WO2013187498A1 - 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 - Google Patents

符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 Download PDF

Info

Publication number
WO2013187498A1
WO2013187498A1 PCT/JP2013/066438 JP2013066438W WO2013187498A1 WO 2013187498 A1 WO2013187498 A1 WO 2013187498A1 JP 2013066438 W JP2013066438 W JP 2013066438W WO 2013187498 A1 WO2013187498 A1 WO 2013187498A1
Authority
WO
WIPO (PCT)
Prior art keywords
range
samples
correction amount
gain correction
gain
Prior art date
Application number
PCT/JP2013/066438
Other languages
English (en)
French (fr)
Inventor
勝宏 福井
祐介 日和▲崎▼
登 原田
守谷 健弘
優 鎌本
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP2014521423A priority Critical patent/JP5734519B2/ja
Publication of WO2013187498A1 publication Critical patent/WO2013187498A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding

Definitions

  • the present invention relates to a technique for encoding a sound signal such as speech or music with a small amount of information, and more particularly, to an encoding technique for improving quantization accuracy.
  • Non-Patent Document 1 an outline of an encoding device and a decoding device disclosed in Non-Patent Document 1 is shown in FIG.
  • the quantized value of the global gain (gain that affects the quantization accuracy of the normalized input signal sequence) is calculated in the time domain.
  • the energy of the signal in the time domain is equal to the energy of the signal in the frequency domain, even if the quantized value of the global gain is obtained in the frequency domain, this result is not different from that in the time domain. Therefore, here, a case where the quantized value of the global gain and the decoded value thereof are calculated in the frequency domain is illustrated.
  • the frequency domain transform unit 101 receives an input time domain signal sequence x F (t) in frame units composed of a plurality of consecutive samples included in the time domain input signal x (t).
  • the frequency domain transform unit 101 converts the frequency component at the L point (L is a positive integer, for example, 256) corresponding to the input time domain signal sequence x F (t) of one frame to the input frequency domain signal sequence X ( ⁇ ).
  • L is a positive integer, for example, 256
  • t represents an index of discrete time
  • represents an index of discrete frequency.
  • MDCT Modified Discrete Cosine Transform
  • DCT Discrete Cosine Transform
  • the normalization unit 102 includes an input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and an input frequency domain signal sequence X ( ⁇ ) obtained by the gain control unit 104 described later.
  • a gain hereinafter referred to as a global gain
  • g that determines the quantization accuracy of each component of [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ] is input.
  • the normalization unit 102 divides each component of the input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] by the global gain g, or the input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] by multiplying each component of [ ⁇ ⁇ 0,..., L-1 ⁇ ] by the reciprocal of the global gain g, respectively.
  • ⁇ ] Is normalized, and a normalized signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ] is output.
  • the quantizing unit 103 receives the normalized signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ].
  • the quantization unit 103 quantizes the normalized signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] by a predetermined method, and the normalized signal sequence X Q ( ⁇ ) Quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1] which is a series of quantized values of each component of [ ⁇ ⁇ 0,.
  • a normalized signal code that is a code corresponding to the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ], and the bits of the normalized signal code Number (hereinafter referred to as the number of consumed bits). Further, when receiving from the gain control unit 104 command information for outputting a quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and a normalized signal code Then, the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and the normalized signal code are output.
  • the gain control unit 104 receives the number of consumed bits.
  • the gain control unit 104 adjusts the global gain g so that the number of consumed bits approaches a maximum value that is less than or equal to the number of bits allocated in advance to the normalized signal code (hereinafter referred to as the specified number of bits).
  • the global gain g is output as a new global gain g.
  • a process of increasing the global gain g when the number of consumed bits is larger than the specified number of bits and decreasing the global gain g otherwise can be exemplified.
  • the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0, ..., L-1 ⁇ ] and the normalized signal code are Command information to be output is output to the quantization unit 103.
  • the global gain encoding unit 105 includes an input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and a quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0. ,..., L-1 ⁇ ] is input.
  • the global gain encoding unit 105 includes an input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and a quantum among a plurality of preset global gain quantization values.
  • the normalized signal code and the global gain code which are output codes of the encoding device, are transmitted to the decoding device and input to the decoding device.
  • a global gain code is input to the global gain decoding unit 106.
  • the global gain decoding unit 106 applies a decoding process corresponding to the encoding process performed by the global gain encoding unit 105 to decode the global gain code, and outputs a decoded global gain g ⁇ .
  • ⁇ Normalized signal decoding unit 107 A normalized signal code is input to the normalized signal decoding unit 107.
  • the normalized signal decoding unit 107 applies a decoding method corresponding to the encoding method performed by the quantization unit 103 of the encoding device, decodes the normalized signal code, and generates a decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] is output.
  • the decoded frequency component calculation unit 108 receives the decoded global gain g ⁇ and the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ].
  • the decoded frequency component calculation unit 108 is obtained by multiplying each component of the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and the decoded global gain g ⁇ .
  • the sequence is output as a decoded frequency domain signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ].
  • ⁇ Time domain conversion unit 109 Decoded frequency domain signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ] is input to time domain transform section 109.
  • the time domain transform unit 109 applies a frequency-time transform to the decoded frequency domain signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ], and outputs an output time domain signal sequence in units of frames.
  • the frequency-time conversion method is an inverse conversion corresponding to the time-frequency conversion method used in the frequency domain conversion unit 101.
  • the frequency-time conversion method here is IMDCT (Inverse Modified Discrete Cosine Transform) or IDCT (Inverse Discrete Cosine Transform).
  • the global gain is adjusted to appropriately control the coarseness of quantization of the normalized signal sequence, so that the number of bits consumed, which is the code amount of the normalized signal code, is the specified number of bits. Control is performed so that the following maximum value is obtained. For this reason, when the number of bits consumed is smaller than the specified number of bits, there is a problem in that the encoding process that makes full use of the number of bits allocated in advance for the normalized signal sequence cannot be performed.
  • an object of the present invention is to provide an encoding technique that improves the quantization accuracy of a normalized signal sequence with a small increase in code amount and a decoding technique thereof.
  • An encoding method is an encoding method for encoding an input signal sequence in units of frames, which includes a plurality of input signal samples, wherein each input signal sample included in the input signal sequence is normalized.
  • a normalized signal encoding step for obtaining a normalized signal code obtained by encoding a sequence based on the received signal, a quantized normalized signal sequence corresponding to the normalized signal code, and a gain corresponding to the input signal sequence.
  • a global gain encoding step for obtaining a quantized global gain and a global gain code corresponding to the quantized global gain, a dividing step for dividing the quantized normalized signal sequence into three or more ranges, The gain obtained by correcting the quantized global gain with at least one gain correction amount for each specified range is divided into ranges. And a gain correction amount code for specifying a gain correction amount that maximizes the correlation between the signal sequence obtained by multiplying the value of each sample of the quantized normalized signal sequence and the input signal sequence or minimizes the error.
  • a gain correction amount encoding step to be obtained, and the division of the quantized normalized signal sequence in the division step is performed by a two-partition step that divides the inputted classification target range into two ranges.
  • the first round of the two-division step is carried out by a partitioning scope quantized normalized signal sequence, the 2 n th (n is 1 or each integer) second from n + 1 - Each round th second section steps, by a partitioning scope any one range of the 2 n ranges obtained in the first 2 n -1-th second section steps from the 2 n-1 th Done.
  • the decoding method is a decoding method for obtaining an output signal sequence by decoding a frame-unit code, and obtaining a decoded normalized signal sequence by decoding a normalized signal code included in the code
  • a decoding step a global gain decoding step for obtaining a decoded global gain by decoding a global gain code included in the code
  • a dividing step for dividing the decoded normalized signal sequence into three or more ranges, and a gain included in the code
  • a restoration step for obtaining a signal sequence obtained by multiplying the value of The divided signal series is divided into two division steps for dividing the inputted division target range into two ranges.
  • the two division steps correspond to the two divided ranges obtained in the two division steps, respectively.
  • the number of bits representing two gain correction amounts is executed within the range of the number of times that is equal to or less than the number of bits assigned for gain correction amount codes.
  • a division target range the (the n 1 or more each integer) the 2 n th from each of the 2 n + 1 -1-th second section step, the 2 n from the 2 n-1 th This is done by setting any one of the 2 n ranges obtained in the first two division steps as the division target range.
  • FIG. 1 The figure which shows the processing flow of the specific example 1 of the 1st example of the division process by a 2nd reference
  • FIG. The figure for demonstrating the modification 5 of the gain correction amount encoding part 140 and the modification 5 of the decompression
  • FIG. The block diagram which shows the function structural example of the decoding apparatus which concerns on 1st Embodiment.
  • the acoustic signal handled in each embodiment is a signal such as a sound or a sound such as music or a video.
  • the acoustic signal is a time domain signal.
  • the time domain signal may be converted into a frequency domain signal or a frequency domain signal may be converted into a time domain signal by a known technique as necessary. You can also. Therefore, the signal to be encoded may be a time-domain signal or a frequency-domain signal (in the following description, a frequency-domain signal is treated for the sake of concrete explanation).
  • the signal input as the target of the encoding process is a sequence (sample sequence) composed of a plurality of samples, and the encoding process is normally executed in units of frames. I will call it.
  • each component included in the input signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ], the quantized global gain g ⁇ , and the quantized normalized signal The relationship between the components included in the sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] can be expressed by Expression (1).
  • e g is the quantization error between the global gain g and the quantized global gain g ⁇
  • e XQ is the normalized input signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0, ..., L-1 ⁇ ].
  • Quantization normalized signal sequence X ⁇ Q ( ⁇ ) represents a quantization error between corresponding components (components having the same value of ⁇ ) included in [ ⁇ ⁇ 0, ..., L-1 ⁇ ] .
  • unused bits the remaining one or more bits (hereinafter, referred to as unused bits) is used to reduce the quantization error e g and e XQ. Furthermore, not only unused bits but also one or a plurality of bits prepared in advance for reducing the quantization error may be used.
  • some or all of one or more bits which are prepared in unused bits or pre describes the application of the reduction of the quantization error e g.
  • the one or more bits which are prepared in unused bits or pre can utilize the remaining bits not used to reduce the quantization error e XQ the reduction of the quantization error e g.
  • it may be prepared one or more bits used only for reducing the quantization error e g in advance.
  • available bits in reducing the quantization error e g a "gain correction bits".
  • U be the number of gain correction bits.
  • the entire sequence of the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] is divided into a plurality of ranges.
  • An easily conceivable method for dividing the same signal sequence B into N ranges by the encoding device and the decoding device is to specify a range such as the boundary position of adjacent ranges and the number of components included in each range.
  • information is output from the encoding device.
  • a large number of bits are required to output information specifying the range.
  • the coding apparatus and the decoding apparatus perform classification according to the same standard without using the information specifying the range as the output of the coding apparatus, that is, without consuming bits.
  • the gain correction bits that is, the amount of information for correcting the quantized global gain, are given to each range as evenly as possible, the components of the quantized normalized signal sequence included in each range It is desirable that the amount of information be as uniform as possible.
  • the encoding apparatus 1 (see FIG. 2) of the first embodiment includes a normalized signal encoding unit 120, a global gain encoding unit 105, a sorting unit 150, a gain correction amount encoding unit 140, and a control unit 170.
  • the encoding device 1 may include a frequency domain transform unit 101 and a synthesis unit 160 as necessary.
  • the input signal sequence of the encoding device 1 is an input signal sequence X ( ⁇ that is a frequency component of L points (L is a positive integer, for example, 256) corresponding to the acoustic signal x (t) in units of frames. ) [ ⁇ ⁇ L min ,..., L max ⁇ ]
  • t is an index of discrete time
  • is an index of discrete frequency
  • L min is an index of minimum discrete frequency among frequency components at L point
  • L max is a maximum discrete frequency among frequency components at L point. Represents the index.
  • the frame-wise acoustic signal x (t) itself may be used as the input signal sequence of the encoding device 1, or a residual signal obtained by performing linear prediction analysis on the frame-wise acoustic signal x (t) is encoded. 1 may be used as the input signal sequence, or a frequency component at L point (L is a positive integer, for example, 256) corresponding to the residual signal may be used as the input signal sequence.
  • the encoding device 1 may include a frequency domain transform unit 101 as a preprocessing unit of the encoding device 1 or in the encoding device 1.
  • the frequency domain transform unit 101 generates frequency components at L points (L is a positive integer, for example, 256) corresponding to the time domain acoustic signal x (t) in units of frames, and the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ]
  • MDCT Modified Discrete Cosine Transform
  • DCT Discrete Cosine Transform
  • a residual signal obtained by linear prediction analysis of the time domain acoustic signals in units of frames may be set as x (t).
  • the normalized signal encoding unit 120 encodes a sequence based on a signal obtained by normalizing each component of the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] in units of frames.
  • the quantized signal code and the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] corresponding to the normalized signal code are output (step S1e).
  • the normalization signal encoding unit 120 is realized by, for example, the normalization unit 102, the quantization unit 103, and the gain control unit 104 in FIG. Each of the normalization unit 102, the quantization unit 103, and the gain control unit 104 operates as described in the [Background Art] column.
  • the global gain encoding unit 105 supports a quantized global gain g ⁇ that is a gain corresponding to the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and a quantized global gain g ⁇ .
  • the global gain code to be obtained is obtained (step S2e).
  • the global gain encoding unit 105 also obtains a quantization step width corresponding to the quantized global gain g ⁇ as necessary.
  • the global gain encoding unit 105 operates, for example, as described in the “Background art” column.
  • the global gain encoding unit 105 includes a table storing a plurality of sets of quantized global gain candidates and global gain codes corresponding to the candidates, and the global gain obtained by the normalized signal encoding unit 120
  • the candidate of the quantized global gain closest to the gain g may be set as the quantized global gain g ⁇ , and the global gain code corresponding to the candidate may be output.
  • the global gain coding unit 105 multiplies each component of the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and the gain and obtains a signal.
  • Quantized global gain g ⁇ obtained on the basis of the maximum correlation or minimum error between the sequence and the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and this quantization
  • a global gain code corresponding to the global gain may be obtained and output.
  • the quantization step width corresponding to the quantized global gain ⁇ is also the gain correction amount code. Is output to the conversion unit 140.
  • the sorting unit 150 receives the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and the number U of gain correction bits.
  • the dividing unit 150 divides the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] into three or more ranges (step S3e).
  • the category information that is information about the category is transmitted to the gain correction amount encoding unit 140.
  • the division unit 150 includes a two-division unit 151.
  • the two division unit 151 divides the input classification target range into two ranges. Details of the processing of the bisection unit 151 will be described later.
  • the total number of bits representing two gain correction amounts respectively corresponding to the two partitioned ranges obtained by the partitioning process of the two partitioning unit 151 is assigned for the gain correction amount code. It is executed within the range of the number of times less than the number of bits. Accordingly, the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into three or more ranges.
  • the number of bits allocated for the gain correction amount code is the number U of gain correction bits.
  • the first process of the two-partitioning unit 151 is performed by setting the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] as the classification target range.
  • Each of the processes of the second nth to the (2 n + 1 -1) -th two-partitioning unit 151 with n being an integer of 1 or more is performed by the second n- th to the ( 2n- 1) -th two-partitioning unit. This is performed by setting any one of the 2 n ranges obtained by the processing of 151 as the classification target range.
  • the control unit 170 initializes the value of the surplus bit number u by setting the surplus bit number u as the bit number U of the gain correction bits (step S3e0).
  • the control unit 170 determines whether the surplus bit number u is greater than 0 (step S3e1).
  • step S3e1 If it is determined in step S3e1 that the surplus bit number u is not greater than 0, the processing in step S3e is terminated.
  • step S3e1 When it is determined in step S3e1 that the number of surplus bits u is greater than 0, the control unit 170 determines a classification target range that is a target range of the current processing by the two classification unit 151 (step S3e1). S3e2). Information about the classification target range is transmitted to the two classification unit 151.
  • 2 processing the last of the two-division portion 151 is the 2 n + 1 -1-th process from the 2 n th, obtained from the 2 n-1 th and divided at the 2 n -1 time processing
  • the control unit 170 selects any one of the remaining ranges as the classification target range [l min , l max ].
  • n is an integer greater than or equal to 1
  • the previous processing of the two-partitioning unit 151 is the second n + 1 ⁇ 1th process, and is obtained by the second n ⁇ 1th to the 2n ⁇ 1th process.
  • the controller 170 were obtained from the 2 n th are classified at the 2 n + 1 -1-th process Any one of the 2 n + 1 ranges is set as a classification target range [l min , l max ].
  • the control unit 170 determines one of the two ranges obtained by the first process as a classification target range [ l min , l max ].
  • the two division unit 151 divides the division target range into two ranges (step S3e3).
  • the classification target range is expressed as [l min , l max ], and among the divided ranges, the low frequency range is [l min , l mid -1] and the high frequency range is [l mid , l max ]. Details of the processing of the bisection unit 151 will be described later.
  • the two-dividing unit 151 determines the number of bits Me representing two gain correction amounts respectively corresponding to the two divided ranges (step S3e4). Thereby, Me bits are allocated to two gain correction amounts respectively corresponding to the two divided ranges.
  • the number of bits Me may be a predetermined fixed value or may be different for each of the two divided ranges divided by the two division unit 151.
  • Information about the determined bit number Me is transmitted to the gain correction amount encoding unit 140.
  • the controller 170 decrements the number u of surplus bits by Me as u ⁇ u-Me (step S3e5). That is, a value obtained by subtracting Me from u is set as a new value of u. Then, it returns to step S3e1.
  • step S3e1 to step S3e5 is repeated as long as the number of surplus bits u is greater than zero.
  • the processing of the two-partitioning unit 151 is such that the total number of bits representing two gain correction amounts respectively corresponding to the two divided ranges obtained by the sectioning process of the two-partitioning unit 151 is the gain correction amount code. It is executed within the range of the number of times that is less than the number of bits allocated to
  • the low frequency band is often higher in auditory importance than the high frequency band.
  • the second nth to 2 n + 1 ⁇ 1 second division unit 151 performs the second n ⁇ 1 to second n n processing.
  • the segmentation target ranges may be set in order from the lowest frequency range.
  • the gain correction amount encoding unit 140 includes an input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ], a quantized global gain g ⁇ , and a quantized normalized signal sequence X ⁇ Q. ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and classification information are input.
  • the gain correction amount encoding unit 140 includes a storage unit 141, for example.
  • the gain correction amount encoding unit 140 quantizes and normalizes the gain obtained by correcting the quantized global gain g ⁇ with at least one gain correction amount for each divided range for each divided range.
  • Gain correction amount code idx for specifying the gain correction amount that minimizes the error from L max ⁇ ] is obtained (step S4e).
  • An example of correction of the quantized global gain g ⁇ by the gain correction amount is addition of the gain correction amount and the quantized global gain g ⁇ .
  • the at least one gain correction amount for each divided range is a gain correction amount corresponding to each divided range and a gain correction amount corresponding to a range including each divided range. .
  • the gain correction amount for each of the divided ranges is a gain correction amount corresponding to each of the divided ranges.
  • the quantized normalized signal sequence is divided into four ranges.
  • the quantized normalized signal sequence is divided into a first range R1, a second range R2, a third range R3, and a fourth range R4.
  • the first range R1 is a section [L min , L (1) -1]
  • the second range R2 is a section [L (1) , L (2) -1]
  • the third range R3 is Section [L (2) , L (3) -1]
  • the fourth range R4 is section [L (3) , L max ].
  • the horizontal axis in FIG. 10 represents the sample number.
  • the range R1 and the range R2 are included in the range R12 obtained by the first processing of the bisection unit 151.
  • the range R3 and the range R4 are included in the range R34 obtained by the first processing of the two-dividing unit 151.
  • At least one gain correction amount for the range R1 is a gain correction amount corresponding to the range R1 and a gain correction amount corresponding to the range R12.
  • At least one gain correction amount for the range R2 is a gain correction amount corresponding to the range R2 and a gain correction amount corresponding to the range R12.
  • At least one gain correction amount for the range R3 is a gain correction amount corresponding to the range R3 and a gain correction amount corresponding to the range R34.
  • At least one gain correction amount for the range R4 is a gain correction amount corresponding to the range R4 and a gain correction amount corresponding to the range R34.
  • Mc bits are allocated to two gain correction amounts corresponding to the range R12 and the range R34, respectively, and the two gain correction amounts corresponding to the range R1 and the range R2 respectively. It is assumed that Ma bits are allocated, and Mb bits are allocated to two gain correction amounts respectively corresponding to the ranges R3 and R4. It is assumed that the gain correction amount corresponding to each range is specified by the number of bits assigned to the gain correction amount corresponding to each range in the bisection unit 151.
  • the gain correction amount corresponding to each range may be scalar quantized or vector quantized.
  • the range is divided as shown in FIG. 10, and the case where the vector correction is performed for the gain correction amount corresponding to two adjacent ranges will be described as an example.
  • the range R1 and the range R2 constitute a group G12
  • the range R3 and the range R4 constitute a group G34
  • the range R12 and the range R34 constitute a group G1234. That is, the range constituting each group is as follows.
  • the first vector quantization is vector quantization for the group G12, that is, vector quantization of a gain correction amount corresponding to the range R1 and a gain correction amount corresponding to the range R2. This is hereinafter referred to as “first VQ”.
  • the second vector quantization is vector quantization for the group G34, that is, vector quantization of a gain correction amount corresponding to the range R3 and a gain correction amount corresponding to the range R4. This is hereinafter referred to as “second VQ”.
  • the third vector quantization is vector quantization for the group G1234, that is, vector quantization of a gain correction amount corresponding to the range R12 and a gain correction amount corresponding to the range R34. This is hereinafter referred to as “third VQ”.
  • the storage unit 141 of the gain correction amount encoding unit 140 stores a gain correction amount candidate ⁇ 1 (ma) corresponding to the range R1, a gain correction amount candidate ⁇ 2 (ma) corresponding to the range R2, and these 2 Ma pairs (2 to the Ma power, Ma is an integer greater than or equal to 1, ma ⁇ ⁇ 1, ..., 2 Ma ⁇ ]) are stored with the code idx 12 (ma) that identifies the gain correction amount candidates. Yes.
  • a set of ⁇ 1 (1), ⁇ 2 (1) and idx 12 (1), a set of ⁇ 1 (2), ⁇ 2 (2) and idx 12 (2), ..., ⁇ A set of 1 (2 Ma ), ⁇ 2 (2 Ma ), and idx 12 (2 Ma ) is stored in the storage unit 141 as a first VQ gain correction amount codebook.
  • the number of bits of the code idx 12 (ma) is Ma bits. That is, the code (hereinafter referred to as the first VQ code) idx 12 output by the first VQ is Ma bits.
  • the gain correction amount codebook of the first VQ has ⁇ 1 (1) And ⁇ 2 (1), a gain correction amount candidate vector composed of ⁇ 1 (2) and ⁇ 2 (2),..., ⁇ 1 (2 Ma ) and ⁇ 2 (2 Ma ) of gain correction amount candidate vectors composed of a total of 2 Ma gain correction amount candidate vectors, and a total of 2 Ma codes idx 12 (1), corresponding to a total of 2 Ma gain correction amount candidate vectors, respectively. It can be considered that idx 12 (2), ..., idx 12 (2 Ma ) is stored.
  • the storage unit 141 stores gain correction amount candidates ⁇ 3 (mb) corresponding to the range R3, gain correction amount candidates ⁇ 4 (mb) corresponding to the range R4, and gain correction amount candidates.
  • 2 Mb sets (2 Mb powers, Mb is an integer equal to or greater than 1, mb ⁇ ⁇ 1,..., 2 Mb ⁇ ]) are stored with the identified code idx 34 (mb).
  • Mb may be the same value as Ma or a different value.
  • the number of bits of the code idx 34 (mb) is Mb bits. That is, a code (hereinafter referred to as a second VQ code) idx 34 output by the second VQ is Mb bits.
  • the second VQ gain correction amount codebook includes a gain correction amount candidate vector composed of ⁇ 3 (1) and ⁇ 4 (1), and a gain correction amount composed of ⁇ 3 (2) and ⁇ 4 (2).
  • Candidate vectors, 2 Mb gain correction amount candidate vectors, and a total of 2 Mb gain correction amount candidate vectors of gain correction amount candidate vectors composed of ⁇ 3 (2 Mb ) and ⁇ 4 (2 Mb ) It can be considered that a total of 2 Mb codes idx 34 (1), idx 34 (2),..., Idx 34 (2 Mb ) corresponding to the above are stored.
  • the storage unit 141 stores a gain correction amount candidate ⁇ 12 (mc) in the range R12, a gain correction amount candidate ⁇ 34 (mc) in the range R34, and a code idx for specifying these gain correction amount candidates.
  • a set of ⁇ 12 (1), ⁇ 34 (1) and idx 1234 (1), a set of ⁇ 12 (2), ⁇ 34 (2) and idx 1234 (2), ..., ⁇ A set of 12 (2 Mc ), ⁇ 34 (2 Mc ), and idx 1234 (2 Mc ) is stored in the storage unit 141 as a third VQ gain correction amount codebook.
  • Mc may be the same value as Ma or a different value. Further, Mc may be the same value as Mb or a different value.
  • the number of bits of the code idx 1234 (mc) is Mc bits. That is, the code (hereinafter referred to as the third VQ code) idx 1234 output by the third VQ is Mc bits.
  • the third VQ gain correction amount codebook includes a gain correction amount candidate vector composed of ⁇ 12 (1) and ⁇ 34 (1), and a gain correction amount composed of ⁇ 12 (2) and ⁇ 34 (2).
  • idx 1234 (2), ... may be considered as idx 1234 (2 Mc) is stored.
  • ⁇ 1 (1), ..., ⁇ 1 (2 Ma ) is associated with the range R1
  • ⁇ 2 (1), ..., ⁇ 2 (2 Ma ) is associated with the range R2.
  • in the range R4 ⁇ 4 (1), ... , ⁇ 4 (2 Mb) is correlated ⁇ 12 (1),..., ⁇ 12 (2 Mc ) is associated with the range R12
  • ⁇ 34 (1),..., ⁇ 34 (2 Mc ) is associated with the range R34.
  • the gain correction amount encoding unit 140 obtains a gain correction amount code idx for specifying a gain correction amount vector that minimizes an error defined by the following equation (F1).
  • the gain correction amount encoding unit 140 outputs the third VQ code idx 1234 , the first VQ code idx 12 and the second VQ code idx 34 defined by the following equation (F2) as the gain correction amount code idx.
  • the absolute value of the gain correction amount candidate ⁇ 1 (ma) corresponding to the range R1 and the range R2 are supported.
  • the absolute value of the gain correction amount candidate ⁇ 2 (ma), the absolute value of the gain correction amount candidate ⁇ 3 (mb) corresponding to the range R3, and the gain correction amount candidate ⁇ 4 (mb) corresponding to the range R4 May be smaller than the absolute value of the gain correction amount candidate ⁇ 12 (mc) in the range R12 and the absolute value of the gain correction amount candidate ⁇ 34 (mc) in the range R34.
  • the gain correction amount candidate vector can be generated as follows, for example.
  • the storage unit 141 stores, for example, 2 E normalized gain correction amount candidate vectors, that is, ( ⁇ 1 (1), ⁇ 2 (1)),... ( ⁇ 1 (2 E ), ⁇ 2 (2 E )) Is stored.
  • E is a predetermined integer, for example, Me.
  • a predetermined coefficient is associated with two divided ranges obtained by the processing of the two-dividing unit 151 according to the number of times of processing of the two-dividing unit 151. For example, towards the absolute value of the predetermined coefficient corresponding from the 2 n th to the processing of the 2 n + 1 -1-th second section 151, from the 2 n-1 th of the 2 n -1 time two The association is made so as to be smaller than the absolute value of the predetermined coefficient corresponding to the processing of the sorting unit 151.
  • a vector obtained by multiplying the normalized gain correction amount candidate vector by a predetermined coefficient corresponding to the number of times of processing of the two-partitioning unit 151 is divided into two parts obtained by the processing of the second-partitioning unit 151 for the number of times. Let it be a gain correction amount candidate vector for the range. In other words, each of the two values ⁇ 1 (i), ⁇ 2 (i) constituting the normalized gain correction amount candidate vector ( ⁇ 1 (i), ⁇ 2 (i)) is divided into two sections 151.
  • Step ⁇ 1 (i), step ⁇ 2 (i) composed of two values step ⁇ 1 (i) and step ⁇ 2 (i) obtained by multiplying a predetermined coefficient step corresponding to the number of times )) Is a gain correction amount candidate vector for two divided ranges obtained by the processing of the second dividing section 151 for the number of times.
  • n is an integer greater than or equal to 0
  • n (i), ⁇ 2, n (i)) are stored together with a code idx (i) for identifying the gain correction amount candidate vector ( ⁇ 1, n (i), ⁇ 2, n (i)).
  • 141 is stored.
  • the gain correction amount candidate vectors ( ⁇ 1, n (i),...) For the two divided ranges obtained by the processing of the second dividing unit 151 from the 2 nth time to the 2 n + 1 ⁇ 1 time.
  • delta 2, n (i)) candidate delta 1 of the gain correction amount constituting, n (i), delta 2, towards n of the absolute value of (i) is the 2 n -1 from the 2 n-1 th
  • the gain correction amount encoding unit 140 may specify a gain correction amount that minimizes the error defined by the equation (F3) instead of the equation (F1).
  • s 1 , s 2 , s 3 , s 4 , s 12 , and s 34 are defined as in the following equations.
  • the gain correction amount encoding unit 140 calculates each gain correction amount for each divided range and the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] Is corrected by a value obtained by multiplying the sum of squares of the values of all the samples by the sum of squares of the values of all the samples within the range corresponding to each gain correction amount. May be.
  • the gain correction amount encoding unit 140 may obtain the gain correction amount code idx for specifying the gain correction amount that minimizes the error defined by the equation (F4) instead of the equation (F1).
  • the gain correction amount encoding unit 140 adds the gain correction amount for each divided range for each range and the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is multiplied by the value obtained by multiplying the sum of squares of the values of all the samples by the sum of squares of the values of all the samples in each divided range, and the quantized global gain g ⁇ May be corrected.
  • s 12 , s 34 , s 1 , s 2 , s 3 , and s 4 may be defined as in the following equations, respectively.
  • the energy of the samples in the range R12 is the number of sample that is larger than the first predetermined value.
  • c 34 the energy of the samples in the range R34 is the number of sample that is larger than the second predetermined value.
  • c 1234 is the number of samples in which the energy of the sample in the range R1234 is larger than the third predetermined value.
  • c 1 is the number of samples in which the energy of the sample in the range R1 is larger than the fourth predetermined value.
  • c 2 is the energy of the samples in the range R2 is the number of larger samples than the fifth predetermined value.
  • c 3 is the number of samples in which the energy of the sample in the range R3 is larger than the sixth predetermined value.
  • c 4 is the energy of the samples in the range R4 is the number of larger samples than the seventh predetermined value.
  • the gain correction amount encoding unit 140 calculates each gain correction amount for each divided range and the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ .
  • the value obtained by dividing the number of samples whose sample energy is larger than the eighth predetermined value by the number of samples whose sample energy within the range corresponding to each gain correction amount is larger than the ninth predetermined value.
  • the quantized global gain ⁇ is corrected with the multiplied value.
  • the gain correction amount encoding unit 140 adds the gain correction amount for each divided range for each range and the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] the number of samples whose energy is greater than a tenth predetermined value is divided by the number of samples whose energy within each segment is greater than the eleventh predetermined value.
  • the quantized global gain g ⁇ is corrected with a value multiplied by the value.
  • first to eleventh predetermined values may be different from each other, but are preferably the same value. These first to eleventh predetermined values correspond to ⁇ in formula (B2) described later.
  • the synthesis unit 160 After the processing of the gain correction amount encoding unit 140 is finished, the synthesis unit 160 performs the normalization signal code, the gain correction amount code idx obtained by the gain correction amount encoding unit 140, and the global as necessary. A bit stream in which gain codes are collected is output. The bit stream is transmitted to the decoding device 2.
  • the two-partitioning unit 151 determines the range to be classified based on “a criterion for classifying so that the energy of each range is as equal as possible” or “a criterion for classifying so that the number of significant samples included in each range is as equal as possible”. Is divided into two ranges.
  • the “criteria for classifying so that the energy of each range is as equal as possible” is abbreviated as the first standard
  • the “criteria for classifying so that the number of significant samples included in each range is as equal as possible” is abbreviated as the second standard.
  • the first range of the classification target range is, for example, (a) The square sum of the values of all the samples included in the first range of the classification target range and the half of the square sum of the values of all the samples of the classification target range are closest to each other. Or (b) The absolute value sum of the values of all the samples included in the first range of the classification target range and the half of the absolute value sum of the values of all the samples of the classification target range are closest to each other. , Or (c) The sum of the number of samples in the first range of the classification target range is the sum of squares of the values of all the samples included in the first range of the classification target range.
  • the sum of the number of samples in the first range of the classification target range is the sum of the absolute values of all the samples included in the first range of the classification target range is the absolute value of all the samples in the classification target range.
  • the sum of the number of samples in the first range of the classification target range is the sum of squares of the values of all samples included in the first range of the classification target range, and the sum of squares of the values of all samples in the classification target range So that the maximum number of samples is half or less of Or (f)
  • the sum of the number of samples in the first range of the classification target range is the sum of the absolute values of all the samples included in the first range of the classification target range is the absolute value of all the samples in the classification target range. So that the maximum number of samples is less than half of the sum of values, Seeking The range other than the first range in the sorting target range is set as the second range of the sorting target range, so that the sorting target range is divided into two ranges.
  • the classification process exemplified above is realized by a method of sequentially determining the classification based on the “criteria for classifying so that the energy of each range is as equal as possible” sequentially from the first range. According to the classification process exemplified above, it is possible to realize the classification based on the “standard for classifying the energy in each range so as to be as equal as possible” with a small amount of calculation processing.
  • Figure 4 is a segmented target range X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min, ..., l max ⁇ ] the X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min, ..., l mid -1 ⁇ ] and X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l mid ,..., L max ⁇ ]
  • a low range as the first range
  • a high range as the second range
  • determining lmid which is a sample number on the lowest side of the second range as information representing the boundary of the second range.
  • equation (2) by partitioning the scope determined X ⁇ Q [ ⁇ ⁇ l min , ..., l max ⁇ ] of all samples X ⁇ Q (l min), ..., X ⁇ Q of (l max)
  • the difference between the half sum of squares and the sum of squares of the values of all samples X ⁇ Q ( lmin ), ..., X ⁇ Q ( lmid- 1) included in the first range of the classification target range Lmid which is the sample number on the lowest side of the second range, is obtained so that is minimized. That is, lmid is obtained by equation (3).
  • the first range is determined as X ⁇ Q [ ⁇ ⁇ l min ,..., L mid ⁇ 1 ⁇ ].
  • classification target range X ⁇ Q [ ⁇ ⁇ l min , ..., l max ⁇ ] first range outside the range of, namely, X ⁇ Q [ ⁇ ⁇ l mid, ..., l max ⁇ ] the first The range is 2.
  • the classification target range X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information second section 151 outputs may be a l mid, may be a value obtained by calculating the predetermined value in l mid, sample number l mid -l min of the first range It may be the number of samples in the second range l max ⁇ l mid +1, or anything insofar as it is information that can identify the first range and the second range.
  • the second example of the sorting process based on the first standard corresponds to the above (b).
  • the sorting process of the second example is the same method as the sorting process of the first example, except that “sum of squares” in the sorting process of the first example is replaced with “sum of absolute values”. According to the sorting process of the second example, it is possible to perform the sorting process with a smaller amount of calculation processing than the sorting process of the first example because the square calculation performed in the sorting process of the first example can be omitted.
  • Figure 5 is a segmented target range X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min, ..., l max ⁇ ] the X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min, ..., l mid -1 ⁇ ] and X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l mid ,..., L max ⁇ ]
  • a low range as the first range
  • a high range as the second range
  • determining lmid which is a sample number on the lowest side of the second range as information representing the boundary of the second range.
  • FIG. 5 is a flowchart for realizing the above processing.
  • the initial value of the discrete frequency index ⁇ is set to l min
  • the initial value of the low frequency energy p low is set to
  • the value obtained by adding is a new p low .
  • p low ⁇ pow / 2 is satisfied, a value obtained by adding 1 to the index ⁇ of the discrete frequency at that time is output as the index l mid .
  • classification target range X ⁇ Q [ ⁇ ⁇ l min , ..., l max ⁇ ] first range outside the range of, namely, X ⁇ Q [ ⁇ ⁇ l mid, ..., l max ⁇ ] the first The range is 2.
  • the classification target range X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information second section 151 outputs may be a l mid, may be a value obtained by calculating the predetermined value in l mid, sample number l mid -l min of the first range It may be the number of samples in the second range l max ⁇ l mid +1, or anything insofar as it is information that can identify the first range and the second range.
  • the fourth example of the sorting process based on the first standard corresponds to the above (d).
  • the sorting process of the fourth example is the same method as the sorting process of the third example, except that “sum of squares” in the sorting process of the third example is replaced with “sum of absolute values”. According to the classification process of the fourth example, it is possible to perform the classification process with a smaller calculation processing amount than the classification process of the third example because the square calculation performed in the classification process of the third example can be omitted.
  • Figure 6 is partitioned scope X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min, ..., l max ⁇ ] the X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min, ..., l mid -1 ⁇ ] and X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l mid ,..., L max ⁇ ]
  • X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l mid ,..., L max ⁇ ]
  • the first range is the discrete frequency obtained by subtracting 1 from the index ⁇ of the discrete frequency when p low ⁇ pow / 2 is not satisfied for the first time, and the index ⁇ is the lowest side of the second range.
  • FIG. 6 is a flowchart for realizing the above processing.
  • the initial value of the discrete frequency index ⁇ is set to l min
  • the initial value of the low frequency energy p low is set to
  • p low ⁇ pow / 2 is the one plus the index of discrete frequency omega as a new omega, energy to p low X ⁇ Q ( ⁇ )
  • classification target range X ⁇ Q [ ⁇ ⁇ l min , ..., l max ⁇ ] first range outside the range of, namely, X ⁇ Q [ ⁇ ⁇ l mid, ..., l max ⁇ ] the first The range is 2.
  • the classification target range X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information second section 151 outputs may be a l mid, may be a value obtained by calculating the predetermined value in l mid, sample number l mid -l min of the first range It may be the number of samples in the second range l max ⁇ l mid +1, or anything insofar as it is information that can identify the first range and the second range.
  • the sixth example of the sorting process based on the first standard corresponds to the above (f).
  • the sorting process of the sixth example is the same method as the sorting process of the fifth example, except that “sum of squares” in the sorting process of the fifth example is replaced with “sum of absolute values”. According to the sorting process of the sixth example, it is possible to perform the sorting process with a smaller calculation processing amount than the sorting process of the fifth example, because the square calculation performed in the sorting process of the fifth example can be omitted.
  • the classification process in the “criteria for classifying so that the number of significant samples included in each range is as equal as possible” includes, for example, the first range of the classification target range, (a) Of all the samples included in the first range of the classification target range, the number of samples whose sample energy is greater than or equal to the predetermined value and of all the samples included in the classification target range So that the energy of the sample is greater than or equal to one half of the number of samples that are greater than or equal to the predetermined value.
  • the number of samples whose sample energy is greater than or equal to a predetermined value among all samples included in the first range of the classification target range is among all samples included in the classification target range.
  • the sample number is the minimum number of samples that is greater than or equal to one-half of the number of samples that are greater than or equal to a predetermined value
  • the number of samples whose absolute value of the sample is greater than or equal to the predetermined value is equal to that of all samples included in the classification target range.
  • the absolute value of the sample is larger than the predetermined value or the minimum number of samples that is more than half of the number of samples that is equal to or larger than the predetermined value.
  • the number of samples whose sample energy is greater than or equal to the predetermined value among all the samples included in the first range of the classification target range.
  • the maximum number of samples is less than one half of the number of samples whose sample energy is greater than or equal to or greater than a predetermined value.
  • the number of samples whose absolute value of the sample is greater than or equal to the predetermined value is equal to that of all the samples included in the classification target range.
  • the absolute value of the sample is greater than the predetermined value or the maximum number of samples that is less than or equal to half of the number of samples that is greater than or equal to the predetermined value. Seeking
  • the range other than the first range in the sorting target range is set as the second range of the sorting target range, so that the sorting target range is divided into two ranges.
  • the classification process exemplified above realizes the classification based on the “criteria for classifying so that the number of significant samples included in each range is as equal as possible” by a method of sequentially determining each range. . According to the classification process exemplified above, it is possible to realize classification according to “a criterion for classifying so that the number of significant samples included in each range is as equal as possible” with a small amount of calculation processing.
  • FIG. 7 shows the classification target range X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min , ..., l max ⁇ ] and X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min , ..., l mid -1 ⁇ ] and X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l mid ,..., L max ⁇ ]
  • f count ( ⁇ ) is determined for each index ⁇ by the equation (B2).
  • the f count ( ⁇ ) for each index ⁇ includes the energy of the sample corresponding to the index ⁇ of the classification target range X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min ,..., L max ⁇ ]
  • 1 is set as information indicating that “sample energy
  • 0 is set as information indicating that the energy
  • the predetermined value is arbitrarily set to a minute amount ⁇ ( ⁇ is a value of 0 or more).
  • classification target range X ⁇ Q [ ⁇ ⁇ l min , ..., l max ⁇ ] first range outside the range of, namely, X ⁇ Q [ ⁇ ⁇ l mid, ..., l max ⁇ ] the first The range is 2.
  • the classification target range X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • Second section information identifying circuit 151 outputs may be a l mid, may be a value obtained by calculating the predetermined value in l mid, sample number of the first range l mid-1- l min +1 may be used, or the number of samples in the second range may be l max ⁇ l mid +1. The point is that the information can identify the first range and the second range. Anything is fine.
  • a second example of the sorting process based on the second standard corresponds to the above (b).
  • 2 ” in the classification process of the first example is replaced with “absolute value of sample
  • This is the same method as the sorting process in the first example.
  • it is possible to perform the sorting process with a smaller amount of calculation processing than the sorting process of the first example because the square calculation performed in the sorting process of the first example can be omitted.
  • FIG. 8 shows the classification target range X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min , ..., l max ⁇ ] and X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min , ..., l mid -1 ⁇ ] and X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l mid ,..., L max ⁇ ]
  • f count ( ⁇ ) is determined for each index ⁇ by the equation (B2).
  • the number f count sample energy of the sample is greater than a predetermined value among all samples contained a number k of the index ⁇ discrete frequency division scope from l min from l min to the index k, while increasing in the order (l min ) +... + f count (k) is judged whether or not (f count (l min ) +... + f count (l max )) / 2 or more, and for the first time f count (l min ) + ... + f count (k) is (f count (l min ) + ...
  • the first range is determined as X ⁇ Q [ ⁇ ⁇ l min ,..., L mid ⁇ 1 ⁇ ].
  • classification target range X ⁇ Q [ ⁇ ⁇ l min , ..., l max ⁇ ] first range outside the range of, namely, X ⁇ Q [ ⁇ ⁇ l mid, ..., l max ⁇ ] the first The range is 2.
  • the classification target range X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information second section 151 outputs may be a l mid, may be a value obtained by calculating the predetermined value in l mid, sample number l mid -l min of the first range It may be the number of samples in the second range l max ⁇ l mid +1, or anything insofar as it is information that can identify the first range and the second range.
  • the fourth example of the sorting process based on the second standard corresponds to the above (d).
  • 2 ” in the classification process of the third example is replaced with “absolute value of sample
  • the classification target segmental scope X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min, ..., l max ⁇ ] the X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min, ..., l mid -1 ⁇ ] And X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l mid ,..., L max ⁇ ] are divided into two ranges, specifically, the first range is the low range and the second range. This is an example of determining lmid which is the sample number on the lowest frequency side of the second range as information representing the boundary with the high frequency.
  • f count ( ⁇ ) is determined for each index ⁇ by the equation (B2).
  • the number f count sample energy of the sample is greater than a predetermined value among all samples contained a number k of the index ⁇ discrete frequency division scope from l min from l min to the index k, while increasing in the order It is determined whether (l min ) + ... + f count (k) is greater than (f count (l min ) + ... + f count (l max )) / 2, and for the first time f count (l min ) + ... + f count (k) is defined as the first range up to k-1 which is 1 smaller than the index k of the discrete frequency where (f count (l min ) + ...
  • the index k is output as the index l mid which is the sample number on the lowest side of the second range. Accordingly, the first range is determined as X ⁇ Q [ ⁇ ⁇ l min ,..., L mid ⁇ 1 ⁇ ].
  • classification target range X ⁇ Q [ ⁇ ⁇ l min , ..., l max ⁇ ] first range outside the range of, namely, X ⁇ Q [ ⁇ ⁇ l mid, ..., l max ⁇ ] the first The range is 2.
  • the classification target range X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information second section 151 outputs may be a l mid, may be a value obtained by calculating the predetermined value in l mid, sample number l mid -l min of the first range It may be the number of samples in the second range l max ⁇ l mid +1, or anything insofar as it is information that can identify the first range and the second range.
  • combination part 160 is recorded on a recording medium, and the said information read from the said recording medium Is also allowed to be input to the decoding device 2.
  • the decoding apparatus 2 (see FIG. 13) of the first embodiment includes a normalized signal decoding unit 107, a global gain decoding unit 106, a sorting unit 260, and a restoration unit 250.
  • the decoding device 2 may include a separation unit 210 and a time domain conversion unit 270 as necessary.
  • the bit stream transmitted from the encoding device 1 is input to the decoding device 2.
  • the separation unit 210 extracts a normalized signal code, a global gain code, and a gain correction amount code idx from the bit stream.
  • ⁇ Normalized signal decoding unit 107 A normalized signal code is input to the normalized signal decoding unit 107.
  • the normalized signal decoding unit 107 applies a decoding method corresponding to the encoding method performed by the normalized signal encoding unit 120 of the encoding device 1 to decode the normalized signal code and decode the normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is obtained (step S1d).
  • represents an index of discrete frequency
  • the normalized signal decoding unit 107 performs the same operation as the normalized signal decoding unit 107 of FIG. 1 described in the “Background Art” column.
  • a global gain code is input to the global gain decoding unit 106.
  • the global gain decoding unit 160 decodes the global gain code and outputs a decoded global gain g ⁇ (step S2d).
  • the decoding process performed by the global gain decoding unit 106 is a process corresponding to the encoding process performed by the global gain encoding unit 105, and is a well-known technique as described in the global gain decoding unit 106 in the [Background Art] column.
  • the sorting unit 260 includes the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ], the gain correction amount code idx, and the number of bits allocated for the gain correction amount code. At least input.
  • the division unit 260 divides the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] into three or more ranges (step S3d).
  • the category information that is information about the category is transmitted to the restoration unit 250.
  • the division unit 260 includes a two-division unit 261.
  • the two division unit 261 divides the division target range into two ranges. Details of the processing of the bisection unit 261 will be described later.
  • the total number of bits representing two gain correction amounts respectively corresponding to the two partitioned ranges obtained by the partitioning process of the two partitioning unit 261 is assigned for the gain correction amount code. It is executed within the range of the number of times less than the number of bits. Accordingly, the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into three or more ranges.
  • the first processing of the two-partitioning unit 261 is performed by setting the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] as the classification target range.
  • Each of the processes of the second n- th to (2 n + 1 -1) -th two-partitioning unit 261 is performed for each of the second n- th to the (2 n -1) -th two-partitioning units, where n is an integer of 1 or more. This is performed by setting any one of the 2 n ranges obtained by the processing of H.261 as a target range to be classified.
  • the control unit 280 initializes the value of the surplus bit number u by setting the surplus bit number u as the bit number U allocated for the gain correction amount code (step S3d0).
  • the control unit 280 determines whether the surplus bit number u is larger than 0 (step S3d1).
  • step S3d1 If it is determined in step S3d1 that the surplus bit number u is not greater than 0, the processing in step S3d is terminated.
  • step S3d1 When it is determined in step S3d1 that the number of surplus bits u is greater than 0, the control unit 280 determines a segmentation target range that is a target range of the current process by the two segmentation unit 261 (step S3d1). S3d2). Information on the classification target range is transmitted to the two classification unit 261.
  • 2 processing the last of the two-division portion 261 is the 2 n + 1 -1-th process from the 2 n th, obtained from the 2 n-1 th and divided at the 2 n -1 time processing
  • the control unit 280 determines any one of the remaining ranges as the classification target range [l min , l max ].
  • the processing of the previous second section 261 is the 2 n + 1 -1-th process, from the 2 n-1 th and divided at the 2 n -1 time processing If the range is not a classification target range of the 2 n ranges that are do not remain, the control unit 280, were obtained from the 2 n th are classified at the 2 n + 1 -1-th process Any one of the 2 n + 1 ranges is set as a classification target range [l min , l max ].
  • control unit 280 determines one of the two ranges obtained by the first process as a classification target range [ l min , l max ].
  • the two-segment unit 261 determines the segment target range based on the same standard as the two-segment unit 151 of the encoding device 1.
  • the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is converted into the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ ⁇ L min ,..., L max ⁇ ].
  • the two division unit 261 divides the division target range into two ranges (step S3d3).
  • the classification target range is expressed as [l min , l max ], and among the divided ranges, the low frequency range is [l min , l mid -1] and the high frequency range is [l mid , l max ].
  • Classification information which is information about the classification, is provided to the restoration unit 250. Details of the processing of the bisection unit 261 will be described later.
  • the control unit 280 decrements the number u of surplus bits by Me as u ⁇ u-Me (step S3d5). That is, a value obtained by subtracting Me from u is set as a new value of u. Thereafter, the process returns to step S3d1.
  • Me is the number of bits representing two gain correction amounts respectively corresponding to the two divided ranges obtained by the current processing of the two-dividing unit 261.
  • the number of bits representing these two gain correction amounts is for the two gain correction amounts respectively corresponding to the two divided ranges obtained by the current processing of the two-dividing unit 261 included in the gain correction amount code idx. For example, it can be obtained by calculating the number of bits of the code.
  • Me may be a predetermined fixed value or may be different for each of the two divided ranges divided by the two division unit 261.
  • step S3d1 to step S3d5 is repeated as long as the number of surplus bits u is greater than zero.
  • the processing of the two-segment unit 261 is the sum of the number of bits representing two gain correction amounts respectively corresponding to the two segmented ranges obtained by the segment processing of the two-segment unit 261. It is executed within the range of the number of times that is less than the number of bits allocated to
  • the low frequency band is often higher in auditory importance than the high frequency band. Therefore, when the input signal sequence is a signal sequence in the frequency domain, the processing of the 2 n + 1 -1-th second section 261 from the 2 n th is the 2 n from the 2 n-1 th Of the 2 n ranges obtained by the first process of the two-segmentation unit 261, it may be performed by setting the segmentation target ranges in order from the lowest frequency range.
  • the restoration unit 250 includes, for example, a storage unit 251 and a multiplication unit 252.
  • the restoration unit 250 receives at least a gain correction amount code idx, a decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and a decoded global gain g ⁇ .
  • the restoration unit 250 calculates the gain obtained by correcting the decoded global gain g ⁇ with at least one gain correction amount for each divided range obtained by decoding the gain correction amount code idx for each divided range.
  • a signal sequence obtained by multiplying the value of each sample of the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is obtained as an output signal sequence (step S4d).
  • An example of correction of the decoded global gain g ⁇ by the gain correction quantity is addition of the gain correction quantity and the quantized global gain g ⁇ .
  • the at least one gain correction amount for each divided range is a gain correction amount corresponding to each divided range and a gain correction amount corresponding to a range including each divided range. .
  • the gain correction amount for each of the divided ranges is a gain correction amount corresponding to each of the divided ranges.
  • the decoded normalized signal sequence is divided into four ranges.
  • the decoded normalized signal sequence is divided into a first range R1, a second range R2, a third range R3, and a fourth range R4.
  • the first range R1 is a section [L min , L (1) -1]
  • the second range R2 is a section [L (1) , L (2) -1]
  • the third range R3 is Section [L (2) , L (3) -1]
  • the fourth range R4 is section [L (3) , L max ].
  • the horizontal axis in FIG. 10 represents the sample number.
  • the range R1 and the range R2 are included in the range R12 obtained by the first processing of the two-division unit 261.
  • the range R3 and the range R4 are included in the range R34 obtained by the first processing of the two-division unit 261.
  • At least one gain correction amount for the range R1 is a gain correction amount corresponding to the range R1 and a gain correction amount corresponding to the range R12.
  • At least one gain correction amount for the range R2 is a gain correction amount corresponding to the range R2 and a gain correction amount corresponding to the range R12.
  • At least one gain correction amount for the range R3 is a gain correction amount corresponding to the range R3 and a gain correction amount corresponding to the range R34.
  • At least one gain correction amount for the range R4 is a gain correction amount corresponding to the range R4 and a gain correction amount corresponding to the range R34.
  • Mc bits are assigned to two gain correction amounts corresponding to the ranges R12 and R34, respectively, and Ma bits are assigned to two gain correction amounts corresponding to the ranges R1 and R2, respectively. Assume that Mb bits are allocated to two gain correction amounts respectively corresponding to the range R3 and the range R4.
  • the gain correction amount corresponding to each range can be obtained by a decoding process corresponding to the encoding process performed by the gain correction amount encoding unit 140 of the encoding device 1.
  • a decoding process corresponding to the encoding process performed by the gain correction amount encoding unit 140 of the encoding device 1.
  • gain correction amounts corresponding to two adjacent ranges are obtained by vector quantization decoding.
  • the range R1 and the range R2 constitute a group G12
  • the range R3 and the range R4 constitute a group G34
  • the range R12 and the range R34 constitute a group G1234. That is, the range constituting each group is as follows.
  • the first vector quantization decoding is vector quantization decoding for the group G12, that is, vector quantization decoding of the gain correction amount corresponding to the range R1 and the gain correction amount corresponding to the range R2. This is hereinafter referred to as “first VQ”.
  • the second vector quantization decoding is vector quantization decoding for the group G34, that is, vector quantization decoding of the gain correction amount corresponding to the range R3 and the gain correction amount corresponding to the range R4. This is hereinafter referred to as “second VQ”.
  • the third vector quantization decoding is vector quantization decoding for the group G1234, that is, vector quantization decoding of the gain correction amount corresponding to the range R12 and the gain correction amount corresponding to the range R34. This is hereinafter referred to as “third VQ”.
  • the storage unit 251 of the restoration unit 250 stores the gain correction amount candidate ⁇ 1 (ma) corresponding to the range R1, the gain correction amount candidate ⁇ 2 (ma) corresponding to the range R2, and the gain correction amount of these gain correction amounts.
  • a set of ⁇ 1 (1), ⁇ 2 (1) and idx 12 (1), a set of ⁇ 1 (2), ⁇ 2 (2) and idx 12 (2), ..., ⁇ A set of 1 (2 Ma ), ⁇ 2 (2 Ma ), and idx 12 (2 Ma ) is stored in the storage unit 251 as a first VQ gain correction amount codebook.
  • the number of bits of the code idx 12 (ma) is Ma bits.
  • the gain correction amount codebook of the first VQ has ⁇ 1 (1) And ⁇ 2 (1), a gain correction amount candidate vector composed of ⁇ 1 (2) and ⁇ 2 (2),..., ⁇ 1 (2 Ma ) and ⁇ 2 (2 Ma ) of gain correction amount candidate vectors composed of a total of 2 Ma gain correction amount candidate vectors, and a total of 2 Ma codes idx 12 (1), corresponding to a total of 2 Ma gain correction amount candidate vectors, respectively. It can be considered that idx 12 (2), ..., idx 12 (2 Ma ) is stored.
  • the storage unit 251 stores gain correction amount candidates ⁇ 3 (mb) corresponding to the range R3, gain correction amount candidates ⁇ 4 (mb) corresponding to the range R4, and gain correction amount candidates.
  • set of 2 Mb pieces of a code idx 34 (mb) for identifying (2 Mb th power, Mb is an integer of 1 or more, mb ⁇ ⁇ 1, ..., 2 Mb ⁇ ])) are stored.
  • a set of 3 (2 Mb ), ⁇ 4 (2 Mb ), and idx 34 (2 Mb ) is stored in the storage unit 251 as a second VQ gain correction amount codebook.
  • Mb may be the same value as Ma or a different value.
  • the number of bits of the code idx 34 (mb) is Mb bits.
  • the second VQ gain correction amount codebook includes a gain correction amount candidate vector composed of ⁇ 3 (1) and ⁇ 4 (1), and a gain correction amount composed of ⁇ 3 (2) and ⁇ 4 (2).
  • Candidate vectors, 2 Mb gain correction amount candidate vectors, and a total of 2 Mb gain correction amount candidate vectors of gain correction amount candidate vectors composed of ⁇ 3 (2 Mb ) and ⁇ 4 (2 Mb ) It can be considered that a total of 2 Mb codes idx 34 (1), idx 34 (2),..., Idx 34 (2 Mb ) corresponding to the above are stored.
  • the storage unit 251 stores a gain correction amount candidate ⁇ 12 (mc) in the range R12, a gain correction amount candidate ⁇ 34 (mc) in the range R34, and a code idx for specifying these gain correction amount candidates.
  • a set of ⁇ 12 (1), ⁇ 34 (1) and idx 1234 (1), a set of ⁇ 12 (2), ⁇ 34 (2) and idx 1234 (2), ..., ⁇ A set of 12 (2 Mc ), ⁇ 34 (2 Mc ), and idx 1234 (2 Mc ) is stored in the storage unit 251 as the third VQ gain correction amount codebook.
  • Mc may be the same value as Ma or a different value. Further, Mc may be the same value as Mb or a different value.
  • the number of bits of the code idx 1234 (mc) is Mc bits.
  • the third VQ gain correction amount codebook includes a gain correction amount candidate vector composed of ⁇ 12 (1) and ⁇ 34 (1), and a gain correction amount composed of ⁇ 12 (2) and ⁇ 34 (2).
  • idx 1234 (2), ... may be considered as idx 1234 (2 Mc) is stored.
  • ⁇ 1 (1), ..., ⁇ 1 (2 Ma ) is associated with the range R1
  • ⁇ 2 (1), ..., ⁇ 2 (2 Ma ) is associated with the range R2.
  • in the range R4 ⁇ 4 (1), ... , ⁇ 4 (2 Mb) is correlated ⁇ 12 (1),..., ⁇ 12 (2 Mc ) is associated with the range R12
  • ⁇ 34 (1),..., ⁇ 34 (2 Mc ) is associated with the range R34.
  • the restoration unit 250 first decodes the code corresponding to each range constituting the gain correction amount code idx by using the gain correction amount codebook stored in the storage unit 251 to obtain the gain correction corresponding to each range. Get quantity.
  • the restoration unit 250 obtains an output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L min ,..., L (1) ⁇ 1 ⁇ ] in the range R1 by the following equation.
  • the restoration unit 250 performs decoding global gain g ⁇ of correction using the delta 12 and delta 1 and the gain correction amount for the range R1, the corrected gain g ⁇ + ⁇ 12 + ⁇ 1 and the decoded normalization Multiplied by the value of each sample of the completed signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min , ..., L (1) -1], and the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L min , ..., L (1) -1 ⁇ ] is obtained.
  • the restoration unit 250 obtains an output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (1) ,..., L (2) ⁇ 1 ⁇ ] in the range R2 by the following equation.
  • X ⁇ ( ⁇ ) (g ⁇ + ⁇ 12 + ⁇ 2 ) X ⁇ Q ( ⁇ ) (F6) That is, the restoration unit 250 performs decoding global gain g ⁇ corrected using the delta 12 and delta 2 is a gain correction amount for the range R2, the corrected gain g ⁇ + ⁇ 12 + ⁇ 2 and the decoded normalization Multiplied by the value of each sample of the completed signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L (1) ,..., L (2) -1], and the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (1) ,..., L (2) ⁇ 1 ⁇ ].
  • the restoration unit 250 obtains an output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (2) ,..., L (3) ⁇ 1 ⁇ ] in the range R3 by the following equation.
  • X ⁇ ( ⁇ ) (g ⁇ + ⁇ 34 + ⁇ 3 ) X ⁇ Q ( ⁇ ) (F7) That is, the restoration unit 250 performs decoding global gain g ⁇ corrected using the delta 34 and delta 3 is a gain correction amount for the range R3, the corrected gain g ⁇ + ⁇ 34 + ⁇ 3 and the decoded normalization Multiplied by the value of each sample of the completed signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L (2) ,..., L (3) -1], and the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (2) ,..., L (3) ⁇ 1 ⁇ ].
  • the restoration unit 250 obtains an output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (3) ,..., L max ⁇ ] in the range R4 by the following equation.
  • X ⁇ ( ⁇ ) (g ⁇ + ⁇ 34 + ⁇ 4 ) X ⁇ Q ( ⁇ ) (F8) That is, the restoration unit 250 performs decoding global gain g ⁇ corrected using the delta 34 and delta 4 is a gain correction amount for range R4, the corrected gain g ⁇ + ⁇ 34 + ⁇ 4 and the decoded normalization Multiplied by the value of each sample of the completed signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L (3) ,..., L max ], and the output signal series X ⁇ ( ⁇ ) [ ⁇ ⁇ L (3) , ..., L max ⁇ ].
  • the absolute value of the gain correction amount candidate ⁇ 1 (ma) corresponding to the range R1 and the gain corresponding to the range R2 The absolute value of the correction amount candidate ⁇ 2 (ma), the absolute value of the gain correction amount candidate ⁇ 3 (mb) corresponding to the range R3, and the gain correction amount candidate ⁇ 4 (mb) corresponding to the range R4
  • the absolute value may be smaller than the absolute value of the gain correction amount candidate ⁇ 12 (mc) in the range R12 and the absolute value of the gain correction amount candidate ⁇ 34 (mc) in the range R34.
  • the gain correction amount candidate vector can be generated as follows, for example.
  • the storage unit 251 stores, for example, 2 E normalized gain correction amount candidate vectors, that is, ( ⁇ 1 (1), ⁇ 2 (1)),... ( ⁇ 1 (2 E ), ⁇ 2 (2 E )) Is stored.
  • E is a predetermined integer, for example, Me.
  • a predetermined coefficient is associated with the two divided ranges obtained by the processing of the two-segment unit 261 according to the number of times of processing of the two-segment unit 261. For example, towards the absolute value of the predetermined coefficient corresponding from the 2 n th to the processing of the 2 n + 1 -1-th second section portion 261, from the 2 n-1 th of the 2 n -1 time two The association is performed so as to be smaller than the absolute value of the predetermined coefficient corresponding to the processing of the sorting unit 261.
  • a vector obtained by multiplying the normalized gain correction amount candidate vector by a predetermined coefficient corresponding to the number of processes of the two-segment unit 261 is divided into two segments obtained by the process of the second-segment unit 261 for that number of times. Let it be a gain correction amount candidate vector for the range.
  • each of the two values ⁇ 1 (i), ⁇ 2 (i) constituting the normalized gain correction amount candidate vector ( ⁇ 1 (i), ⁇ 2 (i)) is divided into two sections 261.
  • Step ⁇ 1 (i), step ⁇ 2 (i) composed of two values step ⁇ 1 (i) and step ⁇ 2 (i) obtained by multiplying a predetermined coefficient step corresponding to the number of times )
  • 2 E-number Gain correction amount candidate vectors step ⁇ 1 (i), step ⁇ 2 (i) are obtained.
  • the gain correction amount candidate corresponding to each of the two divided ranges obtained by the second-time processing by the two-division unit 261 is combined with a code for specifying the gain correction amount candidate as one gain correction amount codebook.
  • FIG. For example, assuming that n is an integer greater than or equal to 0, gain correction amount candidate vectors ( ⁇ 1) for two divided ranges obtained by the processing of the second dividing unit 261 from the 2 nth time to the 2 n + 1 ⁇ 1 time. , n (i), ⁇ 2, n (i)) are stored together with a code idx (i) for identifying the gain correction amount candidate vector ( ⁇ 1, n (i), ⁇ 2, n (i)). 251 is stored.
  • Two sections obtained by the second section 261 from the second (n 1) to the third.
  • the gain correction amount candidate vectors for the two segmented range obtained from the 2 n-th in the processing of the 2 n + 1 -1-th second section part 261 ( ⁇ 1, n (i ), delta 2, n (i)) candidate delta 1 of the gain correction amount constituting, n (i), delta 2, towards n of the absolute value of (i) is the 2 n -1 from the 2 n-1 th Gain corrections constituting gain correction amount candidate vectors ( ⁇ 1, n-1 (i), ⁇ 2, n-1 (i)) for two divided ranges obtained by the second processing of the two-dividing unit 261 It is assumed that the absolute value of the quantity candidates ⁇ 1, n-1 (i), ⁇ 2, n-1 (i) is smaller.
  • the restoration unit 250 determines the gain specified by a code corresponding to each range constituting the input gain correction amount code idx from among a plurality of gain correction amount candidate vectors stored in the gain correction amount codebook. A correction amount candidate vector is selected. The decoding global gain is corrected using the gain correction amount constituting the selected gain correction amount candidate vector.
  • the restoration unit 250 replaces the expressions (F5), (F6), (F7), and (F8) with the expressions (F9), (F10), (F11), and (F12), respectively.
  • the output signal sequence X ⁇ ( ⁇ ) may be obtained.
  • X ⁇ ( ⁇ ) (g ⁇ + s 12 ⁇ 12 + s 1 ⁇ 1 ) X ⁇ Q ( ⁇ ) (F9)
  • X ⁇ ( ⁇ ) (g ⁇ + s 12 ⁇ 12 + s 2 ⁇ 2 ) X ⁇ Q ( ⁇ ) (F10)
  • X ⁇ ( ⁇ ) (g ⁇ + s 34 ⁇ 34 + s 3 ⁇ 3 )
  • X ⁇ ( ⁇ ) (g ⁇ + s 34 ⁇ 34 + s 4 ⁇ 4 ) X ⁇ Q ( ⁇ ) (F12)
  • s 1 , s 2 , s 3 , s 4 , s 12 , and s 34 are defined as in the following equations.
  • the decoded global gain ⁇ circumflex over (g) ⁇ may be corrected by a value obtained by multiplying the sum of squares of sample values by a value obtained by dividing the sum of squares of all sample values within a range corresponding to each gain correction amount.
  • the restoration unit 250 replaces the equations (F5), (F6), (F7), and (F8) with equations (F13), (F14), (F15), and (F16), respectively. Based on this, the output signal sequence X ⁇ ( ⁇ ) may be obtained.
  • X ⁇ ( ⁇ ) (g ⁇ + s 1 ( ⁇ 12 + ⁇ 1 )) X ⁇ Q ( ⁇ ) (F13)
  • X ⁇ ( ⁇ ) (g ⁇ + s 2 ( ⁇ 12 + ⁇ 2 ))
  • X ⁇ ( ⁇ ) (g ⁇ + s 3 ( ⁇ 34 + ⁇ 3 ))
  • X ⁇ ( ⁇ ) (g ⁇ + s 4 ( ⁇ 34 + ⁇ 4 )) X ⁇ Q ( ⁇ ) (F16)
  • the restoration unit 250 adds the gain correction amount for each divided range for each range, and the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,.
  • L max ⁇ ] may be corrected by a value obtained by multiplying a sum of squares of values of all samples by a value obtained by dividing the sum of squares of values of all samples within each divided range by the sum of squares of the values of all samples.
  • s 12 , s 34 , s 1 , s 2 , s 3 , and s 4 may be defined as in the following equations, respectively.
  • the energy of the samples in the range R12 is the number of sample that is larger than the first predetermined value.
  • c 34 the energy of the samples in the range R34 is the number of sample that is larger than the second predetermined value.
  • c 1234 is the number of samples in which the energy of the sample in the range R1234 is larger than the third predetermined value.
  • c 1 is the number of samples in which the energy of the sample in the range R1 is larger than the fourth predetermined value.
  • c 2 is the energy of the samples in the range R2 is the number of larger samples than the fifth predetermined value.
  • c 3 is the number of samples in which the energy of the sample in the range R3 is larger than the sixth predetermined value.
  • c 4 is the energy of the samples in the range R4 is the number of larger samples than the seventh predetermined value.
  • the decoding unit 260 uses each gain correction amount for each divided range and the energy of the sample of the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ].
  • the number of samples with a value greater than the eighth predetermined value is decoded by a value obtained by multiplying the number of samples within the range corresponding to each gain correction amount by the number of samples divided by the number of samples greater than the ninth predetermined value.
  • the global gain g ⁇ will be corrected.
  • the decoding unit 260 adds the gain correction amount for each divided range for each range and the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] Is multiplied by a value obtained by dividing the number of samples in which the energy of the sample is larger than the tenth predetermined value by the number of samples in which the energy of the samples within each divided range is larger than the eleventh predetermined value.
  • the decoding global gain g ⁇ is corrected by the value.
  • first to eleventh predetermined values may be different from each other, but are preferably the same value. These first to eleventh predetermined values correspond to ⁇ in the formula (B2).
  • the sorting process performed by the two sorting unit 261 on the sorting target range is the same as the sorting process performed by the two sorting unit 151 of the encoding device 1 on the sorting target range.
  • the first range of the classification target range is, for example, (a) The square sum of the values of all the samples included in the first range of the classification target range and the half of the square sum of the values of all the samples of the classification target range are closest to each other. Or (b) The absolute value sum of the values of all the samples included in the first range of the classification target range and the half of the absolute value sum of the values of all the samples of the classification target range are closest to each other.
  • the number of samples in the first range of the classification target range is the sum of squares of the values of all the samples included in the first range of the classification target range is 2 of the square sum of the values of all the samples in the classification target range. So that the minimum number of samples is 1 / min.
  • the absolute value sum of the values of all the samples in the classification target range is the sum of the absolute values of the values of all the samples included in the first range of the classification target range. So that the minimum number of samples is at least half of
  • the number of samples in the first range of the classification target range is the sum of squares of the values of all the samples included in the first range of the classification target range is 2 of the square sum of the values of all the samples in the classification target range.
  • the number of samples from the first range to the nth range of the classification target range is the sum of the absolute values of the values of all the samples included in the first range of the classification target range. So that the maximum number of samples is less than one half of the sum of absolute values of Seeking
  • the range other than the first range in the sorting target range is set as the second range of the sorting target range, so that the sorting target range is divided into two ranges.
  • the classification process exemplified above is realized by a method of sequentially determining the classification based on the “criteria for classifying so that the energy of each range is as equal as possible” sequentially from the first range. According to the classification process exemplified above, it is possible to realize the classification based on the “standard for classifying the energy in each range so as to be as equal as possible” with a small amount of calculation processing.
  • the classification process in the “criteria for classifying so that the number of significant samples included in each range is as equal as possible” includes, for example, the first range of the classification target range, (a) Of all the samples included in the first range of the classification target range, the number of samples whose sample energy is greater than or equal to the predetermined value and of all the samples included in the classification target range So that the energy of the sample is greater than or equal to one half of the number of samples that are greater than or equal to the predetermined value.
  • the number of samples whose sample energy is greater than or equal to a predetermined value among all samples included in the first range of the classification target range is among all samples included in the classification target range.
  • the sample number is the minimum number of samples that is greater than or equal to one-half of the number of samples that are greater than or equal to a predetermined value
  • the number of samples whose absolute value of the sample is greater than or equal to the predetermined value is equal to that of all samples included in the classification target range.
  • the absolute value of the sample is larger than the predetermined value or the minimum number of samples that is more than half of the number of samples that is equal to or larger than the predetermined value.
  • the number of samples whose sample energy is greater than or equal to the predetermined value among all the samples included in the first range of the classification target range.
  • the maximum number of samples is less than one half of the number of samples whose sample energy is greater than or equal to or greater than a predetermined value.
  • the number of samples whose absolute value of the sample is greater than or equal to or greater than the predetermined value is the number of samples included in the classification target range.
  • the absolute value of the sample is greater than the predetermined value or the maximum number of samples that is less than or equal to half of the number of samples that is greater than or equal to the predetermined value. Seeking
  • the range other than the first range in the sorting target range is set as the second range of the sorting target range, so that the sorting target range is divided into two ranges.
  • the classification process exemplified above realizes the classification based on the “criteria for classifying so that the number of significant samples included in each range is as equal as possible” by a method of sequentially determining each range. . According to the classification process exemplified above, it is possible to realize classification according to “a criterion for classifying so that the number of significant samples included in each range is as equal as possible” with a small amount of calculation processing.
  • Specific examples of the sorting process performed by the two-sorting unit 261 are specific examples of the sorting process performed by the two-sorting unit 151 of the encoding device 1 to “first example of the sorting process based on the first reference”.
  • Quantized normalized signal in each of the specific examples of “sixth example of segmentation processing by”, “first example of segmentation processing by second criterion” to “sixth example of segmentation processing by second criterion” Sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min , ..., l max ⁇ ] replaced with decoded normalized signal series X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min , ..., l max ⁇ ] It is.
  • the output signal sequence X ⁇ ( ⁇ ) is input to the time domain conversion unit 270 provided as necessary.
  • the time domain transform unit 270 applies a frequency-time transform to the output signal sequence X ⁇ ( ⁇ ) and outputs a time domain signal sequence z F (t) in units of frames.
  • the frequency-time conversion method is an inverse conversion corresponding to the time-frequency conversion method used in the frequency domain conversion unit 101.
  • the frequency-time conversion method here is IMDCT (Inverse Modified Discrete Cosine Transform) or IDCT (Inverse Discrete Cosine Transform).
  • Second Embodiment >> In the second embodiment, the remaining bits of the normalized signal code are used for the gain correction amount code idx.
  • the number of consumed bits may be smaller than the specified number of bits. is there.
  • the normalized signal encoding unit 120 outputs the number of gain correction bits U obtained by subtracting the number of consumed bits from the specified number of bits to the dividing unit 150.
  • the gain correction amount encoding unit 140 outputs a U-bit gain correction amount code idx based on the input number U of gain correction bits.
  • the normalized signal decoding unit 107 uses the consumption bits that are the number of bits of the actual normalized signal code from the specified number of bits defined as the maximum value of the number of bits of the normalized signal code
  • the number U of gain correction bits obtained by subtracting the number is output to the sorting unit 260.
  • the restoration unit 250 can decode the input U-bit gain correction amount code idx.
  • bits that are prepared for the normalized signal code but are not actually used for the normalized signal code are used as the gain correction amount code idx. As a result, it is possible to perform encoding and decoding using the given bits effectively.
  • the encoding device, the encoding method, the decoding device, and the decoding method according to the present invention are not limited to the above-described embodiments, and can be appropriately changed without departing from the spirit of the present invention. Is possible.
  • the processing described in the above embodiment may be executed not only in time series according to the order of description but also in parallel or individually as required by the processing capability of the apparatus that executes the processing. .
  • the processing functions in the encoding device / decoding device are realized by a computer
  • the processing contents of the functions that the encoding device / decoding device should have are described by a program.
  • the processing functions of the encoding device / decoding device are realized on the computer.
  • the program describing the processing contents can be recorded on a computer-readable recording medium.
  • a computer-readable recording medium for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
  • the encoding device and the decoding device are configured by executing a predetermined program on the computer.
  • at least a part of the processing contents may be realized by hardware. Good.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 符号化方法は、入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、正規化信号符号に対応する量子化正規化済み信号系列とを得る正規化信号符号化処理と、入力信号系列に対応する量子化グローバルゲインと、量子化グローバルゲインに対応するグローバルゲイン符号とを得るグローバルゲイン符号化処理と、量子化正規化済み信号系列を3つ以上の範囲に区分する区分処理と、各区分された範囲についての少なくとも1つのゲイン補正量で量子化グローバルゲインを補正して得られるゲインを量子化正規化済み信号系列の各サンプルの値に乗算して得られる信号系列と入力信号系列との相関が最大又は誤差が最小となるゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量の符号化処理とを有する。

Description

符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
 本発明は、音声や音楽などの音響信号を少ない情報量で符号化するための技術に関し、より詳しくは、量子化精度を向上させる符号化技術に関する。
 現在、音声や音楽などの音響信号を離散化したディジタルの入力信号を高能率に符号化する技術として、例えば、入力信号に含まれる5から200ms程度の一定間隔の各区間(フレーム)の入力信号系列を処理対象として、1フレームの入力信号系列に時間-周波数変換を適用して得られた周波数領域信号を符号化することが知られている。このような従来技術のうち、非特許文献1に開示されている符号化装置と復号装置の概要を図1に示す。
 なお、非特許文献1によるとグローバルゲイン(正規化された入力信号系列の量子化精度に影響を及ぼすゲイン)の量子化値は時間領域で計算されている。しかし、時間領域における信号のエネルギーと周波数領域における信号のエネルギーは等しいため、グローバルゲインの量子化値を周波数領域で求めてもこの結果は時間領域におけるそれと異ならない。したがって、ここでは、グローバルゲインの量子化値およびその復号値を周波数領域で計算する場合を例示する。
 以下、符号化装置での処理を説明する。
 <周波数領域変換部101>
 周波数領域変換部101には、時間領域の入力信号x(t)に含まれる連続する複数サンプルからなるフレーム単位の入力時間領域信号系列xF(t)が入力される。周波数領域変換部101は、1フレームの入力時間領域信号系列xF(t)に対応するL点(Lは、正整数で例えば256である)の周波数成分を入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]として出力する。ここで、tは離散時間のインデックス、ωは離散周波数のインデックスを表す。時間-周波数変換方法として、例えばMDCT(Modified Discrete Cosine Transform)またはDCT(Discrete Cosine Transform)を用いることができる。
 <正規化部102>
 正規化部102には、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]と、後述するゲイン制御部104で求められた入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の各成分の量子化精度を決定するゲイン(以下、グローバルゲインという)gが入力される。正規化部102は、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の各成分をグローバルゲインgでそれぞれ除することによって、もしくは入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の各成分にグローバルゲインgの逆数をそれぞれ乗ずることによって、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の正規化を行い、正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]を出力する。
 <量子化部103>
 量子化部103には、正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]が入力される。量子化部103は、事前に定められた方法で正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]の量子化を行い、正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]の各成分の量子化値による系列である量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]、および量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に対応する符号である正規化信号符号を生成し、正規化信号符号のビット数(以下、消費ビット数という)を出力する。また、ゲイン制御部104から、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]と正規化信号符号を出力する指令情報を受けた場合には、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]と正規化信号符号を出力する。
 <ゲイン制御部104>
 ゲイン制御部104には、消費ビット数が入力される。ゲイン制御部104は、消費ビット数が正規化信号符号に対して事前に割り当てられたビット数(以下、規定ビット数という)以下の最大値に近づくようにグローバルゲインgを調整し、調整後のグローバルゲインgを新たなグローバルゲインgとして出力する。グローバルゲインgの調整の一例として、消費ビット数が規定ビット数より大きい場合にはグローバルゲインgを大きくし、そうでなければグローバルゲインgを小さくする処理を例示できる。消費ビット数が規定ビット数以下の最大値となった場合には、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]と正規化信号符号を出力する指令情報を量子化部103に対して出力する。
 <グローバルゲイン符号化部105>
 グローバルゲイン符号化部105には、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]と量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]が入力される。グローバルゲイン符号化部105は、予め設定されたグローバルゲインの量子化値の複数の候補のうち、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]と、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]の各成分とグローバルゲインの量子化値の候補との乗算値による系列と、の間の相関が最大または誤差が最小となるグローバルゲインの量子化値の候補g^に対応する符号をグローバルゲイン符号として出力する。
 符号化装置の出力符号である正規化信号符号とグローバルゲイン符号は、復号装置に向けて送信され、復号装置に入力される。
 以下、復号装置での処理を説明する。
 <グローバルゲイン復号部106>
 グローバルゲイン復号部106には、グローバルゲイン符号が入力される。グローバルゲイン復号部106は、グローバルゲイン符号化部105が行う符号化処理に対応する復号処理を適用して当該グローバルゲイン符号を復号し、復号グローバルゲインg^を出力する。
 <正規化信号復号部107>
 正規化信号復号部107には、正規化信号符号が入力される。正規化信号復号部107は、符号化装置の量子化部103で行われる符号化方法と対応する復号方法を適用して当該正規化信号符号を復号し、復号正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]を出力する。
 <復号周波数成分計算部108>
 復号周波数成分計算部108には、復号グローバルゲインg^と復号正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]が入力される。復号周波数成分計算部108は、復号正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]の各成分と復号グローバルゲインg^とをそれぞれ乗算して得られる系列を復号周波数領域信号系列X^(ω) [ω∈{0,…,L-1}]として出力する。
 <時間領域変換部109>
 時間領域変換部109には、復号周波数領域信号系列X^(ω) [ω∈{0,…,L-1}]が入力される。時間領域変換部109は、復号周波数領域信号系列X^(ω) [ω∈{0,…,L-1}]に対して周波数-時間変換を適用して、フレーム単位の出力時間領域信号系列zF(t)を出力する。周波数-時間変換方法は、周波数領域変換部101で用いられた時間-周波数変換方法に対応する逆変換である。上述の例であれば、ここでの周波数-時間変換方法は、IMDCT(Inverse Modified Discrete Cosine Transform)またはIDCT(Inverse Discrete Cosine Transform)である。
Guillaume Fuchs, Markus Multrus, Max Neuendorf and Ralf Geiger, "MDCT-BASED CODER FOR HIGHLY ADAPTIVE SPEECH AND AUDIO CODING," 17th European Signal Processing Conference (EUSIPCO 2009), Glasgow, Scotland, August 24-28, 2009.
 上述のような符号化方法では、グローバルゲインを調整して正規化済み信号系列の量子化の粗さを適宜制御し、このことによって正規化信号符号の符号量である消費ビット数が規定ビット数以下の最大値となるように制御を行っている。このため、規定ビット数より消費ビット数が小さい場合は、正規化済み信号系列のために事前に割り当てられたビット数を十分に生かした符号化処理を行えていないという問題がある。
 このような状況に鑑みて、本発明は、正規化済み信号系列の量子化精度を少ない符号量の増加で改善する符号化技術とその復号技術を提供することを目的とする。
 本発明の一態様による符号化方法は、複数の入力信号サンプルにより構成される、フレーム単位の入力信号系列を符号化する符号化方法において、入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、正規化信号符号に対応する量子化正規化済み信号系列と、を得る正規化信号符号化ステップと、入力信号系列に対応するゲインである量子化グローバルゲインと、量子化グローバルゲインに対応するグローバルゲイン符号と、を得るグローバルゲイン符号化ステップと、量子化正規化済み信号系列を3つ以上の範囲に区分する区分ステップと、各区分された範囲についての少なくとも1つのゲイン補正量で量子化グローバルゲインを補正して得られるゲインを各区分された範囲ごとに量子化正規化済み信号系列の各サンプルの値に乗算して得られる信号系列と入力信号系列との相関が最大又は誤差が最小となるゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化ステップと、を有し、区分ステップにおける量子化正規化済み信号系列の区分は、入力された区分対象範囲を2つの範囲に区分する二区分ステップにより行われ、二区分ステップは、二区分ステップで得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行され、第1回目の二区分ステップは、量子化正規化済み信号系列を区分対象範囲とすることにより行われ、第2n回目(nは1以上の各整数)から第2n+1-1回目の二区分ステップのそれぞれは、第2n-1回目から第2n-1回目の二区分ステップで得られる2n個の範囲のうちの何れか1つの範囲を区分対象範囲とすることにより行われる。
 本発明の一態様による復号方法は、フレーム単位の符号を復号して出力信号系列を得る復号方法において、符号に含まれる正規化信号符号を復号して復号正規化済み信号系列を得る正規化信号復号ステップと、符号に含まれるグローバルゲイン符号を復号して復号グローバルゲインを得るグローバルゲイン復号ステップと、復号正規化済み信号系列を3つ以上の範囲に区分する区分ステップと、符号に含まれるゲイン補正量符号を復号して得られる各区分された範囲についての少なくとも1つのゲイン補正量で復号グローバルゲインを補正して得られるゲインを各区分された範囲ごとに復号正規化済み信号系列の各サンプルの値にを乗算して得られる信号系列を出力信号系列として得る復元ステップと、を有し、区分ステップにおける復号正規化済み信号系列の区分は、入力された区分対象範囲を2つの範囲に区分する二区分ステップにより行われ、二区分ステップは、二区分ステップで得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行され、第1回目の二区分ステップは、復号正規化済み信号系列を区分対象範囲とすることにより行われ、第2n回目(nは1以上の各整数)から第2n+1-1回目の二区分ステップのそれぞれは、第2n-1回目から第2n-1回目の二区分ステップで得られる2n個の範囲のうちの何れか1つの範囲を区分対象範囲とすることにより行われる。
 符号を要することなく符号化側と復号側で同一の方法でフレームを複数の範囲に区分し、複数の範囲のそれぞれにおいて、フレームの帯域全体に適用される量子化グローバルゲインを補正することによって、少ない符号量の増加でゲインの量子化精度が向上し、ミュージカルノイズや量子化ノイズなどに起因する音質劣化を軽減できる。
従来技術に関わる符号化装置と復号装置の機能構成例を示すブロック図。 第1実施形態に係る符号化装置の機能構成例を示すブロック図。 第1実施形態に係る符号化処理の処理フローを示す図。 第1基準による区分処理の第1例の具体例1の処理フローを示す図。 第1基準による区分処理の第3例の具体例1の処理フローを示す図。 第1基準による区分処理の第5例の具体例1の処理フローを示す図。 第2基準による区分処理の第1例の具体例1の処理フローを示す図。 第2基準による区分処理の第3例の具体例1の処理フローを示す図。 第2基準による区分処理の第5例の具体例1の処理フローを示す図。 区分された範囲の例を説明するための図。 区分部150の処理フローの例を示す図。 ゲイン補正量符号化部140の変形例5及び復元部250の変形例5を説明するための図。 第1実施形態に係る復号装置の機能構成例を示すブロック図。 第1実施形態に係る復号処理の処理フローを示す図。 区分部260の処理フローの例を示す図。
 本発明の実施形態を、図面を参照して説明する。同一構成要素ないし同一処理には同一符号を割り当てて重複説明を省略する場合がある。なお、各実施形態で扱う音響信号は音声や楽音などの音響、映像などの信号である。ここでは音響信号が時間領域信号であることを想定しているが、必要に応じて周知技術によって時間領域信号を周波数領域信号に変換することも、或いは周波数領域信号を時間領域信号に変換することもできる。したがって、符号化処理の対象となる信号は、時間領域信号でも周波数領域信号でもよい(以下の説明では、説明を具体的にするため、周波数領域信号を扱う)。符号化処理の対象として入力される信号は複数のサンプルで構成される系列(サンプル系列)であり、符号化処理は通常、フレーム単位で実行されることから、処理対象の信号を入力信号系列と呼称することにする。
 例えば図1に示す技術を参考にすると、入力信号系列X(ω) [ω∈{0,…,L-1}]に含まれる各成分、量子化グローバルゲインg^および量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に含まれる各成分の間の関係は式(1)で表すことができる。ここで、egはグローバルゲインgと量子化グローバルゲインg^との量子化誤差を、eXQは正規化入力信号系列XQ(ω) [ω∈{0,…,L-1}]と量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に含まれる対応する成分同士(同じωの値の成分同士)の量子化誤差を表している。
Figure JPOXMLDOC01-appb-M000001
 通常の量子化では、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に対応する符号である正規化信号符号に消費される消費ビット数は入力信号系列に依存し、正規化信号符号用に予め定められた規定ビット数の一部が未使用のビットとして残る場合が多い。そこで、この残った一つまたは複数のビット(以下、未使用ビットという)を量子化誤差egとeXQの低減に利用する。さらに言えば、未使用ビットに限らず、量子化誤差の低減のために事前に用意された一つまたは複数のビットを利用してもよい。以下で説明する実施形態では、未使用ビットまたは事前に用意された一つまたは複数のビットのうち一部または全部を量子化誤差egの低減に利用することを説明する。例えば、未使用ビットまたは事前に用意された一つまたは複数のビットのうち、量子化誤差eXQの低減に使われなかった残りのビットを量子化誤差egの低減に利用することができる。もちろん、量子化誤差egの低減のためだけに利用される一つまたは複数のビットを事前に用意しておいてもよい。以下、量子化誤差egの低減に利用可能なビットを「ゲイン修正ビット」と呼称する。ゲイン修正ビットのビット数をUとする。
 「量子化誤差egを低減する」ことは、換言すると、「量子化グローバルゲインを補正する」ことに他ならない。量子化グローバルゲインの補正に関して、一つのフレームに関する離散周波数のインデックスω∈{0,1,2,…,L-1}の全体、つまり系列全体、に共通の量子化グローバルゲインを補正する方法が考えられる。しかし、音響信号の特性を考慮すると、系列全体に共通の量子化グローバルゲインを補正するよりも、系列全体BをN個(ただし、Nは2以上の予め定められた整数である)の範囲{Bnn=1 N={B1,…,Bn,…,BN}に区分した後、各範囲に対応するゲインを、量子化グローバルゲインを補正することによって求める方が、音声品質の向上を期待できる。このような観点から、実施形態における適応量子化では、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]の系列全体が複数の範囲に区分される。
 符号化装置と復号装置とで同じ信号系列BをN個の範囲に区分するために容易に考えられる方法は、隣接する範囲の境界位置や各範囲に含まれる成分数のような範囲を特定する情報を符号化装置の出力とする方法である。しかし、範囲を特定する情報を出力するためには大量のビット数が必要となる。範囲を特定する情報を符号化装置の出力とすることなく、すなわち、ビットを消費することなく、符号化装置と復号装置とで同じ基準で区分を行なう。また、各範囲に対してなるべく均等にゲイン修正ビット、すなわち、量子化グローバルゲインを修正するための情報量、を与えることを想定し、各範囲に含まれる量子化正規化済み信号系列の成分の情報量がなるべく均等となることが望ましい。そこで、系列区分の基準として「各範囲のエネルギーがなるべく等しくなるように区分する基準」又は「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」を採用する。これらの基準による具体的な区分方法については、後に詳述する。
 実施形態の詳細を以下に説明する。
 《第1実施形態》
 第1実施形態の符号化装置1(図2参照)は、正規化信号符号化部120、グローバルゲイン符号化部105、区分部150、ゲイン補正量符号化部140及び制御部170を含む。符号化装置1は、必要に応じて、周波数領域変換部101と合成部160を含んでもよい。
 まず、符号化装置1(encoder)が行う符号化処理を説明する(図3参照)。
 ここでは、符号化装置1の入力信号系列は、フレーム単位の音響信号x(t)に対応するL点(Lは、正整数で例えば256である)の周波数成分である入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]であるとして説明する。ここで、tは離散時間のインデックス、ωは離散周波数のインデックス、LminはL点の周波数成分のうちの最小の離散周波数のインデックス、LmaxはL点の周波数成分のうちの最大の離散周波数のインデックス、を表す。ただし、フレーム単位の音響信号x(t)そのものを符号化装置1の入力信号系列としてもよいし、フレーム単位の音響信号x(t)に対して線形予測分析をした残差信号を符号化装置1の入力信号系列としてもよいし、その残差信号に対応するL点(Lは、正整数で例えば256である)の周波数成分を入力信号系列としてもよい。
 <周波数領域変換部101>
 符号化装置1は、符号化装置1の前処理部として、または符号化装置1内に、周波数領域変換部101を備えてもよい。この場合は、周波数領域変換部101がフレーム単位の時間領域の音響信号x(t)に対応するL点(Lは、正整数で例えば256である)の周波数成分を生成して入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]として出力する。時間-周波数変換方法として、例えばMDCT(Modified Discrete Cosine Transform)やDCT(Discrete Cosine Transform)を用いることができる。この場合も、フレーム単位の時間領域の音響信号に代えて、フレーム単位の時間領域の音響信号を線形予測分析して得られる残差信号をx(t)としてもよい。
 <正規化信号符号化部120>
 正規化信号符号化部120は、フレーム単位の入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]の各成分が正規化された信号による系列を符号化して得られる正規化信号符号と、この正規化信号符号に対応する量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を出力する(ステップS1e)。
 正規化信号符号化部120は、例えば、図1の正規化部102、量子化部103、ゲイン制御部104により実現される。正規化部102、量子化部103、ゲイン制御部104のそれぞれは、[背景技術]欄で説明した通りに動作する。
 <グローバルゲイン符号化部105>
 グローバルゲイン符号化部105が、入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]に対応するゲインである量子化グローバルゲインg^と、量子化グローバルゲインg^に対応するグローバルゲイン符号とを得る(ステップS2e)。また、グローバルゲイン符号化部105は、必要に応じて量子化グローバルゲインg^に対応する量子化ステップ幅も得る。
 グローバルゲイン符号化部105は、例えば、[背景技術]欄で説明した通りに動作する。
 また、例えば、グローバルゲイン符号化部105は、量子化グローバルゲインの候補とその候補に対応するグローバルゲイン符号の組を複数組格納したテーブルを備え、正規化信号符号化部120で得られたグローバルゲインgと最も近い量子化グローバルゲインの候補を量子化グローバルゲインg^とし、その候補に対応するグローバルゲイン符号を出力してもよい。
 要は、グローバルゲイン符号化部105は、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の各成分とゲインとを乗算して得られる信号系列と入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]との相関が最大または誤差が最小となるような基準で求められた量子化グローバルゲインg^とこの量子化グローバルゲインに対応するグローバルゲイン符号を求めて出力すればよい。
 なお、ゲイン補正量符号化部140が量子化グローバルゲインg^に対応する量子化ステップ幅を用いた処理を行う場合は、量子化グローバルゲインg^に対応する量子化ステップ幅もゲイン補正量符号化部140に対して出力される。
 <区分部150>
 区分部150には、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]及びゲイン修正ビットのビット数Uが入力される。区分部150は、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を、3つ以上の範囲に区分する(ステップS3e)。区分についての情報である区分情報は、ゲイン補正量符号化部140に送信される。
 区分部150は、二区分部151を含む。二区分部151は、入力された区分対象範囲を2つの範囲に区分する。二区分部151の処理の詳細については、後述する。
 二区分部151による区分処理は、二区分部151の区分処理で得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行される。これにより、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]は、3つ以上の範囲に区分される。ゲイン補正量符号用に割り当てられたビット数は、ゲイン修正ビットのビット数Uのことである。
 第1回目の二区分部151の処理は、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を区分対象範囲とすることにより行われる。
 nを1以上の各整数として、第2n回目から第2n+1-1回目の二区分部151の処理のそれぞれは、第2n-1回目から第2n-1回目の二区分部151の処理で得られる2n個の範囲のうちの何れか1つの範囲を区分対象範囲とすることにより行われる。
 以下、図11を参照しながら、区分部150の処理の一例について説明する。
 制御部170は、余剰ビット数uをゲイン修正ビットのビット数Uとすることにより、余剰ビット数uの値を初期化する(ステップS3e0)。
 制御部170は、余剰ビット数uが0より大であるか判定する(ステップS3e1)。
 ステップS3e1において、余剰ビット数uが0より大でないと判定された場合には、ステップS3eの処理を終了する。
 ステップS3e1において、余剰ビット数uが0より大であると判定された場合には、制御部170は、二区分部151による今回の処理の対象となる範囲である区分対象範囲を決定する(ステップS3e2)。区分対象範囲についての情報は、二区分部151に送信される。
 前回の二区分部151の処理が第2n回目から第2n+1-1回目の処理であり、第2n-1回目から第2n-1回目の処理で区分して得られた2個の範囲のうち区分対象範囲となっていない範囲が残っている場合には、制御部170は、この残っている範囲の何れか1つの範囲を、区分対象範囲[lmin,lmax]とする。
 nを1以上の整数として、前回の二区分部151の処理が第2n+1-1回目の処理であり、第2n-1回目から第2n-1回目の処理で区分して得られた2個の範囲のうち区分対象範囲となっていない範囲が残っていない場合、制御部170は、第2n回目から第2n+1-1回目の処理で区分して得られた2n+1個の範囲のうち何れか1つの範囲を、区分対象範囲[lmin,lmax]とする。
 前回の二区分部151の処理が1回目の処理である場合、制御部170は、1回目の処理で区分して得られた2個の範囲のうち何れか1つの範囲を、区分対象範囲[lmin,lmax]とする。
 二区分部151は、区分対象範囲を2つの範囲に区分する(ステップS3e3)。区分対象範囲を[lmin,lmax]と表記し、区分された範囲のうち、低域側の範囲を[lmin,lmid-1]、高域側の範囲を[lmid,lmax]と表記する。二区分部151の処理の詳細については、後述する。
 二区分部151は、2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数Meを決定する(ステップS3e4)。これにより、2つの区分された範囲にそれぞれ対応する2つのゲイン補正量にMe個のビットを割り当てる。このビット数Meは、所定の固定値でもよいし、二区分部151で区分された2つの区分された範囲ごとに異なってもよい。決定されたビット数Meについての情報は、ゲイン補正量符号化部140に送信される。
 制御部170は、u←u-Meとして、余剰ビットの数uをMeだけデクリメントする(ステップS3e5)。すなわち、uからMeを減じた値を新たなuの値とする。その後、ステップS3e1に戻る。
 このようにして、ステップS3e1からステップS3e5の処理は、余剰ビットの数uが0より大きい限りは繰り返される。換言すれば、二区分部151の処理は、二区分部151の区分処理で得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行される。
 [区分部150の変形例1]
 第2n回目から第2n+1-1回目の二区分部151の処理は、第2n-1回目から第2n-1回目の二区分部151の処理で得られた2n個の範囲のうち、聴覚的な重要度が高い範囲から順に区分対象範囲とすることにより行なわれてもよい。
 [区分部150の変形例2]
 また、一般的には、周波数が低い帯域の方が、周波数が高い帯域よりも、聴覚的な重要度が高いことが多い。このため、入力信号系列が周波数領域の信号系列である場合には、第2n回目から第2n+1-1回目の二区分部151の処理は、第2n-1回目から第2n-1回目の二区分部151の処理で得られた2n個の範囲のうち、周波数が低い範囲から順に区分対象範囲とすることにより行なわれてもよい。
 <ゲイン補正量符号化部140>
 ゲイン補正量符号化部140には、入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]と、量子化グローバルゲインg^と、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]と区分情報が入力される。ゲイン補正量符号化部140は、記憶部141を例えば含む。
 ゲイン補正量符号化部140は、各区分された範囲についての少なくとも1つのゲイン補正量で量子化グローバルゲインg^を補正して得られるゲインを各区分された範囲ごとに量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の各サンプルの値に乗算して得られる信号系列と入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]との誤差が最小となるゲイン補正量を特定するためのゲイン補正量符号idxを得る(ステップS4e)。
 ゲイン補正量による量子化グローバルゲインg^の補正の一例は、ゲイン補正量と量子化グローバルゲインg^との加算である。
 各区分された範囲についての少なくとも1つのゲイン補正量とは、その各区分された範囲に対応するゲイン補正量、及び、その各区分された範囲を含む範囲に対応するゲイン補正量のことである。その各区分された範囲を含む範囲が存在しない場合には、その各区分された範囲についてのゲイン補正量は、その各区分された範囲に対応するゲイン補正量のことである。
 例えば、図10に示すように、量子化正規化済み信号系列が4個の範囲に区分されているとする。この例では、量子化正規化済み信号系列は、第1の範囲R1、第2の範囲R2、第3の範囲R3及び第4の範囲R4に区分されている。第1の範囲R1は区間[Lmin,L(1)-1]であり、第2の範囲R2は区間[L(1),L(2)-1]であり、第3の範囲R3は区間[L(2),L(3)-1]であり、第4の範囲R4は区間[L(3),Lmax]である。図10の横軸は、サンプル番号を表す。範囲R1及び範囲R2は、第1回目の二区分部151の処理で得られた範囲R12に含まれる。また、範囲R3及び範囲R4は、第1回目の二区分部151の処理で得られた範囲R34に含まれる。
 したがって、範囲R1についての少なくとも1つのゲイン補正量は、範囲R1に対応するゲイン補正量及び範囲R12に対応するゲイン補正量である。範囲R2についての少なくとも1つのゲイン補正量は、範囲R2に対応するゲイン補正量及び範囲R12に対応するゲイン補正量である。範囲R3についての少なくとも1つのゲイン補正量は、範囲R3に対応するゲイン補正量及び範囲R34に対応するゲイン補正量である。範囲R4についての少なくとも1つのゲイン補正量は、範囲R4に対応するゲイン補正量及び範囲R34に対応するゲイン補正量である。
 区分部150の二区分部151において、範囲R12及び範囲R34にそれぞれ対応する2つのゲイン補正量にMc個のビットが割り当てられており、範囲R1及び範囲R2にそれぞれ対応する2つのゲイン補正量にMa個のビットが割り当てられており、範囲R3及び範囲R4にそれぞれ対応する2つのゲイン補正量にMb個のビットが割り当てられているとする。各範囲に対応するゲイン補正量は、二区分部151でその各範囲に対応するゲイン補正量に割り当てられたビット数で特定されるとする。
 各範囲に対応するゲイン補正量は、スカラー量子化されてもよいし、ベクトル量子化されてもよい。ここでは、図10に示すように範囲が区分されており、隣接する2つの範囲に対応するゲイン補正量をベクトル量子化する場合を例に挙げて説明する。
 この例では、範囲R1及び範囲R2がグループG12を構成しており、範囲R3及び範囲R4がグループG34を構成しており、範囲R12及び範囲R34がグループG1234を構成している。すなわち、各グループを構成する範囲は、以下のようになる。
 グループG12={範囲R1,範囲R2}
 グループG34={範囲R3,範囲R4}
 グループG1234={範囲R12,範囲R34}
ベクトル量子化は、これらのグループG12,G34,G1234のそれぞれで行われる。
 具体的には、次の3つのベクトル量子化が行なわれる。第1のベクトル量子化は、グループG12についてのベクトル量子化、すなわち範囲R1に対応するゲイン補正量と範囲R2に対応するゲイン補正量とのベクトル量子化である。これを以下では「第1VQ」という。第2のベクトル量子化は、グループG34についてのベクトル量子化、すなわち範囲R3に対応するゲイン補正量と範囲R4に対応するゲイン補正量とのベクトル量子化である。これを以下では「第2VQ」という。第3のベクトル量子化は、グループG1234についてのベクトル量子化、すなわち範囲R12に対応するゲイン補正量と範囲R34に対応するゲイン補正量とのベクトル量子化である。これを以下では「第3VQ」という。
 ゲイン補正量符号化部140の記憶部141には、範囲R1に対応するゲイン補正量の候補Δ1(ma)と、範囲R2に対応するゲイン補正量の候補Δ2(ma)と、これらのゲイン補正量の候補を特定する符号idx12(ma)との組が2Ma個(2のMa乗個、Maは1以上の整数、ma∈{1,…,2Ma}])格納されている。具体的には、Δ1(1)とΔ2(1)とidx12(1)との組、Δ1(2)とΔ2(2)とidx12(2)との組、…、Δ1(2Ma)とΔ2(2Ma)とidx12(2Ma)との組が第1VQのゲイン補正量コードブックとして記憶部141に格納されている。符号idx12(ma)のビット数はMaビットである。すなわち、第1VQにより出力される符号(以下、第1VQ符号という)idx12はMaビットである。
 a個(この例ではa=2)のゲイン補正量の候補で構成されたベクトルを、ゲイン補正量候補ベクトルと呼ぶことにすると、第1VQのゲイン補正量コードブックには、Δ1(1)及びΔ2(1)で構成されたゲイン補正量候補ベクトル、Δ1(2)及びΔ2(2)で構成されたゲイン補正量候補ベクトル、…、Δ1(2Ma)及びΔ2(2Ma)で構成されたゲイン補正量候補ベクトルの計2Ma個のゲイン補正量候補ベクトルと、計2Ma個のゲイン補正量候補ベクトルとそれぞれ対応する計2Ma個の符号idx12(1),idx12(2),…,idx12(2Ma)が格納されていると考えることができる。
 また、記憶部141には、範囲R3に対応するゲイン補正量の候補Δ3(mb)と、範囲R4に対応するゲイン補正量の候補Δ4(mb)と、これらのゲイン補正量の候補を特定する符号idx34(mb)との組が2Mb個(2のMb乗個、Mbは1以上の整数、mb∈{1,…,2Mb}])格納されている。具体的には、Δ3(1)とΔ4(1)とidx34(1)との組、Δ3(2)とΔ4(2)とidx34(2)との組、…、Δ3(2Mb)とΔ4(2Mb)とidx34(2Mb)との組が第2VQのゲイン補正量コードブックとして記憶部141に格納されている。MbはMaと同じ値であっても異なる値であってもよい。符号idx34(mb)のビット数はMbビットである。すなわち、第2VQにより出力される符号(以下、第2VQ符号という)idx34はMbビットである。
 第2VQのゲイン補正量コードブックには、Δ3(1)及びΔ4(1)で構成されたゲイン補正量候補ベクトル、Δ3(2)及びΔ4(2)で構成されたゲイン補正量候補ベクトル、…、Δ3(2Mb)及びΔ4(2Mb)で構成されたゲイン補正量候補ベクトルの計2Mb個のゲイン補正量候補ベクトルと、計2Mb個のゲイン補正量候補ベクトルとそれぞれ対応する計2Mb個の符号idx34(1),idx34(2),…,idx34(2Mb)が格納されていると考えてもよい。
 さらに、記憶部141には、範囲R12のゲイン補正量の候補Δ12(mc)と、範囲R34のゲイン補正量の候補Δ34(mc)と、これらのゲイン補正量の候補を特定する符号idx1234(mc)との組が2Mc個(2のMc乗個、Mcは1以上の整数、mc∈{1,…,2Mc}])格納されている。具体的には、Δ12(1)とΔ34(1)とidx1234(1)との組、Δ12(2)とΔ34(2)とidx1234(2)との組、…、Δ12(2Mc)とΔ34(2Mc)とidx1234(2Mc)との組が第3VQのゲイン補正量コードブックとして記憶部141に格納されている。McはMaと同じ値であっても異なる値であってもよい。また、McはMbと同じ値であっても異なる値であってもよい。符号idx1234(mc)のビット数はMcビットである。すなわち、第3VQにより出力される符号(以下、第3VQ符号という)idx1234はMcビットである。
 第3VQのゲイン補正量コードブックには、Δ12(1)及びΔ34(1)で構成されたゲイン補正量候補ベクトル、Δ12(2)及びΔ34(2)で構成されたゲイン補正量候補ベクトル、…、Δ12(2Mc)及びΔ34(2Mc)で構成されたゲイン補正量候補ベクトルの計2Mc個のゲイン補正量候補ベクトルと、計2Mc個のゲイン補正量候補ベクトルとそれぞれ対応する計2Mc個の符号idx1234(1),idx1234(2),…,idx1234(2Mc)が格納されていると考えてもよい。
 このように、各区分された範囲には、複数個のゲイン補正量の候補が対応付けされている。この例では、範囲R1にはΔ1(1),…,Δ1(2Ma)が対応付けされており、範囲R2にはΔ2(1),…,Δ2(2Ma)が対応付けされており、範囲R3にはΔ3(1),…,Δ3(2Mb)が対応付けされており、範囲R4にはΔ4(1),…,Δ4(2Mb)が対応付けされており、範囲R12にはΔ12(1),…,Δ12(2Mc)が対応付けされており、範囲R34にはΔ34(1),…,Δ34(2Mc)が対応付けされている。
 このとき、ゲイン補正量符号化部140は、以下の式(F1)で定義される誤差を最小にするゲイン補正量ベクトルを特定するためのゲイン補正量符号idxを得る。
Figure JPOXMLDOC01-appb-M000002
 換言すれば、ゲイン補正量符号化部140は、以下の式(F2)で定義される第3VQ符号idx1234と第1VQ符号idx12と第2VQ符号idx34をゲイン補正量符号idxとして出力する。
Figure JPOXMLDOC01-appb-M000003
 [ゲイン補正量符号化部140の変形例1]
 第2n回目から第2n+1-1回目の二区分部151の処理で得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補の絶対値の方が、第2n-1回目から第2n-1回目の二区分部151の処理で得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補の絶対値よりも小さくてもよい。
 量子化正規化済み信号系列が4個の範囲に区分されている図10に示す例だと、範囲R1に対応するゲイン補正量の候補Δ1(ma)の絶対値と、範囲R2に対応するゲイン補正量の候補Δ2(ma)の絶対値と、範囲R3に対応するゲイン補正量の候補Δ3(mb)の絶対値と、範囲R4に対応するゲイン補正量の候補Δ4(mb)の絶対値とが、範囲R12のゲイン補正量の候補Δ12(mc)の絶対値及び範囲R34のゲイン補正量の候補Δ34(mc)の絶対値よりも小さくてもよい。
 Δ12(mc),Δ34(mc)>Δ1(ma),Δ2(ma),Δ3(mb),Δ4(mb)
 [ゲイン補正量符号化部140の変形例2]
 ゲイン補正量候補ベクトルは、例えば次のようにして生成することができる。
 記憶部141には、2個の値で構成される正規化ゲイン補正量候補ベクトルがその正規化ゲイン補正量候補ベクトルを特定する符号と共に複数格納されているとする。正規化ゲイン補正量候補ベクトルを構成する2個の値をΔ1(i),Δ2(i)と表記すると、正規化ゲイン補正量候補ベクトルは(Δ1(i),Δ2(i))と表記することができる。記憶部141には、例えば、2E個の正規化ゲイン補正量候補ベクトル、すなわち(Δ1(1),Δ2(1)),…,(Δ1(2E),Δ2(2E))が格納されている。Eは、所定の整数であり、例えばMeである。
 なお、Δの右肩の数字及び文字はΔについての単なる添え字でありべき乗を意味しない。一方、例えば2E等のΔ以外の文字の右肩の数字及び文字はべき乗を意味する点に注意すること。
 二区分部151の処理で得られる2つの区分された範囲には、その二区分部151の処理の回数に応じて所定の係数が対応付けされているものとする。例えば、第2n回目から第2n+1-1回目の二区分部151の処理に対応する所定の係数の絶対値の方が、第2n-1回目から第2n-1回目の二区分部151の処理に対応する所定の係数の絶対値よりも小さいように対応付けがされている。
 このとき、正規化ゲイン補正量候補ベクトルに、二区分部151の処理の回数に対応する所定の係数を乗算したベクトルを、その回数目の二区分部151の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトルとする。言いかえれば、正規化ゲイン補正量候補ベクトル(Δ1(i),Δ2(i))を構成する2個の値Δ1(i),Δ2(i)のそれぞれに、二区分部151の処理の回数に対応する所定の係数stepを乗算することにより得られた2個の値stepΔ1(i),stepΔ2(i)により構成されるベクトル(stepΔ1(i),stepΔ2(i))を、その回数目の二区分部151の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトルとする。この乗算は、ゲイン補正量符号化部140の乗算部144により行われる。正規化ゲイン補正量候補ベクトル(Δ1(i),Δ2(i))が2E個ある場合には、i=1,…,2Eのそれぞれについてこの乗算を行うことにより、2E個のゲイン補正量候補ベクトル(stepΔ1(i),stepΔ2(i))が得られる。
 [ゲイン補正量符号化部140の変形例3]
 二区分部151による各回数目の処理で得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補をそのゲイン補正量の候補を特定する符号と共に、ひとつのゲイン補正量コードブックとして記憶部141に格納しておいてもよい。例えば、nを0以上の各整数として、第2n回目から第2n+1-1回目の二区分部151の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))が、そのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を特定する符号idx(i)と共に記憶部141に格納されているとする。
 すなわち、図12に例示するように、nの最大値をnmaxとして、1回目(n=0)の二区分部151の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,0(i),Δ2,0(i))[i=1,…,2E]、2回目(n=1)から3回目の二区分部151の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,1(i),Δ2,1(i))[i=1,…,2E]、4回目(n=2)から7回目の二区分部151の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,2(i),Δ2,2(i))[i=1,…,2E]、…、第2nmax回目(n=nmax)から第2nmax+1-1回目の二区分部151の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,nmax(i),Δ2,nmax(i))[i=1,…,2E]が、そのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を特定する符号idx(i)と共に記憶部141に格納されているとする。
 二区分部151の処理が行われる回数をD(Dはnmax以下の整数)とすると、符号idx(i)で特定されるゲイン補正量候補ベクトルは、A=Σd=1 Ddとして、A個のゲイン補正量の候補で構成されていると考えてもよい。
 このとき、例えば、第2n回目から第2n+1-1回目の二区分部151の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を構成するゲイン補正量の候補Δ1,n(i),Δ2,n(i)の絶対値の方が、第2n-1回目から第2n-1回目の二区分部151の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,n-1(i),Δ2,n-1(i))を構成するゲイン補正量の候補Δ1,n-1(i),Δ2,n-1(i)の絶対値よりも小さいとする。
 [ゲイン補正量符号化部140の変形例4]
 ゲイン補正量符号化部140は、式(F1)ではなく式(F3)で定義される誤差を最小にするゲイン補正量を特定してもよい。
Figure JPOXMLDOC01-appb-M000004
 s1,s2,s3,s4,s12,s34は、例えば以下の式のように定義される。
Figure JPOXMLDOC01-appb-M000005
 このように、ゲイン補正量符号化部140は、各区分された範囲についての各ゲイン補正量と、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全てのサンプルの値の二乗和をその各ゲイン補正量に対応する範囲内の全てのサンプルの値の二乗和で除算した値とを乗算した値で量子化グローバルゲインg^を補正してもよい。
 また、ゲイン補正量符号化部140は、式(F1)に代えて式(F4)で定義される誤差を最小にするゲイン補正量を特定するためのゲイン補正量符号idxを得てもよい。
Figure JPOXMLDOC01-appb-M000006
 このように、ゲイン補正量符号化部140は、各区分された範囲についてのゲイン補正量を各範囲ごとに加算した値と、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全てのサンプルの値の二乗和を各区分された範囲内の全てのサンプルの値の二乗和で除算した値とを乗算した値で量子化グローバルゲインg^を補正してもよい。
 なお、s12,s34,s1,s2,s3,s4を、それぞれ以下の式のように定義してもよい。
Figure JPOXMLDOC01-appb-M000007
 c12は、範囲R12のサンプルのエネルギーが第一の所定値よりも大きいサンプルの個数である。c34は、範囲R34のサンプルのエネルギーが第二の所定値よりも大きいサンプルの個数である。c1234は、範囲R1234のサンプルのエネルギーが第三の所定値よりも大きいサンプルの個数である。c1は、範囲R1のサンプルのエネルギーが第四の所定値よりも大きいサンプルの個数である。c2は、範囲R2のサンプルのエネルギーが第五の所定値よりも大きいサンプルの個数である。c3は、範囲R3のサンプルのエネルギーが第六の所定値よりも大きいサンプルの個数である。c4は、範囲R4のサンプルのエネルギーが第七の所定値よりも大きいサンプルの個数である。
 この場合、ゲイン補正量符号化部140は、各区分された範囲についての各ゲイン補正量と、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のサンプルのエネルギーが第八の所定値よりも大きいサンプルの個数をその各ゲイン補正量に対応する範囲内のサンプルのエネルギーが第九の所定値よりも大きいサンプルの個数で除算した値とを乗算した値で量子化グローバルゲインg^を補正することになる。または、ゲイン補正量符号化部140は、各区分された範囲についてのゲイン補正量を各範囲ごとに加算した値と、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のサンプルのエネルギーが第十の所定値よりも大きいサンプルの個数を各区分された範囲内のサンプルのエネルギーが第十一の所定値よりも大きいサンプルの個数で除算した値とを乗算した値で量子化グローバルゲインg^を補正することになる。
 これらの第一から第十一の所定値は、互いに異なる値であってもよいが、同じ値であることが好ましい。これらの第一から第十一の所定値は、後述する式(B2)におけるεに対応する。
 ゲイン補正量符号化部140の処理が終わった後は、必要に応じて、合成部160が、正規化信号符号と、ゲイン補正量符号化部140で得られたゲイン補正量符号idxと、グローバルゲイン符号をまとめたビットストリームを出力する。ビットストリームは復号装置2へ伝送される。
 <二区分部151が行なう区分処理の詳細>
 二区分部151は、「各範囲のエネルギーがなるべく等しくなるように区分する基準」又は「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」に基づいて、区分対象範囲を2つの範囲に区分する。
 まず「各範囲のエネルギーがなるべく等しくなるように区分する基準」での区分処理について説明し、次に「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」での区分処理について説明する。
 以下、「各範囲のエネルギーがなるべく等しくなるように区分する基準」を第1基準、「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」を第2基準と略記することがある。
 「各範囲のエネルギーがなるべく等しくなるように区分する基準」での区分処理は、例えば、区分対象範囲の第1の範囲を、
(a) 区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和と、区分対象範囲の全てのサンプルの値の二乗和の2分の1と、が最も近付くように、
または、
(b) 区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和と、区分対象範囲の全てのサンプルの値の絶対値和の2分の1と、が最も近付くように、
または、
(c) 区分対象範囲の第1の範囲のサンプル数の合計が、区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和が区分対象範囲の全てのサンプルの値の二乗和の2分の1以上となる最小のサンプル数になるように、
または、
(d) 区分対象範囲の第1の範囲のサンプル数の合計が、区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和が区分対象範囲の全てのサンプルの値の絶対値和の2分の1以上となる最小のサンプル数になるように、
または、
(e) 区分対象範囲の第1の範囲のサンプル数の合計が、区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和が区分対象範囲の全てのサンプルの値の二乗和の2分の1以下となる最大のサンプル数になるように、
または、
(f) 区分対象範囲の第1の範囲のサンプル数の合計が、区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和が区分対象範囲の全てのサンプルの値の絶対値和の2分の1以下となる最大のサンプル数になるように、
求め、
区分対象範囲のうちの第1の範囲以外の範囲を、区分対象範囲の第2の範囲とすることで、区分対象範囲を2個の範囲に区分することにより行なわれる。
 上記に例示した区分処理は、「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を、第1の範囲から順に逐次的に決定していく方法によって実現するものである。上記に例示した区分処理によれば、少ない演算処理量で「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を実現できる。
 [第1基準による区分処理の第1例]
 第1基準による区分処理の第1例を図4を用いて説明する。第1例の区分処理は上記の(a)に対応する。
 図4は、区分対象範囲X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{l mid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるlmidを決定する場合の例である。
 まず、区分対象範囲X^Q(ω) [ω∈{lmin,…,lmax}]の全サンプルX^Q(lmin),…,X^Q(lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
Figure JPOXMLDOC01-appb-M000008
 次に、式(2)により求めた区分対象範囲X^Q [ω∈{lmin,…,lmax}]の全サンプルX^Q(lmin),…,X^Q(lmax)の二乗和の2分の1と、区分対象範囲の第1の範囲に含まれる全てのサンプルX^Q(lmin),…,X^Q(lmid-1)の値の二乗和との差が最小となるように、第2の範囲の最も低域側にあるサンプル番号であるlmidを求める。すなわち、lmidは式(3)によって求まる。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
Figure JPOXMLDOC01-appb-M000009
 そして、区分対象範囲X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、区分対象範囲X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 二区分部151が出力する区分情報は、lmidであってもよいし、lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-lminであってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第1基準による区分処理の第2例]
 第1基準による区分処理の第2例は上記の(b)に対応する。第2例の区分処理は、第1例の区分処理における「二乗和」を「絶対値和」に置き換えた以外は、第1例の区分処理と同じ方法である。第2例の区分処理によれば、第1例の区分処理で行なう二乗計算を省略できる分、第1例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 [第1基準による区分処理の第3例]
 第1基準による区分処理の第3例を図5を用いて説明する。第3例の区分処理は上記の(c)に対応する。
 図5は、区分対象範囲X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{lmid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるlmidを決定する場合の例である。
 まず、区分対象範囲X^Q(ω) [ω∈{lmin,…,lmax}]の全サンプルX^Q(lmin),…,X^Q(lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、離散周波数のインデックスωの番号をlminから順に増やしながら区分対象範囲X^Q(ω)のlminから当該インデックスまでの二乗和plowがplow≧pow/2を満たすか否かを判定し、初めてplow≧pow/2を満たす場合の離散周波数のインデックスωまでを第1の範囲とし、当該インデックスωに1を加算したものを第2の範囲の最も低域側にあるサンプル番号であるインデックスlmidとして出力する。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
 図5は、上記の処理を実現するためのフローチャートである。離散周波数のインデックスωの初期値をlmin、低域のエネルギーplowの初期値を|X^Q(lmin)|2に設定する。そして、plow≧pow/2を満たすか否かを判定する。plow≧pow/2を満たさない場合には、離散周波数のインデックスωに1を加えたものを新たなωとし、plowにX^Q(ω)のエネルギー|X^Q(ω)|2を加算したものを新たなplowとする。plow≧pow/2を満たす場合には、その時点での離散周波数のインデックスωに1を加えたものをインデックスlmidとして出力する。
 そして、区分対象範囲X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、区分対象範囲X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 二区分部151が出力する区分情報は、lmidであってもよいし、lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-lminであってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第1基準による区分処理の第4例]
 第1基準による区分処理の第4例は上記の(d)に対応する。第4例の区分処理は、第3例の区分処理における「二乗和」を「絶対値和」に置き換えた以外は、第3例の区分処理と同じ方法である。第4例の区分処理によれば、第3例の区分処理で行なう二乗計算を省略できる分、第3例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 [第1基準による区分処理の第5例]
 第1基準による区分処理の第5例を図6を用いて説明する。第5例の区分処理は上記の(e)に対応する。
 図6は、区分対象範囲X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{lmid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるlmidを決定する場合の例である。
 まず、区分対象範囲X^Q(ω) [ω∈{lmin,…,lmax}]の全サンプルX^Q(lmin),…,X^Q(lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、離散周波数のインデックスωの番号をlminから順に増やしながら区分対象範囲X^Q(ω)のlminから当該インデックスまでの二乗和plowがplow≦pow/2を満たすか否かを判定し、初めてplow≦pow/2を満たさなくなる場合の離散周波数のインデックスωから1を減算した離散周波数までを第1の範囲とし、当該インデックスωをを第2の範囲の最も低域側にあるサンプル番号であるインデックスlmidとして出力する。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
 図6は、上記の処理を実現するためのフローチャートである。離散周波数のインデックスωの初期値をlmin、低域のエネルギーplowの初期値を|X^Q(lmin)|2に設定する。そして、plow≦pow/2を満たすか否かを判定する。plow≦pow/2を満たす場合には、離散周波数のインデックスωに1を加えたものを新たなωとし、plowにX^Q(ω)のエネルギー|X^Q(ω)|2を加算したものを新たなplowとする。plow≦pow/2を満たさない場合には、その時点での離散周波数のインデックスωをインデックスlmidとして出力する。
 そして、区分対象範囲X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、区分対象範囲X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 二区分部151が出力する区分情報は、lmidであってもよいし、lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-lminであってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 
 [第1基準による区分処理の第6例]
 第1基準による区分処理の第6例は上記の(f)に対応する。第6例の区分処理は、第5例の区分処理における「二乗和」を「絶対値和」に置き換えた以外は、第5例の区分処理と同じ方法である。第6例の区分処理によれば、第5例の区分処理で行なう二乗計算を省略できる分、第5例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 次に、第2基準である「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」での区分処理について説明する。
 「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」での区分処理は、例えば、区分対象範囲の第1の範囲を、
(a) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数と、区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1と、が最も近付くように、
または、
(b) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数と、区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1と、が最も近付くように、
または、
(c) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数が、区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以上となる最小のサンプル数となるように、
または、
(d) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数が、区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以上となる最小のサンプル数となるように、
または、
(e) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数が、区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以下となる最大のサンプル数となるように、
または、
(f)区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数が、区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以下となる最大のサンプル数となるように、
求め、
区分対象範囲のうちの第1の範囲以外の範囲を、区分対象範囲の第2の範囲とすることで、区分対象範囲を2個の範囲に区分することにより行なわれる。
 上記に例示した区分処理は、「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」による区分を、各範囲を逐次的に決定していく方法によって実現するものである。上記に例示した区分処理によれば、少ない演算処理量で「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」による区分を実現できる。
 [第2基準による区分処理の第1例]
 第2基準による区分処理の第1例を図7を用いて説明する。第1例の区分処理は上記の(a)に対応する。
 図7は、区分対象範囲X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{lmid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるl midを決定する場合の例である。
 まず、各インデックスωについてfcount(ω)を式(B2)によって定める。各インデックスωについてのfcount(ω)には、区分対象範囲X^Q(ω) [ω∈{lmin,…,lmax}]のインデックスωに対応するサンプルのエネルギー|X^Q(ω)|2が所定値より大きいサンプルに対して「サンプルのエネルギー|X^Q(ω)|が所定値より大きい」ことを表す情報として1を設定し、それ以外のサンプルに対して「サンプルのエネルギー|X^Q(ω)|が所定値より大きくない」ことを表す情報として0を設定する。この例では所定値を任意に予め定めた微小量ε(εは0以上の値)とする。
Figure JPOXMLDOC01-appb-M000010
 次に、区分対象範囲に含まれる全てのサンプルX^Q(ω) [ω∈{lmin,…,lmax}]のうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(lmax)の2分の1と、区分対象範囲の第1の範囲に含まれる全てのサンプルX^Q(ω) [ω∈{lmin,…,lmid-1}]のうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(lmid-1)との差分値(差の絶対値)が最小となるように、第2の範囲の最も低域側にあるサンプル番号であるlmidを求める。すなわち、lmidは式(B3)によって求まる。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
Figure JPOXMLDOC01-appb-M000011
 そして、区分対象範囲X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、区分対象範囲X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 二区分部151が出力する区分情報は、lmidであってもよいし、lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-1-lmin+1であってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第2基準による区分処理の第2例]
 第2基準による区分処理の第2例は上記の(b)に対応する。第2例の区分処理は、第1例の区分処理における「サンプルのエネルギー|X^Q(ω)|2」を「サンプルの絶対値|X^Q(ω)|」に置き換えた以外は、第1例の区分処理と同じ方法である。第2例の区分処理によれば、第1例の区分処理で行なう二乗計算を省略できる分、第1例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 [第2基準による区分処理の第3例]
 第2基準による区分処理の第3例を図8を用いて説明する。第3例の区分処理は上記の(c)に対応する。
 図8は、区分対象範囲X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{lmid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるlmidを決定する場合の例である。
 まず、各インデックスωについてfcount(ω)を式(B2)によって定める。
 次に、区分対象範囲に含まれる全てのサンプルX^Q(ω) [ω∈{lmin,…,lmax}]のうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(lmax)を求める。
 次に、離散周波数のインデックスωの番号kをlminから順に増やしながらlminから当該インデックスkまでの区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(k)が(fcount(lmin)+…+fcount(lmax))/2以上であるか否かを判定し、初めてfcount(lmin)+…+fcount(k)が (fcount(lmin)+…+fcount(lmax))/2以上となる離散周波数のインデックスkまでを第1の範囲とし、当該インデックスkに1を加算したものを第2の範囲の最も低域側にあるサンプル番号であるインデックスl midとして出力する。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
 そして、区分対象範囲X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、区分対象範囲X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 二区分部151が出力する区分情報は、l midであってもよいし、l midに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-lminであってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第2基準による区分処理の第4例]
 第2基準による区分処理の第4例は上記の(d)に対応する。第4例の区分処理は、第3例の区分処理における「サンプルのエネルギー|X^Q(ω)|2」を「サンプルの絶対値|X^Q(ω)|」に置き換えた以外は、第3例の区分処理と同じ方法である。第4例の区分処理によれば、第3例の区分処理で行なう二乗計算を省略できる分、第3例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 [第2基準による区分処理の第5例]
 第2基準による区分処理の第5例を図9を用いて説明する。第5例の区分処理は上記の(e)に対応する。
 図9は、区分対象の区分対象範囲X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{lmid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるlmidを決定する場合の例である。
 まず、各インデックスωについてfcount(ω)を式(B2)によって定める。
 次に、区分対象範囲に含まれる全てのサンプルX^Q(ω) [ω∈{lmin,…,lmax}]のうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(lmax)を求める。
 次に、離散周波数のインデックスωの番号kをlminから順に増やしながらlminから当該インデックスkまでの区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(k)が(fcount(lmin)+…+fcount(lmax))/2より大であるか否かを判定し、初めてfcount(lmin)+…+fcount(k)が (fcount(lmin)+…+fcount(lmax))/2より大となる離散周波数のインデックスkより1小さいk-1までを第1の範囲とし、当該インデックスkを第2の範囲の最も低域側にあるサンプル番号であるインデックスl midとして出力する。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
 そして、区分対象範囲X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、区分対象範囲X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 二区分部151が出力する区分情報は、lmidであってもよいし、lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-lminであってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第2基準による区分処理の第6例]
 第2基準による区分処理の第6例は上記の(f)に対応する。第6例の区分処理は、第5例の区分処理における「サンプルのエネルギー|X^Q(ω)|2」を「サンプルの絶対値|X^Q(ω)|」に置き換えた以外は、第5例の区分処理と同じ方法である。第6例の区分処理によれば、第5例の区分処理で行なう二乗計算を省略できる分、第5例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 なお、符号化装置1から復号装置2へビットストリームを伝送する実施構成に限定されず、例えば、合成部160によって得られた情報を記録媒体に記録し、当該記録媒体から読み出された当該情報が復号装置2に入力される実施構成も許容される。
 第1実施形態の復号装置2(図13参照)は、正規化信号復号部107、グローバルゲイン復号部106、区分部260及び復元部250を含む。復号装置2は必要に応じて分離部210、時間領域変換部270を含んでもよい。
 以下、復号装置2(decoder)での処理を説明する(図14参照)。
 符号化装置1から送信されたビットストリームは復号装置2に入力される。分離部210が、ビットストリームから、正規化信号符号と、グローバルゲイン符号と、ゲイン補正量符号idxを取り出す。
 <正規化信号復号部107>
 正規化信号復号部107には、正規化信号符号が入力される。正規化信号復号部107が、符号化装置1の正規化信号符号化部120が行う符号化方法と対応する復号方法を適用して、正規化信号符号を復号して復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を得る(ステップS1d)。この例では、符号化装置1に対応して説明を行なうため、ωは離散周波数のインデックスを表すものとし、L点の離散周波数の各成分をω=LminからLmaxのそれぞれで表すものとする。正規化信号復号部107は、[背景技術]欄で説明した図1の正規化信号復号部107と同じ動作をする。
 <グローバルゲイン復号部106>
 グローバルゲイン復号部106には、グローバルゲイン符号が入力される。グローバルゲイン復号部160は、当該グローバルゲイン符号を復号し、復号グローバルゲインg^を出力する(ステップS2d)。グローバルゲイン復号部106が行う復号処理は、グローバルゲイン符号化部105が行う符号化処理に対応する処理であり、[背景技術]欄のグローバルゲイン復号部106でも説明した通りの周知技術である。
 <区分部260>
 区分部260には、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]、ゲイン補正量符号idx、ゲイン補正量符号用に割り当てられたビット数が少なくとも入力される。区分部260は、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を3つ以上の範囲に区分する(ステップS3d)。区分についての情報である区分情報は、復元部250に送信される。
 区分部260は、二区分部261を含む。二区分部261は、区分対象範囲を2つの範囲に区分する。二区分部261の処理の詳細については、後述する。
 二区分部261による区分処理は、二区分部261の区分処理で得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行される。これにより、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]は、3つ以上の範囲に区分される。
 第1回目の二区分部261の処理は、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を区分対象範囲とすることにより行われる。
 nを1以上の各整数として、第2n回目から第2n+1-1回目の二区分部261の処理のそれぞれは、第2n-1回目から第2n-1回目の二区分部261の処理で得られる2n個の範囲のうちの何れか1つの範囲を区分対象範囲とすることにより行われる。
 以下、図15を参照しながら、区分部260の処理の一例について説明する。
 制御部280は、余剰ビット数uをゲイン補正量符号用に割り当てられたビット数Uとすることにより、余剰ビット数uの値を初期化する(ステップS3d0)。
 制御部280は、余剰ビット数uが0より大であるか判定する(ステップS3d1)。
 ステップS3d1において、余剰ビット数uが0より大でないと判定された場合には、ステップS3dの処理を終了する。
 ステップS3d1において、余剰ビット数uが0より大であると判定された場合には、制御部280は、二区分部261による今回の処理の対象となる範囲である区分対象範囲を決定する(ステップS3d2)。区分対象範囲についての情報は、二区分部261に送信される。
 前回の二区分部261の処理が第2n回目から第2n+1-1回目の処理であり、第2n-1回目から第2n-1回目の処理で区分して得られた2個の範囲のうち区分対象範囲となっていない範囲が残っている場合には、制御部280は、この残っている範囲の何れか1つの範囲を、区分対象範囲[lmin,lmax]とする。
 nを1以上の整数として、前回の二区分部261の処理が第2n+1-1回目の処理であり、第2n-1回目から第2n-1回目の処理で区分して得られた2個の範囲のうち区分対象範囲となっていない範囲が残っていない場合、制御部280は、第2n回目から第2n+1-1回目の処理で区分して得られた2n+1個の範囲のうち何れか1つの範囲を、区分対象範囲[lmin,lmax]とする。
 前回の二区分部261の処理が1回目の処理である場合、制御部280は、1回目の処理で区分して得られた2個の範囲のうち何れか1つの範囲を、区分対象範囲[lmin,lmax]とする。
 二区分部261は、符号化装置1の二区分部151と同じ基準で区分対象範囲を決定する。これにより、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]は、符号化装置1における量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の区分と同様に区分される。
 二区分部261は、区分対象範囲を2つの範囲に区分する(ステップS3d3)。区分対象範囲を[lmin,lmax]と表記し、区分された範囲のうち、低域側の範囲を[lmin,lmid-1]、高域側の範囲を[lmid,lmax]と表記する。この区分についての情報である区分情報が、復元部250に提供される。二区分部261の処理の詳細については、後述する。
 制御部280は、u←u-Meとして、余剰ビットの数uをMeだけデクリメントする(ステップS3d5)。すなわち、uからMeを減じた値を新たなuの値とする。その後、ステップS3d1に戻る。
 Meは、今回の二区分部261の処理で得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数である。この2つのゲイン補正量を表すビットの数は、ゲイン補正量符号idxに含まれる、今回の二区分部261の処理で得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量についての符号のビットとの数を計算することにより例えば得られる。Meは、所定の固定値でもよいし、二区分部261で区分された2つの区分された範囲ごとに異なることもある。
 このようにして、ステップS3d1からステップS3d5の処理は、余剰ビットの数uが0より大きい限りは繰り返される。換言すれば、二区分部261の処理は、二区分部261の区分処理で得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行される。
 [区分部260の変形例1]
 第2n回目から第2n+1-1回目の二区分部261の処理は、第2n-1回目から第2n-1回目の二区分部261の処理で得られた2n個の範囲のうち、聴覚的な重要度が高い範囲から順に区分対象範囲とすることにより行なわれてもよい。
 [区分部260の変形例2]
 また、一般的には、周波数が低い帯域の方が、周波数が高い帯域よりも、聴覚的な重要度が高いことが多い。このため、入力信号系列が周波数領域の信号系列である場合には、第2n回目から第2n+1-1回目の二区分部261の処理は、第2n-1回目から第2n-1回目の二区分部261の処理で得られた2n個の範囲のうち、周波数が低い範囲から順に区分対象範囲とすることにより行なわれてもよい。
 <復元部250>
 復元部250は、図13に示すように、記憶部251及び乗算部252を例えば備えている。
 復元部250には、ゲイン補正量符号idx、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]及び復号グローバルゲインg^が少なくとも入力される。
 復元部250は、ゲイン補正量符号idxを復号して得られる各区分された範囲についての少なくとも1つのゲイン補正量で復号グローバルゲインg^を補正して得られるゲインを各区分された範囲ごとに復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の各サンプルの値にを乗算して得られる信号系列を出力信号系列として得る(ステップS4d)。
 ゲイン補正量による復号グローバルゲインg^の補正の一例は、ゲイン補正量と量子化グローバルゲインg^との加算である。
 各区分された範囲についての少なくとも1つのゲイン補正量とは、その各区分された範囲に対応するゲイン補正量、及び、その各区分された範囲を含む範囲に対応するゲイン補正量のことである。その各区分された範囲を含む範囲が存在しない場合には、その各区分された範囲についてのゲイン補正量は、その各区分された範囲に対応するゲイン補正量のことである。
 例えば、図10に示すように、復号正規化済み信号系列が4個の範囲に区分されているとする。この例では、復号正規化済み信号系列は、第1の範囲R1、第2の範囲R2、第3の範囲R3及び第4の範囲R4に区分されている。第1の範囲R1は区間[Lmin,L(1)-1]であり、第2の範囲R2は区間[L(1),L(2)-1]であり、第3の範囲R3は区間[L(2),L(3)-1]であり、第4の範囲R4は区間[L(3),Lmax]である。図10の横軸は、サンプル番号を表す。範囲R1及び範囲R2は、第1回目の二区分部261の処理で得られた範囲R12に含まれる。また、範囲R3及び範囲R4は、第1回目の二区分部261の処理で得られた範囲R34に含まれる。
 したがって、範囲R1についての少なくとも1つのゲイン補正量は、範囲R1に対応するゲイン補正量及び範囲R12に対応するゲイン補正量である。範囲R2についての少なくとも1つのゲイン補正量は、範囲R2に対応するゲイン補正量及び範囲R12に対応するゲイン補正量である。範囲R3についての少なくとも1つのゲイン補正量は、範囲R3に対応するゲイン補正量及び範囲R34に対応するゲイン補正量である。範囲R4についての少なくとも1つのゲイン補正量は、範囲R4に対応するゲイン補正量及び範囲R34に対応するゲイン補正量である。
 範囲R12及び範囲R34にそれぞれ対応する2つのゲイン補正量にMc個のビットが割り当てられており、範囲R1及び範囲R2にそれぞれ対応する2つのゲイン補正量にMa個のビットが割り当てられており、範囲R3及び範囲R4にそれぞれ対応する2つのゲイン補正量にMb個のビットが割り当てられているとする。
 各範囲に対応するゲイン補正量は、符号化装置1のゲイン補正量符号化部140が行う符号化処理に対応する復号処理により得ることができる。ここでは、図10に示すように範囲が区分されており、隣接する2つの範囲に対応するゲイン補正量をベクトル量子化の復号により得る場合を例に挙げて説明する。
 この例では、範囲R1及び範囲R2がグループG12を構成しており、範囲R3及び範囲R4がグループG34を構成しており、範囲R12及び範囲R34がグループG1234を構成している。すなわち、各グループを構成する範囲は、以下のようになる。
 グループG12={範囲R1,範囲R2}
 グループG34={範囲R3,範囲R4}
 グループG1234={範囲R12,範囲R34}
ベクトル量子化の復号は、これらのグループG12,G34,G1234のそれぞれで行われる。
 具体的には、次の3つのベクトル量子化の復号が行なわれる。第1のベクトル量子化の復号は、グループG12についてのベクトル量子化の復号、すなわち範囲R1に対応するゲイン補正量と範囲R2に対応するゲイン補正量とのベクトル量子化の復号である。これを以下では「第1VQ」という。第2のベクトル量子化の復号は、グループG34についてのベクトル量子化の復号、すなわち範囲R3に対応するゲイン補正量と範囲R4に対応するゲイン補正量とのベクトル量子化の復号である。これを以下では「第2VQ」という。第3のベクトル量子化の復号は、グループG1234についてのベクトル量子化の復号、すなわち範囲R12に対応するゲイン補正量と範囲R34に対応するゲイン補正量とのベクトル量子化の復号である。これを以下では「第3VQ」という。
 復元部250の記憶部251には、範囲R1に対応するゲイン補正量の候補Δ1(ma)と、範囲R2に対応するゲイン補正量の候補Δ2(ma)と、これらのゲイン補正量の候補を特定する符号idx12(ma)との組が2Ma個(2のMa乗個、Maは1以上の整数、ma∈{1,…,2Ma}])格納されている。具体的には、Δ1(1)とΔ2(1)とidx12(1)との組、Δ1(2)とΔ2(2)とidx12(2)との組、…、Δ1(2Ma)とΔ2(2Ma)とidx12(2Ma)との組が第1VQのゲイン補正量コードブックとして記憶部251に格納されている。符号idx12(ma)のビット数はMaビットである。
 a個(この例ではa=2)のゲイン補正量の候補で構成されたベクトルを、ゲイン補正量候補ベクトルと呼ぶことにすると、第1VQのゲイン補正量コードブックには、Δ1(1)及びΔ2(1)で構成されたゲイン補正量候補ベクトル、Δ1(2)及びΔ2(2)で構成されたゲイン補正量候補ベクトル、…、Δ1(2Ma)及びΔ2(2Ma)で構成されたゲイン補正量候補ベクトルの計2Ma個のゲイン補正量候補ベクトルと、計2Ma個のゲイン補正量候補ベクトルとそれぞれ対応する計2Ma個の符号idx12(1),idx12(2),…,idx12(2Ma)が格納されていると考えることができる。
 また、記憶部251には、範囲R3に対応するゲイン補正量の候補Δ3(mb)と、範囲R4に対応するゲイン補正量の候補Δ4(mb)と、これらのゲイン補正量の候補を特定する符号idx34(mb)との組が2Mb個(2のMb乗個、Mbは1以上の整数、mb∈{1,…,2Mb}]))格納されている。具体的には、Δ3(1)とΔ4(1)とidx34(1)との組、Δ3(2)とΔ4(2)とidx34 (2)との組、…、Δ3(2Mb)とΔ4(2Mb)とidx34(2Mb)との組が第2VQのゲイン補正量コードブックとして記憶部251に格納されている。MbはMaと同じ値であっても異なる値であってもよい。符号idx34(mb)のビット数はMbビットである。
 第2VQのゲイン補正量コードブックには、Δ3(1)及びΔ4(1)で構成されたゲイン補正量候補ベクトル、Δ3(2)及びΔ4(2)で構成されたゲイン補正量候補ベクトル、…、Δ3(2Mb)及びΔ4(2Mb)で構成されたゲイン補正量候補ベクトルの計2Mb個のゲイン補正量候補ベクトルと、計2Mb個のゲイン補正量候補ベクトルとそれぞれ対応する計2Mb個の符号idx34(1),idx34(2),…,idx34(2Mb)が格納されていると考えてもよい。
 さらに、記憶部251には、範囲R12のゲイン補正量の候補Δ12(mc)と、範囲R34のゲイン補正量の候補Δ34(mc)と、これらのゲイン補正量の候補を特定する符号idx1234(mc)との組が2Mc個(2のMc乗個、Mcは1以上の整数、mc∈{1,…,2Mc}]))格納されている。具体的には、Δ12(1)とΔ34(1)とidx1234(1)との組、Δ12(2)とΔ34(2)とidx1234(2)との組、…、Δ12(2Mc)とΔ34(2Mc)とidx1234(2Mc)との組が第3VQのゲイン補正量コードブックとして記憶部251に格納されている。McはMaと同じ値であっても異なる値であってもよい。また、McはMbと同じ値であっても異なる値であってもよい。符号idx1234(mc)のビット数はMcビットである。
 第3VQのゲイン補正量コードブックには、Δ12(1)及びΔ34(1)で構成されたゲイン補正量候補ベクトル、Δ12(2)及びΔ34(2)で構成されたゲイン補正量候補ベクトル、…、Δ12(2Mc)及びΔ34(2Mc)で構成されたゲイン補正量候補ベクトルの計2Mc個のゲイン補正量候補ベクトルと、計2Mc個のゲイン補正量候補ベクトルとそれぞれ対応する計2Mc個の符号idx1234(1),idx1234(2),…,idx1234(2Mc)が格納されていると考えてもよい。
 このように、各区分された範囲には、複数個のゲイン補正量の候補が対応付けされている。この例では、範囲R1にはΔ1(1),…,Δ1(2Ma)が対応付けされており、範囲R2にはΔ2(1),…,Δ2(2Ma)が対応付けされており、範囲R3にはΔ3(1),…,Δ3(2Mb)が対応付けされており、範囲R4にはΔ4(1),…,Δ4(2Mb)が対応付けされており、範囲R12にはΔ12(1),…,Δ12(2Mc)が対応付けされており、範囲R34にはΔ34(1),…,Δ34(2Mc)が対応付けされている。
 このとき、復元部250は、まずゲイン補正量符号idxを構成する各範囲に対応する符号を記憶部251に記憶されたゲイン補正量コードブックを用いて復号して、各範囲に対応するゲイン補正量を得る。
 そして、復元部250は、以下の式により、範囲R1の出力信号系列X^(ω) [ω∈{Lmin,…,L(1)-1}]を得る。
 X^(ω)=(g^+Δ12+Δ1) X^Q(ω)  (F5)
すなわち、復元部250は、範囲R1についてのゲイン補正量であるΔ12とΔ1とを用いて復号グローバルゲインg^の補正を行い、この補正されたゲインg^+Δ12+Δ1と復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,L(1)-1]の各サンプルの値とを乗算して、範囲R1の出力信号系列X^(ω) [ω∈{Lmin,…,L(1)-1}]を得る。
 また、復元部250は、以下の式により、範囲R2の出力信号系列X^(ω) [ω∈{L(1),…,L(2)-1}]を得る。
 X^(ω)=(g^+Δ12+Δ2) X^Q(ω)  (F6)
すなわち、復元部250は、範囲R2についてのゲイン補正量であるΔ12とΔ2とを用いて復号グローバルゲインg^の補正を行い、この補正されたゲインg^+Δ12+Δ2と復号正規化済み信号系列X^Q(ω) [ω∈{L(1),…,L(2)-1]の各サンプルの値とを乗算して、範囲R2の出力信号系列X^(ω) [ω∈{L(1),…,L(2)-1}]を得る。
 また、復元部250は、以下の式により、範囲R3の出力信号系列X^(ω) [ω∈{L(2),…,L(3)-1}]を得る。
 X^(ω)=(g^+Δ34+Δ3) X^Q(ω)  (F7)
すなわち、復元部250は、範囲R3についてのゲイン補正量であるΔ34とΔ3とを用いて復号グローバルゲインg^の補正を行い、この補正されたゲインg^+Δ34+Δ3と復号正規化済み信号系列X^Q(ω) [ω∈{L(2),…,L(3)-1]の各サンプルの値とを乗算して、範囲R3の出力信号系列X^(ω) [ω∈{L(2),…,L(3)-1}]を得る。
 また、復元部250は、以下の式により、範囲R4の出力信号系列X^(ω) [ω∈{L(3),…,Lmax}]を得る。
 X^(ω)=(g^+Δ34+Δ4) X^Q(ω)  (F8)
すなわち、復元部250は、範囲R4についてのゲイン補正量であるΔ34とΔ4とを用いて復号グローバルゲインg^の補正を行い、この補正されたゲインg^+Δ34+Δ4と復号正規化済み信号系列X^Q(ω) [ω∈{L(3),…,Lmax]の各サンプルの値とを乗算して、範囲R4の出力信号系列X^(ω) [ω∈{L(3),…,Lmax}]を得る。
 [復元部250の変形例1]
 第2n回目から第2n+1-1回目の二区分部261の処理で得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補の絶対値の方が、第2n-1回目から第2n-1回目の二区分部261の処理で得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補の絶対値よりも小さくてもよい。
 復号正規化済み信号系列が4個の範囲に区分されている図10に示す例だと、範囲R1に対応するゲイン補正量の候補Δ1(ma)の絶対値と、範囲R2に対応するゲイン補正量の候補Δ2(ma)の絶対値と、範囲R3に対応するゲイン補正量の候補Δ3(mb)の絶対値と、範囲R4に対応するゲイン補正量の候補Δ4(mb)の絶対値とが、範囲R12のゲイン補正量の候補Δ12(mc)の絶対値及び範囲R34のゲイン補正量の候補Δ34(mc)の絶対値よりも小さくてもよい。
 |Δ12(mc)|,|Δ34(mc)|>|Δ1(ma)|,|Δ2(ma)|,|Δ3(mb)|,|Δ4(mb)|
 [復元部250の変形例2]
 ゲイン補正量候補ベクトルは、例えば次のようにして生成することができる。
 記憶部251には、2個の値で構成される正規化ゲイン補正量候補ベクトルがその正規化ゲイン補正量候補ベクトルを特定する符号と共に複数格納されているとする。正規化ゲイン補正量候補ベクトルを構成する2個の値をΔ1(i),Δ2(i)と表記すると、正規化ゲイン補正量候補ベクトルは(Δ1(i),Δ2(i))と表記することができる。記憶部251には、例えば、2E個の正規化ゲイン補正量候補ベクトル、すなわち(Δ1(1),Δ2(1)),…,(Δ1(2E),Δ2(2E))が格納されている。Eは、所定の整数であり、例えばMeである。
 二区分部261の処理で得られる2つの区分された範囲には、その二区分部261の処理の回数に応じて所定の係数が対応付けされているものとする。例えば、第2n回目から第2n+1-1回目の二区分部261の処理に対応する所定の係数の絶対値の方が、第2n-1回目から第2n-1回目の二区分部261の処理に対応する所定の係数の絶対値よりも小さいように対応付けがされている。
 このとき、正規化ゲイン補正量候補ベクトルに、二区分部261の処理の回数に対応する所定の係数を乗算したベクトルを、その回数目の二区分部261の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトルとする。言いかえれば、正規化ゲイン補正量候補ベクトル(Δ1(i),Δ2(i))を構成する2個の値Δ1(i),Δ2(i)のそれぞれに、二区分部261の処理の回数に対応する所定の係数stepを乗算することにより得られた2個の値stepΔ1(i),stepΔ2(i)により構成されるベクトル(stepΔ1(i),stepΔ2(i))を、その回数目の二区分部261の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトルとする。この乗算は、復元部250の乗算部252により行われる。正規化ゲイン補正量候補ベクトル(Δ1(i),Δ2(i))が2E個ある場合には、i=1,…,2Eのそれぞれについてこの乗算を行うことにより、2E個のゲイン補正量候補ベクトル(stepΔ1(i),stepΔ2(i))が得られる。
 [復元部250の変形例3]
 二区分部261による各回数目の処理で得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補をそのゲイン補正量の候補を特定する符号と共に、ひとつのゲイン補正量コードブックとして記憶部251に格納しておいてもよい。例えば、nを0以上の各整数として、第2n回目から第2n+1-1回目の二区分部261の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))が、そのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を特定する符号idx(i)と共に記憶部251に格納されているとする。
 すなわち、図12に例示するように、nの最大値をnmaxとして、1回目(n=0)の二区分部261の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,0(i),Δ2,0(i))[i=1,…,2E]、2回目(n=1)から3回目の二区分部261の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,1(i),Δ2,1(i))[i=1,…,2E]、4回目(n=2)から7回目の二区分部261の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,2(i),Δ2,2(i))[i=1,…,2E]、…、第2nmax回目(n=nmax)から第2nmax+1-1回目の二区分部261の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,nmax(i),Δ2,nmax(i))[i=1,…,2E]が、そのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を特定する符号idx(i)と共に記憶部141に格納されているとする。
 二区分部261の処理が行われる回数をD(Dはnmax以下の整数)とすると、符号idx(i)で特定されるゲイン補正量候補ベクトルは、A=Σd=1 Ddとして、A個のゲイン補正量の候補で構成されていると考えてもよい。
 このとき、例えば、第2n回目から第2n+1-1回目の二区分部261の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を構成するゲイン補正量の候補Δ1,n(i),Δ2,n(i)の絶対値の方が、第2n-1回目から第2n-1回目の二区分部261の処理で得られる2つの区分された範囲についてのゲイン補正量候補ベクトル(Δ1,n-1(i),Δ2,n-1(i))を構成するゲイン補正量の候補Δ1,n-1(i),Δ2,n-1(i)の絶対値よりも小さいとする。
 この場合、復元部250は、ゲイン補正量コードブックに格納された複数のゲイン補正量候補ベクトルの中から、入力されたゲイン補正量符号idxを構成する各範囲に対応する符号で特定されるゲイン補正量候補ベクトルを選択する。この選択されたゲイン補正量候補ベクトルを構成するゲイン補正量を用いて、復号グローバルゲインの補正を行う。
 [復元部250の変形例4]
 復元部250は、式(F5),式(F6),式(F7),式(F8)にそれぞれ代えて式(F9),式(F10),式(F11),式(F12)に基づいて、出力信号系列X^(ω)を求めてもよい。
 X^(ω)=(g^+s12Δ12+s1Δ1) X^Q(ω)  (F9)
 X^(ω)=(g^+s12Δ12+s2Δ2) X^Q(ω)  (F10)
 X^(ω)=(g^+s34Δ34+s3Δ3) X^Q(ω)  (F11)
 X^(ω)=(g^+s34Δ34+s4Δ4) X^Q(ω)  (F12)
 s1,s2,s3,s4,s12,s34は、例えば以下の式のように定義される。
Figure JPOXMLDOC01-appb-M000012
 このように、復元部250は、各区分された範囲についての各ゲイン補正量と、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全てのサンプルの値の二乗和をその各ゲイン補正量に対応する範囲内の全てのサンプルの値の二乗和で除算した値とを乗算した値で復号グローバルゲインg^を補正してもよい。
 また、復元部250は、式(F5),式(F6),式(F7),式(F8)にそれぞれ代えて式(F13),式(F14),式(F15),式(F16)に基づいて、出力信号系列X^(ω)を求めてもよい。
 X^(ω)=(g^+s112+Δ1)) X^Q(ω)  (F13)
 X^(ω)=(g^+s212+Δ2)) X^Q(ω)  (F14)
 X^(ω)=(g^+s334+Δ3)) X^Q(ω)  (F15)
 X^(ω)=(g^+s434+Δ4)) X^Q(ω)  (F16)
 このように、復元部250は、各区分された範囲についてのゲイン補正量を各範囲ごとに加算した値と、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全てのサンプルの値の二乗和を各区分された範囲内の全てのサンプルの値の二乗和で除算した値とを乗算した値で復号グローバルゲインg^を補正してもよい。
 なお、s12,s34,s1,s2,s3,s4を、それぞれ以下の式のように定義してもよい。
Figure JPOXMLDOC01-appb-M000013
 c12は、範囲R12のサンプルのエネルギーが第一の所定値よりも大きいサンプルの個数である。c34は、範囲R34のサンプルのエネルギーが第二の所定値よりも大きいサンプルの個数である。c1234は、範囲R1234のサンプルのエネルギーが第三の所定値よりも大きいサンプルの個数である。c1は、範囲R1のサンプルのエネルギーが第四の所定値よりも大きいサンプルの個数である。c2は、範囲R2のサンプルのエネルギーが第五の所定値よりも大きいサンプルの個数である。c3は、範囲R3のサンプルのエネルギーが第六の所定値よりも大きいサンプルの個数である。c4は、範囲R4のサンプルのエネルギーが第七の所定値よりも大きいサンプルの個数である。
 この場合、復号部260は、各区分された範囲についての各ゲイン補正量と、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のサンプルのエネルギーが第八の所定値よりも大きいサンプルの個数をその各ゲイン補正量に対応する範囲内のサンプルのエネルギーが第九の所定値よりも大きいサンプルの個数で除算した値とを乗算した値で復号グローバルゲインg^を補正することになる。または、復号部260は、各区分された範囲についてのゲイン補正量を各範囲ごとに加算した値と、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のサンプルのエネルギーが第十の所定値よりも大きいサンプルの個数を各区分された範囲内のサンプルのエネルギーが第十一の所定値よりも大きいサンプルの個数で除算した値とを乗算した値で復号グローバルゲインg^を補正することになる。
 これらの第一から第十一の所定値は、互いに異なる値であってもよいが、同じ値であることが好ましい。これらの第一から第十一の所定値は、式(B2)におけるεに対応する。
 <二区分部261が行なう区分処理の詳細>
 二区分部261が区分対象範囲に対して行なう区分処理は、符号化装置1の二区分部151が区分対象範囲に対して行なう区分処理と同一である。
 「各範囲のエネルギーがなるべく等しくなるように区分する基準」での区分処理は、例えば、区分対象範囲の第1の範囲を、
(a) 区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和と、区分対象範囲の全てのサンプルの値の二乗和の2分の1と、が最も近付くように、
または、
(b) 区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和と、区分対象範囲の全てのサンプルの値の絶対値和の2分の1と、が最も近付くように、
または、
(c) 区分対象範囲の第1の範囲のサンプル数が、区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和が区分対象範囲の全てのサンプルの値の二乗和の2分の1以上となる最小のサンプル数になるように、
または、
(d) 区分対象範囲の第1の範囲のサンプル数が、区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和が区分対象範囲の全てのサンプルの値の絶対値和の2分の1以上となる最小のサンプル数になるように、
または、
(e) 区分対象範囲の第1の範囲のサンプル数が、区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和が区分対象範囲の全てのサンプルの値の二乗和の2分の1以下となる最大のサンプル数になるように、
または、
(f) 区分対象範囲の第1の範囲から第nの範囲までのサンプル数が、区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和が区分対象範囲の全てのサンプルの値の絶対値和の2分の1以下となる最大のサンプル数になるように、
求め、
区分対象範囲のうちの第1の範囲以外の範囲を、区分対象範囲の第2の範囲とすることで、区分対象範囲を2個の範囲に区分することにより行なわれる。
 上記に例示した区分処理は、「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を、第1の範囲から順に逐次的に決定していく方法によって実現するものである。上記に例示した区分処理によれば、少ない演算処理量で「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を実現できる。
 「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」での区分処理は、例えば、区分対象範囲の第1の範囲を、
(a) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数と、区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1と、が最も近付くように、
または、
(b) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数と、区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1と、が最も近付くように、
または、
(c) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数が、区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以上となる最小のサンプル数となるように、
または、
(d) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数が、区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以上となる最小のサンプル数となるように、
または、
(e) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数が、区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以下となる最大のサンプル数となるように、
または、
(f) 区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数が、区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以下となる最大のサンプル数となるように、
求め、
 区分対象範囲のうちの第1の範囲以外の範囲を、区分対象範囲の第2の範囲とすることで、区分対象範囲を2個の範囲に区分することにより行なわれる。
 上記に例示した区分処理は、「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」による区分を、各範囲を逐次的に決定していく方法によって実現するものである。上記に例示した区分処理によれば、少ない演算処理量で「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」による区分を実現できる。
 二区分部261が行なう区分処理の具体例は、符号化装置1の二区分部151が行う区分処理の具体例である「第1の基準による区分処理の第1例」から「第1の基準による区分処理の第6例」、「第2の基準による区分処理の第1例」から「第2の基準による区分処理の第6例」のそれぞれの具体例中の、量子化正規化済み信号系列X^Q(ω) [ω∈{lmin,…,lmax}]を復号正規化済み信号系列X^Q(ω) [ω∈{lmin,…,lmax}]に置き換えたものである。
 <時間領域変換部270>
 必要に応じて備える時間領域変換部270には、出力信号系列X^(ω)が入力される。時間領域変換部270は、出力信号系列X^(ω)に対して周波数-時間変換を適用して、フレーム単位の時間領域信号系列zF(t)を出力する。周波数-時間変換方法は、周波数領域変換部101で用いられた時間-周波数変換方法に対応する逆変換である。上述の例であれば、ここでの周波数-時間変換方法は、IMDCT(Inverse Modified Discrete Cosine Transform)またはIDCT(Inverse Discrete Cosine Transform)である。
 《第2実施形態》
 第2実施形態は、ゲイン補正量符号idxに、正規化信号符号の余ったビットを用いる形態である。
 正規化信号符号化部120が[背景技術]欄で説明した正規化部102と量子化部103とゲイン制御部104により構成される場合などでは、消費ビット数が規定ビット数より少なくなる場合がある。
 第2実施形態の符号化装置1では、正規化信号符号化部120が、規定ビット数から消費ビット数を減算して得られるゲイン修正ビットのビット数Uを区分部150に対して出力するようにする。また、ゲイン補正量符号化部140は、入力されたゲイン修正ビットのビット数Uに基づいて、Uビットのゲイン補正量符号idxを出力するようにする。
 第2実施形態の復号装置2では、正規化信号復号部107が、正規化信号符号のビット数の最大値として規定されている規定ビット数から実際の正規化信号符号のビット数である消費ビット数を減算して得られるゲイン修正ビットのビット数Uを区分部260に対して出力するようにする。また、復元部250は入力されたUビットのゲイン補正量符号idxを復号できるようにする。
 第2実施形態の符号化装置1及び復号装置2によれば、正規化信号符号のために用意されたものの実際には正規化信号符号には用いられなかったビットをゲイン補正量符号idxに用いることで、与えられたビットを有効に活用した符号化及び復号を行うことが可能となる。
 以上の各実施形態の他、本発明である符号化装置、符号化方法、復号装置、復号方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
 また、上記符号化装置/上記復号装置における処理機能をコンピュータによって実現する場合、符号化装置/復号装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記符号化装置/上記復号装置における処理機能がコンピュータ上で実現される。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
 また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、符号化装置、復号装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (28)

  1.  複数の入力信号サンプルにより構成される、フレーム単位の入力信号系列を符号化する符号化方法において、
     上記入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、上記正規化信号符号に対応する量子化正規化済み信号系列と、を得る正規化信号符号化ステップと、
     上記入力信号系列に対応するゲインである量子化グローバルゲインと、上記量子化グローバルゲインに対応するグローバルゲイン符号と、を得るグローバルゲイン符号化ステップと、
     上記量子化正規化済み信号系列を3つ以上の範囲に区分する区分ステップと、
     各上記区分された範囲についての少なくとも1つのゲイン補正量で上記量子化グローバルゲインを補正して得られるゲインを上記各区分された範囲ごとに上記量子化正規化済み信号系列の各サンプルの値に乗算して得られる信号系列と上記入力信号系列との相関が最大又は誤差が最小となるゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化ステップと、
     を有し、
     上記区分ステップにおける上記量子化正規化済み信号系列の区分は、入力された区分対象範囲を2つの範囲に区分する二区分ステップにより行われ、
     上記二区分ステップは、上記二区分ステップで得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行され、
     第1回目の二区分ステップは、上記量子化正規化済み信号系列を上記区分対象範囲とすることにより行われ、第2n回目(nは1以上の各整数)から第2n+1-1回目の二区分ステップのそれぞれは、第2n-1回目から第2n-1回目の二区分ステップで得られる2n個の範囲のうちの何れか1つの範囲を上記区分対象範囲とすることにより行われる、
     符号化方法。
  2.  請求項1に記載の符号化方法であって、
     上記二区分ステップにおける2つの範囲への区分は、
     上記区分対象範囲の第1の範囲を、
    (a)上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和と、上記区分対象範囲の全てのサンプルの値の二乗和の2分の1と、が最も近付くように、
    または、
    (b)上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和と、上記区分対象範囲の全てのサンプルの値の絶対値和の2分の1と、が最も近付くように、
    または、
    (c)上記区分対象範囲の第1の範囲のサンプル数が、上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和が上記区分対象範囲の全てのサンプルの値の二乗和の2分の1以上となる最小のサンプル数になるように、
    または、
    (d)上記区分対象範囲の第1の範囲のサンプル数が、上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和が上記区分対象範囲の全てのサンプルの値の絶対値和の2分の1以上となる最小のサンプル数になるように、
    または、
    (e)上記区分対象範囲の第1の範囲のサンプル数が、上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和が上記区分対象範囲の全てのサンプルの値の二乗和の2分の1以下となる最大のサンプル数になるように、
    または、
    (f)上記区分対象範囲の第1の範囲のサンプル数が、上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和が上記区分対象範囲の全てのサンプルの値の絶対値和の2分の1となる最大のサンプル数になるように、
    求め、
     上記区分対象範囲のうちの第1の範囲以外の範囲を、上記区分対象範囲の第2の範囲とすることで、2つの範囲に区分することにより行なわれる、
     符号化方法。
  3.  請求項1に記載の符号化方法であって、
     上記二区分ステップにおける2つの範囲への区分は、
     上記区分対象範囲の第1の範囲を、
    (a)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数と、上記区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1と、が最も近付くように、
    または、
    (b)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数と、上記区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数の2分の1と、が最も近付くように、
    または、
    (c)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数が、上記区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1以上となる最小のサンプル数となるように、
    または、
    (d)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数が、上記区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が上記所定値より大きいサンプルの個数の2分の1以上となる最小のサンプル数となるように、
    または、
    (e)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数が、上記区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1以下となる最大のサンプル数となるように、
    または、
    (f)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数が、上記区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が上記所定値より大きいサンプルの個数の2分の1以下となる最大のサンプル数となるように、
    求め、
     上記区分対象範囲のうちの第1の範囲以外の範囲を、上記区分対象範囲の第2の範囲とすることで、2つの範囲に区分することにより行なわれる、
     符号化方法。
  4.  請求項1から請求項3の何れかに記載の符号化方法であって、
     第2n回目から第2n+1-1回目の二区分ステップは、第2n-1回目から第2n-1回目の二区分ステップで得られた2n個の範囲のうち、聴覚的な重要度が高い範囲から順に上記区分対象範囲とすることにより行なわれる、
     符号化方法。
  5.  請求項1から請求項3の何れかに記載の符号化方法であって、
     上記入力信号系列は周波数領域の信号系列であり、
     第2n回目から第2n+1-1回目の二区分ステップは、第2n-1回目から第2n-1回目の二区分ステップで得られた2n個の範囲のうち、周波数が低い範囲から順に上記区分対象範囲とすることにより行なわれる、
     符号化方法。
  6.  請求項1から請求項5の何れかに記載の符号化方法であって、
     上記ゲイン補正量符号化ステップは、複数個のゲイン補正量の候補の中から上記相関が最大又は誤差が最小となるゲイン補正量を特定するステップであり、
     第2n回目から第2n+1-1回目の二区分ステップで得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補の絶対値の方が、第2n-1回目から第2n-1回目の二区分ステップで得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補の絶対値よりも小さい、
     符号化方法。
  7.  請求項1から請求項5の何れかに記載の符号化方法であって、
     ゲイン補正量候補ベクトルは、2個のゲイン補正量の候補で構成されており、
     上記2つの区分された範囲は、それぞれその2つの区分された範囲についてのゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補に対応付けされており、
     上記ゲイン補正量符号化ステップは、各2つの区分された範囲についての複数のゲイン補正量候補ベクトルの中から上記誤差を最小にするゲイン補正量候補ベクトルを特定するためのゲイン補正量符号を得るステップであり、
     符号帳には、2個の値で構成される正規化ゲイン補正量候補ベクトルが複数格納されており、
     上記2つの区分された範囲についての複数のゲイン補正量候補ベクトルは、上記符号帳に格納された正規化ゲイン補正量候補ベクトルを構成する2個の値のそれぞれにその2つの区分された範囲に対応する所定の係数を乗算することにより得られた2個の値により構成されるベクトルであり、
     第2n回目から第2n+1-1回目の二区分ステップで得られる2つの区分された範囲に対応する所定の係数の絶対値の方が、第2n-1回目から第2n-1回目の二区分ステップで得られる2つの区分された範囲に対応する所定の係数の絶対値よりも小さい、
     符号化方法。
  8.  請求項1から請求項5の何れかに記載の符号化方法であって、
     上記二区分ステップが行われる回数をDとして、ゲイン補正量候補ベクトルは、A=Σd=1 Ddとして、A個のゲイン補正量の候補で構成されており、
     上記二区分ステップで得られるA個の区分された範囲は、それぞれゲイン補正量候補ベクトルを構成するA個のゲイン補正量の候補に対応付けされており、
     ゲイン補正量コードブックには、複数のゲイン補正量候補ベクトルが格納されており、
     上記ゲイン補正量符号化ステップは、上記ゲイン補正量コードブックに格納された複数のゲイン補正量候補ベクトルの中から上記誤差を最小にするゲイン補正量候補ベクトルを特定するゲイン補正量符号を得るステップであり、
     第2n回目から第2n+1-1回目の二区分ステップで得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補の絶対値の方が、第2n-1回目から第2n-1回目の二区分ステップで得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補の絶対値よりも大きい、
     符号化方法。
  9.  請求項1から請求項5の何れかに記載の符号化方法であって、
     上記補正して得られるゲインは、上記各区分された範囲についての各ゲイン補正量と、上記量子化正規化済み信号系列の全てのサンプルの値の二乗和をその各ゲイン補正量に対応する範囲内の全てのサンプルの値の二乗和で除算した値とを乗算した値で上記量子化グローバルゲインを補正して得られる値である、
     符号化方法。
  10.  請求項1から請求項5の何れかに記載の符号化方法であって、
     上記補正して得られるゲインは、上記各区分された範囲についての各ゲイン補正量と、上記量子化正規化済み信号系列のサンプルのエネルギーが所定値よりも大きいサンプルの個数をその各ゲイン補正量に対応する範囲内のサンプルのエネルギーが上記所定値よりも大きいサンプルの個数で除算した値とを乗算した値で上記量子化グローバルゲインを補正して得られる値である、
     符号化方法。
  11.  請求項1から請求項5の何れかに記載の符号化方法であって、
     上記補正して得られるゲインは、上記各区分された範囲についてのゲイン補正量を各範囲ごとに加算した値と、上記量子化正規化済み信号系列の全てのサンプルの値の二乗和を上記各区分された範囲内の全てのサンプルの値の二乗和で除算した値とを乗算した値で上記量子化グローバルゲインを補正して得られる値である、
     符号化方法。
  12.  請求項1から請求項6の何れかに記載の符号化方法であって、
     上記補正して得られるゲインは、上記各区分された範囲についてのゲイン補正量を各範囲ごとに加算した値と、上記量子化正規化済み信号系列のサンプルのエネルギーが所定値よりも大きいサンプルの個数を上記各区分された範囲内のサンプルのエネルギーが上記所定値よりも大きいサンプルの個数で除算した値とを乗算した値で上記量子化グローバルゲインを補正して得られる値である、
     符号化方法。
  13.  フレーム単位の符号を復号して出力信号系列を得る復号方法において、
     上記符号に含まれる正規化信号符号を復号して復号正規化済み信号系列を得る正規化信号復号ステップと、
     上記符号に含まれるグローバルゲイン符号を復号して復号グローバルゲインを得るグローバルゲイン復号ステップと、
     上記復号正規化済み信号系列を3つ以上の範囲に区分する区分ステップと、
     上記符号に含まれるゲイン補正量符号を復号して得られる各上記区分された範囲についての少なくとも1つのゲイン補正量で上記復号グローバルゲインを補正して得られるゲインを上記各区分された範囲ごとに上記復号正規化済み信号系列の各サンプルの値にを乗算して得られる信号系列を出力信号系列として得る復元ステップと、
     を有し、
     上記区分ステップにおける上記復号正規化済み信号系列の区分は、入力された区分対象範囲を2つの範囲に区分する二区分ステップにより行われ、
     上記二区分ステップは、上記二区分ステップで得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行され、
     第1回目の二区分ステップは、上記復号正規化済み信号系列を上記区分対象範囲とすることにより行われ、第2n回目(nは1以上の各整数)から第2n+1-1回目の二区分ステップのそれぞれは、第2n-1回目から第2n-1回目の二区分ステップで得られる2n個の範囲のうちの何れか1つの範囲を上記区分対象範囲とすることにより行われる、
     復号方法。
  14.  請求項13に記載の復号方法であって、
     上記二区分ステップにおける2つの範囲への区分は、
     上記区分対象範囲の第1の範囲を、
    (a)上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和と、上記区分対象範囲の全てのサンプルの値の二乗和の2分の1と、が最も近付くように、
    または、
    (b)上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和と、上記区分対象範囲の全てのサンプルの値の絶対値和の2分の1と、が最も近付くように、
    または、
    (c)上記区分対象範囲の第1の範囲のサンプル数が、上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和が上記区分対象範囲の全てのサンプルの値の二乗和の2分の1以上となる最小のサンプル数になるように、
    または、
    (d)上記区分対象範囲の第1の範囲のサンプル数が、上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和が上記区分対象範囲の全てのサンプルの値の絶対値和の2分の1以上となる最小のサンプル数になるように、
    または、
    (e)上記区分対象範囲の第1の範囲のサンプル数が、上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の二乗和が上記区分対象範囲の全てのサンプルの値の二乗和の2分の1以下となる最大のサンプル数になるように、
    または、
    (f)上記区分対象範囲の第1の範囲のサンプル数が、上記区分対象範囲の第1の範囲に含まれる全てのサンプルの値の絶対値和が上記区分対象範囲の全てのサンプルの値の絶対値和の2分の1以下となる最大のサンプル数になるように、
    求め、
     上記区分対象範囲のうちの第1の範囲以外の範囲を、上記区分対象範囲の第2の範囲とすることで、2つの範囲に区分することにより行なわれる、
     復号方法。
  15.  請求項13に記載の復号方法であって、
     上記二区分ステップにおける2つの範囲への区分は、
     上記区分対象範囲の第1の範囲を、
    (a)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数と、上記区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1と、が最も近付くように、
    または、
    (b)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数と、上記区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数の2分の1と、が最も近付くように、
    または、
    (c)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数が、上記区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1以上となる最小のサンプル数となるように、
    または、
    (d)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数が、上記区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が上記所定値より大きいサンプルの個数の2分の1以上となる最小のサンプル数となるように、
    または、
    (e)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数が、上記区分対象範囲に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1以下となる最大のサンプル数となるように、
    または、
    (f)上記区分対象範囲の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数が、上記区分対象範囲に含まれる全てのサンプルのうちサンプルの絶対値が上記所定値より大きいサンプルの個数の2分の1以下となる最大のサンプル数となるように、
    求め、
     上記区分対象範囲のうちの第1の範囲以外の範囲を、上記区分対象範囲の第2の範囲とすることで、2つの範囲に区分することにより行なわれる、
     復号方法。
  16.  請求項13から請求項15の何れかに記載の復号方法であって、
     第2n回目から第2n+1-1回目の二区分ステップは、第2n-1回目から第2n-1回目の二区分ステップで得られた2n個の範囲のうち、聴覚的な重要度が高い範囲から順に上記区分対象範囲とすることにより行なわれる、
     復号方法。
  17.  請求項13から請求項15の何れかに記載の復号方法であって、
     上記復号正規化済み信号系列は周波数領域の信号系列であり、
     第2n回目から第2n+1-1回目の二区分ステップは、第2n-1回目から第2n-1回目の二区分ステップで得られた2n個の範囲のうち、周波数が低い高い範囲から順に上記区分対象範囲とすることにより行なわれる、
     復号方法。
  18.  請求項13から請求項17の何れかに記載の復号方法であって、
     第2n回目から第2n+1-1回目の二区分ステップで得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の絶対値の方が、第2n-1回目から第2n-1回目の二区分ステップで得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の絶対値よりも小さい、
     復号方法。
  19.  請求項13から請求項17の何れかに記載の復号方法であって、
     ゲイン補正量候補ベクトルは、2個のゲイン補正量の候補で構成されており、
     上記2つの区分された範囲は、それぞれその2つの区分された範囲についてのゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補に対応付けされており、
     上記復元ステップは、各2つの区分された範囲についての複数のゲイン補正量候補ベクトルの中から上記符号に含まれるゲイン補正量符号により特定されるゲイン補正量候補ベクトルを選択し、その選択されたゲイン補正量候補ベクトルを構成するゲイン補正量を用いて上記出力信号系列を得るステップであり、
     符号帳には、2個の値で構成される正規化ゲイン補正量候補ベクトルが複数格納されており、
     上記2つの区分された範囲についての複数のゲイン補正量候補ベクトルは、上記符号帳に格納された正規化ゲイン補正量候補ベクトルを構成する2個の値のそれぞれにその2つの区分された範囲に対応する所定の係数を乗算することにより得られた2個の値により構成されるベクトルであり、
     第2n回目から第2n+1-1回目の二区分ステップで得られる2つの区分された範囲に対応する所定の係数の絶対値の方が、第2n-1回目から第2n-1回目の二区分ステップで得られる2つの区分された範囲に対応する所定の係数の絶対値よりも小さい、
     復号方法。
  20.  請求項13から請求項17の何れかに記載の復号方法であって、
     上記二区分ステップが行われる回数をDとして、ゲイン補正量候補ベクトルは、A=Σd=1 Ddとして、A個のゲイン補正量の候補で構成されており、
     上記二区分ステップで得られるA個の区分された範囲は、それぞれゲイン補正量候補ベクトルを構成するA個のゲイン補正量の候補に対応付けされており、
     ゲイン補正量コードブックには、複数のゲイン補正量候補ベクトルが格納されており、
     上記復号ステップは、上記ゲイン補正量コードブックに格納された複数のゲイン補正量候補ベクトルの中から上記符号に含まれるゲイン補正量符号により特定されるゲイン補正量候補ベクトルを選択し、その選択されたゲイン補正量候補ベクトルを構成するゲイン補正量を用いて上記復号グローバルゲインの補正を行うステップを含み、
     第2n回目から第2n+1-1回目の二区分ステップで得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補の絶対値の方が、第2n-1回目から第2n-1回目の二区分ステップで得られる2つの区分された範囲のそれぞれに対応するゲイン補正量の候補の絶対値よりも大きい、
     復号方法。
  21.  請求項13から請求項17の何れかに記載の復号方法であって、
     上記補正して得られるゲインは、上記各区分された範囲についての各ゲイン補正量と、上記復号正規化済み信号系列の全てのサンプルの値の二乗和をその各ゲイン補正量に対応する範囲内の全てのサンプルの値の二乗和で除算した値とを乗算した値で上記復号グローバルゲインを補正して得られる値である、
     復号方法。
  22.  請求項13から請求項17のいずれかに記載の復号方法であって、
     上記補正して得られるゲインは、上記各区分された範囲についての各ゲイン補正量と、上記復号正規化済み信号系列のサンプルのエネルギーが所定値よりも大きいサンプルの個数をその各ゲイン補正量に対応する範囲内のサンプルのエネルギーが上記所定値よりも大きいサンプルの個数で除算した値とを乗算した値で上記復号グローバルゲインを補正して得られる値である、
     復号方法。
  23.  請求項13から請求項17の何れかに記載の復号方法であって、
     上記補正して得られるゲインは、上記各区分された範囲についてのゲイン補正量を各範囲ごとに加算した値と、上記復号正規化済み信号系列の全てのサンプルの値の二乗和を上記各区分された範囲内の全てのサンプルの値の二乗和で除算した値とを乗算した値で上記復号グローバルゲインを補正して得られる値である、
     復号方法。
  24.  請求項13から請求項17の何れかに記載の復号方法であって、
     上記補正して得られるゲインは、上記各区分された範囲についてのゲイン補正量を各範囲ごとに加算した値と、上記復号正規化済み信号系列のサンプルのエネルギーが所定値よりも大きいサンプルの個数を上記各区分された範囲内のサンプルのエネルギーが上記所定値よりも大きいサンプルの個数で除算した値とを乗算した値で上記復号グローバルゲインを補正して得られる値である、
     復号方法。
  25.  複数の入力信号サンプルにより構成される、フレーム単位の入力信号系列を符号化する符号化装置において、
     上記入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、上記正規化信号符号に対応する量子化正規化済み信号系列と、を得る正規化信号符号化部と、
     上記入力信号系列に対応するゲインである量子化グローバルゲインと、上記量子化グローバルゲインに対応するグローバルゲイン符号と、を得るグローバルゲイン符号化部と、
     上記量子化正規化済み信号系列を3つ以上の範囲に区分する区分部と、
     各上記区分された範囲についての少なくとも1つのゲイン補正量で上記量子化グローバルゲインを補正して得られるゲインを上記各区分された範囲ごとに上記量子化正規化済み信号系列の各サンプルの値に乗算して得られる信号系列と上記入力信号系列との相関が最大又は誤差が最小となるゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化部と、
     を含み、
     上記区分部は二区分部を含み、
     上記区分部の処理における上記量子化正規化済み信号系列の区分は、入力された区分対象範囲を2つの範囲に区分する上記二区分部により行われ、
     上記二区分部の処理は、上記二区分部の処理で得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行され、
     第1回目の二区分部の処理は、上記量子化正規化済み信号系列を上記区分対象範囲とすることにより行われ、第2n回目(nは1以上の各整数)から第2n+1-1回目の二区分部の処理のそれぞれは、第2n-1回目から第2n-1回目の二区分部の処理で得られる2n個の範囲のうちの何れか1つの範囲を上記区分対象範囲とすることにより行われる、
     符号化装置。
  26.  フレーム単位の符号を復号して出力信号系列を得る復号装置において、
     上記符号に含まれる正規化信号符号を復号して復号正規化済み信号系列を得る正規化信号復号部と、
     上記符号に含まれるグローバルゲイン符号を復号して復号グローバルゲインを得るグローバルゲイン復号部と、
     上記復号正規化済み信号系列を3つ以上の範囲に区分する区分部と、
     上記符号に含まれるゲイン補正量符号を復号して得られる各上記区分された範囲についての少なくとも1つのゲイン補正量で上記復号グローバルゲインを補正して得られるゲインを上記各区分された範囲ごとに上記復号正規化済み信号系列の各サンプルの値にを乗算して得られる信号系列を出力信号系列として得る復元部と、
     を含み、
     上記区分部は二区分部を含み、
     上記区分部の処理における上記復号正規化済み信号系列の区分は、入力された区分対象範囲を2つの範囲に区分する上記二区分部により行われ、
     上記二区分部の処理は、上記二区分部の処理で得られる2つの区分された範囲にそれぞれ対応する2つのゲイン補正量を表すビットの数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行され、
     第1回目の二区分部の処理は、上記復号正規化済み信号系列を上記区分対象範囲とすることにより行われ、第2n回目(nは1以上の各整数)から第2n+1-1回目の二区分部の処理のそれぞれは、第2n-1回目から第2n-1回目の二区分部の処理で得られる2n個の範囲のうちの何れか1つの範囲を上記区分対象範囲とすることにより行われる、
     復号装置。
  27.  請求項1から請求項12の何れかに記載の符号化方法の各ステップ及び/又は請求項13から請求項24の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラム。
  28.  請求項1から請求項12の何れかに記載の符号化方法の各ステップ及び/又は請求項13から請求項24の何れかに記載の復号方法の各ステップ手順をコンピュータに実行させるためのプログラムを記録した記録媒体。
PCT/JP2013/066438 2012-06-15 2013-06-14 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 WO2013187498A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014521423A JP5734519B2 (ja) 2012-06-15 2013-06-14 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012135373 2012-06-15
JP2012-135373 2012-06-15

Publications (1)

Publication Number Publication Date
WO2013187498A1 true WO2013187498A1 (ja) 2013-12-19

Family

ID=49758316

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/066438 WO2013187498A1 (ja) 2012-06-15 2013-06-14 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Country Status (2)

Country Link
JP (1) JP5734519B2 (ja)
WO (1) WO2013187498A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014071401A (ja) * 2012-10-01 2014-04-21 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268693A (ja) * 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
JP2006010817A (ja) * 2004-06-23 2006-01-12 Victor Co Of Japan Ltd 音響信号符号化装置
WO2007029304A1 (ja) * 2005-09-05 2007-03-15 Fujitsu Limited オーディオ符号化装置及びオーディオ符号化方法
JP2008065162A (ja) * 2006-09-08 2008-03-21 Toshiba Corp オーディオ符号化装置
JP2008203739A (ja) * 2007-02-22 2008-09-04 Kddi Corp オーディオビットレート変換方法および装置
JP2008261978A (ja) * 2007-04-11 2008-10-30 Toshiba Microelectronics Corp 再生音量自動調整方法
WO2009001874A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
JP2010175633A (ja) * 2009-01-27 2010-08-12 Sony Corp 符号化装置及び方法、並びにプログラム
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム
WO2012005212A1 (ja) * 2010-07-05 2012-01-12 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268693A (ja) * 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
JP2006010817A (ja) * 2004-06-23 2006-01-12 Victor Co Of Japan Ltd 音響信号符号化装置
WO2007029304A1 (ja) * 2005-09-05 2007-03-15 Fujitsu Limited オーディオ符号化装置及びオーディオ符号化方法
JP2008065162A (ja) * 2006-09-08 2008-03-21 Toshiba Corp オーディオ符号化装置
JP2008203739A (ja) * 2007-02-22 2008-09-04 Kddi Corp オーディオビットレート変換方法および装置
JP2008261978A (ja) * 2007-04-11 2008-10-30 Toshiba Microelectronics Corp 再生音量自動調整方法
WO2009001874A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
JP2010175633A (ja) * 2009-01-27 2010-08-12 Sony Corp 符号化装置及び方法、並びにプログラム
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム
WO2012005212A1 (ja) * 2010-07-05 2012-01-12 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014071401A (ja) * 2012-10-01 2014-04-21 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Also Published As

Publication number Publication date
JP5734519B2 (ja) 2015-06-17
JPWO2013187498A1 (ja) 2016-02-08

Similar Documents

Publication Publication Date Title
TWI405187B (zh) 可縮放語音及音訊編碼解碼器、包括可縮放語音及音訊編碼解碼器之處理器、及用於可縮放語音及音訊編碼解碼器之方法及機器可讀媒體
JP5710476B2 (ja) スーパーフレームにおいてlpcフィルタの量子化および逆量子化を行うためのデバイスおよび方法
JP5613781B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
US20060277040A1 (en) Apparatus and method for coding and decoding residual signal
CN110444216B (zh) 解码装置、解码方法、记录介质
US20140074489A1 (en) Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method
JP6457552B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
JPWO2012004998A1 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
AU2018338424B2 (en) Method and device for efficiently distributing a bit-budget in a CELP codec
WO2011045926A1 (ja) 符号化装置、復号装置およびこれらの方法
JP5734519B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
AU2014280258B9 (en) Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding
CA2914418C (en) Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
CN110291583B (zh) 用于音频编解码器中的长期预测的系统和方法
JP5840101B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5635213B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5738480B2 (ja) 符号化方法、符号化装置、復号方法、復号装置及びプログラム
JP5786044B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5800920B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
RU2769429C2 (ru) Кодер звукового сигнала
KR101348888B1 (ko) Klt 기반 도메인 스위치 스플릿 벡터 양자화 방법 및 장치
KR20140037118A (ko) 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기
JP5714172B2 (ja) 符号化装置、この方法、プログラムおよび記録媒体
KR20130047630A (ko) 통신 시스템에서 신호 부호화 장치 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13804593

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014521423

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13804593

Country of ref document: EP

Kind code of ref document: A1