WO2013180164A1 - 符号化方法、符号化装置、プログラム、および記録媒体 - Google Patents

符号化方法、符号化装置、プログラム、および記録媒体 Download PDF

Info

Publication number
WO2013180164A1
WO2013180164A1 PCT/JP2013/064877 JP2013064877W WO2013180164A1 WO 2013180164 A1 WO2013180164 A1 WO 2013180164A1 JP 2013064877 W JP2013064877 W JP 2013064877W WO 2013180164 A1 WO2013180164 A1 WO 2013180164A1
Authority
WO
WIPO (PCT)
Prior art keywords
gain
value
bits
consumed
bit number
Prior art date
Application number
PCT/JP2013/064877
Other languages
English (en)
French (fr)
Inventor
守谷 健弘
優 鎌本
登 原田
祐介 日和▲崎▼
勝宏 福井
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=49673352&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=WO2013180164(A1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority to EP13796771.7A priority Critical patent/EP2827328B1/en
Priority to US14/394,158 priority patent/US9552821B2/en
Priority to KR1020147032029A priority patent/KR101661917B1/ko
Priority to KR1020177015504A priority patent/KR101762210B1/ko
Priority to EP19169511.3A priority patent/EP3534367B1/en
Priority to PL19169511T priority patent/PL3534367T3/pl
Priority to KR1020167026537A priority patent/KR101746697B1/ko
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to EP17175244.7A priority patent/EP3236468B1/en
Priority to ES13796771.7T priority patent/ES2661504T3/es
Priority to JP2014518696A priority patent/JP5872034B2/ja
Priority to CN201380026180.4A priority patent/CN104321813B/zh
Priority to PL17175244T priority patent/PL3236468T3/pl
Priority to KR1020177015496A priority patent/KR101762205B1/ko
Publication of WO2013180164A1 publication Critical patent/WO2013180164A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Definitions

  • the present invention relates to an audio signal encoding technique.
  • the present invention relates to a coding technique for a sequence obtained by dividing a sample sequence derived from an acoustic signal by a gain.
  • Adaptive coding for orthogonal transform coefficients such as DFT (Discrete Fourier Transform) and MDCT (Modified Discrete Cosine Transform) is known as a coding method for low-bit (for example, about 10 kbit / s to 20 kbit / s) speech and acoustic signals. It has been.
  • AMR-WB + Extended-Adaptive-Multi-Rate-Wideband
  • TCX transform-coded excitation
  • TCX coding a coefficient sequence obtained by normalizing a frequency domain acoustic digital signal sequence with a power spectrum envelope coefficient sequence so that encoding can be performed with the total number of bits given for each frame.
  • the gain is determined so that a sequence obtained by dividing each coefficient of the above by a gain can be encoded with a predetermined number of bits.
  • ⁇ TCX encoding apparatus 1000> A configuration example of a conventional TCX encoding apparatus 1000 is shown in FIG. Hereinafter, each part of FIG. 1 will be described.
  • the frequency domain transform unit 1001 transforms the input acoustic digital signal into N-point MDCT coefficient sequences X (1),. Output.
  • N is a positive integer.
  • the power spectrum envelope coefficient sequence calculation unit 1002 performs a linear prediction analysis on the acoustic digital signal in units of frames to obtain a linear prediction coefficient, and uses the linear prediction coefficient to calculate the power spectrum envelope coefficient sequence W ( 1), ..., W (N) is obtained and output.
  • the weighted envelope normalization unit 1003 normalizes each coefficient of the MDCT coefficient sequence obtained by the frequency domain transform unit 1001 using the power spectrum envelope coefficient sequence obtained by the power spectrum envelope coefficient sequence calculation unit 1002, and performs weighted normalization MDCT.
  • Coefficient sequence X N (1), ..., X N (N) is output.
  • the weighted envelope normalization unit 1003 uses the weighted power spectrum envelope coefficient sequence in which the power spectrum envelope is blunted to generate an MDCT coefficient sequence in units of frames. Normalize each coefficient of.
  • the weighted normalized MDCT coefficient sequence X N (1),..., X N (N) does not have the amplitude gradient and amplitude irregularity as large as the input MDCT coefficient sequence, but the acoustic digital signal Having a similar magnitude relationship to the power spectrum envelope coefficient sequence, ie, having a slightly larger amplitude in the coefficient side region corresponding to a lower frequency and having a fine structure due to the pitch period.
  • the initialization unit 1004 sets an initial value of the gain (global gain) g.
  • the initial value of the gain is determined from the energy of the weighted normalized MDCT coefficient sequence X N (1),..., X N (N) and the number of bits allocated in advance to the code output by the variable length encoding unit 1006. be able to.
  • the number of bits allocated in advance to the code output by the variable length encoding unit 1006 is referred to as an allocated bit number B.
  • the initialization unit sets 0 as the initial value of the number of gain updates.
  • Gain update loop processing section 1130 encodes a sequence obtained by dividing each coefficient in weighted normalized MDCT coefficient sequence X N (1),..., X N (N) by a gain with a predetermined number of bits. The gain is determined as possible, and the sequence obtained by dividing each coefficient in the weighted normalized MDCT coefficient sequence X N (1), ..., X N (N) by the determined gain is variable-length encoded. The obtained integer signal code and the gain code obtained by encoding the determined gain are output.
  • the gain update loop processing unit 1130 includes a quantization unit 1005, a variable length encoding unit 1006, a determination unit 1007, a gain expansion update unit 1131, a gain reduction update unit 1132, a truncation unit 1016, and a gain encoding unit. 1017.
  • the quantization unit 1005 quantizes the value obtained by dividing each coefficient of the weighted normalized MDCT coefficient sequence X N (1),..., X N (N) by the gain g, A certain quantized normalized coefficient series X Q (1), ..., X Q (N) is obtained and output.
  • variable length coding unit 1006 performs variable length coding on the quantized normalized coefficient series X Q (1),..., X Q (N) to obtain and output a code.
  • This code is called an integer signal code.
  • the variable length coding unit 1006 measures the number of bits of the integer signal code obtained by variable length coding. Hereinafter, this number of bits is referred to as the number of consumed bits c.
  • the determination unit 1007 outputs the gain, the integer signal code, and the number of consumed bits c when the gain update count is a predetermined count.
  • the gain expansion updating unit 1131 When the consumed bit number c measured by 1006 is smaller than the allocated bit number B, the gain reduction updating unit 1132 controls to perform the next process.
  • the number of consumed bits c is equal to the number of allocated bits B, it means that the current gain value is an optimum value, so that the gain, the integer signal code, and the number of consumed bits c are output.
  • the gain expansion update unit 1131 sets a value g ′> g larger than the current gain g value as a new gain.
  • the gain expansion update unit 1131 includes a gain lower limit setting unit 1008, a first branch unit 1009, a first gain update unit 1010, and a gain expansion unit 1011.
  • the gain lower limit setting unit 1008 sets the current gain g value as the lower limit value g min of the gain (g min ⁇ g). This lower limit value g min of the gain means that at least the gain value should be more than this.
  • the first gain updating unit 1010 newly sets an average value of the current gain g value and the upper limit value g max of the gain as the value of the gain g (g ⁇ (g + g max ) / 2). This is because the optimum gain value exists between the current gain g value and the upper limit value g max of the gain. Since the value of this gain g is set as the lower limit value g min of the gain, a new average value of the upper limit value g max and the gain lower limit value g min of the gain can be said to be set as the value of the gain g (g ⁇ -( Gmax + gmin ) / 2). Thereafter, the processing returns to the quantization unit 1005.
  • the gain expanding unit 1011 sets a value larger than the current gain g value as a new gain g value. For example, a value obtained by adding a gain change amount ⁇ g, which is a predetermined value, to the current gain g value is set as a new gain g value (g ⁇ g + ⁇ g). Further, for example, when the upper limit value g max of the gain is not set and the state where the number of consumed bits c is larger than the number of allocated bits B continues multiple times, a value larger than a predetermined value is set as the gain change amount ⁇ g. Use. Thereafter, the processing returns to the quantization unit 1005.
  • the gain reduction updating unit 1132 sets a value g ′ ⁇ g smaller than the current gain g value as a new gain.
  • the gain reduction / update unit 1132 includes a gain upper limit setting unit 1012, a second branching unit 1013, a second gain update unit 1014, and a gain reduction unit 1015.
  • the gain upper limit setting unit 1012 sets the current gain g value as the gain upper limit value g max (g max ⁇ g).
  • the upper limit value g max of the gain means that at least the gain value should be less than this value.
  • the second gain updating unit 1014 sets the average value of the current gain g and the lower limit value g min of the gain as a new value of the gain g (g ⁇ (g + g min ) / 2). This is because the optimum gain value exists between the current gain g value and the lower limit value g min of the gain. Since the value of this gain g is set as the upper limit value g max gain, a new average value of the upper limit value g max and the gain lower limit value g min of the gain can be said to be set as the value of the gain g (g ⁇ -( Gmax + gmin ) / 2). Thereafter, the processing returns to the quantization unit 1005.
  • the gain reduction unit 1015 sets a value smaller than the current gain g value as a new gain g value. For example, a value obtained by subtracting a gain change amount ⁇ g, which is a predetermined value, from the current gain g value is set as a new gain g value (g ⁇ g ⁇ g). Further, for example, when the lower limit value g min of the gain is not set and a state where the number of consumed bits c is smaller than the number of allocated bits B continues multiple times, a value larger than a predetermined value is set as the gain change amount ⁇ g. Use. Thereafter, the processing returns to the quantization unit 1005.
  • the truncating unit 1016 includes an amount of the consumed bit number c exceeding the allocated bit number B among the integer signal codes output from the determining unit 1007.
  • a code obtained by removing the only code from the code corresponding to the quantized normalized coefficient on the high frequency side is output as a new integer signal code. That is, the truncation unit 1016 obtains the remainder obtained by removing, from the integer signal code, the code corresponding to the quantized normalized coefficient on the high frequency side corresponding to the surplus c ⁇ B with respect to the allocated bit number B of the consumed bit number c. Is output as a new integer signal code.
  • the gain output from the determination unit 1007 is encoded with a predetermined number of bits to obtain a gain code and output.
  • a gain value is fixedly obtained by adding a gain change amount ⁇ g, which is a predetermined value, to the value of gain g, as a new gain g value. It was expanding. If the upper limit value of the gain is not set and the process of the gain expanding unit 1011 is required a plurality of times, the initial value of the gain may be too small, so that the gain change amount ⁇ g is larger than a predetermined value. Therefore, the probability that the upper limit value of the gain can be reached must be increased, but a value that greatly exceeds the appropriate gain may be set as a new gain value. In some cases, an appropriate gain value cannot be obtained a predetermined number of times.
  • gain reduction section 1015 of conventional coding apparatus 1000 a value obtained by subtracting gain change amount ⁇ g, which is a predetermined value, from the value of gain g is used as a new gain g value, so that gain is fixed. The value of was reduced. If the lower limit value of the gain is not set and the processing of the gain reduction unit 1015 is required a plurality of times, the initial value of the gain may be very large, so the gain change amount ⁇ g is set larger than a predetermined value. Therefore, the probability that the lower limit of the gain can be reached must be increased, but this may set a value that greatly exceeds the appropriate gain as a new gain value, and it takes a lot of convergence. In some cases, an appropriate gain value cannot be obtained a predetermined number of times.
  • the decoding device obtains a decoded signal with the high-frequency coefficient set to 0. There is a problem that the distortion of the decoded signal increases due to the necessity.
  • the gain value obtained at a predetermined number of times is too large, the number of bits of the integer signal code is less than the allocated bits, and thus there is a problem that sufficient sound signal quality cannot be obtained.
  • the gain value is updated so that the difference between the pre-update gain and the post-update gain increases as the difference between the predetermined allocation bit number B increases, and the gain code corresponding to the obtained gain and the sample
  • An integer signal code obtained by encoding a sequence of integer value samples obtained by dividing each sample of the sequence by the gain is obtained.
  • the number of bits of the code obtained by variable length coding can be made closer to the allocated bits than in the prior art. It becomes possible to perform higher quality encoding than the technology.
  • the block diagram which illustrated the composition of the conventional coding device The block diagram which illustrated the composition of the coding device of a 1st embodiment.
  • the acoustic digital signal (input acoustic signal) handled in each embodiment is a signal obtained by digitizing an acoustic signal such as a voice or a musical sound.
  • the input acoustic digital signal is a time domain signal of a predetermined time interval, converts the acoustic digital signal into a frequency domain signal, and further normalizes the frequency domain signal using a power spectrum envelope coefficient sequence. It is assumed that the sequence obtained in this way is a sample sequence to be encoded (a sample sequence derived from an input acoustic signal).
  • the input acoustic digital signal may be a time domain signal of a predetermined time interval, and the acoustic digital signal itself may be a sample sequence to be encoded, or linear prediction analysis may be performed on the acoustic digital signal.
  • the residual signal obtained by performing may be a sample sequence to be encoded, or a frequency domain signal converted from the acoustic digital signal may be a sample sequence to be encoded.
  • the input acoustic digital signal is a frequency domain signal of a predetermined section (a frequency domain signal corresponding to a predetermined time section or a frequency domain signal of a predetermined frequency section of the frequency domain signal), and the acoustic digital signal It may be a sample sequence to be encoded, or a time domain signal converted from the acoustic digital signal may be a sample sequence to be encoded, or linear predictive analysis for the time domain signal
  • the residual signal obtained by performing the above may be a sample sequence to be encoded. That is, the input acoustic digital signal may be a time domain signal or a frequency domain signal, and a sample sequence to be encoded may be a time domain signal or a frequency domain signal.
  • MDCT Modified Discrete Cosine Transform
  • DCT Discrete Cosine Transform
  • Inverse transformation or the like can be used.
  • the encoding device has a frequency domain transform unit, a power spectrum envelope coefficient sequence calculation unit, and a weighted envelope normalization unit, and the sample sequence obtained by the weighted envelope normalization unit is The example input into a quantization part is shown.
  • the frequency domain conversion unit, the power spectrum envelope coefficient sequence calculation unit, and the weighted envelope normalization unit are omitted, and the acoustic digital signal Are directly input to the quantization unit.
  • the encoding device When a residual signal obtained by performing linear prediction analysis on an acoustic digital signal that is an input time domain signal is used as a sample sequence to be encoded, for example, the encoding device includes a frequency domain conversion unit. , instead of the power spectrum envelope coefficient sequence calculation unit and the weighted envelope normalization unit, a linear prediction unit that obtains a linear prediction coefficient or a coefficient that can be converted to them by using an acoustic digital signal, and a linear corresponding to the linear prediction coefficient A residual calculation unit that obtains a prediction residual from the prediction filter and the acoustic digital signal is provided, and a sample sequence of the residual signal is input to the quantization unit.
  • a frequency domain signal converted from an acoustic digital signal that is an input time domain signal is used as a sample sequence to be encoded, for example, a power spectrum envelope coefficient sequence calculation unit and a weighted envelope normalization unit are omitted.
  • the sample sequence of the frequency domain signal obtained by the frequency domain transform unit is input to the quantization unit.
  • an encoding device When a time domain signal converted from an acoustic digital signal that is an input frequency domain signal is used as a sample sequence to be encoded, for example, an encoding device includes a frequency domain conversion unit, a power spectrum envelope coefficient sequence calculation unit In place of the weighted envelope normalization unit, a time domain conversion unit that converts an acoustic digital signal into a time domain signal is provided, and a sample sequence of the time domain signal is input to the quantization unit.
  • a residual signal obtained by performing linear prediction analysis on a time domain signal converted from an acoustic digital signal that is an input frequency domain signal is used as an encoding target sample sequence, for example, encoding is performed.
  • the apparatus has a time domain conversion unit, a linear prediction unit, and a residual calculation unit instead of the frequency domain conversion unit, the power spectrum envelope coefficient sequence calculation unit, and the weighted envelope normalization unit, and is obtained by the residual calculation unit.
  • the sample sequence of the residual signal is input to the quantization unit.
  • the frequency domain transform unit 101 converts an input acoustic digital signal (input acoustic signal) into N points of MDCT coefficient sequences X (1),..., X (N ) And output.
  • N is a positive integer.
  • the power spectrum envelope coefficient sequence calculation unit 102 performs linear prediction analysis on the acoustic digital signal in units of frames to obtain a linear prediction coefficient, and uses the linear prediction coefficient to calculate the power spectrum envelope coefficient sequence W ( 1), ..., W (N) is obtained and output.
  • the weighted envelope normalization unit 103 normalizes each coefficient of the MDCT coefficient sequence obtained by the frequency domain transform unit 101 using the power spectrum envelope coefficient sequence obtained by the power spectrum envelope coefficient sequence calculation unit 102, and weighted normalization MDCT Coefficient sequence X N (1), ..., X N (N) is output.
  • the weighted envelope normalization unit 103 uses the weighted power spectrum envelope coefficient sequence in which the power spectrum envelope is blunted to generate an MDCT coefficient sequence in units of frames. Normalize each coefficient of.
  • the weighted normalized MDCT coefficient sequence X N (1),..., X N (N) does not have the amplitude gradient and amplitude irregularity as large as the input MDCT coefficient sequence, but the acoustic digital signal Having a similar magnitude relationship to the power spectrum envelope coefficient sequence, ie, having a slightly larger amplitude in the coefficient side region corresponding to a lower frequency and having a fine structure due to the pitch period.
  • the time signal x (t) at time t is the value x (t-1) , ⁇ , x (tp) and the prediction residuals e (t) and the linear prediction coefficients alpha 1, ⁇ ⁇ ⁇ , represented by the formula (1) by alpha p.
  • each coefficient W (n) [1 ⁇ n ⁇ N] of the power spectrum envelope coefficient sequence is expressed by Expression (2).
  • exp ( ⁇ ) is an exponential function with the Napier number as the base
  • j is an imaginary unit
  • ⁇ 2 is the predicted residual energy.
  • the linear prediction coefficient may be obtained by performing linear prediction analysis on the acoustic digital signal input to the frequency domain transform unit 101 by the weighted envelope normalization unit 103, or may be another unillustrated unit existing in the encoding device 100. It may be obtained by linear predictive analysis of an acoustic digital signal by means. In such a case, the weighted envelope normalization unit 103 obtains each coefficient W (1),..., W (N) of the power spectrum envelope coefficient sequence using the linear prediction coefficient. Further, the coefficients W (1),..., W (N) of the power spectrum envelope coefficient sequence are already obtained by other means (such as the power spectrum envelope coefficient sequence calculation unit 102) in the encoding apparatus 100.
  • the weighted envelope normalization unit 103 can use the coefficients W (1),..., W (N) of the power spectrum envelope coefficient sequence. Note that since the decoding device needs to obtain the same value as that obtained by the encoding device 100, a quantized linear prediction coefficient and / or power spectrum envelope coefficient sequence is used.
  • linear prediction coefficient or “power spectrum envelope coefficient sequence” means a quantized linear prediction coefficient or power spectrum envelope coefficient sequence.
  • the linear prediction coefficient is encoded by, for example, a conventional encoding technique, and the prediction coefficient code is transmitted to the decoding side.
  • the conventional encoding technique is, for example, an encoding technique in which a code corresponding to the linear prediction coefficient itself is a prediction coefficient code, a code corresponding to the LSP parameter by converting the linear prediction coefficient into an LSP parameter, and a prediction coefficient code.
  • An encoding technique for converting a linear prediction coefficient into a PARCOR coefficient and using a code corresponding to the PARCOR coefficient as a prediction coefficient code is obtained by other means existing in the encoding apparatus 100, the linear prediction coefficient is encoded by a conventional encoding technique in the other means existing in the encoding apparatus 100. And the prediction coefficient code is transmitted to the decoding side.
  • the weighted envelope normalization unit 2 converts each coefficient X (1),..., X (N) of the MDCT coefficient sequence to a correction value W ⁇ (1) of each coefficient of the power spectrum envelope coefficient sequence corresponding to each coefficient. , ..., W ⁇ (N), by dividing each coefficient X (1) / W ⁇ (1), ..., X (N) / W ⁇ (N) of the weighted normalized MDCT coefficient sequence Process to get.
  • the correction value W ⁇ (n) [1 ⁇ n ⁇ N] is given by Equation (3).
  • is a positive constant of 1 or less, and is a constant that dulls the power spectrum coefficient.
  • the weighted envelope normalization unit 2 converts each coefficient X (1),..., X (N) of the MDCT coefficient sequence to the ⁇ power of each coefficient of the power spectrum envelope coefficient sequence corresponding to each coefficient (0 ⁇ ⁇ 1) values W (1) ⁇ ,..., W (N) ⁇ by dividing each coefficient X (1) / W (1) ⁇ ,. (N) / W (N) ⁇ is obtained.
  • a frame-by-frame weighted normalized MDCT coefficient sequence is obtained, but the weighted normalized MDCT coefficient sequence does not have a larger amplitude gradient or amplitude irregularity than the input MDCT coefficient sequence, but the input MDCT coefficient It has a magnitude relationship similar to the power spectrum envelope of the column, that is, one having a slightly large amplitude in the coefficient side region corresponding to a low frequency and a fine structure resulting from the pitch period.
  • the inverse processing corresponding to the weighted envelope normalization process that is, the process of restoring the MDCT coefficient sequence from the weighted normalized MDCT coefficient sequence is performed on the decoding side, so the weighted power spectrum envelope coefficient sequence from the power spectrum envelope coefficient sequence It is necessary to set a common setting for the encoding side and the decoding side.
  • the initialization unit 104 sets an initial value of the gain (global gain) g.
  • X N (N) number of bits energy and variable length coding unit 106 is pre-allocated to the code output from the be able to.
  • the initial value of the gain g is a positive value.
  • the number of bits allocated in advance to the code output from the variable-length encoding unit 106 is referred to as an allocated bit number B.
  • the initialization unit sets 0 as the initial value of the number of gain updates.
  • the gain update loop processing unit 130 calculates a sequence (sequence of integer value samples) obtained by dividing each coefficient in the weighted normalized MDCT coefficient sequence X N (1),..., X N (N) by the gain. Obtained by determining the gain so that encoding can be performed with a predetermined number of bits, and dividing each coefficient in the weighted normalized MDCT coefficient sequence X N (1),..., X N (N) by the determined gain An integer signal code obtained by variable-length coding a sequence (sequence of integer value samples) and a gain code obtained by coding the determined gain (a gain code corresponding to the gain) are output.
  • the gain update loop processing unit 130 increases the gain before the update and the gain after the update as the difference between the number of bits of the code obtained by encoding the sequence of integer value samples and the predetermined distribution bit number B increases. The value of the gain is updated so that the difference between is increased.
  • the gain update loop processing unit 130 includes a quantization unit 105, a variable length encoding unit 106, a determination unit 107, a gain expansion update unit 131, a gain reduction update unit 132, a truncation unit 116, and a gain encoding unit. 117.
  • the quantization unit 105 receives each coefficient (each sample) of the input weighted normalized MDCT coefficient sequence X N (1),..., X N (N) (sample sequence derived from the input acoustic signal in a predetermined section). ) Is divided by the gain g, and the quantized normalized coefficient sequence X Q (1), ..., X Q (which is a sequence of integer values (quantized normalized samples) is quantized. N) is obtained and output. Further, the quantization unit 105 counts the number of samples s from the quantized normalized coefficient on the lowest frequency side to the quantized normalized coefficient on the highest frequency side whose value is not 0, and this sample The number s is output.
  • variable length coding unit 106 performs variable length coding on the input quantized normalized coefficient series X Q (1),..., X Q (N) to obtain a code (sample string code) and outputs it. .
  • This code is called an integer signal code.
  • the variable length coding unit 106 measures the number of bits of the integer signal code obtained by variable length coding. In this embodiment, this number of bits is referred to as the number of consumed bits c.
  • the determination unit 107 outputs a gain g, an integer signal code, and a consumed bit number c when the number of gain updates is a predetermined number.
  • the gain expansion updating unit 131 performs the variable length coding unit.
  • the gain reduction updating unit 132 controls to perform the next process. If the consumed bit number c measured by the variable length coding unit 106 is equal to the allocated bit number B, the determining unit 107 outputs the gain g, the integer signal code, and the consumed bit number c.
  • the gain expansion updating unit 131 sets a value g ′> g larger than the current gain g value as a new gain.
  • the gain expansion update unit 131 includes a sample number measurement unit 118, a gain lower limit setting unit 108, a first branch unit 109, a first gain update unit 110, a first gain update unit 110, a gain expansion unit 111, including.
  • sample number measuring unit 118 When the consumed bit number c is larger than the allocated bit number B, the sample number measuring unit 118 is high so that the consumed bit number c does not exceed the allocated bit number B among the integer signal codes output from the determining unit 107. The number t of samples of the quantized normalized coefficient corresponding to the code from which the code corresponding to the quantized normalized coefficient on the frequency side is removed is output. That is, the sample number measuring unit 118 calculates the quantized normalized coefficient on the high frequency side corresponding to the code (truncated code) corresponding to the surplus c ⁇ B with respect to the allocated bit number B of the consumed bit number c.
  • the number of samples t of the quantized normalized coefficients that have been removed from the quantized normalized coefficient series output by 105 and whose corresponding code has not been removed is output.
  • An example of the truncation code is a code with the bit number of cB or more and the smallest among codes corresponding to one or more quantized normalized coefficients in the region including the highest frequency. In other words, only the low frequency side quantized normalized coefficients are to be encoded, and the remaining high frequency side quantized normalized coefficients are not to be encoded, thereby reducing the length of the corresponding variable length code.
  • the number of samples of the quantized normalized coefficient to be encoded when the number of allocated bits is equal to or less than B is t.
  • the gain lower limit setting unit 108 When the consumed bit number c is larger than the allocated bit number B, the gain lower limit setting unit 108 further sets the current gain g value (gain g corresponding to the consumed bit number c) as the gain lower limit value g min. (G min ⁇ g). This lower limit value g min of the gain means that at least the gain value should be more than this.
  • the first gain updating unit 110 sets a value between the current gain g value (gain g corresponding to the consumed bit number c) and the upper limit value g max of the gain as a new value of the gain g. This is because the optimum gain value exists between the current gain g value and the upper limit value g max of the gain. For example, the first gain updating unit 110 newly sets the average value of the current gain g value and the upper limit value g max of the gain as the gain g (g ⁇ (g + g max ) / 2).
  • this gain g Since the value of this gain g is set as the lower limit value g min of the gain, a new average value of the upper limit value g max and the gain lower limit value g min of the gain can be said to be set as the value of the gain g (g ⁇ -( Gmax + gmin ) / 2). Thereafter, the processing returns to the quantization unit 105.
  • the gain expanding unit 111 outputs the sample number measuring unit 118 from the number of samples s from the quantized normalized coefficient on the lowest frequency side to the quantized normalized coefficient on the highest frequency side whose value is not 0.
  • the larger the value u s ⁇ t obtained by subtracting the number of samples t, the greater is the increment from the current gain to the new gain.
  • is a predetermined positive constant.
  • the gain expanding unit 111 subtracts the number of samples of the quantized normalized coefficient from which the corresponding code is not removed from the number of samples of a part or all of the quantized normalized sample sequence. As the obtained value is larger, the gain value is updated so that the increment from the value before the gain update to the value after the update becomes larger, and the subsequent processing of the quantization unit 105 is performed.
  • the gain reduction updating unit 132 sets a value g ′ ⁇ g smaller than the current gain g value as a new gain.
  • the gain reduction updating unit 132 includes a gain upper limit setting unit 112, a second branching unit 113, a second gain updating unit 114, and a gain reduction unit 115.
  • the gain upper limit setting unit 112 sets the current gain g value (the value of the gain g corresponding to the consumed bit number c) to the gain upper limit value g max. (G max ⁇ g).
  • the upper limit value g max of the gain means that at least the gain value should be less than this value.
  • the second gain updating unit 114 sets a value between the current gain g value (the value of the gain g corresponding to the consumed bit number c) and the lower limit value g min of the gain as a new value of the gain g. . This is because the optimum gain value exists between the current gain g value and the lower limit value g min of the gain. For example, the second gain updating unit 114 sets the average value of the current gain g and the lower limit value g min of the gain as a new value of the gain g (g ⁇ (g + g min ) / 2).
  • this gain g Since the value of this gain g is set as the upper limit value g max gain, a new average value of the upper limit value g max and the gain lower limit value g min of the gain can be said to be set as the value of the gain g (g ⁇ -( Gmax + gmin ) / 2). Thereafter, the processing returns to the quantization unit 105.
  • the gain reduction unit 115 decreases the current gain g value to a new gain g value as the surplus bit number Bc, which is a value obtained by subtracting the consumed bit number c from the allocated bit number B, increases. Make the minutes bigger.
  • the value of the new gain g is also a positive value.
  • new gain g current gain g ⁇ (1 ⁇ (Bc) / B ⁇ ⁇ ).
  • is a predetermined positive constant. That is, the gain reduction unit 115 greatly decreases the value of the gain g as the value Bc obtained by subtracting the consumed bit number c from the allocated bit number B increases. Thereafter, the processing returns to the quantization unit 105.
  • the gain reducing unit 115 increases the decrease in the gain g from the value before the update to the value after the update.
  • the value of the gain g is updated so that the following processing is performed by the quantization unit 115.
  • ⁇ Truncation part 116> When the number of consumed bits c output from the determining unit 107 is larger than the allocated bit number B, the truncating unit 116 determines that the consumed bit number c exceeds the allocated bit number B among the integer signal codes output from the determining unit 107. A code obtained by removing the only code from the code corresponding to the quantized normalized coefficient on the high frequency side is output as a new integer signal code.
  • the truncation unit 116 converts an integer signal code (sample sequence code) to a code (truncated code) corresponding to a quantized normalized coefficient on the higher frequency side corresponding to the surplus c ⁇ B with respect to the allocated bit number B of the consumed bit number c.
  • the remaining codes (truncated sample string codes) obtained by removing from () are output as new integer signal codes.
  • the gain output from the determination unit 107 is encoded with a predetermined number of bits to obtain a gain code and output.
  • the encoding device 150 of the modification of the first embodiment differs from the encoding device 100 of the first embodiment in that the estimated bits of the integer signal code are used instead of the number of bits of the integer signal code obtained by variable length coding.
  • the number is the consumption bit number c.
  • the encoding device 150 includes a gain update loop processing unit 190 instead of the gain update loop processing unit 130 of the encoding device 100.
  • the gain update loop processing unit 190 replaces the variable length encoding unit 106, the determination unit 107, the gain expansion update unit 131, and the truncation unit 116 of the gain update loop processing unit 130 with a bit number estimation unit 156, a determination unit 157, A gain expansion update unit 191 and a variable length encoding unit 159 are provided.
  • the gain expansion update unit 191 includes a gain expansion unit 151 and a sample number measurement unit 168 instead of the gain expansion unit 111 and the sample number measurement unit 118 of the gain expansion update unit 131. Only differences from the first embodiment will be described below.
  • the bit number estimation unit 156 calculates an estimated value (estimated bit number) of the number of bits of a code obtained by variable length coding the quantized normalized coefficient sequence X Q (1),..., X Q (N). Find and output. In the modification of the first embodiment, this estimated number of bits is referred to as the number of consumed bits c.
  • the determination unit 157 outputs the gain g and the quantized normalized coefficient series X Q (1),..., X Q (N) when the number of gain updates is a predetermined number.
  • the gain expansion update unit 191 performs the bit number estimation unit 156.
  • the gain reduction updating unit 132 controls to perform the next process.
  • the determining unit 157 determines the gain g, the quantized normalized coefficient sequence X Q (1),. Q (N) is output.
  • sample number measuring unit 168 When the consumed bit number c is larger than the allocated bit number B, the sample number measuring unit 168 is subject to a code (truncated code) corresponding to the surplus c ⁇ B with respect to the allocated bit number B of the consumed bit number c.
  • the remaining quantized normalized coefficients obtained by removing the quantized normalized coefficients on the frequency side from the quantized normalized coefficient series X Q (1),..., X Q (N) output from the quantizing unit 105 The coefficient sample count t is output.
  • the gain expanding unit 111 determines that the quantized normalized coefficient on the high frequency side that is the target of the above-described truncation code is quantized by the quantizing unit 105 from the number of samples of a part or all of the quantized normalized sample sequence. output quantized normalized haze coefficient sequence X Q (1), ⁇ , as X Q (N) from the remaining removal quantized normalized haze factor of sample number t, the value obtained by subtracting the large Then, the gain value is updated so that the increment from the value before the gain update to the value after the update becomes larger, and the subsequent processing of the quantization unit 105 is performed.
  • variable length encoding unit 159 obtains a code by variable length encoding the quantized normalized coefficient sequence X Q (1),..., X Q (N) output from the determination unit 157, and obtains a code. Is output as an integer signal code (sample string code).
  • the variable length encoding unit 159 When a code having a number of bits exceeding the allocated bit number B is obtained by variable length encoding, the variable length encoding unit 159 generates codes corresponding to the number exceeding the allocated bit number B among the codes obtained by variable length encoding. Is removed from the code corresponding to the quantized normalized coefficient on the higher frequency side and output as an integer signal code.
  • the encoding apparatus 200 of the second embodiment is different from the encoding apparatus 100 of the first embodiment in that a gain update loop processing unit 230 is provided instead of the gain update loop processing unit 130, and the gain update loop processing unit 230 is Instead of the quantization unit 105, the determination unit 107, the gain expansion update unit 131, and the truncation unit 116 of the gain update loop processing unit 130, a quantization unit 205, a determination unit 207, a gain expansion update unit 231, and a truncation unit 216 are used.
  • the gain expansion update unit 231 does not include the sample number measurement unit 118 in the gain expansion update unit 131 of the first embodiment, and the gain lower limit setting unit 108, the first branch unit 109, the first gain update unit 110, and the gain And an enlargement unit 211. Only differences from the first embodiment will be described below.
  • the quantization unit 205 gains each coefficient (each sample) of the weighted normalized MDCT coefficient sequence X N (1),..., X N (N) (sample sequence derived from the input acoustic signal in a predetermined section). The value obtained by dividing by g is quantized, and a quantized normalized coefficient sequence X Q (1), ..., X Q (N), which is a sequence of integer values (quantized normalized samples), is obtained. Output.
  • the determination unit 207 outputs the gain, the integer signal code, and the number of consumed bits c when the gain update count is a predetermined count.
  • the gain expansion updating unit 231 uses the variable length coding unit.
  • the gain reduction updating unit 132 controls to perform the processing described in the first embodiment. If the consumed bit number c measured by the variable length coding unit 106 is equal to the allocated bit number B, the determining unit 207 outputs the gain, the integer signal code, and the consumed bit number c.
  • the truncating unit 216 includes the portion of the integer signal code output from the determining unit 207 that exceeds the allocated bit number B.
  • a code obtained by removing the only code from the code corresponding to the quantized normalized coefficient on the high frequency side is output as a new integer signal code. That is, the truncation unit 216 converts an integer signal code (sample sequence code) to a code (a truncation code) corresponding to a quantized normalized coefficient on the high frequency side corresponding to the surplus c ⁇ B with respect to the allocated bit number B of the consumed bit number c.
  • the remaining code (truncated sample string code) obtained by removing from () is output as a new integer signal code.
  • the gain expanding unit 211 increases the increase from the current gain to the new gain as the insufficient bit number c ⁇ B, which is a value obtained by subtracting the allocated bit number B from the consumed bit number c. To do. For example, a new gain g ⁇ current gain g ⁇ (1+ (c ⁇ B) / B ⁇ ⁇ ).
  • is a predetermined positive constant. That is, when the consumed bit number c is larger than the allocated bit number B and the upper limit value g max of the gain is not set, the gain expanding unit 211 obtains the subtracted distributed bit number B from the consumed bit number c. The larger the value cB that is obtained, the greater the value of the gain g.
  • the processing returns to the quantization unit 205.
  • the gain expanding unit 211 increases the gain g from the value before update to the value after update.
  • the value of the gain g is updated, and the subsequent processing of the quantization unit 205 is performed.
  • the encoding device 250 of the modification of the second embodiment differs from the encoding device 200 of the second embodiment in that the estimated bit of the integer signal code is used instead of the number of bits of the integer signal code obtained by variable length coding.
  • the number is the consumption bit number c.
  • the encoding device 250 includes a gain update loop processing unit 290 instead of the gain update loop processing unit 230 of the encoding device 200.
  • the gain update loop processing unit 290 includes the variable length encoding unit 106 of the gain update loop processing unit 230, In place of the truncation unit 216 and the determination unit 207, a bit number estimation unit 156, a variable length encoding unit 159, and a determination unit 257 are provided. Only differences from the second embodiment will be described below.
  • bit number estimation unit 156 is the same as the modification of the first embodiment.
  • the determination unit 257 outputs the gain, the quantized normalized coefficient series, and the number of consumed bits c when the number of gain updates is a predetermined number.
  • the gain expansion update unit 231 performs the bit number estimation unit 156.
  • the gain reduction updating unit 132 controls to perform the process described in the first embodiment. If the consumed bit number c estimated by the bit number estimating unit 156 is equal to the allocated bit number B, the determining unit 257 outputs the gain, the quantized normalized coefficient series, and the consumed bit number c.
  • variable length coding unit 159 is the same as the modification of the first embodiment.
  • the encoding device 300 of the third embodiment is different from the encoding device 100 of the first embodiment in that the gain lower limit setting unit 108, the first gain update unit 110, the gain upper limit setting unit 112, and the second gain update unit 114. Instead, a gain lower limit setting unit 308, a first gain updating unit 310, a gain upper limit setting unit 312, a second gain updating unit 314, and a consumed bit number storage unit 320 are provided.
  • the gain expansion update unit 331 includes a gain lower limit setting unit 308 and a first gain update unit 310 instead of the gain lower limit setting unit 108 and the first gain update unit 110 of the gain expansion update unit 131.
  • the gain reduction update unit 332 includes a gain upper limit setting unit 312 and a second gain update unit 314 instead of the gain upper limit setting unit 112 and the second gain update unit 114 of the gain reduction update unit 132.
  • the gain expansion loop processing unit 330 includes a gain expansion update unit 331 and a gain reduction update unit 332 instead of the gain expansion update unit 131 and the gain reduction update unit 132 of the gain expansion loop processing unit 130. Only differences from the first embodiment will be described below.
  • the gain lower limit setting unit 308 sets the current gain g value as the gain lower limit value g min (g min ⁇ g). Also, the gain lower limit setting unit 308 stores the consumption bit number storage unit 320 consumption bits c as lower limit setting when the number of consumed bits c L. That is, when the number of consumed bits c is larger than the allocated bit number B, the gain lower limit setting unit 308 further sets the consumed bit number c to the number of consumed bits at the lower limit setting in addition to the processing of the gain lower limit setting unit 108 of the first embodiment. c Set as L and store in the consumed bit number storage unit 320.
  • the gain upper limit setting unit 312 sets the current gain g value as the gain upper limit g max (g max ⁇ g). Also, the gain upper limit setting unit 312 stores the consumption bit number storage unit 320 consumption bits c as an upper limit set when the number of consumed bits c U. That is, when the consumed bit number c is smaller than the allocated bit number B, the gain upper limit setting unit 312 further sets the consumed bit number c to the upper limit setting consumed bit number in addition to the processing of the gain upper limit setting unit 112 of the first embodiment. c Set as U and store in the consumed bit number storage unit 320.
  • the first gain update unit 310 uses the allocated bit number B and the upper limit setting consumed bit number c U. and based on the number of consumed bits at the lower limit set c L, determine at least one of an indicator of likelihood of an upper limit value g max plausibility index and gain lower limit value g min of the gain.
  • the “index of plausibility” means an index representing the plausibility as the value of the gain g.
  • the first gain update unit 310 obtains an index w that represents the relative likelihood of the lower limit value g min of the gain using the formula A.
  • w (B ⁇ c U ) / (c L ⁇ c U ) (Formula A)
  • Expression A semantically represents the right side of Expression B based on the difference between the number of allocated bits B and the number of consumption bits c U at the upper limit setting, and the difference between the number of consumption bits c L at the lower limit setting and the number of allocated bits B. It is a deformed one.
  • the index w may be obtained not by the formula A but by the formula B.
  • the index w obtained by the formula A or B is large, the lower limit value g min of the gain is more likely to be the value of the gain g, and when the index w is smaller, the upper limit value g max of the gain is more likely to be the value of the gain g. It will be.
  • the index (1-w) may be obtained not by the formula C but by the formula D.
  • the index (1-w) obtained by the expression A or B is large, the upper limit value g max of the gain is more likely to be the value of the gain g, and when the index (1-w) is small, the lower limit value g min of the gain is This is the most likely value for the gain g.
  • the first gain updating unit 310 sets a weighted average that places a weight on the most likely value of the upper limit value g max and the lower limit value g min of the gain as a new value of the gain g. (G ⁇ g min ⁇ w + g max ⁇ (1 ⁇ w)). That is, when a larger difference in the difference in the number distribution of bits B and the upper limit set at the number of consumed bits c U is a lower limit set at the number of consumed bits c L allocation bit number B is towards the lower limit g min of gain plausible, It will be close to the preferred gain g value.
  • the value of the new gain g is an intermediate value between the arithmetic average value of the upper limit value g max of the gain and the lower limit value g min of the gain, the weighted average based on the difference between the number of consumed bits and the number of allocated bits.
  • the sample number measurement unit 118 obtains the number of quantized normalized samples that are the target of the truncation code (the number of rounded samples Tr), the number of consumed bits c L at the lower limit setting is allocated. Instead of the difference in the number of bits B, it is also possible to use the truncated number of samples Tr. This is because, as the difference between the number of consumed bits c L and the allocated number of bits B is larger, the number of truncated samples Tr is larger.
  • the lower limit setting bit count c is obtained by experimentally determining the correspondence between the difference between the number L of bits consumed at the lower limit setting L and the distribution bit number B and the number of samples Tr truncated.
  • the first gain updating unit 310 uses the distribution bit number B, the truncated sample number Tr, and the upper limit setting consumption bit number c U, and uses an index of the likelihood of the lower limit of the gain and the maximum of the upper limit of the gain. You may obtain at least any one of the parameter
  • the “index of plausibility” described above represents how much the gain g value is moved in the direction of the lower limit value g min or the upper limit value g max of the gain and approaches the appropriate value of the gain g.
  • the gain g is updated to a new value based on this index, the number of updates until the gain g converges to an appropriate value can be reduced.
  • the first gain updating unit 310 and the second gain updating unit 314 obtain at least one of the likelihood index of the lower limit value g min of the gain and the likelihood index of the upper limit value g max of the gain. Te, gave a plausible greater weight to more of the upper limit value g max of the lower limit value g min and the gain of the gain, the lower limit value g min and the gain of the gain the weighted average of the upper limit value g max, the gain g New values were used. However, the first gain updating unit 310 and the second gain updating unit 314 gave a larger weight to the plausible one of the lower limit value g min and the upper limit value g max of the gain without obtaining the plausibility index.
  • the weighted average of the lower limit value g min of the gain and the upper limit value g max of the gain may be a new value of the gain g.
  • the first gain updating unit 310 and the second gain updating unit 314 obtain the upper limit setting consumption bit number c U and the lower limit setting consumption bit number c L without obtaining either the index w or (1-w). Based on the distribution bit number B, Or May be obtained as a new value of the gain g.
  • the first gain update unit 310 and the second gain update unit 314 are configured to update the gain g based on the truncated number of samples Tr, the first gain update unit 310 Or May be obtained as a new value of the gain g.
  • ⁇ 1 takes a positive value of 1 or more when g min is more likely, that is, when (B ⁇ c U )> (c L ⁇ B), and g max
  • a positive value of 1 or less may be taken, and a larger value may be set as Bc U is larger.
  • ⁇ 1 may be a monotonically increasing function value for Bc U.
  • (G min + ⁇ 2 ⁇ g max ) / (1 + ⁇ 2 ) May be a new value of the gain g.
  • ⁇ 2 takes a positive value of 1 or more when g max is plausible, takes a positive value of 1 or less when g min is plausible, and c L ⁇ B is What is necessary is just to set so that it may take a large value, so that it is large.
  • ⁇ 2 may be a monotonically increasing function value for c L ⁇ B.
  • ⁇ 3 is a positive value greater than or equal to 1 and takes a monotonically increasing function value for B ⁇ c U
  • ⁇ 4 is a positive value greater than or equal to 1 and a monotone increasing function value for c L ⁇ B.
  • At least based weight to number distribution bits B and the lower limit set at the number of consumed bits c L and the upper limit set at the number of consumed bits c U, one at least of the lower limit value g min of the upper limit value g max and the gain of the gain may be used as the updated gain.
  • the gain lower limit setting unit 108, the gain upper limit setting unit 112, the first gain update unit 110, and the second gain update unit 114 of the first embodiment are described as being replaced.
  • the gain lower limit setting unit 108, the gain upper limit setting unit 112, the first gain update unit 110, and the second gain update unit 114 may be replaced with those described in the third embodiment, and [Background Art]
  • the gain lower limit setting unit 1008, the gain upper limit setting unit 1012, the first gain update unit 1010, and the second gain update unit 1014 of the encoding apparatus 1000 for TCX encoding described in the above are replaced with those described in the third embodiment. May be implemented.
  • the gain lower limit setting unit 108, the gain upper limit setting unit 112, the first gain update unit 110, and the second gain update unit 114 of the modified example of the first embodiment are replaced with those described in the third embodiment.
  • the gain lower limit setting unit 108, the gain upper limit setting unit 112, the first gain update unit 110, and the second gain update unit 114 of the modification of the second embodiment are described in the third embodiment. It may be implemented by replacing.
  • the gain before update is set as the lower limit value g min of the gain
  • the gain before updating is set as the upper limit value g max of the gain
  • the estimated number of bits is set as an upper limit set when the number of consumed bits c U, the smaller the number of allocation bits B and the lower limit set at the number of consumed bits c L and the upper limit set at the number of consumed bits c U
  • the encoding apparatus may include an input unit to which a keyboard or the like can be connected, an output unit to which a liquid crystal display or the like can be connected, a CPU (Central Processing Unit) [cache memory, or the like. ] RAM (Random Access Memory) and ROM (Read Only Memory), external storage devices that are hard disks, and these input units, output units, CPU, RAM, ROM, and exchange of data between external storage devices It has a bus that connects as much as possible. If necessary, the encoding device may be provided with a device (drive) that can read and write a storage medium such as a CD-ROM.
  • a device drive
  • the external storage device of the encoding device stores a program for executing encoding and data necessary for the processing of this program [not limited to the external storage device, for example, the program is read by a read-only storage device. It may be stored in a certain ROM. ]. Data obtained by the processing of these programs is appropriately stored in a RAM or an external storage device.
  • a storage device that stores data, addresses of storage areas, and the like is simply referred to as a “storage unit”.
  • the storage unit of the encoding device stores a program for executing encoding.
  • each program stored in the storage unit and data necessary for the processing of each program are read into the RAM as necessary, and interpreted and executed by the CPU.
  • the encoding is realized by the CPU realizing a predetermined function.
  • the present invention is not limited to the above-described embodiment, and can be modified as appropriate without departing from the spirit of the present invention.
  • the gain reduction update unit when the number of consumed bits is smaller than the number of allocated bits, the gain reduction update unit is processed, and when the number of consumed bits is equal to the number of allocated bits, the determination unit outputs a gain or the like. It was.
  • the processing of the gain reduction updating unit may be performed when the number of consumed bits is not greater than the number of allocated bits.
  • the processing described in the above embodiment may be executed not only in time series according to the order of description but also in parallel or individually as required by the processing capability of the device that executes the processing. .
  • the processing functions in the hardware entity (encoding device) described in the above embodiment are realized by a computer, the processing contents of the functions that the hardware entity should have are described by a program. Then, by executing this program on a computer, the processing functions in the hardware entity are realized on the computer.
  • the program describing the processing contents can be recorded on a computer-readable recording medium.
  • a computer-readable recording medium is a non-transitory recording medium.
  • the computer-readable recording medium for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
  • a magnetic recording device a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only) Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto-Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.
  • this program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
  • a computer that executes such a program first stores a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device.
  • the computer reads a program stored in its own recording medium and executes a process according to the read program.
  • the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer.
  • the processing according to the received program may be executed sequentially.
  • the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good.
  • ASP Application Service Provider
  • the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
  • the hardware entity is configured by executing a predetermined program on the computer.
  • a predetermined program on the computer.
  • at least a part of these processing contents may be realized in hardware.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

 所定の区間の入力音響信号に由来するサンプル列のサンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新し、得られた利得に対応する利得符号と、サンプル列の各サンプルを利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る。

Description

符号化方法、符号化装置、プログラム、および記録媒体
 本発明は、音響信号の符号化技術に関する。特に、音響信号に由来するサンプル列を利得で除算して得られる系列の符号化技術に関する。
 低ビット(例えば10kbit/s~20kbit/s程度)の音声信号や音響信号の符号化方法として、DFT(離散フーリエ変換)やMDCT(変形離散コサイン変換)などの直交変換係数に対する適応符号化が知られている。例えば非特許文献1の標準規格技術であるAMR-WB+(Extended Adaptive Multi-Rate Wideband)は、TCX(transform coded excitation:変換符号化励振)符号化モードを持つ。TCX符号化においては、フレームごとに与えられた総ビット数での符号化が行えるように、周波数領域の音響ディジタル信号系列をパワースペクトル包絡係数列によって正規化して得られる係数列について、係数列中の各係数を利得で除算して得られる系列を所定のビット数で符号化できるように利得を決定する。
<TCX符号化装置1000>
 従来のTCX符号化の符号化装置1000の構成例を図1に示す。以下、図1の各部について説明する。
<周波数領域変換部1001>
 周波数領域変換部1001は、所定の時間区間であるフレーム単位で、入力された音響ディジタル信号を周波数領域のN点のMDCT係数列X(1),・・・,X(N)に変換して出力する。ただし、Nは正整数である。
<パワースペクトル包絡係数列計算部1002>
 パワースペクトル包絡係数列計算部1002は、フレーム単位の音響ディジタル信号に対する線形予測分析を行って線形予測係数を求め、その線形予測係数を用いてN点の音響ディジタル信号のパワースペクトル包絡係数列W(1),・・・,W(N)を得て出力する。
<重み付け包絡正規化部1003>
 重み付け包絡正規化部1003は、パワースペクトル包絡係数列計算部1002が得たパワースペクトル包絡係数列を用いて、周波数領域変換部1001が得たMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)を出力する。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部1003は、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列XN(1),・・・,XN(N)は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
<初期化部1004>
 初期化部1004は、利得(グローバルゲイン)gの初期値を設定する。利得の初期値は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)のエネルギーと可変長符号化部1006が出力する符号に予め配分されたビット数などから決めることができる。以下、可変長符号化部1006が出力する符号に予め配分されたビット数を配分ビット数Bと呼ぶ。また、初期化部は、利得の更新回数の初期値として0を設定する。
<利得更新ループ処理部1130>
 利得更新ループ処理部1130は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を利得で除算して得られる系列を所定のビット数で符号化できるように利得を決定し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を決定した利得で除算して得られる系列を可変長符号化して得た整数信号符号と、決定した利得を符号化して得た利得符号と、を出力する。
 利得更新ループ処理部1130は、量子化部1005と、可変長符号化部1006と、判定部1007と、利得拡大更新部1131と、利得縮小更新部1132と、切り捨て部1016と、利得符号化部1017と、を有する。
<量子化部1005>
 量子化部1005は、重み付け正規化MDCT係数列XN(1),・・・,XN (N)の各係数を利得gで割り算して得られる値を量子化して、整数値による系列である量子化正規化済係数系列XQ(1),・・・,XQ(N)を得て出力する。
<可変長符号化部1006>
 可変長符号化部1006は、量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して符号を得て出力する。この符号を整数信号符号と呼ぶ。この可変長符号化には、例えば、量子化正規化済係数系列中の複数の係数を纏めて符号化する方法を用いる。また、可変長符号化部1006は、可変長符号化で得た整数信号符号のビット数を計測する。以下では、このビット数を消費ビット数cと呼ぶ。
<判定部1007>
 判定部1007は、利得の更新回数が予め定めた回数の場合は、利得、整数信号符号、消費ビット数cを出力する。
 利得の更新回数が予め定めた回数未満である場合は、可変長符号化部1006が計測した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部1131が、可変長符号化部1006が計測した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部1132が、次の処理を行うように制御する。なお、消費ビット数cと配分ビット数Bが等しいときは、今回の利得の値が最適な値であることを意味するので、利得、整数信号符号、消費ビット数cを出力する。
<利得拡大更新部1131>
 利得拡大更新部1131は、今回の利得gの値よりも大きな値g’>gを新たな利得として設定する。利得拡大更新部1131は、利得下限設定部1008と、第1分岐部1009と、第1利得更新部1010と、利得拡大部1011と、を有する。
<利得下限設定部1008>
 利得下限設定部1008は、今回の利得gの値を利得の下限値gminとして設定する(gmin←g)。この利得の下限値gminは、少なくとも利得の値はこれ以上であるべきことを意味する。
<第1分岐部1009>
 利得下限設定部1008で利得の下限値gminが設定された場合、第1分岐部1009は、利得の上限値gmaxが既に設定されている場合には第1利得更新部1010が、そうでない場合には利得拡大部1011が、次の処理を行うように制御する。
<第1利得更新部1010>
 第1利得更新部1010は、例えば、今回の利得gの値と利得の上限値gmaxの平均値を新たに利得gの値として設定する(g←(g+gmax)/2)。これは、最適な利得の値は、今回の利得gの値と利得の上限値gmaxとの間に存在するからである。今回の利得gの値は利得の下限値gminとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部1005の処理に戻る。
<利得拡大部1011>
 利得拡大部1011は、今回の利得gの値より大きな値を新たな利得gの値として設定する。例えば、今回の利得gの値に予め定めた値である利得変更量Δgを加算したものを新たな利得gの値として設定する(g←g+Δg)。また例えば、利得の上限値gmaxが設定されずに、消費ビット数cが配分ビット数Bより多い状態が複数回続いている場合には、予め定めた値より大きな値を利得変更量Δgとして用いる。その後、量子化部1005の処理に戻る。
<利得縮小更新部1132>
 利得縮小更新部1132は、今回の利得gの値よりも小さな値g’<gを新たな利得として設定する。利得縮小更新部1132は、利得上限設定部1012と、第2分岐部1013と、第2利得更新部1014と、利得縮小部1015と、を有する。
<利得上限設定部1012>
 利得上限設定部1012は、今回の利得gの値を利得の上限値gmaxと設定する(gmax←g)。この利得の上限値gmaxは、少なくとも利得の値はこれ以下であるべきことを意味する。
<第2分岐部1013>
 利得上限設定部1012で利得の上限値gmaxが設定された場合、第2分岐部1013は、利得の下限値gminが既に設定されている場合には第2利得更新部1014が、そうでない場合には利得縮小部1015が、次の処理を行うように制御する。
<第2利得更新部1014>
 第2利得更新部1014は、例えば、今回の利得gの値と利得の下限値gminの平均値を新たな利得gの値として設定する(g←(g+gmin)/2)。これは、最適な利得の値は、今回の利得gの値と利得の下限値gminとの間に存在するからである。今回の利得gの値は利得の上限値gmaxとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部1005の処理に戻る。
<利得縮小部1015>
 利得縮小部1015は、今回の利得gの値より小さな値を新たな利得gの値として設定する。例えば、今回の利得gの値から予め定めた値である利得変更量Δgを減算したものを新たな利得gの値として設定する(g←g-Δg)。また例えば、利得の下限値gminが設定されずに、消費ビット数cが配分ビット数Bより少ない状態が複数回続いている場合には、予め定めた値より大きな値を利得変更量Δgとして用いる。その後、量子化部1005の処理に戻る。
<切り捨て部1016>
 切り捨て部1016は、判定部1007が出力した消費ビット数cが配分ビット数Bより多い場合には、判定部1007が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、新たな整数信号符号として出力する。すなわち切り捨て部1016は、消費ビット数cの配分ビット数Bに対する上回り分c-Bに対応する高い周波数側の量子化正規化済係数に対応する符号を整数信号符号から取り除くことで得られる、残りの符号を、新たな整数信号符号として出力する。
<利得符号化部1017>
 判定部1007が出力した利得を所定のビット数で符号化して利得符号を得て、出力する。
3rd Generation Partnership Project (3GPP), Technical Specification (TS) 26.290, "Extended Adaptive Multi-Rate-Wideband (AMR-WB+) codec; Transcoding functions", Version 10.0.0 (2011-03)
 従来の符号化装置1000の利得拡大部1011では、利得gの値に所定の値である利得変更量Δgを加算したものを新たな利得gの値とすることで、固定的に利得の値を拡大していた。
 利得の上限値が設定されずに、利得拡大部1011の処理が複数回必要となる場合には利得の初期値がきわめて小さすぎた可能性があるので、利得変更量Δgを所定の値より大きくして、利得の上限値に到達できる確率を高めざるをえないが、これにより適正な利得を大幅に超えた値を新たな利得の値として設定してしまうこともあり、収束に回数がかかり、所定の回数で適切な利得の値を求められないことがあった。
 同様に、従来の符号化装置1000の利得縮小部1015では、利得gの値から所定の値である利得変更量Δgを減算したものを新たな利得gの値とすることで、固定的に利得の値を縮小していた。
 利得の下限値が設定されずに、利得縮小部1015の処理が複数回必要となる場合には利得の初期値がきわめて大きすぎた可能性があるので、利得変更量Δgを所定の値より大きくして、利得の下限値に到達できる確率を高めざるをえないが、これにより適正な利得を大幅に超えた値を新たな利得の値として設定してしまうこともあり、収束に回数がかかり、所定の回数で適切な利得の値を求められないことがあった。
 所定の回数で求まった利得の値が小さ過ぎる場合には、可変長符号化により得られた符号のビット数が配分ビットより大きいため、可変長符号化により得られた符号の一部しか整数信号符号とできず、高域の量子化正規化済係数に対応する符号が符号化装置から出力されず、復号装置にも伝えられないため、復号装置では高域の係数を0として復号信号を得なければならない等により、復号信号の歪が大きくなるという問題がある。所定の回数で求まった利得の値が大き過ぎる場合には、整数信号符号のビット数が配分ビットより少ないため、十分な音響信号の品質を得られない問題がある。
 所定の区間の入力音響信号に由来するサンプル列のサンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新し、得られた利得に対応する利得符号と、サンプル列の各サンプルを利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る。
 本発明の符号化によれば、利得の値の適切な値への収束を早めることにより、従来技術よりも可変長符号化により得られる符号のビット数を配分ビットに近づけることが可能となり、従来技術よりも高品質な符号化を行うことが可能となる。
従来の符号化装置の構成を例示したブロック図。 第1実施形態の符号化装置の構成を例示したブロック図。 第1実施形態の変形例の符号化装置の構成を例示したブロック図。 第2実施形態の符号化装置の構成を例示したブロック図。 第2実施形態の変形例の符号化装置の構成を例示したブロック図。 第3実施形態の符号化装置の構成を例示したブロック図。
 図面を参照しながら本発明の実施形態を説明する。同一構成要素ないし同一処理には同一符号を割り当てて重複説明を省略する場合がある。なお、各実施形態で扱う音響ディジタル信号(入力音響信号)は、音声や楽音などの音響信号がディジタル化された信号である。各実施形態では、入力される音響ディジタル信号が所定の時間区間の時間領域信号であり、音響ディジタル信号を周波数領域信号に変換し、さらにパワースペクトル包絡係数列を用いて当該周波数領域信号を正規化して得られる列が、符号化対象のサンプル列(入力音響信号に由来するサンプル列)であることを想定している。しかしながら、入力された音響ディジタル信号が所定の時間区間の時間領域信号であり、当該音響ディジタル信号そのものが符号化対象のサンプル列であってもよいし、当該音響ディジタル信号に対して線形予測分析を行って得られた残差信号が符号化対象のサンプル列であってもよいし、当該音響ディジタル信号から変換された周波数領域信号が符号化対象のサンプル列であってもよい。或いは、入力された音響ディジタル信号が所定の区間の周波数領域信号(所定の時間区間に対応する周波数領域信号、または当該周波数領域信号の所定の周波数区間の周波数領域信号)であり、当該音響ディジタル信号そのものが符号化対象のサンプル列であってもよいし、当該音響ディジタル信号から変換された時間領域信号が符号化対象のサンプル列であってもよいし、その時間領域信号に対して線形予測分析を行って得られた残差信号が符号化対象のサンプル列であってもよい。すなわち、入力される音響ディジタル信号は、時間領域信号でも周波数領域信号でもよく、符号化処理の対象のサンプル列も、時間領域信号でも周波数領域信号でもよい。また、時間領域信号から周波数領域信号への変換方法、および周波数域信号から時間領域信号への変換方法に限定はなく、例えばMDCT(Modified Discrete Cosine Transform)やDCT(Discrete Cosine Transform)、およびそれらの逆変換などを用いることができる。
 上述の想定に基づき、各実施形態では、符号化装置が周波数領域変換部、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部を有し、重み付け包絡正規化部で得られたサンプル列が量子化部に入力される例を示す。しかしながら、入力された音響ディジタル信号そのものを符号化対象のサンプル列とする場合には、例えば、周波数領域変換部、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部が省略され、音響ディジタル信号のサンプル列がそのまま量子化部に入力される。入力された時間領域信号である音響ディジタル信号に対して線形予測分析を行って得られた残差信号を符号化対象のサンプル列とする場合には、例えば、符号化装置が、周波数領域変換部、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部に代えて、音響ディジタル信号を入力として線形予測係数またはそれらに変換可能な係数を得る線形予測部、および当該線形予測係数に対応する線形予測フィルタと音響ディジタル信号とから予測残差を得る残差計算部を有し、当該残差信号のサンプル列が量子化部に入力される。入力された時間領域信号である音響ディジタル信号から変換された周波数領域信号を符号化対象のサンプル列とする場合には、例えば、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部が省略され、周波数領域変換部で得られた周波数領域信号のサンプル列が量子化部に入力される。入力された周波数領域信号である音響ディジタル信号から変換された時間領域信号を符号化対象のサンプル列とする場合には、例えば、符号化装置が、周波数領域変換部、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部に代えて、音響ディジタル信号を時間領域信号に変換する時間領域変換部を有し、当該時間領域信号のサンプル列が量子化部に入力される。入力された周波数領域信号である音響ディジタル信号から変換された時間領域信号に対して線形予測分析をして得られた残差信号を符号化対象のサンプル列とする場合には、例えば、符号化装置が、周波数領域変換部、パワースペクトル包絡係数列計算部、および重み付け包絡正規化部に代えて、時間領域変換部、線形予測部、および残差計算部を有し、残差計算部で得られた残差信号のサンプル列が量子化部に入力される。
[第1実施形態]
<符号化装置100>
 図2を参照して第1実施形態の符号化装置100が行う符号化処理を説明する。
<周波数領域変換部101>
 周波数領域変換部101は、所定の時間区間であるフレーム単位で、入力された音響ディジタル信号(入力音響信号)を周波数領域のN点のMDCT係数列X(1),・・・,X(N)に変換して出力する。ただし、Nは正整数である。
<パワースペクトル包絡係数列計算部102>
 パワースペクトル包絡係数列計算部102は、フレーム単位の音響ディジタル信号に対する線形予測分析を行って線形予測係数を求め、その線形予測係数を用いてN点の音響ディジタル信号のパワースペクトル包絡係数列W(1),・・・,W(N)を得て出力する。
<重み付け包絡正規化部103>
 重み付け包絡正規化部103は、パワースペクトル包絡係数列計算部102が得たパワースペクトル包絡係数列を用いて、周波数領域変換部101が得たMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)を出力する。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部103は、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列XN(1),・・・,XN(N)は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
[重み付け包絡正規化処理の具体例]
 N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により(ただしpは正整数)、時刻tの時間信号x(t)は、p時点まで遡った過去の自分自身の値x(t-1),・・・,x(t-p)と予測残差e(t)と線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
Figure JPOXMLDOC01-appb-M000021
 線形予測係数は、周波数領域変換部101に入力された音響ディジタル信号を重み付け包絡正規化部103によって線形予測分析して得られたものでもよいし、符号化装置100内に在る図示しない他の手段によって音響ディジタル信号を線形予測分析して得られたものであってもよい。このような場合には、重み付け包絡正規化部103が線形予測係数を用いてパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を求める。また、符号化装置100内に在る他の手段(パワースペクトル包絡係数列計算部102など)によってパワースペクトル包絡係数列の各係数W(1),・・・,W(N)が既に得られている場合には、重み付け包絡正規化部103は、このパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を用いることができる。なお、復号装置でも符号化装置100で得られた値と同じ値を得る必要があるため、量子化された線形予測係数および/またはパワースペクトル包絡係数列が利用される。以後の説明において、特に断りが無い限り、「線形予測係数」ないし「パワースペクトル包絡係数列」は量子化された線形予測係数ないしパワースペクトル包絡係数列を意味する。また、線形予測係数は例えば従来的な符号化技術によって符号化されて予測係数符号が復号側へ伝送される。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を予測係数符号とする符号化技術、などである。符号化装置100内に在る他の手段によってパワースペクトル包絡係数列が得られる構成である場合は、符号化装置100内に在る他の手段において線形予測係数が従来的な符号化技術によって符号化されて予測係数符号が復号側へ伝送される。
 ここでは、重み付け包絡正規化処理の具体例として二つの例を示すが、本発明ではこれらの例に限定されるものではない。
<例1>
 重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値Wγ(1),・・・,Wγ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/Wγ(1),・・・,X(N)/Wγ(N)を得る処理を行う。補正値Wγ(n)[1≦n≦N]は式(3)で与えられる。但し、γは1以下の正の定数であり、パワースペクトル係数を鈍らせる定数である。
Figure JPOXMLDOC01-appb-M000022
<例2>
 重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)β,・・・,X(N)/W(N)βを得る処理を行う。
 この結果、フレーム単位の重み付け正規化MDCT係数列が得られるが、重み付け正規化MDCT係数列は入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、入力されたMDCT係数列のパワースペクトル包絡と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。
 なお、重み付け包絡正規化処理に対応する逆処理、つまり、重み付け正規化MDCT係数列からMDCT係数列を復元する処理が復号側にて行われるため、パワースペクトル包絡係数列から重み付けパワースペクトル包絡係数列を算出する方法を符号化側と復号側で共通の設定にしておくことが必要である。
<初期化部104>
 初期化部104は、利得(グローバルゲイン)gの初期値を設定する。利得の初期値は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)のエネルギーと可変長符号化部106が出力する符号に予め配分されたビット数などから決めることができる。また、利得gの初期値は正値である。以下、可変長符号化部106が出力する符号に予め配分されたビット数を配分ビット数Bと呼ぶ。また、初期化部は、利得の更新回数の初期値として0を設定する。
<利得更新ループ処理部130>
 利得更新ループ処理部130は、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を利得で除算して得られる系列(整数値サンプルによる列)を所定のビット数で符号化できるように利得を決定し、重み付け正規化MDCT係数列XN(1),・・・,XN(N)中の各係数を決定した利得で除算して得られる系列(整数値サンプルによる列)を可変長符号化して得た整数信号符号と、決定した利得を符号化して得た利得符号(利得に対応する利得符号)と、を出力する。利得更新ループ処理部130は、上記の整数値サンプルによる列を符号化して得られる符号のビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新する。
 利得更新ループ処理部130は、量子化部105と、可変長符号化部106と、判定部107と、利得拡大更新部131と、利得縮小更新部132と、切り捨て部116と、利得符号化部117と、を含む。
<量子化部105>
 量子化部105は、入力された重み付け正規化MDCT係数列XN(1),・・・,XN (N)(所定の区間の入力音響信号に由来するサンプル列)の各係数(各サンプル)を利得gで割り算して得られる値を量子化して、整数値(量子化正規化済サンプル)による系列である量子化正規化済係数系列XQ(1),・・・,XQ(N)を得て出力する。
 また量子化部105は、最も低い周波数側にある量子化正規化済係数から、値が0ではない最も高い周波数側にある量子化正規化済係数までの、サンプル数sを計数し、このサンプル数sを出力する。
<可変長符号化部106>
 可変長符号化部106は、入力された量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して符号(サンプル列符号)を得て出力する。この符号を整数信号符号と呼ぶ。この可変長符号化には、例えば、量子化正規化済係数系列中の複数の係数を纏めて符号化する方法を用いる。また、可変長符号化部106は、可変長符号化で得た整数信号符号のビット数を計測する。本形態では、このビット数を消費ビット数cと呼ぶ。
<判定部107>
 判定部107は、利得の更新回数が予め定めた回数の場合は、利得g、整数信号符号、消費ビット数cを出力する。
 利得の更新回数が予め定めた回数未満である場合は、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部131が、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、次の処理を行うように制御する。なお、可変長符号化部106が計測した消費ビット数cが配分ビット数Bと等しい場合は、判定部107は、利得g、整数信号符号、消費ビット数cを出力する。
<利得拡大更新部131>
 利得拡大更新部131は、今回の利得gの値よりも大きな値g’>gを新たな利得として設定する。利得拡大更新部131は、サンプル数計測部118と、利得下限設定部108と、第1分岐部109と、第1利得更新部110と、第1利得更新部110と、利得拡大部111と、を含む。
<サンプル数計測部118>
 サンプル数計測部118は、消費ビット数cが配分ビット数Bより多い場合には、判定部107が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回らないように、高い周波数側の量子化正規化済係数に対応する符号を取り除いた符号に対応する量子化正規化済係数のサンプル数tを出力する。
 つまり、サンプル数計測部118は、消費ビット数cの配分ビット数Bに対する上回り分c-Bに対応する符号(切り捨て符号)に対応する高い周波数側の量子化正規化済係数を、量子化部105が出力した量子化正規化済係数系列から取り除いた残りである、対応する符号が取り除かれなかった量子化正規化済係数のサンプル数tを出力する。切り捨て符号の例は、最も高い周波数を含む領域内の1個以上の量子化正規化済係数に対応する符号のうち、ビット数がc-B以上かつ最小の符号である。言い換えれば、低い周波数側の量子化正規化済係数のみを符号化対象とし、残りの高い周波数側の量子化正規化済係数を符号化対象としないことにより、対応する可変長符号の長さが配分ビット数B以下かつ最大となるときの、符号化対象とする量子化正規化済係数のサンプル数がtである。
<利得下限設定部108>
 消費ビット数cが配分ビット数Bより多い場合には、さらに利得下限設定部108が、今回の利得gの値(当該消費ビット数cに対応する利得g)を利得の下限値gminとして設定する(gmin←g)。この利得の下限値gminは、少なくとも利得の値はこれ以上であるべきことを意味する。
<第1分岐部109>
 利得下限設定部108で利得の下限値gminが設定された場合、第1分岐部109は、利得の上限値gmaxが既に設定されている場合には第1利得更新部110が、そうでない場合には利得拡大部111が、次の処理を行うように制御する。
<第1利得更新部110>
 第1利得更新部110は、今回の利得gの値(消費ビット数cに対応する利得g)と利得の上限値gmaxとの間の値を、利得gの新たな値とする。これは、最適な利得の値は、今回の利得gの値と利得の上限値gmaxとの間に存在するからである。第1利得更新部110は、例えば、今回の利得gの値と利得の上限値gmaxの平均値を新たに利得gとして設定する(g←(g+gmax)/2)。今回の利得gの値は利得の下限値gminとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部105の処理に戻る。
<利得拡大部111>
 利得拡大部111は、最も低い周波数側にある量子化正規化済係数から値が0ではない最も高い周波数側にある量子化正規化済係数までのサンプル数sから、サンプル数計測部118が出力したサンプル数tを減算して得られる値u=s-t、が大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。例えば、新たな利得g←今回の利得g×(1+u/N×α)とする。ここで、αは予め定めた正の定数とする。
 または、利得拡大部111は、符号化対象のすべてのサンプル数Nから、サンプル数計測部118が出力したサンプル数tを減算して得られるv=N-tが大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。たとえば、新たな利得g←今回の利得g×(1+v/N×α)とする。
 すなわち利得拡大部111は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の対応する符号が取り除かれなかった量子化正規化済係数のサンプル数、を減算して得られる値が大きいほど、利得gの値を大きく増加させる。その後、量子化部105の処理に戻る。言い換えると、利得拡大部111は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の対応する符号が取り除かれなかった量子化正規化済係数のサンプル数、を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように利得の値を更新し、その後の量子化部105の処理を行わせる。
<利得縮小更新部132>
 利得縮小更新部132は、今回の利得gの値よりも小さな値g’<gを新たな利得として設定する。利得縮小更新部132は、利得上限設定部112と、第2分岐部113と、第2利得更新部114と、利得縮小部115と、を含む。
<利得上限設定部112>
 消費ビット数cが配分ビット数Bよりも少ない場合には、利得上限設定部112が、今回の利得gの値(当該消費ビット数cに対応する利得gの値)を利得の上限値gmaxと設定する(gmax←g)。この利得の上限値gmaxは、少なくとも利得の値はこれ以下であるべきことを意味する。
<第2分岐部113>
 利得上限設定部112で利得の上限値gmaxが設定された場合、第2分岐部113は、利得の下限値gminが既に設定されている場合には第2利得更新部114が、そうでない場合には利得縮小部115が、次の処理を行うように制御する。
<第2利得更新部114>
 第2利得更新部114は、今回の利得gの値(消費ビット数cに対応する利得gの値)と、利得の下限値gminとの間の値を、利得gの新たな値とする。これは、最適な利得の値は、今回の利得gの値と利得の下限値gminとの間に存在するからである。第2利得更新部114は、例えば、今回の利得gの値と利得の下限値gminの平均値を新たな利得gの値として設定する(g←(g+gmin)/2)。今回の利得gの値は利得の上限値gmaxとして設定されているので、利得の上限値gmaxと利得の下限値gminの平均値を新たに利得gの値として設定するとも言える(g←(gmax+gmin)/2)。その後、量子化部105の処理に戻る。
<利得縮小部115>
 利得縮小部115は、配分ビット数Bから消費ビット数cを減算して得られる値である余剰ビット数B-cが大きいほど、今回の利得gの値から新たな利得gの値への減少分が大きくなるようにする。ただし、新たな利得gの値も正値である。例えば、新たな利得g←今回の利得g×(1-(B-c)/B×β)とする。ここで、βは予め定めた正の定数とする。すなわち利得縮小部115は、配分ビット数Bから消費ビット数cを減算して得られる値B-cが大きいほど、利得gの値を大きく減少させる。その後、量子化部105の処理に戻る。言い換えると、利得縮小部115は、配分ビット数Bから消費ビット数cを減算して得られる値B-cが大きいほど、利得gの更新前の値から更新後の値への減少分が大きくなるように利得gの値を更新し、その後の量子化部115の処理を行わせる。
<切り捨て部116>
 切り捨て部116は、判定部107が出力した消費ビット数cが配分ビット数Bより多い場合には、判定部107が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、新たな整数信号符号として出力する。すなわち切り捨て部116は、消費ビット数cの配分ビット数Bに対する上回り分c-Bに対応する高い周波数側の量子化正規化済係数に対応する符号(切り捨て符号)を整数信号符号(サンプル列符号)から取り除くことで得られる、残りの符号(切り捨て済サンプル列符号)を、新たな整数信号符号として出力する。
<利得符号化部117>
 判定部107が出力した利得を所定のビット数で符号化して利得符号を得て、出力する。
[第1実施形態の変形例]
<符号化装置150>
 図3を参照して第1実施形態の変形例の符号化装置150が行う符号化処理を説明する。第1実施形態の変形例の符号化装置150が第1実施形態の符号化装置100と異なるのは、可変長符号化で得た整数信号符号のビット数に代えて、整数信号符号の推定ビット数を消費ビット数cとする点である。符号化装置150は、符号化装置100の利得更新ループ処理部130に代えて、利得更新ループ処理部190を備える。利得更新ループ処理部190は、利得更新ループ処理部130の可変長符号化部106、判定部107、利得拡大更新部131、および切り捨て部116に代えて、ビット数推定部156、判定部157、利得拡大更新部191、および可変長符号化部159を備える。利得拡大更新部191は、利得拡大更新部131の利得拡大部111、およびサンプル数計測部118に代えて、利得拡大部151、およびサンプル数計測部168を備える。
以下、第1実施形態との差分についてのみ説明する。
<ビット数推定部156>
 ビット数推定部156は、量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して得られる符号のビット数の推定値(推定ビット数)を求めて出力する。第1実施形態の変形例では、この推定ビット数を消費ビット数cと呼ぶ。
<判定部157>
 判定部157は、利得の更新回数が予め定めた回数の場合は、利得g、量子化正規化済係数系列XQ(1),・・・,XQ(N)を出力する。
 利得の更新回数が予め定めた回数未満である場合は、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部191が、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、次の処理を行うように制御する。なお、ビット数推定部156が推定した消費ビット数cが配分ビット数Bと等しい場合は、判定部157は、利得g、量子化正規化済係数系列XQ(1),・・・,XQ(N)を出力する。
<サンプル数計測部168>
 サンプル数計測部168は、消費ビット数cが配分ビット数Bより多い場合には、消費ビット数cの配分ビット数Bに対する上回り分c-Bに対応する符号(切り捨て符号)の対象となる高い周波数側の量子化正規化済係数を、量子化部105が出力した量子化正規化済係数系列XQ(1),・・・,XQ(N)から取り除いた残りの量子化正規化済係数のサンプル数tを出力する。
<利得拡大部151>
 利得拡大部151は、第1実施形態の利得拡大部111におけるサンプル数計測部118が出力したサンプル数tの代わりに、サンプル数計測部168が出力したサンプル数tを用いる点を除いては同じである。
 すなわち、利得拡大部151は、最も低い周波数側にある量子化正規化済係数から値が0ではない最も高い周波数側にある量子化正規化済係数までのサンプル数sから、サンプル数計測部118が出力したサンプル数tを減算して得られる値u=s-t、が大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。例えば、新たな利得g←今回の利得g×(1+u/N×α)とする。ここで、αは予め定めた正の定数とする。
 または、利得拡大部111は、符号化対象のすべてのサンプル数Nから、サンプル数計測部118が出力したサンプル数tを減算して得られるv=N-tが大きいほど、今回の利得から新たな利得への増分が大きくなるようにする。たとえば、新たな利得g←今回の利得g×(1+v/N×α)とする。
 すなわち利得拡大部111は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の対応する符号が取り除かれなかった量子化正規化済係数のサンプル数、を減算して得られる値が大きいほど、利得gの値を大きく増加させる。その後、量子化部105の処理に戻る。言い換えると、利得拡大部111は、量子化正規化済サンプル列の一部または全てのサンプル数から、上記の切り捨て符号の対象となる高い周波数側の量子化正規化済係数を量子化部105が出力した量子化正規化済係数系列XQ(1),・・・,XQ(N)から取り除いた残りの量子化正規化済係数のサンプル数t、を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように利得の値を更新し、その後の量子化部105の処理を行わせる。
<可変長符号化部159>
 可変長符号化部159は、判定部157から出力された量子化正規化済係数系列XQ(1),・・・,XQ(N)を可変長符号化して符号を得て、得られた符号を整数信号符号(サンプル列符号)として出力する。可変長符号化によって配分ビット数Bを超えるビット数の符号が得られる場合、可変長符号化部159は、可変長符号化により得られた符号のうち、配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、整数信号符号として出力する。
[第2実施形態]
<符号化装置200>
 図4を参照して第2実施形態の符号化装置200が行う符号化処理を説明する。第2実施形態の符号化装置200が第1実施形態の符号化装置100と異なるのは、利得更新ループ処理部130に代えて利得更新ループ処理部230を備え、利得更新ループ処理部230が、利得更新ループ処理部130の量子化部105、判定部107、利得拡大更新部131、および切り捨て部116に代えて、量子化部205、判定部207、利得拡大更新部231、および切り捨て部216を備える点、ならびに第1利得更新部110、第2利得更新部114、および利得縮小部115の処理の後、量子化部105の処理に戻ることに代えて、量子化部205の処理に戻る点である。利得拡大更新部231は、第1実施形態の利得拡大更新部131におけるサンプル数計測部118を含まず、利得下限設定部108と、第1分岐部109と、第1利得更新部110と、利得拡大部211と、から構成される。以下、第1実施形態との差分についてのみ説明する。
<量子化部205>
 量子化部205は、重み付け正規化MDCT係数列XN(1),・・・,XN(N) (所定の区間の入力音響信号に由来するサンプル列)の各係数(各サンプル)を利得gで割り算して得られる値を量子化して、整数値(量子化正規化済サンプル)による系列である量子化正規化済係数系列XQ(1),・・・,XQ(N)を得て出力する。
<判定部207>
 判定部207は、利得の更新回数が予め定めた回数の場合は、利得、整数信号符号、消費ビット数cを出力する。
 利得の更新回数が予め定めた回数未満である場合は、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部231が、可変長符号化部106が計測した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、第1実施形態で説明した処理を行うように制御する。なお、可変長符号化部106が計測した消費ビット数cが配分ビット数Bと等しい場合は、判定部207は、利得、整数信号符号、消費ビット数cを出力する。
<切り捨て部216>
 切り捨て部216は、判定部207が出力した消費ビット数cが配分ビット数Bより多い場合には、判定部207が出力した整数信号符号のうち、消費ビット数cが配分ビット数Bを上回る分だけの符号を、高い周波数側の量子化正規化済係数に対応する符号から取り除いたものを、新たな整数信号符号として出力する。すなわち切り捨て部216は、消費ビット数cの配分ビット数Bに対する上回り分c-Bに対応する高い周波数側の量子化正規化済係数に対応する符号(切り捨て符号)を整数信号符号(サンプル列符号)から取り除くことで得られる、残りの符号(切り捨て済サンプル列符号)を、新たな整数信号符号として出力する。
<利得拡大部211>
 利得拡大部211は、消費ビット数cから配分ビット数Bを減算して得られる値である不足ビット数c-Bが大きいほど、今回の利得から新たな利得への増加分が大きくなるようにする。たとえば、新たな利得g←今回の利得g×(1+(c-B)/B×α)とする。ここで、αは予め定めた正の定数とする。すなわち、消費ビット数cが配分ビット数Bよりも多く、なおかつ、利得の上限値gmaxが設定されていない場合、利得拡大部211が、消費ビット数cから配分ビット数Bを減算して得られる値c-Bが大きいほど、利得gの値を大きく増加させる。その後、量子化部205の処理に戻る。言い換えると、利得拡大部211は、消費ビット数cから配分ビット数Bを減算して得られる値c-Bが大きいほど、利得gの更新前の値から更新後の値への増分が大きくなるように利得gの値を更新し、その後の量子化部205の処理を行わせる。
[第2実施形態の変形例]
<符号化装置250>
 図5を参照して第2実施形態の変形例の符号化装置250が行う符号化処理を説明する。第2実施形態の変形例の符号化装置250が第2実施形態の符号化装置200と異なるのは、可変長符号化で得た整数信号符号のビット数に代えて、整数信号符号の推定ビット数を消費ビット数cとする点である。符号化装置250は、符号化装置200の利得更新ループ処理部230に代えて利得更新ループ処理部290を備え、利得更新ループ処理部290が利得更新ループ処理部230の可変長符号化部106、切り捨て部216、および判定部207に代えて、ビット数推定部156、可変長符号化部159、および判定部257を備える。以下、第2実施形態との差分についてのみ説明する。
<ビット数推定部156>
 ビット数推定部156は、第1実施形態の変形例と同じである。
<判定部257>
 判定部257は、利得の更新回数が予め定めた回数の場合は、利得、量子化正規化済係数系列、消費ビット数cを出力する。
 利得の更新回数が予め定めた回数未満である場合は、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより多い場合には利得拡大更新部231が、ビット数推定部156が推定した消費ビット数cが配分ビット数Bより少ない場合には利得縮小更新部132が、第1実施形態で説明した処理を行うように制御する。なお、ビット数推定部156が推定した消費ビット数cが配分ビット数Bと等しい場合は、判定部257は、利得、量子化正規化済係数系列、消費ビット数cを出力する。
<可変長符号化部159>
 可変長符号化部159は、第1実施形態の変形例と同じである。
[第3実施形態]
<符号化装置300>
 図6を参照して第3実施形態の符号化装置300が行う符号化処理を説明する。第3実施形態の符号化装置300が第1実施形態の符号化装置100と異なるのは、利得下限設定部108、第1利得更新部110、利得上限設定部112、および第2利得更新部114に代えて、利得下限設定部308、第1利得更新部310、利得上限設定部312、第2利得更新部314、および消費ビット数記憶部320を備える点である。利得拡大更新部331は、利得拡大更新部131の利得下限設定部108、第1利得更新部110に代えて、利得下限設定部308、第1利得更新部310を備える。利得縮小更新部332は、利得縮小更新部132の利得上限設定部112、第2利得更新部114に代えて、利得上限設定部312、第2利得更新部314を備える。利得拡大ループ処理部330は、利得拡大ループ処理部130の利得拡大更新部131と利得縮小更新部132に代えて、利得拡大更新部331と利得縮小更新部332を備える。以下、第1実施形態との差分についてのみ説明する。
<利得下限設定部308>
 利得下限設定部308は、今回の利得gの値を利得の下限値gminとして設定する(gmin←g)。また、利得下限設定部308は、消費ビット数cを下限設定時消費ビット数cとして消費ビット数記憶部320に記憶する。すなわち利得下限設定部308は、消費ビット数cが配分ビット数Bよりも多い場合に、第1実施形態の利得下限設定部108の処理に加え、さらに消費ビット数cを下限設定時消費ビット数cとして設定して消費ビット数記憶部320に記憶する。
<利得上限設定部312>
 利得上限設定部312は、今回の利得gの値を利得の上限値gmaxと設定する(gmax←g)。また、利得上限設定部312は、消費ビット数cを上限設定時消費ビット数cとして消費ビット数記憶部320に記憶する。すなわち利得上限設定部312は、消費ビット数cが配分ビット数Bよりも少ない場合に、第1実施形態の利得上限設定部112の処理に加え、さらに消費ビット数cを上限設定時消費ビット数cとして設定して消費ビット数記憶部320に記憶する。
<第1利得更新部310>
 消費ビット数cが配分ビット数Bよりも多く、なおかつ、利得の上限値gmaxが既に設定されている場合、第1利得更新部310は、配分ビット数Bと上限設定時消費ビット数cと下限設定時消費ビット数cとに基づき、利得の下限値gminのもっともらしさの指標と利得の上限値gmaxのもっともらしさの指標との少なくとも何れかを求める。なお、「もっともらしさの指標」とは、利得gの値としてのもっともらしさを表す指標を意味する。
[利得の下限値gminのもっともらしさの指標]
 第1利得更新部310は、例えば、利得の下限値gminの相対的もっともらしさを表す指標wを式Aにより求める。
w=(B-c)/(c-c) (式A)
式Aは、意味的には、配分ビット数Bと上限設定時消費ビット数cとの差、と下限設定時消費ビット数cと配分ビット数Bとの差に基づく式Bの右辺を変形したものである。
w=(B-c)/(B-c+c-B) (式B)
従って、式Aではなく式Bにより指標wを求めてもよい。
 式Aまたは式Bにより求まる指標wが大きいときには、利得の下限値gminのほうが利得gの値としてもっともらしく、指標wが小さいときには、利得の上限値gmaxのほうが利得gの値としてもっともらしいことになる。
[利得の上限値gmaxのもっともらしさの指標]
 利得の上限値gmaxの相対的もっともらしさは(1-w)である。
 すなわち、式Aまたは式Bにより指標wを求めることに代えて、利得の上限値gmaxのもっともらしさの指標(1-w)を式Cによって求めてもよい。
(1-w)=(c-B)/(c-c) (式C)
 式Cは、意味的には、配分ビット数Bと上限設定時消費ビット数cとの差B-c、と下限設定時消費ビット数cと配分ビット数Bとの差c-Bに基づく式Dの右辺を変形したものである。
1-w=(c-B)/(B-c+c-B) (式D)
 従って、式Cではなく式Dにより指標(1-w)を求めてもよい。
 式Aまたは式Bにより求まる指標(1-w)が大きいときには、利得の上限値gmaxのほうが利得gの値としてもっともらしく、指標(1-w)が小さいときには、利得の下限値gminのほうが利得gの値としてもっともらしいことになる。
 そして、第1利得更新部310は、利得の上限値gmaxと利得の下限値gminのうちもっともらしさの大きいほうの値に重きを置いた重みつき平均を新たな利得gの値として設定して出力する(g←gmin×w+gmax×(1-w))。すなわち、配分ビット数Bと上限設定時消費ビット数cの差が下限設定時消費ビット数cと配分ビット数Bの差より大きい場合には、利得の下限値gminのほうがもっともらしく、好ましい利得gの値に近いことになる。
 あるいは第1利得更新部310が、正の値である定数Cを使って、w=(B-c+C)/(c-c+2×C)として重みづけを緩和したものを指標wとして求めてもよい。なお、この場合は
(1-w)=(c-B+C)/(c-c+2×C)
となり、新たな利得gの値は利得の上限値gmaxと利得の下限値gminの算術平均値と消費ビット数と配分ビット数の差に基づく重みつき平均の中間となる。
 なお、サンプル数計測部118で切り捨て符号の対象となる量子化正規化済サンプルのサンプル数(切り捨てられたサンプル数Tr)が得られている場合には、下限設定時消費ビット数cと配分ビット数Bの差のかわりに、切り捨てられたサンプル数Trを用いることも可能である。下限設定時消費ビット数cと配分ビット数Bの差が大きいほど切り捨てられたサンプル数Trが大きいという性質があるためである。下限設定時消費ビット数cと配分ビット数Bの差と切り捨てられたサンプル数Trの対応関係をあらかじめ実験的にもとめておくことで、切り捨てられたサンプル数Trを下限設定時消費ビット数cと配分ビット数Bの差に近似的に換算すればよい。γは換算のために実験的に定める係数で(c-B)=γ×Trと置き換えるとw=(B-c)/(B-c+γ×Tr)とすることができる。同様に、正の値である定数Cを使ってw=(B-c+C)/(B-c+γ×Tr+2×C)として重みづけを緩和したものを指標wとすることもできる。すなわち、第1利得更新部310は、配分ビット数B、切り捨てられたサンプル数Tr、および上限設定時消費ビット数cを用い、利得の下限値のもっともらしさの指標と利得の上限値のもっともらしさの指標との少なくとも何れかを得てもよい。なお、直近のサンプル数計測部118の処理で得られた最も新しいサンプル数Trを用いることが望ましいが、より過去のサンプル数計測部118の処理で得られたサンプル数Trを用いてもよい。
 その後、量子化部105の処理に戻る。
<第2利得更新部314>
 消費ビット数cが配分ビット数Bよりも少なく、なおかつ、利得の下限値gminが既に設定されている場合に、第2利得更新部314は第1利得更新部310と同じ動作をする。
 上述した「もっともらしさの指標」は、利得の下限値gminまたは上限値gmaxのどちらの方向に、どのくらい利得gの値を動かせば、適切な利得gの値に近づくかを表す。本形態では、この指標に基づいて利得gの新たな値に更新するため、利得gが適切な値に収束するまでの更新回数を削減することができる。
 なお、本形態の第1利得更新部310および第2利得更新部314は、利得の下限値gminのもっともらしさの指標と利得の上限値gmaxのもっともらしさの指標との少なくとも何れかを得て、利得の下限値gminと利得の上限値gmaxのうちもっともらしいほうに大きな重みを与えた、利得の下限値gminと利得の上限値gmaxとの重みつき平均を、利得gの新たな値とした。しかしながら、第1利得更新部310および第2利得更新部314が、もっともらしさの指標を得ることなく、利得の下限値gminと利得の上限値gmaxのうちもっともらしいほうに大きな重みを与えた、利得の下限値gminと利得の上限値gmaxとの重みつき平均を、利得gの新たな値としてもよい。例えば、第1利得更新部310および第2利得更新部314が、指標wおよび(1-w)の何れも得ることなく、上限設定時消費ビット数cと下限設定時消費ビット数cと、配分ビット数Bとに基づき、
Figure JPOXMLDOC01-appb-M000023

あるいは、
Figure JPOXMLDOC01-appb-M000024

を利得gの新たな値として得てもよい。すなわち、配分ビット数Bと上限設定時消費ビット数cの差が大きいほど、利得の上限値gmaxのほうに大きな重みを与えた、または、下限設定時消費ビット数cと配分ビット数Bの差が大きいほど、利得の下限値gminのほうに大きな重みを与えた、利得の下限値gminと利得の上限値gmaxとの重みつき平均を、利得gの新たな値とすればよく、その処理過程に限定はない。
 あるいは、第1利得更新部310および第2利得更新部314が、切り捨てられたサンプル数Trに基づき利得gを更新する構成とする場合には、第1利得更新部310が、
Figure JPOXMLDOC01-appb-M000025

もしくは、
Figure JPOXMLDOC01-appb-M000026

を利得gの新たな値として得てもよい。
 また例えば、利得の下限値gminと利得の上限値gmaxの何れかに重みを与えた、利得の下限値gminと利得の上限値gmaxとの重みつき平均を、利得gの新たな値としても良い。例えば、
(ω×gmin+gmax)/(ω+1)
を利得gの新たな値としても良い。ここで、ωは、例えば、gminの方がもっともらしい場合、すなわち(B-c)>(c-B)の場合、に1以上の正の値を取り、gmaxの方がもっともらしい場合、すなわち(B-c)<(c-B)の場合、に1以下の正の値を取り、B-cが大きいほど大きな値を取るように設定すればよい。例えば、ωをB-cに関する単調増加関数値とすれば良い。あるいは、
(gmin+ω×gmax)/(1+ω
を利得gの新たな値としても良い。ここで、ωは、例えば、gmaxの方がもっともらしい場合に1以上の正の値を取り、gminの方がもっともらしい場合に1以下の正の値を取り、c-Bが大きいほど大きな値を取るように設定すればよい。例えば、ωを、c-Bに関する単調増加関数値とすれば良い。あるいは、ωを1以上の正の値であって、B-cに関する単調増加関数値を取るものとし、ωを1以上の正の値であってc-Bに関する単調増加関数値を取るものとして、gminの方がもっともらしい場合((B-c)>(c-B)の場合)に
(ω×gmin+gmax)/(ω+1)
を利得gの新たな値とし、gmaxの方がもっともらしい場合((B-c)<(c-B)の場合)に
(gmin+ω×gmax)/(1+ω
を利得gの新たな値としても良い。
 このように、配分ビット数Bと下限設定時消費ビット数cと上限設定時消費ビット数cとに少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得としてもよい。
[第3実施形態の変形例]
 上記の第3実施形態では第1実施形態の利得下限設定部108、利得上限設定部112、第1利得更新部110、第2利得更新部114を置き換えるものとして説明したが、第2実施形態の利得下限設定部108、利得上限設定部112、第1利得更新部110、第2利得更新部114を上記の第3実施形態で説明したものに置き換えて実施してもよいし、[背景技術]に記載したTCX符号化の符号化装置1000の利得下限設定部1008、利得上限設定部1012、第1利得更新部1010、第2利得更新部1014を上記の第3実施形態で説明したものに置き換えて実施してもよい。
 あるいは、第1実施形態の変形例の利得下限設定部108、利得上限設定部112、第1利得更新部110、第2利得更新部114を上記の第3実施形態で説明したものに置き換えて実施してもよいし、第2実施形態の変形例の利得下限設定部108、利得上限設定部112、第1利得更新部110、第2利得更新部114を上記の第3実施形態で説明したものに置き換えて実施してもよい。
 すなわち、サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、所定の配分ビット数Bより多い場合に、更新前の利得を利得の下限値gminとして設定し、ビット数または推定ビット数を下限設定時消費ビット数cとして設定し、サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、所定の配分ビット数Bより少ない場合に、更新前の利得を利得の上限値gmaxとして設定し、ビット数または推定ビット数を上限設定時消費ビット数cとして設定し、配分ビット数Bと下限設定時消費ビット数cと上限設定時消費ビット数cとに少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得とすればよい。
<符号化装置のハードウェア構成例>
 上述の実施形態に関わる符号化装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)、ハードディスクである外部記憶装置、およびこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置に、CD-ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
 符号化装置の外部記憶装置には、符号化を実行するためのプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている〔外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくなどでもよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。以下、データやその格納領域のアドレスなどを記憶する記憶装置を単に「記憶部」と呼ぶことにする。符号化装置の記憶部には、符号化を実行するためのプログラムなどが記憶されている。
 符号化装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能を実現することで符号化が実現される。
<補記>
 本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、上記の各実施形態では、消費ビット数が配分ビット数より少ない場合には利得縮小更新部の処理を行い、消費ビット数が配分ビット数と等しい場合に判定部が利得等を出力することとした。しかしながら、消費ビット数が配分ビット数より多くない場合に利得縮小更新部の処理を行ってもよい。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
 また、上記実施形態において説明したハードウェアエンティティ(符号化装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は非一時的な(non-transitory)記録媒体である。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
 また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
 このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
 また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
100,150,200,250,300,1000 符号化装置

Claims (28)

  1.    所定の区間の入力音響信号に由来するサンプル列の符号化方法であって、
       上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新する利得拡大縮小ステップを含んで、利得を得る利得更新ループ処理ステップと、
       上記利得更新ループ処理ステップにより得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号出力ステップと、
    を有する符号化方法。
  2.    所定の区間の入力音響信号に由来するサンプル列について、利得をループ処理により求める利得更新ループ処理ステップにより得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号化方法であって、
       上記利得更新ループ処理ステップは、
       上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより多い場合に、上記更新前の利得を利得の下限値gminとして設定し、上記ビット数または推定ビット数を下限設定時消費ビット数cとして設定する利得下限値設定ステップと、
       上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより少ない場合に、上記更新前の利得を利得の上限値gmaxとして設定し、上記ビット数または推定ビット数を上限設定時消費ビット数cとして設定する利得上限値設定ステップと、
       上記配分ビット数Bと下限設定時消費ビット数cと上限設定時消費ビット数cとに少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得とする利得更新ステップと、
    を含む符号化方法。
  3.    請求項2記載の符号化方法であって、
       上記利得更新ステップにおける重み付き平均は、
    Figure JPOXMLDOC01-appb-M000001

    もしくは、Cを所定の正の定数として、
    Figure JPOXMLDOC01-appb-M000002

    である符号化方法。
  4.    所定の区間の入力音響信号に由来するサンプル列の符号化方法であって、
       上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
       上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
       上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
       上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
       上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に利得縮小更新ステップを行わせる判定ステップと、
       を有し、
       上記利得拡大更新ステップは、
       上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号を上記サンプル列符号から取り除くことで得られる残りの切り捨て済サンプル列符号に対応する量子化正規化済サンプルのサンプル数T、を減算して得られる値A-Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
       を含み、
       上記利得縮小更新ステップは、
       上記消費ビット数が上記配分ビット数よりも少ない場合に上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
    を含む符号化方法。
  5.    所定の区間の入力音響信号に由来するサンプル列の符号化方法であって、
       上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
       上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
       上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
       上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
       上記利得の更新回数が予め定めた回数の場合は可変長符号化ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新ステップを行わせる判定ステップと、
       を有し、
       上記利得拡大更新ステップは、
       上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号の対象となる量子化正規化済サンプルを上記量子化正規化済サンプル列から取り除いた残りのサンプル数T、を減算して得られる値A-Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
       を含み、
       上記利得縮小更新ステップは、
       上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
    を含む符号化方法。
  6.    所定の区間の入力音響信号に由来するサンプル列の符号化方法であって、
       上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
       上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
       上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
       上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
       上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新ステップを行わせる判定ステップと、
       を有し、
       上記利得拡大更新ステップは、
      上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
       を含み、
       上記利得縮小更新ステップは、
       上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
    を含む符号化方法。
  7.    所定の区間の入力音響信号に由来するサンプル列の符号化方法であって、
       上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化ステップと、
       上記利得よりも大きな値を新たな利得として設定する利得拡大更新ステップと、
       上記利得よりも小さな値を新たな利得として設定する利得縮小更新ステップと、
       上記利得の更新回数が予め定めた回数の場合は可変長符号化ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新ステップを行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新ステップを行わせる判定ステップと、
       を有し、
       上記利得拡大更新ステップは、
       上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定ステップと、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得拡大ステップと、
       を含み、
       上記利得縮小更新ステップは、
       上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定ステップと、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化ステップを行わせる利得縮小ステップと、
       上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化ステップと、
    を含む符号化方法。
  8.    請求項4から7の何れかの符号化方法であって、
       上記利得下限値設定ステップは、上記消費ビット数が上記配分ビット数よりも多い場合に、さらに上記消費ビット数を下限設定時消費ビット数として設定するステップであり、
       上記利得上限値設定ステップは、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定するステップであり、
       上記利得拡大更新ステップは、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記下限設定時消費ビット数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新ステップ
       をさらに含み、
       上記利得縮小更新ステップは、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記下限設定時消費ビット数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  9.    請求項4から7の何れかの符号化方法であって、
       上記利得下限値設定ステップは、上記消費ビット数が上記配分ビット数よりも多い場合に、さらに上記消費ビット数を下限設定時消費ビット数として設定するステップであり、
       上記利得上限値設定ステップは、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定するステップであり、
       上記利得拡大更新ステップは、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記下限設定時消費ビット数c、上記上限設定時消費ビット数c、上記利得の下限値gmin、および上記利得の上限値gmaxについての
    Figure JPOXMLDOC01-appb-M000003

    を、上記利得の新たな値とする第1利得更新ステップ
       をさらに含み、
       上記利得縮小更新ステップは、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure JPOXMLDOC01-appb-M000004

    を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  10.    請求項4から7の何れかの符号化方法であって、
       上記利得下限値設定ステップは、上記消費ビット数が上記配分ビット数よりも多い場合に、さらに上記消費ビット数を下限設定時消費ビット数として設定するステップであり、
       上記利得上限値設定ステップは、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定するステップであり、
       上記利得拡大更新ステップは、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記下限設定時消費ビット数c、上記上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、および正の定数Cについての
    Figure JPOXMLDOC01-appb-M000005

    を、上記利得の新たな値とする第1利得更新ステップ
       をさらに含み、
       上記利得縮小更新ステップは、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure JPOXMLDOC01-appb-M000006

    を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  11.    請求項4または5の符号化方法であって、
       上記利得上限値設定ステップは、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定するステップであり、
       上記利得拡大更新ステップは、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新ステップ
       をさらに含み、
       上記利得縮小更新ステップは、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  12.    請求項4または5の符号化方法であって、
       上記利得上限値設定ステップは、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定するステップであり、
       上記利得拡大更新ステップは、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および上記上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、および係数γについての
    Figure JPOXMLDOC01-appb-M000007

    を、上記利得の新たな値とする第1利得更新ステップ
       をさらに含み、
       上記利得縮小更新ステップは、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure JPOXMLDOC01-appb-M000008

    を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  13.    請求項4または5の符号化方法であって、
       上記利得上限値設定ステップは、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定するステップであり、
       上記利得拡大更新ステップは、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および上記上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、係数γ、および正の定数Cについての
    Figure JPOXMLDOC01-appb-M000009

    を、上記利得の新たな値とする第1利得更新ステップ
       をさらに含み、
       上記利得縮小更新ステップは、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure JPOXMLDOC01-appb-M000010

    を、上記利得の新たな値とする第2利得更新ステップ
    をさらに含む符号化方法。
  14.    所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
       上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数と、所定の配分ビット数Bと、の差が大きいほど、更新前の利得と更新後の利得との差が大きくなるように利得の値を更新する利得拡大縮小部を含んで、利得を得る利得更新ループ処理部と、
       上記利得更新ループ処理部により得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号出力部と、
    を有する符号化装置。
  15.    所定の区間の入力音響信号に由来するサンプル列について、利得をループ処理により求める利得更新ループ処理部により得られた利得に対応する利得符号と、上記サンプル列の各サンプルを上記利得で除算して得られる整数値サンプルによる列を符号化して得られる整数信号符号とを得る符号化装置であって、
       上記利得更新ループ処理部は、
       上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより多い場合に、上記更新前の利得を利得の下限値gminとして設定し、上記ビット数または推定ビット数を下限設定時消費ビット数cとして設定する利得下限値設定部と、
       上記サンプル列の各サンプルを更新前の利得で除算して得られる整数値サンプルによる列を符号化して得られる符号のビット数または推定ビット数が、上記所定の配分ビット数Bより少ない場合に、上記更新前の利得を利得の上限値gmaxとして設定し、上記ビット数または推定ビット数を上限設定時消費ビット数cとして設定する利得上限値設定部と、
       上記配分ビット数Bと下限設定時消費ビット数cと上限設定時消費ビット数cとに少なくとも基づく重みを、利得の上限値gmaxと利得の下限値gminとの少なくとも何れかに与えた、利得の上限値と利得の下限値の重み付き平均を更新後の利得とする利得更新部と、
    を含む符号化装置。
  16.    請求項15記載の符号化装置であって、
       上記利得更新部における重み付き平均は、
    Figure JPOXMLDOC01-appb-M000011

    もしくは、Cを所定の正の定数として、
    Figure JPOXMLDOC01-appb-M000012

    である符号化装置。
  17.    所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
       上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
       上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
       上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
       上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
       上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に利得縮小更新部の処理を行わせる判定部と、
       を有し、
       上記利得拡大更新部は、
       上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号を上記サンプル列符号から取り除くことで得られる残りの切り捨て済サンプル列符号に対応する量子化正規化済サンプルのサンプル数T、を減算して得られる値A-Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
       を含み、
       上記利得縮小更新部は、
       上記消費ビット数が上記配分ビット数よりも少ない場合に上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
    を含む符号化装置。
  18.    所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
       上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
       上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
       上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
       上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
       上記利得の更新回数が予め定めた回数の場合は可変長符号化部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新部の処理を行わせる判定部と、
       を有し、
       上記利得拡大更新部は、
       上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記量子化正規化済サンプル列の一部または全てのサンプル数Aから、上記消費ビット数の上記配分ビット数に対する上回り分に対応する切り捨て符号の対象となる量子化正規化済サンプルを上記量子化正規化済サンプル列から取り除いた残りのサンプル数T、を減算して得られる値A-Tが大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
       を含み、
       上記利得縮小更新部は、
       上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
    を含む符号化装置。
  19.    所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
       上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
       上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
       上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
       上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
       上記利得の更新回数が予め定めた回数の場合は上記利得と上記サンプル列符号とを出力し、上記利得の更新回数が予め定めた回数未満かつ上記サンプル列符号のビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新部の処理を行わせる判定部と、
       を有し、
       上記利得拡大更新部は、
      上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
       を含み、
       上記利得縮小更新部は、
       上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
    を含む符号化装置。
  20.    所定の区間の入力音響信号に由来するサンプル列の符号化装置であって、
       上記サンプル列の各サンプルを利得で割り算して得られる値を量子化し、量子化正規化済サンプル列を得る量子化部と、
       上記利得よりも大きな値を新たな利得として設定する利得拡大更新部と、
       上記利得よりも小さな値を新たな利得として設定する利得縮小更新部と、
       上記利得の更新回数が予め定めた回数の場合は可変長符号化部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記量子化正規化済サンプル列に対応する符号の推定ビット数である消費ビット数が所定の配分ビット数よりも多い場合に上記利得拡大更新部の処理を行わせ、上記利得の更新回数が予め定めた回数未満かつ上記消費ビット数が上記配分ビット数よりも少ない場合に上記利得縮小更新部の処理を行わせる判定部と、
       を有し、
       上記利得拡大更新部は、
       上記消費ビット数が上記配分ビット数よりも多い場合に、上記消費ビット数に対応する利得の値を利得の下限値として設定する利得下限値設定部と、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が設定されていない場合に、上記消費ビット数から上記配分ビット数を減算して得られる値が大きいほど、利得の更新前の値から更新後の値への増分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得拡大部と、
       を含み、
       上記利得縮小更新部は、
       上記消費ビット数が上記配分ビット数よりも少ない場合に、上記消費ビット数に対応する利得の値を利得の上限値として設定する利得上限値設定部と、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が設定されていない場合に、上記配分ビット数から上記消費ビット数を減算して得られる値が大きいほど、上記利得の更新前の値から更新後の値への減少分が大きくなるように上記利得の値を更新し、上記量子化部の処理を行わせる利得縮小部と、
       上記量子化正規化済サンプル列を可変長符号化し、サンプル列符号を得る可変長符号化部と、
    を含む符号化装置。
  21.    請求項17から20の何れかの符号化装置であって、
       上記利得下限値設定部は、上記消費ビット数が上記配分ビット数よりも多い場合に、さらに上記消費ビット数を下限設定時消費ビット数として設定し、
       上記利得上限値設定部は、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定し、
       上記利得拡大更新部は、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記下限設定時消費ビット数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新部
       をさらに含み、
       上記利得縮小更新部は、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記下限設定時消費ビット数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  22.    請求項17から20の何れかの符号化装置であって、
       上記利得下限値設定部は、上記消費ビット数が上記配分ビット数よりも多い場合に、さらに上記消費ビット数を下限設定時消費ビット数として設定し、
       上記利得上限値設定部は、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定し、
       上記利得拡大更新部は、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記下限設定時消費ビット数c、上記上限設定時消費ビット数c、上記利得の下限値gmin、および上記利得の上限値gmaxについての
    Figure JPOXMLDOC01-appb-M000013

    を、上記利得の新たな値とする第1利得更新部
       をさらに含み、
       上記利得縮小更新部は、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure JPOXMLDOC01-appb-M000014

    を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  23.    請求項17から20の何れかの符号化装置であって、
       上記利得下限値設定部は、上記消費ビット数が上記配分ビット数よりも多い場合に、さらに上記消費ビット数を下限設定時消費ビット数として設定し、
       上記利得上限値設定部は、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定し、
       上記利得拡大更新部は、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記下限設定時消費ビット数c、上記上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、および正の定数Cについての
    Figure JPOXMLDOC01-appb-M000015

    を、上記利得の新たな値とする第1利得更新部
       をさらに含み、
       上記利得縮小更新部は、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure JPOXMLDOC01-appb-M000016

    を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  24.    請求項17または18の符号化装置であって、
       上記利得上限値設定部は、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定し、
       上記利得拡大更新部は、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および上記上限設定時消費ビット数を用い、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第1利得更新部
       をさらに含み、
       上記利得縮小更新部は、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、上記配分ビット数、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数、および上記上限設定時消費ビット数を用い、上記利得の下限値のもっともらしさの指標と上記利得の上限値のもっともらしさの指標との少なくとも何れかによって、上記利得の下限値と上記利得の上限値のうちもっともらしいほうに大きな重みを与えた、上記利得の下限値と上記利得の上限値との重みつき平均を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  25.    請求項17または18の符号化装置であって、
       上記利得上限値設定部は、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定し、
       上記利得拡大更新部は、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および上記上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、および係数γについての
    Figure JPOXMLDOC01-appb-M000017

    を、上記利得の新たな値とする第1利得更新部
       をさらに含み、
       上記利得縮小更新部は、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure JPOXMLDOC01-appb-M000018

    を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  26.    請求項17または18の符号化装置であって、
       上記利得上限値設定部は、上記消費ビット数が上記配分ビット数よりも少ない場合に、さらに上記消費ビット数を上限設定時消費ビット数として設定し、
       上記利得拡大更新部は、
       上記消費ビット数が上記配分ビット数よりも多く、なおかつ、上記利得の上限値が既に設定されている場合に、上記配分ビット数B、上記切り捨て符号に対応する量子化正規化済サンプルのサンプル数Tr、および上記上限設定時消費ビット数c、上記利得の下限値gmin、上記利得の上限値gmax、係数γ、および正の定数Cについての
    Figure JPOXMLDOC01-appb-M000019

    を、上記利得の新たな値とする第1利得更新部
       をさらに含み、
       上記利得縮小更新部は、
       上記消費ビット数が上記配分ビット数よりも少なく、なおかつ、上記利得の下限値が既に設定されている場合に、
    Figure JPOXMLDOC01-appb-M000020

    を、上記利得の新たな値とする第2利得更新部
    をさらに含む符号化装置。
  27.    請求項1から13の何れかの符号化方法の各ステップをコンピュータに実行させるためのプログラム。
  28.    請求項1から13の何れかの符号化方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
PCT/JP2013/064877 2012-05-30 2013-05-29 符号化方法、符号化装置、プログラム、および記録媒体 WO2013180164A1 (ja)

Priority Applications (13)

Application Number Priority Date Filing Date Title
KR1020177015496A KR101762205B1 (ko) 2012-05-30 2013-05-29 부호화 방법, 부호화 장치, 프로그램 및 기록 매체
KR1020167026537A KR101746697B1 (ko) 2012-05-30 2013-05-29 부호화 방법, 부호화 장치, 프로그램 및 기록 매체
KR1020147032029A KR101661917B1 (ko) 2012-05-30 2013-05-29 부호화 방법, 부호화 장치, 프로그램 및 기록 매체
KR1020177015504A KR101762210B1 (ko) 2012-05-30 2013-05-29 부호화 방법, 부호화 장치, 프로그램 및 기록 매체
EP19169511.3A EP3534367B1 (en) 2012-05-30 2013-05-29 Encoding method, encoder, program and recording medium
PL19169511T PL3534367T3 (pl) 2012-05-30 2013-05-29 Sposób kodowania, koder, program i nośnik rejestrujący
EP17175244.7A EP3236468B1 (en) 2012-05-30 2013-05-29 Encoding method, encoder, program and recording medium
EP13796771.7A EP2827328B1 (en) 2012-05-30 2013-05-29 Encoding method, encoder, program, and recording medium
US14/394,158 US9552821B2 (en) 2012-05-30 2013-05-29 Encoding method, encoder, program and recording medium
ES13796771.7T ES2661504T3 (es) 2012-05-30 2013-05-29 Método de codificación, codificador, programa y medio de grabación
JP2014518696A JP5872034B2 (ja) 2012-05-30 2013-05-29 符号化方法、符号化装置、プログラム、および記録媒体
CN201380026180.4A CN104321813B (zh) 2012-05-30 2013-05-29 编码方法、编码装置
PL17175244T PL3236468T3 (pl) 2012-05-30 2013-05-29 Sposób kodowania, koder, program i nośnik rejestrujący

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012-122785 2012-05-30
JP2012122785 2012-05-30

Publications (1)

Publication Number Publication Date
WO2013180164A1 true WO2013180164A1 (ja) 2013-12-05

Family

ID=49673352

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/064877 WO2013180164A1 (ja) 2012-05-30 2013-05-29 符号化方法、符号化装置、プログラム、および記録媒体

Country Status (8)

Country Link
US (1) US9552821B2 (ja)
EP (3) EP2827328B1 (ja)
JP (1) JP5872034B2 (ja)
KR (4) KR101746697B1 (ja)
CN (1) CN104321813B (ja)
ES (3) ES2661504T3 (ja)
PL (2) PL3534367T3 (ja)
WO (1) WO2013180164A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015146224A1 (ja) * 2014-03-24 2015-10-01 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102023138B1 (ko) * 2013-12-02 2019-09-19 후아웨이 테크놀러지 컴퍼니 리미티드 인코딩 방법 및 장치
CN104143335B (zh) * 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置
US10276186B2 (en) 2015-01-30 2019-04-30 Nippon Telegraph And Telephone Corporation Parameter determination device, method, program and recording medium for determining a parameter indicating a characteristic of sound signal
JP6780108B2 (ja) * 2017-06-07 2020-11-04 日本電信電話株式会社 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US20230121712A1 (en) * 2021-10-18 2023-04-20 S&P Global Inc. String Alignment with Translocation Insensitivity

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006145782A (ja) * 2004-11-18 2006-06-08 Canon Inc オーディオ信号符号化装置および方法
JP2007240823A (ja) * 2006-03-08 2007-09-20 Sharp Corp デジタルデータ復号化装置
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム
WO2012004998A1 (ja) * 2010-07-06 2012-01-12 パナソニック株式会社 スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6732071B2 (en) 2001-09-27 2004-05-04 Intel Corporation Method, apparatus, and system for efficient rate control in audio encoding
US7940839B2 (en) * 2004-01-26 2011-05-10 Diablo Technologies Inc. Fully adaptive equalization for high loss communications channels
US7292092B2 (en) * 2004-08-31 2007-11-06 Integration Associates Inc. Tunable poly-phase filter and method for calibration thereof
DE602004010509D1 (de) * 2004-09-03 2008-01-17 St Microelectronics Srl System und Verfahren zur Bildkodierung und zugehöriges Rechnerprogrammprodukt
KR100682890B1 (ko) 2004-09-08 2007-02-15 삼성전자주식회사 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치
US8374857B2 (en) * 2006-08-08 2013-02-12 Stmicroelectronics Asia Pacific Pte, Ltd. Estimating rate controlling parameters in perceptual audio encoders
JP5224666B2 (ja) * 2006-09-08 2013-07-03 株式会社東芝 オーディオ符号化装置
JP5434592B2 (ja) * 2007-06-27 2014-03-05 日本電気株式会社 オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
JP5264913B2 (ja) * 2007-09-11 2013-08-14 ヴォイスエイジ・コーポレーション 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置
US20150341158A1 (en) * 2014-05-23 2015-11-26 Mediatek Inc. Loop gain calibration apparatus for controlling loop gain of timing recovery loop and related loop gain calibration method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006145782A (ja) * 2004-11-18 2006-06-08 Canon Inc オーディオ信号符号化装置および方法
JP2007240823A (ja) * 2006-03-08 2007-09-20 Sharp Corp デジタルデータ復号化装置
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム
WO2012004998A1 (ja) * 2010-07-06 2012-01-12 パナソニック株式会社 スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"3RD GENERATION PARTNERSHIP PROJECT;TECHNICAL SPECIFICATION GROUP SERVICES AND SYSTEM ASPECTS; AUDIO CODEC PROCESSING FUNCTIONS;EXTENDED ADAPTIVE MULTI-RATE - WIDEBAND (AMR-WB+)CODEC; TRANSCODING FUNCTIONS (RELEASE 10)", 3GPP TS 26.290, VERSION 10.0.0, RELEASE 10 [ONLINE], April 2011 (2011-04-01), XP050477145, Retrieved from the Internet <URL:http://www.etsi.org/deliver/etsi_ts/126200_126299/126290/10.00.0060/ts126290v100000p.pdf> [retrieved on 20130813] *
MARINA BOSI ET AL.: "ISO/IEC MPEG-2 Advanced Audio Coding", JOURNAL OF THE AUDIO ENGINEERING SOCIETY, vol. 45, no. 10, October 1997 (1997-10-01), pages 789 - 814, XP002326353 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015146224A1 (ja) * 2014-03-24 2015-10-01 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
CN106133830A (zh) * 2014-03-24 2016-11-16 日本电信电话株式会社 编码方法、编码装置、程序以及记录介质
JPWO2015146224A1 (ja) * 2014-03-24 2017-04-13 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
EP3125242A4 (en) * 2014-03-24 2017-08-30 Nippon Telegraph and Telephone Corporation Coding method, coding device, program and recording medium
EP3385948A1 (en) * 2014-03-24 2018-10-10 Nippon Telegraph and Telephone Corporation Encoding method, encoder, program and recording medium
EP3413306A1 (en) * 2014-03-24 2018-12-12 Nippon Telegraph and Telephone Corporation Encoding method, encoder, program and recording medium

Also Published As

Publication number Publication date
JPWO2013180164A1 (ja) 2016-01-21
PL3236468T3 (pl) 2019-10-31
KR20160114200A (ko) 2016-10-04
ES2807241T3 (es) 2021-02-22
EP3236468B1 (en) 2019-05-29
KR20150003817A (ko) 2015-01-09
CN104321813B (zh) 2016-12-14
KR20170069294A (ko) 2017-06-20
ES2661504T3 (es) 2018-04-02
EP2827328B1 (en) 2018-01-03
JP5872034B2 (ja) 2016-03-01
PL3534367T3 (pl) 2020-10-05
EP3534367B1 (en) 2020-05-13
KR101762210B1 (ko) 2017-07-27
ES2742481T3 (es) 2020-02-14
US9552821B2 (en) 2017-01-24
CN104321813A (zh) 2015-01-28
KR101762205B1 (ko) 2017-07-27
EP3236468A1 (en) 2017-10-25
KR101746697B1 (ko) 2017-06-14
EP2827328A1 (en) 2015-01-21
US20150088529A1 (en) 2015-03-26
KR101661917B1 (ko) 2016-10-05
EP3534367A1 (en) 2019-09-04
KR20170068617A (ko) 2017-06-19
EP2827328A4 (en) 2016-04-13

Similar Documents

Publication Publication Date Title
JP5872034B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP5603484B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP5612698B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
WO2014054556A1 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP6595687B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP6979048B2 (ja) 低複雑度の調性適応音声信号量子化
JP2009069309A (ja) 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
US9838700B2 (en) Encoding apparatus, decoding apparatus, and method and program for the same
JP5663461B2 (ja) 符号化方法、符号化装置、プログラム、記録媒体
JP5336942B2 (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
EP3252758B1 (en) Encoding apparatus, decoding apparatus, and methods, programs and recording media for encoding apparatus and decoding apparatus
JP2011009868A (ja) 符号化方法、復号方法、符号化器、復号器およびプログラム
JP5579932B2 (ja) 符号化方法、装置、プログラム及び記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13796771

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014518696

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14394158

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2013796771

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 20147032029

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE