WO2013129439A1 - Encoding device, encoding method, program and recording medium - Google Patents

Encoding device, encoding method, program and recording medium Download PDF

Info

Publication number
WO2013129439A1
WO2013129439A1 PCT/JP2013/055048 JP2013055048W WO2013129439A1 WO 2013129439 A1 WO2013129439 A1 WO 2013129439A1 JP 2013055048 W JP2013055048 W JP 2013055048W WO 2013129439 A1 WO2013129439 A1 WO 2013129439A1
Authority
WO
WIPO (PCT)
Prior art keywords
gain
index
code
bits
sample
Prior art date
Application number
PCT/JP2013/055048
Other languages
French (fr)
Japanese (ja)
Inventor
守谷 健弘
優 鎌本
登 原田
弘和 亀岡
茂樹 嵯峨山
崇良 大嶋
小野 順貴
大輔 齋藤
Original Assignee
日本電信電話株式会社
国立大学法人東京大学
大学共同利用機関法人情報・システム研究機構
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社, 国立大学法人東京大学, 大学共同利用機関法人情報・システム研究機構 filed Critical 日本電信電話株式会社
Priority to JP2014502273A priority Critical patent/JP5789816B2/en
Publication of WO2013129439A1 publication Critical patent/WO2013129439A1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Definitions

  • Patent Document 1 discloses a technique for performing fixed-length or variable-length encoding and decoding in consideration of the continuity and frequency of gain values of periodic components.
  • the variable-length coding and decoding described in Patent Document 1 is intended to reduce the average code amount, and both the distortion and the code length of the index are taken into account when performing variable-length coding. Was not.
  • the problem of the present invention is that when the gain obtained by an encoding method such as CELP is encoded with reference to a codebook, it is more efficient considering both the length (information amount) and distortion of the code. It is to provide a good encoding device, this method, a program and a recording medium.
  • variable-length code that assigns a short code to a frequently occurring index in advance, and when selecting an index, the length of the index code is approximately converted to distortion.
  • An index with the most favorable balance between distortion and code length can be selected.
  • the functional block diagram of the example of an encoding apparatus The functional block diagram of the example of a decoding apparatus.
  • the encoding device 11 of the first embodiment includes a linear prediction analysis unit 111, an adaptive codebook 112, a fixed codebook 113, and a pitch analysis unit 114 (corresponding to an “adaptive codebook search unit”). , Search section 115 (corresponding to “fixed codebook search section”), perceptual weighting filter 116, synthesis filter 117, gain quantization section 118, and parameter encoding section 119.
  • the decoding device 12 includes an adaptive codebook 122, a fixed codebook 123, a fixed codebook selection unit 125, a synthesis filter 127, and a parameter decoding unit 129.
  • the encoding device 11 and the decoding device 12 are, for example, a program in a known computer or a dedicated computer having a CPU (central processing unit), a RAM (random-access memory), a ROM (read-only memory), etc. It is a special device constructed by reading data. Further, at least a part of the processing units of the encoding device 11 and the decoding device 12 may be configured by hardware such as an integrated circuit.
  • the input acoustic signals x (n) (n 0,..., L ⁇ 1, L), which are digitized and time-series signals divided in units of frames that are predetermined time intervals, An integer greater than or equal to 2 and each n is called a “sample point”).
  • the fixed codebook 113 includes a plurality of pulse sequences (“sample”) composed of one or more signals having a value composed of a combination of a non-zero unit pulse and its polarity and one or more signals having a zero value. Information for identifying the column) is stored. Fixed codebook 113 outputs a pulse sequence corresponding to input acoustic signal x (n) for each subframe into which one frame is divided under the control of search section 115.
  • an example is shown in which one frame is equally divided into four subframes. That is, a frame composed of L sample points 0,..., L ⁇ 1 is a first subframe (first frame ) composed of sample points L f (0) ,..., L f (1) ⁇ 1.
  • Pulse sequences c f1 , c f2 , c f3 , and c f4 corresponding to the first to fourth subframes are expressed as follows.
  • c f1 (c f1 (L f (0) ), ..., c f1 (L f (1) -1))
  • c f2 (c f2 (L f (1) ), ..., c f2 (L f (2) -1))
  • c f3 (c f3 (L f (2) ), ..., c f3 (L f (3) -1))
  • c f4 (c f4 (L f (3) ), ..., c f4 (L f (4) -1))
  • the pitch period is obtained by decoding the pitch code. Therefore, it is not essential for the pitch analysis unit 114 to output the pitch period.
  • the pitch period is not only expressed as an integer multiple of the sample point interval (integer precision), but is also expressed using an integer multiple of the sample point interval and a decimal value (fractional value) (decimal precision) There is also.
  • pitch analyzer 114 may obtain and output pitch gains g p1 , g p2 , g p3 , and g p4 for each subframe for use in search unit 115.
  • the adaptive codebook 112 stores excitation signals generated at each past time point.
  • the adaptive signal component v (n) is expressed using a pitch cycle with decimal precision, an interpolation filter that performs a weighted average operation on a plurality of excitation signals delayed according to the pitch cycle is used.
  • a code corresponding to a set of quantized pitch gain g p1 ⁇ and quantized fixed codebook gain g c1 ⁇ , and a set of quantized pitch gain g p2 ⁇ and quantized fixed codebook gain g c2 ⁇ A set corresponding to a set of code, quantized pitch gain g p3 ⁇ and quantized fixed codebook gain g c3 ⁇ , a set of quantized pitch gain g p4 ⁇ and quantized fixed codebook gain g c4 ⁇
  • the codes corresponding to are expressed as “gain codes GA f1 , GA f2 , GA f3 , GA f4 ”.
  • D g D 0 2 (-2g / N) ... (1)
  • D 0 distortion when the number of bits of the code per sample is 0.
  • the index value D U is not limited to the above, and a value obtained by adding or multiplying the distortion D and a coefficient that increases as the number of bits b of the index increases is used as the index value D U.
  • code value D U is the minimum need be searched.
  • Gain quantization section 118 performs variable length coding (for example, Huffman coding) on a set of quantized pitch gain candidates and quantized fixed codebook gain candidates to obtain an index that is a gain code.
  • a quantized fixed codebook gain candidate obtained from a function value of a quantized fixed codebook gain candidate May be ⁇ .
  • the number of samples included in the sample sequence Z, the number of samples included in the sample sequence Y, and the number of samples included in the combined signal sample sequence ⁇ Y + ⁇ Z are all N.
  • the synthesis filter 117 converts a sample ⁇ (n) at a certain sample point n into samples ⁇ (n) of P sample points n ⁇ 1, n ⁇ 2,..., NP past the sample point n.
  • the samples included in the sample string A are ⁇ (n ⁇ 1), ⁇ (n ⁇ 2),. P) is at least a part, and ⁇ (n) is a sample at the sample point n of the sample sequence C.
  • ⁇ (n ⁇ 1), ⁇ (n ⁇ 2),..., ⁇ (n ⁇ P) corresponds to a sample point in the past from the sample sequence A, for example, ⁇ (n ⁇ 1)
  • At least part of ⁇ (n ⁇ 2),..., ⁇ (n ⁇ P) is a sample included in a sample sequence before the sample sequence A.
  • gain quantization section 118 does not calculate the bit number b from the index. It can calculate the value D U. However, even without the number of bits b is stored in the gain codebook, the gain quantization unit 118 may calculate the index value D U by calculating the number of bits from the index. Therefore, it is not essential to store the bit number b of each index in the gain codebook.
  • variable length coding using the gain codebook illustrated in Table 1 and the index having the number of bits b is a gain code
  • the remainder is obtained by changing the uniform length coding to variable length coding (B ⁇ b)
  • the input sound signal can be further encoded using bits and distortion can be reduced.
  • Equation (11) can be changed from the uniform length code as a reference for selecting the gain codebook.
  • the long code has a smaller number of bits and is evaluated in terms of distortion.
  • the term (2log2) B / N in equation (11) is very small compared to 1. Therefore, there is no big difference between the index value D U approximate to the formula (10) and (11).
  • the index value D U of formula (14) can be adjusted magnitude of the number of bits of the gain code of each sub-frame.
  • w in the current time interval is set in advance.
  • the current time interval w is set to a predetermined value w This is possible by setting a value larger than zero .
  • linear prediction information LPC info pitch period codes CT 1 , CT 2 , CT 3 , CT 4 , code indexes C f1 , C f2 , C f3 , C f4 , and gain codes GA f1 , GA f2 , GA f3 , GA
  • the “excitation parameter” including f4 is input to the parameter encoding unit 119.
  • the parameter encoding unit 119 generates and outputs a bit stream BS (code) that is a code corresponding to the excitation parameter.
  • the fixed codebook 123 decodes the input code indexes C f1 , C f2 , C f3 , and C f4 based on the control of the fixed codebook selection unit 125, and the pulse sequences c f1 , c f2 , c f3 and c f4 are obtained and output.
  • the present invention can be applied to any coding that is obtained by multiplying a gain sample (hereinafter referred to as “quantized gain”) and a waveform sample sequence obtained by multiplying an input signal and obtaining a variable-length gain code of the input signal.
  • the input signal is, for example, a time series signal. Examples of input signals are acoustic signals, video signals, biological signals, seismic wave signals, sensor array signals, and the like.
  • the input signal may be a time domain signal or a frequency domain signal. That is, the encoding device includes a gain codebook in which a plurality of sets of quantized gain candidates or function values thereof and indexes are stored, and the plurality of indexes include those having different numbers of bits. cage, each time or frequency intervals may be obtained an index index value D U is the smallest as a gain code.
  • the waveform information code is a code that can specify a sample string by decoding the waveform information code.
  • the index value DU is a value that increases as the distortion D increases, and increases as the number of bits of an index corresponding to a quantized gain candidate for obtaining a waveform sample sequence increases.
  • the distortion D is a distortion between the waveform sample sequence obtained by multiplying the sample sequence corresponding to the waveform information code by the quantized gain candidates and the input signal, or the first to ⁇ ⁇ ( ⁇ Is obtained by multiplying each sample of the sample sequence corresponding to ⁇ th ( ⁇ is an integer not less than 1 and not more than ⁇ ) waveform information codes by the ⁇ th quantized gain candidates.
  • This is a distortion of the total waveform sample sequence obtained by adding the ⁇ th waveform sample sequence ( ⁇ waveform sample sequences) for each corresponding sample and the input signal.
  • the sample sequence corresponding to the waveform information code is obtained by, for example, passing the sample sequence itself obtained by decoding the waveform information code or the sample sequence obtained by decoding the waveform information code through the synthesis filter. It is.
  • the index value DU is a value obtained by adding or multiplying the distortion D and a coefficient that increases as the number of bits of the index increases.
  • An example of a coefficient that increases as the number of bits of the index increases is a power value having an exponent with a value that increases as the number of bits of the index increases.
  • Specific examples of the index value D U is like the above-mentioned formula (4) (5) (7) (10) (11).
  • the encoding apparatus 21 illustrated in FIG. 3 includes ⁇ waveform information codebooks 211-1,..., 211- ⁇ and an encoding unit 212.
  • is an integer of 1 or more
  • the encoding unit 212 includes a gain quantization unit 218.
  • sample string Y ⁇ corresponding to the waveform information code E ⁇ is a sample obtained by passing the sample string from the waveform information code book 211- ⁇ for the waveform information code E ⁇ through the synthesis filter corresponding to the input signal X. column and the sample sequence from the waveform information codebook 211-theta for waveform information code E theta and the like.
  • the quantized gain candidate ⁇ 1 in the gain quantizing unit 218 is the quantized fixed codebook gain candidate ⁇ in the gain quantizing unit 118
  • the quantized gain candidate in the gain quantizing unit 218 ⁇ 2 is a quantized pitch gain candidate ⁇ in the gain quantization unit 118
  • the waveform information code E 1 is the code index of the first embodiment
  • the waveform information code E 2 is the pitch code of the first embodiment.
  • the input signal X is the input acoustic signal of the first embodiment.
  • the decoding apparatus uses the waveform information codes E 1 ,..., E ⁇ and the gain code included in the input bit stream, and gains gain for each sample of the sample sequence Y ⁇ corresponding to the waveform information code E ⁇ for each time interval.
  • the sample sequence ⁇ 1 Y 1 +... + ⁇ ⁇ Y ⁇ is output for the sample sequence ⁇ ⁇ Y ⁇ obtained by multiplying the quantized gain candidate ⁇ ⁇ represented by the code.
  • index index value D U is the smallest as a gain code.
  • index index value D U is the smallest as a gain code
  • each plurality of sub-frame or frame to obtain an index index value D U is the smallest as a gain code Also good.
  • the program describing the processing contents can be recorded on a computer-readable recording medium.
  • a computer-readable recording medium is a non-transitory recording medium. Examples of such a recording medium are a magnetic recording device, an optical disk, a magneto-optical recording medium, a semiconductor memory, and the like.
  • This program is distributed, for example, by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

A gain codebook having a plurality of sets stored therein is stored in a gain quantization unit. The sets contain candidates for quantized pitch gains, candidates for quantized fixed codebook gains, and indexes. A plurality of indexes includes indexes with different numbers of bits. In selecting a code, the waveform distortion itself caused by gain quantization, and the distortion converted from the length of the corresponding code are both considered. In other words, in order to select a code, not only is the distortion of a waveform caused by the use of the code considered, but the code length assigned to the code is considered.

Description

符号化装置、この方法、プログラム及び記録媒体Encoding apparatus, method, program, and recording medium
 この発明は、音声、音楽等の音信号を符号化または復号する技術に関する。特に、CELP等の符号化技術で符号化された周期性成分の利得およびパルス性成分の利得を符号化または復号する技術に関する。 The present invention relates to a technique for encoding or decoding sound signals such as voice and music. In particular, the present invention relates to a technique for encoding or decoding a gain of a periodic component and a gain of a pulse component that are encoded by an encoding technique such as CELP.
 従来は、CELP(Code Excited Linear Prediction)の符号化および復号において用いられる周期性成分の利得およびパルス性成分の利得は、符号誤りに対する耐性を強くするために固定長ビットが割り当てられて符号化および復号されていた(例えば、非特許文献1参照)。パルス性成分の利得については、利得そのものではなく過去のサブフレームからの予測値に対する比を符号化の対象とすることにより、利得の値の時間的な連続性を考慮して符号量の削減を行っていた。 Conventionally, the gain of periodic components and the gain of pulse components used in encoding and decoding of CELP (Code (Excited Linear Prediction) are encoded with fixed-length bits assigned to increase the tolerance against code errors. It was decoded (for example, refer nonpatent literature 1). For the gain of the pulse component, the amount of code can be reduced in consideration of the temporal continuity of the gain value by using the ratio to the predicted value from the past subframe instead of the gain itself as the object of encoding. I was going.
 また、特許文献1では、周期性成分の利得から周期性成分の利得の値の時間的な連続性の有無を判定し、時間的な連続性があると予測された場合には周期性成分の利得の値の差分を可変長符号化することにより符号量の削減を行っていた。 Further, in Patent Document 1, it is determined whether or not there is temporal continuity of the gain value of the periodic component from the gain of the periodic component, and when it is predicted that there is temporal continuity, The amount of code is reduced by variable-length coding the difference between gain values.
WO2006/075605国際公開公報WO2006 / 075605 International Publication
 非特許文献1に記載された符号化方法および復号方法では、周期性成分の利得およびパルス性成分の利得については、固定長での符号化および復号が行われていた。
 しかしながら、非特許文献1に記載された符号化方法では、周期性成分の利得およびパルス性成分の利得の頻度に関する冗長性や周期性成分の利得の連続性について考慮することなく符号化および復号されており、符号化および復号の効率が良くないという問題があった。
In the encoding method and decoding method described in Non-Patent Document 1, encoding and decoding at a fixed length are performed for the gain of the periodic component and the gain of the pulse component.
However, in the encoding method described in Non-Patent Document 1, encoding and decoding are performed without considering redundancy regarding the frequency of the gain of the periodic component and the gain frequency of the pulse component and the continuity of the gain of the periodic component. Therefore, there is a problem that encoding and decoding efficiency is not good.
 特許文献1には、周期性成分の利得の値の連続性や頻度を考慮して固定長または可変長の符号化および復号を行う技術が開示されている。
 しかしながら、特許文献1に記載された可変長符号化および復号は、平均符号量を少なくすることを目的としたものであり、可変長符号化の際には歪みとインデックスの符号長の双方は考慮されていなかった。
Patent Document 1 discloses a technique for performing fixed-length or variable-length encoding and decoding in consideration of the continuity and frequency of gain values of periodic components.
However, the variable-length coding and decoding described in Patent Document 1 is intended to reduce the average code amount, and both the distortion and the code length of the index are taken into account when performing variable-length coding. Was not.
 この発明の課題は、CELPなどの符号化方式で得られた利得を、符号帳を参照して符号化する際に、符号の長さ(情報量)と歪みの双方を考慮した、より効率が良い符号化装置、この方法、プログラムおよび記録媒体を提供することである。 The problem of the present invention is that when the gain obtained by an encoding method such as CELP is encoded with reference to a codebook, it is more efficient considering both the length (information amount) and distortion of the code. It is to provide a good encoding device, this method, a program and a recording medium.
 符号化においては、利得に対応する符号帳の中から、最も好ましいインデックスを選択するが、この際にこの符号を使うことで生じる波形の歪みだけでなくこの符号に割り当てられた符号長を考慮する。 In encoding, the most preferable index is selected from the code book corresponding to the gain, and in this case, not only the waveform distortion caused by using this code but also the code length assigned to this code is considered. .
 利得のベクトル量子化のために、予め出現頻度の高いインデックスに短い符号を割り当てるような可変長符号を使い、インデックスを選択する際に、インデックスの符号の長さを歪みに近似的に換算して歪み尺度を変形し、その変形した歪み尺度を利用する。歪みと符号の長さで最も好ましいバランスのインデックスを選択できる。これにより、従来技術よりも小さな平均ビットレートでありながら、平均の波形歪みについては従来技術とほぼ同じにすることができる。また、節約できた平均のビット数を例えばパルス成分符号化に充当することで、従来の符号化方法に比べ、同じ平均ビットレートでありながら、波形歪みを小さくできる。 For vector quantization of gain, use a variable-length code that assigns a short code to a frequently occurring index in advance, and when selecting an index, the length of the index code is approximately converted to distortion. Deform the distortion scale and use the deformed distortion scale. An index with the most favorable balance between distortion and code length can be selected. Thereby, although the average bit rate is smaller than that of the conventional technique, the average waveform distortion can be made substantially the same as that of the conventional technique. Further, by allocating the average number of bits saved, for example, to pulse component encoding, waveform distortion can be reduced while maintaining the same average bit rate as compared with the conventional encoding method.
符号化装置の例の機能ブロック図。The functional block diagram of the example of an encoding apparatus. 復号装置の例の機能ブロック図。The functional block diagram of the example of a decoding apparatus. 符号化装置の例の機能ブロック図。The functional block diagram of the example of an encoding apparatus.
 以下、この発明の一実施形態について、詳細に説明する。 Hereinafter, an embodiment of the present invention will be described in detail.
 [第一実施形態]
 <構成>
 図1に例示するように、第一実施形態の符号化装置11は、線形予測分析部111、適応符号帳112、固定符号帳113、ピッチ分析部114(「適応符号帳探索部」に相当)、探索部115(「固定符号帳探索部」に相当)、聴覚重み付けフィルタ116、合成フィルタ117、利得量子化部118、およびパラメータ符号化部119を有する。
[First embodiment]
<Configuration>
As illustrated in FIG. 1, the encoding device 11 of the first embodiment includes a linear prediction analysis unit 111, an adaptive codebook 112, a fixed codebook 113, and a pitch analysis unit 114 (corresponding to an “adaptive codebook search unit”). , Search section 115 (corresponding to “fixed codebook search section”), perceptual weighting filter 116, synthesis filter 117, gain quantization section 118, and parameter encoding section 119.
 図2に例示するように、第一実施形態の復号装置12は、適応符号帳122、固定符号帳123、固定符号帳選択部125、合成フィルタ127、およびパラメータ復号部129を有する。 2, the decoding device 12 according to the first embodiment includes an adaptive codebook 122, a fixed codebook 123, a fixed codebook selection unit 125, a synthesis filter 127, and a parameter decoding unit 129.
 本形態の符号化装置11および復号装置12は、例えば、CPU(central processing unit)、RAM(random-access memory)、ROM(read-only memory)等を備えた公知のコンピュータまたは専用のコンピュータにプログラムやデータが読み込まれることで構成された特別な装置である。また、符号化装置11および復号装置12の処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。 The encoding device 11 and the decoding device 12 according to the present embodiment are, for example, a program in a known computer or a dedicated computer having a CPU (central processing unit), a RAM (random-access memory), a ROM (read-only memory), etc. It is a special device constructed by reading data. Further, at least a part of the processing units of the encoding device 11 and the decoding device 12 may be configured by hardware such as an integrated circuit.
 <符号化>
 符号化装置11には、デジタル化され、所定時間区間であるフレームの単位で区分された時系列信号である入力音響信号x(n)(n=0,...,L-1、Lは2以上の整数、各nを「サンプル点」と呼ぶ)が入力される。符号化装置11は、入力音響信号x(n)(n=0,...,L-1)を以下のようにフレームごとに符号化する。
<Encoding>
In the encoding device 11, the input acoustic signals x (n) (n = 0,..., L−1, L), which are digitized and time-series signals divided in units of frames that are predetermined time intervals, An integer greater than or equal to 2 and each n is called a “sample point”). The encoding device 11 encodes the input acoustic signal x (n) (n = 0,..., L−1) for each frame as follows.
 線形予測分析部111は、処理対象のフレーム(「現フレーム」と呼ぶ)に属する各サンプル点n=0,...,L-1での入力音響信号x(n)(n=0,...,L-1)の線形予測分析を行い、当該現フレームでの全極型の合成フィルタ117を特定するための係数の量子化値に対応する符号である線形予測情報LPC info(「予測パラメータ」に含まれる)を出力する。すなわち、線形予測分析部111は、フレームごとに、入力音響信号x(n)(n=0,...,L-1)に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報LPC infoを得て出力する。例えば、線形予測分析部111は、現フレームの入力音響信号x(n)(n=0,...,L-1)に対応する線形予測係数a(m)(m=1,...,P、Pは正の整数である線形予測次数)を算出し、線形予測係数a(m)(m=1,...,P)を線スペクトル対係数LSPに変換し、量子化した線スペクトル対係数LSPに対応する符号を線形予測情報LPC infoとして出力する。 The linear prediction analysis unit 111 inputs the input acoustic signal x (n) (n = 0,...) At each sample point n = 0,..., L−1 belonging to the processing target frame (referred to as “current frame”). .., L−1) is performed, and linear prediction information LPC info (“prediction”) is a code corresponding to the quantized value of the coefficient for specifying the all-pole synthesis filter 117 in the current frame. Included in "parameter". That is, the linear prediction analysis unit 111 uses, for each frame, a code that specifies a linear prediction coefficient corresponding to the input acoustic signal x (n) (n = 0,..., L−1) or a coefficient compatible therewith. Obtain and output some linear prediction information LPC info. For example, the linear prediction analysis unit 111 performs linear prediction coefficients a (m) (m = 1,...) Corresponding to the input sound signal x (n) (n = 0,..., L−1) of the current frame. , P, P are linear prediction orders that are positive integers), linear prediction coefficients a (m) (m = 1,..., P) are converted into line spectrum pair coefficients LSP, and quantized lines. A code corresponding to the spectrum pair coefficient LSP is output as linear prediction information LPC info.
 固定符号帳113には、零でない単位パルスとその極性との組み合わせからなる値を持つ1個以上の信号と零値を持つ1個以上の信号とから構成される複数個のパルス系列(「サンプル列」に相当)を特定するための情報が格納される。固定符号帳113は、探索部115の制御に従い、1フレームを区分したサブフレームごとに、入力音響信号x(n)に対応するパルス系列を出力する。ここでは1フレームが4個のサブフレームに等区分される例を示す。すなわち、L個のサンプル点0,...,L-1からなるフレームは、サンプル点Lf(0),...,Lf(1)-1からなる1番目のサブフレーム(第1サブフレーム)、サンプル点Lf(1),...,Lf(2)-1からなる2番目のサブフレーム(第2サブフレーム)、サンプル点Lf(2),...,Lf(3)-1からなる3番目のサブフレーム(第3サブフレーム)、およびサンプル点Lf(3),...,Lf(4)-1からなる4番目のサブフレーム(第4サブフレーム)に区分される。Lf(0),Lf(1),Lf(2),Lf(3),Lf(4)は、Lf(0)=0,Lf(4)=L,Lf(0)<Lf(1)<Lf(2)<Lf(3)<Lf(4)を満たす正整数である。第1-4サブフレームに対応するパルス系列cf1,cf2,cf3,cf4はそれぞれ以下のように表現される。
  cf1=(cf1(Lf(0)),...,cf1(Lf(1)-1))
  cf2=(cf2(Lf(1)),...,cf2(Lf(2)-1))
  cf3=(cf3(Lf(2)),...,cf3(Lf(3)-1))
  cf4=(cf4(Lf(3)),...,cf4(Lf(4)-1))
The fixed codebook 113 includes a plurality of pulse sequences (“sample”) composed of one or more signals having a value composed of a combination of a non-zero unit pulse and its polarity and one or more signals having a zero value. Information for identifying the column) is stored. Fixed codebook 113 outputs a pulse sequence corresponding to input acoustic signal x (n) for each subframe into which one frame is divided under the control of search section 115. Here, an example is shown in which one frame is equally divided into four subframes. That is, a frame composed of L sample points 0,..., L−1 is a first subframe (first frame ) composed of sample points L f (0) ,..., L f (1) −1. Sub-frame), sample points L f (1) ,..., L f (2) −1, the second sub-frame (second sub-frame), sample points L f (2) ,. The third subframe consisting of f (3) −1 (third subframe) and the fourth subframe consisting of sampling points L f (3) ,..., L f (4) −1 (fourth subframe ) Subframes). L f (0) , L f (1) , L f (2) , L f (3) , L f (4) are L f (0) = 0, L f (4) = L, L f ( 0) <L f (1) <L f (2) <L f (3) <L f (4) . Pulse sequences c f1 , c f2 , c f3 , and c f4 corresponding to the first to fourth subframes are expressed as follows.
c f1 = (c f1 (L f (0) ), ..., c f1 (L f (1) -1))
c f2 = (c f2 (L f (1) ), ..., c f2 (L f (2) -1))
c f3 = (c f3 (L f (2) ), ..., c f3 (L f (3) -1))
c f4 = (c f4 (L f (3) ), ..., c f4 (L f (4) -1))
 ピッチ分析部114は、サブフレームごとに、入力音響信号x(n)(n=0,...,L-1)に対応するピッチ周期T,T,T,Tを得て、当該ピッチ周期T,T,T,Tと、当該ピッチ周期T,T,T,Tを特定するピッチ符号(周期性成分符号)CT,CT,CT,CTと、を出力する。各サブフレームのピッチ符号CT,CT,CT,CTはそれぞれ均一長であってもよいし、可変長であってもよい。CT,CT,CT,CTそれぞれのビット数は、互いに同一であってもよいし、互いに異なっていてもよい。なお、ピッチ周期はピッチ符号を復号することにより得られる。そのため、ピッチ分析部114がピッチ周期を出力することは必須ではない。ピッチ周期は、サンプル点の間隔の整数倍のみで表現される場合(整数精度)のみならず、サンプル点の間隔の整数倍と小数値(分数値)とを用いて表現される場合(小数精度)もある。また、ピッチ分析部114は、探索部115で用いるために、サブフレームごとに、ピッチ利得gp1,gp2,gp3,gp4を求めて出力してもよい。 The pitch analysis unit 114 obtains pitch periods T 1 , T 2 , T 3 , T 4 corresponding to the input acoustic signal x (n) (n = 0,..., L−1) for each subframe. , Pitch periods T 1 , T 2 , T 3 , T 4 and pitch codes (periodic component codes) CT 1 , CT 2 , CT 3 for identifying the pitch periods T 1 , T 2 , T 3 , T 4. , CT 4 . The pitch codes CT 1 , CT 2 , CT 3 , and CT 4 of each subframe may be uniform lengths or variable lengths. The numbers of bits of CT 1 , CT 2 , CT 3 , and CT 4 may be the same or different from each other. The pitch period is obtained by decoding the pitch code. Therefore, it is not essential for the pitch analysis unit 114 to output the pitch period. The pitch period is not only expressed as an integer multiple of the sample point interval (integer precision), but is also expressed using an integer multiple of the sample point interval and a decimal value (fractional value) (decimal precision) There is also. In addition, pitch analyzer 114 may obtain and output pitch gains g p1 , g p2 , g p3 , and g p4 for each subframe for use in search unit 115.
 入力音響信号x(n)(n=0,...,L-1)に対応するピッチ周期T,T,T,T、当該ピッチ周期T,T,T,Tを特定するピッチ符号CT,CT,CT,CTの探索は、例えば、サブフレームごとに、適応符号帳112に記憶されている過去の各時点で生成された励振信号をピッチ周期の候補で遅延させて得られる信号に線形予測情報LPC infoによって特定される全極型の合成フィルタ117を適用して得られる合成信号と、入力された入力音響信号との差分に、聴覚重み付けフィルタ116を適用した値が最小となるように行われる。 Pitch periods T 1 , T 2 , T 3 , T 4 corresponding to the input acoustic signal x (n) (n = 0,..., L−1), the pitch periods T 1 , T 2 , T 3 , T The search for pitch codes CT 1 , CT 2 , CT 3 , and CT 4 that specify 4 is performed by, for example, pitch periods of excitation signals generated at each past time point stored in the adaptive codebook 112 for each subframe. The perceptual weighting filter is applied to the difference between the synthesized signal obtained by applying the all-pole synthesis filter 117 specified by the linear prediction information LPC info to the signal obtained by delaying the candidate and the input acoustic signal. It is performed so that the value to which 116 is applied is minimized.
 ピッチ利得gp1,gp2,gp3,gp4は、例えば、サブフレームごとに、探索された当該ピッチ周期T,T,T,Tに対応する合成信号と入力された入力音響信号との相互相関値を合成信号の自己相関値で除算した値として求められる。 The pitch gains g p1 , g p2 , g p3 , and g p4 are, for example, for each subframe, the input sound that is input with the synthesized signals corresponding to the searched pitch periods T 1 , T 2 , T 3 , and T 4. It is obtained as a value obtained by dividing the cross-correlation value with the signal by the autocorrelation value of the combined signal.
 適応符号帳112には、過去の各時点で生成された励振信号が記憶されている。適応符号帳112は、第1-4サブフレームの各サブフレームで得られるピッチ周期T,T,T,Tに応じて励振信号を遅延させて得られる適応信号成分v(n)(n=0,...,L-1)を出力する。小数精度のピッチ周期を用いて適応信号成分v(n)を表現する場合には、ピッチ周期に応じて遅延させた複数の励振信号に重み付き平均操作を行う補間フィルタが用いられる。 The adaptive codebook 112 stores excitation signals generated at each past time point. The adaptive codebook 112 has an adaptive signal component v (n) obtained by delaying the excitation signal according to the pitch periods T 1 , T 2 , T 3 , T 4 obtained in each subframe of the 1-4th subframe. (N = 0,..., L−1) is output. When the adaptive signal component v (n) is expressed using a pitch cycle with decimal precision, an interpolation filter that performs a weighted average operation on a plurality of excitation signals delayed according to the pitch cycle is used.
 探索部115は、サブフレームごとに、入力音響信号x(n)(n=0,...,L-1)に対応するパルス系列cf1,cf2,cf3,cf4と、当該パルス系列cf1,cf2,cf3,cf4に対応するコードインデックスCf1,Cf2,Cf3,Cf4(入力音響信号x(n)(n=0,...,L-1)に対応するパルス系列cf1,cf2,cf3,cf4を特定するコードインデックス)と、を得て出力する。なお、パルス系列はコードインデックスを復号することにより得られるので、探索部115がパルス系列を出力することは必須ではない。 For each subframe, the search unit 115 includes a pulse sequence c f1 , c f2 , c f3 , c f4 corresponding to the input acoustic signal x (n) (n = 0,..., L−1), and the pulse. Code indices C f1 , C f2 , C f3 , C f4 (input acoustic signals x (n) (n = 0,..., L−1) corresponding to the sequences c f1 , c f2 , c f3 , c f4 And a corresponding pulse sequence c f1 , c f2 , c f3 , c f4 ). Since the pulse sequence is obtained by decoding the code index, it is not essential for the search unit 115 to output the pulse sequence.
 利得量子化部118には、入力音響信号x(n)(n=0,...,L-1)および合成信号x’(n)(n=0,...,L-1)が入力される。合成信号x’(n)(n=0,...,L-1)からなるサンプル列は、コードインデックスに対応するパルス系列を合成フィルタ117に通して得られるサンプル列のそれぞれのサンプルに、量子化された固定符号帳利得の候補を乗算して得られるサンプル列と、ピッチ符号に対応するピッチ周期に対応するサンプル数だけ過去の励振信号を合成フィルタ117に通して得られるサンプル列のそれぞれのサンプルに、量子化されたピッチ利得の候補を乗算して得られるサンプル列と、を対応するサンプル毎に加算して得られる。利得量子化部118は、これらを用いてベクトル量子化を行い、すなわちサブフレームごとに、入力音響信号と合成信号の歪が最も小さくなるように、量子化されたピッチ利得またはその関数値と量子化された固定符号帳利得またはその関数値との組に対応する符号を得て出力する。以下では、量子化されたピッチ利得を「量子化済ピッチ利得」と表現し、量子化された固定符号帳利得を「量子化済固定符号帳利得」と表現する。また量子化済ピッチ利得gp1^と量子化済固定符号帳利得gc1^の組に対応する符号、量子化済ピッチ利得gp2^と量子化済固定符号帳利得gc2^の組に対応する符号、量子化済ピッチ利得gp3^と量子化済固定符号帳利得gc3^の組に対応する符号、量子化済ピッチ利得gp4^と量子化済固定符号帳利得gc4^の組に対応する符号を「利得符号GAf1,GAf2,GAf3,GAf4」と表現する。すなわち、利得量子化部118は、第1から第4のサブフレームのそれぞれ(第jサブフレーム)について、量子化済ピッチ利得gpj^と量子化済固定符号帳利得gcj^の組を特定する利得符号GAfjを得て出力する。 The gain quantization unit 118 receives an input acoustic signal x (n) (n = 0,..., L−1) and a synthesized signal x ′ (n) (n = 0,..., L−1). Entered. A sample sequence composed of the synthesized signal x ′ (n) (n = 0,..., L−1) is obtained by passing each pulse sequence corresponding to the code index through the synthesis filter 117 to each sample of the sample sequence. A sample sequence obtained by multiplying the quantized fixed codebook gain candidates and a sample sequence obtained by passing past excitation signals through the synthesis filter 117 by the number of samples corresponding to the pitch period corresponding to the pitch code. And a sample sequence obtained by multiplying a sample of the above by a quantized pitch gain candidate is obtained for each corresponding sample. The gain quantizing unit 118 performs vector quantization using these, that is, for each subframe, the quantized pitch gain or its function value and the quantum so as to minimize the distortion of the input acoustic signal and the synthesized signal. A code corresponding to the set of the fixed codebook gain or its function value is obtained and output. Hereinafter, the quantized pitch gain is expressed as “quantized pitch gain”, and the quantized fixed codebook gain is expressed as “quantized fixed codebook gain”. Also, a code corresponding to a set of quantized pitch gain g p1 ^ and quantized fixed codebook gain g c1 ^, and a set of quantized pitch gain g p2 ^ and quantized fixed codebook gain g c2 ^ A set corresponding to a set of code, quantized pitch gain g p3 ^ and quantized fixed codebook gain g c3 ^, a set of quantized pitch gain g p4 ^ and quantized fixed codebook gain g c4 ^ The codes corresponding to are expressed as “gain codes GA f1 , GA f2 , GA f3 , GA f4 ”. That is, gain quantization section 118 identifies a set of quantized pitch gain g pj ^ and quantized fixed codebook gain g cj ^ for each of the first to fourth subframes (jth subframe). Gain code GA fj to be output.
 このようなベクトル量子化には、例えば、量子化済ピッチ利得と量子化済固定符号帳利得との組に対応する利得符号を特定するためのテーブルである利得符号帳が用いられる。利得符号帳の例は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスとの組が複数個格納されたテーブルである。なお、量子化済ピッチ利得に代えて量子化済ピッチ利得の関数値をベクトル量子化の対象としてもよいし、量子化済固定符号帳利得に代えて量子化済固定符号帳利得の関数値をベクトル量子化の対象としてもよいが、以下では量子化済ピッチ利得そのものと量子化済固定符号帳利得そのものをベクトル量子化の対象とする例について説明する。 For such vector quantization, for example, a gain codebook that is a table for specifying a gain code corresponding to a set of quantized pitch gain and quantized fixed codebook gain is used. An example of the gain codebook is a table in which a plurality of sets of quantized pitch gain candidates, quantized fixed codebook gain candidates, and indexes are stored. Note that the function value of the quantized pitch gain may be the target of vector quantization instead of the quantized pitch gain, or the function value of the quantized fixed codebook gain may be used instead of the quantized fixed codebook gain. Although it may be a vector quantization target, an example in which the quantized pitch gain itself and the quantized fixed codebook gain itself are the target of vector quantization will be described below.
 量子化済固定符号帳利得の関数値の一例は、過去または現在のサブフレーム(またはフレーム)での固定符号帳113からの信号成分のエネルギーを基に予測された現在のサブフレーム(またはフレーム)での固定符号帳利得の推定値と、現在のサブフレーム(またはフレーム)での固定符号帳利得との比を表す補正係数(correction factor)などである。補正係数の例は、非特許文献1の「5.8.2 Quantization of codebook gains」の欄に記載されたγgcである。例えば、j(j=1,...,4)番目のサブフレームでの量子化済固定符号帳利得gcj^、補正係数γgcの量子化値γgc^、j(j=1,...,4)番目のサブフレームでの固定符号帳利得の推定値の量子化値pgcj^の間には、以下の関係が成り立つ。
 gcj^=γgc^×pgcj^
An example of a function value of the quantized fixed codebook gain is the current subframe (or frame) predicted based on the energy of the signal component from the fixed codebook 113 in the past or current subframe (or frame). And a correction factor indicating a ratio between the estimated value of the fixed codebook gain at the time and the fixed codebook gain at the current subframe (or frame). An example of the correction coefficient is γ gc described in “5.8.2 Quantization of codebook gains” in Non-Patent Document 1. For example, the quantized fixed codebook gain g cj ^ in the j (j = 1,..., 4) th subframe, the quantized value γ gc ^ of the correction coefficient γ gc , j (j = 1,. .., 4) The following relationship holds between the quantized values pg cj ^ of the estimated value of the fixed codebook gain in the fourth subframe.
g cj ^ = γ gc ^ × pg cj ^
 <利得量子化部118が行うベクトル量子化>
 利得量子化部118が行うベクトル量子化は、サブフレーム毎に、入力された入力音響信号x(n)(n=0,...,L-1)および合成信号x’(n)(n=0,...,L-1)に対して、利得符号帳に格納された複数個のインデックスのうちの何れか1つを選択し、それを利得符号とするものである。本発明は、この選択する処理に特徴があるので、以下でその[原理]と[具体的な手順の例]について順に説明する。
<Vector Quantization Performed by Gain Quantization Unit 118>
The vector quantization performed by the gain quantization unit 118 is performed for each subframe by inputting the input acoustic signal x (n) (n = 0,..., L−1) and the synthesized signal x ′ (n) (n = 0,..., L−1), one of a plurality of indexes stored in the gain codebook is selected and used as a gain code. Since the present invention is characterized by the processing to be selected, its [principle] and [example of specific procedure] will be described in order below.
 [原理]
 本発明の利得量子化が行うベクトル量子化では、利得符号帳のインデックスとして可変長符号が割り当てられる。本発明でのインデックスの選択は、符号化歪み(以下「歪み」という)を最小とする基準に基づいてなされるのではなく、歪みとインデックスのビット数(符号長,情報量)とのバランスを考慮した基準に基づいてなされる。以下、この基準について説明する。
[principle]
In the vector quantization performed by the gain quantization of the present invention, a variable length code is assigned as an index of the gain codebook. The selection of an index in the present invention is not made based on a criterion for minimizing coding distortion (hereinafter referred to as “distortion”), but a balance between distortion and the number of bits of the index (code length, information amount). Based on the criteria considered. Hereinafter, this standard will be described.
 一般に、N個(N≧1)のサンプルが符号化される場合、歪みDと1サンプルあたりの符号(インデックス)のビット数g/Nとの間には、以下の近似が成り立つ。
 Dg=D02(-2g/N)   ...(1)
ただし、符号化対象のN個のサンプルと、当該N個のサンプルに対応する符号が復号された場合に得られるN個の復元サンプルとの間の二乗距離を歪みと定義する。Dは1サンプルあたりの符号のビット数が0である場合の歪みである。
 このような関係は、サンプルの振幅が一様に分布する場合、1サンプルあたりの符号のビット数g/Nが1ビット増えると歪みDは1/4になること、および、サンプルの振幅がどのような分布に従う場合であっても、符号のビット数gがある程度以上ならほぼ同様のことがいえることに基づく。
In general, when N (N ≧ 1) samples are encoded, the following approximation holds between the distortion Dg and the number of bits (g / N) of the code (index) per sample.
D g = D 0 2 (-2g / N) ... (1)
However, the square distance between the N samples to be encoded and the N restored samples obtained when the codes corresponding to the N samples are decoded is defined as distortion. D 0 is distortion when the number of bits of the code per sample is 0.
Such a relationship, if the amplitude of the sample is uniformly distributed, one bit number g / N code per sample is increased 1 bit whose strain D g is to become 1/4, and the amplitude of the sample Regardless of the distribution, it is based on the fact that the same can be said if the number of bits g of the code is more than a certain level.
 よって、歪みの変化率D/Dは以下のように近似できる。
 Dg/D0=2(-2g/N)  ...(2)
これを底10の対数に変換してdB表現すると以下のようになる。
 10log10(Dg/D0)
=10log10(2(-2g/N))
=10(-2g/N)log10(2)
=-6.02(g/N)    ...(3)
 すなわち、一般的に歪みの変化率D/Dの対数は1個のサンプルあたりの符号のビット数g/Nに比例する。例えばN=64の場合、64個のサンプルあたりの符号のビット数gが1ビット増加すると歪みの変化率D/Dは約0.1dB改善される。実験でもこれと同様な結果が得られる。
Therefore, the strain change rate D g / D 0 can be approximated as follows.
D g / D 0 = 2 (-2g / N) ... (2)
This is converted into the logarithm of the base 10 and expressed in dB as follows.
10log 10 (D g / D 0 )
= 10log 10 (2 (-2g / N) )
= 10 (-2g / N) log 10 (2)
= -6.02 (g / N) ... (3)
That is, generally, the logarithm of the distortion change rate D g / D 0 is proportional to the number of bits g / N of the code per sample. For example, in the case of N = 64, the distortion change rate D g / D 0 is improved by about 0.1 dB when the number of code bits g per 64 samples increases by one bit. Similar results can be obtained in experiments.
 以上のように、式(1)は歪みDと1サンプルあたりの符号のビット数g/Nとの一般的な関係を近似している。利得符号帳中のあるインデックスに対応する量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補を使うことによって生ずる歪みをDとし、そのインデックスのビット数をbとする。bが小さいと符号化装置全体として出力するビット数が小さくできたり、符号化装置が出力する符号の平均ビット数またはある時間区間内でビット数が一定である制約のもとに、節約できたビットを後続のフレームで利用して後続フレームの歪みを小さくできるという利点がある。従来はDを最小化する基準で選択したインデックスを利得符号としたが、本願では歪みとビット数を1つの指標値で評価して、最適なインデックスを利得符号として選択する。このために、式(1)の関係とこのフレームで一定のビット数のもとに利得量子化で節約できたビットを入力音響信号の符号化に割り当てることを想定する。利得符号にbビットを使うと、(b-1)ビットの場合より、入力音響信号の符号化で使うビット数は1ビット削減する必要があり、式(1)から歪みは2(2/N)倍だけ増加する。したがって、利得符号にbビットを使うと歪みは2(2b/N)倍だけ増加することになる。このようなビット数の消費を歪みに換算した歪みをDとして式(4)で定義する。
 DU=D×2(2b/N)  ...(4)
 歪みDが小さいほどDは小さくなり、インデックスを指定するビット数bが小さいほどDは小さくなる。Dが最小となる符号を探索することで、歪みDおよびインデックスのビット数bを1つの指標値で評価して利得符号を選択することができる。以下、Dを指標値と呼ぶ。
As described above, Equation (1) approximates the general relationship between the distortion Dg and the number of bits of code per sample g / N. Let D be the distortion caused by using a quantized pitch gain candidate and a quantized fixed codebook gain candidate corresponding to a certain index in the gain codebook, and let b be the number of bits in that index. When b is small, the number of bits output as a whole of the encoding device can be reduced, or the average number of bits of the code output from the encoding device or the restriction that the number of bits is constant within a certain time interval can be saved. There is an advantage that distortion of the subsequent frame can be reduced by using the bit in the subsequent frame. Conventionally, an index selected on the basis of minimizing D is a gain code. However, in this application, distortion and the number of bits are evaluated with one index value, and an optimal index is selected as a gain code. For this purpose, it is assumed that bits saved by gain quantization based on the relationship of equation (1) and a certain number of bits in this frame are allocated to encoding of the input acoustic signal. When b bits are used for the gain code, it is necessary to reduce the number of bits used for encoding the input acoustic signal by 1 bit as compared with the case of (b-1) bits, and the distortion is 2 (2 / N ) Increase by a factor of two. Therefore, when b bits are used for the gain code, the distortion increases by 2 (2b / N) times. The distortion in terms of distortion consumption of such number of bits defined by the equation (4) as a D U.
D U = D × 2 (2b / N) ... (4)
More distortion D is smaller D U becomes smaller, as the number of bits to specify the index b is smaller D U decreases. By searching a code D U is minimized, it is possible to select a gain code by evaluating the distortion D and the number of bits of the index b by one index value. Hereinafter referred to as an index value D U.
 式(4)の代わりに、以下の指標値Dが最小となる符号が探索されてもよい。
 DU=10log10(D×2(2b/N))=10log10(D)+(20b/N)log10(2)  ...(5)
Instead of Equation (4), code following the index value D U is the minimum may be searched.
D U = 10log 10 (D × 2 (2b / N) ) = 10log 10 (D) + (20b / N) log 10 (2) ... (5)
 式(4)の指数部2b/Nの値は非常に小さいため、式(4)の指数関数部をテイラー展開し(e=1+x+x/2+x/6+...)、それによって得られる多項式の2項以降を省略してもよい近似となる。従って、以下の指標値Dが最小となる符号が探索されてもよい。
Figure JPOXMLDOC01-appb-M000001
 式(6)は上記のようないろいろな仮定と近似に基づいており、一般にはγを正の値である定数として式(7)のような指標値とし、γは符号化装置全体の制約や目的に合わせた実験に基づく値とすることが好ましい。
 DU=D(1+γb)   ...(7)
 要するに、指標値Dは上述のものに限定されず、歪みDと、インデックスのビット数bが大きいほど大きくなる係数と、を加算または乗算して得られる値が指標値Dとされ、指標値Dが最小となる符号が探索されればよい。
Since the value of the exponent part 2b / N of the formula (4) is very small, the formula an exponential portion (4) and Taylor expansion (e x = 1 + x + x 2/2 + x 3/6 + ...), obtained thereby This is an approximation that may omit the second and subsequent terms of the polynomial. Therefore, reference numerals the following index values D U is the minimum may be searched.
Figure JPOXMLDOC01-appb-M000001
Equation (6) is based on various assumptions and approximations as described above. In general, γ is a positive constant and is used as an index value as in Equation (7). It is preferable to set a value based on an experiment tailored to the purpose.
D U = D (1 + γb) ... (7)
In short, the index value D U is not limited to the above, and a value obtained by adding or multiplying the distortion D and a coefficient that increases as the number of bits b of the index increases is used as the index value D U. code value D U is the minimum need be searched.
 [具体的な手順の例]
 上記の原理に基づいて利得量子化部118が行うベクトル量子化の具体的な手順を例示する。
 利得量子化部118は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組を、可変長符号化(例えばハフマン符号化)し、利得符号であるインデックスを得る。例えば、利得量子化部118は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補と可変長符号であるインデックスとの組が複数個格納された利得符号帳を備え、上述の基準に従い、入力音響信号x(n)(n=0,...,L-1)に対応する利得符号であるインデックスを得る。
[Example of specific procedure]
A specific procedure of vector quantization performed by the gain quantization unit 118 based on the above principle will be exemplified.
Gain quantization section 118 performs variable length coding (for example, Huffman coding) on a set of quantized pitch gain candidates and quantized fixed codebook gain candidates to obtain an index that is a gain code. For example, the gain quantization unit 118 includes a gain codebook in which a plurality of pairs of quantized pitch gain candidates, quantized fixed codebook gain candidates, and indexes that are variable length codes are stored, According to the standard, an index which is a gain code corresponding to the input acoustic signal x (n) (n = 0,..., L−1) is obtained.
 可変長符号は、例えば、学習用データを量子化した結果から得られる。具体的には、可変長符号は、学習用データのピッチ利得と固定符号帳利得の組をベクトル量子化した際に、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組が選択された頻度に応じて予め割り当てられたものである。選択された頻度の高い量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組にはビット数の小さなインデックス(短い符号)が割り当てられ、選択された頻度の低い量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組にはビット数の大きなインデックス(長い符号)が割り当てられる。すなわち、利得符号帳に格納された複数個のインデックスにはビット数が異なるものが含まれる。このようなインデックスの例はハフマン符号である。しかしながら、その他の可変長符号がインデックスとして用いられてもよい。なお、各インデックスのビット数を定めるための上記頻度は、学習用データを用いなくても選択される量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組の頻度はある程度予想できるため、学習用データを用いることなく上記の頻度を予想して量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組に可変長符号を割り当ててもよい。 The variable length code is obtained from the result of quantizing the learning data, for example. Specifically, when the variable length code vector-quantizes a set of the pitch gain and fixed codebook gain of the learning data, the variable-length code includes a quantized pitch gain candidate and a quantized fixed codebook gain candidate. The set is assigned in advance according to the frequency with which the set is selected. A pair of selected frequent quantized pitch gain candidates and quantized fixed codebook gain candidates is assigned an index (short code) with a small number of bits, and the selected low frequency quantized An index (long code) having a large number of bits is assigned to a set of pitch gain candidates and quantized fixed codebook gain candidates. That is, the plurality of indexes stored in the gain codebook include those with different numbers of bits. An example of such an index is a Huffman code. However, other variable length codes may be used as the index. The frequency for determining the number of bits of each index is, to some extent, the number of pairs of quantized pitch gain candidates and quantized fixed codebook gain candidates that are selected without using learning data. Therefore, a variable length code may be assigned to a set of a quantized pitch gain candidate and a quantized fixed codebook gain candidate by predicting the above frequency without using learning data.
 以下に利得符号帳の具体例を示す。
Figure JPOXMLDOC01-appb-T000002
 表1は、インデックスがハフマン符号であり、インデックスのビット数も利得符号帳に格納する場合の利得符号帳の例である。表1ではその一部を省略してあるが、表1の利得符号帳には、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスと当該インデックスのビット数とによる組が32組格納されている。
A specific example of the gain codebook is shown below.
Figure JPOXMLDOC01-appb-T000002
Table 1 shows an example of the gain codebook in the case where the index is a Huffman code and the number of bits of the index is also stored in the gain codebook. Although a part thereof is omitted in Table 1, the gain codebook in Table 1 includes a set of a quantized pitch gain candidate, a quantized fixed codebook gain candidate, an index, and the number of bits of the index. 32 sets are stored.
 利得量子化部118は、N個のサンプル点からなるサブフレーム(時間区間)ごとに、コードインデックスに対応するパルス系列(固定符号帳113からのサンプル列)を合成フィルタ117に通して得られるサンプル列Zのそれぞれのサンプルに、量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、ピッチ符号に対応するピッチ周期に対応するサンプル数だけ過去の励振信号を合成フィルタ117に通して得られるサンプル列Yのそれぞれのサンプルに、量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数bが大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得て出力する。例えば、第jサブフレームの合成信号サンプル列αY+βZは、第jサブフレームに属するN個のサンプル点nの合成信号x’(n)=gpj^×v(n)+gcj^×cfj(n)からなるサンプル列である。ただし、gpj^=αかつgcj^=βである。例えば、第jサブフレームの入力音響信号Xは、第jサブフレームに属するN個のサンプル点nの入力音響信号x(n)からなるサンプル列である。例えば、利得量子化部118は、各インデックスに対応するgpj^=αおよびgcj^=βを出力し、第jサブフレームに属するN個のサンプル点nの合成信号x’(n)からなるサンプル列、および、第jサブフレームに属するN個のサンプル点nの入力音響信号x(n)からなるサンプル列を得て、第jサブフレームの指標値Dを各インデックスについて計算し、指標値Dが最も小さくなるインデックスを、第jサブフレームの利得符号として得て出力する。各指標値Dに対応する量子化済ピッチ利得の候補αと量子化済固定符号帳利得の候補βとインデックスとの組は、それぞれ、利得符号帳に格納された量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスとの組の何れかである。利得符号帳に量子化ピッチ利得の候補の関数値が格納されている場合は、量子化済ピッチ利得の候補の関数値から求まる量子化済ピッチ利得の候補をαとすればよい。同様に、利得符号帳に量子化済固定符号帳利得の候補の関数値が格納されている場合は、量子化済固定符号帳利得の候補の関数値から求まる量子化済固定符号帳利得の候補をβとすればよい。サンプル列Zに含まれるサンプルの個数、サンプル列Yに含まれるサンプルの個数、および合成信号サンプル列αY+βZに含まれるサンプルの個数は、すべてN個である。合成フィルタ117は、あるサンプル点nのサンプルυ(n)を、そのサンプル点nよりも過去のP個のサンプル点n-1,n-2,...,n-Pのサンプルχ(n-1),χ(n-2),...,χ(n-P)に線形予測係数a(n-1),a(n-2),...,a(n-P)を乗算した値a(n-1)×χ(n-1),a(n-2)×χ(n-2),...,a(n-P)×χ(n-P)の和で表す線形FIR(Finite Impulse Response)フィルタである。以下に合成フィルタ117を表す。
 υ(n)=a(1)×χ(n-1)+a(2)×χ(n-2)+...+a(P)×χ(n-P)
 例えば、サンプル列Aを合成フィルタ117に通してサンプル列Cが得られる場合、サンプル列Aに含まれるサンプルがχ(n-1),χ(n-2),...,χ(n-P)の少なくとも一部となり、υ(n)がサンプル列Cのサンプル点nでのサンプルとなる。χ(n-1),χ(n-2),...,χ(n-P)の少なくとも一部がサンプル列Aよりも過去のサンプル点に対応する場合、例えば、当該χ(n-1),χ(n-2),...,χ(n-P)の少なくとも一部はサンプル列Aより過去のサンプル列に含まれるサンプルとされる。あるいは、サンプル列Aよりも過去のサンプル列が存在しない場合、当該当該χ(n-1),χ(n-2),...,χ(n-P)の少なくとも一部は0などの定数とされる。
Gain quantization section 118 obtains samples obtained by passing a pulse sequence (sample sequence from fixed codebook 113) corresponding to a code index through synthesis filter 117 for each subframe (time interval) composed of N sample points. A sample filter βZ obtained by multiplying each sample of the sequence Z by a quantized fixed codebook gain candidate β and a past excitation signal by the number of samples corresponding to the pitch period corresponding to the pitch code are combined with the synthesis filter 117. And a sample sequence αY obtained by multiplying each sample of the sample sequence Y obtained by passing through a quantized pitch gain candidate α and a corresponding sample to obtain a combined signal sample sequence αY + βZ. Obtained by adding or multiplying the distortion D with the input acoustic signal X and the coefficient that increases as the number of bits b of the index increases. An index mark value D U is the smallest, and outputs as a gain code. For example, the composite signal sample sequence αY + βZ of the j-th subframe is a composite signal x ′ (n) = g pj ^ × v (n) + g cj ^ × c fj of N sample points n belonging to the j-th subframe. This is a sample sequence consisting of (n). However, g pj ^ = α and g cj ^ = β. For example, the input acoustic signal X in the j-th subframe is a sample string composed of the input acoustic signals x (n) at N sample points n belonging to the j-th subframe. For example, the gain quantization unit 118 outputs g pj ^ = α and g cj ^ = β corresponding to each index, and from the combined signal x ′ (n) of N sample points n belonging to the j-th subframe. And a sample sequence consisting of input acoustic signals x (n) of N sample points n belonging to the jth subframe, and calculating an index value D U of the jth subframe for each index, an index index value D U is the smallest, and outputs as a gain code of the j-th subframe. A set of a quantized pitch gain candidate α, a quantized fixed codebook gain candidate β and an index corresponding to each index value DU is a quantized pitch gain candidate stored in the gain codebook. And a set of quantized fixed codebook gain candidates and indexes. When the function value of the quantized pitch gain candidate is stored in the gain codebook, the quantized pitch gain candidate obtained from the function value of the quantized pitch gain candidate may be α. Similarly, when a function value of a quantized fixed codebook gain candidate is stored in the gain codebook, a quantized fixed codebook gain candidate obtained from a function value of a quantized fixed codebook gain candidate May be β. The number of samples included in the sample sequence Z, the number of samples included in the sample sequence Y, and the number of samples included in the combined signal sample sequence αY + βZ are all N. The synthesis filter 117 converts a sample ν (n) at a certain sample point n into samples χ (n) of P sample points n−1, n−2,..., NP past the sample point n. −1), χ (n−2),..., Χ (n−P) with linear prediction coefficients a (n−1), a (n−2),. Sum of multiplied values a (n−1) × χ (n−1), a (n−2) × χ (n−2),..., A (n−P) × χ (n−P) Is a linear FIR (Finite Impulse Response) filter. The synthesis filter 117 is shown below.
υ (n) = a (1) × χ (n-1) + a (2) × χ (n-2) + ... + a (P) × χ (nP)
For example, when the sample string A is obtained by passing the sample string A through the synthesis filter 117, the samples included in the sample string A are χ (n−1), χ (n−2),. P) is at least a part, and ν (n) is a sample at the sample point n of the sample sequence C. When at least a part of χ (n−1), χ (n−2),..., χ (n−P) corresponds to a sample point in the past from the sample sequence A, for example, χ (n− 1) At least part of χ (n−2),..., Χ (n−P) is a sample included in a sample sequence before the sample sequence A. Alternatively, when there is no sample sequence that is earlier than the sample sequence A, at least a part of the χ (n−1), χ (n−2),. It is assumed to be a constant.
 以下に指標値Dの具体例を示す。
 サブフレームがN個のサンプル点S,...,S+N-1(Sは0以上の整数)からなり、サブフレームに属する入力音響信号XをベクトルX=(x(S),...,x(S+N-1))と表現し、サンプル列ZをベクトルZ=(z(S),...,z(S+N-1))と表現し、サンプル列YをベクトルY=(y(S),...,y(S+N-1))と表現し、サンプル列αY+βZと入力音響信号Xとの二乗誤差を歪みDと定義すると、歪みDは以下のように表される。ただし、σはσの転置を表す。
Figure JPOXMLDOC01-appb-M000003
Hereinafter a specific example of index values D U in.
A subframe is composed of N sample points S,..., S + N−1 (S is an integer of 0 or more), and an input acoustic signal X belonging to the subframe is represented by a vector X = (x (S),. x (S + N−1)), the sample sequence Z is expressed as a vector Z = (z (S),..., z (S + N−1)), and the sample sequence Y is expressed as a vector Y = (y (S ),..., Y (S + N−1)), and defining the square error between the sample sequence αY + βZ and the input acoustic signal X as distortion D, the distortion D is expressed as follows. However, σ T represents transposition of σ.
Figure JPOXMLDOC01-appb-M000003
 例えば、前述した1フレームが4個のサブフレームに等区分される例の場合、第jサブフレーム(j=1,...,4)は、N=Lf(j)-Lf(j-1)個のサンプル点Lf(j-1),...,Lf(j)-1からなる。ここで、第jサブフレームでの入力音響信号XをベクトルX=(x(Lf(j-1)),...,x(Lf(j)-1))と表現する。また、第jサブフレームでの固定符号帳113からのパルス系列cfj=(cfj(Lf(j-1)),...,cfj(Lf(j)-1))を合成フィルタ117に通して得られるサンプル列ZをZ=(z(Lf(j-1)),...,z(Lf(j)-1))と表現する。さらに、第jサブフレームでの適応信号成分(過去の励振信号)v(Lf(j-1)),...,v(Lf(j)-1)を合成フィルタ117に通して得られるサンプル列YをベクトルY=(y(Lf(j-1)),...,y(Lf(j)-1))と表現する。すると、第jサブフレームでの歪みDは以下のように表される。
Figure JPOXMLDOC01-appb-M000004
For example, in the example in which one frame described above is equally divided into four subframes, the jth subframe (j = 1,..., 4) is represented by N = L f (j) −L f (j -1) It consists of L f (j-1) , ..., L f (j) -1 sample points. Here, the input acoustic signal X in the j-th subframe is expressed as a vector X j = (x (L f (j−1) ),..., X (L f (j) −1)). Also, the pulse sequence c fj = (c fj (L f (j−1) ),..., C fj (L f (j) −1)) from the fixed codebook 113 in the j-th subframe is synthesized. A sample string Z obtained through the filter 117 is expressed as Z j = (z (L f (j−1) ),..., Z (L f (j) −1)). Further, adaptive signal components (past excitation signals) v (L f (j−1) ),..., V (L f (j) −1) in the j-th subframe are obtained through the synthesis filter 117. The sample sequence Y to be obtained is expressed as a vector Y = (y (L f (j−1) ),..., Y (L f (j) −1)). Then, the distortion D in the j-th subframe is expressed as follows.
Figure JPOXMLDOC01-appb-M000004
 指標値Dの例は、前述の式(4)または式(5)または式(7)であってもよいし、式(6)で近似された以下の指標値Dであってもよい。
Figure JPOXMLDOC01-appb-M000005
Examples of the index value D U may be a formula described above (4) or the formula (5) or (7) may be less than index value D U approximated by equation (6) .
Figure JPOXMLDOC01-appb-M000005
 歪みDは符号化歪みであり、Dは歪みと利得符号のビット数b(符号長)の双方を考慮した指標値である。すなわち、歪みDが最小となるインデックスを利得符号として選択するのが従来の選択方法であり、指標値Dが最小となるインデックスを利得符号として選択するのが本発明での選択方法である。本発明では、歪みDと利得符号のビット数b(符号長)の双方を考慮して利得符号が選択される。 Distortion D is encoding distortion, D U is the index value in consideration of both the distortion and gain code number of bits b (code length). That is, a conventional selection method to select an index that distortion D is minimum as a gain code, to select the index index value D U is the minimum as the gain code is the method of choice in the present invention. In the present invention, the gain code is selected in consideration of both the distortion D and the number of bits b (code length) of the gain code.
 なお、表1のように、利得符号帳に各インデックスとそのビット数bとが対応付けられて格納されていれば、利得量子化部118は、インデックスからそのビット数bを算出することなく指標値Dを計算できる。しかしながら、利得符号帳にビット数bが格納されていなくても、利得量子化部118は、インデックスからそのビット数を計算して指標値Dを計算できる。そのため、各インデックスのビット数bを利得符号帳に格納しておくことは必須ではない。 As shown in Table 1, if each index and its bit number b are stored in association with each other in the gain codebook, gain quantization section 118 does not calculate the bit number b from the index. It can calculate the value D U. However, even without the number of bits b is stored in the gain codebook, the gain quantization unit 118 may calculate the index value D U by calculating the number of bits from the index. Therefore, it is not essential to store the bit number b of each index in the gain codebook.
 [指標値の変形例1]
 或いは、利得量子化部118が、以下の指標値Dを最小にする量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とに対応するインデックスを利得符号帳から探索し、得られたインデックスを利得符号として出力してもよい。
Figure JPOXMLDOC01-appb-M000006
ただし、Bは利得符号帳に格納された全ての量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補の組を均一長符号化するために必要な符号のビット数である。例えば、表1に例示した利得符号帳は32=2個のインデックスを含み、この場合のBの例は5である。表1に例示した利得符号帳を用いた可変長符号化でビット数がbのインデックスが利得符号とされた場合は、均一長符号化を可変長符号化に変更したことにより余った(B-b)ビットを使って入力音響信号を更に符号化するができ、歪を軽減できることを想定する。実際は(B-b)ビットが正であれば情報の節約ができ、あるいは次のサブフレーム以降で使うことができるが、式(11)は、利得符号帳の選択の基準として均一長符号より可変長符号のほうがビット数が少ないことを歪に換算して評価するものである。式(11)の(2log2)B/Nの項は1と比較して非常に小さい。従って、近似的には式(10)および式(11)の指標値Dの間に大きな違いはない。
[Modification Example of Index Value 1]
Alternatively, the gain quantization unit 118, an index corresponding to the candidate of the candidate and the quantized fixed codebook gains of quantized pitch gain which minimizes the following index values D U searched from the gain codebook, to obtain The obtained index may be output as a gain code.
Figure JPOXMLDOC01-appb-M000006
Here, B is the number of bits of a code necessary for uniformly encoding a set of all quantized pitch gain candidates and quantized fixed codebook gain candidates stored in the gain codebook. For example, the gain codebook illustrated in Table 1 includes 32 = 2 5 indexes, and an example of B in this case is 5. In the case of variable length coding using the gain codebook illustrated in Table 1 and the index having the number of bits b is a gain code, the remainder is obtained by changing the uniform length coding to variable length coding (B− b) It is assumed that the input sound signal can be further encoded using bits and distortion can be reduced. Actually, if the (Bb) bit is positive, information can be saved, or it can be used after the next subframe, but Equation (11) can be changed from the uniform length code as a reference for selecting the gain codebook. The long code has a smaller number of bits and is evaluated in terms of distortion. The term (2log2) B / N in equation (11) is very small compared to 1. Therefore, there is no big difference between the index value D U approximate to the formula (10) and (11).
 [指標値の変形例2]
 或いは、利得量子化部118が、以下の指標値Dを最小にする量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とに対応するインデックスを利得符号帳から探索し、得られたインデックスを利得符号として出力してもよい。
Figure JPOXMLDOC01-appb-M000007
ただし、vは正の係数である。
[Modification Example 2 of Index Value]
Alternatively, the gain quantization unit 118, an index corresponding to the candidate of the candidate and the quantized fixed codebook gains of quantized pitch gain which minimizes the following index values D U searched from the gain codebook, to obtain The obtained index may be output as a gain code.
Figure JPOXMLDOC01-appb-M000007
However, v is a positive coefficient.
 言い換えると、利得量子化部118が、式(10)の括弧内の第2項、すなわち、インデックスのビット数bが大きくなるほど大きくなる項、に正の値である係数vを乗算して得られる式(12)により求まる指標値Dを最小にする量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とに対応するインデックスを利得符号帳から探索し、得られたインデックスを利得符号として出力してもよい。 In other words, gain quantization section 118 is obtained by multiplying the second term in parentheses in equation (10), that is, the term that increases as the number of bits b of the index increases, by coefficient v, which is a positive value. searching an index corresponding to the candidate of the candidate and the quantized fixed codebook gains of quantized pitch gain for the index value D U which is obtained by the equation (12) minimizing the gain codebook, gain the resulting index You may output as a code | symbol.
 式(12)の指標値Dが用いられる場合、係数vを調整することで、サブフレームごとの利得符号のビット数の大小を調整できる。このような調整は、例えば、パラメータ符号化部119から出力されるビットストリームのビット数がフレームごとに定められている場合などに有効である。このような調整は、所定時間だけ過去の時間区間(例えばサブフレーム)で得られた利得符号のビット数がインデックスの平均ビット数より小さい場合には、現在の時間区間(例えばサブフレーム)のvを1より小さな値とし、所定時間だけ過去の時間区間で得られた利得符号のビット数がインデックスの平均ビット数より大きい場合には、現在の時間区間のvを1より大きな値とすることによって可能である。 If the index value D U of formula (12) is used, by adjusting the coefficient v, it can be adjusted magnitude of the number of bits of the gain code of each sub-frame. Such adjustment is effective, for example, when the number of bits of the bit stream output from the parameter encoding unit 119 is determined for each frame. Such adjustment is performed when the number of bits of the gain code obtained in the past time interval (for example, subframe) by a predetermined time is smaller than the average bit number of the index, and v in the current time interval (for example, subframe). If the number of bits of the gain code obtained in the past time interval for a predetermined time is larger than the average number of bits in the index, v in the current time interval is set to a value greater than 1. Is possible.
 例えば、利得量子化部118は、第1サブフレームでv=1とした式(12)により求まる指標値Dを最小とするインデックスを利得符号として選択する。その結果、第1サブフレームでビット数が平均ビット数よりも小さいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも大きくなる。そこで、第2サブフレームでは、v=0.5とした式(12)により求まる指標値Dを最小とするインデックスが利得符号として選択される。すなわち、第2サブフレームでは、インデックスのビット数を小さくすることよりも歪みDを小さくすることを優先してインデックスが選択される。逆に第1サブフレームでビット数が平均ビット数よりも大きいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも小さくなる。そこで、第2サブフレームでは、v=2.0とした式(12)により求まる指標値Dを最小とするインデックスが利得符号として選択される。すなわち、第2サブフレームでは、歪みDを小さくすることよりもインデックスのビット数を小さくすることを優先してインデックスが選択される。 For example, the gain quantization unit 118 selects an index that minimizes the index value D U which is obtained by the equation was v = 1 in the first subframe (12) as a gain code. As a result, when an index whose number of bits is smaller than the average number of bits in the first subframe is selected as the gain code, the number of bits that can be allocated to the remaining subframes is greater than the average. In the second subframe, the index of v = 0.5 and the formula an index value D U which is obtained by (12) and the minimum is selected as the gain code. That is, in the second subframe, the index is selected with priority given to reducing the distortion D over reducing the number of bits of the index. Conversely, when an index having a number of bits larger than the average number of bits in the first subframe is selected as the gain code, the number of bits that can be assigned to the remaining subframes becomes smaller than the average. In the second subframe, the index of v = 2.0 and the formula an index value D U which is obtained by (12) and the minimum is selected as the gain code. That is, in the second subframe, the index is selected with priority given to reducing the number of bits of the index over reducing the distortion D.
 係数vが異なれば、それに対応する最適な利得符号帳も異なる。そのため、利得量子化部118が、利得符号帳を複数個備え、各係数vの値ごとに予め定められた利得符号帳を用いて利得符号を得て出力してもよい。例えば、v=1に対応する利得符号帳、v=2に対応する利得符号帳、v=0.5に対応する利得符号帳、の複数個の符号帳を予め利得量子化部118に格納しておき、vの値に対応する利得符号帳が選択され、選択された利得符号帳から指標値Dを最小とするインデックスが選択され、それが利得符号として出力されてもよい。この場合、利得符号帳の選択基準は、符号化装置11と復号装置12との間で同一とする。 If the coefficient v is different, the optimum gain codebook corresponding to the coefficient v is also different. Therefore, gain quantization section 118 may include a plurality of gain codebooks, and obtain and output gain codes using a gain codebook predetermined for each value of coefficient v. For example, a plurality of codebooks of a gain codebook corresponding to v = 1, a gain codebook corresponding to v = 2, and a gain codebook corresponding to v = 0.5 are stored in the gain quantization unit 118 in advance. advance, gain codebook corresponding to the value of v is selected and the index to minimize an index value D U is selected from the gain codebook is selected, it may be output as a gain code. In this case, the gain codebook selection criterion is the same between the encoding device 11 and the decoding device 12.
 式(5)で求まる指標値Dに代えて式(6)で求まる指標値Dを用いることができるのと同様に、式(12)で求まる指標値Dに代えて式(13)で求まる指標値Dを用いることができる。
 Du=D(1+vγb)   …(13)
 ここで、γは正の定数、vは正の係数であるので、vγに相当する正の係数をwとすれば、式(14)で求まる指標値Dを用いることができる。
 Du=D(1+wb)   …(14)
Wherein Like the place of the index value D U which is obtained by (5) can be used an index value D U which is obtained by the formula (6), wherein in place of the index value D U which is obtained by the formula (12) (13) it can be used an index value D U which is obtained by.
D u = D (1 + vγb) (13)
Here, gamma is a positive constant, v is because it is a positive coefficient, the positive coefficient corresponding to vγ if w, can be used an index value D U which is obtained by the formula (14).
D u = D (1 + wb)… (14)
 式(14)の指標値Dが用いられる場合、係数wを調整することで、サブフレームごとの利得符号のビット数の大小を調整できる。この調整は、所定時間だけ過去の時間区間(例えばサブフレーム)で得られた利得符号のビット数がインデックスの平均ビット数より小さい場合には、現在の時間区間(例えばサブフレーム)のwを予め定めた値wより小さな値とし、所定時間だけ過去の時間区間で得られた利得符号のビット数がインデックスの平均ビット数より大きい場合には、現在の時間区間のwを予め定めた値wより大きな値とすることによって可能である。
 例えば、利得量子化部118は、第1サブフレームでw=wとした式(14)により求まる指標値Dを最小とするインデックスを利得符号として選択する。その結果、第1サブフレームでビット数が平均ビット数よりも小さいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも大きくなる。そこで、第2サブフレームでは、w=0.5wとした式(14)により求まる指標値Dを最小とするインデックスが利得符号として選択される。逆に第1サブフレームでビット数が平均ビット数よりも大きいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも小さくなる。そこで、第2サブフレームでは、w=2.0wとした式(14)により求まる指標値Dを最小とするインデックスが利得符号として選択される。上述した係数vを用いる場合と同様に、係数wを用いる場合も、利得量子化部118が、利得符号帳を複数個備え、各係数wの値ごとに予め定められた利得符号帳を用いて利得符号を得て出力してもよい。この場合も、利得符号帳の選択基準は、符号化装置11と復号装置12との間で同一とする(<利得量子化部118が行うベクトル量子化>の説明終わり)。
If the index value D U of formula (14) is used, by adjusting the coefficients w, it can be adjusted magnitude of the number of bits of the gain code of each sub-frame. In this adjustment, when the number of bits of the gain code obtained in the past time interval (for example, subframe) by a predetermined time is smaller than the average bit number of the index, w in the current time interval (for example, subframe) is set in advance. When the number of bits of the gain code obtained in the past time interval is larger than the average bit number of the index with a value smaller than the predetermined value w 0 , the current time interval w is set to a predetermined value w This is possible by setting a value larger than zero .
For example, the gain quantization unit 118 selects the index to the index value D U which is obtained by the equation was w = w 0 in the first sub-frame (14) and the minimum as the gain code. As a result, when an index whose number of bits is smaller than the average number of bits in the first subframe is selected as the gain code, the number of bits that can be allocated to the remaining subframes is greater than the average. In the second subframe, the index which minimizes the index value D U which is obtained by the equation (14) with a w = 0.5 w 0 is selected as the gain code. Conversely, when an index having a number of bits larger than the average number of bits in the first subframe is selected as the gain code, the number of bits that can be assigned to the remaining subframes becomes smaller than the average. In the second subframe, the index which minimizes the index value D U which is obtained by the equation (14) with a w = 2.0 w 0 is selected as the gain code. Similarly to the case of using the coefficient v described above, also in the case of using the coefficient w, the gain quantization unit 118 includes a plurality of gain codebooks and uses a gain codebook predetermined for each value of the coefficient w. A gain code may be obtained and output. In this case as well, the gain codebook selection criteria are the same between the encoding device 11 and the decoding device 12 (end of description of <vector quantization performed by the gain quantization unit 118>).
 利得量子化部118で各サブフレームでの利得符号GAf1,GAf2,GAf3,GAf4が得られると、コードインデックスCf1,Cf2,Cf3,Cf4に対応するパルス系列cf1,cf2,cf3,cf4(固定符号帳113からのサンプル列)に量子化済固定符号帳利得gc1^,gc2^,gc3^,gc4^を乗算して得られるサンプル列と、サブフレームごとにピッチ周期T,T,T,Tに対応するサンプル数だけ過去の励振信号である適応信号成分v(n)(n=0,...,L-1)に量子化済ピッチ利得gp1^,gp2^,gp3^,gp4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u'(n)(n=0,...,L-1)が、適応符号帳112に追加される。
  u'(n)=gp1^×v(n)+gc1^×cf1(n)(n=Lf(0),...,Lf(1)-1)
  u'(n)=gp2^×v(n)+gc2^×cf2(n)(n=Lf(1),...,Lf(2)-1)
  u'(n)=gp3^×v(n)+gc3^×cf3(n)(n=Lf(2),...,Lf(3)-1)
  u'(n)=gp4^×v(n)+gc4^×cf4(n)(n=Lf(3),...,Lf(4)-1)
The gain code GA f1 in each sub-frame by the gain quantization unit 118, GA f2, GA f3, GA f4 is obtained, code index C f1, C f2, C f3 , pulse sequence c f1 corresponding to C f4, a sample sequence obtained by multiplying c f2 , c f3 , c f4 (sample sequence from the fixed codebook 113) by quantized fixed codebook gains g c1 ^, g c2 ^, g c3 ^, g c4 ^ , Adaptive signal component v (n) (n = 0,..., L−1) that is a past excitation signal by the number of samples corresponding to pitch periods T 1 , T 2 , T 3 , T 4 for each subframe. And a sample sequence obtained by multiplying the quantized pitch gains g p1 ,, g p2 ,, g p3 ,, and g p4 ^ by the corresponding samples, and the following excitation signal u ′ (n) (N = 0, ..., L-1) is It is added to the adaptive codebook 112.
u '(n) = g p1 ^ × v (n) + g c1 ^ × c f1 (n) (n = L f (0) , ..., L f (1) -1)
u '(n) = g p2 ^ × v (n) + g c2 ^ × c f2 (n) (n = L f (1) , ..., L f (2) -1)
u '(n) = g p3 ^ × v (n) + g c3 ^ × c f3 (n) (n = L f (2) , ..., L f (3) -1)
u '(n) = g p4 ^ × v (n) + g c4 ^ × c f4 (n) (n = L f (3) , ..., L f (4) -1)
 また、線形予測情報LPC info、ピッチ周期符号CT,CT,CT,CT、コードインデックスCf1,Cf2,Cf3,Cf4、および利得符号GAf1,GAf2,GAf3,GAf4を含む「励振パラメータ」がパラメータ符号化部119に入力される。パラメータ符号化部119は、励振パラメータに対応する符号であるビットストリームBS(符号)を生成して出力する。 Also, linear prediction information LPC info, pitch period codes CT 1 , CT 2 , CT 3 , CT 4 , code indexes C f1 , C f2 , C f3 , C f4 , and gain codes GA f1 , GA f2 , GA f3 , GA The “excitation parameter” including f4 is input to the parameter encoding unit 119. The parameter encoding unit 119 generates and outputs a bit stream BS (code) that is a code corresponding to the excitation parameter.
 <復号>
 符号化装置11(図1)のパラメータ符号化部119から出力されたビットストリームBSは、入力符号として復号装置12(図2)のパラメータ復号部129に入力される。パラメータ復号部129は、ビットストリームBSから得られた線形予測情報LPC info、ピッチ周期符号CT,CT,CT,CTを復号して得られたピッチ周期T',T',T',T'、コードインデックスCf1,Cf2,Cf3,Cf4、ならびに利得符号GAf1,GAf2,GAf3,GAf4を復号して得られた復号ピッチ利得gp1^,gp2^,gp3^,gp4^および復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を出力する。なお、パラメータ復号部129は、符号化装置11の利得量子化部118に備えられた利得符号帳と同じ符号帳(例えば、表1)を用いて利得符号GAf1,GAf2,GAf3,GAf4を可変長復号し、復号ピッチ利得gp1^,gp2^,gp3^,gp4^および復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を得る。
<Decryption>
The bit stream BS output from the parameter encoding unit 119 of the encoding device 11 (FIG. 1) is input as an input code to the parameter decoding unit 129 of the decoding device 12 (FIG. 2). The parameter decoding unit 129 decodes the linear prediction information LPC info obtained from the bit stream BS and the pitch period codes CT 1 , CT 2 , CT 3 , CT 4, and the pitch periods T 1 ′, T 2 ′, Decoding pitch gain g p1 ^ obtained by decoding T 3 ′, T 4 ′, code indexes C f1 , C f2 , C f3 , C f4 , and gain codes GA f1 , GA f2 , GA f3 , GA f4 g p2 ^, g p3 ^, g p4 ^ and decoded fixed codebook gains g c1 ^, g c2 ^, g c3 ^, g c4 ^ are output. The parameter decoding unit 129 uses the same codebook (for example, Table 1) as the gain codebook provided in the gain quantization unit 118 of the encoding device 11 to obtain the gain codes GAf1 , GAf2 , GAf3 , GA. f4 is subjected to variable length decoding to obtain decoding pitch gains g p1 , g p2 , g p3 , g p4, and decoding fixed codebook gains g c1 , g c2 , g c3 , g c4
 固定符号帳123は、固定符号帳選択部125の制御に基づき、入力されたコードインデックスCf1,Cf2,Cf3,Cf4を復号し、当該フレームに対応するパルス系列cf1,cf2,cf3,cf4を得て出力する。適応符号帳122は、入力されたピッチ周期T’,T’,T’,T’で特定される適応信号成分v’(n)(n=0,...,L-1)を出力する。 The fixed codebook 123 decodes the input code indexes C f1 , C f2 , C f3 , and C f4 based on the control of the fixed codebook selection unit 125, and the pulse sequences c f1 , c f2 , c f3 and c f4 are obtained and output. The adaptive codebook 122 has adaptive signal components v ′ (n) (n = 0,..., L−1) specified by the inputted pitch periods T 1 ′, T 2 ′, T 3 ′, T 4 ′. ) Is output.
 パルス系列cf1,cf2,cf3,cf4に復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を乗算して得られるサンプル列と、適応信号成分v’(n)(n=0,...,L-1)に復号ピッチ利得gp1^,gp2^,gp3^,gp4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u’(n)(n=0,...,L-1)が、適応符号帳122に追加される。
  u'(n)=gp1^×v'(n)+gc1^×cf1(n)(n=Lf(0),...,Lf(1)-1)
  u'(n)=gp2^×v'(n)+gc2^×cf2(n)(n=Lf(1),...,Lf(2)-1)
  u'(n)=gp3^×v'(n)+gc3^×cf3(n)(n=Lf(2),...,Lf(3)-1)
  u'(n)=gp4^×v'(n)+gc4^×cf4(n)(n=Lf(3),...,Lf(4)-1)
 また、励振信号u’(n)(n=0,...,L-1)に、線形予測情報LPC infoによって特定される全極型の合成フィルタ127が適用され、それによって生成された合成信号x’(n)(n=0,...,L-1)が出力される。
A sample sequence obtained by multiplying the pulse sequences c f1 , c f2 , c f3 , and c f4 by decoding fixed codebook gains g c1 ^, g c2 ^, g c3 ^, g c4 ^, and an adaptive signal component v ′ ( n) a sample sequence obtained by multiplying (n = 0,..., L−1) by decoding pitch gains g p1 ^, g p2 ^, g p3 ^, g p4 ^ for each corresponding sample The added excitation signals u ′ (n) (n = 0,..., L−1) are added to the adaptive codebook 122 as follows.
u '(n) = g p1 ^ × v' (n) + g c1 ^ × c f1 (n) (n = L f (0) , ..., L f (1) -1)
u '(n) = g p2 ^ × v' (n) + g c2 ^ × c f2 (n) (n = L f (1) , ..., L f (2) -1)
u '(n) = g p3 ^ × v' (n) + g c3 ^ × c f3 (n) (n = L f (2) , ..., L f (3) -1)
u '(n) = g p4 ^ × v' (n) + g c4 ^ × c f4 (n) (n = L f (3) , ..., L f (4) -1)
Further, an all-pole synthesis filter 127 specified by the linear prediction information LPC info is applied to the excitation signal u ′ (n) (n = 0,..., L−1), and the synthesis generated thereby. A signal x ′ (n) (n = 0,..., L−1) is output.
 <その他の変形例等>
 本発明は上述の実施形態に限定されるものではない。例えば、上述の実施形態では、線形予測残差残差信号を固定符号帳と適応符号帳と利得符号帳を用いて符号化する、いわゆるCELP符号化における利得の符号化に本発明を適用する例を示した。しかしながら、線形予測残差信号ではなく入力音響信号そのものを符号化対象とするものであっても、音響信号ではない時系列信号を符号化対象とするものであっても、固定符号帳と適応符号帳の何れかを備えないものであっても、固定符号帳と適応符号帳の何れかを複数備えるものであっても、固定符号帳や適応符号帳を用いる符号化の代わりにその他のサンプル列の符号化方法を採用したものであっても、何らかの方法によりサンプル列に対応する符号である波形情報符号を得られる符号化方法であり、かつ、波形情報符号に対応するサンプル列に量子化された利得(以下「量子化済利得」という)を乗算して得られる波形サンプル列と入力信号とが与えられ、入力信号の可変長の利得符号を得る符号化であれば、本発明を適用できる。入力信号は、例えば時系列信号である。入力信号の例は、音響信号、映像信号、生体信号、地震波信号、センサーアレイ信号などである。入力信号は時間領域の信号であってもよいし、周波数領域の信号であってもよい。すなわち、符号化装置が、量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、当該複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数区間ごとに、指標値Dが最も小さくなるインデックスを利得符号として得てもよい。
<Other variations, etc.>
The present invention is not limited to the above-described embodiment. For example, in the above-described embodiment, an example in which the present invention is applied to gain encoding in so-called CELP encoding in which a linear prediction residual signal is encoded using a fixed codebook, an adaptive codebook, and a gain codebook. showed that. However, even if the input acoustic signal itself is not the linear prediction residual signal but is the encoding target, or the time series signal that is not the acoustic signal is the encoding target, the fixed codebook and the adaptive code Even if it does not have any of the books, or has more than one of the fixed codebook and adaptive codebook, other sample sequences instead of encoding using the fixed codebook or adaptive codebook Even if the encoding method is adopted, it is an encoding method that can obtain a waveform information code that is a code corresponding to the sample sequence by some method, and is quantized to a sample sequence corresponding to the waveform information code. The present invention can be applied to any coding that is obtained by multiplying a gain sample (hereinafter referred to as “quantized gain”) and a waveform sample sequence obtained by multiplying an input signal and obtaining a variable-length gain code of the input signal. . The input signal is, for example, a time series signal. Examples of input signals are acoustic signals, video signals, biological signals, seismic wave signals, sensor array signals, and the like. The input signal may be a time domain signal or a frequency domain signal. That is, the encoding device includes a gain codebook in which a plurality of sets of quantized gain candidates or function values thereof and indexes are stored, and the plurality of indexes include those having different numbers of bits. cage, each time or frequency intervals may be obtained an index index value D U is the smallest as a gain code.
 波形情報符号とは、波形情報符号を復号することによりサンプル列を特定することが可能な符号であり、上述の実施形態におけるコードインデックスやピッチ符号やこれらを代替するような符号、たとえば、標本化・量子化されたPCM形式のサンプルを表す符号、である。指標値Dは、歪みDが大きいほど大きくなり、かつ、波形サンプル列を得るための量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる値である。歪Dは、波形情報符号に対応するサンプル列に量子化済利得の候補を乗算して得られる波形サンプル列と入力信号との歪みであるか、または、第1から第ΓまでのΓ(Γは2以上の整数)個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列(Γ個の波形サンプル列)、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みである。波形情報符号に対応するサンプル列は、例えば、波形情報符号を復号することにより得られるサンプル列そのものや、波形情報符号を復号することにより得られるサンプル列を、合成フィルタに通して得られたものである。例えば、指標値Dは、歪みDとインデックスのビット数が大きいほど大きくなる係数とを加算または乗算して得られる値である。インデックスのビット数が大きいほど大きくなる係数の例は、インデックスのビット数が大きいほど大きくなる値を指数に持つ、べき乗値である。指標値Dの具体例は、前述の式(4)(5)(7)(10)(11)などである。 The waveform information code is a code that can specify a sample string by decoding the waveform information code. The code index, the pitch code, and a code that replaces these in the above-described embodiment, for example, sampling A code representing a quantized PCM format sample. The index value DU is a value that increases as the distortion D increases, and increases as the number of bits of an index corresponding to a quantized gain candidate for obtaining a waveform sample sequence increases. The distortion D is a distortion between the waveform sample sequence obtained by multiplying the sample sequence corresponding to the waveform information code by the quantized gain candidates and the input signal, or the first to Γ Γ (Γ Is obtained by multiplying each sample of the sample sequence corresponding to γth (γ is an integer not less than 1 and not more than Γ) waveform information codes by the γth quantized gain candidates. This is a distortion of the total waveform sample sequence obtained by adding the γth waveform sample sequence (Γ waveform sample sequences) for each corresponding sample and the input signal. The sample sequence corresponding to the waveform information code is obtained by, for example, passing the sample sequence itself obtained by decoding the waveform information code or the sample sequence obtained by decoding the waveform information code through the synthesis filter. It is. For example, the index value DU is a value obtained by adding or multiplying the distortion D and a coefficient that increases as the number of bits of the index increases. An example of a coefficient that increases as the number of bits of the index increases is a power value having an exponent with a value that increases as the number of bits of the index increases. Specific examples of the index value D U is like the above-mentioned formula (4) (5) (7) (10) (11).
 図3に例示する符号化装置21は、Θ個の波形情報符号帳211-1,…,211-Θと符号化部212とを有する。ただし、Θは1以上の整数であり、符号化部212は利得量子化部218を含む。 The encoding apparatus 21 illustrated in FIG. 3 includes Θ waveform information codebooks 211-1,..., 211-Θ and an encoding unit 212. However, Θ is an integer of 1 or more, and the encoding unit 212 includes a gain quantization unit 218.
 利得量子化部218は、量子化済利得の候補αθまたはその関数値とインデックスとの組を複数個格納している。ただしθ=1,…,Θである。すなわち、利得量子化部218は、量子化済利得の候補αまたはその関数値、量子化済利得の候補αまたはその関数値、・・・、および量子化済利得の候補αΘまたはその関数値、ならびにインデックスからなる組を複数個格納している。すなわち、Θ=1の場合、利得量子化部218は、量子化済利得の候補αまたはその関数値とインデックスとの組を複数個格納している。Θ=Γ≧2の場合、利得量子化部218は、第1から第Γの量子化済利得の候補αγまたはその関数値の組とインデックスとの組を複数個格納している。当該複数個のインデックスにはビット数が異なるものが含まれている。 The gain quantization unit 218 stores a plurality of sets of quantized gain candidates α θ or their function values and indexes. However, θ = 1,. That is, the gain quantizing unit 218 performs the quantized gain candidate α 1 or a function value thereof, the quantized gain candidate α 2 or the function value thereof ,. Multiple sets of function values and indexes are stored. That is, when Θ = 1, gain quantization section 218 stores a plurality of sets of quantized gain candidates α 1 or their function values and indexes. When Θ = Γ ≧ 2, the gain quantization unit 218 stores a plurality of first to Γ quantized gain candidates α γ or a set of function values and indexes. The plurality of indexes include those having different numbers of bits.
 符号化部212は、時間区間ごとに、波形情報符号E,…,EΘを得、指標値Dが最も小さくなるインデックスを利得符号として得、波形情報符号E,…,EΘおよび利得符号に対応するビットストリームを出力する。インデックスの選択は、利得量子化部218によって行われる。前述のように、指標値Dは、歪みDが大きいほど大きくなり、かつ、量子化済利得の候補αθ(θ=1,…,Θ)に対応するインデックスのビット数が大きいほど大きくなる値である。ただし、図3の例の歪みDは、波形情報符号Eθに対応するサンプル列Yθのそれぞれのサンプルに量子化済利得の候補αθを乗算して得られるサンプル列αθθについてのα+…+αΘΘと、入力信号Xと、の歪みである。また、波形情報符号Eθに対応するサンプル列Yθの例は、波形情報符号Eθに対する波形情報符号帳211-θからのサンプル列を入力信号Xに対応する合成フィルタに通して得られるサンプル列や、波形情報符号Eθに対する波形情報符号帳211-θからのサンプル列などである。 The encoding unit 212 obtains the waveform information codes E 1 ,..., E Θ for each time interval, obtains the index with the smallest index value D U as the gain code, and obtains the waveform information codes E 1 ,. A bit stream corresponding to the gain code is output. The index is selected by the gain quantization unit 218. As described above, the index value D U becomes larger as the distortion D is large, and the candidate alpha theta of quantized gain (θ = 1, ..., Θ ) increases the larger the number of bits of the index corresponding to the Value. However, the distortion D in the example of FIG. 3 is obtained with respect to the sample sequence α θ Y θ obtained by multiplying each sample of the sample sequence Y θ corresponding to the waveform information code E θ by the quantized gain candidate α θ . α 1 Y 1 +... + α Θ Y Θ and the distortion of the input signal X. An example of the sample string Y θ corresponding to the waveform information code E θ is a sample obtained by passing the sample string from the waveform information code book 211-θ for the waveform information code E θ through the synthesis filter corresponding to the input signal X. column and the sample sequence from the waveform information codebook 211-theta for waveform information code E theta and the like.
 図3に例示する符号化装置21は、第一実施形態の符号化装置、すなわち、図1に例示した符号化装置11を包含するものである。具体的には、図3の符号化装置21であって、Θ=2であり、かつ、波形情報符号帳211-1が固定符号帳113であり、波形情報符号帳211-2が適応符号帳112であり、利得量子化部218が利得量子化部118である構成は第一実施形態の符号化装置11そのものである。この場合は、利得量子化部218における量子化済利得の候補αは利得量子化部118における量子化済固定符号帳利得の候補βであり、利得量子化部218における量子化済利得の候補αは利得量子化部118における量子化済ピッチ利得の候補αであり、波形情報符号Eは第一実施形態のコードインデックスであり、波形情報符号Eは第一実施形態のピッチ符号であり、入力信号Xは第一実施形態の入力音響信号である。 The encoding device 21 illustrated in FIG. 3 includes the encoding device of the first embodiment, that is, the encoding device 11 illustrated in FIG. Specifically, in the encoding device 21 of FIG. 3, Θ = 2, the waveform information codebook 211-1 is the fixed codebook 113, and the waveform information codebook 211-2 is the adaptive codebook. 112, and the configuration in which the gain quantization unit 218 is the gain quantization unit 118 is the encoding device 11 itself of the first embodiment. In this case, the quantized gain candidate α 1 in the gain quantizing unit 218 is the quantized fixed codebook gain candidate β in the gain quantizing unit 118, and the quantized gain candidate in the gain quantizing unit 218 α 2 is a quantized pitch gain candidate α in the gain quantization unit 118, the waveform information code E 1 is the code index of the first embodiment, and the waveform information code E 2 is the pitch code of the first embodiment. Yes, the input signal X is the input acoustic signal of the first embodiment.
 符号化装置21に対応する復号装置は、量子化済利得の候補αθ(θ=1,…,Θ)またはその関数値とインデックスとの組を複数個格納している。これらの組は、利得量子化部218に格納された組と同一である。復号装置は、入力されたビットストリームが含む波形情報符号E,…,EΘおよび利得符号を用い、時間区間ごとに、波形情報符号Eθに対応するサンプル列Yθのそれぞれのサンプルに利得符号が表す量子化済利得の候補αθを乗算して得られるサンプル列αθθについてのサンプル列α+…+αΘΘを出力する。 The decoding apparatus corresponding to the encoding apparatus 21 stores a plurality of sets of quantized gain candidates α θ (θ = 1,..., Θ) or their function values and indexes. These sets are the same as the sets stored in the gain quantization unit 218. The decoding apparatus uses the waveform information codes E 1 ,..., E Θ and the gain code included in the input bit stream, and gains gain for each sample of the sample sequence Y θ corresponding to the waveform information code E θ for each time interval. The sample sequence α 1 Y 1 +... + Α Θ Y Θ is output for the sample sequence α θ Y θ obtained by multiplying the quantized gain candidate α θ represented by the code.
 上記の実施形態では、サブフレームごとに、指標値Dが最も小さくなるインデックスを利得符号として得た。しかしながら、フレームごとに、指標値Dが最も小さくなるインデックスを利得符号として得てもよいし、複数個のサブフレームまたはフレームごとに、指標値Dが最も小さくなるインデックスを利得符号として得てもよい。 In the above embodiments, for each sub-frame, to obtain an index index value D U is the smallest as a gain code. However, for each frame, it may be obtained an index index value D U is the smallest as a gain code, for each plurality of sub-frame or frame, to obtain an index index value D U is the smallest as a gain code Also good.
 その他、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。 In addition, the various processes described above are not only executed in time series according to the description, but may be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. Needless to say, other modifications are possible without departing from the spirit of the present invention.
 また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。 In addition, when the above configuration is realized by a computer, the processing contents of the functions that each device should have are described by a program. The processing functions are realized on the computer by executing the program on the computer.
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。 The program describing the processing contents can be recorded on a computer-readable recording medium. An example of a computer-readable recording medium is a non-transitory recording medium. Examples of such a recording medium are a magnetic recording device, an optical disk, a magneto-optical recording medium, a semiconductor memory, and the like.
 このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 This program is distributed, for example, by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
 このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。 For example, a computer that executes such a program first stores a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, this computer reads the program stored in its own recording device and executes the process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially.
 上記実施形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部がハードウェアで実現されてもよい。 In the above embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.
11,21 符号化装置
12 復号装置
11, 21 Coding device 12 Decoding device

Claims (26)

  1.  量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、波形情報符号に対応するサンプル列の各サンプルに上記量子化済利得の候補を乗算して得られる波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化部を有する符号化装置。 A gain codebook storing a plurality of sets of quantized gain candidates or their function values and indexes is stored, and the plurality of indexes include those having different numbers of bits, and time or frequency intervals Each time, the larger the distortion D of the waveform sample sequence obtained by multiplying each sample of the sample sequence corresponding to the waveform information code by the quantized gain candidate and the input signal, the larger the waveform waveform becomes. Coding having a gain quantization unit for obtaining, as a gain code, the index value D U that becomes the larger as the number of bits of the index corresponding to the quantized gain candidate for obtaining the sample sequence becomes larger apparatus.
  2.  第1から第Γ(Γは2以上の整数)の量子化済利得の候補またはその関数値の組とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、第1から第ΓまでのΓ個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記合計波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化部を有する符号化装置。 A gain codebook in which a plurality of first to Γ (Γ is an integer of 2 or more) quantized gain candidates or pairs of function values thereof and an index are stored; Samples corresponding to Γ-th γ-th (γ is an integer between 1 and Γ) waveform information codes from 1st to Γ are included for each time or frequency interval, including samples having different numbers of bits. A total waveform sample sequence obtained by adding for each corresponding sample a γth waveform sample sequence obtained by multiplying each sample of the sequence by the γth quantized gain candidate, and an input signal, The index becomes smaller as the distortion D becomes larger, and the index value D U becomes larger as the number of bits of the index corresponding to the quantized gain candidates for obtaining the total waveform sample sequence becomes larger. , Gain sign Encoding apparatus having a gain quantization unit that may be.
  3.  上記波形情報符号に対応するサンプル列は、上記波形情報符号を復号することにより得られるサンプル列を、合成フィルタに通して得られたものである、
    請求項1または2の符号化装置。
    The sample sequence corresponding to the waveform information code is obtained by passing a sample sequence obtained by decoding the waveform information code through a synthesis filter.
    The encoding apparatus according to claim 1 or 2.
  4.  所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
     量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間区間ごとに、固定符号帳からのサンプル列を合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得る利得量子化部を有する、符号化装置。
    For each predetermined time interval, a code index for specifying a sample string from a fixed codebook, a pitch code for specifying a pitch period, a quantized fixed codebook gain, and a quantized pitch gain corresponding to an input acoustic signal An encoding device for obtaining a corresponding gain code,
    A gain codebook in which a plurality of quantized fixed codebook gain candidates or function values thereof and quantized pitch gain candidates or function value / index pairs are stored, and the plurality of indexes include bits In each time interval, the quantized fixed codebook gain candidate β is added to each sample of the sample sequence Z obtained by passing the sample sequence from the fixed codebook through the synthesis filter. A sample sequence βZ obtained by multiplication, and a sample sequence αY obtained by multiplying each sample of the sample sequence Y obtained by passing a past excitation signal through the synthesis filter by the quantized pitch gain candidate α , For each corresponding sample, the distortion D between the composite signal sample sequence αY + βZ and the input acoustic signal X, and the larger the number of bits of the index, the larger the value. The number, an index index value D U is the smallest obtained by adding or multiplying, a gain quantization section for obtaining a gain code, the encoding apparatus.
  5.  入力音響信号を所定時間区間ごとに符号化する装置であって、
     時間区間ごとに、上記入力音響信号に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報を得る線形予測分析部と、
     時間区間ごとに、固定符号帳に含まれる複数のサンプル列のうち上記入力音響信号に対応するサンプル列を特定するコードインデックスを得る固定符号帳探索部と、
     時間区間ごとに、上記入力音響信号に対応するピッチ周期を特定するピッチ符号を得る適応符号帳探索部と、
     時間区間ごとに、量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号を得る利得量子化部と、
     上記コードインデックスに対応する固定符号帳からのサンプル列のそれぞれのサンプルに上記量子化済固定符号帳利得を乗算して得られるサンプル列と、上記ピッチ周期に対応するサンプル数だけ過去の励振信号のサンプル列のそれぞれのサンプルに上記量子化済ピッチ利得を乗算して得られるサンプル列と、を対応するサンプル毎に加算した励振信号を格納する適応符号帳と、を少なくとも備えており、
     上記利得量子化部は、
     量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、
     上記複数個のインデックスにはビット数が異なるものが含まれており、
     時間区間ごとに、上記コードインデックスに対応する固定符号帳からのサンプル列を上記線形予測係数またはこれと互換な係数による合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、上記ピッチ周期に対応するサンプル数だけ過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得るものである。
    A device that encodes an input acoustic signal every predetermined time interval,
    A linear prediction analysis unit that obtains linear prediction information that is a code for specifying a linear prediction coefficient corresponding to the input acoustic signal or a coefficient compatible with the input acoustic signal for each time interval;
    A fixed codebook search unit for obtaining a code index for identifying a sample sequence corresponding to the input acoustic signal among a plurality of sample sequences included in the fixed codebook for each time interval;
    An adaptive codebook search unit for obtaining a pitch code for specifying a pitch period corresponding to the input acoustic signal for each time interval;
    A gain quantization unit for obtaining a gain code corresponding to a quantized fixed codebook gain and a quantized pitch gain for each time interval;
    A sample sequence obtained by multiplying each sample of the sample sequence from the fixed codebook corresponding to the code index by the quantized fixed codebook gain, and the number of past excitation signals by the number of samples corresponding to the pitch period A sample sequence obtained by multiplying each sample of the sample sequence by the quantized pitch gain, and an adaptive codebook for storing an excitation signal obtained by adding each sample corresponding to the sample sequence,
    The gain quantization unit is
    A gain codebook in which a plurality of quantized fixed codebook gain candidates or function values thereof and quantized pitch gain candidates or pairs of function values and indexes are stored;
    The plurality of indexes include those with different numbers of bits,
    For each time interval, the quantized fixed value is applied to each sample of the sample string Z obtained by passing the sample string from the fixed codebook corresponding to the code index through a synthesis filter using the linear prediction coefficient or a coefficient compatible therewith. The quantization is performed on each sample of the sample sequence βZ obtained by multiplying the codebook gain candidate β and the sample sequence Y obtained by passing past excitation signals by the number of samples corresponding to the pitch period through the synthesis filter. The distortion D of the composite signal sample sequence αY + βZ obtained by multiplying the corresponding sample by the sample sequence αY obtained by multiplying the completed pitch gain candidate α and the number of bits of the index are large. and more larger coefficient, the index of addition or multiplication with index value D U obtained becomes minimum, and as a gain code To get.
  6.  上記指標値Dは、bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とし、γを予め定めた正の定数としたD=D{1+γb}により求まる値である、請求項1から5の何れかに記載の符号化装置。 The index value D U is obtained by D U = D {1 + γb} where b is the number of bits of the index, N is the number of samples of the input acoustic signal in the time interval, and γ is a predetermined positive constant. The encoding device according to claim 1, wherein the encoding device is a value.
  7.  上記指標値Dは、bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数としたD=D{1+(2log2)b/N}により求まる値である、請求項1から5の何れかに記載の符号化装置。 The index value D U is a value obtained by D U = D {1+ (2log2) b / N} where b is the number of bits of the index and N is the number of samples of the input acoustic signal in the time interval. The encoding device according to any one of claims 1 to 5.
  8.  上記指標値Dは、bを上記インデックスのビット数とし、Bを上記利得符号帳に格納された全ての量子化済ピッチ利得の候補またはその関数値と量子化済固定符号帳利得の候補またはその関数値の組を均一長符号化するために必要な符号のビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数としたD=D{1+(2log2)(b-B)/N}により求まる値である、請求項1から5の何れかに記載の符号化装置。 The index value DU is such that b is the number of bits of the index and B is a candidate for all quantized pitch gains stored in the gain codebook or a function value thereof and a candidate for quantized fixed codebook gain or D U = D {1+ (2log2) (b−B) where the set of function values is the number of bits of a code necessary for performing uniform length coding and N is the number of samples of the input acoustic signal in the time interval. The encoding apparatus according to claim 1, which is a value obtained by / N}.
  9.  上記指標値Dは、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値wより小さな値とし、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、現在の時間区間のwを予め定めた正の値wより大きな値とし、
     bを上記インデックスのビット数とした
     D=D(1+wb)
    により求まる値である、請求項1から5の何れかに記載の符号化装置。
    The index value DU is
    If the number of bits of the gain code obtained in the past time interval for a predetermined time is smaller than the average number of bits of the index stored in the gain codebook, the current time interval w is set to a predetermined positive value w A value less than 0 ,
    When the number of bits of the gain code obtained in the past time interval for a predetermined time is larger than the average number of bits of the index stored in the gain codebook, the current time interval w is set to a predetermined positive value w A value greater than 0 ,
    b was the number of bits of the index D U = D (1 + wb )
    The encoding device according to claim 1, wherein the encoding device is a value obtained by:
  10.  上記利得量子化部には、利得符号帳が複数個備えられており、
     上記利得量子化部は、wの値ごとに予め定められた利得符号帳を用いて利得符号を得る、請求項9記載の符号化装置。
    The gain quantization unit includes a plurality of gain codebooks,
    The encoding apparatus according to claim 9, wherein the gain quantization unit obtains a gain code using a gain codebook determined in advance for each value of w.
  11.  上記指標値Dは、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、現在の時間区間のvを1より大きな値とし、
     bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
     D=D{1+v(2log2)b/N}
    により求まる値である、請求項1から5の何れかに記載の符号化装置。
    The index value DU is
    When the number of bits of the gain code obtained in the past time interval for a predetermined time is smaller than the average number of bits of the index stored in the gain codebook, v in the current time interval is set to a value smaller than 1.
    When the number of bits of the gain code obtained in the past time interval for a predetermined time is larger than the average number of bits of the index stored in the gain codebook, v in the current time interval is set to a value greater than 1,
    The b and the number of bits of the index, D the N was the number of samples of the input audio signals in the time interval U = D {1 + v ( 2log2) b / N}
    The encoding device according to claim 1, wherein the encoding device is a value obtained by:
  12.  上記利得量子化部には、利得符号帳が複数個備えられており、
     上記利得量子化部は、vの値ごとに予め定められた利得符号帳を用いて利得符号を得る、請求項11記載の符号化装置。
    The gain quantization unit includes a plurality of gain codebooks,
    12. The encoding apparatus according to claim 11, wherein the gain quantization unit obtains a gain code using a gain codebook predetermined for each value of v.
  13.  量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、波形情報符号に対応するサンプル列の各サンプルに上記量子化済利得の候補を乗算して得られる波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化ステップを有する符号化方法。 A gain codebook storing a plurality of sets of quantized gain candidates or their function values and indexes is stored, and the plurality of indexes include those having different numbers of bits, and time or frequency intervals Each time, the larger the distortion D of the waveform sample sequence obtained by multiplying each sample of the sample sequence corresponding to the waveform information code by the quantized gain candidate and the input signal, the larger the waveform waveform becomes. Coding having a gain quantization step for obtaining, as a gain code, the index value D U that becomes larger as the number of bits of the index corresponding to the quantized gain candidate for obtaining the sample sequence becomes larger Method.
  14.  第1から第Γ(Γは2以上の整数)の量子化済利得の候補またはその関数値の組とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、第1から第ΓまでのΓ個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記合計波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化ステップを有する符号化方法。 A gain codebook in which a plurality of first to Γ (Γ is an integer of 2 or more) quantized gain candidates or pairs of function values thereof and an index are stored; Samples corresponding to Γ-th γ-th (γ is an integer between 1 and Γ) waveform information codes from 1st to Γ are included for each time or frequency interval, including samples having different numbers of bits. A total waveform sample sequence obtained by adding for each corresponding sample a γth waveform sample sequence obtained by multiplying each sample of the sequence by the γth quantized gain candidate, and an input signal, The index becomes smaller as the distortion D becomes larger, and the index value D U becomes larger as the number of bits of the index corresponding to the quantized gain candidates for obtaining the total waveform sample sequence becomes larger. , Gain sign Coding method having a gain quantization step obtained by.
  15.  上記波形情報符号に対応するサンプル列は、上記波形情報符号を復号することにより得られるサンプル列を、合成フィルタに通して得られたものである、
    請求項13または14の符号化方法。
    The sample sequence corresponding to the waveform information code is obtained by passing a sample sequence obtained by decoding the waveform information code through a synthesis filter.
    The encoding method according to claim 13 or 14.
  16.  所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
     量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間区間ごとに、固定符号帳からのサンプル列を合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得る利得量子化ステップを有する、符号化方法。
    For each predetermined time interval, a code index for specifying a sample string from a fixed codebook, a pitch code for specifying a pitch period, a quantized fixed codebook gain, and a quantized pitch gain corresponding to an input acoustic signal A coding method for obtaining a corresponding gain code,
    A gain codebook in which a plurality of quantized fixed codebook gain candidates or function values thereof and quantized pitch gain candidates or function value / index pairs are stored, and the plurality of indexes include bits In each time interval, the quantized fixed codebook gain candidate β is added to each sample of the sample sequence Z obtained by passing the sample sequence from the fixed codebook through the synthesis filter. A sample sequence βZ obtained by multiplication, and a sample sequence αY obtained by multiplying each sample of the sample sequence Y obtained by passing a past excitation signal through the synthesis filter by the quantized pitch gain candidate α , For each corresponding sample, the distortion D between the composite signal sample sequence αY + βZ and the input acoustic signal X, and the larger the number of bits of the index, the larger the value. The number, an index index value D U is the smallest obtained by adding or multiplying, a gain quantization step to obtain a gain code, the coding method.
  17.  入力音響信号を所定時間区間ごとに符号化する方法であって、
     時間区間ごとに、上記入力音響信号に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報を得る線形予測ステップと、
     時間区間ごとに、固定符号帳に含まれる複数のサンプル列のうち上記入力音響信号に対応するサンプル列を特定するコードインデックスを得る固定符号帳探索ステップと、
     時間区間ごとに、上記入力音響信号に対応するピッチ周期を特定するピッチ符号を得る適応符号帳探索ステップと、
     時間区間ごとに、量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号を得る利得量子化ステップと、
     上記コードインデックスに対応する固定符号帳からのサンプル列のそれぞれのサンプルに上記量子化済固定符号帳利得を乗算して得られるサンプル列と、上記ピッチ周期に対応するサンプル数だけ過去の励振信号のサンプル列のそれぞれのサンプルに上記量子化済ピッチ利得を乗算して得られるサンプル列と、を対応するサンプル毎に加算した励振信号を適応符号帳に格納するステップと、を少なくとも備えており、
     量子化済固定符号帳利得またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、
     上記複数個のインデックスにはビット数が異なるものが含まれており、
     上記利得量子化ステップは、
     時間区間ごとに、上記コードインデックスに対応する固定符号帳からのサンプル列を上記線形予測係数またはこれと互換な係数による合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、上記ピッチ周期に対応するサンプル数だけ過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得るものである、符号化方法。
    A method of encoding an input acoustic signal every predetermined time interval,
    A linear prediction step for obtaining linear prediction information, which is a code for specifying a linear prediction coefficient corresponding to the input acoustic signal or a coefficient compatible with the input acoustic signal for each time interval;
    A fixed codebook search step for obtaining a code index for identifying a sample sequence corresponding to the input acoustic signal among a plurality of sample sequences included in the fixed codebook for each time interval;
    An adaptive codebook search step for obtaining a pitch code specifying a pitch period corresponding to the input acoustic signal for each time interval;
    A gain quantization step for obtaining a gain code corresponding to a quantized fixed codebook gain and a quantized pitch gain for each time interval;
    A sample sequence obtained by multiplying each sample of the sample sequence from the fixed codebook corresponding to the code index by the quantized fixed codebook gain, and the number of past excitation signals by the number of samples corresponding to the pitch period A sample sequence obtained by multiplying each sample of the sample sequence by the quantized pitch gain, and storing in the adaptive codebook an excitation signal obtained by adding each sample corresponding to the sample sequence,
    A gain codebook in which a plurality of candidates for quantized fixed codebook gain or its function value and quantized pitch gain or a set of its function value and index are stored;
    The plurality of indexes include those with different numbers of bits,
    The gain quantization step is:
    For each time interval, the quantized fixed value is applied to each sample of the sample string Z obtained by passing the sample string from the fixed codebook corresponding to the code index through a synthesis filter using the linear prediction coefficient or a coefficient compatible therewith. The quantization is performed on each sample of the sample sequence βZ obtained by multiplying the codebook gain candidate β and the sample sequence Y obtained by passing past excitation signals by the number of samples corresponding to the pitch period through the synthesis filter. The distortion D of the composite signal sample sequence αY + βZ obtained by multiplying the corresponding sample by the sample sequence αY obtained by multiplying the completed pitch gain candidate α and the number of bits of the index are large. and more larger coefficient, the index of addition or multiplication with index value D U obtained becomes minimum, and as a gain code An encoding method to be obtained.
  18.  上記指標値Dは、bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とし、γを予め定めた正の定数としたD=D{1+γb}により求まる値である、請求項13から17の何れかに記載の符号化方法。 The index value D U is obtained by D U = D {1 + γb} where b is the number of bits of the index, N is the number of samples of the input acoustic signal in the time interval, and γ is a predetermined positive constant. The encoding method according to claim 13, wherein the encoding method is a value.
  19.  上記指標値Dは、bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数としたD=D{1+(2log2)b/N}により求まる値である、請求項13から17の何れかに記載の符号化方法。 The index value D U is a value obtained by D U = D {1+ (2log2) b / N} where b is the number of bits of the index and N is the number of samples of the input acoustic signal in the time interval. The encoding method according to claim 13.
  20.  上記指標値Dは、bを上記インデックスのビット数とし、Bを上記利得符号帳に格納された全ての量子化済ピッチ利得の候補またはその関数値と量子化済固定符号帳利得の候補またはその関数値の組を均一長符号化するために必要な符号のビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数としたD=D{1+(2log2)(b-B)/N}により求まる値である、請求項13から17の何れかに記載の符号化方法。 The index value DU is such that b is the number of bits of the index and B is a candidate for all quantized pitch gains stored in the gain codebook or a function value thereof and a candidate for quantized fixed codebook gain or D U = D {1+ (2log2) (b−B) where the set of function values is the number of bits of a code necessary for performing uniform length coding and N is the number of samples of the input acoustic signal in the time interval. The encoding method according to claim 13, wherein the encoding method is a value obtained by / N}.
  21.  上記指標値Dは、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値wより小さな値とし、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、現在の時間区間のwを予め定めた正の値wより大きな値とし、
     bを上記インデックスのビット数とした
     D=D(1+wb)
    により求まる値である、請求項13から17の何れかに記載の符号化方法。
    The index value DU is
    If the number of bits of the gain code obtained in the past time interval for a predetermined time is smaller than the average number of bits of the index stored in the gain codebook, the current time interval w is set to a predetermined positive value w A value less than 0 ,
    When the number of bits of the gain code obtained in the past time interval for a predetermined time is larger than the average number of bits of the index stored in the gain codebook, the current time interval w is set to a predetermined positive value w A value greater than 0 ,
    b was the number of bits of the index D U = D (1 + wb )
    The encoding method according to claim 13, wherein the encoding method is a value obtained by:
  22.  利得符号帳が複数個備えられており、
     上記利得量子化ステップは、wの値ごとに予め定められた利得符号帳を用いて利得符号を得るステップである、請求項21記載の符号化方法。
    There are multiple gain codebooks,
    The encoding method according to claim 21, wherein the gain quantization step is a step of obtaining a gain code using a gain codebook predetermined for each value of w.
  23.  上記指標値Dは、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、現在の時間区間のvを1より大きな値とし、
     bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
     D=D{1+v(2log2)b/N}
    により求まる値である、請求項13から17の何れかに記載の符号化方法。
    The index value DU is
    When the number of bits of the gain code obtained in the past time interval for a predetermined time is smaller than the average number of bits of the index stored in the gain codebook, v in the current time interval is set to a value smaller than 1.
    When the number of bits of the gain code obtained in the past time interval for a predetermined time is larger than the average number of bits of the index stored in the gain codebook, v in the current time interval is set to a value greater than 1,
    The b and the number of bits of the index, D the N was the number of samples of the input audio signals in the time interval U = D {1 + v ( 2log2) b / N}
    The encoding method according to claim 13, wherein the encoding method is a value obtained by:
  24.  利得符号帳が複数個備えられており、
     上記利得量子化ステップは、vの値ごとに予め定められた利得符号帳を用いて利得符号を得るステップである、請求項23記載の符号化方法。
    There are multiple gain codebooks,
    24. The encoding method according to claim 23, wherein the gain quantization step is a step of obtaining a gain code using a gain codebook predetermined for each value of v.
  25.  請求項1,4または5の何れかの符号化装置としてコンピュータを機能させるためのプログラム。 A program for causing a computer to function as the encoding device according to claim 1, 4 or 5.
  26.  請求項1,4または5の何れかの符号化装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium storing a program for causing a computer to function as the encoding device according to claim 1, 4 or 5.
PCT/JP2013/055048 2012-02-28 2013-02-27 Encoding device, encoding method, program and recording medium WO2013129439A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014502273A JP5789816B2 (en) 2012-02-28 2013-02-27 Encoding apparatus, method, program, and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012041527 2012-02-28
JP2012-041527 2012-02-28

Publications (1)

Publication Number Publication Date
WO2013129439A1 true WO2013129439A1 (en) 2013-09-06

Family

ID=49082634

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/055048 WO2013129439A1 (en) 2012-02-28 2013-02-27 Encoding device, encoding method, program and recording medium

Country Status (2)

Country Link
JP (1) JP5789816B2 (en)
WO (1) WO2013129439A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004020676A (en) * 2002-06-13 2004-01-22 Hitachi Kokusai Electric Inc Speech coding/decoding method, and speech coding/decoding apparatus
JP2011509426A (en) * 2008-01-04 2011-03-24 ドルビー・インターナショナル・アーベー Audio encoder and decoder
JP2011133637A (en) * 2009-12-24 2011-07-07 Nippon Telegr & Teleph Corp <Ntt> Encoding method, decoding method, encoding device, decoding device, and program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4727413B2 (en) * 2005-12-21 2011-07-20 三菱電機株式会社 Speech encoding / decoding device
WO2008072732A1 (en) * 2006-12-14 2008-06-19 Panasonic Corporation Audio encoding device and audio encoding method
WO2009114656A1 (en) * 2008-03-14 2009-09-17 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
JPWO2011048810A1 (en) * 2009-10-20 2013-03-07 パナソニック株式会社 Vector quantization apparatus and vector quantization method
WO2011083849A1 (en) * 2010-01-08 2011-07-14 日本電信電話株式会社 Encoding method, decoding method, encoder apparatus, decoder apparatus, program and recording medium

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004020676A (en) * 2002-06-13 2004-01-22 Hitachi Kokusai Electric Inc Speech coding/decoding method, and speech coding/decoding apparatus
JP2011509426A (en) * 2008-01-04 2011-03-24 ドルビー・インターナショナル・アーベー Audio encoder and decoder
JP2011133637A (en) * 2009-12-24 2011-07-07 Nippon Telegr & Teleph Corp <Ntt> Encoding method, decoding method, encoding device, decoding device, and program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAKAYOSHI OSHIMA ET AL.: "Variable-length coding of ACELP gain using Entropy-Constrained VQ", INTERNATIONAL SYMPOSIUM ON COMMUNICATIONS AND INFORMATION TECHNOLOGIES (ISCIT), 5 October 2012 (2012-10-05), pages 105 - 109 *

Also Published As

Publication number Publication date
JP5789816B2 (en) 2015-10-07
JPWO2013129439A1 (en) 2015-07-30

Similar Documents

Publication Publication Date Title
US11024319B2 (en) Encoding method, decoding method, encoder, decoder, program, and recording medium
US10056088B2 (en) Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
JP5613781B2 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
WO2012102149A1 (en) Encoding method, encoding device, periodic feature amount determination method, periodic feature amount determination device, program and recording medium
JP3143956B2 (en) Voice parameter coding method
CN110444216B (en) Decoding device, decoding method, and recording medium
EP1267328A2 (en) Method of converting codes between speech coding and decoding systems, and device and program therefor
KR101629661B1 (en) Decoding method, decoding apparatus, program, and recording medium therefor
JP5789816B2 (en) Encoding apparatus, method, program, and recording medium
JP5714172B2 (en) Encoding apparatus, method, program, and recording medium
JP5395649B2 (en) Encoding method, decoding method, encoding device, decoding device, and program
JP6053145B2 (en) Encoding device, decoding device, method, program, and recording medium
JP5762636B2 (en) Encoding device, decoding device, method, program, and recording medium
JP5786044B2 (en) Encoding method, encoding apparatus, decoding method, decoding apparatus, program, and recording medium
JP5800920B2 (en) Encoding method, encoding apparatus, decoding method, decoding apparatus, program, and recording medium

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13755136

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014502273

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13755136

Country of ref document: EP

Kind code of ref document: A1