WO2010140591A1 - 予測次数決定方法、予測次数決定装置、プログラム及び記録媒体 - Google Patents

予測次数決定方法、予測次数決定装置、プログラム及び記録媒体 Download PDF

Info

Publication number
WO2010140591A1
WO2010140591A1 PCT/JP2010/059272 JP2010059272W WO2010140591A1 WO 2010140591 A1 WO2010140591 A1 WO 2010140591A1 JP 2010059272 W JP2010059272 W JP 2010059272W WO 2010140591 A1 WO2010140591 A1 WO 2010140591A1
Authority
WO
WIPO (PCT)
Prior art keywords
prediction
order
code amount
prediction order
quantized
Prior art date
Application number
PCT/JP2010/059272
Other languages
English (en)
French (fr)
Inventor
優 鎌本
登 原田
健弘 守谷
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP2011518456A priority Critical patent/JP5562332B2/ja
Publication of WO2010140591A1 publication Critical patent/WO2010140591A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Definitions

  • the present invention relates to a lossless encoding technique for digital time series signals such as acoustic signals.
  • the input signal is processed every N sample frames.
  • the maximum order of the allowable PARCOR coefficient is Pmax order.
  • the symbol “ ⁇ ” represents multiplication.
  • the residual encoding unit 911 performs entropy encoding on the prediction residual eO (n), for example, and outputs a residual code CeO.
  • the code synthesis unit 913 outputs a combination of the residual code CeO and the coefficient code CkO as a synthesis code CaO.
  • the quantization unit 903 obtains a quantized PARCOR coefficient by quantizing the PARCOR coefficient.
  • the prediction order PO is increased, the prediction residual eO (n) is also reduced, but on the other hand, the amount of code required to transmit the PARCOR coefficient also increases, so the code amount of the composite code CaO is increased. It is necessary to obtain the prediction order PO that is the minimum.
  • the energy of the prediction residual can be estimated using the PARCOR coefficient.
  • the energy EO (1) of the prediction residual when the linear prediction is performed using the PARCOR coefficient KO (1) is expressed by Expression (3).
  • the energy EO (2) of the prediction residual when the second-order linear prediction is performed using the PARCOR coefficient KO (2) is expressed by Expression (4).
  • Equation (6) The entropy of the Gaussian distribution with mean 0 and variance ⁇ 2 (ie, energy divided by N) is expressed by equation (6).
  • Equation (7) The entropy of the Laplace distribution with mean 0 and variance ⁇ 2 (that is, energy divided by N) is expressed by equation (7).
  • Equation (8) the entropy is expressed by Equation (8) with ⁇ as a constant.
  • the value of the constant ⁇ is about 2 in the case of a Gaussian distribution from the equation (6), and is about 1.7 in the case of a Laplace distribution from the equation (7).
  • Equation (9). the entropy HO (PO) of the prediction residual when performing PO-order linear prediction, that is, the average number of estimated bits required for one sample of the prediction residual is given by Equation (9). ).
  • Equation (9) the second term on the right side of Equation (9) depends on the input signal and can be regarded as a constant. Therefore, the value of entropy HO (PO) changes depending on what value the third term on the right side of Equation (9) takes.
  • the third term on the right side also has a value close to 0, so the entropy cannot be lowered and predicted.
  • the average estimated number of bits required for one residual sample cannot be reduced. If KO (1) and KO (2) included in the PARCOR coefficient series KO take values near +1 or -1, the third term on the right side has a negative value, and the entropy is reduced. The average estimated number of bits required for one sample can be reduced.
  • B0 (PO) is a graph represented by the solid line ⁇ in FIG. 2, a prediction order PO that minimizes the estimated code amount of the composite code CaO may be obtained.
  • the quantization accuracy of the PARCOR coefficient is increased, the difference between the PARCOR coefficient sequence KO and the quantized PARCOR coefficient sequence K'O decreases, and the prediction residual eO (n) also decreases.
  • a small amount of code is required to represent the difference code.
  • the amount of code required to represent the quantized PARCOR coefficient sequence K′O indicated by the broken line ⁇ in FIG. 2 increases. Therefore, the estimated code amount of the composite code CaO is not necessarily reduced when the accuracy of the PARCOR coefficient is increased.
  • a PARCOR coefficient sequence KO (KO (1), KO (2)... KO (Pmax)) obtained with signed 8-bit accuracy is input to the quantization unit 903.
  • Step 1: KO (i) is linearly or nonlinearly quantized with 5 bits to obtain K'O (i).
  • Step 2 For each prediction order in a preset range, the estimated code amount of the composite code CaO is obtained using Equation (10) using the unquantized PARCOR coefficient KO (i).
  • Step 3 The prediction order that minimizes the estimated code amount of the composite code CaO obtained in Step 2 is defined as the optimum order PO.
  • the PARCOR coefficient is quantized in order to efficiently send the code. As shown in FIG. 2, if the quantization accuracy of the PARCOR coefficient is increased, the PARCOR coefficient sequence KO and the quantized PARCOR are quantized. Since the difference from the coefficient sequence K′O is reduced and the prediction residual eO (n) is also reduced, the code amount required for the prediction residual is reduced. However, since the number of bits necessary to represent the quantized PARCOR coefficient sequence K′O increases, it is not always better to increase the quantization accuracy of the PARCOR coefficient.
  • the number of bits allocated to the PARCOR coefficient of the predicted order was the same. Therefore, when the number of bits allocated to the PARCOR coefficient of each prediction order is the same, the upper limit prediction order Pmax is obtained by using Equation (10), although the optimal order that minimizes the estimated code amount of the composite code CaO is obtained.
  • the number of bits assigned to the PARCOR coefficient of each prediction order is not assumed to be the same depending on the maximum number of prediction orders Pmax, the number of bits assigned to the PARCOR coefficient of each prediction order is not the same, that is, the quantization error is In the case of a change, the optimum order that minimizes the estimated code amount of the composite code CaO is not always obtained.
  • K′O (1) is represented by 3 bits
  • K'O (1) is 4 bits
  • K'O (2) is 3 bits
  • K'O (1) is 5 bits
  • K'O (2) is 4 bits
  • K′O (3) is represented by 3 bits.
  • an object of the present invention is to provide a prediction order determination technique for high-compression lossless encoding when the number of bits allocated to the PARCOR coefficient of each prediction order is not the same according to the upper limit prediction order.
  • the present invention quantizes each PARCOR coefficient up to the prediction order with a predetermined number of bits according to the prediction order for each prediction order in a preset range, and a quantized PARCOR corresponding to the PARCOR coefficient Obtain coefficients and estimate for each prediction order in the preset range by the code amount of the quantized PARCOR coefficient and the entropy of the linear prediction residual of the input signal expressed using the quantized PARCOR coefficient
  • the code amount depending on at least the prediction order is obtained from the total code amount of the code amount of the linear prediction residual and the information representing the prediction order, and at least the prediction order is obtained from the obtained total code amount.
  • the prediction order that minimizes the code amount that depends on is determined as the prediction order of linear prediction.
  • each PARCOR coefficient up to the prediction order is quantized with a predetermined number of bits according to the prediction order, and the prediction order is determined using the quantized PARCOR coefficient. Therefore, the lossless encoding compression rate can be improved.
  • FIG. 3 is a diagram illustrating a functional configuration example of an encoding process including a prediction order determination process according to the first embodiment.
  • FIG. 10 is a diagram illustrating a functional configuration example of an encoding process including a prediction order determination process according to the second embodiment.
  • the quantized PARCOR coefficient K′O (1), K ′ is considered in consideration of transmitting the coefficient code CkO obtained by encoding the quantized PARCOR coefficient sequence K′O.
  • the code amount corresponding to each of O (2),..., K′O (PO) is C (1), C (2),. Represented by About the estimated code amount of synthetic code CaO based on this formula (11), the same thing as the contents explained using Drawing 2 is appropriate.
  • the quantization bit of the PARCOR coefficient changes depending on the predicted order, it is not a smooth line but a stepped shape.
  • the present invention is different from the prior art in which the estimated code amount of the composite code is calculated using the equation (10) in that the quantization error is taken into consideration as the equation (11) in calculating the estimated code amount of the composite code.
  • the value of the estimated code amount B′O (PO) of the composite code CaO varies depending on what value the third term on the right side of Equation (11) takes. Actually, when white noise is input such that the quantized PARCOR coefficient series K′O has only a value near 0, the third term on the right side of Equation (11) also has a value near 0, so entropy Thus, the estimated code amount of the composite code CaO cannot be reduced. If K'O (1) and K'O (2) of the quantized PARCOR coefficient series K'O take values near +1 or -1, the third term on the right side of equation (11) is also a negative value. Since the entropy is reduced, the estimated code amount of the composite code CaO can be reduced. For example, as shown in Fig.
  • the primary PARCOR coefficients are concentrated around 0.95, so the part corresponding to the primary PARCOR coefficient in the third term on the right side of Equation (11) Since the residual code CeO can be reduced by about 33 bits at 20 samples per frame, even if K ′ (1) is quantized with 8 bits, the composite code CaO can be expressed sufficiently. The amount of code can be reduced. (Reference) T. Liebchen, et. Al., “The MPEG-4 Audio Lossless Coding (ALS) Standard -Technology and Applications,” AES 119th Convention, New York, USA, October, 2005.
  • the 4th order PARCOR coefficients are concentrated around 0.25, so the 4th order PARCOR coefficients in the third term on the right side of Equation (11)
  • the corresponding part can be expressed by equation (13).
  • the residual code CeO can only be reduced by about 1 bit, so when K ′ (4) is quantized with 3 bits, The code amount of the composite code CaO cannot be reduced, and conversely, the code amount of the composite code CaO is increased.
  • the quantized PARCOR coefficient sequence K′O evaluated by the fourth term on the right side of Equation (11) Even if the required number of bits is increased, the estimated code amount of the composite code CaO can be reduced, so the quantization accuracy of the PARCOR coefficient may be made finer. In this case, even if the predicted order PO is increased, an effect commensurate with it can be expected. Conversely, when the entropy reduction effect due to the reduction of the third term on the right side of Equation (11) cannot be expected, it is necessary for the quantized PARCOR coefficient series K′O evaluated by the fourth term on the right side of Equation (11). Unless the number of bits is reduced, the estimated code amount of the composite code CaO cannot be reduced. Therefore, it is necessary to coarsen the quantization accuracy of the PARCOR coefficient and set the prediction order PO low.
  • the embodiment of the present invention has the functional configuration of the quantization unit 100 shown in FIG. 3, and the entire encoding process is performed except that the quantization unit 903 is changed to the quantization unit 100 as shown in FIG. 3.
  • the quantization unit 100 includes a coefficient quantization unit 102, a code amount estimation unit 104, and a prediction order determination unit 106.
  • a PARCOR coefficient sequence KO (KO (1), KO (2),..., KO (Pmax)) in which each PARCOR coefficient is obtained with, for example, signed 8-bit precision is input to the quantization unit 100
  • the code amount estimation unit 104 uses the code amount ⁇ (Ptmp) of the upper limit prediction order Ptmp for each of the cases where each prediction order included in the above range (1st order to Pmax order) is the upper limit prediction order Ptmp, It is estimated by the entropy of the linear prediction residual of the input signal (N samples per frame) expressed using the code amount of the quantized PARCOR coefficient and the quantized PARCOR coefficient obtained in the process of step S1. Then, an estimated total code amount with the code amount of the linear prediction residual is obtained using equation (11) (step S2).
  • step S1 the quantized PARCOR coefficients K′O t (1), K′O t (2),..., K′O t ( Ptmp) is represented by C t (1), C t (2),..., C t (Ptmp).
  • the prediction order determination unit 106 determines, as the optimal prediction order PO, the prediction order for giving the minimum total code amount among the estimated total code amounts obtained in the process of step S2 (step S3).
  • the prediction order determination unit 106 will be described on the assumption of a specific example in the process of step S2.
  • B′0 (3) is the smallest total code amount among B′0 (4), the prediction order 3 when B′0 (3) is given is determined as the optimum prediction order PO To do.
  • each prediction order from the first order to the Pmax order is represented by Expression (11). Instead of the estimated total code amount to be obtained, the sum of the third term on the right side, the fourth term on the right side, and the fifth term on the right side of the equation (11) is obtained. In step S3, the third term on the right side and the fourth term on the right side in the equation (11). And the predicted order that minimizes the total value of the fifth term on the right side may be determined as the optimal order.
  • the optimal order is calculated using only the total value of the third term on the right side, the fourth term on the right side, and the fifth term on the right side or the total value of the third term on the right side and the fourth term on the right side. You may decide.
  • the estimated code amount of the composite code CaO when the optimum order is determined using only the total value of the third term on the right side and the fourth term on the right side of Equation (11) is expressed by Equation (11A).
  • B′o (4) can be approximately calculated by the equation (17B) represented by using B′o (3) calculated by the equation (16B) instead of the equation (17).
  • ⁇ (4) ⁇ (4) ⁇ (3).
  • Example 2 A second embodiment using a reference table stored in the memory 50 will be described, unlike the first embodiment in which logarithmic operations are frequently used as the upper limit prediction order increases.
  • An example of the reference table is shown in FIG.
  • n is a predetermined integer.
  • the quantization unit 100a includes a coefficient quantization unit 102a, a code amount estimation unit 104a, and a prediction order determination unit 106a.
  • An index L t, i is determined in advance according to the value of the quantized PARCOR coefficient K′O t (i). For example, if 0.90 ⁇ K′O t (i) ⁇ 1, the index L t, i of the K′O t (i) is L (1), and if 0.75 ⁇ K′O t (i) ⁇ 0.90, The index L t, i of K′O t (i) is L (2), and if 0.65 ⁇ K′O t (i) ⁇ 0.75, the index L t, i of the K′O t (i) is set to L ( 3), and if 0 ⁇ K′O t (i) ⁇ 0.15, it is predetermined that the index L t, i of the K′O t (i) is L (n).
  • K 1, K'O 1 (1) is represented by 3 bits.
  • K'O 2 (1) is represented by 4 bits
  • K'O 2 (2) is represented by 3 bits.
  • Ptmp 3
  • K'O 3 (1) is 5 bits
  • K'O 3 (2) is 4 bits
  • K'O 3 (3) 3 bits
  • K'O 4 (2) is 5 bits
  • K'O 4 (3) 4 bits
  • K'O 4 (4) is 3 bits.
  • the code amount estimation unit 104a sets each prediction order included in the above range (1st order to Pmax order) as the upper limit prediction order Ptmp, the code amount estimation unit 104a beforehand corresponds to the index obtained in the process of step S1a.
  • the quantized PARCOR coefficients K′O t (1), K′O t (2),..., K′O t ( Ptmp) is represented by C t (1), C t (2),..., C t (Ptmp).
  • Processes after step 3 following the process of step S2a in the second embodiment are the same as those in the first embodiment. According to the second embodiment, since the logarithmic calculation result pre-calculated by the table lookup from the reference table is used, the number of logarithmic calculations can be reduced.
  • the prediction order determination method of the present invention is applied to each of the cases where each prediction order included in a part of the preset range is set as the upper limit prediction order Ptmp, and is included in a part other than the part of the preset range.
  • a conventional prediction order determination method may be applied to each of the cases where each prediction order is the upper limit prediction order Ptmp.
  • Input signal represented by using the code amount ⁇ (Ptmp) of the upper limit prediction order Ptmp, the code amount of the quantized PARCOR coefficient, and the quantized PARCOR coefficient The total code amount with the code amount of the linear prediction residual estimated by the entropy of the linear prediction residual (N samples per frame) is obtained using Equation (11), and [2] a preset range ( The code amount ⁇ (Ptmp) of the upper limit prediction order Ptmp for each prediction order included in other than the above (PT + 1 order to Pmax order) among the first order to Pmax order) is set to the upper limit prediction order Ptmp. And the code amount of the quantized PARCOR coefficient and each PARCOR coefficient before quantization.
  • step S2b The total code amount with the code amount of the linear prediction residual estimated by the entropy of the linear prediction residual of the input signal (N samples per frame) is obtained using equation (10) (step S2b).
  • the prediction order determination method of the present invention is applied when the prediction order is low, and the conventional technique is applied when the prediction order is high. Conversely, the conventional technique is applied when the prediction order is low.
  • the prediction order determination method of the present invention may be applied when the technique is applied and the prediction order is high.
  • the prediction order determination method of the present invention may be applied when the upper limit prediction order Ptmp is an odd number, and the conventional technique may be applied when the upper limit prediction order Ptmp is an even number.
  • the prediction order determination method of the present invention may be applied when the upper limit prediction order Ptmp is an even number, and the conventional technique may be applied when the upper limit prediction order Ptmp is an odd number.
  • Respective prediction orders included in a part of the preset range (1st order to Pmax order) (1st order to PT order) as the upper limit prediction order Ptmp is “[1 ] “For each case where each prediction order included in a part of the preset range (1st order to Pmax order) (odd order) is the upper limit prediction order Ptmp” is read as “[2] Preset range.
  • each PARCOR coefficient K ( 1), K (2),..., K (PT) are quantized with a predetermined number of bits according to the predicted order and quantized PARCOR coefficients K ′ (1), K ′ (2),. '(PT) is obtained (step S1c).
  • the code amount estimation unit 104 uses the code amount ⁇ (Ptmp) of the upper limit prediction order Ptmp for each of the prediction orders from the first order to the Pmax order as the upper limit prediction order Ptmp. , The code amount of the quantized PARCOR coefficients K ′ (1), K ′ (2),..., K ′ (Ptmp), and the quantized PARCOR coefficients K ′ (1), K ′ (2),.
  • the code amount ⁇ (Ptmp) of the upper limit prediction order Ptmp and the quantized PARCOR coefficients K ′ (1), K ′ 2) Code amount of K ′ (PT), PARCOR coefficient K (PT + 1),..., K (Ptmp) code amount when quantized with fixed bit length, and quantized PARCOR coefficient , K ′ (PT) and the respective PARCOR coefficients K (PT + 1),..., K (Ptmp), and the linear prediction residual of the input signal expressed by K ′ (1), K ′ (2),.
  • the total code amount with the code amount of the linear prediction residual estimated by the entropy is obtained (step S2c).
  • step S1c the quantized PARCOR coefficients K′O t (1), K′O t (2),..., K′O t ( Ptmp) is represented by C t (1), C t (2),..., C t (Ptmp).
  • each of the expressions (28) to (31) also applies to the expressions (28) to (31) as described in the above ⁇ Example 1 using approximate expression >> to ⁇ Example 4 using approximate expression >>. ) Can be changed to approximate equations.
  • the prediction order determination unit 106 determines a prediction order for giving the minimum total code amount among the estimated total code amounts obtained in the process of step S2c (step S3). If a specific example in the process of step S2c is described as a premise, the prediction order determination unit 106 performs the estimated total code amount B′0 (1), B′0 (2), B′0 obtained in the process of step S2c. (3) If B′0 (4) is the smallest total code amount among B′0 (4), the prediction order 4 when B′0 (4) is given is determined as the optimum prediction order PO. To do.
  • the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the present invention.
  • the number of bits representing the PARCOR coefficient K′O (i) is not limited to 8 and may be 32 or 16.
  • the predicted order determination method of the present invention is executed by a computer by reading a program that causes the computer to operate as each functional component of the present invention and causing the processing unit, input unit, output unit, and the like to operate. Can be made.
  • the program is recorded on a computer-readable recording medium, and the program recorded on the server or the like is read into the computer through a telecommunication line or the like. There is a method to make it.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 高圧縮ロスレス符号化のための予測次数決定技術を提供する。予め設定された範囲の各予測次数について、予測次数に応じて予め定められたビット数で当該予測次数までの各PARCOR係数を量子化して、当該PARCOR係数に対応する量子化済PARCOR係数を得て、予め設定された範囲の各予測次数について、量子化済PARCOR係数の符号量と、当該量子化済PARCOR係数を用いて表される、入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求め、得られた合計符号量のうち少なくとも予測次数に依存する符号量が最小となる予測次数を、線形予測の予測次数として決定する。

Description

予測次数決定方法、予測次数決定装置、プログラム及び記録媒体
 本発明は、音響信号などのディジタル時系列信号のロスレス符号化技術に関する。
 例えば図1に示すように、入力信号がNサンプルのフレーム毎に処理されるとする。入力信号をXO(n) (n=1,2,…,N)とする。許容されるPARCOR係数の最大次数をPmax次とする。
 線形予測分析部901は入力信号XO(n)からLevinson-Durbin法やBurg法などにより、予め定めた最大次数であるPmax次までのPARCOR係数KO(1),KO(2),…,KO(Pmax)を算出し、従来技術(例えば特許文献1参照)で求めた最適次数POとPO次までのPARCOR係数系列KO=(KO(1),KO(2),…,KO(PO))を出力する。
 量子化部903はPARCOR係数系列KOを量子化し、量子化済PARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))を出力する。逆変換部905は量子化済PARCOR係数系列K'Oを線形予測係数系列a'O=(a'O(1),a'O(2),…,a'O(PO))に変換して出力する。フィルタ907は線形予測係数系列a'O=(a'O(1),a'O(2),…,a'O(PO))をフィルタ係数として、式(1)に従って入力信号XO(n) (n=1,2,…,N)をPO次でフィルタリングし、予測残差eO(n) (n=1,2,…,N)を得る。ただし、aO'(0)=1とする。記号"×"は乗算を表す。
Figure JPOXMLDOC01-appb-M000001
 残差符号化部911は予測残差eO(n)を例えばエントロピー符号化し、残差符号CeOを出力する。係数符号化部909は最適次数POと量子化済PARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))を符号化し、係数符号CkOを出力する。符号合成部913は残差符号CeOと係数符号CkOを合わせたものを合成符号CaOとして出力する。
 このように量子化部903は、PARCOR係数を量子化して量子化済PARCOR係数を求める。
 一般的に、予測次数POを増やせば予測残差eO(n)も小さくなるが、その一方でPARCOR係数を伝送するのに必要な符号量も増加してしまうので、合成符号CaOの符号量が最小となる予測次数POを求めることが必要となる。
 ところで、PARCOR係数を用いて予測残差のエネルギーを見積もることができる。平均0(平均が0で無ければ平均値(バイアス)分を全サンプルから予め引けばよい)の入力信号XO(n) (n=1,2,…,N)の1フレームあたりのエネルギーEO(0)は式(2)で表される。
Figure JPOXMLDOC01-appb-M000002
 PARCOR係数KO(1)を用いて、1次の線形予測を行ったときの予測残差のエネルギーEO(1)は式(3)で表される。
Figure JPOXMLDOC01-appb-M000003
 PARCOR係数KO(2)を用いて、2次の線形予測を行ったときの予測残差のエネルギーEO(2)は式(4)で表される。
Figure JPOXMLDOC01-appb-M000004
 これをPmax次まで繰り返すと,Pmax次の線形予測を行ったときの予測残差のエネルギーEO(Pmax)は式(5)で表される。
Figure JPOXMLDOC01-appb-M000005
 平均0、分散σ2(すなわちエネルギーをNで割ったもの)のガウス分布のエントロピーは式(6)で表される。
Figure JPOXMLDOC01-appb-M000006
 平均0、分散σ2(すなわちエネルギーをNで割ったもの)のラプラス分布のエントロピーは式(7)で表される。
Figure JPOXMLDOC01-appb-M000007
 いずれの場合も分散σ2に依存しており、エントロピーは、βを定数として式(8)で表される。
Figure JPOXMLDOC01-appb-M000008
 定数βの値は、式(6)よりガウス分布の場合に約2であり、式(7)よりラプラス分布の場合に約1.7である。
 式(5)と式(8)より、PO次の線形予測を行ったときの予測残差のエントロピーHO(PO)は、つまり予測残差1サンプルに必要な平均推定ビット数は、式(9)で表される。
Figure JPOXMLDOC01-appb-M000009
 ここで式(9)の右辺第二項は入力信号に依存するので定数とみなせる。従って、式(9)の右辺第三項がどのような値をとるかによってエントロピーHO(PO)の値が変化する。実際に、PARCOR係数系列KOの各PARCOR係数が0付近の値しか持たないような白色雑音が入力されたときは右辺第三項も0付近の値しか持たないので、エントロピーを下げられず、予測残差1サンプルに必要な平均推定ビット数を低減することはできない。PARCOR係数系列KOに含まれるKO(1)とKO(2)が+1や-1付近の値を取るのであれば、右辺第三項は負の値を持ち、エントロピーが低減するので、予測残差1サンプルに必要な平均推定ビット数を低減することができる。
 ロスレス符号化の場合には最適次数POと量子化済PARCOR係数系列K'Oを符号化した係数符号CkOも伝送するので、係数符号のうち最適次数POに対応する符号のビット数をγ(PO)とし(ただし、γ(PO)がPOに拠らず定数である場合には、最適次数POに対応する符号のビット数を無視して計算してもよい。)、係数符号のうち量子化済PARCOR係数K'O(1),K'O(2),…,K'O(PO)のそれぞれに対応する符号量をC(1),(2),…,C(PO)とすると、1フレーム(Nサンプル)あたりの合成符号CaOの推定符号量は、式(10)で表される。
Figure JPOXMLDOC01-appb-M000010
 B0(PO)は図2の実線θで表すようなグラフとなるので、合成符号CaOの推定符号量が最小となる予測次数POを求めればよい。PARCOR係数の量子化精度を高くすればPARCOR係数系列KOと量子化済PARCOR係数系列K'Oの差が小さくなり、予測残差eO(n)も小さくなるため、図2に点線τで示す残差符号を表すために必要な符号量は少なくて済む。しかしながら、図2に破線ηで示す量子化済PARCOR係数系列K'Oを表すために必要な符号量は増えてしまう。従って、必ずしもPARCOR係数の精度を高くした方が合成符号CaOの推定符号量が小さくなるとは限らない。
 従来技術の例として5ビットで均一量子化の場合を説明する。例えば符号付8ビットの精度で求められたPARCOR係数系列KO=(KO(1),KO(2)…KO(Pmax))が量子化部903に入力される。量子化部903はKO(i) (i=1,2,…,Pmax)を下記のStep 1~3に従って量子化し、量子化済PARCOR係数系列K'O=(PO,K'O(1),K'O(2),…,K'O(PO))と最適次数POを出力する。
Step 1: KO(i)を5ビットで線形量子化または非線形量子化し、K'O(i)を求める。
 Step 2: 予め設定された範囲の予測次数のそれぞれについて、量子化されていないPARCOR係数KO(i)を用いて、式(10)を用いて合成符号CaOの推定符号量を求める。
 Step 3: Step 2で求めた合成符号CaOの推定符号量が最小となる予測次数を最適次数POとする。
特開2009-69309号公報
 従来の予測次数決定方法では、効率的に符号を送るためにPARCOR係数を量子化しており、図2に表すように、PARCOR係数の量子化精度を高くすればPARCOR係数系列KOと量子化済PARCOR係数系列K'Oとの差が小さくなり、予測残差eO(n)も小さくなるため予測残差に要する符号量は少なくなる。しかしながら、量子化済PARCOR係数系列K'Oを表すのに必要なビット数は増えてしまうため、必ずしもPARCOR係数の量子化精度を高くした方が良いとは限らない。
 特許文献1では、各予測次数のPARCOR係数の量子化誤差が予測次数によって変わらないという前提で最適予測次数を決定していた。つまり、例えば、Pmax=1の場合、K'O(1)が5ビットで表され、Pmax=2の場合、K'O(1)とK'O(2)のそれぞれが5ビットで表され、Pmax=3の場合、K'O(1)とK'O(2)とK'O(3)のそれぞれが5ビットで表される、というように上限予測次数Pmaxに関らず、各予測次数のPARCOR係数に割り当てるビット数が同一であった。よって、各予測次数のPARCOR係数に割り当てるビット数が同一である場合には、式(10)を用いることで、合成符号CaOの推定符号量が最小となる最適次数が求まるものの、上限予測次数Pmaxに応じて各予測次数のPARCOR係数に割り当てるビット数が同一でない場合は想定されておらず、上限予測次数Pmaxに応じて各予測次数のPARCOR係数に割り当てるビット数が同一でない場合すなわち量子化誤差が変化する場合には、必ずしも合成符号CaOの推定符号量が最小となる最適次数が求まらない。上限予測次数Pmaxに応じて各予測次数のPARCOR係数に割り当てるビット数が同一でない場合として、例えば、Pmax=1の場合、K'O(1)が3ビットで表され、Pmax=2の場合、K'O(1)が4ビットで、K'O(2)が3ビットで表され、Pmax=3の場合、K'O(1)が5ビットで、K'O(2)が4ビットで、K'O(3)が3ビットで表される、というような例を挙げることができる。
 そこで本発明は、上限予測次数に応じて各予測次数のPARCOR係数に割り当てるビット数が同一でない場合において、高圧縮ロスレス符号化のための予測次数決定技術を提供することを目的とする。
 本発明は、予め設定された範囲の各予測次数について、予測次数に応じて予め定められたビット数で当該予測次数までの各PARCOR係数を量子化して、当該PARCOR係数に対応する量子化済PARCOR係数を得て、予め設定された範囲の各予測次数について、量子化済PARCOR係数の符号量と、当該量子化済PARCOR係数を用いて表される、入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求め、得られた合計符号量のうち少なくとも予測次数に依存する符号量が最小となる予測次数を、線形予測の予測次数として決定する。
 本発明に拠れば、量子化誤差を考慮して、予測次数に応じて予め定められたビット数で当該予測次数までの各PARCOR係数を量子化し、量子化済PARCOR係数を用いて予測次数を決定するのでロスレス符号化の圧縮率を向上させることができる。
従来の予測次数決定処理を含む符号化処理の機能構成例を示す図。 PARCOR係数の割り当てビット数と線形予測残差の符号量との関係を示す図。 実施例1の予測次数決定処理を含む符号化処理の機能構成例を示す図。 実施例1の予測次数決定処理の処理フローを示す図。 実施例2の予測次数決定処理を含む符号化処理の機能構成例を示す図。 参照テーブルの例を示す図。 実施例2の予測次数決定処理の処理フローを示す図。 変形例1の予測次数決定処理の処理フローを示す図。 変形例2の予測次数決定処理の処理フローを示す図。
 本発明では、ロスレス符号化の場合には量子化済PARCOR係数系列K'Oを符号化した係数符号CkOも伝送することを考慮して、量子化済PARCOR係数K'O(1),K'O(2),…,K'O(PO)のそれぞれに対応する符号量をC(1),C(2),…,C(PO)として合成符号CaOの推定符号量を式(11)で表す。この式(11)に基づく合成符号CaOの推定符号量について、図2を用いて説明した内容と同じことが妥当する。ただし、予測次数によってPARCOR係数の量子化ビットが変わる場合は滑らかな線ではなく階段状になる。
Figure JPOXMLDOC01-appb-M000011
 本発明は合成符号の推定符号量の算出に当たり式(11)のように量子化誤差を考慮している点で式(10)を用いて合成符号の推定符号量を算出する従来技術と異なる。
 式(11)の右辺第三項がどのような値をとるかによって合成符号CaOの推定符号量B'O(PO)の値が変化する。実際に、量子化済PARCOR係数系列K'Oが0付近の値しか持たないような白色雑音が入力されたときは式(11)の右辺第三項も0付近の値しか持たないので、エントロピーを下げられず、合成符号CaOの推定符号量を低減することはできない。量子化済PARCOR係数系列K'OのK'O(1)とK'O(2)が+1や-1付近の値を取るのであれば、式(11)の右辺第三項も負の値を持ち、エントロピーが低減するので、合成符号CaOの推定符号量を低減することができる。例えば参考文献のFig.4に表されているように1次のPARCOR係数は0.95付近に集中しているので、式(11)の右辺第三項のうちの1次のPARCOR係数に対応する部分は式(12)で表すことができ、1フレームあたり20サンプルのときは残差符号CeOを約33ビット削減できるので、K'(1)を8ビットで量子化しても十分に合成符号CaOの符号量を削減できる。
(参考文献)T. Liebchen, et. al., “The MPEG-4 Audio Lossless Coding (ALS) Standard -Technology and Applications,” AES 119th Convention,  New York, USA, October, 2005.
Figure JPOXMLDOC01-appb-M000012
 一方、上記参考文献のFig.4に表されているように、4次のPARCOR係数は0.25付近に集中しているので、式(11)の右辺第三項のうちの4次のPARCOR係数に対応する部分は式(13)で表すことができ、1フレームあたり20サンプルのときは残差符号CeOを約1ビット程度しか削減できないので、K'(4)を3ビットで量子化した場合は合成符号CaOの符号量を削減できず、逆に合成符号CaOの符号量を増加させていることになる。
Figure JPOXMLDOC01-appb-M000013
 つまり、式(11)の右辺第三項の値の低減によるエントロピーの削減効果が期待できるのであれば、式(11)の右辺第四項で評価される量子化済PARCOR係数系列K'Oに必要なビット数を大きくしても、合成符号CaOの推定符号量は削減できるので、PARCOR係数の量子化精度を細かくすればよい。この場合、予測次数POを大きくしてもそれに見合った効果が期待できる。
 逆に、式(11)の右辺第三項の低減によるエントロピーの削減効果が期待できない場合は、式(11)の右辺第四項で評価される量子化済PARCOR係数系列K'Oに必要なビット数を小さくしなければ合成符号CaOの推定符号量を削減できない。そこで、PARCOR係数の量子化精度を粗くし、予測次数POを低く設定する必要がある。
 以上のことから、本発明では、上限予測次数に応じて各予測次数のPARCOR係数に割り当てるビット数が同一でない場合において、量子化誤差を考慮して、予測次数に応じて予め定められたビット数で当該予測次数までの各PARCOR係数を量子化し、量子化済PARCOR係数を用いて最適な予測次数を決定する。
[実施形態]
 本発明の実施形態は図3に示す量子化部100の機能構成を持ち、図3に示すように、量子化部903が量子化部100に変更されていることを除き、符号化処理の全体は図1に示す機能構成と同じ機能構成を持つ。
 量子化部100は、係数量子化部102、符号量推定部104、予測次数決定部106を含む。
 各PARCOR係数が例えば符号付8ビットの精度で求められたPARCOR係数系列KO=(KO(1),KO(2),…,KO(Pmax))が量子化部100に入力されると、量子化部100は、最適予測次数POと、線形量子化または非線形量子化されたPARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))を出力する。最適予測次数POと量子化済PARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))は係数符号化部909へ送られる。
<実施例1>
 PARCOR係数系列KO=(KO(1),KO(2),…,KO(Pmax))が量子化部100に入力されると、まず、係数量子化部102は、予め設定された範囲(例えば1次~Pmax次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて、各PARCOR係数KO(i) (i=1,2,…,Ptmp)を当該上限予測次数Ptmpに応じて予め定められたビット数で量子化し、量子化済PARCOR係数を求める(ステップS1)。
 例えば、上限予測次数Ptmp=tでの量子化済PARCOR係数をK'Ot(1),K'Ot(2),…,K'Ot(Ptmp)とし、Pmax=4とし、Ptmp=1の場合にK'O1(1)が3ビットで表され、Ptmp=2の場合にK'O2(1)が4ビットで、K'O2(2)が3ビットで表され、Ptmp=3の場合にK'O3(1)が5ビットで、K'O3(2)が4ビットで、K'O3(3)が3ビットで表され、Ptmp=4の場合にK'O4(1)が6ビットで、K'O4(2)が5ビットで、K'O4(3)が4ビットで、K'O4(4)が3ビットで表されるとした場合、係数量子化部102は、
Ptmp=1について、KO(1)を3ビットで量子化してK'O1(1)を求め、
Ptmp=2について、KO(1)を4ビットで量子化してK'O2(1)を求め、KO(2)を3ビットで量子化してK'O2(2)を求め、
Ptmp=3について、KO(1)を5ビットで量子化してK'O3(1)を求め、KO(2)を4ビットで量子化してK'O3(2)を求め、KO(3)を3ビットで量子化してK'O3 (3)を求め、
Ptmp=Pmax=4について、KO(1)を6ビットで量子化してK'O4(1)を求め、KO(2)を5ビットで量子化してK'O4(2)を求め、KO(3)を4ビットで量子化してK'O4(3)を求め、KO(4)を3ビットで量子化してK'O4(4)を求める。
 次に、符号量推定部104が、上記範囲(1次~Pmax次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて、上限予測次数Ptmpの符号量γ(Ptmp)と、量子化済PARCOR係数の符号量と、ステップS1の処理で得られた当該量子化済PARCOR係数を用いて表される、入力信号(1フレーム当たりNサンプル)の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量との推定合計符号量を式(11)を用いて求める(ステップS2)。
 ステップS1の処理での具体例を前提として説明すると、上限予測次数Ptmp=tでの量子化済PARCOR係数K'Ot(1),K'Ot(2),…,K'Ot(Ptmp)のそれぞれに対応する符号量をCt(1),Ct(2),…,Ct(Ptmp)として、符号量推定部104は、
Ptmp=1について、3ビットのK'O1(1)とC1(1)=3を用いて、推定合計符号量B'0(1)を式(14)によって求め、
Ptmp=2について、4ビットのK'O2(1)とC2(1)=4と3ビットのK'O2(2)とC2(2)=3を用いて、推定合計符号量B'0(2)を式(15)によって求め、
Ptmp=3について、5ビットのK'O3(1)とC3(1)=5と4ビットのK'O3(2)とC3(2)=4と3ビットのK'O3(3) とC3(3)=3を用いて、推定合計符号量B'0(3)を式(16)によって求め、
Ptmp=4について、6ビットのK'O4(1)とC4(1)=6と5ビットのK'O4(2)とC4(2)=5と4ビットのK'O4(3)とC4(3)=4と3ビットのK'O4(4)とC4(4)=3を用いて、推定合計符号量B'0(4)を式(17)によって求める。
Figure JPOXMLDOC01-appb-M000014
 次に、予測次数決定部106は、ステップS2の処理で得られた推定合計符号量のうち最小の合計符号量を与えるときの予測次数を最適予測次数POとして決定する(ステップS3)。
 ステップS2の処理での具体例を前提として説明すると、予測次数決定部106は、ステップS2の処理で得られた推定合計符号量B'0(1)、B'0(2)、B'0(3)、B'0(4)のうち最小の合計符号量がB'0(3)であるならば、B'0(3)を与えたときの予測次数3を最適予測次数POとして決定する。
 そして、量子化部100は、最適予測次数POと、最適予測次数POに対応するステップS1の処理で得られた量子化済PARCOR係数の系列K'O=(K'O(1),K'O(2),…,K'O(PO))を出力する。
 なお、式(11)のうち量子化済PARCOR係数及びPARCOR係数の符号量以外は上限予測次数に依存しない値であるので、ステップS2では1次~Pmax次の各予測次数について式(11)で求まる推定合計符号量の代わりに式(11)の右辺第3項と右辺第4項と右辺第5項の合計値を求め、ステップS3では式(11)の右辺第3項と右辺第4項と右辺第5項の合計値が最小となる予測次数を最適次数として決定してもよい。そもそも予測次数に依存しない定数部分を無視して、右辺第3項と右辺第4項と右辺第5項の合計値や右辺第3項と右辺第4項の合計値のみを用いて最適次数を決定してもよい。式(11)の右辺第3項と右辺第4項の合計値のみを用いて最適次数を決定する場合の合成符号CaOの推定符号量は、式(11A)で表される。
Figure JPOXMLDOC01-appb-M000015
≪近似式を用いた例1≫
 上限予測次数Ptmpを変更しても量子化精度がそれほど変わらないのであれば、式(15)に替えて、式(14)で算出されたB'o(1)を用いて表される式(15B)によってB'o(2)を近似算出することができる。式(15B)では、計算済みの結果であるB'o(1)を流用して、式(14)と式(15)との差分である式(15B)の第2項と第3項と第4項のみを計算すればよく、式(15)と比較して演算量を減らせる。ここで、Δγ(2)=γ(2)-γ(1)である。同様に、式(16)に替えて、式(15B)で算出されたB'o(2)を用いて表される式(16B)によってB'o(3)を近似算出することができる。ここで、Δγ(3)=γ(3)-γ(2)である。また、式(17)に替えて、式(16B)で算出されたB'o(3)を用いて表される式(17B)によってB'o(4)を近似算出することができる。ここで、Δγ(4)=γ(4)-γ(3)である。このように、圧縮率を高くすることより演算量を減らすことを優先する場合などでは、式(15)から式(17)のそれぞれの代わりに下記の式(15B)から式(17B)を用いた計算を行うようにしてもよい。
Figure JPOXMLDOC01-appb-M000016
≪近似式を用いた例2≫
 PARCOR係数の性質である-1<KO(i)<1という条件の下で、対数の計算をテイラー級数(マクローリン級数)で展開した近似式を用いて、log2(1-K'O(i)×K'O(i))を-K'O(i)×K'O(i)で近似しても良い。この場合は、式(14)、式(15B)、式(16B)、式(17B)のそれぞれの代わりに下記の式(14C)から式(17C)を用いた計算を行う。
Figure JPOXMLDOC01-appb-M000017
≪近似式を用いた例3≫
 推定合計符号量を近似算出することを考慮すると、-K'O(i)×K'O(i)の替わりに-KO(i)×KO(i)を計算に用いても良い。この場合は、式(14C)~式(17C)のそれぞれの代わりに下記の式(14D)~式(17D)を用いた計算を行う。
Figure JPOXMLDOC01-appb-M000018
 なお、≪近似式を用いた例1≫を前提として≪近似式を用いた例2≫と≪近似式を用いた例3≫を説明したが、式(14)から式(17)のそれぞれに現れるlog2(1-K'O(i)×K'O(i))を-K'O(i)×K'O(i)または-KO(i)×KO(i)に置き換えた式を用いて計算を行ってもよい。log2(1-K'O(i)×K'O(i))を-KO(i)×KO(i)で置換する場合、式(14)-(17)を与える式(11)は、式(11B)に改められる。そして、既述のとおり、式(11)の右辺第3項と右辺第4項の合計値のみを用いて最適次数を決定するとするならば、式(11B)は式(11C)に改められる(式(11A)参照)。
Figure JPOXMLDOC01-appb-M000019
≪近似式を用いた例4≫
 推定合計符号量を近似算出することを考慮すると、-K'O(i)×K'O(i)の替わりに、量子化前のPARCOR係数と補正のための重み係数Ω(Ωは正の数。例えばΩ=2である)を用いた-Ω×KO(i)×KO(i)を計算に用いても良い。この場合は、式(14C)~式(17C)のそれぞれの代わりに下記の式(14E)~式(17E)を用いた計算を行う。
Figure JPOXMLDOC01-appb-M000020
 なお、≪近似式を用いた例2≫あるいは≪近似式を用いた例3≫を前提として≪近似式を用いた例4≫を説明したが、式(14)から式(17)のそれぞれに現れるlog2(1-K'O(i)×K'O(i))を-K'O(i)×K'O(i)または-KO(i)×KO(i)に置き換えた式を用いて計算を行ってもよい。従って、≪近似式を用いた例4≫で説明したように重み係数Ωを上記式(11C)に導入すると式(11C)は式(11D)に改められる。よって、一例として示した式(14)-(17)は、で式(14F)-(17F)に改められる。
Figure JPOXMLDOC01-appb-M000021
<実施例2>
 上限予測次数が大きくなるにつれて対数演算を多用する実施例1と異なり、メモリ50に記憶されている参照テーブルを利用する実施例2を説明する。参照テーブルの例を図5に示す。この参照テーブルでは、インデックスL(q) (q=1,2,…,n)に、入力信号(1フレーム当たりNサンプル)の線形予測残差のエントロピーの算出式(11)の右辺第三項に現れる対数演算log2(1-K'O(i)×K'O(i))を予め計算した結果(事前計算結果T(j) (j= L(1),L(2),…,L(n)))が対応付けられている。ここでnは予め定められた整数である。
 実施例2の量子化部100aは、係数量子化部102a、符号量推定部104a、予測次数決定部106aを含む。
 PARCOR係数系列KO=(KO(1),KO(2),…,KO(Pmax))が量子化部100に入力されると、まず、係数量子化部102aは、予め設定された範囲(例えば1次~Pmax次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて、各PARCOR係数KO(i) (i=1,2,…,Ptmp)を当該上限予測次数Ptmp=tに応じて予め定められたビット数で量子化して得られる量子化済PARCOR係数K'Ot(i)のインデックスLt,iを求める(ステップS1a)。量子化済PARCOR係数K'Ot(i)の値に応じてインデックスLt,iが予め定められている。例えば、0.90≦K'Ot(i)≦1ならば当該K'Ot(i)のインデックスLt,iをL(1)とし、0.75≦K'Ot(i)<0.90ならば当該K'Ot(i)のインデックスLt,iをL(2)とし、0.65≦K'Ot(i)<0.75ならば当該K'Ot(i)のインデックスLt,iをL(3)とし、0≦K'Ot(i)≦0.15ならば当該K'Ot(i)のインデックスLt,iをL(n)とすることが予め定められている。
 ここで、上限予測次数Ptmp=tでの量子化済PARCOR係数をK'Ot(1),K'Ot(2),…,K'Ot(Ptmp)とし、Pmax=4とし、Ptmp=1の場合にK'O1(1)が3ビットで表され、Ptmp=2の場合にK'O2(1)が4ビットで、K'O2(2)が3ビットで表され、Ptmp=3の場合にK'O3(1)が5ビットで、K'O3(2)が4ビットで、K'O3(3)が3ビットで表され、Ptmp=4の場合にK'O4(1)が6ビットで、K'O4(2)が5ビットで、K'O4(3)が4ビットで、K'O4(4)が3ビットで表されるとした場合を例に採り説明すると、係数量子化部102aは、
Ptmp=1について、KO(1)を3ビットで量子化して得られるK'O1(1)のインデックスL1,1を求め、
Ptmp=2について、KO(1)を4ビットで量子化して得られるK'O2(1)のインデックスL2,1と、KO(2)を3ビットで量子化して得られるK'O2(2)のインデックスL2,2を求め、
Ptmp=3について、KO(1)を5ビットで量子化して得られるK'O3(1)のインデックスL3,1と、KO(2)を4ビットで量子化して得られるK'O3(2)のインデックスL3,2と、KO(3)を3ビットで量子化して得られるK'O3(3)のインデックスL3,3を求め、
Ptmp=Pmax=4について、KO(1)を6ビットで量子化して得られるK'O4(1)のインデックスL4,1と、KO(2)を5ビットで量子化して得られるK'O4(2)のインデックスL4,2と、KO(3)を4ビットで量子化して得られるK'O4(3)のインデックスL4,3を求め、KO(4)を3ビットで量子化して得られるK'O4(4)のインデックスL4,4を求める。
 次に、符号量推定部104aが、上記範囲(1次~Pmax次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて、ステップS1aの処理で得られたインデックスに対応する事前計算結果T(j)を参照テーブルから表引きし、当該事前計算結果を用いた、入力信号(1フレーム当たりNサンプル)の線形予測残差のエントロピーによって推定される線形予測残差の符号量と、量子化済PARCOR係数の符号量と、上限予測次数Ptmpの符号量γ(Ptmp)との推定合計符号量を求める(ステップS2a)。
 ステップS1aの処理での具体例を前提として説明すると、上限予測次数Ptmp=tでの量子化済PARCOR係数K'Ot(1),K'Ot(2),…,K'Ot(Ptmp)のそれぞれに対応する符号量をCt(1),Ct(2),…,Ct(Ptmp)として、符号量推定部104aは、
Ptmp=1について、インデックスL1,1に対応する値T(L1,1)とC1(1)=3を用いて、推定合計符号量B'0(1)を式(18)によって求め、
Ptmp=2について、インデックスL2,1に対応する値T(L2,1)とC2(1)=4とインデックスL2,2に対応する値T(L2,2)とC2(2)=3を用いて、推定合計符号量B'0(2)を式(19)によって求め、
Ptmp=3について、インデックスL3,1に対応する値T(L3,1)とC3(1)=5とインデックスL3,2に対応する値T(L3,2)とC3(2)=4とインデックスL3,3に対応する値T(L3,3)とC3(3)=3を用いて、推定合計符号量B'0(3)を式(20)によって求め、
Ptmp=4について、インデックスL4,1に対応する値T(L4,1)とC4(1)=6とインデックスL4,2に対応する値T(L4,2)とC4(2)=5とインデックスL4,3に対応する値T(L4,3)とC4(3)=4とインデックスL4,4に対応する値T(L4,4)とC4(4)=3を用いて、推定合計符号量B'0(4)を式(21)によって求める。
Figure JPOXMLDOC01-appb-M000022
 実施例2におけるステップS2aの処理に続くステップ3以降の処理は、実施例1と同じである。実施例2によれば、参照テーブルからの表引きによって事前計算された対数演算結果を用いるから、対数演算の回数を低減できる。
<変形例>
 予め設定された範囲の一部に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて本発明の予測次数決定方法を適用し、予め設定された範囲のうち上記一部以外に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて従来的な予測次数決定方法を適用してもよい。
 例えば、量子化部100,100aは、上限予測次数Ptmpが予め定めたPT次以下またはPT次より小さい(例えばPT=2)場合には本発明に則り推定符号量を見積もり、上限予測次数PtmpがPT次より大きいまたはPT次以上の場合には従来技術(例えば量子化ビットを一定とした方法)で推定符号量を見積もり、最小の推定符号量を与える最適次数POを決定し、最適次数POと量子化済PARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))を出力する。
<変形例の具体例1>
 具体例1として実施例1の変形例を説明する。
 実施例1のステップS1の処理に続いて、符号量推定部104が、[1]予め設定された範囲(1次~Pmax次)の一部(1次~PT次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて、上限予測次数Ptmpの符号量γ(Ptmp)と、量子化済PARCOR係数の符号量と、当該量子化済PARCOR係数を用いて表される、入力信号(1フレーム当たりNサンプル)の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量との合計符号量を式(11)を用いて求め、[2]予め設定された範囲(1次~Pmax次)のうち上記一部以外(PT+1次~Pmax次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて、上限予測次数Ptmpの符号量γ(Ptmp)と、量子化済PARCOR係数の符号量と、量子化前の各PARCOR係数を用いて表される、入力信号(1フレーム当たりNサンプル)の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量との合計符号量を式(10)を用いて求める(ステップS2b)。
 実施例1のステップS1の処理での具体例を前提として説明すると、PT=2とし、上限予測次数Ptmp=tでの量子化済PARCOR係数K'Ot(1),K'Ot(2),…,K'Ot(Ptmp)のそれぞれに対応する符号量をCt(1),Ct(2),…,Ct(Ptmp)として、符号量推定部104は、
Ptmp=1について、3ビットのK'O1(1)を用いて、推定合計符号量B'0(1)を式(22)によって求め、
Ptmp=2について、4ビットのK'O2(1)と3ビットのK'O2(2)を用いて、推定合計符号量B'0(2)を式(23)によって求め、
Ptmp=3について、KO(1)とKO(2)とKO(3)を用いて、推定合計符号量B'0(3)を式(24)によって求め、
Ptmp=4について、KO(1)とKO(2)とKO(3)とKO(4)を用いて、推定合計符号量B'0(4)を式(25)によって求める。
Figure JPOXMLDOC01-appb-M000023
 なお、式(22)から式(25)のそれぞれについても、上記≪近似式を用いた例1≫から≪近似式を用いた例4≫で説明したように、式(22)から式(25)のそれぞれを近似式に変更することができる。
 上記の変形例では、予測次数が低次の場合に本発明の予測次数決定方法を適用し予測次数が高次の場合に従来技術を適用したが、逆に予測次数が低次の場合に従来技術を適用し予測次数が高次の場合に本発明の予測次数決定方法を適用してもよい。具体的には、『[1]予め設定された範囲(1次~Pmax次)の一部(1次~PT次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』を『[1]予め設定された範囲(1次~Pmax次)の一部(PT+1次~Pmax次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』に読み替え、『[2]予め設定された範囲(1次~Pmax次)のうち上記一部以外(PT+1次~Pmax次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』を『[2]予め設定された範囲(1次~Pmax次)のうち上記一部以外(1次~PT次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』に読み替えて理解すればよい。なお、当然ながら上記具体例の内容も変更されることに留意すること。
 また、上限予測次数Ptmpが奇数の場合に本発明の予測次数決定方法を適用し上限予測次数Ptmpが偶数の場合に従来技術を適用してもよい。あるいは上限予測次数Ptmpが偶数の場合に本発明の予測次数決定方法を適用し上限予測次数Ptmpが奇数の場合に従来技術を適用してもよい。具体的には、『[1]予め設定された範囲(1次~Pmax次)の一部(1次~PT次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』を『[1]予め設定された範囲(1次~Pmax次)の一部(偶数次数)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』に読み替え、『[2]予め設定された範囲(1次~Pmax次)のうち上記一部以外(PT+1次~Pmax次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』を『[2]予め設定された範囲(1次~Pmax次)のうち上記一部以外(奇数次数)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』に読み替えて理解すればよい。あるいは、『[1]予め設定された範囲(1次~Pmax次)の一部(1次~PT次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』を『[1]予め設定された範囲(1次~Pmax次)の一部(奇数次数)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』に読み替え、『[2]予め設定された範囲(1次~Pmax次)のうち上記一部以外(PT+1次~Pmax次)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』を『[2]予め設定された範囲(1次~Pmax次)のうち上記一部以外(偶数次数)に含まれる各予測次数を上限予測次数Ptmpとした場合のそれぞれについて』に読み替えて理解すればよい。なお、当然ながら上記具体例の内容も変更されることに留意すること。
<変形例の具体例2>
 PARCOR係数系列KO=(KO(1),KO(2),…,KO(Pmax))が量子化部100に入力されると、まず、係数量子化部102は、[1]Pmaxが予め定められた値PT以下あるいはPTより小さい場合に、予測次数に応じて予め定められたビット数で各PARCOR係数K(1),K(2),…,K(Pmax)を量子化して量子化済PARCOR係数K'(1),K'(2),…,K'(Pmax)を求め、[2]Pmaxが予め定められた値PTより大きいあるいはPT以上である場合に、各PARCOR係数K(1),K(2),…,K(PT)を予測次数に応じて予め定められたビット数で量子化して量子化済PARCOR係数K'(1),K'(2),…,K'(PT)を求める(ステップS1c)。
 例えば、上限予測次数Ptmp=tでの量子化済PARCOR係数をK'Ot(1),K'Ot(2),…,K'Ot(Ptmp)とし、PT=3とし、上限予測次数Ptmp=1の場合にK'O1(1)が3ビットで表され、上限予測次数Ptmp=2の場合にK'O2(1)が4ビットで、K'O2(2)が3ビットで表され、上限予測次数Ptmp=PT=3の場合にK'O3(1)が5ビットで、K'O3(2)が4ビットで、K'O3(3)が3ビットで表されるとした場合、係数量子化部102は、
Pmax=2の場合、
Ptmp=1について、KO(1)を3ビットで量子化してK'O1(1)を求め、
Ptmp=2について、KO(1)を4ビットで量子化してK'O2(1)を求め、KO(2)を3ビットで量子化してK'O2(2)を求め、
Pmax=4の場合、
Ptmp=1について、KO(1)を3ビットで量子化してK'O1(1)を求め、
Ptmp=2について、KO(1)を4ビットで量子化してK'O2(1)を求め、KO(2)を3ビットで量子化してK'O2(2)を求め、
Ptmp=3について、KO(1)を5ビットで量子化してK'O3(1)を求め、KO(2)を4ビットで量子化してK'O3(2)を求め、KO(3)を3ビットで量子化してK'O3(3)を求める。
 次に、符号量推定部104が、上記[1]の場合、1次からPmax次までの各予測次数を上限予測次数Ptmpとした場合のそれぞれについて、上限予測次数Ptmpの符号量γ(Ptmp)と、量子化済PARCOR係数K'(1),K'(2),…,K'(Ptmp)の符号量と、当該量子化済PARCOR係数K'(1),K'(2),…,K'(Ptmp)を用いて表される、入力信号の線形予測残差のエントロピー(式(26)参照)によって推定される当該線形予測残差の符号量との合計符号量を求め、上記[2]の場合、1次からPT次までの各予測次数を上限予測次数Ptmpとした場合のそれぞれについては上記[1]に従って、PT+1次からPmax次までの各予測次数を上限予測次数Ptmpとした場合のそれぞれについては、上限予測次数Ptmpの符号量γ(Ptmp)と、量子化済PARCOR係数K'(1),K'(2),…,K'(PT)の符号量と、各PARCOR係数K(PT+1),…,K(Ptmp)を固定ビット長で量子化した場合の符号量と、量子化済PARCOR係数K'(1),K'(2),…,K'(PT)および各PARCOR係数K(PT+1),…,K(Ptmp)を用いて表される、入力信号の線形予測残差のエントロピー(式(27)参照)によって推定される当該線形予測残差の符号量との合計符号量を求める(ステップS2c)。
Figure JPOXMLDOC01-appb-M000024
 なお、式(26)および式(27)についても、上記≪近似式を用いた例1≫から≪近似式を用いた例4≫で説明したように、式(26)および式(27)を近似式に変更することができる。
 ステップS1cの処理での具体例を前提として説明すると、上限予測次数Ptmp=tでの量子化済PARCOR係数K'Ot(1),K'Ot(2),…,K'Ot(Ptmp)のそれぞれに対応する符号量をCt(1),Ct(2),…,Ct(Ptmp)として、符号量推定部104は、
Pmax=2の場合、
Ptmp=1について、3ビットのK'O1(1)とC1(1)=3を用いて、推定合計符号量B'0(1)を式(28)によって求め、
Ptmp=2について、4ビットのK'O2(1)とC2(1)=4と3ビットのK'O2(2)とC2(2)=3を用いて、推定合計符号量B'0(2)を式(29)によって求め、
Pmax=4の場合、
Ptmp=1について、3ビットのK'O1(1)とC1(1)=3を用いて、推定合計符号量B'0(1)を式(28)によって求め、
Ptmp=2について、4ビットのK'O2(1)とC2(1)=4と3ビットのK'O2(2)とC2(2)=3を用いて、推定合計符号量B'0(2)を式(29)によって求め、
Ptmp=3について、5ビットのK'O3(1)とC3(1)=5と4ビットのK'O3(2)とC3(2)=4と3ビットのK'O3(3)とC3(3)=3を用いて、推定合計符号量B'0(3)を式(30)によって求め、
Ptmp=Pmax=4について、KO(4)とC4(4)と5ビットのK'O3(1)とC4(1)=5と4ビットのK'O3(2)とC4(2)=4と3ビットのK'O3(3)とC4(3)=3を用いて、推定合計符号量B'0(4)を式(31)によって求める。
Figure JPOXMLDOC01-appb-M000025
 なお、式(28)から式(31)のそれぞれについても、上記≪近似式を用いた例1≫から≪近似式を用いた例4≫で説明したように、式(28)から式(31)のそれぞれを近似式に変更することができる。
 次に、予測次数決定部106は、ステップS2cの処理で得られた推定合計符号量のうち最小の合計符号量を与えるときの予測次数を決定する(ステップS3)。
 ステップS2cの処理での具体例を前提として説明すると、予測次数決定部106は、ステップS2cの処理で得られた推定合計符号量B'0(1)、B'0(2)、B'0(3)、B'0(4)のうち最小の合計符号量がB'0(4)であるならば、B'0(4)を与えたときの予測次数4を最適予測次数POとして決定する。
 そして、量子化部100は、最適予測次数POと、最適予測次数POに対応するステップS1cの処理で得られた量子化済PARCOR係数の系列K'O=(K'O(1),K'O(2),…,K'O(PO))を出力する。なお、PO>PTあるいはPO≧PTの場合、ステップS1cの処理でPARCOR係数K(PT+1),…,K(PO)は量子化されていないので、PARCOR係数K(PT+1),…,K(PO)を固定ビット長で量子化して量子化済PARCOR係数K'(PT+1),…,K'(PO)を求めてから、量子化済PARCOR係数の系列K'O=(K'O(1),K'O(2),…,K'O(PO))を出力することになる。
 以上の実施形態の他、本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
 例えば、PARCOR係数K'O(i)を表すビット数は、8に限らず32や16でもよい。
 本発明の予測次数決定方法は、コンピュータの記録部に、本発明の各機能構成部としてコンピュータを動作させるプログラムを読み込ませ、処理部、入力部、出力部などを動作させることで、コンピュータに実行させることができる。また、コンピュータに読み込ませる方法としては、プログラムをコンピュータ読み取り可能な記録媒体に記録しておき、記録媒体からコンピュータに読み込ませる方法、サーバ等に記録されたプログラムを、電気通信回線等を通じてコンピュータに読み込ませる方法などがある。

Claims (21)

  1.    入力信号から算出されたPARCOR係数を用いて線形予測の予測次数を決定する予測次数決定方法であって、
       予め設定された範囲の各予測次数について、予測次数に応じて予め定められたビット数で当該予測次数までの各上記PARCOR係数を量子化して、当該PARCOR係数に対応する量子化済PARCOR係数を得る量子化ステップと、
       予め設定された範囲の各予測次数について、各上記量子化済PARCOR係数の符号量と、各上記量子化済PARCOR係数を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求める符号量推定ステップと、
       予め設定された範囲の各予測次数のうち、上記合計符号量のうち少なくとも予測次数に依存する符号量が最小となる予測次数を、線形予測の予測次数として決定する予測次数決定ステップと
    を有する予測次数決定方法。
  2.    入力信号から算出されたPARCOR係数を用いて線形予測の予測次数を決定する予測次数決定方法であって、
       予め設定された範囲の各予測次数(以下、候補次数という。)について、予測次数に応じて予め定められたビット数で候補次数までの各上記PARCOR係数を量子化して、当該PARCOR係数に対応する量子化済PARCOR係数を得る量子化ステップと、
       上記範囲の各上記候補次数について、少なくとも、各上記量子化済PARCOR係数の符号量と、候補次数までの各上記PARCOR係数を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量(以下、推定残差符号量という。)との合計符号量を求める符号量推定ステップと、
       上記範囲の各上記候補次数のうち、上記合計符号量が最小となる候補次数を、線形予測の予測次数として決定する予測次数決定ステップと
    を有する予測次数決定方法。
  3.    請求項2に記載の予測次数決定方法であって、
       上記推定残差符号量は、上記候補次数まで、予測次数ごとに得られる1から上記PARCOR係数の二乗を減じた値の対数を合計した値で表される
    ことを特徴とする予測次数決定方法。
  4.    請求項3に記載の予測次数決定方法であって、
       上記対数がテイラー級数で近似されている
    ことを特徴とする予測次数決定方法。
  5.    請求項4に記載の予測次数決定方法であって、
       上記対数をテイラー級数で近似した値に重み係数が乗じられている
    ことを特徴とする予測次数決定方法。
  6.    入力信号から算出されたPARCOR係数を用いて線形予測の予測次数を決定する予測次数決定方法であって、
       予め設定された範囲の各予測次数について、予測次数に応じて予め定められたビット数で当該予測次数までの各上記PARCOR係数を量子化して得られる量子化済PARCOR係数のインデックスを求める量子化ステップと、
       予め設定された範囲の各予測次数について、上記入力信号の線形予測残差のエントロピーの算出式に含まれる量子化済PARCOR係数を用いた演算の事前計算結果とインデックスとが対応付けられた参照テーブルから、上記インデックスに対応する事前計算結果を表引きし、当該事前計算結果を用いた上記エントロピーによって推定される上記線形予測残差の符号量と、上記量子化済PARCOR係数の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求める符号量推定ステップと、
       予め設定された範囲の各予測次数のうち、上記合計符号量のうち少なくとも予測次数に依存する符号量が最小となる予測次数を、線形予測の予測次数として決定する予測次数決定ステップと
    を有する予測次数決定方法。
  7.    入力信号から算出されたPARCOR係数を用いて線形予測の予測次数を決定する予測次数決定方法であって、
       予め設定された範囲の各予測次数について、予測次数に応じて予め定められたビット数で当該予測次数までの各上記PARCOR係数を量子化して、当該PARCOR係数に対応する量子化済PARCOR係数を得る量子化ステップと、
       (1)予め設定された範囲のうち一部の各予測次数について、各上記量子化済PARCOR係数の符号量と、各上記量子化済PARCOR係数を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量と、(2)予め設定された範囲のうち上記一部以外の各予測次数について、各上記量子化済PARCOR係数の符号量と、上記PARCOR係数を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量とを求める符号量推定ステップと、
       予め設定された範囲の各予測次数のうち、上記合計符号量のうち少なくとも予測次数に依存する符号量が最小となる予測次数を、線形予測の予測次数として決定する予測次数決定ステップと
    を有する予測次数決定方法。
  8.    請求項7に記載の予測次数決定方法であって、
       予め設定された範囲のうち上記一部に含まれる予測次数は、予め定められた閾値以下の予測次数または当該閾値よりも小さい予測次数である
    ことを特徴とする予測次数決定方法。
  9.    請求項7に記載の予測次数決定方法であって、
       予め設定された範囲のうち上記一部に含まれる予測次数は、予め定められた閾値以上の予測次数または当該閾値よりも大きい予測次数である
    ことを特徴とする予測次数決定方法。
  10.    請求項7に記載の予測次数決定方法であって、
       予め設定された範囲のうち上記一部に含まれる予測次数は偶数の予測次数であり、予め設定された範囲のうち上記一部以外に含まれる予測次数は奇数の予測次数である、
       あるいは、
       予め設定された範囲のうち上記一部に含まれる予測次数は奇数の予測次数であり、予め設定された範囲のうち上記一部以外に含まれる予測次数は偶数の予測次数である、
    ことを特徴とする予測次数決定方法。
  11.    入力信号から算出されたPARCOR係数を用いて線形予測の予測次数を決定する予測次数決定方法であって、
       入力された上記PARCOR係数K(1),K(2),…,K(Ptmp)について、[1]Ptmpが予め定められた値PT以下あるいはPTより小さい場合に、予測次数に応じて予め定められたビット数で各上記PARCOR係数K(1),K(2),…,K(Ptmp)を量子化して量子化済PARCOR係数K'(1),K'(2),…,K'(Ptmp)を求め、[2]Ptmpが予め定められた値PTより大きいあるいはPT以上である場合に、各上記PARCOR係数K(1),K(2),…,K(PT)を予測次数に応じて予め定められたビット数で量子化して量子化済PARCOR係数K'(1),K'(2),…,K'(PT)を求める量子化ステップと、
       上記[1]の場合、1次からPtmp次までの各予測次数について、量子化済PARCOR係数K'(1),K'(2),…,K'(Ptmp)の符号量と、当該量子化済PARCOR係数K'(1),K'(2),…,K'(Ptmp)を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求め、上記[2]の場合、1次からPT次までの各予測次数について、量子化済PARCOR係数K'(1),K'(2),…,K'(PT)の符号量と、当該量子化済PARCOR係数K'(1),K'(2),…,K'(PT)を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求め、PT+1次からPtmp次までの各予測次数について、量子化済PARCOR係数K'(1),K'(2),…,K'(PT)の符号量と、各PARCOR係数K(PT+1),…,K(Ptmp)を固定ビット長で量子化した場合の符号量と、量子化済PARCOR係数K'(1),K'(2),…,K'(PT)と各PARCOR係数K(PT+1),…,K(Ptmp)を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求める符号量推定ステップと、
       予め設定された範囲の各予測次数のうち、上記合計符号量のうち少なくとも予測次数に依存する符号量が最小となる予測次数を、線形予測の予測次数として決定する予測次数決定ステップと
    を有する予測次数決定方法。
  12.    入力信号から算出されたPARCOR係数を用いて線形予測の予測次数を決定する予測次数決定装置であって、
       予め設定された範囲の各予測次数について、予測次数に応じて予め定められたビット数で当該予測次数までの各上記PARCOR係数を量子化して、当該PARCOR係数に対応する量子化済PARCOR係数を得る量子化部と、
       予め設定された範囲の各予測次数について、各上記量子化済PARCOR係数の符号量と、各上記量子化済PARCOR係数を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求める符号量推定部と、
       予め設定された範囲の各予測次数のうち、上記合計符号量のうち少なくとも予測次数に依存する符号量が最小となる予測次数、線形予測の予測次数として決定する予測次数決定部と
    を含む予測次数決定装置。
  13.    入力信号から算出されたPARCOR係数を用いて線形予測の予測次数を決定する予測次数決定装置であって、
       予め設定された範囲の各予測次数(以下、候補次数という。)について、予測次数に応じて予め定められたビット数で候補次数までの各上記PARCOR係数を量子化して、当該PARCOR係数に対応する量子化済PARCOR係数を得る量子化部と、
       上記範囲の各上記候補次数について、少なくとも、各上記量子化済PARCOR係数の符号量と、候補次数までの各上記PARCOR係数を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量(以下、推定残差符号量という。)との合計符号量を求める符号量推定部と、
       上記範囲の各上記候補次数のうち、上記合計符号量が最小となる候補次数を、線形予測の予測次数として決定する予測次数決定部と
    を有する予測次数決定方法。
  14.    請求項13に記載の予測次数決定装置であって、
       上記推定残差符号量は、上記候補次数まで、予測次数ごとに得られる1から上記PARCOR係数の二乗を減じた値の対数を合計した値で表される
    ことを特徴とする予測次数決定装置。
  15.    請求項14に記載の予測次数決定装置であって、
       上記対数がテイラー級数で近似されている
    ことを特徴とする予測次数決定装置。
  16.    請求項15に記載の予測次数決定装置であって、
       上記対数をテイラー級数で近似した値に重み係数が乗じられている
    ことを特徴とする予測次数決定装置。
  17.    入力信号から算出されたPARCOR係数を用いて線形予測の予測次数を決定する予測次数決定装置であって、
       予め設定された範囲の各予測次数について、予測次数に応じて予め定められたビット数で当該予測次数までの各上記PARCOR係数を量子化して得られる量子化済PARCOR係数のインデックスを求める量子化部と、
       予め設定された範囲の各予測次数について、上記入力信号の線形予測残差のエントロピーの算出式に含まれる量子化済PARCOR係数を用いた演算の事前計算結果とインデックスとが対応付けられた参照テーブルから、上記インデックスに対応する事前計算結果を表引きし、当該事前計算結果を用いた上記エントロピーによって推定される上記線形予測残差の符号量と、上記量子化済PARCOR係数の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求める符号量推定部と、
       予め設定された範囲の各予測次数のうち、上記合計符号量のうち少なくとも予測次数に依存する符号量が最小となる予測次数を、線形予測の予測次数として決定する予測次数決定部と
    を含む予測次数決定装置。
  18.    入力信号から算出されたPARCOR係数を用いて線形予測の予測次数を決定する予測次数決定装置であって、
       予め設定された範囲の各予測次数について、予測次数に応じて予め定められたビット数で当該予測次数までの各上記PARCOR係数を量子化して、当該PARCOR係数に対応する量子化済PARCOR係数を得る量子化部と、
       (1)予め設定された範囲のうち一部の各予測次数について、各上記量子化済PARCOR係数の符号量と、各上記量子化済PARCOR係数を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量の合計符号量のうち少なくとも予測次数に依存する符号量と、(2)予め設定された範囲のうち上記一部以外の各予測次数について、各上記量子化済PARCOR係数の符号量と、上記PARCOR係数を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量の合計符号量のうち少なくとも予測次数に依存する符号量とを求める符号量推定部と、
       予め設定された範囲の各予測次数のうち、上記合計符号量のうち少なくとも予測次数に依存する符号量が最小となる予測次数を、線形予測の予測次数として決定する予測次数決定部と
    を含む予測次数決定装置。
  19.    入力信号から算出されたPARCOR係数を用いて線形予測の予測次数を決定する予測次数決定装置であって、
       入力された上記PARCOR係数K(1),K(2),…,K(Ptmp)について、[1]Ptmpが予め定められた値PT以下あるいはPTより小さい場合に、予測次数に応じて予め定められたビット数で各上記PARCOR係数K(1),K(2),…,K(Ptmp)を量子化して量子化済PARCOR係数K'(1),K'(2),…,K'(Ptmp)を求め、[2]Ptmpが予め定められた値PTより大きいあるいはPT以上である場合に、各上記PARCOR係数K(1),K(2),…,K(PT)を予測次数に応じて予め定められたビット数で量子化して量子化済PARCOR係数K'(1),K'(2),…,K'(PT)を求める量子化部と、
       上記[1]の場合、1次からPtmp次までの各予測次数について、量子化済PARCOR係数K'(1),K'(2),…,K'(Ptmp)の符号量と、当該量子化済PARCOR係数K'(1),K'(2),…,K'(Ptmp)を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求め、上記[2]の場合、1次からPT次までの各予測次数について、量子化済PARCOR係数K'(1),K'(2),…,K'(PT)の符号量と、当該量子化済PARCOR係数K'(1),K'(2),…,K'(PT)を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求め、PT+1次からPtmp次までの各予測次数について、量子化済PARCOR係数K'(1),K'(2),…,K'(PT)の符号量と、各PARCOR係数K(PT+1),…,K(Ptmp)を固定ビット長で量子化した場合の符号量と、量子化済PARCOR係数K'(1),K'(2),…,K'(PT)と各PARCOR係数K(PT+1),…,K(Ptmp)を用いて表される、上記入力信号の線形予測残差のエントロピーによって推定される当該線形予測残差の符号量と、予測次数を表す情報の符号量との合計符号量のうち少なくとも予測次数に依存する符号量を求める符号量推定部と、
       予め設定された範囲の各予測次数のうち、上記合計符号量のうち少なくとも予測次数に依存する符号量が最小となる予測次数を、線形予測の予測次数として決定する予測次数決定部と
    を含む予測次数決定装置。
  20.    コンピュータを請求項12から請求項19のいずれかに記載された予測次数決定装置として機能させるためのプログラム。
  21.    コンピュータを請求項12から請求項19のいずれかに記載された予測次数決定装置として機能させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
PCT/JP2010/059272 2009-06-03 2010-06-01 予測次数決定方法、予測次数決定装置、プログラム及び記録媒体 WO2010140591A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011518456A JP5562332B2 (ja) 2009-06-03 2010-06-01 予測次数決定方法、予測次数決定装置、プログラム及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009134371 2009-06-03
JP2009-134371 2009-06-03

Publications (1)

Publication Number Publication Date
WO2010140591A1 true WO2010140591A1 (ja) 2010-12-09

Family

ID=43297725

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/059272 WO2010140591A1 (ja) 2009-06-03 2010-06-01 予測次数決定方法、予測次数決定装置、プログラム及び記録媒体

Country Status (2)

Country Link
JP (1) JP5562332B2 (ja)
WO (1) WO2010140591A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120225A (ja) * 2011-12-06 2013-06-17 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、符号化装置、プログラム、記録媒体
KR20200111027A (ko) * 2019-03-18 2020-09-28 한양대학교 산학협력단 RoIP 선형 예측 부호화 및 비선형 양자화 융합 압축 송신 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279385A (ja) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> マルチチャネル符号化方法、その装置、そのプログラム及び記録媒体
JP2007318691A (ja) * 2006-05-29 2007-12-06 Nippon Telegr & Teleph Corp <Ntt> 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
JP2009069309A (ja) * 2007-09-11 2009-04-02 Nippon Telegr & Teleph Corp <Ntt> 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279385A (ja) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> マルチチャネル符号化方法、その装置、そのプログラム及び記録媒体
JP2007318691A (ja) * 2006-05-29 2007-12-06 Nippon Telegr & Teleph Corp <Ntt> 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
JP2009069309A (ja) * 2007-09-11 2009-04-02 Nippon Telegr & Teleph Corp <Ntt> 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUTAKA KAMAMOTO ET AL.: "ITU-T G711.0 (Lossless Onsei Fugoka) de Tsukawareteiru Tei Enzanryo no Senkei Yosoku Jisu Suiteiho", REPORT OF THE 2010 SPRING MEETING, THE ACOUSTICAL SOCIETY OF JAPAN, 1 March 2010 (2010-03-01), pages 475 - 476 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120225A (ja) * 2011-12-06 2013-06-17 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、符号化装置、プログラム、記録媒体
KR20200111027A (ko) * 2019-03-18 2020-09-28 한양대학교 산학협력단 RoIP 선형 예측 부호화 및 비선형 양자화 융합 압축 송신 방법
KR102229893B1 (ko) 2019-03-18 2021-03-19 한양대학교 산학협력단 RoIP 선형 예측 부호화 및 비선형 양자화 융합 압축 송신 방법

Also Published As

Publication number Publication date
JP5562332B2 (ja) 2014-07-30
JPWO2010140591A1 (ja) 2012-11-22

Similar Documents

Publication Publication Date Title
JP4825916B2 (ja) 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
CN104584122B (zh) 使用改进的概率分布估计的基于线性预测的音频编码
US8463615B2 (en) Low-delay audio coder
JP5337235B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
JP3636094B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
EP3069449B1 (en) Split gain shape vector coding
CN110491399B (zh) 编码方法、编码装置以及记录介质
US8576910B2 (en) Parameter selection method, parameter selection apparatus, program, and recording medium
KR101771065B1 (ko) 씨이엘피 부호기 및 복호기에 사용하기 위한 가요성 및 스케일러블 조합형 이노베이션 코드북
JP5562332B2 (ja) 予測次数決定方法、予測次数決定装置、プログラム及び記録媒体
CN115668777A (zh) 用于改进的机器学习压缩的系统和方法
KR20060063198A (ko) 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
JP5780686B2 (ja) Parcor係数量子化方法、装置、プログラム
KR100835661B1 (ko) 다수 필터 결정법을 이용한 동영상 압축 부호화 장치 및방법
JP3294024B2 (ja) 音声信号の符号化伝送方法
EP1416736A1 (en) Image encoding apparatus and method
JP2774003B2 (ja) コード励振線形予測符号化装置
JPH0715347A (ja) 符号化装置及び復号装置
JPH10228297A (ja) Lspの予測符号化装置及び方法
JP5042978B2 (ja) データ符号化装置及びデータ符号化方法
Kamamoto et al. Low-complexity PARCOR coefficient quantization and prediction order estimation designed for entropy coding of prediction residuals
Kamamoto et al. Low-complexity PARCOR coefficient quantizer and prediction order estimator for G. 711.0 (Lossless Speech Coding)
JPH0736493A (ja) 可変レート音声符号化装置
JP2005197989A (ja) べき乗演算回路、量子化回路および方法
JPH09269799A (ja) 雑音抑圧処理機能を備えた音声符号化回路

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10783374

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2011518456

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10783374

Country of ref document: EP

Kind code of ref document: A1