WO2010140590A1 - Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体 - Google Patents

Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体 Download PDF

Info

Publication number
WO2010140590A1
WO2010140590A1 PCT/JP2010/059271 JP2010059271W WO2010140590A1 WO 2010140590 A1 WO2010140590 A1 WO 2010140590A1 JP 2010059271 W JP2010059271 W JP 2010059271W WO 2010140590 A1 WO2010140590 A1 WO 2010140590A1
Authority
WO
WIPO (PCT)
Prior art keywords
parcor coefficient
bit
parcor
value
bit string
Prior art date
Application number
PCT/JP2010/059271
Other languages
English (en)
French (fr)
Inventor
優 鎌本
登 原田
守谷 健弘
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP2011518455A priority Critical patent/JPWO2010140590A1/ja
Priority to CN201080022910XA priority patent/CN102449691B/zh
Priority to US13/320,861 priority patent/US8902997B2/en
Publication of WO2010140590A1 publication Critical patent/WO2010140590A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error

Definitions

  • the present invention relates to a lossless encoding technique for digital time series signals such as acoustic signals.
  • the input signal is processed every N sample frames.
  • the maximum order of the allowable PARCOR coefficient is Pmax order.
  • the symbol “ ⁇ ” represents multiplication.
  • the residual encoding unit 911 performs entropy encoding on the prediction residual eO (n), for example, and outputs a residual code CeO.
  • the code synthesis unit 913 outputs a combination of the residual code CeO and the coefficient code CkO as a synthesis code CaO.
  • the quantization unit 903 quantizes the PARCOR coefficient in order to send the code effectively.
  • FIG. 2 shows a case where the PARCOR coefficient is linearly quantized as an example of the prior art.
  • Each PARCOR coefficient included in the PARCOR coefficient series KO has a real value ranging from ⁇ 1 to +1. If each PARCOR coefficient is calculated with 16-bit precision and each PARCOR coefficient is multiplied by 32768 and expressed as a 16-bit signed integer, each PARCOR coefficient has a value from -32768 to +32767. become.
  • each quantized PARCOR coefficient included in the quantized PARCOR coefficient series K'O is a 4-bit precision value, the error due to quantization is larger than the 16-bit precision, but the quantized PARCOR coefficient series K '
  • the code amount representing each quantized PARCOR coefficient included in 'O is also sufficient with 4 bits, and how coarsely the quantization is performed is a trade-off between quantization error and code amount.
  • Non-Patent Documents 1 to 3 nonlinear quantization is performed using a function arc sin or a function tanh, and bit allocation is changed according to the order. Further, as disclosed in Non-Patent Document 4, lossless encoding MPEG-4 ALS of acoustic signals uses a nonlinear function including a root (root number).
  • the prediction residual eO (n) is not increased by finely quantizing the values near +1 and +1 where the PARCOR coefficient has high sensitivity (increase in error) and coarsely quantizing around 0.
  • the PARCOR coefficient series KO is quantized.
  • more complicated processing is required compared with linear quantization.
  • Non-Patent Documents 1 to 3 used in lossy speech coding, the quantizer is designed so that audible distortion minimization is the standard. Even if audible distortion is minimized, the entropy of the linear prediction residual of the input signal is not minimized, and the code amount is not minimized. For this reason, there is a problem that the code amount in the lossless encoding is not minimized even if this criterion is used.
  • an object of the present invention is to provide a PARCOR coefficient quantization technique for high-compression lossless coding.
  • the present invention is based on the criterion of minimizing the entropy of the linear prediction residual of the input signal used to calculate the input PARCOR coefficient series, and the linear prediction residual due to the quantization error of the PARCOR coefficient. As the absolute value of the PARCOR coefficient is larger, the PARCOR coefficient is quantized with higher quantization accuracy so as to suppress the increase in the code amount.
  • the PARCOR coefficient is expressed as a value of R bits
  • U is a predetermined integer satisfying 1 or more and less than ⁇ R- (2 U -1) ⁇
  • V is 0 or more ⁇ R- (2 U -1) -U ⁇ is obtained as a predetermined integer satisfying less than -U ⁇
  • a bit string representing the absolute value L of the PARCOR coefficient K is obtained, and the U bit is obtained from the most significant bit in this bit string (the value of the U bit is W
  • the (U + V + W) bits may be acquired from the most significant bit in the bit string.
  • the PARCOR coefficient is quantized according to the entropy minimization standard, the compression rate of lossless encoding can be improved.
  • FIG. 6 is a diagram illustrating a functional configuration example of an encoding process including PARCOR coefficient quantization according to the first and second embodiments.
  • FIG. 10 is a diagram showing a processing flow of PARCOR coefficient quantization according to the second embodiment.
  • FIG. 10 is a diagram illustrating a functional configuration example of an encoding process including PARCOR coefficient quantization according to the third embodiment.
  • FIG. 10 is a diagram illustrating a processing flow of PARCOR coefficient quantization according to the third embodiment.
  • FIG. 10 is a diagram illustrating a processing flow of PARCOR coefficient quantization according to the fourth embodiment.
  • the PARCOR coefficient can be used to estimate the energy of the prediction residual.
  • the energy EO (1) of the prediction residual when the linear prediction is performed using the PARCOR coefficient KO (1) is expressed by Expression (3).
  • the energy EO (2) of the prediction residual when the second-order linear prediction is performed using the PARCOR coefficient KO (2) is expressed by Expression (4).
  • Equation (6) The entropy of the Gaussian distribution with mean 0 and variance ⁇ 2 (ie, energy divided by N) is expressed by equation (6).
  • Equation (7) The entropy of the Laplace distribution with mean 0 and variance ⁇ 2 (that is, energy divided by N) is expressed by equation (7).
  • Equation (8) the entropy is expressed by Equation (8) with ⁇ as a constant.
  • the value of the constant ⁇ is about 2 in the case of a Gaussian distribution from the equation (6), and is about 1.7 in the case of a Laplace distribution from the equation (7).
  • Equation (5) the entropy HO (PO) of the prediction residual when performing the PO-order linear prediction that is the optimal order, that is, the average estimated number of bits required for one sample of the prediction residual is And represented by equation (9).
  • the second term on the right side of Equation (9) depends on the input signal and can be regarded as a constant. Therefore, the value of entropy HO (PO) changes depending on what value the third term on the right side of Equation (9) takes.
  • the third term on the right side also has a value close to 0, so the entropy cannot be lowered and predicted. The average estimated number of bits required for one residual sample cannot be reduced.
  • Non-Patent Documents 1 to 4 if KO (1) and KO (2) included in the PARCOR coefficient series KO take values near +1 or -1, the third term on the right side should be negative.
  • the entropy is reduced, the average number of estimated bits required for one prediction residual sample can be reduced.
  • the portion corresponding to the first-order PARCOR coefficient in the third term on the right side is expressed by the formula ( 10), and the residual code CeO can be reduced by about 1.6 bits.
  • the fourth-order PARCOR coefficient has a value around 0.25, so the part corresponding to the fourth-order PARCOR coefficient in the third term on the right side is the formula (11), and the residual code CeO can be reduced by only about 0.05 bits.
  • the number of bits of the code corresponding to the optimum order PO among the coefficient codes is set.
  • when the optimal order PO is encoded with a fixed number of bits, ⁇ is a constant and may be ignored
  • the quantized PARCOR coefficient K′O If the code amount corresponding to each of 1), K′O (2),..., K′O (PO) is C (1), (2),.
  • the estimated code amount of the composite code CaO can be expressed by Expression (12).
  • the solid line ⁇ shown in FIG. 3 indicates the code amount of the composite code corresponding to this equation (12). If the quantization accuracy of the PARCOR coefficient is increased, the difference between the PARCOR coefficient series KO and the quantized PARCOR coefficient series K'O is reduced, and the prediction residual eO (n) is also reduced. A small amount of code is required to represent the difference code. However, the amount of code required to represent the quantized PARCOR coefficient sequence K′O indicated by the broken line ⁇ in FIG. 3 increases. Therefore, the estimated code amount of the composite code CaO is not necessarily reduced when the accuracy of the PARCOR coefficient is increased.
  • the present invention increases the code amount of the residual code CeO due to the quantization error of the PARCOR coefficient when the PARCOR coefficient value is large, and the residual due to the quantization error of the PARCOR coefficient when the PARCOR coefficient value is small. Paying attention to the fact that the increase in the code amount of the difference code CeO is small, the PARCOR coefficient is quantized.
  • the linear prediction residual caused by the quantization error of the PARCOR coefficient is used under the criterion of minimizing the entropy of the linear prediction residual of the input signal used for calculating the input PARCOR coefficient series.
  • the PARCOR coefficient is quantized with higher quantization accuracy as the absolute value of the PARCOR coefficient is larger.
  • the embodiment of the present invention has the functional configuration of the quantization unit 100 shown in FIG. 4, and as shown in FIG. 4, the entire encoding process is performed except that the quantization unit 903 is changed to the quantization unit 100.
  • the quantized PARCOR coefficient sequence K′O (K′O (1), K′O (2),..., K′O (PO)) is sent to the coefficient encoding unit 909.
  • the quantization unit 100 As the absolute value of the input PARCOR coefficient is larger, the quantization unit 100 is represented by including more effective bits (1 in the binary number) from the most significant bit toward the least significant bit. Output the value.
  • the 16-bit value 1xxy yyyy yyyyyyyyyyyyy is the quantized PARCOR coefficient
  • the 16-bit value 0xyy yyyyyyyyyyyyyyyy is the quantized PARCOR. It becomes a coefficient.
  • the value of the bit position of x is the same as the value of the corresponding bit in the bit string representing the original PARCOR coefficient KO (i), but the value of the bit position of y is a predetermined arbitrary value (for example, 0) It is.
  • the absolute value of the PARCOR coefficient KO (i) is determined by only the most significant bit of the unsigned R bit of the PARCOR coefficient KO (i), that is, the most significant bit of the portion representing the absolute value of the PARCOR coefficient KO (i). If the absolute value of the PARCOR coefficient KO (i) is in the range of the larger side, or the absolute value of the PARCOR coefficient KO (i) is in the range of the smaller side. Encodes the P 1 bit from the most significant bit and encodes the P 2 bit (where P 1 > P 2 ) from the most significant bit when the absolute value of the PARCOR coefficient KO (i) is in the smaller range. It will be the target.
  • the entropy reduction effect is expressed by a logarithmic function of base 2. Therefore, the sensitivity of the PARCOR coefficient is in the order of the exponential function of 2, which is the inverse function thereof. . Therefore, in the case of binary representation, if quantization according to the most significant bit is performed, the quantization is based on the entropy minimization standard.
  • the (P 1 +1) bit (“S1bc”) including “b” and the fourth bit “c”) is sent to the coefficient encoding unit 909 as an encoding target. If the bit next to the most significant bit (“S”) (“a” in the second bit from the left) is 0, the quantization unit 100 stores one bit to the right of the bit (the third bit from the left). (P 2 +1) bits (“S0b”) including b ′′) are sent to the coefficient encoding unit 909 as an encoding target.
  • the 16-bit value S1xx yyyy yyyyy yyyy is the quantized PARCOR coefficient
  • the 16-bit value S0xy yyyyy yyyyyyyyyy is quantized.
  • the converted PARCOR coefficient is a bit representing a sign
  • the value of the bit position of x is the same as the value of the corresponding bit in the bit string representing the original PARCOR coefficient KO (i), but the value of the bit position of y is It is a set arbitrary value (for example, 0).
  • the two's complement expression is used, so that the processing of “if 0” and “if 1” in the description of the quantization unit 100 are replaced.
  • the values of P 1 and P 2 logically satisfy P 1 ⁇ R, P 2 ⁇ R, and P 2 ⁇ P 1 , but specific values may be determined as appropriate.
  • the PARCOR coefficient KO (i) is determined only by the bit next to the most significant bit of the signed R bit of the PARCOR coefficient KO (i), that is, the most significant bit of the portion representing the absolute value of the PARCOR coefficient KO (i).
  • the range where the absolute value of PARCOR coefficient KO (i) is larger is selected, and the range where the absolute value of PARCOR coefficient KO (i) is larger is selected.
  • the P 1 bit from the most significant bit is to be encoded, and the P 2 bit from the most significant bit when the absolute value of the PARCOR coefficient KO (i) is in the smaller range (where P 1 > P 2). ) To be encoded.
  • the quantization unit 100 transmits S1xx yyyy yyyyyyyyyyyyyy or S0xy yyyyyyyyyyyyyyyyyyyyyyyy obtained by adding a positive / negative code S to the most significant bit of the resultant bit string to the coefficient encoding unit 909. Note that the most significant 4 bits of S1xx yyyy yyyyyyyyyyyyyyyyyy are to be encoded. Further, the most significant 3 bits of S0xy yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy are to be encoded.
  • S is a bit representing a sign
  • the value of the bit position of x is the same as the value of the corresponding bit in the bit string representing the original PARCOR coefficient KO (i), but the value of the bit position of y is predetermined. Any arbitrary value (for example, 0).
  • the quantization unit 100 transmits the result 01xx yyyy yyyyyyyyyy or 00xy yyyyyyyyyyyy to the coefficient coding unit 909.
  • 3-bit "1xx” is the encoding target.
  • 2-bit “0x” is an encoding target.
  • the value of the bit position of x is the same as the value of the corresponding bit in the bit string representing the original PARCOR coefficient KO (i), but the value of the bit position of y is a predetermined arbitrary value.
  • the quantization unit 100 includes a first processing unit 102, a second processing unit 104, a third processing unit 106, and an adding unit 108.
  • the PARCOR coefficient KO (i) is expressed as an R-bit value
  • U is a predetermined integer satisfying 1 or more and less than ⁇ R- (2 U -1) ⁇
  • V is 0 or more ⁇ Let it be a predetermined integer satisfying less than R- (2 U -1) -U ⁇ .
  • U and V The reason for defining U and V in this way is that, as will be described later, a bit shift operation of (RUVW) bits is performed using W that satisfies 0 ⁇ W ⁇ 2 U ⁇ 1, so that RUVW ⁇ 0 is satisfied.
  • This is for setting U and V.
  • U is a predetermined integer satisfying 1 or more and less than R
  • V is a predetermined integer satisfying 0 or more and less than R
  • the right bit that is not sufficient for the bit shift operation when RUVW ⁇ 0 is obtained. It may be regarded as 0.
  • the second processing unit 104 shifts the bit string representing L (i) to the right by (15-U) bits (step S2).
  • the value is W (decimal notation).
  • 0ab is obtained by shifting L (i) to the right by 13 bits.
  • a value obtained by decimal representation of 0ab in binary notation is W.
  • the third processing unit 106 shifts the bit string representing L (i) to the right by (15-UVW) bits, and then shifts it to the left by zero padding (15-UVW) (step S3).
  • This result is defined as L ′ (i).
  • the adding unit 108 adds the positive / negative sign S (i) of KO (i) as a sign bit to L ′ (i) (step S4).
  • the 16-bit bit string obtained by the process of step S4 becomes the quantized PARCOR coefficient K′O (i).
  • the padding may be an arbitrary numerical value (for example, 010101). Instead of zero padding.
  • nonlinear quantization can be performed so as to have a bit string pattern of Sxxy yyyz zzzzzzzz.
  • S is a sign bit
  • x is a bit depending on U
  • y is a bit depending on W and V
  • z is an arbitrary bit.
  • the PARCOR coefficient is quantized with higher quantization accuracy as the absolute value of the PARCOR coefficient is larger.
  • This modified example is an example in which the process in step S4 in the second example is omitted, and corresponds to the generalization of the specific example 4.
  • the information of the positive / negative code S (i) obtained by the process of step S1 is sent to the coefficient encoding unit 909 as an encoding target.
  • a bit string pattern of 0xxy yyyz zzzz zzzz is obtained as L ′ (i) by the processing in step 3. Therefore, the 16-bit bit string obtained by the process of step S3 is set as a quantized PARCOR coefficient K′O (i).
  • Example 3 A third embodiment that uses a reference table stored in the memory 50 will be described, unlike the second embodiment that frequently uses shift operations.
  • An example of the reference table is shown in FIG.
  • a bit string represented by including more effective bits from the most significant bit to the least significant bit is assigned as T increases.
  • a bit string having the most significant bit of 0 is assigned corresponding to T. ing.
  • the quantization unit 100a includes a first processing unit 102a, a second processing unit 104a, a third processing unit 106a, and an adding unit 108a.
  • the PARCOR coefficient is expressed as an R-bit value
  • U is a predetermined integer satisfying 1 or more and less than ⁇ R- (2 U -1) ⁇
  • V is 0 or more and ⁇ R- (2 It is a predetermined integer satisfying less than U ⁇ 1) ⁇ U ⁇ .
  • the reason for defining U and V in this way is that, as will be described later, a bit shift operation of (RUVW) bits is performed using W that satisfies 0 ⁇ W ⁇ 2 U ⁇ 1, so that RUVW ⁇ 0 is satisfied.
  • the value is T (decimal notation).
  • 0abc def is obtained by shifting L (i) to the right by 9 bits.
  • a value obtained by decimal representation of 0abc def in binary notation is T.
  • the adding unit 108a adds the positive / negative sign S (i) of KO (i) as a sign bit to L ′ (i) (step S4a).
  • S (i) S is added to the MSB (Most Significant Bit) of L ′ (i).
  • a positive or negative sign (or a sign meaning it) is added to the value of T to be T ', and the bit string corresponding to the T' is referenced from the reference table using the value of T '.
  • L ′ (i) with a positive / negative sign may be obtained by performing a table lookup.
  • the 16-bit bit string obtained by the process of step S4 becomes the quantized PARCOR coefficient K′O (i).
  • nonlinear quantization can be performed so as to have a bit string pattern of Sxxy yyyz zzzzzz.
  • the table occupancy increases the memory occupation amount, but the shift operation can be reduced, so that the operation amount can be reduced.
  • the PARCOR coefficient K′O (i) has been described as being represented by signed R bits, but the third embodiment can also be applied to an unsigned R bit PARCOR coefficient K′O (i). Moreover, it can also be set as embodiment which abbreviate
  • Example 4 Different from the second embodiment using the shift operation, the fourth embodiment using a bitwise AND operation (bit mask) will be described. A different part from Example 2 is demonstrated.
  • the second processing unit 104 masks bits other than necessary bits in the bit string representing L (i) (bitwise AND operation with 1 is performed on necessary bits). And performs a bitwise AND operation with 0 on unnecessary bits) (step S2b).
  • the value is W (decimal notation).
  • the third processing unit 106 masks bits other than necessary bits in the bit string representing L (i) based on the value of W (performs bitwise AND operation with 1 on necessary bits). Then, a bitwise AND operation with 0 is performed on unnecessary bits) (step S3b). This result is defined as L ′ (i).
  • step S4 described in the second embodiment is performed.
  • an embodiment in which the process of step S4a is omitted may be employed.
  • ⁇ Modification 1> Only a part of the PARCOR coefficients KO (i) included in the PARCOR coefficient series KO (KO (1), KO (2),..., KO (PO)) input to the quantization units 100 and 100a The quantization method of the present invention may be applied.
  • the remaining PARCOR coefficient KO (i) to which the quantization method of the present invention is not applied is quantized by, for example, a conventional quantization method.
  • the values of the order PO and the PARCOR coefficient are given.
  • the order PO is used as a reference
  • the input PARCOR coefficients K (1), K (2),..., K (P) from the first order to the P order are less than or equal to a predetermined order or more than the order.
  • the quantization method of the present invention is applied to small order PARCOR coefficients. As shown in Fig. 4 of Non-Patent Document 4, since a low-order PARCOR coefficient generally has a large value, the PARCOR coefficient of an order lower than a predetermined order (for example, 3) or smaller than that order is used.
  • the quantization method of the present invention is applied.
  • the quantization method of the present invention is applied to a PARCOR coefficient having a value greater than or equal to a predetermined threshold value or greater than the threshold value. This is because when the value of the PARCOR coefficient is large, the increase in the code amount of the residual code CeO due to the quantization error of the PARCOR coefficient becomes large.
  • Non-Patent Document 4 a function obtained qualitatively from observation of experimental results is used instead of a theoretically defined function. For this reason, when the number of samples per frame is as small as 10 times the PARCOR coefficient (about 100 samples per 10th-order PARCOR coefficient per frame), the code amount of the residual code CeO Since the code amount of the coefficient code CkO is not very small, the code amount necessary for the PARCOR coefficient cannot be ignored, and the code amount of the composite code CaO is not necessarily minimized.
  • the quantization method of the present invention may be applied to some or all of the PARCOR coefficients.
  • the composite code CaO is a combination of the residual code CeO and the coefficient code CkO.
  • the residual code CeO is so large that the coefficient code CkO can be ignored, even if the coefficient code CkO includes an error, a large error does not occur in the code amount of the coefficient code CkO, but in the opposite case. From equation (12), it is possible to determine whether the code amount of the coefficient code CkO can be ignored or not according to the number N of samples per frame. If N is small, it cannot be ignored, and if N is large, it can be ignored.
  • the number of samples depends on the sampling rate of the input signal, and these examples are for 8 kHz sampling.
  • the quantization method of the present invention may be applied to the PARCOR coefficient.
  • the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the present invention.
  • the number of bits R representing the PARCOR coefficient K′O (i) is not limited to 16, and may be 32 or 8.
  • right-justified 15 bits are used as an example of the shift operation for obtaining the absolute value of the PARCOR coefficient K′O (i), but left-justified may be used.
  • the bit on the left side has been described as a bit representing a larger value, the bit on the right side may be a bit representing a larger value (horizontal inversion). 8 bits (1 byte) may be rearranged according to endian (big / little-endian).
  • the right side is described as 0 padding, 1 padding or any value may be padded.
  • the absolute value may not be obtained and the table may be directly referenced using the PARCOR coefficient.
  • the quantization method of the present invention causes a computer to execute a program by causing a computer recording unit to read a program for operating the computer as each functional component of the present invention, and to operate a processing unit, an input unit, an output unit, and the like. be able to.
  • the program is recorded on a computer-readable recording medium, and the program recorded on the server or the like is read into the computer through a telecommunication line or the like. There is a method to make it.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 入力されたPARCOR係数の系列の算出に使われた入力信号の線形予測残差のエントロピーを最小化する基準の下で、PARCOR係数の量子化誤差に起因する当該線形予測残差の符号量の増大を抑圧するように、PARCOR係数の絶対値が大きいほど高い量子化精度でPARCOR係数を量子化する。PARCOR係数が所定ビット数を持つ値として表されている場合、入力されたPARCOR係数の絶対値が大きいほど、最上位ビットから最下位ビットへ向かってより多くの有効ビットを含んで表される値を出力する。

Description

PARCOR係数量子化方法、PARCOR係数量子化装置、プログラム及び記録媒体
 本発明は、音響信号などのディジタル時系列信号のロスレス符号化技術に関する。
 例えば図1に示すように、入力信号がNサンプルのフレーム毎に処理されるとする。入力信号をXO(n) (n=1,2,…,N)とする。許容されるPARCOR係数の最大次数をPmax次とする。
 線形予測分析部901は入力信号XO(n)からLevinson-Durbin法やBurg法などにより、予め定めた最大次数であるPmax次までのPARCOR係数KO(1),KO(2),…,KO(Pmax)を算出し、なんらかの方法(例えば特許文献1参照)で求めた最適次数POとPO次までのPARCOR係数系列KO=(KO(1),KO(2),…,KO(PO))を出力する。
 量子化部903はPARCOR係数系列KOを量子化し、量子化済PARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))を出力する。逆変換部905は量子化済PARCOR係数系列K'Oを線形予測係数系列a'O=(a'O(1),a'O(2),…,a'O(PO))に変換して出力する。フィルタ907は線形予測係数系列a'O=(a'O(1),a'O(2),…,a'O(PO))をフィルタ係数として、式(1)に従って入力信号XO(n) (n=1,2,…,N)をPO次でフィルタリングし、予測残差eO(n) (n=1,2,…,N)を得る。ただし、aO'(0)=1とする。記号"×"は乗算を表す。
Figure JPOXMLDOC01-appb-M000001
 残差符号化部911は予測残差eO(n)を例えばエントロピー符号化し、残差符号CeOを出力する。係数符号化部909は最適次数POと量子化済PARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))を符号化し、係数符号CkOを出力する。符号合成部913は残差符号CeOと係数符号CkOを合わせたものを合成符号CaOとして出力する。
 量子化部903は、効果的に符号を送るためにPARCOR係数を量子化している。
 従来技術の例としてPARCOR係数を線形量子化した場合を図2に示す。PARCOR係数系列KOに含まれる各PARCOR係数は-1から+1の範囲の実数値を持つ。この各PARCOR係数が16ビットの精度で計算されたとし、各PARCOR係数を32768倍した値を16ビットの符号付き整数で表現すると、各PARCOR係数は-32768から+32767の値を持っていることになる。つまり、-(32768/32768)=-1が16ビットの符号付き整数で表現された-32768に対応し、-(32767/32768)≒+1が16ビットの符号付き整数で表現された+32767に対応する。これら16ビットの符号付き整数表現の値それぞれを4ビットで線形量子化したとする。つまり、PARCOR係数系列KOに含まれる各PARCOR係数を32768倍した値の16ビットの符号付き整数表現を上位4ビットの値だけを残し下位12ビットが0詰めされた値を32768で除算した結果が、量子化済PARCOR係数系列K'Oとなる。量子化済PARCOR係数系列K'Oに含まれる各量子化済PARCOR係数は4ビットの精度の値なので、量子化による誤差は16ビットの精度と比べて大きくなるが、量子化済PARCOR係数系列K'Oに含まれる各量子化済PARCOR係数を表す符号量も4ビットで十分となり、どれだけ粗く量子化するかは量子化誤差と符号量とのトレードオフとなる。
 そこで従来のロス(歪み)のある音声符号化では、PARCOR係数を少ない符号量で符号化した場合での聴感上の音質劣化を防ぐために、スペクトル歪みを尺度としてPARCOR係数の量子化を行っていた。非特許文献1~3に開示されるように、関数arc sinや関数tanhを使って非線形量子化を行い、次数に応じてビット割り当てを変えている。また、非特許文献4に開示されるように、音響信号のロスレス符号化MPEG-4 ALSではルート(根号)を含む非線形関数を用いている。いずれにせよ、PARCOR係数の感度の高い(誤差が大きくなる)-1と+1付近の値を細かく量子化し、0付近を粗く量子化することで予測残差eO(n)が大きくならないように、PARCOR係数系列KOの量子化を行っている。ただし、非線形量子化の場合は線形量子化と比べてより複雑な処理が必要となる。
特開2009-69309号公報
北脇,板倉,斎藤,"PARCOR形音声分析合成系における最適符号構成",電子通信学会論文誌,Vol.J61-A, No.2, pp.119-126 東倉,板倉,"PARCOR帯域圧縮方式における音声品質向上",電子通信学会論文誌,Vol.J61-A, No.3, pp.254-261 北脇,板倉,"PARCOR係数の非線形量子化と不均一標本化による音声の能率的符号化",電子通信学会論文誌,Vol.J61-A, No.6, pp.543-550 T. Liebchen, et. al., "The MPEG-4 Audio Lossless Coding (ALS) Standard -Technology and Applications," AES 119th Convention,  New York, USA, October, 2005.
 従来のロスのある音声符号化で用いられているPARCOR係数の量子化方法(非特許文献1~3参照)では聴感上の歪み最小化が基準となるように量子化器が設計されている。聴感上の歪みを最小化しても入力信号の線形予測残差のエントロピーは最小化されず、その符号量は最小化されない。このため、この基準を用いてもロスレス符号化での符号量は最小化されないという問題がある。
 そこで本発明は、高圧縮ロスレス符号化のためのPARCOR係数量子化技術を提供することを目的とする。
 本発明は、入力されたPARCOR係数の系列の算出に使われた入力信号の線形予測残差のエントロピーを最小化する基準の下で、PARCOR係数の量子化誤差に起因する当該線形予測残差の符号量の増大を抑圧するように、PARCOR係数の絶対値が大きいほど高い量子化精度でPARCOR係数を量子化する。
 例えば、PARCOR係数がRビットの値として表されているとし、Uを1以上{R-(2U-1)}未満を満たす予め定められた整数とし、Vを0以上{R-(2U-1)-U}未満を満たす予め定められた整数として、PARCOR係数Kの絶対値Lを表すビット列を求め、このビット列のうち最上位ビットからUビットを取得し(Uビットの値をWとする)、上記ビット列のうち最上位ビットから(U+V+W)ビットを取得する処理としてもよい。
 要するに、エントロピー最小化基準の下で、PARCOR係数の感度の高い-1と+1付近の値を細かく量子化し、0付近を粗く量子化するのである。
 本発明に拠れば、エントロピー最小化基準でPARCOR係数を量子化するのでロスレス符号化の圧縮率を向上させることができる。
従来のPARCOR係数の量子化を含む符号化処理の機能構成例を示す図。 従来のPARCOR係数の量子化の一例を示す図。 PARCOR係数の割り当てビット数と線形予測残差の符号量との関係を示す図。 実施例1および2のPARCOR係数量子化を含む符号化処理の機能構成例を示す図。 実施例2のPARCOR係数量子化の処理フローを示す図。 実施例3のPARCOR係数量子化を含む符号化処理の機能構成例を示す図。 参照テーブルの例を示す図。 実施例3のPARCOR係数量子化の処理フローを示す図。 実施例4のPARCOR係数量子化の処理フローを示す図。
 日本国公開特許公報2009-69309に開示されているように、PARCOR係数を用いて予測残差のエネルギーを見積もることができる。平均0(平均が0で無ければ平均値(バイアス)分を全サンプルから予め引けばよい)の入力信号XO(n) (n=1,2,…,N)の1フレームあたりのエネルギーEO(0)は式(2)で表される。
Figure JPOXMLDOC01-appb-M000002
 PARCOR係数KO(1)を用いて、1次の線形予測を行ったときの予測残差のエネルギーEO(1)は式(3)で表される。
Figure JPOXMLDOC01-appb-M000003
 PARCOR係数KO(2)を用いて、2次の線形予測を行ったときの予測残差のエネルギーEO(2)は式(4)で表される。
Figure JPOXMLDOC01-appb-M000004
 これをPmax次まで繰り返すと,Pmax次の線形予測を行ったときの予測残差のエネルギーEO(Pmax)は式(5)で表される。
Figure JPOXMLDOC01-appb-M000005
 平均0、分散σ2(すなわちエネルギーをNで割ったもの)のガウス分布のエントロピーは式(6)で表される。
Figure JPOXMLDOC01-appb-M000006
 平均0、分散σ2(すなわちエネルギーをNで割ったもの)のラプラス分布のエントロピーは式(7)で表される。
Figure JPOXMLDOC01-appb-M000007
 いずれの場合も分散σ2に依存しており、エントロピーは、βを定数として式(8)で表される。
Figure JPOXMLDOC01-appb-M000008
 定数βの値は、式(6)よりガウス分布の場合に約2であり、式(7)よりラプラス分布の場合に約1.7である。
 式(5)と式(8)より、最適次数であるPO次の線形予測を行ったときの予測残差のエントロピーHO(PO)は、つまり予測残差1サンプルに必要な平均推定ビット数は、式(9)で表される。
Figure JPOXMLDOC01-appb-M000009
 ここで式(9)の右辺第二項は入力信号に依存するので定数とみなせる。従って、式(9)の右辺第三項がどのような値をとるかによってエントロピーHO(PO)の値が変化する。実際に、PARCOR係数系列KOの各PARCOR係数が0付近の値しか持たないような白色雑音が入力されたときは右辺第三項も0付近の値しか持たないので、エントロピーを下げられず、予測残差1サンプルに必要な平均推定ビット数を低減することはできない。非特許文献1~4に示されるようにPARCOR係数系列KOに含まれるKO(1)とKO(2)が+1や-1付近の値を取るのであれば、右辺第三項は負の値を持ち、エントロピーが低減するので、予測残差1サンプルに必要な平均推定ビット数を低減することができる。例えば非特許文献4のFig.4に表されているように、1次のPARCOR係数は0.95付近の値を持つので、右辺第三項のうちの1次のPARCOR係数に対応する部分は式(10)で表すことができ、残差符号CeOを約1.6ビット削減できる。
Figure JPOXMLDOC01-appb-M000010
 一方、非特許文献4のFig.4に表されているように、4次のPARCOR係数は0.25付近の値を持つので、右辺第三項のうちの4次のPARCOR係数に対応する部分は式(11)で表すことができ、残差符号CeOを約0.05ビット程度しか削減できない。
Figure JPOXMLDOC01-appb-M000011
 ここで、ロスレス符号化の場合には最適次数POと量子化済PARCOR係数系列K'Oを符号化した係数符号CkOも伝送するので、係数符号のうち最適次数POに対応する符号のビット数をγとし(最適次数POを固定ビット数で符号化する場合には、γは定数となるのでこれを無視して計算してもよい。)、係数符号のうち量子化済PARCOR係数K'O(1),K'O(2),…,K'O(PO)のそれぞれに対応する符号量をC(1),(2),…,C(PO)とすると、1フレームがNサンプルを含むときの合成符号CaOの推定符号量は式(12)で表すことができる。
Figure JPOXMLDOC01-appb-M000012
 図3に示される実線θは、この式(12)に対応する合成符号の符号量を示している。PARCOR係数の量子化精度を高くすればPARCOR係数系列KOと量子化済PARCOR係数系列K'Oの差が小さくなり、予測残差eO(n)も小さくなるため、図3に点線τで示す残差符号を表すために必要な符号量は少なくて済む。しかしながら、図3に破線ηで示す量子化済PARCOR係数系列K'Oを表すために必要な符号量は増えてしまう。従って、必ずしもPARCOR係数の精度を高くした方が合成符号CaOの推定符号量が小さくなるとは限らない。
 そこで本発明は、PARCOR係数の値が大きいときにはPARCOR係数の量子化誤差に起因する残差符号CeOの符号量の増大が大きく、PARCOR係数の値が小さいときにはPARCOR係数の量子化誤差に起因する残差符号CeOの符号量の増大が小さいこと、に着目してPARCOR係数の量子化を行う。
 つまり、本発明では、入力されたPARCOR係数の系列の算出に使われた入力信号の線形予測残差のエントロピーを最小化する基準の下で、PARCOR係数の量子化誤差に起因する当該線形予測残差の符号量の増大を抑圧するように、PARCOR係数の絶対値が大きいほど高い量子化精度でPARCOR係数が量子化される。
[実施形態]
 本発明の実施形態は図4に示す量子化部100の機能構成を持ち、図4に示すように、量子化部903が量子化部100に変更されていることを除き、符号化処理の全体は図1に示す機能構成と同じ機能構成を持つ。各PARCOR係数が符号付16ビットの精度で求められたPARCOR係数系列KO=(KO(1),KO(2),…,KO(PO))が量子化部100に入力されると、量子化部100は各PARCOR係数KO(i) (i=1, 2, …, PO)を量子化し、量子化済PARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))を出力する。量子化済PARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))は係数符号化部909へ送られる。
[実施例1]
 量子化部100は、入力されたPARCOR係数の絶対値が大きいほど、最上位ビットから最下位ビットへ向かってより多くの有効ビット(2進数の場合、1である。)を含んで表される値を出力する。
<具体例1>
 P1=3、P2=2、R=16とし、PARCOR係数KO(i)が符号無しRビットで2進数表現されているとする(左端ビットが最上位ビットであるとする。)。つまりPARCOR係数KO(i)のビット列が16ビットのabcd efgh ijkl mnopとすると、量子化部100は、左端に位置する最上位の1ビット("a")が1ならば、上位P1ビット("1bc")を符号化対象として係数符号化部909に送り、最上位1ビット("a")が0ならば上位P2ビット("0b")を符号化対象として係数符号化部909に送る。つまり、最上位の1ビットが1ならば1xxy yyyy yyyy yyyyという16ビットの値が量子化済PARCOR係数となり、最上位1ビットが0ならば0xyy yyyy yyyy yyyyという16ビットの値が量子化済PARCOR係数となる。ここで、xのビット位置の値は元のPARCOR係数KO(i)を表すビット列において対応するビットの値と同じであるが、yのビット位置の値は予め定めた任意の値(例えば0)である。
 要は、PARCOR係数KO(i)の符号無しRビットの最上位ビット、すなわち、PARCOR係数KO(i)の絶対値を表わす部分の最上位ビットのみにより、PARCOR係数KO(i)の絶対値が大きい側の範囲にあるかPARCOR係数KO(i)の絶対値が小さい側の範囲にあるかの二者択一を行い、PARCOR係数KO(i)の絶対値が大きい側の範囲にある場合には最上位ビットからP1ビットを符号化対象とし、PARCOR係数KO(i)の絶対値が小さい側の範囲にある場合の最上位ビットからP2ビット(ただしP1>P2)を符号化対象とする、ことになる。
 式(10)や式(11)に表されているように、エントロピー削減効果は底2の対数関数で表されるので、PARCOR係数の感度はその逆関数である2の指数関数のオーダーとなる。よって、2進数表現の場合、最上位ビットに応じた量子化を行えば、エントロピー最小化基準で量子化していることになる。
<具体例2>
 P1=3、P2=2、R=16とし、PARCOR係数KO(i)が符号付Rビットで2進数表現されているとする(但し、左端ビットが最上位ビットであり、負数は2の補数で表現されるとする。)。つまりPARCOR係数KO(i)のビット列が16ビットのSabc defg hijk lmnoとすると、左端に位置する最上位の1ビット("S")はPARCOR係数の値が正であるか負であるかの符号を表すので、量子化部100は、その次のビット(左から2ビット目の"a")が1ならば、当該ビットの右の(P1-1)ビット分(左から3ビット目の"b"と4ビット目の"c")も含めた(P1+1)ビット("S1bc")を符号化対象として係数符号化部909に送る。最上位ビット("S")の次のビット(左から2ビット目の"a")が0ならば、量子化部100は、当該ビットの右の1ビット分(左から3ビット目の"b")も含めた(P2+1)ビット("S0b")を符号化対象として係数符号化部909に送る。つまり、最上位の次のビットが1ならばS1xx yyyy yyyy yyyyという16ビットの値が量子化済PARCOR係数となり、最上位の次のビットが0ならばS0xy yyyy yyyy yyyyという16ビットの値が量子化済PARCOR係数となる。ここで、Sは符号を表すビットであり、xのビット位置の値は元のPARCOR係数KO(i)を表すビット列において対応するビットの値と同じであるが、yのビット位置の値は予め定めた任意の値(例えば0)である。ただし、負の値の場合には2の補数表現なので、上記量子化部100の説明中の「0ならば」と「1ならば」とを入れ替えた処理を行う。
 P1とP2の値は、論理的にP1<R、P2<R、P2<P1を満たすが、その具体的な値は適宜に定めてよい。
 要は、PARCOR係数KO(i)の符号付Rビットの最上位ビットの次のビット、すなわち、PARCOR係数KO(i)の絶対値を表わす部分の最上位ビットのみにより、PARCOR係数KO(i)の絶対値が大きい側の範囲にあるかPARCOR係数KO(i)の絶対値が小さい側の範囲にあるかの二者択一を行い、PARCOR係数KO(i)の絶対値が大きい側の範囲にある場合には最上位ビットからP1ビットを符号化対象とし、PARCOR係数KO(i)の絶対値が小さい側の範囲にある場合の最上位ビットからP2ビット(ただしP1>P2)を符号化対象とする、ことになる。
<具体例3>
 R=16とし、PARCOR係数KO(i)が符号付Rビットで表されているとする。つまりPARCOR係数KO(i)のビット列が16ビットのSabc defg hijk lmnoとすると、量子化部100は、PARCOR係数KO(i)の絶対値を求め、符号無し15ビットの0abc defg hijk lmnoに変換する。このとき正負の情報S(例えば正負を表す最上位ビット)はメモリに保持される。符号無し15ビットの0abc defg hijk lmnoについて左端に位置する最上位のビットから2ビット目の"a"が1ならば、量子化部100は、3ビット目の"b"と4ビット目の"c"も保持し、5ビット目以降を破棄する(01xx yyyy yyyy yyyy)。符号無し15ビットの0abc defg hijk lmnoについて左端に位置する最上位のビットから2ビット目の"a"が0ならば、量子化部100は、3ビット目の"b"を保持し、4ビット目以降を破棄する(00xy yyyy yyyy yyyy)。そして量子化部100は、この結果のビット列の最上位ビットに正負の符号Sを付加したS1xx yyyy yyyy yyyyまたはS0xy yyyy yyyy yyyyを係数符号化部909に伝送する。なお、S1xx yyyy yyyy yyyyは最上位4ビットが符号化対象とされる。また、S0xy yyyy yyyy yyyyは最上位3ビットが符号化対象とされる。ここで、Sは符号を表すビットで、xのビット位置の値は元のPARCOR係数KO(i)を表すビット列において対応するビットの値と同じであるが、yのビット位置の値は予め定めた任意の値(例えば0)である。
<具体例4>
 R=16とし、PARCOR係数KO(i)が符号付Rビットで表されているとする。つまりPARCOR係数KO(i)のビット列が16ビットのSabc defg hijk lmnoとすると、量子化部100は、PARCOR係数KO(i)の絶対値を求め、符号無し15ビットの0abc defg hijk lmnoに変換する。このとき正負の情報S(例えば正負を表す最上位ビット)は符号化対象として係数符号化部909に送られる。符号無し15ビットの0abc defg hijk lmnoについて左端に位置する最上位のビットから2ビット目の"a"が1ならば、量子化部100は、3ビット目の"b"と4ビット目の"c"も保持し、5ビット目以降を破棄する(01xx yyyy yyyy yyyy)。符号無し15ビットの0abc defg hijk lmnoについて左端に位置する最上位のビットから2ビット目の"a"が0ならば、量子化部100は、3ビット目の"b"を保持し、4ビット目以降を破棄する(00xy yyyy yyyy yyyy)。そして量子化部100は、この結果の01xx yyyy yyyy yyyyまたは00xy yyyy yyyy yyyyを係数符号化部909に伝送する。なお、01xx yyyy yyyy yyyyの場合には3ビットの"1xx"が符号化対象とされる。また、00xy yyyy yyyy yyyyの場合には2ビットの"0x"が符号化対象とされる。ここで、xのビット位置の値は元のPARCOR係数KO(i)を表すビット列において対応するビットの値と同じであるが、yのビット位置の値は予め定めた任意の値である。
[実施例2]
 上記具体例3を一般化した実施例を説明する。上記具体例1および2についてもこの実施例2に従って同様の結果を得ることができる。
 量子化部100は、第1処理部102、第2処理部104、第3処理部106、付加部108を含む。この例ではPARCOR係数KO(i)がRビットの値として表されているとし、Uを1以上{R-(2U-1)}未満を満たす予め定められた整数とし、Vを0以上{R-(2U-1)-U}未満を満たす予め定められた整数とする。UとVをこのように定める理由は、後述するように0≦W≦2U-1を満たすWを用いて(R-U-V-W)ビットのビットシフト演算を行うことから、R-U-V-W≧0を満たすように、UとVを設定するためである。しかし、例えば、Uを1以上R未満を満たす予め定められた整数とし、Vを0以上R未満を満たす予め定められた整数として、R-U-V-W<0の場合にビットシフト演算で足りなくなる右側のビットを0とみなすようにしてもよい。説明を具体的なものとするため、ここではR=16、U=2、V=1とする。
 まず、第1処理部102が、KO(i)の絶対値L(i)を表すビット列を求める(ステップS1)。この際、第1処理部102は、KO(i)の符号ビットで表される正負符号S(i)の情報をメモリにストアする。例えば、PARCOR係数KO(i)のビット列が16ビットのSabc defg hijk lmno (S:符号ビット、a-o:0または1)で与えられている場合、L(i)を表すビット列として、符号無し15ビットの0abc defg hijk lmnoが得られる。正負符号S(i)=Sはメモリにストアされる。
 次に、第2処理部104は、L(i)を表すビット列を右に(15-U)ビットシフトする(ステップS2)。その値をW(10進数表記)とする。上記の例であれば、L(i)を右に13ビットシフトして0abが得られる。この2進数表記の0abを10進数表記した値がWである。
 次に、第3処理部106は、L(i)を表すビット列を右に(15-U-V-W)ビットシフトし、次いで0詰めで左に(15-U-V-W)ビットシフトする(ステップS3)。この結果をL'(i)とする。上記の例であれば、
ab=11つまりW=3の場合、L'(i)として011c def0 0000 0000が得られ、
ab=10つまりW=2の場合、L'(i)として010c de00 0000 0000が得られ、
ab=01つまりW=1の場合、L'(i)として001c d000 0000 0000が得られ、
ab=00つまりW=0の場合、L'(i)として000c 0000 0000 0000が得られる。
 次に、付加部108は、L'(i)に符号ビットとしてKO(i)の正負符号S(i)を付加する(ステップS4)。上記の例であれば、S(i)=SがL'(i)のMSB(Most Significant Bit)に付加される。つまり、
ab=11つまりW=3に対応して、S11c def0 0000 0000が得られ、
ab=10つまりW=2に対応して、S10c de00 0000 0000が得られ、
ab=01つまりW=1に対応して、S01c d000 0000 0000が得られ、
ab=00つまりW=0に対応して、S00c 0000 0000 0000が得られる。
 このステップS4の処理で得られた16ビットのビット列が量子化済PARCOR係数K'O(i)となる。
 なお、ステップS3の処理において0詰めではなく任意の数値(例えば010101…)のような詰め方をしてもよい。いずれにせよSxxy yyyz zzzz zzzzというビット列パターンを持つように非線形量子化をすることができる。ここでSは正負符号ビット、xはUに依存するビット、yはWとVに依存するビット、zは任意のビットである。このように、PARCOR係数の絶対値が大きいほど高い量子化精度でPARCOR係数が量子化される。
[実施例2の変形例]
 次に、実施例2の変形例を説明する。この変形例は、実施例2におけるステップS4の処理を省略する実施例であり、上記具体例4の一般化に対応する。
 この変形例では、ステップS1の処理で得られた正負符号S(i)の情報が符号化対象として係数符号化部909へ送られる。
 また、ステップ3の処理によって、L'(i)として0xxy yyyz zzzz zzzzというビット列パターンが得られている。そこで、ステップS3の処理で得られた16ビットのビット列を量子化済PARCOR係数K'O(i)とする。上記の例であれば、
ab=11つまりW=3に対応して、K'O(i)として011c def0 0000 0000が得られ、
ab=10つまりW=2に対応して、K'O(i)として010c de00 0000 0000が得られ、
ab=01つまりW=1に対応して、K'O(i)として001c d000 0000 0000が得られ、
ab=00つまりW=0に対応して、K'O(i)として000c 0000 0000 0000が得られる。
[実施例3]
 シフト演算を多用する実施例2と異なり、メモリ50に記憶されている参照テーブルを利用する実施例3を説明する。参照テーブルの例を図7に示す。この参照テーブルでは、Tが大きな値ほど最上位ビットから最下位ビットへ向かってより多くの有効ビットを含んで表されるビット列が割り当てられている。なお、例示する参照テーブルでは、符号付16ビットのPARCOR係数KO(i)の絶対値を用いた処理に対応する例として、最上位ビットが0となっているビット列がTに対応して割り当てられている。
 実施例3の量子化部100aは、第1処理部102a、第2処理部104a、第3処理部106a、付加部108aを含む。この例ではPARCOR係数がRビットの値として表されているとし、Uを1以上{R-(2U-1)}未満を満たす予め定められた整数とし、Vを0以上{R-(2U-1)-U}未満を満たす予め定められた整数とする。UとVをこのように定める理由は、後述するように0≦W≦2U-1を満たすWを用いて(R-U-V-W)ビットのビットシフト演算を行うことから、R-U-V-W≧0を満たすように、UとVを設定するためである。しかし、例えば、Uを1以上R未満を満たす予め定められた整数とし、Vを0以上R未満を満たす予め定められた整数として、R-U-V-W<0の場合にビットシフト演算で足りなくなる右側のビットを0とみなすようにしてもよい。説明を具体的なものとするため、ここではR=16、U=2、V=1とする。
 まず、第1処理部102aが、KO(i)の絶対値L(i)を表すビット列を求める(ステップS1a)。この際、第1処理部102aは、KO(i)の符号ビットで表される正負符号S(i)の情報はメモリにストアする。例えば、PARCOR係数KO(i)のビット列が16ビットのSabc defg hijk lmno (S:符号ビット、a-o:0または1)で与えられている場合、L(i)を表すビット列として、符号無し15ビットの0abc defg hijk lmnoが得られる。正負符号S(i)=Sはメモリにストアされる。
 次に、第2処理部104aは、Uビットで表される最大値をW(=2-1)として、L(i)を表すビット列を右に(15-U-V-W)ビットシフトする(ステップS2a)。その値をT(10進数表記)とする。上記の例であれば、L(i)を右に9ビットシフトして0abc defが得られる。この2進数表記の0abc defを10進数表記した値がTである。
 次に、第3処理部106aは、Tの値を用いて参照テーブルから当該Tに対応するビット列の表引きを行う(ステップS3a)。この結果をL'(i)とする。例えばT=61の場合、L'(i)として0111 1010 0000 0000が得られる。
 次に、付加部108aは、L'(i)に符号ビットとしてKO(i)の正負符号S(i)を付加する(ステップS4a)。上記の例であれば、S(i)=SがL'(i)のMSB(Most Significant Bit)に付加される。ただし、例えばステップS3aの処理にて、Tの値に正負符号(またはそれを意味する符号)を付加してT’とし、T’の値を用いて参照テーブルから当該T’に対応するビット列の表引きを行うことで正負符号付のL’(i)を求めてもよい。
 このステップS4の処理で得られた16ビットのビット列が量子化済PARCOR係数K'O(i)となる。
 この実施例でもSxxy yyyz zzzz zzzzというビット列パターンを持つように非線形量子化をすることができる。表引きによりメモリ占有量は増加するがシフト演算を減らせるため演算量を削減できる。ここでは、PARCOR係数K'O(i)が符号付Rビットで表されているとして説明したが、実施例3は、符号無しRビットのPARCOR係数K'O(i)にも適用できる。また、実施例2の変形例のように、ステップS4aの処理を省略する実施形態とすることもできる。
[実施例4]
 シフト演算を利用する実施例2と異なり、ビット単位のAND演算(ビットマスク)を利用する実施例4を説明する。実施例2と異なる部分について説明する。
 実施例2のステップS1の処理に続いて、第2処理部104は、L(i)を表すビット列のうち必要なビット以外をマスクする(必要なビットに対して1とのビット単位AND演算を行い、不要なビットに対して0とのビット単位AND演算を行う)(ステップS2b)。
その値をW(10進数表記)とする。上記の例であれば、U=2なので、16ビットのPARCOR係数KO(i)の絶対値のビット列0abc defg hijk lmnoに対して、15ビット目から右側へ順に各ビットを1とし15-Uビット目から右側へ順に各ビットを0としたビット列0110 0000 0000 0000とビット単位AND演算を行いビット列0ab0 0000 0000 0000を得る。この2進数表記の0abを10進数表記した値がWである。
 次に、第3処理部106は、上記Wの値に基づいて、L(i)を表すビット列のうち必要なビット以外をマスクする(必要なビットに対して1とのビット単位AND演算を行い、不要なビットに対して0とのビット単位AND演算を行う)(ステップS3b)。この結果をL'(i)とする。上記の例であれば、U=2、V=1、W=3の場合には、16ビットのPARCOR係数KO(i)の絶対値のビット列0abc defg hijk lmnoに対して、15ビット目から右側へ順に各ビットを1とし15-U-V-Wビット目から右側へ順に各ビットを0としたビット列0111 1110 0000 0000とビット単位AND演算を行いビット列0abc def0 0000 0000を得る。
 ステップS3bの処理の後に実施例2で説明したステップS4の処理を行う。ただし、実施例2の変形例の如く、ステップS4aの処理を省略する実施形態とすることもできる。
<変形例1>
 量子化部100,100aに入力されたPARCOR係数系列KO=(KO(1),KO(2),…,KO(PO))に含まれるPARCOR係数KO(i)のうち一部のみに対して本発明の量子化方法を適用してもよい。本発明の量子化方法が適用されなかった残りのPARCOR係数KO(i)は、例えば従来的な量子化方法で量子化される。
 本発明の量子化方法の適用対象となるPARCOR係数KO(i)を選別する基準として、次数PO、PARCOR係数の値が挙げられる。
 次数POを基準とする場合、入力された1次からP次までのPARCOR係数K(1),K(2),…,K(P)のうち、予め定められた次数以下または当該次数よりも小さい次数のPARCOR係数に対して本発明の量子化方法を適用する。非特許文献4のFig.4に示されるように、一般的に低次数のPARCOR係数は大きい値を持つから、予め定められた次数(例えば3)以下または当該次数よりも小さい次数のPARCOR係数に対して本発明の量子化方法を適用するのである。
 PARCOR係数の値を基準とする場合、予め定められた閾値以上または当該閾値よりも大きい値を持つPARCOR係数に対して本発明の量子化方法を適用する。PARCOR係数の値が大きいときにはPARCOR係数の量子化誤差に起因する残差符号CeOの符号量の増大が大きくなるからである。
<変形例2>
 音響信号ロスレス符号化での従来方法(非特許文献4参照)では理論的に定められた関数ではなく、実験結果の観測から定性的に求めた関数を用いている。このため、1フレームあたりのサンプル数がPARCOR係数の10倍程度のように少ない場合(1フレームあたり、10次のPARCOR係数に対して100サンプル程度)には、残差符号CeOの符号量に比べて係数符号CkOの符号量が非常に少ないわけではないので、PARCOR係数に必要な符号量を無視できず、合成符号CaOの符号量が必ずしも最小化されない。
 そこで、PARCOR係数系列の算出に使われた入力信号のサンプル数が、予め定められた閾値以下または当該閾値よりも小さい場合に、PARCOR係数系列KO=(KO(1),KO(2),…,KO(PO))に含まれる一部または全てのPARCOR係数に対して本発明の量子化方法を適用してもよい。
 既述のとおり、残差符号CeOと係数符号CkOを合わせたものが合成符号CaOである。係数符号CkOが無視できるくらい残差符号CeOが大きい場合は、係数符号CkOが誤差を含んでも係数符号CkOの符号量に大きな誤差を生じないが、逆の場合はそうならない。式(12)から、1フレームあたりのサンプル数Nに応じて、係数符号CkOの符号量が無視できるか無視できないかの判断が可能である。Nが小さければ無視できず、Nが大きければ無視できる。よって、例えば、N=40~80サンプルの場合には本発明の量子化方法をPARCOR係数に適用し、N=160~320サンプルの場合には従来的な量子化方法をPARCOR係数に適用してもよい(このサンプル数の場合わけは入力信号のサンプリングレートに依存し、これらの例は8 kHzサンプリングの場合である。)。また、入力信号の1フレームに160サンプルが含まれる場合でも、当該フレームを4つのサブフレーム(サブフレーム当たり40サンプルを含む。)に分割する場合は、フレーム単位のサンプル数を40サンプルとみなして本発明の量子化方法をPARCOR係数に適用してもよい。
 以上の実施形態の他、本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
 例えば、PARCOR係数K'O(i)を表すビット数Rは、16に限らず32や8でもよい。また、PARCOR係数K'O(i)の絶対値を求めるシフト演算として右詰15ビットを例に採用したが、左詰でもよい。ビット列において左側のビットがより大きい値を表すビットとして説明したが、右側のビットがより大きい値を表すビットとしてもかまわない(左右反転)。エンディアン(big/little-endian)に応じて8ビット(1バイト)を並び替えてもよい。右側を0詰めとして説明したが1詰めや任意の値を詰めてもよい。また、絶対値を求めず、PARCOR係数を用いて直接表引きにしてもよい。
 本発明の量子化方法は、コンピュータの記録部に、本発明の各機能構成部としてコンピュータを動作させるプログラムを読み込ませ、処理部、入力部、出力部などを動作させることで、コンピュータに実行させることができる。また、コンピュータに読み込ませる方法としては、プログラムをコンピュータ読み取り可能な記録媒体に記録しておき、記録媒体からコンピュータに読み込ませる方法、サーバ等に記録されたプログラムを、電気通信回線等を通じてコンピュータに読み込ませる方法などがある。

Claims (16)

  1.    PARCOR係数の量子化を行うPARCOR係数量子化ステップを有するPARCOR係数量子化方法において、
       上記PARCOR係数量子化ステップでは、
       入力された上記PARCOR係数の系列の算出に使われた入力信号の線形予測残差のエントロピーを最小化する基準の下で、上記PARCOR係数の量子化誤差に起因する当該線形予測残差の符号量の増大を抑圧するように、上記PARCOR係数の絶対値が大きいほど高い量子化精度で上記PARCOR係数が量子化される
    ことを特徴とするPARCOR係数量子化方法。
  2.    PARCOR係数の量子化を行うPARCOR係数量子化ステップを有するPARCOR係数量子化方法において、
       上記PARCOR係数が所定ビット数を持つ値として表されているとして、
       上記PARCOR係数量子化ステップでは、
       入力された上記PARCOR係数の絶対値が大きいほど、最上位ビットから最下位ビットへ向かってより多くの有効ビットを含んで表される値を出力する
    ことを特徴とするPARCOR係数量子化方法。
  3.    PARCOR係数の量子化を行うPARCOR係数量子化ステップを有するPARCOR係数量子化方法において、
       上記PARCOR係数がRビットの値として表されているとし、Uを1以上{R-(2U-1)}未満を満たす予め定められた整数とし、Vを0以上{R-(2U-1)-U}未満を満たす予め定められた整数として、
       上記PARCOR係数量子化ステップは、
    (a)上記PARCOR係数Kの絶対値Lを表すビット列を求めるステップと、
    (b)上記PARCOR係数Kの絶対値Lを表すビット列のうち最上位ビットからUビットを取得するステップと、
    (c)上記ステップ(b)で得られたUビットの値をWとして、上記PARCOR係数Kの絶対値Lを表すビット列のうち最上位ビットから(U+V+W)ビットを取得するステップと
    を有することを特徴とするPARCOR係数量子化方法。
  4.    請求項3に記載のPARCOR係数量子化方法であって、
       上記PARCOR係数量子化ステップは、さらに、
    (d)上記ステップ(c)で得られた(U+V+W)ビットに、上記PARCOR係数Kの符号ビットを付加するステップ
    を有することを特徴とするPARCOR係数量子化方法。
  5.    PARCOR係数の量子化を行うPARCOR係数量子化ステップを有するPARCOR係数量子化方法において、
       上記PARCOR係数量子化ステップは、
    (a)上記PARCOR係数Kの絶対値Lを表すビット列を求めるステップと、
    (b)上記絶対値Lを表すビット列のうち最上位ビットから所定の長さのビット列を取得するステップと、
    (c)上記ステップ(b)で得られたビット列の値をTとして、大きな値ほど最上位ビットから最下位ビットへ向かってより多くの有効ビットを含んで表されるビット列が割り当てられている参照テーブルから、上記Tの値に対応するビット列を取得するステップと
    を有することを特徴とするPARCOR係数量子化方法。
  6.    請求項5に記載のPARCOR係数量子化方法において、
       ステップ(c)にて、上記PARCOR係数Kが負の場合には、上記Tに正負符号を表す符号を付加してT’を求め、上記参照テーブルから当該T’に対応するビット列を取得する
    ことを特徴とするPARCOR係数量子化方法。
  7.    請求項5に記載のPARCOR係数量子化方法であって、
       上記PARCOR係数量子化ステップは、さらに、
    (d)上記ステップ(c)で得られたビット列に、上記PARCOR係数Kの符号ビットを付加するステップ
    を有することを特徴とするPARCOR係数量子化方法。
  8.    請求項1,2,3,5のいずれかに記載のPARCOR係数量子化方法であって、
       上記PARCOR係数量子化ステップにおいて、入力された上記PARCOR係数の系列のうち少なくとも一部の上記PARCOR係数が量子化される
    ことを特徴とするPARCOR係数量子化方法。
  9.    請求項1,2,3,5のいずれかに記載のPARCOR係数量子化方法であって、
       上記PARCOR係数量子化ステップにおいて、入力された1次からP次までの上記PARCOR係数の系列K(1),K(2),…,K(P)のうち、予め定められた次数以下または当該次数よりも小さい次数のPARCOR係数が量子化される
    ことを特徴とするPARCOR係数量子化方法。
  10.    請求項1,2,3,5のいずれかに記載のPARCOR係数量子化方法であって、
       上記PARCOR係数量子化ステップにおいて、入力された上記PARCOR係数の系列のうち、予め定められた閾値以上または当該閾値よりも大きい値を持つPARCOR係数が量子化される
    ことを特徴とするPARCOR係数量子化方法。
  11.    請求項1,2,3,5のいずれかに記載のPARCOR係数量子化方法であって、
       入力された上記PARCOR係数の系列の算出に使われた入力信号のサンプル数が、予め定められた閾値以下または当該閾値よりも小さい場合に、上記PARCOR係数量子化ステップにおいて、入力された上記PARCOR係数の系列のうち少なくとも一部の上記PARCOR係数が量子化される
    ことを特徴とするPARCOR係数量子化方法。
  12.    PARCOR係数の量子化を行うPARCOR係数量子化部を有するPARCOR係数量子化装置において、
       上記PARCOR係数がRビットの値として表されているとし、Uを1以上{R-(2U-1)}未満を満たす予め定められた整数とし、Vを0以上{R-(2U-1)-U}未満を満たす予め定められた整数として、
       上記PARCOR係数量子化部は、
     上記PARCOR係数Kの絶対値Lを表すビット列を求める第1処理部と、
     上記PARCOR係数Kの絶対値Lを表すビット列のうち最上位ビットからUビットを取得する第2処理部と、
     上記第2処理部によって得られたUビットの値をWとして、上記PARCOR係数Kの絶対値Lを表すビット列のうち最上位ビットから(U+V+W)ビットを取得する第3処理部と
    を含むことを特徴とするPARCOR係数量子化装置。
  13.    PARCOR係数の量子化を行うPARCOR係数量子化部を有するPARCOR係数量子化装置において、
       上記PARCOR係数量子化部は、
     上記PARCOR係数Kの絶対値Lを表すビット列を求める第1処理部と、
     上記絶対値Lを表すビット列のうち最上位ビットから所定の長さのビット列を取得する第2処理部と、
     上記第2処理部によって得られたビット列の値をTとして、大きな値ほど最上位ビットから最下位ビットへ向かってより多くの有効ビットを含んで表されるビット列が割り当てられている参照テーブルから、上記Tの値に対応するビット列を取得する第3処理部と
    を含むことを特徴とするPARCOR係数量子化装置。
  14.    請求項13に記載のPARCOR係数量子化装置において、
       上記第3処理部は、上記PARCOR係数Kが負の場合には、上記Tに正負符号を表す符号を付加してT’を求め、上記参照テーブルから当該T’に対応するビット列を取得する
    ことを特徴とするPARCOR係数量子化装置。
  15.    コンピュータを請求項12または請求項13に記載されたPARCOR係数量子化装置として機能させるためのプログラム。
  16.    コンピュータを請求項12または請求項13に記載されたPARCOR係数量子化装置として機能させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
PCT/JP2010/059271 2009-06-03 2010-06-01 Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体 WO2010140590A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011518455A JPWO2010140590A1 (ja) 2009-06-03 2010-06-01 Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体
CN201080022910XA CN102449691B (zh) 2009-06-03 2010-06-01 Parcor系数量化方法、parcor系数量化装置、程序以及记录介质
US13/320,861 US8902997B2 (en) 2009-06-03 2010-06-01 PARCOR coefficient quantization method, PARCOR coefficient quantization apparatus, program and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009-134370 2009-06-03
JP2009134370 2009-06-03

Publications (1)

Publication Number Publication Date
WO2010140590A1 true WO2010140590A1 (ja) 2010-12-09

Family

ID=43297724

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/059271 WO2010140590A1 (ja) 2009-06-03 2010-06-01 Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体

Country Status (4)

Country Link
US (1) US8902997B2 (ja)
JP (2) JPWO2010140590A1 (ja)
CN (1) CN102449691B (ja)
WO (1) WO2010140590A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120225A (ja) * 2011-12-06 2013-06-17 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、符号化装置、プログラム、記録媒体

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10204633B2 (en) * 2014-05-01 2019-02-12 Nippon Telegraph And Telephone Corporation Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium
CN111836045A (zh) * 2020-06-02 2020-10-27 广东省建筑科学研究院集团股份有限公司 一种桥梁健康监测传感器数据的无损压缩方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5628276B2 (ja) * 1973-08-16 1981-06-30
JPS6195400A (ja) * 1984-10-17 1986-05-14 株式会社日立製作所 音声分析・合成系におけるパラメ−タ非線形変換方式
JP2008185701A (ja) * 2007-01-29 2008-08-14 Nippon Telegr & Teleph Corp <Ntt> Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体
JP2008209637A (ja) * 2007-02-26 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体
JP2009069309A (ja) * 2007-09-11 2009-04-02 Nippon Telegr & Teleph Corp <Ntt> 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5628276A (en) 1979-08-15 1981-03-19 Matsushita Electric Ind Co Ltd Pyrogenic composition
JPS5921039B2 (ja) * 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
WO2009022454A1 (ja) 2007-08-10 2009-02-19 Panasonic Corporation 音声分離装置、音声合成装置および声質変換装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5628276B2 (ja) * 1973-08-16 1981-06-30
JPS6195400A (ja) * 1984-10-17 1986-05-14 株式会社日立製作所 音声分析・合成系におけるパラメ−タ非線形変換方式
JP2008185701A (ja) * 2007-01-29 2008-08-14 Nippon Telegr & Teleph Corp <Ntt> Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体
JP2008209637A (ja) * 2007-02-26 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体
JP2009069309A (ja) * 2007-09-11 2009-04-02 Nippon Telegr & Teleph Corp <Ntt> 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HIROKAZU KAMEOKA ET AL.: "A Linear Predictive Coding Algorithm Minimizing the Golomb-Rice Code Length of the Residual Signal", THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS A, vol. J91-A, no. 11, 1 November 2008 (2008-11-01), pages 1017 - 1025 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120225A (ja) * 2011-12-06 2013-06-17 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、符号化装置、プログラム、記録媒体

Also Published As

Publication number Publication date
US8902997B2 (en) 2014-12-02
CN102449691B (zh) 2013-11-06
US20120072226A1 (en) 2012-03-22
CN102449691A (zh) 2012-05-09
JP2014222369A (ja) 2014-11-27
JPWO2010140590A1 (ja) 2012-11-22
JP5780686B2 (ja) 2015-09-16

Similar Documents

Publication Publication Date Title
EP2159790B1 (en) Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system
RU2020119762A (ru) Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием квантования и энтропийного кодирования
US8068042B2 (en) Coding method, decoding method, and apparatuses, programs and recording media therefor
US20070168186A1 (en) Audio coding apparatus, audio decoding apparatus, audio coding method and audio decoding method
BRPI0709450B1 (pt) codificação de sinal de informação
KR20080049116A (ko) 오디오 코딩
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
JP5780686B2 (ja) Parcor係数量子化方法、装置、プログラム
KR20120096541A (ko) 디지털 신호의 압축 또는 압축해제를 위한 방법, 시스템 및 장치
JPH01177227A (ja) 音声コーデック
US20070033024A1 (en) Method and apparatus for encoding audio data
KR100668319B1 (ko) 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
WO2008092719A1 (en) Audio quantization
KR20060084437A (ko) 오디오 인코딩 시의 레이트-왜곡 제어 구조
JP5303074B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP3294024B2 (ja) 音声信号の符号化伝送方法
JP5562332B2 (ja) 予測次数決定方法、予測次数決定装置、プログラム及び記録媒体
JPH0715347A (ja) 符号化装置及び復号装置
JP4438655B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
JP3144213B2 (ja) 音声パラメータ分析装置および音声符号化装置
KR20010005669A (ko) 래그 파라미터의 부호화 방법 및 그 장치, 그리고 부호 리스트 작성 방법
KR0170205B1 (ko) 부호화 및 복호화 방법 및 회로
WO2023198383A1 (en) Method for quantizing line spectral frequencies
EP3084761A1 (en) Audio signal encoder
Kamamoto et al. Low-complexity PARCOR coefficient quantizer and prediction order estimator for G. 711.0 (Lossless Speech Coding)

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201080022910.X

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10783373

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2011518455

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 13320861

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10783373

Country of ref document: EP

Kind code of ref document: A1