WO2010140590A1 - Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体 - Google Patents
Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体 Download PDFInfo
- Publication number
- WO2010140590A1 WO2010140590A1 PCT/JP2010/059271 JP2010059271W WO2010140590A1 WO 2010140590 A1 WO2010140590 A1 WO 2010140590A1 JP 2010059271 W JP2010059271 W JP 2010059271W WO 2010140590 A1 WO2010140590 A1 WO 2010140590A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- parcor coefficient
- bit
- parcor
- value
- bit string
- Prior art date
Links
- 238000013139 quantization Methods 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 title claims description 55
- 230000008569 process Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 9
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 239000002131 composite material Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
Definitions
- the present invention relates to a lossless encoding technique for digital time series signals such as acoustic signals.
- the input signal is processed every N sample frames.
- the maximum order of the allowable PARCOR coefficient is Pmax order.
- the symbol “ ⁇ ” represents multiplication.
- the residual encoding unit 911 performs entropy encoding on the prediction residual eO (n), for example, and outputs a residual code CeO.
- the code synthesis unit 913 outputs a combination of the residual code CeO and the coefficient code CkO as a synthesis code CaO.
- the quantization unit 903 quantizes the PARCOR coefficient in order to send the code effectively.
- FIG. 2 shows a case where the PARCOR coefficient is linearly quantized as an example of the prior art.
- Each PARCOR coefficient included in the PARCOR coefficient series KO has a real value ranging from ⁇ 1 to +1. If each PARCOR coefficient is calculated with 16-bit precision and each PARCOR coefficient is multiplied by 32768 and expressed as a 16-bit signed integer, each PARCOR coefficient has a value from -32768 to +32767. become.
- each quantized PARCOR coefficient included in the quantized PARCOR coefficient series K'O is a 4-bit precision value, the error due to quantization is larger than the 16-bit precision, but the quantized PARCOR coefficient series K '
- the code amount representing each quantized PARCOR coefficient included in 'O is also sufficient with 4 bits, and how coarsely the quantization is performed is a trade-off between quantization error and code amount.
- Non-Patent Documents 1 to 3 nonlinear quantization is performed using a function arc sin or a function tanh, and bit allocation is changed according to the order. Further, as disclosed in Non-Patent Document 4, lossless encoding MPEG-4 ALS of acoustic signals uses a nonlinear function including a root (root number).
- the prediction residual eO (n) is not increased by finely quantizing the values near +1 and +1 where the PARCOR coefficient has high sensitivity (increase in error) and coarsely quantizing around 0.
- the PARCOR coefficient series KO is quantized.
- more complicated processing is required compared with linear quantization.
- Non-Patent Documents 1 to 3 used in lossy speech coding, the quantizer is designed so that audible distortion minimization is the standard. Even if audible distortion is minimized, the entropy of the linear prediction residual of the input signal is not minimized, and the code amount is not minimized. For this reason, there is a problem that the code amount in the lossless encoding is not minimized even if this criterion is used.
- an object of the present invention is to provide a PARCOR coefficient quantization technique for high-compression lossless coding.
- the present invention is based on the criterion of minimizing the entropy of the linear prediction residual of the input signal used to calculate the input PARCOR coefficient series, and the linear prediction residual due to the quantization error of the PARCOR coefficient. As the absolute value of the PARCOR coefficient is larger, the PARCOR coefficient is quantized with higher quantization accuracy so as to suppress the increase in the code amount.
- the PARCOR coefficient is expressed as a value of R bits
- U is a predetermined integer satisfying 1 or more and less than ⁇ R- (2 U -1) ⁇
- V is 0 or more ⁇ R- (2 U -1) -U ⁇ is obtained as a predetermined integer satisfying less than -U ⁇
- a bit string representing the absolute value L of the PARCOR coefficient K is obtained, and the U bit is obtained from the most significant bit in this bit string (the value of the U bit is W
- the (U + V + W) bits may be acquired from the most significant bit in the bit string.
- the PARCOR coefficient is quantized according to the entropy minimization standard, the compression rate of lossless encoding can be improved.
- FIG. 6 is a diagram illustrating a functional configuration example of an encoding process including PARCOR coefficient quantization according to the first and second embodiments.
- FIG. 10 is a diagram showing a processing flow of PARCOR coefficient quantization according to the second embodiment.
- FIG. 10 is a diagram illustrating a functional configuration example of an encoding process including PARCOR coefficient quantization according to the third embodiment.
- FIG. 10 is a diagram illustrating a processing flow of PARCOR coefficient quantization according to the third embodiment.
- FIG. 10 is a diagram illustrating a processing flow of PARCOR coefficient quantization according to the fourth embodiment.
- the PARCOR coefficient can be used to estimate the energy of the prediction residual.
- the energy EO (1) of the prediction residual when the linear prediction is performed using the PARCOR coefficient KO (1) is expressed by Expression (3).
- the energy EO (2) of the prediction residual when the second-order linear prediction is performed using the PARCOR coefficient KO (2) is expressed by Expression (4).
- Equation (6) The entropy of the Gaussian distribution with mean 0 and variance ⁇ 2 (ie, energy divided by N) is expressed by equation (6).
- Equation (7) The entropy of the Laplace distribution with mean 0 and variance ⁇ 2 (that is, energy divided by N) is expressed by equation (7).
- Equation (8) the entropy is expressed by Equation (8) with ⁇ as a constant.
- the value of the constant ⁇ is about 2 in the case of a Gaussian distribution from the equation (6), and is about 1.7 in the case of a Laplace distribution from the equation (7).
- Equation (5) the entropy HO (PO) of the prediction residual when performing the PO-order linear prediction that is the optimal order, that is, the average estimated number of bits required for one sample of the prediction residual is And represented by equation (9).
- the second term on the right side of Equation (9) depends on the input signal and can be regarded as a constant. Therefore, the value of entropy HO (PO) changes depending on what value the third term on the right side of Equation (9) takes.
- the third term on the right side also has a value close to 0, so the entropy cannot be lowered and predicted. The average estimated number of bits required for one residual sample cannot be reduced.
- Non-Patent Documents 1 to 4 if KO (1) and KO (2) included in the PARCOR coefficient series KO take values near +1 or -1, the third term on the right side should be negative.
- the entropy is reduced, the average number of estimated bits required for one prediction residual sample can be reduced.
- the portion corresponding to the first-order PARCOR coefficient in the third term on the right side is expressed by the formula ( 10), and the residual code CeO can be reduced by about 1.6 bits.
- the fourth-order PARCOR coefficient has a value around 0.25, so the part corresponding to the fourth-order PARCOR coefficient in the third term on the right side is the formula (11), and the residual code CeO can be reduced by only about 0.05 bits.
- the number of bits of the code corresponding to the optimum order PO among the coefficient codes is set.
- ⁇ when the optimal order PO is encoded with a fixed number of bits, ⁇ is a constant and may be ignored
- the quantized PARCOR coefficient K′O If the code amount corresponding to each of 1), K′O (2),..., K′O (PO) is C (1), (2),.
- the estimated code amount of the composite code CaO can be expressed by Expression (12).
- the solid line ⁇ shown in FIG. 3 indicates the code amount of the composite code corresponding to this equation (12). If the quantization accuracy of the PARCOR coefficient is increased, the difference between the PARCOR coefficient series KO and the quantized PARCOR coefficient series K'O is reduced, and the prediction residual eO (n) is also reduced. A small amount of code is required to represent the difference code. However, the amount of code required to represent the quantized PARCOR coefficient sequence K′O indicated by the broken line ⁇ in FIG. 3 increases. Therefore, the estimated code amount of the composite code CaO is not necessarily reduced when the accuracy of the PARCOR coefficient is increased.
- the present invention increases the code amount of the residual code CeO due to the quantization error of the PARCOR coefficient when the PARCOR coefficient value is large, and the residual due to the quantization error of the PARCOR coefficient when the PARCOR coefficient value is small. Paying attention to the fact that the increase in the code amount of the difference code CeO is small, the PARCOR coefficient is quantized.
- the linear prediction residual caused by the quantization error of the PARCOR coefficient is used under the criterion of minimizing the entropy of the linear prediction residual of the input signal used for calculating the input PARCOR coefficient series.
- the PARCOR coefficient is quantized with higher quantization accuracy as the absolute value of the PARCOR coefficient is larger.
- the embodiment of the present invention has the functional configuration of the quantization unit 100 shown in FIG. 4, and as shown in FIG. 4, the entire encoding process is performed except that the quantization unit 903 is changed to the quantization unit 100.
- the quantized PARCOR coefficient sequence K′O (K′O (1), K′O (2),..., K′O (PO)) is sent to the coefficient encoding unit 909.
- the quantization unit 100 As the absolute value of the input PARCOR coefficient is larger, the quantization unit 100 is represented by including more effective bits (1 in the binary number) from the most significant bit toward the least significant bit. Output the value.
- the 16-bit value 1xxy yyyy yyyyyyyyyyyyy is the quantized PARCOR coefficient
- the 16-bit value 0xyy yyyyyyyyyyyyyyyy is the quantized PARCOR. It becomes a coefficient.
- the value of the bit position of x is the same as the value of the corresponding bit in the bit string representing the original PARCOR coefficient KO (i), but the value of the bit position of y is a predetermined arbitrary value (for example, 0) It is.
- the absolute value of the PARCOR coefficient KO (i) is determined by only the most significant bit of the unsigned R bit of the PARCOR coefficient KO (i), that is, the most significant bit of the portion representing the absolute value of the PARCOR coefficient KO (i). If the absolute value of the PARCOR coefficient KO (i) is in the range of the larger side, or the absolute value of the PARCOR coefficient KO (i) is in the range of the smaller side. Encodes the P 1 bit from the most significant bit and encodes the P 2 bit (where P 1 > P 2 ) from the most significant bit when the absolute value of the PARCOR coefficient KO (i) is in the smaller range. It will be the target.
- the entropy reduction effect is expressed by a logarithmic function of base 2. Therefore, the sensitivity of the PARCOR coefficient is in the order of the exponential function of 2, which is the inverse function thereof. . Therefore, in the case of binary representation, if quantization according to the most significant bit is performed, the quantization is based on the entropy minimization standard.
- the (P 1 +1) bit (“S1bc”) including “b” and the fourth bit “c”) is sent to the coefficient encoding unit 909 as an encoding target. If the bit next to the most significant bit (“S”) (“a” in the second bit from the left) is 0, the quantization unit 100 stores one bit to the right of the bit (the third bit from the left). (P 2 +1) bits (“S0b”) including b ′′) are sent to the coefficient encoding unit 909 as an encoding target.
- the 16-bit value S1xx yyyy yyyyy yyyy is the quantized PARCOR coefficient
- the 16-bit value S0xy yyyyy yyyyyyyyyy is quantized.
- the converted PARCOR coefficient is a bit representing a sign
- the value of the bit position of x is the same as the value of the corresponding bit in the bit string representing the original PARCOR coefficient KO (i), but the value of the bit position of y is It is a set arbitrary value (for example, 0).
- the two's complement expression is used, so that the processing of “if 0” and “if 1” in the description of the quantization unit 100 are replaced.
- the values of P 1 and P 2 logically satisfy P 1 ⁇ R, P 2 ⁇ R, and P 2 ⁇ P 1 , but specific values may be determined as appropriate.
- the PARCOR coefficient KO (i) is determined only by the bit next to the most significant bit of the signed R bit of the PARCOR coefficient KO (i), that is, the most significant bit of the portion representing the absolute value of the PARCOR coefficient KO (i).
- the range where the absolute value of PARCOR coefficient KO (i) is larger is selected, and the range where the absolute value of PARCOR coefficient KO (i) is larger is selected.
- the P 1 bit from the most significant bit is to be encoded, and the P 2 bit from the most significant bit when the absolute value of the PARCOR coefficient KO (i) is in the smaller range (where P 1 > P 2). ) To be encoded.
- the quantization unit 100 transmits S1xx yyyy yyyyyyyyyyyyyy or S0xy yyyyyyyyyyyyyyyyyyyyyyyy obtained by adding a positive / negative code S to the most significant bit of the resultant bit string to the coefficient encoding unit 909. Note that the most significant 4 bits of S1xx yyyy yyyyyyyyyyyyyyyyyy are to be encoded. Further, the most significant 3 bits of S0xy yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy are to be encoded.
- S is a bit representing a sign
- the value of the bit position of x is the same as the value of the corresponding bit in the bit string representing the original PARCOR coefficient KO (i), but the value of the bit position of y is predetermined. Any arbitrary value (for example, 0).
- the quantization unit 100 transmits the result 01xx yyyy yyyyyyyyyy or 00xy yyyyyyyyyyyy to the coefficient coding unit 909.
- 3-bit "1xx” is the encoding target.
- 2-bit “0x” is an encoding target.
- the value of the bit position of x is the same as the value of the corresponding bit in the bit string representing the original PARCOR coefficient KO (i), but the value of the bit position of y is a predetermined arbitrary value.
- the quantization unit 100 includes a first processing unit 102, a second processing unit 104, a third processing unit 106, and an adding unit 108.
- the PARCOR coefficient KO (i) is expressed as an R-bit value
- U is a predetermined integer satisfying 1 or more and less than ⁇ R- (2 U -1) ⁇
- V is 0 or more ⁇ Let it be a predetermined integer satisfying less than R- (2 U -1) -U ⁇ .
- U and V The reason for defining U and V in this way is that, as will be described later, a bit shift operation of (RUVW) bits is performed using W that satisfies 0 ⁇ W ⁇ 2 U ⁇ 1, so that RUVW ⁇ 0 is satisfied.
- This is for setting U and V.
- U is a predetermined integer satisfying 1 or more and less than R
- V is a predetermined integer satisfying 0 or more and less than R
- the right bit that is not sufficient for the bit shift operation when RUVW ⁇ 0 is obtained. It may be regarded as 0.
- the second processing unit 104 shifts the bit string representing L (i) to the right by (15-U) bits (step S2).
- the value is W (decimal notation).
- 0ab is obtained by shifting L (i) to the right by 13 bits.
- a value obtained by decimal representation of 0ab in binary notation is W.
- the third processing unit 106 shifts the bit string representing L (i) to the right by (15-UVW) bits, and then shifts it to the left by zero padding (15-UVW) (step S3).
- This result is defined as L ′ (i).
- the adding unit 108 adds the positive / negative sign S (i) of KO (i) as a sign bit to L ′ (i) (step S4).
- the 16-bit bit string obtained by the process of step S4 becomes the quantized PARCOR coefficient K′O (i).
- the padding may be an arbitrary numerical value (for example, 010101). Instead of zero padding.
- nonlinear quantization can be performed so as to have a bit string pattern of Sxxy yyyz zzzzzzzz.
- S is a sign bit
- x is a bit depending on U
- y is a bit depending on W and V
- z is an arbitrary bit.
- the PARCOR coefficient is quantized with higher quantization accuracy as the absolute value of the PARCOR coefficient is larger.
- This modified example is an example in which the process in step S4 in the second example is omitted, and corresponds to the generalization of the specific example 4.
- the information of the positive / negative code S (i) obtained by the process of step S1 is sent to the coefficient encoding unit 909 as an encoding target.
- a bit string pattern of 0xxy yyyz zzzz zzzz is obtained as L ′ (i) by the processing in step 3. Therefore, the 16-bit bit string obtained by the process of step S3 is set as a quantized PARCOR coefficient K′O (i).
- Example 3 A third embodiment that uses a reference table stored in the memory 50 will be described, unlike the second embodiment that frequently uses shift operations.
- An example of the reference table is shown in FIG.
- a bit string represented by including more effective bits from the most significant bit to the least significant bit is assigned as T increases.
- a bit string having the most significant bit of 0 is assigned corresponding to T. ing.
- the quantization unit 100a includes a first processing unit 102a, a second processing unit 104a, a third processing unit 106a, and an adding unit 108a.
- the PARCOR coefficient is expressed as an R-bit value
- U is a predetermined integer satisfying 1 or more and less than ⁇ R- (2 U -1) ⁇
- V is 0 or more and ⁇ R- (2 It is a predetermined integer satisfying less than U ⁇ 1) ⁇ U ⁇ .
- the reason for defining U and V in this way is that, as will be described later, a bit shift operation of (RUVW) bits is performed using W that satisfies 0 ⁇ W ⁇ 2 U ⁇ 1, so that RUVW ⁇ 0 is satisfied.
- the value is T (decimal notation).
- 0abc def is obtained by shifting L (i) to the right by 9 bits.
- a value obtained by decimal representation of 0abc def in binary notation is T.
- the adding unit 108a adds the positive / negative sign S (i) of KO (i) as a sign bit to L ′ (i) (step S4a).
- S (i) S is added to the MSB (Most Significant Bit) of L ′ (i).
- a positive or negative sign (or a sign meaning it) is added to the value of T to be T ', and the bit string corresponding to the T' is referenced from the reference table using the value of T '.
- L ′ (i) with a positive / negative sign may be obtained by performing a table lookup.
- the 16-bit bit string obtained by the process of step S4 becomes the quantized PARCOR coefficient K′O (i).
- nonlinear quantization can be performed so as to have a bit string pattern of Sxxy yyyz zzzzzz.
- the table occupancy increases the memory occupation amount, but the shift operation can be reduced, so that the operation amount can be reduced.
- the PARCOR coefficient K′O (i) has been described as being represented by signed R bits, but the third embodiment can also be applied to an unsigned R bit PARCOR coefficient K′O (i). Moreover, it can also be set as embodiment which abbreviate
- Example 4 Different from the second embodiment using the shift operation, the fourth embodiment using a bitwise AND operation (bit mask) will be described. A different part from Example 2 is demonstrated.
- the second processing unit 104 masks bits other than necessary bits in the bit string representing L (i) (bitwise AND operation with 1 is performed on necessary bits). And performs a bitwise AND operation with 0 on unnecessary bits) (step S2b).
- the value is W (decimal notation).
- the third processing unit 106 masks bits other than necessary bits in the bit string representing L (i) based on the value of W (performs bitwise AND operation with 1 on necessary bits). Then, a bitwise AND operation with 0 is performed on unnecessary bits) (step S3b). This result is defined as L ′ (i).
- step S4 described in the second embodiment is performed.
- an embodiment in which the process of step S4a is omitted may be employed.
- ⁇ Modification 1> Only a part of the PARCOR coefficients KO (i) included in the PARCOR coefficient series KO (KO (1), KO (2),..., KO (PO)) input to the quantization units 100 and 100a The quantization method of the present invention may be applied.
- the remaining PARCOR coefficient KO (i) to which the quantization method of the present invention is not applied is quantized by, for example, a conventional quantization method.
- the values of the order PO and the PARCOR coefficient are given.
- the order PO is used as a reference
- the input PARCOR coefficients K (1), K (2),..., K (P) from the first order to the P order are less than or equal to a predetermined order or more than the order.
- the quantization method of the present invention is applied to small order PARCOR coefficients. As shown in Fig. 4 of Non-Patent Document 4, since a low-order PARCOR coefficient generally has a large value, the PARCOR coefficient of an order lower than a predetermined order (for example, 3) or smaller than that order is used.
- the quantization method of the present invention is applied.
- the quantization method of the present invention is applied to a PARCOR coefficient having a value greater than or equal to a predetermined threshold value or greater than the threshold value. This is because when the value of the PARCOR coefficient is large, the increase in the code amount of the residual code CeO due to the quantization error of the PARCOR coefficient becomes large.
- Non-Patent Document 4 a function obtained qualitatively from observation of experimental results is used instead of a theoretically defined function. For this reason, when the number of samples per frame is as small as 10 times the PARCOR coefficient (about 100 samples per 10th-order PARCOR coefficient per frame), the code amount of the residual code CeO Since the code amount of the coefficient code CkO is not very small, the code amount necessary for the PARCOR coefficient cannot be ignored, and the code amount of the composite code CaO is not necessarily minimized.
- the quantization method of the present invention may be applied to some or all of the PARCOR coefficients.
- the composite code CaO is a combination of the residual code CeO and the coefficient code CkO.
- the residual code CeO is so large that the coefficient code CkO can be ignored, even if the coefficient code CkO includes an error, a large error does not occur in the code amount of the coefficient code CkO, but in the opposite case. From equation (12), it is possible to determine whether the code amount of the coefficient code CkO can be ignored or not according to the number N of samples per frame. If N is small, it cannot be ignored, and if N is large, it can be ignored.
- the number of samples depends on the sampling rate of the input signal, and these examples are for 8 kHz sampling.
- the quantization method of the present invention may be applied to the PARCOR coefficient.
- the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the present invention.
- the number of bits R representing the PARCOR coefficient K′O (i) is not limited to 16, and may be 32 or 8.
- right-justified 15 bits are used as an example of the shift operation for obtaining the absolute value of the PARCOR coefficient K′O (i), but left-justified may be used.
- the bit on the left side has been described as a bit representing a larger value, the bit on the right side may be a bit representing a larger value (horizontal inversion). 8 bits (1 byte) may be rearranged according to endian (big / little-endian).
- the right side is described as 0 padding, 1 padding or any value may be padded.
- the absolute value may not be obtained and the table may be directly referenced using the PARCOR coefficient.
- the quantization method of the present invention causes a computer to execute a program by causing a computer recording unit to read a program for operating the computer as each functional component of the present invention, and to operate a processing unit, an input unit, an output unit, and the like. be able to.
- the program is recorded on a computer-readable recording medium, and the program recorded on the server or the like is read into the computer through a telecommunication line or the like. There is a method to make it.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
従来技術の例としてPARCOR係数を線形量子化した場合を図2に示す。PARCOR係数系列KOに含まれる各PARCOR係数は-1から+1の範囲の実数値を持つ。この各PARCOR係数が16ビットの精度で計算されたとし、各PARCOR係数を32768倍した値を16ビットの符号付き整数で表現すると、各PARCOR係数は-32768から+32767の値を持っていることになる。つまり、-(32768/32768)=-1が16ビットの符号付き整数で表現された-32768に対応し、-(32767/32768)≒+1が16ビットの符号付き整数で表現された+32767に対応する。これら16ビットの符号付き整数表現の値それぞれを4ビットで線形量子化したとする。つまり、PARCOR係数系列KOに含まれる各PARCOR係数を32768倍した値の16ビットの符号付き整数表現を上位4ビットの値だけを残し下位12ビットが0詰めされた値を32768で除算した結果が、量子化済PARCOR係数系列K'Oとなる。量子化済PARCOR係数系列K'Oに含まれる各量子化済PARCOR係数は4ビットの精度の値なので、量子化による誤差は16ビットの精度と比べて大きくなるが、量子化済PARCOR係数系列K'Oに含まれる各量子化済PARCOR係数を表す符号量も4ビットで十分となり、どれだけ粗く量子化するかは量子化誤差と符号量とのトレードオフとなる。
つまり、本発明では、入力されたPARCOR係数の系列の算出に使われた入力信号の線形予測残差のエントロピーを最小化する基準の下で、PARCOR係数の量子化誤差に起因する当該線形予測残差の符号量の増大を抑圧するように、PARCOR係数の絶対値が大きいほど高い量子化精度でPARCOR係数が量子化される。
本発明の実施形態は図4に示す量子化部100の機能構成を持ち、図4に示すように、量子化部903が量子化部100に変更されていることを除き、符号化処理の全体は図1に示す機能構成と同じ機能構成を持つ。各PARCOR係数が符号付16ビットの精度で求められたPARCOR係数系列KO=(KO(1),KO(2),…,KO(PO))が量子化部100に入力されると、量子化部100は各PARCOR係数KO(i) (i=1, 2, …, PO)を量子化し、量子化済PARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))を出力する。量子化済PARCOR係数系列K'O=(K'O(1),K'O(2),…,K'O(PO))は係数符号化部909へ送られる。
量子化部100は、入力されたPARCOR係数の絶対値が大きいほど、最上位ビットから最下位ビットへ向かってより多くの有効ビット(2進数の場合、1である。)を含んで表される値を出力する。
P1=3、P2=2、R=16とし、PARCOR係数KO(i)が符号無しRビットで2進数表現されているとする(左端ビットが最上位ビットであるとする。)。つまりPARCOR係数KO(i)のビット列が16ビットのabcd efgh ijkl mnopとすると、量子化部100は、左端に位置する最上位の1ビット("a")が1ならば、上位P1ビット("1bc")を符号化対象として係数符号化部909に送り、最上位1ビット("a")が0ならば上位P2ビット("0b")を符号化対象として係数符号化部909に送る。つまり、最上位の1ビットが1ならば1xxy yyyy yyyy yyyyという16ビットの値が量子化済PARCOR係数となり、最上位1ビットが0ならば0xyy yyyy yyyy yyyyという16ビットの値が量子化済PARCOR係数となる。ここで、xのビット位置の値は元のPARCOR係数KO(i)を表すビット列において対応するビットの値と同じであるが、yのビット位置の値は予め定めた任意の値(例えば0)である。
式(10)や式(11)に表されているように、エントロピー削減効果は底2の対数関数で表されるので、PARCOR係数の感度はその逆関数である2の指数関数のオーダーとなる。よって、2進数表現の場合、最上位ビットに応じた量子化を行えば、エントロピー最小化基準で量子化していることになる。
P1=3、P2=2、R=16とし、PARCOR係数KO(i)が符号付Rビットで2進数表現されているとする(但し、左端ビットが最上位ビットであり、負数は2の補数で表現されるとする。)。つまりPARCOR係数KO(i)のビット列が16ビットのSabc defg hijk lmnoとすると、左端に位置する最上位の1ビット("S")はPARCOR係数の値が正であるか負であるかの符号を表すので、量子化部100は、その次のビット(左から2ビット目の"a")が1ならば、当該ビットの右の(P1-1)ビット分(左から3ビット目の"b"と4ビット目の"c")も含めた(P1+1)ビット("S1bc")を符号化対象として係数符号化部909に送る。最上位ビット("S")の次のビット(左から2ビット目の"a")が0ならば、量子化部100は、当該ビットの右の1ビット分(左から3ビット目の"b")も含めた(P2+1)ビット("S0b")を符号化対象として係数符号化部909に送る。つまり、最上位の次のビットが1ならばS1xx yyyy yyyy yyyyという16ビットの値が量子化済PARCOR係数となり、最上位の次のビットが0ならばS0xy yyyy yyyy yyyyという16ビットの値が量子化済PARCOR係数となる。ここで、Sは符号を表すビットであり、xのビット位置の値は元のPARCOR係数KO(i)を表すビット列において対応するビットの値と同じであるが、yのビット位置の値は予め定めた任意の値(例えば0)である。ただし、負の値の場合には2の補数表現なので、上記量子化部100の説明中の「0ならば」と「1ならば」とを入れ替えた処理を行う。
要は、PARCOR係数KO(i)の符号付Rビットの最上位ビットの次のビット、すなわち、PARCOR係数KO(i)の絶対値を表わす部分の最上位ビットのみにより、PARCOR係数KO(i)の絶対値が大きい側の範囲にあるかPARCOR係数KO(i)の絶対値が小さい側の範囲にあるかの二者択一を行い、PARCOR係数KO(i)の絶対値が大きい側の範囲にある場合には最上位ビットからP1ビットを符号化対象とし、PARCOR係数KO(i)の絶対値が小さい側の範囲にある場合の最上位ビットからP2ビット(ただしP1>P2)を符号化対象とする、ことになる。
R=16とし、PARCOR係数KO(i)が符号付Rビットで表されているとする。つまりPARCOR係数KO(i)のビット列が16ビットのSabc defg hijk lmnoとすると、量子化部100は、PARCOR係数KO(i)の絶対値を求め、符号無し15ビットの0abc defg hijk lmnoに変換する。このとき正負の情報S(例えば正負を表す最上位ビット)はメモリに保持される。符号無し15ビットの0abc defg hijk lmnoについて左端に位置する最上位のビットから2ビット目の"a"が1ならば、量子化部100は、3ビット目の"b"と4ビット目の"c"も保持し、5ビット目以降を破棄する(01xx yyyy yyyy yyyy)。符号無し15ビットの0abc defg hijk lmnoについて左端に位置する最上位のビットから2ビット目の"a"が0ならば、量子化部100は、3ビット目の"b"を保持し、4ビット目以降を破棄する(00xy yyyy yyyy yyyy)。そして量子化部100は、この結果のビット列の最上位ビットに正負の符号Sを付加したS1xx yyyy yyyy yyyyまたはS0xy yyyy yyyy yyyyを係数符号化部909に伝送する。なお、S1xx yyyy yyyy yyyyは最上位4ビットが符号化対象とされる。また、S0xy yyyy yyyy yyyyは最上位3ビットが符号化対象とされる。ここで、Sは符号を表すビットで、xのビット位置の値は元のPARCOR係数KO(i)を表すビット列において対応するビットの値と同じであるが、yのビット位置の値は予め定めた任意の値(例えば0)である。
R=16とし、PARCOR係数KO(i)が符号付Rビットで表されているとする。つまりPARCOR係数KO(i)のビット列が16ビットのSabc defg hijk lmnoとすると、量子化部100は、PARCOR係数KO(i)の絶対値を求め、符号無し15ビットの0abc defg hijk lmnoに変換する。このとき正負の情報S(例えば正負を表す最上位ビット)は符号化対象として係数符号化部909に送られる。符号無し15ビットの0abc defg hijk lmnoについて左端に位置する最上位のビットから2ビット目の"a"が1ならば、量子化部100は、3ビット目の"b"と4ビット目の"c"も保持し、5ビット目以降を破棄する(01xx yyyy yyyy yyyy)。符号無し15ビットの0abc defg hijk lmnoについて左端に位置する最上位のビットから2ビット目の"a"が0ならば、量子化部100は、3ビット目の"b"を保持し、4ビット目以降を破棄する(00xy yyyy yyyy yyyy)。そして量子化部100は、この結果の01xx yyyy yyyy yyyyまたは00xy yyyy yyyy yyyyを係数符号化部909に伝送する。なお、01xx yyyy yyyy yyyyの場合には3ビットの"1xx"が符号化対象とされる。また、00xy yyyy yyyy yyyyの場合には2ビットの"0x"が符号化対象とされる。ここで、xのビット位置の値は元のPARCOR係数KO(i)を表すビット列において対応するビットの値と同じであるが、yのビット位置の値は予め定めた任意の値である。
上記具体例3を一般化した実施例を説明する。上記具体例1および2についてもこの実施例2に従って同様の結果を得ることができる。
量子化部100は、第1処理部102、第2処理部104、第3処理部106、付加部108を含む。この例ではPARCOR係数KO(i)がRビットの値として表されているとし、Uを1以上{R-(2U-1)}未満を満たす予め定められた整数とし、Vを0以上{R-(2U-1)-U}未満を満たす予め定められた整数とする。UとVをこのように定める理由は、後述するように0≦W≦2U-1を満たすWを用いて(R-U-V-W)ビットのビットシフト演算を行うことから、R-U-V-W≧0を満たすように、UとVを設定するためである。しかし、例えば、Uを1以上R未満を満たす予め定められた整数とし、Vを0以上R未満を満たす予め定められた整数として、R-U-V-W<0の場合にビットシフト演算で足りなくなる右側のビットを0とみなすようにしてもよい。説明を具体的なものとするため、ここではR=16、U=2、V=1とする。
ab=11つまりW=3の場合、L'(i)として011c def0 0000 0000が得られ、
ab=10つまりW=2の場合、L'(i)として010c de00 0000 0000が得られ、
ab=01つまりW=1の場合、L'(i)として001c d000 0000 0000が得られ、
ab=00つまりW=0の場合、L'(i)として000c 0000 0000 0000が得られる。
ab=11つまりW=3に対応して、S11c def0 0000 0000が得られ、
ab=10つまりW=2に対応して、S10c de00 0000 0000が得られ、
ab=01つまりW=1に対応して、S01c d000 0000 0000が得られ、
ab=00つまりW=0に対応して、S00c 0000 0000 0000が得られる。
このステップS4の処理で得られた16ビットのビット列が量子化済PARCOR係数K'O(i)となる。
次に、実施例2の変形例を説明する。この変形例は、実施例2におけるステップS4の処理を省略する実施例であり、上記具体例4の一般化に対応する。
この変形例では、ステップS1の処理で得られた正負符号S(i)の情報が符号化対象として係数符号化部909へ送られる。
また、ステップ3の処理によって、L'(i)として0xxy yyyz zzzz zzzzというビット列パターンが得られている。そこで、ステップS3の処理で得られた16ビットのビット列を量子化済PARCOR係数K'O(i)とする。上記の例であれば、
ab=11つまりW=3に対応して、K'O(i)として011c def0 0000 0000が得られ、
ab=10つまりW=2に対応して、K'O(i)として010c de00 0000 0000が得られ、
ab=01つまりW=1に対応して、K'O(i)として001c d000 0000 0000が得られ、
ab=00つまりW=0に対応して、K'O(i)として000c 0000 0000 0000が得られる。
シフト演算を多用する実施例2と異なり、メモリ50に記憶されている参照テーブルを利用する実施例3を説明する。参照テーブルの例を図7に示す。この参照テーブルでは、Tが大きな値ほど最上位ビットから最下位ビットへ向かってより多くの有効ビットを含んで表されるビット列が割り当てられている。なお、例示する参照テーブルでは、符号付16ビットのPARCOR係数KO(i)の絶対値を用いた処理に対応する例として、最上位ビットが0となっているビット列がTに対応して割り当てられている。
このステップS4の処理で得られた16ビットのビット列が量子化済PARCOR係数K'O(i)となる。
シフト演算を利用する実施例2と異なり、ビット単位のAND演算(ビットマスク)を利用する実施例4を説明する。実施例2と異なる部分について説明する。
その値をW(10進数表記)とする。上記の例であれば、U=2なので、16ビットのPARCOR係数KO(i)の絶対値のビット列0abc defg hijk lmnoに対して、15ビット目から右側へ順に各ビットを1とし15-Uビット目から右側へ順に各ビットを0としたビット列0110 0000 0000 0000とビット単位AND演算を行いビット列0ab0 0000 0000 0000を得る。この2進数表記の0abを10進数表記した値がWである。
量子化部100,100aに入力されたPARCOR係数系列KO=(KO(1),KO(2),…,KO(PO))に含まれるPARCOR係数KO(i)のうち一部のみに対して本発明の量子化方法を適用してもよい。本発明の量子化方法が適用されなかった残りのPARCOR係数KO(i)は、例えば従来的な量子化方法で量子化される。
次数POを基準とする場合、入力された1次からP次までのPARCOR係数K(1),K(2),…,K(P)のうち、予め定められた次数以下または当該次数よりも小さい次数のPARCOR係数に対して本発明の量子化方法を適用する。非特許文献4のFig.4に示されるように、一般的に低次数のPARCOR係数は大きい値を持つから、予め定められた次数(例えば3)以下または当該次数よりも小さい次数のPARCOR係数に対して本発明の量子化方法を適用するのである。
PARCOR係数の値を基準とする場合、予め定められた閾値以上または当該閾値よりも大きい値を持つPARCOR係数に対して本発明の量子化方法を適用する。PARCOR係数の値が大きいときにはPARCOR係数の量子化誤差に起因する残差符号CeOの符号量の増大が大きくなるからである。
音響信号ロスレス符号化での従来方法(非特許文献4参照)では理論的に定められた関数ではなく、実験結果の観測から定性的に求めた関数を用いている。このため、1フレームあたりのサンプル数がPARCOR係数の10倍程度のように少ない場合(1フレームあたり、10次のPARCOR係数に対して100サンプル程度)には、残差符号CeOの符号量に比べて係数符号CkOの符号量が非常に少ないわけではないので、PARCOR係数に必要な符号量を無視できず、合成符号CaOの符号量が必ずしも最小化されない。
例えば、PARCOR係数K'O(i)を表すビット数Rは、16に限らず32や8でもよい。また、PARCOR係数K'O(i)の絶対値を求めるシフト演算として右詰15ビットを例に採用したが、左詰でもよい。ビット列において左側のビットがより大きい値を表すビットとして説明したが、右側のビットがより大きい値を表すビットとしてもかまわない(左右反転)。エンディアン(big/little-endian)に応じて8ビット(1バイト)を並び替えてもよい。右側を0詰めとして説明したが1詰めや任意の値を詰めてもよい。また、絶対値を求めず、PARCOR係数を用いて直接表引きにしてもよい。
Claims (16)
- PARCOR係数の量子化を行うPARCOR係数量子化ステップを有するPARCOR係数量子化方法において、
上記PARCOR係数量子化ステップでは、
入力された上記PARCOR係数の系列の算出に使われた入力信号の線形予測残差のエントロピーを最小化する基準の下で、上記PARCOR係数の量子化誤差に起因する当該線形予測残差の符号量の増大を抑圧するように、上記PARCOR係数の絶対値が大きいほど高い量子化精度で上記PARCOR係数が量子化される
ことを特徴とするPARCOR係数量子化方法。 - PARCOR係数の量子化を行うPARCOR係数量子化ステップを有するPARCOR係数量子化方法において、
上記PARCOR係数が所定ビット数を持つ値として表されているとして、
上記PARCOR係数量子化ステップでは、
入力された上記PARCOR係数の絶対値が大きいほど、最上位ビットから最下位ビットへ向かってより多くの有効ビットを含んで表される値を出力する
ことを特徴とするPARCOR係数量子化方法。 - PARCOR係数の量子化を行うPARCOR係数量子化ステップを有するPARCOR係数量子化方法において、
上記PARCOR係数がRビットの値として表されているとし、Uを1以上{R-(2U-1)}未満を満たす予め定められた整数とし、Vを0以上{R-(2U-1)-U}未満を満たす予め定められた整数として、
上記PARCOR係数量子化ステップは、
(a)上記PARCOR係数Kの絶対値Lを表すビット列を求めるステップと、
(b)上記PARCOR係数Kの絶対値Lを表すビット列のうち最上位ビットからUビットを取得するステップと、
(c)上記ステップ(b)で得られたUビットの値をWとして、上記PARCOR係数Kの絶対値Lを表すビット列のうち最上位ビットから(U+V+W)ビットを取得するステップと
を有することを特徴とするPARCOR係数量子化方法。 - 請求項3に記載のPARCOR係数量子化方法であって、
上記PARCOR係数量子化ステップは、さらに、
(d)上記ステップ(c)で得られた(U+V+W)ビットに、上記PARCOR係数Kの符号ビットを付加するステップ
を有することを特徴とするPARCOR係数量子化方法。 - PARCOR係数の量子化を行うPARCOR係数量子化ステップを有するPARCOR係数量子化方法において、
上記PARCOR係数量子化ステップは、
(a)上記PARCOR係数Kの絶対値Lを表すビット列を求めるステップと、
(b)上記絶対値Lを表すビット列のうち最上位ビットから所定の長さのビット列を取得するステップと、
(c)上記ステップ(b)で得られたビット列の値をTとして、大きな値ほど最上位ビットから最下位ビットへ向かってより多くの有効ビットを含んで表されるビット列が割り当てられている参照テーブルから、上記Tの値に対応するビット列を取得するステップと
を有することを特徴とするPARCOR係数量子化方法。 - 請求項5に記載のPARCOR係数量子化方法において、
ステップ(c)にて、上記PARCOR係数Kが負の場合には、上記Tに正負符号を表す符号を付加してT’を求め、上記参照テーブルから当該T’に対応するビット列を取得する
ことを特徴とするPARCOR係数量子化方法。 - 請求項5に記載のPARCOR係数量子化方法であって、
上記PARCOR係数量子化ステップは、さらに、
(d)上記ステップ(c)で得られたビット列に、上記PARCOR係数Kの符号ビットを付加するステップ
を有することを特徴とするPARCOR係数量子化方法。 - 請求項1,2,3,5のいずれかに記載のPARCOR係数量子化方法であって、
上記PARCOR係数量子化ステップにおいて、入力された上記PARCOR係数の系列のうち少なくとも一部の上記PARCOR係数が量子化される
ことを特徴とするPARCOR係数量子化方法。 - 請求項1,2,3,5のいずれかに記載のPARCOR係数量子化方法であって、
上記PARCOR係数量子化ステップにおいて、入力された1次からP次までの上記PARCOR係数の系列K(1),K(2),…,K(P)のうち、予め定められた次数以下または当該次数よりも小さい次数のPARCOR係数が量子化される
ことを特徴とするPARCOR係数量子化方法。 - 請求項1,2,3,5のいずれかに記載のPARCOR係数量子化方法であって、
上記PARCOR係数量子化ステップにおいて、入力された上記PARCOR係数の系列のうち、予め定められた閾値以上または当該閾値よりも大きい値を持つPARCOR係数が量子化される
ことを特徴とするPARCOR係数量子化方法。 - 請求項1,2,3,5のいずれかに記載のPARCOR係数量子化方法であって、
入力された上記PARCOR係数の系列の算出に使われた入力信号のサンプル数が、予め定められた閾値以下または当該閾値よりも小さい場合に、上記PARCOR係数量子化ステップにおいて、入力された上記PARCOR係数の系列のうち少なくとも一部の上記PARCOR係数が量子化される
ことを特徴とするPARCOR係数量子化方法。 - PARCOR係数の量子化を行うPARCOR係数量子化部を有するPARCOR係数量子化装置において、
上記PARCOR係数がRビットの値として表されているとし、Uを1以上{R-(2U-1)}未満を満たす予め定められた整数とし、Vを0以上{R-(2U-1)-U}未満を満たす予め定められた整数として、
上記PARCOR係数量子化部は、
上記PARCOR係数Kの絶対値Lを表すビット列を求める第1処理部と、
上記PARCOR係数Kの絶対値Lを表すビット列のうち最上位ビットからUビットを取得する第2処理部と、
上記第2処理部によって得られたUビットの値をWとして、上記PARCOR係数Kの絶対値Lを表すビット列のうち最上位ビットから(U+V+W)ビットを取得する第3処理部と
を含むことを特徴とするPARCOR係数量子化装置。 - PARCOR係数の量子化を行うPARCOR係数量子化部を有するPARCOR係数量子化装置において、
上記PARCOR係数量子化部は、
上記PARCOR係数Kの絶対値Lを表すビット列を求める第1処理部と、
上記絶対値Lを表すビット列のうち最上位ビットから所定の長さのビット列を取得する第2処理部と、
上記第2処理部によって得られたビット列の値をTとして、大きな値ほど最上位ビットから最下位ビットへ向かってより多くの有効ビットを含んで表されるビット列が割り当てられている参照テーブルから、上記Tの値に対応するビット列を取得する第3処理部と
を含むことを特徴とするPARCOR係数量子化装置。 - 請求項13に記載のPARCOR係数量子化装置において、
上記第3処理部は、上記PARCOR係数Kが負の場合には、上記Tに正負符号を表す符号を付加してT’を求め、上記参照テーブルから当該T’に対応するビット列を取得する
ことを特徴とするPARCOR係数量子化装置。 - コンピュータを請求項12または請求項13に記載されたPARCOR係数量子化装置として機能させるためのプログラム。
- コンピュータを請求項12または請求項13に記載されたPARCOR係数量子化装置として機能させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011518455A JPWO2010140590A1 (ja) | 2009-06-03 | 2010-06-01 | Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体 |
CN201080022910XA CN102449691B (zh) | 2009-06-03 | 2010-06-01 | Parcor系数量化方法、parcor系数量化装置、程序以及记录介质 |
US13/320,861 US8902997B2 (en) | 2009-06-03 | 2010-06-01 | PARCOR coefficient quantization method, PARCOR coefficient quantization apparatus, program and recording medium |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009-134370 | 2009-06-03 | ||
JP2009134370 | 2009-06-03 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2010140590A1 true WO2010140590A1 (ja) | 2010-12-09 |
Family
ID=43297724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2010/059271 WO2010140590A1 (ja) | 2009-06-03 | 2010-06-01 | Parcor係数量子化方法、parcor係数量子化装置、プログラム及び記録媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8902997B2 (ja) |
JP (2) | JPWO2010140590A1 (ja) |
CN (1) | CN102449691B (ja) |
WO (1) | WO2010140590A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013120225A (ja) * | 2011-12-06 | 2013-06-17 | Nippon Telegr & Teleph Corp <Ntt> | 符号化方法、符号化装置、プログラム、記録媒体 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10204633B2 (en) * | 2014-05-01 | 2019-02-12 | Nippon Telegraph And Telephone Corporation | Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium |
CN111836045A (zh) * | 2020-06-02 | 2020-10-27 | 广东省建筑科学研究院集团股份有限公司 | 一种桥梁健康监测传感器数据的无损压缩方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5628276B2 (ja) * | 1973-08-16 | 1981-06-30 | ||
JPS6195400A (ja) * | 1984-10-17 | 1986-05-14 | 株式会社日立製作所 | 音声分析・合成系におけるパラメ−タ非線形変換方式 |
JP2008185701A (ja) * | 2007-01-29 | 2008-08-14 | Nippon Telegr & Teleph Corp <Ntt> | Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体 |
JP2008209637A (ja) * | 2007-02-26 | 2008-09-11 | Nippon Telegr & Teleph Corp <Ntt> | マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体 |
JP2009069309A (ja) * | 2007-09-11 | 2009-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5628276A (en) | 1979-08-15 | 1981-03-19 | Matsushita Electric Ind Co Ltd | Pyrogenic composition |
JPS5921039B2 (ja) * | 1981-11-04 | 1984-05-17 | 日本電信電話株式会社 | 適応予測符号化方式 |
CN100346392C (zh) * | 2002-04-26 | 2007-10-31 | 松下电器产业株式会社 | 编码设备、解码设备、编码方法和解码方法 |
WO2009022454A1 (ja) | 2007-08-10 | 2009-02-19 | Panasonic Corporation | 音声分離装置、音声合成装置および声質変換装置 |
-
2010
- 2010-06-01 CN CN201080022910XA patent/CN102449691B/zh active Active
- 2010-06-01 JP JP2011518455A patent/JPWO2010140590A1/ja active Pending
- 2010-06-01 WO PCT/JP2010/059271 patent/WO2010140590A1/ja active Application Filing
- 2010-06-01 US US13/320,861 patent/US8902997B2/en active Active
-
2014
- 2014-08-21 JP JP2014168381A patent/JP5780686B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5628276B2 (ja) * | 1973-08-16 | 1981-06-30 | ||
JPS6195400A (ja) * | 1984-10-17 | 1986-05-14 | 株式会社日立製作所 | 音声分析・合成系におけるパラメ−タ非線形変換方式 |
JP2008185701A (ja) * | 2007-01-29 | 2008-08-14 | Nippon Telegr & Teleph Corp <Ntt> | Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体 |
JP2008209637A (ja) * | 2007-02-26 | 2008-09-11 | Nippon Telegr & Teleph Corp <Ntt> | マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体 |
JP2009069309A (ja) * | 2007-09-11 | 2009-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体 |
Non-Patent Citations (1)
Title |
---|
HIROKAZU KAMEOKA ET AL.: "A Linear Predictive Coding Algorithm Minimizing the Golomb-Rice Code Length of the Residual Signal", THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS A, vol. J91-A, no. 11, 1 November 2008 (2008-11-01), pages 1017 - 1025 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013120225A (ja) * | 2011-12-06 | 2013-06-17 | Nippon Telegr & Teleph Corp <Ntt> | 符号化方法、符号化装置、プログラム、記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US8902997B2 (en) | 2014-12-02 |
CN102449691B (zh) | 2013-11-06 |
US20120072226A1 (en) | 2012-03-22 |
CN102449691A (zh) | 2012-05-09 |
JP2014222369A (ja) | 2014-11-27 |
JPWO2010140590A1 (ja) | 2012-11-22 |
JP5780686B2 (ja) | 2015-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2159790B1 (en) | Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system | |
RU2020119762A (ru) | Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием квантования и энтропийного кодирования | |
US8068042B2 (en) | Coding method, decoding method, and apparatuses, programs and recording media therefor | |
US20070168186A1 (en) | Audio coding apparatus, audio decoding apparatus, audio coding method and audio decoding method | |
BRPI0709450B1 (pt) | codificação de sinal de informação | |
KR20080049116A (ko) | 오디오 코딩 | |
US6593872B2 (en) | Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method | |
JP5780686B2 (ja) | Parcor係数量子化方法、装置、プログラム | |
KR20120096541A (ko) | 디지털 신호의 압축 또는 압축해제를 위한 방법, 시스템 및 장치 | |
JPH01177227A (ja) | 音声コーデック | |
US20070033024A1 (en) | Method and apparatus for encoding audio data | |
KR100668319B1 (ko) | 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치 | |
WO2008092719A1 (en) | Audio quantization | |
KR20060084437A (ko) | 오디오 인코딩 시의 레이트-왜곡 제어 구조 | |
JP5303074B2 (ja) | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 | |
JP3294024B2 (ja) | 音声信号の符号化伝送方法 | |
JP5562332B2 (ja) | 予測次数決定方法、予測次数決定装置、プログラム及び記録媒体 | |
JPH0715347A (ja) | 符号化装置及び復号装置 | |
JP4438655B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP3144213B2 (ja) | 音声パラメータ分析装置および音声符号化装置 | |
KR20010005669A (ko) | 래그 파라미터의 부호화 방법 및 그 장치, 그리고 부호 리스트 작성 방법 | |
KR0170205B1 (ko) | 부호화 및 복호화 방법 및 회로 | |
WO2023198383A1 (en) | Method for quantizing line spectral frequencies | |
EP3084761A1 (en) | Audio signal encoder | |
Kamamoto et al. | Low-complexity PARCOR coefficient quantizer and prediction order estimator for G. 711.0 (Lossless Speech Coding) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WWE | Wipo information: entry into national phase |
Ref document number: 201080022910.X Country of ref document: CN |
|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 10783373 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2011518455 Country of ref document: JP |
|
WWE | Wipo information: entry into national phase |
Ref document number: 13320861 Country of ref document: US |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 10783373 Country of ref document: EP Kind code of ref document: A1 |