WO1998037636A1 - Procede de codage de signaux vocaux - Google Patents
Procede de codage de signaux vocaux Download PDFInfo
- Publication number
- WO1998037636A1 WO1998037636A1 PCT/JP1998/000674 JP9800674W WO9837636A1 WO 1998037636 A1 WO1998037636 A1 WO 1998037636A1 JP 9800674 W JP9800674 W JP 9800674W WO 9837636 A1 WO9837636 A1 WO 9837636A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- value
- code
- signal
- input signal
- prediction error
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 48
- 238000013139 quantization Methods 0.000 claims abstract description 236
- 230000003044 adaptive effect Effects 0.000 claims abstract description 44
- 241001385733 Aesculus indica Species 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 description 18
- 230000005236 sound signal Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000005070 sampling Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000001934 delay Effects 0.000 description 4
- 241000735552 Erythroxylum Species 0.000 description 2
- 235000008957 cocaer Nutrition 0.000 description 2
- ZPUCINDJVBIVPJ-LJISPDSOSA-N cocaine Chemical compound O([C@H]1C[C@@H]2CC[C@@H](N2C)[C@H]1C(=O)OC)C(=O)C1=CC=CC=C1 ZPUCINDJVBIVPJ-LJISPDSOSA-N 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 235000003913 Coccoloba uvifera Nutrition 0.000 description 1
- 240000008976 Pterocarpus marsupium Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Definitions
- the present invention relates to a speech coding method, and more particularly to an improvement of an adaptive pulse code modulation (APCM) method and an adaptive differential pulse code modulation (ADFC) method.
- APCM adaptive pulse code modulation
- ADFC adaptive differential pulse code modulation
- an adaptive pulse code modulation method (APCM), an adaptive differential pulse code modulation method (ADPCM), and the like are known.
- APCM adaptive pulse code modulation method
- ADPCM adaptive differential pulse code modulation method
- ADPCM is a method of predicting a current input signal from a past input signal, quantizing the difference between the predicted value and the current input signal, and then encoding the signal.
- the quantization width (quantization step size) is changed according to the fluctuation of the input signal level.
- FIG. 11 shows a schematic configuration of a conventional AD PCM encoder 4 and AD PCM decoder 5. Note that n used in the following description is an integer. First, the ADPCM encoding device 4 will be described.
- First adder 4 1 the AD P CM difference input to the encoding device 4 signal chi [pi and the prediction signal y (prediction error signal d n), determined according to the following equation (1).
- the first adaptive quantizer 42 encodes the prediction error signal d n obtained by the first adder 41 based on the quantization width T n to obtain a code L Request n. That is, the first adaptive quantizer 4 2, based on the following equation (2), determining the code L n. the obtained code L n is main Sent to Mori 6.
- the symbol [] is a Gaussian symbol and represents the largest integer that does not exceed the number in the symbol.
- the initial value of the quantization width T eta is a positive number.
- First quantization width updater 4 based on the following equation (3), obtaining a quantization width T eta + 1 for the next speech signals sampled in g value chi eta + 1.
- the relationship between the sign L n and the function M (L n ) is as shown in Table 1.
- Table 1 shows an example in which the code L n is 4 bits.
- the second adder 45 is based on the predicted signal y n and the inverse quantization value Q n for the current audio signal sampling value x n Find the reproduced signal w n . That is, the second adder 4 5, based on the following equation (5), obtaining the reproduction signal w n.
- the first predictor 46 delays the reproduced signal w n by one sample time to obtain the next audio signal sampling value ⁇ ⁇ + 1 Obtain the prediction signal y n +1 Next, the ADPCM decoding device 5 will be described.
- the second adaptive inverse quantizer 51 uses the code L n ′ obtained from the memory 6 and the quantization width T n ′ obtained by the second quantization width updater 52 to obtain the following equation (6).
- the second quantization width updater 52 uses the code L n ′ obtained from the memory 6 and Based on (7), the quantization width T n + ] ′ to be used for the next code L n + 1 ′ is obtained: L n ′ and the function M (L consult) Is the same as the relationship between L n and the function M (L divulg) in Table 1 above.
- the third adder 53 obtains a reproduced signal w n ′ based on the prediction signal y n ′ and the inverse quantization value Q vigorous′ obtained by the second predictor 54. That is, the third adder 53 obtains a reproduction signal w n ′ based on the following equation (8): The obtained reproduction signal w n ′ is output from the ADP CM decoding device 5.
- the second predictor 54 delays the reproduced signal w n 'by one sample time to obtain the next predicted signal y n + 1 ', and this predicted signal y n + Is sent to the third adder 53.
- FIGS. 12 and 13 show the relationship between the inverse quantization value Q n and the prediction error signal d ⁇ ⁇ ⁇ ⁇ when the code L n is 3 bits.
- T in FIG. 12 and U in FIG. 13 indicate the quantization widths determined by the first quantization width updater 43 at different times. Here, it is assumed that T and U.
- the range A ⁇ B of the prediction error signal d n A, in B in the case of that range including the boundary A represents a "[A”, if not including the boundary A is represented as "(A” Similarly, when the range includes boundary B, it is expressed as "B]", and when it does not include boundary B, it is expressed as "B)".
- the inverse quantization value Q n is 0.5 T when the value of the prediction error signal d n is in the range of [0, T), and the value of the prediction error signal d n is [T, 2 T) is 1.5 T, and the value of the prediction error signal d n is 2.5 T when the value of the prediction error signal d n is in the range of [2 ⁇ , 3 T), and the value of the prediction error signal d n is When it is in the range of [3 T, ⁇ ], it becomes 3.5 T.
- the inverse quantization value Q n is 10.5 T
- the value of the prediction error signal d n is [1 2 T, — In the range T)
- the value of the prediction error signal d n is in the range of [1 3 T, — 2 T)
- it is 1 2.5 T
- it becomes one 3.5 T.
- T in FIG. 1 2 is in the relationship that has been replaced by U.
- the relationship between the inverse quantized value Q n and the prediction error signal d n conventionally, the positive range and negative range of the predictive error signal d n, characteristics are determined to be symmetric.
- the inverse quantization values Q n is 0 not pose a.
- the quantization width T n increases. That is, the quantization width as shown in FIG. 1 2 when the prediction error signal d n is small is rather small, the quantization width is increased as shown in Figures 1 to 3 when a large prediction error signal d n.
- the quantization width is kept small value corresponding to the smaller predictive error signal d n absolute value of the previous The quantization error increases.
- An object of the present invention is to provide a speech coding method capable of reducing a quantization error when a prediction error signal d fatigueis 0 or when an input signal changes abruptly. Disclosure>
- First speech encoding method in the audio coding method for coding by adaptive quantization of the difference d "of the input signal chi [pi and predicted value y n, for a small section of the absolute value of the difference d n
- the adaptive quantization is performed so that the inverse quantization value Q josof the code L n becomes substantially zero.
- Second speech encoding method when the first prediction error signal d which is the difference between the predicted value y n against the input signal chi [pi and the input signal chi eta "is 0 or more, the by adding 1/2 of the quantization width T n to 1 of the prediction error signal d n to generate a second prediction error signal e ", if the first prediction error signal d n is smaller than 0, the 1 of the first step of generating a prediction error signal e [pi and second by the subtracting 1 ??
- the code L n is obtained based on the following equation (9).
- the symbol [] is a Gaussian symbol and is the largest integer that does not exceed the number in the symbol.
- the inverse quantization values Q n is found on the basis of the following equation (1 0).
- the fourth step for example, the quantization width T eta + 1 is determined based on the following equation (1 1).
- M (L n ) is a value determined according to L n .
- a predicted value y n +1 is obtained based on the following equation (12).
- yn + i y ⁇ + q n - (1 2)
- third speech encoding method speech coding for encoding adaptively quantizing the difference dn of the input signal chi eta and predicted value y n in the method, as the inverse quantization value of the code L n for a small section of the absolute value of the difference d "becomes approximately zero, and as compared to a small section of the absolute value of the difference dn, large absolute value of the difference d n It is characterized in that adaptive quantization is performed so that the quantization width for a section becomes large.
- Fourth speech encoding method when the first prediction error signal d n is the difference between the predicted value y n against the input signal chi [pi and the input signal chi [pi is 0 or more, the by adding 1 Bruno 2 of 1 of the prediction error signal d n to the unit quantization width T n generates a second prediction error signal e n, if the first prediction error signal d n is smaller than 0, first step of generating a second prediction error signal en by subtracting 1/2 of the first prediction error signal d n units quantization from the width T n, the second prediction error signal obtained by the first step e n , a second step of obtaining the code Ln based on a table in which the relationship between the second prediction error signal e n and the code L n is stored in advance, the code L n obtained in the second step, and the code L n based on the table stored in advance the relationship between the inverse quantized value Q n, third step of obtaining an inverse quantization value Q
- fourth step and on the basis of the third and the inverse quantized value Qn calculated in step and the predicted value y n, comprises a fifth step of obtaining a prediction value y n + 1 for the next input signal chi eta + 1 ,
- Each of the above tables must be created to satisfy the following conditions (a), (b) and (c) It is characterized by.
- a predicted value y n + 1 is obtained based on the following equation (13).
- yn + i yn + q n - (1 3)
- fifth speech encoding method in the audio coding method for coding by adaptive quantization of the input signal chi eta, the absolute value of the input signal chi [pi Adaptive quantization is performed so that the inverse quantization value of the code L n for a section having a small value is substantially zero.
- the symbol [] is a Gaussian symbol and is the largest integer that does not exceed the number in the symbol.
- the quantization width ⁇ + 1 is obtained based on the following equation (15).
- M (L n ) is a value determined according to L n .
- a reproduced signal w n ′ is obtained based on the following equation (16).
- Seventh speech coding method according to the invention in the audio coding method for coding by adaptive quantization of the input signal chi eta, dequantized value of sign-L n for a small section of the absolute value of the input signal chi eta Q n is approximately 0 and the absolute value of the human-power signal ⁇ ⁇ is small. Adaptive quantization is performed so that the quantization width for a section where the absolute value of the input signal ⁇ ⁇ is large is larger than that for a section where the input signal ⁇ is large.
- Eighth speech coding method when the human power signal chi eta is 0 or more, generates a modified input signal g n by adding 1/2 units quantization width T [pi to the input signal chi eta and, when the input signal chi eta is less than 0, the first step of generating a modified input signal g n from the input signal chi eta by subtracting 1/2 units quantization width T eta, the first step A second step of obtaining the code L administratbased on the corrected input signal g n obtained in the above manner and a table storing the relationship between the signal g n and the code L n in advance, and the code L n obtained in the second step.
- FIG. 1 is a block diagram showing a first embodiment of the present invention.
- FIG. 2 is a flowchart showing the operation of the ADPCM encoding apparatus of FIG.
- FIG. 3 is a flowchart showing the operation of the AD PCM decoding apparatus of FIG.
- Figure 4 is a graph showing the relationship between the prediction error signal d n and the inverse quantization values q n.
- Figure 5 is a graph showing the relationship between the prediction error signal d n and the inverse quantization values Q n.
- FIG. 6 is a block diagram showing a second embodiment of the present invention.
- FIG. 7 is a flowchart showing the operation of the ADPCM encoding apparatus of FIG.
- FIG. 8 is a flowchart showing the operation of the AD PCM decoding apparatus of FIG.
- Figure 9 is a graph showing the relationship between the prediction error signal d "and the inverse quantization values Q n. 1 0 is a block diagram showing a third embodiment of the present invention.
- FIG. 11 is a block diagram showing a conventional example.
- Figure 1 2 is a graph showing the relationship between the prediction error signal d n and the inverse quantization values q n in the prior art.
- Figure 1 3 is a graph showing the relationship between the prediction error signal d n and the inverse quantization values Q n in the prior art. Best Mode for Carrying Out the Invention>
- FIG. 1 shows a schematic configuration of an AD PCM encoder 1 and an AD PCM decoder 2. .
- n used in the following description is an integer.
- the first adder 11 calculates a difference (hereinafter, referred to as a first prediction error signal d n ) between the signal ⁇ ⁇ input to the ADPCM encoder 1 and the prediction signal y exceptby the following equation (17) ).
- Signal generator 1 9, based on the obtained et quantization width T [pi in the first prediction error signal d n and the first quantization width updater 1 8, for generating a correction signal a eta.
- the first adaptive quantizer 14 converts the second prediction error signal e ⁇ ⁇ obtained by the second adder 12 into , Is coded based on the quantization width T n obtained by the first quantization width updater 18 to obtain a code L ⁇ . That is, the first adaptive quantizer 14 uses the following equation (2 1) based on the obtained code L n. code L n obtained is sent to the memory 3.
- the first quantization width updater 18 obtains a quantization width ⁇ + 1 for the next audio signal sampling value ⁇ + ⁇ based on the following equation (22). Between the sign L n and the function M (L hinder) Relationship is the same as the relationship between the code of Table 1 L n and function M (Ln).
- the first predictor 17 predicts the next audio signal sampling value ⁇ ⁇ + 1 by delaying the reproduced signal w n by one sample time. Find the signal y n + 1 .
- the AD PCM decoding device 2 will be described.
- the second adaptive inverse quantizer 22 uses the code L n ′ obtained from the memory 3 and the quantization width T n ′ obtained by the second quantization width updater 23 to obtain the following equation (25)
- Tdung +1 ' T Recipe' XM (L n ')-(2 6)
- the fourth adder 24 adds the prediction signal y n ′ obtained by the second predictor 25 to the inverse quantization value Q n 'To obtain the reproduction signal w n '. That is, the fourth adder 24 obtains the reproduction signal w n ′ based on the following equation (2 7).
- the obtained reproduced signal w n ′ is output from the ADPCM decoding device 2.
- w réelle' yn' + q n '-" (2 7)
- the second predictor 25 delays the reproduced signal w n ' by one sample time to obtain the next predicted signal y n + 1 '.
- the prediction signal y n + ⁇ is sent to the fourth adder 24.
- FIG. 2 shows an operation procedure of the ADPCM encoding apparatus 1.
- the prediction signal y n from the input signal chi eta is subtracted, the first prediction erroneous difference signal d n is determined (Step 1).
- step 2 it is determined whether the first prediction error signal dn is equal to or larger than 0 or smaller than 0 (step 2). If the first prediction error signal d n is 0 or more, by 1/2 of the quantization width T eta is added to the first prediction error signal d n, the second prediction error signal e n Is required (step 3).
- the second prediction error signal e n is obtained by subtracting ⁇ of the quantization width T n from the first prediction error signal d n. Request (Step 4).
- step 5 the equation (2 1) based on the coding and the above equation (2 3) to the inverse quantization based is performed (step 5). That is, the code L n and the inverse quantization value q n are obtained.o
- the quantization width Tn is updated based on the above equation (22) (step 6). Then, based on the above equation (24), a predicted signal yn + 1 for the next audio signal sampling value ⁇ + 1 is obtained (step 7).
- FIG. 3 shows an operation procedure of the AD PCM decoding device 2.
- the code L n ′ is read from the memory 3, and an inverse quantization value q n ′ is obtained based on the above equation (25) (step 11).
- FIGS. 4 and 5 show the inverse quantized value Q ⁇ obtained by the first adaptive inverse quantizer 15 of the ADPCM encoder 1 and the first prediction error signal d when the code L ⁇ is 3 bits. This shows the relationship with n .
- T in FIG. 4 and U in FIG. 5 indicate the quantization widths determined by the first quantization width updater 18 at different times.
- T ⁇ U it is assumed that T ⁇ U.
- the inverse quantization value Qn is 0 when the value of the first prediction error signal d n is in the range of (0.5 T, 0.5 ⁇ ), and the first prediction error signal d n If the value of n is [0. 5 T, 1. next T when in range of 5 T), a first prediction value of the error signal d n is [1. 5 T, 2. 2 T next when in a range of 5 T), the When the value of the prediction error signal d ⁇ of 1 is in the range of [2.5 T, ⁇ ], it becomes 3 T.
- the inverse quantization value q n is 1 T when the value of the first prediction error signal d n is in the range of (1-1.5 T, — 0.5 T].
- d value of n is (one 2 5 T, -. 1. one 2 T next when in a range of 5 T], the first prediction error signal d values force n (open one 3. 5 T, - 2 5 T] is _ 3 T, and [10, -3.5 T] is 14 T.
- the reference numeral L n increases, the quantization width T n is increased. That is, when the prediction error signal dn is small, the quantization width is reduced as shown in FIG. 4, and when the prediction error signal d is large, the quantization width is increased as shown in FIG.
- the quantization error is reduced when the prediction error signal d ⁇ is 0 as in the silent section of the audio signal. Also, when the abruptly changed to a smaller value from the absolute value is larger the value of the first prediction error signal d n is a large value corresponding to a large prediction error signal d n of quantization widths previous absolute value Although it is maintained, the quantization error can be reduced because the inverse quantization value q n can be set to 0. In other words, when the quantization width is a relatively large value U as shown in FIG. 5, if the absolute value of the prediction error signal dn rapidly decreases to a value close to 0, the inverse quantization value Since Q n becomes 0, the quantization error is reduced.
- FIG. 6 is a schematic diagram of an AD PCM encoder 101 and an AD PCM decoder 102. The schematic configuration is shown. Note that n used in the following description is an integer. First, the ADP CM encoding device 101 will be described.
- This ADP CM encoding device 101 includes first storage means 113.
- a conversion table as shown in Table 2 is stored in the first storage unit 113.
- Table 2 shows an example where the code L n is 4 bits.
- the translation table is first column region of the second prediction error signal e n is stored, the second column code L n are stored which correspond to the range of the second prediction error signal e n of the first column ,
- the third column and calculation formula of the unit quantization width T n + 1 corresponding to the code L n of the second column dequantized value Q n is stored corresponding to the code L n of the second column is stored It consists of four columns. Note that the unit quantization width is a value for determining the actual quantization width, and is not the actual quantization width itself.
- the conversion from the second prediction error signal e ⁇ to the code L n performed by the first adaptive quantizer 114 is performed by the first adaptive inverse quantizer 115.
- the conversion from the code L n to the inverse quantization value Q n and the update of the unit quantization width T n performed by the first quantization width updater 118 are stored in the first storage means 113 This is performed based on the above conversion table.
- First adder 1 1 1, AD P CM encoder 1 0 1 is human power in signal x "and prediction signal y n and the difference (hereinafter, the first prediction error signal d" hereinafter) to the following It is determined based on the equation (28).
- d x gag-y gag-(2 8)
- the signal generator 1 19 generates the first prediction error signal d ⁇ and the unit quantization width ⁇ ⁇ obtained by the first quantization width updater 1 18.
- the second adder 1 1 2 calculates the first prediction error signal d n and the correction signal a obtained by the signal generator 1 19.
- the first adaptive quantizer 1 1 4 uses the second prediction error signal e n obtained by the second adder 1 1 2
- the code L n is obtained based on the above conversion table. That is, the conversion of each code L n of the second column of the table, the first adaptive quantizer code L n corresponding to the second prediction error signal e "is read from the first storage unit 1 1 3 output from the 1 1 4. obtained code L n is sent to the memory 1 0 3.
- First adaptive inverse quantizer 1 1 based on a code L n obtained in the first adaptive quantizer 1 1 4 and converted Te one table, obtains the inverse quantization values Q n.
- the inverse quantization values q n corresponding to the code L "determined by the first adaptive quantizer 1 1 4 a first storage means 1 13 and output from the first adaptive inverse quantizer 1 15.
- the first quantization width updater 1 18 calculates the next quantization width based on the code L n obtained by the first adaptive quantizer 1 14, the current unit quantization width T n, and the conversion table. ⁇ ⁇ ⁇ Find ⁇ + 1 . That is, based on the fourth of the unit quantization width calculation formula column, the unit quantization width calculation formula corresponding to the code L n obtained in the first adaptive quantizer 1 1 4 of the conversion table, The next unit quantization width T n + 1 is obtained.
- the AD PCM decoding apparatus 102 will be described.
- This AD PCM decoding apparatus 102 includes a second storage means 122.
- a conversion table having the same contents as the conversion table stored in the first storage means 113 is stored.
- the second adaptive inverse quantizer 1 2 2 obtains an inverse quantization value q n ′ based on the code L n ′ obtained from the memory 103 and the conversion table. That is, of the inverse quantization values Q n in the third column of the conversion table, the code L n ′ obtained from the memory 103 corresponds to the inverse quantization value q n corresponding to the code L n in the second column. 'Is read from the second storage means 122 and output from the second adaptive inverse quantizer 122.
- the second quantization width updater 1 2 3 calculates the next unit quantization width ⁇ ⁇ based on the code L administrat'obtained from the memory 103, the current unit quantization width ⁇ ⁇ ', and the conversion table. + 1 'determined. that is, the fourth of the unit quantization width calculation formula of column memory 1 0 3 obtained code L n from the conversion table' based on the unit quantization width calculation formula corresponding to Then, the next unit quantization width T n + 1 'is obtained.
- the fourth adder 1 24 obtains a reproduction signal w n ′ based on the prediction signal y n ′ obtained by the second predictor 1 25 and the inverse quantization value Q n ′. That is, the fourth adder 124 obtains the reproduction signal w n ′ based on the following equation (33).
- the obtained reproduction signal w n ′ is output from the ADPCM decoding device 102.
- w réelle' yn' + qn '... (3 3)
- the second predictor 1 2 5 delays the reproduced signal w prepared′ by one sample time to obtain the next predicted signal y n + 1 ′, and sends this predicted signal y n + to the fourth adder 1 2 4 send.
- FIG. 7 shows an operation procedure of the ADPCM encoder 101.
- Step 2 the prediction signal y n from the human power signal chi eta is subtracted, the first prediction erroneous difference signal d n is determined (Step 2 1).
- step 22 it is determined whether the first prediction error signal is equal to or greater than d n ⁇ 0 or smaller than 0 (step 22). If the first prediction error signal d n is 0 or more, by 1/2 of the unit quantization width T n is added to the first prediction error signal d n, the second prediction error signal e n is determined (step 23).
- the second prediction error signal e n Is required (step 24).
- Step 2 5 coding and inverse quantization is performed (Step 2 5). That is, the code L n and the inverse quantization value q n are obtained.
- the unit quantization width Tn is updated based on the conversion table (step 2).
- FIG. 8 shows an operation procedure of the ADPCM decoding apparatus 102.
- Step 3 the inverse quantization values q n based on the conversion table' is determined (Step 3 1).
- reference numeral L n is 4 bits and AD P CM coding apparatus dequantized value q n provided by 1 0 first first adaptive inverse quantizer 1 1 5 when a first prediction error Shows the relationship between the signal d n.
- T is the first quantization width updater 1 at some point
- the unit quantization width determined by 18 is shown.
- the inverse quantization value Q n becomes 0 when the value of the first prediction error signal d n is in the range of (1 0.5 T, 0.5 T), and the value of the first prediction error signal d n Is [0.5 T, 1.
- the inverse quantization value Q n is such that the value of the first prediction error signal d n is [3.5 T, 5.5
- the inverse quantization value q n is calculated when the value of the first prediction error signal d n is in the range of [7.5 T, 10.5 T).
- the inverse quantization value Q n is 1 T when the value of the first prediction error signal d n is in the range of (—1.5 T, 0.5 T], and the first prediction error signal d n
- the value of n is in the range of (-2.5 T, -1.5 T]
- the value is 1 T
- the value of the first prediction error signal d n is (—3.5 T, —2.5 T]
- the value of the first prediction error signal d n becomes (14.5 T, -3.5 T] when the value of the first prediction error signal d n is in the range of ⁇ 4 T.
- the inverse quantized value Q n the first prediction error signal d values of n (one 6. 5 T, one 4.5 one 5. 5 T next when in a range of T], the first When the value of the prediction error signal d n is in the range of (—8.5 T, -6.5 T], it is _7.5 T.
- the inverse quantized value Q n is the first prediction When the value of the error signal d n is (1 11.5 T, 1 8.5 T] When the value is within the range, the value is 1 10 T, and when the value of the first prediction error signal d costumeis within the range of [10,-11.5 T], the value is _ 13 T.
- the unit quantization width T n increases. That is, when the prediction error signal d n is small, is rather small, the quantization width, the quantization width is rather large when a large prediction error signal d n.
- the quantization error is reduced when the prediction error signal d n is 0 as in a silent section of a speech signal.
- the value of the first prediction error signal d n is a large value corresponding to a large prediction error signal d n of quantization widths previous absolute value While maintaining, since the inverse quantization values Q n may be 0, quantization error can be reduced.
- the prediction error signal d at that time is determined.
- the quantization width was constant regardless of the absolute value of n .
- the absolute value of the prediction error signal d is relatively small, the actual quantization width is It is rather small, when the absolute value of the prediction error signal d n is relatively large, substantial quantization width is rather large.
- the quantization error when the absolute value of the prediction error signal d n is small can be further reduced as compared with the first embodiment. If the absolute value of the prediction error signal d n is small, if the voice is small is large, since the quantization error greatly affects the degradation of the reproduced sound, Kino quantized absolute value of the prediction error signal d n is small The ability to reduce errors is beneficial.
- the unit quantization width becomes a small value.
- the prediction error signal d n When the absolute value of is large, the substantial quantization width becomes larger than the unit quantization width, so that the quantization error can be reduced.
- the present invention is applied to the AD PCM.
- the input signal x n is The present invention can be applied to an AP CM that is used as it is.
- FIG. 10 shows a schematic configuration of the APCM encoding device 201 and the APCM decoding device 202. Note that n used in the following description is an integer. First, the APCM encoding device 201 will be described.
- the first adaptive quantizer 2 1 4 converts the modified input signal g n obtained by the first adder 2 12 and encoding based on the quantization width T n obtained by the first quantization width updater 2 1 8 obtains the sign-L n. That is, the first adaptive quantizer 2 1 4 on the basis of the following equation (3 7), we obtain the code L n. Code L n obtained is sent to the memory 2 0 3.
- Equation (3 7) the symbol [] is a Gaussian symbol, the maximum represents an integer of quantization width T eta not exceeding the number in the symbol The initial value is a positive number.
- First quantization width updater 2 1 on the basis of the following equation (3 8), determine the quantization width T eta + 1 for the next speech signals sampled-ring values chi eta + 1.
- the relationship between the sign L n and the function M (L n ) is as shown in Table 3.
- Table 3 shows an example in which the code L n is 4 bits.
- the second adaptive inverse quantizer 2 2 2 uses the code L n ′ obtained from the memory 203 and the quantization width T n ′ obtained by the second quantization width updater 2 23, and Based on (39), the reproduced signal w n ′ (inverse quantization value) is obtained.
- the obtained reproduced signal w n ′ is output from the AP CM decoding device 202.
- the second quantization width updater 2 2 3 is used for the next code L n + 1 ′ based on the following equation (4 0) using the code L ⁇ ′ obtained from the memory 203. Find the quantization width T n + 1 '.
- the relationship between the sign L n 'and the function M (L,') is the same as the relationship between the sign L n and the function M (L hinder) in Table 3.
- the third embodiment has based the modified human power signal g n, in a table stored in advance the relationship between the signal g n and code L n with code L n is obtained, and based on the obtained code L n and a table in which the relationship between the code L n and the unit quantization width ⁇ ⁇ + 1 for the next input signal ⁇ ⁇ +1 is stored in advance,
- the unit quantization width ⁇ + 1 for the next human power signal ⁇ + 1 may be obtained.
- the speech encoding method according to the present invention is suitable for use in speech encoding methods such as ADP CM and AP CM.
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
明 細 書 音声符号化方法
<技術分野 >
この発明は、 音声符号化方法に関し、 特に適応パルス符号変調 (AP CM : Ad aptive Pulse Code Modulation) 方法、 および適応差分パルス符号変調 (AD F CM: Adaptive Differential Pulse Code Modulation ) 方法の改良に関する。
ぐ背景技術 >
音声信号の符号化方式として、 適応パルス符号変調方法 (AP CM) 、 適応差 分パルス符号変調方法 (AD P CM) 等が知られている。
AD P CMは、 過去の入力信号から現在の入力信号を予測し、 その予測値と現 在の入力信号との差分を量子化した後、 符号化する方法である。 また、 ADP C Mでは、 量子化幅 (量子化ステップサイズ) が入力信号レベルの変動に応じて変 化せしめられる。
図 1 1は従来の AD P CM符号化装置 4および AD P CM復号化装置 5の概略 構成を示している。 なお、 以下の説明において用いられるる nは、 整数である。 まず、 AD P CM符号化装置 4について説明する。
第 1加算器 4 1は、 AD P CM符号化装置 4に入力された信号 χπ と予測信号 y との差分 (予測誤差信号 dn ) を、 次式 ( 1 ) に基づいて求める。
d = X - y„ … ( 1 ) 第 1適応量子化器 4 2は、 第 1加算器 4 1で求められた予測誤差信号 d n を、 量子化幅 Tn に基づいて符号化して符号 Ln を求める。 つまり、 第 1適応量子化 器 4 2は、 次式 ( 2 ) に基づいて、 符号 Ln を求める。 求められた符号 Ln はメ
モリ 6に送られる。
L„ d„ ZTn ] ( 2 ) 数式 (2 ) において、 記号 [ ] は、 ガウス記号であり、 その記号内の数を越 えない最大の整数を表す。 量子化幅 Τη の初期値は正の数である。
第 1量子化幅更新器 4 3は、 次式 ( 3 ) に基づいて、 次の音声信号サンプリ ン グ値 χη + 1 に対する量子化幅 Τη+1 を求める。 符号 Ln と関数 M (Ln ) との関 係は、 表 1に示す通りである。 表 1は、 符号 Ln が 4 ビッ 卜の場合の例を示して いる。
表 1
第 1適応逆量子化器 4 4は、 符号 Ln を用いて予測誤差信号 d„ を逆量子化し て、 逆量子化値 Qn を求める。 つまり、 第 1適応逆量子化器 4 4は、 次式 (4 ) に基づいて、 逆量子化値 qn を求める。
q„ = (L„ + 0. 5 ) X Tn - ( 4 ) 第 2加算器 4 5は、 今回の音声信号サンプリ ング値 x n に対する予測信号 y n と逆量子化値 Qn とに基づいて、 再生信号 wn を求める。 つまり、 第 2加算器 4 5は、 次式 ( 5 ) に基づいて、 再生信号 wn を求める。
W n = y n + q „ ··· ( 5 ) 第 1予測器 4 6は、 再生信号 wn を 1サンプル時間だけ遅延させることによつ て、 次の音声信号サンプリ ング値 χ η + 1 に対する予測信号 y n + 1 を求める。 次に、 AD P CM復号化装置 5について説明する。
第 2適応逆量子化器 5 1は、 メモリ 6から得られた符号 L n ' および第 2量子 化幅更新器 5 2によって得られた量子化幅 Tn ' を用い、 次式 ( 6 ) に基づいて 、 逆量子化値 qn ' を求める。 qn ' - (Ln ' + 0. 5) ΧΤ„ ' … ( 6 ) なお、 AD P CM符号化装置 4で求めた Ln が、 正しく AD P CM復号化装置 5に伝送されれば、 即ち Ln = L„ ' の場合には、 AD P CM復号化装置 5側で 用いられている qn ' 、 y n ' 、 Tn ' および wn ' は、 それぞれ AD P CM符 号化装置 4側で用いられている q n 、 y n 、 T„ および wn の値と等しく なる。 第 2量子化幅更新器 5 2は、 メモリ 6から得られた符号 L n ' を用い、 次式 ( 7 ) に基づいて、 次の符号 Ln+1 ' に対して用いられる量子化幅 Tn +】 ' を求め る。 次式 ( 7 ) における Ln ' と関数 M (L„ ' ) との関係は、 上記表 1の Ln と関数 M (L„ ) との関係と同じである。
第 3加算器 5 3は、 第 2予測器 5 4で得られた予測信号 y n ' と逆量子化値 Q „ ' とに基づいて、 再生信号 wn ' を求める。 つまり、 第 3加算器 5 3は、 次式 ( 8 ) に基づいて、 再生信号 wn ' を求める。 求められた再生信号 wn ' は、 A D P CM復号化装置 5から出力される。
W n = y n ' + q n ' … ( 8 ) 第 2予測器 5 4は、 再生信号 wn ' を 1サンプル時間だけ遅延させて次の予測 信号 y n + 1 ' を求め、 この予測信号 y n + を第 3加算器 5 3に送る。
図 1 2および図 1 3は、 符号 Ln が 3 ビッ トである場合における逆量子化値 Q n と予測誤差信号 d „ との関係を示している。
図 1 2の Tおよび図 1 3の Uは、 それぞれ異なる時点において、 第 1量子化幅 更新器 4 3によって決定された量子化幅を示している。 ここでは、 Tく Uである とする。
予測誤差信号 dn の範囲 A〜Bを A, Bで示す場合において、 その範囲に境界 Aを含む場合には" [ A" と表し、 境界 Aを含まない場合には" (A" と表すこ とにする。 同様に、 その範囲に境界 Bを含む場合には" B] " と表し、 境界 Bを 含まない場合には" B) " と表すことにする。
図 1 2では、 逆量子化値 Qn は、 予測誤差信号 dn の値が [0, T) の範囲に あるときは 0. 5 Tとなり、 予測誤差信号 d n の値が [ T, 2 T) の範囲にある ときは 1. 5 Tとなり、 予測誤差信号 dn の値が [ 2 Τ, 3 T) の範囲にあると きは 2. 5 Tとなり、 予測誤差信号 dn の値が [ 3 T, ∞] の範囲にあるときは 3. 5 Tとなる。
また、 逆量子化値 Qn は、 予測誤差信号 dn の値が [一 T, 0 ) の範囲にある ときは一 0. 5 Tとなり、 予測誤差信号 dn の値が [一 2 T, — T) の範囲にあ
るときは一 1. 5 Tとなり、 予測誤差信号 d n の値が [一 3 T, — 2 T) の範囲 にあるときは一 2. 5 Tとなり、 [―∞, — 3 T) の範囲にあるときは一 3. 5 Tとなる。
図 1 3の逆量子化値 Q n と予測誤差信号 d n との関係では、 図 1 2の Tが Uに 置き換えられた関係となっている。 図 1 2および図 1 3に示すように、 逆量子化 値 Q n と予測誤差信号 d n との関係は、 従来においては、 予測誤差信号 d n の正 の範囲と負の範囲とで、 特性が対称となるように決定される。 この結果、 予測誤 差信号 d n が小さい場合でも、 逆量子化値 Q n は 0 とはならなく なる。
数式 ( 3 ) および表 1から分かるように、 符号 L n が大き くなると、 量子化幅 Tn が大き く される。 つまり、 予測誤差信号 d n が小さいときには図 1 2に示す ように量子化幅が小さ く され、 予測誤差信号 d n が大きいときには図 1 3に示す ように量子化幅が大きく される。
音声信号では予測誤差信号 d n が 0 となる無音区間が多々存在するが、 上述の 従来技術では、 予測誤差信号 d n が 0である場合でも逆量子化値 Q n は 0. 5 T (または 0. 5 U) というように 0にはならないので、 量子化誤差が大き くなつ てしまう。
また、 上述の従来技術では、 予測誤差信号 d n の絶対値が大きい値から小さい 値に急激に変化しても、 量子化幅は前回の絶対値の大きい予測誤差信号 d n に応 じた大きな値を維持しているため、 量子化誤差が大き くなる。 つまり、 量子化幅 が図 1 3に示されているように比較的大きな値 Uであるときに、 予測誤差信号 d n の絶対値が 0に近い値まで急激に小さ くなつても、 逆量子化値 Qn は 0. 5 U と大きい値となってしまい、 量子化誤差が大き くなる。
さらに、 予測誤差信号 d n の絶対値が小さい値から大きい値に急激に変化して も、 量子化幅は前回の絶対値の小さい予測誤差信号 d n に応じた小さな値を維持 しているため、 量子化誤差が大きくなる。
このような問題は、 予測誤差信号 d n の代わりに入力信号をそのまま用いる A P CMにおいても、 同様に発生する。
この発明は、 予測誤差信号 d„ が 0である場合または入力信号が急激に変化し た場合に、 量子化誤差の低減化が図れる音声符号化方法を提供することを目的と する。 <発明の開示 >
この発明による第 1の音声符号化方法は、 入力信号 χπ と予測値 yn との差分 d„ を適応量子化して符号化する音声符号化方法において、 差分 dn の絶対値の 小さい区間に対する符号 Ln の逆量子化値 Q„ が略 0となるように、 適応量子化 を行うことを特徴とする。
この発明による第 2の音声符号化方法は、 入力信号 χπ と当該入力信号 χη に 対する予測値 yn との差分である第 1の予測誤差信号 d„ が 0以上の場合には、 第 1の予測誤差信号 dn に量子化幅 Tn の 1 / 2を加算して第 2の予測誤差信号 e„ を生成し、 第 1の予測誤差信号 d n が 0より小さい場合には、 第 1の予測誤 差信号 dn から量子化幅 Τπ の 1 Ζ2を減算して第 2の予測誤差信号 e π を生成 する第 1ステップ、 第 1ステップによって求めた第 2の予測誤差信号 e η と量子 化幅 Τπ とに基づいて符号 Ln を求める第 2ステップ、 第 2ステップによって求 めた符号 Ln に基づいて、 逆量子化値 QN を求める第 3ステップ、 第 2ステップ によって求めた符号 Ln に基づいて、 次の入力信号 χη + 1 に対する量子化幅 Τη + 1 を求める第 4ステップ、 および第 3ステップで求めた逆量子化値 q n と予測値 y n とに基づいて、 次の入力信号 χη+1 に対する予測値 yn + 1 を求める第 5ステ ップを備えていることを特徴とする。
ただし、 記号 [ ]は、 ガウス記号であり、 その記号内の数を越えない最大の整 数である。
上記第 3ステップでは、 たとえば、 次式 ( 1 0) に基づいて逆量子化値 Qn が 求められる。
Q„ = L„ x Tn - ( 1 0 ) 上記第 4ステップでは、 たとえば、 次式 ( 1 1 ) に基づいて量子化幅 Τη + 1 が 求められる。
T„ + 1 =T„ XM (Ln ) ··· ( 1 1 )
ただし、 M (Ln ) は、 Ln に応じて決まる値である。 上記第 5ステップでは、 たとえば、 次式 ( 1 2) に基づいて予測値 yn + 1 が求 められる。 y n+ i =y π + qn - ( 1 2 ) この発明による第 3の音声符号化方法は、 入力信号 χη と予測値 yn との差分 dn を適応量子化して符号化する音声符号化方法において、 差分 d„ の絶対値の 小さい区間に対する符号 L n の逆量子化値 が略 0となるように、 かつ差分 d n の絶対値の小さい区間に比べて、 差分 dn の絶対値の大きい区間に対する量子 化幅が大きくなるように、 適応量子化を行うことを特徴とする。
この発明による第 4の音声符号化方法は、 入力信号 χπ と当該入力信号 χπ に 対する予測値 yn との差分である第 1の予測誤差信号 dn が 0以上の場合には、 第 1の予測誤差信号 dn に単位量子化幅 Tn の 1ノ 2を加算して第 2の予測誤差 信号 e n を生成し、 第 1の予測誤差信号 d n が 0より小さい場合には、 第 1の予 測誤差信号 d n から単位量子化幅 Tn の 1 / 2を減算して第 2の予測誤差信号 e n を生成する第 1ステップ、 第 1ステツプによって求めた第 2の予測誤差信号 e
n と、 第 2の予測誤差信号 e n と符号 Ln との関係を予め記憶したテーブルとに 基づいて符号 Ln を求める第 2ステップ、 第 2ステップによって求めた符号 L n と、 符号 Ln と逆量子化値 Qn との関係を予め記憶したテーブルとに基づいて、 逆量子化値 Qn を求める第 3ステップ、 第 2ステップによって求めた符号 L n と 、 符号 Ln と次の人力信号 χη+1 に対する単位量子化幅 Τη+1 との関係を予め記 憶したテ一ブルとの関係とに基づいて、 次の人力信号 χη+1 に対する単位量子化 幅 Τη+1 を求める第 4ステップ、 および第 3ステップで求めた逆量子化値 Qn と 予測値 yn とに基づいて、 次の入力信号 χη+1 に対する予測値 yn+1 を求める第 5ステップを備えており、 上記各テーブルは、 以下の条件 ( a) 、 (b ) および ( c ) を満たすように作成されていることを特徴とする。
( a ) 差分 dn の絶対値が大きくなるように変化した際には、 単位量子化幅 T n が大きくなるように変化すること
(b ) 差分 dn の絶対値の小さい区間に対する符号 Ln の逆量子化値 qn が略 0となること
( c ) 差分 dn の絶対値の小さい区間に比べて、 差分 d„ の絶対値の大きい区 間に対する実質的な量子化幅が大きくなること
上記第 5ステップでは、 たとえば、 次式 ( 1 3 ) に基づいて予測値 yn+1 が求 められる。 y n+i =y n + qn - ( 1 3 ) この発明による第 5の音声符号化方法は、 入力信号 χη を適応量子化して符号 化する音声符号化方法において、 入力信号 χπ の絶対値の小さい区間に対する符 号 Ln の逆量子化値が略 0となるように、 適応量子化を行う ことを特徴とする。 この発明による第 6の音声符号化方法は、 入力信号 χη が 0以上の場合には、 入力信号 Χ η に量子化幅 Τη の 1 /2を加算して修正入力信号 g n を生成し、 入 力信号 χη が 0より小さい場合には、 人力信号 χη から量子化幅 Τη の 1 2を
減算して修正入力信号 gn を生成する第 1ステップ、 第 1ステップによって求め た修正人力信号 gn と量子化幅 Tn とに基づいて符号 Ln を求める第 2ステップ 、 第 2ステップによって求めた符号 L n に基づいて、 次の入力信号 X n+ 1 に対す る量子化幅 Τη + 1 を求める第 3ステップ、 および第 2ステップによって求めた符 号 Ln ' (=Ln ) に基づいて再生信号 wn ' を求める第 4ステップを備えてい ることを特徴とする。
上記第 2ステップでは、 たとえば、 次式 ( 1 4 ) に基づいて符号 Ln が求めら れる。 L„ =[ g„ /T„ ] - ( 1 4 )
ただし、 記号 [ ]は、 ガウス記号であり、 その記号内の数を越えない最大の整 数である。 上記第 3ステップでは、 たとえば、 次式 ( 1 5) に基づいて量子化幅 Τη + 1 が 求められる。
T„ + i =T„ XM (L„ ) - ( 1 5 )
ただし、 M (Ln ) は、 Ln に応じて決まる値である。 上記第 4ステップでは、 たとえば、 次式 ( 1 6) に基づいて再生信号 wn ' が 求められる。
この発明による第 7の音声符号化方法は、 入力信号 χη を適応量子化して符号 化する音声符号化方法において、 入力信号 χη の絶対値の小さい区間に対する符 号 Ln の逆量子化値 Qn が略 0となるように、 かつ人力信号 χη の絶対値の小さ
い区間に比べて、 入力信号 χη の絶対値の大きい区間に対する量子化幅が大き く なるように、 適応量子化を行うことを特徴とする。
この発明による第 8の音声符号化方法は、 人力信号 χη が 0以上の場合には、 入力信号 χη に単位量子化幅 Τπ の 1 /2を加算して修正入力信号 gn を生成し 、 入力信号 χη が 0より小さい場合には、 入力信号 χη から単位量子化幅 Τη の 1 /2を減算して修正入力信号 gn を生成する第 1ステップ、 第 1ステップによ つて求めた修正入力信号 gn と、 信号 gn と符号 Ln との関係を予め記憶したテ —ブルとに基づいて符号 L„ を求める第 2ステップ、 第 2ステップによって求め た符号 Ln と、 符号 Ln と次の入力信号 χη+1 に対する単位量子化幅 Τη+1 との 関係を予め記憶したテーブルとに基づいて、 次の入力信号 χη + 1 に対する単位量 子化幅 Τη + 1 を求める第 3ステップ、 および第 2ステップによって求めた符号 L n ' (=Ln ) と、 符号 Ln ' (=L„ ) と再生信号 wn ' との関係を記憶した テ一ブルとに基づいて再生信号 wn ' を求める第 4ステップを備えており、 上記 各テーブルは、 以下の条件 (a) 、 (b) および ( c) を満たすように作成され ていることを特徴とする。
(a) 入力信号 χη の絶対値が大きくなるように変化した際には、 単位量子化 幅 Τη が大き くなるように変化すること
(b ) 入力信号 χη の絶対値の小さい区間に対する符号 L η の逆量子化値が略 0となること
( c ) 入力信号 χη の絶対値の小さい区間に比べて、 入力信号 χη の絶対値の 大きい区間に対する実質的な量子化幅が大き くなること
<図面の簡単な説明 >
図 1は、 この発明の第 1の実施の形態を示すプロック図である。
図 2は、 図 1の AD P CM符号化装置の動作を示すフローチャー トである。 図 3は、 図 1の AD P CM復号化装置の動作を示すフローチヤ一 トである。 図 4は、 予測誤差信号 dn と逆量子化値 qn との関係を示すグラフである。
図 5は、 予測誤差信号 dn と逆量子化値 Qn との関係を示すグラフである。 図 6は、 この発明の第 2の実施の形態を示すプロック図である。
図 7は、 図 6の AD P CM符号化装置の動作を示すフローチヤ一トである。 図 8は、 図 6の AD P CM復号化装置の動作を示すフローチヤ一トである。 図 9は、 予測誤差信号 d„ と逆量子化値 Qn との関係を示すグラフである。 図 1 0は、 この発明の第 3の実施の形態を示すブロック図である。
図 1 1は、 従来例を示すブロック図である。
図 1 2は、 従来における予測誤差信号 dn と逆量子化値 qn との関係を示すグ ラフである。
図 1 3は、 従来における予測誤差信号 dn と逆量子化値 Qn との関係を示すグ ラフである。 ぐ発明を実施するための最良の形態〉
〔 1〕 第 1の実施の形態の説明
以下、 図 1〜図 5を参照して、 この発明の第 1の実施の形態について説明する 図 1は、 AD P CM符号化装置 1および AD P CM復号化装置 2の概略構成を 示している。 なお、 以下の説明において用いられる nは、 整数である。
まず、 AD P CM符号化装置 1について説明する。
第 1加算器 1 1は、 AD P CM符号化装置 1に入力された信号 χη と予測信号 y„ との差分 (以下、 第 1の予測誤差信号 dn という) を、 次式 ( 1 7 ) に基づ いて求める。
信号発生器 1 9は、 第 1の予測誤差信号 dn と第 1量子化幅更新器 1 8で得ら れた量子化幅 Τπ とに基づいて、 補正信号 a η を発生する。 つまり、 信号発生器
1 9は、 次式 ( 1 8 ) に基づいて、 補正信号 a n を発生する。 d n ≥ 0の場合: a π =Tn / 2
d η < 0の場合: a η = — Τη / 2 ( 1 8 ) 第 2加算器 1 2は、 第 1の予測誤差信号 d„ と信号発生器 1 9で得られた補正 信号 a n とに基づいて、 第 2の予測誤差信号 e n を求める。 つまり、 第 2加算器 1 2は、 次式 ( 1 9 ) に基づいて、 予測誤差信号 e n を求める。 d„ + a ( 1 9 ) したがって、 第 2の予測誤差信号 e n は、 次式 ( 2 0 ) で表される, d„ ≥ 0の場合: e n = d π +Tn / 2
d n < 0の場合: e n = dn - 1\ ノ2 ( 2 0 ) 第 1適応量子化器 1 4は、 第 2加算器 1 2で求められた第 2の予測誤差信号 e „ を、 第 1量子化幅更新器 1 8で得られた量子化幅 Tn に基づいて符号化して符 号 L η を求める。 つまり、 第 1適応量子化器 1 4は、 次式 ( 2 1 ) に基づいて、 符号 Ln を求める。 求められた符号 Ln はメモリ 3に送られる。
Ln =[ e n /T„ ] ( 2 1 ) 数式 (2 1 ) において、 記号 [ ] は、 ガウス記号であり、 その記号内の数を 越えない最大の整数を表す。 量子化幅 Τη の初期値は正の数である。
第 1量子化幅更新器 1 8は、 次式 ( 2 2 ) に基づいて、 次の音声信号サンプリ ング値 χη+Ι に対する量子化幅 Τη+1 を求める。 符号 Ln と関数 M (L„ ) との
関係は、 上記表 1の符号 L n と関数 M (Ln ) との関係と同じである。
Tn+ 1 M (Ln ) … ( 2 2 ) 第 1適応逆量子化器 1 5は、 次式 ( 2 3 ) に基づいて、 逆量子化値 q n を求め る。
第 3加算器 1 6は、 今回の音声信号サンプリ ング値 χη に対する予測信号 y n と逆量子化値 Q n とに基づいて、 再生信号 W n を求める。 つまり、 第 3加算器 1
6は、 次式 ( 2 4 ) に基づいて、 再生信号 wn を求める。 wn = y n + q η … ( 2 4 ) 第 1予測器 1 7は、 再生信号 wn を 1サンプル時間だけ遅延させることによつ て、 次の音声信号サンプリ ング値 χη+1 に対する予測信号 y n+1 を求める。 次に、 AD P CM復号化装置 2について説明する。
第 2適応逆量子化器 2 2は、 メモリ 3から得られた符号 Ln ' および第 2量子 化幅更新器 2 3によって得られた量子化幅 Tn ' を用い、 次式 ( 2 5 ) に基づい て、 逆量子化値 qn ' を求める。 q n ' = L„ ' x Τπ ' … ( 2 5 ) なお、 AD P CM符号化装置 1で求めた L n が、 正しく AD P CM復号化装置 2に伝送されれば、 即ち Ln = L„ ' の場合には、 AD P CM復号化装置 2側で
用いられている qn ' 、 yn ' 、 Tn ' および wn ' は、 それぞれ AD P CM符 号化装置 1側で用いられている Q n 、 y n 、 T n および W n の値と等しく なる。 第 2量子化幅更新器 2 3は、 メモリ 3から得られた符号 Ln ' を用い、 次式 ( 2 6 ) に基づいて、 次の符号 Ln+1 ' に対して用いられる量子化幅 Tn + 1 ' を求 める。 符号 L„ ' と関数 M (L„ ' ) との関係は、 上記表 1の符号 Ln と関数 M (L„ ) との関係と同じである。
T„+1 ' =T„ ' XM (Ln ' ) - ( 2 6) 第 4加算器 2 4は、 第 2予測器 2 5で得られた予測信号 yn ' と逆量子化値 Q n ' とに基づいて、 再生信号 wn ' を求める。 つまり、 第 4加算器 2 4は、 次式 (2 7 ) に基づいて、 再生信号 wn ' を求める。 求められた再生信号 wn ' は、 AD P CM復号化装置 2から出力される。 w„ ' = y n ' + q n ' -" ( 2 7 ) 第 2予測器 2 5は、 再生信号 wn ' を 1サンプル時間だけ遅延させて次の予測 信号 yn + 1 ' を求め、 この予測信号 yn +Γ を第 4加算器 2 4に送る。
図 2は、 上記 AD P CM符号化装置 1の動作手順を示している。
まず、 入力信号 χη から予測信号 yn が減算されることにより、 第 1の予測誤 差信号 dn が求められる (ステップ 1 ) 。
次に、 第 1の予測誤差信号 dn が、 0以上であるか、 0より小さいかが判別さ れる (ステップ 2 ) 。 第 1の予測誤差信号 dn が 0以上である場合には、 第 1の 予測誤差信号 dn に量子化幅 Τη の 1 /2が加算されることにより、 第 2の予測 誤差信号 e n が求められる (ステップ 3) 。
第 1の予測誤差信号 dn が 0より小さい場合には、 第 1の予測誤差信号 dn に 量子化幅 Tn の 1 /2が減算されることにより、 第 2の予測誤差信号 e n が求め
られる (ステップ 4 ) 。
ステップ 3またはステップ 4によって第 2の予測誤差信号 e n が求められると 、 上記数式 ( 2 1 ) に基づく符号化および上記数式 ( 2 3 ) に基づく逆量子化が 行われる (ステップ 5 ) 。 つまり、 符号 Ln および逆量子化値 qn が求められる o
次に、 上記数式 ( 2 2 ) に基づいて、 量子化幅 Tn が更新される (ステップ 6 ) 。 そして、 上記数式 ( 2 4) に基づいて、 次の音声信号サンプリ ング値 χη + 1 に対する予測信号 yn + 1 が求められる (ステップ 7 ) 。
図 3は、 上記 AD P CM復号化装置 2の動作手順を示している。
まず、 メモリ 3から符号 Ln ' が読み出され、 上記数式 ( 2 5 ) に基づいて逆 量子化値 qn ' が求められる (ステップ 1 1 ) 。
この後、 上記数式 (2 7 ) に基づいて、 次の予測信号 yn + 1 ' が求められる ( ステップ 1 2 ) 。
そして、 上記数式 ( 2 6 ) に基づいて、 次の符号 Ln + 1 ' に対して用いられる 量子化幅 Tn+1 ' が求められる (ステップ 1 3 ) 。
図 4および図 5は、 符号 L π が 3 ビッ トである場合における A D P C M符号化 装置 1の第 1適応逆量子化器 1 5によって得られる逆量子化値 Q π と第 1の予測 誤差信号 dn との関係を示している。
図 4の Tおよび図 5の Uは、 それぞれ異なる時点において、 第 1量子化幅更新 器 1 8によって決定された量子化幅を示している。 ここでは、 T<Uであるとす る。
第 1の予測誤差信号 dn の範囲 A〜Bを A, Bで示す場合において、 その範囲 に境界 Aを含む場合には" [ A" と表し、 境界 Aを含まない場合には" (A" と 表すことにする。 同様に、 その範囲に境界 Bを含む場合には" B] " と表し、 境 界 Bを含まない場合には" B) " と表すことにする。
図 4では、 逆量子化値 Qn は、 第 1の予測誤差信号 dn の値が (一 0. 5 T, 0. 5 Τ) の範囲にあるときは 0となり、 第 1の予測誤差信号 dn の値が [ 0.
5 T, 1. 5 T) の範囲にあるときは Tとなり、 第 1の予測誤差信号 d n の値が [ 1. 5 T, 2. 5 T) の範囲にあるときは 2 Tとなり、 第 1の予測誤差信号 d „ の値が [ 2. 5 T, ∞] の範囲にあるときは 3 Tとなる。
また、 逆量子化値 qn は、 第 1の予測誤差信号 d n の値が (一 1. 5 T, — 0 . 5 T] の範囲にあるときは一 Tとなり、 第 1の予測誤差信号 d n の値が (一 2 . 5 T, - 1. 5 T] の範囲にあるときは一 2 Tとなり、 第 1の予測誤差信号 d n の値力く (一 3. 5 T, - 2. 5 T] の範囲にあるときは _ 3 Tとなり、 [一∞ , - 3. 5 T] の範囲にあるときは一 4 Tとなる。
図 5の逆量子化値 Qn と第 1の予測誤差信号 c との関係では、 図 4の Tが U に置き換えられた関係となっている。
第 1の実施の形態においても、 上記数式 ( 2 2 ) および表 1から分かるように 、 符号 L n が大きくなると、 量子化幅 Tn が大きく される。 つまり、 予測誤差信 号 d n が小さいときには図 4に示すように量子化幅が小さ く され、 予測誤差信号 d が大きいときには図 5に示すように量子化幅が大きく される。
第 1の実施の形態によれば、 入力信号 χη と予測信号 y n との差である予測誤 差信号 dn が 0である場合には、 逆量子化値 qn が 0 となるので、 音声信号の無 音区間のように予測誤差信号 d π が 0である場合に量子化誤差が低減化される。 また、 第 1 の予測誤差信号 d n の絶対値が大きい値から小さい値に急激に変化 した場合には、 量子化幅は前回の絶対値の大きい予測誤差信号 d n に応じた大き な値を維持しているが、 逆量子化値 qn を 0 とすることができるので、 量子化誤 差が低減される。 つまり、 量子化幅が図 5に示されているように比較的大きな値 Uであるときに、 予測誤差信号 d n の絶対値が 0に近い値まで急激に小さ くなる と、 逆量子化値 Qn は 0 となるので量子化誤差が低減される。
〔 2〕 第 2の実施の形態の説明
以下、 図 6〜図 9を参照して、 この発明の第 2の実施の形態について説明する 図 6 は、 AD P CM符号化装置 1 0 1および AD P CM復号化装置 1 0 2の概
略構成を示している。 なお、 以下の説明において用いられる nは、 整数である。 まず、 A D P CM符号化装置 1 0 1 について説明する。
この A D P CM符号化装置 1 0 1 は、 第 1記憶手段 1 1 3を備えている。 第 1 記憶手段 1 1 3には、 表 2で示されているような変換テーブルが記憶されている 。 表 2 は、 符号 Ln が 4 ビッ トである場合の例を示している。 表 2
この変換テーブルは、 第 2の予測誤差信号 e n の範囲が記憶された第 1欄、 第 1欄の第 2の予測誤差信号 e n の範囲に対応する符号 Ln が記憶された第 2欄、
第 2欄の符号 Ln に対応する逆量子化値 Qn が記憶された第 3欄および第 2欄の 符号 Ln に対応する単位量子化幅 Tn+1 の算出式が記憶された第 4欄とからなる 。 なお、 単位量子化幅は実質的な量子化幅を決定するための値であり、 実質的な 量子化幅そのものではない。
この第 2の実施の形態では、 第 1適応量子化器 1 1 4で行なわれる第 2の予測 誤差信号 e„ から符号 Ln への変換、 第 1適応逆量子化器 1 1 5で行なわれる符 号 Ln から逆量子化値 Qn への変換および第 1量子化幅更新器 1 1 8で行われる 単位量子化幅 Tn の更新は、 第 1記憶手段 1 1 3に記憶されている上記変換テー ブルに基づいて行われる。
第 1加算器 1 1 1 は、 AD P CM符号化装置 1 0 1に人力された信号 x„ と予 測信号 yn との差分 (以下、 第 1の予測誤差信号 d„ という) を、 次式 ( 2 8 ) に基づいて求める。 d„ =x„ -y„ - ( 2 8 ) 信号発生器 1 1 9は、 第 1の予測誤差信号 d π と第 1量子化幅更新器 1 1 8で 得られた単位量子化幅 Τπ とに基づいて、 補正信号 a η を発生する。 つまり、 信 号発生器 1 1 9は、 次式 ( 2 9 ) に基づいて、 補正信号 a„ を発生する。 d η ≥ 0の場合 : a η =Τη / 2
dn < 0の場合 : an =— Tn Z2 - ( 2 9 ) 第 2加算器 1 1 2は、 第 1の予測誤差信号 dn と信号発生器 1 1 9で得られた 補正信号 a n とに基づいて、 第 2の予測誤差信号 e n を求める。 つまり、 第 2加 算器 1 1 2は、 次式 ( 3 0 ) に基づいて、 第 2の予測誤差信号 e n を求める。 e„ = d + a … ( 3 0 )
したがって、 第 2の予測誤差信号 e n は、 次式 ( 3 1 ) で表される。 d n ≥ 0の場合: e n = d n +Tn
d n < 0の場合: e n = d n — Tn ( 3 1 ) 第 1適応量子化器 1 1 4は、 第 2加算器 1 1 2で求められた第 2の予測誤差信 号 e n と上記変換テーブルとに基づいて、 符号 Ln を求める。 つまり、 変換テー ブルの第 2欄の各符号 Ln のうち、 第 2の予測誤差信号 e„ に対応する符号 Ln が第 1記憶手段 1 1 3から読み出されて第 1適応量子化器 1 1 4から出力される 。 得られた符号 Ln はメモリ 1 0 3に送られる。
第 1適応逆量子化器 1 1 5は、 第 1適応量子化器 1 1 4で求められた符号 L n と変換テ一ブルとに基づいて、 逆量子化値 Qn を求める。 つまり、 変換テーブル の第 3欄の各逆量子化値 qn のうち、 第 1適応量子化器 1 1 4で求められた符号 L„ に対応する逆量子化値 qn が第 1記憶手段 1 1 3から読み出されて第 1適応 逆量子化器 1 1 5から出力される。
第 1量子化幅更新器 1 1 8は、 第 1適応量子化器 1 1 4で求められた符号 Ln と今回の単位量子化幅 Tn と変換テーブルとに基づいて、 次回の量子化幅 Τη+ 1 を求める。 つまり、 変換テーブルの第 4欄の各単位量子化幅算出式のうちの、 第 1適応量子化器 1 1 4で求められた符号 Ln に対応する単位量子化幅算出式に基 づいて、 次回の単位量子化幅 Tn+1 が求められる。
第 3加算器 1 1 6は、 今回の音声信号サンプリ ング値 χη に対する予測信号 y n と逆量子化値 qn とに基づいて、 再生信号 wn を求める。 つまり、 第 3加算器 1 1 6は、 次式 ( 3 2) に基づいて、 再生信号 wn を求める。 w„ - y„ + q n - (3 2 ) 第 1予測器 1 1 7は、 再生信号 wn を 1サンプル時間だけ遅延させることによ
つて、 次の音声信号サンプリ ング値 xn+1 に対する予測信号 yn + 1 を求める。 次に、 AD P CM復号化装置 1 0 2について説明する。
この AD P CM復号化装置 1 0 2は、 第 2記憶手段 1 2 1を備えている。 第 2 記憶手段 1 2 1には、 上記第 1記憶手段 1 1 3に記憶されている変換テ一ブルと 同じ内容の変換テーブルが記憶されている。
第 2適応逆量子化器 1 2 2は、 メモリ 1 0 3から得られた符号 Ln ' と変換テ —ブルとに基づいて、 逆量子化値 qn ' を求める。 つまり、 変換テーブルの第 3 欄の各逆量子化値 Qn のうち、 メモリ 1 0 3から得られた符号 Ln ' が該当する 第 2欄の符号 Ln に対応する逆量子化値 qn ' が第 2記憶手段 1 2 1から読み出 されて第 2適応逆量子化器 1 2 2から出力される。
なお、 AD P CM符号化装置 1 0 1で求めた Ln が、 正しく AD P CM復号化 装置 1 0 2に伝送されれば、 即ち Ln -L„ ' の場合には、 AD P CM復号化装 置 1 0 2側で用いられている Qn ' 、 yn ' 、 Tn ' および wn ' は、 それぞれ AD P CM符号化装置 1 0 1側で用いられている Qn 、 y„ 、 Tn および wn の 値と等しく なる。
第 2量子化幅更新器 1 2 3は、 メモリ 1 0 3から得られた符号 L„ ' と今回の 単位量子化幅 Τπ ' と変換テーブルとに基づいて、 次回の単位量子化幅 Τη + 1 ' を求める。 つまり、 変換テーブルの第 4欄の各単位量子化幅算出式のうちの、 メ モリ 1 0 3から得られた符号 Ln ' に対応する単位量子化幅算出式に基づいて、 次回の単位量子化幅 Tn+1 ' が求められる。
第 4加算器 1 2 4は、 第 2予測器 1 2 5で得られた予測信号 yn ' と逆量子化 値 Q n ' とに基づいて、 再生信号 wn ' を求める。 つまり、 第 4加算器 1 2 4は 、 次式 (3 3 ) に基づいて、 再生信号 wn ' を求める。 求められた再生信号 wn ' は、 AD P CM復号化装置 1 0 2から出力される。 w„ ' = y n ' + q n ' … ( 3 3 )
第 2予測器 1 2 5は、 再生信号 w„ ' を 1サンプル時間だけ遅延させて次の予 測信号 yn+1 ' を求め、 この予測信号 yn + を第 4加算器 1 2 4に送る。
図 7は、 上記 A D P CM符号化装置 1 0 1の動作手順を示している。
まず、 人力信号 χη から予測信号 yn が減算されることにより、 第 1の予測誤 差信号 dn が求められる (ステップ 2 1 ) 。
次に、 第 1の予測誤差信号 d n カ^ 0以上であるか、 0より小さいかが判別さ れる (ステップ 2 2 ) 。 第 1の予測誤差信号 dn が 0以上である場合には、 第 1 の予測誤差信号 dn に単位量子化幅 Tn の 1 /2が加算されることにより、 第 2 の予測誤差信号 e n が求められる (ステップ 2 3 ) 。
第 1の予測誤差信号 d„ が 0より小さい場合には、 第 1の予測誤差信号 dn に 単位量子化幅 Tn の 1 /2が減算されることにより、 第 2の予測誤差信号 e n が 求められる (ステップ 2 4 ) 。
ステップ 2 3またはステップ 2 4によって第 2の予測誤差信号 e n が求められ ると、 変換テーブルに基づいて、 符号化および逆量子化が行われる (ステップ 2 5 ) 。 つまり、 符号 Ln および逆量子化値 qn が求められる。
次に、 変換テ一ブルに基づいて、 単位量子化幅 Tn が更新される (ステップ 2
6) 。 そして、 上記数式 ( 3 2 ) に基づいて、 次の音声信号サンプリ ング値 χη + 1 に対する予測信号 yn+1 が求められる (ステップ 2 7) 。
図 8は、 上記 AD P CM復号化装置 1 0 2の動作手順を示している。
まず、 メモリ 1 0 3から符号 Ln ' が読み出され、 変換テーブルに基づいて逆 量子化値 qn ' が求められる (ステップ 3 1 ) 。
この後、 上記数式 (3 3 ) に基づいて、 次の予測信号 yn+, ' が求められる ( ステップ 3 2 ) 。
そして、 変換テ一ブルに基づいて、 次の符号 Ln+1 ' に対して用いられる単位 量子化幅 Tn+1 ' が求められる (ステップ 3 3 ) 。
図 9は、 符号 Ln が 4 ビッ トである場合における AD P CM符号化装置 1 0 1 の第 1適応逆量子化器 1 1 5によって得られる逆量子化値 qn と第 1の予測誤差
信号 d n との関係を示している。 Tは、 ある時点において第 1量子化幅更新器 1
1 8によって決定された単位量子化幅を示している。
第 1の予測誤差信号 d n の範囲 A~Bを、 A, Bで示す際に、 その範囲に境界
Aを含む場合には" [ A" と表し、 境界 Aを含まない場合には" (A" と表すこ とにする。 同様に、 その範囲に境界 Bを含む場合には" B] " と表し、 境界 Bを 含まない場合には" B) " と表すことにする。
逆量子化値 Qn は、 第 1の予測誤差信号 d n の値が (一 0. 5 T, 0. 5 T) の範囲にあるときは 0 となり、 第 1の予測誤差信号 d n の値が [ 0. 5 T, 1.
5 T) の範囲にあるときは Tとなり、 第 1の予測誤差信号 d„ の値が [ 1. 5 T , 2. 5 T) の範囲にあるときは 2 Tとなり、 第 1の予測誤差信号 dn の値が [
2. 5 T, 3. 5 T) の範囲にあるときは 3 Tとなる。
また、 逆量子化値 Qn は、 第 1の予測誤差信号 dn の値が [ 3. 5 T, 5. 5
T) の範囲にあるときは 4. 5 Tとなり、 第 1の予測誤差信号 d n の値が [ 5.
5 T, 7. 5 T) の範囲にあるときは 6. 5 Tとなる。 また、 逆量子化値 qn は 、 第 1の予測誤差信号 d n の値が [ 7. 5 T, 1 0. 5 T) の範囲にあるときは
9 Tとなり、 第 1の予測誤差信号 dn の値が [ 1 0. 5 T, ∞] の範囲にあると きは 1 2 Tとなる。
さらに、 逆量子化値 Qn は、 第 1の予測誤差信号 dn の値が (— 1. 5 T, 0. 5 T] の範囲にあるときは一 Tとなり、 第 1の予測誤差信号 d n の値が (― 2. 5 T, - 1. 5 T] の範囲にあるときは一 2 Tとなり、 第 1の予測誤差信号 d n の値が (— 3. 5 T, — 2. 5 T] の範囲にあるときは— 3 Tとなり、 第 1 の予測誤差信号 dn の値が (一 4. 5 T, - 3. 5 T] の範囲にあるときは一 4 Tとなる。
また、 逆量子化値 Q n は、 第 1の予測誤差信号 d n の値が (一 6. 5 T, 一 4 . 5 T] の範囲にあるときは一 5. 5 Tとなり、 第 1の予測誤差信号 d n の値が (— 8. 5 T, - 6. 5 T] の範囲にあるときは _ 7. 5 Tとなる。 また、 逆量 子化値 Qn は、 第 1の予測誤差信号 d n の値が (一 1 1. 5 T, 一 8. 5 T] の
範囲にあるときは一 1 0 Tとなり、 第 1の予測誤差信号 d„ の値が [一∞, — 1 1 . 5 T ] の範囲にあるときは _ 1 3 Tとなる。
第 2の実施の形態においても、 表 2から分かるように、 符号 L n が大き くなる と、 単位量子化幅 T n が大きく される。 つまり、 予測誤差信号 d n が小さいとき には量子化幅が小さ く され、 予測誤差信号 d n が大きいときには量子化幅が大き く される。
また、 第 2の実施の形態においても、 第 1の実施の形態と同様に、 入力信号 X n と予測信号 y n との差である予測誤差信号 d n が 0である場合には、 逆量子化 値 q n が 0 となるので、 音声信号の無音区間のように予測誤差信号 d n が 0であ る場合に量子化誤差が低減化される。
また、 第 1の予測誤差信号 d n の絶対値が大きい値から小さい値に急激に変化 した場合には、 量子化幅は前回の絶対値の大きい予測誤差信号 d n に応じた大き な値を維持しているが、 逆量子化値 Q n を 0 とすることができるので、 量子化誤 差が低減化される。
ところで、 上記第 1の実施の形態では、 各時点での量子化幅が変化することは あっても、 ある時点で量子化幅が決定された場合には、 その時点での予測誤差信 号 d n の絶対値に係わらず量子化幅は一定であった。 ところが、 第 2の実施の形 態では、 ある時点で単位量子化幅 T n が決定された場合においても、 予測誤差信 号 d„ の絶対値が比較的小さいときには、 実質的な量子化幅は小さ く され、 予測 誤差信号 d n の絶対値が比較的大きいときには、 実質的な量子化幅は大き く され ている。
このため、 第 2の実施の形態では、 予測誤差信号 d n の絶対値が小さいときの 量子化誤差を第 1の実施の形態に比べてより低減できるという利点がある。 予測 誤差信号 d n の絶対値が小さい場合には、 音声が小さい場合が多く、 量子化誤差 が再生音声の劣化に大きく影響するので、 予測誤差信号 d n の絶対値が小さいと きの量子化誤差を低減できることは有益である。
一方、 予測誤差信号 d n の絶対値が大きい場合には、 音声が大きい場合が多く
、 量子化誤差が再生音声の劣化にあまり影響しないので、 第 2の実施の形態のよ うに、 予測誤差信号 d„ の絶対値が比較的大きいときに実質的な量子化幅を大き く しても、 そのためのデメ リ ッ トは少ない。
さらに、 予測誤差信号 d n の絶対値が小さい値から大きい値に急激に変化した 場合には、 単位量子化幅は小さい値となっているが、 第 2の実施の形態では予測 誤差信号 d n の絶対値が大きい場合には、 実質的な量子化幅が単位量子化幅より 大き く なるので、 量子化誤差を低減することができる。
上記第 1の実施の形態および第 2の実施の形態では、 AD P CMにこの発明を 適用した場合について説明したが、 AD P CMの第 1予測誤差信号 dn の代わり に入力信号 xn がそのまま用いられる A P CMにもこの発明を適用することがで きる。
〔 3〕 第 3の実施の形態の説明
以下、 図 1 0を参照して、 この発明の第 3の実施の形態について説明する。 図 1 0は、 AP CM符号化装置 2 0 1および A P CM復号化装置 2 0 2の概略 構成を示している。 なお、 以下の説明において用いられる nは、 整数である。 まず、 A P CM符号化装置 2 0 1 について説明する。
信号発生器 2 1 9 は、 AD P CM符号化装置 1 に入力された信号 xn と第 1量 子化幅更新器 2 1 8で得られた量子化幅 Tn とに基づいて、 補正信号 a η を発生 する。 つまり、 信号発生器 2 1 9は、 次式 ( 3 4 ) に基づいて、 補正信号 a η を 発生する。 η ≥ 0の場合 : a η =Τη Ζ 2
χη く 0の場合 : a n =_ Tn Z 2 "- ( 3 4 ) 第 1加算器 2 1 2は、 入力信号 χη と信号発生器 2 1 9で得られた補正信号 a n とに基づいて、 修正人力信号 gn を求める。 つまり、 第 1加算器 2 1 2 は、 次 式 ( 3 5 ) に基づいて、 修正入力信号 gn を求める。
x + a ( 3 5 ) したがって、 修正入力信号 gn は、 次式 ( 3 6 ) で表される。 d n ≥ 0の場合: gn =xn +Tn /2
d η < 0の場合: g η = X π — Τ η / 2 ( 3 6 ) 第 1適応量子化器 2 1 4は、 第 1加算器 2 1 2で求められた修正入力信号 g n を、 第 1量子化幅更新器 2 1 8で得られた量子化幅 Tn に基づいて符号化して符 号 Ln を求める。 つまり、 第 1適応量子化器 2 1 4は、 次式 ( 3 7 ) に基づいて 、 符号 Ln を求める。 求められた符号 Ln はメモリ 2 0 3に送られる。
L n g n /T„ ] - ( 3 7 ) 数式 ( 3 7 ) において、 記号 [ ] は、 ガウス記号であり、 その記号内の数を 越えない最大の整数を表す。 量子化幅 Τη の初期値は正の数である。
第 1量子化幅更新器 2 1 8は、 次式 ( 3 8 ) に基づいて、 次の音声信号サンプ リ ング値 χη+1 に対する量子化幅 Τη+1 を求める。 符号 Ln と関数 M (L n ) と の関係は、 表 3に示す通りである。 表 3は符号 Ln が 4 ビッ 卜の場合の例を示し ている。
Tn + i =T„ XM (Ln ) - ( 3 8 )
表 3
第 2適応逆量子化器 2 2 2は、 メモリ 2 0 3から得られた符号 L n ' および第 2量子化幅更新器 2 2 3によって得られた量子化幅 Tn ' を用い、 次式 ( 3 9 ) に基づいて、 再生信号 wn ' (逆量子化値) を求める。 求められた再生信号 wn ' は、 A P CM復号化装置 2 0 2から出力される。
第 2量子化幅更新器 2 2 3は、 メモリ 2 0 3から得られた符号 L η ' を用い、 次式 (4 0 ) に基づいて、 次の符号 Ln+1 ' に対して用いられる量子化幅 Tn+1 ' を求める。 符号 Ln ' と関数 M (L, ' ) との関係は、 表 3の符号 L n と関数 M (L„ ) との関係と同じである。
Tn+, ' =Τ„ ' XM ( L n ' ) ( 4 0 ) 第 3の実施の形態においては、 入力信号 x„ の絶対値の小さい区間に対する符
号 L„ の再生信号 (逆量子化値) wn ' が略 0となる。
なお、 上記第 3の実施の形態において、 上記第 2の実施の形態と同様に、 修正 人力信号 gn と、 信号 gn と符号 Ln との関係を予め記憶したテーブルとに基づ いて符号 Ln を求めるとともに、 求められた符号 Ln と、 符号 Ln と次の入力信 号 χη + 1 に対する単位量子化幅 Τη+1 との関係を予め記憶したテーブルとに基づ いて、 次の人力信号 χη+1 に対する単位量子化幅 Τη+1 を求めるようにしてもよ い。
この場合、 信号 gn と符号 Ln との関係および符号 Ln と次の入力信号 χη+1 に対する単位量子化幅 Τη+1 との関係を記憶したテーブルは、 下記の条件 (a) 、 (b) 、 ( c ) を満たすように作成される。
(a) 人力信号 χπ の絶対値が大き く なるように変化した際には、 単位量子化 幅 Τη が大き くなるように変化すること
(b) 入力信号 χη の絶対値の小さい区間に対する符号 Ln の再生信号 wn ' (逆量子化値) が略 0となること
( c ) 入力信号 χη の絶対値の小さい区間に比べて、 人力信号 の絶対値の 大きい区間に対する実質的な量子化幅が大き く なること ぐ産業上の利用可能性 >
この発明による音声符号化方法は、 ADP CM、 A P CM等の音声符号化方法 に用いるのに適している。
Claims
1. 入力信号 χη と予測値 yn との差分 dn を適応量子化して符号化する音声 符号化方法において、
差分 dn の絶対値の小さい区間に対する符号 L n の逆量子化値 q„ が略 0とな るように、 適応量子化を行うことを特徴とする音声符号化方法。
2. 人力信号 χη と当該入力信号 χη に対する予測値 yn との差分である第 1 の予測誤差信号 d„ が 0以上の場合には、 第 1の予測誤差信号 dn に量子化幅 T „ の 1 Z2を加算して第 2の予測誤差信号 e π を生成し、 第 1の予測誤差信号 d n が 0より小さい場合には、 第 1の予測誤差信号 d„ から量子化幅 Tn の 1 /2 を減算して第 2の予測誤差信号 e η を生成する第 1ステップ、
第 1ステップによって求めた第 2の予測誤差信号 e η と量子化幅 Τη とに基づ いて符号 Ln を求める第 2ステップ、
第 2ステップによって求めた符号 Ln に基づいて、 逆量子化値 Q N を求める第 3ステップ、
第 2ステップによって求めた符号 Ln に基づいて、 次の入力信号 χη+1 に対す る量子化幅 Τπ + 1 を求める第 4ステップ、 および
第 3ステップで求めた逆量子化値 Q η と予測値 yn とに基づいて、 次の入力信 号 χη+1 に対する予測値 yn + 1 を求める第 5ステップ、
を備えている音声符号化方法。
3. 上記第 2ステップでは、 下記の式に基づいて符号 L n が求められる請求項 2に記載の音声符号化方法。
L„ =[ e n /Tn ]
ただし、 記号 [ ]は、 ガウス記号であり、 その記号内の数を越えない最大 の整数である。
5. 上記第 4ステップでは、 下記の式に基づいて量子化幅 Tn+1 が求められる 請求項 2に記載の音声符号化方法。
ただし、 M (Ln ) は、 Ln に応じて決まる値である。
6. 上記第 5ステップでは、 下記の式に基づいて予測値 y n+1 が求められる請 求項 2に記載の音声符号化方法。
y n+i = y n + q n
7. 人力信号 x n と予測値 y n との差分 dn を適応量子化して符号化する音声 符号化方法において、
差分 dn の絶対値の小さい区間に対する符号 L n の逆量子化値 qn が略 0とな るように、 かつ差分 dn の絶対値の小さい区間に比べて、 差分 d n の絶対値の大 きい区間に対する量子化幅が大きくなるように、 適応量子化を行うことを特徴と する音声符号化方法。
8. 入力信号 χη と当該入力信号 χη に対する予測値 y n との差分である第 1 の予測誤差信号 dn が 0以上の場合には、 第 1の予測誤差信号 dn に単位量子化 幅 Tn の 1 / 2を加算して第 2の予測誤差信号 e η を生成し、 第 1の予測誤差信 号 dn が 0より小さい場合には、 第 1の予測誤差信号 d„ から単位量子化幅 Τη の 1 / 2を減算して第 2の予測誤差信号 e„ を生成する第 1 ステップ、
第 1 ステップによって求めた第 2の予測誤差信号 e n と、 第 2の予測誤差信号 e„ と符号 Ln との関係を予め記憶したテーブルとに基づいて符号 Ln を求める 第 2ステップ、
第 2ステップによって求めた符号 L n と、 符号 Ln と逆量子化値 Qn との関係 を予め記憶したテーブルとに基づいて、 逆量子化値 qn を求める第 3ステップ、 第 2ステップによって求めた符号 L n と、 符号 Ln と次の入力信号 χη + 1 に対 する単位量子化幅 Τ η+ との関係を予め記憶したテーブルとの関係とに基づいて 、 次の入力信号 χη+1 に対する単位量子化幅 Τη + 1 を求める第 4ステップ、 およ
び
第 3ステップで求めた逆量子化値 Q n と予測値 y n とに基づいて、 次の人力信 号 χη+1 に対する予測値 yn+1 を求める第 5ステップを備えており、
上記各テーブルは、 以下の条件 (a) 、 (b) および ( c) を満たすように作 成されている音声符号化方法。
(a) 差分 d„ の絶対値が大きくなるように変化した際には、 単位量子化幅 T n が大きくなるように変化すること
(b ) 差分 dn の絶対値の小さい区間に対する符号 Ln の逆量子化値 Qn が略 0 となること
(c) 差分 dn の絶対値の小さい区間に比べて、 差分 dn の絶対値の大きい区 間に対する実質的な量子化幅が大きく なること
9. 上記第 5ステップでは、 下記の式に基づいて予測値 y n+1 が求められる請 求項 8に記載の音声符号化方法。
y n+1 = y n + q n
1 0. 入力信号 xn を適応量子化して符号化する音声符号化方法において、 入力信号 χη の絶対値の小さい区間に対する符号 Ln の逆量子化値が略 0 とな るように、 適応量子化を行うことを特徴とする音声符号化方法。
1 1. 入力信号 χη が 0以上の場合には、 人力信号 χη に量子化幅 Τη の 1 Z 2を加算して修正入力信号 gn を生成し、 入力信号 χη が 0より小さい場合には 、 入力信号 χη から量子化幅 Τη の 1 / 2を減算して修正入力信号 gn を生成す る第 1 ステップ、
第 1 ステップによって求めた修正入力信号 g„ と量子化幅 Tn とに基づいて符 号 L η を求める第 2ステツプ、
第 2ステップによって求めた符号 Ln に基づいて、 次の入力信号 χη+1 に対す る量子化幅 Τη + 1 を求める第 3ステップ、 および
第 2ステップによって求めた符号 L n ' (-L„ ) に基づいて再生信号 wn ' を求める第 4ステツプ、
を備えている音声符号化方法。
1 2. 上記第 2ステップでは、 下記の式に基づいて符号 L n が求められる請求 項 1 1に記載の音声符号化方法。
L„ =[ gn ZTn ]
ただし、 記号 [ ]は、 ガウス記号であり、 その記号内の数を越えない最大 の整数である。
1 3. 上記第 3ステップでは、 下記の式に基づいて量子化幅 Τη + 1 が求められ る請求項 1 1に記載の音声符号化方法。
ただし、 M (Ln ) は、 Ln に応じて決まる値である。
1 4. 上記第 4ステップでは、 下記の式に基づいて再生信号 wn ' が求められ る請求項 1 1に記載の音声符号化方法。
1 5. 入力信号 χη を適応量子化して符号化する音声符号化方法において、 入力信号 χη の絶対値の小さい区間に対する符号 Ln の逆量子化値 qn が略 0 となるように、 かつ入力信号 χη の絶対値の小さい区間に比べて、 入力信号 χη の絶対値の大きい区間に対する量子化幅が大きくなるように、 適応量子化を行う ことを特徴とする音声符号化方法。
1 6. 入力信号 χη が 0以上の場合には、 入力信号 χη に単位量子化幅 Τη の 1 Ζ2を加算して修正入力信号 gn を生成し、 入力信号 χη が 0より小さい場合に は、 入力信号 χη から単位量子化幅 Τη の 1 / 2を減算して修正入力信号 g„ を 生成する第 1ステップ、
第 1ステップによって求めた修正人力信号 gn と、 信号 gn と符号 Ln との関 係を予め記憶したテーブルとに基づいて符号 Ln を求める第 2ステップ、 第 2ステップによって求めた符号 L n と、 符号 Ln と次の入力信号 xn + 1 に対 する単位量子化幅 Tn + 1 との関係を予め記憶したテーブルとに基づいて、 次の人 力信号 χη + 1 に対する単位量子化幅 Τη+1 を求める第 3ステップ、 および
第 2ステップによって求めた符号 L n ' (=Ln ) と、 符号 Ln ' (=Ln ) と再生信号 Wn ' との関係を記憶したテーブルとに基づいて再生信号 Wn ' を求 める第 4ステツプを備えており、
上記各テーブルは、 以下の条件 (a) 、 (b) および (c) を満たすように作 成されている音声符号化方法。
(a) 人力信号 χη の絶対値が大きく なるように変化した際には、 単位量子化 幅 Τη が大き くなるように変化すること
(b) 入力信号 χη の絶対値の小さい区間に対する符号 Ln の逆量子化値が略 0となること
( c ) 入力信号 χη の絶対値の小さい区間に比べて、 入力信号 χπ の絶対値の 大きい区間に対する実質的な量子化幅が大き く なること
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/367,229 US6366881B1 (en) | 1997-02-19 | 1998-02-18 | Voice encoding method |
CA002282278A CA2282278A1 (en) | 1997-02-19 | 1998-02-18 | Voice encoding method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9/35062 | 1997-02-19 | ||
JP09035062A JP3143406B2 (ja) | 1997-02-19 | 1997-02-19 | 音声符号化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO1998037636A1 true WO1998037636A1 (fr) | 1998-08-27 |
Family
ID=12431544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP1998/000674 WO1998037636A1 (fr) | 1997-02-19 | 1998-02-18 | Procede de codage de signaux vocaux |
Country Status (4)
Country | Link |
---|---|
US (1) | US6366881B1 (ja) |
JP (1) | JP3143406B2 (ja) |
CA (1) | CA2282278A1 (ja) |
WO (1) | WO1998037636A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
WO2004112256A1 (ja) | 2003-06-10 | 2004-12-23 | Fujitsu Limited | 音声符号化装置 |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
EP2383730B1 (en) | 2008-12-26 | 2017-02-22 | Kyushu Institute of Technology | Adaptive differential pulse code modulation encoding apparatus and decoding apparatus |
US9742434B1 (en) * | 2016-12-23 | 2017-08-22 | Mediatek Inc. | Data compression and de-compression method and data compressor and data de-compressor |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62194742A (ja) * | 1986-02-21 | 1987-08-27 | Hitachi Ltd | Adpcm符号化方式 |
JPS62213321A (ja) * | 1986-03-13 | 1987-09-19 | Fujitsu Ltd | 符号化装置 |
JPS6359024A (ja) * | 1986-08-28 | 1988-03-14 | Fujitsu Ltd | 適応量子化方式 |
JPS6410742A (en) * | 1987-07-02 | 1989-01-13 | Victor Company Of Japan | Digital signal transmission system |
JPH03177114A (ja) * | 1989-12-06 | 1991-08-01 | Fujitsu Ltd | Adpcm符号化方式 |
JPH04189032A (ja) * | 1990-11-22 | 1992-07-07 | Yamaha Corp | ディジタル・アナログ変換回路 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59178030A (ja) | 1983-03-28 | 1984-10-09 | Fujitsu Ltd | 適応型差分符号化方式 |
JPS59210723A (ja) | 1983-05-16 | 1984-11-29 | Nippon Telegr & Teleph Corp <Ntt> | 符号器 |
US4686512A (en) * | 1985-03-01 | 1987-08-11 | Kabushiki Kaisha Toshiba | Integrated digital circuit for processing speech signal |
JPH0828875B2 (ja) * | 1989-08-21 | 1996-03-21 | 三菱電機株式会社 | 符号化装置および復号化装置 |
-
1997
- 1997-02-19 JP JP09035062A patent/JP3143406B2/ja not_active Expired - Lifetime
-
1998
- 1998-02-18 CA CA002282278A patent/CA2282278A1/en not_active Abandoned
- 1998-02-18 US US09/367,229 patent/US6366881B1/en not_active Expired - Lifetime
- 1998-02-18 WO PCT/JP1998/000674 patent/WO1998037636A1/ja active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62194742A (ja) * | 1986-02-21 | 1987-08-27 | Hitachi Ltd | Adpcm符号化方式 |
JPS62213321A (ja) * | 1986-03-13 | 1987-09-19 | Fujitsu Ltd | 符号化装置 |
JPS6359024A (ja) * | 1986-08-28 | 1988-03-14 | Fujitsu Ltd | 適応量子化方式 |
JPS6410742A (en) * | 1987-07-02 | 1989-01-13 | Victor Company Of Japan | Digital signal transmission system |
JPH03177114A (ja) * | 1989-12-06 | 1991-08-01 | Fujitsu Ltd | Adpcm符号化方式 |
JPH04189032A (ja) * | 1990-11-22 | 1992-07-07 | Yamaha Corp | ディジタル・アナログ変換回路 |
Also Published As
Publication number | Publication date |
---|---|
CA2282278A1 (en) | 1998-08-27 |
JP3143406B2 (ja) | 2001-03-07 |
JPH10233696A (ja) | 1998-09-02 |
US6366881B1 (en) | 2002-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4761251B2 (ja) | 長期予測符号化方法、長期予測復号化方法、これら装置、及びそのプログラム | |
JP2002335161A (ja) | 信号処理装置及び方法、信号符号化装置及び方法、並びに信号復号装置及び方法 | |
WO1998037636A1 (fr) | Procede de codage de signaux vocaux | |
US7072830B2 (en) | Audio coder | |
EP1617417A1 (en) | Voice coding/decoding method and apparatus | |
JPH11184498A (ja) | 音声符号化/復号化方法 | |
US9990932B2 (en) | Processing in the encoded domain of an audio signal encoded by ADPCM coding | |
JP2008046405A (ja) | 適応差分パルス符号変調方式の符号化方法及び復号化方法 | |
JPH021661A (ja) | パケット補間方式 | |
JP3747357B2 (ja) | 楽音信号の符号化装置及び復号化装置 | |
JP3143359B2 (ja) | 音声符号化方法 | |
JPH08211900A (ja) | ディジタル音声圧縮方式 | |
JP2626236B2 (ja) | Adpcm復号器 | |
JP2848610B2 (ja) | 音声分析合成装置 | |
JP3183743B2 (ja) | 音声処理システムにおける線型予測分析方法 | |
JP2005316130A (ja) | 音声符号化装置および音声符号化方法 | |
JP4054919B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP3068688B2 (ja) | コード励振線形予測符号化方法 | |
JP3008668B2 (ja) | Adpcm復号器 | |
JP3200875B2 (ja) | Adpcm方式復号器 | |
JP2617207B2 (ja) | 適応型差分パルス符号変調符号化復号化装置 | |
JPH0535297A (ja) | 高能率符号化装置及び高能率符号復号化装置 | |
JPS63278422A (ja) | 適応差分パルス符号変調方式 | |
JPH043695B2 (ja) | ||
JPH04146500A (ja) | 音声符号化および復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AK | Designated states |
Kind code of ref document: A1 Designated state(s): CA KR US |
|
DFPE | Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101) | ||
WWE | Wipo information: entry into national phase |
Ref document number: 09367229 Country of ref document: US |
|
ENP | Entry into the national phase |
Ref document number: 2282278 Country of ref document: CA Ref country code: CA Ref document number: 2282278 Kind code of ref document: A Format of ref document f/p: F |