JPH0286231A - Voice prediction coder - Google Patents
Voice prediction coderInfo
- Publication number
- JPH0286231A JPH0286231A JP63236934A JP23693488A JPH0286231A JP H0286231 A JPH0286231 A JP H0286231A JP 63236934 A JP63236934 A JP 63236934A JP 23693488 A JP23693488 A JP 23693488A JP H0286231 A JPH0286231 A JP H0286231A
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- information
- signal
- linear prediction
- error correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012937 correction Methods 0.000 claims abstract description 19
- 230000015654 memory Effects 0.000 claims description 22
- 230000005540 biological transmission Effects 0.000 abstract description 12
- 238000005070 sampling Methods 0.000 abstract description 5
- 230000006866 deterioration Effects 0.000 abstract description 3
- 238000013139 quantization Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011548 physical evaluation Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Landscapes
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
【発明の詳細な説明】
産業上の利用分野
本発明:・土移動無線通信分野にひいて、伝送誤り率が
10=〜ICr“と非t< kζ悪い環境でも使用する
ことができる音声予測符号化装置、:・二関するもので
ある。DETAILED DESCRIPTION OF THE INVENTION Field of Industrial Application The present invention: - A voice prediction code that can be used even in a bad environment with a transmission error rate of 10=~ICr'' and a non-t<kζ, particularly in the field of land mobile radio communications. Converting device:・It is related to two things.
従来の技術
第2図(は、従来の音声予測符号化装置の一構成例を示
す概略ブロック図である。第2図において1は音声や制
御信号などが入力する信号入力端子、2は符号化された
信号な出力する符号化信号出力端子、3は入力信号を再
生した再生信号を出力する再生信号出力端子、10は入
力信号から後述する加算器22の予測値を差し引く差分
器、11は、差分器10からの信号に係数Gを乗算する
係数器、12ハ、係数器11からの信号を量子化する量
子化器、13は、量子化器12からのは号を符号化して
端子2に出力する符号器である。BACKGROUND ART FIG. 2 is a schematic block diagram showing an example of the configuration of a conventional speech predictive coding device. In FIG. 3 is a reproduced signal output terminal that outputs a reproduced signal obtained by reproducing the input signal; 10 is a difference device that subtracts a predicted value of an adder 22, which will be described later, from the input signal; 11 is a A coefficient unit 12 C multiplies the signal from the difference unit 10 by a coefficient G. A quantizer 13 quantizes the signal from the coefficient unit 11. This is an encoder that outputs.
14は、量子化器12からの信号て係数Gを乗算する係
数器、15は、係数器14からの信号と加算器22から
の信号な加算して端子3に出力する加算器、16.17
・・・18はそれぞれ、加算器15からの信号な1周期
毎に遅延するための遅延メモリ、19.20・・・21
はそれぞれ、遅延メモリ16.17・・・18からの信
号に係数α1、α2・・・αPを乗算する係数器であり
、加算器22は、係数器19.20・・・21からの信
号を加算した予測値を差分器10と加算器15に出力す
る。14 is a coefficient unit that multiplies the signal from the quantizer 12 by a coefficient G; 15 is an adder that adds the signal from the coefficient unit 14 and the signal from the adder 22, and outputs the result to terminal 3; 16.17
. . . 18 are delay memories for delaying the signal from the adder 15 every cycle, 19. 20 . . . 21
are coefficient units that multiply the signals from the delay memories 16, 17...18 by coefficients α1, α2...αP, and the adder 22 multiplies the signals from the coefficient units 19, 20...21. The added predicted value is output to the difference unit 10 and the adder 15.
次に上記従来の音声予測符号化装置の動作について説明
する。Next, the operation of the conventional speech predictive coding apparatus described above will be explained.
今、離散的な音声信号系列をXl(+=1.2・・・)
とし、x、の前向きの予測値をx、とすると、差分器1
0はXl とX、の差分を取り予測誤差E1を出力する
。係数器11は予測誤差E1のレベルを正規化するだめ
のもので、係数Gは、たとえばG=2°(n=0.1.
2.3.4・・・)のように定められる。Now, the discrete audio signal sequence is Xl (+=1.2...)
Let x be the forward predicted value of x, then the differentiator 1
0 takes the difference between Xl and X and outputs the prediction error E1. The coefficient unit 11 is for normalizing the level of the prediction error E1, and the coefficient G is, for example, G=2° (n=0.1.
2.3.4...).
量子化器12は正規化された信号G−Eiを2段階〜6
4段階に量子化するもので、量子化のステップサイズは
、レベル分布特性?考慮して量子化歪が最小となるよう
に決定される。The quantizer 12 converts the normalized signal G-Ei into stages 2 to 6.
It quantizes in 4 steps, and the quantization step size is a level distribution characteristic? It is determined so that the quantization distortion is minimized.
符号器13は量子化12で量子化された信号の量子化値
c−E’lt1ビット〜6ビノトに符号化するだめのも
のである。係数器14は量子化値G−E’1にGを乗算
し、もとのレベルEl 1に変換する。加算器15はこ
の信号E′iに予測値X、を加算して信号入力x、の近
似値x′1 を生成し、遅延メモリ16に送出する。近
似値嶋は次の標本化周期で、Xl、−1として予測値X
lの算出(C使用され、かつ遅延メモリ17に移送され
る。同様にして、第P周期後には近似値XI、−,−1
が遅延メモリ18に移送される。The encoder 13 is used to encode the signal quantized in the quantization step 12 into quantized values c-E'lt of 1 bit to 6 bits. The coefficient unit 14 multiplies the quantized value GE'1 by G and converts it to the original level El1. Adder 15 adds predicted value X to signal E'i to generate an approximate value x'1 of signal input x, and sends it to delay memory 16. The approximate value is the predicted value X at the next sampling period as Xl, -1
The calculation of l (C is used and transferred to the delay memory 17. Similarly, after the P period, the approximate value XI, -, -1
is transferred to delay memory 18.
予測値x、は、各遅延メモリの内容にそれぞれα1、α
2、・・・ α2の係数を乗じたものを総べて加算して
得られる。係数α1、α2、・・・、α、は線形予測係
数と呼ばれるもので、量子化誤差を無視して、xl=x
、とみなしたときに、予測誤差の自乗和pE+ が最
小となるように決定される。The predicted value x, is α1 and α for the contents of each delay memory, respectively.
2,... It is obtained by adding all the products multiplied by the coefficient of α2. The coefficients α1, α2, ..., α are called linear prediction coefficients, and ignoring quantization errors, xl=x
, the sum of squares of prediction errors pE+ is determined to be the minimum.
また、係数α・、α2、°°° α2は固定の値では
なく、lQms〜25m5ごとに更新されるものである
。Further, the coefficients α·, α2, and °°° α2 are not fixed values, but are updated every 1Qms to 25m5.
発明が解決しようとする課題
しかしながら、従来の音声予測符号化装置で符号化され
た信号は、復号化する際に予測残差信号の他に、線形予
測係数、振幅情報、エネルギ情報等のサイド情報を必要
とする。このため、例えばサンプリング周期5.4 K
Hzで、1サンプルあだり1ビツトで残差信号な符号
化した時のピノトレー1・ば6.4 Kbpsとはなら
ず、サイド情報と合わせて8KbpS程度となる。した
がって、8KbpSでのコーデックを構成する場合、誤
り率が10程度の誤りの多いところで了解性を確保する
ために必要な誤り訂正情報が付加できないという課題が
あった。Problems to be Solved by the Invention However, when decoding a signal encoded by a conventional speech predictive encoding device, in addition to the prediction residual signal, side information such as linear prediction coefficients, amplitude information, energy information, etc. Requires. For this reason, for example, the sampling period is 5.4 K.
When the residual signal is encoded with 1 bit per sample at Hz, Pinot Tray 1 does not achieve 6.4 Kbps, but together with side information, it becomes about 8 Kbps. Therefore, when configuring a codec for 8 KbpS, there is a problem that error correction information necessary to ensure intelligibility cannot be added in areas where there are many errors with an error rate of about 10.
また線形予測係数はサイド情報の低ビツト化のために4
次程度にしていた。このため従来の音声予測符号化装置
では伝送誤りが発生した場合、音韻性が著しく劣化する
という課題かあった。In addition, the linear prediction coefficient is set to 4 to reduce the bits of side information.
I kept it to about the same level. For this reason, in the conventional speech predictive coding apparatus, when a transmission error occurs, there is a problem in that the phonological properties are significantly deteriorated.
本発明はこのような従来の課題な解決するものでうり、
再生音声の劣化を最小限に押えながら、トータル伝送情
報量は増やさずに、誤り訂正情報を付加することができ
、10 〜10 程度の伝送誤りに対しても了解性が確
保できる優れた音声予測符号化装置を提供することを目
的とするものである。The present invention solves these conventional problems, and
Excellent speech prediction that can add error correction information without increasing the total amount of transmitted information while minimizing deterioration of reproduced speech, ensuring intelligibility even with transmission errors of about 10 to 10 The object of the present invention is to provide an encoding device.
課題な解決するだめの手段
本発明は上記課題を達成するために、量子化残差信号を
ダウンサンプリングするダウンサンプラと、前記のダウ
ンサンプラにより欠落したサンプルをダウンサンプリン
グ前の予測残差信号の自己相関係数あるいは実験的に定
めた補間係数により補間する補間器と、前記のダウンサ
ンプラで削減できた情報量を、サイド情報のうちのエネ
ルギ情報および1次と2次の線形予測係数に誤り訂正符
号を付加する誤り訂正符号付加器と2備え、さらに、了
解性を良くするために選択的に入力音声エネルギおよび
一次短期線形予測係数の値を用いて有声/無声の判定を
行ない実験的に求めた補間係数で補間を行なう遅延メモ
リ、係数器および加算器からなる回路とを備えたもので
ある。Means for Solving the Problems In order to achieve the above-mentioned problems, the present invention provides a downsampler that downsamples a quantized residual signal, and a sample that is omitted by the downsampler and a sample of the predicted residual signal before downsampling. An interpolator performs interpolation using a correlation coefficient or an experimentally determined interpolation coefficient, and the amount of information reduced by the down sampler is error-corrected into energy information of side information and first- and second-order linear prediction coefficients. In addition, in order to improve intelligibility, voiced/unvoiced judgment is determined experimentally by selectively using the input speech energy and the value of the first-order short-term linear prediction coefficient. The circuit includes a delay memory that performs interpolation using the calculated interpolation coefficients, a coefficient multiplier, and an adder.
作用
本発明は上記のように構成されているため次のような作
用を有する。すなわち、本発明に係る音声予測符号化装
置は了解性に寄与する線形予測次数を8以上とすること
ができ、かつ、サイド情報のうち最も重要なエネルギ情
報と、1次と2次の線形予測係数に誤り訂正符号を付加
することが可能となった。これにより、ビットレートな
増やすことなく、10 〜10 程度の伝送誤りが発生
する状態においても通話の了解性を確保することができ
る。Effects Since the present invention is configured as described above, it has the following effects. In other words, the speech predictive coding device according to the present invention can increase the linear prediction order contributing to intelligibility to 8 or more, and can encode the most important energy information among the side information and the first-order and second-order linear predictions. It is now possible to add error correction codes to coefficients. As a result, it is possible to ensure the intelligibility of a call even in a state where about 10 to 10 transmission errors occur without increasing the bit rate.
実施例
第1図は、本発明に係る音声予測符号化装置の一実施例
を示すブロック図である。Embodiment FIG. 1 is a block diagram showing an embodiment of a speech predictive coding apparatus according to the present invention.
第」図中、30は音声や制御信号などが入力する信号入
力端子、31はサイド情報、線形予測情報を分析し分岐
する線形予測分析器、32は入力信号から後述する加算
器52の予測値を差し引く差分器、33は、差分器32
からの信号に係数Gを乗算する係数器、34は、係数器
33かもの信号を量子化する量子化器、35は、量子化
器34からの信号を複数回(=Q)に1回の割合でサン
プルするダウンサンプラ、36は、ダウンサンプラ35
からの信号を符号化し、量子化残差信号を端子57に出
力する符号器である。In the figure, 30 is a signal input terminal into which audio, control signals, etc. are input, 31 is a linear prediction analyzer that analyzes and branches side information and linear prediction information, and 32 is a predicted value of an adder 52, which will be described later, from the input signal. The subtraction device 33 is the subtraction device 32
34 is a quantizer that quantizes the signal from the coefficient multiplier 33. 35 is a quantizer that multiplies the signal from the quantizer 34 by a coefficient G. 35 is a quantizer that multiplies the signal from the quantizer 34 by a coefficient G. Down sampler 36 samples by percentage, down sampler 35
This is an encoder that encodes a signal from the terminal 57 and outputs a quantized residual signal to a terminal 57.
37.38・・・39はそれぞれ、ダウンサンプラ35
からの信号を1周期毎に遅延するための遅延メモリ、4
0.41・・・42はそれぞれ、遅延メモリ37.38
・・・39により遅延された信号に係数β1、β2・・
・βP を乗算する係数器、43は、係数器40.41
・・・42からの信号を加算する加算器、44は、ダウ
ンサンプラ35と連動し、ダウンサンプラ35からの信
号と加算器43からの信号を選択的に出力する補間スイ
ッチであり、これら遅延メモリ37.38・・・39と
、係数器40.41・・・42と、加算器43と補間ス
イッチ44が、ダウンサンプラ35により欠落したサン
プルを補間する補間器55な構成している。37, 38...39 are down samplers 35, respectively.
a delay memory for delaying the signal from 4 for each period;
0.41...42 are respectively delay memories 37.38
Coefficients β1, β2, etc. are added to the signal delayed by 39.
・Coefficient unit 43 for multiplying βP is coefficient unit 40.41
The adder 44 which adds the signals from 42 is an interpolation switch which works in conjunction with the down sampler 35 and selectively outputs the signal from the down sampler 35 and the signal from the adder 43. 37, 38, . . . , 39, coefficient units 40, 41, .
53は補間スイッチ44からの信号に係数G を乗算す
る係数器、45は、係数器53からの信号と加算器52
からの信号を加算して端子58に出力する加算器、46
.47・・・48はそれぞれ、加算器45からの信号を
1周期毎に遅延するだめの遅延メモリ、49.50・・
・51はそれぞれ、遅延メモリ46.47・・・48か
らの信号に係数α1、α2・・・αPを乗算する係数器
であり、加算器52は、係数器49.50・・・51か
らの信号を加算した予測値を差分器32と加算器45に
出力する。53 is a coefficient multiplier that multiplies the signal from the interpolation switch 44 by a coefficient G; 45 is a signal from the coefficient multiplier 53 and an adder 52;
an adder 46 that adds the signals from and outputs it to a terminal 58;
.. 47...48 are delay memories for delaying the signal from the adder 45 every cycle, 49, 50...
- 51 are coefficient multipliers that multiply the signals from the delay memories 46, 47...48 by coefficients α1, α2...αP, and the adder 52 multiplies the signals from the coefficient multipliers 49, 50...51. A predicted value obtained by adding the signals is output to the difference unit 32 and the adder 45.
54は、ダウンサンプラ35により削減された情報に代
えて、サイド情報のエネルギ情報と1次、2次の線形予
測係数に誤り訂正符号を付加し、端子56に出力する誤
り訂正符号付加回路である。54 is an error correction code addition circuit that adds an error correction code to the energy information of the side information and the first-order and second-order linear prediction coefficients in place of the information reduced by the down sampler 35, and outputs the error correction code to the terminal 56. .
次に、本発明の一実施例の動作について説明する。予測
誤差信号Eiは次式で求められる。Next, the operation of one embodiment of the present invention will be explained. The prediction error signal Ei is obtained by the following equation.
ただし、Xiは入力信号、X’+ −Hは補間信号であ
る。However, Xi is an input signal and X'+ -H is an interpolation signal.
係数器33はこの予測誤差信号Eiに係数Gを乗算し、
その後量子化器34はこのG−Eiを量子化しG−E’
iとする。ダウンサンプラ35は滑子化予測誤差信号G
−E’iを1/Qにダウンサンプルする。The coefficient unit 33 multiplies this prediction error signal Ei by a coefficient G,
After that, the quantizer 34 quantizes this G-Ei and G-E'
Let it be i. The down sampler 35 generates a smoothed prediction error signal G.
- Downsample E'i to 1/Q.
したがって、符号器36はQ回に1回の割合で1/Qに
ダウンサンプルされた量子化予測残差信号G−E’iを
符号化する。このため、量子化残差符号出力端子57に
出力される量子化予測残差信号G・E′1を符号化した
量子化予測残差符号化信号は、従来の音声予測符号化信
号にくらべて、1/Qに圧縮された信号となる。Therefore, the encoder 36 encodes the quantized prediction residual signal GE'i that has been downsampled to 1/Q once every Q times. Therefore, the quantized predictive residual encoded signal obtained by encoding the quantized predictive residual signal G·E'1 output to the quantized residual code output terminal 57 is different from the conventional speech predictive encoded signal. , the signal is compressed to 1/Q.
1方、ダウンプラ35は符号器36に量子化予測残差信
号G−E″1を送出すると同時に、遅延メモリ37に1
/Qに圧縮した量子化予測残差信号G−E″1を送出す
る。今、1/Qを1/4とすると、遅延メモリ37では
4サンプル中3サンプルの情報が欠落することになる。On the other hand, the downpla 35 sends the quantized predicted residual signal G-E''1 to the encoder 36, and at the same time sends the quantized predicted residual signal G-E''1 to the delay memory 37.
The quantized predicted residual signal GE''1 compressed to /Q is sent out. If 1/Q is now 1/4, the delay memory 37 will lose information on 3 out of 4 samples.
ここで、ダウンサンプラ35が遅延メモリ37に量子化
予測残差信号G−E’iを送出しないサンプルポイント
(ダウンサンプラ35と補間スイッチ44のスイッチが
下方に接続されている時)では、遅延メモリ37から遅
延メモリ39のメモリ内容は順次シフトされる。このと
き、遅延メモリ37から遅延メモリ39には、順次「0
」が格納されて行く。Here, at the sample point where the down sampler 35 does not send the quantized predicted residual signal G-E'i to the delay memory 37 (when the down sampler 35 and the interpolation switch 44 are connected downward), the delay memory From 37 onwards, the memory contents of delay memory 39 are shifted sequentially. At this time, "0" is sequentially stored from the delay memory 37 to the delay memory 39.
' will be stored.
補間器55は、ダウンサンプラ35で欠落した信号を下
記(2)式のように補間して量子化予測残差信号G−E
’iの近似値G−E”iを出力する。The interpolator 55 interpolates the signal missing by the down sampler 35 as shown in equation (2) below to obtain a quantized predicted residual signal GE.
Output the approximate value G−E”i of 'i.
G−E”1=ぢβに−E’+−K ・・・・・
・(2)K=Q
ただし、βo=1
ここで、補間のための係数βにとして、まず、ダウンサ
ンプル前の残差信号の自己相関係数を用いる方法がある
。すなわち、処理フレームごとに量子化前の残差信号の
自己相関係数な計算し、補間係数β1には1次の相関係
数、β2には2次の相関係数、βKにはに次の相関係数
を用いる方法である。この方法では処理フレームごとに
補間係数な伝送する必要があり、サイド情報の増加につ
ながる。したがって、低ビツト伝送を目的とする場合に
は次に述べる全フレームに共通な補間係数βKを用いる
。他方、補間のだめの係数βにとして全フレームに共通
な補間係数βに?聴感評価あるいはS N Rseg等
の物理評価により求める方法がちり、この場合は実験的
に得られた最もよい評価値な使用する。G-E"1 = ぢβ-E'+-K...
-(2) K=Q However, βo=1 Here, first, there is a method of using the autocorrelation coefficient of the residual signal before downsampling as the coefficient β for interpolation. That is, the autocorrelation coefficient of the residual signal before quantization is calculated for each processing frame, and the interpolation coefficient β1 is a first-order correlation coefficient, β2 is a second-order correlation coefficient, and βK is a second-order correlation coefficient. This method uses correlation coefficients. This method requires interpolation coefficients to be transmitted for each processing frame, leading to an increase in side information. Therefore, when the purpose is low bit transmission, an interpolation coefficient βK common to all frames, which will be described below, is used. On the other hand, what about the interpolation coefficient β that is common to all frames? The method of determining the value using auditory evaluation or physical evaluation such as SNRseg is insufficient, and in this case, the best evaluation value obtained experimentally is used.
また、本発明では予測誤差信号は有声部と無声部とでは
異なるという事実に基づき、入力音声エネルギおよび一
次短期線形予測係数の値を用いて有声/無声の判定を行
ない、この有声部と無声部の区間で異なる補間係数の選
択を行なうようにしている。Furthermore, in the present invention, based on the fact that the prediction error signal is different between voiced parts and unvoiced parts, voiced/unvoiced judgment is performed using the input audio energy and the value of the first-order short-term linear prediction coefficient, and the voiced parts and unvoiced parts are Different interpolation coefficients are selected in the interval.
以上説明したように、量子化予測残差信号のダウンサン
プリングによって余分の情報量を確保できる。例えば5
.4 KHzのサンプリングを1/3でダウンサンプリ
ングすれば、4.2 KHz分の情報量が削減される。As explained above, an extra amount of information can be secured by downsampling the quantized predicted residual signal. For example 5
.. If 4 KHz sampling is downsampled by 1/3, the amount of information will be reduced by 4.2 KHz.
したがって、誤り訂正符号付加器54はこの削減した情
報量?サイド情報の誤り訂正符号として利用できる。Therefore, the error correction code adder 54 uses this reduced amount of information? It can be used as an error correction code for side information.
ここで、サイド情報にはエネルギ符号化値、線形予測係
数などの要素があるが、この中でどの要素が誤りの影響
を受けやすいかを評価した結果、エネルギ情報および1
次と2次の線形予測係数が誤って伝送される場合に有色
雑音が発生し、了解性が著しく劣化することが分かった
。一方、予測係数の3次以降の係数が誤って伝送されて
もあまり大きな劣化はなかった。Here, side information includes elements such as energy encoded values and linear prediction coefficients, but as a result of evaluating which elements among these are likely to be affected by errors, we found that the energy information and
It has been found that when the next and second-order linear prediction coefficients are erroneously transmitted, colored noise is generated and intelligibility is significantly degraded. On the other hand, even if third-order and subsequent coefficients of the prediction coefficients were erroneously transmitted, there was no significant deterioration.
以上の結果から、本発明では効率的に誤り訂正?するた
めに、サイド情報のうちエネルギ情報、および1次と2
次の線形予測係数に対し誤り訂正符号な付加する。From the above results, does the present invention efficiently correct errors? In order to
Add an error correction code to the next linear prediction coefficient.
一方、線形予測係数α1、α2、・・・αPは従来サイ
ド情報を低減するために4次程度とされていた。On the other hand, the linear prediction coefficients α1, α2, .
しかし、4次程度の次数では伝送中に誤ゆが発生した場
合は、例えば、(mj)が〔n」〕に異聴するなど、音
韻性が著しく劣化する。本来、音韻性を正しく再現する
ためには音声スペクトルな正しく伝送する必要がある。However, if an error occurs during transmission at an order of around 4th order, the phonology will deteriorate significantly, for example, (mj) will sound strange to [n'']. Essentially, in order to correctly reproduce phonology, it is necessary to correctly transmit the speech spectrum.
このためには、予測係数は8次以上とすべきである。For this purpose, the prediction coefficient should be of order 8 or higher.
本発明では、線形予測係数な十分高くして、かつ、伝送
誤りが発生した場合でも線形予測係数をできるだけ正し
く伝送出来るようにして音韻性の再現性を向上するよう
にしている。In the present invention, the linear prediction coefficient is made sufficiently high, and even if a transmission error occurs, the linear prediction coefficient is transmitted as accurately as possible in order to improve the reproducibility of phonology.
以上のように、上記実施例では量子化予測残差信号をダ
ウンサンプリングし、欠落したサンプルはダウンサンプ
リング前の予測残差信号の自己相関係数あるいは実験的
に定めだ補間係数により補間するようにしダウンサンプ
リングで削減できた情報量をサイド情報のうちのエネル
ギ情報と、1次と2次の線形予測係数に誤り訂正符号な
付加している。また、音韻の再現性を向上させるだめに
線形予測係数は8次以上としている。As described above, in the above embodiment, the quantized predicted residual signal is downsampled, and the missing samples are interpolated using the autocorrelation coefficient of the predicted residual signal before downsampling or the experimentally determined interpolation coefficient. The amount of information reduced by downsampling is added to the energy information of the side information and to the first- and second-order linear prediction coefficients as an error correction code. Furthermore, in order to improve the reproducibility of phonemes, the linear prediction coefficient is set to 8th order or higher.
したがって、本発明ではトータルの伝送ビットレートは
増−やすことなく、誤り訂正符号な付加することにより
、誤り率が10〜10 程度と非常に悪い状態でも了
解性の良い再士音声を得ることかできる。Therefore, in the present invention, by adding an error correction code without increasing the total transmission bit rate, it is possible to obtain reciprocated speech with good intelligibility even under very poor conditions with an error rate of about 10 to 10. can.
発明の効果
本発明は上記実施例より明らかなように、量子化残差信
号なダウンサンプリングし、欠落したサンプルはダウン
サンプリング前の予測残差信号の自己相関係数により補
間すると共に、入力音声エネルギおよび一次短期線形予
測係数の値を用いて有声/無声の判定をし実験的に求め
だ補間係数で補間を行ない、トータルの伝送ピットレー
トを増やすことなく、誤り訂正符号な付加でき、さらに
線形予測係数を8次以上とできるため、誤り率が10〜
10程度と非譜ζ悪い状態でも了解性の良い再生音声を
得・5ことができる効果を有する。Effects of the Invention As is clear from the above embodiments, the present invention downsamples the quantized residual signal, interpolates missing samples using the autocorrelation coefficient of the predicted residual signal before downsampling, and Voiced/unvoiced judgment is performed using the first-order short-term linear prediction coefficient value, and interpolation is performed using an experimentally determined interpolation coefficient. Error correction codes can be added without increasing the total transmission pit rate, and linear prediction can be performed. Since the coefficients can be of 8th order or higher, the error rate is 10~
It has the effect of being able to obtain playback audio with good intelligibility even in poor conditions with a score of about 10.
第1図は1本発明に係る音声予測符号化装置の−実楕例
・ビ示す概略ブロック図、第2図は、従来の音声予測符
号化装置?示す概略プコノク図である。
30・・信号入力端子、31・・・線形予測分析器、3
2・・差分器、33・・係・数器、34・・量子化器、
35・・・ダウンサンプラ、36・・・符号器、37.
38.39・・・遅延メモリ、40、41.4.2・・
補間係数器、43・・・加算器、44・・・補間スイッ
チ、45・・・加算器、46.47.48・・・遅延メ
モリ、49、50.51・・線形予測係数器、52・・
・加算器、53・・・係数器、54・・誤り訂正符号付
加器、55・・・補間器、56・・誤り訂正符号付加情
報出力端子、57・・・量子化残差符号出力端子、58
・・・再生信号出力端子。FIG. 1 is a schematic block diagram showing an actual example of a speech predictive coding device according to the present invention, and FIG. 2 is a schematic block diagram showing a conventional speech predictive coding device. FIG. 30...Signal input terminal, 31...Linear prediction analyzer, 3
2... Differential unit, 33... Coefficient/number unit, 34... Quantizer,
35... Down sampler, 36... Encoder, 37.
38.39...delay memory, 40, 41.4.2...
Interpolation coefficient unit, 43...Adder, 44...Interpolation switch, 45...Adder, 46.47.48...Delay memory, 49, 50.51...Linear prediction coefficient unit, 52...・
- Adder, 53... Coefficient unit, 54... Error correction code adder, 55... Interpolator, 56... Error correction code additional information output terminal, 57... Quantization residual code output terminal, 58
...Reproduction signal output terminal.
Claims (2)
予測分析器と、予測誤差信号を求める差分器と、前記予
測誤差信号を量子化する量子化器と、前記量子化器で量
子化された量子化残差信号をダウンサンプリングするダ
ウンサンプラと、前記ダウンサンプラにより欠落したサ
ンプルをダウンサンプリング前の予測残差信号の自己相
関係数あるいは実験的に定めた補間係数により補間する
補間器と、前記のダウンサンプラで削減できた情報量に
代えて、サイド情報のうちのエネルギ情報および1次と
2次の線形予測係数に誤り訂正符号を付加する誤り訂正
符号付加器とを備えたことを特徴とする音声予測符号化
装置。(1) A linear prediction analyzer that analyzes and branches side information and linear prediction information, a difference machine that obtains a prediction error signal, a quantizer that quantizes the prediction error signal, and a quantizer that quantizes the prediction error signal. a downsampler that downsamples the quantized residual signal; and an interpolator that interpolates the samples missed by the downsampler using an autocorrelation coefficient or an experimentally determined interpolation coefficient of the predicted residual signal before downsampling; It is characterized by being equipped with an error correction code adder that adds an error correction code to the energy information of the side information and the first-order and second-order linear prediction coefficients in place of the amount of information that can be reduced by the downsampler. A speech predictive coding device.
値を用いて有声/無声の判定を行ない実験的に求めたそ
れぞれ異なる補間係数で補間を行なう遅延メモリ、係数
器および加算器からなる回路とを備えたことを特徴とす
る請求項(1)記載の音声予測符号化装置。(2) A circuit consisting of a delay memory, a coefficient unit, and an adder that performs voiced/unvoiced judgment using the input audio energy and the value of the first-order short-term linear prediction coefficient, and performs interpolation using different interpolation coefficients obtained experimentally. The speech predictive coding device according to claim 1, further comprising: a speech predictive coding device;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63236934A JPH0286231A (en) | 1988-09-21 | 1988-09-21 | Voice prediction coder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63236934A JPH0286231A (en) | 1988-09-21 | 1988-09-21 | Voice prediction coder |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0286231A true JPH0286231A (en) | 1990-03-27 |
Family
ID=17007918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63236934A Pending JPH0286231A (en) | 1988-09-21 | 1988-09-21 | Voice prediction coder |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0286231A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06202696A (en) * | 1992-12-24 | 1994-07-22 | Nec Corp | Speech decoding device |
JP2006510947A (en) * | 2002-12-24 | 2006-03-30 | ノキア コーポレイション | Robust prediction vector quantization method and apparatus for linear prediction parameters in variable bit rate speech coding |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60253338A (en) * | 1984-05-30 | 1985-12-14 | Matsushita Electric Ind Co Ltd | Predictive coding method |
JPS62117423A (en) * | 1985-11-18 | 1987-05-28 | Nippon Telegr & Teleph Corp <Ntt> | Sound encoding system |
JPS62117422A (en) * | 1985-11-18 | 1987-05-28 | Nippon Telegr & Teleph Corp <Ntt> | Sound encoding system |
JPS62165493A (en) * | 1986-01-16 | 1987-07-22 | Canon Inc | Information signal transmission system |
JPS62176384A (en) * | 1986-01-30 | 1987-08-03 | Canon Inc | Information signal transmission system |
JPS6322697A (en) * | 1986-07-16 | 1988-01-30 | 凸版印刷株式会社 | Manufacture of metal evaporating transfer foil |
JPS63253338A (en) * | 1987-10-12 | 1988-10-20 | Minolta Camera Co Ltd | Film sensitivity setting device |
-
1988
- 1988-09-21 JP JP63236934A patent/JPH0286231A/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60253338A (en) * | 1984-05-30 | 1985-12-14 | Matsushita Electric Ind Co Ltd | Predictive coding method |
JPS62117423A (en) * | 1985-11-18 | 1987-05-28 | Nippon Telegr & Teleph Corp <Ntt> | Sound encoding system |
JPS62117422A (en) * | 1985-11-18 | 1987-05-28 | Nippon Telegr & Teleph Corp <Ntt> | Sound encoding system |
JPS62165493A (en) * | 1986-01-16 | 1987-07-22 | Canon Inc | Information signal transmission system |
JPS62176384A (en) * | 1986-01-30 | 1987-08-03 | Canon Inc | Information signal transmission system |
JPS6322697A (en) * | 1986-07-16 | 1988-01-30 | 凸版印刷株式会社 | Manufacture of metal evaporating transfer foil |
JPS63253338A (en) * | 1987-10-12 | 1988-10-20 | Minolta Camera Co Ltd | Film sensitivity setting device |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06202696A (en) * | 1992-12-24 | 1994-07-22 | Nec Corp | Speech decoding device |
JP2006510947A (en) * | 2002-12-24 | 2006-03-30 | ノキア コーポレイション | Robust prediction vector quantization method and apparatus for linear prediction parameters in variable bit rate speech coding |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2418324C2 (en) | Subband voice codec with multi-stage codebooks and redudant coding | |
US7539615B2 (en) | Audio signal quality enhancement in a digital network | |
US8374856B2 (en) | Method and apparatus for concealing packet loss, and apparatus for transmitting and receiving speech signal | |
CA2483791C (en) | Method and device for efficient frame erasure concealment in linear predictive based speech codecs | |
JP6692948B2 (en) | Method, encoder and decoder for linear predictive coding and decoding of speech signals with transitions between frames having different sampling rates | |
JP4302978B2 (en) | Pseudo high-bandwidth signal estimation system for speech codec | |
EP1281172A2 (en) | Method and apparatus for compression of speech encoded parameters | |
JPS60116000A (en) | Voice encoding system | |
JPH0736118B2 (en) | Audio compressor using Serp | |
JPH0430200A (en) | Sound decoding system | |
JPH10187197A (en) | Voice coding method and device executing the method | |
JP4874464B2 (en) | Multipulse interpolative coding of transition speech frames. | |
US20100114567A1 (en) | Method And Arrangement For Smoothing Of Stationary Background Noise | |
US8078457B2 (en) | Method for adapting for an interoperability between short-term correlation models of digital signals | |
CN101783142B (en) | Transcoding method, device and communication equipment | |
JP2002221994A (en) | Method and apparatus for assembling packet of code string of voice signal, method and apparatus for disassembling packet, program for executing these methods, and recording medium for recording program thereon | |
Wang et al. | Parameter interpolation to enhance the frame erasure robustness of CELP coders in packet networks | |
JPH01261930A (en) | Sound encoding/decoding system | |
US9990932B2 (en) | Processing in the encoded domain of an audio signal encoded by ADPCM coding | |
JPH0286231A (en) | Voice prediction coder | |
WO2004112256A1 (en) | Speech encoding device | |
JPH0612095A (en) | Voice decoding method | |
JP6713424B2 (en) | Audio decoding device, audio decoding method, program, and recording medium | |
JPH0588697A (en) | Absent speech interpolation system | |
JP6691440B2 (en) | Speech coding apparatus, speech decoding apparatus, speech coding method, speech decoding method, program, and recording medium |