JPH04149600A - Voice decoding system - Google Patents
Voice decoding systemInfo
- Publication number
- JPH04149600A JPH04149600A JP2274834A JP27483490A JPH04149600A JP H04149600 A JPH04149600 A JP H04149600A JP 2274834 A JP2274834 A JP 2274834A JP 27483490 A JP27483490 A JP 27483490A JP H04149600 A JPH04149600 A JP H04149600A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- pitch period
- error
- period
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013598 vector Substances 0.000 claims abstract description 41
- 230000003044 adaptive effect Effects 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 33
- 238000005314 correlation function Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000006978 adaptation Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 14
- 230000008439 repair process Effects 0.000 abstract description 8
- 238000012545 processing Methods 0.000 abstract description 5
- 238000010606 normalization Methods 0.000 abstract 2
- 102220008426 rs394105 Human genes 0.000 abstract 1
- 239000011295 pitch Substances 0.000 description 79
- 230000005236 sound signal Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000007774 longterm Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
Abstract
Description
【発明の詳細な説明】
〔概 要〕
情報圧縮されて伝送された音声信号の高能率な音声復号
化方式に関し、
符号化側でピッチ予測分析を行った結果得られるピンチ
周期及びピッチ予測係数を符号化パラメータとして受信
した音声を復号化する方式において、冗長度を付加する
ことなくピッチ周期に対する伝送路誤りの有無を検出す
ることを目的とし、受信ピッチ周期分だけ遅延すること
により適応符号帳から得られる過去のピッチ・ベクトル
と、該受信ピッチ周期を整数倍遅延させて該適応符号帳
から得られる過去のピッチ・ベクトルとの間の相関関数
を計算し、この相関関数値の大きさに基づいて伝送路誤
りによるピッチ周期値の誤りの有無を検出するように構
成する。[Detailed Description of the Invention] [Summary] Regarding a highly efficient audio decoding method for audio signals transmitted after information compression, the pinch period and pitch prediction coefficient obtained as a result of pitch prediction analysis on the encoding side are In a method for decoding audio received as a coding parameter, the purpose is to detect the presence or absence of a transmission path error with respect to the pitch period without adding redundancy. Calculate the correlation function between the obtained past pitch vector and the past pitch vector obtained from the adaptive codebook by delaying the received pitch period by an integral number of times, and based on the magnitude of this correlation function value. The system is configured to detect whether or not there is an error in the pitch period value due to a transmission path error.
本発明は、音声復号化方式に関し、特に情報圧縮されて
伝送された音声信号の高能率な音声復号化方式に関する
ものである。The present invention relates to an audio decoding system, and more particularly to a highly efficient audio decoding system for audio signals transmitted after information compression.
近年、企業内通信システム、ディジタル移動無線システ
ム、音声蓄積システムなどにおいて、音声信号をその品
質を保持しつつ情報を高能率に圧縮した形で伝送する方
式が求められている。In recent years, in corporate communication systems, digital mobile radio systems, voice storage systems, and the like, there has been a demand for a method for transmitting voice signals in a highly efficient compressed form while maintaining the quality of the voice signals.
C従来の技術〕
音声信号の伝送に際し、音声を予測して符号化する側で
は、フレーム毎に短期(線形)予測分析により抽出され
た短期予測係数と、長期予測分析により抽出されたピッ
チ予測係数及びピッチ周期と、入力信号にこの短期予測
フィルタ及び長期予測フィルタの逆特性フィルタ(逆フ
ィルタ)を施して得た予測残差信号とを多重化して伝送
する方式が一般的である。C. Prior Art] When transmitting an audio signal, on the side that predicts and encodes the audio, short-term prediction coefficients extracted by short-term (linear) prediction analysis and pitch prediction coefficients extracted by long-term prediction analysis are used for each frame. A common method is to multiplex and transmit the pitch period and a prediction residual signal obtained by applying an inverse characteristic filter (inverse filter) of the short-term prediction filter and the long-term prediction filter to the input signal.
また、この予測残差信号情報の効率的伝送のために、予
測残差ベクトルを予め用意した符号帳を用いてベクトル
量子化し、その符号帳のベクトル・インデフクスを伝送
する方式(コード駆動線形予測符号化方式: CELP
)や、予測残差ベクトルを有限個のパルス列でモデル化
し最適なパルス位置及びパルス振幅を伝送する方式(マ
ルチパルス駆動符号化方式:MPC)等が用いられてい
る。In addition, in order to efficiently transmit this predictive residual signal information, a method (code-driven linear predictive code Method: CELP
), a method (multi-pulse drive coding method: MPC), etc. in which the prediction residual vector is modeled with a finite number of pulse trains and the optimal pulse position and pulse amplitude are transmitted are used.
第5図は、符号化側において上記の長期予測分析に際し
て用いられるピッチ周期探索方式を示したもので、1は
フレーム遅延器2からの1フレーム前の線形予測残差信
号gvを記憶した適応符号帳(アダプティブ・コードブ
ック)であり、この適応符号帳1でDサンプル遅延させ
た信号に、成るピッチ予測係数(ゲイン)gを掛けた後
に得られる線形予測残差信号gVi−0を線形予測再生
フィルタ3で聴覚重み付は再生する。FIG. 5 shows the pitch period search method used in the above-mentioned long-term prediction analysis on the encoding side, where 1 is an adaptive code that stores the linear prediction residual signal gv from the frame delay device 2 one frame before. A linear prediction residual signal gVi-0 obtained by multiplying a signal delayed by D samples using this adaptive codebook 1 by a pitch prediction coefficient (gain) g is linearly predicted and reproduced. The filter 3 reproduces the auditory weighting.
そして、この再生信号gy1と入力音声信号χよとの誤
差を減算器4で求め、この誤差信号の電力をピッチ周期
探索部5で求める。この誤差電力は、E。Then, the subtracter 4 calculates the error between the reproduced signal gy1 and the input audio signal χyo, and the pitch period search unit 5 calculates the power of this error signal. This error power is E.
=Σ (X、 li ・・・・(1) で表される。=Σ (X, li ...(1) It is expressed as
但し、 I =v、−,+Σaj)’1−j X;入力音声信号 V二過去の線形予測残差信号 a:線形予測係数 p:線形予測の次数 である。however, I =v, -, +Σaj)'1-j X; input audio signal V2 past linear prediction residual signal a: linear prediction coefficient p: order of linear prediction It is.
上記の式(1)を最小にするゲインgは、両辺をgで微
分して零と置くことにより得られるので、d Ee /
d g=0
2Σ (xt
g)’I
I
=0
ΣXI’)’直
パ・g8
・・・・・・(2)
Σ y。The gain g that minimizes the above equation (1) can be obtained by differentiating both sides with respect to g and setting it to zero, so d Ee /
d g=0 2Σ (xt g)'I I =0 ΣXI')'Direct pa・g8 ......(2) Σ y.
となる。becomes.
従って、 3のときの誤差電力E9 は次のように なる。Therefore, Error power E9 when 3 is as follows Become.
ED −1(xt gyr )”
この式(3)の右辺第2項を最大にすれば、誤差電力E
Dは最小となるので、ピッチ周期探索部5では、図示の
ピッチ周期りを例えばlサンプルづつ順次ずらして行き
、右辺第2項が最大になるときのピッチ周期を最適ピッ
チ周期として選択すればよいことになる。ED −1(xt gyr )” If the second term on the right side of equation (3) is maximized, the error power E
Since D is the minimum, the pitch period search unit 5 may sequentially shift the illustrated pitch period by, for example, l samples, and select the pitch period when the second term on the right side becomes the maximum as the optimal pitch period. It turns out.
そして、適応符号帳1は1フレ一ム分のピッチ周期探索
が終了した時点でフレーム遅延器2からの前フレームの
残差ベクトルで部分更新される。Then, the adaptive codebook 1 is partially updated with the residual vector of the previous frame from the frame delayer 2 at the time when the pitch period search for one frame is completed.
尚、図示の音源ベクトル7は、上記のCELP符号化方
式において短期予測分析を行うために用いられる白色雑
音の固定(ストカスティック)符号帳から選択されたコ
ード・ベク斗ルに成るゲインを掛けたものであり、CE
LP方式中の逐次最適化方式においてはゼロとして与え
られ、同時最適化方式において図示のように加算部8で
ピッチ周期ベクトルにゲインgを乗じたものと加算され
て残差ベクトルが得られることになる。Note that the sound source vector 7 shown in the figure is a code vector selected from a white noise fixed (stochastic) codebook used for short-term predictive analysis in the CELP encoding method described above, multiplied by a gain. CE
In the sequential optimization method in the LP method, it is given as zero, and in the simultaneous optimization method, as shown in the figure, it is added to the pitch period vector multiplied by the gain g in the adder 8 to obtain the residual vector. Become.
このような分析手法(^nalysis−by−5yn
Lhesis:AB−5法)により、符号化側では、各
ピッチ周期で一旦音声信号を再往して最も誤差の小さか
ったものを選ぶようにしている。This kind of analysis method (^analysis-by-5yn
According to Lhesis (AB-5 method), on the encoding side, the audio signal is passed once in each pitch period and the one with the smallest error is selected.
このような音声符号化方式を、移動通信のような伝送路
エラーの多い環境下で使用する場合には、復号化側にお
いて、誤りが発生した場合の品質劣化を抑えるため、一
般には誤り訂正符号化の併用や、誤りのあるパラメータ
の修復技術等が必要とされる。When using such audio encoding systems in environments with many transmission path errors, such as mobile communications, error correction codes are generally used on the decoding side to suppress quality deterioration when errors occur. Therefore, it is necessary to use both methods and techniques to repair erroneous parameters.
この場合、パラメータの修復処理は、時間的に前後する
パラメータからの補間や繰り返し等により誤りの在るパ
ラメータの修復を行うものであるが、これらの処理は誤
りの無いときの再生音声品質を劣化させてしまうため、
誤り検出符号化との併用により、誤りが存在するパラメ
ータのみに対して処理を行う必要があり、短期予測分析
により抽出された短期予測係数などのように、時間的に
スムースな線形特性を示すパラメータに対しては、前後
の係数から推測される係数の存在範囲から著しく逸脱し
た計数値が受信された場合に誤りの存在を検出すること
が出来、パラメータの修復処理を比較的容品に行うこと
ができる。In this case, the parameter restoration process involves interpolating or repeating temporally preceding and subsequent parameters to restore the erroneous parameters, but these processes degrade the playback audio quality when there are no errors. In order to let
When used in conjunction with error detection coding, it is necessary to process only parameters with errors, and parameters that exhibit smooth linear characteristics over time, such as short-term prediction coefficients extracted by short-term prediction analysis. , it is possible to detect the existence of an error when a count value that significantly deviates from the existing range of coefficients estimated from the previous and subsequent coefficients is received, and the parameter repair process can be performed relatively easily. I can do it.
しかしながら、上記のような長期予測分析により抽出さ
れたピッチ周期は第6図に示すように、基本周期以外に
2倍ピッチも頻繁に選択され、更には3倍ピッチ以上に
ついても同様に選択されるため、線形特性とはならず、
従ってピッチ周期における誤りは従来、何らかの冗長度
を付加して誤り検出を行う必要があるが、音声符号化の
本来の目的は音声信号から冗長度を除き情報圧縮を行う
ことであり、冗長度を付加することになる誤り検出符号
化の適用は、音声の有声音部において最も重要なパラメ
ータの一つであるピッチ情報における過度の圧縮により
再生音声品質を著しく劣化させることになるので、情報
圧縮の観点からは好ましくないという問題点があった。However, as shown in Figure 6, the pitch periods extracted by the long-term prediction analysis described above frequently include double pitches in addition to the basic period, and even triple pitches or more. Therefore, it is not a linear characteristic,
Therefore, conventionally, it is necessary to add some redundancy to detect errors in the pitch period, but the original purpose of audio coding is to remove redundancy from the audio signal and compress information. The application of error detection coding, which will be added, will significantly degrade the reproduced audio quality due to excessive compression of pitch information, which is one of the most important parameters in the voiced part of speech. There was a problem that it was not desirable from the viewpoint.
従って、本発明は、符号化側でピッチ予測分析を行った
結果得られるピッチ周期及びピッチ予測係数を符号化パ
ラメータとして受信した音声を復号化する方式において
、冗長度を付加することなくピッチ周期に対する伝送路
誤りの有無を検出することを目的とする。Therefore, the present invention provides a method for decoding received speech using pitch periods and pitch prediction coefficients obtained as a result of pitch prediction analysis on the encoding side as encoding parameters, without adding redundancy. The purpose is to detect the presence or absence of transmission path errors.
〔課題を解決するための手段及び作用〕生主所久盃理
第5図に示したような、ピッチ周期探索方式で求めた最
適ピッチ周期は、式(3)の右辺第2項が最大になる基
本ピッチ周期であり、これは入力信号ベクトルX、と線
形予測フィルタ3により(聴覚重み付けされた)各ピン
チ周期におけるピッチ周期ベクトルy、との間の相関値
が最大になることを示している。[Means and actions for solving the problem] The optimal pitch period determined by the pitch period search method as shown in Figure 5 is such that the second term on the right side of equation (3) is maximized. This indicates that the correlation value between the input signal vector X and the pitch period vector y in each pinch period (perceptually weighted) by the linear prediction filter 3 is maximum. .
従って、入力信号X、が音声の有声区間のように周期的
波形となる部分では、その基本ピッチ周期以外に、2倍
ピッチ周期、3倍ピッチ周期等の基本周期の整数倍の周
期における相関値も同様に高くなる。Therefore, in a portion where the input signal X has a periodic waveform such as a voiced section of speech, in addition to its basic pitch period, correlation values at periods that are integral multiples of the basic period, such as double pitch period and triple pitch period, etc. will be similarly high.
即ち、第2図に示すように、基本周期が60サンプルの
ときの各ピッチ周期における式(3)(右辺第2項)の
相関値は、60サンプルの基本周期以外に、2倍ピッチ
周期(120サンプル)、3倍ピッチ周期(180サン
プル)、及びその中間周期においても相関関数値にピー
クが現れる。f@、上記の第6図のピッチ周期(N軸)
は、第2図に示した2倍ピッチ周jlI(横軸)に対応
している。That is, as shown in FIG. 2, the correlation value of equation (3) (second term on the right side) for each pitch period when the basic period is 60 samples is, in addition to the basic period of 60 samples, the correlation value for the double pitch period ( 120 samples), the triple pitch period (180 samples), and the intermediate period thereof also have peaks in the correlation function value. f@, pitch period in Figure 6 above (N axis)
corresponds to the double pitch circumference jlI (horizontal axis) shown in FIG.
且贋少J我立詐朋
そこで、本発明では、第2図の特性を利用することによ
り第1図に示すように、復号化側において符号化側から
受信したピッチ周期り分だけ遅延することにより適応符
号帳lから得られる過去のピッチ・ベクトルと、受信ピ
ッチ周期りを整数倍遅延させて適応符号帳1から得られ
る過去のピッチ・ベクトルとの間の相関関数を計算する
(Sl)そして、この相関関数値の大きさに基づいて伝
送路誤りによるピッチ周期値の誤りの有無を検出する(
S2)。Therefore, in the present invention, by utilizing the characteristics shown in FIG. 2, as shown in FIG. 1, the decoding side is delayed by the pitch period received from the encoding side. Calculate the correlation function between the past pitch vector obtained from the adaptive codebook l and the past pitch vector obtained from the adaptive codebook 1 by delaying the reception pitch period by an integral multiple (Sl); and , based on the magnitude of this correlation function value, detect whether there is an error in the pitch period value due to a transmission path error (
S2).
これにより、伝送データに冗長度を付加することなくピ
ッチ周期の誤りを受信側で検出することができる。This allows pitch period errors to be detected on the receiving side without adding redundancy to the transmitted data.
また、本発明では、適応符号4!1に記憶されたピッチ
・ベクトルの代わりに、残差ベクトルを再生フィルタに
通した後の再生信号ベクトルを用いて同様の相関関数値
による受信ピッチ周期の誤り検出を行ってもよい。Furthermore, in the present invention, instead of the pitch vector stored in the adaptive code 4!1, a reproduced signal vector obtained by passing the residual vector through a reproduction filter is used to detect errors in the received pitch period due to similar correlation function values. Detection may also be performed.
更には、ピッチ予測係数が閾値を越えているときのみ上
記の相関演算を行えば、ピッチ予測係数が閾値より低い
無声音部についての上記の相関演算を省くことが出来、
効率的なピッチ周期の誤り有無の検出を行うことができ
ると共に無声音部で相関関数値が大きい場合に誤った検
出が行われるのを回避することができる。Furthermore, if the above correlation calculation is performed only when the pitch prediction coefficient exceeds the threshold, the above correlation calculation for unvoiced parts whose pitch prediction coefficient is lower than the threshold can be omitted.
It is possible to efficiently detect the presence or absence of pitch cycle errors, and it is also possible to avoid erroneous detection when the correlation function value is large in an unvoiced part.
第3図は、第1図に示した本発明に係る音声復号化方式
の実現するための復号器の実施例を示したもので、この
実施例では、ピッチJiI期探索方式としては上記のA
−B−3法を用い、ピッチ周期探索範囲としては第6図
に示したように20−147サンプルの範囲の場合で考
える。FIG. 3 shows an embodiment of a decoder for realizing the speech decoding method according to the present invention shown in FIG. 1. In this embodiment, the above-mentioned A
-B-3 method is used, and the pitch period search range is assumed to be 20-147 samples as shown in FIG.
図中、10は符号化側の適応符号II(第5図参照)に
対応した適応符号帳、20は残差ベクトルを1フレ一ム
分遅延させて適応符号帳10を部分更新させるフレーム
遅延器、30は残差ベクトルに聴覚重み付けして再生ベ
クトルを生成する線形予測フィルタ、40は適応符号帳
10に記憶された残差信号をピッチ周期に応じて取り込
む相関関数計算バッファ、50はバッファ40で計算し
た相関関数と受信側から送られてきたゲイン(ピッチ予
測係数)gに基づいてピッチ周期の誤りの有無を検出す
る誤り有無検出部、60は誤り有無検出部50の検出結
果によりピッチ周期を修復する修復処理部、70は上述
したように白色雑音の固定(ストカスティック)符号帳
から選択されたコート′・ベクトルに成るゲインを掛け
た音源ベクトル、そして、80は音源ベクトル70とピ
ッチ周期ベクトル(gv)とを加算して残差ベクトルを
生成するための加算部である。In the figure, 10 is an adaptive codebook corresponding to the adaptive code II (see FIG. 5) on the encoding side, and 20 is a frame delay device that partially updates the adaptive codebook 10 by delaying the residual vector by one frame. , 30 is a linear prediction filter that perceptually weights the residual vector to generate a reproduction vector, 40 is a correlation function calculation buffer that takes in the residual signal stored in the adaptive codebook 10 according to the pitch period, and 50 is the buffer 40. An error detection section 60 detects the presence or absence of an error in the pitch period based on the calculated correlation function and the gain (pitch prediction coefficient) g sent from the receiving side. A repair processing unit for repairing, 70 is an excitation vector multiplied by a gain consisting of a coat' vector selected from a stochastic codebook of white noise as described above, and 80 is an excitation vector 70 and a pitch period vector. (gv) to generate a residual vector.
次にこの実施例の動作を説明する。Next, the operation of this embodiment will be explained.
まず、符号化側では、ピッチ周期探索範囲無いの各ピン
チ周期において上記の式(3)の右辺第2項を計算し、
これが最大となるピンチ周期りとそのときのゲインgを
求め、他のパラメータと共に多重化して第3図の復号器
へ伝送する。First, on the encoding side, the second term on the right side of the above equation (3) is calculated for each pinch period without a pitch period search range,
The pinch period at which this becomes the maximum and the gain g at that time are determined, multiplexed with other parameters, and transmitted to the decoder shown in FIG.
すると、この復号器では、ピッチ周期りを受信してバッ
ファ40に与える。バッファ40では、このピッチ周3
IIIDと共にその2倍のピッチ周期2Dの各ピッチ・
ベクトルP、及びP2を適応符号[10から取り出して
次式〔4)に示すように両者間の正規化相関係数r11
を計算する。Then, this decoder receives the pitch period and provides it to the buffer 40. In the buffer 40, this pitch circumference 3
Each pitch with a pitch period of 2D, which is twice that of IIID,
The vectors P and P2 are extracted from the adaptive code [10] and the normalized correlation coefficient r11 between them is calculated as shown in the following equation [4].
Calculate.
次に、誤り有無検出部50ではバッファ40からの正規
化相関係数r+zを受けて第4図に示す誤り有無の検出
を行う。Next, the error detection unit 50 receives the normalized correlation coefficient r+z from the buffer 40 and performs error detection as shown in FIG.
即ち、まず、受信側より伝送されて来たゲインgを所定
の閾値gいと比較する(ステップTI)。That is, first, the gain g transmitted from the receiving side is compared with a predetermined threshold g (step TI).
この比較の結果、g<gいの場合には、受信音声信号は
無声音部と考えられるので、誤り有無の検出は行わず、
ピッチ周MDはそのまま使用する(ステップT2)。As a result of this comparison, if g<g, the received audio signal is considered to be an unvoiced part, so no error detection is performed.
The pitch circumference MD is used as is (step T2).
一方、gagいの場合には、有声音部と考えられるので
、上記の式(4)によりバッファ4oで求めたピッチ周
期りと2倍ピッチP1期2Dとのピッチ・ベクトルの正
規化相関係数rI!をその閾値rいと比較しくステップ
T3)、r+I< rいのときには有声音部であるが2
倍ピッチ周期との相関が小さいため、受信ピッチ周期り
に「誤りが有る」ものとして(ステップT4)、修復処
理部6oで修復処理を行う。この修復処理としては、例
えば誤りの無い最近のピッチ周期D゛と置き換える等の
方法が行われ、残差ベクトルgVo・及び再生ベクトル
gFe・が得られることになる。On the other hand, in the case of gag, it is considered to be a voiced part, so the normalized correlation coefficient of the pitch vector between the pitch period calculated in the buffer 4o by the above equation (4) and the double pitch P1 period 2D rI! is compared with its threshold value r (step T3), and when r+I<r, it is a voiced part, but 2
Since the correlation with the double pitch cycle is small, it is assumed that there is an error in the received pitch cycle (step T4), and the repair processing unit 6o performs repair processing. As this repair process, for example, a method such as replacing with a recent pitch period D' without an error is performed, and a residual vector gVo. and a reproduced vector gFe. are obtained.
また、rlz>rいのときには伝送路誤りが無いものと
見て「誤り無し」の検出出力を発生し、修後処理は行わ
ない、尚、この場合、ピッチ・ベクトルの再生音声に対
する寄与は小さいため、誤りの影響も小さく無視できる
こととなる。Also, when rlz>r, it is assumed that there is no transmission path error, and a detection output of "no error" is generated, and no post-processing is performed.In this case, the contribution of the pitch vector to the reproduced audio is small. Therefore, the influence of errors is small and can be ignored.
尚、上記の実施例では、ピッチ・ベクトルにより相関演
算を行って、誤りのを無を検出しているが、ピッチ周期
りのピンチ・ベクトルにゲインgを乗じた残差ベクトル
を線形予測フィルタ30に通して得られる再生信号ベク
トルと、ピッチ周期2Dのピッチ・ベクトルにゲインg
を乗じた残差ベクトルを線形予測フィルタ30に通して
得られる再生信号ベクトルとの相関関数値を求めて同様
の娯りを無の検出を行ってもよい。In the above embodiment, a correlation calculation is performed using the pitch vector to detect whether there is an error. A gain g is applied to the reproduced signal vector obtained through
Similar detection may be performed by calculating the correlation function value between the residual vector multiplied by the linear prediction filter 30 and the reproduced signal vector obtained.
以上説明したように、本発明によれば、受信ピッチ周期
分だけ遅延することにより適応符号帳から得られる過去
のピッチ・ベクトルと、受信ピッチ周期を整数倍遅延さ
せて該適応符号帳から得られる過去のピッチ・ベクトル
との間の相関関数を計算し、この相関関数値の大きさに
基づいて伝送銘渓りによるピッチ周M値の誤りの有無を
検出するように構成したので、誤り検出符号等の冗長度
を付加することなく、ピッチ周期情報の誤りを受信側で
検出することができるため、音声符号化速度を落として
品質の劣化をさせることなく伝送銘渓りに対しても強い
復号化を行うことができる。As explained above, according to the present invention, the past pitch vector obtained from the adaptive codebook by delaying the reception pitch period and the past pitch vector obtained from the adaptive codebook by delaying the reception pitch period by an integral multiple Since the configuration is configured to calculate the correlation function between the past pitch vector and detect the presence or absence of an error in the pitch circumference M value due to transmission error based on the magnitude of this correlation function value, an error detection code is used. Since errors in pitch period information can be detected on the receiving side without adding redundancy such as can be converted into
第1図は、本発明に係る音声復号化方式を概念的に示し
た図、
第2図は、所定ピッチ周期(60サンプル)の音声にお
ける各ピッチ周期における相関関数値の一例を示した図
、
第3図は、本発明に係る音声復号化方式の一実施例を示
したブロック図、
第4図は、本発明に係る音声復号化方式に用いる誤り有
無検出の処理を示すフローチャート図、第5図は、従来
から一般的な符号化側における入力音声信号のピッチ周
期探索方式を概念的に示したブロック図、
第6図は、ピッチ周期値の時間変化の一例を示した図、
である。
図において、10は適応符号帳、20はフレーム遅延器
、30は線形予測フィルタ、40は相関関数計算バッフ
ァ、50は誤り有無検出部、をそれぞれ示す。
図中、同一符号は同−又は相当部分を示す。FIG. 1 is a diagram conceptually illustrating the audio decoding method according to the present invention; FIG. 2 is a diagram illustrating an example of correlation function values at each pitch period in audio with a predetermined pitch period (60 samples); FIG. 3 is a block diagram showing an embodiment of the audio decoding method according to the present invention, FIG. 4 is a flowchart showing the error detection process used in the audio decoding method according to the invention, and FIG. FIG. 6 is a block diagram conceptually showing a pitch period search method for an input audio signal on the encoding side, which has been conventionally common. FIG. 6 is a diagram showing an example of a change in pitch period value over time.
It is. In the figure, 10 is an adaptive codebook, 20 is a frame delay device, 30 is a linear prediction filter, 40 is a correlation function calculation buffer, and 50 is an error detection unit. In the figures, the same reference numerals indicate the same or corresponding parts.
Claims (3)
ピッチ周期及びピッチ予測係数を符号化パラメータとし
て受信した音声を復号化する方式において、 受信ピッチ周期(D)分だけ遅延することにより適応符
号帳(1)から得られる過去のピッチ・ベクトルと、該
受信ピッチ周期(D)を整数倍遅延させて該適応符号帳
(1)から得られる過去のピッチ・ベクトルとの間の相
関関数を計算し、この相関関数値の大きさに基づいて伝
送路誤りによるピッチ周期値の誤りの有無を検出するこ
とを特徴とする音声復号化方式。(1) In a method for decoding received speech using the pitch period and pitch prediction coefficient obtained as a result of pitch prediction analysis on the encoding side as encoding parameters, adaptation is achieved by delaying the received pitch period (D). The correlation function between the past pitch vector obtained from the codebook (1) and the past pitch vector obtained from the adaptive codebook (1) by delaying the reception pitch period (D) by an integral multiple is calculated. 1. An audio decoding method characterized in that the presence or absence of an error in a pitch period value due to a transmission path error is detected based on the magnitude of the correlation function value.
再生フィルタに通した後の再生信号ベクトルを用いるこ
とを特徴とした請求項1記載の音声復号化方式。(2) The audio decoding method according to claim 1, wherein a reproduced signal vector obtained by passing a residual vector through a reproduction filter is used instead of the pitch vector.
相関演算を行うことを特徴とした請求項1又は2記載の
音声復号化方式。(3) The audio decoding method according to claim 1 or 2, wherein the correlation calculation is performed only when the pitch prediction coefficient exceeds a threshold value.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2274834A JPH04149600A (en) | 1990-10-12 | 1990-10-12 | Voice decoding system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2274834A JPH04149600A (en) | 1990-10-12 | 1990-10-12 | Voice decoding system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04149600A true JPH04149600A (en) | 1992-05-22 |
Family
ID=17547234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2274834A Pending JPH04149600A (en) | 1990-10-12 | 1990-10-12 | Voice decoding system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04149600A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100554165B1 (en) * | 2003-07-15 | 2006-02-22 | 한국전자통신연구원 | CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same |
JP2008529423A (en) * | 2005-01-31 | 2008-07-31 | クゥアルコム・インコーポレイテッド | Frame loss cancellation in voice communication |
-
1990
- 1990-10-12 JP JP2274834A patent/JPH04149600A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100554165B1 (en) * | 2003-07-15 | 2006-02-22 | 한국전자통신연구원 | CELP-based Speech Codec capable of eliminating of pitch-multiple effect and method of the same |
JP2008529423A (en) * | 2005-01-31 | 2008-07-31 | クゥアルコム・インコーポレイテッド | Frame loss cancellation in voice communication |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101023460B1 (en) | Signal processing method, processing apparatus and voice decoder | |
AU2023208191B2 (en) | Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program | |
US9224399B2 (en) | Apparatus and method for concealing frame erasure and voice decoding apparatus and method using the same | |
JPH0430200A (en) | Sound decoding system | |
JP2008542838A (en) | Robust decoder | |
JPH0736118B2 (en) | Audio compressor using Serp | |
RU2701075C1 (en) | Audio signal processing device, audio signal processing method and audio signal processing program | |
CA2552853A1 (en) | Signal decoding apparatus and signal decoding method | |
KR101587703B1 (en) | Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal | |
JPH04149600A (en) | Voice decoding system | |
JP3219467B2 (en) | Audio decoding method | |
JP3095340B2 (en) | Audio decoding device | |
JP4597360B2 (en) | Speech decoding apparatus and speech decoding method | |
JP2016105168A5 (en) | ||
JPH08202398A (en) | Voice coding device | |
JPH0286231A (en) | Voice prediction coder | |
MXPA96002143A (en) | System for speech compression based on adaptable codigocifrado, better | |
JPH07248795A (en) | Voice processor |