JP3230380B2 - Audio coding device - Google Patents

Audio coding device

Info

Publication number
JP3230380B2
JP3230380B2 JP18325794A JP18325794A JP3230380B2 JP 3230380 B2 JP3230380 B2 JP 3230380B2 JP 18325794 A JP18325794 A JP 18325794A JP 18325794 A JP18325794 A JP 18325794A JP 3230380 B2 JP3230380 B2 JP 3230380B2
Authority
JP
Japan
Prior art keywords
code
delay
signal
thinning
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP18325794A
Other languages
Japanese (ja)
Other versions
JPH0844396A (en
Inventor
慶一 舟木
一範 小澤
和永 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP18325794A priority Critical patent/JP3230380B2/en
Priority to CA002144693A priority patent/CA2144693A1/en
Publication of JPH0844396A publication Critical patent/JPH0844396A/en
Application granted granted Critical
Publication of JP3230380B2 publication Critical patent/JP3230380B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は音声符号化装置に関し、
特に音声信号を8〜4kb/s程度の低いビットレート
で高品質に符号化するCELP方式の音声符号化装置に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech coding apparatus,
In particular, the present invention relates to a CELP-type audio encoding device that encodes an audio signal at a low bit rate of about 8 to 4 kb / s with high quality.

【0002】[0002]

【従来の技術】近年、無線電波を媒体とした自動車電話
やコードレス電話のディジタル化が急激に進展してい
る。無線電波ではこの種の電話に使用可能な周波数帯域
が少ないため、占有帯域を低減するために低ビットレー
トの音声信号の符号化方式の開発は重要である。ビット
レートが8〜4kb/s程度のこの種の符号化方式とし
て、例えば、1985年アメリカで出版されたアイキャ
スプ・プロシーディング85,(ICASSP pro
ceedings 85)第937〜940頁所載の論
文シュローダおよびアタル,コードエキサイテッド・リ
ニア・プレディクション:ハイクオリティスピーチ・ア
トロウビットレーツ(M.Schroeder and
B.S.Atal,”Code−excited l
iearprediction:High quali
ty speech at lowbit rate
s”)(文献1)等に記載されているCELP(Cod
e Excited LPC Coding)が知られ
ている。
2. Description of the Related Art In recent years, the digitization of automobile telephones and cordless telephones using radio waves as a medium has been rapidly advancing. Since a radio wave has a small frequency band that can be used for this type of telephone, it is important to develop a coding method for a low bit rate audio signal in order to reduce the occupied band. Examples of this type of coding system having a bit rate of about 8 to 4 kb / s include, for example, Eyecast Prop. 85, published in the United States in 1985 (ICASSP pro
ceedings 85) Schroeder and Atal, Code Excited Linear Prediction, pages 937-940: High Quality Speech Atrobitrates (M. Schroeder and
B. S. Atal, "Code-excited l
earprediction: High quali
ty speech at lowbit rate
s ") (Reference 1) and the like.
e Excited LPC Coding) is known.

【0003】この文献1記載の従来の第1の音声符号化
装置であるCELPにおいて、送信側では次の手順で符
号化処理が行われる。まず、フレーム毎(例えば20m
s)に、符号化対象の音声信号から音声の周波数特性を
表す短期予測符号を抽出する(短期予測)。次にフレー
ムをさらに小区間のサブフレーム(例えば5ms)に分
割する。上記サブフレーム毎に、過去の音源信号から長
区間相関(ピッチ相関)を表すピッチパラメータを抽出
し、上記ピッチパラメータによりそのサブフレームの音
声信号を長期予測する。この長期予測は、上記過去の音
源信号を各遅延符号に対応する遅延サンプル分遅延させ
たサブフレーム長の音源信号(適応コードベクトル)か
ら成る適応コードブックを用いて、上記ピッチ相関を表
す遅延符号を次の手順で決定することによりなされる。
すなわち、上記遅延符号を適応コードブックのサイズ分
変化させ、各遅延符号に対応する適応コードベクトルを
抽出する。抽出された上記適応コードベクトルを用いて
合成信号を生成し上記音声信号との誤差電力を算出す
る。算出された上記誤差電力が最小になる最適遅延符号
と、この最適遅延符号に対応する適応コードベクトルと
そのゲインとを決定する。
[0003] In the CELP which is the first conventional speech coding apparatus described in Document 1, a coding process is performed on the transmitting side in the following procedure. First, every frame (for example, 20m
In s), a short-term prediction code representing a frequency characteristic of the voice is extracted from the voice signal to be coded (short-term prediction). Next, the frame is further divided into sub-frames (for example, 5 ms) of a small section. For each sub-frame, a pitch parameter indicating a long-term correlation (pitch correlation) is extracted from a past sound source signal, and the speech signal of the sub-frame is predicted for a long time by the pitch parameter. The long-term prediction uses a delay code representing the pitch correlation using an adaptive codebook composed of a subframe-length excitation signal (adaptive code vector) obtained by delaying the past excitation signal by delay samples corresponding to each delay code. Is determined by the following procedure.
That is, the delay code is changed by the size of the adaptive codebook, and an adaptive code vector corresponding to each delay code is extracted. A composite signal is generated using the extracted adaptive code vector, and error power with respect to the audio signal is calculated. An optimal delay code that minimizes the calculated error power, an adaptive code vector corresponding to the optimal delay code, and its gain are determined.

【0004】次に、あらかじめ用意された種類の量子化
符号である雑音信号(音源コードブック)から抽出した
音源コードベクトルから生成した合成信号と、上記長期
予測して求められた残差信号との誤差電力が最小になる
音源コードベクトルとそのゲインとを決定する(音源コ
ードブック探索)。このようにして決定された適応コー
ドベクトルならびに音源コードベクトルの種類を表すイ
ンデックスと各々の音源信号のゲインならびにスペクト
ルパラメータの種類を表すインデックスとを伝送する。
Next, a synthesized signal generated from an excitation code vector extracted from a noise signal (excitation codebook), which is a kind of quantization code prepared in advance, and a residual signal obtained by the long-term prediction are described. A sound source code vector that minimizes error power and its gain are determined (sound source codebook search). An index indicating the type of the adaptive code vector and the excitation code vector determined in this way and an index indicating the type of the gain and the spectrum parameter of each excitation signal are transmitted.

【0005】具体的な適応コードベクトルの遅延符号と
音源コードベクトルの量子化符号の探索法は次の手順で
行われる。先ず、入力された音声信号x[n]に対し聴
感上の重み付けおよび過去の影響信号の減算を行って信
号z[n]を算出する。次に、上述の短期予測で求め、
量子化および逆量子化を行ったスペクトルパラメータで
構成される合成フィルタHを、量子化符号jのコードベ
クトルej[n]で駆動して合成信号Hej[n]を算
出する。次に、次式において、信号z[n]と信号He
j[n]の誤差電力Eが最小になる量子化符号jを求め
る。
A specific method of searching for a delay code of an adaptive code vector and a quantization code of an excitation code vector is performed in the following procedure. First, a signal z [n] is calculated by performing weighting on audibility and subtracting a past influence signal from the input audio signal x [n]. Next, calculated by the above short-term forecast,
The synthesis filter H composed of the quantized and inversely quantized spectral parameters is driven by the code vector ej [n] of the quantization code j to calculate the synthesized signal Hej [n]. Next, in the following equation, the signal z [n] and the signal He are
A quantization code j that minimizes the error power E of j [n] is obtained.

【0006】 [0006]

【0007】ここで、Ns はサブフレーム長を、Hは合
成フィルタを実現する行列を、gejはコードベクトルe
jのゲインをそれぞれ表す。実際には(1)式は、次の
ように展開される。
Here, N s is a subframe length, H is a matrix for realizing a synthesis filter, and g ej is a code vector e.
j, respectively. In practice, equation (1) is expanded as follows.

【0008】 [0008]

【0009】(2)式の分子Cjは相互相関、分母Gj
は自己相関であり、それぞれ次式で算出できる。
The numerator Cj in the equation (2) is a cross-correlation, a denominator Gj
Is the autocorrelation, which can be calculated by the following equations.

【0010】 [0010]

【0011】これら自己相関Gjと相互相関Cjの計算
は、合成フィルタの駆動すなわちフィルタリングにより
信号Hej[n]を算出の後、実行される。そのとき、
上記フィルタリング処理の演算は上述のコードブックの
サイズの分にわたり実行するため、処理対象のフレーム
に対する上記演算の演算量(積和の回数)は非常に多く
なる。
The calculation of the auto-correlation Gj and the cross-correlation Cj is executed after the signal Hej [n] is calculated by driving the synthesis filter, that is, filtering. then,
Since the calculation of the filtering process is performed over the size of the codebook, the amount of calculation (the number of times of product sum) of the calculation for the frame to be processed becomes very large.

【0012】この長期予測の時の演算量低減ための従来
の第2の音声符号化装置として、特願平2−22858
1号公報(文献2)記載の「デジタル音声コーダーおよ
びそのコーダーに用いられるパラメータを求める方法」
に開示された遅延符号のオープン・クローズド探索がよ
く知られている。この方法は、オープンループにより遅
延符号の予備選択を行い、クローズドループにより上記
予備選択により決定された遅延符号の近傍の符号の探索
を行うことにより、長期予測を精度低下なしに低演算量
で実現している。
Japanese Patent Application No. 22858/1990 discloses a second conventional speech coding apparatus for reducing the amount of computation during long-term prediction.
No. 1 (Reference 2), “Digital voice coder and method for obtaining parameters used in the coder”
Is well known. This method realizes a long-term prediction with a small amount of calculation without deteriorating accuracy by performing preliminary selection of a delay code by an open loop and searching for a code near the delay code determined by the preliminary selection by a closed loop. are doing.

【0013】従来の第1および第2の音声符号化装置を
含むCELP方式の音声符号化装置をブロックで示す図
5を参照すると、この図に示す音声符号化装置は、音声
入力信号を符号化する符号化部1と、符号化信号を復号
化する復号化部2と、符号化部1と復号化部2とを接続
する伝送路3とを備える。
FIG. 5 is a block diagram showing a conventional CELP type speech coding apparatus including first and second speech coding apparatuses. Referring to FIG. 5, the speech coding apparatus shown in FIG. And a transmission line 3 connecting the encoding unit 1 and the decoding unit 2 to each other.

【0014】符号化部1は、入力端子TIから入力した
音声信号を記憶するバッファ回路11と、音声のスペク
トルパラメータであるLPC係数を抽出するLPC分析
回路12と、LPC係数を量子化するパラメータ量子化
回路13と、音声信号に対し聴感重み付けを行う重み付
け回路14と、過去の音源を蓄えておく適応コードブッ
ク15と、ピッチ相関を表す遅延符号である適応コード
ベクトルを探索する長期予測回路16と、長期予測残差
を表すサブフレーム長の音源コードベクトルが蓄えられ
たコードブックである音源コードブック17と、音源コ
ードブックから最適な音源コードベクトルを決定する音
源コードブック探索回路18と、適応コードベクトルと
音源コードベクトルのゲイン項を表すパラメータが蓄積
されているゲインコードブック19と、適応コードベク
トルと音源コードベクトルの量子化ゲインをゲインコー
ドブックから決定するゲインコードブック探索回路40
と、符号系列を組み合わせて出力するマルチプレクサ4
1とを備える。
The encoding unit 1 includes a buffer circuit 11 for storing an audio signal input from an input terminal TI, an LPC analysis circuit 12 for extracting an LPC coefficient as an audio spectrum parameter, and a parameter quantization circuit for quantizing the LPC coefficient. Circuit 13, a weighting circuit 14 for weighting the audibility of an audio signal, an adaptive codebook 15 for storing past sound sources, and a long-term prediction circuit 16 for searching for an adaptive code vector that is a delay code representing a pitch correlation. An excitation codebook 17 which is a codebook in which excitation codes of subframe lengths representing long-term prediction residuals are stored; an excitation codebook search circuit 18 for determining an optimal excitation codevector from the excitation codebook; Gain that stores the parameters representing the gain terms of the vector and sound source code vector And Dobukku 19, the gain codebook searching circuit determines the quantization gain of the adaptive code vector and the excitation code vector from the gain codebook 40
And a multiplexer 4 for combining and outputting a code sequence
1 is provided.

【0015】音源コードブック17は、文献1記載の雑
音コードブックでも特願平2−22955号公報や特願
平2−22956号公報等記載のベクトル量子化(V
Q)アルゴリズムにより学習された学習コードブックで
も構わない。
The sound source codebook 17 uses the vector quantization (V) described in Japanese Unexamined Patent Application Publication No. 2-22955 or Japanese Unexamined Patent Application Publication No. 2-22956 as a noise codebook described in Reference 1.
Q) A learning codebook learned by an algorithm may be used.

【0016】復号化部2は、供給を受けた伝送符号を所
定の各符号系列にデコードするデマルチプレクサ21
と、適応コードブック15と同一の適応コードブック2
2と、音源コードブック17と同一の音源コードブック
23と、ゲインコードブック19と同一のゲインコード
ブック24と、生成された音源と音声合成フィルタより
音声信号を再生する合成フィルタ25と、出力端子TO
と、音声出力用の出力端子TOとを備える。
The decoding unit 2 is a demultiplexer 21 for decoding the supplied transmission code into predetermined code sequences.
And adaptive codebook 2 identical to adaptive codebook 15
2, a sound source codebook 23 that is the same as the sound source codebook 17, a gain codebook 24 that is the same as the gain codebook 19, a synthesis filter 25 that reproduces a sound signal from the generated sound source and the sound synthesis filter, and an output terminal. TO
And an output terminal TO for audio output.

【0017】長期予測回路16の構成をブロックで示す
図6を参照すると、この従来の長期予測回路16は、遅
延符号を適応コードブックのサイズ分変化させる遅延符
号可変回路161と、遅延符号可変回路161で設定さ
れた遅延符号dに対応する適応コードベクトルe
d (n)をコードブック166に蓄えられるている過去
の信号より生成する適応コードベクトル生成回路162
と、適応コードベクトルed(n)を入力とする合成信
号である重み付け適応コードベクトルH・ed (n)を
生成する合成フィルタ163と、音声バッファに蓄積さ
れている音声信号と合成信号H・ed (n)の誤差電力
を表す評価関数を算出する評価関数算出回路164と、
全ての可変させた遅延符号dに対応する評価関数を用い
て最適な遅延符号CDを決定する最適遅延符号決定回路
165と、適応コードブック探索のための過去の音源信
号や残差信号や重み付け信号あるいは音声信号などの信
号を蓄積するバッファであるコードブック166と、符
号化処理を行う区間の音声信号を蓄積するバッファであ
り、この音声信号との誤差電力を最小にする遅延コード
が探索される音声バッファ167とを備える。
Referring to FIG. 6 showing a block diagram of the configuration of the long-term prediction circuit 16, the conventional long-term prediction circuit 16 includes a delay code variable circuit 161 for changing a delay code by the size of an adaptive codebook, and a delay code variable circuit. The adaptive code vector e corresponding to the delay code d set in 161
Adaptive code vector generation circuit 162 for generating d (n) from past signals stored in codebook 166
When the adaptive code vector e d (n) and a synthetic signal for receiving the weighted adaptive code vector H · e d synthesis filter 163 to generate a (n), synthesized signal H and the audio signal stored in the audio buffer An evaluation function calculation circuit 164 for calculating an evaluation function representing an error power of e d (n);
An optimal delay code determination circuit 165 that determines an optimal delay code CD using an evaluation function corresponding to all variable delay codes d; a past excitation signal, a residual signal, and a weighting signal for adaptive codebook search; Alternatively, a codebook 166 which is a buffer for accumulating a signal such as an audio signal, and a buffer which accumulates an audio signal in a section where encoding processing is performed, are searched for a delay code which minimizes error power with respect to this audio signal. An audio buffer 167 is provided.

【0018】次に、図5および図6を参照して、従来の
音声符号化回路の処理の流れについて説明すると、まず
符号化部1は、入力端子TIより、音声信号を入力しバ
ッファ11に格納する。このバッファ11に蓄えられた
一定サンプルの音声信号を用いてLPC分析回路12で
短期予測分析し、この音声信号のLPC係数を算出す
る。LPC分析回路12で求めた上記LPC係数はパラ
メータ量子化回路13で量子化され、上記LPC係数の
量子化符号CLがマルチプレクサ41に送られると共
に、逆量子化され以後の符号化処理に用いられる。
Next, with reference to FIGS. 5 and 6, a description will be given of the flow of processing of the conventional audio encoding circuit. First, the encoding unit 1 inputs an audio signal from an input terminal TI and sends it to a buffer 11. Store. The LPC analysis circuit 12 performs a short-term prediction analysis using the audio signal of a certain sample stored in the buffer 11, and calculates an LPC coefficient of the audio signal. The LPC coefficient obtained by the LPC analysis circuit 12 is quantized by the parameter quantization circuit 13, and the quantized code CL of the LPC coefficient is sent to the multiplexer 41, and is dequantized and used for the subsequent encoding processing.

【0019】一方、バッファ11に蓄えられた音声信号
は量子化/逆量子化されたLPC係数を用いて重み付け
回路14で聴感上の重み付けをされた信号SWとして長
期予測回路16,音源コードブック探索回路18,およ
びゲインコードブック探索回路40にそれぞれ供給さ
れ、以降のコードブック探索に用いられる。
On the other hand, the audio signal stored in the buffer 11 is converted into a perceptually weighted signal SW by the weighting circuit 14 using the quantized / dequantized LPC coefficients. The signal is supplied to the circuit 18 and the gain codebook search circuit 40, respectively, and used for the subsequent codebook search.

【0020】次に、適応コードブック15、音源コード
ブック17、およびゲインコードブック19の各々を用
いて信号SWのそれぞれのコードブック探索を行う。ま
ず、最初に長期予測回路16で長期予測を行い、ピッチ
相関を表す最適の遅延符号CDを後述のように決定し、
その遅延符号CDをマルチプレクサ41に転送するとと
もに、対応の適応コードベクトルの生成を行なう。次
に、上記適応コードベクトルの影響を減算後、音源コー
ドブック探索回路18で音源コードブック探索を行い、
量子化符号CSを決定し、音源コードベクトルを生成す
るとともにこの量子化符号CSをマルチプレクサ41に
転送する。適応コードベクトルと音源コードベクトルと
を求めた後、ゲインコードブック探索回路40でこれら
2つの音源のゲインを算出し、その符号CGをマルチプ
レクサ41に転送する。マルチプレクサ41では、これ
ら符号CL,CD,CS,およびCGを組み合わせて伝
送符号CTに変換し、この符号CTを伝送路3を経由し
て復号化部2に転送する。
Next, a codebook search for the signal SW is performed using each of the adaptive codebook 15, the sound source codebook 17, and the gain codebook 19. First, a long-term prediction is first performed by the long-term prediction circuit 16, and an optimum delay code CD representing the pitch correlation is determined as described later.
The delay code CD is transferred to the multiplexer 41, and a corresponding adaptive code vector is generated. Next, after subtracting the influence of the adaptive code vector, the sound source codebook search circuit 18 performs a sound source codebook search,
The quantization code CS is determined, an excitation code vector is generated, and the quantization code CS is transferred to the multiplexer 41. After obtaining the adaptive code vector and the excitation code vector, the gain codebook search circuit 40 calculates the gain of these two excitations and transfers the code CG to the multiplexer 41. The multiplexer 41 combines these codes CL, CD, CS, and CG and converts them into a transmission code CT, and transfers this code CT to the decoding unit 2 via the transmission path 3.

【0021】復号化部2は、デマルチプレクサ2で、伝
送路3から入力された伝送符号CTを符号CL,CD,
CS,およびCGの各々に分解する。LPC係数対応の
符号CLよりフィルタ係数をデコードし、合成フィルタ
25に転送する。遅延符号CDより適応コードブック1
5を用いて適応コードベクトルを生成する。音源対応の
量子化符号CSより音源コードブック17を用いて音源
コードベクトルを生成する。ゲイン対応の符号CGより
適応コードベクトルと音源コードベクトルのゲインを算
出し、各音源にゲイン項を掛け合わせて合成フィルタの
入力信号を生成する。最後に入力信号を用いて合成フィ
ルタ25で音声信号の合成を行ない端子TOから出力す
る。
The decoding unit 2 uses the demultiplexer 2 to convert the transmission code CT input from the transmission path 3 into codes CL, CD,
Decomposes into CS and CG respectively. The filter coefficient is decoded from the code CL corresponding to the LPC coefficient and transferred to the synthesis filter 25. Adaptive codebook 1 from delay code CD
5 to generate an adaptive code vector. An excitation code vector is generated from the quantization code CS corresponding to the excitation using the excitation codebook 17. The gain of the adaptive code vector and the excitation code vector is calculated from the code CG corresponding to the gain, and each excitation is multiplied by a gain term to generate an input signal of the synthesis filter. Finally, the synthesis signal is synthesized by the synthesis filter 25 using the input signal and output from the terminal TO.

【0022】次に、図6を参照して長期予測回路16の
動作について説明すると、まず、遅延符号可変回路16
1は、信号SW対応の遅延符号を適応コードブックのサ
イズ分変化させ、遅延符号dを設定する。この遅延符号
dは小数点遅延を表す符号が望ましいが、整数遅延を表
す符号でもよい。次に、適応コードベクトル生成回路1
62はこの遅延符号dに対応する適応コードベクトルe
d (n)をコードブック166から生成する。次に、合
成フィルタ163は適応コードベクトルed (n)を入
力とする零状態合成信号である重み付け適応コードベク
トルH・ed (n)を生成する。評価関数算出回路16
4は重み付け適応コードベクトルH・ed (N)と、音
声バッファ167に格納されている符号化区間における
零入力応答減算信号z(n)の相互相関Cd ,自己相関
d をそれぞれ算出し、誤差電力相当の評価関数Cd 2
/Gd を算出する。これら適応コードベクトル生成回路
162,合成フィルタ163,および評価関数算出回路
164の処理を遅延符号可変回路161の可変対象の全
遅延符号に対して行った後、最適遅延符号決定回路16
5で評価関数Cd 2 /Gd を最大にする遅延符号dを最
適遅延符号CDとして決定する。
Next, the operation of the long-term prediction circuit 16 will be described with reference to FIG.
1 sets the delay code d by changing the delay code corresponding to the signal SW by the size of the adaptive codebook. The delay code d is preferably a code representing a decimal point delay, but may be a code representing an integer delay. Next, the adaptive code vector generation circuit 1
62 is an adaptive code vector e corresponding to the delay code d.
d (n) is generated from the codebook 166. Next, the synthesis filter 163 generates an adaptive code vector e d (n) is the zero-state synthesis signal for receiving the weighted adaptive code vector H · e d (n). Evaluation function calculation circuit 16
4 is a weighted adaptive code vector H · e d (N), the cross-correlation C d of the zero input response subtraction signal z (n) in the encoding section is stored, the autocorrelation G d is calculated respectively in the audio buffer 167 , The evaluation function C d 2 corresponding to the error power
/ Gd is calculated. After the processes of the adaptive code vector generation circuit 162, the synthesis filter 163, and the evaluation function calculation circuit 164 are performed on all delay codes to be changed by the delay code variable circuit 161, the optimum delay code determination circuit 16
In step 5, the delay code d that maximizes the evaluation function C d 2 / G d is determined as the optimum delay code CD.

【0023】[0023]

【発明が解決しようとする課題】上述した従来の第1の
音声符号化装置は、長期予測のコードブック探索時の演
算量が非常に多く、低ビットレートで良好な音質の音声
符号化の実現が困難であるという欠点があった。
The above-mentioned first conventional speech coding apparatus requires a large amount of computation when searching for a long-term prediction codebook, and realizes speech coding with good sound quality at a low bit rate. There is a drawback that it is difficult.

【0024】上記演算量の低減を図った従来の第2の音
声符号化装置でも、演算量はかなり多く、低ビットレー
トで良好な音質の音声符号化装置の実現にはより一層の
演算量の低減化を要するという問題点があった。
Even in the conventional second speech coding apparatus in which the amount of calculation is reduced, the amount of calculation is considerably large, and further reduction in the amount of calculation is required for realizing a speech coding apparatus having a low bit rate and good sound quality. There was a problem that reduction was required.

【0025】本発明の目的は、長期予測のときの演算量
を低減化し、4kb/s程度の低ビットレートで音質の
良好な音声符号化装置を実現することにある。
It is an object of the present invention to reduce the amount of computation in long-term prediction and to realize a speech encoding device with a low bit rate of about 4 kb / s and good sound quality.

【0026】[0026]

【課題を解決するための手段】本発明の音声符号化装置
は、予め定めたフレーム長の音声信号を分析しこの音声
信号のスペクトルパラメータを抽出して対応の短期予測
符号を生成する音声分析手段と、前記フレーム長をさら
に予め定めたサブフレーム長に分割しこのサブフレーム
長単位の過去の音源信号を蓄積した適応コードブック格
納手段と、前記適応コードーブック格納手段から読出し
た前記音源信号を予め定めたピッチ周期の範囲で遅延さ
せ評価尺度である重み付け2乗誤差が最小となる遅延値
と遅延させた前記過去の音源に対するゲインとを算出し
て前記音声信号のピッチ相関を表す最適な遅延符号であ
る適応コードベクトルを探索して長期予測を行う長期予
測手段と、前記長期予測後の残差信号を示す量子化符号
である音源コードベクトルを蓄積する音源コードブック
格納手段と、前記音源コードブックから最適な音源コー
ドベクトルを決定する音源コードブック探索手段とを備
える音声符号化装置において、前記長期予測手段が、
記適応コードブック格納手段探索のための前記過去の音
源信号と前記残差信号と重み付け信号を含む信号を蓄積
するバッファであるコードブックと、前記遅延符号を
記コードブックのサイズ内で間引ながら可変させること
により低減した処理対象の遅延符号である間引き遅延符
号を生成する遅延符号間引可変手段と、 前記間引き遅延
符号を入力しこの間引き遅延符号に対応する前記適応コ
ードベクトルの候補を前記コードブックから生成する適
応コードベクトル生成手段と、 前記適応コードベクトル
の候補を入力し零状態合成信号である重み付け適応コー
ドベクトルを生成する合成フィルタ手段と、 符号化処理
を行う区間である符号化区間の音声信号を格納した音声
バッファと、 前記重み付け適応コードベクトルと前記音
声バッファに格納されている前記符号化区間における零
入力応答減算信号との相互相関と自己相関とから符号化
音声信号の前記音声信号に対する誤差電力相当の評価関
数を算出する評価関数算出手 段と、 前記重み付け2乗誤
差の最小化に対応するよう前記評価関数を最大とする前
記間引き遅延符号を前記最適遅延符号と決定する最適遅
延符号決定手段とを備えて構成されている。
SUMMARY OF THE INVENTION A speech encoding apparatus according to the present invention analyzes a speech signal having a predetermined frame length, extracts a spectrum parameter of the speech signal, and generates a corresponding short-term prediction code. Adaptive codebook storage means for further dividing the frame length into predetermined subframe lengths and storing past excitation signals of this subframe length unit; and the excitation signal read from the adaptive codebook storage means. An optimal delay code representing a pitch correlation of the voice signal by calculating a delay value that minimizes a weighted square error as an evaluation scale by delaying within a predetermined pitch period and a gain for the delayed past sound source. A long-term prediction means for searching for an adaptive code vector that is a long-term prediction, and an excitation code that is a quantization code indicating a residual signal after the long-term prediction. A sound source code book storage means for storing vector, in the speech coding apparatus and a sound source code book search means for determining the optimum excitation code vector from the excitation codebook, said long-term prediction means, before
The past sound for searching for an adaptive codebook storage means
Stores a signal including a source signal, the residual signal, and a weighted signal
A codebook is a buffer that, before the delay code
A thinning-out delay code that is a processing-target delay code reduced by making it variable while thinning out within the codebook size.
Variable sign thinning variable means for generating a signal , and said thinning delay
Code and inputs the adaptive code corresponding to the thinning-out delay code.
Code vector candidates from the codebook.
Adaptive code vector generating means, and the adaptive code vector
Weighted adaptive code that is a zero-state synthesized signal
Synthesis filter means for generating a code vector and encoding processing
That stores the audio signal of the coding section that is the section where
A buffer, the weighted adaptive code vector and the sound
Zero in the coding interval stored in the voice buffer
Coding from cross-correlation with input response subtracted signal and auto-correlation
An evaluation function corresponding to error power of an audio signal with respect to the audio signal.
And evaluation function calculation means to calculate the number, the weighting 2 Noayama
Before maximizing the evaluation function to correspond to the minimization of the difference
Optimum delay for determining a thinning-out delay code as the optimal delay code
And an extension code determining means .

【0027】[0027]

【実施例】次に、本発明を特徴ずける第1の実施例の長
期予測回路16Aの構成をブロックで示す図1を参照す
ると、この長期予測回路16Aは従来の技術の長期予測
回路16の適応コードベクトル生成回路162と、合成
フィルタ163と、評価関数算出回路164と、最適遅
延符号決定回路165と、コードブック166と、音声
バッファ167とに加えて、遅延符号可変回路161の
代りに適応コードブックの遅延符号を均一に間引きなが
ら変化させる遅延符号均一間引可変回路168を備え
る。
FIG. 1 is a block diagram showing the configuration of a long-term prediction circuit 16A according to a first embodiment of the present invention. In addition to the adaptive code vector generation circuit 162, the synthesis filter 163, the evaluation function calculation circuit 164, the optimum delay code determination circuit 165, the code book 166, and the audio buffer 167, the adaptive code vector generation circuit 162 is used instead of the delay code variable circuit 161. There is provided a delay code uniform thinning-out variable circuit 168 for changing the delay code of the code book while thinning it out uniformly.

【0028】次に、図1を参照して本実施例の動作につ
いて説明すると、まず、遅延符号均一間引可変回路16
8は遅延符号をコードブックのサイズ内で均一に間引き
ながら変化させ処理対象の遅延符号dを設定し、各遅延
符号d毎に適応コードベクトル生成回路162による適
応コードベクトルed (n)生成処理,合成フィルタ1
63による重み付け適応コードベクトルH・ed (n)
の生成処理,評価関数算出回路164による評価関数C
d 2 /Gd の算出処理を行う。上記均一間引方法とし
て、奇数番目の遅延符号だけを抽出する。これら適応コ
ードベクトル生成処理,重み付け適応コードベクトル生
成処理,および評価関数算出処理,および最適遅延符号
決定処理は従来と共通であるので説明を省略する。
Next, the operation of this embodiment will be described with reference to FIG.
Reference numeral 8 designates a delay code d to be processed by changing the delay code while thinning it uniformly within the size of the codebook, and generates an adaptive code vector e d (n) by the adaptive code vector generation circuit 162 for each delay code d. , Synthesis filter 1
The adaptive code vector H · ed (n) weighted by 63
Generation processing, evaluation function C by evaluation function calculation circuit 164
Calculation processing of d 2 / G d is performed. As the uniform thinning method, only odd-numbered delay codes are extracted. The adaptive code vector generation processing, the weighted adaptive code vector generation processing, the evaluation function calculation processing, and the optimum delay code determination processing are common to those in the related art, and thus description thereof is omitted.

【0029】以上の各処理を可変対象の全ての遅延符号
dに対して行った後、従来と同様に最適遅延符号決定回
路165により評価関数Cd 2 /Gd を最大にする遅延
符号dを最適遅延符号CDとして決定し出力する。
After performing each of the above processes on all the delay codes d to be changed, the optimum delay code determination circuit 165 determines the delay code d that maximizes the evaluation function C d 2 / G d in the same manner as before. It is determined and output as the optimum delay code CD.

【0030】このように、本実施例では、長期予測時
に、遅延符号を間引くことにより、演算量低減化を実現
する。
As described above, in this embodiment, the amount of calculation can be reduced by thinning out the delay codes at the time of long-term prediction.

【0031】次に、本発明の第2の実施例の長期予測回
路16Bの構成を図1と共通の構成要素には共通の参照
文字/数字を付して同様にブロックで示す図2を参照す
ると、この長期予測回路16Bの第1の実施例の長期予
測回路16Aとの相違点は、遅延符号均一間引可変回路
168の代りに適応コードブックの遅延符号を非均一に
間引きながら遅延変化させる遅延符号非均一間引可変回
路169を備えることである。
Next, the configuration of the long-term prediction circuit 16B according to the second embodiment of the present invention will be described with reference to FIG. Then, the difference between this long-term prediction circuit 16B and the long-term prediction circuit 16A of the first embodiment is that the delay code is changed while thinning out the delay code of the adaptive codebook non-uniformly instead of the delay code uniform thinning-out variable circuit 168. In other words, a variable delay code non-uniform thinning variable circuit 169 is provided.

【0032】本実施例の動作は、遅延符号非均一間引可
変回路169が、遅延符号をコードブックのサイズ内で
非均一に間引きながら変化させ処理対象の遅延符号dを
設定する他は、上述の第1の実施例と同様である。
The operation of this embodiment is the same as that described above except that the delay code non-uniform thinning-out variable circuit 169 changes the delay code while thinning it non-uniformly within the size of the codebook and sets the delay code d to be processed. Is similar to the first embodiment.

【0033】上記非均一間引き方法として、遅延が小さ
い遅延符号は全ての符号を抽出し、遅延が大きい遅延符
号は偶数番目のみを抽出する。
As the non-uniform thinning-out method, a delay code having a small delay extracts all codes, and a delay code having a large delay extracts only even-numbered delay codes.

【0034】次に、本発明の第3の実施例の長期予測回
路16Cの構成を図2と共通の構成要素には共通の参照
文字/数字を付して同様にブロックで示す図3を参照す
ると、この長期予測回路16Bの第2の実施例の長期予
測回路16Bとの相違点は、遅延符号非均一間引可変回
路169に加えて、合成フィルタ163および音声バッ
ファ167の各々の出力側に入力信号を1/D(任意の
整数)に間引くサンプル間引回路170,180を備え
ることである。
Next, the configuration of the long-term prediction circuit 16C according to the third embodiment of the present invention will be described with reference to FIG. Then, the difference between this long-term prediction circuit 16B and the long-term prediction circuit 16B of the second embodiment is that, in addition to the delay code non-uniform thinning-out variable circuit 169, the output side of each of the synthesis filter 163 and the audio buffer 167. In other words, sample thinning circuits 170 and 180 for thinning the input signal to 1 / D (arbitrary integer) are provided.

【0035】本実施例の動作は、第2の実施例と同様に
遅延符号非均一間引可変回路169が、遅延符号をコー
ドブックのサイズ内で非均一に間引きながら変化させ処
理対象の遅延符号dを設定し、各遅延符号d毎に適応コ
ードベクトル生成回路162による適応コードベクトル
d (n)生成処理,合成フィルタ163による重み付
け適応コードベクトルH・ed (n)の生成処理を行な
った後、サンプル間引回路170によりこの重み付け適
応コードベクトルH・ed (n)を1/D(例えばD=
2)にサンプル間引を行い間引コードベクトルH・ed
(n)’を生成する。サンプル間引回路180は音声バ
ッファ167に格納されている符号化区間における零入
力応答減算信号z(n)を同様に1/Dにサンプル間引
を行い間引零入力応答減算信号z(n)’を生成する。
評価関数算出回路164はこれら間引コードベクトルH
・ed (n)’と間引零入力応答減算信号z(n)’と
の相互相関Cd ,自己相関Gd をそれぞれ算出し、これ
ら相互,自己相関Cd ,Gd から実施例2と同様に評価
関数Cd 2 /Gd を算出する。上記サンプル間引の実行
は、ロウパスフィルタによるダウンサンプリングによる
か単純な間引により行う。以上の他の処理は、上述の第
2の実施例と同様に行う。
The operation of this embodiment is similar to that of the second embodiment, except that the delay code non-uniform thinning-out variable circuit 169 changes the delay code while thinning it out non-uniformly within the size of the codebook and changes the delay code to be processed. d, the adaptive code vector generation circuit 162 generates an adaptive code vector e d (n) for each delay code d, and the synthesis filter 163 generates a weighted adaptive code vector H · ed (n). Then, the weighted adaptive code vector H · ed (n) is 1 / D (for example, D =
Thinning code vector H · e d performs sample thinning 2)
(N) ′ is generated. The sample thinning circuit 180 thins out the sample of the zero input response subtracted signal z (n) in the coding section stored in the audio buffer 167 to 1 / D in the same manner, and thins out the zero input response subtracted signal z (n). 'Is generated.
The evaluation function calculation circuit 164 calculates these thinning code vectors H
The second embodiment calculates a cross-correlation C d and an auto-correlation G d between e d (n) ′ and a decimation zero input response subtracted signal z (n) ′, respectively, and calculates the second embodiment from the cross-correlation and auto-correlation C d and G d. Similarly, the evaluation function C d 2 / G d is calculated. The execution of the sample thinning is performed by downsampling using a low-pass filter or by simple thinning. The other processes are performed in the same manner as in the second embodiment.

【0036】本実施例では、相関計算の実行時に、サン
プルを間引いた信号を用いることにより更なる演算量低
減化を実現する。
In the present embodiment, a further reduction in the amount of calculation is realized by using a signal from which samples have been thinned out during execution of the correlation calculation.

【0037】次に、本発明の第4の実施例の長期予測回
路16Dの構成を図3と共通の構成要素には共通の参照
文字/数字を付して同様にブロックで示す図4を参照す
ると、この長期予測回路16Dの第3の実施例の長期予
測回路16Cとの相違点は、評価関数算出回路164の
出力の評価関数Cd 2 /Gd を基準としてM個の最適遅
延符号CDに対する候補すなわち遅延符号候補を予備選
択する遅延符号候補決定回路171と、最適遅延符号決
定回路165に代りこれらM個の遅延符号候補から最適
遅延符号CDを決定する最終遅延符号決定回路172と
を備える。
Next, the construction of the long-term prediction circuit 16D according to the fourth embodiment of the present invention will be described with reference to FIG. Then, the difference between the long-term prediction circuit 16D and the long-term prediction circuit 16C of the third embodiment is that M optimum delay codes CD based on the evaluation function C d 2 / G d of the output of the evaluation function calculation circuit 164 are used as a reference. , And a final delay code determination circuit 172 that determines an optimal delay code CD from these M delay code candidates instead of the optimal delay code determination circuit 165. .

【0038】本実施例の動作について説明すると、遅延
符号非均一間引回路169の可変対象の遅延符号dの全
てについての第3の実施例と同様の処理結果得られた評
価関数評価関数Cd 2 /Gd は遅延符号候補決定回路1
71に供給される。遅延符号候補決定回路171は、評
価関数評価関数Cd 2 /Gd を基準にM(例えばM=
5)個の遅延符号候補D1〜DM(=5)を予備選択す
る。最終遅延符号決定回路172は、これら遅延符号候
補D1〜D5の中から、従来と同様の探索手法で最適遅
延符号CDを決定する。
The operation of the present embodiment will be described. The evaluation function evaluation function C d obtained as a result of the same processing as in the third embodiment for all of the variable delay codes d of the delay code non-uniform thinning circuit 169 will be described. 2 / Gd is the delay code candidate decision circuit 1
71. The delay code candidate determination circuit 171 uses the evaluation function evaluation function C d 2 / G d as a reference for M (for example, M =
5) Preliminarily select the delay code candidates D1 to DM (= 5). The final delay code determination circuit 172 determines an optimum delay code CD from among the delay code candidates D1 to D5 by a search method similar to the related art.

【0039】本実施例では、サンプルの間引きを最適遅
延符号の予備選択に用い、予備選択された遅延符号候補
対応の遅延符号を用いて、従来と同様の探索を行うこと
により、精度を保持したまま演算量低減化を実現でき
る。
In this embodiment, the precision is maintained by performing the same search as in the prior art using the thinning of the samples for the preliminary selection of the optimum delay code and using the delay code corresponding to the preselected delay code candidate. The amount of calculation can be reduced as it is.

【0040】以上、本発明の実施例を説明したが、本発
明は上記実施例に限られることなく種々の変形が可能で
ある。
Although the embodiments of the present invention have been described above, the present invention is not limited to the above embodiments, and various modifications can be made.

【0041】例えば、評価関数として相互相関2 /自己
相関を用いたが、相互相関2 でも同様の効果が得られ
る。また、適応コードベクトルを合成した重み付け適応
コードベクトルを用いているが、合成処理を行わないま
まの適応コードベクトルそのものを用いても同様の効果
が得られる。さらに、音声バッファに格納する信号を零
状態減算信号とする代りに入力音声信号や残差信号や聴
感上の重み付け信号を用いてもよい。さらにまた、コー
ドブックとして過去の音源信号を用いる代りに、過去の
入力音声信号や残差信号や聴感上の重み付け信号を用い
ても同様の効果が得られる。さらに、相互相関や自己相
関の算出に合成フィルタHでまともにフィルタリングす
る方法を用いたが、近似式を用いる方法でも同様の効果
が得られる。この近似法は、例えば、1986年アメリ
カで出版されたアイキャスプ86・プロシーディング
(ICASSP proceedings 86)第2
375〜2378頁所載の論文トランスコおよびアタ
ル,エフィシエントプロセジャーズ・フォー・ファイン
ディング・ジ・オプチマムイノベーション・イン・スト
キャスティックコーダ(IM.Transco,B.
S.Atal,”EFFICIENTPROCEDUR
ES FOR FINDING THE OPTIMU
MINNOVATION IN STOCASTIC
CODERS”)等を参照できる。また、最適遅延符号
を1個に絞る代りに複数候補を求め次のステップで本選
択を行うことや、以後のコードブック探索で同時最適探
索を行うことも同様の効果が得られる。さらに、LPC
分析回路を用いて説明を行ったが、スペクトルパラメー
タを抽出するBURG法等の他の分析法を用いても同様
の効果が得られる。また、LPC係数を用いて説明した
が、PARCOR係数やLSP係数のような他のスペク
トルパラメータでも同様な効果が得られることは明白で
ある。さらにまた、音源コードブック探索回路を1段構
成とする代りに、多段構成にすることも、本発明の主旨
を逸脱しない限り適用できることは勿論である。
For example, although the cross-correlation 2 / auto-correlation is used as the evaluation function, the same effect can be obtained with the cross-correlation 2 . Although the weighted adaptive code vector obtained by combining the adaptive code vectors is used, the same effect can be obtained by using the adaptive code vector itself without performing the combining process. Further, instead of using the signal stored in the audio buffer as the zero-state subtraction signal, an input audio signal, a residual signal, or a weighting signal for audibility may be used. Furthermore, the same effect can be obtained by using a past input speech signal, a residual signal, or a weighting signal on audibility instead of using a past sound source signal as a codebook. Furthermore, although the method of filtering with the synthesis filter H is used for calculating the cross-correlation and the auto-correlation, the same effect can be obtained by a method using an approximate expression. This approximation method is described, for example, in ICASP86 Proceedings 86, published in the United States in 1986.
Transco and Atal, Efficient Procedures for Finding the Optimum Innovation in Stochastic Coder, pp. 375-2378 (IM. Transco, B .;
S. Atal, "EFFICIENTPROCEDUR
ES FOR FINDING THE OPTIMU
MINNOVATION IN STOCASTIC
CODERS "), etc. Also, instead of narrowing down the optimal delay code to one, a plurality of candidates are obtained and the main selection is performed in the next step, and the simultaneous optimal search is performed in the subsequent codebook search. The effect can be obtained.
Although the description has been made using the analysis circuit, the same effect can be obtained by using another analysis method such as the BURG method for extracting a spectrum parameter. Although the description has been made using the LPC coefficient, it is apparent that a similar effect can be obtained with other spectral parameters such as the PARCOR coefficient and the LSP coefficient. Furthermore, it is needless to say that a multi-stage sound source codebook search circuit can be applied instead of a single-stage sound source code book search circuit without departing from the gist of the present invention.

【0042】[0042]

【発明の効果】以上説明したように、本発明の音声符号
化装置は、長期予測手段が遅延符号を間引ながら可変さ
せる遅延符号間引可変手段を備えるので、上記遅延符号
を間引くことにより探索対象の遅延符号数が低減される
ため、適応コードブック探索における演算量が低減化さ
れるという効果がある。
As described above, the speech coding apparatus of the present invention includes the delay code thinning-out variable means for changing the delay code while thinning out the delay code. Since the number of target delay codes is reduced, the amount of calculation in adaptive codebook search is reduced.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の音声符号化装置の第1の実施例を示す
長期予測回路のブロック図である。
FIG. 1 is a block diagram of a long-term prediction circuit showing a first embodiment of a speech encoding apparatus according to the present invention.

【図2】本発明の音声符号化装置の第2の実施例を示す
長期予測回路のブロック図である。
FIG. 2 is a block diagram of a long-term prediction circuit showing a second embodiment of the speech coding apparatus of the present invention.

【図3】本発明の音声符号化装置の第3の実施例を示す
長期予測回路のブロック図である。
FIG. 3 is a block diagram of a long-term prediction circuit showing a third embodiment of the speech coding apparatus of the present invention.

【図4】本発明の音声符号化装置の第4の実施例を示す
長期予測回路のブロック図である。
FIG. 4 is a block diagram of a long-term prediction circuit showing a fourth embodiment of the speech coding apparatus of the present invention.

【図5】音声符号化装置の全体を示すブロック図であ
る。
FIG. 5 is a block diagram illustrating an entire speech encoding apparatus.

【図6】従来の音声符号化装置の一例を示すブロック図
である。
FIG. 6 is a block diagram illustrating an example of a conventional speech encoding device.

【符号の説明】[Explanation of symbols]

1 符号化部 2 復号化部 3 伝送路 11 バッファ回路 12 LPC分析回路 13 パラメータ量子化回路 14 重み付け回路 15,22 適応コードブック 16 長期予測回路 17,23 音源コードブック 18 音源コードブック探索回路 19,24 ゲインコードブック 40 ゲインコードブック探索回路 41 マルチプレクサ 21 デマルチプレクサ 25 合成フィルタ 161 遅延符号可変回路 162 適応コードベクトル生成回路 163 合成フィルタ 164 評価関数算出回路 165 最適遅延符号決定回路 166 コードブック 167 音声バッファ 168 遅延符号均一間引可変回路 169 遅延符号非均一間引可変回路 170,180 サンプル間引回路 171 遅延符号候補決定回路 172 最終遅延符号決定回路 DESCRIPTION OF SYMBOLS 1 Encoding part 2 Decoding part 3 Transmission line 11 Buffer circuit 12 LPC analysis circuit 13 Parameter quantization circuit 14 Weighting circuit 15,22 Adaptive codebook 16 Long-term prediction circuit 17,23 Sound source codebook 18 Sound source codebook search circuit 19, Reference Signs List 24 gain codebook 40 gain codebook search circuit 41 multiplexer 21 demultiplexer 25 synthesis filter 161 delay code variable circuit 162 adaptive code vector generation circuit 163 synthesis filter 164 evaluation function calculation circuit 165 optimal delay code determination circuit 166 codebook 167 audio buffer 168 Delay code uniform thinning variable circuit 169 Delay code non-uniform thinning variable circuit 170, 180 Sample thinning circuit 171 Delay code candidate determination circuit 172 Final delay code determination circuit

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−301900(JP,A) 特開 平5−11799(JP,A) 特開 平5−61499(JP,A) 特開 平5−158497(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 9/14 H04B 14/04 H03M 7/30 ──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-4-301900 (JP, A) JP-A-5-11799 (JP, A) JP-A-5-61499 (JP, A) 158497 (JP, A) (58) Field surveyed (Int. Cl. 7 , DB name) G10L 19/00-9/14 H04B 14/04 H03M 7/30

Claims (5)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 予め定めたフレーム長の音声信号を分析
しこの音声信号のスペクトルパラメータを抽出して対応
の短期予測符号を生成する音声分析手段と、前記フレー
ム長をさらに予め定めたサブフレーム長に分割しこのサ
ブフレーム長単位の過去の音源信号を蓄積した適応コー
ドブック格納手段と、前記適応コードーブック格納手段
から読出した前記音源信号を予め定めたピッチ周期の範
囲で遅延させ評価尺度である重み付け2乗誤差が最小と
なる遅延値と遅延させた前記過去の音源に対するゲイン
とを算出して前記音声信号のピッチ相関を表す最適な遅
延符号である適応コードベクトルを探索して長期予測を
行う長期予測手段と、前記長期予測後の残差信号を示す
量子化符号である音源コードベクトルを蓄積する音源コ
ードブック格納手段と、前記音源コードブックから最適
な音源コードベクトルを決定する音源コードブック探索
手段とを備える音声符号化装置において、前記長期予測
手段が、前記適応コードブック格納手段探索のための前
記過去の音源信号と前記残差信号と重み付け信号を含む
信号を蓄積するバッファであるコードブックと、 前記遅延符号を前記コードブックのサイズ内で間引なが
ら可変させることにより低減した処理対象の遅延符号で
ある間引き遅延符号を生成する遅延符号間引可変手段
と、 前記間引き遅延符号を入力しこの間引き遅延符号に対応
する前記適応コードベクトルの候補を前記コードブック
から生成する適応コードベクトル生成手段と、 前記適応
コードベクトルの候補を入力し零状態合成信号である重
み付け適応コードベクトルを生成する合成フィルタ手段
と、 符号化処理を行う区間である符号化区間の音声信号を格
納した音声バッファと、 前記重み付け適応コードベクトルと前記音声バッファに
格納されている前記符号化区間における零入力応答減算
信号との相互相関と自己相関とから符号化音声信号の前
記音声信号に対する誤差電力相当の評価関数を算出する
評価関数算出手段と、 前記重み付け2乗誤差の最小化に対応するよう前記評価
関数を最大とする前記 間引き遅延符号を前記最適遅延符
号と決定する最適遅延符号決定手段と を備えることを特
徴とする音声符号化装置。
1. A speech analyzing means for analyzing a speech signal having a predetermined frame length, extracting a spectrum parameter of the speech signal and generating a corresponding short-term prediction code, and further comprising a sub-frame length having a predetermined frame length. And an adaptive codebook storing means for storing the past sound source signal of this subframe length unit, and the sound source signal read from the adaptive codebook storing means is delayed by a predetermined pitch cycle as an evaluation scale. Calculate a delay value that minimizes a weighted square error and a gain for the delayed past sound source, search for an adaptive code vector that is an optimal delay code representing a pitch correlation of the voice signal, and perform long-term prediction. Long-term prediction means, and excitation codebook storage means for storing an excitation code vector which is a quantization code indicating the residual signal after the long-term prediction And a sound source codebook searching means for determining an optimum sound source code vector from the sound source codebook, wherein the long-term predicting means is used for searching for the adaptive codebook storing means.
Including the past sound source signal, the residual signal, and the weighting signal
A codebook which is a buffer for accumulating signals, and a delay code to be processed which is reduced by changing the delay code while thinning it within the size of the codebook.
Delay code thinning variable means for generating a certain thinning delay code
And the thinning-out delay code is input and corresponds to the thinning-out delay code.
The candidate of the adaptive code vector to be
Adaptive code vector generating means for generating from said adaptive
A candidate for a code vector is input and
Synthesis filter means for generating a matching adaptive code vector
And the audio signal of the coding section, which is the section where the coding process is performed,
Stored in the audio buffer, the weighted adaptive code vector and the audio buffer.
Zero input response subtraction in the stored coding interval
Before the coded speech signal from the cross-correlation with the signal and the auto-correlation
Calculate the evaluation function equivalent to the error power for the voice signal
Evaluation function calculating means; and the evaluation function corresponding to minimization of the weighted square error.
The decimation delay code that maximizes the function is replaced with the optimal delay code
An audio encoding apparatus comprising: an optimal delay code determining means for determining a signal .
【請求項2】前記遅延符号間引可変手段が、予め定めた
数毎に均一に前記遅延符号を間引く均一間引手段を備え
ることを特徴とする請求項1記載の音声符号化装置。
2. A speech encoding apparatus according to claim 1, wherein said delay code thinning-out variable means includes a uniform thinning means for thinning out said delay code uniformly for every predetermined number.
【請求項3】前記遅延符号間引可変手段が、予め定めた
非均一な間引対象符号の決定方法に従い前記遅延符号を
間引く非均一間引手段を備えることを特徴とする請求項
1記載の音声符号化装置。
3. The non-uniform thinning-out means according to claim 1, wherein said delay code thinning-out variable means comprises a non-uniform thinning-out means for thinning out said delayed codes in accordance with a predetermined non-uniform thinning-out target code determining method. Audio coding device.
【請求項4】前記長期予測手段が、前記重み付け2乗誤
差を計算する評価関数算出手段に供給する前記音声信号
と前記遅延符号対応の重み付け適応コードベクトルとの
各々をそれぞれ予め定めた率で間引く第1および第2の
サンプル間引手段をさらに備えることを特徴とする請求
項1記載の音声符号化装置。
4. The long-term predicting means thins out each of the speech signal and the weighted adaptive code vector corresponding to the delayed code, which are supplied to an evaluation function calculating means for calculating the weighted square error, at a predetermined rate. The speech encoding apparatus according to claim 1, further comprising first and second sample thinning means.
【請求項5】前記長期予測手段が、予め定めた数の前記
適応コードベクトルの候補である遅延候補を選択する遅
延候補決定手段と、前記遅延候補の中から前記適応コー
ドベクトル対応の最適遅延符号を決定する最終遅延符号
決定手段とをさらに備えることを特徴とする請求項1記
載の音声符号化装置。
5. A delay candidate determining means for selecting a predetermined number of delay candidates which are candidates for the adaptive code vector, an optimum delay code corresponding to the adaptive code vector from the delay candidates. 2. The speech encoding apparatus according to claim 1, further comprising: a final delay code determination unit that determines the final delay code.
JP18325794A 1994-08-04 1994-08-04 Audio coding device Expired - Lifetime JP3230380B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP18325794A JP3230380B2 (en) 1994-08-04 1994-08-04 Audio coding device
CA002144693A CA2144693A1 (en) 1994-08-04 1995-03-15 Speech decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18325794A JP3230380B2 (en) 1994-08-04 1994-08-04 Audio coding device

Publications (2)

Publication Number Publication Date
JPH0844396A JPH0844396A (en) 1996-02-16
JP3230380B2 true JP3230380B2 (en) 2001-11-19

Family

ID=16132509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18325794A Expired - Lifetime JP3230380B2 (en) 1994-08-04 1994-08-04 Audio coding device

Country Status (2)

Country Link
JP (1) JP3230380B2 (en)
CA (1) CA2144693A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9911737D0 (en) * 1999-05-21 1999-07-21 Philips Electronics Nv Audio signal time scale modification

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3249144B2 (en) * 1991-03-29 2002-01-21 株式会社東芝 Audio coding device

Also Published As

Publication number Publication date
CA2144693A1 (en) 1996-02-05
JPH0844396A (en) 1996-02-16

Similar Documents

Publication Publication Date Title
EP0443548B1 (en) Speech coder
JP3196595B2 (en) Audio coding device
EP1339040A1 (en) Vector quantizing device for lpc parameters
CA2061830C (en) Speech coding system
JPH08272395A (en) Voice encoding device
JP3180786B2 (en) Audio encoding method and audio encoding device
JP2002268686A (en) Voice coder and voice decoder
JP2970407B2 (en) Speech excitation signal encoding device
JP2003044099A (en) Pitch cycle search range setting device and pitch cycle searching device
JP3174733B2 (en) CELP-type speech decoding apparatus and CELP-type speech decoding method
JPH08292797A (en) Voice encoding device
JPH0830299A (en) Voice coder
JP3230380B2 (en) Audio coding device
JP2979943B2 (en) Audio coding device
JPH06282298A (en) Voice coding method
JP3153075B2 (en) Audio coding device
JP3299099B2 (en) Audio coding device
JP3319396B2 (en) Speech encoder and speech encoder / decoder
JP3249144B2 (en) Audio coding device
JPH0519795A (en) Excitation signal encoding and decoding method for voice
JPH08185199A (en) Voice coding device
JP3024467B2 (en) Audio coding device
JP3192051B2 (en) Audio coding device
JP3226180B2 (en) Speech pitch encoding method
JP3471542B2 (en) Audio coding device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010814

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110914

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120914

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130914

Year of fee payment: 12

EXPY Cancellation because of completion of term