JP2892462B2 - Code-excited linear predictive encoder - Google Patents

Code-excited linear predictive encoder

Info

Publication number
JP2892462B2
JP2892462B2 JP2222558A JP22255890A JP2892462B2 JP 2892462 B2 JP2892462 B2 JP 2892462B2 JP 2222558 A JP2222558 A JP 2222558A JP 22255890 A JP22255890 A JP 22255890A JP 2892462 B2 JP2892462 B2 JP 2892462B2
Authority
JP
Japan
Prior art keywords
vector
code
short
excitation code
square
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2222558A
Other languages
Japanese (ja)
Other versions
JPH04106599A (en
Inventor
伸二 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2222558A priority Critical patent/JP2892462B2/en
Publication of JPH04106599A publication Critical patent/JPH04106599A/en
Application granted granted Critical
Publication of JP2892462B2 publication Critical patent/JP2892462B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、原音声を符号化するコード励振線形予測符
号化器に関するものである。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a code-excited linear predictive encoder for encoding original speech.

[従来の技術] 音声情報はその情報量が多大であるため、伝送する場
合や認識処理する場合に、原音声を符号化して圧縮する
ようにしている。このような符号化方式の一つとして、
コード励振線形予測符号化方式が提案されている。例え
ば、下記文献に記載されている。
[Prior Art] Since voice information has a large amount of information, an original voice is encoded and compressed when transmitting or performing recognition processing. As one of such encoding methods,
A code-excited linear predictive coding scheme has been proposed. For example, it is described in the following literature.

文献『M.R.Schroeder(シュロイダー)、B.S.Atal
(エイタル)共著、“Code−Excited Linear Predictio
n(CELP):High Quality Speech at Very Low Bit Rate
(コード励振線形予測:低ビットレートでの高品質音
声)”、Proc.ICASSP,pp937−940,March 1985. 第2図は、このようなコード励振線形予測符号化器の
従来の概念図を示す。
Literature [MRSchroeder, BSAtal
Co-author, "Code-Excited Linear Predictio"
n (CELP): High Quality Speech at Very Low Bit Rate
(Code Excited Linear Prediction: High Quality Speech at Low Bit Rate) ", Proc. ICASSP, pp 937-940, March 1985. FIG. 2 shows a conventional conceptual diagram of such a code excited linear predictive encoder. .

第2図において、このコード励振線形予測符号化器10
の入力端子11には原音声ベクトルSが入力される。この
原音声ベクトルSは、原音声をサンプリングした際にお
ける隣接する複数のサンプルよりなるベクトルである
(なお、同一サンプルが複数のベクトルの要素になって
いても良く、また、1サンプルはいずれか一つのベクト
ルだけの要素になるようにしていても良い)。原音声ベ
クトルSは、短時間分析部12及び減算器18に与えられ
る。
In FIG. 2, the code excitation linear predictive encoder 10
The original speech vector S is input to the input terminal 11. The original audio vector S is a vector composed of a plurality of adjacent samples when the original audio is sampled (the same sample may be an element of a plurality of vectors, and one sample is any one of the samples). It may be an element of only one vector). The original speech vector S is provided to the short-time analyzer 12 and the subtractor 18.

短時間分析部12は、原音声ベクトルSに対する短時間
予測係数αjを計算する。一例としては、短時間のLPC
分析によって短時間予測係数αjを計算する。短時間分
析部12は、このようにして得られた短時間予測係数αj
を短時間合成フィルタ13及び量子化器14に送出する。ま
た、短時間分析部12は、音声のフォルマント成分(短時
間成分)を除去したベクトルS1を長時間分析部15に送出
する。
The short-time analysis unit 12 calculates a short-term prediction coefficient αj for the original speech vector S. One example is a short LPC
The short-term prediction coefficient αj is calculated by the analysis. The short-term analysis unit 12 calculates the short-term prediction coefficient αj thus obtained.
Is transmitted to the short-time synthesis filter 13 and the quantizer 14. In addition, the short-time analysis unit 12 sends the vector S1 from which the formant component (short-time component) of the voice has been removed to the long-time analysis unit 15.

長時間分析部15は、ベクトルS1に対して長時間分析
(分析の一例としてはLPC分析)を行ない、ピッチ予測
係数βと、ラグ(ピッチ周期)Lを計算し、長時間合成
フィルタ16及び量子化器14に送出する。
The long-time analysis unit 15 performs a long-time analysis (LPC analysis as an example of the analysis) on the vector S1, calculates a pitch prediction coefficient β and a lag (pitch cycle) L, To the generator 14.

量子化器14は、短時間予測係数αj、ピッチ予測係数
β、ラグL及び後述する最適励振コードベクトルのイン
デックスIを量子化し、トータルコードCとして出力端
子112より出力する。
The quantizer 14 quantizes the short-term prediction coefficient αj, the pitch prediction coefficient β, the lag L, and the index I of the optimal excitation code vector described later, and outputs the result from the output terminal 112 as a total code C.

量子化器14に与えられるインデックスIは、励振コー
ドテーブル17、長時間合成フィルタ16、短時間合成フィ
ルタ13、減算器18、知覚重み付けフィルタ19、2乗計算
部110及び平均操作部111の処理によって、次のように決
定される。
The index I given to the quantizer 14 is obtained by the processing of the excitation code table 17, the long-time synthesis filter 16, the short-time synthesis filter 13, the subtractor 18, the perceptual weighting filter 19, the square calculation unit 110, and the average operation unit 111. Is determined as follows.

励振コードテーブル17には、各インデックスi(i=
1〜n)に対応付けられて励振コードベクロルeiが格
納されており、各励振コードベクトルeiは、時間順次
に又は一括的に長時間合成フィルタ16に与えられる。
In the excitation code table 17, each index i (i =
Excitation code vectors ei are stored in association with 1 to n), and each excitation code vector ei is applied to the long-time synthesis filter 16 in time sequence or collectively.

長時間合成フィルタ16は、励振コードベクトルeiに
対して、ピッチ予測係数β及びラグLを用いて長時間分
析部15の逆処理(合成処理)を施し、処理出力ベクトル
STiを短時間合成フィルタ13に送出する。短時間合成フ
ィルタ13は、ベクトルSTiに対して、短時間予測係数α
jを用いて短時間分析部12の逆処理(合成処理)を行な
って処理出力ベクトルSWiを減算器18に送出する。
The long-time synthesis filter 16 performs inverse processing (synthesis processing) of the long-time analysis unit 15 on the excitation code vector ei using the pitch prediction coefficient β and the lag L, and converts the processed output vector STi into the short-time synthesis filter 13. To send to. The short-time synthesis filter 13 generates a short-time prediction coefficient α
The inverse processing (synthesis processing) of the short time analysis unit 12 is performed using j, and the processing output vector SWi is sent to the subtractor 18.

このn個の各ベクトルSWiは、各励振コードベクオル
eiにより合成した合成音(予測ベクトル)を意味する
ものであり、それぞれ原音声ベクトルSに対応する。
Each of the n vectors SWi means a synthesized sound (predicted vector) synthesized by each excitation code vector ei, and corresponds to the original speech vector S, respectively.

減算器18は、各予測ベクトルSWiと原音声ベクトルS
との成分単位の減算を行ない、得られた誤差ベクトルe
riを知覚重み付けフィルタ19に送出する。
The subtracter 18 calculates each predicted vector SWi and the original speech vector S
And the resulting error vector e
ri is sent to the perceptual weighting filter 19.

知覚重み付けフィルタ19は、人間の知覚特性を考慮し
て設けられたものであり、誤差ベクトルeriに対して知
覚特性に対応した重み付けを施し、得られたベクトルε
iを2乗計算部110に送出する。
The perceptual weighting filter 19 is provided in consideration of human perceptual characteristics, and weights the error vector eri in accordance with the perceptual characteristics to obtain a vector ε.
i is sent to the square calculator 110.

2乗計算部110は、知覚重み付けされた誤差ベクトル
εiの各成分の2乗を計算し、平均操作部111は、得ら
れたベクトルεiの各成分の2乗の和の平均giを計算
する。さらに、平均操作部111は、n個の平均値g1〜g
nの中から最小の平均値gI(予測誤差が最小のもの)を
検出し、そのインデックスを最適励振コードベクトルの
インデックスIとして励振コードテーブル17から量子化
器14に出力させる。
The square calculation unit 110 calculates the square of each component of the perceptually weighted error vector εi, and the average operation unit 111 calculates the average gi of the sum of the squares of the obtained components of the vector εi. Further, the average operation unit 111 includes n average values g1 to g.
The smallest average value gI (the one with the smallest prediction error) is detected from n, and the index is output from the excitation code table 17 to the quantizer 14 as the index I of the optimal excitation code vector.

なお、図示しない復号化器においては、インデックス
Iから励振コードベクトルeIを取出し、この励振コード
ベクトルeIに対して、ピッチ予測係数β及びラグLを用
いた長時間分析部15の逆処理(合成処理)、及び、短時
間予測係数αjを用いた短時間分析部12の逆処理(合成
処理)を順次行なって原音声Sに対応した再生音声Ssを
得る。
A decoder (not shown) extracts the excitation code vector eI from the index I, and inverts the excitation code vector eI by the long-time analysis unit 15 using the pitch prediction coefficient β and the lag L (synthesis processing). ) And the inverse processing (synthesis processing) of the short-time analysis unit 12 using the short-term prediction coefficient αj is sequentially performed to obtain a reproduced sound Ss corresponding to the original sound S.

[発明が解決しようとする課題] 上述したように、従来の符号化方式においては、最適
励振コードベクトルを評価するために、2乗計算及び平
均処理を行なっている。しかしながら、2乗処理を行っ
た信号つまり元の信号の2倍の帯域幅を有する信号に対
して、実際上方形窓により取り出し、その和を計算して
から平均値を求め、その値を用いて最適励振コードベク
トルを評価する場合、窓の周波数特性の影響を受けて正
確な評価ができないという欠点がある。すなわち、再生
音声の品質を劣化させていた。
[Problems to be Solved by the Invention] As described above, in the conventional encoding method, a square calculation and an averaging process are performed in order to evaluate an optimal excitation code vector. However, for the squared signal, that is, the signal having twice the bandwidth of the original signal, the signal is actually extracted through the upper window, the sum is calculated, the average value is obtained, and the average value is used. When evaluating the optimal excitation code vector, there is a disadvantage that accurate evaluation cannot be performed due to the influence of the frequency characteristics of the window. That is, the quality of the reproduced sound is deteriorated.

本発明は、以上の点を考慮してなされたものであり、
各励振コードベクトルによる予測ベクトルを正しく評価
できて真に最適な励振コードベクトルを検出することが
できて、結果として符号化音声信号の音質を向上させる
ことができるコード励振線形予測符号化器を提供しよう
とするものである。
The present invention has been made in view of the above points,
Provide a code excitation linear prediction encoder that can correctly evaluate a prediction vector based on each excitation code vector, detect a truly optimal excitation code vector, and thereby improve the sound quality of an encoded speech signal. What you want to do.

[課題を解決するための手段] かかる課題を解決するため、本発明においては、原音
声ベクトルを分析して得た分析パラメータと、その分析
パラメータを用いて複数の励振コードベクトルを合成処
理して得た複数の予測ベクトルのうち原音声ベクトルか
らの誤差が最小となる最適な励振コードベクトルからの
インデックスとを出力するものであって、各予測ベクト
ルと原音声ベクトルとの誤差ベクトルの2乗ベクトルに
基づいて最適な励振コードベクトルを決定するコード励
振線形予測符号化器において、各2乗ベクトルを帯域を
考慮して重付けする重み付け回路を設け、重付けされた
2乗ベクトルに基づいて最適な励振コードベクトルを決
定するようにした。
[Means for Solving the Problem] In order to solve the problem, according to the present invention, an analysis parameter obtained by analyzing an original speech vector and a plurality of excitation code vectors are synthesized using the analysis parameter. It outputs an index from an optimal excitation code vector that minimizes an error from the original speech vector among the plurality of obtained prediction vectors, and is a square vector of an error vector between each prediction vector and the original speech vector. In the code excitation linear predictive encoder that determines the optimal excitation code vector based on the weighting circuit, a weighting circuit that weights each square vector in consideration of the band is provided, and the optimal square vector is determined based on the weighted square vector. The excitation code vector is determined.

[作用] 本発明は、原音声ベクトルを分析して得た分析パラメ
ータを用いて複数の励振コードベクトルを合成処理して
得た複数の予測ベクトルのうち原音声ベクトルからの誤
差が最小となる最適な励振コードベクトルの決定を、各
予測ベクトルと原音声ベクトルとの誤差ベクトルの2乗
ベクトルに基づいて行なうものに関する。そして、最適
な励振コードベクトルの決定を行なうための2乗ベクト
ルとして、各予測ベクトルと原音声ベクトルとの誤差ベ
クトルの2乗ベクトルをそのまま用いるのではなく、重
み付け回路によって各2乗ベクトルを帯域を考慮して重
付けした後、最適な励振コードベクトルの決定を行なう
ようにした。
[Operation] According to the present invention, among the plurality of prediction vectors obtained by synthesizing a plurality of excitation code vectors using an analysis parameter obtained by analyzing an original speech vector, an optimum error from the original speech vector is minimized. The present invention relates to a method of determining an excitation code vector based on a square vector of an error vector between each prediction vector and an original speech vector. Then, instead of using the square vector of the error vector between each prediction vector and the original speech vector as it is as the square vector for determining the optimal excitation code vector, the weighting circuit converts each square vector into a band. After weighting in consideration of the above, an optimal excitation code vector is determined.

[実施例] 以下、本発明の一実施例を図面を参照しながら詳述す
る。第1図に本発明の一実施例の構成を示す。
Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 shows the configuration of one embodiment of the present invention.

この実施例のコード例振線形予測符号化器20において
も、短時間分析部22が、入力端子21を介して与えられた
原音声ベクトルSを短時間分析(例えばLPC分析による
短時間分析)して得られた短時間予測係数αjを量子化
器24及び短時間合成フィルタ23に与えると共に、長時間
分析部25が、短時間分析部22から与えられた音声のフォ
ルマント成分(短時間成分)が除去されたベクトルS1を
長時間分析(分析の一例としてはLPC分析)して得られ
たピッチ予測係数β及びラグ(ピッチ周期)Lを長時間
合成フィルタ26及び量子化器24に与え、量子化器24が、
短時間予測係数αj、ピッチ予測係数β、ラグL及び後
述するように決定された最適励振コードベクトルのイン
デックスIを量子化し、トータルコードCとして出力端
子212より出力する構成は、従来の符号化器10と同様で
ある。
In the code example linear prediction encoder 20 of this embodiment as well, the short-time analysis unit 22 performs a short-time analysis (for example, a short-time analysis by LPC analysis) on the original speech vector S provided via the input terminal 21. The short-term prediction coefficient αj obtained as described above is supplied to the quantizer 24 and the short-time synthesis filter 23, and the long-term analysis unit 25 outputs the formant component (short-time component) of the speech supplied from the short-time analysis unit 22. The pitch prediction coefficient β and the lag (pitch period) L obtained by performing the long-term analysis (LPC analysis as an example of the analysis) on the removed vector S1 are given to the long-time synthesis filter 26 and the quantizer 24, and quantized. Vessel 24,
The configuration in which the short-term prediction coefficient αj, pitch prediction coefficient β, lag L, and index I of the optimal excitation code vector determined as described later are quantized and output from the output terminal 212 as a total code C is a conventional encoder. Same as 10.

しかし、この実施例の符号化器20は、各励振コードベ
クトルeiを評価して最適励振コードベクトルeIのイン
デックスIを得る構成が、従来の符号化器10とは異な
る。
However, the encoder 20 of this embodiment is different from the conventional encoder 10 in the configuration in which each excitation code vector ei is evaluated to obtain the index I of the optimal excitation code vector eI.

励振コードテーブル27には、n個の各インデックスi
(i=1〜n)に対応付けられた励振コードベクトルe
iが予め格納されており、各励振コードベクトルeiは、
時間順次に又は一括的に長時間合成フィルタ26に与えら
れる。
The excitation code table 27 has n indexes i
Excitation code vector e associated with (i = 1 to n)
i are stored in advance, and each excitation code vector ei is
The time-sequentially or collectively is supplied to the long-time synthesis filter 26.

長時間合成フィルタ26は、励振コードベクトルeiに
対して、長時間分析部25から与えられたピッチ予測係数
β及びラグLを用いて長時間分析部25の逆処理(合成処
理)を施し、処理出力ベクトルSTiを短時間合成フィル
タ23に送出する。短時間合成フィルタ23も、ベクトルS
Tiに対して、短時間分析部22から与えられた短時間予測
係数αjを用いて短時間分析部22の逆処理(合成処理)
を行なって処理出力ベクトル(励振コードベクトルei
により合成した原音声ベクトルSに対応する予測ベクト
ル)SWiを減算器28に送出する。
The long-time synthesis filter 26 performs an inverse process (synthesis process) of the long-time analysis unit 25 on the excitation code vector ei by using the pitch prediction coefficient β and the lag L given from the long-time analysis unit 25. The output vector STi is sent to the short-time synthesis filter 23. The short-time synthesis filter 23 also has the vector S
Reverse processing (synthesis processing) of the short-time analysis unit 22 on Ti using the short-time prediction coefficient αj given from the short-time analysis unit 22
To obtain a processing output vector (excitation code vector ei
Is transmitted to the subtracter 28).

減算器28は、各予測ベクトルSWiと原音声ベクトルS
との成分単位の減算を行ない、得られた誤差ベクトルe
riを知覚重み付けフィルタ29に送出する。知覚重み付け
フィルタ29は、人間の知覚特性を考慮して設けられたも
のであり、誤差ベクトルeriに対して知覚特性に対応し
た重み付けを施し、得られたベクトルεiを2乗計算部
210に送出する。2乗計算部210は、知覚重み付けされた
誤差ベクトルεiの各成分の2乗を計算する。
The subtractor 28 calculates each prediction vector SWi and the original speech vector S
And the resulting error vector e
ri is sent to the perceptual weighting filter 29. The perceptual weighting filter 29 is provided in consideration of human perceptual characteristics, weights the error vector eri in accordance with the perceptual characteristics, and obtains the obtained vector εi by a square calculator.
Send to 210. The square calculator 210 calculates the square of each component of the perceptually weighted error vector εi.

各励振コードベクトルeiを評価する構成、つまり最
適励振コードベクトルを検出してそのインデックスを取
出す構成においても、上述した励振コードテーブル27か
ら2乗計算部210に至るまでの構成は従来と同様であ
る。すなわち、各励振コードベクトルから原音声ベクト
ルの予測ベクトルを形成し、原音声ベクトルからの予測
ベクトルの誤差ベクトルを得、その誤差ベクトルに対し
て知覚特性を考慮した重み付けを施した後、2乗処理す
るまでの構成は従来と同様である。
Also in the configuration for evaluating each excitation code vector ei, that is, the configuration for detecting the optimum excitation code vector and extracting its index, the configuration from the above-described excitation code table 27 to the square calculation unit 210 is the same as the conventional configuration. . That is, a prediction vector of the original speech vector is formed from each excitation code vector, an error vector of the prediction vector from the original speech vector is obtained, the error vector is weighted in consideration of perceptual characteristics, and then squared. The configuration up to this point is the same as the conventional one.

しかし、この実施例の場合、2乗計算部210から出力
された誤差ベクトルεiの2乗ベクトルは、平均操作部
211に直接与えられるのではなく、重み付け回路213によ
って重付け処理された後、平均操作部211に与えられ
る。
However, in the case of this embodiment, the square vector of the error vector εi output from the square calculating section 210 is
Instead of being directly given to 211, it is given to the averaging section 211 after being weighted by the weighting circuit 213.

重み付け回路213は、式に示す重み付け演算を実行
する。
The weighting circuit 213 performs a weighting operation shown in the equation.

γi(m)=(εi(m))2W(m) (ここで、W(m)は重み付け関数、mはベクトルの
成分数) 重み付け関数W(m)としては、高周波での減衰量が
多く得られ、かつ帯域幅が狭いものが良く、例えば、現
在よく使われているハミング窓でも良い。
γi (m) = (εi (m)) 2 W (m) (where W (m) is a weighting function and m is the number of components of a vector) As the weighting function W (m), the attenuation amount at a high frequency is It is better to obtain a large number and have a narrow bandwidth. For example, a hamming window that is frequently used at present may be used.

このような重み付け回路213を設けるようにしたの
は、2乗処理を行った信号は元の信号の2倍の帯域幅を
有するので、単純に方形窓によって取り出した場合、窓
の周波数特性の影響を受けて正確な評価ができない恐れ
があるためである。
The weighting circuit 213 is provided because the squared signal has twice the bandwidth of the original signal. Therefore, when the signal is simply extracted by a square window, the influence of the frequency characteristics of the window is obtained. This is because there is a risk that accurate evaluation may not be possible in response to this.

平均操作部211は、得られたベクトルγiの各成分の
2乗の和の平均giを計算する。さらに、平均操作部211
は、n個の平均値g1〜gnの中から最小の平均値gI(予
測誤差が最小のもの)を検出し、そのインデックスを最
適励振コードベクトルのインデックスIとして励振コー
ドテーブル27から量子化器24に出力させる。
The average operation unit 211 calculates the average gi of the sum of the squares of the components of the obtained vector γi. Furthermore, the average operation unit 211
Detects the minimum average value gI (the one with the smallest prediction error) from the n average values g1 to gn, and uses the index as the index I of the optimal excitation code vector from the excitation code table 27 to the quantizer 24. Output.

以上の符号化処理は、原音声ベクトルSが変化する毎
に繰り返される。
The above encoding process is repeated every time the original speech vector S changes.

なお、復号化器の構成及び処理は従来と同様である。 Note that the configuration and processing of the decoder are the same as those in the conventional art.

従って、上述の実施例によれば、各励振コードベクト
ルを評価して最適な励振コードベクトルのインデックス
を検出する際に、帯域が2倍化された2乗ベクトルを重
付け処理後に演算操作するようにしたので、予測ベクト
ルと原音声ベクトルとの誤差を正しく評価できて最適な
符号化を実行することができる。すなわち、再生音声の
品質を従来より高めることができる。
Therefore, according to the above-described embodiment, when each excitation code vector is evaluated and the index of the optimal excitation code vector is detected, the squared vector whose band has been doubled is operated after the weighting process. Therefore, it is possible to correctly evaluate the error between the prediction vector and the original speech vector, and to execute optimal encoding. That is, the quality of the reproduced sound can be improved as compared with the related art.

なお、上述の実施例においては、短時間分析部及び長
時間分析部の双方を有する符号化器に適用したものを示
したが、少なくとも短時間分析部を有する符号化器に適
用することができる。
Note that, in the above-described embodiment, an example in which the present invention is applied to an encoder having both a short-time analysis unit and a long-time analysis unit has been described. However, the present invention can be applied to at least an encoder having a short-time analysis unit. .

また、励振コードテーブルが適応形のものである符号
化器にも適用することができる。
Further, the present invention can be applied to an encoder in which the excitation code table is of an adaptive type.

さらに、重付けされた2乗ベクトルに対する演算は、
平均演算だけでなく、単なる総和演算であっても良い。
Further, the operation on the weighted square vector is
Not only the average operation but also a simple sum operation may be used.

また、2乗処理後の信号の帯域等を実施例と等価にで
きるならば、重み付け回路213を2乗計算部210の前段に
設けるようにしても良い。
If the band of the signal after the squaring process can be made equivalent to that of the embodiment, the weighting circuit 213 may be provided in a stage preceding the square calculating unit 210.

[発明の効果] 以上のように、本発明によれば、知覚特性が考慮され
た誤差ベクトルの2乗ベクトルに帯域を考慮した重み付
けを施した後、誤差ベクトルの代表値(各成分の2乗平
均値、各成分の2乗総和値)の演算部に与えるようにし
たので、予測ベクトルと原音声ベクトルとの誤差を正し
く評価できて最適な符号化を実行することができて、再
生音声の品質を従来より高めることができる。
[Effects of the Invention] As described above, according to the present invention, after weighting the square vector of the error vector in which the perceptual characteristics are considered in consideration of the band, the representative value of the error vector (the square of each component) Since the average value and the sum of squares of each component are given to the calculation unit, the error between the prediction vector and the original speech vector can be correctly evaluated, and the optimum encoding can be executed. Quality can be improved than before.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明によるコード励振線形予測符号化器の一
実施例を示すブロック図、第2図は従来の符号化器を示
すブロック図である。 22……短時間分析部、23……短時間合成フィルタ、24…
…量子化器、25……長時間分析部、26……長時間合成フ
ィルタ、27……励振コードテーブル、28……減算器、29
……知覚重み付けフィルタ、210……2乗計算部、211…
…平均操作部、213……重み付け回路。
FIG. 1 is a block diagram showing an embodiment of a code excitation linear prediction encoder according to the present invention, and FIG. 2 is a block diagram showing a conventional encoder. 22 ... short-time analysis unit, 23 ... short-time synthesis filter, 24 ...
... Quantizer, 25 ... Long time analysis unit, 26 ... Long time synthesis filter, 27 ... Excitation code table, 28 ... Subtractor, 29
…… Perceptual weighting filter, 210… Square calculator, 211…
... Average operation unit, 213 ... Weighting circuit.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】原音声ベクトルを分析して得た分析パラメ
ータと、その分析パラメータを用いて複数の励振コード
ベクトルを合成処理して得た複数の予測ベクトルのうち
原音声ベクトルからの誤差が最小となる最適な励振コー
ドベクトルのインデックスとを出力するものであって、
各予測ベクトルと原音声ベクトルとの誤差ベクトルの2
乗ベクトルに基づいて最適な励振コードベクトルを決定
するコード励振線形予測符号化器において、 上記各2乗ベクトルを帯域を考慮して重付けする重み付
け回路を設け、重付けされた2乗ベクトルに基づいて最
適な励振コードベクトルを決定するようにしたことを特
徴とするコード励振線形予測符号化器。
An analysis parameter obtained by analyzing an original speech vector, and a plurality of prediction vectors obtained by synthesizing a plurality of excitation code vectors using the analysis parameter, the error from the original speech vector is minimized. And the index of the optimal excitation code vector
Error vector 2 between each predicted vector and the original speech vector
A code excitation linear predictive encoder that determines an optimal excitation code vector based on a square vector, comprising: a weighting circuit that weights each of the square vectors in consideration of a band, based on the weighted square vector. A code excitation linear predictive encoder characterized in that an optimal excitation code vector is determined by using the same.
JP2222558A 1990-08-27 1990-08-27 Code-excited linear predictive encoder Expired - Lifetime JP2892462B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2222558A JP2892462B2 (en) 1990-08-27 1990-08-27 Code-excited linear predictive encoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2222558A JP2892462B2 (en) 1990-08-27 1990-08-27 Code-excited linear predictive encoder

Publications (2)

Publication Number Publication Date
JPH04106599A JPH04106599A (en) 1992-04-08
JP2892462B2 true JP2892462B2 (en) 1999-05-17

Family

ID=16784335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2222558A Expired - Lifetime JP2892462B2 (en) 1990-08-27 1990-08-27 Code-excited linear predictive encoder

Country Status (1)

Country Link
JP (1) JP2892462B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9002308A (en) * 1990-10-23 1992-05-18 Nederland Ptt METHOD FOR CODING AND DECODING A SAMPLED ANALOGUE SIGNAL WITH A REPEATING CHARACTER AND AN APPARATUS FOR CODING AND DECODING ACCORDING TO THIS METHOD
JP2658794B2 (en) * 1993-01-22 1997-09-30 日本電気株式会社 Audio coding method

Also Published As

Publication number Publication date
JPH04106599A (en) 1992-04-08

Similar Documents

Publication Publication Date Title
JP2887286B2 (en) Improvements in the method of compressing digitally coded speech
US5751903A (en) Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
US5734789A (en) Voiced, unvoiced or noise modes in a CELP vocoder
KR100742443B1 (en) A speech communication system and method for handling lost frames
JP3254687B2 (en) Audio coding method
JP2007523388A (en) ENCODER, DEVICE WITH ENCODER, SYSTEM WITH ENCODER, METHOD FOR ENCODING AUDIO SIGNAL, MODULE, AND COMPUTER PROGRAM PRODUCT
US5694426A (en) Signal quantizer with reduced output fluctuation
MXPA06011957A (en) Signal encoding.
KR101350285B1 (en) Signal coding, decoding method and device, system thereof
JP3628268B2 (en) Acoustic signal encoding method, decoding method and apparatus, program, and recording medium
JP3248668B2 (en) Digital filter and acoustic encoding / decoding device
EP0810584A2 (en) Signal coder
JP3531780B2 (en) Voice encoding method and decoding method
JP2892462B2 (en) Code-excited linear predictive encoder
KR100550003B1 (en) Open-loop pitch estimation method in transcoder and apparatus thereof
Tzeng Analysis-by-synthesis linear predictive speech coding at 2.4 kbit/s
JP2736157B2 (en) Encoding device
JP3047761B2 (en) Audio coding device
JPH05232996A (en) Voice coding device
JP2898377B2 (en) Code-excited linear prediction encoder and decoder
JP3192051B2 (en) Audio coding device
Drygajilo Speech Coding Techniques and Standards
Tseng An analysis-by-synthesis linear predictive model for narrowband speech coding
JPH08160996A (en) Voice encoding device
JPH09120300A (en) Vector quantization device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090226

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090226

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100226

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110226

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110226

Year of fee payment: 12