JPH09120300A - Vector quantization device - Google Patents

Vector quantization device

Info

Publication number
JPH09120300A
JPH09120300A JP7277367A JP27736795A JPH09120300A JP H09120300 A JPH09120300 A JP H09120300A JP 7277367 A JP7277367 A JP 7277367A JP 27736795 A JP27736795 A JP 27736795A JP H09120300 A JPH09120300 A JP H09120300A
Authority
JP
Japan
Prior art keywords
vector
quantizer
difference
coefficient
lsp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7277367A
Other languages
Japanese (ja)
Inventor
Masanao Suzuki
政直 鈴木
Takashi Ota
恭士 大田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP7277367A priority Critical patent/JPH09120300A/en
Publication of JPH09120300A publication Critical patent/JPH09120300A/en
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide the vector quantization device which can perform the vector quantization of a speech signal with good efficiency. SOLUTION: A means 21 takes a linear predictive analysis of an input speech signal S2 at different analytic window positions in the same frame to find a 1st LSP(linear spectrum pair) coefficient xi and a 2nd LSP coefficient yi , where the order (i) is a complex value; and a quantizer 22 performs the vector quantization of the 1st LSP coefficient xi , an inverse quantizer 23 performs the inverse quantization of the output quantized value CODE1 of the quantizer 22, and a means 24 finds the difference vector Δi consisting of the difference between the inverse quantized value xqi and the 2nd LSP coefficient yi of the same order. A means 26 decides plural properties of the signal S2 to obtain pieces mO-mK of mode information corresponding to the properties, a means 50 selects quantizers 51-53 corresponding to the mO-mK, and the selected quantizers 51-53 quantize Δi , so that the quantized value COD2 in transmitted.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は音声信号の情報圧縮
を行うことによって音声の符号化を行う装置、特に音声
のスペクトル包絡情報を表すLSP(Line Spectrum Pai
r)係数(線スペクトル対係数)を抽出し、LSP係数を
ベクトル量子化するベクトル量子化装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a device for encoding a voice by compressing the information of the voice signal, and more particularly to an LSP (Line Spectrum Pai) which represents the spectrum envelope information of the voice.
r) The present invention relates to a vector quantizer which extracts a coefficient (line spectrum pair coefficient) and vector-quantizes an LSP coefficient.

【0002】近年、この種の装置は、有線電話のみなら
ず、携帯電話や自動車電話などのディジタル移動体通信
においても広く用いられており、音声品質を保ちつつ高
能率に音声を情報圧縮することが求められている。
In recent years, this type of device has been widely used not only in wired telephones but also in digital mobile communications such as mobile telephones and car telephones, and is capable of efficiently compressing voice information while maintaining voice quality. Is required.

【0003】[0003]

【従来の技術】従来から音声符号化装置において、音声
信号の周波数スペクトル包絡情報を表すLPC係数(線
形予測係数)を伝送するために、これと等価であり、か
つ量子化特性や補間特性の優れたLSP係数に変換して
から量子化する方法が広く用いられている。
2. Description of the Related Art Conventionally, in a speech coder, an LPC coefficient (linear prediction coefficient) representing frequency spectrum envelope information of a speech signal is transmitted, which is equivalent to the LPC coefficient and is excellent in quantization characteristic and interpolation characteristic. A method of converting to LSP coefficients and then quantizing is widely used.

【0004】近年の携帯電話や自動車電話などのディジ
タル移動体通信で採用されている音声符号化方式では、
さらなる量子化効率の向上のため、LSP係数の量子化
にベクトル量子化が用いられている。
In the voice coding system adopted in recent years for digital mobile communication such as mobile phones and car phones,
To further improve the quantization efficiency, vector quantization is used to quantize the LSP coefficient.

【0005】図10に従来のベクトル量子化装置のブロ
ック構成図を示し、その説明を行う。図10において、
11は符号帳、12は選択スイッチ、13は誤差最小化
部、14は減算器である。
FIG. 10 shows a block diagram of a conventional vector quantizer and its description will be given. In FIG.
Reference numeral 11 is a codebook, 12 is a selection switch, 13 is an error minimizing unit, and 14 is a subtractor.

【0006】S1で示す入力信号は10次元のLSP係
数からなるLSP係数ベクトルである。また、符号帳1
1はLSP係数ベクトルS1と同じ10次元の符号ベク
トルをL本格納しており、L本にはそれぞれ1〜Lのイ
ンデックスが割り当てられている。
The input signal indicated by S1 is an LSP coefficient vector consisting of 10-dimensional LSP coefficients. Also, the codebook 1
1 stores L pieces of 10-dimensional code vectors, which is the same as the LSP coefficient vector S1, and indexes L to 1 are assigned to the L pieces.

【0007】減算器14はスイッチ12で順次選択され
る1つの符号ベクトルをLSP係数ベクトルS1から減
算することによって2者の誤差を得るものである。誤差
最小化部13はその誤差が最も小さくなる符号ベクトル
が符号帳11から選択されるようにスイッチ12を制御
するものである。
The subtractor 14 obtains an error between the two by subtracting one code vector sequentially selected by the switch 12 from the LSP coefficient vector S1. The error minimization unit 13 controls the switch 12 so that the code vector having the smallest error is selected from the code book 11.

【0008】このような構成においてベクトル量子化が
行われる場合、L本の符号ベクトルの中からLSP係数
ベクトルS1との誤差(例えばユークリッド距離)が最
も小さくなるベクトルが選択され、この選択された符号
ベクトルのインデックス1〜Lが伝送されることによっ
て伝送情報の圧縮が行われるようになっている。
When vector quantization is performed in such a configuration, a vector having the smallest error (for example, Euclidean distance) from the LSP coefficient vector S1 is selected from the L code vectors, and the selected code is selected. By transmitting the vector indexes 1 to L, the transmission information is compressed.

【0009】[0009]

【発明が解決しようとする課題】上述した従来のベクト
ル量子化装置による音声符号化方式は有線・無線を問わ
ず広く用いられている。
The above-described conventional voice coding method by the vector quantizer is widely used regardless of whether it is wired or wireless.

【0010】無線においては、周波数の有効利用が求め
られているため、伝送レートの削減が必須である。この
ため、ベクトル量子化による情報圧縮の効果を高めるた
めに、符号化処理の単位となる符号化フレーム長(1回
の符号化処理で符号化される入力音声サンプル数)を長
くする傾向がある。
In wireless communication, effective use of frequency is required, and therefore reduction of transmission rate is essential. Therefore, in order to enhance the effect of information compression by vector quantization, the coding frame length (the number of input voice samples coded in one coding process), which is a unit of the coding process, tends to be long. .

【0011】しかし、符号化フレーム長を長くすると音
声の時間変化への追従性が悪くなる場合もあるので、フ
レームをさらに細かく分割したサブフレームを単位とし
てベクトル量子化する対策が取られることが多いが、逆
に伝送する情報が増えるという矛盾が生じる。音声符号
化において必須である線形予測係数の量子化においては
これが大きな問題となっていた。
However, if the length of the coded frame is increased, the ability to follow the time change of the voice may be deteriorated. Therefore, it is often the case that vector quantization is performed in units of subframes obtained by further dividing the frame. However, there is a contradiction that the information to be transmitted increases. This has been a big problem in the quantization of linear prediction coefficients, which is essential in speech coding.

【0012】この問題を解決するために、これまでに様
々な手法が提案されている。例えば、マトリクス量子
化、予測型ベクトル量子化、差分ベクトル量子化などの
手法がある。
To solve this problem, various methods have been proposed so far. For example, there are techniques such as matrix quantization, predictive vector quantization, and difference vector quantization.

【0013】マトリクス量子化は、ベクトル量子化の拡
張であり、複数のベクトルを一つのマトリクスと見なし
て量子化する手法であり、情報圧縮度が高いが行列間の
距離計算をコードブック内の行列の数分だけ繰り返さな
ければならないため、演算量が膨大になってしまうとい
う欠点がある。
Matrix quantization is an extension of vector quantization, and is a method of quantizing a plurality of vectors by treating them as one matrix. Although the degree of information compression is high, the distance calculation between matrices is performed in a matrix in a codebook. Since it has to be repeated for several minutes, there is a drawback that the amount of calculation becomes huge.

【0014】予測ベクトル量子化、差分ベクトル量子化
は隣接するフレーム間のLSP係数に相関があることを
利用して情報圧縮を実現する手法である。しかし、これ
らの手法を無線などに用いる場合には伝送エラーの問題
が生じる。
Prediction vector quantization and difference vector quantization are techniques for realizing information compression by utilizing the fact that there is a correlation between LSP coefficients between adjacent frames. However, when these methods are used for radio or the like, a problem of transmission error occurs.

【0015】無線ではフェージング等の影響による伝送
エラーが避けられない。予測ベクトル量子化、差分ベク
トル量子化は過去のLSP係数を用いるため、伝送エラ
ーが生じてLSP係数に誤りが生じた場合、その影響が
後続のフレームまで続いてしまうという大きな問題があ
る。
In wireless, transmission errors due to the effects of fading are unavoidable. Since prediction vector quantization and difference vector quantization use past LSP coefficients, if a transmission error occurs and an error occurs in the LSP coefficient, there is a big problem that the influence continues to the subsequent frame.

【0016】音声符号化装置において、LSP係数の誤
りは致命的であり、誤ったLSP係数で音声を再生する
と、入力音声とは全く異なる信号が再生されてしまう可
能性が高い。
In the speech coding apparatus, the error of the LSP coefficient is fatal, and if the speech is reproduced with the wrong LSP coefficient, there is a high possibility that a signal completely different from the input speech will be reproduced.

【0017】本発明は、このような点に鑑みてなされた
ものであり、音声信号の効率のよいベクトル量子化を行
うことができるベクトル量子化装置を提供することを目
的としている。
The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a vector quantizer capable of performing efficient vector quantization of a voice signal.

【0018】[0018]

【課題を解決するための手段】図1に本発明の原理図を
示す。この図に示すベクトル量子化装置は、入力音声信
号S2を分析して線形予測係数を抽出し、これを量子化
して伝送するものであり、本発明の特徴は、入力音声信
号S2を同一フレーム内で異なる分析窓位置で線形予測
分析することによって次数iが複数値を取る第1LSP
係数xi 及び第2LSP係数yi を求める分析手段21
と、第1LSP係数xi のベクトル量子化を行うベクト
ル量子化器22と、ベクトル量子化器22の出力量子化
値CODE1の逆量子化を行う逆量子化器23と、逆量
子化器23の出力逆量子化値xqiと第2LSP係数yi
との同じ次数同士の差分からなる差分ベクトルΔi を求
める差分検出手段24と、入力音声信号S2の複数の性
質を判定し、この判定された性質に応じたモード情報m
0〜mKを得る判定手段26と、入力音声信号S2の複
数の性質に対応する第1〜第K差分ベクトル量子化器5
1〜53と、判定手段26から出力されるモード情報m
0〜mKに対応する第1〜第K差分ベクトル量子化器5
1〜53を選択し、この選択された第1〜第K差分ベク
トル量子化器51〜53へ差分ベクトルΔi が供給され
るようにする選択手段50とを具備し、第1〜第K差分
ベクトル量子化器51〜53で量子化された差分ベクト
ルCODE2を伝送するように構成したことである。
FIG. 1 shows the principle of the present invention. The vector quantizer shown in this figure analyzes the input speech signal S2, extracts a linear prediction coefficient, and quantizes and transmits the linear prediction coefficient. The feature of the present invention is that the input speech signal S2 is transmitted in the same frame. The first LSP in which the order i takes multiple values by performing linear prediction analysis at different analysis window positions in
Analyzing means 21 for obtaining the coefficient x i and the second LSP coefficient y i
A vector quantizer 22 for vector quantizing the first LSP coefficient x i ; an inverse quantizer 23 for inverse quantizing the output quantized value CODE1 of the vector quantizer 22; and an inverse quantizer 23 Output dequantized value x qi and second LSP coefficient y i
The difference detection means 24 for obtaining the difference vector Δ i consisting of the difference between the same orders with and the plurality of properties of the input audio signal S2 are determined, and the mode information m according to the determined properties.
The determining means 26 for obtaining 0 to mK, and the first to Kth difference vector quantizers 5 corresponding to a plurality of properties of the input speech signal S2.
1 to 53 and the mode information m output from the determination means 26
First to Kth difference vector quantizers 5 corresponding to 0 to mK
1-53, and a selecting means 50 for supplying the difference vector Δ i to the selected first-Kth difference vector quantizers 51-53. That is, the difference vector CODE2 quantized by the vector quantizers 51 to 53 is transmitted.

【0019】[0019]

【発明の実施の形態】以下、図面を参照して本発明の一
実施の形態について説明する。図2は本発明の一実施形
態によるベクトル量子化装置のブロック構成図である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. FIG. 2 is a block diagram of a vector quantization apparatus according to an exemplary embodiment of the present invention.

【0020】図2において、21はLPC分析部、22
はベクトル量子化器、23は逆量子化器、24,27,
28は減算器、25はベクトル分割部、26はモード判
定部、29,30は誤差最小化部、31,32,33,
34,35,36,37,38,39,40は選択スイ
ッチ、B0,B1,B2,B3,C0,C1,C2,C
3は符号帳である。
In FIG. 2, reference numeral 21 denotes an LPC analysis unit, 22
Is a vector quantizer, 23 is an inverse quantizer, 24, 27,
28 is a subtractor, 25 is a vector division unit, 26 is a mode determination unit, 29 and 30 are error minimization units, 31, 32, 33,
34, 35, 36, 37, 38, 39, 40 are selection switches, B0, B1, B2, B3, C0, C1, C2, C
3 is a codebook.

【0021】このような構成要素から成るベクトル量子
化装置において、図3に示すように、入力音声信号S2
における1フレーム内で複数回(この例では2回)のL
PC分析を行うことによって得られるLSP係数をベク
トル量子化する場合を考える。但し、LPC分析とは、
音声サンプル間の近接相関を利用して、音声信号の周波
数特性を推定する手法である。言い換えると、音声生成
モデルにおける声道の特性を近似するフィルタの係数を
入力音声から推定する手法である。
In the vector quantizer comprising such components, as shown in FIG. 3, the input voice signal S2
Multiple times (two times in this example) within one frame in
Consider the case of vector-quantizing the LSP coefficient obtained by performing the PC analysis. However, what is LPC analysis?
This is a method of estimating the frequency characteristics of a voice signal by using the close correlation between voice samples. In other words, it is a method of estimating the coefficient of the filter that approximates the characteristics of the vocal tract in the voice generation model from the input voice.

【0022】このようなLPC分析を複数回行うことに
より音声品質は向上するが、従来技術で説明したように
ベクトル量子化をフレーム内で複数回行うと、LPC分
析を1回行う場合に比べてその回数分だけ伝送すべき情
報量が増えてしまう。
Speech quality is improved by performing such LPC analysis a plurality of times. However, when vector quantization is performed a plurality of times within a frame as described in the prior art, compared to the case where LPC analysis is performed once. The amount of information to be transmitted increases by the number of times.

【0023】図2に示すLPC分析部21は、LPC分
析を2回行う場合を示しており、1回目及び2回目のL
PC分析で得られたLSP係数を、図3に示すようにそ
れぞれLSP1i ,(i=1,…,10)、LSP
i ,(i=1,…,10)とする。
The LPC analysis unit 21 shown in FIG. 2 shows a case where the LPC analysis is performed twice, and the LPC analysis at the first and second times is performed.
As shown in FIG. 3, the LSP coefficients obtained by the PC analysis are LSP1 i , (i = 1, ..., 10), LSP, respectively.
Let 2 i , (i = 1, ..., 10).

【0024】このように得られたLSP1i が、ベクト
ル量子化器22でベクトル量子化することによって、伝
送すべきインデックスCODE1を決定する。次に、C
ODE1を入力として、逆量子化器23によりLSP1
i の逆量子化値LSP1qi ,(i=1,…,10)を
求める。ここで用いる逆量子化器23は、受信側(復号
器側)で用いる逆量子化器と同じものである。
The LSP1 i thus obtained is vector-quantized by the vector quantizer 22 to determine the index CODE1 to be transmitted. Next, C
Using the ODE1 as an input, the inverse quantizer 23 uses the LSP1
dequantized value LSP1q i of i, a (i = 1, ..., 10 ) determined. The inverse quantizer 23 used here is the same as the inverse quantizer used on the receiving side (decoder side).

【0025】減算器24によりLSP1qi とLSP2
i の差分Δi を求める。ここで、 Δi =LSP1qi −LSP2i ,(i=1,…,10) (1) である。尚、減算の仕方は Δi =LSP2i −LSP1qi ,(i=1,…,10) (2) でもよい。以下では式(1)とした場合について説明す
る。
The subtractor 24 causes LSP1q i and LSP2
Find the difference Δ i between i . Here, Δ i = LSP1q i -LSP2 i , (i = 1, ..., 10) is (1). The subtraction method may be Δ i = LSP2 i −LSP1 q i , (i = 1, ..., 10) (2). In the following, the case where the formula (1) is used will be described.

【0026】LSP係数の各次数の値の存在範囲は必ず
0〜πの間にある。ここでπはナイキスト周波数であ
る。従って、LSP係数はπで正規化すると0〜1の間
に存在する。
The existence range of the value of each order of the LSP coefficient is always between 0 and π. Where π is the Nyquist frequency. Therefore, the LSP coefficient exists between 0 and 1 when normalized by π.

【0027】一方、式(1)で求めた差分Δi の各次数
の値の存在範囲は更に狭くほぼ−0.25〜0.25の
間にあることが知られている。即ち、Δi の分布の範囲
は元のLSP係数(ここではLSP2i )の存在範囲の
ほぼ半分である。
On the other hand, it is known that the range of existence of the values of the respective orders of the difference Δ i obtained by the equation (1) is narrower and is approximately between −0.25 and 0.25. That is, the range of the distribution of Δ i is almost half of the existing range of the original LSP coefficient (here, LSP2 i ).

【0028】また、Δi の分布は音声の性質によっても
異なっている。従って、音声の性質に着目してΔi を量
子化する方が単にLSP2i を量子化するよりも効率が
よい。
The distribution of Δ i also differs depending on the nature of the voice. Therefore, it is more efficient to quantize Δ i by paying attention to the nature of speech than to simply quantize LSP2 i .

【0029】ここで、現在符号化しようしているフレー
ムの音声信号S2の性質を表すモード情報を用いる。音
声信号S2はその性質から有声部、無声部、無声
から有声への変化部、有声から無声への変化部などの
いくつかのモードに分けられる。
Here, the mode information representing the property of the audio signal S2 of the frame currently being encoded is used. The voice signal S2 is divided into several modes such as voiced part, unvoiced part, unvoiced to voiced part, and voiced to unvoiced part.

【0030】Δi の分布はモードによっても異なってい
る。従って、音声の性質ごと、つまりモードごとにΔi
に対して最適な符号帳を用意しておくことにより従来の
ベクトル量子化よりも効率よく量子化できる。但し、符
号帳はあらかじめ学習しておく必要がある。
The distribution of Δ i also differs depending on the mode. Therefore, Δ i for each voice property, that is, for each mode
Quantization can be performed more efficiently than conventional vector quantization by preparing an optimal codebook for. However, the codebook needs to be learned in advance.

【0031】以上説明したように本発明は、音声の性質
を利用して入力音声信号S2を複数のモードに分け、各
モードごとに用意した符号帳を用いてLSP係数の差分
を効率良くベクトル量子化する構成をとっている。但
し、LSP1i とLSP2i を入れ換えた場合において
も、上記の論理は成立する。
As described above, according to the present invention, the input voice signal S2 is divided into a plurality of modes by utilizing the nature of voice, and the difference between the LSP coefficients is efficiently vector-quantized by using the codebook prepared for each mode. It has a structure to be converted. However, the above logic holds even when the LSP1 i and LSP2 i are interchanged.

【0032】ここで、LSP(LSP1qi とLSP2
i )の差分Δi を求め、その差分Δ i をモードによって
異なるベクトル量子化器(各符号帳B0〜B3とC0〜
C3に該当)を用いて量子化する利点について説明す
る。
Here, LSP (LSP1qiAnd LSP2
i) Difference ΔiAnd the difference Δ iDepending on the mode
Different vector quantizers (each codebook B0 to B3 and C0
Explain the advantage of quantization using C3)
You.

【0033】図4及び図5にLSPの差分Δi のヒスト
グラムを示す。ここで用いたLSPは、サンプリング周
波数8KHzでA/D変換して得られた400単文章
(約30分間)のデータをLPC分析して求めたもので
ある。分析次数は10次とした。
4 and 5 show histograms of LSP differences Δ i . The LSP used here is obtained by LPC analysis of data of 400 single sentences (about 30 minutes) obtained by A / D conversion at a sampling frequency of 8 KHz. The analysis order was 10th.

【0034】図4は音声の有声部のΔi であり、図5は
音声が有声部から無声部に変化する部分のΔi である。
図4及び図5では説明を容易にするため1,2,7,8
次を例に取って掲載している。
[0034] FIG. 4 is a delta i voiced portion of speech, and FIG. 5 is a delta i of the part sound is changed to unvoiced portion from the voiced portion.
In FIG. 4 and FIG. 5, 1, 2, 7, and 8 are provided for ease of explanation.
The following is an example.

【0035】図4及び図5から明らかなように、Δi
平均値はほぼ0であり、平均値の近傍に局在化してい
る。これは、LSP係数の時間的な変化が小さいことに
よるものである。
As is apparent from FIGS. 4 and 5, the average value of Δ i is almost 0 and is localized in the vicinity of the average value. This is because the temporal change of the LSP coefficient is small.

【0036】また、Δi の次数によっても分布が異なる
ことが分かり、傾向としては低次の差分ほど分散が小さ
く、高次の差分は分散が大きい。また、モードによって
もΔ i の分布の形が異なっていることがわかる。
Also, ΔiDistribution depends on the degree of
It is clear that the lower the difference, the smaller the variance.
In addition, high-order differences have large variance. Also, depending on the mode
Also Δ iIt can be seen that the distribution forms of are different.

【0037】従って、Δi (1〜10次)を低次側(例
えば1〜4次)のΔL と高次側(例えば5〜10次)の
ΔH の2つのベクトルにベクトル分割部25で分割し、
各ベクトルΔL ,ΔH を入力フレームの音声の性質に最
適な量子化器を用いて量子化すれば、高い量子化効率が
得られる。但し、Δi の分割数は2以上でもよい。
[0037] Therefore, delta i (1 to 10 order) low-order side (e.g. 1-4 order) of delta L and higher side (for example, 5 to 10 order) of delta vectors split section into two vectors of H 25 Split with
If each vector Δ L , Δ H is quantized using a quantizer that is optimal for the nature of the speech of the input frame, high quantization efficiency can be obtained. However, the number of divisions of Δ i may be two or more.

【0038】即ち、モード判定部26から出力されるモ
ード情報mode0〜3に応じてスイッチ31で符号帳
B0〜B3の何れかを選択し、この選択された符号帳
(例えばB0)の符号ベクトルをスイッチ32で順次選
択し、この選択される1つの符号ベクトルを減算器27
においてΔL から減算することによって2者の誤差を取
得し、誤差最小化部29によって、その誤差が最も小さ
くなる符号ベクトルが符号帳B0から選択されるように
スイッチ32を制御するようになっている。また符号帳
C0〜C3側も同様に制御されるのでその説明を省略す
る。
That is, any one of the codebooks B0 to B3 is selected by the switch 31 according to the mode information modes 0 to 3 output from the mode determination unit 26, and the code vector of the selected codebook (for example, B0) is selected. The switches 32 are sequentially selected, and the selected one code vector is subtracted by the subtractor 27.
The error between the two is obtained by subtracting from Δ L in Δ, and the error minimization unit 29 controls the switch 32 so that the code vector having the smallest error is selected from the code book B0. There is. Further, the codebooks C0 to C3 are also controlled in the same manner, and the description thereof will be omitted.

【0039】次に、このような構成のベクトル量子化装
置の動作を説明する。入力音声信号S2は一定数のサン
プルからなるフレームを単位として処理される。即ち、
フレーム内の音声信号S2がLPC分析部21に入力さ
れ、LPC分析部21において異なる分析窓位置で2回
のLPC分析が実行され、2組のLSP係数LSP
i ,LSP2i ,(i=1,…,10)が求められ
る。
Next, the operation of the vector quantizer having such a configuration will be described. The input audio signal S2 is processed in units of frames including a fixed number of samples. That is,
The voice signal S2 in the frame is input to the LPC analysis unit 21, and the LPC analysis unit 21 performs the LPC analysis twice at different analysis window positions to obtain two sets of LSP coefficient LSP.
1 i , LSP2 i , (i = 1, ..., 10) are obtained.

【0040】ここで、LSP係数の算出については、始
めにLPC係数(α係数)又はPARCOR係数を先に
求めてからLSP係数に変換することもできる。一方、
モード判定部26においては、音声信号S2の性質を分
析してモードが判別され、モード情報mode0〜3が
出力される。モードの判別法としては、既に提案されて
いる任意の手法を用いることができる。
Here, regarding the calculation of the LSP coefficient, it is also possible to first obtain the LPC coefficient (α coefficient) or the PARCOR coefficient and then convert the LPC coefficient into the LSP coefficient. on the other hand,
In the mode determination unit 26, the characteristics of the audio signal S2 are analyzed to determine the mode, and the mode information modes 0 to 3 are output. As a method for discriminating modes, any method already proposed can be used.

【0041】ここでは、前述したように音声を無声部、
有声から無声への変化部、無声から有声への変化部、有
声部の4つのモードに分類し、それぞれのモードに0、
1、2、3の番号を割り当てる。従って、モード情報は
mode0〜3の4通りの値を取ることになる。
Here, as described above, the voice is converted to the unvoiced part,
It is classified into four modes: voiced to unvoiced change part, unvoiced to voiced change part, and voiced part change mode.
Assign numbers 1, 2, and 3. Therefore, the mode information has four values of modes 0 to 3.

【0042】LSP1i は量子化器1により量子化さ
れ、量子化結果である符号CODE1が求められる。量
子化器1としては、既に提案されている任意の量子化手
法を用いることができる。
The LSP1 i is quantized by the quantizer 1 to obtain the code CODE1 which is the quantization result. As the quantizer 1, any previously proposed quantization method can be used.

【0043】次に、CODE1は逆量子化器23に入力
されてLSP1i の量子化値LSP1qi が求められ
る。そして減算器24においてLSP1qi とLSP2
i の差分Δi が次式により求められる。 Δi =LSP1qi −LSP2i (i=1,…,10) (3) Δi はベクトル分割部25に入力され、低次側(例えば
1〜4次)からなるΔ L と、高次側(例えば5〜10
次)からなるΔH の2つのベクトルが生成される。
Next, CODE1 is input to the inverse quantizer 23.
Is LSP1iQuantized value of LSP1qiIs sought
You. Then, in the subtractor 24, LSP1qiAnd LSP2
iDifference ΔiIs calculated by the following equation. Δi= LSP1qi-LSP2i(I = 1, ..., 10) (3) ΔiIs input to the vector division unit 25, and the low-order side (for example,
1 to 4) LAnd the higher side (for example 5-10
) Consisting ofHTwo vectors are generated.

【0044】次に、ΔL とΔH をそれぞれベクトル量子
化するが、その際に用いる符号帳B0〜B3,C0〜C
3をモード情報mode0〜3に応じて選択する。ここ
で、符号帳B0、符号帳B1、符号帳B2、符号帳B3
はΔL 用の符号帳であり、それぞれモード0、1、2、
3に対応している。
Next, Δ L and Δ H are vector-quantized, respectively. The code books B0 to B3 and C0 to C used at that time are quantized.
3 is selected according to the mode information modes 0 to 3. Here, codebook B0, codebook B1, codebook B2, codebook B3
Is a codebook for Δ L , and modes 0, 1, 2, and
3 is supported.

【0045】また、符号帳C0、符号帳C1、符号帳C
2、符号帳C3はΔH 用の符号帳であり、それぞれモー
ド0、1、2、3に対応している。各符号帳は、予め各
モード用に学習されているものとする。
Codebook C0, codebook C1, codebook C
2, codebook C3 is a codebook for Δ H , and corresponds to modes 0, 1, 2, and 3, respectively. It is assumed that each codebook has been learned in advance for each mode.

【0046】ΔL 、ΔH のベクトル量子化をmode3
で行う場合、即ち入力音声信号S2が有声部の際にベク
トル量子化を行う場合を例に取って説明する。まず、m
ode3の情報に応じたスイッチ31の選択動作によっ
て、ΔL に対して符号帳B3が選択される。符号帳B3
内に格納されている全ての符号ベクトルとΔL との間の
誤差が減算器27で計算され、その誤差が最も小さくな
る符号ベクトルが誤差最小化部29の制御によるスイッ
チ35の選択動作によって選択され、この選択符号ベク
トルのインデックスが伝送される。
Vector quantization of Δ L and Δ H is performed in mode3.
The case of performing vector quantization when the input voice signal S2 is a voiced portion will be described as an example. First, m
The codebook B3 is selected for Δ L by the selection operation of the switch 31 in accordance with the information of the node 3. Codebook B3
The error between all the code vectors stored in the matrix and Δ L is calculated by the subtractor 27, and the code vector with the smallest error is selected by the selection operation of the switch 35 under the control of the error minimization unit 29. Then, the index of this selected code vector is transmitted.

【0047】但し、誤差の尺度にはユークリッド距離を
用いることができる。また、処理量削減のため、何らか
の予備選択を行うことにより符号帳内の一部の符号ベク
トルと誤差評価することもできる。
However, the Euclidean distance can be used as a measure of the error. Further, in order to reduce the processing amount, it is possible to evaluate the error with some code vectors in the codebook by performing some preliminary selection.

【0048】ΔH に対しては、符号帳C3が選択される
点以外はΔL の場合と同様であるので、説明を省略す
る。また、他のモードが選択された場合も用いる符号帳
が異なる点以外は同様であるので説明を省略する。
The procedure for Δ H is the same as that for Δ L except that codebook C3 is selected, and a description thereof will be omitted. The description is omitted because the same is applied except that the codebook used is different when another mode is selected.

【0049】復号側(受信側)では、全く同じ符号帳を
持つことにより、受け取ったインデックスから容易にL
SPの量子化値を再生することができる。この実施形態
では、モードの数だけ符号帳が必要となるが、ΔL 、Δ
H の分布の偏りを利用しているため、LSP係数をその
まま量子化する従来のベクトル量子化に比べて小さいサ
イズ符号帳で( 少ない伝送情報で) 効率良く量子化が実
現できる。
Since the decoding side (reception side) has exactly the same codebook, it is easy to use L from the received index.
The quantized value of SP can be reproduced. In this embodiment, as many codebooks as the number of modes are required, but Δ L , Δ
Since the bias of the distribution of H is used, the quantization can be efficiently realized with a smaller size codebook (with less transmission information) than the conventional vector quantization in which the LSP coefficient is quantized as it is.

【0050】また、LSP係数の差分ではなくPARC
OR係数(Kパラメータ又は反射係数と呼ばれることも
ある。) の差分を量子化するようにしてもよい。この場
合はPARCOR係数の差分を量子化する点が上述した
実施形態と異なるだけで他の部分は同じであるので説明
を省略する。
Further, PARC is used instead of LSP coefficient difference.
You may make it quantize the difference of OR coefficient (It may be called a K parameter or a reflection coefficient.). In this case, the point that the difference between PARCOR coefficients is quantized is different from the above-described embodiment, and the other parts are the same, so the description will be omitted.

【0051】ここで、本発明の量子化器(図2に示すベ
クトル量子化器22)の性能を検証するため、本発明の
量子化器による量子化誤差(変換誤差)と、本発明の量
子化器22の代わりに、既に提案されている24bit
二分割/二段ベクトル量子化器(以下では、これを参照
量子化器と呼ぶ。)との双方を用いてLSP2i を量子
化した時の量子化誤差を比較する。
Here, in order to verify the performance of the quantizer of the present invention (the vector quantizer 22 shown in FIG. 2), the quantization error (conversion error) by the quantizer of the present invention and the quantum of the present invention will be described. 24 bits already proposed instead of the rectifier 22
The quantization error when the LSP2 i is quantized by using both of the two-division / two-stage vector quantizer (hereinafter referred to as a reference quantizer) is compared.

【0052】尚、参照量子化器は30bitのスカラー
量子化と同等の特性であり、高い量子化効率を有するも
のであることが知られている。また、量子化器の性能を
表す尺度として、量子化前のLSP係数と量子化後のL
SP係数との間のLPCケプストラム距離(以下CDと
呼ぶ。)を用いる。CDは周波数領域における距離尺度
であり、式(4)で定義される。
It is known that the reference quantizer has characteristics equivalent to 30-bit scalar quantization and has high quantization efficiency. Further, as a measure of the performance of the quantizer, the LSP coefficient before quantization and the LSP after quantization are used.
The LPC cepstrum distance (hereinafter referred to as CD) with the SP coefficient is used. CD is a distance measure in the frequency domain and is defined by equation (4).

【0053】[0053]

【数1】 (Equation 1)

【0054】ここで、Cx (i) 、Cy (i) はそれぞれ量
子化前のLSP係数、量子化後のLSP係数から求めら
れるLPCケプストラム係数である。また、p=30と
した。CDの値が小さい程、量子化による量子化誤差が
小さいことを意味する。
Here, C x (i) and C y (i) are LPC cepstrum coefficients obtained from the LSP coefficient before quantization and the LSP coefficient after quantization, respectively. Also, p = 30. The smaller the CD value, the smaller the quantization error due to quantization.

【0055】評価には符号帳の学習に用いなかった40
単文章(約5分間)を用いた。サンプリング周波数は8
KHzである。図6に音声信号S2の有声部におけるC
D特性を示し、図7に無声部におけるCD特性、図8に
有声から無声へ変化する部分におけるCD特性、図9に
無声から有声へ変化する部分におけるCD特性を示す。
40 was not used for learning the codebook for evaluation.
A single sentence (about 5 minutes) was used. The sampling frequency is 8
KHz. FIG. 6 shows C in the voiced part of the voice signal S2.
FIG. 7 shows the CD characteristics in the unvoiced part, FIG. 8 shows the CD characteristics in the part where voiced changes to unvoiced, and FIG. 9 shows the CD characteristics in the part where voiced changes to unvoiced.

【0056】図6〜図9に示す何れのモードにおいても
参照量子化器よりもビット数の少ない本発明の量子化器
で参照量子化器の性能を上回っている。特に、図6に示
す有声部のモードにおいては、わずか14bitの本発
明の量子化器で24bitの参照量子化器と同等の性能
を達成している。
In any of the modes shown in FIGS. 6 to 9, the quantizer of the present invention having a smaller number of bits than the reference quantizer exceeds the performance of the reference quantizer. Particularly, in the voiced mode shown in FIG. 6, the quantizer of the present invention having only 14 bits achieves the same performance as that of the reference quantizer of 24 bits.

【0057】また、図8に示す有声から無声へ変化する
モード、図9に示す無声から有声へ変化するモードにお
いては、有声部のモードよりも2bitだけ大きな符号
帳サイズが必要であることが分かった。
Further, in the mode of changing from voiced to unvoiced shown in FIG. 8 and in the mode of changing from unvoiced to voiced shown in FIG. 9, it is found that a codebook size larger by 2 bits than the mode of the voiced part is required. It was

【0058】これは、有声部のモードにおけるLSPの
差分の分散よりも有声から無声へ変化するモード、無声
から有声へ変化するモードにおけるLSPの差分の分散
の方が多きいためと考えられる。
It is considered that this is because the variance of the LSP difference in the voiced mode is greater than the variance of the LSP difference in the voiced mode, and the variance of the LSP difference in the unvoiced to voiced mode is larger.

【0059】以上の説明してように、本実施形態のベク
トル量子化装置によれば、従来のベクトル量子化装置よ
りもはるかに効率よくベクトル量子化を行うことが可能
である。
As described above, according to the vector quantizing device of this embodiment, it is possible to perform vector quantizing much more efficiently than the conventional vector quantizing device.

【0060】[0060]

【発明の効果】以上説明したように、本発明のベクトル
量子化装置によれば、音声の性質を利用してLSP係数
を効率よくベクトル量子化することによって、音声信号
の効率のよいベクトル量子化を行うことができる効果が
ある。
As described above, according to the vector quantizing device of the present invention, the LSP coefficient is efficiently vector-quantized by utilizing the property of the voice, so that the efficient vector quantizing of the voice signal is performed. There is an effect that can be done.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理図である。FIG. 1 is a principle diagram of the present invention.

【図2】本発明の一実施形態によるベクトル量子化装置
のブロック構成図である。
FIG. 2 is a block diagram of a vector quantization device according to an exemplary embodiment of the present invention.

【図3】LPC分析とフレームの関係を説明するための
図である。
FIG. 3 is a diagram for explaining the relationship between LPC analysis and frames.

【図4】有声部の音声におけるLSPの差分のヒストグ
ラムを示す図である。
FIG. 4 is a diagram showing a histogram of LSP differences in voiced voice.

【図5】有声部から無声部へ変化する部分におけるLS
Pの差分のヒストグラムを示す図である。
FIG. 5: LS in the part where the voiced part changes to the unvoiced part
It is a figure which shows the histogram of the difference of P.

【図6】有声部におけるCD特性を示す図である。FIG. 6 is a diagram showing a CD characteristic in a voiced part.

【図7】無声部におけるCD特性を示す図である。FIG. 7 is a diagram showing a CD characteristic in an unvoiced part.

【図8】有声から無声へ変化する部分におけるCD特性
を示す図である。
FIG. 8 is a diagram showing CD characteristics in a portion where voiced voice changes to unvoiced voice.

【図9】無声から有声へ変化する部分におけるCD特性
を示す図である。
FIG. 9 is a diagram showing CD characteristics in a portion where voicelessness changes to voiced sound.

【図10】従来例によるベクトル量子化装置のブロック
構成図である。
FIG. 10 is a block configuration diagram of a vector quantization device according to a conventional example.

【符号の説明】[Explanation of symbols]

21 分析手段 22 ベクトル量子化器 23 逆量子化器 24 差分検出手段 26 判定手段 50 選択手段 51〜53 第1〜第K差分ベクトル量子化器 S2 入力音声信号 xi 第1LSP係数 yi 第2LSP係数 CODE1 第1LSP係数xi のベクトル量子化値 xqi ベクトル量子化値CODE1の逆量子化値 Δi 差分ベクトル m0〜mK モード情報 CODE2 差分ベクトルΔi の量子化値21 analysis means 22 vector quantizer 23 inverse quantizer 24 difference detection means 26 judgment means 50 selection means 51-53 1st-Kth difference vector quantizer S2 input speech signal x i first LSP coefficient y i second LSP coefficient CODE1 vector quantized value of first LSP coefficient x i x qi vector quantized value inverse quantized value of CODE1 Δ i difference vector m0 to mK mode information CODE2 quantized value of difference vector Δ i

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 入力音声信号を分析して線形予測係数を
抽出し、これを量子化して伝送するベクトル量子化装置
において、 前記入力音声信号を同一フレーム内で異なる分析窓位置
で線形予測分析することによって次数iが複数値を取る
第1LSP係数xi 及び第2LSP係数yi を求める分
析手段と、 該第1LSP係数xi のベクトル量子化を行うベクトル
量子化器と、 該ベクトル量子化器の出力量子化値の逆量子化を行う逆
量子化器と、 該逆量子化器の出力逆量子化値と、該第2LSP係数y
i との同じ次数同士の差分からなる差分ベクトルを求め
る差分検出手段と、 該入力音声信号の複数の性質を判定し、この判定された
性質に応じたモード情報を得る判定手段と、 該入力音声信号の複数の性質に対応する第1〜第K差分
ベクトル量子化器と、 該判定手段から出力されるモード情報に対応する該第1
〜第K差分ベクトル量子化器を選択し、この選択された
第1〜第K差分ベクトル量子化器へ該差分ベクトルが供
給されるようにする選択手段とを具備し、 前記第1〜第K差分ベクトル量子化器で量子化された前
記差分ベクトルを伝送することを特徴とするベクトル量
子化装置。
1. A vector quantizer which analyzes an input speech signal to extract a linear prediction coefficient, quantizes and transmits the coefficient, and performs linear prediction analysis on the input speech signal at different analysis window positions within the same frame. By analyzing the first LSP coefficient x i and the second LSP coefficient y i , the vector quantizer performing vector quantization of the first LSP coefficient x i , and the vector quantizer An inverse quantizer that performs inverse quantization of the output quantized value, an output inverse quantized value of the inverse quantizer, and the second LSP coefficient y
difference detecting means for obtaining a difference vector composed of differences of the same degree with i , judging means for judging a plurality of properties of the input voice signal, and obtaining mode information according to the judged properties, and the input voice First to Kth difference vector quantizers corresponding to a plurality of properties of the signal, and the first corresponding to the mode information output from the determining means.
To Kth difference vector quantizers, and selecting means for supplying the difference vectors to the selected first to Kth difference vector quantizers, A vector quantization device, which transmits the difference vector quantized by a difference vector quantizer.
【請求項2】 前記次数iが1,…,10の10次であ
ることを特徴とするベクトル量子化装置。
2. A vector quantizer, wherein the order i is a tenth order of 1, ..., 10.
【請求項3】 前記モード情報が、前記入力音声信号の
有声部に対応するもの、無声部に対応するもの、無声か
ら有声への変化部に対応するもの、有声から無声への変
化部に対応するものであることを特徴とする請求項1又
は2記載のベクトル量子化装置。
3. The mode information corresponds to a voiced portion of the input audio signal, a voiceless portion thereof, a voiceless to voiced portion thereof, and a voiced to voiceless portion of the input audio signal. The vector quantization device according to claim 1 or 2, characterized in that
【請求項4】 前記差分ベクトルを低次群及び高次群の
差分ベクトルに分割するベクトル分割手段と、前記第1
〜第K差分ベクトル量子化器として、該低次群の差分ベ
クトルを量子化する低次群用の第1〜第K差分ベクトル
量子化器と、該高次群の差分ベクトルを量子化する高次
群用の第1〜第K差分ベクトル量子化器とを具備し、前
記選択手段が前記モード情報に応じて該低次群及び高次
群用の第1〜第K差分ベクトル量子化器を選択するよう
にし、この選択された該低次群及び高次群用の差分ベク
トル量子化器で量子化された差分ベクトルを伝送するよ
うにしたことを特徴とする請求項1〜3の何れかに記載
のベクトル量子化装置。
4. A vector division means for dividing the difference vector into a difference vector of a low order group and a difference vector of a high order group;
As Kth difference vector quantizers, first to Kth difference vector quantizers for low-order groups that quantize the difference vectors of the low-order group and high-order groups for quantizing difference vectors of the high-order group A first to a Kth difference vector quantizer, wherein the selecting means selects the first to the Kth difference vector quantizers for the low-order group and the high-order group according to the mode information. The vector quantization device according to claim 1, wherein the selected difference vector quantizer for the low-order group and the high-order group transmits a difference vector quantized.
【請求項5】 LSP係数の代わりにPARCOR係数
を用いることを特徴とする請求項1〜4の何れかに記載
のベクトル量子化装置。
5. The vector quantizer according to claim 1, wherein PARCOR coefficients are used instead of LSP coefficients.
JP7277367A 1995-10-25 1995-10-25 Vector quantization device Pending JPH09120300A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7277367A JPH09120300A (en) 1995-10-25 1995-10-25 Vector quantization device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7277367A JPH09120300A (en) 1995-10-25 1995-10-25 Vector quantization device

Publications (1)

Publication Number Publication Date
JPH09120300A true JPH09120300A (en) 1997-05-06

Family

ID=17582546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7277367A Pending JPH09120300A (en) 1995-10-25 1995-10-25 Vector quantization device

Country Status (1)

Country Link
JP (1) JPH09120300A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008242029A (en) * 2007-03-27 2008-10-09 Casio Comput Co Ltd Speech encoding device, speech decoding device, speech encoding method, speech decoding method, and program
WO2010092827A1 (en) * 2009-02-13 2010-08-19 パナソニック株式会社 Vector quantization device, vector inverse-quantization device, and methods of same
JP2011009869A (en) * 2009-06-23 2011-01-13 Nippon Telegr & Teleph Corp <Ntt> Encoding method, decoding method, encoder, decoder, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008242029A (en) * 2007-03-27 2008-10-09 Casio Comput Co Ltd Speech encoding device, speech decoding device, speech encoding method, speech decoding method, and program
WO2010092827A1 (en) * 2009-02-13 2010-08-19 パナソニック株式会社 Vector quantization device, vector inverse-quantization device, and methods of same
US8493244B2 (en) 2009-02-13 2013-07-23 Panasonic Corporation Vector quantization device, vector inverse-quantization device, and methods of same
JP2011009869A (en) * 2009-06-23 2011-01-13 Nippon Telegr & Teleph Corp <Ntt> Encoding method, decoding method, encoder, decoder, and program

Similar Documents

Publication Publication Date Title
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
KR100487136B1 (en) Voice decoding method and apparatus
US7149683B2 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US20010016817A1 (en) CELP-based to CELP-based vocoder packet translation
JP3254687B2 (en) Audio coding method
JP2006099124A (en) Automatic voice/speaker recognition on digital radio channel
KR20020093943A (en) Method and apparatus for predictively quantizing voiced speech
JPH08263099A (en) Encoder
JPH10187197A (en) Voice coding method and device executing the method
WO2001020595A1 (en) Voice encoder/decoder
JP2004517348A (en) High performance low bit rate coding method and apparatus for non-voice speech
JP4874464B2 (en) Multipulse interpolative coding of transition speech frames.
US20050119880A1 (en) Method and apparatus for subsampling phase spectrum information
Eriksson et al. Exploiting interframe correlation in spectral quantization: a study of different memory VQ schemes
CN101609681B (en) Coding method, coder, decoding method and decoder
Gomez et al. Recognition of coded speech transmitted over wireless channels
Özaydın et al. Matrix quantization and mixed excitation based linear predictive speech coding at very low bit rates
US20080162150A1 (en) System and Method for a High Performance Audio Codec
JPH09120300A (en) Vector quantization device
Zhang et al. A CELP variable rate speech codec with low average rate
JPH05232996A (en) Voice coding device
JP3700310B2 (en) Vector quantization apparatus and vector quantization method
Drygajilo Speech Coding Techniques and Standards
JPH08179800A (en) Sound coding device
JPH1049200A (en) Method and device for voice information compression and accumulation

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041124