JPH0588699A - Vector quantization system for speech drive signal - Google Patents

Vector quantization system for speech drive signal

Info

Publication number
JPH0588699A
JPH0588699A JP3250672A JP25067291A JPH0588699A JP H0588699 A JPH0588699 A JP H0588699A JP 3250672 A JP3250672 A JP 3250672A JP 25067291 A JP25067291 A JP 25067291A JP H0588699 A JPH0588699 A JP H0588699A
Authority
JP
Japan
Prior art keywords
vector
drive signal
codebook
convolution
impulse response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3250672A
Other languages
Japanese (ja)
Inventor
Kimio Miseki
公生 三関
Masami Akamine
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP3250672A priority Critical patent/JPH0588699A/en
Publication of JPH0588699A publication Critical patent/JPH0588699A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To encode the drive signal for a speech by using two code books whose code vectors overlap with each other and a composing filter. CONSTITUTION:While a target vector calculation part 11 generates a target vector for vector quantization from a speech signal and a filter coefficient calculation part 1 determines the coefficient of a composing filter from the speech signal, an impulse response calculation part 2 finds an impulse response and a drive signal with an integer pitch period whose code vectors overlap with a code book 3 is interpolated with a drive signal with an integer pitch period to store a drive signal with a non-integer pitch period whose code vectors overlap with a code book 5; and a composite vector is generated by a convolution part 6 with the impulse response and the drive signal with the integer pitch period, a composite vector is generated by a convolution part 7 with the impulse response and the drive signal with the non-integer pitch period, and a drive signal code is searched for by using those composite vectors and target vector.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、コードベクトルがオー
バーラップするコードブックと合成フィルタを用いて音
声駆動信号を符号化する音声の駆動信号のベクトル量子
化方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio drive signal vector quantization system for encoding an audio drive signal using a codebook and a synthesis filter in which code vectors overlap.

【0002】[0002]

【従来の技術】従来、音声信号を8kbit/秒程度の低レー
トで高品質に符号化できる符号化方式として、CELP(Cod
e Excited Linear Predicion) 方式が知られている。CE
LP方式の詳細はP.Kroon 氏らの"A Class of Analysis-b
y-Synthesis Coding at RatesBetween 4.8 and 16kbits
/s",IEEE SAC-6, pp.353-363,February 1988 に述べら
れている。
2. Description of the Related Art Conventionally, CELP (Cod) has been used as an encoding method capable of encoding a voice signal with high quality at a low rate of about 8 kbit / sec.
The e Excited Linear Predicion) method is known. CE
For details of the LP method, see "A Class of Analysis-b" by P. Kroon et al.
y-Synthesis Coding at RatesBetween 4.8 and 16kbits
/ s ", IEEE SAC-6, pp.353-363, February 1988.

【0003】CELP方式は、合成音声信号を駆動信号と合
成フィルタとにより生成する音声符号化方式の1つに分
類され、その特徴とするところは、音声信号から生成さ
れる目標ベクトルと、合成ベクトルとの波形歪が小さく
なるように駆動信号コードブック内から最適なコードベ
クトルを選択するところにある。図3は、従来のCELP方
式の符号側で行われる駆動信号のベクトル量子化方式の
原理的構成を示すブロック図である。
The CELP system is classified into one of audio encoding systems for producing a synthetic speech signal by a driving signal and a synthesis filter, and is characterized by a target vector produced from the speech signal and a synthetic vector. The optimum code vector is selected from within the drive signal code book so that the waveform distortion of and becomes small. FIG. 3 is a block diagram showing the principle configuration of a drive signal vector quantization method performed on the code side of the conventional CELP method.

【0004】図において、212は入力端子で、この入
力端子212に与えられる入力信号(例えば音声信号)
はフィルタ係数算出部201及び目標ベクトル算出部2
11にそれぞれ送られる。
In the figure, reference numeral 212 denotes an input terminal, which is an input signal (for example, an audio signal) given to the input terminal 212.
Is a filter coefficient calculation unit 201 and a target vector calculation unit 2
11 respectively.

【0005】フィルタ係数算出部201は入力信号を予
測分析して声道特性を表す合成フィルタのフィルタ係数
を求めるもので、このフィルタ係数をインパルス応答算
出部202に与え、このインパルス応答算出部202で
合成フィルタの係数を基に所定の重み関数で重み付けら
れた有限サンプル数のインパルス応答を求める。また、
目標ベクトル算出部211は、フィルタ係数算出部20
1のフィルタ係数を基に決まる重みフィルタにより入力
信号を重み付けし、後で述べる影響信号算出部213の
過去の符号化による現在の入力信号への影響信号を該重
み付けされた入力信号から差し引き、駆動信号のベクト
ル量子化に用いる目標ベクトルX を算出するようにして
いる。
The filter coefficient calculation unit 201 predicts and analyzes the input signal to obtain the filter coefficient of the synthesis filter representing the vocal tract characteristic. The filter coefficient is given to the impulse response calculation unit 202, and the impulse response calculation unit 202 An impulse response of a finite number of samples weighted by a predetermined weighting function is obtained based on the coefficient of the synthesis filter. Also,
The target vector calculation unit 211 includes the filter coefficient calculation unit 20.
The input signal is weighted by the weighting filter determined based on the filter coefficient of 1, and the influence signal to the present input signal due to the past encoding of the influence signal calculation unit 213, which will be described later, is subtracted from the weighted input signal and driven. The target vector X used for vector quantization of the signal is calculated.

【0006】一方、203はコードブックで、このコー
ドブック203は、る駆動信号生成部214で生成され
た過去の駆動信号V(n)を順次取り込み、また、コードブ
ック203内の不要な駆動信号を廃棄することでその内
容を更新可能にしている。
On the other hand, reference numeral 203 denotes a codebook, which sequentially takes in past drive signals V (n) generated by the drive signal generation unit 214, and also unnecessary drive signals in the codebook 203. The contents can be updated by discarding.

【0007】コードブック203の駆動信号データは、
畳み込み部206に送られ、この畳み込み部206にお
いて、インパルス応答算出部202のインパルス応答h
(n)と、コードブック203からの探索すべきピッチ周
期に基づく所定のコードベクトルから合成ベクトルDiを
計算する。
The drive signal data of the codebook 203 is
It is sent to the convolution unit 206, and in this convolution unit 206, the impulse response h of the impulse response calculation unit 202
A composite vector Di is calculated from (n) and a predetermined code vector based on the pitch period to be searched from the codebook 203.

【0008】そして、畳み込み部206の合成ベクトル
Diをピッチ合成部208に入力し、整数ピッチ周期I を
与えるピッチ合成処理を施し、これをコード探索部21
5に与えて、ピッチ合成部208にてピッチ周期I を与
えられ得られた合成ベクトルU と目標ベクトルX とを用
いてコード探索を行う。
Then, the composite vector of the convolution unit 206
Di is input to the pitch synthesizing unit 208, pitch synthesizing processing that gives an integer pitch period I is performed, and this is performed by the code searching unit 21.
5, a code search is performed using the synthesized vector U and the target vector X obtained by giving the pitch cycle I in the pitch synthesis unit 208.

【0009】ここで、コード探索部215でのコード探
索は、最適ゲインを与えられたときの合成ベクトルU と
目標ベクトルX との歪 Xt X-(Xt U)2 /( Ut U)の最小
化、即ち、値(Xt U)2 /( Ut U)が最大となるコードを探
索することで行われる。そして、最適コードの情報は端
子218より出力されるとともに、ゲイン決定部216
に送られる。
Here, in the code search in the code search unit 215, the distortion X t between the combined vector U and the target vector X when the optimum gain is given. X- (X t U) 2 / (U t U) minimization, that is, the value (X t U) 2 / (U t This is done by searching for the code with the maximum U). Then, the information of the optimum code is output from the terminal 218 and the gain determining unit 216
Sent to.

【0010】ゲイン決定部216では、コード探索部2
15で探索されたコードを基に計算される最適ゲイン(X
t U)/( Ut U)を目標値として駆動信号コードベクトルの
ゲインを決定し、これを駆動信号生成部214に与え
る。
In the gain determining unit 216, the code searching unit 2
Optimal gain (X
t U) / (U t U) is used as a target value to determine the gain of the drive signal code vector, and this is given to the drive signal generation unit 214.

【0011】これにより駆動信号生成部214では、コ
ード探索部215からの最適コード情報とゲイン決定部
216のゲインを用い、最適コードベクトルにゲインを
乗ずることにより現在区間の音声の駆動信号を生成す
る。また、この駆動信号は影響信号算出部213に与え
られ、この影響信号算出部213にて次の区間の音声の
駆動信号のベクトル量子化のための現在の符号化による
次の区間への影響信号を算出する。
As a result, the drive signal generation unit 214 uses the optimum code information from the code search unit 215 and the gain of the gain determination unit 216, and multiplies the optimum code vector by the gain to generate the drive signal of the voice in the current section. .. Further, this drive signal is given to the influence signal calculation unit 213, and the influence signal calculation unit 213 gives the influence signal to the next section by the current encoding for vector quantization of the drive signal of the voice of the next section. To calculate.

【0012】しかして、このようにCELP方式によれば、
選択された駆動信号コードと合成フィルタのパラメータ
より生成される合成音声信号は、波形歪が小さいことを
符号側で確認しているので、復号側でも8kbit/秒程度の
レートについては良好な合成音声を生成することが可能
となる。
Thus, according to the CELP method,
The synthesized voice signal generated from the selected drive signal code and the parameters of the synthesis filter has been confirmed on the coding side that the waveform distortion is small, so even on the decoding side, a good synthesized speech for a rate of about 8 kbit / sec. Can be generated.

【0013】ところで、一般にCELP方式では、駆動信号
コードブックとして性質の異なる複数個のコードブック
を用いることが多いが、このうちで最も効率の良いコー
ドブックとして適応コードブックが知られている。
Generally, in the CELP system, a plurality of codebooks having different properties are often used as the drive signal codebook, and the adaptive codebook is known as the most efficient codebook among them.

【0014】適応コードブックは、過去に符号化された
音声の駆動信号をコードブックとするもので、人間の音
声で強い周期性(ピッチ)を持つ区間の駆動信号では、
ビッチ周期毎に似た波形が繰り返すため、適応コードブ
ックにより効率のよい駆動信号の符号化が可能になる。
また、適応コードブックのコードベクトルは、ピッチ周
期に基づいてコード番号が付けられ、現在のサンプル点
から整数ピッチ周期だけ過去の駆動信号を使ってこのピ
ッチ周期で繰り返すベクトルを作成することにより生成
される。
The adaptive codebook uses the coded drive signals of voices encoded in the past, and the drive signals in the section having a strong periodicity (pitch) in human voice are
Since a similar waveform repeats every bitch cycle, the adaptive codebook enables efficient coding of the drive signal.
Also, the code vector of the adaptive codebook is coded based on the pitch period, and is generated by creating a vector that repeats at this pitch period by using the past drive signal for an integer pitch period from the current sample point. It

【0015】このようにして生成されるコードベクトル
は、隣合うコード番号のコードベクトルとオーバーラッ
プする構造を持っているが、従来では、このオーバーラ
ップ構造を利用して高速に合成ベクトルを計算する再帰
的畳込みが考えられている。
The code vector generated in this way has a structure that overlaps the code vectors of adjacent code numbers. Conventionally, this overlap structure is used to calculate a composite vector at high speed. Recursive convolution is being considered.

【0016】ここで、高速畳込みの原理について簡単に
説明すると、いま、図4に示すようにコードブック40
0内に格納される信号系列をC(n)(n=…,-2-1)、整数ピ
ッチ周期k に対応するコードベクトルを Vk で表すと、
Vk と Vk-1 は次のようなオーバーラップ構造を有して
いる。 Vk-1 =(C(-k+1),C(-k+2),...,C(-k+L-1),C(-k+L)) Vk =(C(-k),C(-k+1),C(-k+2),...,C(-k+L-1)) …(1) ここでLはベクトルの次元を表す。また、 Vk の第n番
目の要素を Vk (n) とおくと、 Vk (n) = C(-k+n-1) …(2)
The principle of high-speed convolution will now be briefly described. Now, as shown in FIG.
If the signal sequence stored in 0 is C (n) (n = ...,-2-1) and the code vector corresponding to the integer pitch period k is V k ,
V k and V k-1 have the following overlapping structure. V k-1 = (C (-k + 1), C (-k + 2), ..., C (-k + L-1), C (-k + L)) V k = (C ( -k), C (-k + 1), C (-k + 2), ..., C (-k + L-1)) (1) Here, L represents the dimension of the vector. Also, by placing the n-th element of V k and V k (n), V k (n) = C (-k + n-1) ... (2)

【0017】の関係で表される。そして、畳み込みに用
いるフィルタのインパルス応答をh とし、 Vk とインパ
ルス応答の畳み込みによって得られた合成ベクトルを d
k とすると、隣合うコードの合成ベクトルの間に、次の
ような関係が成り立つ。 dk (n) = Vk (1)h(n) + dk-1 (n-1) =c(-k)h(n) + dk-1 (n-1) …(3)
It is represented by the relationship: Then, let h be the impulse response of the filter used for convolution, and let d k be the composite vector obtained by convolving V k and the impulse response.
If k , the following relationship holds between the combined vectors of adjacent codes. d k (n) = V k (1) h (n) + d k-1 (n-1) = c (-k) h (n) + d k-1 (n-1) (3)

【0018】上式においては、前のコードの合成ベクト
ル dk-1 が計算されていれば、これにc(-k)h(n) を加え
ることにより次のコードの合成ベクトル dk の畳み込み
計算が計算量L のオーダで再帰的に行えることを示して
いる。
In the above equation, if the composite vector d k-1 of the previous code has been calculated, then c (-k) h (n) is added to this to convolve the composite vector d k of the next code. It shows that the calculation can be done recursively on the order of the complexity L.

【0019】従って、このような関係を利用することに
より、畳み込みに要する計算量のオーダを L2 からL に
削減できるので最適なコードベクトルの探索に要する計
算量を約L分の1に削減できることになり、実時間で音
声の符号化を完了させるための技術として重要なものと
なっている。
Therefore, by using such a relation, the order of the amount of calculation required for convolution is L 2 To L, the amount of calculation required to search for an optimal code vector can be reduced to about L / L, which is an important technique for completing speech coding in real time.

【0020】ところが、このようなCELP方式では、8kbi
t/秒より低いレートにおいては駆動信号に割り当てるビ
ット数が少なくなることから、合成音声信号の波形歪が
ノイズとして知覚されるようになり、特に、4kbit/秒以
下の低レートでは品質の劣化が大きく、高品質な音声符
号化を行えないという問題点があった。これを解決する
ものとして、適応コードブックのピッチ周期の精度を上
げる方法が考えられている。
However, in such a CELP system, 8 kbi
At a rate lower than t / sec, the number of bits allocated to the drive signal becomes small, so waveform distortion of the synthesized voice signal becomes perceived as noise, and especially at a low rate of 4 kbit / sec or less, quality deterioration occurs. There is a problem in that it is not possible to perform large-scale and high-quality speech coding. As a solution to this, a method of improving the accuracy of the pitch period of the adaptive codebook has been considered.

【0021】この方法は、1990年のInternational Conf
erence on Acoustics, Speech, andSignal Processing
という国際学会で発表された P.Kroon 氏らの論文"PI
TCHPREDICTORS WITH HIGH TEM PORAL RESOLUTION"(PP.6
61-664) 及び J.S.Marques 氏らの論文"IMPROVED PITC
H PREDICTION WITH FRACTIONAL DELAYS IN CELP CODIN
G"(PP.665-668) で説明されている。
This method is based on the 1990 International Conf
erence on Acoustics, Speech, and Signal Processing
P. Kroon's paper "PI
TCHPREDICTORS WITH HIGH TEM PORAL RESOLUTION "(PP.6
61-664) and JS Marques et al. "IMPROVED PITC.
H PREDICTION WITH FRACTIONAL DELAYS IN CELP CODIN
G "(PP.665-668).

【0022】この方法を簡単に説明すると、通常、音声
信号は8kHzでサンプリングされてディジタル化される。
このため、従来のピッチ周期の探索精度は整数サンプル
の精度で行われていた。ところが、実際に、人間の音声
に含まれるピッチ周期は、連続的に緩やかに変化するた
め、ピッチ探索の精度不足が原因でうまくピッチを探索
できないことがあり、これが合成音声品質の劣化の原因
の一つになっている。そこで、これを解決するため駆動
信号コードブック内の過去の駆動信号(整数サンプル精
度)をアップサンプリングして整数サンプル精度より細
かい非整数サンプル精度のピッチ周期まで探索すること
により、より正確に駆動信号のピッチ周期の表現を可能
とし、低ビットレートでもなめらかな発声の音声を合成
できるようにしている。ところが、これらの論文には、
非整数ピッチ周期を探索する際の高速畳み込みの方法に
ついて何も述べられていない。
Briefly explaining this method, the audio signal is usually sampled at 8 kHz and digitized.
For this reason, the conventional pitch period search precision is performed with integer sample precision. However, in practice, the pitch period included in human speech changes gradually and continuously, and therefore pitch search may not be performed properly due to lack of precision in pitch search, which is a cause of deterioration in synthesized speech quality. It is one. Therefore, in order to solve this, by up-sampling the past drive signal (integer sample precision) in the drive signal codebook and searching up to a pitch period of a non-integer sample precision which is finer than the integer sample precision, the drive signal is more accurately obtained. It is possible to express the pitch period of, and it is possible to synthesize a smooth uttered voice even at a low bit rate. However, in these papers,
Nothing is said about the method of fast convolution when searching for non-integer pitch periods.

【0023】このことについて、上述した図3のCELP方
式で、整数ピッチ周期と非整数ピッチ周期を高速畳み込
みで計算する方法としてアップサンプリングした過去の
駆動信号を畳み込み部206に送り、インパルス応答算
出部202からのインパルス応答h(n)をアップサンプリ
ングした結果を用いて畳み込みを行うようにする。
With respect to this, in the CELP method of FIG. 3 described above, as a method of calculating the integer pitch period and the non-integer pitch period by high-speed convolution, the up-sampled past drive signal is sent to the convolution unit 206, and the impulse response calculation unit Convolution is performed using the result of up-sampling the impulse response h (n) from 202.

【0024】ところが、このようにすると、畳み込みに
用いるすべてのデータがL から2Lになってしまうので、
高速畳み込みの計算量も2Lのオーダになる。従って、畳
み込み部206では、探索するピッチ周期の候補を整数
ピッチ周期M種類、非整数ピッチ周期N種類とし、コー
ドベクトルの次元をLとすると、(M+N)個の合成ベ
クトルを求めるのに2L(M+N)回のオーダの計算が
必要となり、計算量の著しい増加を招く欠点があった。
However, if this is done, all the data used for convolution will be changed from L to 2L.
The amount of calculation for fast convolution is also on the order of 2L. Therefore, in the convolution unit 206, if the pitch period candidates to be searched are the integer pitch period M types and the non-integer pitch period N types, and the dimension of the code vector is L, 2L (to obtain (M + N) combined vectors. There is a drawback in that the calculation of the order of M + N) is required and the calculation amount is remarkably increased.

【0025】[0025]

【発明が解決しようとする課題】このように従来の音声
符号化における音声駆動信号のベクトル量子化方式にあ
って、4kbit/秒以下の低レートでは、畳み込み部での畳
み込み計算量が著しく増大するため、最適なピッチ周期
を高速検索できず、作業能率が著しく低下し、実時間で
高品質な音声符号化を行うのが難しくなる問題点があっ
た。
As described above, in the conventional vector coding method of the voice driving signal in the voice encoding, at the low rate of 4 kbit / sec or less, the convolution calculation amount in the convolution unit is significantly increased. Therefore, there is a problem that the optimum pitch period cannot be searched at high speed, the work efficiency is significantly reduced, and it is difficult to perform high-quality speech coding in real time.

【0026】本発明は上記事情に鑑みてなされたもの
で、畳み込みの計算量を軽減でき、4kbit/秒以下の低レ
ートでも高品質な実時間音声符号化を実現できる音声駆
動信号のベクトル量子化方式を提供することを目的とす
る。
The present invention has been made in view of the above circumstances, and it is possible to reduce the amount of convolution calculation, and to realize high-quality real-time speech coding at a low rate of 4 kbit / sec or less. The purpose is to provide a scheme.

【0027】[0027]

【課題を解決するための手段】上述した目的を達成する
ため、本発明の音声駆動信号のベクトル量子化方式は、
入力される音声信号からベクトル量子化の目標ベクトル
を生成する目標ベクトル生成手段、前記音声信号から合
成フィルタの係数を決定するとともに該フィルタ係数か
らインパルス応答を求めるインパルス応答生成手段、コ
ードベクトルがオーバーラップする整数ピッチ周期の駆
動信号を格納する第1のコードブック、上記第1のコー
ドブックの整数ピッチ周期の駆動信号に対する内挿処理
により求められるコードベクトルがオーバーラップする
非整数ピッチ周期の駆動信号を格納する第2のコードブ
ック、前記インパルス応答生成手段のインパルス応答と
前記第1のコードブックの前記整数ピッチ周期の駆動信
号から畳込みを行い合成ベクトルを生成する第1の畳み
込み手段、前記インパルス応答生成手段のインパルス応
答と前記第2のコードブックの前記非整数ピッチ周期の
駆動信号から畳込みを行い合成ベクトルを生成する第2
の畳み込み手段、前記第1および第2の畳み込み手段か
らの合成ベクトルと前記目標ベクトル生成手段の目標ベ
クトルを用いて駆動信号コードを探索するコード検索手
段により構成している。
In order to achieve the above-mentioned object, the vector quantization system of the audio drive signal of the present invention is
Target vector generation means for generating a target vector for vector quantization from an input voice signal, impulse response generation means for determining a coefficient of a synthesis filter from the voice signal and obtaining an impulse response from the filter coefficient, code vector overlap A first codebook storing a drive signal of an integer pitch cycle, and a drive signal of a non-integer pitch cycle in which a code vector obtained by interpolation processing with respect to the drive signal of the integer pitch cycle of the first codebook is overlapped. The second codebook to be stored, the first convolution means for convoluting the impulse response of the impulse response generating means and the drive signal of the integer pitch period of the first codebook to generate a combined vector, the impulse response The impulse response of the generating means and the second Second generating a composite vector performs convolution from the drive signal of the non-integer pitch period of the codebook
And the code search means for searching the drive signal code using the combined vector from the first and second convolution means and the target vector of the target vector generation means.

【0028】また、本発明の音声駆動信号のベクトル量
子化方式は、入力される音声信号からベクトル量子化の
目標ベクトルを生成する目標ベクトル生成手段、前記音
声信号から合成フィルタの係数を決定するとともに該フ
ィルタ係数からインパルス応答を求めるインパルス応答
生成手段、コードベクトルがオーバーラップする整数ピ
ッチ周期の駆動信号を格納する第1のコードブック、上
記第1のコードブックの整数ピッチ周期の駆動信号に対
する内挿処理により求められるコードベクトルがオーバ
ーラップする非整数ピッチ周期の駆動信号を格納する第
2のコードブック、前記インパルス応答生成手段のイン
パルス応答と前記第1のコードブックの前記整数ピッチ
周期の駆動信号から畳込みを行い合成ベクトルを生成す
る第1の畳み込み手段、前記インパルス応答生成手段の
インパルス応答と前記第2のコードブックの前記非整数
ピッチ周期の駆動信号から畳込みを行い合成ベクトルを
生成する第2の畳み込み手段、前記第1の畳み込み手段
にて生成される合成ベクトルに対して整数サンプルのピ
ッチ周期を持つ合成ベクトルを生成する第1のピッチ合
成手段、前記第1の畳み込み手段にて生成される合成ベ
クトルを前記整数サンプルのピッチ周期に応じて遅延さ
せるとともに前記第2の畳み込み手段にて生成される合
成ベクトルを加算し加算合成ベクトルを生成する遅延加
算手段、前記加算合成ベクトルから整数サンプルのピッ
チ周期を持つ合成ベクトルを生成する第2のピッチ合成
手段、前記第1および第2のピッチ合成手段からの合成
ベクトルと前記目標ベクトル生成手段の目標ベクトルを
用いて駆動信号コードを探索するコード検索手段により
構成している。
Further, according to the vector quantization method of the voice drive signal of the present invention, the target vector generating means for generating the target vector of the vector quantization from the input voice signal, and the coefficient of the synthesis filter from the voice signal are determined. Impulse response generating means for obtaining an impulse response from the filter coefficient, a first codebook for storing a drive signal of an integer pitch period with overlapping code vectors, and interpolation for the drive signal of the integer pitch period of the first codebook. From a second codebook for storing a drive signal of a non-integer pitch cycle in which code vectors obtained by processing overlap, an impulse response of the impulse response generating means and a drive signal of the integer pitch cycle of the first codebook. The first convolution that performs the convolution to generate a composite vector A second convolution means for convoluting the impulse response of the impulse response generation means and the drive signal of the non-integer pitch period of the second codebook to generate a combined vector, and the first convolution means. First pitch synthesizing means for generating a synthetic vector having an integer sample pitch period with respect to the generated synthetic vector, and a synthetic vector generated by the first convolution means according to the integer sample pitch period. Delaying and adding means for delaying and adding the combined vector generated by the second convolution means to generate an added combined vector; second pitch for generating a combined vector having a pitch period of integer samples from the added combined vector Synthesizing means, synthetic vectors from the first and second pitch synthesizing means, and the target vector generating means Constitute a code search means for searching a driving signal code using the target vector.

【0029】[0029]

【作用】この結果、本発明によれば、第1のコードブッ
クにコードベクトルがオーバラップ構造を持つ過去に符
号化された整数ピッチ周期の駆動信号系列を格納し、第
2のコードブックに内挿処理により第1のコードブック
内の駆動信号系列をシフトさせたオーバラップ構造を持
つ非整数ピッチ同期の駆動信号系列を格納し、これら第
1および第2のコードブックの駆動信号系列についてそ
れぞれ独立して畳み込み処理を行うようになるので、畳
み込みの計算量を軽減することができるとともに、これ
ら畳み込みにより生成される合成ベクトルと目標ベクト
ルとの歪量を高速に計算でき、非整数ピッチ周期を持つ
駆動信号のベクトル量子化を高速に行うことができる。
As a result, according to the present invention, the first codebook stores the previously encoded integer-pitch-cycle drive signal sequence having the code vector overlapping structure, and the second codebook stores The non-integer pitch-synchronized drive signal series having the overlap structure in which the drive signal series in the first codebook is shifted by the insertion processing is stored, and the drive signal series of the first and second codebooks are stored independently of each other. Since the convolution processing is performed by doing so, the amount of calculation of the convolution can be reduced, the distortion amount between the synthetic vector generated by these convolutions and the target vector can be calculated at high speed, and the non-integer pitch period is provided. Vector quantization of the drive signal can be performed at high speed.

【0030】[0030]

【実施例】以下、本発明の一実施例を図面に従い説明す
る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.

【0031】図1は、同実施例に係る音声駆動信号のベ
クトル量子化方式の原理的構成を示すブロック図であ
る。図において、12は入力端子で、この入力端子12
に与えられる入力信号(例えば音声信号)はフィルタ係
数算出部1及び目標ベクトル算出部11にそれぞれ送ら
れる。
FIG. 1 is a block diagram showing the principle structure of a vector quantization system for a voice drive signal according to the embodiment. In the figure, reference numeral 12 is an input terminal.
An input signal (for example, a voice signal) given to is sent to the filter coefficient calculation unit 1 and the target vector calculation unit 11, respectively.

【0032】フィルタ係数算出部1では、フレーム長
(通常20ms程度)単位で入力信号を予測分析して声道特
性を表す合成フィルタのフィルタ係数を求め、このフィ
ルタ係数をインパルス応答算出部2に与え、ここで合成
フィルタの係数を基に所定の重み関数で重み付けられた
有限サンプル数のインパルス応答を求める。これ以降の
処理は、ベクトルの次元数のサンプルで表される時間長
を一小区間として、小区間毎に行われるようになる。
The filter coefficient calculation unit 1 predicts and analyzes the input signal in units of frame length (usually about 20 ms) to obtain the filter coefficient of the synthesis filter representing the vocal tract characteristics, and supplies this filter coefficient to the impulse response calculation unit 2. Here, the impulse response of a finite number of samples weighted by a predetermined weighting function is obtained based on the coefficient of the synthesis filter. Subsequent processing is performed for each small section with the time length represented by the sample of the number of dimensions of the vector as one small section.

【0033】まず、目標ベクトル算出部11は、フィル
タ係数算出部1のフィルタ係数を基に決まる重みフィル
タにより入力信号を重み付けし、後で述べる影響信号算
出部13の過去の符号化による現在の入力信号への影響
信号を該重み付けされた入力信号から差し引き、駆動信
号のベクトル量子化に用いる目標ベクトルX を算出する
ようになる。
First, the target vector calculation unit 11 weights the input signal with a weighting filter determined based on the filter coefficient of the filter coefficient calculation unit 1, and the present input by past coding of the influence signal calculation unit 13 described later. The influence signal on the signal is subtracted from the weighted input signal to calculate the target vector X 1 used for vector quantization of the drive signal.

【0034】一方、3は適応コードブックからなるコー
ドブックであり、後で述べる駆動信号生成部14で生成
された過去の駆動信号V(n)を取り込み、また、コードブ
ック3内の不要な駆動信号を廃棄することで、その内容
を更新可能にしている。この場合、コードブック3に取
り込まれる駆動信号は、整数のピッチ周期T =I (Iは
整数)に対応するもので、そのコードベクトルV(n)(n=
0,1,...,L) は、次式で定義されている。(ここで、L
はベクトルの次元を表している。) V(n)=V(n-I) (n=0,1,...,I-1) …(4) コードブック3の駆動信号データは、内挿計算部4およ
び畳み込み部6に送られる。
On the other hand, 3 is a codebook consisting of an adaptive codebook, which takes in the past drive signal V (n) generated by the drive signal generation unit 14 described later, and unnecessary drive in the codebook 3. By discarding the signal, its contents can be updated. In this case, the drive signal taken into the codebook 3 corresponds to an integer pitch period T = I (I is an integer), and its code vector V (n) (n =
0,1, ..., L) is defined by the following equation. (Where L
Represents the dimension of the vector. ) V (n) = V (nI) (n = 0,1, ..., I-1) (4) The drive signal data of the codebook 3 is sent to the interpolation calculation unit 4 and the convolution unit 6. ..

【0035】内挿計算部4では、例えば内挿フィルタを
用いてコードブック3内の過去の駆動信号V(n)に対する
内挿信号 Vf (n) を求める。この場合、内挿フィルタを
用いて離散信号データから非整数サンプル位相のずれた
位置の信号振幅を求める技術は公知であり、例えば R.
E.Crochiere と L.R.Rabiner 共著で Prentice Hall
社から1983年に発行されている Multirate Digital S
ignal Procesing に詳しく書かれているのでここでの
説明を省略する。
The interpolation calculation section 4 obtains the interpolation signal V f (n) for the past drive signal V (n) in the codebook 3 by using, for example, an interpolation filter. In this case, a technique for obtaining the signal amplitude at a position where the non-integer sample phase is shifted from the discrete signal data by using an interpolation filter is known, for example, R.
Co-authored by E. Crochiere and LRRabiner at Prentice Hall
Multirate Digital S published by the company in 1983
Since it is described in detail in ignal Procesing, the explanation is omitted here.

【0036】内挿計算部4で求められた内挿信号 V
f (n) は、コードブック5に送られ、ここに一時的に格
納され非整数ピッチ周期の駆動信号データを有する適応
コードブックを形成する。そして、コードブック5の駆
動信号データは、畳み込み部7に送られる。
Interpolation signal V obtained by the interpolation calculation unit 4
The f (n) is sent to the codebook 5 and is temporarily stored therein to form an adaptive codebook having drive signal data of a non-integer pitch period. Then, the drive signal data of the codebook 5 is sent to the convolution unit 7.

【0037】畳み込み部6では、インパルス応答算出部
2のインパルス応答h(n)とコードブック3よりの探索す
る整数ピッチ周期に基づくコードベクトルから上述した
式3の畳み込み法を用いて合成ベクトル Di を計算す
る。
The convolution unit 6 uses the impulse response h (n) of the impulse response calculation unit 2 and the code vector based on the integer pitch period searched for from the code book 3 by using the convolution method of the above-described Expression 3 to generate a composite vector D i. To calculate.

【0038】一方、畳み込み部7においても、インパル
ス応答算出部2のインパルス応答h(n)とコードブック5
の探索する非整数ピッチ周期に基づくコードベクトルか
ら上述した式3の畳み込み法を用いて合成ベクトル Df
を計算する。
On the other hand, also in the convolution unit 7, the impulse response h (n) of the impulse response calculation unit 2 and the codebook 5
Synthetic vector D f from the code vectors based on non-integer pitch period to search using the convolution method of the formula 3 described above
To calculate.

【0039】そして、これら畳み込み部6、7の合成ベ
クトル Di 、 Df をコード探索部15に与え、畳み込み
部6、7よりの合成ベクトルを合成ベクトルU とし、目
標ベクトルX を用いてコード探索を行う。ここでのコー
ド探索は、値(Xt U)2 /( Ut U)が最大となるようなコー
ドを探索することで行われる。そして、最適コードの情
報は端子18より出力される。
Then, a synthetic vector of the convolution parts 6 and 7 is obtained.
Cutle Di, DfIs given to the code search unit 15 and convolution is performed.
Let the composite vector from parts 6 and 7 be a composite vector U
A code search is performed using the characteristic vector X. Coe here
Search for the value (Xt U)2 / (Ut U) is the maximum
This is done by searching for the de. And the optimal code information
The information is output from the terminal 18.

【0040】ゲイン決定部16では、最適コードを基に
計算される(Xt U)/( Ut U)をコード探索部15より入力
し、これを目標値として駆動信号コードベクトルのゲイ
ンを決定し、これを駆動信号生成部14に与える。これ
により駆動信号生成部14では、コード探索部15から
の最適コード情報とゲイン決定部16のゲインを用い、
最適コードベクトルにゲインを乗ずることにより現在の
小区間の音声駆動信号を生成するようになる。また、こ
の駆動信号は影響信号算出部13に与えられ、この影響
信号算出部13にて次の小区間の音声の駆動信号のベク
トル量子化のための現在の符号化による次の小区間への
影響信号を算出するようになる。
In the gain determining section 16, calculation is performed based on the optimum code (X t U) / (U t U) is input from the code search unit 15, the gain of the drive signal code vector is determined using this as a target value, and this is given to the drive signal generation unit 14. As a result, the drive signal generation unit 14 uses the optimum code information from the code search unit 15 and the gain of the gain determination unit 16,
By multiplying the optimum code vector by the gain, the voice drive signal for the current small section is generated. Further, this drive signal is given to the influence signal calculation unit 13, and the influence signal calculation unit 13 transmits to the next small section by the current encoding for vector quantization of the drive signal of the voice of the next small section. The influence signal is calculated.

【0041】従って、このようにすればコードブック3
に整数ピッチ周期の駆動信号、コードブック5に内挿計
算により得られた非整数ピッチ周期の駆動信号がそれぞ
れ格納され、各コードブック3、5について別個にイン
パルス応答算出部202からのインパルス応答h(n)に基
づいて畳み込みを行うようになるので、探索するピッチ
周期の候補を整数ピッチ周期M種類、非整数ピッチ周期
N種類とし、コードベクトルの次元をLとすると、(M
+N)個の合成ベクトルを求めるのに必要な計算量は、
L(M+N)回のオーダとなり、計算量を大幅に減らす
ことができ、4kbit/秒以下の低レートでも高品質な実時
間音声符号化を実現できるようになる。次に、本発明の
第2の実施例を図2に従い説明する。この場合、図2
は、図1と同一符号を付した部分は、上述した説明と同
様の機能を有するのでここでの説明は省略する。
Therefore, in this way, the codebook 3
The drive signal of the integer pitch cycle is stored in the codebook 5, and the drive signal of the non-integer pitch cycle obtained by the interpolation calculation is stored in the codebook 5, respectively, and the impulse response h from the impulse response calculation unit 202 is separately provided for each codebook 3 and 5. Since the convolution is performed based on (n), if the pitch period candidates to be searched are M integer pitch periods and N non-integer pitch periods and the dimension of the code vector is L, (M
The amount of calculation required to obtain + N) composite vectors is
The order is L (M + N) times, the amount of calculation can be significantly reduced, and high-quality real-time speech coding can be realized even at a low rate of 4 kbit / sec or less. Next, a second embodiment of the present invention will be described with reference to FIG. In this case,
1 have the same functions as those described above, the description thereof is omitted here.

【0042】この実施例では、探索するピッチ周期T と
コードベクトルの次元L とがT<L なる関係にあるときの
ピッチ周期探索にも対応できる駆動信号のベクトル量子
化方式を示している。
In this embodiment, a drive signal vector quantization system is shown which can also be used for pitch period search when the pitch period T to be searched and the dimension L of the code vector have a relation of T <L.

【0043】この場合、整数ピッチ周期I に対して、ピ
ッチ合成部8は畳み込み部6よりの合成ベクトル Di
入力し、これにピッチ周期I を与えるピッチ合成処理を
施すようになる。この処理は例えば次のように行うこと
ができる。
In this case, for the integer pitch period I, the pitch synthesizing unit 8 inputs the synthesis vector D i from the convolution unit 6 and performs the pitch synthesizing process for giving the pitch period I. This processing can be performed as follows, for example.

【0044】 U(n)= Di (n)+U(n-I) …(5) 次に、ピッチ周期T が小数つまり非整数のサンプル長F
の場合を考えると、コードブック3の駆動信号系列をV
(n)、内挿計算部4で計算されたコードブック5の駆動
信号系列をVf(n) とすると、V(n)のサンプリング周波数
を fs から2fs に上げて得られる信号系列VD(n) は、 VD(2m )= V(m) …(6) VD(2m-1)=Vf (m) …(7) となる。そして、VDをV と Vf を用いて時間順に書き表
すと次のようになる。... Vf (n-1),V(n-1), V f (n),V
(n),..., V f (-2),V(-2) Vf (-1),V(-1)
U (n) = D i (n) + U (nI) (5) Next, the pitch period T is a decimal, that is, a non-integer sample length F
Considering the case of, the drive signal sequence of Codebook 3 is V
(n), when a driving signal sequence codebook 5 calculated by the interpolation calculation section 4 and Vf (n), V (n ) of sampling frequency f s from 2f s signal sequence obtained by raising the VD ( n) becomes VD (2m) = V (m) (6) VD (2m-1) = V f (m) (7). Then, if VD is written in order of time using V and V f , it becomes as follows. ... V f (n-1), V (n-1), V f (n), V
(n), ..., V f (-2), V (-2) V f (-1), V (-1)

【0045】この信号系列VDをn=0 の点よりピッチ周期
2F(=2I+1 :奇数)で繰り返し、サンプリング周波数を
元の fsに下げることにより非整数周期F で繰り返すコ
ードベクトルV(n)(n=0,1,...,L-1) が得られる。
This signal sequence VD is pitched from the point of n = 0
Code vector V (n) (n = 0,1, ..., L-1) that repeats at 2F (= 2I + 1: odd number) and repeats at a fractional period F by lowering the sampling frequency to the original f s Is obtained.

【0046】この場合、2F(=2I+1) が奇数であるため、
サンプリング周期fsにおけるV(0)より始まる1回目のピ
ッチの繰り返しはV(0)=Vf (-I),V(1)= Vf (1-I),...と
なり、すべてV の内挿値 Vf だけから求められることが
わかる。そして、2回目の繰り返しでは Vf の内挿値、
即ちV だけからコードベクトルが求められるようにな
る。この関係を用いるとコードベクトルV(n)(n=0,1
…,L-1)は、次式で計算できる。 V(n)=Vf (n)= Vf (n-I) (n=0,...,min(L-1,I-1)) …(9) V(n)=Vi (n)=V(n-2I-1) (n=I,...,min(L-1,2I)) …(10) V(n)=V(n-2F) (n=2F,...,L-1) …(11)
In this case, since 2F (= 2I + 1) is an odd number,
The first pitch repetition starting from V (0) in the sampling period fs is V (0) = V f (-I), V (1) = V f (1-I), ... It can be seen that it can be obtained only from the interpolated value V f . And in the second iteration, the interpolated value of V f ,
That is, the code vector can be obtained only from V. Using this relationship, the code vector V (n) (n = 0,1
…, L-1) can be calculated by the following formula. V (n) = V f (n) = V f (nI) (n = 0, ..., min (L-1, I-1))… (9) V (n) = V i (n) = V (n-2I-1) (n = I, ..., min (L-1,2I)) (10) V (n) = V (n-2F) (n = 2F, ... , L-1)… (11)

【0047】ここで、実際に目標ベクトルとの歪計算に
用いるのは合成ベクトルU であり、V と合成フィルタの
インパルス応答h との畳込みである合成ベクトルU は上
式のV を直接使っても計算できるが、式9の Vf と式1
0の Vi とで畳み込みの計算を分けて例えば次のように
行うことができる。 Df (n)= Vf (n)*h(n) …(12) Di (n)= Vi (n)*h(n) …(13) U(n)=Df (n)+ Di (n-I)+U(n-2F) …(14)
Here, it is the composite vector U that is actually used for distortion calculation with the target vector, and the composite vector U that is the convolution of V and the impulse response h of the composite filter is obtained by directly using V in the above equation. Can be calculated, but V f in Eq. 9 and Eq. 1
The convolution calculation can be performed separately with V i of 0, for example, as follows. D f (n) = V f (n) * h (n)… (12) D i (n) = V i (n) * h (n)… (13) U (n) = D f (n) + D i (nI) + U (n-2F) (14)

【0048】この場合、式12と式13の計算は、各々
の適応コードブック毎に上述した高速の畳込みで計算で
きる。ところが、 Di は、整数ピッチ周期の探索を行う
時点で畳み込み部6で求めるから、整数ピッチと非整数
ピッチの探索を組み合わせて行うことにより式13の D
i の計算の分だけ非整数ピッチの探索に必要な演算量を
削減できる。これらの計算は一つのピッチ周期につき一
回行われるため、探索すべきピッチ周期の数(コードブ
ックのサイズ)が大きな場合には特に大幅な計算量の削
減が可能となる。これにより、非整数ピッチ周期で繰り
返す合成ベクトルは、畳み込み部6、7からの合成ベク
トルを入力して式14の処理を行えばよいことがわか
る。
In this case, the equations 12 and 13 can be calculated by the above-described high-speed convolution for each adaptive codebook. However, since D i is obtained by the convolution unit 6 at the time of searching for an integer pitch period, D i in Equation 13 can be obtained by performing a search for an integer pitch and a non-integer pitch.
It is possible to reduce the amount of calculation required for searching a non-integer pitch by the amount of calculation of i . Since these calculations are performed once for each pitch period, the amount of calculation can be significantly reduced particularly when the number of pitch periods to be searched (codebook size) is large. From this, it is understood that the synthetic vector repeated in the non-integer pitch cycle may be obtained by inputting the synthetic vector from the convolution units 6 and 7 and performing the processing of Expression 14.

【0049】ここで、遅延加算部9及びピッチ合成部1
0は、式14の処理を行うもので、遅延加算部9は、畳
み込み部6からの合成ベクトル Di をピッチ周期I に基
づいたサンプル数だけ遅延シフトさせ、これと畳み込み
部7の合成ベクトル Df を加算して、加算合成ベクトル
を出力するようにしている。また、ピッチ合成部10は
遅延加算部9の加算合成ベクトルが与えられ、これに整
数ピッチ周期2F(2I+1)を与えるピッチ合成処理を施すよ
うになる。なお、探索するピッチ周期T がベクトルの次
元数L 以上の場合は、遅延加算部9及びピッチ合成部
8、10での処理は省略できる。
Here, the delay adder 9 and the pitch synthesizer 1
0 performs the processing of Expression 14, and the delay adder 9 delay-shifts the composite vector D i from the convolution unit 6 by the number of samples based on the pitch period I, and the composite vector D i of the convolution unit 7 f is added, and an added synthetic vector is output. Further, the pitch synthesizing unit 10 is given the addition synthesizing vector of the delay adding unit 9, and performs a pitch synthesizing process for giving an integer pitch period 2F (2I + 1) to this. If the pitch period T 1 to be searched is equal to or larger than the number of dimensions L of the vector, the processing in the delay adding unit 9 and the pitch synthesizing units 8 and 10 can be omitted.

【0050】従って、本実施例による駆動信号のベクト
ル量子化では、非整数ピッチ周期を表すコードベクトル
の探索に於いて、サンプリングレートを上げずに高速の
畳み込み法を利用して効率的に合成ベクトルの計算がで
きるので、例えば、探索するピッチ周期の候補を整数ピ
ッチ周期M種類、非整数ピッチ周期N種類とし、コード
ベクトルの次元をLとすると、ピッチ周期がT≧Lなる
とき、(M+N)個の合成ベクトルを求めるのに要する
積和演算量は、式3の高速の畳み込み法に従えば1つの
合成ベクトル当たりL回の積和演算を要するから、(M
+N)種類のピッチ周期の候補に対する合成ベクトルは
L(M+N)回のオーダの積和演算で計算できることに
なり、実時間で高品質な低レート音声符号化が実現でき
ることになる。
Therefore, in the vector quantization of the driving signal according to the present embodiment, in the search for the code vector representing the non-integer pitch period, the high-speed convolution method is used without increasing the sampling rate to efficiently combine the vector. Therefore, for example, if the pitch period candidates to be searched are M integer pitch periods and N non-integer pitch periods N, and the dimension of the code vector is L, when the pitch period is T ≧ L, (M + N) Since the product-sum calculation amount required to obtain each composite vector requires L times of product-sum calculation per composite vector according to the high-speed convolution method of Expression 3, (M
The synthesized vector for + N) types of pitch period candidates can be calculated by multiplying and summing L (M + N) times of products, and real-time high-quality low-rate speech coding can be realized.

【0051】[0051]

【発明の効果】以上述べたように本発明によれば、音声
のピッチ周期を精度良く表すために必要な非整数ピッチ
周期の適応コードブック探索についても高速の畳み込み
を可能にでき、4kbit/秒以下の低レートでも実時間で高
品質な音声符号化を実現することができる。
As described above, according to the present invention, it is possible to perform high-speed convolution even for the adaptive codebook search of a non-integer pitch period necessary for accurately expressing the pitch period of speech, and 4 kbit / sec. It is possible to realize high-quality speech coding in real time even at the following low rates.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の概略構成を示すブロック
図。
FIG. 1 is a block diagram showing a schematic configuration of an embodiment of the present invention.

【図2】本発明の第2の実施例の概略構成を示すブロッ
ク図。
FIG. 2 is a block diagram showing a schematic configuration of a second embodiment of the present invention.

【図3】従来の音声の駆動信号のベクトル量子化方式を
説明するためのブロック図。
FIG. 3 is a block diagram for explaining a conventional vector quantization method of a drive signal for audio.

【図4】従来の音声の駆動信号のベクトル量子化方式を
説明するための図。
FIG. 4 is a diagram for explaining a conventional vector quantization method of a drive signal for audio.

【符号の説明】[Explanation of symbols]

1…フィルタ係数算出部、2…インパルス応答算出部、
3、5…コードブック、4…内挿計算部、6、7…畳み
込み部、9…遅延加算部、8、10…ピッチ合成部、1
1…目標ベクトル算出部、12…入力端子、13…影響
信号算出部、14…駆動信号生成部、15…コード探索
部、16…ゲイン決定部。
1 ... Filter coefficient calculation unit, 2 ... Impulse response calculation unit,
3, 5 ... Codebook, 4 ... Interpolation calculation unit, 6, 7 ... Convolution unit, 9 ... Delay addition unit, 8, 10 ... Pitch synthesis unit, 1
DESCRIPTION OF SYMBOLS 1 ... Target vector calculation part, 12 ... Input terminal, 13 ... Influence signal calculation part, 14 ... Drive signal generation part, 15 ... Code search part, 16 ... Gain determination part.

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】入力される音声信号からベクトル量子化の
目標ベクトルを生成する目標ベクトル生成手段と、 前記音声信号から合成フィルタの係数を決定するととも
に該フィルタ係数からインパルス応答を求めるインパル
ス応答生成手段と、 コードベクトルがオーバーラップする整数ピッチ周期の
駆動信号系列を格納する第1のコードブックと、 上記第1のコードブックの整数ピッチ周期の駆動信号系
列に対する内挿処理により求められるコードベクトルが
オーバーラップする非整数ピッチ周期の駆動信号系列を
格納する第2のコードブックと、 前記インパルス応答生成手段のインパルス応答と前記第
1のコードブックの前記整数ピッチ周期の駆動信号系列
から畳込みを行い合成ベクトルを生成する第1の畳み込
み手段と、 前記インパルス応答生成手段のインパルス応答と前記第
2のコードブックの前記非整数ピッチ周期の駆動信号系
列から畳込みを行い合成ベクトルを生成する第2の畳み
込み手段と、 前記第1および第2の畳み込み手段からの合成ベクトル
と前記目標ベクトル生成手段の目標ベクトルを用いて駆
動信号コードを探索するコード検索手段とを具備したこ
とを特徴とする音声駆動信号のベクトル量子化方式。
1. A target vector generating means for generating a target vector for vector quantization from an input voice signal, and an impulse response generating means for determining a coefficient of a synthesis filter from the voice signal and obtaining an impulse response from the filter coefficient. And a first codebook that stores a drive signal sequence of an integer pitch period in which code vectors overlap, and a code vector obtained by interpolation processing on the drive signal sequence of an integer pitch period of the first codebook is overlaid. A second codebook for storing a non-integer pitch cycle drive signal sequence to be wrapped, a convolution from the impulse response of the impulse response generating means and the integer pitch cycle drive signal sequence of the first codebook, and synthesis. First convolution means for generating a vector, said impulse From the impulse response of the answer generation means and the drive signal sequence of the non-integer pitch period of the second codebook, second convolution means for generating a combined vector; and the first and second convolution means And a code search means for searching a drive signal code by using the target vector of the target vector generation means.
【請求項2】入力される音声信号からベクトル量子化の
目標ベクトルを生成する目標ベクトル生成手段と、 前記音声信号から合成フィルタの係数を決定するととも
に該フィルタ係数からインパルス応答を求めるインパル
ス応答生成手段と、 コードベクトルがオーバーラップする整数ピッチ周期の
駆動信号系列を格納する第1のコードブックと、 上記第1のコードブックの整数ピッチ周期の駆動信号系
列に対する内挿処理により求められるコードベクトルが
オーバーラップする非整数ピッチ周期の駆動信号系列を
格納する第2のコードブックと、 前記インパルス応答生成手段のインパルス応答と前記第
1のコードブックの前記整数ピッチ周期の駆動信号系列
から畳込みを行い合成ベクトルを生成する第1の畳み込
み手段と、 前記インパルス応答生成手段のインパルス応答と前記第
2のコードブックの前記非整数ピッチ周期の駆動信号系
列から畳込みを行い合成ベクトルを生成する第2の畳み
込み手段と、 前記第1の畳み込み手段にて生成される合成ベクトルに
対して整数サンプルのピッチ周期を持つ合成ベクトルを
生成する第1のピッチ合成手段と、 前記第1の畳み込み手段にて生成される合成ベクトルを
前記整数サンプルのピッチ周期に応じて遅延させるとと
もに前記第2の畳み込み手段にて生成される合成ベクト
ルを加算し加算合成ベクトルを生成する遅延加算手段
と、 前記加算合成ベクトルから整数サンプルのピッチ周期を
持つ合成ベクトルを生成する第2のピッチ合成手段と、 前記第1および第2のピッチ合成手段からの合成ベクト
ルと前記目標ベクトル生成手段の目標ベクトルを用いて
駆動信号コードを探索するコード検索手段とを具備した
ことを特徴とする音声駆動信号のベクトル量子化方式。
2. A target vector generating means for generating a target vector for vector quantization from an input voice signal, and an impulse response generating means for determining a coefficient of a synthesis filter from the voice signal and obtaining an impulse response from the filter coefficient. And a first codebook that stores a drive signal sequence of an integer pitch period in which code vectors overlap, and a code vector obtained by interpolation processing on the drive signal sequence of an integer pitch period of the first codebook is overlaid. A second codebook for storing a non-integer pitch cycle drive signal sequence to be wrapped, a convolution from the impulse response of the impulse response generating means and the integer pitch cycle drive signal sequence of the first codebook, and synthesis. First convolution means for generating a vector, said impulse Second convolution means for convoluting the impulse response of the answer generation means and the drive signal sequence of the non-integer pitch period of the second codebook to generate a combined vector; and the second convolution means for generating the combined vector. First pitch synthesizing means for generating a synthetic vector having an integer sample pitch period with respect to the synthetic vector, and delaying the synthetic vector generated by the first convolution means according to the integer sample pitch period. And a second adding pitch for generating a combined vector having an integer sample pitch period from the added combined vector, and a delay addition means for adding the combined vector generated by the second convolution means to generate an added combined vector Combining means, combining vectors from the first and second pitch combining means, and an eye of the target vector generating means Vector quantization scheme of the audio driving signal, characterized by comprising a code search means for searching a driving signal code using a vector.
JP3250672A 1991-09-30 1991-09-30 Vector quantization system for speech drive signal Pending JPH0588699A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3250672A JPH0588699A (en) 1991-09-30 1991-09-30 Vector quantization system for speech drive signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3250672A JPH0588699A (en) 1991-09-30 1991-09-30 Vector quantization system for speech drive signal

Publications (1)

Publication Number Publication Date
JPH0588699A true JPH0588699A (en) 1993-04-09

Family

ID=17211334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3250672A Pending JPH0588699A (en) 1991-09-30 1991-09-30 Vector quantization system for speech drive signal

Country Status (1)

Country Link
JP (1) JPH0588699A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011048810A1 (en) * 2009-10-20 2011-04-28 パナソニック株式会社 Vector quantisation device and vector quantisation method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011048810A1 (en) * 2009-10-20 2011-04-28 パナソニック株式会社 Vector quantisation device and vector quantisation method

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
US5359696A (en) Digital speech coder having improved sub-sample resolution long-term predictor
JP3134817B2 (en) Audio encoding / decoding device
US6594626B2 (en) Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
AU634795B2 (en) Digital speech coder having improved sub-sample resolution long-term predictor
JP4008607B2 (en) Speech encoding / decoding method
JP2000155597A (en) Voice coding method to be used in digital voice encoder
JP3168238B2 (en) Method and apparatus for increasing the periodicity of a reconstructed audio signal
EP0964393A1 (en) Speech coding
EP1204094B1 (en) Excitation signal low pass filtering for speech coding
JPH0588699A (en) Vector quantization system for speech drive signal
JPH10222197A (en) Voice synthesizing method and code exciting linear prediction synthesizing device
JPH0258100A (en) Voice encoding and decoding method, voice encoder, and voice decoder
JP3249144B2 (en) Audio coding device
JP3299099B2 (en) Audio coding device
JPH08185199A (en) Voice coding device
JPH05273998A (en) Voice encoder
JPH0990997A (en) Speech coding device, speech decoding device, speech coding/decoding method and composite digital filter
JPH08320700A (en) Sound coding device
JP3002299B2 (en) Audio coding device
JP3290443B2 (en) Code-excited linear prediction encoder and decoder
JPH02282800A (en) Sound encoding system
JP3410931B2 (en) Audio encoding method and apparatus
JP4007730B2 (en) Speech encoding apparatus, speech encoding method, and computer-readable recording medium recording speech encoding algorithm
JP3207466B2 (en) Coding method of pitch synthesis filter