JP3207466B2 - Coding method of pitch synthesis filter - Google Patents

Coding method of pitch synthesis filter

Info

Publication number
JP3207466B2
JP3207466B2 JP25067391A JP25067391A JP3207466B2 JP 3207466 B2 JP3207466 B2 JP 3207466B2 JP 25067391 A JP25067391 A JP 25067391A JP 25067391 A JP25067391 A JP 25067391A JP 3207466 B2 JP3207466 B2 JP 3207466B2
Authority
JP
Japan
Prior art keywords
pitch
vector
gain
code
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP25067391A
Other languages
Japanese (ja)
Other versions
JPH0588700A (en
Inventor
公生 三関
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP25067391A priority Critical patent/JP3207466B2/en
Publication of JPH0588700A publication Critical patent/JPH0588700A/en
Application granted granted Critical
Publication of JP3207466B2 publication Critical patent/JP3207466B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、CELP方式の音声符号化
に適用されるピッチ合成フィルタの符号化方式に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an encoding method of a pitch synthesis filter applied to CELP speech encoding.

【0002】[0002]

【従来の技術】従来、音声信号を8kbit/秒程度の低レー
トで高品質に符号化できる符号化方式として、CELP(Cod
e Excited Linear Predicion) 方式が知られている。CE
LP方式の詳細はP.Kroon 氏らの"A Class of Analysis-b
y-Synthesis Coding at RatesBetween 4.8 and 16kbits
/s",IEEE SAC-6, pp.353-363,February 1988 に述べら
れている。
2. Description of the Related Art Conventionally, as a coding method capable of coding a speech signal at a low rate of about 8 kbit / sec and high quality, CELP (Cod
e Excited Linear Predicion) method is known. CE
For details on the LP method, see "A Class of Analysis-b" by P. Kroon et al.
y-Synthesis Coding at RatesBetween 4.8 and 16kbits
/ s ", IEEE SAC-6, pp. 353-363, February 1988.

【0003】CELP方式は、合成音声信号を駆動信号と合
成フィルタとピッチ合成フィルタとにより生成する音声
符号化方式の1つに分類され、その特徴とするところ
は、音声信号から生成される目標ベクトルと合成ベクト
ルとの波形歪が小さくなるように駆動信号コードブック
内から最適なコードベクトルを選択するところにある。
図4は、従来のCELP方式の符号側で行われるピッチゲイ
ンの符号化部分とそれ以外の部分に分けて示すブロック
図である。
[0003] The CELP system is classified into one of voice coding systems for generating a synthesized voice signal by using a driving signal, a synthesis filter, and a pitch synthesis filter. The feature of the CELP system is that a target vector generated from the voice signal is generated. An optimal code vector is to be selected from the drive signal codebook so that the waveform distortion between the signal and the composite vector is reduced.
FIG. 4 is a block diagram showing a coding part of pitch gain performed on the code side of the conventional CELP system and a part other than the coding part.

【0004】図において、212は入力端子で、この入
力端子212に与えられる入力信号(例えば音声信号)
は、フィルタ係数算出部201及び目標ベクトル算出部
211にそれぞれ送られる。
[0004] In the figure, reference numeral 212 denotes an input terminal, which is an input signal (for example, an audio signal) supplied to the input terminal 212.
Are sent to the filter coefficient calculation unit 201 and the target vector calculation unit 211, respectively.

【0005】フィルタ係数算出部201は、入力信号を
線形予測分析して声道特性を表す合成フィルタのフィル
タ係数を求め、これを符号化してインパルス応答を求
め、フィルタ係数情報を目標ベクトル算出部211、影
響信号算出部213および合成ベクトル算出部206に
与え、さらに出力端子220より出力する。また、目標
ベクトル算出部211は、フィルタ係数算出部201の
フィルタ係数を基に数を基に決まる重みフィルタで入力
信号を重み付けし、後で述べる影響信号算出部213の
過去の符号化による現在の入力信号への影響信号を該重
み付けされた入力信号から差し引き、駆動信号のベクト
ル量子化に用いる目標ベクトルX を算出するようにして
いる。
A filter coefficient calculating section 201 performs linear prediction analysis of an input signal to obtain filter coefficients of a synthesis filter representing vocal tract characteristics, encodes them to obtain an impulse response, and converts the filter coefficient information into a target vector calculating section 211. , To the influence signal calculation unit 213 and the combined vector calculation unit 206, and further output from the output terminal 220. In addition, the target vector calculation unit 211 weights the input signal with a weight filter determined based on the number based on the filter coefficient of the filter coefficient calculation unit 201, and outputs the current signal based on the past encoding of the influence signal calculation unit 213 described later. An influence signal on the input signal is subtracted from the weighted input signal, and a target vector X used for vector quantization of the drive signal is calculated.

【0006】一方、203はコードブックで、このコー
ドブック203は、駆動信号生成部214で生成された
過去の駆動信号を順次取り込み、また、コードブック2
03内の不要な駆動信号を廃棄することでその内容を更
新可能にしている。ここで、コードブック203は、CE
LP方式の場合、性質の異なる複数のものを用いることが
多く、ここでは最も効率の良いコードブックとして知ら
れる適応コードブックが用いられている。この適応コー
ドブックは過去に符号化された音声の駆動信号をコード
ブックとするもので、人間の音声で強い周期性(ピッ
チ)を持つ区間の駆動信号ではピッチ周期毎に似た波形
が繰り返すため、効率のよい駆動信号の符号化が可能に
なる。また、適応コードブックのコードベクトルは、ピ
ッチ周期に基づいてコード番号が付けられ、現在のサン
プル点からピッチ周期だけ過去の駆動信号をコードベク
トルとするようにしている。
[0006] On the other hand, reference numeral 203 denotes a code book. The code book 203 sequentially takes in past drive signals generated by the drive signal generation unit 214,
By discarding unnecessary drive signals in 03, the contents can be updated. Here, the codebook 203 is CE
In the case of the LP method, a plurality of codes having different properties are often used, and an adaptive codebook known as the most efficient codebook is used here. This adaptive codebook uses a drive signal of voice coded in the past as a codebook. Since a drive signal in a section having strong periodicity (pitch) in human voice repeats a waveform similar to each pitch cycle. Thus, efficient encoding of the drive signal is enabled. The code vector of the adaptive code book is assigned a code number based on the pitch cycle, and a drive signal in the past from the current sample point by the pitch cycle is used as the code vector.

【0007】そして、コードブック203の出力は、合
成ベクトル算出部206に送られ、合成ベクトル算出部
206において、フィルタ係数算出部201のインパル
ス応答とコードブック203からのピッチ周期T に基づ
くコードベクトルにより畳み込み計算を行い合成ベクト
ル DT を計算する。
[0007] The output of the codebook 203 is sent to a combined vector calculation unit 206, which uses the code vector based on the impulse response of the filter coefficient calculation unit 201 and the pitch period T from the codebook 203. A convolution calculation is performed to calculate a composite vector DT .

【0008】さらに、合成ベクトル算出部206の合成
ベクトル DT をピッチ合成部208に入力し、これに探
索中のピッチ周期T を与えてピッチ合成処理を施しピッ
チ合成ベクトル UT を生成する。この場合のピッチ合成
処理は、次式により行うことができる。 UT (n) = DT (n)+ UT (n-T) …(1)
Furthermore, the synthetic vector D T of the synthesis vector calculating unit 206 and input to the pitch synthesis unit 208 generates a pitch synthesis vector U T subjected to pitch synthesis process giving a pitch period T in the search thereto. The pitch synthesis processing in this case can be performed by the following equation. U T (n) = D T (n) + U T (nT) ... (1)

【0009】上式ではピッチ周期T 、ピッチゲイン1の
ピッチ合成フィルタの処理を表しているが、このような
ピッチ合成フィルタは、z変換領域で1/(1-z-T) とな
り、入力波形を周期T で単純に繰り返す効果しか持たな
い。
In the above equation, the processing of a pitch synthesis filter having a pitch period T and a pitch gain of 1 is represented. Such a pitch synthesis filter becomes 1 / (1-z- T ) in the z - conversion domain, and the input waveform Has only the effect of simply repeating with a period T.

【0010】従って、従来のCELP方式では、ピッチゲイ
ンを1とする代わりに UT に乗じるべき最適のゲインγ
T を求めて符号化するようにしているが、この方法では
式1に示すようなピッチ周期の更新区間内で全く同じ形
の駆動信号が繰り返すピッチ合成フィルタが用いられる
ため、同じようなパワーで繰り返す音声信号については
比較的効率よく表現できるが、駆動信号のパワーが急激
に増加する音声の出だしの区間やパワーの減少する言葉
の終わりの区間では音声を正確に表すことができない。
Accordingly, in the conventional CELP scheme, the optimal gain should multiplied to U T instead of the 1 pitch gain γ
Although T is obtained and encoded, this method uses a pitch synthesis filter in which drive signals of exactly the same shape repeat within the update interval of the pitch period as shown in Expression 1, so that the same power is used. Although a repetitive voice signal can be expressed relatively efficiently, the voice cannot be accurately represented in a section where the power of the drive signal suddenly increases or a section where the power decreases at the end of a word.

【0011】そして、ピッチ合成部208にてピッチ周
期T を与えられた合成ベクトル UTは、コード探索部2
15に与えられ、ピッチ周期T を与えた合成ベクトル U
T と目標ベクトルX を用いてコード検索(ピッチ周期検
索)を行う。ここでのコード検索は、最適ゲインγT
与えられたときの合成ベクトルγT U と目標ベクトルX
との歪 Xt X-(Xt UT ) 2 /( UT t UT ) の最小化、即
ち、値(Xt UT ) 2 /(UT t UT ) が最大となるコード
(ピッチ周期)を探索することで行われる。そして、最
適ゲイン値はゲイン決定部207へ、最適なコード情報
は駆動信号生成部207に与えられるとともに、出力端
子218に出力される。
[0011] Then, the resultant vector U T given pitch period T in pitch synthesis unit 208, the code search unit 2
15, a composite vector U given a pitch period T
A code search (pitch cycle search) is performed using T and the target vector X. The code search here is performed by combining the combined vector γ T U and the target vector X when the optimal gain γ T is given.
And the distortion X t X- (X t U T ) 2 / (U T t U T ), that is, the value (X t U T ) 2 / (U T t This is performed by searching for a code (pitch cycle) that maximizes U T ). Then, the optimum gain value is provided to the gain determination unit 207, and the optimum code information is provided to the drive signal generation unit 207 and output to the output terminal 218.

【0012】ゲイン決定部207では、コード探索部2
15で計算される最適ゲインγT opt =(Xt UTopt)/(U
Topt t UTopt) を目標値として、ゲインテーブル205
を用いてコードベクトルのゲインを符号化し、これを出
力端子219に出力する。また、駆動信号生成部214
では、コード探索部215の最適コード情報およびゲイ
ン決定部207の符号化されたゲインを用い、最適コー
ドベクトルにゲインを乗ずることにより現在区間の音声
の駆動信号を生成するようになる。また、この駆動信号
は影響信号算出部213に与えられ、影響信号算出部2
13にて現在区間の音声の駆動信号のベクトル量子化に
よる次の区間への影響信号を算出するようになる。
In the gain determining section 207, the code searching section 2
The optimal gain γ T opt = (X t U Topt ) / (U
Topt t U Topt ) as the target value and the gain table 205
Is used to encode the gain of the code vector, and this is output to the output terminal 219. Also, the drive signal generation unit 214
Then, using the optimum code information of the code search unit 215 and the coded gain of the gain determination unit 207, the optimum code vector is multiplied by the gain to generate a speech drive signal for the current section. This drive signal is given to the influence signal calculation unit 213, and the influence signal calculation unit 2
At 13, an influence signal on the next section due to vector quantization of the audio drive signal of the current section is calculated.

【0013】しかして、このようなCELP方式によれば、
選択された駆動信号コードと合成フィルタとピッチ合成
フィルタとより生成される合成音声信号は、歪が小さい
ことを符号側で確認しているので、復号側でも8kbit/秒
程度のビットレートについては良好な合成音声を生成す
ることが可能となる。
According to the CELP system,
The synthesized voice signal generated by the selected drive signal code, the synthesis filter, and the pitch synthesis filter has been confirmed by the code side to have low distortion, so that the decoding side has a good bit rate of about 8 kbit / sec. It is possible to generate a complex synthesized voice.

【0014】ところで、従来の8kbit/秒程度のビットレ
ートで符号化を実現するものでは、適応コードブック探
索及びピッチ合成を5msec 程度の短い区間( サブフレー
ム)毎に行うようにしているが、このような短いサブフ
レームを用いれば実際の音声の駆動信号のゲイン及びピ
ッチ周期の変化が少なくなるので、比較的正確に駆動信
号を表現できる。
By the way, in the conventional encoding at a bit rate of about 8 kbit / sec, adaptive codebook search and pitch synthesis are performed for each short section (subframe) of about 5 msec. When such a short subframe is used, the change in the gain and pitch cycle of the actual audio drive signal is reduced, so that the drive signal can be expressed relatively accurately.

【0015】これに対して、最近、さらに低いビットレ
ートである4kbit/秒程度の音声の符号化を行うことが考
えられているが、このような低いビットレートを用いる
と、使用できるビット数に制約があることから、サブフ
レームの長さを大きくしてピッチ周期及びピッチゲイン
のそれぞれの更新周期を長くする必要がある。しかし、
このようにすると各サブフレーム毎での駆動信号のゲイ
ン及びピッチ周期の変化が顕著となって、合成音声が滑
らかに変化しなくなり、これが原因で合成音声の品質が
劣化する欠点があった。
On the other hand, recently, it has been considered to perform speech coding at a lower bit rate of about 4 kbit / sec. However, if such a low bit rate is used, the number of usable bits is reduced. Due to the restrictions, it is necessary to increase the length of the subframe to increase the pitch cycle and the pitch gain update cycle. But,
In this case, the gain and pitch cycle of the drive signal for each sub-frame change significantly, and the synthesized voice does not change smoothly, resulting in a deterioration in the quality of the synthesized voice.

【0016】[0016]

【発明が解決しようとする課題】このように従来の音声
符号化においては、ビットレートが4kbit/秒程度の低レ
ートになると、使用できるビット数の制約からピッチ周
期及びピッチゲインの更新周期(サブフレーム)を長く
する必要が生じ、これによりサブフレーム内で変化する
駆動信号情報、特にピッチゲインの情報を正確に表現で
きなくなり高品質な合成音声を生成できないという問題
点があった。
As described above, in the conventional speech coding, when the bit rate becomes as low as about 4 kbit / sec, the pitch cycle and the pitch gain update cycle (sub Frame), which makes it impossible to accurately represent drive signal information that changes within a sub-frame, especially pitch gain information, and cannot produce high-quality synthesized speech.

【0017】本発明は上記事情に鑑みてなされたもの
で、4kbit/秒程度の低ビットレートでも合成音声のパワ
ーが滑らかに変化し高品質な合成音声を生成できるピッ
チ合成フィルタの符号化方式を提供することを目的とす
る。
The present invention has been made in view of the above circumstances, and provides an encoding method of a pitch synthesis filter capable of generating a high-quality synthesized voice by smoothly changing the power of the synthesized voice even at a low bit rate of about 4 kbit / sec. The purpose is to provide.

【0018】[0018]

【課題を解決するための手段】上述した目的を達成する
ため、本発明のピッチ合成フィルタの符号化方式は、適
応コードブックを用いてピッチ周期検索を行うとともに
該検索されたピッチ周期により指定される前記適応コー
ドブックのコードベクトルを出力する音声符号化手段、
音声符号化手段より出力されるコードベクトルを用いて
合成ベクトルを生成する合成ベクトル生成手段、符号化
手段での適応コードブック検索で求まるピッチ周期とゲ
インテーブルのピッチゲインをパラメータとして再帰形
ピッチ合成フィルタを生成するとともに、合成ベクトル
生成手段の合成ベクトルについて再帰形のピッチ合成処
理を施し合成音声を生成する手段、合成音声の歪量を基
に前記ゲインテーブルのピッチゲインを選択する手段に
より構成している。
In order to achieve the above-mentioned object, a coding method of a pitch synthesis filter according to the present invention performs a pitch cycle search using an adaptive codebook, and specifies a pitch cycle by the searched pitch cycle. Speech encoding means for outputting a code vector of the adaptive codebook,
Synthetic vector generating means for generating a synthetic vector using a code vector output from a voice coding means, a recursive pitch synthesis filter using a pitch period obtained by an adaptive codebook search in the coding means and a pitch gain of a gain table as parameters And a means for performing a recursive pitch synthesis process on the synthesized vector of the synthesized vector generating means to generate a synthesized voice, and a means for selecting a pitch gain of the gain table based on a distortion amount of the synthesized voice. I have.

【0019】[0019]

【作用】この結果、本発明によればCELP符号化で閉ルー
プのピッチ周期探索により決定したピッチ周期とゲイン
テーブルのピッチゲイン候補を用いて再帰形ピッチ合成
フィルタを生成し、このピッチ合成フィルタを用いて合
成された音声信号の歪量を基に最適なピッチゲインをゲ
インテーブルから選択することで、駆動信号の急激なパ
ワーの増加/減少に対応できるパワーの変化の滑らかな
合成音声が得られるようになる。つまり、CELP符号化に
より求めた高精度のピッチ周期を用いた再帰形ピッチ合
成フィルタを使用することにより、低レートでもパワー
の変化が滑らかで且つピッチ周期の正確な高品質な合成
音声を提供できるようになる。
As a result, according to the present invention, a recursive pitch synthesis filter is generated by using the pitch cycle determined by the closed loop pitch cycle search and the pitch gain candidate of the gain table in the CELP coding, and this pitch synthesis filter is used. By selecting the optimal pitch gain from the gain table based on the distortion amount of the synthesized voice signal, a synthesized voice having a smooth power change corresponding to a sudden increase / decrease of the power of the drive signal can be obtained. become. In other words, by using a recursive pitch synthesis filter using a high-precision pitch cycle obtained by CELP encoding, it is possible to provide a high-quality synthesized speech with a smooth power change and an accurate pitch cycle even at a low rate. Become like

【0020】[0020]

【実施例】以下、本発明の一実施例を図面に従い説明す
る。
An embodiment of the present invention will be described below with reference to the drawings.

【0021】図1は、同実施例に係るピッチ合成フィル
タの符号化方式を適用したCELP型の音声符号化方式の原
理的構成を示すブロック図である。図において、112
は入力端子で、この入力端子112に与えられる入力信
号(例えば音声信号)はCELP符号化部100に入力され
る。
FIG. 1 is a block diagram showing a principle configuration of a CELP-type speech coding system to which the coding system of the pitch synthesis filter according to the embodiment is applied. In the figure, 112
Is an input terminal, and an input signal (for example, a voice signal) provided to the input terminal 112 is input to the CELP encoding unit 100.

【0022】CELP符号化部100は、上述した図4の符
号200で説明したCELP方式のものが適用される。な
お、このようなCELP方式のものでは、音声の駆動信号を
符号化するために適応コードブックの他に雑音コードブ
ック等のコードブック用いることが多いが、ここでは適
応コードブックだけを用いたものが使用される。
As the CELP encoding unit 100, the one of the CELP system described with reference numeral 200 in FIG. 4 is applied. In addition, in the case of such a CELP system, a codebook such as a noise codebook is often used in addition to the adaptive codebook in order to encode the audio drive signal, but here, only the adaptive codebook is used. Is used.

【0023】そして、このようなCELP符号化部100に
おいて入力音声信号より抽出される合成フィルタ係数
は、合成部140に与えられ、同時に出力端子120よ
り出力される。また、探索されたピッチ周期の情報は、
遅延部166に与えられ、同時に出力端子118より出
力される。さらに、探索されたピッチ周期Toptで指定さ
れる適応コードブックからのコードベクトルは、合成部
140に与えられ、また、入力信号を重み付けして得ら
れる目標ベクトルは、ゲイン評価部170に与えられ
る。
Then, the synthesis filter coefficient extracted from the input speech signal in the CELP encoding section 100 is provided to the synthesis section 140 and output from the output terminal 120 at the same time. The information of the searched pitch cycle is
The signal is supplied to the delay unit 166 and output from the output terminal 118 at the same time. Further, the code vector from the adaptive code book specified by the searched pitch period Topt is provided to the synthesizing unit 140, and the target vector obtained by weighting the input signal is provided to the gain evaluating unit 170.

【0024】合成部140はCELP符号化部100より与
えられるコードベクトルと合成フィルタの係数を基に合
成ベクトル DToptを求め、この合成ベクトル DToptをピ
ッチ合成部160に与える。
The synthesizing unit 140 obtains a synthesized vector D Topt based on the code vector supplied from the CELP encoding unit 100 and the coefficients of the synthesis filter, and supplies the synthesized vector D Topt to the pitch synthesizing unit 160.

【0025】ピッチ合成部160は、加算部162、遅
延部166、乗算部164より構成され、合成部140
からの合成ベクトルを入力として、ゲインテーブル15
0よりのピッチゲインの候補値b とCELP符号化部100
のピッチ周期 Topt を用いて下式に示す再帰形のピッチ
合成フィルタP(z)により処理を行いピッチ合成ベクトル
Y を生成する。 P(z)=1/(1- bz-Topt ) …(2)
The pitch synthesizer 160 includes an adder 162, a delay 166, and a multiplier 164.
The gain vector 15
Pitch gain candidate value b from 0 and CELP encoding section 100
Is processed by the recursive pitch synthesis filter P (z) shown in the following equation using the pitch period T opt of
Generate Y. P (z) = 1 / (1- bz -Topt )… (2)

【0026】ここでのピッチ合成フィルタは、CELP符号
化で閉ループのピッチ周期探索により決定した高精度な
ピッチ周期 Topt とゲインテーブルのピッチゲイン候補
b を用いて生成されたもので、b>1 のときは入力信号の
振幅をピッチ周期 Topt 毎にb 倍に滑らかに増加し、b<
1 のときは入力信号の振幅をピッチ周期 Topt 毎にb倍
に滑らかに減少するように動作する。
The pitch synthesis filter used here is a highly accurate pitch cycle T opt determined by a closed loop pitch cycle search in CELP coding. And pitch gain candidates in the gain table
b), and when b> 1, the amplitude of the input signal is smoothly increased by a factor of b for each pitch period T opt , and b <
When it is 1, the input signal operates so as to smoothly decrease the amplitude of the input signal by a factor of b for each pitch period Topt .

【0027】ピッチ合成部160での動作をさらに詳し
く説明すると、加算部162では合成ベクトル D
Topt(n) とピッチ合成ベクトルのピッチ周期分過去の値
にゲインテーブル150よりのピッチゲインの候補値b
を乗じた値bY(n-Topt ) を加算しピッチ合成ベクトルY
(n)を出力する。また、遅延部166では過去のピッチ
合成ベクトルを格納し、CELP符号化部100からのピッ
チ周期 Topt に基づいてピッチ周期分過去のピッチ合成
ベクトルの値を出力する。そして、乗算部164では、
この値にゲインテーブル150よりのピッチゲインの候
補値b を乗じた値を加算部162に出力するようにな
る。このような処理は、例えば次式に従って行われる。 Y(n)= DTopt(n)+bY(n-Topt ) …(3)
The operation of the pitch synthesizing unit 160 will be described in more detail.
Topt (n) and the pitch gain candidate value b from the gain table 150 to the past value for the pitch cycle of the pitch synthesis vector.
Is added to the value bY (nT opt ), and the pitch composite vector Y
(n) is output. Further, the delay unit 166 stores the past pitch synthesized vector, and outputs the value of the pitch synthesized vector in the past by the pitch period based on the pitch period T opt from the CELP encoding unit 100. Then, in the multiplication unit 164,
A value obtained by multiplying this value by the pitch gain candidate value b from the gain table 150 is output to the adding unit 162. Such processing is performed, for example, according to the following equation. Y (n) = D Topt (n) + bY (nT opt ) (3)

【0028】そして、ゲイン評価部170にてCELP符号
化部100の目標ベクトルX とピッチ合成ベクトルY と
の歪量を評価し、歪量が最小となるピッチゲイン bopt
をゲインテーブル150から探索し、最適ピッチゲイン
の情報をCELP符号化部100に与えるとともに、出力端
子119より出力するようになる。
Then, the gain evaluator 170 evaluates the amount of distortion between the target vector X and the pitch composite vector Y of the CELP encoder 100, and obtains a pitch gain b opt that minimizes the amount of distortion.
Is searched from the gain table 150, information on the optimal pitch gain is provided to the CELP encoding unit 100, and is output from the output terminal 119.

【0029】従って、このようにしたピッチ合成フィル
タの符号化方式を適用すれば、従来のサブフレーム内で
全く同じ形の駆動信号が繰り返すピッチ合成フィルタと
異なり、再帰形ピッチ合成フィルタを用いるので駆動信
号の急激なパワーの増加/減少に対応でき、また、確定
したピッチ周期に対してだけゲインテーブル内のゲイン
を探索するため、ゲイン探索に要する計算量の増加も無
視できるほど少なくでき、ゲインの符号化ビット数の増
加は全く無いという利点もある。これにより、サブフレ
ーム長が大きい構成の低ビットレートの音声符号化にお
いても、パワーの変化の滑らかな高品質の合成音声を得
られるようになる。
Therefore, if the coding method of the pitch synthesizing filter as described above is applied, unlike a conventional pitch synthesizing filter in which drive signals of exactly the same shape repeat within a subframe, a recursive pitch synthesizing filter is used. Since it is possible to cope with a sudden increase / decrease of the power of the signal and to search for the gain in the gain table only for the determined pitch period, the increase in the amount of calculation required for the gain search can be negligibly small. There is also an advantage that the number of coded bits does not increase at all. This makes it possible to obtain high-quality synthesized speech having a smooth power change even in low-bit-rate speech encoding having a large subframe length.

【0030】因みに、本発明の効果を確かめるために、
実際の音声信号を用いて符号化の比較実験を行ったとこ
ろ、図3の結果が確認された。ここで、図3(a)は実
際の入力音声信号の波形図(60msec)で、従来のピッチ周
期の更新区間内で全く同じ形の駆動信号が繰り返すピッ
チ合成フィルタを用いたものでは、同図(b)に示すよ
うな合成音声信号の波形となり、合成音声のパワーが滑
らかに変化しないため、入力音声信号波形のパワー変化
に似ていないものとなるが、本発明では、上述した再帰
形ピッチ合成フィルタを用いることにより同図(c)に
示すように合成音声のパワーが滑らかに変化する合成音
声信号の波形となり、より入力音声信号波形のパワー変
化に近くなっている。次に、本発明の第2の実施例を図
2に従い説明する。この場合、図2は、図1と同一符号
を付した部分は、上述した説明と同様の機能を有するの
で、ここでの説明は省略する。図において、入力信号
(例えば音声信号)は入力端子112よりフィルタ係数
算出部101及び目標ベクトル算出部111に入力され
る。
Incidentally, in order to confirm the effect of the present invention,
A comparison experiment of coding was performed using actual speech signals, and the result of FIG. 3 was confirmed. Here, FIG. 3 (a) is a waveform diagram (60 msec) of an actual input voice signal. In the case of using a conventional pitch synthesizing filter in which drive signals of exactly the same shape are repeated within the update interval of the pitch cycle, FIG. Since the waveform of the synthesized voice signal does not change smoothly because of the waveform of the synthesized voice signal shown in (b), the synthesized voice signal does not resemble the power change of the input voice signal waveform. By using the synthesis filter, the power of the synthesized voice becomes a waveform of the synthesized voice signal that smoothly changes, as shown in FIG. 3C, and is closer to the power change of the input voice signal waveform. Next, a second embodiment of the present invention will be described with reference to FIG. In this case, in FIG. 2, portions denoted by the same reference numerals as those in FIG. 1 have the same functions as those described above, and thus description thereof will be omitted. In the figure, an input signal (for example, an audio signal) is input from an input terminal 112 to a filter coefficient calculator 101 and a target vector calculator 111.

【0031】フィルタ係数算出部101ではフレーム長
(通常20ms程度)単位で入力信号を予測分析して合成フ
ィルタのフィルタ係数を求め、これを符号化して係数情
報を出力端子120に出力する。これ以下の処理はベク
トルの次元数のサンプルで表される時間長を一小区間
(サブフレーム)として、サブフレーム毎に行われる。
The filter coefficient calculation unit 101 predicts and analyzes the input signal in units of a frame length (usually about 20 ms) to obtain a filter coefficient of a synthesis filter, encodes the filter coefficient, and outputs coefficient information to an output terminal 120. The processing below this is performed for each subframe, with the time length represented by the sample of the number of dimensions of the vector as one small section (subframe).

【0032】目標ベクトル算出部111では、フィルタ
係数算出部101のフィルタ係数を基に決まる重みフィ
ルタで入力信号を重み付けし、後で述べる影響信号算出
部113の過去の符号化による現在の入力信号への影響
信号を該重み付けされた入力信号から差し引き、駆動信
号のベクトル量子化に用いる目標ベクトルX を算出す
る。
The target vector calculation section 111 weights the input signal with a weighting filter determined based on the filter coefficient of the filter coefficient calculation section 101, and adds the weighted input signal to the current input signal obtained by past coding of the influence signal calculation section 113 described later. Is subtracted from the weighted input signal to calculate a target vector X used for vector quantization of the drive signal.

【0033】一方、コードブック103は適応コードブ
ックからなるもので、後で述べる駆動信号生成部114
で生成された過去の駆動信号V(n)を取り込み、また、コ
ードブック103内の不要な駆動信号を廃棄すること
で、その内容を更新している。この場合、コードブック
103から生成されるコードベクトルは、コードがピッ
チ周期T =I (I は整数)に対応するもので、そのコー
ドベクトル VI (n)(n=0,1,...,L)は、次式で定義されて
いる。(ここで、L はベクトルの次元を表している。) VI (n)=V(n-I) (n=0,1,...,min(I-1,L-1)) …(4) コードブック103のコードベクトルは合成ベクトル算
出部106に送られる。
On the other hand, the code book 103 is composed of an adaptive code book, and includes a drive signal generator 114 described later.
The content is updated by taking in the past drive signal V (n) generated in (1) and discarding unnecessary drive signals in the codebook 103. In this case, the code vector generated from the code book 103 is such that the code corresponds to the pitch period T = I (I is an integer) and the code vector V I (n) (n = 0, 1,...) , L) is defined by the following equation. (Here, L represents the dimension of the vector.) V I (n) = V (nI) (n = 0,1, ..., min (I-1, L-1)) ... (4 The code vector of the code book 103 is sent to the composite vector calculation unit 106.

【0034】合成ベクトル算出部106では、フィルタ
係数算出部101のフィルタ係数とコードブック103
の探索ピッチ周期に基づくコードベクトルにより合成ベ
クトル DI を計算する。
In the composite vector calculation unit 106, the filter coefficients of the filter coefficient calculation unit 101 and the codebook 103
The code vector based on the search pitch period of calculating the combined vector D I.

【0035】そして、この合成ベクトル算出部106の
合成ベクトル DIをピッチ合成部108に与える。ピッ
チ合成部108では、ピッチ周期I、ピッチゲイン1の
ピッチ合成フィルタで合成ベクトルをピッチ合成するよ
うになる。このような処理は次式に従って実行される。 UI (n) = DI (n)+ UI (n-I) …(5) なお、探索するピッチ周期I がベクトルの次元数L 以上
の場合は、ピッチ合成部108の処理は省略できる。
[0035] Then, provide a synthetic vector D I of the synthetic vector calculation unit 106 to the pitch synthesis section 108. The pitch synthesizing unit 108 synthesizes the synthesized vector with a pitch using a pitch synthesizing filter having a pitch period I and a pitch gain of 1. Such processing is performed according to the following equation. U I (n) = D I (n) + U I (nI) (5) When the pitch period I to be searched is equal to or greater than the number of dimensions L of the vector, the processing of the pitch synthesis unit 108 can be omitted.

【0036】ピッチ合成部108の合成ベクトル U
I は、コード探索部115に与えられる。コード探索部
115では、ピッチ合成部108の合成ベクトル UI
目標ベクトルX とを用いて、コード探索を行う。ここで
のコード探索は、値(Xt UI ) 2 /( UI t UI ) が最大
となるコードを探索することで行われる。そして、最適
なコードの情報は出力端子118より出力されるととも
に、コードブック103に送られる。一方、合成部14
0ではコードブック103の最適コードベクトルとフィ
ルタ係数算出部101の合成フィルタ係数を基に合成ベ
クトル DToptを求める。
The synthesized vector U of the pitch synthesizer 108
IIs given to the code search unit 115. Code search section
At 115, the synthesized vector U of the pitch synthesis unit 108IWhen
A code search is performed using the target vector X. here
Search for the value (Xt  UI)Two / (UI t  UI) Is the largest
This is done by searching for the code And optimal
Code information is output from the output terminal 118.
Is sent to the codebook 103. On the other hand, the combining unit 14
0 means that the optimal code vector and code
A synthesis filter based on the synthesis filter coefficient of the
Couture DToptAsk for.

【0037】そして、この合成ベクトル DToptはピッチ
合成部160に送られる。ピッチ合成部160では、合
成部140からの合成ベクトルを入力として、ゲインテ
ーブル150よりのピッチゲインの候補値b とコード探
索部115よりのピッチ周期Topt を用いて上述の式2
に従って再帰形のピッチ合成処理を実行し、ピッチ合成
ベクトルY を生成するようになる。
Then, the synthesized vector D Topt is sent to the pitch synthesizer 160. The pitch synthesizing section 160 receives the synthesized vector from the synthesizing section 140 as an input, and uses the pitch gain candidate value b from the gain table 150 and the pitch cycle T opt from the code searching section 115 to obtain the above-described equation (2).
, A recursive pitch synthesis process is executed to generate a pitch synthesis vector Y.

【0038】そして、ゲイン評価部170にて目標ベク
トル算出部111の目標ベクトルXとピッチ合成ベクト
ルY の歪量を評価し、歪量が最小となるピッチゲイン b
optをゲインテーブル150から探索し、最適ピッチゲ
インの情報を駆動信号生成部114に与えるとともに、
出力端子119より出力するようになる。
Then, the gain evaluator 170 evaluates the amount of distortion between the target vector X and the pitch composite vector Y of the target vector calculator 111, and obtains a pitch gain b that minimizes the amount of distortion.
opt is searched from the gain table 150, and information on the optimal pitch gain is provided to the drive signal generation unit 114,
The signal is output from the output terminal 119.

【0039】駆動信号生成部114では、コード探索部
115のコード情報およびゲイン評価部170のゲイン
情報を用いて、最適コードベクトルにゲインを乗ずるこ
とにより現在のサブフレームの音声の駆動信号を生成す
るようになる。また、この駆動信号は影響信号算出部1
13に与えられ、影響信号算出部113にて次のサブフ
レームの目標ベクトル算出のための現サブフレームの符
号化による次のサブフレームへの影響信号を算出するよ
うになる。
The drive signal generation section 114 generates a drive signal for the current subframe voice by multiplying the optimum code vector by a gain using the code information of the code search section 115 and the gain information of the gain evaluation section 170. Become like This drive signal is transmitted to the influence signal calculation unit 1.
13, the influence signal calculation unit 113 calculates an influence signal to the next subframe by encoding the current subframe for calculating a target vector of the next subframe.

【0040】従って、このようにしたピッチ合成フィル
タの符号化方式によっても、従来のサブフレーム内で全
く同じ形の駆動信号が繰り返すピッチ合成フィルタと異
なり、再帰形ピッチ合成フィルタを用いるので駆動信号
の急激なパワーの増加/減少に対応でき、また、確定し
たピッチ周期に対してだけゲインテーブル内のゲインを
探索するため、ゲイン探索に要する計算量の増加も無視
できるほど少なくでき、ゲインの符号化ビット数の増加
は全く無いという利点もある。これにより、サブフレー
ム長が大きい構成の低ビットレートの音声符号化におい
ても、パワーの変化の滑らかな高品質の合成音声を得ら
れることになる。
Accordingly, even with the above-described coding method of the pitch synthesis filter, unlike the conventional pitch synthesis filter in which the drive signal of exactly the same shape repeats in the subframe, a recursive pitch synthesis filter is used. It is possible to cope with a sudden increase / decrease in power, and to search for a gain in the gain table only for a fixed pitch period, so that the increase in the amount of calculation required for the gain search can be negligibly small. There is also an advantage that the number of bits does not increase at all. As a result, even in speech encoding at a low bit rate with a large subframe length, a high-quality synthesized speech with a smooth power change can be obtained.

【0041】[0041]

【発明の効果】以上説明したように本発明のピッチ合成
フィルタの符号化方式によれば、駆動信号の急激なパワ
ーの増加/減少に対応でき、パワーの変化の滑らかな合
成音声が得られ、4kbit/秒程度の低ビットレートでも合
成音声のパワーが滑らかに変化する高品質な合成音声を
生成できる。
As described above, according to the coding method of the pitch synthesis filter of the present invention, it is possible to cope with a sudden increase / decrease of the power of the drive signal, and to obtain a synthesized speech having a smooth power change. Even at a low bit rate of about 4 kbit / s, it is possible to generate high-quality synthesized speech in which the power of synthesized speech changes smoothly.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例の概略構成を示すブロック
図。
FIG. 1 is a block diagram showing a schematic configuration of an embodiment of the present invention.

【図2】本発明の第2の実施例の概略構成を示すブロッ
ク図。
FIG. 2 is a block diagram showing a schematic configuration of a second embodiment of the present invention.

【図3】本発明の一実施例の効果を説明するための波形
図。
FIG. 3 is a waveform chart for explaining the effect of one embodiment of the present invention.

【図4】従来のピッチ合成フィルタの符号化方式を説明
するための図。
FIG. 4 is a diagram for explaining an encoding method of a conventional pitch synthesis filter.

【符号の説明】[Explanation of symbols]

100…CELP符号化部、101…フィルタ係数算出部、
103…コードブック、106…合成ベクトル算出部、
108…ピッチ合成部、111…目標ベクトル算出部、
113…影響信号算出部、114…駆動信号生成部、1
15…コード探索部、140…合成部、150…ゲイン
テーブル、160…ピッチ合成部、162…加算部、1
64…乗算部、166…遅延部、170…ゲイン評価
部。
100: CELP encoding unit, 101: Filter coefficient calculation unit,
103: code book, 106: composite vector calculation unit,
108: pitch synthesis unit, 111: target vector calculation unit,
113: influence signal calculation unit, 114: drive signal generation unit, 1
15 code search unit, 140 synthesis unit, 150 gain table, 160 pitch synthesis unit, 162 addition unit, 1
64: Multiplication unit, 166: Delay unit, 170: Gain evaluation unit

フロントページの続き (56)参考文献 特開 平5−61499(JP,A) 特開 平1−293400(JP,A) 特開 平5−134698(JP,A) 特開 平5−46199(JP,A) 特開 平4−233000(JP,A) 特開 平3−189700(JP,A) 特開 平3−101800(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/12 Continuation of the front page (56) References JP-A-5-61499 (JP, A) JP-A-1-293400 (JP, A) JP-A-5-134698 (JP, A) JP-A-5-46199 (JP) JP-A-4-233000 (JP, A) JP-A-3-189700 (JP, A) JP-A-3-101800 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB Name) G10L 19/12

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】適応コードブックを用いてピッチ周期検索
を行うとともに該検索されたピッチ周期により指定され
る前記適応コードブックのコードベクトルを出力する音
声符号化手段と、 前記音声符号化手段より出力されるコードベクトルを用
いて合成ベクトルを生成する合成ベクトル生成手段と、 前記符号化手段での適応コードブック検索で求まるピッ
チ周期とゲインテーブルのピッチゲインをパラメータと
して再帰形ピッチ合成フィルタを生成するとともに前記
合成ベクトル生成手段の合成ベクトルについて再帰形の
ピッチ合成処理を施し合成音声を生成する手段と、 前記合成音声の歪量を基に前記ゲインテーブルのピッチ
ゲインを選択する手段とを具備したことを特徴とするピ
ッチ合成フィルタの符号化方式。
1. A speech encoding means for performing a pitch cycle search using an adaptive codebook and outputting a code vector of the adaptive codebook specified by the searched pitch cycle, and an output from the speech encoding means. A synthetic vector generating means for generating a synthetic vector using the code vector to be generated, and a recursive pitch synthesis filter using the pitch period and the pitch gain of the gain table determined by the adaptive code book search in the encoding means as parameters. Means for performing a recursive pitch synthesis process on a synthesized vector of the synthesized vector generating means to generate a synthesized voice, and means for selecting a pitch gain of the gain table based on a distortion amount of the synthesized voice. Characteristic coding method of pitch synthesis filter.
JP25067391A 1991-09-30 1991-09-30 Coding method of pitch synthesis filter Expired - Lifetime JP3207466B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25067391A JP3207466B2 (en) 1991-09-30 1991-09-30 Coding method of pitch synthesis filter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25067391A JP3207466B2 (en) 1991-09-30 1991-09-30 Coding method of pitch synthesis filter

Publications (2)

Publication Number Publication Date
JPH0588700A JPH0588700A (en) 1993-04-09
JP3207466B2 true JP3207466B2 (en) 2001-09-10

Family

ID=17211347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25067391A Expired - Lifetime JP3207466B2 (en) 1991-09-30 1991-09-30 Coding method of pitch synthesis filter

Country Status (1)

Country Link
JP (1) JP3207466B2 (en)

Also Published As

Publication number Publication date
JPH0588700A (en) 1993-04-09

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
JP3346765B2 (en) Audio decoding method and audio decoding device
JP2746039B2 (en) Audio coding method
US6385576B2 (en) Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
JP3180762B2 (en) Audio encoding device and audio decoding device
JPH0990995A (en) Speech coding device
JP3137176B2 (en) Audio coding device
JP2624130B2 (en) Audio coding method
JP2970407B2 (en) Speech excitation signal encoding device
JP3531780B2 (en) Voice encoding method and decoding method
JP3148778B2 (en) Audio encoding method
JP3207466B2 (en) Coding method of pitch synthesis filter
JP2613503B2 (en) Speech excitation signal encoding / decoding method
JP3583945B2 (en) Audio coding method
JP3003531B2 (en) Audio coding device
JP2968109B2 (en) Code-excited linear prediction encoder and decoder
JP3299099B2 (en) Audio coding device
JPH08234795A (en) Voice encoding device
JP3192051B2 (en) Audio coding device
JP3089967B2 (en) Audio coding device
JP3226180B2 (en) Speech pitch encoding method
JP3410931B2 (en) Audio encoding method and apparatus
JP3471542B2 (en) Audio coding device
JP3071800B2 (en) Adaptive post filter
JPH08320700A (en) Sound coding device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080706

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090706

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100706

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110706

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120706

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120706

Year of fee payment: 11