JPH06202699A - Speech encoding device and speech decoding device, and speech encoding and decoding method - Google Patents

Speech encoding device and speech decoding device, and speech encoding and decoding method

Info

Publication number
JPH06202699A
JPH06202699A JP5240135A JP24013593A JPH06202699A JP H06202699 A JPH06202699 A JP H06202699A JP 5240135 A JP5240135 A JP 5240135A JP 24013593 A JP24013593 A JP 24013593A JP H06202699 A JPH06202699 A JP H06202699A
Authority
JP
Japan
Prior art keywords
excitation
vector
adaptive
pitch
driving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5240135A
Other languages
Japanese (ja)
Other versions
JP3024455B2 (en
Inventor
Tadashi Yamaura
正 山浦
Masaya Takahashi
真哉 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP5240135A priority Critical patent/JP3024455B2/en
Publication of JPH06202699A publication Critical patent/JPH06202699A/en
Application granted granted Critical
Publication of JP3024455B2 publication Critical patent/JP3024455B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To prevent sound quality deterioration due to the disorder of the periodicity of a synthesized speech by a small increase in the amount of transmitted information as to the speech encoding and decoding devices which separate an input speech signal into spectrum envelope information and sound source signal information and quantize the sound source signal into vectors. CONSTITUTION:A periodic pulse sound source generating means 21 which generates a sound source vector consisting of a periodic pulse train corresponding uniformly to an adaptive sound source vector outputted from an adaptive sound source code book consisting of a sound source signal found in a precedent frame and a multiple vector adaptive sound source encoding means 20 which generates a sound source signal by adding gains individually to adaptive sound source vectors and periodic pulse sound source vectors corresponding to the adaptive sound source vectors, and finds and encodes pitch information and gains so as to obtain a sound source signal for generating a synthesized speech minimizing distortion from the input speech are provided on an encoding side, and the same periodic pulse sound source generating means 23 as the encoding side and a multiple vector adaptive sound source decoding means 22 which generates adaptive sound source vectors and periodic pulse sound source vectors from the transmitted codes are provided on a decoding side.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、音声をディジタル伝
送あるいは蓄積する場合などに用いられるもので、音声
の音源信号情報をベクトル量子化する音声符号化・復号
化装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice encoding / decoding device which is used when digitally transmitting or storing voice, and which vector-quantizes voice source signal information.

【0002】[0002]

【従来の技術】音声をスペクトル包絡情報と音源信号情
報に分離し、音源信号情報をベクトル量子化する従来の
音声符号化・復号化装置として、図10に示すものがあ
る。図10は、W.B.Kleijn, D.J.Krasinski, and R.H.K
etchum 著”Improved Speech Quality and Efficient V
ector Quantization in SELP”(ICASSP■88, pp.155-1
58, 1988)に示されたのと同様なものである。図におい
て、1は符号化部、2は復号化部、3は伝送路であり、
4は入力音声、5は出力音声である。6はスペクトル分
析手段、7はスペクトルパラメータ符号化手段であり、
8は適応音源符号化手段、9、14は適応音源符号帳で
ある。10は駆動音源符号化手段、11、16は駆動音
源符号帳である。12、17は音源ベクトル生成手段、
13は適応音源復号化手段、15は駆動音源復号化手段
であり、18はスペクトルパラメータ復号化手段、19
は合成フィルタである。
2. Description of the Related Art A conventional speech coding / decoding apparatus for separating speech into spectral envelope information and excitation signal information and vector-quantizing the excitation signal information is shown in FIG. Figure 10 shows WBKleijn, DJKrasinski, and RHK
"Improved Speech Quality and Efficient V" by etchum
ector Quantization in SELP ”(ICASSP ■ 88, pp.155-1
58, 1988). In the figure, 1 is an encoding unit, 2 is a decoding unit, 3 is a transmission path,
Reference numeral 4 is an input voice, and 5 is an output voice. 6 is spectrum analysis means, 7 is spectrum parameter coding means,
Reference numeral 8 is an adaptive excitation coding means, and 9 and 14 are adaptive excitation codebooks. 10 is a driving excitation coding means, and 11 and 16 are driving excitation codebooks. 12 and 17 are sound source vector generation means,
Reference numeral 13 is an adaptive excitation decoding means, 15 is a driving excitation decoding means, 18 is a spectrum parameter decoding means, 19
Is a synthesis filter.

【0003】以下、従来の音声符号化・復号化装置の動
作について説明する。まず、符号化部1の動作について
説明する。スペクトルパラメータ分析手段6は、入力音
声4を分析して、スペクトルパラメータを抽出する。ス
ペクトルパラメータ符号化手段7は前記スペクトルパラ
メータを量子化し、それに対応する符号を復号化部2に
伝送路3を介して出力するとともに、量子化したスペク
トルパラメータを適応音源符号化手段8及び駆動音源符
号化手段10に出力する。適応音源符号帳9には先行フ
レームにおいて求めた音源信号が記憶されており、ピッ
チ情報を符号として、現フレームにおいて前記音源信号
をピッチ周期で繰り返して得られる適応音源ベクトルを
出力する。図11に先行フレームにおける音源信号とそ
のとき得られる適応音源ベクトルの例を示す。適応音源
ベクトルは、ピッチ周期がフレーム長よりも短いときに
は、図11(b)に示すように現フレーム内で音源信号
をピッチ周期で繰り返したものとなる。
The operation of the conventional speech encoding / decoding device will be described below. First, the operation of the encoding unit 1 will be described. The spectrum parameter analysis means 6 analyzes the input voice 4 and extracts spectrum parameters. The spectrum parameter coding means 7 quantizes the spectrum parameter, outputs the code corresponding to the quantized spectrum parameter to the decoding section 2 via the transmission path 3, and also outputs the quantized spectrum parameter to the adaptive excitation coding means 8 and the driving excitation code. It outputs to the conversion means 10. The excitation signal obtained in the preceding frame is stored in the adaptive excitation codebook 9, and the adaptive excitation vector obtained by repeating the excitation signal in the pitch cycle in the current frame is output using the pitch information as a code. FIG. 11 shows an example of the sound source signal in the preceding frame and the adaptive sound source vector obtained at that time. When the pitch period is shorter than the frame length, the adaptive excitation vector is a repetition of the excitation signal in the current frame at the pitch period as shown in FIG. 11 (b).

【0004】適応音源符号化手段8は、前記適応音源符
号帳9より入力されるM個の適応音源ベクトルai(i
=1,... ,M)と、前記スペクトルパラメータ符号化
手段7より入力されたスペクトルパラメータを用いて、
M個の合成音声ベクトルAi(i=1,... ,M)を合
成する。そして、入力音声4からフレーム毎に切り出し
た入力音声ベクトルXとのベクトル間距離Diを、例え
ば式(1)に従って求める。ここで、ゲインβiは距離
iが最小になるように、例えば式(2)に従って決定
する。(なお、tは転置をしめす)
The adaptive excitation coding means 8 has M adaptive excitation vectors a i (i) input from the adaptive excitation codebook 9.
= 1, ..., M) and the spectrum parameter input from the spectrum parameter encoding means 7,
M synthesized speech vectors A i (i = 1, ..., M) are synthesized. Then, the inter-vector distance D i between the input voice 4 and the input voice vector X cut out for each frame is obtained, for example, according to the equation (1). Here, the gain β i is determined, for example, according to the equation (2) so that the distance D i becomes the minimum. (Note that t indicates transposition)

【0005】[0005]

【数1】 [Equation 1]

【0006】次に、このベクトル間距離が最小となるベ
クトルAIを探索し、その符号I及びゲインβIを量子化
したゲインβqIの符号を伝送路3を介して復号化部2に
出力し、また、選択された適応音源ベクトルaI及びそ
のゲインβqIを音源ベクトル生成手段12に出力すると
ともに、誤差ベクトルX■ X■=X−βqII を駆動音源符号化手段10に出力する。
Next, a vector A I that minimizes the inter-vector distance is searched for, and the code of the gain I qI obtained by quantizing the code I and the gain β I is output to the decoding unit 2 via the transmission line 3. In addition, the selected adaptive excitation vector a I and its gain β qI are output to the excitation vector generation means 12, and the error vector X ■ X ■ = X−β qI A I is output to the driving excitation encoding means 10. To do.

【0007】駆動音源符号帳11には、例えばランダム
雑音から生成したN個の駆動音源ベクトルが記憶されて
いる。駆動音源符号化手段10は、前記駆動音源符号帳
11より入力される駆動音源ベクトルcj(j=1,...
,N)と、前記スペクトルパラメータ符号化手段より
入力されたスペクトルパラメータを用いて、N個の合成
音声ベクトルCj(j=1,... ,N)を合成する。そ
して、前記適応音源符号化手段8より入力された誤差ベ
クトルX■ とのベクトル間距離Djを、例えば式(3)
に従って求める。ここで、ゲインγjは距離Djが最小に
なるように、例えば式(4)に従って決定する。
The driving excitation codebook 11 stores N driving excitation vectors generated from random noise, for example. The driving excitation coding means 10 is a driving excitation vector c j (j = 1, ...) Inputted from the driving excitation codebook 11.
, N) and the spectrum parameter input from the spectrum parameter coding means, N synthesized speech vectors C j (j = 1, ..., N) are synthesized. Then, the inter-vector distance D j with the error vector X ■ input from the adaptive excitation encoding means 8 is calculated by, for example, the equation (3)
Ask according to. Here, the gain γ j is determined, for example, according to the equation (4) so that the distance D j is minimized.

【0008】[0008]

【数2】 [Equation 2]

【0009】次にこのベクトル間距離が最小となるベク
トルCJを探索し、その符号J及びゲインγJを量子化し
たゲインγqJの符号を伝送路3を介して復号化部2に出
力するとともに、選択された駆動音源ベクトルcJ及び
そのゲインγqJを音源ベクトル生成手段12に出力す
る。
Next, a vector C J having the minimum inter-vector distance is searched for, and the code J and the gain γ qJ obtained by quantizing the gain γ J are output to the decoding unit 2 via the transmission line 3. At the same time, the selected driving sound source vector c J and its gain γ qJ are output to the sound source vector generating means 12.

【0010】音源ベクトル生成手段12は、前記適応音
源符号化手段8より入力された適応音源ベクトルaI
びそのゲインβqIと、前記駆動音源符号化手段10より
入力された駆動音源ベクトルcJ及びそのゲインγqJ
り音源ベクトル βqII+γqJJ を生成し、これを適応音源符号帳9に出力する。
The excitation vector generation means 12 has the adaptive excitation vector aI and its gain β qI input from the adaptive excitation coding means 8 and the driving excitation vector c J and its input from the driving excitation coding means 10. An excitation vector β qI a I + γ qJ c J is generated from the gain γ qJ , and this is output to the adaptive excitation codebook 9.

【0011】次に、復号化部2の動作について説明す
る。適応音源復号化手段13は、符号化部1から入力さ
れた適応音源ベクトルの符号Iに基づき、前記適応音源
符号帳9と同一の適応音源ベクトルを記憶する適応音源
符号帳14から適応音源ベクトルaI を読みだし、ま
た、符号化部1から入力された適応音源ベクトルに対す
るゲインの符号よりゲインβqIを復号化し、前記適応音
源ベクトルaIとそのゲインβqIを音源ベクトル生成手
段17に出力する。また、駆動音源復号化手段15は、
符号化部1から入力された駆動音源ベクトルの符号Jに
基づき、前記駆動音源符号帳11と同一の駆動音源ベク
トルを記憶する駆動音源符号帳16から駆動音源ベクト
ルcJを読みだし、また、符号化部1から入力された駆
動音源ベクトルに対するゲインの符号よりゲインγqJ
復号し、前記駆動音源ベクトルcJとそのゲインγqJ
音源ベクトル生成手段17に出力する。
Next, the operation of the decoding section 2 will be described. Based on the code I of the adaptive excitation vector input from the encoding unit 1, the adaptive excitation decoding means 13 stores the same adaptive excitation vector as the adaptive excitation codebook 9 from the adaptive excitation codebook 14 that stores the adaptive excitation vector a. I is read, the gain β qI is decoded from the sign of the gain for the adaptive excitation vector input from the encoding unit 1, and the adaptive excitation vector a I and its gain β qI are output to the excitation vector generation means 17. . Further, the driving sound source decoding means 15
Based on the code J of the drive excitation vector input from the encoding unit 1, the drive excitation vector cJ is read from the drive excitation codebook 16 that stores the same drive excitation vector as the drive excitation codebook 11, and is also encoded. The gain γ qJ is decoded from the sign of the gain for the driving sound source vector input from the unit 1, and the driving sound source vector c J and its gain γ qJ are output to the sound source vector generating means 17.

【0012】音源ベクトル生成手段17は、前記適応音
源復号化手段13より入力された適応音源ベクトルaI
及びそのゲインβqIと、前記駆動音源復号化手段15よ
り入力された駆動音源ベクトルcJ、及びそのゲインγ
qJより音源ベクトルβqII+γqJJを生成し、これを
適応音源符号帳14及び合成フィルタ19に出力する。
The excitation vector generation means 17 is an adaptive excitation vector a I input from the adaptive excitation decoding means 13.
And its gain β qI , the driving excitation vector c J input from the driving excitation decoding means 15, and its gain γ.
An excitation vector β qI a I + γ qJ c J is generated from qJ and is output to the adaptive excitation codebook 14 and the synthesis filter 19.

【0013】スペクトルパラメータ復号化手段18は、
符号化部1から入力されたスペクトルパラメータの符号
に基づきスペクトルパラメータを復号し、合成フィルタ
19に出力する。合成フィルタ19は、前記音源ベクト
ル生成手段17より入力された音源ベクトルと、前記ス
ペクトルパラメータ復号化手段18より入力されたスペ
クトルパラメータを用いて出力音声5を合成する。
The spectrum parameter decoding means 18 is
The spectrum parameter is decoded based on the code of the spectrum parameter input from the encoding unit 1 and output to the synthesis filter 19. The synthesis filter 19 synthesizes the output speech 5 using the excitation vector input from the excitation vector generation means 17 and the spectrum parameter input from the spectrum parameter decoding means 18.

【0014】[0014]

【発明が解決しようとする課題】音声信号には有声音と
無声音が有り、それぞれは音源信号がピッチ周期のパル
ス的成分を持つか、周期性の無い白色雑音であるかで特
徴づけられる。そして、有声音におけるピッチ周期性の
再現性が合成音声の品質に与える影響は大きい。上記の
ような従来の音声符号化・復号化装置では、有声音にお
ける音源信号のピッチ周期のパルス的成分を、先行フレ
ームの音源信号で作られる適応音源ベクトルを用いるこ
とにより発生させていた。しかし、適応音源ベクトルは
複数のサンプルで構成されるので、有声音に必要なパル
ス的成分を積極的には生成できない。このため、無声音
から有声音への過渡部では適当な音源が生成できず音質
が劣化するという課題があった。また、パルス的成分が
生成されても、それ以外のサンプルを含めて音源を生成
するため、必ずしも最適なパルス系列が得られず、これ
がピッチ周期性の欠落につながり音質が劣化するという
課題もあった。
Voice signals include voiced sound and unvoiced sound, and are characterized by whether the sound source signal has a pulse-like component of a pitch period or white noise having no periodicity. The reproducibility of pitch periodicity in voiced sound has a great influence on the quality of synthesized speech. In the conventional speech encoding / decoding apparatus as described above, the pulse-like component of the pitch period of the excitation signal in the voiced sound is generated by using the adaptive excitation vector created by the excitation signal of the preceding frame. However, since the adaptive sound source vector is composed of multiple samples, it is not possible to positively generate the pulse-like component necessary for voiced sound. Therefore, there is a problem that an appropriate sound source cannot be generated in the transition part from unvoiced sound to voiced sound and the sound quality is deteriorated. In addition, even if a pulse component is generated, the sound source is generated by including the other samples, so that an optimum pulse sequence cannot always be obtained, which leads to lack of pitch periodicity, resulting in deterioration of sound quality. It was

【0015】また、音源信号を適応音源ベクトルとピッ
チ周期性を考慮していない駆動音源ベクトルとの線形和
により生成するので、適応音源ベクトルがピッチ周期性
を発生させたとしても、伝達情報量を低減させるために
は、フレーム長、即ちベクトル長を長くする、あるいは
駆動音源符号帳の符号帳サイズを小さくする必要があ
り、その場合には生成された音源信号のピッチ周期性が
乱れ、音質が劣化するという課題もあった。
Further, since the sound source signal is generated by a linear sum of the adaptive sound source vector and the driving sound source vector in which the pitch periodicity is not taken into consideration, even if the adaptive sound source vector generates the pitch periodicity, the transmitted information amount is In order to reduce it, it is necessary to increase the frame length, that is, the vector length, or reduce the codebook size of the driving excitation codebook. In that case, the pitch periodicity of the generated excitation signal is disturbed and the sound quality is reduced. There was also the problem of deterioration.

【0016】また、従来の音声符号化復号化装置では入
力音声のパワーによらず駆動音源ベクトルに対するゲイ
ン量子化を行っているが、量子化すべきゲインの範囲が
大きいため、少量のビットで量子化する場合は量子化歪
が大きくなり、合成音声の品質が劣化する。また、入力
音声のパワーにより駆動音源ベクトルのゲインの量子化
を変更するためには、新たにパワー情報を伝送する必要
があり、効率的ではないという課題もあった。
In the conventional speech coding / decoding apparatus, the gain quantization for the driving excitation vector is performed regardless of the power of the input speech, but since the range of gain to be quantized is large, the quantization is performed with a small number of bits. If so, the quantization distortion becomes large and the quality of the synthesized speech deteriorates. Further, in order to change the quantization of the gain of the driving sound source vector by the power of the input sound, it is necessary to newly transmit the power information, which is not efficient.

【0017】この発明は、かかる課題を解決するために
なされたもので、適応音源ベクトルに加え、この適応音
源ベクトルに対して一意的に求めることが可能な周期パ
ルス列からなる音源ベクトルを生成し、これを用いて音
源信号を生成すること、及び駆動音源ベクトルをピッチ
周期に同期して繰り返し用いることにより、少ない伝送
情報量でも音源信号のピッチ周期性の乱れが少なく、ま
た、適応音源信号のパワー情報により駆動音源ベクトル
のゲインの量子化を変更することにより、少ない伝送情
報量でも音源信号の量子化歪が小さい、品質の高い復号
音声を合成することを目的としている。
The present invention has been made to solve the above problem, and in addition to an adaptive excitation vector, generates a excitation vector consisting of a periodic pulse train that can be uniquely obtained for this adaptive excitation vector, By using this to generate a sound source signal and by repeatedly using the driving sound source vector in synchronization with the pitch cycle, the pitch periodicity of the sound source signal is not disturbed even with a small amount of transmission information, and the power of the adaptive sound source signal is reduced. By changing the quantization of the gain of the driving excitation vector according to the information, it is an object to synthesize high-quality decoded speech with small quantization distortion of the excitation signal even with a small amount of transmission information.

【0018】[0018]

【課題を解決するための手段】この発明に係る音声符号
化装置は、先行フレームの音源信号の情報である適応音
源ベクトルを記憶する適応音源符号帳と、上記適応音源
符号帳内の各適応音源ベクトルの主要成分として定まる
周期パルス音源ベクトルを生成する周期パルス音源生成
手段と、上記適応音源ベクトルと上記適応音源ベクトル
に対応する周期パルス音源ベクトルとの線形和を音源信
号として生成した復号音声と入力音声との歪みを最小に
する適応音源ベクトルとその適応音源ベクトルに対応す
る周期パルス音源ベクトルと、上記適応音源ベクトルと
上記周期パルス音源ベクトルとに対するゲインを求め、
上記適応音源ベクトルと、上記適応音源ベクトルと上記
周期パルス音源ベクトルとに対するゲインを符号化する
複数ベクトル適応音源符号化手段を備えた。
A speech coding apparatus according to the present invention includes an adaptive excitation codebook for storing an adaptive excitation vector which is information of an excitation signal of a preceding frame, and each adaptive excitation in the adaptive excitation codebook. Periodic pulse source generating means for generating a periodic pulse source vector determined as a main component of the vector, and a decoded speech generated as a source signal by a linear sum of the adaptive source vector and the periodic pulse source vector corresponding to the adaptive source vector and the input An adaptive excitation vector that minimizes distortion with speech and a periodic pulse excitation vector corresponding to the adaptive excitation vector, and a gain for the adaptive excitation vector and the periodic pulse excitation vector are obtained,
A plurality of vector adaptive excitation encoding means for encoding the adaptive excitation vector and the gains for the adaptive excitation vector and the periodic pulse excitation vector are provided.

【0019】請求項2の発明に係る復号化装置は、先行
フレームの音源信号の情報である適応音源ベクトルを記
憶する適応音源符号帳と、復号化された適応音源ベクト
ルの主要成分として定まる周期パルス音源ベクトルを生
成する周期パルス音源生成手段と、適応音源ベクトル
と、上記適応音源ベクトルと上記適応音源ベクトルに対
応する周期パルス音源ベクトルとに対するゲインを復号
化し、上記適応音源ベクトルと上記周期パルス音源ベク
トルの各々に上記ゲインを与えて加算する複数ベクトル
適応音源復号化手段とを備えた。
The decoding apparatus according to the second aspect of the present invention is an adaptive excitation codebook for storing an adaptive excitation vector which is information of an excitation signal of a preceding frame, and a periodic pulse determined as a main component of the decoded adaptive excitation vector. A periodic pulse sound source generating means for generating a sound source vector, an adaptive sound source vector, the adaptive sound source vector, and a gain for the periodic pulse sound source vector corresponding to the adaptive sound source vector are decoded to obtain the adaptive sound source vector and the periodic pulse sound source vector. A multi-vector adaptive excitation decoding means for adding the above gains to each of them and adding them.

【0020】請求項3の発明に係る符号化装置は、先行
フレームの音源信号の情報である適応音源ベクトルを記
憶する適応音源符号帳と、上記適応音源ベクトルを音源
信号として生成した復号音声と入力音声との歪みを最小
にする適応音源ベクトルとその適応音源ベクトルに対す
るゲインを求め、上記適応音源ベクトルと上記適応音源
ベクトルに対するゲインを符号化する適応音源符号化手
段と、予め用意された複数の音源信号を駆動音源ベクト
ルとして記憶している駆動音源符号帳と、入力音声に対
してピッチ周期間隔で並ぶ複数の特徴点をピッチ位置と
して抽出し、上記ピッチ位置を符号化するピッチ位置抽
出手段と、上記ピッチ位置に上記駆動音源符号帳の各駆
動音源ベクトルの所定の位置を合わせ、上記駆動音源ベ
クトルをピッチ周期で繰り返したピッチ同期駆動音源ベ
クトルを生成するピッチ同期化手段と、上記適応音源ベ
クトルと上記ピッチ同期駆動音源ベクトルとの線形和を
音源信号として生成した復号音声と入力音声との歪みを
最小にするピッチ同期駆動音源ベクトルとそのピッチ同
期駆動音源ベクトルに対するゲインを求め、上記ピッチ
同期駆動音源ベクトルに対応する駆動音源ベクトルと上
記ピッチ同期駆動音源ベクトルに対するゲインを符号化
する駆動音源符号化手段とを備えた。
An encoding apparatus according to a third aspect of the present invention inputs an adaptive excitation codebook that stores an adaptive excitation vector that is information of an excitation signal of a preceding frame, and a decoded speech generated by using the adaptive excitation vector as an excitation signal. An adaptive sound source vector that minimizes distortion with speech and an adaptive sound source coding unit that obtains a gain for the adaptive sound source vector and encodes the adaptive sound source vector and the gain for the adaptive sound source vector, and a plurality of previously prepared sound sources A drive excitation codebook that stores a signal as a drive excitation vector, and a plurality of feature points that are arranged at pitch cycle intervals with respect to the input voice as pitch positions, and a pitch position extraction unit that encodes the pitch positions, Align the predetermined position of each driving excitation vector of the driving excitation codebook to the pitch position, and pitch the driving excitation vector. And a pitch synchronization means for generating a pitch-synchronized drive source vector repeated by the above, and a distortion between a decoded voice generated as a source signal and a linear sum of the adaptive excitation vector and the pitch-synchronized drive source vector and an input voice are minimized. A pitch-synchronized drive excitation vector and a gain for the pitch-synchronized drive excitation vector are obtained, and a drive excitation vector corresponding to the pitch-synchronized drive excitation vector and a drive excitation encoding means for encoding the gain for the pitch-synchronized drive excitation vector are provided. It was

【0021】請求項4の発明に係る符号化装置は、先行
フレームの音源信号の情報である適応音源ベクトルを記
憶する適応音源符号帳と、上記適応音源ベクトルを音源
信号して生成した復号音声と入力音声との歪みを最小に
する適応音源ベクトルとその適応音源ベクトルに対する
ゲインを求め、上記適応音源ベクトルと上記適応音源ベ
クトルに対するゲインを符号化する適応音源符号化手段
と、予め用意された複数の音源信号を駆動音源ベクトル
として記憶している駆動音源符号帳と、ピッチ周期間隔
で並ぶ複数の点をピッチ位置として、上記ピッチ位置に
上記駆動音源符号帳の各駆動音源ベクトルの所定の位置
を合わせ、上記駆動音源ベクトルをピッチ周期で繰り返
してピッチ同期駆動音源ベクトルを生成するピッチ同期
化手段と、上記適応音源ベクトルと上記ピッチ同期駆動
音源ベクトルとの線形和を音源信号として生成した復号
音声と入力音声との歪みを最小にするピッチ同期駆動音
源ベクトルとそのピッチ同期駆動音源ベクトルに対する
ゲインを求め、上記ピッチ同期駆動音源ベクトルに対応
する駆動音源ベクトルとピッチ位置と上記ピッチ同期駆
動音源ベクトルに対するゲインを符号化する駆動音源符
号化手段とを備えた。
An encoding apparatus according to a fourth aspect of the present invention includes an adaptive excitation codebook that stores an adaptive excitation vector that is information of an excitation signal of a preceding frame, and a decoded speech generated by generating an excitation signal of the adaptive excitation vector. An adaptive excitation vector that minimizes distortion with respect to the input speech, an adaptive excitation encoding unit that obtains a gain for the adaptive excitation vector, and encodes the adaptive excitation vector and the gain for the adaptive excitation vector, and a plurality of previously prepared adaptive excitation encoding units. A driving excitation codebook that stores excitation signals as driving excitation vectors and a plurality of points arranged at pitch period intervals as pitch positions, and the predetermined positions of the driving excitation vectors of the driving excitation codebook are aligned with the pitch positions. A pitch synchronization means for repeating the driving sound source vector in a pitch cycle to generate a pitch synchronization driving sound source vector; A pitch-synchronized drive source vector that minimizes distortion between the decoded voice and the input voice generated by using a linear sum of the excitation vector and the pitch-synchronized drive source vector as a source signal and a gain for the pitch-synchronized drive source vector are obtained, and the pitch A drive excitation vector corresponding to the synchronous drive excitation vector, a pitch position, and a drive excitation encoding means for encoding a gain for the pitch synchronous drive excitation vector are provided.

【0022】請求項5の発明に係る復号化装置は、先行
フレームの音源信号の情報である適応音源ベクトルを記
憶する適応音源符号帳と、適応音源ベクトルとその適応
音源ベクトルに対するゲインを復号化する適応音源復号
化手段と、予め用意された複数の音源信号を駆動音源ベ
クトルとして記憶している駆動音源符号帳と、ピッチ位
置を復号化し、上記ピッチ位置に復号化された駆動音源
ベクトルの所定の位置を合わせ、上記駆動音源ベクトル
をピッチ周期で繰り返してピッチ同期駆動音源ベクトル
を生成するピッチ同期化手段と、駆動音源ベクトルと、
上記ピッチ同期駆動音源ベクトルに対するゲインを復号
化する駆動音源復号化手段と、上記適応音源ベクトルと
上記適応音源ベクトルに対するゲインと、上記ピッチ同
期駆動音源ベクトルと上記ピッチ同期駆動音源ベクトル
に対するゲインとから音源ベクトルを復号化する音源ベ
クトル生成手段とを備えた。
A decoding device according to a fifth aspect of the present invention decodes an adaptive excitation codebook that stores an adaptive excitation vector that is information of an excitation signal of a preceding frame, an adaptive excitation vector and a gain for the adaptive excitation vector. Adaptive excitation decoding means, a driving excitation codebook that stores a plurality of excitation signals prepared in advance as driving excitation vectors, a pitch position is decoded, and a predetermined driving excitation vector of the decoded driving excitation vector is obtained at the pitch position. Pitch synchronization means for aligning positions and generating the pitch-synchronized driving sound source vector by repeating the driving sound source vector in a pitch cycle, and the driving sound source vector,
A sound source from a driving sound source decoding unit that decodes a gain for the pitch synchronization driving sound source vector, a gain for the adaptive sound source vector and the adaptive sound source vector, and a gain for the pitch synchronization driving sound source vector and the pitch synchronization driving sound source vector Excitation vector generation means for decoding the vector.

【0023】請求項6の発明に係る符号化装置は、先行
フレームの音源信号の情報である適応音源ベクトルを記
憶する適応音源符号帳と、上記適応音源符号帳内の各適
応音源ベクトルにおいてピッチ周期間隔で並ぶ複数の特
徴点をピッチ位置として抽出するピッチ位置抽出手段
と、上記適応音源ベクトルを音源信号として生成した復
号音声と入力音声との歪みを最小にする適応音源ベクト
ルとその適応音源ベクトルに対するゲインを求め、上記
適応音源ベクトルと上記適応音源ベクトルに対するゲイ
ンを符号化する適応音源符号化手段と、予め用意された
複数の音源信号を駆動音源ベクトルとして記憶している
駆動音源符号帳と、上記ピッチ位置抽出手段で得られた
ピッチ位置に、上記駆動音源符号帳の各駆動音源ベクト
ルの所定の位置を合わせ、上記駆動音源ベクトルをピッ
チ周期で繰り返したピッチ同期駆動音源ベクトルを生成
するピッチ同期化手段と、上記適応音源ベクトルと上記
ピッチ同期駆動音源ベクトルとの線形和を音源信号とし
て生成した復号音声と入力音声との歪みを最小にするピ
ッチ同期駆動音源ベクトルとそのピッチ同期駆動音源ベ
クトルに対するゲインを求め、上記ピッチ同期駆動音源
ベクトルに対応する駆動音源ベクトルと上記ピッチ同期
駆動音源ベクトルに対するゲインを符号化する駆動音源
符号化手段とを備えた。
An encoding apparatus according to a sixth aspect of the present invention is an adaptive excitation codebook for storing an adaptive excitation vector which is information of an excitation signal of a preceding frame, and pitch periods in each adaptive excitation vector in the adaptive excitation codebook. Pitch position extracting means for extracting a plurality of feature points arranged at intervals as pitch positions, an adaptive excitation vector that minimizes distortion between the decoded speech and the input speech generated with the adaptive excitation vector as the excitation signal, and the adaptive excitation vector An adaptive excitation coding means for obtaining a gain and encoding the adaptive excitation vector and the gain for the adaptive excitation vector; a driving excitation codebook storing a plurality of prepared excitation signals as driving excitation vectors; The pitch position obtained by the pitch position extraction means is combined with the predetermined position of each driving excitation vector of the above driving excitation codebook. And a pitch synchronization means for generating a pitch-synchronized drive excitation vector by repeating the drive excitation vector in a pitch cycle, and a decoded voice generated as a excitation signal a linear sum of the adaptive excitation vector and the pitch-synchronized drive excitation vector. A pitch-synchronized driving sound source vector that minimizes distortion with the input speech and a gain for the pitch-synchronized driving sound source vector are obtained, and the driving sound source vector corresponding to the pitch-synchronized driving sound source vector and the gain for the pitch-synchronous driving sound source vector are encoded. And a driving excitation encoding means for performing the same.

【0024】請求項7の発明に係る復号化装置は、先行
フレームの音源信号の情報である適応音源ベクトルを記
憶する適応音源符号帳と、適応音源ベクトルとその適応
音源ベクトルに対するゲインを復号化する適応音源復号
化手段と、復号化された適応音源ベクトルにおいてピッ
チ周期間隔で並ぶ複数の特徴点をピッチ位置として抽出
するピッチ位置抽出手段と、予め用意された複数の音源
信号を駆動音源ベクトルとして記憶している駆動音源符
号帳と、上記ピッチ位置抽出手段で得られたピッチ位置
に、復号化された駆動音源ベクトルの所定の位置を合わ
せ、上記駆動音源ベクトルをピッチ周期で繰り返したピ
ッチ同期駆動音源ベクトルを生成するピッチ同期化手段
と、駆動音源ベクトルと、上記ピッチ同期駆動音源ベク
トルに対するゲインを復号化する駆動音源復号化手段
と、上記適応音源ベクトルと上記適応音源ベクトルに対
するゲインと、上記ピッチ同期駆動音源ベクトルと上記
ピッチ同期駆動音源ベクトルに対するゲインとから音源
ベクトルを復号化する音源ベクトル生成手段とを備え
た。
A decoding device according to a seventh aspect of the present invention decodes an adaptive excitation codebook that stores an adaptive excitation vector that is information of an excitation signal of a preceding frame, an adaptive excitation vector and a gain for the adaptive excitation vector. Adaptive excitation decoding means, pitch position extraction means for extracting a plurality of feature points arranged at pitch cycle intervals in the decoded adaptive excitation vector as pitch positions, and storing a plurality of prepared excitation signals as driving excitation vectors Driving excitation codebook and the pitch position obtained by the pitch position extraction means are aligned with a predetermined position of the decoded driving excitation vector, and the driving excitation vector is repeated in a pitch cycle. A pitch synchronization means for generating a vector, a driving sound source vector, and a gay sound source for the pitch synchronization driving sound source vector. Driving excitation decoding means for decoding the above, an adaptive excitation vector, a gain for the adaptive excitation vector, and an excitation vector generation for decoding the excitation vector from the pitch-synchronized excitation vector and the gain for the pitch-synchronized excitation vector And means.

【0025】請求項8の発明に係る符号化復号化方法
は、先行フレームの音源信号の情報である適応音源ベク
トルを記憶する第1の適応音源符号帳を送信側に持ち、
また対応する第2の適応音源符号帳を受信側に持ち、予
め用意された複数の音源信号を駆動音源ベクトルとして
記憶している第1の駆動音源符号帳を送信側に持ち、ま
た対応する第2の駆動音源符号帳を受信側に持ち、送信
側では、入力音声に対して、上記第1の適応音源符号帳
の中から最適な適応音源ベクトルを選択し、またそのゲ
インを定め、入力音声または上記適応音源ベクトルより
複数のピッチ位置を抽出し、上記ピッチ位置に上記駆動
音源符号帳の駆動音源ベクトルの所定の位置を合わせて
周期化したピッチ同期駆動音源ベクトルを作成して最適
なピッチ同期駆動音源ベクトルを選択し、またそのゲイ
ンを定め、上記適応音源ベクトルと上記ピッチ同期駆動
音源ベクトルと、上記適応音源ベクトルと上記ピッチ同
期駆動音源ベクトルとに対するゲインを符号化して送信
し、受信側では、受信符号により、上記第2の適応音源
符号帳から適応音源ベクトルを生成し、また上記適応音
源ベクトルのゲインを復号し、受信符号または上記適応
音源ベクトルより複数のピッチ位置を抽出し、上記第2
の駆動音源符号帳から駆動音源ベクトルを生成し、上記
ピッチ位置に上記駆動音源ベクトルの所定の位置を合わ
せて周期化したピッチ同期駆動音源ベクトルを作成し、
また上記ピッチ同期駆動音源ベクトルのゲインを復号
し、上記適応音源ベクトルと上記ピッチ同期駆動音源ベ
クトルとそれぞれのゲインとから音源ベクトルを復号す
るようにした。
In the encoding / decoding method according to the invention of claim 8, the transmitting side has a first adaptive excitation codebook for storing an adaptive excitation vector which is information of the excitation signal of the preceding frame.
Further, it has a corresponding second adaptive excitation codebook on the receiving side, has a first driving excitation codebook that stores a plurality of prepared excitation signals as driving excitation vectors on the transmitting side, and also has a corresponding first excitation codebook. The receiving side has the second driving excitation codebook, and the transmitting side selects the optimum adaptive excitation vector from the first adaptive excitation codebook for the input speech, determines its gain, and determines the input speech. Alternatively, a plurality of pitch positions are extracted from the adaptive excitation vector, a predetermined position of the driving excitation vector of the driving excitation codebook is aligned with the pitch position to create a pitch-synchronized driving excitation vector, and optimal pitch synchronization is created. A driving sound source vector is selected and its gain is determined, and the adaptive sound source vector, the pitch synchronization driving sound source vector, the adaptive sound source vector, and the pitch synchronization driving sound source vector. The gains for and are encoded and transmitted, and on the receiving side, an adaptive excitation vector is generated from the second adaptive excitation codebook by the reception code, and the gain of the adaptive excitation vector is decoded to obtain the reception code or the adaptation. A plurality of pitch positions are extracted from the sound source vector, and the second
To generate a driving excitation vector from the driving excitation codebook, to create a pitch-synchronized driving excitation vector that is periodic with the predetermined position of the driving excitation vector aligned with the pitch position,
Further, the gain of the pitch-synchronized driving excitation vector is decoded, and the excitation vector is decoded from the adaptive excitation vector, the pitch-synchronized driving excitation vector and the respective gains.

【0026】請求項9の発明にかかる符号化装置は、先
行フレームの音源信号の情報である適応音源ベクトルを
記憶する適応音源符号帳と、上記適応音源ベクトルを音
源信号として生成した復号音声と入力音声との歪みを最
小にする適応音源ベクトルとその適応音源ベクトルに対
するゲインを求め、上記適応音源ベクトルと上記適応音
源ベクトルに対するゲインを符号化する適応音源符号化
手段と、予め用意された複数の音源信号を駆動音源ベク
トルとして記憶している駆動音源符号帳と、上記適応音
源ベクトルとそのゲインより求められる適応音源信号の
パワー情報により駆動音源ベクトルに対して用いるゲイ
ン量子化テーブルを予め用意された複数のゲイン量子化
テーブルの中から選択して指定する制御手段と、上記適
応音源ベクトルと上記駆動音源ベクトルとの線形和を音
源信号として生成した復号音声と入力音声との歪みを最
小にする駆動音源ベクトルとその駆動音源ベクトルに対
するゲインを求め、上記指定されたゲイン量子化テーブ
ルを用いて、上記駆動音源ベクトルと上記駆動音源ベク
トルに対するゲインを符号化する駆動音源符号化手段と
を備えた。
An encoding apparatus according to a ninth aspect of the present invention inputs an adaptive excitation codebook that stores an adaptive excitation vector, which is information on an excitation signal of a preceding frame, and a decoded speech generated by using the adaptive excitation vector as an excitation signal. An adaptive excitation vector that minimizes distortion with speech and an adaptive excitation vector that obtains a gain for the adaptive excitation vector, and encodes the adaptive excitation vector and the gain for the adaptive excitation vector, and a plurality of prepared excitation sources A plurality of pre-prepared driving excitation codebooks that store signals as driving excitation vectors, and gain quantization tables used for driving excitation vectors based on the adaptive excitation signal power information obtained from the adaptive excitation vectors and their gains. Control means for selecting and specifying from the gain quantization table of The driving excitation vector that minimizes the distortion between the decoded speech and the input speech generated by using the linear sum of the driving excitation vector as the excitation signal and the gain for the driving excitation vector are obtained, and the gain quantization table specified above is used. , And a drive excitation encoding means for encoding the drive excitation vector and a gain for the drive excitation vector.

【0027】請求項10の発明に係る復号化装置は、先
行フレームの音源信号の情報である適応音源ベクトルを
記憶する適応音源符号帳と、適応音源ベクトルとその適
応音源ベクトルに対するゲインを復号化する適応音源復
号化手段と、予め用意された複数の音源信号を駆動音源
ベクトルとして記憶している駆動音源符号帳と、上記適
応音源ベクトルと上記適応音源ベクトルに対するゲイン
より求められる適応音源信号のパワー情報により駆動音
源ベクトルに対して用いるゲイン量子化テーブルを予め
用意された複数のゲイン量子化テーブルの中から選択し
て指定する制御手段と、上記指定されたゲイン量子化テ
ーブルを用いて、駆動音源ベクトルとその駆動音源ベク
トルに対するゲインを復号化する駆動音源復号化手段と
を備えた。
A decoding apparatus according to the invention of claim 10 decodes an adaptive excitation codebook for storing an adaptive excitation vector which is information of an excitation signal of a preceding frame, an adaptive excitation vector and a gain for the adaptive excitation vector. Adaptive excitation decoding means, a driving excitation codebook in which a plurality of excitation signals prepared in advance are stored as driving excitation vectors, power information of the adaptive excitation signal obtained from the adaptive excitation vector and a gain for the adaptive excitation vector By using a control means for selecting and designating a gain quantization table to be used for a driving excitation vector from a plurality of gain quantization tables prepared in advance, and a driving quantization vector specified above. And a driving excitation decoding means for decoding the gain for the driving excitation vector.

【0028】請求項11の発明に係る符号化復号化方法
は、先行フレームの音源信号の情報である適応音源ベク
トルを記憶する第1の適応音源符号帳を送信側に持ち、
また対応する第2の適応音源符号帳を受信側に持ち、予
め用意された複数の音源信号を駆動音源ベクトルとして
記憶している第1の駆動音源符号帳を送信側に持ち、ま
た対応する第2の駆動音源符号帳を受信側に持ち、送信
側では、入力音声に対して、上記第1の適応音源符号帳
の中から最適な適応音源ベクトルを選択し、またそのゲ
インを定め、上記適応音源ベクトルとそのゲインより求
められる適応音源信号のパワー情報により駆動音源ベク
トルのゲイン量子化テーブルを変更し、上記第1の駆動
音源符号帳の中から最適な駆動音源ベクトルを選択し、
またそのゲインを定め、上記適応音源ベクトルと上記駆
動音源ベクトルと、上記適応音源ベクトルと上記駆動音
源ベクトルとに対するゲインを符号化して送信し、受信
側では、受信符号により、上記第2の適応音源符号帳か
ら適応音源ベクトルを生成し、また上記適応音源ベクト
ルのゲインを復号し、上記適応音源ベクトルとそのゲイ
ンより求められる適応音源信号のパワー情報より駆動音
源ベクトルのゲイン量子化テーブルを変更し、上記第2
の駆動音源ベクトル符号帳から駆動音源ベクトルを生成
し、また上記駆動音源ベクトルのゲインを復号し、上記
適応音源ベクトルと、駆動音源ベクトルとそれぞれのゲ
インとから音源ベクトルを復号するようにしたものであ
る。
The encoding / decoding method according to the invention of claim 11 has, on the transmitting side, a first adaptive excitation codebook for storing an adaptive excitation vector which is information of the excitation signal of the preceding frame.
Further, it has a corresponding second adaptive excitation codebook on the receiving side, has a first driving excitation codebook that stores a plurality of prepared excitation signals as driving excitation vectors on the transmitting side, and also has a corresponding first excitation codebook. The receiving side has two driving excitation codebooks, and the transmitting side selects the optimum adaptive excitation vector from the first adaptive excitation codebook for the input voice, determines the gain, and The gain quantization table of the driving excitation vector is changed by the power information of the adaptive excitation signal obtained from the excitation vector and its gain, and the optimum driving excitation vector is selected from the first driving excitation codebook,
Further, the gain is determined, the gains for the adaptive excitation vector, the driving excitation vector, and the adaptive excitation vector and the driving excitation vector are encoded and transmitted, and on the receiving side, the second adaptive excitation by the reception code. Generating an adaptive excitation vector from the codebook, decoding the gain of the adaptive excitation vector, changing the gain quantization table of the driving excitation vector from the power information of the adaptive excitation signal obtained from the adaptive excitation vector and the gain, Second above
The driving excitation vector is generated from the driving excitation vector codebook, and the gain of the driving excitation vector is decoded, and the excitation vector is decoded from the adaptive excitation vector, the driving excitation vector and each gain. is there.

【0029】[0029]

【作用】この発明における入力音声符号化装置は、適応
音源ベクトルに対応して周期パルス音源ベクトルが新し
く生成され、それぞれゲインを掛けて合成され、入力音
声との歪みが最小となるベクトルとゲインが選択されて
符号化される。また、請求項2の発明の音声復号化装置
は、伝送された符号とゲインにより、周期性を持つ音源
ベクトルが生成され、これと適応音源ベクトルにより、
音源ベクトルが復号される。また、請求項3、4の発明
の音声符号化装置は、駆動音源ベクトルが周期的に繰り
返され、入力音声との歪みが最小になるベクトルとゲイ
ンが選択されて符号化される。また、請求項5の発明の
音声復号化装置は、伝送された符号により、駆動音源ベ
クトルが周期的に生成され、これと適応音源ベクトルに
より、音源ベクトルが復号される。また、請求項6の発
明の音声符号化装置は、適応音源ベクトルにおいてピッ
チ周期で定まる特徴点がピッチ位置として抽出され、こ
れにより駆動音源ベクトルが周期的に繰り返され、入力
音声との歪みが最小になるベクトルとゲインが選択され
て符号化される。また、請求項7の発明の音声復号化装
置は、伝送された符号、受信スペクトルパラメータとゲ
インにより、ピッチ位置が抽出され、これにより駆動音
源ベクトルが周期的に生成され、これと適応音源ベクト
ルにより、音源ベクトルが復号される。
In the input speech coding apparatus according to the present invention, the periodic pulse excitation vector is newly generated corresponding to the adaptive excitation vector, multiplied by each gain and synthesized, and the vector and the gain that minimize distortion with the input speech are obtained. Selected and encoded. Further, the speech decoding apparatus according to the second aspect of the present invention generates an excitation vector having periodicity by the transmitted code and gain, and by this and the adaptive excitation vector,
The source vector is decoded. In the speech coding apparatus according to the third and fourth aspects of the invention, the driving excitation vector is periodically repeated, and the vector and gain that minimize distortion with the input speech are selected and coded. Also, in the speech decoding apparatus according to the fifth aspect of the present invention, the driving excitation vector is periodically generated by the transmitted code, and the excitation vector is decoded by this and the adaptive excitation vector. Further, in the speech coding apparatus according to the invention of claim 6, a feature point determined by a pitch cycle in the adaptive excitation vector is extracted as a pitch position, whereby the driving excitation vector is periodically repeated, and distortion with the input speech is minimized. The vector and gain are selected and encoded. According to the speech decoding apparatus of the invention of claim 7, the pitch position is extracted by the transmitted code, the reception spectrum parameter and the gain, whereby the driving excitation vector is periodically generated, and by this and the adaptive excitation vector. , The excitation vector is decoded.

【0030】また、請求項8の発明の音声符号化復号化
方法は、フレーム中の適応音源ベクトルよりピッチが抽
出されて、このピッチに同期したピッチ同期ベクトルが
生成、符号化されて、適応音源ベクトル符号と共に伝送
され、受信側では、ピッチに同期したピッチ同期ベクト
ルが生成され、適応音源ベクトルと加算されて音源ベク
トルが復号される。また、請求項9の発明の音声符号化
装置は、適応音源ベクトルとそのゲインより適応音源信
号のパワー情報が抽出され、これに応じて駆動音源ベク
トルに対するゲイン量子化テーブルが変更され、入力音
声との歪みが最小になるベクトルとゲインが選択されて
符号化される。また、請求項10の発明の音声復号化装
置は、伝送された適応音源ベクトルの符号とそのゲイン
により、適応音源信号のパワー情報が抽出され、これに
応じて駆動音源ベクトルに対するゲイン量子化テーブル
が変更され、これにより駆動音源ベクトルに対するゲイ
ンが復号され、これを用いて音源ベクトルが復号され
る。また、請求項11の発明の音声符号化復号化方法
は、適応音源ベクトルとそのゲインより適応音源信号の
パワー情報が抽出され、これに応じて駆動音源ベクトル
に対するゲイン量子化テーブルが変更され、入力音声と
の歪みが最小になるベクトルとゲインが選択されて符号
化されて伝送され、受信側では、適応音源信号のパワー
情報に応じて駆動音源ベクトルに対するゲイン量子化テ
ーブルが変更され、これにより駆動音源ベクトルに対す
るゲインが復号され、これを用いて音源ベクトルが復号
される。
According to the speech coding / decoding method of the present invention, the pitch is extracted from the adaptive excitation vector in the frame, the pitch synchronization vector synchronized with this pitch is generated and coded, and the adaptive excitation is generated. It is transmitted together with the vector code, and on the receiving side, a pitch synchronization vector which is synchronized with the pitch is generated and added with the adaptive excitation vector to decode the excitation vector. Further, according to the speech coding apparatus of the invention of claim 9, the power information of the adaptive excitation signal is extracted from the adaptive excitation vector and its gain, the gain quantization table for the driving excitation vector is changed in accordance with this, and the input speech The vector and gain that minimize the distortion of are selected and encoded. Further, according to the speech decoding apparatus of the invention of claim 10, the power information of the adaptive excitation signal is extracted by the code of the transmitted adaptive excitation vector and the gain thereof, and the gain quantization table for the driving excitation vector is correspondingly extracted. Modified, which causes the gain for the driving source vector to be decoded and used to decode the source vector. According to the speech encoding / decoding method of the invention of claim 11, the power information of the adaptive excitation signal is extracted from the adaptive excitation vector and its gain, and the gain quantization table for the driving excitation vector is changed in accordance with this, and the input The vector and gain that minimize distortion with speech are selected, coded, and transmitted, and on the receiving side, the gain quantization table for the driving excitation vector is changed according to the power information of the adaptive excitation signal. The gain for the excitation vector is decoded, and this is used to decode the excitation vector.

【0031】[0031]

【実施例】【Example】

実施例1.図1はこの発明の請求項1の一実施例の構成
図である。図1において図10と同一の部分については
同一の符号を付し、説明を省略する。図1において、新
規な部分は、20の複数ベクトル適応音源符号化手段、
21及び23の周期パルス音源生成手段、22の複数ベ
クトル適応音源復号化手段である。スペクトル分析手段
6、スペクトルパラメータ符号化手段7からなる声道部
と、複数ベクトル適応音源符号化手段20、駆動音源符
号化手段10、音源ベクトル生成手段12からなる声帯
部の分担は従来例と同じであるが、声帯部の、特にピッ
チ周期性を向上させ、合成後の音声品質を改善するもの
である。
Example 1. 1 is a block diagram of an embodiment of claim 1 of the present invention. In FIG. 1, the same parts as those in FIG. 10 are designated by the same reference numerals and the description thereof will be omitted. In FIG. 1, a new part is 20 multi-vector adaptive excitation coding means,
21 and 23 are periodic pulse excitation generating means, and 22 are multiple vector adaptive excitation decoding means. The vocal tract portion including the spectrum analysis unit 6 and the spectrum parameter encoding unit 7 and the vocal cord portion including the multiple vector adaptive excitation encoding unit 20, the driving excitation encoding unit 10, and the excitation vector generation unit 12 are shared as in the conventional example. However, the pitch periodicity of the vocal cords, in particular, is improved, and the voice quality after synthesis is improved.

【0032】以下、本発明の一実施例の動作について説
明する。まず、符号化部1の動作について説明する。周
期パルス音源生成手段21は、適応音源符号帳9より入
力される適応音源ベクトルaiより、その最大振幅をと
る次元のみ1でその他の次元は0である周期単位インパ
ルス列からなる周期パルス音源ベクトルpiを生成し、
このpiを複数ベクトル符号化手段20に出力する。元
々、適応音源符号帳9が前フレーム迄の入力のサンプリ
ング系列値を記憶しており、これから、複数ベクトル適
応音源符号化手段20では現フレームの入力音声に最も
近い合成音声を生成するベクトルを選ぶが、記憶されて
いる適応音源符号帳9のベクトルは周期性の保持につい
ては充分ではない。同期パルス音源ベクトル音源ベクト
ルpiを新たに作ることで周期性が保強されることにな
る。
The operation of the embodiment of the present invention will be described below. First, the operation of the encoding unit 1 will be described. The periodic pulse excitation generator 21 is based on the adaptive excitation vector a i input from the adaptive excitation codebook 9 and is a periodic pulse excitation vector consisting of a periodic unit impulse sequence in which the dimension having the maximum amplitude is 1 and the other dimensions are 0. generate p i ,
This p i is output to the multiple vector coding means 20. Originally, the adaptive excitation codebook 9 stores the sampling sequence value of the input up to the previous frame, and from this, the multi-vector adaptive excitation coding means 20 selects the vector that produces the synthesized speech closest to the input speech of the current frame. However, the stored vector of the adaptive excitation codebook 9 is not sufficient to maintain the periodicity. The periodicity is maintained by newly creating the synchronous pulse source vector source vector p i .

【0033】図2に本実施例における適応音源ベクトル
(a)と、それより生成される周期パルス音源ベクトル
(b)の例を示す。つまり、記憶している多くのベクト
ル中で、その最大の振幅を持つベクトルが、単位化され
て出力される。このことにより、音声の再生にとって重
要な周期性を強調することが出来る。
FIG. 2 shows an example of the adaptive excitation vector (a) and the periodic pulse excitation vector (b) generated from it in this embodiment. That is, of the many stored vectors, the vector with the largest amplitude is unitized and output. This makes it possible to emphasize the periodicity that is important for audio reproduction.

【0034】複数ベクトル適応音源符号化手段20は、
スペクトルパラメータ符号化手段7より入力されるスペ
クトルパラメータを用い、前記適応音源符号帳9より入
力される適応音源ベクトルai 、前記周期パルス音源生
成手段21より入力される周期パルス音源ベクトルpi
より合成音声ベクトルAi、Piをそれぞれ合成する。そ
して、入力音声4からフレーム毎に切り出した入力音声
ベクトルXとのベクトル間距離Diを、例えば式(5)
に従って求める。ここで、ゲインβAi、βPiは距離Di
が最小になるように、例えば式(6)、式(7)に従っ
て決定する。
The multi-vector adaptive excitation coding means 20 is
Using the spectrum parameters input from the spectrum parameter encoding means 7, the adaptive excitation vector a i input from the adaptive excitation codebook 9 and the periodic pulse excitation vector p i input from the periodic pulse excitation generation means 21.
More synthesized speech vectors A i and P i are synthesized respectively. Then, the inter-vector distance D i with respect to the input voice vector X cut out from the input voice 4 for each frame is calculated by, for example, formula (5)
Ask according to. Here, the gains β Ai and β Pi are distances D i
Is determined according to, for example, equations (6) and (7).

【0035】[0035]

【数3】 [Equation 3]

【0036】次にこのベクトル間距離が最小となるベク
トルAI、PIの組を探索し、その符号I及びゲイン
βAI、βPIを量子化したゲインβqAI、βqPIの符号を伝
送路3を介して復号化部2に出力する。また、選択され
た適応音源ベクトルaI及びそのゲインβqAIと、周期パ
ルス音源ベクトルpI及びそのゲインβqPIを、音源ベク
トル生成手段12に出力するとともに、誤差ベクトルX
■ として、 X■=X−βqAII−βqPII を駆動音源符号化手段10に出力する。このように、従
来と比べて、AIのベクトルをAIとPIの組のベクトル
としたことが新規である。なお、ベクトル差をさらに量
子化して符号化送信する駆動音源符号化手段10の動作
は、本実施例では、従来例と同じであり、復号部2に対
してはJとγqJの符号を送信する。
Next, a set of vectors A I and P I that minimizes the inter-vector distance is searched, and the code I and the gains β qAI and β qPI obtained by quantizing the gains β AI and β PI are transmitted through the transmission line. 3 to the decoding unit 2. Also, the selected adaptive source vector a I and its gain β qAI , the periodic pulse source vector p I and its gain β qPI are output to the source vector generation means 12, and the error vector X is also output.
As (2), X * = X−β qAI A I −β qPI P I is output to the driving excitation encoding means 10. Thus, as compared with the conventional, it is novel that the vector of A I and the set of vectors of A I and P I. The operation of the driving excitation coding means 10 for further quantizing and coding and transmitting the vector difference is the same as the conventional example in this embodiment, and the codes of J and γ qJ are transmitted to the decoding unit 2. To do.

【0037】次に、復号化部2の動作について説明す
る。複数ベクトル適応音源復号化手段22は、符号化部
1から入力された適応音源ベクトルの符号Iを適応音源
符号帳14に出力する。適応音源符号帳14は、前記符
号Iに対応する適応音源ベクトルaIを、複数ベクトル
適応音源復号化手段22と周期パルス音源生成手段23
へ出力する。周期パルス音源生成手段23は、前記適応
音源符号帳14から入力された適応音源ベクトルaI
り周期パルス音源ベクトルpIを生成し、複数ベクトル
適応音源復号化手段22に出力する。
Next, the operation of the decoding section 2 will be described. The multiple vector adaptive excitation decoding means 22 outputs the code I of the adaptive excitation vector input from the encoding unit 1 to the adaptive excitation codebook 14. The adaptive excitation codebook 14 converts the adaptive excitation vector a I corresponding to the code I into multiple vector adaptive excitation decoding means 22 and periodic pulse excitation generation means 23.
Output to. The periodic pulse excitation generating means 23 generates a periodic pulse excitation vector p I from the adaptive excitation vector a I input from the adaptive excitation codebook 14 and outputs it to the multi-vector adaptive excitation decoding means 22.

【0038】複数ベクトル適応音源復号化手段22は、
前記適応音源符号帳14より入力される適応音源ベクト
ルaIと、前記周期パルス音源生成手段23より入力さ
れる周期パルス音源ベクトルpI、及び符号化部1から
入力されたそれぞれのゲインの符号より復号したゲイン
βqAI、βqPIを音源ベクトル生成手段17に出力する。
つまり、βqAI、aI、βqPI、pIの組が音源ベクトル生
成手段に与えられる。
The multi-vector adaptive excitation decoding means 22 is
From the adaptive excitation vector a I input from the adaptive excitation codebook 14, the periodic pulse excitation vector p I input from the periodic pulse excitation generation means 23, and the respective gain codes input from the encoding unit 1. The decoded gains β qAI and β qPI are output to the excitation vector generation means 17.
That is, a set of β qAI , a I , β qPI and p I is given to the sound source vector generating means.

【0039】音源ベクトル生成手段17は、前記複数ベ
クトル適応音源復号化手段22より入力された適応音源
ベクトルaI、周期パルス音源ベクトルpI及びそれぞれ
のゲインβqAI、βqPIと、他方の入力である駆動音源復
号化手段15より入力される駆動音源ベクトルcJ及び
そのゲインγqJより、下記の音源ベクトルを生成する。 βqAII+βqPII+γqJJ 生成された音源ベクトルは、適応音源符号帳14及び合
成フィルタ19に出力される。合成フィルタ19の出力
は、合成して復元された音声出力となる。
The excitation vector generating means 17 receives the adaptive excitation vector a I , the periodic pulse excitation vector p I and the respective gains β qAI and β qPI inputted from the multi-vector adaptive excitation decoding means 22 and the other input. The following excitation vector is generated from the driving excitation vector c J input from a certain driving excitation decoding means 15 and its gain γ qJ . β qAI a I + β qPI p I + γ qJ c J The generated excitation vector is output to the adaptive excitation codebook 14 and the synthesis filter 19. The output of the synthesizing filter 19 is a voice output that is synthesized and restored.

【0040】実施例2.上記実施例1では、符号化する
フレーム内のピッチ周期性のみを考慮して周期パルス音
源ベクトルを生成している。一方、切り出して選択・符
号化された適応音源ベクトルのピッチ周期は、入力音声
の実際のピッチ周期の倍の値をとったりして、周期パル
ス音源ベクトルが生成するパルス列は、フレーム間では
必ずしも周期的にはならない。このときは、先行フレー
ムの情報を用いて、例えば平均ピッチ周期を求めてお
き、周期パルス音源ベクトルはその平均ピッチ周期のパ
ルス列から生成するなど、フレーム間でのピッチ周期性
をも考慮して周期パルス音源ベクトルを生成してもよ
い。
Example 2. In the first embodiment, the periodic pulse excitation vector is generated by considering only the pitch periodicity in the frame to be encoded. On the other hand, the pitch period of the adaptive excitation vector that is cut out and selected / encoded has a value that is twice the actual pitch period of the input speech, and the pulse train generated by the periodic pulse excitation vector is not necessarily periodic between frames. It doesn't. At this time, using the information of the preceding frame, for example, the average pitch period is obtained in advance, and the periodic pulse excitation vector is generated from the pulse train of the average pitch period. A pulsed source vector may be generated.

【0041】実施例3.上記実施例1では、周期パルス
音源ベクトルの各パルスの振幅が全て等しいとした。こ
れを変更して、例えば音声のパワーに応じて振幅を、前
フレームから順次、増加、又は減少させる等、線形的に
変化させるなど、各周期パルス音源ベクトルが異なる振
幅をとるように設定してもよい。
Example 3. In the first embodiment, the amplitude of each pulse of the periodic pulse source vector is assumed to be equal. By changing this, for example, the amplitude is changed linearly by sequentially increasing, decreasing, or the like from the previous frame according to the power of the voice, and setting so that each periodic pulse source vector has a different amplitude. Good.

【0042】実施例4.上記実施例1では、周期パルス
音源ベクトルのパルス位置を、適応音源ベクトルの振幅
最大点より求めているが、この両者を合成して得られる
合成音声ベクトルにおいて、両者のベクトルの内積が最
大となる周期パルス音源ベクトルを設定してもよい。
Example 4. In the first embodiment, the pulse position of the periodic pulse excitation vector is obtained from the maximum amplitude point of the adaptive excitation vector. In the synthesized speech vector obtained by synthesizing the two, the inner product of the two vectors becomes maximum. A periodic pulse source vector may be set.

【0043】実施例5.上記実施例1では、適応音源ベ
クトルと周期パルス音源ベクトルをそのまま用いて合成
音声ベクトルを生成し、その結果ベクトルと入力音声ベ
クトルとのベクトル間距離を求めている。しかし、例え
ば周期パルス音源ベクトルのパルス位置における適応音
源ベクトルの振幅値を0にして、適応音源ベクトルと周
期パルス音源ベクトルを直交化してベクトル間の相関を
取り除き、周期性については専ら周期パルス音源ベクト
ルを用いた合成音声ベクトルを生成してもよい。そし
て、その結果ベクトルと入力音声ベクトルとのベクトル
間距離を求めてもよい。
Example 5. In the first embodiment, the adaptive sound source vector and the periodic pulse sound source vector are used as they are to generate a synthetic speech vector, and the inter-vector distance between the resultant vector and the input speech vector is obtained. However, for example, the amplitude value of the adaptive excitation vector at the pulse position of the periodic pulse excitation vector is set to 0, the adaptive excitation vector and the periodic pulse excitation vector are orthogonalized, and the correlation between the vectors is removed. You may generate the synthetic | combination speech vector using. Then, the inter-vector distance between the result vector and the input voice vector may be obtained.

【0044】実施例6.上記実施例5では、適応音源ベ
クトルと周期パルス音源ベクトルとを直交化してその相
関を取り除いている。これを、それぞれを合成して得ら
れる合成音声ベクトル同志を直交化することによりベク
トル間の相関を取り除いてもよい。
Example 6. In the fifth embodiment, the adaptive excitation vector and the periodic pulse excitation vector are orthogonalized to remove their correlation. The correlation between the vectors may be removed by orthogonalizing the synthesized speech vectors obtained by synthesizing them.

【0045】実施例7.上記実施例1では、周期パルス
音源ベクトルを1つのベクトルで構成している。これ
を、周期パルス音源ベクトルの各パルスのゲインを、図
2(b)で2パルスある例のとき、時間的に前のゲイン
と後のパルスのゲインを異なる値に設定するようにして
もよい。
Example 7. In the first embodiment, the periodic pulse sound source vector is composed of one vector. In the case where the gain of each pulse of the periodic pulse source vector is two pulses in FIG. 2B, the gain of the previous pulse and the gain of the subsequent pulse may be set to different values in terms of time. .

【0046】実施例8.図3はこの発明の請求項3及び
請求項5の発明の一実施例を示す構成図である。図3に
おいて、図1と同一の部分については同一の符号を付
し、説明を省略する。図3において、24は適応音源符
号化手段、25はピッチ位置抽出手段、26は駆動音源
符号化手段である。27、28はピッチ同期化手段であ
り、29は音源ベクトル生成手段である。
Example 8. FIG. 3 is a block diagram showing an embodiment of the inventions of claims 3 and 5 of the present invention. In FIG. 3, the same parts as those in FIG. 1 are designated by the same reference numerals and the description thereof will be omitted. In FIG. 3, 24 is an adaptive excitation coding means, 25 is a pitch position extraction means, and 26 is a driving excitation coding means. Reference numerals 27 and 28 are pitch synchronization means, and 29 is a sound source vector generation means.

【0047】以下、図3に示した本発明の一実施例の動
作について説明する。まず、符号化部1の動作について
説明する。適応音源符号化手段24は、適応音源符号帳
9より入力される適応音源ベクトルaiと、スペクトル
パラメータ符号化手段7より入力されるスペクトルパラ
メータを用いて合成音声ベクトルAiを合成する。そし
て、入力音声4からフレーム毎に切り出した入力音声ベ
クトルXとの歪みが最小になる合成音声ベクトルAI
びそのゲインβIを探索し、その符号I、及びゲインβI
を量子化したゲインβqIの符号を伝送路3を介して復号
化部2に出力し、選択された適応音源ベクトルaI及び
そのゲインβqIを音源ベクトル生成手段12に出力し、
また誤差ベクトルX■ を、 X■=X−βqII とし、このX■ と前記適応音源ベクトルaIを駆動音源
符号化手段26に出力するとともに、前記適応音源ベク
トルaIに対応するピッチ周期をピッチ位置抽出手段2
5に出力する。
The operation of the embodiment of the present invention shown in FIG. 3 will be described below. First, the operation of the encoding unit 1 will be described. The adaptive excitation coding means 24 synthesizes the synthesized speech vector A i using the adaptive excitation vector a i input from the adaptive excitation codebook 9 and the spectrum parameter input from the spectrum parameter coding means 7. Then, a synthetic speech vector A I and its gain β I that minimize distortion with the input speech vector X cut out from the input speech 4 for each frame are searched, and its code I and gain β I are searched.
The code of the gain β qI quantized is output to the decoding unit 2 via the transmission line 3, and the selected adaptive excitation vector a I and its gain β qI are output to the excitation vector generation means 12,
The addition error vector X ■, X ■ = pitch is X-β qI A I, and outputs the X ■ and the adaptive excitation vector a I to driving excitation coding unit 26, corresponding to the adaptive excitation vector a I Pitch position extraction means 2
Output to 5.

【0048】ピッチ位置抽出手段25は、適応音源符号
化手段24より入力されたピッチ周期を用いてピッチ周
期のパルス列を作成し、これを音源としてスペクトルパ
ラメータ符号化手段7より入力されるスペクトルパラメ
ータを用いて合成音声ベクトルを生成したときに、入力
音声4からフレーム毎に切り出した入力音声ベクトルX
との歪みが最小となるパルス列を探索する。そして、そ
のパルス位置をピッチ位置としてピッチ同期化手段27
に出力する。
The pitch position extraction means 25 creates a pulse train of a pitch cycle using the pitch cycle input from the adaptive excitation coding means 24, and uses this as a sound source for the spectrum parameter input from the spectrum parameter coding means 7. When a synthetic speech vector is generated using the input speech vector X, the input speech vector X is extracted from the input speech 4 for each frame.
Search for a pulse train that minimizes the distortion between and. Then, using the pulse position as the pitch position, the pitch synchronization means 27
Output to.

【0049】図4に、ピッチ位置探索時の動作ブロック
図を示す。この動作は、ピッチ周期のパルスの先頭位置
をフレームの先頭の位置から、例えば1フレームの切り
出し時間を128等分し、1/128時間ずらした値を
順次設定する。そして、先頭位置をずらしたピッチ周期
のパルス列を合成したものが入力音声に最も近いものを
選ぶ。こうすることで、入力音声のフレーミングによら
ず音声のピッチ構造に対して一意に定まる点が求められ
るので、周期性を明確化できる。
FIG. 4 shows an operation block diagram when the pitch position is searched. In this operation, the start position of the pulse of the pitch cycle is divided from the start position of the frame, for example, by dividing the cut-out time of one frame into 128 equal parts, and a value shifted by 1/128 hours is sequentially set. Then, the one obtained by combining the pulse trains whose pitch positions are shifted and closest to the input voice is selected. By doing so, a point that is uniquely determined for the pitch structure of the voice is required regardless of the framing of the input voice, and thus the periodicity can be clarified.

【0050】駆動音源符号帳11には、例えば音声のピ
ッチ位置に同期したピッチ長で切り出した短周期予測残
差信号より、Linde, Buzo, Gray 法(LBG法)で学習
した結果として、N個の駆動ベクトルが記憶されてい
る。また、各駆動音源ベクトルを切り出したピッチ位置
を、その駆動音源ベクトルのピッチ同期位置として設定
しておく。ピッチ同期化手段27は、前記ピッチ位置抽
出手段25より入力されたピッチ位置に、駆動音源符号
帳11より入力される駆動音源ベクトルcj のピッチ同
期位置を合わせて、ピッチ周期で繰り返すピッチ同期駆
動音源ベクトルcj■を作成する。そして、これを駆動
音源符号化手段26に出力する。図5に本実施例におけ
るピッチ同期駆動音源ベクトルの例を示す。駆動音源符
号化手段26は、前記ピッチ同期化手段27より入力さ
れるピッチ同期駆動音源ベクトルcj■を、前記適応音
源符号化手段24より入力された適応音源ベクトルaI
に対して、例えば式(8)に従って直交化した直交化ピ
ッチ同期駆動音源ベクトルcj■を作成する。
In the driving excitation codebook 11, for example, as a result of learning by the Linde, Buzo, Gray method (LBG method) from the short cycle prediction residual signal cut out at a pitch length synchronized with the pitch position of the speech, N pieces are obtained. The drive vector of is stored. In addition, the pitch position where each driving sound source vector is cut out is set as the pitch synchronization position of the driving sound source vector. The pitch synchronization means 27 aligns the pitch synchronization position of the drive excitation vector c j input from the drive excitation codebook 11 with the pitch position input from the pitch position extraction means 25, and repeats the pitch synchronization drive in the pitch cycle. A sound source vector c j ■ is created. Then, this is output to the driving excitation encoding means 26. FIG. 5 shows an example of the pitch synchronous drive sound source vector in this embodiment. The driving excitation coding means 26 converts the pitch-synchronized driving excitation vector c j 2 input from the pitch synchronization means 27 into the adaptive excitation vector a I input from the adaptive excitation coding means 24.
On the other hand, for example, the orthogonalized pitch-synchronized drive sound source vector c j { circle around (2) } is created according to equation (8).

【0051】[0051]

【数4】 [Equation 4]

【0052】次に、前記直交化ピッチ同期駆動音源ベク
トルcj■より合成音声ベクトルCj■を合成する。そし
て、前記適応音源符号化手段24から入力された誤差ベ
クトルX■とのベクトル間距離Djを、例えば式(9)
に従って求める。ここで、ゲインγjはベクトル間距離
Dj を最小になるように、例えば式(10)に従って決定
する。
Next, a synthesized voice vector C j {1 } is synthesized from the orthogonal pitch-synchronized drive sound source vector c j {1 }. Then, the inter-vector distance D j from the error vector X ■ input from the adaptive excitation encoding means 24 is calculated by, for example, equation (9).
Ask according to. Here, the gain γ j is determined, for example, according to the equation (10) so that the inter-vector distance D j is minimized.

【0053】[0053]

【数5】 [Equation 5]

【0054】次に、このベクトル間距離Djが最小とな
るベクトルCJ■を探索し、この符号J、及びゲインγJ
を量子化したγqJの符号を伝送路3を介して復号部2に
出力する。同時に、選択された直交化ピッチ同期駆動音
源ベクトルcJ■及びそのゲインγqJを音源ベクトル生
成手段12に出力する。このことは、従来はピッチに非
同期であったために生成される音源信号の周期性を乱し
ていた駆動音源ベクトルを、ピッチに同期させることで
音源信号の周期性を向上させることになる。
Next, a vector C J (1) that minimizes the inter-vector distance D j is searched for, and the code J and the gain γ J are searched.
The quantized γ qJ code is output to the decoding unit 2 via the transmission line 3. At the same time, the selected orthogonalized pitch-synchronized drive sound source vector c J (1) and its gain γ qJ are output to the sound source vector generating means 12. This improves the periodicity of the sound source signal by synchronizing the driving sound source vector, which has been disturbing the periodicity of the sound source signal generated conventionally because it is asynchronous with the pitch, with the pitch.

【0055】次に、復号化部2の動作について説明す
る。ピッチ同期化手段28は、駆動音源符号帳16より
入力される駆動音源ベクトルcJから、符号化部1から
入力されたピッチ位置に同期して繰り返したピッチ同期
駆動音源ベクトルcJ■を作成し、駆動音源復号化手段
15に出力する。
Next, the operation of the decoding section 2 will be described. The pitch synchronization means 28 creates a pitch-synchronized drive excitation vector c J (1) that is repeated in synchronization with the pitch position input from the encoder 1 from the drive excitation vector c J input from the drive excitation codebook 16. , To the driving excitation decoding means 15.

【0056】音源ベクトル生成手段29は、まず、駆動
音源復号化手段15より入力されるピッチ同期駆動音源
ベクトルcJ■を、適応音源復号化手段13より入力さ
れる適応音源ベクトルaIと直交化して、直交化ピッチ
同期駆動音源ベクトルcJ■を生成する。次に、前記適
応音源ベクトルaI及び適応音源復号化手段13より入
力されるゲインβqIと、前記直交化ピッチ同期駆動音源
ベクトルcJ■及び駆動音源復号化手段15より入力さ
れるゲインγqJより、次式の音源ベクトル βqII+γqJJ■ を生成し、これを適応音源符号帳14及び合成フィルタ
19に出力する。合成フィルタ19の出力は合成して復
元された音声出力となる。
The excitation vector generating means 29 first orthogonalizes the pitch-synchronized driving excitation vector c J (2) input from the driving excitation decoding means 15 with the adaptive excitation vector a I input from the adaptive excitation decoding means 13. To generate an orthogonalized pitch-synchronized drive sound source vector c J ∘. Next, the gain β qI input from the adaptive excitation vector a I and the adaptive excitation decoding means 13, and the gain γ qJ input from the orthogonalized pitch-synchronized drive excitation vector c J 1 and the drive excitation decoding means 15. From this, an excitation vector β qI a I + γ qJ c J 2 of the following equation is generated and output to the adaptive excitation codebook 14 and the synthesis filter 19. The output of the synthesizing filter 19 becomes an audio output that is synthesized and restored.

【0057】実施例9.図6はこの発明の請求項4及び
請求項5の発明の一実施例を示す構成図である。図6に
おいて、図3と同一の部分については同一の符号を付
し、説明を省略する。図6において、30は駆動音源符
号化手段である。
Embodiment 9 FIG. 6 is a block diagram showing an embodiment of the inventions of claims 4 and 5 of the present invention. 6, parts that are the same as those in FIG. 3 are given the same reference numerals, and descriptions thereof will be omitted. In FIG. 6, 30 is a drive excitation encoding means.

【0058】以下、図6に示した本発明の一実施例につ
いて説明する。適応音源符号化手段24は、適応音源符
号帳9より入力される適応音源ベクトルaiと、スペク
トルパラメータ符号化手段7より入力されるスペクトル
パラメータを用いて合成音声ベクトルAiを合成する。
そして、入力音声4からフレーム毎に切り出した入力音
声ベクトルXとの歪みが最小になるベクトルAI及びそ
のゲインβIを探索し、その符号I、及びゲインβIを量
子化したゲインβqIの符号を伝送路3を介して復号化部
2に出力し、選択された適応音源ベクトルaI及びその
ゲインβqIを音源ベクトル生成手段12に出力し、また
誤差ベクトルX■を、 X■=X−βqII とし、このX■と前記適応音源ベクトルaI及びaIに対
応するピッチ周期を駆動音源符号化手段30に出力す
る。
An embodiment of the present invention shown in FIG. 6 will be described below. The adaptive excitation coding means 24 synthesizes the synthesized speech vector A i using the adaptive excitation vector a i input from the adaptive excitation codebook 9 and the spectrum parameter input from the spectrum parameter coding means 7.
Then, from the input speech 4 distortion of the input speech vector X cut out for each frame is searched vector A I and gain beta I minimized, of the code I, and the gain beta qI the gain beta I quantized The code is output to the decoding unit 2 via the transmission path 3, the selected adaptive excitation vector a I and its gain β qI are output to the excitation vector generation means 12, and the error vector X ■ is expressed as X ■ = X. −β qI A I, and outputs the pitch period corresponding to this X 2 and the adaptive excitation vectors a I and a I to the driving excitation encoding means 30.

【0059】駆動音源符号化手段30は、まず、前記適
応音源符号化手段24より入力されたピッチ周期を用い
ピッチ同期化手段27にピッチ位置kを出力する。この
ピッチ位置kはフレームの先頭の位置からk点目を先頭
にピッチ周期で定まる位置である。ピッチ同期化手段2
7は、前記駆動音源符号化手段30より入力されたピッ
チ位置kに、駆動音源符号帳11より入力される駆動音
源ベクトルcj のピッチ同期位置を合わせて、ピッチ周
期で繰り返すピッチ同期駆動音源ベクトルcjk■を作成
する。そして、これを駆動音源符号化手段30に出力す
る。駆動音源符号化手段30は、前記ピッチ同期化手段
27より入力されたピッチ同期駆動音源ベクトルcjk
を、前記適応音源符号化手段24より入力された適応
音源ベクトルaIに対して、例えば式(11)に従って直
交化した直交化ピッチ同期駆動音源ベクトルcjk■ を
作成する。
The driving excitation coding means 30 first outputs the pitch position k to the pitch synchronization means 27 using the pitch period input from the adaptive excitation coding means 24. The pitch position k is a position determined by the pitch cycle starting from the k-th position from the head position of the frame. Pitch synchronization means 2
Reference numeral 7 is a pitch-synchronized drive excitation vector which is repeated at pitch intervals by matching the pitch synchronization position of the drive excitation vector c j input from the drive excitation codebook 11 with the pitch position k input from the drive excitation encoding means 30. Create c jk ■. Then, this is output to the driving excitation encoding means 30. The driving excitation coding means 30 is a pitch-synchronized driving excitation vector c jk (2) input from the pitch synchronization means 27.
Then, the orthogonalized pitch-synchronized drive excitation vector c jk (2) is created by orthogonalizing the adaptive excitation vector a I input from the adaptive excitation encoding means 24 according to, for example, equation (11).

【0060】[0060]

【数6】 [Equation 6]

【0061】次に、前記直交化ピッチ同期駆動音源ベク
トルcjk■ より合成音声ベクトルCjk■ を合成する。
そして、前記適応音源符号化手段24から入力された誤
差ベクトルX■ とのベクトル間距離Djkを、例えば式
(12)に従って求める。ここで、ゲインγjkはベクトル
間距離Djkを最小になるように、例えば式(13)に従っ
て決定する。
Next, a synthesized speech vector C jk s is synthesized from the orthogonalized pitch synchronization drive sound source vector c jk s .
Then, the inter-vector distance D jk with the error vector X2 input from the adaptive excitation coding means 24 is obtained according to, for example, equation (12). Here, the gain γ jk is determined, for example, according to the equation (13) so that the inter-vector distance D jk is minimized.

【0062】[0062]

【数7】 [Equation 7]

【0063】次に、このベクトル間距離Djkを駆動音源
ベクトルの符号j(j=1, ...,N)とピッチ位置k
(k=1, ...,L)の全ての組み合わせに対して求
め、ベクトル間距離Djkが最小になるベクトルCJK■を
探索し、この符号J、ピッチ位置K、及びゲインγJK
量子化したγqJKの符号を伝送路3を介して復号化部2
に出力する。同時に、選択された直交化ピッチ同期駆動
音源ベクトルcJK■ 及びそのゲインγqJKを音源ベクト
ル生成手段12に出力する。このことは、ピッチ位置を
合成音声の歪み最小となるものとして抽出することによ
り、合成音声の音質を向上させることになる。
Next, the inter-vector distance D jk is set to the code j (j = 1, ..., N) of the driving sound source vector and the pitch position k.
For all combinations (k = 1, ..., L), a vector C JK (2) that minimizes the inter-vector distance D jk is searched, and this code J, pitch position K, and gain γ JK are obtained. The quantized γ qJK code is decoded by the decoding unit 2 via the transmission line 3.
Output to. At the same time, the selected orthogonalized pitch-synchronized drive sound source vector c JK 1 and its gain γ qJK are output to the sound source vector generating means 12. This improves the sound quality of the synthetic voice by extracting the pitch position as the one that minimizes the distortion of the synthetic voice.

【0064】実施例10.図7はこの発明の請求項6の
発明の一実施例を示す構成図である。図7において、図
6と同一の部分については同一の符号を付し、説明を省
略する。図7において、31は適応音源符号化手段、3
2、33はピッチ位置抽出手段である。
Example 10. FIG. 7 is a block diagram showing an embodiment of the invention of claim 6 of the present invention. 7, parts that are the same as those shown in FIG. 6 are given the same reference numerals, and descriptions thereof will be omitted. In FIG. 7, 31 is adaptive excitation coding means, 3
2 and 33 are pitch position extracting means.

【0065】以下、図7に示した本発明の一実施例の動
作について説明する。まず、符号化部1の動作について
説明する。ピッチ位置抽出手段32は、適応音源符号帳
9より入力される適応音源ベクトルaiと、スペクトル
パラメータ符号化手段7より入力されるスペクトルパラ
メータを用いて合成音声ベクトルAiを合成する。次に
前記適応音源ベクトルaiに対応するピッチ周期のパル
ス列を音源として、前記スペクトルパラメータを用いて
合成音声ベクトルを生成したときに、前記合成音声ベク
トルAiとの歪みが最小となるパルス列を探索する。そ
して、そのパルス位置をピッチ位置として適応音源符号
化手段31に出力する。
The operation of the embodiment of the present invention shown in FIG. 7 will be described below. First, the operation of the encoding unit 1 will be described. The pitch position extracting means 32 synthesizes the synthesized speech vector A i using the adaptive excitation vector a i input from the adaptive excitation codebook 9 and the spectrum parameter input from the spectrum parameter encoding means 7. Next, when a synthesized speech vector is generated using the spectral parameters with a pulse train having a pitch period corresponding to the adaptive source vector a i as a sound source, a pulse train having a minimum distortion with the synthesized speech vector A i is searched for. To do. Then, the pulse position is output as a pitch position to the adaptive excitation encoding means 31.

【0066】適応音源符号化手段31は、まず前記適応
音源符号帳9より入力される適応音源ベクトルaiに対
応するピッチ周期のパルス列を音源として、前記スペク
トルパラメータ符号化手段7より入力されるスペクトル
パラメータを用いて合成音声ベクトルを生成したとき
に、入力音声4からフレーム毎に切り出した入力音声ベ
クトルXとの歪みが最小となるパルス列を探索する。そ
して、そのパルス位置を入力音声におけるピッチ位置と
する。そして、前記ピッチ位置抽出手段32より入力さ
れる適応音源ベクトルaiにおけるピッチ位置が、前記
入力音声におけるピッチ位置よりある距離、例えば5サ
ンプル、以内にある場合のみ以下の処理を行い、それ以
外の場合は前記適応音源ベクトルaiを符号化の対象か
ら外す。
The adaptive excitation coding means 31 first uses the pulse train of the pitch period corresponding to the adaptive excitation vector a i input from the adaptive excitation codebook 9 as the excitation, and inputs the spectrum input from the spectrum parameter encoding means 7. When a synthetic speech vector is generated using the parameters, a pulse train that minimizes distortion with the input speech vector X cut out from the input speech 4 for each frame is searched for. Then, the pulse position is set as the pitch position in the input voice. Then, the following processing is performed only when the pitch position in the adaptive sound source vector a i input from the pitch position extraction means 32 is within a certain distance, for example, 5 samples, from the pitch position in the input speech, and other than that. In this case, the adaptive excitation vector a i is excluded from the target of encoding.

【0067】適応音源符号化手段31は、次に、前記適
応音源ベクトルaiにおけるピッチ位置のみ1でその他
は0であるピッチパルスベクトルpiを生成する。そし
て、前記スペクトルパラメータを用い、前記適応音源ベ
クトルaiと前記ピッチパルスベクトルpiより合成音声
ベクトルAi、Piを合成する。また、入力音声ベクトル
Xとのベクトル間距離Diを例えば式(14)に従って求
める。ここで、min(x,y)はx、yのうち値の小
さい方を選択する関数であり、選択結果が出力される。
また、ゲインβAi、βPiは距離Diが最小になるよう
に、例えば式(15)、式(16)に従って決定する。
The adaptive excitation coding means 31 then generates a pitch pulse vector p i in which only the pitch position in the adaptive excitation vector a i is 1 and the others are 0. Then, using the spectrum parameters, synthesized speech vectors A i and P i are synthesized from the adaptive sound source vector a i and the pitch pulse vector p i . Further, the inter-vector distance D i with respect to the input voice vector X is obtained, for example, according to the equation (14). Here, min (x, y) is a function that selects the smaller one of x and y, and the selection result is output.
Further, the gains β Ai and β Pi are determined in accordance with, for example, equations (15) and (16) so that the distance D i becomes the minimum.

【0068】[0068]

【数8】 [Equation 8]

【0069】次に、このベクトル間距離が最小となるベ
クトルAI を探索し、その符号I及びそのゲインβAI
量子化したゲインβqAI の符号を伝送路3を介して復号
化部2に出力する。また、前記適応音源ベクトルaI
そのゲインβqAIを、音源ベクトル生成手段12に出力
する。更に、前記ピッチ位置抽出手段32より入力され
た前記適応音源ベクトルaIにおけるピッチ位置を、ピ
ッチ同期化手段27に出力する。また誤差ベクトルX■
を、 X■=X−βqAII とし、このX■ と前記適応音源ベクトルaIを駆動音源
符号化手段26にも出力する。
Next, the vector A I having the minimum inter-vector distance is searched for, and the code I and the code of the gain β qAI obtained by quantizing the gain β AI are transmitted to the decoding unit 2 via the transmission line 3. Output. Further, the adaptive excitation vector a I and its gain β qAI are output to the excitation vector generation means 12. Further, the pitch position in the adaptive sound source vector a I input from the pitch position extraction means 32 is output to the pitch synchronization means 27. Also, the error vector X
X X = X-β qAI A I, and outputs this X ■ and the adaptive excitation vector a I to the driving excitation encoding means 26.

【0070】次に、復号化部2の動作について説明す
る。ピッチ位置抽出手段33は、適応音源符号帳14よ
り入力される適応音源ベクトルaIと、スペクトルパラ
メータ復号化手段18より入力されるスペクトルパラメ
ータよりピッチ位置を抽出する。そして、このピッチ位
置をピッチ同期化手段28に出力する。このことは、ピ
ッチ位置を入力音声を量子化したものである適応音源ベ
クトルとスペクトルパラメータより抽出することにより
復号化部においても一意に求めることが可能であり、ピ
ッチ位置を伝送する必要がなく、合成音声の音質の劣化
を起こさずに伝送情報量の削減することになる。
Next, the operation of the decoding section 2 will be described. The pitch position extracting means 33 extracts a pitch position from the adaptive excitation vector a I input from the adaptive excitation codebook 14 and the spectrum parameter input from the spectrum parameter decoding means 18. Then, this pitch position is output to the pitch synchronizing means 28. This can be uniquely obtained in the decoding unit by extracting the pitch position from the adaptive excitation vector that is a quantized input speech and the spectrum parameter, without the need to transmit the pitch position, The amount of transmitted information can be reduced without deteriorating the sound quality of the synthetic voice.

【0071】実施例11.上記実施例10では、適応音
源符号化手段において、適応音源ベクトルを符号化対象
とする判断基準である適応音源ベクトルより抽出したピ
ッチ位置と、入力音声より求まるピッチ位置間の距離値
を固定としているが、例えばピッチ長に応じて可変とし
てもよい。
Example 11. In the tenth embodiment, the adaptive excitation encoding means fixes the distance value between the pitch position extracted from the adaptive excitation vector which is the criterion for determining the adaptive excitation vector as the encoding target and the pitch position obtained from the input speech. However, it may be variable according to the pitch length, for example.

【0072】実施例12.上記実施例10では、適応音
源符号化手段において、適応音源ベクトルより抽出した
ピッチ位置と入力音声より求まるピッチ位置の差が、あ
る距離以内のもののみ符号化の対象としているが、全て
の適応音源ベクトルがこの基準を満たさないフレームに
おいては、この距離基準を緩和、あるいは廃止してもよ
い。
Example 12 In the tenth embodiment, the adaptive excitation coding means targets the encoding only when the difference between the pitch position extracted from the adaptive excitation vector and the pitch position obtained from the input speech is within a certain distance. This distance criterion may be relaxed or eliminated in frames where the vector does not meet this criterion.

【0073】実施例13.図8はこの発明の請求項9の
発明の一実施例を示す構成図である。図8において、図
10と同一の部分については同一の符号を付し、説明を
省略する。図8において、34、36は制御手段、35
は駆動音源符号化手段であり、37は駆動音源復号化手
段である。
Example 13 FIG. 8 is a block diagram showing an embodiment of the invention of claim 9 of the present invention. 8, parts that are the same as the parts shown in FIG. 10 are given the same reference numerals, and descriptions thereof will be omitted. In FIG. 8, 34 and 36 are control means, and 35.
Is a driving excitation encoding means, and 37 is a driving excitation decoding means.

【0074】以下、図8に示した本発明の一実施例の動
作について説明する。まず、符号化部1の動作について
説明する。制御手段34は適応音源符号化手段8より入
力される適応音源ベクトルaI及びそのゲインβqIより
適応音源信号のパワーP P=‖βqII2 を求める。そして、例えば、予め設定した閾値P1
2、P3と前記適応音源信号のパワーPとを比較して、
予め複数個用意してある駆動音源ベクトルに対するゲイ
ン量子化テーブルの中から、例えば以下の条件判別に従
って実際に量子化に用いる駆動音源ベクトルに対するゲ
イン量子化テーブルを選択し、選択された量子化テーブ
ルを駆動音源符号化手段35に出力する。 P<P1 の場合 量子化テーブル1 を選択 P1≦P<P2 の場合 量子化テーブル2 を選択 P2≦P<P3 の場合 量子化テーブル3 を選択 P3≦P の場合 量子化テーブル4 を選択
The operation of the embodiment of the present invention shown in FIG. 8 will be described below. First, the operation of the encoding unit 1 will be described. The control means 34 obtains the power P P = ‖β qI a I2 of the adaptive excitation signal from the adaptive excitation vector a I input from the adaptive excitation encoding means 8 and its gain β qI . Then, for example, a preset threshold P 1 ,
Comparing P 2 and P 3 with the power P of the adaptive sound source signal,
From the gain quantization table for the driving excitation vector prepared in advance, for example, select the gain quantization table for the driving excitation vector to be actually used for quantization according to the following condition determination, and select the selected quantization table. It outputs to the drive excitation encoding means 35. If P <P 1 Select Quantization Table 1 If P 1 ≦ P <P 2 Select Quantization Table 2 If P 2 ≦ P <P 3 Select Quantization Table 3 If P 3 ≦ P Quantization Select table 4

【0075】各量子化テーブルは、例えば図9に示す適
応音源信号のパワーと駆動音源ベクトルに対するゲイン
との相関関係を用いて各条件下では効率の良い量子化を
行えるように設計しておく。図9より分かるように、駆
動音源ベクトルに対するゲインの量子化を適応音源信号
のパワー情報により変更することにより、各量子化テー
ブルにおいては量子化すべきゲインの範囲を小さくでき
るので、量子化効率を上げることができる。
Each quantization table is designed so that efficient quantization can be performed under each condition by using the correlation between the power of the adaptive excitation signal and the gain with respect to the driving excitation vector shown in FIG. 9, for example. As can be seen from FIG. 9, the gain range to be quantized in each quantization table can be reduced by changing the quantization of the gain for the driving excitation vector according to the power information of the adaptive excitation signal, thus increasing the quantization efficiency. be able to.

【0076】駆動音源符号化手段35は、駆動音源符号
帳11より入力される駆動音源ベクトルcjと、スペク
トルパラメータ符号化手段より入力されるスペクトルパ
ラメータを用いて、合成音声ベクトルCjを合成する。
そして、適応音源符号化手段8より入力された誤差ベク
トルX■ とのベクトル間距離Djを、例えば式(17)に
従って求める。ここで、ゲインγjは距離Djが最小にな
るように、例えば式(18)に従って決定する。
The driving excitation coding means 35 synthesizes the synthesized speech vector C j using the driving excitation vector c j inputted from the driving excitation codebook 11 and the spectrum parameter inputted from the spectrum parameter coding means. .
Then, the inter-vector distance D j with the error vector X₄ input from the adaptive excitation encoding means 8 is obtained according to, for example, equation (17). Here, the gain γ j is determined, for example, according to the equation (18) so that the distance D j is minimized.

【0077】[0077]

【数9】 [Equation 9]

【0078】次にこのベクトル間距離が最小となるベク
トルCJを探索し、その符号J及びゲインγJを前記制御
手段34より入力された駆動音源ベクトルに対するゲイ
ン量子化テーブルを用いて量子化したゲインγqJの符号
を伝送路3を介して復号化部2に出力するとともに、選
択された駆動音源ベクトルcJ及びそのゲインγqJを音
源ベクトル生成手段12に出力する。
Next, a vector C J that minimizes the inter-vector distance is searched, and its code J and gain γ J are quantized using the gain quantization table for the driving sound source vector input from the control means 34. The code of the gain γ qJ is output to the decoding unit 2 via the transmission path 3, and the selected drive excitation vector c J and its gain γ qJ are output to the excitation vector generation means 12.

【0079】次に、復号化部2の動作について説明す
る。制御手段36は適応音源復号化手段13より入力さ
れる適応音源ベクトルaI及びそのゲインβqIより適応
音源信号のパワーPを求め、前記制御手段34と同一の
予め複数個用意してある駆動音源ベクトルに対するゲイ
ン量子化テーブルの中から、前記制御手段34と同一の
閾値を用いた条件判別に従って逆量子化に用いる駆動音
源ベクトルに対するゲイン量子化テーブルを選択し、選
択された量子化テーブルを駆動音源復号化手段37に出
力する。
Next, the operation of the decoding section 2 will be described. The control means 36 obtains the power P of the adaptive excitation signal from the adaptive excitation vector a I input from the adaptive excitation decoding means 13 and its gain β qI, and a plurality of drive excitation sources, which are the same as the control means 34, are prepared in advance. From the gain quantization table for the vector, the gain quantization table for the driving excitation vector used for inverse quantization is selected according to the condition determination using the same threshold value as that of the control means 34, and the selected quantization table is used as the driving excitation source. It outputs to the decoding means 37.

【0080】駆動音源復号化手段37は、符号化部1か
ら入力された駆動音源ベクトルの符号Jに基づき、駆動
音源符号帳16から駆動音源ベクトルcJを読みだし、
また、前記制御手段36より入力されたゲイン量子化テ
ーブルを用い、符号化部1から入力された駆動音源ベク
トルに対するゲインの符号よりゲインγqJを復号化し、
前記駆動音源ベクトルcJとそのゲインγqJを音源ベク
トル生成手段17に出力する。
The driving excitation decoding means 37 reads the driving excitation vector c J from the driving excitation codebook 16 based on the code J of the driving excitation vector input from the encoding unit 1,
Further, using the gain quantization table input from the control means 36, the gain γ qJ is decoded from the sign of the gain for the driving excitation vector input from the encoding unit 1,
The driving sound source vector c J and its gain γ qJ are output to the sound source vector generating means 17.

【0081】[0081]

【発明の効果】以上のようにこの発明によれば、音声符
号化装置に、適応音源ベクトルを記憶する適応音源符号
帳と、周期パルス音源ベクトルを生成する周期パルス音
源生成手段と、両者を加算合成し符号化する複数ベクト
ル適応音源符号化手段を備えたので、また、音声復号化
装置には符号化装置に対応する手段を備えたので、僅か
の伝送情報の追加のみで、ピッチ周期性の乱れが少ない
高品質の音声を合成できる効果がある。
As described above, according to the present invention, an adaptive excitation codebook that stores an adaptive excitation vector and a periodic pulse excitation generation means that generates a periodic pulse excitation vector are added to a speech encoding device. Since the multi-vector adaptive excitation encoding means for synthesizing and encoding is provided, and the speech decoding apparatus is provided with means corresponding to the encoding apparatus, only a small amount of transmission information is added, and the pitch periodicity This has the effect of synthesizing high-quality speech with little disturbance.

【0082】また請求項3ないし請求項5の発明によれ
ば、音声符号化装置は、適応音源符号帳と、ピッチ位置
抽出手段と、複数の音源信号を記憶している駆動音源符
号帳と、駆動音源ベクトルをピッチ周期で繰り返すピッ
チ同期化手段と、適応音源符号化手段と、駆動音源符号
化手段とを備えたので、また音声復号化装置には、符号
化装置に対応する手段を備えたので、僅かの伝送情報の
追加のみで、ピッチ周期性の乱れが少ない高品質の音声
を合成できる効果がある。
According to the inventions of claims 3 to 5, the speech coding apparatus comprises an adaptive excitation codebook, pitch position extraction means, a driving excitation codebook storing a plurality of excitation signals, Since the pitch synchronization means for repeating the driving excitation vector in the pitch cycle, the adaptive excitation coding means, and the driving excitation coding means are provided, the speech decoding apparatus is provided with means corresponding to the coding apparatus. Therefore, it is possible to synthesize high-quality speech with little disturbance of pitch periodicity by adding a small amount of transmission information.

【0083】また請求項6及び請求項7の発明によれ
ば、音声符号化装置は、適応音源符号帳と、適応音源ベ
クトルからピッチ位置を抽出するピッチ位置抽出手段
と、駆動音源符号帳と、駆動音源ベクトルをピッチ周期
で繰り返すピッチ同期化手段と、適応音源符号化手段
と、駆動音源符号化手段とを備えたので、また音声復号
化装置には、符号化装置に対応する手段を備えたので、
伝送情報の増加無しに、ピッチ周期性の乱れが少ない高
品質の音声を合成できる効果がある。
According to the sixth and seventh aspects of the invention, the speech coding apparatus comprises an adaptive excitation codebook, pitch position extraction means for extracting a pitch position from an adaptive excitation vector, and a driving excitation codebook. Since the pitch synchronization means for repeating the driving excitation vector in the pitch cycle, the adaptive excitation coding means, and the driving excitation coding means are provided, the speech decoding apparatus is provided with means corresponding to the coding apparatus. So
There is an effect that it is possible to synthesize high-quality speech with little disturbance of pitch periodicity without increasing transmission information.

【0084】また請求項8の発明によれば、周期ピッチ
を抽出する方法と、受信側では周期性を持つピッチ同期
ベクトルを生成する方法を備えたので、僅かの伝送情報
を加えるだけで、ピッチ周期性の乱れが少ない高品質の
伝送が可能になる効果がある。
Further, according to the invention of claim 8, since the method for extracting the periodic pitch and the method for generating the pitch synchronization vector having the periodicity are provided on the receiving side, the pitch can be obtained by adding a small amount of transmission information. This has the effect of enabling high-quality transmission with less periodic disturbance.

【0085】また請求項9及び請求項10の発明によれ
ば、音声符号化装置は、適応音源符号帳と、駆動音源符
号帳と、適応音源符号化手段と、適応音源信号のパワー
情報により駆動音源ベクトルに対するゲイン量子化テー
ブルを変更する制御手段と、駆動音源符号化手段とを備
えたので、また音声復号化装置には、符号化装置に対応
する手段を備えたので、伝送情報の増加無しに、量子化
歪が小さい高品質の音声を合成できる効果がある。
According to the ninth and tenth aspects of the present invention, the speech coding apparatus is driven by the adaptive excitation codebook, the driving excitation codebook, the adaptive excitation coding means, and the power information of the adaptive excitation signal. Since the control means for changing the gain quantization table for the excitation vector and the driving excitation encoding means are provided, and the speech decoding apparatus is provided with the means corresponding to the encoding apparatus, there is no increase in transmission information. In addition, there is an effect that high-quality speech with small quantization distortion can be synthesized.

【0086】更に、請求項11の発明によれば、駆動音
源ベクトルに対するゲインの量子化を適応音源信号のパ
ワー情報によって効率の良いものに変更する方法と、受
信側でも送信側に対応する量子化に変更する方法を備え
たので、伝送情報の増加無しに、量子化歪が小さい高品
質の伝送が可能になる効果がある。
Further, according to the invention of claim 11, a method of changing the quantization of the gain with respect to the driving excitation vector to an efficient one by the power information of the adaptive excitation signal, and a quantization corresponding to the receiving side and the transmitting side. Since there is provided a method of changing to, there is an effect that high-quality transmission with small quantization distortion can be performed without increasing the transmission information.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の実施例1を示す構成図である。FIG. 1 is a configuration diagram showing a first embodiment of the present invention.

【図2】この発明の周期パルス音源ベクトルの例を示す
説明図である。
FIG. 2 is an explanatory diagram showing an example of a periodic pulse sound source vector of the present invention.

【図3】この発明の実施例8を示す構成図である。FIG. 3 is a configuration diagram showing an eighth embodiment of the present invention.

【図4】この発明のピッチ位置抽出を示す説明図であ
る。
FIG. 4 is an explanatory diagram showing pitch position extraction of the present invention.

【図5】この発明のピッチ同期駆動音源ベクトルの例を
示す説明図である。
FIG. 5 is an explanatory diagram showing an example of a pitch-synchronized drive sound source vector of the present invention.

【図6】この発明の実施例9を示す構成図である。FIG. 6 is a configuration diagram showing an embodiment 9 of the present invention.

【図7】この発明の実施例10を示す構成図である。FIG. 7 is a configuration diagram showing an embodiment 10 of the present invention.

【図8】この発明の実施例13を示す構成図である。FIG. 8 is a configuration diagram showing an embodiment 13 of the present invention.

【図9】適応音源信号のパワーと駆動音源ベクトルに対
するゲインとの関係を示す説明図である。
FIG. 9 is an explanatory diagram showing the relationship between the power of the adaptive excitation signal and the gain with respect to the driving excitation vector.

【図10】従来の音声符号化復号化装置を示す構成図で
ある。
FIG. 10 is a configuration diagram showing a conventional speech encoding / decoding device.

【図11】適応音源ベクトルの例を示す説明図である。FIG. 11 is an explanatory diagram showing an example of an adaptive sound source vector.

【符号の説明】[Explanation of symbols]

1 符号化部 2 復号化部 3 伝送路 4 入力音声 5 出力音声 6 スペクトル分析手段 7 スペクトルパラメータ符号化手段 8 適応音源符号化手段 9、14 適応音源符号帳 10 駆動音源符号化手段 11、16 駆動音源符号帳 12、17 音源ベクトル生成手段 13 適応音源復号化手段 15 駆動音源復号化手段 18 スペクトルパラメータ復号化手段 19 合成フィルタ 20 複数ベクトル適応音源符号化手段 21、23 周期パルス音源生成手段 22 複数ベクトル適応音源復号化手段 24 適応音源符号化手段 25 ピッチ位置抽出手段 26 駆動音源符号化手段 27、28 ピッチ同期化手段 29 音源ベクトル生成手段 30 駆動音源符号化手段 31 適応音源符号化手段 32、33 ピッチ位置抽出手段 34、36 制御手段 35 駆動音源符号化手段 37 駆動音源復号化手段 1 Encoding Unit 2 Decoding Unit 3 Transmission Line 4 Input Speech 5 Output Speech 6 Spectrum Analysis Means 7 Spectrum Parameter Encoding Means 8 Adaptive Excitation Encoding Means 9, 14 Adaptive Excitation Codebook 10 Driving Excitation Encoding Means 11, 16 Driving Excitation codebook 12, 17 Excitation vector generation means 13 Adaptive excitation decoding means 15 Drive excitation decoding means 18 Spectral parameter decoding means 19 Synthesis filter 20 Multiple vector adaptive excitation coding means 21, 23 Periodic pulse excitation generation means 22 Multiple vectors Adaptive excitation decoding means 24 Adaptive excitation coding means 25 Pitch position extraction means 26 Drive excitation coding means 27, 28 Pitch synchronization means 29 Excitation vector generation means 30 Drive excitation coding means 31 Adaptive excitation coding means 32, 33 Pitch Position extraction means 34, 36 Control means 35 Drive sound Coding means 37 driving excitation decoding means

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 一定間隔に区切ったフレーム毎に、入力
音声をスペクトル包絡情報と音源信号情報に分けて符号
化する音声符号化装置において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する適応音源符号帳と、 上記適応音源符号帳内
の各適応音源ベクトルの主要成分として定まる周期パル
ス音源ベクトルを生成する周期パルス音源生成手段と、 上記適応音源ベクトルと上記適応音源ベクトルに対応す
る周期パルス音源ベクトルとの線形和を音源信号として
生成した復号音声と入力音声との歪みを最小にする適応
音源ベクトルとその適応音源ベクトルに対応する周期パ
ルス音源ベクトルと、上記適応音源ベクトルと上記周期
パルス音源ベクトルとに対するゲインを求め、上記適応
音源ベクトルと、上記適応音源ベクトルと上記周期パル
ス音源ベクトルとに対するゲインを符号化する複数ベク
トル適応音源符号化手段を備えた音声符号化装置。
1. A speech coder which divides an input speech into spectral envelope information and excitation signal information for each frame divided at regular intervals, and stores an adaptive excitation vector, which is information on the excitation signal of a preceding frame. Adaptive excitation codebook, a periodic pulse excitation generating means for generating a periodic pulse excitation vector determined as a main component of each adaptive excitation vector in the adaptive excitation codebook, the adaptive excitation vector and a period corresponding to the adaptive excitation vector An adaptive excitation vector that minimizes distortion between the decoded speech and the input speech generated by using a linear sum of the pulse excitation vector as the excitation signal, a periodic pulse excitation vector corresponding to the adaptive excitation vector, the adaptive excitation vector, and the periodic pulse The gain with respect to the sound source vector is obtained, and the adaptive sound source vector and the adaptive sound source vector A speech coding apparatus comprising a plurality of vector adaptive excitation coding means for coding a gain for the periodic pulse excitation vector.
【請求項2】 フレーム毎に符号化されたスペクトル包
絡情報と音源信号情報を各々復号化し、復号化された各
パラメータを用いて復号音声を生成する音声復号化装置
において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する適応音源符号帳と、 復号化された適応音源ベクトルの主要成分として定まる
周期パルス音源ベクトルを生成する周期パルス音源生成
手段と、 適応音源ベクトルと、上記適応音源ベクトルと上記適応
音源ベクトルに対応する周期パルス音源ベクトルとに対
するゲインを復号化し、上記適応音源ベクトルと上記周
期パルス音源ベクトルの各々に上記ゲインを与えて加算
する複数ベクトル適応音源復号化手段とを備えた音声復
号化装置。
2. A speech decoding apparatus which decodes spectrum envelope information and excitation signal information coded for each frame and generates decoded speech using each decoded parameter, wherein the excitation signal of the preceding frame is An adaptive excitation codebook that stores an adaptive excitation vector that is information, a periodic pulse excitation generation means that generates a periodic pulse excitation vector that is determined as a main component of the decoded adaptive excitation vector, an adaptive excitation vector, and the adaptive excitation vector And a multi-vector adaptive excitation decoding means for decoding gains for the periodic pulse excitation vector corresponding to the adaptive excitation vector and for adding the gains to the adaptive excitation vector and the periodic pulse excitation vector respectively. Speech decoding device.
【請求項3】 一定間隔に区切ったフレーム毎に、入力
音声をスペクトル包絡情報と音源信号情報に分けて符号
化する音声符号化装置において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する適応音源符号帳と、 上記適応音源ベクトルを音源信号として生成した復号音
声と入力音声との歪みを最小にする適応音源ベクトルと
その適応音源ベクトルに対するゲインを求め、上記適応
音源ベクトルと上記適応音源ベクトルに対するゲインを
符号化する適応音源符号化手段と、 予め用意された複数の音源信号を駆動音源ベクトルとし
て記憶している駆動音源符号帳と、 入力音声に対してピッチ周期間隔で並ぶ複数の特徴点を
ピッチ位置として抽出し、上記ピッチ位置を符号化する
ピッチ位置抽出手段と、 上記ピッチ位置に上記駆動音源符号帳の各駆動音源ベク
トルの所定の位置を合わせ、上記駆動音源ベクトルをピ
ッチ周期で繰り返したピッチ同期駆動音源ベクトルを生
成するピッチ同期化手段と、 上記適応音源ベクトルと上記ピッチ同期駆動音源ベクト
ルとの線形和を音源信号として生成した復号音声と入力
音声との歪みを最小にするピッチ同期駆動音源ベクトル
とそのピッチ同期駆動音源ベクトルに対するゲインを求
め、上記ピッチ同期駆動音源ベクトルに対応する駆動音
源ベクトルと上記ピッチ同期駆動音源ベクトルに対する
ゲインを符号化する駆動音源符号化手段とを備えた音声
符号化装置。
3. A speech coding apparatus for coding an input speech by dividing it into spectral envelope information and excitation signal information for each frame divided at regular intervals, and storing an adaptive excitation vector which is information of excitation signal of a preceding frame. Adaptive excitation codebook, an adaptive excitation vector that minimizes distortion between the decoded speech generated by using the adaptive excitation vector as the excitation signal and the input speech, and a gain for the adaptive excitation vector are obtained, and the adaptive excitation vector and the adaptive excitation vector Adaptive excitation coding means for coding a gain for a vector, a driving excitation codebook in which a plurality of prepared excitation signals are stored as driving excitation vectors, and a plurality of features arranged at pitch cycle intervals with respect to input speech A pitch position extracting means for extracting a point as a pitch position and encoding the pitch position; Pitch synchronization means for aligning a predetermined position of each driving excitation vector of the dynamic excitation codebook and generating a pitch synchronization driving excitation vector by repeating the driving excitation vector in a pitch cycle; the adaptive excitation vector and the pitch synchronization driving excitation. Pitch-synchronized driving sound source vector that minimizes distortion between the decoded speech generated by linearly summing the vector as a sound source signal and the input speech, and the gain for the pitch-synchronized driving sound source vector, and driving corresponding to the pitch-synchronized driving sound source vector A speech encoding apparatus comprising an excitation vector and a drive excitation encoding means for encoding a gain for the pitch-synchronized drive excitation vector.
【請求項4】 一定間隔に区切ったフレーム毎に、入力
音声をスペクトル包絡情報と音源信号情報に分けて符号
化する音声符号化装置において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する適応音源符号帳と、 上記適応音源ベクトルを音源信号して生成した復号音声
と入力音声との歪みを最小にする適応音源ベクトルとそ
の適応音源ベクトルに対するゲインを求め、上記適応音
源ベクトルと上記適応音源ベクトルに対するゲインを符
号化する適応音源符号化手段と、 予め用意された複数の音源信号を駆動音源ベクトルとし
て記憶している駆動音源符号帳と、 ピッチ周期間隔で並ぶ複数の点をピッチ位置として、上
記ピッチ位置に上記駆動音源符号帳の各駆動音源ベクト
ルの所定の位置を合わせ、上記駆動音源ベクトルをピッ
チ周期で繰り返してピッチ同期駆動音源ベクトルを生成
するピッチ同期化手段と、 上記適応音源ベクトルと上記ピッチ同期駆動音源ベクト
ルとの線形和を音源信号として生成した復号音声と入力
音声との歪みを最小にするピッチ同期駆動音源ベクトル
とそのピッチ同期駆動音源ベクトルに対するゲインを求
め、上記ピッチ同期駆動音源ベクトルに対応する駆動音
源ベクトルとピッチ位置と上記ピッチ同期駆動音源ベク
トルに対するゲインを符号化する駆動音源符号化手段と
を備えた音声符号化装置。
4. A speech coding apparatus for coding an input speech by dividing it into spectral envelope information and excitation signal information for each frame divided at regular intervals, and storing an adaptive excitation vector which is information of excitation signal of a preceding frame. Adaptive excitation codebook, an adaptive excitation vector that minimizes distortion between the decoded speech generated by excitation signal of the adaptive excitation vector and the input speech, and a gain for the adaptive excitation vector are obtained, and the adaptive excitation vector and the adaptive An adaptive excitation coding means for encoding a gain for an excitation vector, a driving excitation codebook that stores a plurality of prepared excitation signals as driving excitation vectors, and a plurality of points arranged at pitch cycle intervals as pitch positions. , Aligning a predetermined position of each driving excitation vector of the driving excitation codebook with the pitch position, Pitch synchronization means for repeatedly generating a pitch-synchronized driving sound source vector in a pitch cycle, and distortion of a decoded speech and an input speech generated by using a linear sum of the adaptive sound source vector and the pitch-synchronized driving sound source vector as a sound source signal is minimized. A drive excitation code for obtaining a pitch-synchronized drive excitation vector and a gain for the pitch-synchronized drive excitation vector, and encoding a drive excitation vector corresponding to the pitch-synchronized drive excitation vector, a pitch position, and a gain for the pitch-synchronized drive excitation vector. A speech coding apparatus having a coding means.
【請求項5】 フレーム毎に符号化されたスペクトル包
絡情報と音源信号情報を各々復号化し、復号化された各
パラメータを用いて復号音声を生成する音声復号化装置
において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する適応音源符号帳と、 適応音源ベクトルとその適応音源ベクトルに対するゲイ
ンを復号化する適応音源復号化手段と、 予め用意された複数の音源信号を駆動音源ベクトルとし
て記憶している駆動音源符号帳と、 ピッチ位置を復号化し、上記ピッチ位置に復号化された
駆動音源ベクトルの所定の位置を合わせ、上記駆動音源
ベクトルをピッチ周期で繰り返してピッチ同期駆動音源
ベクトルを生成するピッチ同期化手段と、 駆動音源ベクトルと、上記ピッチ同期駆動音源ベクトル
に対するゲインを復号化する駆動音源復号化手段と、 上記適応音源ベクトルと上記適応音源ベクトルに対する
ゲインと、上記ピッチ同期駆動音源ベクトルと上記ピッ
チ同期駆動音源ベクトルに対するゲインとから音源ベク
トルを復号化する音源ベクトル生成手段とを備えた音声
復号化装置。
5. A speech decoding apparatus for decoding spectral envelope information and excitation signal information encoded for each frame and generating decoded speech using each of the decoded parameters, wherein the excitation signal of the preceding frame is An adaptive excitation codebook that stores an adaptive excitation vector that is information, an adaptive excitation decoding unit that decodes an adaptive excitation vector and a gain for the adaptive excitation vector, and a plurality of prepared excitation signals that are stored as driving excitation vectors The driving excitation codebook that is operating, the pitch position is decoded, the predetermined position of the decoded driving excitation vector is aligned with the above pitch position, and the above driving excitation vector is repeated in a pitch cycle to generate a pitch synchronization driving excitation vector. Pitch synchronization means, driving source vector, and gain for the pitch-synchronized driving source vector Driving excitation decoding means for performing the above, and the excitation vector generating means for decoding the excitation vector from the adaptive excitation vector and the gain for the adaptive excitation vector, and the gains for the pitch-synchronized excitation vector and the pitch-synchronized excitation vector. A provided voice decoding device.
【請求項6】 一定間隔に区切ったフレーム毎に、入力
音声をスペクトル包絡情報と音源信号情報に分けて符号
化する音声符号化装置において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する適応音源符号帳と、 上記適応音源符号帳内の各適応音源ベクトルにおいてピ
ッチ周期間隔で並ぶ複数の特徴点をピッチ位置として抽
出するピッチ位置抽出手段と、 上記適応音源ベクトルを音源信号として生成した復号音
声と入力音声との歪みを最小にする適応音源ベクトルと
その適応音源ベクトルに対するゲインを求め、上記適応
音源ベクトルと上記適応音源ベクトルに対するゲインを
符号化する適応音源符号化手段と、 予め用意された複数の音源信号を駆動音源ベクトルとし
て記憶している駆動音源符号帳と、 上記ピッチ位置抽出手段で得られたピッチ位置に、上記
駆動音源符号帳の各駆動音源ベクトルの所定の位置を合
わせ、上記駆動音源ベクトルをピッチ周期で繰り返した
ピッチ同期駆動音源ベクトルを生成するピッチ同期化手
段と、 上記適応音源ベクトルと上記ピッチ同期駆動音源ベクト
ルとの線形和を音源信号として生成した復号音声と入力
音声との歪みを最小にするピッチ同期駆動音源ベクトル
とそのピッチ同期駆動音源ベクトルに対するゲインを求
め、上記ピッチ同期駆動音源ベクトルに対応する駆動音
源ベクトルと上記ピッチ同期駆動音源ベクトルに対する
ゲインを符号化する駆動音源符号化手段とを備えた音声
符号化装置。
6. A speech coding apparatus for coding an input speech by dividing it into spectral envelope information and excitation signal information for each frame divided at regular intervals, and storing an adaptive excitation vector which is information of an excitation signal of a preceding frame. Adaptive excitation codebook, pitch position extracting means for extracting a plurality of feature points arranged at pitch cycle intervals in each adaptive excitation vector in the adaptive excitation codebook as pitch positions, and the adaptive excitation vector as the excitation signal. An adaptive excitation vector that obtains an adaptive excitation vector that minimizes distortion between the decoded speech and the input speech, a gain for the adaptive excitation vector, and an adaptive excitation vector that encodes the adaptive excitation vector and the gain for the adaptive excitation vector, and is prepared in advance. Driving excitation codebook storing a plurality of excitation signals as driving excitation vectors, and the pitch position Pitch synchronization means for aligning a predetermined position of each driving excitation vector of the driving excitation codebook with the pitch position obtained by the outputting means, and generating a pitch synchronization driving excitation vector by repeating the driving excitation vector in a pitch cycle. , A pitch-synchronous excitation vector that minimizes distortion between the decoded speech generated by using a linear sum of the adaptive excitation vector and the pitch-synchronized excitation vector as the excitation signal and the input speech, and a gain for the pitch-synchronous excitation vector A speech coding apparatus comprising: a driving excitation vector corresponding to the pitch-synchronized driving excitation vector; and driving excitation coding means for coding a gain for the pitch-synchronized driving excitation vector.
【請求項7】 フレーム毎に符号化されたスペクトル包
絡情報と音源信号情報を各々復号化し、復号化された各
パラメータを用いて復号音声を生成する音声復号化装置
において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する適応音源符号帳と、 適応音源ベクトルとその適応音源ベクトルに対するゲイ
ンを復号化する適応音源復号化手段と、 復号化された適応音源ベクトルにおいてピッチ周期間隔
で並ぶ複数の特徴点をピッチ位置として抽出するピッチ
位置抽出手段と、 予め用意された複数の音源信号を駆動音源ベクトルとし
て記憶している駆動音源符号帳と、 上記ピッチ位置抽出手段で得られたピッチ位置に、復号
化された駆動音源ベクトルの所定の位置を合わせ、上記
駆動音源ベクトルをピッチ周期で繰り返したピッチ同期
駆動音源ベクトルを生成するピッチ同期化手段と、 駆動音源ベクトルと、上記ピッチ同期駆動音源ベクトル
に対するゲインを復号化する駆動音源復号化手段と、 上記適応音源ベクトルと上記適応音源ベクトルに対する
ゲインと、上記ピッチ同期駆動音源ベクトルと上記ピッ
チ同期駆動音源ベクトルに対するゲインとから音源ベク
トルを復号化する音源ベクトル生成手段とを備えた音声
復号化装置。
7. A speech decoding apparatus which decodes spectrum envelope information and excitation signal information encoded for each frame and generates decoded speech using each decoded parameter, in a speech signal of a preceding frame. An adaptive excitation codebook that stores an adaptive excitation vector that is information; an adaptive excitation decoding means that decodes an adaptive excitation vector and a gain for the adaptive excitation vector; and a plurality of decoded adaptive excitation vectors arranged at pitch cycle intervals. Pitch position extracting means for extracting the feature points of as a pitch position, a driving excitation codebook that stores a plurality of prepared excitation signals as driving excitation vectors, and a pitch position obtained by the pitch position extracting means. , A predetermined position of the decoded driving sound source vector is aligned, and the driving sound source vector is repeated in a pitch cycle. Pitch synchronization means for generating a synchronous drive excitation vector, a drive excitation vector, a drive excitation decoding means for decoding a gain for the pitch synchronization drive excitation vector, the adaptive excitation vector and a gain for the adaptive excitation vector A speech decoding apparatus comprising an excitation vector generation means for decoding an excitation vector from the pitch synchronization driven excitation vector and a gain for the pitch synchronization driven excitation vector.
【請求項8】 一定間隔に区切ったフレーム毎に、入力
音声をスペクトル包絡情報と音源信号情報に分けて伝送
する音声符号化復号化方法において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する第1の適応音源符号帳を送信側に持ち、また
対応する第2の適応音源符号帳を受信側に持ち、 予め用意された複数の音源信号を駆動音源ベクトルとし
て記憶している第1の駆動音源符号帳を送信側に持ち、
また対応する第2の駆動音源符号帳を受信側に持ち、 送信側では、入力音声に対して、上記第1の適応音源符
号帳の中から最適な適応音源ベクトルを選択し、またそ
のゲインを定め、入力音声または上記適応音源ベクトル
より複数のピッチ位置を抽出し、上記ピッチ位置に上記
駆動音源符号帳の駆動音源ベクトルの所定の位置を合わ
せて周期化したピッチ同期駆動音源ベクトルを作成して
最適なピッチ同期駆動音源ベクトルを選択し、またその
ゲインを定め、上記適応音源ベクトルと上記ピッチ同期
駆動音源ベクトルと、上記適応音源ベクトルと上記ピッ
チ同期駆動音源ベクトルとに対するゲインを符号化して
送信し、 受信側では、受信符号により、上記第2の適応音源符号
帳から適応音源ベクトルを生成し、また上記適応音源ベ
クトルのゲインを復号し、受信符号または上記適応音源
ベクトルより複数のピッチ位置を抽出し、上記第2の駆
動音源符号帳から駆動音源ベクトルを生成し、上記ピッ
チ位置に上記駆動音源ベクトルの所定の位置を合わせて
周期化したピッチ同期駆動音源ベクトルを作成し、また
上記ピッチ同期駆動音源ベクトルのゲインを復号し、上
記適応音源ベクトルと上記ピッチ同期駆動音源ベクトル
とそれぞれのゲインとから音源ベクトルを復号する音声
符号化復号化方法。
8. A speech coding / decoding method for transmitting input speech by dividing the speech into spectral envelope information and excitation signal information for each frame divided at regular intervals, wherein an adaptive excitation vector which is information of the excitation signal of the preceding frame is set. A first adaptive excitation codebook to be stored is provided on the transmitting side, a corresponding second adaptive excitation codebook is provided on the receiving side, and a plurality of prepared excitation signals are stored as drive excitation vectors. Has the drive excitation codebook of
Further, the corresponding second driving excitation codebook is provided on the receiving side, and the transmitting side selects the optimum adaptive excitation vector from the first adaptive excitation codebook for the input voice and sets its gain. A plurality of pitch positions are extracted from the input speech or the adaptive excitation vector, and a pitch-synchronized drive excitation vector is created by synchronizing the pitch positions with predetermined positions of the drive excitation vector of the drive excitation codebook. An optimum pitch-synchronized driving sound source vector is selected and its gain is determined, and the adaptive sound source vector, the pitch synchronous driving sound source vector, the gains for the adaptive sound source vector and the pitch synchronous driving sound source vector are encoded and transmitted. , The receiving side generates an adaptive excitation vector from the second adaptive excitation codebook by the received code, and Decoding a plurality of pitch positions from the received code or the adaptive excitation vector, generating a driving excitation vector from the second driving excitation codebook, and setting a predetermined position of the driving excitation vector at the pitch position. A voice that creates a pitch-synchronized driving sound source vector that is also cycled, decodes the gain of the pitch-synchronized driving sound source vector, and decodes the sound source vector from the adaptive sound source vector, the pitch-synchronous driving sound source vector, and respective gains Encoding and decoding method.
【請求項9】 一定間隔に区切ったフレーム毎に、入力
音声をスペクトル包絡情報と音源信号情報に分けて符号
化する音声符号化装置において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する適応音源符号帳と、 上記適応音源ベクトルを音源信号として生成した復号音
声と入力音声との歪みを最小にする適応音源ベクトルと
その適応音源ベクトルに対するゲインを求め、上記適応
音源ベクトルと上記適応音源ベクトルに対するゲインを
符号化する適応音源符号化手段と、 予め用意された複数の音源信号を駆動音源ベクトルとし
て記憶している駆動音源符号帳と、 上記適応音源ベクトルとそのゲインより求められる適応
音源信号のパワー情報により駆動音源ベクトルに対して
用いるゲイン量子化テーブルを予め用意された複数のゲ
イン量子化テーブルの中から選択して指定する制御手段
と、 上記適応音源ベクトルと上記駆動音源ベクトルとの線形
和を音源信号として生成した復号音声と入力音声との歪
みを最小にする駆動音源ベクトルとその駆動音源ベクト
ルに対するゲインを求め、上記指定されたゲイン量子化
テーブルを用いて、上記駆動音源ベクトルと上記駆動音
源ベクトルに対するゲインを符号化する駆動音源符号化
手段とを備えた音声符号化装置。
9. A speech coding apparatus for coding an input speech by dividing it into spectral envelope information and excitation signal information for each frame divided at regular intervals, and storing an adaptive excitation vector which is information of an excitation signal of a preceding frame. Adaptive excitation codebook, an adaptive excitation vector that minimizes distortion between the decoded speech generated by using the adaptive excitation vector as the excitation signal and the input speech, and a gain for the adaptive excitation vector are obtained, and the adaptive excitation vector and the adaptive excitation vector Adaptive excitation coding means for encoding a gain for a vector, a driving excitation codebook in which a plurality of prepared excitation signals are stored as driving excitation vectors, and an adaptive excitation signal obtained from the adaptive excitation vector and its gain The gain quantization table used for the driving sound source vector is prepared in advance according to the power information of Control means for selecting and designating from among a number of gain quantization tables, and driving for minimizing distortion between the decoded speech and the input speech generated by using the linear sum of the adaptive excitation vector and the driving excitation vector as the excitation signal. A speech code including a drive source vector and a drive source encoding unit that encodes a gain for the drive source vector by obtaining a gain for the drive source vector and using the specified gain quantization table. Device.
【請求項10】 フレーム毎に符号化されたスペクトル
包絡情報と音源信号情報を各々復号化し、復号化された
各パラメータを用いて復号音声を生成する音声復号化装
置において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する適応音源符号帳と、 適応音源ベクトルとその適応音源ベクトルに対するゲイ
ンを復号化する適応音源復号化手段と、 予め用意された複数の音源信号を駆動音源ベクトルとし
て記憶している駆動音源符号帳と、 上記適応音源ベクトルと上記適応音源ベクトルに対する
ゲインより求められる適応音源信号のパワー情報により
駆動音源ベクトルに対して用いるゲイン量子化テーブル
を予め用意された複数のゲイン量子化テーブルの中から
選択して指定する制御手段と、 上記指定されたゲイン量子化テーブルを用いて、駆動音
源ベクトルとその駆動音源ベクトルに対するゲインを復
号化する駆動音源復号化手段とを備えた音声復号化装
置。
10. A speech decoding apparatus for decoding spectral envelope information and excitation signal information encoded for each frame and generating decoded speech using each of the decoded parameters, wherein the excitation signal of the preceding frame is An adaptive excitation codebook that stores an adaptive excitation vector that is information, an adaptive excitation decoding unit that decodes an adaptive excitation vector and a gain for the adaptive excitation vector, and a plurality of prepared excitation signals that are stored as driving excitation vectors Driving excitation codebook, and the gain quantization table used for the driving excitation vector based on the adaptive excitation vector and the power information of the adaptive excitation signal obtained from the gain for the adaptive excitation vector. Of the specified gain quantization table Using Bull, speech decoding apparatus and a driving excitation decoding means for decoding the gain excitation vector and to its driving excitation vector.
【請求項11】 一定間隔に区切ったフレーム毎に、入
力音声をスペクトル包絡情報と音源信号情報に分けて伝
送する音声符号化復号化方法において、 先行フレームの音源信号の情報である適応音源ベクトル
を記憶する第1の適応音源符号帳を送信側に持ち、また
対応する第2の適応音源符号帳を受信側に持ち、 予め用意された複数の音源信号を駆動音源ベクトルとし
て記憶している第1の駆動音源符号帳を送信側に持ち、
また対応する第2の駆動音源符号帳を受信側に持ち、 送信側では、入力音声に対して、上記第1の適応音源符
号帳の中から最適な適応音源ベクトルを選択し、またそ
のゲインを定め、上記適応音源ベクトルとそのゲインよ
り求められる適応音源信号のパワー情報により駆動音源
ベクトルのゲイン量子化テーブルを変更し、上記第1の
駆動音源符号帳の中から最適な駆動音源ベクトルを選択
し、またそのゲインを定め、上記適応音源ベクトルと上
記駆動音源ベクトルと、上記適応音源ベクトルと上記駆
動音源ベクトルとに対するゲインを符号化して送信し、 受信側では、受信符号により、上記第2の適応音源符号
帳から適応音源ベクトルを生成し、また上記適応音源ベ
クトルのゲインを復号し、上記適応音源ベクトルとその
ゲインより求められる適応音源信号のパワー情報より駆
動音源ベクトルのゲイン量子化テーブルを変更し、上記
第2の駆動音源ベクトル符号帳から駆動音源ベクトルを
生成し、また上記駆動音源ベクトルのゲインを復号し、
上記適応音源ベクトルと、駆動音源ベクトルとそれぞれ
のゲインとから音源ベクトルを復号する音声符号化復号
化方法。
11. A speech coding / decoding method for transmitting input speech by dividing the speech into spectral envelope information and excitation signal information for each frame divided at regular intervals, wherein an adaptive excitation vector which is information of the excitation signal of a preceding frame is set. A first adaptive excitation codebook to be stored is provided on the transmitting side, a corresponding second adaptive excitation codebook is provided on the receiving side, and a plurality of prepared excitation signals are stored as drive excitation vectors. Has the drive excitation codebook of
The corresponding second driving excitation codebook is provided on the receiving side, and the transmitting side selects the optimum adaptive excitation vector from the first adaptive excitation codebook with respect to the input voice, and sets its gain. The quantization table of the driving excitation vector is changed according to the power information of the adaptive excitation signal obtained from the adaptive excitation vector and its gain, and the optimum driving excitation vector is selected from the first driving excitation codebook. , The gain is determined, the gains for the adaptive excitation vector, the driving excitation vector, and the adaptive excitation vector and the driving excitation vector are encoded and transmitted, and on the receiving side, the second adaptation is performed by a reception code. Generate an adaptive excitation vector from the excitation codebook, decode the gain of the adaptive excitation vector, and obtain from the adaptive excitation vector and its gain. That adaptive power information from the change the gain quantization table excitation vector of the sound source signals, said second generating an excitation vector from the driving excitation vector codebook and decodes the gain of the excitation vector,
A speech coding / decoding method for decoding a sound source vector from the adaptive sound source vector, a driving sound source vector, and respective gains.
JP5240135A 1992-09-29 1993-09-27 Audio encoding device and audio decoding device Expired - Lifetime JP3024455B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5240135A JP3024455B2 (en) 1992-09-29 1993-09-27 Audio encoding device and audio decoding device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4-259601 1992-09-29
JP25960192 1992-09-29
JP5240135A JP3024455B2 (en) 1992-09-29 1993-09-27 Audio encoding device and audio decoding device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP11343251A Division JP3041325B1 (en) 1992-09-29 1999-12-02 Audio encoding device and audio decoding device

Publications (2)

Publication Number Publication Date
JPH06202699A true JPH06202699A (en) 1994-07-22
JP3024455B2 JP3024455B2 (en) 2000-03-21

Family

ID=26534595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5240135A Expired - Lifetime JP3024455B2 (en) 1992-09-29 1993-09-27 Audio encoding device and audio decoding device

Country Status (1)

Country Link
JP (1) JP3024455B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999021174A1 (en) * 1997-10-22 1999-04-29 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
CN100367347C (en) * 1997-02-13 2008-02-06 松下电器产业株式会社 Sound encoder and sound decoder
WO2008108078A1 (en) * 2007-03-02 2008-09-12 Panasonic Corporation Encoding device and encoding method
JP2009518659A (en) * 2005-09-27 2009-05-07 エルジー エレクトロニクス インコーポレイティド Multi-channel audio signal encoding / decoding method and apparatus
JP5269195B2 (en) * 2009-05-29 2013-08-21 日本電信電話株式会社 Encoding device, decoding device, encoding method, decoding method, and program thereof

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100367347C (en) * 1997-02-13 2008-02-06 松下电器产业株式会社 Sound encoder and sound decoder
US7925501B2 (en) 1997-10-22 2011-04-12 Panasonic Corporation Speech coder using an orthogonal search and an orthogonal search method
US7499854B2 (en) 1997-10-22 2009-03-03 Panasonic Corporation Speech coder and speech decoder
CN100349208C (en) * 1997-10-22 2007-11-14 松下电器产业株式会社 Speech coder and speech decoder
US6415254B1 (en) 1997-10-22 2002-07-02 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
US7533016B2 (en) 1997-10-22 2009-05-12 Panasonic Corporation Speech coder and speech decoder
US8352253B2 (en) 1997-10-22 2013-01-08 Panasonic Corporation Speech coder and speech decoder
US7024356B2 (en) 1997-10-22 2006-04-04 Matsushita Electric Industrial Co., Ltd. Speech coder and speech decoder
US8332214B2 (en) 1997-10-22 2012-12-11 Panasonic Corporation Speech coder and speech decoder
US7373295B2 (en) 1997-10-22 2008-05-13 Matsushita Electric Industrial Co., Ltd. Speech coder and speech decoder
US7546239B2 (en) 1997-10-22 2009-06-09 Panasonic Corporation Speech coder and speech decoder
US7590527B2 (en) 1997-10-22 2009-09-15 Panasonic Corporation Speech coder using an orthogonal search and an orthogonal search method
WO1999021174A1 (en) * 1997-10-22 1999-04-29 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
JP2009518659A (en) * 2005-09-27 2009-05-07 エルジー エレクトロニクス インコーポレイティド Multi-channel audio signal encoding / decoding method and apparatus
US8306813B2 (en) 2007-03-02 2012-11-06 Panasonic Corporation Encoding device and encoding method
WO2008108078A1 (en) * 2007-03-02 2008-09-12 Panasonic Corporation Encoding device and encoding method
JP5269195B2 (en) * 2009-05-29 2013-08-21 日本電信電話株式会社 Encoding device, decoding device, encoding method, decoding method, and program thereof

Also Published As

Publication number Publication date
JP3024455B2 (en) 2000-03-21

Similar Documents

Publication Publication Date Title
KR0169020B1 (en) Speech encoding apparatus, speech decoding apparatus, speech coding and decoding method and a phase amplitude characteristic extracting apparatus for carrying out the method
JP3134817B2 (en) Audio encoding / decoding device
US8447593B2 (en) Method for speech coding, method for speech decoding and their apparatuses
KR100304682B1 (en) Fast Excitation Coding for Speech Coders
US7792679B2 (en) Optimized multiple coding method
KR100350340B1 (en) Voice encoder, voice decoder, voice encoder/decoder, voice encoding method, voice decoding method and voice encoding/decoding method
US7130796B2 (en) Voice encoding method and apparatus of selecting an excitation mode from a plurality of excitation modes and encoding an input speech using the excitation mode selected
US5091946A (en) Communication system capable of improving a speech quality by effectively calculating excitation multipulses
US6768978B2 (en) Speech coding/decoding method and apparatus
JPH10282997A (en) Speech encoding device and decoding device
JP3024455B2 (en) Audio encoding device and audio decoding device
JP2001075600A (en) Voice encoding device and voice decoding device
US6842732B2 (en) Speech encoding and decoding method and electronic apparatus for synthesizing speech signals using excitation signals
JP2538450B2 (en) Speech excitation signal encoding / decoding method
JP4578145B2 (en) Speech coding apparatus, speech decoding apparatus, and methods thereof
JPH0258100A (en) Voice encoding and decoding method, voice encoder, and voice decoder
JP3041325B1 (en) Audio encoding device and audio decoding device
JPH08234795A (en) Voice encoding device
JP3410931B2 (en) Audio encoding method and apparatus
JP3232728B2 (en) Audio coding method
JP3128226B2 (en) Audio coding method
WO2000003385A1 (en) Voice encoding/decoding device
JPH06266399A (en) Encoding device and speech encoding and decoding device
JP3099844B2 (en) Audio encoding / decoding system
JP2508002B2 (en) Speech coding method and apparatus thereof

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080121

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090121

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100121

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100121

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110121

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120121

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130121

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130121

Year of fee payment: 13

EXPY Cancellation because of completion of term