JP3024455B2 - Audio encoding device and audio decoding device - Google Patents

Audio encoding device and audio decoding device

Info

Publication number
JP3024455B2
JP3024455B2 JP5240135A JP24013593A JP3024455B2 JP 3024455 B2 JP3024455 B2 JP 3024455B2 JP 5240135 A JP5240135 A JP 5240135A JP 24013593 A JP24013593 A JP 24013593A JP 3024455 B2 JP3024455 B2 JP 3024455B2
Authority
JP
Japan
Prior art keywords
vector
excitation
pitch
adaptive
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5240135A
Other languages
Japanese (ja)
Other versions
JPH06202699A (en
Inventor
正 山浦
真哉 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP5240135A priority Critical patent/JP3024455B2/en
Publication of JPH06202699A publication Critical patent/JPH06202699A/en
Application granted granted Critical
Publication of JP3024455B2 publication Critical patent/JP3024455B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は、音声をディジタル伝
送あるいは蓄積する場合などに用いられるもので、音声
の音源信号情報をベクトル量子化する音声符号化・復号
化装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech encoding / decoding apparatus used for digitally transmitting or storing speech, and for performing vector quantization of speech source signal information.

【0002】[0002]

【従来の技術】音声をスペクトル包絡情報と音源信号情
報に分離し、音源信号情報をベクトル量子化する従来の
音声符号化・復号化装置として、図8に示すものがあ
る。図8は、W.B.Kleijn, D.J.Krasinski, and R.H.Ket
chum 著”Improved Speech Quality and Efficient Vec
tor Quantization in SELP”(ICASSP'88, pp.155-158,
1988)に示されたのと同様なものである。図におい
て、1は符号化部、2は復号化部、3は伝送路であり、
4は入力音声、5は出力音声である。6はスペクトル分
析手段、7はスペクトルパラメータ符号化手段であり、
8は適応音源符号化手段、9、14は適応音源符号帳で
ある。10は駆動音源符号化手段、11、16は駆動音
源符号帳である。12、17は音源ベクトル生成手段、
13は適応音源復号化手段、15は駆動音源復号化手段
であり、18はスペクトルパラメータ復号化手段、19
は合成フィルタである。
2. Description of the Related Art FIG. 8 shows a conventional speech encoding / decoding apparatus for separating speech into spectrum envelope information and excitation signal information and vector-quantizing the excitation signal information. Figure 8 shows WBKleijn, DJKrasinski, and RHKet
by chum, “Improved Speech Quality and Efficient Vec
tor Quantization in SELP ”(ICASSP'88, pp.155-158,
1988). In the figure, 1 is an encoding unit, 2 is a decoding unit, 3 is a transmission path,
4 is an input voice and 5 is an output voice. 6 is a spectrum analysis means, 7 is a spectrum parameter coding means,
8 is an adaptive excitation coding means, and 9 and 14 are adaptive excitation codebooks. Reference numeral 10 denotes a driving excitation coding unit, and reference numerals 11 and 16 denote driving excitation codebooks. 12, 17 are sound source vector generating means;
13 is an adaptive excitation decoding means, 15 is a driving excitation decoding means, 18 is a spectrum parameter decoding means, 19
Is a synthesis filter.

【0003】以下、従来の音声符号化・復号化装置の動
作について説明する。まず、符号化部1の動作について
説明する。スペクトル分析手段6は、入力音声4を分析
して、スペクトルパラメータを抽出する。スペクトルパ
ラメータ符号化手段7は前記スペクトルパラメータを量
子化し、それに対応する符号を復号化部2に伝送路3を
介して出力するとともに、量子化したスペクトルパラメ
ータを適応音源符号化手段8及び駆動音源符号化手段1
0に出力する。適応音源符号帳9には先行フレームにお
いて求めた音源信号が記憶されており、ピッチ情報を符
号として、現フレームにおいて前記音源信号をピッチ周
期で繰り返して得られる適応音源ベクトルを出力する。
図9に先行フレームにおける音源信号とそのとき得られ
る適応音源ベクトルの例を示す。適応音源ベクトルは、
ピッチ周期がフレーム長よりも短いときには、図9
(b)に示すように現フレーム内で音源信号をピッチ周
期で繰り返したものとなる。
[0003] The operation of the conventional speech encoding / decoding device will be described below. First, the operation of the encoding unit 1 will be described. The spectrum analysis means 6 analyzes the input speech 4 and extracts spectrum parameters. The spectrum parameter encoding means 7 quantizes the spectrum parameters, outputs a code corresponding to the quantized spectrum parameters to the decoding unit 2 via the transmission path 3, and outputs the quantized spectrum parameters to the adaptive excitation encoding means 8 and the driving excitation code. Means 1
Output to 0. The adaptive excitation codebook 9 stores the excitation signal obtained in the preceding frame, and outputs an adaptive excitation vector obtained by repeating the excitation signal in the current frame at a pitch cycle using the pitch information as a code.
FIG. 9 shows an example of the excitation signal in the preceding frame and the adaptive excitation vector obtained at that time. The adaptive sound source vector is
When the pitch period is shorter than the frame length, FIG.
As shown in (b), the sound source signal is repeated at a pitch cycle in the current frame.

【0004】適応音源符号化手段8は、前記適応音源符
号帳9より入力されるM個の適応音源ベクトルai(i
=1,... ,M)と、前記スペクトルパラメータ符号化
手段7より入力されたスペクトルパラメータを用いて、
M個の合成音声ベクトルAi(i=1,... ,M)を合
成する。そして、入力音声4からフレーム毎に切り出し
た入力音声ベクトルXとのベクトル間距離Diを、例え
ば式(1)に従って求める。ここで、ゲインβiは距離
iが最小になるように、例えば式(2)に従って決定
する。(なお、tは転置をしめす)
[0004] Adaptive excitation coding means 8 includes M adaptive excitation vectors a i (i
= 1,..., M) and the spectrum parameters inputted from the spectrum parameter encoding means 7,
The M synthesized speech vectors A i (i = 1,..., M) are synthesized. Then, the inter-vector distance D i between the input speech vector X cut out for each frame from the input speech 4, for example, determined according to equation (1). Here, the gain β i is determined according to, for example, equation (2) so that the distance D i is minimized. (Note that t indicates transposition.)

【0005】[0005]

【数1】 (Equation 1)

【0006】次に、このベクトル間距離が最小となるベ
クトルAIを探索し、その符号I及びゲインβIを量子化
したゲインβqIの符号を伝送路3を介して復号化部2に
出力し、また、選択された適応音源ベクトルaI及びそ
のゲインβqIを音源ベクトル生成手段12に出力すると
ともに、誤差ベクトルX’ X’=X−βqII を駆動音源符号化手段10に出力する。
Next, the vector A I in which the distance between the vectors is minimized is searched, and the code I and the code of the gain β qI obtained by quantizing the gain β I are output to the decoding unit 2 via the transmission line 3. Also, the selected adaptive excitation vector a I and its gain β qI are output to the excitation vector generation means 12, and the error vector X ′ X ′ = X−β qI A I is output to the driving excitation coding means 10. I do.

【0007】駆動音源符号帳11には、例えばランダム
雑音から生成したN個の駆動音源ベクトルが記憶されて
いる。駆動音源符号化手段10は、前記駆動音源符号帳
11より入力される駆動音源ベクトルcj(j=1,...
,N)と、前記スペクトルパラメータ符号化手段より
入力されたスペクトルパラメータを用いて、N個の合成
音声ベクトルCj(j=1,... ,N)を合成する。そ
して、前記適応音源符号化手段8より入力された誤差ベ
クトルX’とのベクトル間距離Djを、例えば式(3)
に従って求める。ここで、ゲインγjは距離Djが最小に
なるように、例えば式(4)に従って決定する。
[0007] The driving excitation codebook 11 stores, for example, N driving excitation vectors generated from random noise. The driving excitation coding means 10 generates a driving excitation vector c j (j = 1,...) Inputted from the driving excitation codebook 11.
, N) and the spectrum parameters input from the spectrum parameter encoding means, and synthesizes N synthesized speech vectors C j (j = 1,..., N). Then, the inter-vector distance D j with respect to the error vector X ′ input from the adaptive excitation coding means 8 is calculated by, for example, the equation (3).
Ask according to. Here, the gain γ j is determined according to, for example, equation (4) so that the distance D j is minimized.

【0008】[0008]

【数2】 (Equation 2)

【0009】次にこのベクトル間距離が最小となるベク
トルCJを探索し、その符号J及びゲインγJを量子化し
たゲインγqJの符号を伝送路3を介して復号化部2に出
力するとともに、選択された駆動音源ベクトルcJ及び
そのゲインγqJを音源ベクトル生成手段12に出力す
る。
Next, a search is made for a vector C J that minimizes the inter-vector distance, and the code of the code J and the gain γ qJ obtained by quantizing the gain γ J are output to the decoding unit 2 via the transmission path 3. At the same time, the selected drive excitation vector c J and its gain γ qJ are output to the excitation vector generation means 12.

【0010】音源ベクトル生成手段12は、前記適応音
源符号化手段8より入力された適応音源ベクトルaI
びそのゲインβqIと、前記駆動音源符号化手段10より
入力された駆動音源ベクトルcJ及びそのゲインγqJ
り音源ベクトル βqII+γqJJ を生成し、これを適応音源符号帳9に出力する。
Excitation vector generation means 12 generates adaptive excitation vector a I and gain β qI inputted from adaptive excitation coding means 8 and driving excitation vector c J and driving excitation vector c J inputted from driving excitation encoding means 10. its gain gamma generate excitation vector β qI a I + γ qJ c J than QJ, and outputs it to the adaptive excitation codebook 9.

【0011】次に、復号化部2の動作について説明す
る。適応音源復号化手段13は、符号化部1から入力さ
れた適応音源ベクトルの符号Iに基づき、前記適応音源
符号帳9と同一の適応音源ベクトルを記憶する適応音源
符号帳14から適応音源ベクトルaI を読みだし、ま
た、符号化部1から入力された適応音源ベクトルに対す
るゲインの符号よりゲインβqIを復号化し、前記適応音
源ベクトルaIとそのゲインβqIを音源ベクトル生成手
段17に出力する。また、駆動音源復号化手段15は、
符号化部1から入力された駆動音源ベクトルの符号Jに
基づき、前記駆動音源符号帳11と同一の駆動音源ベク
トルを記憶する駆動音源符号帳16から駆動音源ベクト
ルCJを読みだし、また、符号化部1から入力された駆
動音源ベクトルに対するゲインの符号よりゲインγqJ
復号し、前記駆動音源ベクトルcJとそのゲインγqJ
音源ベクトル生成手段17に出力する。
Next, the operation of the decoding unit 2 will be described. The adaptive excitation decoding means 13 receives an adaptive excitation vector a from the adaptive excitation codebook 14 storing the same adaptive excitation vector as the adaptive excitation codebook 9 based on the code I of the adaptive excitation vector input from the encoding unit 1. I is read out, and the gain β qI is decoded from the sign of the gain for the adaptive excitation vector input from the encoding unit 1, and the adaptive excitation vector a I and its gain β qI are output to the excitation vector generation means 17. . Further, the driving excitation decoding means 15 includes:
Based on the code J of the driving excitation vector inputted from the encoding unit 1, the driving excitation vector C J is read from the driving excitation codebook 16 storing the same driving excitation vector as the driving excitation codebook 11, and the code is read. The gain γ qJ is decoded from the sign of the gain for the drive excitation vector input from the converting unit 1, and the drive excitation vector c J and its gain γ qJ are output to the excitation vector generation unit 17.

【0012】音源ベクトル生成手段17は、前記適応音
源復号化手段13より入力された適応音源ベクトルaI
及びそのゲインβqIと、前記駆動音源復号化手段15よ
り入力された駆動音源ベクトルcJ、及びそのゲインγ
qJより音源ベクトル βqII+γqJJ を生成し、これを適応音源符号帳14及び合成フィルタ
19に出力する。
The excitation vector generation means 17 outputs the adaptive excitation vector a I inputted from the adaptive excitation decoding means 13.
And its gain β qI , the driving excitation vector c J inputted from the driving excitation decoding means 15, and its gain γ
generate excitation vector β qI a I + γ qJ c J than QJ, and outputs it to the adaptive excitation codebook 14 and synthesis filter 19.

【0013】スペクトルパラメータ復号化手段18は、
符号化部1から入力されたスペクトルパラメータの符号
に基づきスペクトルパラメータを復号化し、合成フィル
タ19に出力する。合成フィルタ19は、前記音源ベク
トル生成手段17より入力された音源ベクトルと、前記
スペクトルパラメータ復号化手段18より入力されたス
ペクトルパラメータを用いて出力音声5を合成する。
The spectrum parameter decoding means 18 comprises:
The spectrum parameter is decoded based on the sign of the spectrum parameter input from the encoding unit 1 and output to the synthesis filter 19. The synthesis filter 19 synthesizes the output speech 5 using the sound source vector input from the sound source vector generation means 17 and the spectrum parameter input from the spectrum parameter decoding means 18.

【0014】[0014]

【発明が解決しようとする課題】音声信号には有声音と
無声音が有り、それぞれは音源信号がピッチ周期のパル
ス的成分を持つか、周期性の無い白色雑音であるかで特
徴づけられる。そして、有声音におけるピッチ周期性の
再現性が合成音声の品質に与える影響は大きい。上記の
ような従来の音声符号化・復号化装置では、有声音にお
ける音源信号のピッチ周期のパルス的成分を、先行フレ
ームの音源信号で作られる適応音源ベクトルを用いるこ
とにより発生させていた。しかし、適応音源ベクトルは
複数のサンプルで構成されるので、有声音に必要なパル
ス的成分を積極的には生成できない。このため、無声音
から有声音への過渡部では適当な音源が生成できず音質
が劣化するという課題があった。また、パルス的成分が
生成されても、それ以外のサンプルを含めて音源を生成
するため、必ずしも最適なパルス系列が得られず、これ
がピッチ周期性の欠落につながり音質が劣化するという
課題もあった。
The voice signal includes a voiced sound and an unvoiced sound, each of which is characterized by whether the sound source signal has a pulse component of a pitch period or white noise having no periodicity. The reproducibility of the pitch periodicity of voiced sounds has a large effect on the quality of synthesized speech. In the conventional speech encoding / decoding device as described above, the pulse-like component of the pitch period of the sound source signal in the voiced sound is generated by using the adaptive sound source vector created by the sound source signal of the preceding frame. However, since the adaptive sound source vector is composed of a plurality of samples, a pulse-like component necessary for voiced sound cannot be actively generated. For this reason, there has been a problem that an appropriate sound source cannot be generated in a transition portion from unvoiced sound to voiced sound, and the sound quality is deteriorated. In addition, even if a pulse-like component is generated, since a sound source is generated including other samples, an optimal pulse sequence is not always obtained, and this leads to a lack of pitch periodicity and a deterioration in sound quality. Was.

【0015】また、音源信号を適応音源ベクトルとピッ
チ周期性を考慮していない駆動音源ベクトルとの線形和
により生成するので、適応音源ベクトルがピッチ周期性
を発生させたとしても、伝達情報量を低減させるために
は、フレーム長、即ちベクトル長を長くする、あるいは
駆動音源符号帳の符号帳サイズを小さくする必要があ
り、その場合には生成された音源信号のピッチ周期性が
乱れ、音質が劣化するという課題もあった。
Further, since the excitation signal is generated by the linear sum of the adaptive excitation vector and the driving excitation vector not considering the pitch periodicity, even if the adaptive excitation vector generates the pitch periodicity, the amount of transmitted information is reduced. In order to reduce it, it is necessary to increase the frame length, that is, the vector length, or to reduce the codebook size of the driving excitation codebook. In this case, the pitch periodicity of the generated excitation signal is disturbed and the sound quality is reduced. There was also a problem of deterioration.

【0016】この発明は、かかる課題を解決するために
なされたもので、適応音源ベクトルに加え、この適応音
源ベクトルに対して一意的に求めることが可能な周期パ
ルス列からなる音源ベクトルを生成し、これを用いて音
源信号を生成すること、及び駆動音源ベクトルをピッチ
周期に同期して繰り返し用いることにより、少ない伝送
情報量でも音源信号のピッチ周期性の乱れが少なく、品
質の高い復号音声を合成することを目的としている。
The present invention has been made to solve such a problem, and in addition to an adaptive excitation vector, generates an excitation vector consisting of a periodic pulse train that can be uniquely determined for the adaptive excitation vector, By using this to generate a sound source signal and repeatedly using the drive sound source vector in synchronization with the pitch period, the pitch periodicity of the sound source signal is less disturbed even with a small amount of transmitted information, thereby synthesizing high-quality decoded speech. It is intended to be.

【0017】[0017]

【課題を解決するための手段】この発明に係る音声符号
化装置は、スペクトル分析符号化手段、適応音源符号
帳、周期パルス音源生成手段、複数ベクトル適応音源符
号化手段、音源ベクトル生成手段を備え、一定間隔に区
切ったフレーム毎に入力音声を符号化する音声符号化装
置であって、スペクトル分析符号化手段は、入力音声の
スペクトル包絡情報であるスペクトルパラメータを抽出
して符号化し、適応音源符号帳は、先行フレームにおい
て上記音源ベクトル生成手段により出力された音源信号
から適応音源ベクトルを複数生成して記憶し、周期パル
ス音源生成手段は、上記適応音源符号帳から出力される
適応音源ベクトルの主要成分として定まる周期パルス音
源ベクトルを出力し、複数ベクトル適応音源符号化手段
は、上記符号化されたスペクトルパラメータと上記複数
の適応音源ベクトルのいずれか1つと該適応音源ベクト
ルに付与する第1ゲインと上記周期パルス音源ベクトル
と該周期パルス音源ベクトルに付与する第2ゲインとか
ら生成した復号音声と、入力音声との歪みが最小になる
よう上記適応音源ベクトルと第1ゲインと第2ゲインを
決定して符号化し、音源ベクトル生成手段は、少なくと
も上記決定されて符号化された適応音源ベクトルと第1
ゲインと第2ゲインと、上記周期パルス音源ベクトルか
ら音源信号を生成して出力するようにしたものである。
A speech encoding apparatus according to the present invention comprises a spectrum analysis encoding means, an adaptive excitation codebook, a periodic pulse excitation generation means, a multi-vector adaptive excitation encoding means, and an excitation vector generation means. A speech encoding apparatus for encoding input speech for each frame divided at a fixed interval, wherein the spectrum analysis encoding means extracts and encodes a spectrum parameter which is spectrum envelope information of the input speech, and generates an adaptive excitation code. The book generates and stores a plurality of adaptive excitation vectors from the excitation signal output by the excitation vector generation means in the preceding frame, and the periodic pulse excitation generation means generates a main adaptive excitation vector output from the adaptive excitation codebook. A periodic pulse excitation vector determined as a component is output, and the multi-vector adaptive excitation encoding means outputs the encoded A decoded speech generated from a spectral parameter, one of the plurality of adaptive excitation vectors, a first gain applied to the adaptive excitation vector, the periodic pulse excitation vector, and a second gain applied to the periodic pulse excitation vector; The adaptive excitation vector, the first gain, and the second gain are determined and encoded so that distortion from the input speech is minimized, and the excitation vector generation unit determines at least the determined and encoded adaptive excitation vector and the first and second gains.
A sound source signal is generated and output from a gain, a second gain, and the periodic pulse sound source vector.

【0018】請求項2の発明に係る復号化装置は、スペ
クトルパラメータ復号化手段、複数ベクトル適応音源復
号化手段、適応音源符号帳、周期パルス音源生成手段、
音源ベクトル生成手段、合成フィルタを備え、一定間隔
に区切ったフレーム毎に符号化されたスペクトルパラメ
ータの符号と適応音源ベクトルの符号とゲインの符号と
から復号信号を生成する音声復号化装置であって、スペ
クトルパラメータ復号化手段は、スペクトルパラメータ
の符号を入力され、該スペクトルパラメータの符号から
スペクトルパラメータを復号化し、複数ベクトル適応音
源復号化手段は、適応音源ベクトルの符号とゲインの符
号を入力され、該適応音源ベクトルの符号を上記適応音
源符号帳に出力すると共に、上記ゲインの符号から第1
のゲインと第2のゲインを復号化し、適応音源符号帳
は、先行フレームにおいて上記音源ベクトル生成手段に
より出力された音源信号から適応音源ベクトルを複数生
成して記憶すると共に、該記憶された適応音源ベクトル
の中から上記複数ベクトル適応音源復号化手段により出
力される適応音源ベクトルの符号に対応する適応音源ベ
クトルを出力し、周期パルス音源生成手段は、上記適応
音源符号帳から出力される適応音源ベクトルの主要成分
として定まる周期パルス音源ベクトルを出力し、音源ベ
クトル生成手段は、少なくとも上記第1ゲインを付与し
た適応音源ベクトルと上記第2ゲインを付与した周期パ
ルス音源ベクトルを加算して音源信号として出力し、合
成フィルタは、上記復号化されたスペクトルパラメータ
を用いて、上記音源信号から復号信号を生成するように
したものである。
According to a second aspect of the present invention, there is provided a decoding apparatus comprising: a spectrum parameter decoding unit; a multi-vector adaptive excitation decoding unit; an adaptive excitation codebook;
An audio decoding apparatus comprising: an excitation vector generating unit; a synthesis filter; and generating a decoded signal from a code of a spectrum parameter encoded for each frame divided at a fixed interval, a code of an adaptive excitation vector, and a code of a gain. , The spectrum parameter decoding means is input with the code of the spectrum parameter, decodes the spectrum parameter from the code of the spectrum parameter, the multi-vector adaptive excitation decoding means is input with the code of the adaptive excitation vector and the code of the gain, The adaptive excitation vector code is output to the adaptive excitation codebook, and the first
The adaptive excitation codebook generates and stores a plurality of adaptive excitation vectors from the excitation signal output by the excitation vector generation means in the preceding frame, and decodes the stored adaptive excitation code. Outputting an adaptive excitation vector corresponding to the code of the adaptive excitation vector output from the multi-vector adaptive excitation decoding means from among the vectors, the periodic pulse excitation generating means outputting the adaptive excitation vector output from the adaptive excitation codebook A periodic pulse excitation vector determined as a main component of the above is output, and the excitation vector generating means adds at least the adaptive excitation vector to which the first gain has been added and the periodic pulse excitation vector to which the second gain has been added, and outputs as an excitation signal The synthesis filter uses the decoded spectrum parameters to generate the sound source. It is obtained so as to generate a decoded signal from the item.

【0019】請求項3の発明に係る音声復号化装置は、
スペクトル分析符号化手段、ピッチ位置抽出手段、適応
音源符号帳、駆動音源符号帳、ピッチ同期化手段、適応
音源符号化手段、駆動音源符号化手段、音源ベクトル生
成手段を備え、一定間隔に区切ったフレーム毎に、入力
音声を符号化する音声符号化装置であって、スペクトル
分析符号化手段は、入力音声のスペクトル包絡情報であ
るスペクトルパラメータを抽出して符号化し、ピッチ位
置抽出手段は、入力音声からピッチ周期間隔で並ぶ複数
の特徴点をピッチ位置として抽出して符号化し、適応音
源符号帳は、先行フレームにおいて上記音源ベクトル生
成手段により出力された音源信号から適応音源ベクトル
を複数生成して記憶し、駆動音源符号帳は、予め定めら
れたピッチ同期位置を有する駆動音源ベクトルを複数記
憶し、ピッチ同期化手段は、上記符号化されたピッチ位
置に上記各駆動音源ベクトルのピッチ同期位置を合わ
せ、駆動音源ベクトルをピッチ周期で繰り返したピッチ
同期駆動音源ベクトルを生成し、適応音源符号化手段
は、上記符号化されたスペクトルパラメータに基づいて
上記適応音源ベクトルの合成音声ベクトルを生成し、入
力音声と第1ゲインを付与した上記適応音源ベクトルの
合成音声ベクトルの歪みが最小になるよう適応音源ベク
トル、第1ゲインを決定し、該決定された適応音源ベク
トルの符号を出力すると共に、該第1ゲインを符号化
し、駆動音源符号化手段は、上記符号化されたスペクト
ルパラメータに基づいて上記ピッチ同期駆動音源ベクト
ルの合成音声ベクトルを生成し、上記決定された第1ゲ
インを付与した上記決定された適応音源ベクトルの合成
音声ベクトルと第2ゲインを付与した上記ピッチ同期駆
動音源ベクトルの合成音声ベクトルの和を復号信号ベク
トルとしたとき、入力音声と該復号信号ベクトルの歪み
が最小となるよう上記ピッチ同期駆動音源ベクトルの合
成音声ベクトルと第2ゲインを決定し、該決定されたピ
ッチ同期駆動音源ベクトルの符号を出力すると共に、該
決定された第2ゲインを符号化し、音源ベクトル生成手
段は、少なくとも上記決定されて符号化された適応音源
ベクトルと第1ゲインと第2ゲインと、上記ピッチ同期
駆動音源ベクトルから音源信号を生成して出力するよう
にしたものである。
According to a third aspect of the present invention, there is provided a speech decoding apparatus comprising:
A spectrum analysis coding unit, a pitch position extraction unit, an adaptive excitation codebook, a driving excitation codebook, a pitch synchronization unit, an adaptive excitation coding unit, a driving excitation coding unit, and an excitation vector generation unit are provided, and are divided into a fixed interval. A speech encoding apparatus for encoding an input speech for each frame, wherein a spectrum analysis encoding means extracts and encodes a spectrum parameter which is spectrum envelope information of the input speech, and a pitch position extraction means, The adaptive excitation codebook generates and stores a plurality of adaptive excitation vectors from the excitation signal output by the excitation vector generation means in the preceding frame, by extracting a plurality of feature points arranged at a pitch cycle interval as pitch positions and encoding them. The driving excitation codebook stores a plurality of driving excitation vectors having a predetermined pitch synchronization position, Means for adjusting a pitch synchronization position of each of the drive excitation vectors to the encoded pitch position, generating a pitch-synchronous drive excitation vector in which the drive excitation vector is repeated at a pitch cycle, and wherein the adaptive excitation encoding means includes A synthesized speech vector of the adaptive sound source vector is generated based on the converted spectral parameters. Determining the gain, outputting the code of the determined adaptive excitation vector, encoding the first gain, and driving excitation encoding means based on the encoded spectral parameters, And the determined adaptive sound source vector to which the determined first gain has been added. When the sum of the synthesized speech vector of the pitch-synchronous drive excitation vector to which the second gain is added and the synthesized speech vector of the pitch-synchronized excitation vector is used as the decoded signal vector, the pitch-synchronous drive is performed so that the distortion of the input speech and the decoded signal vector is minimized. Determining a synthesized speech vector and a second gain of the sound source vector, outputting a code of the determined pitch synchronous drive sound source vector, and encoding the determined second gain; An excitation signal is generated and output from the adaptive excitation vector, the first gain, the second gain, and the pitch-synchronized excitation vector that have been encoded.

【0020】請求項4の発明に係る音声符号化装置は、
スペクトル分析符号化手段、適応音源符号帳、駆動音源
符号帳、ピッチ同期化手段、適応音源符号化手段、駆動
音源符号化手段、音源ベクトル生成手段を備え、一定間
隔に区切ったフレーム毎に入力音声を符号化する音声符
号化装置であって、スペクトル分析符号化手段は、入力
音声のスペクトル包絡情報であるスペクトルパラメータ
を抽出して符号化し、適応音源符号帳は、先行フレーム
において上記音源ベクトル生成手段により出力された音
源信号から適応音源ベクトルを複数生成して記憶し、駆
動音源符号帳は、予め定められたピッチ同期位置を有す
る駆動音源ベクトルを複数記憶し、ピッチ同期化手段
は、時間軸上にピッチ周期間隔で並ぶ複数の点であるピ
ッチ位置に駆動音源ベクトルのピッチ同期位置を合わ
せ、駆動音源ベクトルをピッチ周期で繰り返したピッチ
同期駆動音源ベクトルを生成し、適応音源符号化手段
は、上記符号化されたスペクトルパラメータに基づいて
上記適応音源ベクトルの合成音声ベクトルを生成し、入
力音声と第1ゲインを付与した上記適応音源ベクトルの
合成音声ベクトルの歪みが最小になるよう適応音源ベク
トル、第1ゲインを決定し、該決定された適応音源ベク
トルの符号を出力すると共に、該決定された第1ゲイン
を符号化し、駆動音源符号化手段は、上記符号化された
スペクトルパラメータに基づいて、上記ピッチ同期駆動
音源ベクトルの合成音声ベクトルを生成し、上記決定さ
れた第1ゲインを付与した上記決定された適応音源ベク
トルの合成音声ベクトルと第2ゲインを付与した上記ピ
ッチ同期駆動音源ベクトルの合成音声ベクトルの和を復
号信号ベクトルとしたとき、入力音声と該復号信号ベク
トルの歪みが最小となるよう上記ピッチ同期駆動音源ベ
クトルの合成音声ベクトルとピッチ位置と第2ゲインを
決定し、該決定されたピッチ同期駆動音源ベクトルの符
号を出力すると共に、該決定されたピッチ位置と第2ゲ
インを符号化し、音源ベクトル生成手段は、少なくとも
上記決定されて符号化された適応音源ベクトルと第1ゲ
インと第2ゲインと、上記ピッチ同期駆動音源ベクトル
から音源信号を生成して出力するようにしたものであ
る。
According to a fourth aspect of the present invention, there is provided a speech encoding apparatus comprising:
The apparatus includes a spectrum analysis encoding unit, an adaptive excitation codebook, a driving excitation codebook, a pitch synchronization unit, an adaptive excitation encoding unit, a driving excitation encoding unit, and an excitation vector generation unit, and receives an input speech for each frame divided at regular intervals. Wherein the spectrum analysis encoding means extracts and encodes a spectrum parameter which is spectrum envelope information of the input speech, and the adaptive excitation codebook includes the excitation vector generation means in a preceding frame. A plurality of adaptive excitation vectors are generated and stored from the excitation signal output by the above, the driving excitation codebook stores a plurality of driving excitation vectors having a predetermined pitch synchronization position, and the pitch synchronization means The pitch of the driving sound source vector is adjusted to the pitch positions, which are a plurality of points arranged at pitch interval intervals, and the driving sound source vector An adaptive excitation encoding means generates a pitch-synchronous drive excitation vector repeated at a pitch cycle, generates a synthesized speech vector of the adaptive excitation vector based on the encoded spectrum parameter, and calculates an input speech and a first gain. The adaptive excitation vector and the first gain are determined so that the distortion of the synthesized speech vector of the applied adaptive excitation vector is minimized, and the sign of the determined adaptive excitation vector is output. The driving excitation encoding means generates a synthesized speech vector of the pitch-synchronized excitation vector based on the encoded spectral parameters, and applies the determined first gain to the determined adaptive gain. A synthesized speech vector of the pitch-synchronous drive excitation vector to which the synthesized speech vector of the sound source vector and the second gain are added. Is determined as a decoded signal vector, a synthesized voice vector, a pitch position, and a second gain of the pitch synchronous drive excitation vector are determined so that distortion of the input voice and the decoded signal vector is minimized, and the determined pitch is determined. A code of the synchronous drive excitation vector is output, and the determined pitch position and the second gain are encoded. The excitation vector generating means includes at least the determined and encoded adaptive excitation vector, the first gain, and the second gain. A sound source signal is generated and output from a gain and the pitch synchronous drive sound source vector.

【0021】請求項5の発明に係る音声復号化装置は、
スペクトルパラメータ復号化手段、適応音源復号化手
段、適応音源符号帳、駆動音源符号帳、ピッチ同期化手
段、駆動音源復号化手段、音源ベクトル生成手段、合成
フィルタを備え、一定間隔に区切ったフレーム毎に符号
化されたスペクトルパラメータの符号と適応音源ベクト
ルの符号と駆動音源ベクトルの符号とゲインの符号とピ
ッチ位置の符号とから復号信号を生成する音声復号化装
置であって、スペクトルパラメータ復号化手段はスペク
トルパラメータの符号を入力され、該スペクトルパラメ
ータの符号からスペクトルパラメータを復号化し、適応
音源復号化手段は、適応音源ベクトルの符号と該適応音
源ベクトルに付与する第1ゲインの符号を入力され、該
適応音源ベクトルの符号を上記適応音源符号帳に出力す
ると共に、上記第1ゲインの符号から第1のゲインを復
号化し、適応音源符号帳は、先行フレームにおいて上記
音源ベクトル生成手段により出力された音源信号から適
応音源ベクトルを複数生成して記憶すると共に、該記憶
された適応音源ベクトルの中から上記適応音源復号化手
段により出力される適応音源ベクトルの符号に対応する
適応音源ベクトルを出力し、駆動音源符号帳は、予め定
められたピッチ同期位置を有する駆動音源ベクトルを複
数記憶すると共に、該記憶された駆動音源ベクトルの中
から上記駆動音源ベクトル復号化手段により出力される
駆動音源ベクトルの符号に対応する駆動音源ベクトルを
ピッチ同期化手段に対して出力し、ピッチ同期化手段
は、ピッチ位置の符号を入力され該符号からピッチ位置
を復号化し、該復号化されたピッチ位置に上記ピッチ同
期位置をあわせ、上記駆動音源符号帳から入力された駆
動音源ベクトルをピッチ周期で繰り返したピッチ同期駆
動音源ベクトルを生成し、駆動音源復号化手段は、駆動
音源ベクトルの符号と該駆動音源ベクトルに付与する第
2ゲインの符号を入力され、該駆動音源ベクトルの符号
を上記駆動音源符号帳に出力すると共に、上記第2ゲイ
ンの符号から第2のゲインを復号化し、音源ベクトル生
成手段は、上記第1ゲインを付与した適応音源ベクトル
と第2ゲインを付与したピッチ同期駆動音源ベクトルの
和である音源信号を出力し、合成フィルタは、上記復号
化されたスペクトルパラメータを用いて、上記音源信号
から復号信号を生成するようにしたものである。
A speech decoding apparatus according to a fifth aspect of the present invention
Each frame is provided with a spectrum parameter decoding unit, an adaptive excitation decoding unit, an adaptive excitation codebook, a driving excitation codebook, a pitch synchronization unit, a driving excitation decoding unit, an excitation vector generation unit, and a synthesis filter. A speech decoding apparatus for generating a decoded signal from a spectrum parameter code, an adaptive excitation vector code, a driving excitation vector code, a gain code, and a pitch position code encoded in Receives the code of the spectrum parameter, decodes the spectrum parameter from the code of the spectrum parameter, the adaptive excitation decoding means receives the code of the adaptive excitation vector and the code of the first gain to be given to the adaptive excitation vector, Outputting the code of the adaptive excitation vector to the adaptive excitation codebook, The adaptive excitation codebook generates a plurality of adaptive excitation vectors from the excitation signal output by the excitation vector generation means in the preceding frame and stores the adaptive excitation codebook. An adaptive excitation vector corresponding to the code of the adaptive excitation vector output by the adaptive excitation decoding means is output from the excitation vectors, and the driving excitation codebook includes a plurality of driving excitation vectors having a predetermined pitch synchronization position. Storing the driving excitation vector corresponding to the code of the driving excitation vector output by the driving excitation vector decoding means from the stored driving excitation vectors to the pitch synchronization means, The means receives a code of the pitch position, decodes the pitch position from the code, and decodes the decoded pitch position. The pitch synchronous position is adjusted, a pitch synchronous driving excitation vector is generated by repeating the driving excitation vector input from the driving excitation codebook at a pitch cycle, and the driving excitation decoding means determines the code of the driving excitation vector and the driving excitation vector. The number given to the vector
The two-gain code is input, the code of the excitation vector is output to the excitation codebook, and the second gain is decoded from the code of the second gain. And a pitch-synchronous drive excitation vector to which the second gain has been applied, and outputs a excitation signal, and the synthesis filter uses the decoded spectral parameters to convert a decoded signal from the excitation signal It is generated.

【0022】請求項6の発明に係る音声符号化装置は、
スペクトル分析符号化手段、適応音源符号帳、ピッチ位
置抽出手段、駆動音源符号帳、ピッチ同期化手段、適応
音源符号化手段、駆動音源符号化手段、音源ベクトル生
成手段を備え、一定間隔に区切ったフレーム毎に、入力
音声を符号化する音声符号化装置であって、スペクトル
分析符号化手段は、入力音声信号のスペクトル包絡情報
であるスペクトルパラメータを抽出して符号化し、適応
音源符号帳は、先行フレームにおいて上記音源ベクトル
生成手段により出力された音源信号から適応音源ベクト
ルを複数生成して記憶し、ピッチ位置抽出手段は、上記
適応音源ベクトルからピッチ周期間隔で並ぶ複数の特徴
点をピッチ位置として抽出し、駆動音源符号帳は、予め
定められたピッチ同期位置を有する駆動音源ベクトルを
複数記憶し、ピッチ同期化手段は、上記抽出されたピッ
チ位置に上記各駆動音源ベクトルのピッチ同期位置を合
わせ、駆動音源ベクトルをピッチ周期で繰り返したピッ
チ同期駆動音源ベクトルを生成し、適応音源符号化手段
は、上記符号化されたスペクトルパラメータに基づいて
上記適応音源ベクトルの合成音声ベクトルを生成し、入
力音声と第1ゲインを付与した上記適応音源ベクトルの
合成音声ベクトルの歪みが最小になるよう適応音源ベク
トル、第1ゲインを決定し、該決定された適応音源ベク
トルの符号を出力すると共に、該第1ゲインを符号化
し、駆動音源符号化手段は、上記符号化されたスペクト
ルパラメータに基づいて上記ピッチ同期駆動音源ベクト
ルの合成音声ベクトルを生成し、上記決定された第1ゲ
インを付与した上記決定された適応音源ベクトルの合成
音声ベクトルと第2ゲインを付与した上記ピッチ同期駆
動音源ベクトルの合成音声ベクトルの和を復号信号ベク
トルとしたとき、入力音声と該復号信号ベクトルの歪み
が最小となるよう上記ピッチ同期駆動音源ベクトルの合
成音声ベクトルと第2ゲインを決定し、該決定されたピ
ッチ同期駆動音源ベクトルの符号を出力すると共に、該
決定された第2ゲインを符号化し、音源ベクトル生成手
段は、少なくとも上記決定されて符号化された適応音源
ベクトルと第1ゲインと第2ゲインと、上記ピッチ同期
駆動音源ベクトルから音源信号を生成して出力するよう
にしたものである。
A speech encoding apparatus according to a sixth aspect of the present invention
A spectrum analysis coding unit, an adaptive excitation codebook, a pitch position extracting unit, a driving excitation codebook, a pitch synchronization unit, an adaptive excitation coding unit, a driving excitation coding unit, and an excitation vector generation unit are provided. A speech encoding apparatus for encoding an input speech for each frame, wherein a spectrum analysis encoding means extracts and encodes a spectrum parameter which is spectrum envelope information of an input speech signal, and an adaptive excitation codebook includes A plurality of adaptive excitation vectors are generated and stored in the frame from the excitation signal output by the excitation vector generation unit, and the pitch position extraction unit extracts a plurality of feature points arranged at a pitch cycle interval from the adaptive excitation vector as a pitch position. The driving excitation codebook stores a plurality of driving excitation vectors having a predetermined pitch synchronization position, and The synchronization unit adjusts the pitch synchronization position of each of the driving excitation vectors to the extracted pitch position, generates a pitch synchronization driving excitation vector in which the driving excitation vector is repeated at a pitch cycle, and the adaptive excitation encoding unit includes A synthesized speech vector of the adaptive excitation vector is generated based on the encoded spectral parameters, and the adaptive excitation vector and the synthesized speech vector of the adaptive excitation vector to which the first gain has been applied are minimized. 1 is determined, the code of the determined adaptive excitation vector is output, and the first gain is encoded, and the driving excitation encoding means performs the pitch synchronous driving excitation based on the encoded spectral parameters. The determined adaptive sound obtained by generating a synthesized speech vector of the vector and adding the determined first gain. When the sum of the synthesized voice vector of the vector and the synthesized voice vector of the pitch-synchronized drive excitation vector to which the second gain is added is set as the decoded signal vector, the pitch-synchronized drive is performed so that the distortion between the input voice and the decoded signal vector is minimized. Determining a synthesized speech vector and a second gain of the sound source vector, outputting a code of the determined pitch synchronous drive sound source vector, and encoding the determined second gain; An excitation signal is generated and output from the adaptive excitation vector, the first gain, the second gain, and the pitch-synchronized excitation vector that have been encoded.

【0023】請求項7の発明に係る音声復号化装置は、
スペクトルパラメータ復号化手段、適応音源復号化手
段、適応音源符号帳、ピッチ位置抽出手段、駆動音源符
号帳、ピッチ同期化手段、駆動音源復号化手段、音源ベ
クトル生成手段、合成フィルタを備え、一定間隔に区切
ったフレーム毎に符号化されたスペクトルパラメータの
符号と適応音源ベクトルの符号と駆動音源ベクトルの符
号とゲインの符号とから復号信号を生成する音声復号化
装置であって、スペクトルパラメータ復号化手段は、ス
ペクトルパラメータの符号を入力され、該スペクトルパ
ラメータの符号からスペクトルパラメータを復号化し、
適応音源復号化手段は、適応音源ベクトルの符号と該適
応音源ベクトルに付与する第1ゲインの符号を入力さ
れ、該適応音源ベクトルの符号を上記適応音源符号帳に
出力すると共に、上記第1ゲインの符号から第1のゲイ
ンを復号化し、適応音源符号帳は、先行フレームにおい
て上記音源ベクトル生成手段により出力された音源信号
から適応音源ベクトルを複数生成して記憶すると共に、
該記憶された適応音源ベクトルの中から上記適応音源復
号化手段により出力される適応音源ベクトルの符号に対
応する適応音源ベクトルを出力し、ピッチ位置抽出手段
は、上記適応音源ベクトルからピッチ周期間隔で並ぶ複
数の特徴点をピッチ位置として抽出し、駆動音源符号帳
は、予め定められたピッチ同期位置を有する駆動音源ベ
クトルを複数記憶すると共に、該記憶された駆動音源ベ
クトルの中から上記駆動音源ベクトル復号化手段により
出力される駆動音源ベクトルの符号に対応する駆動音源
ベクトルをピッチ同期化手段に対して出力し、ピッチ同
期化手段は、上記抽出されたピッチ位置に上記各駆動音
源ベクトルのピッチ同期位置をあわせ、上記駆動音源符
号帳から入力された駆動音源ベクトルをピッチ周期で繰
り返したピッチ同期駆動音源ベクトルを生成し、駆動音
源復号化手段は、駆動音源ベクトルの符号と該駆動音源
ベクトルに付与する第2ゲインの符号を入力され、該駆
動音源ベクトルの符号を上記駆動音源符号帳に出力する
と共に、上記第2ゲインの符号から第2のゲインを復号
化し、音源ベクトル生成手段は、上記第1ゲインを付与
した適応音源ベクトルと第2ゲインを付与したピッチ同
期駆動音源ベクトルの和である音源信号を出力し、合成
フィルタは、上記復号化されたスペクトルパラメータを
用いて、上記音源信号から復号信号を生成するようにし
たものである。
A speech decoding apparatus according to a seventh aspect of the present invention
A spectral parameter decoding unit, an adaptive excitation decoding unit, an adaptive excitation codebook, a pitch position extraction unit, a driving excitation codebook, a pitch synchronization unit, a driving excitation decoding unit, an excitation vector generation unit, a synthesis filter, and a fixed interval. A speech decoding apparatus for generating a decoded signal from a code of a spectral parameter encoded for each frame divided into a code of an adaptive excitation vector, a code of a drive excitation vector, and a code of a gain, comprising: Is input the sign of the spectral parameter, decodes the spectral parameter from the sign of the spectral parameter,
The adaptive excitation decoding means receives the code of the adaptive excitation vector and the code of the first gain to be given to the adaptive excitation vector, outputs the code of the adaptive excitation vector to the adaptive excitation codebook, and outputs the first gain. , The adaptive excitation codebook generates and stores a plurality of adaptive excitation vectors from the excitation signal output by the excitation vector generation means in the preceding frame,
An adaptive excitation vector corresponding to the code of the adaptive excitation vector output by the adaptive excitation decoding means is output from the stored adaptive excitation vectors, and the pitch position extracting means outputs the adaptive excitation vector at a pitch cycle interval from the adaptive excitation vector. A plurality of aligned feature points are extracted as pitch positions, the driving excitation codebook stores a plurality of driving excitation vectors having a predetermined pitch synchronization position, and the driving excitation vector is selected from among the stored driving excitation vectors. A driving excitation vector corresponding to the code of the driving excitation vector output by the decoding unit is output to the pitch synchronization unit, and the pitch synchronization unit sets the pitch synchronization of each of the driving excitation vectors to the extracted pitch position. Adjust the pitch and repeat the driving excitation vector input from the driving excitation codebook at the pitch cycle. A driving excitation vector is generated, and the driving excitation decoding means receives the code of the driving excitation vector and the code of the second gain added to the driving excitation vector, and outputs the code of the driving excitation vector to the driving excitation codebook. At the same time, the second gain is decoded from the code of the second gain, and the excitation vector generating means is the sum of the adaptive excitation vector to which the first gain is applied and the pitch synchronous excitation excitation vector to which the second gain is applied. An excitation signal is output, and the synthesis filter generates a decoded signal from the excitation signal using the decoded spectrum parameter.

【0024】[0024]

【作用】この発明における入力音声符号化装置は、適応
音源ベクトルに対応して周期パルス音源ベクトルが新し
く生成され、それぞれゲインを掛けて合成され、入力音
声との歪みが最小となるベクトルとゲインが選択されて
符号化される。また、請求項2の発明の音声復号化装置
は、伝送された符号とゲインにより、周期性を持つ音源
ベクトルが生成され、これと適応音源ベクトルにより、
音源ベクトルが復号化される。また、請求項3、4の発
明の音声符号化装置は、駆動音源ベクトルが周期的に繰
り返され、入力音声との歪みが最小になるベクトルとゲ
インが選択されて符号化される。また、請求項5の発明
の音声復号化装置は、伝送された符号により、駆動音源
ベクトルが周期的に生成され、これと適応音源ベクトル
により、音源ベクトルが復号化される。また、請求項6
の発明の音声符号化装置は、適応音源ベクトルにおいて
ピッチ周期で定まる特徴点がピッチ位置として抽出さ
れ、これにより駆動音源ベクトルが周期的に繰り返さ
れ、入力音声との歪みが最小になるベクトルとゲインが
選択されて符号化される。また、請求項7の発明の音声
復号化装置は、伝送された符号、受信スペクトルパラメ
ータとゲインにより、ピッチ位置が抽出され、これによ
り駆動音源ベクトルが周期的に生成され、これと適応音
源ベクトルにより、音源ベクトルが復号化される。
According to the input speech encoding apparatus of the present invention, a periodic pulse excitation vector is newly generated corresponding to the adaptive excitation vector, and each of the periodic pulse excitation vectors is multiplied by a gain to be synthesized. Selected and encoded. In the speech decoding apparatus according to the second aspect of the present invention, an excitation vector having periodicity is generated by the transmitted code and the gain, and the excitation vector is generated by the generated excitation vector and the adaptive excitation vector.
The sound source vector is decoded. In the speech coding apparatus according to the third and fourth aspects of the present invention, the driving excitation vector is periodically repeated, and the vector and the gain that minimize the distortion from the input speech are selected and coded. Further, in the speech decoding apparatus according to the fifth aspect of the present invention, the driving excitation vector is periodically generated by the transmitted code, and the excitation vector is decoded by the generated excitation vector and the adaptive excitation vector. Claim 6
In the speech encoding apparatus according to the invention, a feature point determined by a pitch period in an adaptive excitation vector is extracted as a pitch position, whereby a driving excitation vector is periodically repeated, and a vector and a gain that minimize distortion from input speech are obtained. Is selected and encoded. In the speech decoding apparatus according to the seventh aspect of the present invention, the pitch position is extracted by the transmitted code, the received spectrum parameter and the gain, whereby the driving excitation vector is periodically generated. , The excitation vector is decoded.

【0025】[0025]

【実施例】実施例1. 図1はこの発明の請求項1の一実施例の構成図である。
図1において図8と同一の部分については同一の符号を
付し、説明を省略する。図1において、新規な部分は、
20の複数ベクトル適応音源符号化手段、21及び23
の周期パルス音源生成手段、22の複数ベクトル適応音
源復号化手段である。スペクトル分析手段6、スペクト
ルパラメータ符号化手段7からなる声道部と、複数ベク
トル適応音源符号化手段20、駆動音源符号化手段1
0、音源ベクトル生成手段12からなる声帯部の分担は
従来例と同じであるが、声帯部の、特にピッチ周期性を
向上させ、合成後の音声品質を改善するものである。
[Embodiment 1] FIG. 1 is a block diagram of a first embodiment of the present invention.
In FIG. 1, the same portions as those in FIG. 8 are denoted by the same reference numerals, and description thereof will be omitted. In FIG. 1, the new part is
20 multi-vector adaptive excitation coding means, 21 and 23
And a multi-vector adaptive excitation decoding means 22. A vocal tract comprising spectrum analysis means 6, spectrum parameter coding means 7, multiple vector adaptive excitation coding means 20, driving excitation coding means 1
0, the sharing of the vocal chords composed of the sound source vector generation means 12 is the same as in the conventional example, but it is intended to improve the pitch periodicity of the vocal chords in particular and to improve the voice quality after synthesis.

【0026】以下、本発明の一実施例の動作について説
明する。まず、符号化部1の動作について説明する。周
期パルス音源生成手段21は、適応音源符号帳9より入
力される適応音源ベクトルaiより、その最大振幅をと
る次元のみ1でその他の次元は0である周期単位インパ
ルス列からなる周期パルス音源ベクトルpiを生成し、
このpiを複数ベクトル符号化手段20に出力する。元
々、適応音源符号帳9が前フレーム迄の入力のサンプリ
ング系列値を記憶しており、これから、複数ベクトル適
応音源符号化手段20では現フレームの入力音声に最も
近い合成音声を生成するベクトルを選ぶが、記憶されて
いる適応音源符号帳9のベクトルは周期性の保持につい
ては充分ではない。同期パルス音源ベクトルpiを新た
に作ることで周期性が補強されることになる。
The operation of one embodiment of the present invention will be described below. First, the operation of the encoding unit 1 will be described. The periodic pulse excitation generating means 21 generates a periodic pulse excitation vector composed of a periodic unit impulse train in which only the dimension having the maximum amplitude is 1 and the other dimensions are 0 from the adaptive excitation vector a i input from the adaptive excitation codebook 9. generate p i ,
And outputs the p i into multiple vectors encoding means 20. Originally, the adaptive excitation codebook 9 stores the sampling sequence values of the input up to the previous frame, and from this, the multi-vector adaptive excitation coding means 20 selects the vector that generates the synthesized speech closest to the input speech of the current frame. However, the stored vector of adaptive excitation codebook 9 is not sufficient for maintaining the periodicity. The periodicity is reinforced by newly creating the synchronous pulse sound source vector p i .

【0027】図2に本実施例における適応音源ベクトル
(a)と、それより生成される周期パルス音源ベクトル
(b)の例を示す。つまり、記憶している多くのベクト
ル中で、その最大の振幅を持つベクトルが、単位化され
て出力される。このことにより、音声の再生にとって重
要な周期性を強調することが出来る。
FIG. 2 shows an example of the adaptive excitation vector (a) and the periodic pulse excitation vector (b) generated therefrom in this embodiment. In other words, the vector having the largest amplitude among many stored vectors is unitized and output. This makes it possible to emphasize periodicity that is important for sound reproduction.

【0028】複数ベクトル適応音源符号化手段20は、
スペクトルパラメータ符号化手段7より入力されるスペ
クトルパラメータを用い、前記適応音源符号帳9より入
力される適応音源ベクトルai 、前記周期パルス音源生
成手段21より入力される周期パルス音源ベクトルpi
より合成音声ベクトルAi、Piをそれぞれ合成する。そ
して、入力音声4からフレーム毎に切り出した入力音声
ベクトルXとのベクトル間距離Diを、例えば式(5)
に従って求める。ここで、ゲインβAi、βPiは距離Di
が最小になるように、例えば式(6)、式(7)に従っ
て決定する。
The multi-vector adaptive excitation coding means 20 comprises:
The adaptive excitation vector a i input from the adaptive excitation codebook 9 and the periodic pulse excitation vector p i input from the periodic pulse excitation generating means 21 are used, using the spectrum parameters input from the spectrum parameter encoding means 7.
Then, the synthesized speech vectors A i and P i are synthesized. Then, the inter-vector distance D i between the input speech vector X cut out for each frame from the input speech 4, for example, the formula (5)
Ask according to. Here, the gains β Ai and β Pi are the distances Di
Is determined according to, for example, Expressions (6) and (7) so that is minimized.

【0029】[0029]

【数3】 (Equation 3)

【0030】次にこのベクトル間距離が最小となるベク
トルAI、PIの組を探索し、その符号I及びゲイン
βAI、βPIを量子化したゲインβqAI、βqPIの符号を伝
送路3を介して復号化部2に出力する。また、選択され
た適応音源ベクトルaI及びそのゲインβqAIと、周期パ
ルス音源ベクトルpI及びそのゲインβqPIを、音源ベク
トル生成手段12に出力するとともに、誤差ベクトル
X’として、 X’=X−βqAII−βqPII を駆動音源符号化手段10に出力する。このように、従
来と比べて、AIのベクトルをAIとPIの組のベクトル
としたことが新規である。なお、ベクトル差をさらに量
子化して符号化送信する駆動音源符号化手段10の動作
は、本実施例では、従来例と同じであり、復号化部2に
対してはJとγqJの符号を送信する。
Next, a set of vectors A I and P I that minimizes the inter-vector distance is searched for, and the sign I and the signs of the gains β qAI and β qPI obtained by quantizing the gains β AI and β PI are transmitted through the transmission line. 3 to the decoding unit 2. Also, the selected adaptive excitation vector a I and its gain β qAI and the periodic pulse excitation vector p I and its gain β qPI are output to the excitation vector generation means 12 and X ′ = X as an error vector X ′. −β qAI A I −β qPI P I is output to driving excitation coding means 10. Thus, as compared with the conventional, it is novel that the vector of A I and the set of vectors of A I and P I. The operation of the driving excitation encoding means 10 for further quantizing the vector difference and encoding and transmitting the same is the same as that of the conventional example in the present embodiment. Send.

【0031】次に、復号化部2の動作について説明す
る。複数ベクトル適応音源復号化手段22は、符号化部
1から入力された適応音源ベクトルの符号Iを適応音源
符号帳14に出力する。適応音源符号帳14は、前記符
号Iに対応する適応音源ベクトルaIを、複数ベクトル
適応音源復号化手段22と周期パルス音源生成手段23
へ出力する。周期パルス音源生成手段23は、前記適応
音源符号帳14から入力された適応音源ベクトルaI
り周期パルス音源ベクトルpIを生成し、複数ベクトル
適応音源復号化手段22に出力する。
Next, the operation of the decoding unit 2 will be described. The multi-vector adaptive excitation decoding means 22 outputs the code I of the adaptive excitation vector input from the encoding unit 1 to the adaptive excitation codebook 14. The adaptive excitation codebook 14 converts the adaptive excitation vector a I corresponding to the code I into a multi-vector adaptive excitation decoding means 22 and a periodic pulse excitation generating means 23.
Output to The periodic pulse excitation generating means 23 generates a periodic pulse excitation vector p I from the adaptive excitation vector a I input from the adaptive excitation codebook 14, and outputs it to the multi-vector adaptive excitation decoding means 22.

【0032】複数ベクトル適応音源復号化手段22は、
前記適応音源符号帳14より入力される適応音源ベクト
ルaIと、前記周期パルス音源生成手段23より入力さ
れる周期パルス音源ベクトルpI、及び符号化部1から
入力されたそれぞれのゲインの符号より復号したゲイン
βqAI、βqPIを音源ベクトル生成手段17に出力する。
つまり、βqAI、aI、βqPI、pIの組が音源ベクトル生
成手段に与えられる。
The multi-vector adaptive excitation decoding means 22 comprises:
From the adaptive excitation vector a I input from the adaptive excitation codebook 14, the periodic pulse excitation vector p I input from the periodic pulse excitation generating means 23, and the sign of each gain input from the encoding unit 1. The decoded gains β qAI and β qPI are output to the excitation vector generation means 17.
That is, a set of β qAI , a I , β qPI , and p I is given to the sound source vector generation means.

【0033】音源ベクトル生成手段17は、前記複数ベ
クトル適応音源復号化手段22より入力された適応音源
ベクトルaI、周期パルス音源ベクトルpI及びそれぞれ
のゲインβqAI、βqPIと、他方の入力である駆動音源復
号化手段15より入力される駆動音源ベクトルcJ及び
そのゲインγqJより、下記の音源ベクトルを生成する。 βqAII+βqPII+γqJJ 生成された音源ベクトルは、適応音源符号帳14及び合
成フィルタ19に出力される。合成フィルタ19の出力
は、合成して復元された音声出力となる。
The excitation vector generation means 17 receives the adaptive excitation vector a I , the periodic pulse excitation vector p I and the respective gains β qAI and β qPI input from the multi-vector adaptive excitation decoding means 22 and the other input. The following excitation vector is generated from the driving excitation vector c J and the gain γ qJ input from a certain driving excitation decoding means 15. β qAI a I + β qPI p I + γ qJ c J The generated excitation vector is output to adaptive excitation codebook 14 and synthesis filter 19. The output of the synthesis filter 19 is an audio output that is synthesized and restored.

【0034】実施例2. 上記実施例1では、符号化するフレーム内のピッチ周期
性のみを考慮して周期パルス音源ベクトルを生成してい
る。一方、切り出して選択・符号化された適応音源ベク
トルのピッチ周期は、入力音声の実際のピッチ周期の倍
の値をとったりして、周期パルス音源ベクトルが生成す
るパルス列は、フレーム間では必ずしも周期的にはなら
ない。このときは、先行フレームの情報を用いて、例え
ば平均ピッチ周期を求めておき、周期パルス音源ベクト
ルはその平均ピッチ周期のパルス列から生成するなど、
フレーム間でのピッチ周期性をも考慮して周期パルス音
源ベクトルを生成してもよい。
Embodiment 2 FIG. In the first embodiment, the periodic pulse excitation vector is generated in consideration of only the pitch periodicity in the frame to be encoded. On the other hand, the pitch period of the adaptive excitation vector that is cut out and selected / encoded takes a value that is twice the actual pitch period of the input speech, and the pulse train generated by the periodic pulse excitation vector is not necessarily periodic between frames. It does not become. At this time, using the information of the preceding frame, for example, an average pitch period is obtained, and the periodic pulse excitation vector is generated from a pulse train having the average pitch period.
The periodic pulse excitation vector may be generated in consideration of the pitch periodicity between frames.

【0035】実施例3. 上記実施例1では、周期パルス音源ベクトルの各パルス
の振幅が全て等しいとした。これを変更して、例えば音
声のパワーに応じて振幅を、前フレームから順次、増
加、又は減少させる等、線形的に変化させるなど、各周
期パルス音源ベクトルが異なる振幅をとるように設定し
てもよい。
Embodiment 3 FIG. In the first embodiment, the amplitude of each pulse of the periodic pulse sound source vector is assumed to be all equal. By changing this, for example, according to the power of the sound, the amplitude is sequentially increased or decreased from the previous frame, such as linearly changing, such that each periodic pulse sound source vector is set to have a different amplitude. Is also good.

【0036】実施例4. 上記実施例1では、周期パルス音源ベクトルのパルス位
置を、適応音源ベクトルの振幅最大点より求めている
が、この両者を合成して得られる合成音声ベクトルにお
いて、両者のベクトルの内積が最大となる周期パルス音
源ベクトルを設定してもよい。
Embodiment 4 FIG. In the first embodiment, the pulse position of the periodic pulse sound source vector is obtained from the maximum amplitude point of the adaptive sound source vector. However, in a synthesized speech vector obtained by synthesizing the two, the inner product of both vectors becomes maximum. A periodic pulse sound source vector may be set.

【0037】実施例5. 上記実施例1では、適応音源ベクトルと周期パルス音源
ベクトルをそのまま用いて合成音声ベクトルを生成し、
その結果ベクトルと入力音声ベクトルとのベクトル間距
離を求めている。しかし、例えば周期パルス音源ベクト
ルのパルス位置における適応音源ベクトルの振幅値を0
にして、適応音源ベクトルと周期パルス音源ベクトルを
直交化してベクトル間の相関を取り除き、周期性につい
ては専ら周期パルス音源ベクトルを用いた合成音声ベク
トルを生成してもよい。そして、その結果ベクトルと入
力音声ベクトルとのベクトル間距離を求めてもよい。
Embodiment 5 FIG. In the first embodiment, a synthesized speech vector is generated using the adaptive excitation vector and the periodic pulse excitation vector as they are,
As a result, the inter-vector distance between the vector and the input speech vector is obtained. However, for example, if the amplitude value of the adaptive excitation vector at the pulse position of the periodic pulse excitation vector is 0,
Then, the adaptive excitation vector and the periodic pulse excitation vector may be orthogonalized to remove the correlation between the vectors, and for the periodicity, a synthetic speech vector using only the periodic pulse excitation vector may be generated. Then, the inter-vector distance between the result vector and the input speech vector may be obtained.

【0038】実施例6. 上記実施例5では、適応音源ベクトルと周期パルス音源
ベクトルとを直交化してその相関を取り除いている。こ
れを、それぞれを合成して得られる合成音声ベクトル同
志を直交化することによりベクトル間の相関を取り除い
てもよい。
Embodiment 6 FIG. In the fifth embodiment, the adaptive excitation vector and the periodic pulse excitation vector are orthogonalized to remove their correlation. The correlation between vectors may be removed by orthogonalizing synthesized speech vectors obtained by synthesizing them.

【0039】実施例7. 上記実施例1では、周期パルス音源ベクトルを1つのベ
クトルで構成している。これを、周期パルス音源ベクト
ルの各パルスのゲインを、図2(b)で2パルスある例
のとき、時間的に前のゲインと後のパルスのゲインを異
なる値に設定するようにしてもよい。
Embodiment 7 FIG. In the first embodiment, the periodic pulse sound source vector is composed of one vector. In this case, when the gain of each pulse of the periodic pulse sound source vector has two pulses in FIG. 2B, the gain before and after the pulse may be set to different values in terms of time. .

【0040】実施例8. 図3はこの発明の請求項3及び請求項5の発明の一実施
例を示す構成図である。図3において、図1と同一の部
分については同一の符号を付し、説明を省略する。図3
において、24は適応音源符号化手段、25はピッチ位
置抽出手段、26は駆動音源符号化手段である。27、
28はピッチ同期化手段であり、29は音源ベクトル生
成手段である。
Embodiment 8 FIG. FIG. 3 is a block diagram showing one embodiment of the third and fifth aspects of the present invention. 3, the same parts as those in FIG. 1 are denoted by the same reference numerals, and description thereof will be omitted. FIG.
, 24 is an adaptive excitation coding means, 25 is a pitch position extraction means, and 26 is a driving excitation coding means. 27,
28 is a pitch synchronization means, and 29 is a sound source vector generation means.

【0041】以下、図3に示した本発明の一実施例の動
作について説明する。まず、符号化部1の動作について
説明する。適応音源符号化手段24は、適応音源符号帳
9より入力される適応音源ベクトルaiと、スペクトル
パラメータ符号化手段7より入力されるスペクトルパラ
メータを用いて合成音声ベクトルAiを合成する。そし
て、入力音声4からフレーム毎に切り出した入力音声ベ
クトルXとの歪みが最小になる合成音声ベクトルAI
びそのゲインβIを探索し、その符号I、及びゲインβI
を量子化したゲインβqIの符号を伝送路3を介して復号
化部2に出力し、選択された適応音源ベクトルaI及び
そのゲインβqIを音源ベクトル生成手段12に出力し、
また誤差ベクトルX’を、 X’=X−βqII とし、このX’と前記適応音源ベクトルaIを駆動音源
符号化手段26に出力するとともに、前記適応音源ベク
トルaIに対応するピッチ周期をピッチ位置抽出手段2
5に出力する。
The operation of the embodiment of the present invention shown in FIG. 3 will be described below. First, the operation of the encoding unit 1 will be described. Adaptive excitation coding means 24 synthesizes synthesized speech vector A i using adaptive excitation vector a i input from adaptive excitation codebook 9 and spectrum parameters input from spectrum parameter coding means 7. Then, a search is made for the synthesized speech vector A I and its gain β I that minimize the distortion with respect to the input speech vector X cut out for each frame from the input speech 4, and its sign I and gain β I are searched for.
Is output to the decoding unit 2 via the transmission path 3 and the selected adaptive excitation vector a I and its gain β qI are output to the excitation vector generation unit 12.
Further, the error vector X ′ is set to X ′ = X−β qI A I , and the X ′ and the adaptive excitation vector a I are output to the driving excitation coding unit 26 and the pitch corresponding to the adaptive excitation vector a I Cycle is pitch position extraction means 2
5 is output.

【0042】ピッチ位置抽出手段25は、適応音源符号
化手段24より入力されたピッチ周期を用いてピッチ周
期のパルス列を作成し、これを音源としてスペクトルパ
ラメータ符号化手段7より入力されるスペクトルパラメ
ータを用いて合成音声ベクトルを生成したときに、入力
音声4からフレーム毎に切り出した入力音声ベクトルX
との歪みが最小となるパルス列を探索する。そして、そ
のパルス位置をピッチ位置としてピッチ同期化手段27
に出力する。
The pitch position extracting means 25 creates a pulse train of the pitch cycle using the pitch cycle input from the adaptive excitation coding means 24 and converts the spectrum parameter input from the spectrum parameter coding means 7 into a pulse train using this as a sound source. Is used to generate a synthesized speech vector, an input speech vector X cut out from the input speech 4 for each frame.
Search for a pulse train that minimizes distortion. Then, the pulse synchronizing means 27 sets the pulse position as a pitch position.
Output to

【0043】図4に、ピッチ位置探索時の動作ブロック
図を示す。この動作は、ピッチ周期のパルスの先頭位置
をフレームの先頭の位置から、例えば1フレームの切り
出し時間を128等分し、1/128時間ずらした値を
順次設定する。そして、先頭位置をずらしたピッチ周期
のパルス列を合成したものが入力音声に最も近いものを
選ぶ。こうすることで、入力音声のフレーミングによら
ず音声のピッチ構造に対して一意に定まる点が求められ
るので、周期性を明確化できる。
FIG. 4 is an operation block diagram at the time of searching for a pitch position. In this operation, the start position of the pulse of the pitch cycle is divided from the start position of the frame by, for example, the cutout time of one frame by 128 and shifted by 1/128 hours. Then, a combination of a pulse train with a pitch cycle shifted from the head position is selected as the one closest to the input voice. By doing so, a point that is uniquely determined with respect to the pitch structure of the voice is determined regardless of the framing of the input voice, so that the periodicity can be clarified.

【0044】駆動音源符号帳11には、例えば音声のピ
ッチ位置に同期したピッチ長で切り出した短周期予測残
差信号より、Linde, Buzo, Gray 法(LBG法)で学習
した結果として、N個の駆動ベクトルが記憶されてい
る。また、各駆動音源ベクトルを切り出したピッチ位置
を、その駆動音源ベクトルのピッチ同期位置として設定
しておく。ピッチ同期化手段27は、前記ピッチ位置抽
出手段25より入力されたピッチ位置に、駆動音源符号
帳11より入力される駆動音源ベクトルcj のピッチ同
期位置を合わせて、ピッチ周期で繰り返すピッチ同期駆
動音源ベクトルcj’を作成する。そして、これを駆動
音源符号化手段26に出力する。図5に本実施例におけ
るピッチ同期駆動音源ベクトルの例を示す。駆動音源符
号化手段26は、前記ピッチ同期化手段27より入力さ
れるピッチ同期駆動音源ベクトルcj’を、前記適応音
源符号化手段24より入力された適応音源ベクトルaI
に対して、例えば式(8)に従って直交化した直交化ピ
ッチ同期駆動音源ベクトルcj”を作成する。
In the driving excitation codebook 11, for example, as a result of learning by the Linde, Buzo, Gray method (LBG method) from a short-period prediction residual signal cut out at a pitch length synchronized with the pitch position of speech, N Are stored. In addition, a pitch position obtained by cutting out each drive sound source vector is set as a pitch synchronization position of the drive sound source vector. The pitch synchronization unit 27 adjusts the pitch synchronization position of the driving excitation vector c j input from the driving excitation codebook 11 to the pitch position input from the pitch position extraction unit 25, and repeats the pitch synchronization driving at a pitch cycle. Create a sound source vector c j ′. Then, this is output to driving excitation coding means 26. FIG. 5 shows an example of the pitch synchronous drive sound source vector in the present embodiment. The driving excitation coding means 26 converts the pitch-synchronized driving excitation vector c j ′ input from the pitch synchronization means 27 into the adaptive excitation vector a I input from the adaptive excitation coding means 24.
Then, for example, an orthogonalized pitch synchronous drive excitation vector c j ″ that is orthogonalized according to equation (8) is created.

【0045】[0045]

【数4】 (Equation 4)

【0046】次に、前記直交化ピッチ同期駆動音源ベク
トルcj”より合成音声ベクトルCj”を合成する。そし
て、前記適応音源符号化手段24から入力された誤差ベ
クトルX’とのベクトル間距離Djを、例えば式(9)
に従って求める。ここで、ゲインγjはベクトル間距離
Dj を最小になるように、例えば式(10)に従って決定
する。
Next, a synthesized speech vector C j ″ is synthesized from the orthogonalized pitch synchronous drive excitation vector c j ″. The inter-vector distance D j with the error vector X ′ input from the adaptive excitation coding means 24 is calculated, for example, by using equation (9).
Ask according to. Here, the gain γ j is determined according to, for example, equation (10) so as to minimize the inter-vector distance D j .

【0047】[0047]

【数5】 (Equation 5)

【0048】次に、このベクトル間距離Djが最小とな
るベクトルCJ”を探索し、この符号J、及びゲインγJ
を量子化したγqJの符号を伝送路3を介して復号部2に
出力する。同時に、選択された直交化ピッチ同期駆動音
源ベクトルcJ”及びそのゲインγqJを音源ベクトル生
成手段12に出力する。このことは、従来はピッチに非
同期であったために生成される音源信号の周期性を乱し
ていた駆動音源ベクトルを、ピッチに同期させることで
音源信号の周期性を向上させることになる。
Next, a vector C J ″ in which the inter-vector distance D j is minimized is searched for, and the sign J and the gain γ J are searched for.
Is output to the decoding unit 2 via the transmission path 3. At the same time, the selected orthogonalized pitch synchronous drive excitation vector c J ″ and its gain γ qJ are output to the excitation vector generation means 12. This means that the period of the excitation signal generated because it was conventionally asynchronous with the pitch. The periodicity of the sound source signal is improved by synchronizing the driving sound source vector, which has been disturbed, with the pitch.

【0049】次に、復号化部2の動作について説明す
る。ピッチ同期化手段28は、駆動音源符号帳16より
入力される駆動音源ベクトルcJから、符号化部1から
入力されたピッチ位置に同期して繰り返したピッチ同期
駆動音源ベクトルcJ’を作成し、駆動音源復号化手段
15に出力する。
Next, the operation of the decoding unit 2 will be described. The pitch synchronization means 28 creates a pitch-synchronous driving excitation vector c J ′ that is repeated in synchronization with the pitch position input from the encoding unit 1 from the driving excitation vector c J input from the driving excitation codebook 16. , To the driving excitation decoding means 15.

【0050】音源ベクトル生成手段29は、まず、駆動
音源復号化手段15より入力されるピッチ同期駆動音源
ベクトルcJ’を、適応音源復号化手段13より入力さ
れる適応音源ベクトルaIと直交化して、直交化ピッチ
同期駆動音源ベクトルcJ”を生成する。次に、前記適
応音源ベクトルaI及び適応音源復号化手段13より入
力されるゲインβqIと、前記直交化ピッチ同期駆動音源
ベクトルcJ”及び駆動音源復号化手段15より入力さ
れるゲインγqJより、次式の音源ベクトル βqII+γqJJ” を生成し、これを適応音源符号帳14及び合成フィルタ
19に出力する。合成フィルタ19の出力は合成して復
元された音声出力となる。
The excitation vector generating means 29 first orthogonalizes the pitch synchronous driving excitation vector c J ′ input from the driving excitation decoding means 15 with the adaptive excitation vector a I input from the adaptive excitation decoding means 13. To generate the orthogonalized pitch synchronous drive excitation vector c J ″. Next, the adaptive excitation vector a I and the gain β qI input from the adaptive excitation decoder 13 and the orthogonalized pitch synchronous drive excitation vector c c "than the gain gamma QJ input from and excitation decoding means 15, excitation vector β qI a I + γ qJ c J of the formula" J, and outputs it to the adaptive excitation codebook 14 and synthesis filter 19 The output of the synthesis filter 19 is an audio output that is synthesized and restored.

【0051】実施例9. 図6はこの発明の請求項4及び請求項5の発明の一実施
例を示す構成図である。図6において、図3と同一の部
分については同一の符号を付し、説明を省略する。図6
において、30は駆動音源符号化手段である。
Embodiment 9 FIG. 6 is a block diagram showing an embodiment of the invention according to claims 4 and 5 of the present invention. 6, the same parts as those in FIG. 3 are denoted by the same reference numerals, and description thereof will be omitted. FIG.
In the above, reference numeral 30 denotes a driving excitation coding means.

【0052】以下、図6に示した本発明の一実施例につ
いて説明する。適応音源符号化手段24は、適応音源符
号帳9より入力される適応音源ベクトルaiと、スペク
トルパラメータ符号化手段7より入力されるスペクトル
パラメータを用いて合成音声ベクトルAiを合成する。
そして、入力音声4からフレーム毎に切り出した入力音
声ベクトルXとの歪みが最小になるベクトルAI及びそ
のゲインβIを探索し、その符号I、及びゲインβIを量
子化したゲインβqIの符号を伝送路3を介して復号化部
2に出力し、選択された適応音源ベクトルaI及びその
ゲインβqIを音源ベクトル生成手段12に出力し、また
誤差ベクトルX’を、 X’=X−βqII とし、このX’と前記適応音源ベクトルaI及びaIに対
応するピッチ周期を駆動音源符号化手段30に出力す
る。
Hereinafter, an embodiment of the present invention shown in FIG. 6 will be described. Adaptive excitation coding means 24 synthesizes synthesized speech vector A i using adaptive excitation vector a i input from adaptive excitation codebook 9 and spectrum parameters input from spectrum parameter coding means 7.
Then, a search is made for a vector A I and its gain β I that minimize the distortion with respect to the input speech vector X cut out from the input speech 4 for each frame, and the sign I and the gain β qI obtained by quantizing the gain β I are obtained . The code is output to the decoding unit 2 via the transmission path 3, the selected adaptive excitation vector a I and its gain β qI are output to the excitation vector generation unit 12, and the error vector X ′ is calculated as follows : X ′ = X −β qI A I, and outputs X ′ and the pitch period corresponding to the adaptive excitation vectors a I and a I to the driving excitation encoding means 30.

【0053】駆動音源符号化手段30は、まず、前記適
応音源符号化手段24より入力されたピッチ周期を用い
ピッチ同期化手段27にピッチ位置kを出力する。この
ピッチ位置kはフレームの先頭の位置からk点目を先頭
にピッチ周期で定まる位置である。ピッチ同期化手段2
7は、前記駆動音源符号化手段30より入力されたピッ
チ位置kに、駆動音源符号帳11より入力される駆動音
源ベクトルcj のピッチ同期位置を合わせて、ピッチ周
期で繰り返すピッチ同期駆動音源ベクトルcjk’を作成
する。そして、これを駆動音源符号化手段30に出力す
る。駆動音源符号化手段30は、前記ピッチ同期化手段
27より入力されたピッチ同期駆動音源ベクトルcjk
を、前記適応音源符号化手段24より入力された適応音
源ベクトルaIに対して、例えば式(11)に従って直交
化した直交化ピッチ同期駆動音源ベクトルcjk”を作成
する。
The driving excitation coding means 30 first outputs the pitch position k to the pitch synchronization means 27 using the pitch period input from the adaptive excitation coding means 24. This pitch position k is a position determined by the pitch cycle starting from the k-th point from the head position of the frame. Pitch synchronization means 2
Reference numeral 7 denotes a pitch-synchronous driving excitation vector that repeats at a pitch cycle by adjusting the pitch synchronization position of the driving excitation vector c j input from the driving excitation codebook 11 to the pitch position k input from the driving excitation encoding means 30. Create c jk '. Then, this is output to driving excitation coding means 30. The driving excitation encoding means 30 outputs the pitch synchronous driving excitation vector c jk ′ input from the pitch synchronization means 27.
Is generated with respect to the adaptive excitation vector a I input from the adaptive excitation encoding means 24, for example, in accordance with equation (11) to create an orthogonalized pitch synchronous drive excitation vector c jk ″.

【0054】[0054]

【数6】 (Equation 6)

【0055】次に、前記直交化ピッチ同期駆動音源ベク
トルcjk”より合成音声ベクトルCjk”を合成する。そ
して、前記適応音源符号化手段24から入力された誤差
ベクトルX’ とのベクトル間距離Djkを、例えば式(1
2)に従って求める。ここで、ゲインγjkはベクトル間
距離Djkを最小になるように、例えば式(13)に従って
決定する。
Next, a synthesized speech vector C jk ″ is synthesized from the orthogonalized pitch synchronous drive excitation vector c jk ″. Then, the inter-vector distance D jk with respect to the error vector X ′ input from the adaptive excitation coding means 24 is calculated by, for example, the equation (1)
Request according to 2). Here, the gain γ jk is determined according to, for example, Expression (13) so as to minimize the inter-vector distance D jk .

【0056】[0056]

【数7】 (Equation 7)

【0057】次に、このベクトル間距離Djkを駆動音源
ベクトルの符号j(j=1, ...,N)とピッチ位置k
(k=1, ...,L)の全ての組み合わせに対して求
め、ベクトル間距離Djkが最小になるベクトルCJK”を
探索し、この符号J、ピッチ位置K、及びゲインγJK
量子化したγqJKの符号を伝送路3を介して復号化部2
に出力する。同時に、選択された直交化ピッチ同期駆動
音源ベクトルcJK”及びそのゲインγqJKを音源ベクト
ル生成手段12に出力する。このことは、ピッチ位置を
合成音声の歪み最小となるものとして抽出することによ
り、合成音声の音質を向上させることになる。
Next, the inter-vector distance Djk is determined by the code j (j = 1,..., N) of the driving sound source vector and the pitch position k.
(K = 1,..., L), a vector C JK ″ that minimizes the inter-vector distance D jk is searched for, and this code J, pitch position K, and gain γ JK are determined. The quantized γ qJK code is transmitted to the decoding unit 2 via the transmission path 3.
Output to At the same time, the selected orthogonalized pitch synchronous drive excitation vector c JK ″ and its gain γ qJK are output to the excitation vector generation unit 12. This is achieved by extracting the pitch position as the one that minimizes the distortion of the synthesized speech. Thus, the sound quality of the synthesized voice is improved.

【0058】実施例10. 図7はこの発明の請求項6の発明の一実施例を示す構成
図である。図7において、図6と同一の部分については
同一の符号を付し、説明を省略する。図7において、3
1は適応音源符号化手段、32、33はピッチ位置抽出
手段である。
Embodiment 10 FIG. FIG. 7 is a block diagram showing an embodiment of the invention according to claim 6 of the present invention. 7, the same parts as those in FIG. 6 are denoted by the same reference numerals, and the description will be omitted. In FIG. 7, 3
1 is an adaptive excitation coding means, and 32 and 33 are pitch position extracting means.

【0059】以下、図7に示した本発明の一実施例の動
作について説明する。まず、符号化部1の動作について
説明する。ピッチ位置抽出手段32は、適応音源符号帳
9より入力される適応音源ベクトルaiと、スペクトル
パラメータ符号化手段7より入力されるスペクトルパラ
メータを用いて合成音声ベクトルAiを合成する。次に
前記適応音源ベクトルaiに対応するピッチ周期のパル
ス列を音源として、前記スペクトルパラメータを用いて
合成音声ベクトルを生成したときに、前記合成音声ベク
トルAiとの歪みが最小となるパルス列を探索する。そ
して、そのパルス位置をピッチ位置として適応音源符号
化手段31に出力する。
The operation of the embodiment of the present invention shown in FIG. 7 will be described below. First, the operation of the encoding unit 1 will be described. The pitch position extracting means 32 synthesizes the synthesized speech vector A i using the adaptive excitation vector a i inputted from the adaptive excitation codebook 9 and the spectrum parameter inputted from the spectrum parameter encoding means 7. Next, when a synthetic speech vector is generated using the spectral parameters by using a pulse train having a pitch cycle corresponding to the adaptive sound source vector a i as a sound source, a pulse train that minimizes distortion from the synthetic speech vector A i is searched for. I do. Then, the pulse position is output to adaptive excitation encoding means 31 as a pitch position.

【0060】適応音源符号化手段31は、まず前記適応
音源符号帳9より入力される適応音源ベクトルaiに対
応するピッチ周期のパルス列を音源として、前記スペク
トルパラメータ符号化手段7より入力されるスペクトル
パラメータを用いて合成音声ベクトルを生成したとき
に、入力音声4からフレーム毎に切り出した入力音声ベ
クトルXとの歪みが最小となるパルス列を探索する。そ
して、そのパルス位置を入力音声におけるピッチ位置と
する。そして、前記ピッチ位置抽出手段32より入力さ
れる適応音源ベクトルaiにおけるピッチ位置が、前記
入力音声におけるピッチ位置よりある距離、例えば5サ
ンプル、以内にある場合のみ以下の処理を行い、それ以
外の場合は前記適応音源ベクトルaiを符号化の対象か
ら外す。
The adaptive excitation coding means 31 first uses the pulse sequence of the pitch period corresponding to the adaptive excitation vector a i input from the adaptive excitation codebook 9 as the excitation, and uses the spectrum input from the spectrum parameter coding means 7 as the excitation. When a synthesized speech vector is generated using the parameters, a pulse train that minimizes distortion from the input speech vector X cut out from the input speech 4 for each frame is searched. Then, the pulse position is set as a pitch position in the input voice. The following processing is performed only when the pitch position in the adaptive sound source vector a i input from the pitch position extraction means 32 is within a certain distance, for example, 5 samples, from the pitch position in the input voice. In this case, the adaptive excitation vector a i is excluded from the encoding target.

【0061】適応音源符号化手段31は、次に、前記適
応音源ベクトルaiにおけるピッチ位置のみ1でその他
は0であるピッチパルスベクトルpiを生成する。そし
て、前記スペクトルパラメータを用い、前記適応音源ベ
クトルaiと前記ピッチパルスベクトルpiより合成音声
ベクトルAi、Piを合成する。また、入力音声ベクトル
Xとのベクトル間距離Diを例えば式(14)に従って求
める。ここで、min(x,y)はx、yのうち値の小
さい方を選択する関数であり、選択結果が出力される。
また、ゲインβAi、βPiは距離Diが最小になるよう
に、例えば式(15)、式(16)に従って決定する。
Next, adaptive excitation coding means 31 generates a pitch pulse vector p i in which only the pitch position in adaptive excitation vector a i is 1 and the others are 0. Then, using the spectral parameters, synthesized speech vectors A i and P i are synthesized from the adaptive sound source vector a i and the pitch pulse vector p i . Also, determine the inter-vector distance D i between the input speech vector X, for example, in accordance with equation (14). Here, min (x, y) is a function for selecting the smaller value of x and y, and the selection result is output.
The gain beta Ai, beta Pi is such that the distance D i is minimized, for example, formula (15), determined in accordance with equation (16).

【0062】[0062]

【数8】 (Equation 8)

【0063】次に、このベクトル間距離が最小となるベ
クトルAI を探索し、その符号I及びそのゲインβAI
量子化したゲインβqAI の符号を伝送路3を介して復号
化部2に出力する。また、前記適応音源ベクトルaI
そのゲインβqAIを、音源ベクトル生成手段12に出力
する。更に、前記ピッチ位置抽出手段32より入力され
た前記適応音源ベクトルaIにおけるピッチ位置を、ピ
ッチ同期化手段27に出力する。また誤差ベクトルX’
を、 X’=X−βqAII とし、このX’ と前記適応音源ベクトルaIを駆動音源
符号化手段26にも出力する。
Next, the vector A I in which the distance between the vectors is minimized is searched, and the code I and the code of the gain β qAI obtained by quantizing the gain β AI are transmitted to the decoding unit 2 via the transmission path 3. Output. The adaptive excitation vector a I and its gain β qAI are output to the excitation vector generation means 12. Further, the pitch position in the adaptive sound source vector a I input from the pitch position extracting means 32 is output to the pitch synchronizing means 27. Also, the error vector X '
Is set to X ′ = X−β qAI A I, and this X ′ and the adaptive excitation vector a I are also output to the driving excitation encoding means 26.

【0064】次に、復号化部2の動作について説明す
る。ピッチ位置抽出手段33は、適応音源符号帳14よ
り入力される適応音源ベクトルaIと、スペクトルパラ
メータ復号化手段18より入力されるスペクトルパラメ
ータよりピッチ位置を抽出する。そして、このピッチ位
置をピッチ同期化手段28に出力する。このことは、ピ
ッチ位置を入力音声を量子化したものである適応音源ベ
クトルとスペクトルパラメータより抽出することにより
復号化部においても一意に求めることが可能であり、ピ
ッチ位置を伝送する必要がなく、合成音声の音質の劣化
を起こさずに伝送情報量の削減することになる。
Next, the operation of the decoding unit 2 will be described. The pitch position extracting means 33 extracts a pitch position from the adaptive excitation vector a I input from the adaptive excitation codebook 14 and the spectrum parameter input from the spectrum parameter decoding means 18. Then, this pitch position is output to the pitch synchronization means 28. This means that the pitch position can be uniquely obtained even in the decoding unit by extracting the pitch position from the adaptive excitation vector and the spectrum parameter, which are obtained by quantizing the input voice, without transmitting the pitch position. This reduces the amount of transmitted information without deteriorating the sound quality of the synthesized speech.

【0065】実施例11. 上記実施例10では、適応音源符号化手段において、適
応音源ベクトルより抽出したピッチ位置と、入力音声よ
り求まるピッチ位置間の距離基準を固定としているが、
例えばピッチ長に応じて可変としてもよい。
Embodiment 11 FIG. In the tenth embodiment, in the adaptive excitation coding means, the distance reference between the pitch position extracted from the adaptive excitation vector and the pitch position obtained from the input speech is fixed.
For example, it may be variable according to the pitch length.

【0066】実施例12. 上記実施例10では、適応音源符号化手段において、適
応音源ベクトルより抽出したピッチ位置と入力音声より
求まるピッチ位置の差が、ある距離以内のもののみ符号
化の対象としているが、全ての適応音源ベクトルがこの
基準を満たさないフレームにおいては、この距離基準を
緩和、あるいは廃止してもよい。
Embodiment 12 FIG. In the tenth embodiment, the adaptive excitation encoding means encodes only the difference between the pitch position extracted from the adaptive excitation vector and the pitch position obtained from the input speech within a certain distance. For frames whose vectors do not meet this criterion, this distance criterion may be relaxed or abolished.

【0067】[0067]

【発明の効果】以上のようにこの発明によれば、音声符
号化装置に、スペクトルパラメータを抽出して符号化す
るスペクトルパラメータ分析符号化手段と、適応音源ベ
クトルを複数生成して記憶する適応音源符号帳と、周期
パルス音源ベクトルを生成する周期パルス音源生成手段
と、入力音声との歪みが最小になるような適応音源ベク
トルと、適応音源ベクトル及び周期パルス音源ベクトル
に付与するゲインを決定して符号化する複数ベクトル適
応音源符号化手段と、音源信号を生成して出力する音源
ベクトル生成手段を備えたので、また、音声復号化装置
には符号化装置に対応する手段を備えたので、僅かの伝
送情報の追加のみで、ピッチ周期性の乱れが少ない高品
質の音声を合成できる効果がある。
As described above, according to the present invention, a speech encoding apparatus extracts and encodes a spectrum parameter and encodes a spectrum parameter, and an adaptive excitation source for generating and storing a plurality of adaptive excitation vectors. A codebook, a periodic pulse excitation generating means for generating a periodic pulse excitation vector, an adaptive excitation vector that minimizes distortion with the input speech, and a gain to be applied to the adaptive excitation vector and the periodic pulse excitation vector. Since the multi-vector adaptive excitation encoding means for encoding and the excitation vector generation means for generating and outputting an excitation signal are provided, and the speech decoding apparatus is provided with means corresponding to the encoding apparatus, By simply adding the transmission information, it is possible to synthesize a high-quality voice with little disturbance of the pitch periodicity.

【0068】また請求項3ないし請求項5の発明によれ
ば、音声符号化装置に、スペクトルパラメータを抽出し
て符号化するスペクトルパラメータ分析符号化手段と、
ピッチ位置抽出手段と、適応音源符号帳と、予め定めれ
たピッチ同期位置を有する駆動音源ベクトルを複数記憶
する駆動音源符号帳と、駆動音源ベクトルをピッチ周期
で繰り返すピッチ同期化手段と、適応音源符号化手段
と、入力音声と復号信号ベクトルの歪みが最小となるピ
ッチ同期駆動音源ベクトルと第2ゲインを決定し符号化
する駆動音源符号化手段と、音源信号を生成して出力す
る音源ベクトル生成手段とを備えたので、また音声復号
化装置には、符号化装置に対応する手段を備えたので、
僅かの伝送情報の追加のみで、ピッチ周期性の乱れが少
ない高品質の音声を合成できる効果がある。
According to the third to fifth aspects of the present invention, the speech encoding device includes a spectrum parameter analysis encoding means for extracting and encoding a spectrum parameter.
Pitch excitation extracting means, an adaptive excitation codebook, a driving excitation codebook storing a plurality of driving excitation vectors having a predetermined pitch synchronization position, a pitch synchronization means for repeating the driving excitation vector at a pitch cycle, Encoding means, driving excitation excitation means for determining and encoding a pitch-synchronous excitation vector and a second gain for minimizing distortion between an input speech and a decoded signal vector, and excitation vector generation for generating and outputting an excitation signal Means, and the speech decoding apparatus has means corresponding to the encoding apparatus,
By adding only a small amount of transmission information, there is an effect that high-quality speech with little disturbance of pitch periodicity can be synthesized.

【0069】また請求項6及び請求項7の発明によれ
ば、音声符号化装置は、スペクトルパラメータを抽出し
て符号化するスペクトルパラメータ分析符号化手段と、
適応音源ベクトルからピッチ位置を抽出するピッチ位置
抽出手段と、適応音源符号帳と、予め定めれたピッチ同
期位置を有する駆動音源ベクトルを複数記憶する駆動音
源符号帳と、駆動音源ベクトルをピッチ周期で繰り返す
ピッチ同期化手段と、適応音源符号化手段と、入力音声
と復号信号ベクトルの歪みが最小となるピッチ同期駆動
音源ベクトルと第2ゲインを決定し符号化する駆動音源
符号化手段と、音源信号を生成して出力する音源ベクト
ル生成手段とを備えたので、また音声復号化装置には、
符号化装置に対応する手段を備えたので、伝送情報の増
加無しに、ピッチ周期性の乱れが少ない高品質の音声を
合成できる効果がある。
According to the sixth and seventh aspects of the present invention, the speech coding apparatus includes a spectrum parameter analysis coding means for extracting and coding a spectrum parameter;
Pitch position extracting means for extracting a pitch position from an adaptive excitation vector, an adaptive excitation codebook, a driving excitation codebook storing a plurality of driving excitation vectors having a predetermined pitch synchronization position, and a driving excitation vector at a pitch period. Pitch synchronizing means to be repeated, adaptive excitation coding means, driving excitation coding means for determining and coding a pitch-synchronized driving excitation vector and a second gain for minimizing distortion of input speech and a decoded signal vector, and excitation signal Sound source vector generating means for generating and outputting
Since means corresponding to the encoding device is provided, there is an effect that high-quality speech with little disturbance of pitch periodicity can be synthesized without increasing transmission information.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の実施例1を示す構成図である。FIG. 1 is a configuration diagram showing a first embodiment of the present invention.

【図2】この発明の周期パルス音源ベクトルの例を示す
説明図である。
FIG. 2 is an explanatory diagram showing an example of a periodic pulse sound source vector according to the present invention.

【図3】この発明の実施例8を示す構成図である。FIG. 3 is a configuration diagram showing an eighth embodiment of the present invention.

【図4】この発明のピッチ位置抽出を示す説明図であ
る。
FIG. 4 is an explanatory diagram showing pitch position extraction according to the present invention.

【図5】この発明のピッチ同期駆動音源ベクトルの例を
示す説明図である。
FIG. 5 is an explanatory diagram showing an example of a pitch synchronous drive sound source vector according to the present invention.

【図6】この発明の実施例9を示す構成図である。FIG. 6 is a configuration diagram showing a ninth embodiment of the present invention.

【図7】この発明の実施例10を示す構成図である。FIG. 7 is a configuration diagram showing a tenth embodiment of the present invention.

【図8】従来の音声符号化復号化装置を示す構成図であ
る。
FIG. 8 is a configuration diagram showing a conventional speech encoding / decoding device.

【図9】適応音源ベクトルの例を示す説明図である。FIG. 9 is an explanatory diagram showing an example of an adaptive sound source vector.

【符号の説明】[Explanation of symbols]

1 符号化部 2 復号化部 3 伝送路 4 入力音声 5 出力音声 6 スペクトル分析手段 7 スペクトルパラメータ符号化手段 8 適応音源符号化手段 9、14 適応音源符号帳 10 駆動音源符号化手段 11、16 駆動音源符号帳 12、17 音源ベクトル生成手段 13 適応音源復号化手段 15 駆動音源復号化手段 18 スペクトルパラメータ復号化手段 19 合成フィルタ 20 複数ベクトル適応音源符号化手段 21、23 周期パルス音源生成手段 22 複数ベクトル適応音源復号化手段 24 適応音源符号化手段 25 ピッチ位置抽出手段 26 駆動音源符号化手段 27、28 ピッチ同期化手段 29 音源ベクトル生成手段 30 駆動音源符号化手段 31 適応音源符号化手段 32、33 ピッチ位置抽出手段 DESCRIPTION OF SYMBOLS 1 Encoding part 2 Decoding part 3 Transmission path 4 Input speech 5 Output speech 6 Spectrum analysis means 7 Spectrum parameter encoding means 8 Adaptive excitation encoding means 9, 14 Adaptive excitation codebook 10 Driving excitation encoding means 11, 16 Driving Excitation codebook 12, 17 Excitation vector generation means 13 Adaptive excitation decoding means 15 Driving excitation decoding means 18 Spectral parameter decoding means 19 Synthetic filter 20 Multiple vector adaptive excitation coding means 21, 23 Periodic pulse excitation generation means 22 Multiple vectors Adaptive excitation decoding means 24 Adaptive excitation coding means 25 Pitch position extraction means 26 Driving excitation coding means 27, 28 Pitch synchronization means 29 Excitation vector generation means 30 Driving excitation coding means 31 Adaptive excitation coding means 32, 33 Pitch Position extraction means

Claims (7)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 スペクトル分析符号化手段、適応音源符
号帳、周期パルス音源生成手段、複数ベクトル適応音源
符号化手段、音源ベクトル生成手段を備え、一定間隔に
区切ったフレーム毎に入力音声を符号化する音声符号化
装置であって、 スペクトル分析符号化手段は、入力音声のスペクトル包
絡情報であるスペクトルパラメータを抽出して符号化
し、 適応音源符号帳は、先行フレームにおいて上記音源ベク
トル生成手段により出力された音源信号から適応音源ベ
クトルを複数生成して記憶し、 周期パルス音源生成手段は、上記適応音源符号帳から出
力される適応音源ベクトルの主要成分として定まる周期
パルス音源ベクトルを出力し、 複数ベクトル適応音源符号化手段は、上記符号化された
スペクトルパラメータと上記複数の適応音源ベクトルの
いずれか1つと該適応音源ベクトルに付与する第1ゲイ
ンと上記周期パルス音源ベクトルと該周期パルス音源ベ
クトルに付与する第2ゲインとから生成した復号音声
と、入力音声との歪みが最小になるよう上記適応音源ベ
クトルと第1ゲインと第2ゲインを決定して符号化し、 音源ベクトル生成手段は、少なくとも上記決定されて符
号化された適応音源ベクトルと第1ゲインと第2ゲイン
と、上記周期パルス音源ベクトルから音源信号を生成し
て出力する音声符号化装置。
1. An apparatus comprising spectrum analysis coding means, adaptive excitation codebook, periodic pulse excitation generation means, multi-vector adaptive excitation encoding means, excitation vector generation means, and encodes input speech for each frame divided at regular intervals. Wherein the spectrum analysis encoding means extracts and encodes a spectrum parameter which is spectrum envelope information of the input speech, and the adaptive excitation codebook is output by the excitation vector generation means in the preceding frame. A plurality of adaptive excitation vectors are generated from the generated excitation signal and stored, and the periodic pulse excitation generating means outputs a periodic pulse excitation vector determined as a main component of the adaptive excitation vector output from the adaptive excitation codebook, and Excitation encoding means includes the encoded spectral parameters and the plurality of adaptive excitation The distortion between the input speech and the decoded speech generated from any one of the tors and the first gain given to the adaptive excitation vector, the periodic pulse excitation vector and the second gain given to the periodic pulse excitation vector is minimized. The adaptive excitation vector, the first gain and the second gain are determined and encoded so that the adaptive excitation vector, the determined and encoded adaptive excitation vector, the first gain and the second gain, and A speech encoding device that generates and outputs a sound source signal from a periodic pulse sound source vector.
【請求項2】 スペクトルパラメータ復号化手段、複数
ベクトル適応音源復号化手段、適応音源符号帳、周期パ
ルス音源生成手段、音源ベクトル生成手段、合成フィル
タを備え、一定間隔に区切ったフレーム毎に符号化され
たスペクトルパラメータの符号と適応音源ベクトルの符
号とゲインの符号とから復号信号を生成する音声復号化
装置であって、 スペクトルパラメータ復号化手段は、スペクトルパラメ
ータの符号を入力され、該スペクトルパラメータの符号
からスペクトルパラメータを復号化し、 複数ベクトル適応音源復号化手段は、適応音源ベクトル
の符号とゲインの符号を入力され、該適応音源ベクトル
の符号を上記適応音源符号帳に出力すると共に、上記ゲ
インの符号から第1のゲインと第2のゲインを復号化
し、 適応音源符号帳は、先行フレームにおいて上記音源ベク
トル生成手段により出力された音源信号から適応音源ベ
クトルを複数生成して記憶すると共に、該記憶された適
応音源ベクトルの中から上記複数ベクトル適応音源復号
化手段により出力される適応音源ベクトルの符号に対応
する適応音源ベクトルを出力し、 周期パルス音源生成手段は、上記適応音源符号帳から出
力される適応音源ベクトルの主要成分として定まる周期
パルス音源ベクトルを出力し、 音源ベクトル生成手段は、少なくとも上記第1ゲインを
付与した適応音源ベクトルと上記第2ゲインを付与した
周期パルス音源ベクトルを加算して音源信号として出力
し、 合成フィルタは、上記復号化されたスペクトルパラメー
タを用いて、上記音源信号から復号信号を生成する音声
復号化装置。
2. An apparatus comprising a spectrum parameter decoding means, a multi-vector adaptive excitation decoding means, an adaptive excitation codebook, a periodic pulse excitation generation means, an excitation vector generation means, and a synthesis filter, and encodes each frame divided at regular intervals. A speech decoding apparatus for generating a decoded signal from the obtained code of the spectrum parameter, the code of the adaptive excitation vector, and the code of the gain, wherein the spectrum parameter decoding means receives the code of the spectrum parameter, The multi-vector adaptive excitation decoding means receives the code of the adaptive excitation vector and the code of the gain, and outputs the code of the adaptive excitation vector to the adaptive excitation codebook. Decoding the first gain and the second gain from the code, Are generated and stored in the preceding frame from the excitation signal output by the excitation vector generation means, and output from the stored adaptive excitation vector by the multi-vector adaptive excitation decoding means. The periodic pulse excitation generating means outputs a periodic pulse excitation vector determined as a main component of the adaptive excitation vector output from the adaptive excitation codebook, and outputs an excitation vector corresponding to the code of the adaptive excitation vector. The generating means adds at least the adaptive excitation vector to which the first gain has been added and the periodic pulse excitation vector to which the second gain has been added, and outputs the sum as an excitation signal. The synthesis filter uses the decoded spectral parameters. And a speech decoding apparatus for generating a decoded signal from the sound source signal.
【請求項3】 スペクトル分析符号化手段、ピッチ位置
抽出手段、適応音源符号帳、駆動音源符号帳、ピッチ同
期化手段、適応音源符号化手段、駆動音源符号化手段、
音源ベクトル生成手段を備え、一定間隔に区切ったフレ
ーム毎に、入力音声を符号化する音声符号化装置であっ
て、 スペクトル分析符号化手段は、入力音声のスペクトル包
絡情報であるスペクトルパラメータを抽出して符号化
し、 ピッチ位置抽出手段は、入力音声からピッチ周期間隔で
並ぶ複数の特徴点をピッチ位置として抽出して符号化
し、 適応音源符号帳は、先行フレームにおいて上記音源ベク
トル生成手段により出力された音源信号から適応音源ベ
クトルを複数生成して記憶し、 駆動音源符号帳は、予め定められたピッチ同期位置を有
する駆動音源ベクトルを複数記憶し、 ピッチ同期化手段は、上記符号化されたピッチ位置に上
記各駆動音源ベクトルのピッチ同期位置を合わせ、駆動
音源ベクトルをピッチ周期で繰り返したピッチ同期駆動
音源ベクトルを生成し、 適応音源符号化手段は、上記符号化されたスペクトルパ
ラメータに基づいて上記適応音源ベクトルの合成音声ベ
クトルを生成し、入力音声と第1ゲインを付与した上記
適応音源ベクトルの合成音声ベクトルの歪みが最小にな
るよう適応音源ベクトル、第1ゲインを決定し、該決定
された適応音源ベクトルの符号を出力すると共に、該第
1ゲインを符号化し、 駆動音源符号化手段は、上記符号化されたスペクトルパ
ラメータに基づいて上記ピッチ同期駆動音源ベクトルの
合成音声ベクトルを生成し、上記決定された第1ゲイン
を付与した上記決定された適応音源ベクトルの合成音声
ベクトルと第2ゲインを付与した上記ピッチ同期駆動音
源ベクトルの合成音声ベクトルの和を復号信号ベクトル
としたとき、入力音声と該復号信号ベクトルの歪みが最
小となるよう上記ピッチ同期駆動音源ベクトルの合成音
声ベクトルと第2ゲインを決定し、該決定されたピッチ
同期駆動音源ベクトルの符号を出力すると共に、該決定
された第2ゲインを符号化し、 音源ベクトル生成手段は、少なくとも上記決定されて符
号化された適応音源ベクトルと第1ゲインと第2ゲイン
と、上記ピッチ同期駆動音源ベクトルから音源信号を生
成して出力する音声符号化装置。
3. A spectrum analysis encoding means, a pitch position extracting means, an adaptive excitation codebook, a driving excitation codebook, a pitch synchronization means, an adaptive excitation encoding means, a driving excitation encoding means,
A speech encoding apparatus comprising a sound source vector generation unit and encoding an input speech for each frame divided at a fixed interval, wherein the spectrum analysis encoding unit extracts a spectrum parameter which is spectrum envelope information of the input speech. The pitch position extracting means extracts a plurality of feature points arranged at a pitch period interval from the input speech as pitch positions and encodes them, and the adaptive excitation codebook is output by the excitation vector generating means in the preceding frame. A plurality of adaptive excitation vectors are generated and stored from the excitation signal, the driving excitation codebook stores a plurality of driving excitation vectors having a predetermined pitch synchronization position, and the pitch synchronization unit controls the encoded pitch position. To the pitch synchronization position of each drive sound source vector, and repeat the drive sound source vector at the pitch cycle. The adaptive excitation encoding means generates a synthesized speech vector of the adaptive excitation vector based on the encoded spectral parameters, and applies the input speech and the first gain to the adaptive excitation vector. The adaptive excitation vector and the first gain are determined so as to minimize the distortion of the synthesized speech vector, and the code of the determined adaptive excitation vector is output.
The driving excitation encoding means generates a synthesized speech vector of the pitch-synchronized driving excitation vector based on the encoded spectral parameters, and applies the determined first gain. When the sum of the synthesized speech vector of the adaptive excitation vector and the synthesized speech vector of the pitch-synchronized excitation vector to which the second gain is applied is defined as a decoded signal vector, the input speech and the decoded signal vector are minimized in distortion. Determining a synthesized speech vector and a second gain of the pitch-synchronous drive excitation vector, outputting a code of the determined pitch-synchronous drive excitation vector, and encoding the determined second gain; At least the determined and encoded adaptive excitation vector, the first gain and the second gain, and the pitch synchronization Speech encoding apparatus for generating and outputting a sound source signal from Doongen vector.
【請求項4】 スペクトル分析符号化手段、適応音源符
号帳、駆動音源符号帳、ピッチ同期化手段、適応音源符
号化手段、駆動音源符号化手段、音源ベクトル生成手段
を備え、一定間隔に区切ったフレーム毎に入力音声を符
号化する音声符号化装置であって、 スペクトル分析符号化手段は、入力音声のスペクトル包
絡情報であるスペクトルパラメータを抽出して符号化
し、 適応音源符号帳は、先行フレームにおいて上記音源ベク
トル生成手段により出力された音源信号から適応音源ベ
クトルを複数生成して記憶し、 駆動音源符号帳は、予め定められたピッチ同期位置を有
する駆動音源ベクトルを複数記憶し、 ピッチ同期化手段は、時間軸上にピッチ周期間隔で並ぶ
複数の点であるピッチ位置に駆動音源ベクトルのピッチ
同期位置を合わせ、駆動音源ベクトルをピッチ周期で繰
り返したピッチ同期駆動音源ベクトルを生成し、 適応音源符号化手段は、上記符号化されたスペクトルパ
ラメータに基づいて上記適応音源ベクトルの合成音声ベ
クトルを生成し、入力音声と第1ゲインを付与した上記
適応音源ベクトルの合成音声ベクトルの歪みが最小にな
るよう適応音源ベクトル、第1ゲインを決定し、該決定
された適応音源ベクトルの符号を出力すると共に、該決
定された第1ゲインを符号化し、 駆動音源符号化手段は、上記符号化されたスペクトルパ
ラメータに基づいて、上記ピッチ同期駆動音源ベクトル
の合成音声ベクトルを生成し、上記決定された第1ゲイ
ンを付与した上記決定された適応音源ベクトルの合成音
声ベクトルと第2ゲインを付与した上記ピッチ同期駆動
音源ベクトルの合成音声ベクトルの和を復号信号ベクト
ルとしたとき、入力音声と該復号信号ベクトルの歪みが
最小となるよう上記ピッチ同期駆動音源ベクトルの合成
音声ベクトルとピッチ位置と第2ゲインを決定し、該決
定されたピッチ同期駆動音源ベクトルの符号を出力する
と共に、該決定されたピッチ位置と第2ゲインを符号化
し、 音源ベクトル生成手段は、少なくとも上記決定されて符
号化された適応音源ベクトルと第1ゲインと第2ゲイン
と、上記ピッチ同期駆動音源ベクトルから音源信号を生
成して出力する音声符号化装置。
4. An apparatus comprising spectrum analysis coding means, adaptive excitation codebook, driving excitation codebook, pitch synchronization means, adaptive excitation coding means, driving excitation coding means, excitation vector generation means, and divided at regular intervals. A speech encoding apparatus for encoding an input speech for each frame, wherein the spectrum analysis encoding means extracts and encodes a spectrum parameter which is spectrum envelope information of the input speech, A plurality of adaptive excitation vectors are generated and stored from the excitation signal output by the excitation vector generation means, and the driving excitation codebook stores a plurality of driving excitation vectors having a predetermined pitch synchronization position. Adjusts the pitch synchronization position of the driving sound source vector to the pitch position, which is a plurality of points arranged at a pitch cycle interval on the time axis, Generating a pitch-synchronous drive excitation vector obtained by repeating the dynamic excitation vector at a pitch cycle, the adaptive excitation encoding means generates a synthesized speech vector of the adaptive excitation vector based on the encoded spectral parameters, and The adaptive excitation vector and the first gain are determined so that the distortion of the synthesized speech vector of the adaptive excitation vector to which the first gain is added is minimized, and the code of the determined adaptive excitation vector is output, and the determined adaptive excitation vector is output. The first excitation is encoded, and the driving excitation encoding means generates a synthesized speech vector of the pitch synchronous excitation vector based on the encoded spectral parameters, and provides the determined first gain. The synthesized speech vector of the determined adaptive sound source vector and the pitch synchronous drive sound source vector to which the second gain is added. When the sum of the synthesized speech vectors is used as the decoded signal vector, the synthesized speech vector, pitch position, and second gain of the pitch synchronous drive excitation vector are determined so that the distortion of the input speech and the decoded signal vector is minimized. Outputting the code of the determined pitch-synchronous drive excitation vector and encoding the determined pitch position and the second gain, wherein the excitation vector generating means includes at least the determined and encoded adaptive excitation vector and the first A speech encoding device for generating and outputting a sound source signal from a gain, a second gain, and the pitch synchronized drive sound source vector.
【請求項5】 スペクトルパラメータ復号化手段、適応
音源復号化手段、適応音源符号帳、駆動音源符号帳、ピ
ッチ同期化手段、駆動音源復号化手段、音源ベクトル生
成手段、合成フィルタを備え、一定間隔に区切ったフレ
ーム毎に符号化されたスペクトルパラメータの符号と適
応音源ベクトルの符号と駆動音源ベクトルの符号とゲイ
ンの符号とピッチ位置の符号とから復号信号を生成する
音声復号化装置であって、 スペクトルパラメータ復号化手段はスペクトルパラメー
タの符号を入力され、該スペクトルパラメータの符号か
らスペクトルパラメータを復号化し、 適応音源復号化手段は、適応音源ベクトルの符号と該適
応音源ベクトルに付与する第1ゲインの符号を入力さ
れ、該適応音源ベクトルの符号を上記適応音源符号帳に
出力すると共に、上記第1ゲインの符号から第1のゲイ
ンを復号化し、 適応音源符号帳は、先行フレームにおいて上記音源ベク
トル生成手段により出力された音源信号から適応音源ベ
クトルを複数生成して記憶すると共に、該記憶された適
応音源ベクトルの中から上記適応音源復号化手段により
出力される適応音源ベクトルの符号に対応する適応音源
ベクトルを出力し、 駆動音源符号帳は、予め定められたピッチ同期位置を有
する駆動音源ベクトルを複数記憶すると共に、該記憶さ
れた駆動音源ベクトルの中から上記駆動音源ベクトル復
号化手段により出力される駆動音源ベクトルの符号に対
応する駆動音源ベクトルをピッチ同期化手段に対して出
力し、 ピッチ同期化手段は、ピッチ位置の符号を入力され該符
号からピッチ位置を復号化し、該復号化されたピッチ位
置に上記ピッチ同期位置をあわせ、上記駆動音源符号帳
から入力された駆動音源ベクトルをピッチ周期で繰り返
したピッチ同期駆動音源ベクトルを生成し、 駆動音源復号化手段は、駆動音源ベクトルの符号と該駆
動音源ベクトルに付与する第2ゲインの符号を入力さ
れ、該駆動音源ベクトルの符号を上記駆動音源符号帳に
出力すると共に、上記第2ゲインの符号から第2のゲイ
ンを復号化し、 音源ベクトル生成手段は、上記第1ゲインを付与した適
応音源ベクトルと第2ゲインを付与したピッチ同期駆動
音源ベクトルの和である音源信号を出力し、 合成フィルタは、上記復号化されたスペクトルパラメー
タを用いて、上記音源信号から復号信号を生成する音声
復号化装置。
5. An apparatus comprising spectrum parameter decoding means, adaptive excitation decoding means, adaptive excitation codebook, driving excitation codebook, pitch synchronization means, driving excitation decoding means, excitation vector generation means, synthesis filter, and a fixed interval. An audio decoding device that generates a decoded signal from a code of a spectrum parameter encoded for each frame divided into a code of an adaptive excitation vector, a code of a drive excitation vector, a code of a gain, and a code of a pitch position, The spectrum parameter decoding means receives a code of the spectrum parameter, decodes the spectrum parameter from the code of the spectrum parameter, and the adaptive excitation decoding means determines the code of the adaptive excitation vector and the first gain to be given to the adaptive excitation vector. When a code is input and the code of the adaptive excitation vector is output to the adaptive excitation codebook, In addition, the first gain is decoded from the code of the first gain, and the adaptive excitation codebook generates and stores a plurality of adaptive excitation vectors from the excitation signal output by the excitation vector generation means in the preceding frame, An adaptive excitation vector corresponding to the code of the adaptive excitation vector output by the adaptive excitation decoding means is output from the stored adaptive excitation vectors, and the driving excitation codebook has a predetermined pitch synchronization position. A plurality of drive excitation vectors are stored, and a drive excitation vector corresponding to the code of the drive excitation vector output by the drive excitation vector decoding unit is output from the stored drive excitation vectors to the pitch synchronization unit. The pitch synchronization means receives the code of the pitch position, decodes the pitch position from the code, and The pitch synchronization position is adjusted to the calculated pitch position, and a pitch synchronization driving excitation vector is generated by repeating the driving excitation vector input from the driving excitation codebook at a pitch cycle. A code and a code of a second gain to be given to the driving excitation vector are input, and the code of the driving excitation vector is output to the driving excitation codebook, and a second gain is decoded from the code of the second gain, The excitation vector generation means outputs an excitation signal which is the sum of the adaptive excitation vector to which the first gain is applied and the pitch-synchronous drive excitation vector to which the second gain is applied, and the synthesis filter converts the decoded spectrum parameter to A speech decoding apparatus for generating a decoded signal from the sound source signal using the speech decoding apparatus.
【請求項6】 スペクトル分析符号化手段、適応音源符
号帳、ピッチ位置抽出手段、駆動音源符号帳、ピッチ同
期化手段、適応音源符号化手段、駆動音源符号化手段、
音源ベクトル生成手段を備え、一定間隔に区切ったフレ
ーム毎に、入力音声を符号化する音声符号化装置であっ
て、 スペクトル分析符号化手段は、入力音声信号のスペクト
ル包絡情報であるスペクトルパラメータを抽出して符号
化し、 適応音源符号帳は、先行フレームにおいて上記音源ベク
トル生成手段により出力された音源信号から適応音源ベ
クトルを複数生成して記憶し、 ピッチ位置抽出手段は、上記適応音源ベクトルからピッ
チ周期間隔で並ぶ複数の特徴点をピッチ位置として抽出
し、 駆動音源符号帳は、予め定められたピッチ同期位置を有
する駆動音源ベクトルを複数記憶し、 ピッチ同期化手段は、上記抽出されたピッチ位置に上記
各駆動音源ベクトルのピッチ同期位置を合わせ、駆動音
源ベクトルをピッチ周期で繰り返したピッチ同期駆動音
源ベクトルを生成し、 適応音源符号化手段は、上記符号化されたスペクトルパ
ラメータに基づいて上記適応音源ベクトルの合成音声ベ
クトルを生成し、入力音声と第1ゲインを付与した上記
適応音源ベクトルの合成音声ベクトルの歪みが最小にな
るよう適応音源ベクトル、第1ゲインを決定し、該決定
された適応音源ベクトルの符号を出力すると共に、該第
1ゲインを符号化し、 駆動音源符号化手段は、上記符号化されたスペクトルパ
ラメータに基づいて上記ピッチ同期駆動音源ベクトルの
合成音声ベクトルを生成し、上記決定された第1ゲイン
を付与した上記決定された適応音源ベクトルの合成音声
ベクトルと第2ゲインを付与した上記ピッチ同期駆動音
源ベクトルの合成音声ベクトルの和を復号信号ベクトル
としたとき、入力音声と該復号信号ベクトルの歪みが最
小となるよう上記ピッチ同期駆動音源ベクトルの合成音
声ベクトルと第2ゲインを決定し、該決定されたピッチ
同期駆動音源ベクトルの符号を出力すると共に、該決定
された第2ゲインを符号化し、 音源ベクトル生成手段は、少なくとも上記決定されて符
号化された適応音源ベクトルと第1ゲインと第2ゲイン
と、上記ピッチ同期駆動音源ベクトルから音源信号を生
成して出力する音声符号化装置。
6. A spectrum analysis coding means, an adaptive excitation codebook, a pitch position extracting means, a driving excitation codebook, a pitch synchronization means, an adaptive excitation coding means, a driving excitation coding means,
An audio encoding apparatus comprising an excitation vector generation unit and encoding input audio for each frame divided at a fixed interval, wherein the spectrum analysis encoding unit extracts a spectrum parameter which is spectrum envelope information of the input audio signal. The adaptive excitation codebook generates and stores a plurality of adaptive excitation vectors from the excitation signal output by the excitation vector generating means in the preceding frame, and the pitch position extracting means calculates a pitch period from the adaptive excitation vector. A plurality of feature points arranged at intervals are extracted as a pitch position, the driving excitation codebook stores a plurality of driving excitation vectors having a predetermined pitch synchronization position, and the pitch synchronization unit stores the plurality of feature points in the extracted pitch position. The pitch synchronized position of each drive sound source vector is adjusted, and the drive sound source vector is repeated at the pitch cycle. The adaptive excitation encoding means generates a synthesized speech vector of the adaptive excitation vector based on the encoded spectral parameters, and applies the input speech and the first gain to the adaptive excitation. The adaptive excitation vector and the first gain are determined so that the distortion of the synthesized speech vector of the vector is minimized, the code of the determined adaptive excitation vector is output, and the first gain is encoded. Generates a synthesized speech vector of the pitch-synchronous drive excitation vector based on the encoded spectral parameters, and generates a synthesized speech vector of the determined adaptive excitation vector to which the determined first gain is added and a second speech vector. When the sum of the synthesized voice vector of the pitch synchronous drive excitation vector with the gain given is a decoded signal vector, Determining a synthesized speech vector and a second gain of the pitch-synchronous drive excitation vector so as to minimize distortion of the power speech and the decoded signal vector; outputting a code of the determined pitch-synchronous drive excitation vector; The excitation vector generating means generates an excitation signal from at least the determined and encoded adaptive excitation vector, the first gain and the second gain, and the pitch-synchronized excitation excitation vector. An audio encoding device to output.
【請求項7】 スペクトルパラメータ復号化手段、適応
音源復号化手段、適応音源符号帳、ピッチ位置抽出手
段、駆動音源符号帳、ピッチ同期化手段、駆動音源復号
化手段、音源ベクトル生成手段、合成フィルタを備え、
一定間隔に区切ったフレーム毎に符号化されたスペクト
ルパラメータの符号と適応音源ベクトルの符号と駆動音
源ベクトルの符号とゲインの符号とから復号信号を生成
する音声復号化装置であって、 スペクトルパラメータ復号化手段は、スペクトルパラメ
ータの符号を入力され、該スペクトルパラメータの符号
からスペクトルパラメータを復号化し、 適応音源復号化手段は、適応音源ベクトルの符号と該適
応音源ベクトルに付与する第1ゲインの符号を入力さ
れ、該適応音源ベクトルの符号を上記適応音源符号帳に
出力すると共に、上記第1ゲインの符号から第1のゲイ
ンを復号化し、 適応音源符号帳は、先行フレームにおいて上記音源ベク
トル生成手段により出力された音源信号から適応音源ベ
クトルを複数生成して記憶すると共に、該記憶された適
応音源ベクトルの中から上記適応音源復号化手段により
出力される適応音源ベクトルの符号に対応する適応音源
ベクトルを出力し、 ピッチ位置抽出手段は、上記適応音源ベクトルからピッ
チ周期間隔で並ぶ複数の特徴点をピッチ位置として抽出
し、 駆動音源符号帳は、予め定められたピッチ同期位置を有
する駆動音源ベクトルを複数記憶すると共に、該記憶さ
れた駆動音源ベクトルの中から上記駆動音源ベクトル復
号化手段により出力される駆動音源ベクトルの符号に対
応する駆動音源ベクトルをピッチ同期化手段に対して出
力し、 ピッチ同期化手段は、上記抽出されたピッチ位置に上記
各駆動音源ベクトルのピッチ同期位置をあわせ、上記駆
動音源符号帳から入力された駆動音源ベクトルをピッチ
周期で繰り返したピッチ同期駆動音源ベクトルを生成
し、 駆動音源復号化手段は、駆動音源ベクトルの符号と該駆
動音源ベクトルに付与する第2ゲインの符号を入力さ
れ、該駆動音源ベクトルの符号を上記駆動音源符号帳に
出力すると共に、上記第2ゲインの符号から第2のゲイ
ンを復号化し、 音源ベクトル生成手段は、上記第1ゲインを付与した適
応音源ベクトルと第2ゲインを付与したピッチ同期駆動
音源ベクトルの和である音源信号を出力し、 合成フィルタは、上記復号化されたスペクトルパラメー
タを用いて、上記音源信号から復号信号を生成する音声
復号化装置。
7. Spectral parameter decoding means, adaptive excitation decoding means, adaptive excitation codebook, pitch position extraction means, driving excitation codebook, pitch synchronization means, driving excitation decoding means, excitation vector generation means, synthesis filter With
An audio decoding apparatus for generating a decoded signal from a code of a spectral parameter encoded for each frame divided at a fixed interval, a code of an adaptive excitation vector, a code of a driving excitation vector, and a code of a gain, comprising: The coding means receives the code of the spectrum parameter and decodes the spectrum parameter from the code of the spectrum parameter. The adaptive excitation decoding means sets the code of the adaptive excitation vector and the code of the first gain to be given to the adaptive excitation vector. The adaptive excitation codebook is input and outputs the code of the adaptive excitation vector to the adaptive excitation codebook, and decodes the first gain from the code of the first gain. While generating and storing a plurality of adaptive sound source vectors from the output sound source signal, An adaptive excitation vector corresponding to the code of the adaptive excitation vector output by the adaptive excitation decoding means is output from the stored adaptive excitation vectors, and the pitch position extracting means is arranged at a pitch cycle interval from the adaptive excitation vector. A plurality of feature points are extracted as pitch positions. The driving excitation codebook stores a plurality of driving excitation vectors having a predetermined pitch synchronization position, and decodes the driving excitation vector from among the stored driving excitation vectors. A drive excitation vector corresponding to the sign of the drive excitation vector output by the synchronization means is output to the pitch synchronization means, and the pitch synchronization means adjusts the pitch synchronization position of each of the drive excitation vectors to the extracted pitch position. And the pitch obtained by repeating the driving excitation vector input from the driving excitation codebook at the pitch cycle. A driving excitation vector is generated, and the driving excitation decoding unit receives the code of the driving excitation vector and the code of the second gain to be given to the driving excitation vector, and outputs the code of the driving excitation vector to the driving excitation codebook. At the same time, the second gain is decoded from the code of the second gain, and the excitation vector generation means is the sum of the adaptive excitation vector to which the first gain is applied and the pitch synchronous excitation excitation vector to which the second gain is applied. A speech decoding device that outputs a sound source signal, and a synthesis filter generates a decoded signal from the sound source signal using the decoded spectrum parameter.
JP5240135A 1992-09-29 1993-09-27 Audio encoding device and audio decoding device Expired - Lifetime JP3024455B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5240135A JP3024455B2 (en) 1992-09-29 1993-09-27 Audio encoding device and audio decoding device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4-259601 1992-09-29
JP25960192 1992-09-29
JP5240135A JP3024455B2 (en) 1992-09-29 1993-09-27 Audio encoding device and audio decoding device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP11343251A Division JP3041325B1 (en) 1992-09-29 1999-12-02 Audio encoding device and audio decoding device

Publications (2)

Publication Number Publication Date
JPH06202699A JPH06202699A (en) 1994-07-22
JP3024455B2 true JP3024455B2 (en) 2000-03-21

Family

ID=26534595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5240135A Expired - Lifetime JP3024455B2 (en) 1992-09-29 1993-09-27 Audio encoding device and audio decoding device

Country Status (1)

Country Link
JP (1) JP3024455B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10228491A (en) * 1997-02-13 1998-08-25 Toshiba Corp Logic verification device
EP1734512B1 (en) 1997-10-22 2015-09-09 Godo Kaisha IP Bridge 1 CELP encoder and a method of CELP encoding
WO2007037613A1 (en) * 2005-09-27 2007-04-05 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
SG179433A1 (en) * 2007-03-02 2012-04-27 Panasonic Corp Encoding device and encoding method
CA2759914A1 (en) * 2009-05-29 2010-12-02 Nippon Telegraph And Telephone Corporation Encoding device, decoding device, encoding method, decoding method and program therefor

Also Published As

Publication number Publication date
JPH06202699A (en) 1994-07-22

Similar Documents

Publication Publication Date Title
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
JP3134817B2 (en) Audio encoding / decoding device
EP0409239B1 (en) Speech coding/decoding method
KR100304682B1 (en) Fast Excitation Coding for Speech Coders
JPH08123494A (en) Speech encoding device, speech decoding device, speech encoding and decoding method, and phase amplitude characteristic derivation device usable for same
JP2707564B2 (en) Audio coding method
JPH11327597A (en) Voice coding device and voice decoding device
JP2002258896A (en) Method and device for encoding voice
US5091946A (en) Communication system capable of improving a speech quality by effectively calculating excitation multipulses
JP3024455B2 (en) Audio encoding device and audio decoding device
JP2844589B2 (en) Audio signal encoding method and apparatus
JP3303580B2 (en) Audio coding device
JPS6238500A (en) Highly efficient voice coding system and apparatus
JPH0258100A (en) Voice encoding and decoding method, voice encoder, and voice decoder
JP2956068B2 (en) Audio encoding / decoding system
JP3041325B1 (en) Audio encoding device and audio decoding device
JP3319396B2 (en) Speech encoder and speech encoder / decoder
JPH0519795A (en) Excitation signal encoding and decoding method for voice
JP3410931B2 (en) Audio encoding method and apparatus
JP3099844B2 (en) Audio encoding / decoding system
JP2508002B2 (en) Speech coding method and apparatus thereof
JP3063087B2 (en) Audio encoding / decoding device, audio encoding device, and audio decoding device
JP3471542B2 (en) Audio coding device
JP3232728B2 (en) Audio coding method
JP3128226B2 (en) Audio coding method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080121

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090121

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100121

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100121

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110121

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120121

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130121

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130121

Year of fee payment: 13

EXPY Cancellation because of completion of term