JPH05127699A - Code excitation linear prediction and encoding system - Google Patents

Code excitation linear prediction and encoding system

Info

Publication number
JPH05127699A
JPH05127699A JP3251152A JP25115291A JPH05127699A JP H05127699 A JPH05127699 A JP H05127699A JP 3251152 A JP3251152 A JP 3251152A JP 25115291 A JP25115291 A JP 25115291A JP H05127699 A JPH05127699 A JP H05127699A
Authority
JP
Japan
Prior art keywords
excitation
vector
code
multiplier
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3251152A
Other languages
Japanese (ja)
Other versions
JP3031765B2 (en
Inventor
Hiromi Aoyanagi
弘美 青柳
Hiroshi Katsuragawa
浩 桂川
Yoshihiro Ariyama
義博 有山
Kenichiro Hosoda
賢一郎 細田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3251152A priority Critical patent/JP3031765B2/en
Publication of JPH05127699A publication Critical patent/JPH05127699A/en
Application granted granted Critical
Publication of JP3031765B2 publication Critical patent/JP3031765B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To obtain sufficient synthesized speech quality even when a transmission bit rate is low. CONSTITUTION:With Ia, Is, and Ig supplied from an auditory error calculating circuit 316, an adaptive excitation code book 305 outputs and supplies an optimum code vector eai to a multiplier 308, and a gain code book 306 outputs a pair of optimum excitation gains gak, gsk and supplies the gak to a multiplier 308 and the gsk to a multiplier 310. The multiplier 308 supplies a multiplication vector eaik to an adder 309. The multiplier 310 supplies a multiplication vector eslk to the adder 309. The adder 309 supplies the added excitation vector (e) to a multiplier 312, which multiplies it by an excitation gain sigma and supplies the excitation vector eg to a composing filter 313. The composing filter 313 filters the excitation vector eg with the LSP coefficient obtained by an LSP inverse quantizer 303 to obtain a synthesized speech.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、コード励振線形予測
符号化方式に関し、例えば音声信号などの高品質圧縮符
号化方式として適応し得るものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a code-excited linear predictive coding system, which can be applied as a high-quality compression coding system for voice signals.

【0002】[0002]

【従来の技術】従来例のコード励振線形予測符号化方式
は、例えば、文献1に示されている。 文献1:『1989,Proc.IEEE Int.Conf.on Acoustics,Spe
ech and Signal Processing,PP.65-pp.68,N.S.Jayant a
nd J.H.Chen,"Speech Coding with Time-Varying Bit A
llocations to Excitation and LPC Parameters"』 図2は、一例のコード励振線形予測符号化器の機能ブロ
ック図である。
2. Description of the Related Art A conventional code-excited linear predictive coding system is disclosed in, for example, Document 1. Reference 1: "1989, Proc.IEEE Int.Conf.on Acoustics, Spe
ech and Signal Processing, PP.65-pp.68, NSJayant a
nd JH Chen, "Speech Coding with Time-Varying Bit A
llocations to Excitation and LPC Parameters "] FIG. 2 is a functional block diagram of an example of a code excitation linear predictive encoder.

【0003】図2において、入力原音声ベクトルSは、
分析回路102に供給され、ここでPARCOR(PARti
al auto-CORrelation:偏自己相関)分析などを行い、量
子化短時間予測係数αjpを多重化回路111に供給し、
声道予測係数αjqを短時間フィルタ103に供給する。
In FIG. 2, the input original speech vector S is
It is supplied to the analysis circuit 102, where PARCOR (PARti
al auto-COR relation: partial autocorrelation) analysis, etc., and supplies the quantized short-time prediction coefficient αjp to the multiplexing circuit 111.
The vocal tract prediction coefficient αjq is supplied to the short-time filter 103.

【0004】次に、スイッチ108と113を開き、適
応励振コードテーブル104は、適応励振コードベクト
ルea(i)(i=1〜n)を供給される適応励振コードイ
ンデックスIaに基づいて選択出力する。ゲイン制御回
路119は、原音声ベクトルSと、適応励振コードベク
トルea(i)とから、適応励振ゲイン制御コードβapを生
成し多重化回路111に供給する。更に、ゲイン制御回
路119は、適応励振ゲイン制御信号βapを乗算器12
2に供給して、適応励振コードベクトルβea(i)と乗算
してゲインの制御を行い、適応励振コードベクトルβea
(i)を加算器110に供給する。
Next, the switches 108 and 113 are opened, and the adaptive excitation code table 104 selectively outputs the adaptive excitation code vector ea (i) (i = 1 to n) based on the supplied adaptive excitation code index Ia. .. The gain control circuit 119 generates an adaptive excitation gain control code βap from the original speech vector S and the adaptive excitation code vector ea (i) and supplies it to the multiplexing circuit 111. Further, the gain control circuit 119 outputs the adaptive excitation gain control signal βap to the multiplier 12
2 to the adaptive excitation code vector βea (i) to control the gain to obtain the adaptive excitation code vector βea (i).
(i) is supplied to the adder 110.

【0005】加算器110は、適応励振コードベクトル
βea(i)をそのまま励振ベクトルe(i)として、短時間
フィルタに供給し、合成音声ベクトルSwを減算器10
9に供給する。減算器109は、原音声ベクトルSと合
成音声ベクトルSwの成分単位の減算を行い、誤差ベク
トルer(i)を聴覚フィルタ105に供給する。聴覚フィ
ルタ105は、フィルタリングを行いベクトルew(i)を
聴覚誤差計算回路106に供給する。聴覚誤差計算回路
106は、ベクトルew(i)の各成分単位の二乗平均gi
を計算し、このgiが最小となるiを最適な適応励振コ
ードのインデックスIaとして、適応励振コードテーブ
ル104と多重化回路111に供給する。 次には、ス
イッチ113を閉じて、確率的励振コードテーブル10
7から供給される確率的励振コードベクトルes(i)に対
して、ゲイン制御回路123で生成した確率的励振ゲイ
ン制御信号βsqを乗算器126で乗算してゲイン制御
し、確率的励振コードベクトルβes(i)を加算器110
に供給する。この時にゲイン制御回路123は、確率的
励振ゲイン制御コードβspを多重化回路111に供給す
る。加算器110は確率的励振コードベクトルβes(i)
と適応励振コードベクトルβeaの加算を行い、励振ベク
トルe(i)を前述と同様に短時間フィルタ103に供
給して、以下同様な処理の方法で減算器109と、聴覚
フィルタ105と、聴覚誤差計算回路106で処理して
確率的励振コードインデックスIsを求めて、多重化回
路111と、確率的励振コードテーブル107に供給す
る。
The adder 110 supplies the adaptive excitation code vector βea (i) as the excitation vector e (i) to the filter for a short time as it is, and the synthesized speech vector Sw is subtracted from the subtractor 10.
Supply to 9. The subtractor 109 subtracts the original speech vector S and the synthesized speech vector Sw in component units, and supplies the error vector er (i) to the auditory filter 105. The auditory filter 105 performs filtering and supplies the vector ew (i) to the auditory error calculation circuit 106. The auditory error calculation circuit 106 calculates the root mean square gi of each component unit of the vector ew (i).
Is calculated, and i with which gi is minimized is supplied to the adaptive excitation code table 104 and the multiplexing circuit 111 as the index Ia of the optimum adaptive excitation code. Next, the switch 113 is closed and the stochastic excitation code table 10
7, the stochastic excitation code vector es (i) is multiplied by the stochastic excitation gain control signal βsq generated by the gain control circuit 123 in the multiplier 126 to perform gain control, and the stochastic excitation code vector βes (i) is the adder 110
Supply to. At this time, the gain control circuit 123 supplies the stochastic excitation gain control code βsp to the multiplexing circuit 111. The adder 110 uses the stochastic excitation code vector βes (i)
And the adaptive excitation code vector βea are added, and the excitation vector e (i) is supplied to the short-time filter 103 in the same manner as described above, and thereafter, the subtracter 109, the auditory filter 105, and the auditory error are processed by the same processing method. The stochastic excitation code index Is is obtained by processing in the calculation circuit 106 and supplied to the multiplexing circuit 111 and the stochastic excitation code table 107.

【0006】次に、スイッチ108と113を閉じて、
励振ベクトルe(i)によって適応励振コードブック1
04の内容を更新する。以上のようにして得られた確率
的励振コードインデックスIsと適応励振コードインデ
ックスIaと確率的励振ゲイン制御コードβspと適応励
振ゲイン制御コードβapと量子化短時間予測係数αjpと
を多重化してトータルコードCを出力していた。
Next, the switches 108 and 113 are closed,
Adaptive excitation codebook 1 by excitation vector e (i)
The contents of 04 are updated. The stochastic excitation code index Is, the adaptive excitation code index Ia, the stochastic excitation gain control code βsp, the adaptive excitation gain control code βap, and the quantized short-time prediction coefficient αjp, which are obtained as described above, are multiplexed to obtain a total code. It was outputting C.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、以上の
従来の方式においては、入力音声信号に対するPARC
OR分析での量子化ビット数が少なくなると、再生した
合成音声に歪みなどが生じて、十分なS/Nなどが得ら
れないなど良好な音声合成品質が得られないという問題
があった。従って、量子化ビット数を少なくすることが
できず、従って伝送ビットレートを低速にするための障
害となっていた。
However, in the above conventional method, the PARC for the input audio signal is used.
When the number of quantized bits in the OR analysis becomes small, the reproduced synthesized speech is distorted and the like, and there is a problem that a good speech synthesis quality cannot be obtained such that sufficient S / N cannot be obtained. Therefore, the number of quantization bits cannot be reduced, which is an obstacle to reducing the transmission bit rate.

【0008】これは、PARCOR分析の場合に、例え
ば、情報量を減らすために、フレーム間隔を例えば20
msecまでに延ばし、その間に各パラメータの変わり方を
スムーズにするために、例えば、2.5msecごとに線形
補間を行う。しかしながら、この線形補間がPARCO
R係数に必ずしも適応せず、そのために再生した合成音
声のスペクトルに歪みが増大して、音質が劣化してい
た。これは、PARCOR係数が単一の明確な物理量に
対応せず、複雑な複合パラメータになっていることによ
るとも考えられる。
This is because, in the case of PARCOR analysis, for example, in order to reduce the amount of information, the frame interval is set to 20.
For example, linear interpolation is performed every 2.5 msec in order to extend the time to msec and smooth the change of each parameter during that period. However, this linear interpolation is
This does not necessarily apply to the R coefficient, and as a result, distortion is increased in the spectrum of the reproduced synthesized voice, resulting in deterioration of sound quality. It can be considered that this is because the PARCOR coefficient does not correspond to a single definite physical quantity and is a complex compound parameter.

【0009】また、適応励振コードブックと確率的励振
コードブックに対するゲインをそれぞれ独立にスカラー
量子化した係数でゲイン制御していたので、量子化ビッ
ト数が少なくなると、歪みなどが生じて再生した合成音
声のS/Nなどが十分に得られないため、量子化ビット
数を少なくすることができず、従って伝送ビットレート
を低速にするための障害となっていた。
Further, since the gains for the adaptive excitation codebook and the stochastic excitation codebook are controlled independently by the scalar quantized coefficients, when the number of quantized bits becomes small, distortion or the like occurs, and the reproduced synthesis is performed. Since the S / N ratio of voice cannot be sufficiently obtained, the number of quantization bits cannot be reduced, which is an obstacle for reducing the transmission bit rate.

【0010】適応励振ゲイン制御コードと、確率的励振
ゲイン制御コードを独立に生成して伝送していたので、
伝送ビットレートを高くする傾向にあり、励振源コード
ブックの種類がもっと多くなると、ますますゲイン制御
コードの種類も多くなり、伝送ビットレートを高くせざ
るを得なくなるという問題があった。
Since the adaptive excitation gain control code and the stochastic excitation gain control code are independently generated and transmitted,
There is a problem that the transmission bit rate tends to be increased, and as the types of excitation source codebooks increase, the types of gain control codes also increase, and the transmission bit rate must be increased.

【0011】現在のこのような符号化方式に対する要請
は、低い伝送ビットレートで再生した合成音声の品質が
良好に得られるということであるが、以上のような問題
によって実現が困難であった。
The present demand for such an encoding method is that the quality of synthesized speech reproduced at a low transmission bit rate can be obtained satisfactorily, but it has been difficult to realize due to the above problems.

【0012】この発明は、以上の課題に鑑み為されたも
のであり、その目的とするところは、低い伝送ビットレ
ートであっても、十分な合成音声品質が得られるコード
励振線形予測符号化方式を提供することである。
The present invention has been made in view of the above problems, and an object of the present invention is to provide a code-excited linear predictive coding system capable of obtaining sufficient synthesized speech quality even at a low transmission bit rate. Is to provide.

【0013】[0013]

【課題を解決するための手段】この発明は、以上の目的
を達成するために、複数種類の励振源情報を用いるコー
ド励振線形予測符号化方式において、以下の特徴的な手
段と方法で改良した。つまり、音声信号に対する線スペ
クトル対分析を行い、合成音声の生成に利用する線スペ
クトル対分析情報を生成する線スペクトル対分析手段
と、複数個のゲイン制御情報からなるゲイン制御情報組
を複数組格納するゲイン制御コードブックとを備えて、
最適なゲイン制御情報組中の複数個のゲイン制御情報に
よって上記複数種類の励振源情報に対してゲイン制御を
行い、ゲイン制御された複数種類の励振源情報と上記線
スペクトル対分析情報とを用いて、音声信号の符号化及
び復号化を行うことを特徴とする。
In order to achieve the above object, the present invention has been improved by the following characteristic means and method in a code excitation linear predictive coding system using a plurality of types of excitation source information. .. That is, a line spectrum pair analysis means for performing line spectrum pair analysis on a voice signal to generate line spectrum pair analysis information used for generating a synthesized voice, and a plurality of sets of gain control information consisting of a plurality of gain control information are stored. With a gain control codebook
Gain control is performed on the plurality of types of excitation source information by a plurality of gain control information in the optimum gain control information set, and a plurality of types of gain-controlled excitation source information and the line spectrum pair analysis information are used. Then, the audio signal is encoded and decoded.

【0014】[0014]

【作用】この発明によれば、入力音声信号に対して線ス
ペクトル対分析を行っているので、主要なホルマントに
対する線スペクトル対は、ホルマント周波数からのずれ
が少なくて、比較的良く対応する。従って、線形補間特
性が良く、線形補間によるスペクトル歪みが少なく音質
の劣化が少なくなる。そして、線スペクトル対の係数を
低ビット数に量子化しても、従来のPARCOR分析に
よるよりも、音質を良くすることができる。
According to the present invention, since the line spectrum pair analysis is performed on the input voice signal, the line spectrum pairs for the main formants correspond relatively well with little deviation from the formant frequency. Therefore, the linear interpolation characteristic is good, the spectrum distortion due to the linear interpolation is small, and the deterioration of the sound quality is small. Even if the coefficient of the line spectrum pair is quantized to a low bit number, the sound quality can be improved as compared with the conventional PARCOR analysis.

【0015】また、複数種類の励振源情報ごとのゲイン
情報を伝送する必要がない。つまり、各励振源情報に対
するゲイン制御情報が組に形成されているので、この組
を指定する情報を伝送するだけで良いので、伝送ビット
レートを従来に比べ低下させることができる。しかも、
ゲイン制御情報の組を予め最適なゲイン制御情報の組み
に設定しておくことによって、効率的に良好な音質を得
ることができる。
Further, it is not necessary to transmit the gain information for each of the plural kinds of excitation source information. That is, since the gain control information for each excitation source information is formed in a set, only the information designating this set needs to be transmitted, so that the transmission bit rate can be reduced as compared with the conventional case. Moreover,
By setting the set of gain control information to the optimum set of gain control information in advance, it is possible to efficiently obtain good sound quality.

【0016】[0016]

【実施例】次にこの発明に係るコード励振線形予測符号
化方式の好適な一実施例を図面を用いて説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A preferred embodiment of the code-excited linear predictive coding system according to the present invention will be described with reference to the drawings.

【0017】この実施例では、フォワード型のコード励
振線形予測符号化を行うための、コード励振線形予測符
号化器とその復号化器を例に説明する。
In this embodiment, a code-excited linear predictive encoder and its decoder for performing forward code-excited linear predictive encoding will be described as an example.

【0018】またこの実施例の目的は、低ビットレート
においても優れた合成音声品質を得られるコード励振線
形予測符号化器とその復号化器を実現することである。
Another object of this embodiment is to realize a code-excited linear predictive encoder and a decoder thereof that can obtain excellent synthesized speech quality even at a low bit rate.

【0019】この目的を実現するために、この実施例で
は、主に声道予測パラメータをLSP(Line Sp
ectrum Pair)パラメータに変換して量子化
する回路と、LSPパラメータを逆量子化して補間し、
声道予測パラメータに変換する回路と、適応励振コード
ブックと確率的励振コードブックのゲインをベクトル量
子化したVQ(ベクトル量子化)ゲインコードブック
と、バックワード型の励振ゲイン予測回路とを設けてい
る。
In order to realize this object, in this embodiment, the vocal tract prediction parameters are mainly used for LSP (Line Sp).
and a circuit for converting the signal into an quantized parameter and quantizing it, and dequantizing the LSP parameter for interpolation.
A circuit for converting into vocal tract prediction parameters, a VQ (vector quantization) gain codebook in which the gains of the adaptive excitation codebook and the stochastic excitation codebook are vector quantized, and a backward type excitation gain prediction circuit are provided. There is.

【0020】図1は、この実施例のコード励振線形予測
符号化回路の機能ブロック図を示している。図3は、こ
の実施例のコード励振線形予測復号化器の機能ブロック
図を示している。
FIG. 1 is a functional block diagram of the code excitation linear predictive coding circuit of this embodiment. FIG. 3 shows a functional block diagram of the code-excited linear predictive decoder of this embodiment.

【0021】図1において、この実施例のコード励振線
形予測符号化回路は、声道分析回路301と、LSP量
子化器302と、LSP逆量子化器303と、多重化回
路304と、適応励振コードブック305と、VQゲイ
ンコードブック306と、確率的励振コードブック30
7と、乗算器308と、加算器309と、乗算器310
と、ゲイン制御回路311と、乗算器312と、合成フ
ィルタ313と、減算器314と、聴覚フィルタ315
と、聴覚誤差計算回路316とで構成されている。ここ
で、声道分析回路301と、LSP量子化器302と、
LSP逆量子化器303は、LSP分析系を形成してい
る。
In FIG. 1, the code excitation linear predictive coding circuit of this embodiment includes a vocal tract analysis circuit 301, an LSP quantizer 302, an LSP dequantizer 303, a multiplexing circuit 304, and an adaptive excitation. Codebook 305, VQ gain codebook 306, stochastic excitation codebook 30
7, a multiplier 308, an adder 309, and a multiplier 310
A gain control circuit 311, a multiplier 312, a synthesis filter 313, a subtractor 314, and an auditory filter 315.
And an auditory error calculation circuit 316. Here, the vocal tract analysis circuit 301, the LSP quantizer 302,
The LSP dequantizer 303 forms an LSP analysis system.

【0022】次に図1の動作を説明する。フレーム単位
にまとめられた原音声ベクトルSは、声道分析回路30
1に供給され、声道予測パラメータajが求められる。
この声道予測パラメータajは、LSP量子化器302
に供給され、声道予測パラメータajをLSPパラメー
タに変換して量子化し、そのLSPコードIwをLSP
逆量子化器303と多重化回路304に供給される。L
SP逆量子化器303は、コードIwよりLSPパラメ
ータを逆量子化し、補間を行った後に声道予測パラメー
タaqjに逆変換して合成フィルタ313に供給する。
Next, the operation of FIG. 1 will be described. The original speech vector S collected in frame units is the vocal tract analysis circuit 30.
1 and the vocal tract prediction parameter aj is obtained.
This vocal tract prediction parameter aj is calculated by the LSP quantizer 302.
, The vocal tract prediction parameter aj is converted into an LSP parameter and quantized, and the LSP code Iw is converted into an LSP parameter.
It is supplied to the inverse quantizer 303 and the multiplexing circuit 304. L
The SP dequantizer 303 dequantizes the LSP parameter from the code Iw, performs interpolation, and then inversely converts the LSP parameter into the vocal tract prediction parameter aqj, and supplies this to the synthesis filter 313.

【0023】一方、適応励振コードブック305は、適
応励振コードベクトルeai(i=1〜n)を乗算器3
08に供給する。また、確率的励振コードブック307
は、確率的励振コードベクトルesl(l=1〜m)を乗
算器310に供給する。また、VQゲインコードブック
306は、励振ゲインgak、gsk(k=1〜p)の対を
出力し、励振ゲインgakは、乗算器308に供給する。
また励振ゲインgskは、乗算器310に供給する。そし
て、乗算器308は、前記適応励振コードベクトルeai
と励振ゲインgakを乗算してベクトルeaikを得て加
算器309に供給する。また、乗算器310は、前記確
率的励振コードベクトルeslと励振ゲインgskを乗算し
てベクトルeslkを得て加算器309に供給する。
On the other hand, the adaptive excitation codebook 305 multiplies the adaptive excitation code vector eai (i = 1 to n) by the multiplier 3
Supply to 08. Also, the stochastic excitation codebook 307
Supplies the stochastic excitation code vector esl (l = 1 to m) to the multiplier 310. Further, the VQ gain codebook 306 outputs a pair of excitation gains gak and gsk (k = 1 to p), and the excitation gain gak is supplied to the multiplier 308.
The excitation gain gsk is supplied to the multiplier 310. Then, the multiplier 308 outputs the adaptive excitation code vector eai.
Is multiplied by the excitation gain gak to obtain a vector eaik and supplied to the adder 309. The multiplier 310 multiplies the stochastic excitation code vector esl by the excitation gain gsk to obtain a vector eslk, and supplies the vector eslk to the adder 309.

【0024】加算器309は、ベクトルeaikとベク
トルeslkの成分単位の加算を行い励振ベクトルeを
求めて乗算器312に供給する。ゲイン制御回路311
は、過去の最適励振より励振ゲインσを求めて乗算器3
12に供給する。乗算器312は、前記励振ベクトルe
と励振ゲインσを乗算してベクトルegを得て合成フィ
ルタ313に供給する。
The adder 309 adds the vector eaik and the vector eslk in component units to obtain the excitation vector e and supplies it to the multiplier 312. Gain control circuit 311
Is the multiplier 3 obtained by obtaining the excitation gain σ from the past optimum excitation.
Supply to 12. The multiplier 312 receives the excitation vector e
Is multiplied by the excitation gain σ to obtain a vector eg, which is supplied to the synthesis filter 313.

【0025】合成フィルタ313は、供給される声道予
測パラメータaqjをフィルタの例えばタップ係数などと
してベクトルegをフィルタリングして合成音声ベクト
ルSwを求めて減算器314に供給する。減算器314
は、原音声ベクトルSと合成音声ベクトルSwの成分単
位の減算を行い誤差ベクトルerを求めて聴覚フィルタ
315に供給する。聴覚フィルタ315は、誤差ベクト
ルerに対するフィルタリングを行い出力ベクトルew
を聴覚誤差計算回路316に供給する。聴覚誤差計算回
路316は、ベクトルewの各成分の2乗平均を求め
て、この値が最小になるi、j、kの組み合わせを最適
な各コードブックの適応励振コードインデックスIa、
確率的励振コードインデックスIs、励振ゲインコード
インデックスIgとして、これらを多重化回路304に
供給すると共に、適応励振コードインデックスIaを適
応励振コードブック305に供給し、確率的励振コード
インデックスIsを確率的励振コードブック307に供
給し、励振ゲインコードインデックスIgをVQゲイン
コードブック306に供給する。
The synthesis filter 313 filters the vector eg using the supplied vocal tract prediction parameter aqj as, for example, a tap coefficient of the filter to obtain a synthesized speech vector Sw and supplies it to the subtractor 314. Subtractor 314
Is subtracting the original voice vector S and the synthesized voice vector Sw in component units to obtain an error vector er and supplies it to the auditory filter 315. The auditory filter 315 filters the error vector er and outputs the output vector ew.
Is supplied to the auditory error calculation circuit 316. The auditory error calculation circuit 316 obtains the root mean square of each component of the vector ew, and the combination of i, j, and k that minimizes this value is the optimum adaptive excitation code index Ia of each codebook,
The stochastic excitation code index Is and the excitation gain code index Ig are supplied to the multiplexing circuit 304, the adaptive excitation code index Ia is supplied to the adaptive excitation code book 305, and the stochastic excitation code index Is is stochastically excited. The excitation gain code index Ig is supplied to the codebook 307, and the excitation gain code index Ig is supplied to the VQ gain codebook 306.

【0026】適応励振コードブック305は、適応励振
コードインデックスIaによって最適な適応励振コード
ベクトルeaoを出力して乗算器308に供給する。ま
た、確率的励振コードブック305は確率的励振コード
インデックスIsによって最適な確率的励振コードベク
トルesoを出力して乗算器310に供給する。また、V
Qゲインコードブック306は、励振ゲインコードイン
デックスIgによって最適な励振ゲインgao、gsoの対
を出力し、励振ゲインgaoは乗算器308に供給し、励
振ゲインgsoは乗算器310に供給する。
The adaptive excitation codebook 305 outputs the optimum adaptive excitation code vector eao according to the adaptive excitation code index Ia and supplies it to the multiplier 308. Further, the stochastic excitation codebook 305 outputs the optimal stochastic excitation code vector eso according to the stochastic excitation code index Is and supplies it to the multiplier 310. Also, V
The Q gain codebook 306 outputs an optimum pair of excitation gains gao and gso according to the excitation gain code index Ig, the excitation gain gao is supplied to the multiplier 308, and the excitation gain gso is supplied to the multiplier 310.

【0027】乗算器308は、最適な適応励振コードベ
クトルeaoと最適な励振ゲインgaoの乗算を行い、eao
・gaoを加算器309に供給する。また、乗算器310
は、最適な確率的励振コードベクトルesoと最適な励振
ゲインgsoの乗算を行い、eso・gsoを加算器309に
供給する。加算器309は、eao・gaoとeso・gsoの
加算を行い、この加算値をeoptとして適応励振コー
ドブック305に供給し、内容を更新する。
The multiplier 308 multiplies the optimum adaptive excitation code vector eao by the optimum excitation gain gao to obtain eao.
Supply gao to the adder 309. Also, the multiplier 310
Multiplies the optimal stochastic excitation code vector eso by the optimal excitation gain gso, and supplies eso · gso to the adder 309. The adder 309 performs addition of eao · gao and eso · gso, supplies the added value to the adaptive excitation codebook 305 as eopt, and updates the content.

【0028】また、各コードブックによる最適コードイ
ンデックスの探索順番は、いろいろな方法があるが特に
限定するものではない。例えば、適応励振コードベクト
ルをea1とし、確率的励振コードベクトルをes1とし、
励振ゲインを(ga1、gs1)〜(gap、gsp)に順番に
変えて探索し、最適な適応励振コードベクトルと確率的
励振コードベクトルと励振ゲインとを求めることもでき
る。
There are various methods for searching the optimum code index by each codebook, but there is no particular limitation. For example, the adaptive excitation code vector is ea1, the stochastic excitation code vector is es1,
It is also possible to find the optimum adaptive excitation code vector, stochastic excitation code vector, and excitation gain by changing the excitation gain in order from (ga1, gs1) to (gap, gsp).

【0029】多重化回路304は、以上のようにして得
られたLSPコードIwと、適応励振コードインデック
スIaと、確率的励振コードインデックスIsと、励振
ゲインコードインデックスIgとを多重化してこれをト
ータルコードCとして出力し、復号化器に供給する。
The multiplexing circuit 304 multiplexes the LSP code Iw thus obtained, the adaptive excitation code index Ia, the stochastic excitation code index Is, and the excitation gain code index Ig, and totals them. The code C is output and supplied to the decoder.

【0030】図3は、この実施例のコード励振線形予測
復号化器の機能ブロック図を示している。
FIG. 3 shows a functional block diagram of the code-excited linear predictive decoder of this embodiment.

【0031】図3において、この実施例のコード励振線
形予測復号化回路は、多重分離回路402と、適応励振
コードブック403と、VQゲインコードブック404
と、統計励振コードブック405と、乗算器406と、
乗算器407と、加算器408と、ゲイン制御回路40
9と、乗算器410と、LSP逆量子化器411と、合
成フィルタ412とで構成されている。
In FIG. 3, the code-excited linear predictive decoding circuit of this embodiment includes a demultiplexing circuit 402, an adaptive excitation codebook 403, and a VQ gain codebook 404.
A statistical excitation codebook 405, a multiplier 406,
Multiplier 407, adder 408, and gain control circuit 40
9, a multiplier 410, an LSP dequantizer 411, and a synthesis filter 412.

【0032】次に図3の動作を説明する。入力されるト
ータルコードCは、多重分離回路402において、各信
号に分離されて、LSPコードIwはLSP逆量子化器
411に供給され、適応励振コードインデックスIaは
適応励振コードブック403に供給され、確率的励振コ
ードインデックスIsは確率的励振コードブック405
に供給され、励振ゲインコードインデックスIgはVQ
ゲインコードブック404に供給される。
Next, the operation of FIG. 3 will be described. The input total code C is separated into each signal in the demultiplexing circuit 402, the LSP code Iw is supplied to the LSP dequantizer 411, the adaptive excitation code index Ia is supplied to the adaptive excitation codebook 403, The probabilistic excitation code index Is is the probabilistic excitation codebook 405.
And the excitation gain code index Ig is VQ.
It is supplied to the gain codebook 404.

【0033】LSP逆量子化器411は、LSPコード
Iwより、LSPパラメータを逆量子化して、更に補間
を行った後に声道予測パラメータajに変換して、合成
フィルタ412に供給する。
The LSP dequantizer 411 dequantizes the LSP parameter from the LSP code Iw, further interpolates it, and then converts it into the vocal tract prediction parameter aj, and supplies it to the synthesis filter 412.

【0034】適応励振コードブック403は、適応励振
コードインデックスIaに相当する適応励振コードベク
トルeaを乗算器406に供給する。また、確率的励振
コードブック405は、確率的励振コードインデックス
Isに相当する確率的励振コードベクトルesを乗算器
407に供給する。VQゲインコードブック404は、
励振ゲインコードインデックスIgに相当する励振ゲイ
ンga、gsを出力し、励振ゲインgaは、乗算器40
6に供給し、励振ゲインgsは、乗算器407に供給す
る。
The adaptive excitation codebook 403 supplies the adaptive excitation code vector ea corresponding to the adaptive excitation code index Ia to the multiplier 406. The stochastic excitation codebook 405 also supplies the stochastic excitation code vector es corresponding to the stochastic excitation code index Is to the multiplier 407. The VQ gain codebook 404 is
The excitation gains ga and gs corresponding to the excitation gain code index Ig are output, and the excitation gain ga is calculated by the multiplier 40.
6 and the excitation gain gs is supplied to the multiplier 407.

【0035】乗算器406は、適応励振コードベクトル
eaと励振ゲインgaを乗算して得られたベクトルeag
を加算器408に供給する。また、乗算器407は、確
率的励振コードベクトルesと励振ゲインgsを乗算し
て得られたベクトルesgを加算器408に供給する。加
算器408は、ベクトルeagとベクトルesgを加算して
得られたベクトルeを乗算器410に供給する。また、
このベクトルeは、適応励振コードブックにも供給され
て、このベクトルeによって内容が更新される。
The multiplier 406 calculates a vector eag obtained by multiplying the adaptive excitation code vector ea by the excitation gain ga.
Is supplied to the adder 408. Further, the multiplier 407 supplies the vector esg obtained by multiplying the stochastic excitation code vector es and the excitation gain gs to the adder 408. The adder 408 supplies the vector e obtained by adding the vector eag and the vector esg to the multiplier 410. Also,
This vector e is also supplied to the adaptive excitation codebook, and the content is updated by this vector e.

【0036】ゲイン制御回路409は、過去の最適励振
より励振ゲインσを求めて乗算器410に供給する。乗
算器410は、前記励振ベクトルeと励振ゲインσを乗
算してベクトルegを得て合成フィルタ412に供給す
る。
The gain control circuit 409 obtains the excitation gain σ from the past optimum excitation and supplies it to the multiplier 410. The multiplier 410 multiplies the excitation vector e by the excitation gain σ to obtain a vector eg and supplies the vector eg to the synthesis filter 412.

【0037】合成フィルタ412は、供給される声道予
測パラメータajをフィルタの例えばタップ係数などと
してベクトルegをフィルタリングして合成音声ベクト
ルSを求めて出力する。
The synthesis filter 412 filters the vector eg using the supplied vocal tract prediction parameter aj as a filter coefficient, for example, to obtain the synthesized speech vector S and output it.

【0038】以上の実施例によれば、LSP分析による
LSPパラメータのコードIwを伝送し、復号化器側で
は、このLSPコードIwをLSP逆量子化して声道予
測パラメータajを求めて、合成フィルタで合成音声を
再生しているので、LSPパラメータの量子化ビット数
を少なくしても従来のPARCOR方式による分析に比
べ、再生した合成音声のS/Nを向上させることができ
る。また、VQゲインコードブックで励振ゲインコード
インデックスIgによって最適な励振ゲインgao、gso
の対を出力し、適応励振コードベクトルに最適な励振ゲ
インgaoを乗算し、また、確率的励振コードベクトルに
最適な励振ゲインgsoを乗算して符号化及び復号化して
いるので、伝送するのは最適な励振ゲインコードインデ
ックスIgだけでよい。従来は2系統のゲインコードイ
ンデックスを伝送していた。従って、低い伝送ビットレ
ートであっても、十分な音声品質を得ることができる。
According to the above embodiment, the LSP parameter code Iw obtained by the LSP analysis is transmitted, and the decoder side LSP dequantizes the LSP code Iw to obtain the vocal tract prediction parameter aj, and the synthesis filter. Since the synthetic speech is reproduced in S., even if the number of quantization bits of the LSP parameter is reduced, the S / N of the reproduced synthetic speech can be improved as compared with the analysis by the conventional PARCOR method. Also, in the VQ gain code book, the optimum excitation gains gao and gso are determined by the excitation gain code index Ig.
Is output, and the adaptive excitation code vector is multiplied by the optimal excitation gain gao, and the stochastic excitation code vector is multiplied by the optimal excitation gain gso for encoding and decoding. Only the optimum excitation gain code index Ig is required. Conventionally, two systems of gain code indexes were transmitted. Therefore, sufficient voice quality can be obtained even at a low transmission bit rate.

【0039】以上の実施例においては、フォワード型の
コード励振線形予測符号化器及び復号化器について説明
したが、この構成に限るものではなく、例えば、バック
ワード型のコード励振線形予測符号化器及び復号化器に
対しても適用することができる。
Although the forward type code excitation linear predictive encoder and decoder have been described in the above embodiments, the present invention is not limited to this configuration. For example, a backward type code excitation linear predictive encoder and decoder. And can be applied to a decoder.

【0040】また、VQゲインコードブックは2種類の
励振ゲインを一対として格納していたが、これに限るも
のではなく、ゲイン制御する励振コードブックの種類数
に応じて複数個を一組として格納する構成であってもよ
い。
The VQ gain codebook stores two types of excitation gains as a pair, but the present invention is not limited to this, and a plurality of VQ gain codebooks are stored as a set according to the number of types of excitation codebooks to be gain controlled. It may be configured to.

【0041】[0041]

【発明の効果】以上述べたようにこの発明によれば、線
スペクトル対分析手段と、ゲイン制御コードブックとを
備えて、ゲイン制御された複数種類の励振源情報と上記
線スペクトル対分析情報とを用いて、音声信号の符号化
及び復号化を行っているので、低い伝送ビットレートで
あっても、十分な合成音声品質を得ることができる。
As described above, according to the present invention, a plurality of kinds of gain-controlled excitation source information and the line spectrum pair analysis information are provided, which are provided with the line spectrum pair analysis means and the gain control codebook. Since the voice signal is encoded and decoded by using, the sufficient synthesized voice quality can be obtained even at a low transmission bit rate.

【図面の簡単な説明】[Brief description of drawings]

【図1】この実施例に係るコード励振線形予測符号化器
の機能ブロック図である。
FIG. 1 is a functional block diagram of a code excitation linear predictive encoder according to this embodiment.

【図2】従来例に係るコード励振線形予測符号化器の機
能ブロック図である。
FIG. 2 is a functional block diagram of a code-excited linear predictive encoder according to a conventional example.

【図3】この実施例に係るコード励振線形予測復号化器
の機能ブロック図である。
FIG. 3 is a functional block diagram of a code excitation linear prediction decoder according to this embodiment.

【符号の説明】[Explanation of symbols]

301…声道分析回路、302…LSP量子化器、30
3、411…LSP逆量子化器、304…多重化回路、
305…適応励振コードブック、306…VQゲインコ
ードブック、307…確率的励振コードブック、30
8、310、312、406、407、410…乗算
器、309、408…加算器、311、409…ゲイン
制御回路、313、412…合成フィルタ、314…減
算器、315…聴覚フィルタ、316…聴覚誤差計算回
路、402…多重分離回路。
301 ... Vocal tract analysis circuit, 302 ... LSP quantizer, 30
3, 411 ... LSP dequantizer, 304 ... Multiplexing circuit,
305 ... Adaptive excitation codebook, 306 ... VQ gain codebook, 307 ... Stochastic excitation codebook, 30
8, 310, 312, 406, 407, 410 ... Multiplier, 309, 408 ... Adder, 311, 409 ... Gain control circuit, 313, 412 ... Synthesis filter, 314 ... Subtractor, 315 ... Auditory filter, 316 ... Auditory Error calculation circuit, 402 ... Demultiplexing circuit.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 細田 賢一郎 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Kenichiro Hosoda 1-7-12 Toranomon, Minato-ku, Tokyo Oki Electric Industry Co., Ltd.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 複数種類の励振源情報を用いるコード励
振線形予測符号化方式において、 音声信号に対する線スペクトル対分析を行い、合成音声
の生成に利用する線スペクトル対分析情報を生成する線
スペクトル対分析手段と、 複数個のゲイン制御情報からなるゲイン制御情報組を複
数組格納するゲイン制御コードブックとを備えて、 最適なゲイン制御情報組中の複数個のゲイン制御情報に
よって上記複数種類の励振源情報に対してゲイン制御を
行い、ゲイン制御された複数種類の励振源情報と上記線
スペクトル対分析情報とを用いて、音声信号の符号化及
び復号化を行うことを特徴とするコード励振線形予測符
号化方式。
1. A code excitation linear predictive coding method using a plurality of types of excitation source information, wherein a line spectrum pair analysis is performed on a speech signal, and a line spectrum pair is generated which is used to generate synthetic speech. The gain control codebook for storing a plurality of sets of gain control information composed of a plurality of gain control information is provided, and the plurality of types of excitation are controlled by the plurality of gain control information in the optimum gain control information set. A code excitation line characterized by performing gain control on source information and performing encoding and decoding of a voice signal using a plurality of types of gain-controlled excitation source information and the line spectrum pair analysis information. Predictive coding method.
JP3251152A 1991-09-30 1991-09-30 Code-excited linear predictive coding Expired - Lifetime JP3031765B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3251152A JP3031765B2 (en) 1991-09-30 1991-09-30 Code-excited linear predictive coding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3251152A JP3031765B2 (en) 1991-09-30 1991-09-30 Code-excited linear predictive coding

Publications (2)

Publication Number Publication Date
JPH05127699A true JPH05127699A (en) 1993-05-25
JP3031765B2 JP3031765B2 (en) 2000-04-10

Family

ID=17218454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3251152A Expired - Lifetime JP3031765B2 (en) 1991-09-30 1991-09-30 Code-excited linear predictive coding

Country Status (1)

Country Link
JP (1) JP3031765B2 (en)

Also Published As

Publication number Publication date
JP3031765B2 (en) 2000-04-10

Similar Documents

Publication Publication Date Title
US10026411B2 (en) Speech encoding utilizing independent manipulation of signal and noise spectrum
US6694292B2 (en) Apparatus for encoding and apparatus for decoding speech and musical signals
JP3678519B2 (en) Audio frequency signal linear prediction analysis method and audio frequency signal coding and decoding method including application thereof
KR100304682B1 (en) Fast Excitation Coding for Speech Coders
US8396706B2 (en) Speech coding
Edler et al. Audio coding using a psychoacoustic pre-and post-filter
JPH10282999A (en) Method and device for coding audio signal, and method and device decoding for coded audio signal
US5727122A (en) Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method
US6052659A (en) Nonlinear filter for noise suppression in linear prediction speech processing devices
JPH02155313A (en) Coding method
JP3033060B2 (en) Voice prediction encoding / decoding method
JP3357795B2 (en) Voice coding method and apparatus
JPH09152896A (en) Sound path prediction coefficient encoding/decoding circuit, sound path prediction coefficient encoding circuit, sound path prediction coefficient decoding circuit, sound encoding device and sound decoding device
JPH1097295A (en) Coding method and decoding method of acoustic signal
JPH0341500A (en) Low-delay low bit-rate voice coder
KR100513815B1 (en) Signal encoding method and apparatus
JP2968109B2 (en) Code-excited linear prediction encoder and decoder
JPH05127699A (en) Code excitation linear prediction and encoding system
JP3073283B2 (en) Excitation code vector output circuit
JPH10207496A (en) Voice encoding device and voice decoding device
JPH08234795A (en) Voice encoding device
JPH11259098A (en) Method of speech encoding/decoding
JP3520955B2 (en) Acoustic signal coding
JP2000089797A (en) Speech encoding apparatus
JPH0786952A (en) Predictive encoding method for voice

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 12