JPH1011093A - Signal encoding device - Google Patents

Signal encoding device

Info

Publication number
JPH1011093A
JPH1011093A JP8164840A JP16484096A JPH1011093A JP H1011093 A JPH1011093 A JP H1011093A JP 8164840 A JP8164840 A JP 8164840A JP 16484096 A JP16484096 A JP 16484096A JP H1011093 A JPH1011093 A JP H1011093A
Authority
JP
Japan
Prior art keywords
signal
pitch
sound source
delay
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8164840A
Other languages
Japanese (ja)
Other versions
JP3092654B2 (en
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP08164840A priority Critical patent/JP3092654B2/en
Publication of JPH1011093A publication Critical patent/JPH1011093A/en
Application granted granted Critical
Publication of JP3092654B2 publication Critical patent/JP3092654B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To obtain excellent sound quality for voices from more than one speaker and musical sound signals generated by more than one musical instrument by calculating a sound source signal after finding delays from input signals. SOLUTION: A spectrum parameter calculating circuit 200 performs calculation in predetermined degree of a spectrum parameter by providing a window which is longer than subframe length for a voice signal of at least one subframe and segmenting a voice. A pitch extracting circuit 390 finds delays and gains corresponding to a pitch cycle by using the output of an auditory weighting circuit 230. Then a sound source quantizing circuit 350 performs vector quantization for a sound source signal by using a sound source code book 351. The output of a subtracter 236 and the output of an impulse response calculating circuit 310 are used to retrieve a sound source code vector cj (n) from the sound source code book 351. Further, the index of the selected sound source vector is outputted to a multiplexer 400.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声や音楽信号を
低いビットレートで高品質に符号化するための信号符号
化装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a signal encoding apparatus for encoding a speech or music signal at a low bit rate with high quality.

【0002】[0002]

【従来の技術】音声信号を高能率に符号化する方式とし
ては、例えば、M.Schroeder and B.
Atalによる“Code−excited line
arprediction:High quality
speech at very low bit r
ates”(Proc.ICASSP,pp.937−
940,1985年)と題した論文(文献1)や、Kl
eijnらによる“Improved speech
quality and efficeintvect
or quantization in SELP”
(Proc.ICASSP,pp.155−158,1
988年)と題した論文(文献2)などに記載されてい
るCELP(Code Excited Linear
Predictive Coding)が知られてい
る。この従来例では、送信側では、フレーム毎(例えば
20ms)に音声信号から線形予測(LPC)分析を用
いて、音声信号のスペクトル特性を表すスペクトルパラ
メータを抽出する。フレームをさらにサブフレーム(例
えば5ms)に分割し、サブフレーム毎に過去の音源信
号を基に適応コードブックにおけるパラメータ(ピッチ
周期に対応する遅延パラメータとゲインパラメータ)を
抽出し、適応コードブックにより前記サブフレームの音
声信号をピッチ予測する。ピッチ予測して求めた音源信
号に対して、予め定められた種類の雑音信号からなる音
源コードブック(ベクトル量子化コードブック)から最
適な音源コードベクトルを選択し、最適なゲインを計算
することにより、音源信号を量子化する。音源コードベ
クトルの選択の仕方は、選択した雑音信号により合成し
た信号と、前記残差信号との誤差電力を最小化するよう
に行う。そして、選択されたコードベクトルの種類を表
すインデクスとゲインならびに、前記スペクトルパラメ
ータと適応コードブックのパラメータをマルチプレクサ
部により組み合わせて伝送する。受信側の説明は省略す
る。
2. Description of the Related Art As a method for encoding a speech signal with high efficiency, for example, M.I. Schroeder and B.S.
"Code-excited line by Atal
arprediction: High quality
speech at very low bitr
ates "(Proc. ICASPS, pp. 937-
940, 1985), Kl.
"Improved speech" by Eijn et al.
quality and efficiencyintectect
or quantification in SELP "
(Proc. ICASSP, pp. 155-158, 1
1988), and a CELP (Code Excited Linear) described in a paper (Reference 2) and the like.
Predictive Coding) is known. In this conventional example, the transmitting side extracts a spectral parameter representing a spectral characteristic of an audio signal from the audio signal for each frame (for example, 20 ms) by using linear prediction (LPC) analysis. The frame is further divided into subframes (for example, 5 ms), and parameters (a delay parameter and a gain parameter corresponding to a pitch period) in the adaptive codebook are extracted for each subframe based on a past sound source signal. Pitch prediction of the audio signal of the subframe. For an excitation signal obtained by pitch prediction, an optimal excitation code vector is selected from an excitation codebook (vector quantization codebook) composed of predetermined types of noise signals, and an optimal gain is calculated. , Quantize the sound source signal. The excitation code vector is selected so as to minimize the error power between the signal synthesized from the selected noise signal and the residual signal. Then, the index and gain indicating the type of the selected code vector, the spectrum parameter and the parameter of the adaptive codebook are combined and transmitted by the multiplexer unit. Description on the receiving side is omitted.

【0003】[0003]

【発明が解決しようとする課題】前記従来法では、音源
コードブックから最適な音源コードベクトルを選択する
のに多大な演算量を要するという問題があった。これ
は、文献1や2の方法では、音源コードベクトルを選択
するのに、各コードベクトルに対して一旦フィルタリン
グもしくは畳み込み演算を行ない、この演算をコードブ
ックに格納されているコードベクトルの個数だけ繰り返
すことに起因する。例えば、コードブックのビット数が
Bビットで、次元数がNのときは、フィルタリングある
いは畳み込み演算のときのフィルタあるいはインパルス
応答長をKとすると、演算量は1秒当たり、N×K×2
B ×8000/Nだけ必要となる。一例として、B=1
0、N=40、K=10とすると、1秒当たり81,9
20,000回の演算が必要となり、極めて膨大である
という問題点があった。また、この問題点は、入力信号
の帯域が電話帯域よりも広く、標本化周波数が高くなる
ほど、深刻であった。
The conventional method has a problem that a large amount of calculation is required to select an optimal excitation code vector from an excitation codebook. In this method, in order to select a sound source code vector, filtering or convolution operation is once performed on each code vector, and this operation is repeated by the number of code vectors stored in the code book. Due to that. For example, when the number of bits in the codebook is B and the number of dimensions is N, the amount of operation is N × K × 2 per second, where K is the filter or impulse response length in the filtering or convolution operation.
Only B × 8000 / N is required. As an example, B = 1
If 0, N = 40 and K = 10, 81,9 per second
20,000 operations are required, which is extremely large. This problem becomes more serious as the input signal band is wider than the telephone band and the sampling frequency becomes higher.

【0004】音源コードブック探索に必要な演算量を低
減する方法として、種々のものが提案されている。例え
ば、ACELP(Argebraic Code Ex
cited Linear Prediction)方
式が提案されている。これは、例えば、C.Lafla
mmeらによる“16 kbps widebands
peech coding technique ba
sed on algebraic CELP”と題し
た論文(Proc.ICASSP,pp.13−16,
1991)(文献3)等を参照することができる。文献
3の方法によれば、音源信号を複数個のパルスで表し、
各パルスの位置をあらかじめ定められたビット数で表し
伝送する。ここで、各パルスの振幅は+1.0もしくは
−1.0に限定されているため、パルス探索の演算量を
大幅に低減化できる。
[0004] Various methods have been proposed as a method for reducing the amount of calculation required for searching the sound source codebook. For example, ACELP (Argebraic Code Ex)
Citated Linear Prediction) has been proposed. This is, for example, C.I. Lafla
"16 kbps widebands by Mme et al.
peech coding technique ba
Sed on algebric CELP "(Proc. ICASP, pp. 13-16, pp. 13-16).
1991) (Literature 3). According to the method of Document 3, the sound source signal is represented by a plurality of pulses,
The position of each pulse is represented by a predetermined number of bits and transmitted. Here, since the amplitude of each pulse is limited to +1.0 or -1.0, the amount of calculation for the pulse search can be significantly reduced.

【0005】しかし、以上述べたいずれの手法も、ピッ
チが一つの音声に対しては比較的良好な音質が得られる
ものの、会議などの用途で、複数話者の声や、複数種の
楽器が混在するためにピッチが複数個含まれる音楽信号
に対しては、低いビットレートでは甚だしく音質が劣化
していた。
[0005] However, in any of the above-mentioned methods, although relatively good sound quality can be obtained for a single-pitch sound, voices of a plurality of speakers or a plurality of types of musical instruments are used for a conference or the like. For a music signal containing a plurality of pitches due to the coexistence, the sound quality is significantly deteriorated at a low bit rate.

【0006】本発明の目的は、上述の問題を解決し、ビ
ットレートが低い場合にも、広帯域の音声のみならず音
楽信号に対しても、比較的少ない演算量で音質の劣化の
少ない信号符号化方式を提供することにある。
SUMMARY OF THE INVENTION An object of the present invention is to solve the above-mentioned problems and to provide a signal code with a relatively small amount of operation and a small deterioration in sound quality not only for a wideband voice but also for a music signal even when the bit rate is low. It is to provide a generalization method.

【0007】[0007]

【課題を解決するための手段】本発明の第1の態様によ
れば、入力信号からスペクトルパラメータを求めて量子
化するスペクトルパラメータ計算部と、前記入力信号か
ら第1のピッチ周期に対応する第1の遅延を求めピッチ
予測残差信号を求め前記ピッチ予測残差信号から第2の
ピッチ周期に対応する第2の遅延を求め、これら第1及
び第2の遅延を少なくとも含むあらかじめ定められた複
数個の遅延を求めて出力する遅延計算部と、前記複数個
の遅延を用いてピッチ予測した残差信号に対して音源信
号を求めて量子化して出力する音源量子化部を有するこ
とを特徴とする信号符号化装置が得られる。
According to a first aspect of the present invention, there is provided a spectrum parameter calculator for obtaining and quantizing a spectrum parameter from an input signal, and a spectrum parameter calculator corresponding to a first pitch period from the input signal. 1 delay, a pitch prediction residual signal is determined, a second delay corresponding to a second pitch period is determined from the pitch prediction residual signal, and a plurality of predetermined delays including at least the first and second delays are determined. A delay calculation unit that calculates and outputs the number of delays, and a sound source quantization unit that obtains and quantizes and outputs a sound source signal for a pitch-predicted residual signal using the plurality of delays. Thus, a signal encoding device that performs

【0008】本発明の第2の態様によれば、前記信号の
音源信号が振幅が非零の複数個のパルスから構成される
ことを特徴とする信号符号化装置が得られる。
According to a second aspect of the present invention, there is provided a signal encoding apparatus characterized in that an excitation signal of the signal is composed of a plurality of pulses having a non-zero amplitude.

【0009】本発明の第3の態様によれば、入力信号か
らスペクトルパラメータを求めて量子化するスペクトル
パラメータ計算部と、前記入力信号から特徴量を抽出し
てモードを判別するモード判別部と、あらかじめ定めら
れたモードにおいて前記入力信号から第1のピッチ周期
に対応する第1の遅延を求めピッチ予測残差信号を求め
前記ピッチ予測残差信号から第2のピッチ周期に対応す
る第2の遅延を求め、これら第1及び第2の遅延を少な
くとも含むあらかじめ定められた複数個の遅延を求めて
出力する遅延計算部と、前記複数個の遅延を用いてピッ
チ予測した残差信号に対して音源信号を求めて量子化し
て出力する音源量子化部を有することを特徴とする信号
符号化装置が得られる。
According to a third aspect of the present invention, there is provided a spectrum parameter calculator for obtaining and quantizing a spectrum parameter from an input signal, a mode discriminator for extracting a feature quantity from the input signal and discriminating a mode, A first delay corresponding to a first pitch period is obtained from the input signal in a predetermined mode, a pitch prediction residual signal is obtained, and a second delay corresponding to a second pitch period is obtained from the pitch prediction residual signal. And a delay calculator for calculating and outputting a plurality of predetermined delays including at least the first and second delays; and a sound source for the residual signal pitch-predicted using the plurality of delays. A signal encoding device having a sound source quantization unit for obtaining a signal, quantizing the signal, and outputting the signal is obtained.

【0010】本発明の第4の態様によれば、前記信号の
音源信号が振幅が非零の複数個のパルスから構成される
ことを特徴とする信号符号化装置が得られる。
According to a fourth aspect of the present invention, there is provided a signal encoding apparatus characterized in that an excitation signal of the signal is constituted by a plurality of non-zero amplitude pulses.

【0011】本発明の第5の態様によれば、入力信号か
らスペクトルパラメータを求めて量子化するスペクトル
パラメータ計算部と、前記入力信号から第1のピッチ周
期に対応する第1の遅延を求めピッチ予測残差信号を求
め第1のピッチ予測利得を計算し、前記ピッチ予測残差
信号から第2のピッチ周期に対応する第2の遅延を求め
これらの処理を繰り返すピッチ予測部と、前記ピッチ予
測利得があらかじめ定められた条件を満たすかどうかを
判別する判別部と、前記ピッチ予測利得があらかじめ定
められた条件を満たさない場合に前記遅延を用いてピッ
チ予測した残差信号に対して音源信号を求めて量子化し
て出力する音源量子化部を有することを特徴とする信号
符号化装置が得られる。
According to a fifth aspect of the present invention, there is provided a spectrum parameter calculator for obtaining and quantizing a spectrum parameter from an input signal, and obtaining a first delay corresponding to a first pitch period from the input signal. A pitch prediction unit for obtaining a prediction residual signal, calculating a first pitch prediction gain, obtaining a second delay corresponding to a second pitch period from the pitch prediction residual signal, and repeating these processes; A determination unit that determines whether the gain satisfies a predetermined condition, and a sound source signal for a residual signal pitch-predicted using the delay when the pitch prediction gain does not satisfy a predetermined condition. A signal encoding apparatus characterized by having a sound source quantization unit for obtaining, quantizing and outputting the obtained signal is obtained.

【0012】本発明の第6の態様によれば、前記信号の
音源信号が振幅が非零の複数個のパルスから構成される
ことを特徴とする信号符号化装置が得られる。
According to a sixth aspect of the present invention, there is provided a signal encoding apparatus characterized in that an excitation signal of the signal is composed of a plurality of pulses having a non-zero amplitude.

【0013】本発明の第7の態様によれば、入力信号か
らスペクトルパラメータを求めて量子化するスペクトル
パラメータ計算部と、前記入力信号から特徴量を抽出し
てモードを判別するモード判別部と、あらかじめ定めら
れたモードにおいて前記入力信号から第1のピッチ周期
に対応する第1の遅延を求めピッチ予測残差信号を求め
第1のピッチ予測利得を計算し、前記ピッチ予測残差信
号から第2のピッチ周期に対応する第2の遅延を求めこ
れらの処理を繰り返すピッチ予測部と、前記ピッチ予測
利得があらかじめ定められた条件を満たすかどうかを判
別する判別部と、前記ピッチ予測利得があらかじめ定め
られた条件を満たさない場合は前記遅延を用いてピッチ
予測した残差信号に対して音源信号を求めて量子化して
出力する音源量子化部を有することを特徴とする信号符
号化装置が得られる。
According to a seventh aspect of the present invention, there is provided a spectrum parameter calculation unit for obtaining and quantizing a spectrum parameter from an input signal, a mode discrimination unit for extracting a feature amount from the input signal and discriminating a mode, In a predetermined mode, a first delay corresponding to a first pitch period is obtained from the input signal, a pitch prediction residual signal is obtained, a first pitch prediction gain is calculated, and a second pitch prediction gain is calculated from the pitch prediction residual signal. A pitch prediction unit that determines a second delay corresponding to the pitch period and repeats these processes; a determination unit that determines whether the pitch prediction gain satisfies a predetermined condition; If the given condition is not satisfied, a sound source quantum for obtaining and quantizing a sound source signal for the residual signal pitch-predicted using the delay and outputting the sound source signal. Signal encoding device is obtained, characterized in that it comprises a part.

【0014】本発明の第8の態様によれば、前記信号の
音源信号が振幅が非零の複数個のパルスから構成される
ことを特徴とする信号符号化装置が得られる。
According to an eighth aspect of the present invention, there is provided a signal encoding apparatus characterized in that an excitation signal of the signal is composed of a plurality of pulses having a non-zero amplitude.

【0015】本発明の第1の態様では、入力信号からピ
ッチ周期に相当する遅延の計算とピッチ予測残差信号の
計算を繰り返し、あらかじめ定められた個数の遅延を求
め、前記複数個の遅延を用いてピッチ予測した残差信号
に対して音源信号を求めて量子化して出力する。
In the first aspect of the present invention, the calculation of a delay corresponding to a pitch period and the calculation of a pitch prediction residual signal are repeated from an input signal to obtain a predetermined number of delays, and the plurality of delays are calculated. A sound source signal is obtained from the residual signal whose pitch has been predicted using the obtained signal, quantized, and output.

【0016】本発明の第2の態様では、第1の態様にお
いて、音源信号が個数Mの振幅が非零のパルス列から構
成され、パルスの振幅と位置を求めることにより、音源
信号を量子化する。
According to a second aspect of the present invention, in the first aspect, the sound source signal is composed of a pulse train having a number M of non-zero amplitudes, and the amplitude and position of the pulse are obtained to quantize the sound source signal. .

【0017】本発明の第3の態様では、入力信号から特
徴量を抽出してモードを判別し、あらかじめ定められた
モードにおいてのみ、第1の発明と同一の動作を行な
う。
According to the third aspect of the present invention, the mode is determined by extracting the characteristic amount from the input signal, and the same operation as in the first aspect is performed only in a predetermined mode.

【0018】本発明の第4の態様では、第3の態様にお
いて、音源信号が個数Mの振幅が非零のパルス列から構
成され、パルスの振幅と位置を求めることにより、音源
信号を量子化する。
According to a fourth aspect of the present invention, in the third aspect, the sound source signal is composed of a pulse train of a number M having a non-zero amplitude, and the sound source signal is quantized by obtaining the amplitude and position of the pulse. .

【0019】本発明の第5の態様では、入力信号からピ
ッチ周期に相当する遅延の計算とピッチ予測残差信号の
計算とピッチ予測利得の計算を繰り返し、前記ピッチ予
測利得があらかじめ定められた条件を満たすかどうかを
判別し前記ピッチ予測利得があらかじめ定められた条件
を満たさない場合に前記遅延を用いてピッチ予測した残
差信号に対して音源信号を求めて量子化して出力する音
源量子化部を有する。
According to a fifth aspect of the present invention, the calculation of the delay corresponding to the pitch period, the calculation of the pitch prediction residual signal, and the calculation of the pitch prediction gain are repeated from the input signal, and the pitch prediction gain is set to a predetermined condition. A sound source quantizing unit that determines whether the pitch prediction gain does not satisfy a predetermined condition and obtains and quantizes a sound source signal for a residual signal pitch-predicted using the delay when the pitch prediction gain does not satisfy a predetermined condition. Having.

【0020】本発明の第6の態様では、第5の態様にお
いて、音源信号が個数Mの振幅が非零のパルス列から構
成され、パルスの振幅と位置を求めることにより、音源
信号を量子化する。
According to a sixth aspect of the present invention, in the fifth aspect, the sound source signal is constituted by a pulse train of a number M having a non-zero amplitude, and the sound source signal is quantized by obtaining the amplitude and position of the pulse. .

【0021】本発明の第7の態様では、入力信号から特
徴量を抽出してモードを判別し、あらかじめ定められた
モードにおいてのみ、第5の態様と同一の動作を行う。
In the seventh aspect of the present invention, the mode is determined by extracting the characteristic amount from the input signal, and the same operation as in the fifth aspect is performed only in a predetermined mode.

【0022】本発明の第8の態様では、第7の態様にお
いて、音源信号が個数Mの振幅が非零のパルス列から構
成され、パルスの振幅と位置を求めることにより、音源
信号を量子化する。
According to an eighth aspect of the present invention, in the seventh aspect, the sound source signal is constituted by a pulse train having a number M of non-zero amplitudes, and the amplitude and position of the pulse are obtained to quantize the sound source signal. .

【0023】[0023]

【発明の実施の形態】次に本発明の実施例について図面
を参照して説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, embodiments of the present invention will be described with reference to the drawings.

【0024】図1は本発明による音声符号化装置の一実
施例を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a speech coding apparatus according to the present invention.

【0025】図において、入力端子100から音声信号
を入力し、フレーム分割回路110では音声信号をフレ
ーム(例えば10ms)毎に分割し、サブフレーム分割
回路120では、フレームの音声信号をフレームよりも
短いサブフレーム(例えば5ms)に分割する。
In the figure, an audio signal is input from an input terminal 100, a frame dividing circuit 110 divides the audio signal for each frame (for example, 10 ms), and a sub-frame dividing circuit 120 divides the audio signal of the frame into a frame shorter than the frame. It is divided into subframes (for example, 5 ms).

【0026】スペクトルパラメータ計算回路200で
は、少なくとも一つのサブフレームの音声信号に対し
て、サブフレーム長よりも長い窓(例えば24ms)を
かけて音声を切り出してスペクトルパラメータをあらか
じめ定められた次数(例えばP=10次)計算する。こ
こでスペクトルパラメータの計算には、周知のLPC分
析や、Burg分析等を用いることができる。ここで
は、Burg分析を用いることとする。Burg分析の
詳細については、中溝著による“信号解析とシステム同
定”と題した単行本(コロナ社1988年刊)の82〜
87頁(文献4)等に記載されているので説明は略す
る。さらにスペクトルパラメータ計算部では、Bung
法により計算された線形予測係数αi (i=1,…,1
0)を量子化や補間に適したLSPパラメータに変換す
る。ここで、線形予測係数からLSPへの変換は、菅村
他による“線スペクトル対(LSP)音声分析合成方式
による音声情報圧縮”と題した論文(電子通信学会論文
誌、J64−A、pp.599−606、1981年)
(文献5)を参照することができる。例えば、第2サブ
フレームでBurg法により求めた線形予測係数を、L
SPパラメータに変換し、第1サブフレームのLSPを
直線補間により求めて、第1サブフレームのLSPを逆
変換して線形予測係数に戻し、第1,2サブフレームの
線形予測係数αil(i=1,…,10、l=1,…,
2)を聴感重み付け回路230に出力する。また、第2
サブフレームのLSPをスペクトルパラメータ量子化回
路210へ出力する。
The spectrum parameter calculation circuit 200 cuts out the speech signal by applying a window (for example, 24 ms) longer than the subframe length to the speech signal of at least one subframe, and sets the spectrum parameter to a predetermined order (for example, (P = 10th order) is calculated. Here, a well-known LPC analysis, Burg analysis, or the like can be used for calculating the spectrum parameters. Here, Burg analysis is used. For details of the Burg analysis, see the book entitled "Signal Analysis and System Identification" written by Nakamizo (Corona Publishing Co., 1988), 82-.
Since it is described on page 87 (Document 4) and the like, the description is omitted. Further, in the spectrum parameter calculation unit, Bung
Linear prediction coefficient α i (i = 1,..., 1)
0) is converted into LSP parameters suitable for quantization and interpolation. Here, the conversion from the linear prediction coefficient to the LSP is performed by a paper entitled "Speech Information Compression by Line Spectrum Pair (LSP) Speech Analysis / Synthesis Method" by Sugamura et al. -606, 1981)
(Reference 5). For example, the linear prediction coefficient obtained by the Burg method in the second subframe is represented by L
The LSP of the first sub-frame is converted to SP parameters, the LSP of the first sub-frame is obtained by linear interpolation, and the LSP of the first sub-frame is inversely converted to a linear prediction coefficient, and the linear prediction coefficient α il (i = 1, ..., 10, l = 1, ...,
2) is output to the auditory weighting circuit 230. Also, the second
The LSP of the subframe is output to spectrum parameter quantization circuit 210.

【0027】スペクトルパラメータ量子化回路210で
は、あらかじめ定められたサブフレームのLSPパラメ
ータを効率的に量子化する。量子化法として、ベクトル
量子化を用いるものとし、第2サブフレームのLSPパ
ラメータを量子化するものとする。LSPパラメータの
ベクトル量子化の手法は周知の手法を用いることができ
る。具体的な方法は例えば、特開平4−171500号
公報(特願平2−297600号)(文献6)や特開平
4−36300号公報(特願平3−261925号)文
献7)や、特開平5−6199号公報(特願平3−15
5049号)(文献8)や、T.Nomura et
al.,による“LSP CodingUsing V
Q−AVQ With Interpolation
in4.075kbps M−LCELP Speec
h Coder”と題した論文(Proc.Mobil
e Multimedia Communicatio
ns,pp.B.2.5,1993)(文献9)等を参
照できる。
The spectrum parameter quantization circuit 210 efficiently quantizes LSP parameters of a predetermined subframe. It is assumed that vector quantization is used as a quantization method, and LSP parameters of the second subframe are quantized. A well-known method can be used for the method of vector quantization of LSP parameters. Specific methods are described in, for example, JP-A-4-171500 (Japanese Patent Application No. 2-297600) (Reference 6), JP-A-4-36300 (Japanese Patent Application No. 3-261925) Reference 7), and JP-A-5-6199 (Japanese Patent Application No. 3-15)
No. 5049) (Reference 8) and T.I. Nomura et
al. "LSP CodingUsing V
Q-AVQ With Interpolation
in4.075kbps M-LCELP Spec
h Coder "(Proc. Mobil
e Multimedia Communicatio
ns, pp. B. 2.5, 1993) (Reference 9).

【0028】LSPコードブック211を用いて、下記
の数式1で表わされる歪みを最小化するコードベクトル
を選択して出力する。
Using the LSP codebook 211, a code vector that minimizes distortion represented by the following equation 1 is selected and output.

【0029】[0029]

【数1】 ここで、LSP(i),QLSP(i)j ,W(i)は
それぞれ、量子化前のi次目のLSP、量子化後のj番
目の結果、重み係数である。
(Equation 1) Here, LSP (i), QLSP (i) j , and W (i) are the i-th LSP before quantization, the j-th result after quantization, and the weight coefficient, respectively.

【0030】また、スペクトルパラメータ量子化回路2
10では、第2サブフレームで量子化したLSPパラメ
ータをもとに、第1サブフレームのLSPパラメータを
復元する。ここでは、現フレームの第2サブフレームの
量子化LSPパラメータと1つ過去のフレームの第2サ
ブフレームの量子化LSPを直線補間して、第1サブフ
レームのLSPを復元する。ここで、量子化前のLSP
と量子化後のLSPとの誤差電力を最小化するコードベ
クトルを1種類選択した後に、直線補間により第1サブ
フレームのLSPを復元できる。
The spectrum parameter quantization circuit 2
At 10, the LSP parameters of the first sub-frame are restored based on the LSP parameters quantized in the second sub-frame. Here, the LSP of the first subframe is restored by linearly interpolating the quantized LSP parameter of the second subframe of the current frame and the quantized LSP of the second subframe of the previous frame. Here, LSP before quantization
After selecting one type of code vector that minimizes the error power between the LSP and the quantized LSP, the LSP of the first subframe can be restored by linear interpolation.

【0031】以上により復元した第1サブフレームのL
SPと第2サブフレームの量子化LSPをサブフレーム
毎に線形予測係数α′i (i=1,…,10)に変換
し、インパルス応答計算回路310へ出力する。また、
第2サブフレームの量子化LSPのコードベクトルを表
すインデクスをマルチプレクサ400に出力する。
The L of the first subframe restored as described above
The SP and the quantized LSP of the second subframe are converted into linear prediction coefficients α ′ i (i = 1,..., 10) for each subframe and output to the impulse response calculation circuit 310. Also,
An index representing the code vector of the quantized LSP of the second subframe is output to the multiplexer 400.

【0032】聴感重み付け回路230は、スペクトルパ
ラメータ計算回路200から、各サブフレーム毎に量子
化前の線形予測係数αi (i=1,…,P)を入力し、
前記文献1にもとづき、サブフレームの音声信号に対し
て聴感重み付けを行い、聴感重み付け信号を出力する。
The perceptual weighting circuit 230 inputs the linear prediction coefficients α i (i = 1,..., P) before quantization from the spectrum parameter calculation circuit 200 for each subframe,
Based on Document 1, perceptual weighting is performed on the audio signal of the subframe, and a perceptual weighting signal is output.

【0033】応答信号計算回路240は、スペクトルパ
ラメータ計算回路200から、各サブフレーム毎に線形
予測係数αi を入力し、スペクトルパラメータ量子化回
路210から、量子化、補間して復元した線形予測係数
α′i をサブフレーム毎に入力し、保存されているフィ
ルタメモリの値を用いて、入力信号を零d(n)=0と
した応答信号を1サブフレーム分計算し、減算器235
へ出力する。ここで、応答信号xz (n)は下記の数式
2で表される。
The response signal calculation circuit 240 receives the linear prediction coefficient α i for each subframe from the spectrum parameter calculation circuit 200, and quantizes, interpolates, and restores the linear prediction coefficient α i from the spectrum parameter quantization circuit 210. α ′ i is input for each sub-frame, and a response signal with the input signal set to zero d (n) = 0 is calculated for one sub-frame using the stored value of the filter memory, and the subtractor 235
Output to Here, the response signal x z (n) is represented by Equation 2 below.

【0034】[0034]

【数2】 但し、n−i≦0のときは y(n−i)=p(N+(n−i)) (3) xz (n−i)=sw (N+(n−i)) (4) ここでNはサブフレーム長を示す。γは、聴感重み付け
量を制御する重み係数であり、下記の式(6)と同一の
値である。sw (n)、p(n)は、それぞれ、重み付
け信号計算回路の出力信号、後述の式(6)における右
辺第1項のフィルタの分母の項の出力信号をそれぞれ示
す。
(Equation 2) However, when ni ≦ 0, y (ni) = p (N + (ni)) (3) xz (ni) = sw (N + (ni)) (4) Here, N indicates a subframe length. γ is a weight coefficient for controlling the perceptual weighting amount, and is the same value as the following equation (6). s w (n) and p (n) denote the output signal of the weighting signal calculation circuit and the output signal of the denominator term of the filter on the right-hand side first term in equation (6) described later, respectively.

【0035】ピッチ抽出回路390は、聴感重み付け回
路230の出力を用いてピッチ周期に対応する遅延とゲ
インを複数個求める。以下ではこの個数を2とする。ピ
ッチ抽出回路390の構成を図2に示す。
The pitch extraction circuit 390 obtains a plurality of delays and gains corresponding to the pitch period using the output of the auditory weighting circuit 230. Hereinafter, this number is set to two. FIG. 2 shows the configuration of the pitch extraction circuit 390.

【0036】図2において、端子391から聴感重み付
け信号xw (n)を入力する。第1の遅延、ゲイン計算
回路392は、下記の数式3によって表わされる式
(5)を最小化するように第1の遅延T1 を求め、下記
の数式4によって表わされる式(6)から第1のゲイン
β1 を求める。
In FIG. 2, a perceptual weighting signal x w (n) is input from a terminal 391. The first delay / gain calculation circuit 392 obtains the first delay T 1 so as to minimize the equation (5) represented by the following equation 3, and obtains the first delay T 1 from the equation (6) represented by the following equation 4. A gain β 1 of 1 is obtained.

【0037】[0037]

【数3】 (Equation 3)

【0038】[0038]

【数4】 さらに、次式に従い第1のピッチ予測信号y1 (n)を
求め減算器394に出力する。
(Equation 4) Further, a first pitch prediction signal y 1 (n) is obtained according to the following equation and output to the subtractor 394.

【0039】 y1 (n)=β1 w (n−T1 ) (7) 減算器394は、次式により、第1のピッチ予測残差信
号e1 (n)を求める。
Y 1 (n) = β 1 xw (n−T 1 ) (7) The subtractor 394 obtains the first pitch prediction residual signal e 1 (n) by the following equation.

【0040】 e1 (n)=xw (n)−y1 (n) (8) 第2の遅延、ゲイン計算回路393は、e1 (n)から
第2の遅延T2 (n)、ゲインβ2 を求める。これら
は、式(5),(6)において、xw (n)のかわりに
1 (n)を用いれば良い。
E 1 (n) = x w (n) −y 1 (n) (8) The second delay / gain calculation circuit 393 calculates the second delay T 2 (n) from e 1 (n), determine the gain β 2. For these, in equations (5) and (6), e 1 (n) may be used instead of x w (n).

【0041】T2 ,T1 は、それぞれ、端子397,3
98から出力される。
T 2 and T 1 are terminals 397 and 3 respectively.
98.

【0042】インパルス応答計算回路310は、z変換
が下記の数式5で表される聴感重み付けフィルタのイン
パルス応答hw (n)をあらかじめ定められた点数Lだ
け計算し、適応コードブック回路300、音源量子化回
路350へ出力する。
The impulse response calculation circuit 310 calculates the impulse response h w (n) of the perceptual weighting filter whose z-transform is expressed by the following equation 5 by a predetermined point L, and the adaptive codebook circuit 300 and the sound source Output to the quantization circuit 350.

【0043】[0043]

【数5】 適応コードブック回路300は、T1 の近傍のサンプル
において、下記の数式6を最小化する遅延Tc1を計算す
る。なお、ここでは、適応コードブックの次数を1とす
る。
(Equation 5) The adaptive codebook circuit 300 calculates a delay T c1 that minimizes the following Expression 6 for samples near T 1 . Here, the order of the adaptive codebook is 1.

【0044】[0044]

【数6】 ここで、 yw (n−Tc1)=v1 (n−Tc1)*hw (n) (11) であり、記号*は畳み込み演算を表す。(Equation 6) Here, y w (n-T c1 ) = v 1 (n-T c1 ) * h w (n) (11), and the symbol * represents a convolution operation.

【0045】ゲインβc1を下記の数式7に従い求める。The gain β c1 is obtained according to the following equation (7).

【0046】[0046]

【数7】 ここで、女性音や子供の声に対して、遅延の抽出精度を
向上させるために、遅延を整数サンプルではなく、小数
サンプル値で求めてもよい。具体的な方法は、例えば、
P.Kroonらによる、“Pitch predic
tors with high temporal r
esolution”と題した論文(Proc.ICA
SSP,pp.661−664,1990年)(文献1
1)等を参照することができる。
(Equation 7) Here, in order to improve the extraction accuracy of the delay for the female sound and the voice of the child, the delay may be obtained by a decimal sample value instead of the integer sample. The specific method is, for example,
P. "Pitch predic," by Kron et al.
tors with high temporal r
esolution ”(Proc. ICA
SSP, pp. 661-664, 1990) (Reference 1).
1) etc. can be referred to.

【0047】同様の手法により、T2 の近傍のサンプル
において、遅延Tc2とゲインβc2を探索する。
In a similar manner, a delay T c2 and a gain β c2 are searched for in a sample near T 2 .

【0048】次に、ピッチ予測信号を計算し、音源量子
化回路350に出力する。
Next, a pitch prediction signal is calculated and output to the excitation quantization circuit 350.

【0049】 qw1(n) =βc1v(n−Tc1)*hw (n) +βc2v(n−Tc2)*hw (n) (13) 遅延Tc1,Tc2はマルチプレクサ400に出力される。Q w1 (n) = β c1 v (n−T c1 ) * h w (n) + β c2 v (n−T c2 ) * h w (n) (13) The delays T c1 and T c2 are multiplexers. Output to 400.

【0050】減算器236は、次式の計算を行ない、減
算結果を音源量子化回路350へ出力する。
The subtractor 236 calculates the following equation and outputs the subtraction result to the sound source quantization circuit 350.

【0051】 zw (n)=x′w (n)−qw (n) (14) 音源量子化回路350では、音源信号を、音源コードブ
ック351を用いてベクトル量子化する。減算器236
の出力と、インパルス応答計算回路310の出力を用い
て、下記の数式8を最小化するように、音源コードブッ
ク351から音源コードベクトルcj (n)を探索す
る。
Z w (n) = x ′ w (n) −q w (n) (14) In the excitation quantization circuit 350, the excitation signal is vector-quantized using the excitation codebook 351. Subtractor 236
Using the output of the impulse response calculation circuit 310 and the output of the impulse response calculation circuit 310, a sound source code vector c j (n) is searched from the sound source codebook 351 so as to minimize the following Expression 8.

【0052】[0052]

【数8】 ここで、記号*は、畳み込み演算を示す。(Equation 8) Here, the symbol * indicates a convolution operation.

【0053】選択された音源コードベクトルのインデク
スは、マルチプレクサ400に出力される。
The index of the selected sound source code vector is output to the multiplexer 400.

【0054】ゲイン量子化回路365は、ゲインコード
ブック355からゲインコードベクトルを読みだし、選
択された音源コードベクトルに対して、下記の数式9を
最小化するゲインコードベクトルを選択する。
The gain quantization circuit 365 reads a gain code vector from the gain code book 355, and selects a gain code vector that minimizes the following equation 9 for the selected excitation code vector.

【0055】ここでは、音源コードベクトルのゲインを
ベクトル量子化する例について示す。
Here, an example in which the gain of the excitation code vector is vector-quantized will be described.

【0056】[0056]

【数9】 ここで、G′t は、ゲインコードブック355に格納さ
れたゲインコードブックにおけるt番目のコードベクト
ルである。
(Equation 9) Here, G ′ t is the t-th code vector in the gain codebook stored in the gain codebook 355.

【0057】選択されたゲインコードベクトルを表すイ
ンデクスをマルチプレクサ400に出力する。
An index representing the selected gain code vector is output to the multiplexer 400.

【0058】重み付け信号計算回路360は、それぞれ
のインデクスを入力し、インデクスからそれに対応する
コードベクトルを読みだし、まず下式にもとづき駆動音
源信号v(n)を求める。
The weighting signal calculation circuit 360 receives the respective indexes, reads out the corresponding code vectors from the indexes, and obtains the driving sound source signal v (n) based on the following equation.

【0059】 v(n)=g(n)+G′t j (n) (19) v(n)を適応コードブック回路300に出力する。V (n) = g (n) + G ′ t c j (n) (19) Outputs v (n) to the adaptive codebook circuit 300.

【0060】次に、スペクトルパラメータ計算回路20
0の出力パラメータ、スペクトルパラメータ量子化回路
210の出力パラメータを用いて下記の数式10によ
り、応答信号sw (n)をサブフレーム毎に計算し、応
答信号計算回路240へ出力する。
Next, the spectrum parameter calculation circuit 20
Using the output parameter of 0 and the output parameter of the spectrum parameter quantization circuit 210, the response signal s w (n) is calculated for each subframe by the following equation 10, and output to the response signal calculation circuit 240.

【0061】[0061]

【数10】 以上により、第1の発明に対応する実施例の説明を終え
る。
(Equation 10) This concludes the description of the embodiment corresponding to the first invention.

【0062】図3は、第2の実施例の構成を示すブロッ
ク図である。図において、図1と異なるのは、音源量子
化回路500、振幅コードブック540、ゲイン量子化
回路550、ゲインコードブック560である。
FIG. 3 is a block diagram showing the configuration of the second embodiment. In the drawing, what is different from FIG. 1 is a sound source quantization circuit 500, an amplitude codebook 540, a gain quantization circuit 550, and a gain codebook 560.

【0063】音源量子化回路500は、M個の振幅が非
零のパルス列の位置と振幅を計算する。
The sound source quantization circuit 500 calculates the positions and the amplitudes of the M non-zero amplitude pulse trains.

【0064】音源量子化回路500の構成を示すブロッ
ク図を図4に示す。図4において、相関係数計算回路5
10は、端子501,502からそれぞれ、x
w (n),hw (n)を入力し、下記の数式11及び数
式12に従い、2種の相関係数d(n),φを計算し、
位置計算回路520、振幅量子化回路530に出力す
る。
FIG. 4 is a block diagram showing the configuration of the sound source quantization circuit 500. In FIG. 4, a correlation coefficient calculation circuit 5
10 is x from the terminals 501 and 502, respectively.
w (n) and h w (n) are input, and two types of correlation coefficients d (n) and φ are calculated according to the following Expressions 11 and 12.
Output to the position calculation circuit 520 and the amplitude quantization circuit 530.

【0065】[0065]

【数11】 [Equation 11]

【0066】[0066]

【数12】 位置計算回路520は、あらかじめ定められた個数Mの
非零の振幅のパルスの位置を計算する。これには、文献
3と同様に、各パルス毎に、あらかじめ定められた位置
の候補について、次式を最大化するパルスの位置を求め
る。
(Equation 12) The position calculation circuit 520 calculates the positions of a predetermined number M of non-zero amplitude pulses. For this, as in Reference 3, for each pulse, the position of the pulse that maximizes the following equation is determined for a predetermined position candidate.

【0067】例えば、位置の候補の例は、サブフレーム
長をN=40、パルスの個数をM=5とすると、下記の
表1のように表せる。
For example, as an example of a position candidate, if the subframe length is N = 40 and the number of pulses is M = 5, it can be expressed as shown in Table 1 below.

【0068】[0068]

【表1】 各パルスについて、位置の候補を調べ、次式を最大化す
る位置を選択する。
[Table 1] For each pulse, a candidate position is examined and the position that maximizes the following equation is selected.

【0069】 D=Ck 2 /Ek (23) ここで、Ck 及びEk は下記の数式13及び14により
表わされる。
D = C k 2 / E k (23) Here, C k and E k are represented by the following equations (13) and (14).

【0070】[0070]

【数13】 (Equation 13)

【0071】[0071]

【数14】 ここで、mk は、k番目のパルスの位置を示すsgn
(k)はk番目のパルスの極性である。
[Equation 14] Here, m k is, sgn indicating the position of the k-th pulse
(K) is the polarity of the k-th pulse.

【0072】M個のパルスの位置は振幅量子化回路53
0に出力される。
The positions of the M pulses are determined by the amplitude quantization circuit 53.
Output to 0.

【0073】振幅量子化回路530は、パルスの振幅を
振幅コードブック540を用いて量子化する。次式を最
大化する振幅コードベクトル選択する。
The amplitude quantization circuit 530 quantizes the pulse amplitude using the amplitude codebook 540. The amplitude code vector that maximizes the following equation is selected.

【0074】 Cj 2 /Ej (26) ここで、Cj 及びEj は下記の数式15及び16により
表わされる。
C j 2 / E j (26) Here, C j and E j are represented by the following Expressions 15 and 16.

【0075】[0075]

【数15】 (Equation 15)

【0076】[0076]

【数16】 ここで、g′kjは、i番目の振幅コードベクトルにおけ
るk番目のパルスの振幅を示す。
(Equation 16) Here, g ′ kj indicates the amplitude of the k-th pulse in the i-th amplitude code vector.

【0077】なお、パルスの振幅を量子化するための振
幅コードブックを、音声信号を用いてあらかじめ学習し
て格納しておくこともできる。コードブックの学習法
は、例えば、Linde氏らによる“An algor
ithm for vector quantizat
ion design,”と題した論文(IEEE T
rans.Commun.,pp.84−95,Jan
uary,1980)(文献12)等を参照できる。
Note that an amplitude codebook for quantizing the pulse amplitude can be learned and stored in advance using an audio signal. Codebook learning methods are described, for example, by Linde et al., “An algor.
ism for vector quantizat
ion design, "(IEEE T
rans. Commun. Pp. 84-95, Jan
uary, 1980) (Literature 12).

【0078】振幅コードベクトルのインデクスと位置の
情報は、それぞれ、端子503,504から出力され
る。
The index and position information of the amplitude code vector are output from terminals 503 and 504, respectively.

【0079】ゲイン量子化回路550は、ゲインコード
ブック560を用いてパルスのゲインを量子化する。下
記の数式17を最小化するようなゲインコードベクトル
を選択し、インデクスをマルチプレクサ400へ出力す
る。
The gain quantization circuit 550 quantizes the pulse gain using the gain codebook 560. A gain code vector that minimizes the following Expression 17 is selected, and the index is output to the multiplexer 400.

【0080】[0080]

【数17】 重み付け信号計算回路570は、それぞれのインデクス
を入力し、インデクスからそれに対応するコードベクト
ルを読みだし、まず下式にもとづき駆動音源信号v
(n)を求める。
[Equation 17] The weighting signal calculation circuit 570 inputs the respective indexes, reads out the corresponding code vectors from the indexes, and firstly obtains the driving sound source signal v based on the following equation.
Find (n).

【0081】 v(n)=g(n)+G′t g′kjw (n−mk ) (30) v(n)を適応コードブック回路300に出力する。[0081] v (n) = g (n ) + G 't g' kj h w (n-m k) (30) outputs v (n) to the adaptive codebook circuit 300.

【0082】次に、スペクトルパラメータ計算回路20
0の出力パラメータ、スペクトルパラメータ量子化回路
210の出力パラメータを用いて下記の数式18によ
り、応答信号sw (n)をサブフレーム毎に計算し、応
答信号計算回路240へ出力する。
Next, the spectrum parameter calculation circuit 20
Using the output parameter of 0 and the output parameter of the spectrum parameter quantization circuit 210, the response signal s w (n) is calculated for each subframe by the following Expression 18, and is output to the response signal calculation circuit 240.

【0083】[0083]

【数18】 図5は第3の実施例の構成を示すブロック図である。(Equation 18) FIG. 5 is a block diagram showing the configuration of the third embodiment.

【0084】モード判別回路900は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号を受取
り、モード判別情報をピッチ抽出回路600、マルチプ
レクサ400に出力する。
The mode discriminating circuit 900 receives the perceptual weighting signal from the perceptual weighting circuit 230 in frame units, and outputs the mode discriminating information to the pitch extracting circuit 600 and the multiplexer 400.

【0085】ここでは、モード判別に、現在のフレーム
の特徴量を用いる。特徴量としては、例えば、フレーム
で平均したピッチ予測ゲインを用いる。ピッチ予測ゲイ
ンの計算は、例えば下記の数式19を用いる。
Here, the feature amount of the current frame is used for mode determination. As the characteristic amount, for example, a pitch prediction gain averaged in a frame is used. For example, the following equation 19 is used to calculate the pitch prediction gain.

【0086】[0086]

【数19】 ここで、Lはフレームに含まれるサブフレームの個数で
ある。Pi ,Ei はそれぞれ、i番目のサブフレームで
の音声パワー、ピッチ予測誤差パワーを示し、下記の数
式20及び21により表わされる。
[Equation 19] Here, L is the number of subframes included in the frame. P i and E i represent the speech power and the pitch prediction error power in the i-th subframe, respectively, and are represented by the following equations 20 and 21.

【0087】[0087]

【数20】 (Equation 20)

【0088】[0088]

【数21】 ここで、Tは予測ゲインを最大化する最適遅延である。(Equation 21) Here, T is an optimal delay for maximizing the prediction gain.

【0089】フレーム平均ピッチ予測ゲインGをあらか
じめ定められた複数個のしきい値と比較して複数種類の
モードに分類する。モードの個数としては、例えば4を
用いることができる。
The frame average pitch prediction gain G is compared with a plurality of predetermined thresholds, and classified into a plurality of types of modes. As the number of modes, for example, 4 can be used.

【0090】ピッチ抽出回路600は、モード判別情報
を入力し、あらかじめ定められたモードの場合に図2と
同一の処理を行ない、複数個の遅延を出力する。それ以
外のモードでは、遅延の出力は行なわない。
Pitch extraction circuit 600 receives the mode discrimination information, performs the same processing as in FIG. 2 in the case of a predetermined mode, and outputs a plurality of delays. In other modes, no delay is output.

【0091】図6は、第4の実施例の構成を示すブロッ
ク図である。図5におけるモード判別回路900を図3
に付加し、ピッチ抽出回路600を用いたものであるの
で、説明は省略する。
FIG. 6 is a block diagram showing the configuration of the fourth embodiment. The mode discriminating circuit 900 in FIG.
, And the pitch extraction circuit 600 is used, so that the description is omitted.

【0092】図7は、第5の実施例の構成を示すブロッ
ク図である。図において、図1の構成と異なるのは、ピ
ッチ抽出回路700、音源量子化回路850、第1の音
源コードブック851、第2の音源コードブック852
であるので、これらを説明する。
FIG. 7 is a block diagram showing the configuration of the fifth embodiment. In the figure, the configuration different from that of FIG.
Therefore, these will be described.

【0093】図8はピッチ抽出回路700の構成を示す
ブロック図である。
FIG. 8 is a block diagram showing a configuration of the pitch extraction circuit 700.

【0094】第1のピッチ予測利得計算回路710で
は、第1の遅延、ゲイン計算回路392で求めた遅延を
用いて第1のピッチ予測利得を下記の数式22から求め
る。
The first pitch prediction gain calculation circuit 710 obtains the first pitch prediction gain from the following equation 22 using the first delay and the delay obtained by the gain calculation circuit 392.

【0095】[0095]

【数22】 判別回路730は、ピッチ予測ゲインG1 があらかじめ
定められたしきい値よりも大きい場合は第2の遅延、ゲ
イン計算回路に対して処理を継続させる。
(Equation 22) Discriminating circuit 730, if the pitch prediction gain G 1 is greater than the predetermined threshold is a second delay, to continue the process on the gain calculating circuit.

【0096】G1 がしきい値よりも小さい場合は、第2
の遅延、ゲイン計算回路393の処理は行なわずに、第
1の遅延T1 を出力する。
If G 1 is smaller than the threshold, the second
, And outputs the first delay T 1 without performing the processing of the gain calculation circuit 393.

【0097】処理を継続する場合は、第2の遅延、ゲイ
ン計算回路393は、減算器394に出力に対して、式
(5)及び式(6)のxw (n)をe1 (n)におきか
えて第2の遅延、ゲインを計算する。
When the processing is continued, the second delay / gain calculation circuit 393 outputs x w (n) of the equations (5) and (6) to e 1 (n ) And calculate the second delay and gain.

【0098】第2のピッチ予測利得計算回路720は、
式(35)においてxw (n)e1(n)におきかえて
第2のピッチ予測利得G2 を計算する。
The second pitch prediction gain calculation circuit 720
In the equation (35), the second pitch prediction gain G 2 is calculated in place of x w (n) e 1 (n).

【0099】判別回路730は、G2 をしきい値と判別
し、あらかじめ定められたしきい値よりも大きいとき
は、第1の遅延と第2の遅延を出力する。あらかじめ定
められたしきい値よりもG2 が小さい時は、第1の遅延
のみを出力する。さらに、遅延の個数を端子399から
出力する。
The discriminating circuit 730 discriminates G 2 as a threshold value, and outputs a first delay and a second delay when it is larger than a predetermined threshold value. When advance G 2 is smaller than the threshold value defined outputs only the first delay. Further, the number of delays is output from a terminal 399.

【0100】図7にもどって、音源量子化回路850
は、まず、ピッチ抽出回路700から出力される遅延の
個数を調べ、遅延の個数が2であれば、通常のビット数
(B1ビット)である第1の音源コードブック851を
使用して音源信号を量子化するが、遅延の個数が1のと
きは、遅延を表すビット数と同一のビッチ数(B2 )の
第2の音源コードブック852を音源コードブック85
1と併用する。
Returning to FIG. 7, the sound source quantization circuit 850
First, the number of delays output from the pitch extraction circuit 700 is checked, and if the number of delays is 2, the sound source is generated using the first sound source codebook 851, which is a normal number of bits (B 1 bit). The signal is quantized. If the number of delays is 1, the second excitation codebook 852 having the same number of bits (B 2 ) as the number of bits representing the delay is transmitted to the excitation codebook 85.
Use together with 1.

【0101】図9は第6の実施例の構成を示すブロック
図である。図3において、図7のピッチ抽出回路700
を用いたものである。
FIG. 9 is a block diagram showing the configuration of the sixth embodiment. 3, the pitch extraction circuit 700 of FIG.
Is used.

【0102】音源量子化回路860は、ピッチ抽出回路
700から遅延の個数を入力し、遅延の個数により、パ
ルスの個数をM1 とM2 (M1 <M2 )に切替え、さら
に2種のビット数の異なる振幅コードブックを切替え
る。遅延の個数が2個の時はパルスの個数はM1 とし、
第1の振幅コードブック861を用いる。遅延の個数が
1のときはパルスの個数をM2 とし、第2の振幅コード
ブック862を用いる。
The sound source quantization circuit 860 inputs the number of delays from the pitch extraction circuit 700, switches the number of pulses to M 1 and M 2 (M 1 <M 2 ) according to the number of delays, and Switching between amplitude codebooks having different numbers of bits. The number of pulses when the number is two of delay is set to M 1,
The first amplitude codebook 861 is used. When the number of delays is 1, the number of pulses is M 2 and the second amplitude codebook 862 is used.

【0103】図10は、第7の実施例の構成を示すブロ
ック図である。
FIG. 10 is a block diagram showing the configuration of the seventh embodiment.

【0104】図7において、図5のモード判別回路90
0を付加し、ピッチ抽出回路800は、あらかじめ定め
られたモードのときに、図7のピッチ抽出回路700と
同一の動作を行なう。
In FIG. 7, the mode discriminating circuit 90 shown in FIG.
0 is added, and the pitch extraction circuit 800 performs the same operation as the pitch extraction circuit 700 in FIG. 7 in a predetermined mode.

【0105】図11は、第8の実施例の構成を示すブロ
ック図である。図11は、図9において、図10に示し
たモード判別回路900、ピッチ抽出回路800を付加
したものであるので、説明を省略する。
FIG. 11 is a block diagram showing the configuration of the eighth embodiment. FIG. 11 is obtained by adding the mode determining circuit 900 and the pitch extracting circuit 800 shown in FIG. 10 to FIG.

【0106】上述した実施例に限らず、種々の変形が可
能である。
The present invention is not limited to the above-described embodiment, and various modifications are possible.

【0107】モード情報を用いて、音源量子化回路や、
ゲインコードブックを切替える構成とすることもでき
る。
Using the mode information, a sound source quantization circuit,
A configuration in which the gain codebook is switched may be adopted.

【0108】音源コードブックを用いる場合、式(1
5)で示した歪みの小さい順に、複数個のコードベクト
ルを選択し、ゲイン量子化回路でゲインを量子化しなが
ら、式(18)を最小化する音源コードベクトルとゲイ
ンコードベクトルの組合せを選択しても良い。
When the sound source codebook is used, the expression (1)
A plurality of code vectors are selected in ascending order of the distortion shown in 5), and while the gain is quantized by the gain quantization circuit, a combination of the excitation code vector and the gain code vector that minimizes the expression (18) is selected. May be.

【0109】また、パルス列で音源を表す場合、パルス
の振幅を量子化するさいに、パルスの位置を複数セット
求め、これらの各々に対して振幅コードブックを探索
し、式(26)を最大化する組合せを選択してもよい。
また、これらの組合せを複数種類ゲイン量子化回路に出
力し、ゲイン量子化しながら、式(29)を最小化する
ような位置、振幅コードベクトル、ゲインコードベクト
ルの組合せを選択してもも良い。
When the sound source is represented by a pulse train, when quantizing the pulse amplitude, a plurality of sets of pulse positions are obtained, an amplitude codebook is searched for each of these positions, and equation (26) is maximized. May be selected.
Alternatively, a combination of a position, an amplitude code vector, and a gain code vector that minimizes the expression (29) may be selected by outputting these combinations to a plurality of types of gain quantization circuits and performing gain quantization.

【0110】振幅コードブック540のかわりに、あら
かじめ定められたビット数の極性コードブックを用いて
も良い。
Instead of the amplitude codebook 540, a polarity codebook having a predetermined number of bits may be used.

【0111】ピッチ抽出回路で求めた複数個の遅延は、
差分符号化することにより量子化ビット数を削減でき
る。
A plurality of delays obtained by the pitch extraction circuit are as follows:
By performing differential coding, the number of quantization bits can be reduced.

【0112】[0112]

【発明の効果】以上説明したように、本発明によれば、
入力信号から複数個の遅延を求めた後に音源信号を計算
することで、複数話者からなる音声や、複数個の楽器か
ら構成される音楽信号に対して、従来よりも良好な音質
が得られるという効果がある。
As described above, according to the present invention,
By calculating the sound source signal after obtaining a plurality of delays from the input signal, it is possible to obtain better sound quality than before for voices composed of multiple speakers or music signals composed of a plurality of musical instruments. This has the effect.

【0113】さらに、遅延を求めながらピッチ予測利得
を求め、ピッチ予測利得があらかじめ定められた条件を
満たすかどうかを判別することで遅延の個数を可変にし
ているので、入力信号の特徴に応じて遅延の個数を適切
に選ぶことができ、入力信号を良好に符号化することが
できる。
Further, the pitch prediction gain is obtained while obtaining the delay, and it is determined whether or not the pitch prediction gain satisfies a predetermined condition, thereby making the number of delays variable. The number of delays can be appropriately selected, and the input signal can be satisfactorily encoded.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施例による信号符号化装置の
ブロック図である。
FIG. 1 is a block diagram of a signal encoding device according to a first embodiment of the present invention.

【図2】図1の信号符号化装置のピッチ抽出回路390
のブロック図である。
2 is a pitch extraction circuit 390 of the signal encoding device of FIG.
It is a block diagram of.

【図3】本発明の第2の実施例による信号符号化装置の
ブロック図である。
FIG. 3 is a block diagram of a signal encoding device according to a second embodiment of the present invention.

【図4】図3の信号符号化装置の音源量子化回路500
のブロック図である。
FIG. 4 is an excitation quantization circuit 500 of the signal encoding apparatus of FIG. 3;
It is a block diagram of.

【図5】本発明の第3の実施例による信号符号化装置の
ブロック図である。
FIG. 5 is a block diagram of a signal encoding device according to a third embodiment of the present invention.

【図6】本発明の第4の実施例による信号符号化装置の
ブロック図である。
FIG. 6 is a block diagram of a signal encoding device according to a fourth embodiment of the present invention.

【図7】本発明の第5の実施例による信号符号化装置の
ブロック図である。
FIG. 7 is a block diagram of a signal encoding device according to a fifth embodiment of the present invention.

【図8】図7の信号符号装置のピッチ抽出回路700の
ブロック図である。
8 is a block diagram of a pitch extracting circuit 700 of the signal encoding device of FIG.

【図9】本発明の第6の実施例による信号符号化装置の
ブロック図である。
FIG. 9 is a block diagram of a signal encoding device according to a sixth embodiment of the present invention.

【図10】本発明の第7の実施例による信号符号化装置
のブロック図である。
FIG. 10 is a block diagram of a signal encoding device according to a seventh embodiment of the present invention.

【図11】本発明の第8の実施例による信号符号化装置
のブロック図である。
FIG. 11 is a block diagram of a signal encoding device according to an eighth embodiment of the present invention.

【符号の説明】[Explanation of symbols]

110 フレーム分割回路 120 サブフレーム分割回路 200 スペクトルパラメータ計算回路 210 スペクトルパラメータ量子化回路 230 聴感重み付け回路 235,236 減算回路 240 応答信号計算回路 300 適応コードブック回路 310 インパルス応答計算回路 350,500,850,860 音源量子化回路 351 音源コードブック 355,560 ゲインコードブック 365,550 ゲイン量子化回路 390,600,700,800 ピッチ抽出回路 392 第1の遅延計算回路 393 第2の遅延計算回路 400 マルチプレクサ 510 相関係数計算回路 520 位置計算回路 530 振幅量子化回路 540 振幅コードブック 710 第1のピッチ予測利得計算回路 720 第2のピッチ予測利得計算回路 730 判別回路 851 第1の音源コードブック、 852 第2の音源コードブック、 861 第1の振幅コードブック 862 第2の振幅コードブック 900 モード判別回路 Reference Signs List 110 frame division circuit 120 subframe division circuit 200 spectrum parameter calculation circuit 210 spectrum parameter quantization circuit 230 auditory weighting circuit 235,236 subtraction circuit 240 response signal calculation circuit 300 adaptive codebook circuit 310 impulse response calculation circuit 350, 500, 850, 860 Sound source quantization circuit 351 Sound source codebook 355, 560 Gain codebook 365, 550 Gain quantization circuit 390, 600, 700, 800 Pitch extraction circuit 392 First delay calculation circuit 393 Second delay calculation circuit 400 Multiplexer 510 phase Relation number calculation circuit 520 Position calculation circuit 530 Amplitude quantization circuit 540 Amplitude codebook 710 First pitch prediction gain calculation circuit 720 Second pitch prediction gain calculation circuit 730 Another circuit 851 first excitation codebook, 852 second excitation codebook 861 first amplitude codebook 862 second amplitude codebook 900 mode discriminating circuit

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 入力信号からスペクトルパラメータを求
めて量子化するスペクトルパラメータ計算部と、前記入
力信号から第1のピッチ周期に対応する第1の遅延を求
めピッチ予測残差信号を求め前記ピッチ予測残差信号か
ら第2のピッチ周期に対応する第2の遅延を求め、これ
ら第1及び第2の遅延を少なくとも含む、あらかじめ定
められた複数個の遅延を求めて出力する遅延計算部と、
前記複数個の遅延を用いてピッチ予測した残差信号に対
して音源信号を求めて量子化して出力する音源量子化部
を有することを特徴とする信号符号化装置。
1. A spectrum parameter calculation unit for obtaining and quantizing a spectrum parameter from an input signal, obtaining a first delay corresponding to a first pitch period from the input signal, obtaining a pitch prediction residual signal, and obtaining the pitch prediction residual signal. A delay calculating unit that calculates a second delay corresponding to a second pitch period from the residual signal, and calculates and outputs a plurality of predetermined delays including at least the first and second delays;
A signal encoding apparatus comprising: an excitation quantization unit that obtains an excitation signal for a residual signal whose pitch has been predicted using the plurality of delays, quantizes and outputs the excitation signal.
【請求項2】 前記信号の音源信号が振幅が非零の複数
個のパルスから構成されることを特徴とする請求項1記
載の信号符号化装置。
2. The signal encoding apparatus according to claim 1, wherein the excitation signal of the signal is composed of a plurality of pulses having a non-zero amplitude.
【請求項3】 入力信号からスペクトルパラメータを求
めて量子化するスペクトルパラメータ計算部と、前記入
力信号から特徴量を抽出してモードを判別するモード判
別部と、あらかじめ定められたモードにおいて前記入力
信号から第1のピッチ周期に対応する第1の遅延を求め
ピッチ予測残差信号を求め前記ピッチ予測残差信号から
第2のピッチ周期に対応する第2の遅延を求め、これら
第1及び第2の遅延を少なくとも含む、あらかじめ定め
られた複数個の遅延を求めて出力する遅延計算部と、前
記複数個の遅延を用いてピッチ予測した残差信号に対し
て音源信号を求めて量子化して出力する音源量子化部を
有することを特徴とする信号符号化装置。
3. A spectrum parameter calculation unit for obtaining and quantizing a spectrum parameter from an input signal, a mode discrimination unit for extracting a feature quantity from the input signal and discriminating a mode, and the input signal in a predetermined mode. , A first delay corresponding to a first pitch period is obtained, a pitch prediction residual signal is obtained, a second delay corresponding to a second pitch period is obtained from the pitch prediction residual signal, and the first and second delays are obtained. A delay calculation unit for obtaining and outputting a plurality of predetermined delays, and obtaining and quantizing an excitation signal for a pitch-predicted residual signal using the plurality of delays. A signal encoding device, comprising:
【請求項4】 前記信号の音源信号が振幅が非零の複数
個のパルスから構成されることを特徴とする請求項3記
載の信号符号化装置。
4. The signal encoding apparatus according to claim 3, wherein the excitation signal of the signal is composed of a plurality of non-zero amplitude pulses.
【請求項5】 入力信号からスペクトルパラメータを求
めて量子化するスペクトルパラメータ計算部と、前記入
力信号から第1のピッチ周期に対応する第1の遅延を求
めピッチ予測残差信号を求め第1のピッチ予測利得を計
算し、前記ピッチ予測残差信号から第2のピッチ周期に
対応する第2の遅延を求めこれらの処理を繰り返すピッ
チ予測部と、前記ピッチ予測利得があらかじめ定められ
た条件を満たすかどうかを判別する判別部と、前記ピッ
チ予測利得があらかじめ定められた条件を満たさない場
合に前記遅延を用いてピッチ予測した残差信号に対して
音源信号を求めて量子化して出力する音源量子化部を有
することを特徴とする信号符号化装置。
5. A spectrum parameter calculator for obtaining and quantizing a spectrum parameter from an input signal, a first delay corresponding to a first pitch period is obtained from the input signal, and a pitch prediction residual signal is obtained. A pitch prediction unit that calculates a pitch prediction gain, obtains a second delay corresponding to a second pitch period from the pitch prediction residual signal, and repeats these processes; and the pitch prediction gain satisfies a predetermined condition. A determining unit that determines whether the pitch prediction gain does not satisfy a predetermined condition, and obtains and quantizes a source signal with respect to a residual signal pitch-predicted using the delay when the pitch prediction gain does not satisfy a predetermined condition. A signal encoding device comprising an encoding unit.
【請求項6】 前記信号の音源信号が振幅が非零の複数
個のパルスから構成されることを特徴とする請求項5記
載の信号符号化装置。
6. The signal encoding apparatus according to claim 5, wherein the excitation signal of the signal is composed of a plurality of pulses having a non-zero amplitude.
【請求項7】 入力信号からスペクトルパラメータを求
めて量子化するスペクトルパラメータ計算部と、前記入
力信号から特徴量を抽出してモードを判別するモード判
別部と、あらかじめ定められたモードにおいて前記入力
信号から第1のピッチ周期に対応する第1の遅延を求め
ピッチ予測残差信号を求め第1のピッチ予測利得を計算
し、前記ピッチ予測残差信号から第2のピッチ周期に対
応する第第2の遅延を求めこれらの処理を繰り返すピッ
チ予測部と、前記ピッチ予測利得があらかじめ定められ
た条件を満たすかどうかを判別する判別部と、前記ピッ
チ予測利得があらかじめ定められた条件を満たさない場
合は前記遅延を用いてピッチ予測した残差信号に対して
音源信号を求めて量子化して出力する音源量子化部を有
することを特徴とする信号符号化装置。
7. A spectrum parameter calculation unit for obtaining and quantizing a spectrum parameter from an input signal, a mode discrimination unit for extracting a feature amount from the input signal and discriminating a mode, the input signal in a predetermined mode , A first delay corresponding to a first pitch period is obtained, a pitch prediction residual signal is obtained, a first pitch prediction gain is calculated, and a second pitch corresponding to a second pitch period is calculated from the pitch prediction residual signal. A pitch prediction unit that repeats these processes to determine the delay, a determination unit that determines whether the pitch prediction gain satisfies a predetermined condition, and a case where the pitch prediction gain does not satisfy a predetermined condition. A sound source quantizing unit that obtains a sound source signal for the residual signal whose pitch is predicted using the delay, and quantizes and outputs the sound source signal. Signal encoding device.
【請求項8】 前記信号の音源信号が振幅が非零の複数
個のパルスから構成されることを特徴とする請求項7記
載の信号符号化装置。
8. The signal encoding apparatus according to claim 7, wherein the excitation signal of the signal includes a plurality of non-zero amplitude pulses.
JP08164840A 1996-06-25 1996-06-25 Signal encoding device Expired - Fee Related JP3092654B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08164840A JP3092654B2 (en) 1996-06-25 1996-06-25 Signal encoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08164840A JP3092654B2 (en) 1996-06-25 1996-06-25 Signal encoding device

Publications (2)

Publication Number Publication Date
JPH1011093A true JPH1011093A (en) 1998-01-16
JP3092654B2 JP3092654B2 (en) 2000-09-25

Family

ID=15800927

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08164840A Expired - Fee Related JP3092654B2 (en) 1996-06-25 1996-06-25 Signal encoding device

Country Status (1)

Country Link
JP (1) JP3092654B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6856955B1 (en) 1998-07-13 2005-02-15 Nec Corporation Voice encoding/decoding device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6856955B1 (en) 1998-07-13 2005-02-15 Nec Corporation Voice encoding/decoding device

Also Published As

Publication number Publication date
JP3092654B2 (en) 2000-09-25

Similar Documents

Publication Publication Date Title
JP3094908B2 (en) Audio coding device
JP3196595B2 (en) Audio coding device
EP0957472B1 (en) Speech coding apparatus and speech decoding apparatus
JPH06222797A (en) Voice encoding system
EP1005022B1 (en) Speech encoding method and speech encoding system
JPH09281995A (en) Signal coding device and method
JP3266178B2 (en) Audio coding device
JP3335841B2 (en) Signal encoding device
US7680669B2 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JP3616432B2 (en) Speech encoding device
JP3308764B2 (en) Audio coding device
JP3003531B2 (en) Audio coding device
JP3299099B2 (en) Audio coding device
JP3360545B2 (en) Audio coding device
JP3092654B2 (en) Signal encoding device
JP3153075B2 (en) Audio coding device
JP3144284B2 (en) Audio coding device
JP3319396B2 (en) Speech encoder and speech encoder / decoder
JP4510977B2 (en) Speech encoding method and speech decoding method and apparatus
JP3471542B2 (en) Audio coding device
JP2001318698A (en) Voice coder and voice decoder
JP2001142499A (en) Speech encoding device and speech decoding device
JP3089967B2 (en) Audio coding device
JP3192051B2 (en) Audio coding device
JPH08320700A (en) Sound coding device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000628

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070728

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080728

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees