JPH056199A - Voice parameter coding system - Google Patents
Voice parameter coding systemInfo
- Publication number
- JPH056199A JPH056199A JP3155049A JP15504991A JPH056199A JP H056199 A JPH056199 A JP H056199A JP 3155049 A JP3155049 A JP 3155049A JP 15504991 A JP15504991 A JP 15504991A JP H056199 A JPH056199 A JP H056199A
- Authority
- JP
- Japan
- Prior art keywords
- codebook
- parameter
- subframes
- subframe
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は音声信号を低いビットレ
ート、特に8kb/s以下のビットレートで高品質に符
号化する音声符号化方式に供するための音声パラメータ
符号方式に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice parameter coding system for use in a voice coding system for coding a voice signal with a low bit rate, particularly with a bit rate of 8 kb / s or less.
【0002】[0002]
【従来の技術】音声信号を8kb/s以下の低いビット
レートで符号化する方式としては、例えば、M.Sch
roeder and B.Atal氏による”Cod
e−excited linear predicti
on:High quality speech at
very low bit rates”(Pro
c.ICASSP,pp.937−940,1985
年)と題した論文(文献1)や、Kleijn氏らによ
る”Improved speech quality
and efficient vector qua
ntizationin SELP”(Proc.IC
ASSP,pp.155−158,1988年)と題し
た論文(文献2)等に記載されているCELP(Cod
e Excited LPC Coding)方式が知
られている。この方式では、まず送信側は、音声信号の
スペクトル特性を表すスペクトルパラメータをフレーム
毎(例えば20ms)に音声信号から抽出し、さらにフ
レームを小区間サブフレーム(例えば5ms)に分割す
る。次にこのサブフレーム毎に、過去の音源信号をもと
に長時間相関(ピッチ相関)を表すピッチパラメータを
抽出し、このピッチパラメータにより前述のサブフレー
ムの音声信号を長期予測する。次に長期予測して求めた
残差信号に対して、予め定められた種類の雑音信号から
なるコードブックから選択した信号により合成した信号
と、前述の音声信号との誤差電力を最小化するように一
種類の雑音信号を選択し、この種類を表すインデクス及
びゲイン並びに前述のスペクトルパラメータ及びピッチ
パラメータを伝送する。2. Description of the Related Art As a method for encoding a voice signal at a low bit rate of 8 kb / s or less, for example, M. Sch
roeder and B.I. "Cod by Atal
e-excited linear predictive
on: High quality speech at
Very low bit rates "(Pro
c. ICASSP, pp. 937-940, 1985.
(1), and “Improved speech quality” by Kleijn et al.
and effective vector qua
ntification in SELP "(Proc. IC
ASSP, pp. 155-158, 1988) entitled papers (CELP described in the literature 2), or the like (C od
e E xcited LP C Coding) method is known. In this method, the transmitting side first extracts a spectrum parameter indicating the spectrum characteristic of the voice signal from the voice signal for each frame (for example, 20 ms), and further divides the frame into sub-interval subframes (for example, 5 ms). Next, for each subframe, a pitch parameter representing a long-term correlation (pitch correlation) is extracted based on the past sound source signal, and the speech signal of the above-mentioned subframe is long-term predicted by this pitch parameter. Next, with respect to the residual signal obtained by long-term prediction, the error power between the signal synthesized with the signal selected from the codebook consisting of the noise signal of the predetermined type and the above-mentioned voice signal is minimized. A noise signal of one type is selected, and the index and gain representing this type and the above-mentioned spectrum parameter and pitch parameter are transmitted.
【0003】CELP方式では、音声のスペクトルパラ
メータとしてはLPC分析により求めたLPCパラメー
タを用い、このLPCパラメータを量子化する。量子化
法としては、通常スカラ量子化が用いられており、10
次のLPC係数を量子化するのにフレーム当り34ビッ
ト(1.7kb/s)程度のビット数が必要であり、ビ
ット数をさらに低減すると音質が低下する。LPCパラ
メータをより効率的に量子化する方法として、Mori
ya氏らによる”Transform coding
of speech using a weighte
d vector quantizer,”と題した論
文(IEEE J.Sel.Areas,Commu
n.,pp.425−431,1988年)(文献3)
等に記載されたベクトル−スカラ量子化法などが提案さ
れているが、フレーム当り27〜30ビット程度のビッ
ト数が必要である。In the CELP method, LPC parameters obtained by LPC analysis are used as speech spectrum parameters, and the LPC parameters are quantized. Scalar quantization is usually used as the quantization method.
Quantizing the next LPC coefficient requires about 34 bits (1.7 kb / s) per frame, and if the number of bits is further reduced, the sound quality deteriorates. As a method for more efficiently quantizing the LPC parameter, Mori
"Transform coding by ya, et al.
of speech using a weighte
d vector quantizer, "(IEEE J. Sel. Areas, Commu
n. , Pp. 425-431, 1988) (Reference 3)
Although the vector-scalar quantization method described in U.S.A., etc. is proposed, it requires about 27 to 30 bits per frame.
【0004】[0004]
【発明が解決しようとする課題】上述したCELP方式
のビットレートをさらに低減するためには、スペクトル
パラメータの効率的な量子化法が必要であるが、スペク
トルパラメータの量子化に必要なビット数を下げるため
にフレーム長を長くとると、スペクトルの時間的変化を
良好に表すことが困難となり、時間歪が増大し音質が大
幅に劣化していた。In order to further reduce the bit rate of the CELP method described above, an efficient quantization method for spectrum parameters is required. However, the number of bits required for quantization of spectrum parameters is reduced. If the frame length is made long in order to lower the frequency, it becomes difficult to express the temporal change of the spectrum well, the time distortion increases, and the sound quality deteriorates significantly.
【0005】本発明の目的は、上述した問題点を解決
し、スペクトルパラメータを従来よりも少ないビット数
で量子化しても良好な音質を提供できる音声パラメータ
符号化方式を提供することにある。An object of the present invention is to solve the above-mentioned problems and to provide a voice parameter coding system capable of providing good sound quality even if a spectrum parameter is quantized with a smaller number of bits than the conventional one.
【0006】[0006]
【課題を解決するための手段】第1の発明の音声パラメ
ータ符号化方式は、入力した音声信号フレームに分割
し、さらにフレームよりも短い複数個のサブフレームに
分割する手段と、前記サブフレームの少なくとも一つに
ついて前記音声信号に対してスペクトルパラメータを予
め定められた次数だけ求める手段と、一つのサブフレー
ムのスペクトルパラメータを予め構成した第1のコード
ブックを用いて量子化し、他の少なくとも一つサブフレ
ームのスペクトルパラメータを、当該フレームでのスペ
クトルパラメータの量子化値と、過去のフレームでのス
ペクトルパラメータの量子化値と、第2のコードブック
とを用いて量子化することを特徴とする。A speech parameter encoding system according to a first aspect of the present invention divides an input speech signal frame and further divides it into a plurality of subframes shorter than the frame, and the subframe of the subframe. A means for obtaining a spectral parameter of at least one predetermined order with respect to the speech signal for at least one, and a spectral parameter of one subframe is quantized by using a preconfigured first codebook, and at least another one It is characterized in that the spectral parameter of the subframe is quantized by using the quantized value of the spectral parameter in the frame, the quantized value of the spectral parameter in the past frame, and the second codebook.
【0007】第2の発明の音声パラメータ符号化方式
は、第1の発明において、第1のコードブック又は第2
のコードブックの少なくとも一方において、量子化歪の
小さい順に複数種類の候補を出力し、他のサブフレーム
においては、スペクトルパラメータを当該フレームでの
スペクトルパラメータの量子化値と、過去のフレームで
のスペクトルパラメータの量子化値と、第2のコードブ
ックとを用いて量子化して量子化歪を求め前記量子化歪
を複数サブフレームにわたり累積し、前記累積値を最小
にする候補を選択し出力することを特徴とする。A speech parameter coding system according to a second invention is the speech parameter coding system according to the first invention, wherein the first codebook or the second codebook is used.
In at least one of the codebooks, a plurality of types of candidates are output in the ascending order of quantization distortion, and in other subframes, the spectral parameter is a quantized value of the spectrum parameter in the frame and the spectrum in the past frame. Quantizing using a quantized value of a parameter and a second codebook to obtain a quantized distortion, accumulating the quantized distortion over a plurality of subframes, and selecting and outputting a candidate that minimizes the accumulated value. Is characterized by.
【0008】第3の発明の音声パラメータ符号化方式
は、入力した音声信号をフレームに分割し、さらにフレ
ームよりも短い複数個のサブフレームに分割する手段
と、前記サブフレームの少なくとも一つについて前記音
声信号に対してスペクトルパラメータを予め定められた
次数だけ求める手段と、一つのサブフレームのスペクト
ルパラメータを予め構成した第1のコードブックを用い
て量子化し、他の少なくとも一つのサブフレームでは当
該フレームでのスペクトルパラメータの量子化値と過去
のフレームでのスペクトルパラメータの量子化値とを用
いてあらかじめ定められた方法によりスペクトルパラメ
ータを復元し、当該サブフレームのスペクトルパラメー
タと前記復元値との誤差を小さくするように第2のコー
ドブックを選択することを特徴とする。A speech parameter coding system according to a third aspect of the present invention comprises means for dividing an inputted speech signal into frames and further dividing into a plurality of subframes shorter than the frame, and at least one of the subframes. A means for obtaining a spectral parameter of a predetermined order for an audio signal, and a spectral parameter of one subframe are quantized using a preconfigured first codebook, and the frame is quantized in at least one other subframe. The spectral parameter is restored by a predetermined method using the quantized value of the spectral parameter and the quantized value of the spectral parameter in the past frame, and the error between the spectral parameter of the subframe and the restored value is calculated. You can choose a second codebook to make it smaller. The features.
【0009】第4の発明の音声パラメータ符号化方式
は、第2の発明において、第1のコードブック又は第2
のコードブックの少なくとも一方において、量子化歪の
小さい順に複数種類の候補を出力し、他のサブフレーム
においては、当該サブフレームのスペクトルパラメータ
と前記復元値との誤差電力を複数サブフレームにわたり
累積し、前記累積値を最小にする候補を選択し出力する
ことを特徴とする。A speech parameter coding system according to a fourth invention is the speech parameter coding system according to the second invention, wherein the first codebook or the second codebook is used.
In at least one of the codebooks, a plurality of types of candidates are output in ascending order of quantization distortion, and in other subframes, the error power between the spectral parameter of the subframe and the restoration value is accumulated over a plurality of subframes. , A candidate that minimizes the cumulative value is selected and output.
【0010】第5の発明の音声パラメータ符号化方式
は、入力した音声信号をフレームに分割し、さらにフレ
ームよりも短い複数個のサブフレームに分割する手段
と、前記サブフレームの少なくとも一つについて前記音
声信号に対してスペクトルパラメータを予め定められた
次数だけ求める手段と、一つのサブフレームのスペクト
ルパラメータを予め構成した第1のコードブックを用い
て量子化し、量子化歪の小さい順に複数種類の候補を出
力し、他のサブフレームにおいては、当該フレームの量
子化スペクトルパラメータと過去のフレームの量子化ス
ペクトルパラメータを用いて予め定められた方法により
スペクトルパラメータを復元し、サブフレームのスペク
トルパラメータと前記復元値との誤差電力を複数サブフ
レームにわたり累積し、前記累積値を最小にする候補を
選択し出力する手段とを有することを特徴とする。In the speech parameter coding system of the fifth invention, means for dividing the inputted speech signal into frames and further dividing into a plurality of subframes shorter than the frame, and at least one of the subframes are described above. A means for obtaining a spectral parameter in a predetermined order for a voice signal and a first codebook in which spectral parameters of one subframe are pre-configured, and a plurality of types of candidates are quantized in ascending order of quantization distortion. In another subframe, the spectrum parameter is restored by a predetermined method using the quantized spectrum parameter of the frame and the quantized spectrum parameter of the past frame, and the spectrum parameter of the subframe and the restoration are performed. Accumulate error power with the value over multiple subframes And having a means for outputting select the candidates that minimizes the cumulative value.
【0011】[0011]
【作用】本発明による音声パラメータ符号化方式の作用
を示す。図1は第1及び第2の発明の作用を、図3は第
3及び第4の発明の作用を、図4は第5の発明の作用を
各々説明するための図である。以下の説明では音声のス
ペクトルパラメータとしてLSPパラメータを用いるも
のとする。The operation of the speech parameter coding system according to the present invention will be described. FIG. 1 is a diagram for explaining the action of the first and second inventions, FIG. 3 is a diagram for explaining the action of the third and fourth inventions, and FIG. 4 is a diagram for explaining the action of the fifth invention. In the following description, the LSP parameter is used as the spectrum parameter of voice.
【0012】入力した音声信号を予め定められた時間長
のフレーム(例えば30〜40ms)に分割し、さらに
フレームの音声信号を、フレームよりも短い複数個のサ
ブフレーム(例えば5〜8ms)に分割し、フレーム内
の少なくとも一つのサブフレームに対して、周知のLP
C分析を行いスペクトルパラメータを求める。ここで
は、フレーム長を40ms、サブフレーム長を8msと
し、図2に示すサブフレーム、、、についてL
PC分析をおこなうものとする。The input voice signal is divided into frames having a predetermined time length (for example, 30 to 40 ms), and the voice signal of the frame is further divided into a plurality of subframes (for example, 5 to 8 ms) shorter than the frame. However, for at least one subframe in the frame, a well-known LP
C analysis is performed to obtain spectral parameters. Here, the frame length is 40 ms, the subframe length is 8 ms, and the subframes shown in FIG.
PC analysis shall be performed.
【0013】最初に第1の発明の作用について図1を用
いて説明する。First, the operation of the first invention will be described with reference to FIG.
【0014】一例として、第サブフレームについてL
PC分析により求められたスペクトルパラメータを、端
子100から入力し、第、、サブフレームについ
て求めたスペクトルパラメータを端子105から順に入
力する。スペクトルパラメータとしては、ここでは線ス
ペクトル対(LSP)パラメータを用いて説明を行う。
LSPの具体的な計算法は、菅村氏らによる”Quan
tizerdesign in LSP speech
analysis−synthesis,”と題した
論文(IEEE J.Sel.Areas Commu
n.,pp.425−431,1988年)(文献4)
等を参照できる。ベクトル量子化部110は、コードブ
ック120(第1のコードブック)を用いて、入力した
LSPパラメータをベクトル量子化する。コードブック
120には、トレーニング用の多量のLSPパラメータ
系列を用いて予め学習させておく。学習の方法は、例え
ばLinde,Buzo,Gray氏による”An a
lgorithm for vector quant
ization design”と題した論文(IEE
E Trans.Commun.,pp.84−95,
1980)(文献5)等を参照できる。コードベクトル
を探索するときの歪尺度は、種々のものが知られている
が、ここではLSPの2乗距離を用いる。LSPの2乗
距離は(1)式で与えられる。As an example, for the first subframe, L
The spectral parameters obtained by PC analysis are input from the terminal 100, and the spectral parameters obtained for the first subframe and the subframe are sequentially input from the terminal 105. As the spectrum parameter, a line spectrum pair (LSP) parameter will be used here for explanation.
The specific calculation method of LSP is “Quan” by Sugamura et al.
Tizerdesign in LSP speech
"Analysis-synthesis," (IEEE J. Sel. Areas Commu
n. , Pp. 425-431, 1988) (Reference 4)
Etc. can be referred to. The vector quantization unit 110 vector-quantizes the input LSP parameter using the codebook 120 (first codebook). The codebook 120 is pre-learned using a large amount of LSP parameter sequences for training. The learning method is, for example, “Ana by Linde, Buzo, Gray”.
lgorithm for vector quant
The paper entitled "Ization design" (IEEE
E Trans. Commun. , Pp. 84-95,
1980) (reference 5) and the like. Although various distortion measures are known for searching a code vector, the LSP squared distance is used here. The LSP squared distance is given by equation (1).
【0015】[0015]
【数1】 [Equation 1]
【0016】ここではLSP(i)は入力したi次目の
LSP係数を示す。PはLSPの次数である。LSP’
(i)はコードブックが有するj番目のコードベクトル
であり、j=1〜2B (Bはコードブックのビット数)
である。(1)式を最小化するコードベクトルを補間ベ
クトル量子化部130と端子155へ出力する。Here, LSP (i) represents the input i-th LSP coefficient. P is the order of the LSP. LSP '
(I) is the j-th code vector included in the codebook, j = 1 to 2 B (B is the number of bits of the codebook)
Is. The code vector that minimizes the equation (1) is output to the interpolation vector quantization unit 130 and the terminal 155.
【0017】補間ベクトル量子化部130は、ベクトル
量子化部110の出力コードベクトルと、この出力コー
ドベクトルを1フレーム遅延させて得た1フレーム過去
のスペクトルパラメータの量子化値とを入力する。補間
係数コードブック140(コードブック2)を用いて、
端子105より入力したサブフレーム、、のLS
P系列を補間ベクトル量子化して復元する。つまり、
(2)式により、補間係数コードベクトルによる量子化
歪を計算し、量子化歪を最小にする補間係数コードベク
トルAj をサブフレーム毎に選択する。The interpolation vector quantization unit 130 receives the output code vector of the vector quantization unit 110 and the quantized value of the spectrum parameter of one frame past obtained by delaying the output code vector by one frame. Using the interpolation coefficient codebook 140 (codebook 2),
LS of sub-frame input from terminal 105,
Interpolation vector quantization is performed on the P sequence to restore it. That is,
The quantization distortion by the interpolation coefficient code vector is calculated by the equation (2), and the interpolation coefficient code vector A j that minimizes the quantization distortion is selected for each subframe.
【0018】[0018]
【数2】 [Equation 2]
【0019】(2)式において、LSPl (i)は第l
サブフレームでの入力のi次目のLSP。LSP’
n - 1 (i)、LSP’n (i)は、それぞれ1フレー
ム過去のLSPの量子化値、現フレームでのLSPの量
子化値(ベクトル量子化部110の出力値)を示す。A
jは補間係数コードブック140の有するj番目のコー
ドベクトルである。補間ベクトル量子化部130は、
(2)式を最小化する補間係数コードベクトルをサブフ
レーム、、に対して求め、(3)式によりサブフ
レームにおけるスペクトルパラメータを復元し端子15
0から出力する。In equation (2), LSP l (i) is the l-th
The i-th LSP of the input in the subframe. LSP '
n-1 (i) and LSP ' n (i) indicate the quantized value of the LSP in the past by one frame and the quantized value of the LSP in the current frame (the output value of the vector quantization unit 110), respectively. A
j is the j-th code vector included in the interpolation coefficient codebook 140. The interpolation vector quantizer 130
The interpolation coefficient code vector that minimizes the equation (2) is obtained for the subframes ,, and the spectrum parameter in the subframe is restored by the equation (3),
Output from 0.
【0020】
LSP’n l (i)=
LSP’n - 1 (i)・Aj −(1−Aj )LSP’(i) (3)
Aj は、トレーニング用LSP信号に対して、(4)式
を最小化するように、前述の文献5等を用いて予め学習
しておく。LSP ′ n l (i) = LSP ′ n −1 (i) · A j − (1−A j ) LSP ′ (i) (3) A j is ( L ) for the training LSP signal, In order to minimize the equation (4), learning is performed in advance using the above-mentioned document 5 and the like.
【0021】[0021]
【数3】 [Equation 3]
【0022】ここでnはフレーム番号、kはトレーニン
グ全信号のフレーム数を示す。Here, n is a frame number, and k is the number of frames of all training signals.
【0023】次に、第2の発明の作用について同じく図
1を用いて説明する。Next, the operation of the second invention will be described with reference to FIG.
【0024】ベクトル量子化部110は、コードブック
120(第1のコードブック)を用いて(1)式の量子
化歪の小さい順に複数種類(M種類)のコードベクトル
を出力する。次に、複数種類の各々のコードベクトルに
対して、補間ベクトル量子化部130は、補間係数コー
ドブック140(第2のコードブック)を用いて、
(2)式の量子化歪を最小化するコードベクトルを出力
する。次に、補間ベクトル量子化部130は、M種類の
コードベクトルの組合せの各々に対して、複数サブフレ
ームにわたり(5)式の累積歪を計算し、累積歪を最小
化する第1のコードブックと第2のコードブックのコー
ドベクトルの組合せを出力する。The vector quantizer 110 uses the codebook 120 (first codebook) to output a plurality of types (M types) of code vectors in ascending order of the quantization distortion of equation (1). Next, for each of a plurality of types of code vectors, the interpolation vector quantization unit 130 uses the interpolation coefficient codebook 140 (second codebook),
A code vector that minimizes the quantization distortion of equation (2) is output. Next, the interpolation vector quantization unit 130 calculates the cumulative distortion of Expression (5) over a plurality of subframes for each of the combinations of M types of code vectors, and a first codebook that minimizes the cumulative distortion. And a code vector combination of the second codebook are output.
【0025】[0025]
【数4】 [Equation 4]
【0026】ここで、LSP’n k (i)は第1のコー
ドブックから選択されたk番目(k=1〜M)の候補で
ある。Lは歪を累積するサブフレームの個数である。Here, LSP'nk (i) is the k-th (k = 1 to M) candidate selected from the first codebook. L is the number of subframes in which distortion is accumulated.
【0027】次に第3の発明の作用について図3を用い
て説明する。ここで図1と同一の番号を付した構成要素
は図1と同様の動作を行うので説明は略す。Next, the operation of the third invention will be described with reference to FIG. Here, the components denoted by the same reference numerals as those in FIG. 1 perform the same operations as those in FIG.
【0028】第1の発明と異なる点は、現在のフレーム
のスペクトルパラメータの量子化値と過去のフレームの
スペクトルパラメータの量子化値とを用いて、予め定め
られた補間法により補間してサブフレーム、、の
スペクトルパラメータを復元し、各サブフレームのスペ
クトルパラメータと前述の復元値の誤差を小さくするよ
うに第2のコードブックを選択することにある。The difference from the first invention is that the subframe is interpolated by a predetermined interpolation method using the quantized value of the spectrum parameter of the current frame and the quantized value of the spectrum parameter of the past frame. , ,, and the second codebook is selected so as to reduce the error between the spectrum parameter of each subframe and the above-mentioned restored value.
【0029】図3において、補間部115は、1フレー
ム過去のスペクトルパラメータの量子化値とベクトル量
子化部110の出力値(現在のフレームのスペクトルパ
ラメータの量子化値)とを用いて、あらかじめ定められ
た方法によりサブフレームのスペクトルパラメータを復
元する。ここでは、一例として、(6)式により直線補
間により復元するものとする。In FIG. 3, the interpolation unit 115 uses a quantized value of the spectrum parameter of one frame past and an output value of the vector quantization unit 110 (quantized value of the spectrum parameter of the current frame) in advance. The spectral parameters of the subframe are restored by the method described above. Here, as an example, it is assumed that restoration is performed by linear interpolation according to the equation (6).
【0030】
LSP’l (i)=
αl LSP’n - 1 (i)+(1−αl )LSP’n (i) (6)
ここで、LSP’l (1)は直線補間により復元した第
lサブフレームのLSPである。またαl は第lサブフ
レームでの予め定められた補間係数である。LSP ′ l (i) = α l LSP ′ n −1 (i) + (1−α l ) LSP ′ n (i) (6) where LSP ′ l (1) is restored by linear interpolation. It is the LSP of the 1st sub-frame. Further, α 1 is a predetermined interpolation coefficient in the 1st sub-frame.
【0031】補間ベクトル量子化部135は、補間係数
コードブック145(第2のコードブック)を用いて、
次式の誤差電力を最小化するように、サブフレーム毎に
コードベクトルをAj 選択する。The interpolation vector quantizer 135 uses the interpolation coefficient codebook 145 (second codebook) to
The code vector A j is selected for each subframe so as to minimize the error power of the following equation.
【0032】[0032]
【数5】 [Equation 5]
【0033】そして(8)式により、サブフレーム、
、に対して復元した値を端子150から出力する。Then, according to the equation (8), the subframe,
, And the restored value is output from the terminal 150.
【0034】
LSP’’l (i)=LSP’l (i)+LSP’n - 1 (i)・Aj +(1
−Aj )LSP’n (i) (8)
次に第4の発明の作用について同じく図3を用いて説明
する。LSP ″ l (i) = LSP ′ l (i) + LSP ′ n −1 (i) · A j + (1 −A j ) LSP ′ n (i) (8) Next, a fourth invention The action of will be described with reference to FIG.
【0035】ベクトル量子化部110は、コードブック
120(第1のコードブック)を用いて(1)式の量子
化歪の小さい順に複数種類(M種類)のコードベクトル
を出力する。次に、複数種類の各々のコードベクトルに
対して、補間部115において補間し、さらに、補間ベ
クトル量子化部135において、補間係数コードブック
145(第2のコードブック)を用いて、(7)式の量
子化歪を最小化するコードベクトルを出力する。次に、
M種類のコードベクトルの組合せの各々に対して、次式
の複数サブフレームにわたる累積歪を計算し、累積歪を
最小化する第1のコードブックと第2のコードブックの
コードベクトルの組合せを出力する。The vector quantizer 110 outputs a plurality of types (M types) of code vectors in the ascending order of the quantization distortion of the equation (1) using the codebook 120 (first codebook). Next, each of a plurality of types of code vectors is interpolated by the interpolation unit 115, and further, the interpolation vector quantization unit 135 uses the interpolation coefficient codebook 145 (second codebook) to obtain (7). The code vector that minimizes the quantization distortion of the expression is output. next,
For each of the M types of code vector combinations, the cumulative distortion over a plurality of subframes of the following formula is calculated, and the combination of the code vectors of the first codebook and the second codebook that minimizes the cumulative distortion is output. To do.
【0036】[0036]
【数6】 [Equation 6]
【0037】ここで、LSP’’l k (i)は第1のコ
ードブックから選択されたk番目(k=1〜M)の候補
を用いて復元したlサブフレームのLSPである。Here, LSP ″ l k (i) is the LSP of the l subframe restored using the k-th (k = 1 to M) candidate selected from the first codebook.
【0038】第1から第4の発明の作用の例では、全て
のサブフレームに対して共通の補間係数コードブックを
構成したが、サブフレーム毎に異なる補間係数コードブ
ックを構成しても良い。また、この場合、複数サブフレ
ーム分の補間コードブックをまとめてマストリクスコー
ドブックを構成しても良い。In the examples of the operations of the first to fourth inventions, the common interpolation coefficient codebook is constructed for all subframes, but different interpolation coefficient codebooks may be constructed for each subframe. Also, in this case, the interpolation codebooks for a plurality of subframes may be put together to form a matrix codebook.
【0039】また、補間係数コードブックの学習、探索
には上記の2乗距離や、重み付け距離など他の周知の距
離尺度を用いても良い。Further, other known distance scales such as the squared distance and the weighted distance may be used for learning and searching the interpolation coefficient codebook.
【0040】また、ベクトル量子化部では、周知のベク
トルースカラ量子化を用いても良い。The vector quantization section may use well-known vector scalar quantization.
【0041】第5の発明の作用について図4を用いて説
明する。ここで図1、図3と同一の番号を付した構成要
素は図1、図3と同様の動作を行うので説明は略す。The operation of the fifth invention will be described with reference to FIG. Here, the constituent elements denoted by the same numbers as those in FIG. 1 and FIG. 3 perform the same operations as those in FIG. 1 and FIG.
【0042】ベクトル量子化部180では、コードブッ
ク120(第1のコードブック)を用いて(1)式の量
子化歪の小さい順に複数種類(M種類)のコードベクト
ルを出力する。次に、複数種類の各々のコードベクトル
に対して、補間部115において例えば直線補間を用い
て補間処理を行い、(6)式に従い、、、サブフ
レームのLSPを復元する。累積歪計算部160では、
各候補に対して、サブフレームのスペクトルパラメータ
と前述の復元値との誤差電力を複数サブフレームにわた
り累積し、(10)式の累積歪を計算する。The vector quantizer 180 uses the codebook 120 (first codebook) to output a plurality of types (M types) of code vectors in ascending order of the quantization distortion of the equation (1). Next, the interpolation unit 115 performs an interpolation process on each of the plurality of types of code vectors using, for example, linear interpolation, and restores the LSP of the subframe according to the equation (6). In the cumulative distortion calculation unit 160,
For each candidate, the error power between the spectral parameter of the subframe and the above-mentioned restored value is accumulated over a plurality of subframes, and the cumulative distortion of equation (10) is calculated.
【0043】[0043]
【数7】 [Equation 7]
【0044】判定部165では、(10)式を最小化す
るコードベクトルを選択し、ベクトル量子化部の候補は
端子170から、サブフレームの復元値は端子170か
ら出力する。The decision unit 165 selects the code vector that minimizes the equation (10), and outputs the candidate of the vector quantization unit from the terminal 170 and the restored value of the subframe from the terminal 170.
【0045】上記説明において、ベクトル量子化部で
は、周知のベクトル−スカラ量子化を用いることもでき
る。また、補間処理は周知の方法を用いることができ
る。また、コードブックの探索には重み付け距離などの
他の周知な距離尺度を用いることができる。In the above description, the vector quantizer may use well-known vector-scalar quantization. A known method can be used for the interpolation processing. Also, other well-known distance measures such as weighted distances can be used to search the codebook.
【0046】[0046]
【実施例】図5は第1、2、3、4及び5の発明の音声
パラメータ符号化方式の一実施例を示すブロック図であ
る。FIG. 5 is a block diagram showing an embodiment of the speech parameter coding system of the first, second, third, fourth and fifth inventions.
【0047】図5において、入力端子400から音声信
号を入力し、1フレーム分(例えば40ms)の音声信
号をバッファメモリ410に格納する。In FIG. 5, an audio signal is input from the input terminal 400, and an audio signal for one frame (for example, 40 ms) is stored in the buffer memory 410.
【0048】サブフレーム分割回路420は、フレーム
の音声信号を予め定められたサブフレーム(例えば8m
s)に分割する。The subframe division circuit 420 divides the audio signal of the frame into a predetermined subframe (for example, 8 m).
s).
【0049】LPC分析回路430は、少なくとも一つ
のサブフレーム位置(例えば図2の、、、ある
いは、、、、あるいは、あるいは、
など任意の組合せが考えられる)の音声信号のスペクト
ル特性を表すパラメータとして、LSPパラメータを周
知のLPC分析を行いあらかじめ定められた次数Pだけ
計算する。この具体的な計算法については前述文献4等
を参照することができる。The LPC analysis circuit 430 includes at least one sub-frame position (eg ,, or, or, in FIG. 2).
(Any arbitrary combination is conceivable) and LSP parameters are calculated by a well-known LPC analysis as parameters representing the spectral characteristics of the audio signal. For the specific calculation method, the above-mentioned Document 4 can be referred to.
【0050】LSP量子化回路440は、一つのサブフ
レームで求めたLSPパラメータを予め定められた量子
化ビット数で量子化し、得た符号1k を出力端子450
から出力する。The LSP quantization circuit 440 quantizes the LSP parameter obtained in one subframe with a predetermined number of quantization bits, and outputs the obtained code 1 k as an output terminal 450.
Output from.
【0051】最初に、第1の発明におけるLSP量子化
回路440の構成を図6を用いて説明する。First, the configuration of the LSP quantization circuit 440 according to the first invention will be described with reference to FIG.
【0052】図6において、入力端子500からサブフ
レームのLSPパラメータを入力する。また、第、
、サブフレームについて求めたスペクトルパラメー
タを端子505から順に入力し、バッファメモリ506
に格納する。In FIG. 6, the LSP parameter of the subframe is input from the input terminal 500. Also,
, The spectral parameters obtained for the subframes are sequentially input from the terminal 505, and the buffer memory 506
To store.
【0053】ベクトル量子化回路510は、コードブッ
ク520を用いて、入力したLSPパラメータを周知の
手段によりベクトル量子化する。コードブック520
は、トレーニング用の多量のLSPパラメータ系列を用
いて予め学習して構成する。ベクトル量子化回路510
は、(1)式を最小化するコードベクトルを補間ベクト
ル量子化部530と端子555へ出力する。The vector quantization circuit 510 uses the codebook 520 to vector quantize the input LSP parameter by a well-known means. Codebook 520
Is preliminarily learned and configured using a large amount of LSP parameter sequences for training. Vector quantization circuit 510
Outputs the code vector that minimizes the equation (1) to the interpolation vector quantization unit 530 and the terminal 555.
【0054】補間ベクトル量子化回路530は、ベクト
ル量子化回路510の出力コードベクトルと、遅延回路
545による1フレーム過去のスペクトルパラメータの
量子化値とを入力する。補間係数コードブック540を
もちいてバッファメモリ506に格納されたサブフレー
ム、、のLSP系列を補間して復元する。つま
り、(2)式により、各補間係数コードベクトルによる
量子化歪を計算し、量子化歪を最小にする補間係数コー
ドベクトルAj をサブフレーム毎に選択して(3)式に
よりLSPパラメータを復元し、バッファメモリ535
に一旦格納した後に端子550へ出力する。The interpolation vector quantization circuit 530 inputs the output code vector of the vector quantization circuit 510 and the quantized value of the spectrum parameter one frame past by the delay circuit 545. The interpolation coefficient codebook 540 is used to interpolate and restore the LSP sequence of the subframes stored in the buffer memory 506. That is, the quantization distortion by each interpolation coefficient code vector is calculated by the equation (2), the interpolation coefficient code vector A j that minimizes the quantization distortion is selected for each subframe, and the LSP parameter is set by the equation (3). Restore and buffer memory 535
It is stored in the terminal once and then output to the terminal 550.
【0055】補間係数コードブック540の補間係数
は、トレーニング用LSP信号に対して、(4)式を最
小化するように、前述文献5等を用いて予め学習して構
成することができる。The interpolation coefficient of the codebook 540 can be constructed by learning in advance by using the above-mentioned literature 5 or the like so as to minimize the equation (4) for the training LSP signal.
【0056】次に、第2の発明におけるLSP量子化回
路440の構成を図7を用いて説明する。図7において
図6と同一の番号を付した構成要素は図6と同様の動作
を行うので説明は省略する。Next, the configuration of the LSP quantization circuit 440 in the second invention will be described with reference to FIG. In FIG. 7, the components denoted by the same numbers as in FIG. 6 perform the same operations as in FIG.
【0057】図7において、ベクトル量子化回路600
は、コードブック520(第1のコードブック)を用い
て(1)式の量子化歪の小さい順に複数種類(M種類)
のコードベクルトを出力し、候補格納回路610へ格納
する。補間ベクトル量子化回路615は、候補格納回路
610から各候補を入力し、さらに遅延回路545から
1フレーム過去のLSPのベクトル量子化値を入力し、
バッファメモリ506に格納された各サブフレームのL
SPを補間ベクトル量子化する。補間ベクトル量子化に
は補間係数コードブック540(第2のコードブック)
を用いて、(2)式の量子化歪を最小化するコードベク
トルを出力する。累積歪計算回路620では、各候補に
対して、(5)式の累積歪を計算する。(5)式におい
てL=3とする。選択回路625では、累積歪を最小化
する第1のコードブックと第2のコードブックのコード
ベクトルの組合せを用いてベクトル量子化されたLSP
を復元しバッファメモリ535に格納した後に、端子5
55から出力する。遅延回路545は、第4サブフレー
ムでのLSPの量子化値を1フレーム遅延させる。In FIG. 7, the vector quantization circuit 600 is shown.
Is a plurality of types (M types) in the ascending order of the quantization distortion of Expression (1) using the codebook 520 (first codebook).
The code vector of is output and stored in the candidate storage circuit 610. The interpolation vector quantization circuit 615 inputs each candidate from the candidate storage circuit 610, and further inputs the vector quantization value of the LSP of one frame past from the delay circuit 545,
L of each subframe stored in the buffer memory 506
Quantize SP by interpolation vector. For interpolation vector quantization, interpolation coefficient codebook 540 (second codebook)
Is used to output a code vector that minimizes the quantization distortion of equation (2). The cumulative distortion calculation circuit 620 calculates the cumulative distortion of Expression (5) for each candidate. In equation (5), L = 3. The selection circuit 625 vector-quantizes the LSP using a combination of code vectors of the first codebook and the second codebook that minimizes cumulative distortion.
Is restored and stored in the buffer memory 535, and then the terminal 5
Output from 55. The delay circuit 545 delays the LSP quantized value in the fourth subframe by one frame.
【0058】次に、第3の発明におけるLSP量子化回
路440の構成を図8を用いて説明する。図8において
図6と同一の番号を付した構成要素は図6と同様の動作
を行うので説明は省略する。Next, the configuration of the LSP quantization circuit 440 according to the third invention will be described with reference to FIG. In FIG. 8, the components denoted by the same numbers as in FIG. 6 perform the same operations as in FIG.
【0059】図8において、補間回路630は、遅延回
路545の出力値(過去のフレームのLSPのベクトル
量子化値)と、ベクトル量子化回路510の出力値(現
在のフレームのLSPのベクトル量子化値)とを用い
て、あらかじめ定められた補間方法により各サブフレー
ムのLSPを復元する。補間方法としては種々のものが
知られているがここでは一例として、(6)式による直
線補間により復元するものとする。In FIG. 8, the interpolation circuit 630 outputs the output value of the delay circuit 545 (the vector quantization value of the LSP of the past frame) and the output value of the vector quantization circuit 510 (the vector quantization of the LSP of the current frame). Value) and are used to restore the LSP of each subframe by a predetermined interpolation method. Various methods are known as the interpolation method, but here, as an example, it is assumed that the interpolation is performed by linear interpolation according to the equation (6).
【0060】補間ベクトル量子化部635は、補間係数
コードブック645(第2のコードブック)を用いて、
(7)式の誤差電力を最小化するように、サブフレーム
毎にコードベクトルを選択する。そして(8)式によ
り、サブフレーム、、、に対して復元した値を
バッファメモリ535に格納した後に、端子555から
出力する。The interpolation vector quantizer 635 uses the interpolation coefficient codebook 645 (second codebook) to
A code vector is selected for each subframe so as to minimize the error power of the equation (7). Then, according to the equation (8), the values restored for the subframes, ... Are stored in the buffer memory 535 and then output from the terminal 555.
【0061】遅延回路545は、第4サブフレームのL
SPの量子化値を1フレーム遅延させる。The delay circuit 545 is used for the L of the fourth sub-frame.
The quantized value of SP is delayed by one frame.
【0062】次に、第4の発明におけるLSP量子化回
路440の構成を図9を用いて説明する。図9におい
て、図7と同一の番号を付した構成要素は図7と同様の
動作を行うので説明は省略する。Next, the configuration of the LSP quantization circuit 440 according to the fourth aspect of the invention will be described with reference to FIG. In FIG. 9, the components having the same numbers as those in FIG. 7 perform the same operations as those in FIG.
【0063】図9において、ベクトル量子化回路600
は、コードブック520(第1のコードブック)を用い
て(1)式の量子化歪の小さい順に複数種類(M種類)
のコードベクトルを出力し、候補格納回路610に格納
する。複数種類の各々のコードベクトルに対して、補間
回路630において補間し、さらに、補間ベクトル量子
化回路635において、補間係数コードブック645
(第2のコードブック)を用いて、(7)式の量子化歪
を最小化するコードベクトルを出力する。累積歪計算回
路620では、M種類の候補の各々に対して、(9)式
の累積歪を計算する。ここではL=3とする。選択回路
625は、累積歪を最小化する第1のコードブックと第
2のコードブックのコードベクトルの組合せを求め、こ
のときのLSPを復元してバッファメモリ535に格納
した後に端子555から出力する。遅延回路545は、
第4サブフレームで量子化されたLSPを1フレーム遅
延させる。In FIG. 9, the vector quantization circuit 600 is shown.
Is a plurality of types (M types) in the ascending order of the quantization distortion of Expression (1) using the codebook 520 (first codebook).
The code vector of is output and stored in the candidate storage circuit 610. Interpolation circuit 630 interpolates each of a plurality of types of code vectors, and interpolation vector quantization circuit 635 further performs interpolation coefficient codebook 645.
(Second codebook) is used to output a code vector that minimizes the quantization distortion of equation (7). The cumulative distortion calculation circuit 620 calculates the cumulative distortion of Expression (9) for each of the M types of candidates. Here, L = 3. The selection circuit 625 finds a combination of code vectors of the first codebook and the second codebook that minimizes the cumulative distortion, restores the LSP at this time, stores it in the buffer memory 535, and then outputs it from the terminal 555. . The delay circuit 545 is
The LSP quantized in the fourth subframe is delayed by one frame.
【0064】補間係数コードブックは複数種類のサブフ
レームについて共通して使用しても良い。又は、サブフ
レーム毎に最適な補間係数コードブックを用いても良
い。後者のときは、複数サブフレーム分をまとめたマト
リクス構成のコードブックを構成すれば、さらに補間係
数コードブックのビット数を低減化できる。マトリクス
コードブックの作成法は、例えば、C.Tsao氏らに
よる”Matrix quantizer desig
n for LPC speech usingthe
generalized Lloyd algori
thm,”と題した論文(IEEE Trans.AS
SP,pp.537−545,1985年)(文献6)
を参照できる。The interpolation coefficient codebook may be commonly used for a plurality of types of subframes. Alternatively, an optimal interpolation coefficient codebook may be used for each subframe. In the latter case, the number of bits of the interpolation coefficient codebook can be further reduced by forming a codebook having a matrix configuration in which a plurality of subframes are collected. The method of creating the matrix codebook is described in, for example, C.I. "Matrix quantizer design" by Tsao et al.
n for LPC speech usinging
generalized Lloyd algori
thm, ”(IEEE Trans. AS
SP, pp. 537-545, 1985) (Reference 6)
Can be referred to.
【0065】また、補間係数コードブックの学習、探索
には上記の2乗距離や、重み付け距離など他の周知の距
離尺度を用いることができる。Further, other well-known distance scales such as the squared distance and the weighted distance can be used for learning and searching the interpolation coefficient codebook.
【0066】また、ベクトル量子化部では、周知のベク
トル−スカラ量子化を用いることもできる。Further, the vector quantizer can use well-known vector-scalar quantization.
【0067】次に、第5の発明におけるLSP量子化回
路440の構成を図10を用いて説明する。図10にお
いて、図6と同一の番号を付した構成要素は、図6と同
様の動作を行うので、説明は省略する。Next, the configuration of the LSP quantization circuit 440 according to the fifth invention will be described with reference to FIG. In FIG. 10, the components designated by the same numbers as those in FIG. 6 perform the same operations as those in FIG.
【0068】図10において、ベクトル量子化回路60
0は、コードブック520(第1のコードブック)を用
いて(1)式の量子化歪の小さい順に複数種類(M種
類)のコードベクトルを出力し、候補格納回路610に
格納する。補間回路630は、複数種類の各々のコード
ベクトルに対して、補間処理を行い、(6)式に従い、
、、サブフレームのLSPを復元する。ここで、
補間処理は種々の方法が考えられるが、一例として、直
線補間を用いるものとする。累積歪計算回路620は、
各候補に対して、サブフレームのLSPと前述の補間処
理によるLSP復元値との誤差電力を複数サブフレーム
にわたり累積し、(10)式の累積歪を計算する。ここ
ではL=3とする。選択回路625は、(10)式を最
小化するコードベクトル候補を選択し、LSPをサブフ
レーム毎に復元してバッファメモリ535に格納した後
に端子555より出力する。遅延回路545は、第4サ
ブフレームにおいて選択された候補1フレーム遅延させ
る。In FIG. 10, the vector quantization circuit 60
0 outputs a plurality of types (M types) of code vectors in the order of decreasing quantization distortion of Expression (1) using the codebook 520 (first codebook), and stores the code vectors in the candidate storage circuit 610. The interpolation circuit 630 performs interpolation processing on each of a plurality of types of code vectors, and according to equation (6),
,, restore the LSP of the subframe. here,
Although various methods are conceivable for the interpolation processing, linear interpolation is used as an example. The cumulative distortion calculation circuit 620
For each candidate, the error power between the LSP of the subframe and the LSP restoration value obtained by the above-described interpolation processing is accumulated over a plurality of subframes, and the cumulative distortion of Expression (10) is calculated. Here, L = 3. The selection circuit 625 selects a code vector candidate that minimizes the expression (10), restores the LSP for each subframe, stores the LSP in the buffer memory 535, and then outputs the LSP from the terminal 555. The delay circuit 545 delays one candidate frame selected in the fourth subframe.
【0069】最後に、以上の説明について補足する。Finally, the above description will be supplemented.
【0070】まずベクトル量子化回路は、周知のベクト
ル−スカラ量子化を用いても良い。First, the vector quantization circuit may use well-known vector-scalar quantization.
【0071】補間回路630は、補間位置又は補間方法
を複数種類もち、これらの全ての組合せに対して累積歪
を計算し、累積歪を最小にする補間位置又は補間方法を
フレーム毎に補助情報として数ビットで伝送しても良
い。ただし、このようにすると性能は改善されるが補助
情報伝送のため、ビット数が若干増加する。The interpolation circuit 630 has a plurality of interpolation positions or interpolation methods, calculates cumulative distortion for all combinations thereof, and uses interpolation positions or interpolation methods that minimize the cumulative distortion as auxiliary information for each frame. It may be transmitted with several bits. However, although this improves performance, the number of bits is slightly increased due to auxiliary information transmission.
【0072】また、補間回路630における補間は、直
線補間以外に、対数補間などの他の周知の方法を用いて
も良い。また、各サブフレームに最適な補間係数をトレ
ーニング信号を用いて学習して構成しても良い。Further, the interpolation in the interpolation circuit 630 may use other well-known methods such as logarithmic interpolation in addition to linear interpolation. Further, the optimum interpolation coefficient for each subframe may be learned by using a training signal.
【0073】また、LSPのベクトル量子化及び累積歪
の計算にはLSPの2乗距離を用いたが、他の周知の距
離尺度を用いても良い。例えばLSPの重み付け2乗距
離や、LPCケプストラム距離などである。Although the square distance of the LSP is used for the vector quantization of the LSP and the calculation of the cumulative distortion, other known distance measures may be used. For example, the weighted square distance of the LSP, the LPC cepstrum distance, or the like.
【0074】また、ベクトル量子化回路としては、全探
索型ベクトル量子化回路を用いたが、コードベクトルの
探索に要する演算量を低減するために、木探索型、格子
型、他段型又は、他の周知な構成のベクトル量子化回路
を用いても良い。これらの演算量低減化法の詳細につい
ては、例えばR.Gray氏による”Vectorqu
antization,”と題した論文(IEEE A
SSP Magazine,pp.4−29,1984
年)(文献7)等を参照できる。Although the full search type vector quantization circuit is used as the vector quantization circuit, in order to reduce the amount of calculation required to search the code vector, a tree search type, a lattice type, another stage type, or You may use the vector quantization circuit of another well-known structure. For details of these calculation amount reduction methods, see, for example, R.M. "Vector qu by Gray
paper entitled "Antiation," (IEEE A
SSP Magazine, pp. 4-29, 1984
Year) (Reference 7), etc. can be referred to.
【0075】また、4つのサブフレームについて入力音
声をLPC分析してLSP係数を計算したが、演算量を
低減化するために任意の方法を用いることができる。例
えば、2つ又は3つのサブフレーム(2つのときは例え
ば図2のと、又はと、又はと又は、と
)に対してのみLSPを計算し、他のサブフレームで
はこれらのLSPを補間してLSPを求めるようにして
も良い。又は、2つ又は3つのサブフレームに対してL
SPを計算し、1つのサブフレームでLSPを量子化
し、他のサブフレームのLSPは補間又は第2のコード
ブック、あるいは補間と第2のコードブックの組み合わ
せで表わすようにしてもよい。Although LPC analysis was performed on the input speech for four subframes to calculate LSP coefficients, any method can be used to reduce the amount of calculation. For example, the LSP is calculated only for two or three subframes (when there are two, for example, or and, or and or in FIG. 2), and for other subframes, these LSPs are interpolated. The LSP may be obtained. Or L for 2 or 3 subframes
The SP may be calculated, the LSP may be quantized in one subframe, and the LSP in the other subframe may be represented by interpolation or a second codebook or a combination of the interpolation and the second codebook.
【0076】[0076]
【発明の効果】以上述べたように、本発明によれば、音
声のスペクトル特性を表すスペクトルパラメータを量子
化するときに、フレームをそれよりも短いサブフレーム
に分割し、少なくとも1つのサブフレームでスペクトル
パラメータを求めて第1のコードブックを用いて量子化
し、他のサブフレームのスペクトルパラメータは、当該
フレームの量子化値と過去のフレームの量子化値との補
間処理で表すか、第2のコードブックを使用して表す
か、あるいは補間処理と第2のコードブックを用いて表
す。また、第1のコードブックの探索において、量子化
歪の小さい順に複数種類の候補を求め、各候補に対して
補間処理、あるいは第2のコードブック、あるいは補間
処理と第2のコードブックを用いてスペクトルパラメー
タを復元し、複数サブフレームにわたる累積歪を求め、
累積歪を小さくするように前記候補を選択している。従
って、ビットレースを低減するためにフレーム長を増大
させても、少ないビット数及び演算量でスペクトルパラ
メータを良好に量子化できると共に、時間変化も良好に
表すことができるという大きな効果がある。As described above, according to the present invention, when quantizing the spectrum parameter representing the spectrum characteristic of speech, the frame is divided into subframes shorter than that, and at least one subframe is used. The spectrum parameter is obtained and quantized using the first codebook, and the spectrum parameter of another subframe is represented by an interpolation process of the quantized value of the frame and the quantized value of the past frame, or It is represented using a codebook, or using an interpolation process and a second codebook. Also, in the search of the first codebook, a plurality of types of candidates are obtained in the order of smaller quantization distortion, and interpolation processing, or a second codebook, or interpolation processing and a second codebook is used for each candidate. And restore the spectral parameters to find the cumulative distortion over multiple subframes,
The candidates are selected so as to reduce the cumulative distortion. Therefore, even if the frame length is increased to reduce the bit race, there is a great effect that the spectrum parameter can be quantized well with a small number of bits and the amount of calculation, and that the temporal change can be satisfactorily expressed.
【図面の簡単な説明】[Brief description of drawings]
【図1】第1及び第2の発明の音声パラメータ符号化方
式の作用を説明するためのブロック図。FIG. 1 is a block diagram for explaining the operation of a speech parameter coding system of the first and second inventions.
【図2】フレームとサブフレームの関係を表す図。FIG. 2 is a diagram showing a relationship between frames and subframes.
【図3】第3及び第4の発明の音声パラメータ符号化方
式の作用を説明するためのブロック図。FIG. 3 is a block diagram for explaining the operation of the speech parameter coding system of the third and fourth inventions.
【図4】第5の発明の音声パラメータ符号化方式の作用
を説明するためのブロック図。FIG. 4 is a block diagram for explaining the operation of the speech parameter coding system of the fifth invention.
【図5】第1,2,3,4及び5の発明の音声パラメー
タ符号化方式の一実施例を示すブロック図。FIG. 5 is a block diagram showing an embodiment of speech parameter coding systems of the first, second, third, fourth and fifth inventions.
【図6】第1の発明におけるLPC量子化回路の構成を
示すブロック図。FIG. 6 is a block diagram showing a configuration of an LPC quantization circuit according to the first invention.
【図7】第2の発明におけるLPC量子化回路の構成を
示すブロック図。FIG. 7 is a block diagram showing a configuration of an LPC quantization circuit according to a second invention.
【図8】第3の発明におけるLPC量子化回路の構成を
示すブロック図。FIG. 8 is a block diagram showing a configuration of an LPC quantization circuit according to a third invention.
【図9】第4の発明におけるLPC量子化回路の構成を
示すブロック図。FIG. 9 is a block diagram showing a configuration of an LPC quantization circuit according to a fourth invention.
【図10】第5の発明におけるLPC量子化回路の構成
を示すブロック図。FIG. 10 is a block diagram showing a configuration of an LPC quantization circuit according to a fifth aspect of the invention.
110 ベクトル量子化部 120 コードブック 130 補間ベクトル量子化部 140 補間係数コードブック 190 遅延部 115 補間部 135 補間ベクトル量子化部 145 補間係数コードブック 180 ベクトル量子化部 160 累積歪計算部 165 判別部 410 バッファメモリ 420 サブフレーム分割回路 430 LPC分析回路 440 LPC量子化回路 506 バッファメモリ 510 ベクトル量子化部 520 コードブック 530 補間ベクトル量子化回路 535 バッファメモリ 540 補間係数コードブック 545 遅延回路 600 ベクトル量子化回路 610 補間格納回路 615 補間ベクトル量子化回路 620 累積歪計算回路 625 選択回路 630 補間回路 635 補間ベクトル量子化回路 645 補間係数コードブック 110 Vector quantizer 120 codebooks 130 Interpolation vector quantizer 140 Interpolation Coefficient Codebook 190 Delay unit 115 Interpolator 135 Interpolation vector quantizer 145 Interpolation coefficient codebook 180 Vector quantizer 160 Cumulative distortion calculator 165 Discriminator 410 buffer memory 420 subframe division circuit 430 LPC analysis circuit 440 LPC quantization circuit 506 buffer memory 510 Vector quantizer 520 codebook 530 Interpolation vector quantization circuit 535 buffer memory 540 Interpolation Coefficient Codebook 545 delay circuit 600 vector quantization circuit 610 Interpolation storage circuit 615 Interpolation vector quantization circuit 620 Cumulative distortion calculation circuit 625 selection circuit 630 Interpolation circuit 635 Interpolation vector quantization circuit 645 Interpolation Coefficient Codebook
Claims (5)
さらにフレームよりも短い複数個のサブフレームに分割
する手段と、前記サブフレームの少なくとも一つについ
て前記音声信号に対してスペクトルパラメータを予め定
められた次数だけ求める手段と、一つのサブフレームの
スペクトルパラメータを予め構成した第1のコードブッ
クを用いて量子化し、他の少なくとも一つのサブフレー
ムのスペクトルパラメータを、当該フレームでのスペク
トルパラメータの量子化値と、過去のフレームでのスペ
クトルパラメータの量子化値と、第2のコードブックと
を用いて量子化する手段とを有することを特徴とする音
声パラメータ符号化方式。1. Dividing an input audio signal into frames,
Further, means for dividing into a plurality of subframes shorter than the frame, means for obtaining a spectral parameter for at least one of the subframes by a predetermined order for the audio signal, and spectral parameter for one subframe Is quantized using a first codebook configured in advance, and the spectral parameter of at least one other subframe is quantized with respect to the spectral parameter quantized in the frame and the spectral parameter quantized in the past frame. And a means for quantizing using a second codebook, a speech parameter coding method.
ックの少なくとも一方において、量子化歪の小さい順に
複数種類の候補を出力し、他のサブフレームにおいて
は、スペクトルパラメータを当該フレームでのスペクト
ルパラメータの量子化値と、過去のフレームでのスペク
トルパラメータの量子化値と、第2のコードブックとを
用いて量子化して量子化歪を求め前記量子化歪を複数サ
ブフレームにわたり累積し、前記累積値を最小にする候
補を選択し出力することを特徴とする請求項1記載の音
声パラメータ符号化方式。2. In at least one of the first codebook and the second codebook, a plurality of types of candidates are output in ascending order of quantization distortion, and in other subframes, spectrum parameters are set to the spectrum in the frame. Quantized values of parameters, quantized values of spectrum parameters in past frames, and a second codebook to obtain quantization distortion, and the quantization distortion is accumulated over a plurality of subframes, and The speech parameter coding system according to claim 1, wherein a candidate for minimizing a cumulative value is selected and output.
さらにフレームよりも短い複数個のサブフレームに分割
する手段と、前記サブフレームの少なくとも一つについ
て前記音声信号に対してスペクトルパラメータを予め定
められた次数だけ求める手段と、一つのサブフレームの
スペクトルパラメータを予め構成した第1のコードブッ
クを用いて量子化し、他の少なくとも一つのサブフレー
ムでは当該フレームでのスペクトルパラメータの量子化
値と過去のフレームでのスペクトルパラメータの量子化
値とを用いてあらかじめ定められた方法によりスペクト
ルパラメータを復元し、当該サブフレームのスペクトル
パラメータと前記復元値との誤差を小さくするように第
2のコードブックを選択することを特徴とする音声パラ
メータ符号化方式。3. The input audio signal is divided into frames,
Further, means for dividing into a plurality of subframes shorter than the frame, means for obtaining a spectral parameter for at least one of the subframes by a predetermined order for the audio signal, and spectral parameter for one subframe Is quantized using a first codebook configured in advance, and in at least one other subframe, the quantized value of the spectral parameter in the frame and the quantized value of the spectral parameter in the past frame are used in advance. A speech parameter coding method, wherein a spectrum parameter is restored by a predetermined method, and a second codebook is selected so as to reduce an error between the spectrum parameter of the subframe and the restored value.
ックの少なくとも一方において、量子化歪の小さい順に
複数種類の候補を出力し、他のサブフレームにおいて
は、当該サブフレームのスペクトルパラメータと前記復
元値との誤差電力を複数サブフレームにわたり累積し、
前記累積値を最小にする候補を選択し出力することを特
徴とする請求項2記載の音声パラメータ符号化方式。4. At least one of the first codebook and the second codebook outputs a plurality of types of candidates in ascending order of quantization distortion, and in other subframes, the spectrum parameter of the subframe and the candidate are output. Accumulate error power with the restored value over multiple subframes,
The speech parameter coding method according to claim 2, wherein a candidate for minimizing the cumulative value is selected and output.
さらにフレームよりも短い複数個のサブフレームに分割
する手段と、前記サブフレームの少なくとも一つについ
て前記音声信号に対してスペクトルパラメータを予め定
められた次数だけ求める手段と、一つのサブフレームの
スペクトルパラメータを予め構成した第1のコードブッ
クを用いて量子化し、量子化歪の小さい順に複数種類の
候補を出力し、他のサブフレームにおいては、当該フレ
ームの量子化スペクトルパラメータと過去のフレームの
量子化スペクトルパラメータを用いて予め定められた方
法によりスペクトルパラメータを復元し、サブフレーム
のスペクトルパラメータと前記復元値との誤差電力を複
数サブフレームにわたり累積し、前記累積値を最小にす
る候補を選択し出力する手段とを有することを特徴とす
る音声パラメータ符号化方式。5. The input voice signal is divided into frames,
Further, means for dividing into a plurality of subframes shorter than the frame, means for obtaining a spectral parameter for at least one of the subframes by a predetermined order for the audio signal, and spectral parameter for one subframe Are quantized using a preconfigured first codebook, and a plurality of types of candidates are output in the order of smaller quantization distortion. The spectrum parameter is restored by a predetermined method using the spectrum parameter, the error power between the spectrum parameter of the subframe and the restored value is accumulated over a plurality of subframes, and a candidate that minimizes the accumulated value is selected and output. And a voice parameter characterized by Goka system.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03155049A JP3143956B2 (en) | 1991-06-27 | 1991-06-27 | Voice parameter coding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03155049A JP3143956B2 (en) | 1991-06-27 | 1991-06-27 | Voice parameter coding method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH056199A true JPH056199A (en) | 1993-01-14 |
JP3143956B2 JP3143956B2 (en) | 2001-03-07 |
Family
ID=15597558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03155049A Expired - Lifetime JP3143956B2 (en) | 1991-06-27 | 1991-06-27 | Voice parameter coding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3143956B2 (en) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0744200A (en) * | 1993-07-29 | 1995-02-14 | Nec Corp | Speech encoding system |
EP0696026A2 (en) | 1994-08-02 | 1996-02-07 | Nec Corporation | Speech coding device |
EP0696793A2 (en) | 1994-08-11 | 1996-02-14 | Nec Corporation | A speech coder |
EP0756268A2 (en) | 1995-07-27 | 1997-01-29 | Nec Corporation | Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits |
US5737484A (en) * | 1993-01-22 | 1998-04-07 | Nec Corporation | Multistage low bit-rate CELP speech coder with switching code books depending on degree of pitch periodicity |
US5787389A (en) * | 1995-01-17 | 1998-07-28 | Nec Corporation | Speech encoder with features extracted from current and previous frames |
US5826226A (en) * | 1995-09-27 | 1998-10-20 | Nec Corporation | Speech coding apparatus having amplitude information set to correspond with position information |
US5832180A (en) * | 1995-02-23 | 1998-11-03 | Nec Corporation | Determination of gain for pitch period in coding of speech signal |
US5857168A (en) * | 1996-04-12 | 1999-01-05 | Nec Corporation | Method and apparatus for coding signal while adaptively allocating number of pulses |
US5873060A (en) * | 1996-05-27 | 1999-02-16 | Nec Corporation | Signal coder for wide-band signals |
US5884252A (en) * | 1995-05-31 | 1999-03-16 | Nec Corporation | Method of and apparatus for coding speech signal |
US5902244A (en) * | 1997-02-05 | 1999-05-11 | Olympus Optical Co., Ltd. | Ultrasonic diagnosis apparatus including simple digital scan converter |
US5963896A (en) * | 1996-08-26 | 1999-10-05 | Nec Corporation | Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses |
US6023672A (en) * | 1996-04-17 | 2000-02-08 | Nec Corporation | Speech coder |
US6581031B1 (en) | 1998-11-27 | 2003-06-17 | Nec Corporation | Speech encoding method and speech encoding system |
US6856955B1 (en) | 1998-07-13 | 2005-02-15 | Nec Corporation | Voice encoding/decoding device |
KR100446594B1 (en) * | 1997-04-15 | 2005-06-02 | 삼성전자주식회사 | Apparatus and method for encoding / decoding voice line spectrum frequency |
US6973424B1 (en) | 1998-06-30 | 2005-12-06 | Nec Corporation | Voice coder |
US6978235B1 (en) | 1998-05-11 | 2005-12-20 | Nec Corporation | Speech coding apparatus and speech decoding apparatus |
US7680669B2 (en) | 2001-03-07 | 2010-03-16 | Nec Corporation | Sound encoding apparatus and method, and sound decoding apparatus and method |
JP2011501889A (en) * | 2007-09-26 | 2011-01-13 | ディズニー エンタープライゼス インコーポレイテッド | Method and system for providing multimedia presentations to mobile device users |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR200488250Y1 (en) | 2017-09-25 | 2019-01-02 | 구강영 | Table Tennis Racket with hole and grip |
-
1991
- 1991-06-27 JP JP03155049A patent/JP3143956B2/en not_active Expired - Lifetime
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5737484A (en) * | 1993-01-22 | 1998-04-07 | Nec Corporation | Multistage low bit-rate CELP speech coder with switching code books depending on degree of pitch periodicity |
JPH0744200A (en) * | 1993-07-29 | 1995-02-14 | Nec Corp | Speech encoding system |
EP0696026A2 (en) | 1994-08-02 | 1996-02-07 | Nec Corporation | Speech coding device |
US5778334A (en) * | 1994-08-02 | 1998-07-07 | Nec Corporation | Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion |
EP0696793A2 (en) | 1994-08-11 | 1996-02-14 | Nec Corporation | A speech coder |
US5774840A (en) * | 1994-08-11 | 1998-06-30 | Nec Corporation | Speech coder using a non-uniform pulse type sparse excitation codebook |
US5787389A (en) * | 1995-01-17 | 1998-07-28 | Nec Corporation | Speech encoder with features extracted from current and previous frames |
US5832180A (en) * | 1995-02-23 | 1998-11-03 | Nec Corporation | Determination of gain for pitch period in coding of speech signal |
US5884252A (en) * | 1995-05-31 | 1999-03-16 | Nec Corporation | Method of and apparatus for coding speech signal |
US6006178A (en) * | 1995-07-27 | 1999-12-21 | Nec Corporation | Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits |
EP0756268A2 (en) | 1995-07-27 | 1997-01-29 | Nec Corporation | Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits |
US5826226A (en) * | 1995-09-27 | 1998-10-20 | Nec Corporation | Speech coding apparatus having amplitude information set to correspond with position information |
US5857168A (en) * | 1996-04-12 | 1999-01-05 | Nec Corporation | Method and apparatus for coding signal while adaptively allocating number of pulses |
US6023672A (en) * | 1996-04-17 | 2000-02-08 | Nec Corporation | Speech coder |
US5873060A (en) * | 1996-05-27 | 1999-02-16 | Nec Corporation | Signal coder for wide-band signals |
US5963896A (en) * | 1996-08-26 | 1999-10-05 | Nec Corporation | Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses |
US5902244A (en) * | 1997-02-05 | 1999-05-11 | Olympus Optical Co., Ltd. | Ultrasonic diagnosis apparatus including simple digital scan converter |
KR100446594B1 (en) * | 1997-04-15 | 2005-06-02 | 삼성전자주식회사 | Apparatus and method for encoding / decoding voice line spectrum frequency |
US6978235B1 (en) | 1998-05-11 | 2005-12-20 | Nec Corporation | Speech coding apparatus and speech decoding apparatus |
US6973424B1 (en) | 1998-06-30 | 2005-12-06 | Nec Corporation | Voice coder |
US6856955B1 (en) | 1998-07-13 | 2005-02-15 | Nec Corporation | Voice encoding/decoding device |
US6581031B1 (en) | 1998-11-27 | 2003-06-17 | Nec Corporation | Speech encoding method and speech encoding system |
US7680669B2 (en) | 2001-03-07 | 2010-03-16 | Nec Corporation | Sound encoding apparatus and method, and sound decoding apparatus and method |
JP2011501889A (en) * | 2007-09-26 | 2011-01-13 | ディズニー エンタープライゼス インコーポレイテッド | Method and system for providing multimedia presentations to mobile device users |
Also Published As
Publication number | Publication date |
---|---|
JP3143956B2 (en) | 2001-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3143956B2 (en) | Voice parameter coding method | |
US5208862A (en) | Speech coder | |
JP3114197B2 (en) | Voice parameter coding method | |
JP2746039B2 (en) | Audio coding method | |
JP3151874B2 (en) | Voice parameter coding method and apparatus | |
JP3196595B2 (en) | Audio coding device | |
CA2202825C (en) | Speech coder | |
JPH0353300A (en) | Sound encoding and decoding system | |
JP2800618B2 (en) | Voice parameter coding method | |
JPH05216500A (en) | Speech encoding device | |
JP2624130B2 (en) | Audio coding method | |
JP2002268686A (en) | Voice coder and voice decoder | |
JPH0944195A (en) | Voice encoding device | |
JP3308764B2 (en) | Audio coding device | |
JPH0854898A (en) | Voice coding device | |
JP3153075B2 (en) | Audio coding device | |
JP3256215B2 (en) | Audio coding device | |
JP3194930B2 (en) | Audio coding device | |
US5978758A (en) | Vector quantizer with first quantization using input and base vectors and second quantization using input vector and first quantization output | |
JP3252285B2 (en) | Audio band signal encoding method | |
JP3102017B2 (en) | Audio coding method | |
JPH08185199A (en) | Voice coding device | |
JP3192051B2 (en) | Audio coding device | |
JP3428595B2 (en) | Audio coding method | |
JPH1069297A (en) | Voice coding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20001128 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080105 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090105 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100105 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110105 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120105 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120105 Year of fee payment: 11 |