JP3143956B2 - 音声パラメータ符号化方式 - Google Patents

音声パラメータ符号化方式

Info

Publication number
JP3143956B2
JP3143956B2 JP03155049A JP15504991A JP3143956B2 JP 3143956 B2 JP3143956 B2 JP 3143956B2 JP 03155049 A JP03155049 A JP 03155049A JP 15504991 A JP15504991 A JP 15504991A JP 3143956 B2 JP3143956 B2 JP 3143956B2
Authority
JP
Japan
Prior art keywords
codebook
frame
parameter
subframes
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03155049A
Other languages
English (en)
Other versions
JPH056199A (ja
Inventor
一範 小沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP03155049A priority Critical patent/JP3143956B2/ja
Publication of JPH056199A publication Critical patent/JPH056199A/ja
Application granted granted Critical
Publication of JP3143956B2 publication Critical patent/JP3143956B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号を低いビットレ
ート、特に8kb/s以下のビットレートで高品質に符
号化する音声符号化方式に供するための音声パラメータ
符号方式に関する。
【0002】
【従来の技術】音声信号を8kb/s以下の低いビット
レートで符号化する方式としては、例えば、M.Sch
roeder and B.Atal氏による”Cod
e−excited linear predicti
on:High quality speech at
very low bit rates”(Pro
c.ICASSP,pp.937−940,1985
年)と題した論文(文献1)や、Kleijn氏らによ
る”Improved speech quality
and efficient vector qua
ntizationin SELP”(Proc.IC
ASSP,pp.155−158,1988年)と題し
た論文(文献2)等に記載されているCELP(od
xcited LPC Coding)方式が知
られている。この方式では、まず送信側は、音声信号の
スペクトル特性を表すスペクトルパラメータをフレーム
毎(例えば20ms)に音声信号から抽出し、さらにフ
レームを小区間サブフレーム(例えば5ms)に分割す
る。次にこのサブフレーム毎に、過去の音源信号をもと
に長時間相関(ピッチ相関)を表すピッチパラメータを
抽出し、このピッチパラメータにより前述のサブフレー
ムの音声信号を長期予測する。次に長期予測して求めた
残差信号に対して、予め定められた種類の雑音信号から
なるコードブックから選択した信号により合成した信号
と、前述の音声信号との誤差電力を最小化するように一
種類の雑音信号を選択し、この種類を表すインデクス及
びゲイン並びに前述のスペクトルパラメータ及びピッチ
パラメータを伝送する。
【0003】CELP方式では、音声のスペクトルパラ
メータとしてはLPC分析により求めたLPCパラメー
タを用い、このLPCパラメータを量子化する。量子化
法としては、通常スカラ量子化が用いられており、10
次のLPC係数を量子化するのにフレーム当り34ビッ
ト(1.7kb/s)程度のビット数が必要であり、ビ
ット数をさらに低減すると音質が低下する。LPCパラ
メータをより効率的に量子化する方法として、Mori
ya氏らによる”Transform coding
of speech using a weighte
d vector quantizer,”と題した論
文(IEEE J.Sel.Areas,Commu
n.,pp.425−431,1988年)(文献3)
等に記載されたベクトル−スカラ量子化法などが提案さ
れているが、フレーム当り27〜30ビット程度のビッ
ト数が必要である。
【0004】
【発明が解決しようとする課題】上述したCELP方式
のビットレートをさらに低減するためには、スペクトル
パラメータの効率的な量子化法が必要であるが、スペク
トルパラメータの量子化に必要なビット数を下げるため
にフレーム長を長くとると、スペクトルの時間的変化を
良好に表すことが困難となり、時間歪が増大し音質が大
幅に劣化していた。
【0005】本発明の目的は、上述した問題点を解決
し、スペクトルパラメータを従来よりも少ないビット数
で量子化しても良好な音質を提供できる音声パラメータ
符号化方式を提供することにある。
【0006】
【課題を解決するための手段】第1の発明の音声パラメ
ータ符号化方式は、入力した音声信号フレームに分割
し、さらにフレームよりも短い複数個のサブフレームに
分割する手段と、前記サブフレームの少なくとも一つに
ついて前記音声信号に対してスペクトルパラメータを予
め定められた次数だけ求める手段と、一つのサブフレー
ムのスペクトルパラメータを予め構成した第1のコード
ブックを用いて量子化し、他の少なくとも一つサブフレ
ームのスペクトルパラメータを、当該フレームでのスペ
クトルパラメータの量子化値と、過去のフレームでのス
ペクトルパラメータの量子化値と、第2のコードブック
とを用いて量子化することを特徴とする。
【0007】第2の発明の音声パラメータ符号化方式
は、第1の発明において、第1のコードブック又は第2
のコードブックの少なくとも一方において、量子化歪の
小さい順に複数種類の候補を出力し、他のサブフレーム
においては、スペクトルパラメータを当該フレームでの
スペクトルパラメータの量子化値と、過去のフレームで
のスペクトルパラメータの量子化値と、第2のコードブ
ックとを用いて量子化して量子化歪を求め前記量子化歪
を複数サブフレームにわたり累積し、前記累積値を最小
にする候補を選択し出力することを特徴とする。
【0008】第3の発明の音声パラメータ符号化方式
は、入力した音声信号をフレームに分割し、さらにフレ
ームよりも短い複数個のサブフレームに分割する手段
と、前記サブフレームの少なくとも一つについて前記音
声信号に対してスペクトルパラメータを予め定められた
次数だけ求める手段と、一つのサブフレームのスペクト
ルパラメータを予め構成した第1のコードブックを用い
て量子化し、他の少なくとも一つのサブフレームでは当
該フレームでのスペクトルパラメータの量子化値と過去
のフレームでのスペクトルパラメータの量子化値とを用
いてあらかじめ定められた方法によりスペクトルパラメ
ータを復元し、当該サブフレームのスペクトルパラメー
タと前記復元値との誤差を小さくするように第2のコー
ドブックを選択することを特徴とする。
【0009】第4の発明の音声パラメータ符号化方式
は、第2の発明において、第1のコードブック又は第2
のコードブックの少なくとも一方において、量子化歪の
小さい順に複数種類の候補を出力し、他のサブフレーム
においては、当該サブフレームのスペクトルパラメータ
と前記復元値との誤差電力を複数サブフレームにわたり
累積し、前記累積値を最小にする候補を選択し出力する
ことを特徴とする。
【0010】第5の発明の音声パラメータ符号化方式
は、入力した音声信号をフレームに分割し、さらにフレ
ームよりも短い複数個のサブフレームに分割する手段
と、前記サブフレームの少なくとも一つについて前記音
声信号に対してスペクトルパラメータを予め定められた
次数だけ求める手段と、一つのサブフレームのスペクト
ルパラメータを予め構成した第1のコードブックを用い
て量子化し、量子化歪の小さい順に複数種類の候補を出
力し、他のサブフレームにおいては、当該フレームの量
子化スペクトルパラメータと過去のフレームの量子化ス
ペクトルパラメータを用いて予め定められた方法により
スペクトルパラメータを復元し、サブフレームのスペク
トルパラメータと前記復元値との誤差電力を複数サブフ
レームにわたり累積し、前記累積値を最小にする候補を
選択し出力する手段とを有することを特徴とする。
【0011】
【作用】本発明による音声パラメータ符号化方式の作用
を示す。図1は第1及び第2の発明の作用を、図3は第
3及び第4の発明の作用を、図4は第5の発明の作用を
各々説明するための図である。以下の説明では音声のス
ペクトルパラメータとしてLSPパラメータを用いるも
のとする。
【0012】入力した音声信号を予め定められた時間長
のフレーム(例えば30〜40ms)に分割し、さらに
フレームの音声信号を、フレームよりも短い複数個のサ
ブフレーム(例えば5〜8ms)に分割し、フレーム内
の少なくとも一つのサブフレームに対して、周知のLP
C分析を行いスペクトルパラメータを求める。ここで
は、フレーム長を40ms、サブフレーム長を8msと
し、図2に示すサブフレーム、、、についてL
PC分析をおこなうものとする。
【0013】最初に第1の発明の作用について図1を用
いて説明する。
【0014】一例として、第サブフレームについてL
PC分析により求められたスペクトルパラメータを、端
子100から入力し、第、、サブフレームについ
て求めたスペクトルパラメータを端子105から順に入
力する。スペクトルパラメータとしては、ここでは線ス
ペクトル対(LSP)パラメータを用いて説明を行う。
LSPの具体的な計算法は、菅村氏らによる”Quan
tizerdesign in LSP speech
analysis−synthesis,”と題した
論文(IEEE J.Sel.Areas Commu
n.,pp.425−431,1988年)(文献4)
等を参照できる。ベクトル量子化部110は、コードブ
ック120(第1のコードブック)を用いて、入力した
LSPパラメータをベクトル量子化する。コードブック
120には、トレーニング用の多量のLSPパラメータ
系列を用いて予め学習させておく。学習の方法は、例え
ばLinde,Buzo,Gray氏による”An a
lgorithm for vector quant
ization design”と題した論文(IEE
E Trans.Commun.,pp.84−95,
1980)(文献5)等を参照できる。コードベクトル
を探索するときの歪尺度は、種々のものが知られている
が、ここではLSPの2乗距離を用いる。LSPの2乗
距離は(1)式で与えられる。
【0015】
【数1】
【0016】ここではLSP(i)は入力したi次目の
LSP係数を示す。PはLSPの次数である。LSP’
(i)はコードブックが有するj番目のコードベクトル
であり、j=1〜2B (Bはコードブックのビット数)
である。(1)式を最小化するコードベクトルを補間ベ
クトル量子化部130と端子155へ出力する。
【0017】補間ベクトル量子化部130は、ベクトル
量子化部110の出力コードベクトルと、この出力コー
ドベクトルを1フレーム遅延させて得た1フレーム過去
のスペクトルパラメータの量子化値とを入力する。補間
係数コードブック140(コードブック2)を用いて、
端子105より入力したサブフレーム、、のLS
P系列を補間ベクトル量子化して復元する。つまり、
(2)式により、補間係数コードベクトルによる量子化
歪を計算し、量子化歪を最小にする補間係数コードベク
トルAj をサブフレーム毎に選択する。
【0018】
【数2】
【0019】(2)式において、LSPl (i)は第l
サブフレームでの入力のi次目のLSP。LSP’
n - 1 (i)、LSP’n (i)は、それぞれ1フレー
ム過去のLSPの量子化値、現フレームでのLSPの量
子化値(ベクトル量子化部110の出力値)を示す。A
jは補間係数コードブック140の有するj番目のコー
ドベクトルである。補間ベクトル量子化部130は、
(2)式を最小化する補間係数コードベクトルをサブフ
レーム、、に対して求め、(3)式によりサブフ
レームにおけるスペクトルパラメータを復元し端子15
0から出力する。
【0020】 LSP’n l (i)= LSP’n - 1 (i)・Aj −(1−Aj )LSP’(i) (3) Aj は、トレーニング用LSP信号に対して、(4)式
を最小化するように、前述の文献5等を用いて予め学習
しておく。
【0021】
【数3】
【0022】ここでnはフレーム番号、kはトレーニン
グ全信号のフレーム数を示す。
【0023】次に、第2の発明の作用について同じく図
1を用いて説明する。
【0024】ベクトル量子化部110は、コードブック
120(第1のコードブック)を用いて(1)式の量子
化歪の小さい順に複数種類(M種類)のコードベクトル
を出力する。次に、複数種類の各々のコードベクトルに
対して、補間ベクトル量子化部130は、補間係数コー
ドブック140(第2のコードブック)を用いて、
(2)式の量子化歪を最小化するコードベクトルを出力
する。次に、補間ベクトル量子化部130は、M種類の
コードベクトルの組合せの各々に対して、複数サブフレ
ームにわたり(5)式の累積歪を計算し、累積歪を最小
化する第1のコードブックと第2のコードブックのコー
ドベクトルの組合せを出力する。
【0025】
【数4】
【0026】ここで、LSP’n k (i)は第1のコー
ドブックから選択されたk番目(k=1〜M)の候補で
ある。Lは歪を累積するサブフレームの個数である。
【0027】次に第3の発明の作用について図3を用い
て説明する。ここで図1と同一の番号を付した構成要素
は図1と同様の動作を行うので説明は略す。
【0028】第1の発明と異なる点は、現在のフレーム
のスペクトルパラメータの量子化値と過去のフレームの
スペクトルパラメータの量子化値とを用いて、予め定め
られた補間法により補間してサブフレーム、、の
スペクトルパラメータを復元し、各サブフレームのスペ
クトルパラメータと前述の復元値の誤差を小さくするよ
うに第2のコードブックを選択することにある。
【0029】図3において、補間部115は、1フレー
ム過去のスペクトルパラメータの量子化値とベクトル量
子化部110の出力値(現在のフレームのスペクトルパ
ラメータの量子化値)とを用いて、あらかじめ定められ
た方法によりサブフレームのスペクトルパラメータを復
元する。ここでは、一例として、(6)式により直線補
間により復元するものとする。
【0030】 LSP’l (i)= αl LSP’n - 1 (i)+(1−αl )LSP’n (i) (6) ここで、LSP’l (1)は直線補間により復元した第
lサブフレームのLSPである。またαl は第lサブフ
レームでの予め定められた補間係数である。
【0031】補間ベクトル量子化部135は、補間係数
コードブック145(第2のコードブック)を用いて、
次式の誤差電力を最小化するように、サブフレーム毎に
コードベクトルをAj 選択する。
【0032】
【数5】
【0033】そして(8)式により、サブフレーム、
、に対して復元した値を端子150から出力する。
【0034】 LSP’’l (i)=LSP’l (i)+LSP’n - 1 (i)・Aj +(1 −Aj )LSP’n (i) (8) 次に第4の発明の作用について同じく図3を用いて説明
する。
【0035】ベクトル量子化部110は、コードブック
120(第1のコードブック)を用いて(1)式の量子
化歪の小さい順に複数種類(M種類)のコードベクトル
を出力する。次に、複数種類の各々のコードベクトルに
対して、補間部115において補間し、さらに、補間ベ
クトル量子化部135において、補間係数コードブック
145(第2のコードブック)を用いて、(7)式の量
子化歪を最小化するコードベクトルを出力する。次に、
M種類のコードベクトルの組合せの各々に対して、次式
の複数サブフレームにわたる累積歪を計算し、累積歪を
最小化する第1のコードブックと第2のコードブックの
コードベクトルの組合せを出力する。
【0036】
【数6】
【0037】ここで、LSP’’l k (i)は第1のコ
ードブックから選択されたk番目(k=1〜M)の候補
を用いて復元したlサブフレームのLSPである。
【0038】第1から第4の発明の作用の例では、全て
のサブフレームに対して共通の補間係数コードブックを
構成したが、サブフレーム毎に異なる補間係数コードブ
ックを構成しても良い。また、この場合、複数サブフレ
ーム分の補間コードブックをまとめてマストリクスコー
ドブックを構成しても良い。
【0039】また、補間係数コードブックの学習、探索
には上記の2乗距離や、重み付け距離など他の周知の距
離尺度を用いても良い。
【0040】また、ベクトル量子化部では、周知のベク
トルースカラ量子化を用いても良い。
【0041】第5の発明の作用について図4を用いて説
明する。ここで図1、図3と同一の番号を付した構成要
素は図1、図3と同様の動作を行うので説明は略す。
【0042】ベクトル量子化部180では、コードブッ
ク120(第1のコードブック)を用いて(1)式の量
子化歪の小さい順に複数種類(M種類)のコードベクト
ルを出力する。次に、複数種類の各々のコードベクトル
に対して、補間部115において例えば直線補間を用い
て補間処理を行い、(6)式に従い、、、サブフ
レームのLSPを復元する。累積歪計算部160では、
各候補に対して、サブフレームのスペクトルパラメータ
と前述の復元値との誤差電力を複数サブフレームにわた
り累積し、(10)式の累積歪を計算する。
【0043】
【数7】
【0044】判定部165では、(10)式を最小化す
るコードベクトルを選択し、ベクトル量子化部の候補は
端子170から、サブフレームの復元値は端子170か
ら出力する。
【0045】上記説明において、ベクトル量子化部で
は、周知のベクトル−スカラ量子化を用いることもでき
る。また、補間処理は周知の方法を用いることができ
る。また、コードブックの探索には重み付け距離などの
他の周知な距離尺度を用いることができる。
【0046】
【実施例】図5は第1、2、3、4及び5の発明の音声
パラメータ符号化方式の一実施例を示すブロック図であ
る。
【0047】図5において、入力端子400から音声信
号を入力し、1フレーム分(例えば40ms)の音声信
号をバッファメモリ410に格納する。
【0048】サブフレーム分割回路420は、フレーム
の音声信号を予め定められたサブフレーム(例えば8m
s)に分割する。
【0049】LPC分析回路430は、少なくとも一つ
のサブフレーム位置(例えば図2の、、、ある
いは、、、、あるいは、あるいは、
など任意の組合せが考えられる)の音声信号のスペクト
ル特性を表すパラメータとして、LSPパラメータを周
知のLPC分析を行いあらかじめ定められた次数Pだけ
計算する。この具体的な計算法については前述文献4等
を参照することができる。
【0050】LSP量子化回路440は、一つのサブフ
レームで求めたLSPパラメータを予め定められた量子
化ビット数で量子化し、得た符号1k を出力端子450
から出力する。
【0051】最初に、第1の発明におけるLSP量子化
回路440の構成を図6を用いて説明する。
【0052】図6において、入力端子500からサブフ
レームのLSPパラメータを入力する。また、第、
、サブフレームについて求めたスペクトルパラメー
タを端子505から順に入力し、バッファメモリ506
に格納する。
【0053】ベクトル量子化回路510は、コードブッ
ク520を用いて、入力したLSPパラメータを周知の
手段によりベクトル量子化する。コードブック520
は、トレーニング用の多量のLSPパラメータ系列を用
いて予め学習して構成する。ベクトル量子化回路510
は、(1)式を最小化するコードベクトルを補間ベクト
ル量子化部530と端子555へ出力する。
【0054】補間ベクトル量子化回路530は、ベクト
ル量子化回路510の出力コードベクトルと、遅延回路
545による1フレーム過去のスペクトルパラメータの
量子化値とを入力する。補間係数コードブック540を
もちいてバッファメモリ506に格納されたサブフレー
ム、、のLSP系列を補間して復元する。つま
り、(2)式により、各補間係数コードベクトルによる
量子化歪を計算し、量子化歪を最小にする補間係数コー
ドベクトルAj をサブフレーム毎に選択して(3)式に
よりLSPパラメータを復元し、バッファメモリ535
に一旦格納した後に端子550へ出力する。
【0055】補間係数コードブック540の補間係数
は、トレーニング用LSP信号に対して、(4)式を最
小化するように、前述文献5等を用いて予め学習して構
成することができる。
【0056】次に、第2の発明におけるLSP量子化回
路440の構成を図7を用いて説明する。図7において
図6と同一の番号を付した構成要素は図6と同様の動作
を行うので説明は省略する。
【0057】図7において、ベクトル量子化回路600
は、コードブック520(第1のコードブック)を用い
て(1)式の量子化歪の小さい順に複数種類(M種類)
のコードベクルトを出力し、候補格納回路610へ格納
する。補間ベクトル量子化回路615は、候補格納回路
610から各候補を入力し、さらに遅延回路545から
1フレーム過去のLSPのベクトル量子化値を入力し、
バッファメモリ506に格納された各サブフレームのL
SPを補間ベクトル量子化する。補間ベクトル量子化に
は補間係数コードブック540(第2のコードブック)
を用いて、(2)式の量子化歪を最小化するコードベク
トルを出力する。累積歪計算回路620では、各候補に
対して、(5)式の累積歪を計算する。(5)式におい
てL=3とする。選択回路625では、累積歪を最小化
する第1のコードブックと第2のコードブックのコード
ベクトルの組合せを用いてベクトル量子化されたLSP
を復元しバッファメモリ535に格納した後に、端子5
55から出力する。遅延回路545は、第4サブフレー
ムでのLSPの量子化値を1フレーム遅延させる。
【0058】次に、第3の発明におけるLSP量子化回
路440の構成を図8を用いて説明する。図8において
図6と同一の番号を付した構成要素は図6と同様の動作
を行うので説明は省略する。
【0059】図8において、補間回路630は、遅延回
路545の出力値(過去のフレームのLSPのベクトル
量子化値)と、ベクトル量子化回路510の出力値(現
在のフレームのLSPのベクトル量子化値)とを用い
て、あらかじめ定められた補間方法により各サブフレー
ムのLSPを復元する。補間方法としては種々のものが
知られているがここでは一例として、(6)式による直
線補間により復元するものとする。
【0060】補間ベクトル量子化部635は、補間係数
コードブック645(第2のコードブック)を用いて、
(7)式の誤差電力を最小化するように、サブフレーム
毎にコードベクトルを選択する。そして(8)式によ
り、サブフレーム、、、に対して復元した値を
バッファメモリ535に格納した後に、端子555から
出力する。
【0061】遅延回路545は、第4サブフレームのL
SPの量子化値を1フレーム遅延させる。
【0062】次に、第4の発明におけるLSP量子化回
路440の構成を図9を用いて説明する。図9におい
て、図7と同一の番号を付した構成要素は図7と同様の
動作を行うので説明は省略する。
【0063】図9において、ベクトル量子化回路600
は、コードブック520(第1のコードブック)を用い
て(1)式の量子化歪の小さい順に複数種類(M種類)
のコードベクトルを出力し、候補格納回路610に格納
する。複数種類の各々のコードベクトルに対して、補間
回路630において補間し、さらに、補間ベクトル量子
化回路635において、補間係数コードブック645
(第2のコードブック)を用いて、(7)式の量子化歪
を最小化するコードベクトルを出力する。累積歪計算回
路620では、M種類の候補の各々に対して、(9)式
の累積歪を計算する。ここではL=3とする。選択回路
625は、累積歪を最小化する第1のコードブックと第
2のコードブックのコードベクトルの組合せを求め、こ
のときのLSPを復元してバッファメモリ535に格納
した後に端子555から出力する。遅延回路545は、
第4サブフレームで量子化されたLSPを1フレーム遅
延させる。
【0064】補間係数コードブックは複数種類のサブフ
レームについて共通して使用しても良い。又は、サブフ
レーム毎に最適な補間係数コードブックを用いても良
い。後者のときは、複数サブフレーム分をまとめたマト
リクス構成のコードブックを構成すれば、さらに補間係
数コードブックのビット数を低減化できる。マトリクス
コードブックの作成法は、例えば、C.Tsao氏らに
よる”Matrix quantizer desig
n for LPC speech usingthe
generalized Lloyd algori
thm,”と題した論文(IEEE Trans.AS
SP,pp.537−545,1985年)(文献6)
を参照できる。
【0065】また、補間係数コードブックの学習、探索
には上記の2乗距離や、重み付け距離など他の周知の距
離尺度を用いることができる。
【0066】また、ベクトル量子化部では、周知のベク
トル−スカラ量子化を用いることもできる。
【0067】次に、第5の発明におけるLSP量子化回
路440の構成を図10を用いて説明する。図10にお
いて、図6と同一の番号を付した構成要素は、図6と同
様の動作を行うので、説明は省略する。
【0068】図10において、ベクトル量子化回路60
0は、コードブック520(第1のコードブック)を用
いて(1)式の量子化歪の小さい順に複数種類(M種
類)のコードベクトルを出力し、候補格納回路610に
格納する。補間回路630は、複数種類の各々のコード
ベクトルに対して、補間処理を行い、(6)式に従い、
、、サブフレームのLSPを復元する。ここで、
補間処理は種々の方法が考えられるが、一例として、直
線補間を用いるものとする。累積歪計算回路620は、
各候補に対して、サブフレームのLSPと前述の補間処
理によるLSP復元値との誤差電力を複数サブフレーム
にわたり累積し、(10)式の累積歪を計算する。ここ
ではL=3とする。選択回路625は、(10)式を最
小化するコードベクトル候補を選択し、LSPをサブフ
レーム毎に復元してバッファメモリ535に格納した後
に端子555より出力する。遅延回路545は、第4サ
ブフレームにおいて選択された候補1フレーム遅延させ
る。
【0069】最後に、以上の説明について補足する。
【0070】まずベクトル量子化回路は、周知のベクト
ル−スカラ量子化を用いても良い。
【0071】補間回路630は、補間位置又は補間方法
を複数種類もち、これらの全ての組合せに対して累積歪
を計算し、累積歪を最小にする補間位置又は補間方法を
フレーム毎に補助情報として数ビットで伝送しても良
い。ただし、このようにすると性能は改善されるが補助
情報伝送のため、ビット数が若干増加する。
【0072】また、補間回路630における補間は、直
線補間以外に、対数補間などの他の周知の方法を用いて
も良い。また、各サブフレームに最適な補間係数をトレ
ーニング信号を用いて学習して構成しても良い。
【0073】また、LSPのベクトル量子化及び累積歪
の計算にはLSPの2乗距離を用いたが、他の周知の距
離尺度を用いても良い。例えばLSPの重み付け2乗距
離や、LPCケプストラム距離などである。
【0074】また、ベクトル量子化回路としては、全探
索型ベクトル量子化回路を用いたが、コードベクトルの
探索に要する演算量を低減するために、木探索型、格子
型、他段型又は、他の周知な構成のベクトル量子化回路
を用いても良い。これらの演算量低減化法の詳細につい
ては、例えばR.Gray氏による”Vectorqu
antization,”と題した論文(IEEE A
SSP Magazine,pp.4−29,1984
年)(文献7)等を参照できる。
【0075】また、4つのサブフレームについて入力音
声をLPC分析してLSP係数を計算したが、演算量を
低減化するために任意の方法を用いることができる。例
えば、2つ又は3つのサブフレーム(2つのときは例え
ば図2のと、又はと、又はと又は、と
)に対してのみLSPを計算し、他のサブフレームで
はこれらのLSPを補間してLSPを求めるようにして
も良い。又は、2つ又は3つのサブフレームに対してL
SPを計算し、1つのサブフレームでLSPを量子化
し、他のサブフレームのLSPは補間又は第2のコード
ブック、あるいは補間と第2のコードブックの組み合わ
せで表わすようにしてもよい。
【0076】
【発明の効果】以上述べたように、本発明によれば、音
声のスペクトル特性を表すスペクトルパラメータを量子
化するときに、フレームをそれよりも短いサブフレーム
に分割し、少なくとも1つのサブフレームでスペクトル
パラメータを求めて第1のコードブックを用いて量子化
し、他のサブフレームのスペクトルパラメータは、当該
フレームの量子化値と過去のフレームの量子化値との補
間処理で表すか、第2のコードブックを使用して表す
か、あるいは補間処理と第2のコードブックを用いて表
す。また、第1のコードブックの探索において、量子化
歪の小さい順に複数種類の候補を求め、各候補に対して
補間処理、あるいは第2のコードブック、あるいは補間
処理と第2のコードブックを用いてスペクトルパラメー
タを復元し、複数サブフレームにわたる累積歪を求め、
累積歪を小さくするように前記候補を選択している。従
って、ビットレースを低減するためにフレーム長を増大
させても、少ないビット数及び演算量でスペクトルパラ
メータを良好に量子化できると共に、時間変化も良好に
表すことができるという大きな効果がある。
【図面の簡単な説明】
【図1】第1及び第2の発明の音声パラメータ符号化方
式の作用を説明するためのブロック図。
【図2】フレームとサブフレームの関係を表す図。
【図3】第3及び第4の発明の音声パラメータ符号化方
式の作用を説明するためのブロック図。
【図4】第5の発明の音声パラメータ符号化方式の作用
を説明するためのブロック図。
【図5】第1,2,3,4及び5の発明の音声パラメー
タ符号化方式の一実施例を示すブロック図。
【図6】第1の発明におけるLPC量子化回路の構成を
示すブロック図。
【図7】第2の発明におけるLPC量子化回路の構成を
示すブロック図。
【図8】第3の発明におけるLPC量子化回路の構成を
示すブロック図。
【図9】第4の発明におけるLPC量子化回路の構成を
示すブロック図。
【図10】第5の発明におけるLPC量子化回路の構成
を示すブロック図。
【符号の説明】
110 ベクトル量子化部 120 コードブック 130 補間ベクトル量子化部 140 補間係数コードブック 190 遅延部 115 補間部 135 補間ベクトル量子化部 145 補間係数コードブック 180 ベクトル量子化部 160 累積歪計算部 165 判別部 410 バッファメモリ 420 サブフレーム分割回路 430 LPC分析回路 440 LPC量子化回路 506 バッファメモリ 510 ベクトル量子化部 520 コードブック 530 補間ベクトル量子化回路 535 バッファメモリ 540 補間係数コードブック 545 遅延回路 600 ベクトル量子化回路 610 補間格納回路 615 補間ベクトル量子化回路 620 累積歪計算回路 625 選択回路 630 補間回路 635 補間ベクトル量子化回路 645 補間係数コードブック

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】入力した音声信号をフレームに分割し、さ
    らにフレームより短い複数個のサブフレームに分割する
    手段と、 前記サブフレームの少なくとも一つについて前期音声信
    号に対してスペクトルパラメータをあらかじめ定められ
    た次数だけ求める手段と、 一つのサブフレームのスペクトルパラメータをあらかじ
    め構成した第1のコードブックを用いて量子化し、当該
    フレームのスペクトルパラメータの量子化値と、過去の
    フレームでのスペクトルパラメータの量子化値とから、
    種々の補間係数をコードブックとして保有する第2のコ
    ードブックを用いて補間することにより、他の少なくと
    も一つのサブフレームのスペクトルパラメータを量子化
    する手段を有することを特徴とする音声パラメータ符号
    化方式。
  2. 【請求項2】第1のコードブック又は第2のコードブッ
    クの少なくとも一方において、量子化歪の小さい順に複
    数種類の候補を出力し、他のサブフレームにおいては、
    スペクトルパラメータを当該フレームでのスペクトルパ
    ラメータの量子化値と、過去のフレームでのスペクトル
    パラメータの量子化値と、第2のコードブックとを用い
    て補間し量子化して量子化歪を求め前記量子化歪を複数
    サブフレームにわたり累積し、前記累積値を最小にする
    候補を選択し出力することを特徴とする請求項1記載の
    音声パラメータ符号化方式。
  3. 【請求項3】入力した音声信号をフレームに分割し、さ
    らにフレームより短い複数個のサブフレームに分割する
    手段と、 前記サブフレームの少なくとも一つについて前期音声信
    号に対してスペクトルパラメータをあらかじめ定められ
    た次数だけ求める手段と、 一つのサブフレームのスペクトルパラメータをあらかじ
    め構成した第1のコードブックを用いて量子化し、他の
    少なくとも一つのサブフレームでは当該フレームでのス
    ペクトルパラメータの量子化値と過去のフレームでのス
    ペクトルパラメータの量子化値とを用いてあらかじめ定
    められた補間方法によりスペクトルパラメータを復元し
    上で、さらに種々の補間係数がコードベクトルとして
    格納された第2のコードブックを探索し、前記復元した
    スペクトルパラメータと前記補間係数により計算される
    スペクトルパラメータと当該サブフレームのスペクトル
    パラメータとの誤差を小さくするように第2のコードブ
    ックを選択する手段 を備えることを特徴とする音声パラ
    メータ符号化方式。
  4. 【請求項4】第1のコードブック又は第2のコードブッ
    クの少なくとも一方において、量子化歪の小さい順に複
    数種類の候補を出力し、他のサブフレームにおいては、
    当該サブフレームのスペクトルパラメータと前記復元値
    との誤差電力を複数サブフレームにわたり累積し、前記
    累積値を最小にする候補を選択し出力することを特徴と
    する請求項2記載の音声パラメータ符号化方式。
  5. 【請求項5】入力した音声信号をフレームに分割し、さ
    らにフレームよりも短い複数個のサブフレームに分割す
    る手段と、 前記サブフレームの少なくとも一つについて前記音声信
    号に対してスペクトルパラメータを予め定められた次数
    だけ求める手段と、 一つのサブフレームのスペクトルパラメータを予め構成
    した第1のコードブックを用いて量子化し、量子化歪の
    小さい順に複数種類の候補を出力し、他のサブフレーム
    においては、当該フレームの量子化スペクトルパラメー
    タと過去のフレームの量子化スペクトルパラメータを用
    いて予め定められた補間方法によりスペクトルパラメー
    タを復元し、サブフレームのスペクトルパラメータと前
    記復元値との誤差電力を複数サブフレームにわたり累積
    し、前記累積値を最小にする候補を選択し出力する手段
    とを有することを特徴とする音声パラメータ符号化方
    式。
JP03155049A 1991-06-27 1991-06-27 音声パラメータ符号化方式 Expired - Lifetime JP3143956B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03155049A JP3143956B2 (ja) 1991-06-27 1991-06-27 音声パラメータ符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03155049A JP3143956B2 (ja) 1991-06-27 1991-06-27 音声パラメータ符号化方式

Publications (2)

Publication Number Publication Date
JPH056199A JPH056199A (ja) 1993-01-14
JP3143956B2 true JP3143956B2 (ja) 2001-03-07

Family

ID=15597558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03155049A Expired - Lifetime JP3143956B2 (ja) 1991-06-27 1991-06-27 音声パラメータ符号化方式

Country Status (1)

Country Link
JP (1) JP3143956B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200488250Y1 (ko) 2017-09-25 2019-01-02 구강영 구멍과 그립을 가지는 탁구채

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2746039B2 (ja) * 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
JP2624130B2 (ja) * 1993-07-29 1997-06-25 日本電気株式会社 音声符号化方式
CA2154911C (en) 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
JP3179291B2 (ja) 1994-08-11 2001-06-25 日本電気株式会社 音声符号化装置
EP0944037B1 (en) * 1995-01-17 2001-10-10 Nec Corporation Speech encoder with features extracted from current and previous frames
JP3303580B2 (ja) * 1995-02-23 2002-07-22 日本電気株式会社 音声符号化装置
JP3308764B2 (ja) * 1995-05-31 2002-07-29 日本電気株式会社 音声符号化装置
JP3616432B2 (ja) 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置
JP3196595B2 (ja) * 1995-09-27 2001-08-06 日本電気株式会社 音声符号化装置
JPH09281995A (ja) * 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
JP3094908B2 (ja) * 1996-04-17 2000-10-03 日本電気株式会社 音声符号化装置
JP3335841B2 (ja) * 1996-05-27 2002-10-21 日本電気株式会社 信号符号化装置
CA2213909C (en) * 1996-08-26 2002-01-22 Nec Corporation High quality speech coder at low bit rates
US5902244A (en) * 1997-02-05 1999-05-11 Olympus Optical Co., Ltd. Ultrasonic diagnosis apparatus including simple digital scan converter
KR100446594B1 (ko) * 1997-04-15 2005-06-02 삼성전자주식회사 음성선스펙트럼주파수의부호화/복호화장치및그방법
JP3180762B2 (ja) 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
US6973424B1 (en) 1998-06-30 2005-12-06 Nec Corporation Voice coder
JP3319396B2 (ja) 1998-07-13 2002-08-26 日本電気株式会社 音声符号化装置ならびに音声符号化復号化装置
JP3180786B2 (ja) 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
JP3582589B2 (ja) 2001-03-07 2004-10-27 日本電気株式会社 音声符号化装置及び音声復号化装置
US7912459B2 (en) * 2007-09-26 2011-03-22 Disney Enterprises, Inc. Method and system for providing a multimedia presentation to a mobile device user

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200488250Y1 (ko) 2017-09-25 2019-01-02 구강영 구멍과 그립을 가지는 탁구채

Also Published As

Publication number Publication date
JPH056199A (ja) 1993-01-14

Similar Documents

Publication Publication Date Title
JP3143956B2 (ja) 音声パラメータ符号化方式
JP3114197B2 (ja) 音声パラメータ符号化方法
JP3151874B2 (ja) 音声パラメータ符号化方式および装置
US5208862A (en) Speech coder
JP3196595B2 (ja) 音声符号化装置
CA2202825C (en) Speech coder
JP3254687B2 (ja) 音声符号化方式
JP2800618B2 (ja) 音声パラメータ符号化方式
JP2624130B2 (ja) 音声符号化方式
JPH05216500A (ja) 音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JPH0944195A (ja) 音声符号化装置
JP3308764B2 (ja) 音声符号化装置
JPH0854898A (ja) 音声符号化装置
JP3256215B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3194930B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JPH113098A (ja) 音声符号化方法および装置
US5978758A (en) Vector quantizer with first quantization using input and base vectors and second quantization using input vector and first quantization output
JP3102017B2 (ja) 音声符号化方法
JP3428595B2 (ja) 音声符号化方式
JP3089967B2 (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JPH1069297A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001128

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080105

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090105

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100105

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110105

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120105

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120105

Year of fee payment: 11