JP3114197B2 - 音声パラメータ符号化方法 - Google Patents

音声パラメータ符号化方法

Info

Publication number
JP3114197B2
JP3114197B2 JP02297600A JP29760090A JP3114197B2 JP 3114197 B2 JP3114197 B2 JP 3114197B2 JP 02297600 A JP02297600 A JP 02297600A JP 29760090 A JP29760090 A JP 29760090A JP 3114197 B2 JP3114197 B2 JP 3114197B2
Authority
JP
Japan
Prior art keywords
distortion
vector
quantization
codebook
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP02297600A
Other languages
English (en)
Other versions
JPH04171500A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP02297600A priority Critical patent/JP3114197B2/ja
Priority to CA002054849A priority patent/CA2054849C/en
Priority to US07/787,596 priority patent/US5271089A/en
Priority to DE69132986T priority patent/DE69132986T2/de
Priority to EP96115034A priority patent/EP0753841B1/en
Priority to EP91118741A priority patent/EP0483882B1/en
Priority to DE69132987T priority patent/DE69132987T2/de
Priority to EP96115033A priority patent/EP0755047B1/en
Priority to DE69131339T priority patent/DE69131339T2/de
Publication of JPH04171500A publication Critical patent/JPH04171500A/ja
Application granted granted Critical
Publication of JP3114197B2 publication Critical patent/JP3114197B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声信号を低いビットレート、特に8kb/s以
下で高品質に符号化する音声パラメータ符号化方法に供
するための音声パラメータ符号化方法に関する。
〔従来の技術〕
音声信号を8kb/s以下の低いビットレートで符号化す
る方式としては、例えば、M.Schroeder and B.Atal氏に
よる“Code−excited linear prediction:High quality
speech at very low bit rates"(Proc.ICASSP,pp.937
−940,1985年)と題した論文(文献1)や、Kleijn氏ら
による“Improved speech quality and efficient vect
or quantization in SELP"(Proc.ICASSP,pp.155−158,
1988年)と題した論文(文献2)等に記載されているCE
LP(Code Excited LPC Coding)が知られている。この
方法では、送信側では、フレーム毎(例えば20ms)に音
声信号から音声信号のスペクトル特性を表すスペクトル
パラメータを抽出し、フレームをさらに小区間サブフレ
ーム(例えば5ms)に分割し、サブフレーム毎に過去の
音源信号をもとに長時間相関(ピッチ相関)を表すピッ
チパラメータを抽出し、ピッチパラメータにより前記サ
ブフレームの音声信号を長期予測し、長期予測して求め
た残差信号に対して、予め定められた種類の雑音信号か
らなるコードブックから選択した信号により合成した信
号と、前記音声信号との誤差電力を最小化するように一
種類の雑音信号を選択するとともに、最適なゲインを計
算する。そして選択された雑音信号の種類を表すインデ
クスとゲイン、ならびに、前記スペクトルパラメータと
ピッチパラメータを伝送する。
CELP方式のビットレートをさらに低減するためには、
音源信号のみならずスペクトルパラメータの効率的な量
子化法が重要である。
〔発明が解決しようとする課題〕 上述したCELP方式では、スペクトルパラメータとして
LPC分析により求めたLPCパラメータを量子化するが、通
常スカラ量子化が用いられており、10次のLPC係数を量
子化するのにフレーム当り34ビット(1.7kb/s)程度の
ビット数が必要であり、ビット数をさらに低減すると音
質が低下していた。また、LPCパラメータをより効率的
に量子化する方法として、Moriya氏らによる“Transfor
m coding of speech using a weighted vector quantiz
er,"と題した論文(IEEE J.Sel.Areas,Commun.,pp.425
−431,1988年)(文献3)等に記載されたベクトル−ス
カラ量子化法などが提案されているが、27〜30ビット程
度のビット数が必要であり、一層効率的な方法が必要で
あった。
さらにビット数を下げるためにフレーム長を長くとる
と、スペクトルの時間的変化を良好に表すことが困難と
なり、音質が劣化していた。
本発明の目的は、上述した問題点を解決し、スペクト
ルパラメータを従来よりもより少ないビット数で量子化
可能な音声パラメータ符号化方法を提供することにあ
る。
〔課題を解決するための手段〕
第1の発明の音声パラメータ符号化方法は、 音声信号を入力し前記音声信号を予め定められた時間
長のフレームに分割し、前記フレーム毎に前記音声信号
のスペクトルパラメータを求め、予め構成したベクトル
量子化コードブックを予め定められた段数だけ継続接続
し、前段のコードブックの誤差信号を次段のコードブッ
クでベクトル量子化し、初段から予め定められた段数ま
で量子化歪の小さい順に複数種類の候補を出力し、前記
候補の組に対して最終段における歪を計算し、前記累積
歪あるいは前記歪を最小化するコードブックの組を出力
することにより前記スペクトルパラメータを量子化する
ことを特徴とする。
また、第2の発明の音声パラメータ符号化方法は、 入力した音声信号をフレームに分割し、さらにフレー
ムよりも短いサブフレームに分割し、前記フレームある
いは少なくとも一つのサブフレームについて前記音声信
号に対してスペクトルパラメータを求め、予め構成した
ベクトル量子化コードブックを予め定められ段数だけ縦
続接続して、前段のコードブックの誤差信号を次段のコ
ードブックでベクトル量子化し、初段から予め定められ
た段数まで量子化歪の小さい順に複数種類の候補を出力
し、前記候補の組に対して全段における累積歪あるいは
最終段における歪を計算し、予め定められたサブフレー
ムに対して前記候補と予め構成した係数コードブックを
用いて前記サブフレームのスペクトルパラメータを量子
化して量子化歪を求め、前記累積歪あるいは前記歪と前
記量子化歪との和を最小化するコードベクトルの組を出
力することにより前記スペクトルパラメータを量子化す
ることを特徴とする。
また、第3の発明の音声パラメータ符号化方法は、 入力した音声信号をフレームに分割し、さらにフレー
ムよりも短いサブフレームに分割し、前記フレームある
いは少なくとも一つのサブフレームについて前記音声信
号に対してスペクトルパラメータを求め、予め構成した
ベクトル量子化コードブックを予め定められた段数だけ
縦続接続して、前段のコードブックの誤差信号を次段の
コードブックでベクトル量子化し、初段から予め定めら
れた段数まで量子化歪の小さい順に複数種類の候補を出
力し、前記候補の組に対して全段における累積歪あるい
は最終段における歪を計算し、前記累積歪あるいは前記
歪を最小化するコードベクトルの組を求めて出力し、予
め定められたサブフレームに対して前記コードベクトル
の組と予め構成した係数コードブックを用いて前記サブ
フレームのスペクトルパラメータを量子化して量子化歪
を求め、前記量子化歪を最小化する係数コードベクトル
を出力することにより前記スペクトルパラメータを量子
化することを特徴とする。
〔作用〕
本発明による音声パラメータ符号化方法の作用を示
す。以下の説明では音声のスペクトルパラメータとして
LSPパラメータを用い、LSPのベクトル量子化の段数は3
とし、候補数はMとする。
第1図は、第1の発明を実施する音声パラメータ符号
化装置の構成を示すブロック図である。図において、フ
レーム毎の音声信号から計算されたスペクトルパラメー
タをLPC分析回路50に入力する。スペクトルパラメータ
の分析には周知の線形予測(LPC)分析法を用いること
ができる。また、スペクトルパラメータとしては線形予
測(LPC)パラメータを用いる。ここでLPCパラメータと
しては種々のものが知られているが、ここでは線スペク
トル対(LSP)パラメータを用いて説明を行う。LSPの具
体的な計算法は、菅村氏らによる“Quantizer design i
n LSP speech analysis−synthesis,"と題した論文(IE
EE J.Sel.Areas Commun.,pp.425−431,1988年)(文献
4)等を参照できる。
第1のベクトル量子化器100は、第1のコードブック
(図示せず)を用いて、入力したLSPパラメータをベク
トル量子化する。第1のコードブックは、トレーニング
用の多量のLSPパラメータ系列を用いて予め学習して構
成する。学習の方法は、例えばLinde,Buzo,Gray氏によ
る“An algorithm for vector quantization design"と
題した論文(文献5)等を参照できる。ここで第1のベ
クトル量子化器100では、ベクトル量子化歪の小さい順
に予め定められた偶数Mのコードベクトルの候補を求
め、各候補について歪を求める。コードベクトルを探索
するときの歪尺度は、種々のものが知られているが、こ
こではLSPの2乗距離を用いる。LSPの2乗距離は下式で
与えられる。
ここでLSP(i)は入力したi次目のLSP係数を示す。
LSP′(i)はコードブックが有するj番目のコード
ベクトルであり、j=1〜2B(Bはコードブックのビッ
ト数)である。
減算器120は、第1のベクトル量子化器100で求めたM
種の候補の各々に対して、入力したLSP係数との誤差信
号を求め出力する。
第2のベクトル量子化器130は、M種の誤差信号の各
々に対して、第2のコードブック(図示せず)を用いて
(2)式に従いコードベクトルを探索して、歪の小さい
順に、予め定められた個数のコードベクトル候補を出力
する。
ここでLSPek(i)は、前段のk番目の候補に対する
減算器120の出力である誤差信号であり、k=1〜Mで
ある。
減算器150は減算器120と同一の動作を行い、第3のベ
クトル量子化器160は第2のベクトル量子化器130と同一
の動作を行う。さらに累積歪計算部180において、全段
における歪の計算値DAKを下式により計算し、候補のう
ち、累積歪を最小化するコードベクトルの組合せをスペ
クトルパラメータの量子化値として出力する。
累積歪の代わりに、最終段(ここでは第3段)のベク
トル量子化歪((2)式においてN=3とおいて得られ
るD3k)を各候補毎に求め、候補のうちこれを最小化す
るコードベクトルの組合せをスペクトルパラメータの量
子化値として出力するようにしてもよい。
次に第2の発明の作用を第2図をもとに説明する。図
において第1図と同一の番号を付した構成要素は第1図
と同一の動作を行うので、説明は省略する。音声信号を
フレーム毎に分割した後に、さらにフレームよりも短い
サブフレームに分割する。一例としてフレーム長,サブ
フレーム長はそれぞれ20ms,5msとする。LPC分析回路50
でサブフレーム毎に音声信号からLPC分析を行い、LSPパ
ラメータを求める。フレーム内のLSPパラメータかある
いは、フレーム内の予め定められた位置のサブフレーム
(例えば3番目)におけるLSPパラメータを第1のベク
トル量子化器100に入力する。また、予め定められた近
隣サブフレーム(例えば2,4番目)におけるLSPパラメー
タを予測ベクトル量子化部200へ入力する。
予測ベクトル量子化部200は、第3のベクトル量子化
器160まで求めたコードベクトルの候補をもとに、予め
学習して構成した予測ベクトルコードブックを用いて、
近隣サブフレームのLSP系列を予測し、次式により、予
測による量子化歪を計算する。
(4)式において、LSP′(i)は第3のベクトル
量子化器160までで求めたk番目の候補ベクトルであ
る。AL(i)は予測ベクトルコードブックの有するl番
目のコードベクトルである。予測ベクトル量子化部200
は、さらに累積歪と予測による量子化歪の和Dを次式に
より求め、Dを最小化するコードベクトルと予測ベクト
ルの組合せを求め、これらをサブフレームにおけるスペ
クトルパラメータの量子化値として出力する。
D=DAK+DPL (5) 以上の処理をサブフレーム毎に繰り返し、サブフレー
ム毎にLSP係数を量子化する。
なお、サブフレーム毎のLSP係数の量子化には、上述
のように予測係数コードブックを用いる他に、補間係数
コードブックを用いる方法も考えられる。ここでサブフ
レームのLSP係数は、前後のフレームのLSP係数からの直
線補間で表されるとし、補間係数BLを予め計算し補間係
数コードブックに格納しておく。この方法では、予測ベ
クトルコードブックの代わりに補間係数コードブックを
もつ。
ただしk=1〜M,l=1〜2BB,LSP′k L(i)は現フレ
ームのi番目のLSP係数のベクトル量子化におけるk番
目の候補、LSP′L-1(i)は1フレーム過去のLSPのベ
クトル量子化値である。補間係数コードブックの作成
は、トレーニング信号に対してサブフレーム毎に(7)
式を最小化するように補間係数bを求め、 これをクラスタリングしてコードブックを作成する。
クラスタリングの具体的な方法は前記文献5を参照でき
る。
次に、補間による量子化歪DILと、前述の累積歪との
和Dを(7)式に従い計算し、これを最小化するコード
ベクトルと補間係数コードベクトルの組合せを選択し、
サブフレーム毎にLSP係数を量子化して出力する。
D=DAK+DIL (8) 以上で第2の発明の作用の説明を終える。
次に、第3の発明では、第1の発明と同様に、フレー
ムあるいはフレーム内の予め定められた位置のサブフレ
ーム(例えば3番目)におけるLSPパラメータをベクト
ル量子化器に入力し、各段において、ベクトル量子化歪
の小さい順に予め定められた個数Mのコードベクトルの
候補を求め、歪を計算する。そして全段における累積歪
または、最終段におけるベクトル量子化歪を最小にする
候補の組を求め出力する。
次に、前記方法により得られたベクトル量子化値を用
いて、前記(3)あるいは(5)式により、近隣サブフ
レーム(例えば2,4番目)におけるLSPパラメータを予測
ベクトル量子化あるいは補間ベクトル量子化して出力す
る。
〔実施例〕
第3図は第1の発明による音声パラメータ符号化方法
を実施する音声パラメータ符号化装置を示すブロック図
である。
図において、入力端子400から音声信号を入力し、1
フレーム分(例えば20ms)の音声信号をバッファメモリ
410に格納する。
LPC分析回路430は、フレームの音声信号のスペクトル
特性を表すパラメータとして、LSPパラメータを前記フ
レームの音声信号から周知のLPC分析を行い、予め定め
られた次数Lだけ計算する。この具体的な計算法につい
ては前記文献4を参照することができる。
LSP量子化回路440は、フレームで求めたLSPパラメー
タを予め定められた量子化ビット数で量子化し、得た符
号lkを出力端子450から出力する。以下で一例として、L
SP量子化回路では3段のベクトル量子化器を用いるもの
とする。
第4図はLSP量子化回路440の構成を示すブロック図で
ある。図において、入力端子500からフレームのLSPパラ
メータを入力する。第1のベクトル量子化器505は、第
1のコードブック510からコードベクトルLSP′(i)
を読み出し、(2)式に従いベクトル量子化歪を計算
し、ベクトル量子化歪の小さい順に予め定められた個数
Mのコードベクトルの候補を求め、各候補について歪を
求め累積歪計算回路520へ出力する。コードベクトルを
探索するときの歪尺度は、以下ではLSPの2乗距離を用
いる。減算器511は、第1のベクトル量子化器505で求め
たM種の候補の各々に対して、入力したLSP係数との誤
差信号を求め出力する。
第2のベクトル量子化器515は、M種の誤差信号の各
々に対して、第2のコードブック516を用いて(2)式
に従いコードベクトルを探索して、歪の小さい順に予め
定められた個数のコードベクトルを候補として出力し、
そのときの歪を累積歪計算回路520へ出力する。
減算器521は減算器511と同一の動作を行い、第3のベ
クトル量子化器525は第3のコードブック526を用いて第
2のベクトル量子化器515と同一の動作を行う。
累積歪計算回路520は、第5図に示すように、各段の
候補ベクトルを木状に並べる。ここで1段目から2段目
におけるコードベクトルの候補数をそれぞれM1,M2とす
る。次に各パス毎に歪の全段における累積値DAK
(3)式により計算し、累積歪を最小化するパス(コー
ドベクトルの組合せ)をスペクトルパラメータの量子化
値として決定し、選択されたパスの各段のコードベクト
ルを示すインデクスを出力端子535を通し出力する。
以上で第1の発明の実施例の説明を終える。
第6図は、第2の発明の音声パラメータ符号化方法を
実施する音声パラメータ符号化装置を示すブロック図で
ある。図において第3図と同一の番号を付した構成要素
は、第3図と同一の動作を行うので説明は省略する。図
において、サブフレーム分割回路600は、フレームに分
割された音声信号をフレームよりも短いサブフレーム
(例えば5ms)に分割し、LPC分析回路605に出力する。
LPC分析回路605は、音声信号のスペクトル特性を表す
パラメータとして、LSPパラメータを前記フレームの音
声信号、及び、予め定められた位置のサブフレームの音
声信号から、周知のLPC分析を行い予め定められた次数
Lだけ計算し、フレーム及びサブフレームで求めたLSP
係数をLSP量子化回路610へ出力する。
LSP量子化回路610は、まずフレームで求めたLSPパラ
メータを予め定められた量子化ビット数でベクトル量子
化し、ベクトル量子化歪の小さい順に予め定められた個
数の候補数だけコードベクトルを選択して格納する。さ
らに、この候補ベクトルを用いてサブフレームのLSP係
数を予測あるいは補間ベクトル量子化する。以下では一
例として、LSP量子化回路では、フレームのLSP係数の量
子化に3段のベクトル量子化器を用い、サブフレームの
LSP係数の量子化には予測ベクトル量子化を用いるもの
とする。
第7図はLSP量子化回路610の構成を示すブロック図で
ある。図において、入力端子620からフレームのLSPパラ
メータを入力し、第1のベクトル量子化器505は、第1
のコードブック510からコードベクトルLSP′(i)を
読み出し、(2)式に従いベクトル量子化歪を計算し、
ベクトル量子化歪の小さい順に予め定められた個数Mの
コードベクトルの候補を求め予測ベクトル量子化回路63
5へ出力し、各候補について歪を求め累積歪計算回路640
へ出力する。コードベクトルを探索するときの歪尺度
は、以下ではLSPの2乗距離を用いる。減算器511は、第
1のベクトル量子化器505で求めたM種の候補の各々に
対して、入力したLSP係数との誤差信号を求め出力す
る。
第2のベクトル量子化器515は、M種の誤差信号の各
々に対して、第2のコードブック516を用いて(2)式
に従いコードベクトルを探索して歪の小さい順に予め定
められた個数のコードベクトルを候補として予測ベクト
ル量子化回路635へ出力し、そのときの歪を累積歪計算
回路640へ出力する。
減算器521は減算器511と同一の動作を行い、第3のベ
クトル量子化器525は第3のコードブック526を用いて第
2のベクトル量子化器515と同一の動作を行う。
予測ベクトル量子化回路635は、フレームのLSP係数を
ベクトル量子化したときの候補ベクトルを入力し、各段
の候補を第5図に示すように木状に並べる。ここで1段
目から2段目におけるコードベクトルの候補数をそれぞ
れM1,M2とする。予測ベクトル量子化回路635は、第5図
の木状の各パスに対して下式に従い、復号化LSP係数を
計算する。
LSP′(i)=LSP′k1(i)+LSP′k2(i)+LSP′k3(i) ・・・(9) ここでk1,k2,k3はそれぞれ1,2,3段目のベクトル量子
化器において選択されたコードベクトルのインデクスを
示し、k1=1〜M1,k2=1〜M2,k3=1である。また、k
=1〜M1・M2である。
次に予測ベクトル量子化回路635は、予測ベクトルコ
ードブック636から予測係数を読み出し、(9)式の復
号化LSPを用いてサブフレームのLSPを予測し、(3)式
に基づき予測歪DPLを各候補毎に求め、累積歪計算回路6
40へ出力する。
累積歪計算回路640は、第5図の各パスにおける累積
歪DAKと予測ベクトル量子化による予測歪DPLの加算歪D
を(5)式により求め、Dを最小化するような第5図の
パスと予測コードベクトルの組合せを求め、これらを表
す各コードベクトルのインデクスを、LSPの量子化値と
して、出力端子650を通して出力する。
以上で第2の発明の実施例の説明を終える。
第8図は、第3の発明の一実施例を示すブロック図で
ある。図において、第1図,第2図と同一の番号を記し
た構成要素は、第1図,第2図と同一の動作を行うの
で、説明は省略する。
第9図はLSP量子化回路730の構成を示すブロック図で
ある。累積歪計算回路735は、第5図に示すように、各
段の候補ベクトルを木状に並べる。ここで1段目から3
段目におけるコードベクトルの候補数をそれぞれM1,M2,
M3とする。次に各パス毎に、ベクトル量子化歪の全段に
おける累積値DAKを(3)式により計算し、累積歪を最
小化するパス(コードベクトルの組合せ)をスペクトル
パラメータの量子化値として決定し、予測ベクトル量子
化器740に出力する。また決定されたコードベクトルの
インデクスをバッファメモリ750へ出力する。
予測ベクトル量子化回路740は、第5図の木状の各パ
スに対して(8)式に従い、復号化LSP係数を計算す
る。
次に予測ベクトル量子化回路740は、予測ベクトルコ
ードブック745から予測係数を読み出し、(8)式の復
号化LSPを用いてサブフレームのLSPを予測し、(3)式
に基づき予測歪DPLを復号化LSPの各候補毎に求め、予測
歪を最小化する予測コードベクトルのインデクスをバッ
ファメモリ750へ出力する。
バッファメモリ750は、フレームのLSPの選択されたコ
ードベクトルを表すインデクスと、サブフレームのLSP
の選択された予測コードベクトルを表すインデクスを出
力端子755を通して出力する。
以上で第3の発明の実施例の説明を終える。
上述の各実施例で述べた構成以外にも種々の変形が可
能である。
実施例では音声のスペクトルパラメータとしてLSPパ
ラメータを用いたが、他の周知なパラメータ、例えばPA
RCOR,LAR,ケプストラムなどを用いることもできる。
また、LSPのコードベクトルの探索には、2乗距離以
外の他の周知の距離尺度を用いることができる。例え
ば、聴感重み付け2乗距離などが知られており、これを
ケプストラム係数上で行う方法としては誉田氏による
“重みつき対数スペクトル歪尺度を用いたLPCパラメー
タのベクトル量子化、”と題した論文(音響学会講演論
文集,pp.195−196,1990年10月)(文献6)を参照する
ことができる。
また、第1,第2,第3の発明の実施例において、フレー
ムのLSP係数のベクトル量子化には3段のベクトル量子
化器を用いたが、これは任意の段数のベクトル量子化器
を用いることができる。
また、実施例では、各段のベクトル量子化毎にM1,M2
個の候補を求めたが、このようにすると3段目の候補の
個数はM1・M2となり候補数が指数的に増大する。そこ
で、2段目以降のベクトル量子化では、各段毎に累積歪
を求め、累積歪の小さい順に各段毎に予め定められた一
定の候補数(例えばM種)で枝がりを行うことにより、
つねに各段の候補数はMとなり、候補数が指数的に増大
するのを防ぐようにすることもできる。このようにする
と、実施例の方式に比べ、全候補数を低減することがで
き、演算量を低減することができるが、性能は若干低下
する。
また、全ての段のベクトル量子化器において候補を求
めるのではなく、予め定められた段数のベクトル量子化
器のみ複数種の候補を求めて出力するようにしてもよ
い。
また、最適な候補の組の決定には、全段での累積歪の
代わりに、最終段でのベクトル量子化歪を用いることも
できる。
また、第5図では各段での候補を木状に配置したが、
他の周知な配置法、例えばトレリス配置などを用いるこ
ともできる。
また、最適候補の組合せの選択には、周知な高速計算
法、例えば、ダイナミックプログラミング法,ビタービ
計算法などを用いることもできる。
また、第2,第3の発明の実施例の説明では、サブフレ
ームのLSPについては予測ベクトル量子化を行ったが、
作用の項で説明したように補間ベクトル量子化を用いる
こともできる。また、フレームのLSPではなく予め定め
られた位置のサブフレームのLSPを多段ベクトル量子化
してもよい。
さらに、実施例のようにサブフレーム単位で予測ある
いは補間係数コードブックを作成するのではなく、複数
サブフレームをまとめてコードブックを作成する。マト
リクスコードブックを用いるようにしてもよい。マトリ
クスコードブックの作成法は例えば、C.Tsao氏らによる
“Matrix quantizer design for LPC speech using the
generalized Lloyd algorithm,"と題した論文(IEEE T
rans.ASSP,pp.537−545,1985年)(文献7)を参照でき
る。マトリクスコードブックを用いる構成によれば、複
数サブフレームをまとめてコードベクトルで表現するこ
とになるので、予測あるいは補間係数コードベクトル伝
送に必要なビット数を低減することができる。
また、ベクトル量子化器としては、全探索型ベクトル
量子化器を用いたが、コードベクトルの探索に要する演
算量を低減するために、木探索,格子型あるいは他の周
知な構成のベクトル量子化器を用いることもできる。こ
れらの演算量低減化法の詳細については、例えばR.Gray
氏による“Vector quantization,"と題した論文(IEEE
ASSP Magazine,pp.4−29,1984年)(文献8)等を参照
できる。
〔発明の効果〕
以上述べたように、本発明によれば音声のスペクトル
特性を表すスペクトルパラメータを量子化するときに、
ベクトル量子化器を複数段縦続接続するとともに、最終
段における歪を最小化するコードベクトルの組み合わせ
を選択しているので、候補の各々に対して行っていた、
最終段以外の各段における歪の計算と加算が不要にな
り、少ないビット数でも比較的少ない演算量で、性能の
よい量子化器を提供することができるという効果があ
る。
また、フレームのスペクトルパラメータのみならず、
サブフレームのスペクトルパラメータを、フレームでベ
クトル量子化した値を用いて、予測あるいは補間係数コ
ードブックを用いて効率的に量子化しているので、少な
いビット数でも良好にスペクトルの時間的変化を表すこ
とができるという効果がある。
【図面の簡単な説明】
第1図は第1の発明による音声パラメータ符号化方法の
作用を示すブロック図、 第2図は第2の発明による音声パラメータ符号化方法の
作用を示すブロック図、 第3図は第1の発明による音声パラメータ符号化方法を
実施する符号化装置を示すブロック図、 第4図はLSP量子化回路440の構成を示すブロック図、 第5図は各段のベクトル量子化器の候補を木状に配置し
た例を示す図、 第6図は第2の発明を実施する符号化装置を示すブロッ
ク図、 第7図はLSP量子化回路610の構成を示すブロック図、 第8図は第3の発明を実施する符号化装置を示すブロッ
ク図、 第9図はLSP量子化回路730の構成を示すブロック図であ
る。 50,430,605……LPC分析回路 100,505……第1のベクトル量子化回路 120,150,511,521……減算器 130,515……第2のベクトル量子化回路 160,525……第3のベクトル量子化回路 200,635……予測ベクトル量子化回路 180,210,520,640,735……累積歪計算回路 410,750……バッファメモリ 440,610,730……LSP量子化回路 600……サブフレーム分割回路 510……第1のコードブック 516……第2のコードブック 526……第3のコードブック 636,745……予測係数コードブック
フロントページの続き (56)参考文献 1990年電子情報通信学会春季全国大会 講演論文集,分冊1,「A−130 LS Pパラメータの効率的なベクトル量子化 法の検討」,p.1−132,(1990年9 月15日発行) IEEE Journal on S elected Areas in C ommunications,Vol. 6,No.2,Feburary 1988,”Transform Codi ng of Speech Using a Weighted Vector Quantizer”,p.425−431 IEEE Journal on S elected Areas in C ommunications,Vol. 6,No.1,Feburary 1988,”Quantizer Desi gn in LSP Speech A nalysis Synthesi s”,p.432−440 (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号を入力し前記音声信号を予め定め
    られた時間長のフレームに分割し、前記フレーム毎に前
    記音声信号のスペクトルパラメータを求め、予め構成し
    たベクトル量子化コードブックを予め定められた段数だ
    け継続接続し、前段のコードブックの誤差信号を次段の
    コードブックでベクトル量子化し、初段から予め定めら
    れた段数まで量子化歪の小さい順に複数種類の候補を出
    力し、前記候補の組に対して最終段における歪を計算
    し、前記歪を最小化するコードブックの組を出力するこ
    とにより前記スペクトルパラメータを量子化することを
    特徴とする音声パラメータ符号化方法。
  2. 【請求項2】入力した音声信号をフレームに分割し、さ
    らにフレームよりも短いサブフレームに分割し、前記フ
    レームあるいは少なくとも一つのサブフレームについて
    前記音声信号に対してスペクトルパラメータを求め、予
    め構成したベクトル量子化コードブックを予め定められ
    段数だけ縦続接続して、前段のコードブックの誤差信号
    を次段のコードブックでベクトル量子化し、初段から予
    め定められた段数まで量子化歪の小さい順に複数種類の
    候補を出力し、前記候補の組に対して全段における累積
    歪あるいは最終段における歪を計算し、予め定められた
    サブフレームに対して前記候補と予め構成した係数コー
    ドブックを用いて前記サブフレームのスペクトルパラメ
    ータを量子化して量子化歪を求め、前記累積歪あるいは
    前記歪と前記量子化歪との和を最小化するコードベクト
    ルの組を出力することにより前記スペクトルパラメータ
    を量子化することを特徴とする音声パラメータ符号化方
    法。
  3. 【請求項3】入力した音声信号をフレームに分割し、さ
    らにフレームよりも短いサブフレームに分割し、前記フ
    レームあるいは少なくとも一つのサブフレームについて
    前記音声信号に対してスペクトルパラメータを求め、予
    め構成したベクトル量子化コードブックを予め定められ
    た段数だけ縦続接続して、前段のコードブックの誤差信
    号を次段のコードブックでベクトル量子化し、初段から
    予め定められた段数まで量子化歪の小さい順に複数種類
    の候補を出力し、前記候補の組に対して全段における累
    積歪あるいは最終段における歪を計算し、前記累積歪あ
    るいは前記歪を最小化するコードベクトルの組を求めて
    出力し、予め定められたサブフレームに対して前記コー
    ドベクトルの組と予め構成した係数コードブックを用い
    て前記サブフレームのスペクトルパラメータを量子化し
    て量子化歪を求め、前記量子化歪を最小化する係数コー
    ドベクトルを出力することにより前記スペクトルパラメ
    ータを量子化することを特徴とする音声パラメータ符号
    化方法。
JP02297600A 1990-11-02 1990-11-02 音声パラメータ符号化方法 Expired - Lifetime JP3114197B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP02297600A JP3114197B2 (ja) 1990-11-02 1990-11-02 音声パラメータ符号化方法
CA002054849A CA2054849C (en) 1990-11-02 1991-11-01 Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
DE69132986T DE69132986T2 (de) 1990-11-02 1991-11-04 Verfahren zur Kodierung eines Sprachparameters mittels Übertragung eines spektralen Parameters mit verringerter Datenrate
EP96115034A EP0753841B1 (en) 1990-11-02 1991-11-04 Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
US07/787,596 US5271089A (en) 1990-11-02 1991-11-04 Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
EP91118741A EP0483882B1 (en) 1990-11-02 1991-11-04 Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits
DE69132987T DE69132987T2 (de) 1990-11-02 1991-11-04 Verfahren zur Kodierung eines Sprachparameters mittels Übertragung eines spektralen Parameters mit verringerter Datenrate
EP96115033A EP0755047B1 (en) 1990-11-02 1991-11-04 Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
DE69131339T DE69131339T2 (de) 1990-11-02 1991-11-04 Verfahren zur Kodierung von Sprachparametern, das die Spektrumparameterübertragung mit einer verringerten Bitanzahl ermöglicht

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02297600A JP3114197B2 (ja) 1990-11-02 1990-11-02 音声パラメータ符号化方法

Publications (2)

Publication Number Publication Date
JPH04171500A JPH04171500A (ja) 1992-06-18
JP3114197B2 true JP3114197B2 (ja) 2000-12-04

Family

ID=17848662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02297600A Expired - Lifetime JP3114197B2 (ja) 1990-11-02 1990-11-02 音声パラメータ符号化方法

Country Status (1)

Country Link
JP (1) JP3114197B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6575800B1 (en) 1997-09-01 2003-06-10 Seiko Epson Corporation Electroluminescent element and method of producing the same
US7732811B2 (en) 2006-12-04 2010-06-08 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, and electronic device
US8643003B2 (en) 2004-09-24 2014-02-04 Semiconductor Energy Laboratory Co., Ltd. Light emitting device

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2624130B2 (ja) * 1993-07-29 1997-06-25 日本電気株式会社 音声符号化方式
CA2154911C (en) 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
JP3179291B2 (ja) * 1994-08-11 2001-06-25 日本電気株式会社 音声符号化装置
EP0944038B1 (en) * 1995-01-17 2001-09-12 Nec Corporation Speech encoder with features extracted from current and previous frames
JP2982637B2 (ja) * 1995-01-17 1999-11-29 日本電気株式会社 スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置
JP3303580B2 (ja) * 1995-02-23 2002-07-22 日本電気株式会社 音声符号化装置
JP3308764B2 (ja) * 1995-05-31 2002-07-29 日本電気株式会社 音声符号化装置
JP3616432B2 (ja) 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置
JP3196595B2 (ja) * 1995-09-27 2001-08-06 日本電気株式会社 音声符号化装置
JP3137176B2 (ja) 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
JPH09281995A (ja) * 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
JP3335841B2 (ja) * 1996-05-27 2002-10-21 日本電気株式会社 信号符号化装置
JP3344944B2 (ja) * 1997-05-15 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
CA2213909C (en) * 1996-08-26 2002-01-22 Nec Corporation High quality speech coder at low bit rates
JP3266178B2 (ja) * 1996-12-18 2002-03-18 日本電気株式会社 音声符号化装置
US5902244A (en) * 1997-02-05 1999-05-11 Olympus Optical Co., Ltd. Ultrasonic diagnosis apparatus including simple digital scan converter
JP3063668B2 (ja) 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
JP3134817B2 (ja) 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
JP3180762B2 (ja) 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
CA2336360C (en) 1998-06-30 2006-08-01 Nec Corporation Speech coder
JP3319396B2 (ja) 1998-07-13 2002-08-26 日本電気株式会社 音声符号化装置ならびに音声符号化復号化装置
JP3180786B2 (ja) 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
JP3582589B2 (ja) 2001-03-07 2004-10-27 日本電気株式会社 音声符号化装置及び音声復号化装置
EP2618331B1 (en) * 2010-09-17 2016-08-31 Panasonic Intellectual Property Corporation of America Quantization device and quantization method
JP4764956B1 (ja) * 2011-02-08 2011-09-07 パナソニック株式会社 音声符号化装置及び音声符号化方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
1990年電子情報通信学会春季全国大会講演論文集,分冊1,「A−130 LSPパラメータの効率的なベクトル量子化法の検討」,p.1−132,(1990年9月15日発行)
IEEE Journal on Selected Areas in Communications,Vol.6,No.1,Feburary 1988,"Quantizer Design in LSP Speech Analysis Synthesis",p.432−440
IEEE Journal on Selected Areas in Communications,Vol.6,No.2,Feburary 1988,"Transform Coding of Speech Using a Weighted Vector Quantizer",p.425−431

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6575800B1 (en) 1997-09-01 2003-06-10 Seiko Epson Corporation Electroluminescent element and method of producing the same
US6825611B2 (en) 1997-09-01 2004-11-30 Seiko Epson Corporation Electroluminescent elements with light-emitting layer containing first and second compounds
US8643003B2 (en) 2004-09-24 2014-02-04 Semiconductor Energy Laboratory Co., Ltd. Light emitting device
US7732811B2 (en) 2006-12-04 2010-06-08 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, and electronic device
US8319210B2 (en) 2006-12-04 2012-11-27 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, and electronic device

Also Published As

Publication number Publication date
JPH04171500A (ja) 1992-06-18

Similar Documents

Publication Publication Date Title
JP3114197B2 (ja) 音声パラメータ符号化方法
US5208862A (en) Speech coder
US5271089A (en) Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
US6510407B1 (en) Method and apparatus for variable rate coding of speech
US5487128A (en) Speech parameter coding method and appparatus
JP3196595B2 (ja) 音声符号化装置
US7149683B2 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
JP3143956B2 (ja) 音声パラメータ符号化方式
KR100194775B1 (ko) 벡터양자화장치
JPH06222797A (ja) 音声符号化方式
JP2800618B2 (ja) 音声パラメータ符号化方式
JP3089769B2 (ja) 音声符号化装置
JPH08272395A (ja) 音声符号化装置
JP2624130B2 (ja) 音声符号化方式
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
JPH05265496A (ja) 複数のコードブックを有する音声符号化方法
EP0483882B1 (en) Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP3194930B2 (ja) 音声符号化装置
EP0755047B1 (en) Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
JP3428595B2 (ja) 音声符号化方式
JP3256215B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JP3335650B2 (ja) 音声符号化方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080929

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080929

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090929

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090929

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100929

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110929

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110929

Year of fee payment: 11