JPH04171500A - 音声パラメータ符号化方法 - Google Patents

音声パラメータ符号化方法

Info

Publication number
JPH04171500A
JPH04171500A JP2297600A JP29760090A JPH04171500A JP H04171500 A JPH04171500 A JP H04171500A JP 2297600 A JP2297600 A JP 2297600A JP 29760090 A JP29760090 A JP 29760090A JP H04171500 A JPH04171500 A JP H04171500A
Authority
JP
Japan
Prior art keywords
distortion
vector
quantization
codebook
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2297600A
Other languages
English (en)
Other versions
JP3114197B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP02297600A priority Critical patent/JP3114197B2/ja
Priority to CA002054849A priority patent/CA2054849C/en
Priority to DE69131339T priority patent/DE69131339T2/de
Priority to EP96115033A priority patent/EP0755047B1/en
Priority to EP91118741A priority patent/EP0483882B1/en
Priority to EP96115034A priority patent/EP0753841B1/en
Priority to US07/787,596 priority patent/US5271089A/en
Priority to DE69132986T priority patent/DE69132986T2/de
Priority to DE69132987T priority patent/DE69132987T2/de
Publication of JPH04171500A publication Critical patent/JPH04171500A/ja
Application granted granted Critical
Publication of JP3114197B2 publication Critical patent/JP3114197B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野〕 本発明は音声信号を低いビットレート、特に8kb/s
以下で高品質に符号化する音声符号化方式に供するだめ
の音声パラメータ符号化方弐乙こ関する。
3従来の技術〕 音声信号を8 kb/s以下の低いピントレートで符号
化する方式としては、例えば、M、5chroeder
 andB、Ata1氏によるIICode−exci
ted 1inear prediction: )l
igh quality 5peech at ver
y low bit rates″(Proc、 Ic
As5P、 pp、937−940.1985年)と題
した論文(文献l)や、Kleijn氏らによる’ I
mprovedspeech quality and
 efficient vector quantiz
ation in 5ELP″(Proc、 TCAS
SP、 pp、155−158.1988年)と題した
論文(文献2)等に記載されているCELP(Code
 Excited LPCCoding)が知られてい
る。
この方法では、送信側では、フレーム毎(例えば20m
5 )に音声信号から音声信号のスペクトル特性を表す
スペクトルパラメータを抽出し、フレームをさらに小区
間サブフレーム(例えば5m5)乙二分制し、サブフレ
ーム毎に過去の音源信号をもとに長時間相関(ピッチ相
関)を表すピッチパラメータを抽出し、ビソチパラメ・
−夕により前記サブフレームの音声信号を長期予測し、
長期予測して求めた残差信号に対して、予め定められた
種類の雑音信号からなるコードブックから選択した信号
により合成した信号と、前記音声信号との誤差電力を最
小化するように一種類の雑音信号を選択するとともに、
最適なゲインを計算する。そして選択された雑音信号の
種類を表すインデクスとゲイン、ならびに、前記スペク
トルパラメータとピッチパラメータを伝送する。
CELP方式のビットレートをさらに低減するためには
、音源信号のみならずスペクトルパラメータの効率的な
量子化法が重要である。
(発明が解決しようとする課題〕 上述したCELP方式では、スペクトルパラメータとし
てLPG分析により求めたLPGパラメータを量子化す
るが、通常スカラ量子化が用いられており、10次のL
PG係数を量子化するのにフレーム当り34ビツト(1
,7kb/s)程度のビット数が必要であり、ビット数
をさらに低減すると音質が低下していた。
また、LPGパラメータをより効率的に量子化する方法
として、Moriya氏らによる”Transform
 coding of 5peech using a
 weighted vector quantize
r、”と題した論文(JEEE J、Se1. Are
as、 Commun、。
pp、425−43L 1988年)(文献3)等に記
載されたベクトルースカラ量子化法などがIgされてい
るが、27〜30ビット程度のビット数が必要であり、
−層効率的な方法が必要であった。
さらにビット数を下げるためにフレーム長を長くとると
、スペクトルの時間的変化を良好に表すことが困難とな
り、音質が劣化していた。
本発明の目的は、上述した問題点を解決し、スペクトル
パラメータを従来よりもより少ないビ・7ト数で量子化
可能な音声パラメータ符号化方式を提供することにある
(課題を解決するための手段〕 第1の発明の音声パラメータ符号化方式は、音声信号を
入力し前記音声信号を予め定められた時間長のフレーム
に分割し、前記フレーム毎に前記音声信号のスペクトル
パラメータを求め、予め構成したベクトル量子化コード
ブックを予め定められた段数だけ継続接続し、前段のコ
ードブソりの誤差信号を次段のコードブックでベクトル
量子化し、初段から予め定められた段数まで量子化歪の
小さい順に複数種類の候補を出力し、前記候補の組に対
して全段における累積歪あるいは最終段における歪を計
算し、前記累積歪あるいは前記歪を最小化するコードブ
ックの組を出力することにより前記スペクトルパラメー
タを量子化することを特徴とする。
また、第2の発明の音声パラメータ符号化方式入力した
音声信号をフレームに分割し、さらにフレームよりも短
いサブフレームに分割し、前記フレームあるいは少なく
とも一つのサブフレームについて前記音声信号に対して
スペクトルパラメータを求め、予め構成したベクトル量
子化コードブックを予め定められた段数だけ縦続接続し
て、前段のコードブックの誤差信号を次段のコードブッ
クでベクトル量子化し、初段から予め定められた段数ま
で量子化歪の小さい順に複数種類の候補を出力し、前記
候補の組に対して全段における累積歪あるいは最終段に
おける歪を計算し、予め定められたサブフレームに対し
て前記候補と予め構成した係数コードブ・ツクを用いて
前記サブフレームのスペクトルパラメータを量子化して
量子化歪を求め、前記累積歪あるいは前記歪と前記量子
化歪との和を最小化するコードベクトルの組を出力する
ことにより前記スペクトルパラメータを量子化すること
を特徴とする。
また、第3の発明の音声パラメータ符号化方式入力した
音声信号をフレームに分割し、さらにフレームよりも短
いサブフレームに分割し、前記フレームあるいは少なく
とも一つのサブフレームについて前記音声信号に対して
スペクトルパラメータを求め、予め構成したベクトル量
子化コードブックを予め定められた段数だけ縦続接続し
て、前段のコードブックの誤差信号を次段のコードブッ
クでベクトル量子化し、初段から予め定められた段数ま
で量子化歪の小さい順に複数種類の候補を出力し、前記
候補の組に対して全段における累積歪あるいは最終段に
おける歪を計算し、前記累積歪あるいは前記歪を最小化
するコードベクトルの組を求めて出力し、予め定められ
たサブフレームに対して前記コードベクトルの組と予め
構成した係数コードブックを用いて前記サブフレームの
スペクトルパラメータを量子化して量子化歪を求め前記
量子化歪を最小化する係数コードベクトルを出力するこ
とにより前記スペクトルパラメータを量子化することを
特徴とする。
(作用〕 本発明による音声パラメータ符号化方式の作用を示す。
以下の説明では音声のスペクトルパラメータとしてLS
Pパラメータを用い、LSPのベクトル量子化の段数は
3とし、候補数はMとする。
第1図は、第1の発明を実施する音声パラメータ符号化
装置の構成を示すブロック図である。図において、フレ
ーム毎の音声信号から計算されたスペクトルパラメータ
をLPG分析回路5oに入力する。スペクトルパラメー
タの分析には周知の線形予測(LPG)分析法を用いる
ことができる。また、スペクトルパラメータとしては線
形予測(LPG)パラメータを用いる。ここでLPGパ
ラメータとしては種々のものが知られているが、ここで
は線スペクトル対(LSP)パラメータを用いて説明を
行う。
LSPの具体的な計算法は、菅村氏らによる°’(lu
antizer design in LSP 5pe
ech analysis−synthesis、”と
題した論文(IEEE J、Se1. Areas C
ommun、、 pp。
425−431.1988年)(文献4)等を参照でき
る。
第1のベクトル量子化器100は、第1のコードブック
(図示せず)を用いて、入力したLSPパラメータをベ
クトル量子化する。第1のコードブックは、トレーニン
グ用の多量のLSPパラメータ系列を用いて予め学習し
て構成する。学習の方法は、例えばLinde、 Bu
zo、 Gray氏による”An algorithm
 for vector quantization 
design″と題した論文(文献5)等を参照できる
。ここで第1のベクトル量子化器100では、ベクトル
量子化歪の小さい順に予め定められた個数Mのコードベ
クトルの候補を求め、各候補について歪を求める。コー
ドベクトルを探索するときの歪尺度は、種々のものが知
られているが、ここではLSPの2乗距離を用いる。L
SPの2乗距離は下式で与えられる。
ここでLSP (i )は入力したi次目のLSP係数
を示す。
LSP’ ; (i)はコードブックが有するj番目の
コードベクトルであり、j=1〜2B(Bはコードブッ
クのピント数)である。
減算器120は、第1のベクトル量子化器100で求め
たM種の候補の各々に対して、入力したLSP係数との
誤差信号を求め出力する。
第2のベクトル量子化器130は、M種の誤差信号の各
々に対して、第2のコードブ・ツク(図示せス)ヲ用イ
て(2)弐に従いコードベクトルを探索して、歪の小さ
い順に、予め定められた個数のコードベクトル候補を出
力する。
ここでLSP−k(i)は、前段のに番目の候補に対す
る減算器120の出力である誤差信号であり、k=1〜
Mである。
減算器150は減算器120と同一の動作を行い、第3
のベクトル量子化器160は第2のベクトル量子化器1
30と同一の動作を行う。さらに累積歪計算部180に
おいて、全段における歪の計算値D□を下式により計算
し、候補のうち、累積歪を最小化するコードベクトルの
組合せをスペクトルパラメータの量子化値として出力す
る。
累積歪の代わりに、最終段(ここでは第3段)のベクト
ル量子化歪((2)式においてN=3とおいて得られる
D3k)を各候補毎に求め、候補のうちこれを最小化す
るコードベクトルの組合せをスペクトルパラメータの量
子化値として出力するようにしてもよい。
次に第2の発明の作用を第2図をもとに説明する。図に
おいて第1図と同一の番号を付した構成要素は第1図と
同一の動作を行うので、説明は省略する。音声信号をフ
レーム毎に分割した後に、さらにフレームよりも短いサ
ブフレームに分割する。−例としてフレーム長1サブフ
レーム長はそれぞれ20m5. 5 msとする。LP
C分析回路50でサブフレーム毎に音声信号からLPG
分析を行い、LSPパラメータを求める。フレーム内の
LSPパラメータかあるいは、フレーム内の予め定めら
れた位置のサブフレーム(例えば3番目)におけるLS
Pパラメータを第1のベクトル量子化器100に入力す
る。また、予め定められた近隣サブフレーム(例えば2
,4番目)におけるLSPパラメータを予測ベクトル量
子化部200へ入力する。
予測ベクトル量子化部200は、第3のベクトル量子化
器160まで求めたコードベクトルの候補をもとに、予
め学習して構成した予測ベクトルコードブックを用いて
、近隣サブフレームのLSP系列を予測し、次式により
、予測による量子化歪を計算する。
(4)式において、LSP’ h (i)は第3のベク
トル量子化器160までで求めたに番目の候補ベクトル
である。Ar(i)は予測ベクトル量子化器・ツクの有
する1番目のコードベクトルである。予測ベクトル量子
化部200は、さらに累積歪と予測による量子化歪の和
りを次式により求め、Dを最小化するコードベクトルと
予測ベクトルの組合せを求め、これらをサブフレームに
おけるスペクトルパラメータの量子化値として出力する
D = D AK+ D FL           
    (5)以上の処理をサブフレーム毎に繰り返し
、サブフレーム毎にLSP係数を量子化する。
なお、サブフレーム毎のLSP係数の量子化には、上述
のように予測係数コードブ・ツクを用いる他に、補間係
数コードブックを用いる方法も考えられる。
ここでサブフレームのLSP 係数は、前後のフレーム
のLSP係数からの直線補間で表されるとし、補間係数
BLを予め計算し補間係数コードブ・ツクに格納してお
く。この方法では、予測ベクトルコードブックの代わり
に補間係数コードブックをもつ。
DIL−モ[(LSP(i)  LSP’うL(i))
−b+ (LSP′ト’(i)−LSP’kL(i))
 ”、 2・ ・ ・(6) ただシk = 1〜M、  l = 1〜211B、 
LSP’1=L(i)は現フレームの1番目のLSP係
数のベクトル量子化におけるに番目の候補、LSP’し
1(i)は1フレーム過去のLSPのベクトル量子化値
である。補間係数コードブックの作成は、トレーニング
信号に対してサブフレーム毎に(7)式を最小化するよ
うに補間係数すを求め、 〜b (LSP”’ (i)  LSP’kL(i) 
) ]”・・・(7) これをクラスタリングしてコードブックを作成する。ク
ラスタリングの具体的な方法は前記文献5を参照できる
次に、補間による量子化歪D Itと、前述の累積歪と
の和りを(7)弐に従い計算し、これを最小化するコー
ドベクトルと補間係数コードブクトルの組合せを選択し
、サブフレーム毎にLSP係数を量子化して出力する。
D=D□+D、、               (s
)以上で第2の発明の詳細な説明を終える。
次に、第3の発明では、第1の発明と同様に、フレーム
あるいはフレーム内の予め定められた位置のサブフレー
ム(例えば3番目)におけるLSPパラメータをベクト
ル量子化器に入力し、各段において、ベクトル量子化歪
の小さい順に予め定められた個数Mのコードベクトルの
候補を求め、歪を計算する。そして全段における累積歪
または、最終段におけるベクトル量子化歪を最小にする
候補の組を求め出力する。
次に、前記方法により得られたベクトル量子化値を用い
て、前記(3)あるいは(5)式により、近隣サブフレ
ーム(例えば2.4番目)におけるLSPパラメータを
予測ベクトル量子化あるいは補間ベクトル量子化して出
力する。
〔実施例〕
第3図は第1の発明による音声パラメータ符号化方式を
実施する音声パラメータ符号化装置を示すフ゛口・ンク
図である。
図において、入力端子400から音声信号を入力し、1
フレ一ム分(例えば20m5)の音声信号をハソファメ
モリ410に格納スる。
LPG分析回路430は、フレームの音声信号のスペク
トル特性を表すパラメータとして、LSPパラメータを
前記フレームの音声信号から周知のLPG分析を行い、
予め定められた次数したけ計算する。
この具体的な計算法については前記文献4を参照するこ
とができる。
LSP量子化回路440は、フレームで求めたLSPパ
ラメータを予め定められた量子化ビット数で量子化し、
得た符号1.を出力端子450から出力する。以下で一
例として、LSP量子化回路では3段のベクトル量子化
器を用いるものとする。
第4図はLSP量子化回路440の構成を示すブロック
図である。図において、入力端子500がらフレームの
LSPパラメータを入力する。第1のベクトル量子化器
505は、第1のコードブック510からコードベクト
ルLSP’ J(i)を読み出し、(2)式に従いベク
トル量子化歪を計算し、ベクトル量子化歪の小さい順に
予め定められた個数Mのコードベクトルの候補を求め、
各候補について歪を求め累積歪計算回路520へ出力す
る。コードベクトルを探索するときの歪尺度は、以下で
はLSPの2乗距離を用いる。減算器511は、第1の
ベクトル量子化器505で求めたM種の候補の各々に対
して、入力したLSP係数との誤差信号を求め出力する
第2のベクトル量子化器515は、M種の誤差信号の各
々に対して、第2のコードブック516を用いて(2)
式に従いコードベクトルを探索して、歪の小さい順に予
め定められた個数のコードベクトルを候補として出力し
、そのときの歪を累積歪計算回路520へ出力する。
減算器521は減算器511 と同一の動作を行い、第
3のベクトル量子化器525は第3のコードブック52
6を用いて第2のベクトル量子化器515と同一の動作
を行う。
累積歪計算回路520は、第5図に示すように、各段の
候補ヘクトルを木状に並べる。ここで1段目から2段目
におけるコード−・クトルの候補数をそれぞれM、、M
2とする。次に各パス毎に歪の全段における累積値I)
axを(3)弐により計算し、累積歪を最小化するパス
(コードベクトルの組合せ)をスペクトルパラメータの
量子化値として決定し、選択されたパスの各段のコード
ベクトルを示すインデクスを出力端子535を通し出力
する。
以上で第1の発明の詳細な説明を終える。
第6図は、第2の発明の音声パラメータ符号化方式を実
施する音声パラメータ符号化装置を示すブロック図であ
る。図において第3図と同一の番号を付した構成要素は
、第3図と同一の動作を行うので説明は省略する。図に
おいて、サブフレーム公開回路600は、フレームに分
割された音声信号をフレームよりも短いサブフレーム(
例えば5m5)に分割し、LPG分析回路605に出力
する。
LPG分析回路605は、音声信号のスペクトル特性を
表すパラメータとして、LSPパラメータを前記フレー
ムの音声信号、及び、予め定められた位置のサブフレー
ムの音声信号から、周知のLPG分析を行い予め定めら
れた次数りだけ計算し、フレーム及びサブフレームで求
めたLSP係数をLSP量子化回路610へ出力する。
LSP量子化回路610は、まずフレームで求めたLS
Pパラメータを予め定められた量子化ビット数でベクト
ル量子化し、ベクトル量子化歪の小さい順に予め定めら
れた個数の候補数だけコードベクトルを選択して格納す
る。さらに、この候補ベク)・ルを用いてサブフレーム
のLSP係数を予測あるいは補間ベクトル量子化する。
以下で1よ一例として、LSP量子化回路では、フレー
ムのLSP係数の量子化に3段のベクトル量子化器を用
い、サブフレームのLSP係数の量子化には予測ヘクF
−ル量子化を用いるものとする。
第7図はLSP量子化回路610の構成を示すブロック
図である。図C二おいて、入力端子620からフレーム
のLSPパラメータを入力し、第1のベクトル量子化器
505は、第1のコードブック510からコードベクト
ルLSP’=(i)を読み出し、(2)式に従いベクト
ル量子化歪を計算し、ヘクトル量子化歪の小さい順に予
め定められた個数Mのコードベクトルの候補を求め予測
ベクトル量子化回路635へ出力し、各候補について歪
を求め累積歪計算回路640へ出力する。コードベクト
ルを探索するときの歪尺度は、以下ではLSPの2乗距
離を用いる。
減算器511は、第1のベクトル量子化器505で求め
たM種の候補の各々に対して、入力したLSP係数との
誤差信号を求め出力する。
第2のベクトル量子化器515は、M種の誤差信号の各
々に対して、第2のコードブック516を用いて(2)
弐に従いコードベクトルを探索して歪の小さい順に予め
定められた個伜のコードベクトルを候補として予測ベク
トル量子化回路635へ出力し、そのときの歪を累積歪
計算回路640へ出力する。
減算器521は減算器511 と同一の動作を行い、第
3のベクトル量子化器525は第3のコードブック52
6を用いて第2のベクトル量子化器515と同一の動作
を行う。
予測ベクトル量子化回路635は、フレームのLSP係
数をベクトル量子化じたときの候補ベクトルを入力し、
各段の候補を第5図に示すように本状に並べる。ここで
1段目から2段目におけるコードベクトルの候補数をそ
れぞれM 1. M 2 とする。
予測ベクトル量子化回路635は、第5図の本状の各パ
スに対して下式に従い、復号化LSP係数を計算する。
LSP’k(i)  =LSP’1n(i)+LSP’
bz(i)+LSP’13(i)・・・(9) ここでkl、 k2. k3はそれぞれ1,2.3段目
のベクトル量子化器において選択されたコードベクトル
のインデクスを示し、k=1〜M1ak3=1である。
また、k=1〜M1・M2である。
次に予測ベクトル量子北回8635は、予測へクトルコ
ードブ、り636から予測係数を読み出し、(9)弐の
復号化LSPを用いてサブフレームのLSPを予測し、
(3)弐に基づき予測歪D PLを各候補毎に求め、累
積歪計算回路640−・出力する。
累積歪計算回路640は、第5図の各パスにおける累積
歪D A)Fと予測ベクトル量子化による予測歪DPI
の加算歪りを(5)弐により求め、Dを最小化するよう
な第5図のパスと予測コードベクトルの組合せを求め、
これらを表す各コードベクトルのインデクスを、LSP
の量子化値として、出力端子650を通して出力する。
以上で第2の発明の詳細な説明を終える。
第8図は、第3め発明の一実施例を示すブロック図であ
る。図において、第1図、第2図と同一の番号を記した
構成要素は、第1図、第2図と同一の動作を行うので、
説明は省略する。
第9図はLSP量子化回路730の構成を示すブロック
図である。累積歪計算回路735は、第5図に示すよう
に、各段の候補ベクトルを木状に並べる。
ここで1段目から3段目におけるコードベクトルの候補
数をそれぞれM、、M2.M、とする。次に各パス毎に
、ベクトル量子化歪の全段における累積値DAKを(3
)式により計算し、累積歪を最小化するパス(コードベ
クトルの組合せ)をスペクトルパラメータの量子化値と
して決定し、予測ベクトル量子化器740に出力する。
また決定されたコードベクトルのインデクスをバッファ
メモリ750へ出力する。
予測ベクトル量子化回路740は、第5図の木状の各パ
スに対して(8)弐に従い、復号化LSP係数を計算す
る。
次に予測ベクトル量子化回路740は、予測へクトルコ
ードブンク745から予測係数を読み出し、(8)式の
復号化LSPを用いてサブフレームのLSPを予測し、
(3)式に基づき予測歪D PLを復号化LSPの各候
補毎に求め、予測歪を最小化する予測コードベクトルの
インデクスをバッファメモリ750へ出力する。
バッファメモリ750は、フレームのLSPの選択され
たコードベクトルを表すインデクスと、サブフレームの
LSPの選択された予測コードベクトルを表すインデク
スを出力端子755を通して出力する。
以上で第3の発明の詳細な説明を終える。
上述の各実施例で述べた構成以外にも種々の変形が可能
である。
実施例では音声のスペクトルパラメータとしてLSPパ
ラメータを用いたが、他の周知なパラメータ、例えばP
ARCOR,LAR,ケプストラムなどを用いることも
できる。
また、LSPのコードベクトルの探索には、2乗距離以
外の他の周知な距離尺度を用いることができる。例えば
、聴感重み付け2乗距離などが知られており、これをケ
プストラム係数上で行う方法としては誉田氏による“重
みつき対数スペクトル歪尺度を用いたLPGパラメータ
のベクトル量子化、”と題した論文(音響学会講演論文
集、 pp、195−1.96゜1990年10月)(
文献6)を参照することができる。
また、第1.第2.第3の発明の実施例において、フレ
ームのLSP係数のベクトル量子化には3段のベクトル
量子化器を用いたが、これは任意の段数のベクトル量子
化器を用いることができる。
また、実施例では、各段のベクトル量子化毎にM I、
 M 2個の候補を求めたが、このようにすると3段目
の候補の個数はM、・M2となり候補数が指数的に増大
する。そこで、2段目以降のベクトル量子化では、各段
毎に累積歪を求め、累積歪の小さい順に各段毎に予め定
められた一定の候補数(例えばM種)で技がりを行うこ
とにより、つねに各段の候補数はMとなり、候補数が指
数的に増大するのを防ぐようにすることもできる。この
ようにすると、実施例の方式に比べ、全候補数を低減す
ることができ、演算量を低減することができるが、性能
は若干低下する。
また、全ての段のベクトル量子化器において候補を求め
るのではなく、予め定められた段数のベクトル量子化器
のみ複数種の候補を求めて出力するようにしてもよい。
また、最適な候補の組の決定には、全段での累積歪の代
わりに、最終段でのベクトル量子化歪を用いることもで
きる。
また、第5図では各段での候補を木状に配置したが、他
の周知な配置法、例えばトレリス配置などを用いること
もできる。
また、最適候補の組合せの選択には、周知な高速計算法
、例えば、ダイナミックプログラミング法、ビタービ計
算法などを用いることもできる。
また、第2.第3の発明の詳細な説明では、fブ7レ−
4(7)LSPについては予測ベクトル量子化を行った
が、作用の項で説明したように補間ベクトル量子化を用
いることもできる。また、フレームのLSPではなく予
め定められた位置のサブフレームのLSPを多段ベクト
ル量子化してもよい。
さらに、実施例のようにサブフレーム単位で予測あるい
は補間係数コードブックを作成するのではなく、複数サ
ブフレームをまとめてフードブックを作成する、マトリ
クスコードブックを用いるようにしてもよい。マトリク
スコードブ・ツクの作成法は例えば、C,Tsao氏ら
にょる’Matrix quantizer desi
gn for LPC5peech usingthe
 generalized Lloyd algori
thm、”と題した論文(IEEE Trans、 A
SSP、 pp、537−545.1985年)(文献
7)を参照できる。マトリクスコードブックを用いる構
成によれば、複数サブフレームをまとめてコードベクト
ルで表現することになるので、予測あるいは補間係数コ
ードベクトル伝送に必要なピント数を低減することがで
きる。
また、ベクトル量子化器としては、全探索型ベクトル量
子化器を用いたが、コードベクトルの探索!:要する演
算量を低減するために、木探索1格子型あるいは他の周
知な構成のベクトル量子化器を用いることもできる。こ
れらの演算量低減化法の詳細については、例えばR,G
ray氏による”Vector quantizati
on+” と題した論文(IEEE ASSP Mag
azine、 pp、4−29.1984年)(文献8
)等を参照できる。
〔発明の効果〕
以上述べたように、本発明によれば音声のスペクトル特
性を表すスペクトルパラメータを量子化するときに、ベ
クトル量子化器を複数段縦続接続するとともに、初段か
ら予め定められた段まで複数種類の候補とそのときの量
子化歪を求め、全段における累積歪か最終段における歪
を最小化する候補の組合せを量子化値として選択してい
るので、少ないビット数でも比較的少ない演算量で、性
能のよい量子化器を提供することができるという効果が
ある。
また、フレームのスペクトルパラメータのみならず、サ
ブフレームのスペクトルパラメータを、フレームでベク
トル量子化した値を用いて、予測あるいは補間係数コー
ドブックを用いて効率的に量子化しているので、少ない
ビット数でも良好ニスベクトルの時間的変化を表すこと
ができるという効果がある。
【図面の簡単な説明】
第1図は第1の発明による音声パラメータ符号化方式の
作用を示すブロック図、 第2図は第2の発明による音声パラメータ符号化方式の
作用を示すブロック図、 第3図は第1の発明による音声パラメータ符号化方式を
実施する符号化装置を示すブロック図、第4図はLSP
量子化回路440の構成を示すブロック図、 第5図は各段のベクトル量子化器の候補を本状に配置し
た例を示す図、 第6図は第2の発明を実施する符号化装置を示すブロッ
ク図、 第7図はLSP量子化回路610の構成を示すブロック
図、 第8図は第3の発明を実施する符号化装置を示すブロッ
ク図、 第9図はLSP量子化回路730の構成を示すブロック
図である。 50、430.605・・・LPG分析回路100、5
05・・・第1のベクトル量子化回路120、150.
511.521・・・減算器130、515・・・第2
のベクトル量子化回路160、525・・・第3のベク
トル量子化回路200、635・・・予測ベクトル量子
化回路180、210.520.640.735・・・
累積歪計算回路 410、750・・・バッファメモリ 440、610.730 − ・−LSP量子化回路6
00  ・・・・・サブフレーム分割回路510  ・
・・・・第1のコードブック516  ・・・・・第2
のコードブック526  ・・・・・第3のコードブッ
ク636、745・・・予測係数コードブック代理人 
弁理士  岩 佐  義 幸 第1図 第2図 ■  ■  ■ Ml、 M2 第5図 第6図 第7図

Claims (3)

    【特許請求の範囲】
  1. (1)音声信号を入力し前記音声信号を予め定められた
    時間長のフレームに分割し、前記フレーム毎に前記音声
    信号のスペクトルパラメータを求め、予め構成したベク
    トル量子化コードブックを予め定められた段数だけ継続
    接続し、前段のコードブックの誤差信号を次段のコード
    ブックでベクトル量子化し、初段から予め定められた段
    数まで量子化歪の小さい順に複数種類の候補を出力し、
    前記候補の組に対して全段における累積歪あるいは最終
    段における歪を計算し、前記累積歪あるいは前記歪を最
    小化するコードブックの組を出力することにより前記ス
    ペクトルパラメータを量子化することを特徴とする音声
    パラメータ符号化方式。
  2. (2)入力した音声信号をフレームに分割し、さらにフ
    レームよりも短いサブフレームに分割し、前記フレーム
    あるいは少なくとも一つのサブフレームについて前記音
    声信号に対してスペクトルパラメータを求め、予め構成
    したベクトル量子化コードブックを予め定められた段数
    だけ縦続接続して、前段のコードブックの誤差信号を次
    段のコードブックでベクトル量子化し、初段から予め定
    められた段数まで量子化歪の小さい順に複数種類の候補
    を出力し、前記候補の組に対して全段における累積歪あ
    るいは最終段における歪を計算し、予め定められたサブ
    フレームに対して前記候補と予め構成した係数コードブ
    ックを用いて前記サブフレームのスペクトルパラメータ
    を量子化して量子化歪を求め、前記累積歪あるいは前記
    歪と前記量子化歪との和を最小化するコードベクトルの
    組を出力することにより前記スペクトルパラメータを量
    子化することを特徴とする音声パラメータ符号化方式。
  3. (3)入力した音声信号をフレームに分割し、さらにフ
    レームよりも短いサブフレームに分割し、前記フレーム
    あるいは少なくとも一つのサブフレームについて前記音
    声信号に対してスペクトルパラメータを求め、予め構成
    したベクトル量子化コードブックを予め定められた段数
    だけ縦続接続して、前段のコードブックの誤差信号を次
    段のコードブックでベクトル量子化し、初段から予め定
    められた段数まで量子化歪の小さい順に複数種類の候補
    を出力し、前記候補の組に対して全段における累積歪あ
    るいは最終段における歪を計算し、前記累積歪あるいは
    前記歪を最小化するコードベクトルの組を求めて出力し
    、予め定められたサブフレームに対して前記コードベク
    トルの組と予め構成した係数コードブックを用いて前記
    サブフレームのスペクトルパラメータを量子化して量子
    化歪を求め前記量子化歪を最小化する係数コードベクト
    ルを出力することにより前記スペクトルパラメータを量
    子化することを特徴とする音声パラメータ符号化方式。
JP02297600A 1990-11-02 1990-11-02 音声パラメータ符号化方法 Expired - Lifetime JP3114197B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP02297600A JP3114197B2 (ja) 1990-11-02 1990-11-02 音声パラメータ符号化方法
CA002054849A CA2054849C (en) 1990-11-02 1991-11-01 Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
EP96115033A EP0755047B1 (en) 1990-11-02 1991-11-04 Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
EP91118741A EP0483882B1 (en) 1990-11-02 1991-11-04 Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits
DE69131339T DE69131339T2 (de) 1990-11-02 1991-11-04 Verfahren zur Kodierung von Sprachparametern, das die Spektrumparameterübertragung mit einer verringerten Bitanzahl ermöglicht
EP96115034A EP0753841B1 (en) 1990-11-02 1991-11-04 Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
US07/787,596 US5271089A (en) 1990-11-02 1991-11-04 Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
DE69132986T DE69132986T2 (de) 1990-11-02 1991-11-04 Verfahren zur Kodierung eines Sprachparameters mittels Übertragung eines spektralen Parameters mit verringerter Datenrate
DE69132987T DE69132987T2 (de) 1990-11-02 1991-11-04 Verfahren zur Kodierung eines Sprachparameters mittels Übertragung eines spektralen Parameters mit verringerter Datenrate

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02297600A JP3114197B2 (ja) 1990-11-02 1990-11-02 音声パラメータ符号化方法

Publications (2)

Publication Number Publication Date
JPH04171500A true JPH04171500A (ja) 1992-06-18
JP3114197B2 JP3114197B2 (ja) 2000-12-04

Family

ID=17848662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02297600A Expired - Lifetime JP3114197B2 (ja) 1990-11-02 1990-11-02 音声パラメータ符号化方法

Country Status (1)

Country Link
JP (1) JP3114197B2 (ja)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0744200A (ja) * 1993-07-29 1995-02-14 Nec Corp 音声符号化方式
EP0696026A2 (en) 1994-08-02 1996-02-07 Nec Corporation Speech coding device
JPH08195722A (ja) * 1995-01-17 1996-07-30 Nec Corp スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置
EP0756268A2 (en) 1995-07-27 1997-01-29 Nec Corporation Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits
EP0778561A2 (en) 1995-12-06 1997-06-11 Nec Corporation Speech coding device
US5774840A (en) * 1994-08-11 1998-06-30 Nec Corporation Speech coder using a non-uniform pulse type sparse excitation codebook
US5787389A (en) * 1995-01-17 1998-07-28 Nec Corporation Speech encoder with features extracted from current and previous frames
US5826226A (en) * 1995-09-27 1998-10-20 Nec Corporation Speech coding apparatus having amplitude information set to correspond with position information
US5832180A (en) * 1995-02-23 1998-11-03 Nec Corporation Determination of gain for pitch period in coding of speech signal
WO1998052188A1 (fr) * 1997-05-15 1998-11-19 Matsushita Electric Industrial Co., Ltd. Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio
US5857168A (en) * 1996-04-12 1999-01-05 Nec Corporation Method and apparatus for coding signal while adaptively allocating number of pulses
US5873060A (en) * 1996-05-27 1999-02-16 Nec Corporation Signal coder for wide-band signals
US5884252A (en) * 1995-05-31 1999-03-16 Nec Corporation Method of and apparatus for coding speech signal
US5902244A (en) * 1997-02-05 1999-05-11 Olympus Optical Co., Ltd. Ultrasonic diagnosis apparatus including simple digital scan converter
US5963896A (en) * 1996-08-26 1999-10-05 Nec Corporation Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses
US6009388A (en) * 1996-12-18 1999-12-28 Nec Corporation High quality speech code and coding method
US6192334B1 (en) 1997-04-04 2001-02-20 Nec Corporation Audio encoding apparatus and audio decoding apparatus for encoding in multiple stages a multi-pulse signal
US6208957B1 (en) 1997-07-11 2001-03-27 Nec Corporation Voice coding and decoding system
US6581031B1 (en) 1998-11-27 2003-06-17 Nec Corporation Speech encoding method and speech encoding system
US6826526B1 (en) 1996-07-01 2004-11-30 Matsushita Electric Industrial Co., Ltd. Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization
US6856955B1 (en) 1998-07-13 2005-02-15 Nec Corporation Voice encoding/decoding device
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
US6973424B1 (en) 1998-06-30 2005-12-06 Nec Corporation Voice coder
US6978235B1 (en) 1998-05-11 2005-12-20 Nec Corporation Speech coding apparatus and speech decoding apparatus
US7680669B2 (en) 2001-03-07 2010-03-16 Nec Corporation Sound encoding apparatus and method, and sound decoding apparatus and method
JP4764956B1 (ja) * 2011-02-08 2011-09-07 パナソニック株式会社 音声符号化装置及び音声符号化方法
WO2012035781A1 (ja) * 2010-09-17 2012-03-22 パナソニック株式会社 量子化装置及び量子化方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3861400B2 (ja) 1997-09-01 2006-12-20 セイコーエプソン株式会社 電界発光素子およびその製造方法
CN101027799B (zh) 2004-09-24 2010-06-16 株式会社半导体能源研究所 发光器件
KR101426717B1 (ko) 2006-12-04 2014-08-06 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치 및 전자 기기

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0744200A (ja) * 1993-07-29 1995-02-14 Nec Corp 音声符号化方式
EP0696026A2 (en) 1994-08-02 1996-02-07 Nec Corporation Speech coding device
US5778334A (en) * 1994-08-02 1998-07-07 Nec Corporation Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion
US5774840A (en) * 1994-08-11 1998-06-30 Nec Corporation Speech coder using a non-uniform pulse type sparse excitation codebook
JPH08195722A (ja) * 1995-01-17 1996-07-30 Nec Corp スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置
US5787389A (en) * 1995-01-17 1998-07-28 Nec Corporation Speech encoder with features extracted from current and previous frames
US5832180A (en) * 1995-02-23 1998-11-03 Nec Corporation Determination of gain for pitch period in coding of speech signal
US5884252A (en) * 1995-05-31 1999-03-16 Nec Corporation Method of and apparatus for coding speech signal
EP0756268A2 (en) 1995-07-27 1997-01-29 Nec Corporation Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits
US6006178A (en) * 1995-07-27 1999-12-21 Nec Corporation Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits
US5826226A (en) * 1995-09-27 1998-10-20 Nec Corporation Speech coding apparatus having amplitude information set to correspond with position information
EP0778561A2 (en) 1995-12-06 1997-06-11 Nec Corporation Speech coding device
US5857168A (en) * 1996-04-12 1999-01-05 Nec Corporation Method and apparatus for coding signal while adaptively allocating number of pulses
US5873060A (en) * 1996-05-27 1999-02-16 Nec Corporation Signal coder for wide-band signals
US6826526B1 (en) 1996-07-01 2004-11-30 Matsushita Electric Industrial Co., Ltd. Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
US7243061B2 (en) 1996-07-01 2007-07-10 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having a plurality of frequency bands
US5963896A (en) * 1996-08-26 1999-10-05 Nec Corporation Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses
US6009388A (en) * 1996-12-18 1999-12-28 Nec Corporation High quality speech code and coding method
US5902244A (en) * 1997-02-05 1999-05-11 Olympus Optical Co., Ltd. Ultrasonic diagnosis apparatus including simple digital scan converter
US6192334B1 (en) 1997-04-04 2001-02-20 Nec Corporation Audio encoding apparatus and audio decoding apparatus for encoding in multiple stages a multi-pulse signal
WO1998052188A1 (fr) * 1997-05-15 1998-11-19 Matsushita Electric Industrial Co., Ltd. Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio
US6208957B1 (en) 1997-07-11 2001-03-27 Nec Corporation Voice coding and decoding system
US6978235B1 (en) 1998-05-11 2005-12-20 Nec Corporation Speech coding apparatus and speech decoding apparatus
US6973424B1 (en) 1998-06-30 2005-12-06 Nec Corporation Voice coder
US6856955B1 (en) 1998-07-13 2005-02-15 Nec Corporation Voice encoding/decoding device
US6581031B1 (en) 1998-11-27 2003-06-17 Nec Corporation Speech encoding method and speech encoding system
US7680669B2 (en) 2001-03-07 2010-03-16 Nec Corporation Sound encoding apparatus and method, and sound decoding apparatus and method
WO2012035781A1 (ja) * 2010-09-17 2012-03-22 パナソニック株式会社 量子化装置及び量子化方法
US20130173263A1 (en) * 2010-09-17 2013-07-04 Panasonic Corporation Quantization device and quantization method
JP5687706B2 (ja) * 2010-09-17 2015-03-18 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 量子化装置及び量子化方法
US9135919B2 (en) 2010-09-17 2015-09-15 Panasonic Intellectual Property Corporation Of America Quantization device and quantization method
JP4764956B1 (ja) * 2011-02-08 2011-09-07 パナソニック株式会社 音声符号化装置及び音声符号化方法

Also Published As

Publication number Publication date
JP3114197B2 (ja) 2000-12-04

Similar Documents

Publication Publication Date Title
JPH04171500A (ja) 音声パラメータ符号化方法
JP3151874B2 (ja) 音声パラメータ符号化方式および装置
US5208862A (en) Speech coder
US5271089A (en) Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
JP3196595B2 (ja) 音声符号化装置
JP3143956B2 (ja) 音声パラメータ符号化方式
KR100194775B1 (ko) 벡터양자화장치
CZ304212B6 (cs) Způsob kódování a dekódování akustického parametru, kódovací a dekódovací zařízení akustického parametru, a program pro provedení způsobu kódování a dekódování akustického parametru
JP2800618B2 (ja) 音声パラメータ符号化方式
JP3089769B2 (ja) 音声符号化装置
US7680669B2 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JP2624130B2 (ja) 音声符号化方式
EP0483882B1 (en) Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits
JP2003345392A (ja) 分割型スケーリング因子を用いたスペクトル包絡パラメータのベクトル量子化器
JP3194930B2 (ja) 音声符号化装置
JP3256215B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3192051B2 (ja) 音声符号化装置
JP3144194B2 (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
EP0755047B1 (en) Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
Ozaydin et al. A 1200 bps speech coder with LSF matrix quantization
JP2002221998A (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音声符号化、復号化方法、装置及びプログラム
JP3428595B2 (ja) 音声符号化方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080929

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080929

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090929

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090929

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100929

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110929

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110929

Year of fee payment: 11