JPH04171500A - 音声パラメータ符号化方法 - Google Patents
音声パラメータ符号化方法Info
- Publication number
- JPH04171500A JPH04171500A JP2297600A JP29760090A JPH04171500A JP H04171500 A JPH04171500 A JP H04171500A JP 2297600 A JP2297600 A JP 2297600A JP 29760090 A JP29760090 A JP 29760090A JP H04171500 A JPH04171500 A JP H04171500A
- Authority
- JP
- Japan
- Prior art keywords
- distortion
- vector
- quantization
- codebook
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims abstract description 159
- 238000013139 quantization Methods 0.000 claims abstract description 81
- 230000001186 cumulative effect Effects 0.000 claims description 38
- 230000003595 spectral effect Effects 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 34
- 230000005236 sound signal Effects 0.000 claims description 30
- 230000003247 decreasing effect Effects 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 abstract description 8
- 238000004364 calculation method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000007774 longterm Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101100379080 Emericella variicolor andB gene Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- WBWWGRHZICKQGZ-HZAMXZRMSA-M taurocholate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 WBWWGRHZICKQGZ-HZAMXZRMSA-M 0.000 description 1
- 239000002966 varnish Substances 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
め要約のデータは記録されません。
Description
以下で高品質に符号化する音声符号化方式に供するだめ
の音声パラメータ符号化方弐乙こ関する。
化する方式としては、例えば、M、5chroeder
andB、Ata1氏によるIICode−exci
ted 1inear prediction: )l
igh quality 5peech at ver
y low bit rates″(Proc、 Ic
As5P、 pp、937−940.1985年)と題
した論文(文献l)や、Kleijn氏らによる’ I
mprovedspeech quality and
efficient vector quantiz
ation in 5ELP″(Proc、 TCAS
SP、 pp、155−158.1988年)と題した
論文(文献2)等に記載されているCELP(Code
Excited LPCCoding)が知られてい
る。
5 )に音声信号から音声信号のスペクトル特性を表す
スペクトルパラメータを抽出し、フレームをさらに小区
間サブフレーム(例えば5m5)乙二分制し、サブフレ
ーム毎に過去の音源信号をもとに長時間相関(ピッチ相
関)を表すピッチパラメータを抽出し、ビソチパラメ・
−夕により前記サブフレームの音声信号を長期予測し、
長期予測して求めた残差信号に対して、予め定められた
種類の雑音信号からなるコードブックから選択した信号
により合成した信号と、前記音声信号との誤差電力を最
小化するように一種類の雑音信号を選択するとともに、
最適なゲインを計算する。そして選択された雑音信号の
種類を表すインデクスとゲイン、ならびに、前記スペク
トルパラメータとピッチパラメータを伝送する。
、音源信号のみならずスペクトルパラメータの効率的な
量子化法が重要である。
てLPG分析により求めたLPGパラメータを量子化す
るが、通常スカラ量子化が用いられており、10次のL
PG係数を量子化するのにフレーム当り34ビツト(1
,7kb/s)程度のビット数が必要であり、ビット数
をさらに低減すると音質が低下していた。
として、Moriya氏らによる”Transform
coding of 5peech using a
weighted vector quantize
r、”と題した論文(JEEE J、Se1. Are
as、 Commun、。
載されたベクトルースカラ量子化法などがIgされてい
るが、27〜30ビット程度のビット数が必要であり、
−層効率的な方法が必要であった。
、スペクトルの時間的変化を良好に表すことが困難とな
り、音質が劣化していた。
パラメータを従来よりもより少ないビ・7ト数で量子化
可能な音声パラメータ符号化方式を提供することにある
。
入力し前記音声信号を予め定められた時間長のフレーム
に分割し、前記フレーム毎に前記音声信号のスペクトル
パラメータを求め、予め構成したベクトル量子化コード
ブックを予め定められた段数だけ継続接続し、前段のコ
ードブソりの誤差信号を次段のコードブックでベクトル
量子化し、初段から予め定められた段数まで量子化歪の
小さい順に複数種類の候補を出力し、前記候補の組に対
して全段における累積歪あるいは最終段における歪を計
算し、前記累積歪あるいは前記歪を最小化するコードブ
ックの組を出力することにより前記スペクトルパラメー
タを量子化することを特徴とする。
音声信号をフレームに分割し、さらにフレームよりも短
いサブフレームに分割し、前記フレームあるいは少なく
とも一つのサブフレームについて前記音声信号に対して
スペクトルパラメータを求め、予め構成したベクトル量
子化コードブックを予め定められた段数だけ縦続接続し
て、前段のコードブックの誤差信号を次段のコードブッ
クでベクトル量子化し、初段から予め定められた段数ま
で量子化歪の小さい順に複数種類の候補を出力し、前記
候補の組に対して全段における累積歪あるいは最終段に
おける歪を計算し、予め定められたサブフレームに対し
て前記候補と予め構成した係数コードブ・ツクを用いて
前記サブフレームのスペクトルパラメータを量子化して
量子化歪を求め、前記累積歪あるいは前記歪と前記量子
化歪との和を最小化するコードベクトルの組を出力する
ことにより前記スペクトルパラメータを量子化すること
を特徴とする。
音声信号をフレームに分割し、さらにフレームよりも短
いサブフレームに分割し、前記フレームあるいは少なく
とも一つのサブフレームについて前記音声信号に対して
スペクトルパラメータを求め、予め構成したベクトル量
子化コードブックを予め定められた段数だけ縦続接続し
て、前段のコードブックの誤差信号を次段のコードブッ
クでベクトル量子化し、初段から予め定められた段数ま
で量子化歪の小さい順に複数種類の候補を出力し、前記
候補の組に対して全段における累積歪あるいは最終段に
おける歪を計算し、前記累積歪あるいは前記歪を最小化
するコードベクトルの組を求めて出力し、予め定められ
たサブフレームに対して前記コードベクトルの組と予め
構成した係数コードブックを用いて前記サブフレームの
スペクトルパラメータを量子化して量子化歪を求め前記
量子化歪を最小化する係数コードベクトルを出力するこ
とにより前記スペクトルパラメータを量子化することを
特徴とする。
Pパラメータを用い、LSPのベクトル量子化の段数は
3とし、候補数はMとする。
装置の構成を示すブロック図である。図において、フレ
ーム毎の音声信号から計算されたスペクトルパラメータ
をLPG分析回路5oに入力する。スペクトルパラメー
タの分析には周知の線形予測(LPG)分析法を用いる
ことができる。また、スペクトルパラメータとしては線
形予測(LPG)パラメータを用いる。ここでLPGパ
ラメータとしては種々のものが知られているが、ここで
は線スペクトル対(LSP)パラメータを用いて説明を
行う。
antizer design in LSP 5pe
ech analysis−synthesis、”と
題した論文(IEEE J、Se1. Areas C
ommun、、 pp。
る。
(図示せず)を用いて、入力したLSPパラメータをベ
クトル量子化する。第1のコードブックは、トレーニン
グ用の多量のLSPパラメータ系列を用いて予め学習し
て構成する。学習の方法は、例えばLinde、 Bu
zo、 Gray氏による”An algorithm
for vector quantization
design″と題した論文(文献5)等を参照できる
。ここで第1のベクトル量子化器100では、ベクトル
量子化歪の小さい順に予め定められた個数Mのコードベ
クトルの候補を求め、各候補について歪を求める。コー
ドベクトルを探索するときの歪尺度は、種々のものが知
られているが、ここではLSPの2乗距離を用いる。L
SPの2乗距離は下式で与えられる。
を示す。
コードベクトルであり、j=1〜2B(Bはコードブッ
クのピント数)である。
たM種の候補の各々に対して、入力したLSP係数との
誤差信号を求め出力する。
々に対して、第2のコードブ・ツク(図示せス)ヲ用イ
て(2)弐に従いコードベクトルを探索して、歪の小さ
い順に、予め定められた個数のコードベクトル候補を出
力する。
る減算器120の出力である誤差信号であり、k=1〜
Mである。
のベクトル量子化器160は第2のベクトル量子化器1
30と同一の動作を行う。さらに累積歪計算部180に
おいて、全段における歪の計算値D□を下式により計算
し、候補のうち、累積歪を最小化するコードベクトルの
組合せをスペクトルパラメータの量子化値として出力す
る。
ル量子化歪((2)式においてN=3とおいて得られる
D3k)を各候補毎に求め、候補のうちこれを最小化す
るコードベクトルの組合せをスペクトルパラメータの量
子化値として出力するようにしてもよい。
おいて第1図と同一の番号を付した構成要素は第1図と
同一の動作を行うので、説明は省略する。音声信号をフ
レーム毎に分割した後に、さらにフレームよりも短いサ
ブフレームに分割する。−例としてフレーム長1サブフ
レーム長はそれぞれ20m5. 5 msとする。LP
C分析回路50でサブフレーム毎に音声信号からLPG
分析を行い、LSPパラメータを求める。フレーム内の
LSPパラメータかあるいは、フレーム内の予め定めら
れた位置のサブフレーム(例えば3番目)におけるLS
Pパラメータを第1のベクトル量子化器100に入力す
る。また、予め定められた近隣サブフレーム(例えば2
,4番目)におけるLSPパラメータを予測ベクトル量
子化部200へ入力する。
器160まで求めたコードベクトルの候補をもとに、予
め学習して構成した予測ベクトルコードブックを用いて
、近隣サブフレームのLSP系列を予測し、次式により
、予測による量子化歪を計算する。
トル量子化器160までで求めたに番目の候補ベクトル
である。Ar(i)は予測ベクトル量子化器・ツクの有
する1番目のコードベクトルである。予測ベクトル量子
化部200は、さらに累積歪と予測による量子化歪の和
りを次式により求め、Dを最小化するコードベクトルと
予測ベクトルの組合せを求め、これらをサブフレームに
おけるスペクトルパラメータの量子化値として出力する
。
(5)以上の処理をサブフレーム毎に繰り返し
、サブフレーム毎にLSP係数を量子化する。
のように予測係数コードブ・ツクを用いる他に、補間係
数コードブックを用いる方法も考えられる。
のLSP係数からの直線補間で表されるとし、補間係数
BLを予め計算し補間係数コードブ・ツクに格納してお
く。この方法では、予測ベクトルコードブックの代わり
に補間係数コードブックをもつ。
−b+ (LSP′ト’(i)−LSP’kL(i))
”、 2・ ・ ・(6) ただシk = 1〜M、 l = 1〜211B、
LSP’1=L(i)は現フレームの1番目のLSP係
数のベクトル量子化におけるに番目の候補、LSP’し
1(i)は1フレーム過去のLSPのベクトル量子化値
である。補間係数コードブックの作成は、トレーニング
信号に対してサブフレーム毎に(7)式を最小化するよ
うに補間係数すを求め、 〜b (LSP”’ (i) LSP’kL(i)
) ]”・・・(7) これをクラスタリングしてコードブックを作成する。ク
ラスタリングの具体的な方法は前記文献5を参照できる
。
の和りを(7)弐に従い計算し、これを最小化するコー
ドベクトルと補間係数コードブクトルの組合せを選択し
、サブフレーム毎にLSP係数を量子化して出力する。
)以上で第2の発明の詳細な説明を終える。
あるいはフレーム内の予め定められた位置のサブフレー
ム(例えば3番目)におけるLSPパラメータをベクト
ル量子化器に入力し、各段において、ベクトル量子化歪
の小さい順に予め定められた個数Mのコードベクトルの
候補を求め、歪を計算する。そして全段における累積歪
または、最終段におけるベクトル量子化歪を最小にする
候補の組を求め出力する。
て、前記(3)あるいは(5)式により、近隣サブフレ
ーム(例えば2.4番目)におけるLSPパラメータを
予測ベクトル量子化あるいは補間ベクトル量子化して出
力する。
実施する音声パラメータ符号化装置を示すフ゛口・ンク
図である。
フレ一ム分(例えば20m5)の音声信号をハソファメ
モリ410に格納スる。
トル特性を表すパラメータとして、LSPパラメータを
前記フレームの音声信号から周知のLPG分析を行い、
予め定められた次数したけ計算する。
とができる。
ラメータを予め定められた量子化ビット数で量子化し、
得た符号1.を出力端子450から出力する。以下で一
例として、LSP量子化回路では3段のベクトル量子化
器を用いるものとする。
図である。図において、入力端子500がらフレームの
LSPパラメータを入力する。第1のベクトル量子化器
505は、第1のコードブック510からコードベクト
ルLSP’ J(i)を読み出し、(2)式に従いベク
トル量子化歪を計算し、ベクトル量子化歪の小さい順に
予め定められた個数Mのコードベクトルの候補を求め、
各候補について歪を求め累積歪計算回路520へ出力す
る。コードベクトルを探索するときの歪尺度は、以下で
はLSPの2乗距離を用いる。減算器511は、第1の
ベクトル量子化器505で求めたM種の候補の各々に対
して、入力したLSP係数との誤差信号を求め出力する
。
々に対して、第2のコードブック516を用いて(2)
式に従いコードベクトルを探索して、歪の小さい順に予
め定められた個数のコードベクトルを候補として出力し
、そのときの歪を累積歪計算回路520へ出力する。
3のベクトル量子化器525は第3のコードブック52
6を用いて第2のベクトル量子化器515と同一の動作
を行う。
候補ヘクトルを木状に並べる。ここで1段目から2段目
におけるコード−・クトルの候補数をそれぞれM、、M
2とする。次に各パス毎に歪の全段における累積値I)
axを(3)弐により計算し、累積歪を最小化するパス
(コードベクトルの組合せ)をスペクトルパラメータの
量子化値として決定し、選択されたパスの各段のコード
ベクトルを示すインデクスを出力端子535を通し出力
する。
施する音声パラメータ符号化装置を示すブロック図であ
る。図において第3図と同一の番号を付した構成要素は
、第3図と同一の動作を行うので説明は省略する。図に
おいて、サブフレーム公開回路600は、フレームに分
割された音声信号をフレームよりも短いサブフレーム(
例えば5m5)に分割し、LPG分析回路605に出力
する。
表すパラメータとして、LSPパラメータを前記フレー
ムの音声信号、及び、予め定められた位置のサブフレー
ムの音声信号から、周知のLPG分析を行い予め定めら
れた次数りだけ計算し、フレーム及びサブフレームで求
めたLSP係数をLSP量子化回路610へ出力する。
Pパラメータを予め定められた量子化ビット数でベクト
ル量子化し、ベクトル量子化歪の小さい順に予め定めら
れた個数の候補数だけコードベクトルを選択して格納す
る。さらに、この候補ベク)・ルを用いてサブフレーム
のLSP係数を予測あるいは補間ベクトル量子化する。
ムのLSP係数の量子化に3段のベクトル量子化器を用
い、サブフレームのLSP係数の量子化には予測ヘクF
−ル量子化を用いるものとする。
図である。図C二おいて、入力端子620からフレーム
のLSPパラメータを入力し、第1のベクトル量子化器
505は、第1のコードブック510からコードベクト
ルLSP’=(i)を読み出し、(2)式に従いベクト
ル量子化歪を計算し、ヘクトル量子化歪の小さい順に予
め定められた個数Mのコードベクトルの候補を求め予測
ベクトル量子化回路635へ出力し、各候補について歪
を求め累積歪計算回路640へ出力する。コードベクト
ルを探索するときの歪尺度は、以下ではLSPの2乗距
離を用いる。
たM種の候補の各々に対して、入力したLSP係数との
誤差信号を求め出力する。
々に対して、第2のコードブック516を用いて(2)
弐に従いコードベクトルを探索して歪の小さい順に予め
定められた個伜のコードベクトルを候補として予測ベク
トル量子化回路635へ出力し、そのときの歪を累積歪
計算回路640へ出力する。
3のベクトル量子化器525は第3のコードブック52
6を用いて第2のベクトル量子化器515と同一の動作
を行う。
数をベクトル量子化じたときの候補ベクトルを入力し、
各段の候補を第5図に示すように本状に並べる。ここで
1段目から2段目におけるコードベクトルの候補数をそ
れぞれM 1. M 2 とする。
スに対して下式に従い、復号化LSP係数を計算する。
bz(i)+LSP’13(i)・・・(9) ここでkl、 k2. k3はそれぞれ1,2.3段目
のベクトル量子化器において選択されたコードベクトル
のインデクスを示し、k=1〜M1ak3=1である。
ードブ、り636から予測係数を読み出し、(9)弐の
復号化LSPを用いてサブフレームのLSPを予測し、
(3)弐に基づき予測歪D PLを各候補毎に求め、累
積歪計算回路640−・出力する。
歪D A)Fと予測ベクトル量子化による予測歪DPI
の加算歪りを(5)弐により求め、Dを最小化するよう
な第5図のパスと予測コードベクトルの組合せを求め、
これらを表す各コードベクトルのインデクスを、LSP
の量子化値として、出力端子650を通して出力する。
る。図において、第1図、第2図と同一の番号を記した
構成要素は、第1図、第2図と同一の動作を行うので、
説明は省略する。
図である。累積歪計算回路735は、第5図に示すよう
に、各段の候補ベクトルを木状に並べる。
数をそれぞれM、、M2.M、とする。次に各パス毎に
、ベクトル量子化歪の全段における累積値DAKを(3
)式により計算し、累積歪を最小化するパス(コードベ
クトルの組合せ)をスペクトルパラメータの量子化値と
して決定し、予測ベクトル量子化器740に出力する。
メモリ750へ出力する。
スに対して(8)弐に従い、復号化LSP係数を計算す
る。
ードブンク745から予測係数を読み出し、(8)式の
復号化LSPを用いてサブフレームのLSPを予測し、
(3)式に基づき予測歪D PLを復号化LSPの各候
補毎に求め、予測歪を最小化する予測コードベクトルの
インデクスをバッファメモリ750へ出力する。
たコードベクトルを表すインデクスと、サブフレームの
LSPの選択された予測コードベクトルを表すインデク
スを出力端子755を通して出力する。
である。
ラメータを用いたが、他の周知なパラメータ、例えばP
ARCOR,LAR,ケプストラムなどを用いることも
できる。
外の他の周知な距離尺度を用いることができる。例えば
、聴感重み付け2乗距離などが知られており、これをケ
プストラム係数上で行う方法としては誉田氏による“重
みつき対数スペクトル歪尺度を用いたLPGパラメータ
のベクトル量子化、”と題した論文(音響学会講演論文
集、 pp、195−1.96゜1990年10月)(
文献6)を参照することができる。
ームのLSP係数のベクトル量子化には3段のベクトル
量子化器を用いたが、これは任意の段数のベクトル量子
化器を用いることができる。
M 2個の候補を求めたが、このようにすると3段目
の候補の個数はM、・M2となり候補数が指数的に増大
する。そこで、2段目以降のベクトル量子化では、各段
毎に累積歪を求め、累積歪の小さい順に各段毎に予め定
められた一定の候補数(例えばM種)で技がりを行うこ
とにより、つねに各段の候補数はMとなり、候補数が指
数的に増大するのを防ぐようにすることもできる。この
ようにすると、実施例の方式に比べ、全候補数を低減す
ることができ、演算量を低減することができるが、性能
は若干低下する。
るのではなく、予め定められた段数のベクトル量子化器
のみ複数種の候補を求めて出力するようにしてもよい。
わりに、最終段でのベクトル量子化歪を用いることもで
きる。
の周知な配置法、例えばトレリス配置などを用いること
もできる。
、例えば、ダイナミックプログラミング法、ビタービ計
算法などを用いることもできる。
4(7)LSPについては予測ベクトル量子化を行った
が、作用の項で説明したように補間ベクトル量子化を用
いることもできる。また、フレームのLSPではなく予
め定められた位置のサブフレームのLSPを多段ベクト
ル量子化してもよい。
は補間係数コードブックを作成するのではなく、複数サ
ブフレームをまとめてフードブックを作成する、マトリ
クスコードブックを用いるようにしてもよい。マトリク
スコードブ・ツクの作成法は例えば、C,Tsao氏ら
にょる’Matrix quantizer desi
gn for LPC5peech usingthe
generalized Lloyd algori
thm、”と題した論文(IEEE Trans、 A
SSP、 pp、537−545.1985年)(文献
7)を参照できる。マトリクスコードブックを用いる構
成によれば、複数サブフレームをまとめてコードベクト
ルで表現することになるので、予測あるいは補間係数コ
ードベクトル伝送に必要なピント数を低減することがで
きる。
子化器を用いたが、コードベクトルの探索!:要する演
算量を低減するために、木探索1格子型あるいは他の周
知な構成のベクトル量子化器を用いることもできる。こ
れらの演算量低減化法の詳細については、例えばR,G
ray氏による”Vector quantizati
on+” と題した論文(IEEE ASSP Mag
azine、 pp、4−29.1984年)(文献8
)等を参照できる。
性を表すスペクトルパラメータを量子化するときに、ベ
クトル量子化器を複数段縦続接続するとともに、初段か
ら予め定められた段まで複数種類の候補とそのときの量
子化歪を求め、全段における累積歪か最終段における歪
を最小化する候補の組合せを量子化値として選択してい
るので、少ないビット数でも比較的少ない演算量で、性
能のよい量子化器を提供することができるという効果が
ある。
ブフレームのスペクトルパラメータを、フレームでベク
トル量子化した値を用いて、予測あるいは補間係数コー
ドブックを用いて効率的に量子化しているので、少ない
ビット数でも良好ニスベクトルの時間的変化を表すこと
ができるという効果がある。
作用を示すブロック図、 第2図は第2の発明による音声パラメータ符号化方式の
作用を示すブロック図、 第3図は第1の発明による音声パラメータ符号化方式を
実施する符号化装置を示すブロック図、第4図はLSP
量子化回路440の構成を示すブロック図、 第5図は各段のベクトル量子化器の候補を本状に配置し
た例を示す図、 第6図は第2の発明を実施する符号化装置を示すブロッ
ク図、 第7図はLSP量子化回路610の構成を示すブロック
図、 第8図は第3の発明を実施する符号化装置を示すブロッ
ク図、 第9図はLSP量子化回路730の構成を示すブロック
図である。 50、430.605・・・LPG分析回路100、5
05・・・第1のベクトル量子化回路120、150.
511.521・・・減算器130、515・・・第2
のベクトル量子化回路160、525・・・第3のベク
トル量子化回路200、635・・・予測ベクトル量子
化回路180、210.520.640.735・・・
累積歪計算回路 410、750・・・バッファメモリ 440、610.730 − ・−LSP量子化回路6
00 ・・・・・サブフレーム分割回路510 ・
・・・・第1のコードブック516 ・・・・・第2
のコードブック526 ・・・・・第3のコードブッ
ク636、745・・・予測係数コードブック代理人
弁理士 岩 佐 義 幸 第1図 第2図 ■ ■ ■ Ml、 M2 第5図 第6図 第7図
Claims (3)
- (1)音声信号を入力し前記音声信号を予め定められた
時間長のフレームに分割し、前記フレーム毎に前記音声
信号のスペクトルパラメータを求め、予め構成したベク
トル量子化コードブックを予め定められた段数だけ継続
接続し、前段のコードブックの誤差信号を次段のコード
ブックでベクトル量子化し、初段から予め定められた段
数まで量子化歪の小さい順に複数種類の候補を出力し、
前記候補の組に対して全段における累積歪あるいは最終
段における歪を計算し、前記累積歪あるいは前記歪を最
小化するコードブックの組を出力することにより前記ス
ペクトルパラメータを量子化することを特徴とする音声
パラメータ符号化方式。 - (2)入力した音声信号をフレームに分割し、さらにフ
レームよりも短いサブフレームに分割し、前記フレーム
あるいは少なくとも一つのサブフレームについて前記音
声信号に対してスペクトルパラメータを求め、予め構成
したベクトル量子化コードブックを予め定められた段数
だけ縦続接続して、前段のコードブックの誤差信号を次
段のコードブックでベクトル量子化し、初段から予め定
められた段数まで量子化歪の小さい順に複数種類の候補
を出力し、前記候補の組に対して全段における累積歪あ
るいは最終段における歪を計算し、予め定められたサブ
フレームに対して前記候補と予め構成した係数コードブ
ックを用いて前記サブフレームのスペクトルパラメータ
を量子化して量子化歪を求め、前記累積歪あるいは前記
歪と前記量子化歪との和を最小化するコードベクトルの
組を出力することにより前記スペクトルパラメータを量
子化することを特徴とする音声パラメータ符号化方式。 - (3)入力した音声信号をフレームに分割し、さらにフ
レームよりも短いサブフレームに分割し、前記フレーム
あるいは少なくとも一つのサブフレームについて前記音
声信号に対してスペクトルパラメータを求め、予め構成
したベクトル量子化コードブックを予め定められた段数
だけ縦続接続して、前段のコードブックの誤差信号を次
段のコードブックでベクトル量子化し、初段から予め定
められた段数まで量子化歪の小さい順に複数種類の候補
を出力し、前記候補の組に対して全段における累積歪あ
るいは最終段における歪を計算し、前記累積歪あるいは
前記歪を最小化するコードベクトルの組を求めて出力し
、予め定められたサブフレームに対して前記コードベク
トルの組と予め構成した係数コードブックを用いて前記
サブフレームのスペクトルパラメータを量子化して量子
化歪を求め前記量子化歪を最小化する係数コードベクト
ルを出力することにより前記スペクトルパラメータを量
子化することを特徴とする音声パラメータ符号化方式。
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02297600A JP3114197B2 (ja) | 1990-11-02 | 1990-11-02 | 音声パラメータ符号化方法 |
CA002054849A CA2054849C (en) | 1990-11-02 | 1991-11-01 | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits |
EP96115033A EP0755047B1 (en) | 1990-11-02 | 1991-11-04 | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits |
EP91118741A EP0483882B1 (en) | 1990-11-02 | 1991-11-04 | Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits |
DE69131339T DE69131339T2 (de) | 1990-11-02 | 1991-11-04 | Verfahren zur Kodierung von Sprachparametern, das die Spektrumparameterübertragung mit einer verringerten Bitanzahl ermöglicht |
EP96115034A EP0753841B1 (en) | 1990-11-02 | 1991-11-04 | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits |
US07/787,596 US5271089A (en) | 1990-11-02 | 1991-11-04 | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits |
DE69132986T DE69132986T2 (de) | 1990-11-02 | 1991-11-04 | Verfahren zur Kodierung eines Sprachparameters mittels Übertragung eines spektralen Parameters mit verringerter Datenrate |
DE69132987T DE69132987T2 (de) | 1990-11-02 | 1991-11-04 | Verfahren zur Kodierung eines Sprachparameters mittels Übertragung eines spektralen Parameters mit verringerter Datenrate |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02297600A JP3114197B2 (ja) | 1990-11-02 | 1990-11-02 | 音声パラメータ符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04171500A true JPH04171500A (ja) | 1992-06-18 |
JP3114197B2 JP3114197B2 (ja) | 2000-12-04 |
Family
ID=17848662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02297600A Expired - Lifetime JP3114197B2 (ja) | 1990-11-02 | 1990-11-02 | 音声パラメータ符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3114197B2 (ja) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0744200A (ja) * | 1993-07-29 | 1995-02-14 | Nec Corp | 音声符号化方式 |
EP0696026A2 (en) | 1994-08-02 | 1996-02-07 | Nec Corporation | Speech coding device |
JPH08195722A (ja) * | 1995-01-17 | 1996-07-30 | Nec Corp | スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置 |
EP0756268A2 (en) | 1995-07-27 | 1997-01-29 | Nec Corporation | Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits |
EP0778561A2 (en) | 1995-12-06 | 1997-06-11 | Nec Corporation | Speech coding device |
US5774840A (en) * | 1994-08-11 | 1998-06-30 | Nec Corporation | Speech coder using a non-uniform pulse type sparse excitation codebook |
US5787389A (en) * | 1995-01-17 | 1998-07-28 | Nec Corporation | Speech encoder with features extracted from current and previous frames |
US5826226A (en) * | 1995-09-27 | 1998-10-20 | Nec Corporation | Speech coding apparatus having amplitude information set to correspond with position information |
US5832180A (en) * | 1995-02-23 | 1998-11-03 | Nec Corporation | Determination of gain for pitch period in coding of speech signal |
WO1998052188A1 (fr) * | 1997-05-15 | 1998-11-19 | Matsushita Electric Industrial Co., Ltd. | Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio |
US5857168A (en) * | 1996-04-12 | 1999-01-05 | Nec Corporation | Method and apparatus for coding signal while adaptively allocating number of pulses |
US5873060A (en) * | 1996-05-27 | 1999-02-16 | Nec Corporation | Signal coder for wide-band signals |
US5884252A (en) * | 1995-05-31 | 1999-03-16 | Nec Corporation | Method of and apparatus for coding speech signal |
US5902244A (en) * | 1997-02-05 | 1999-05-11 | Olympus Optical Co., Ltd. | Ultrasonic diagnosis apparatus including simple digital scan converter |
US5963896A (en) * | 1996-08-26 | 1999-10-05 | Nec Corporation | Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses |
US6009388A (en) * | 1996-12-18 | 1999-12-28 | Nec Corporation | High quality speech code and coding method |
US6192334B1 (en) | 1997-04-04 | 2001-02-20 | Nec Corporation | Audio encoding apparatus and audio decoding apparatus for encoding in multiple stages a multi-pulse signal |
US6208957B1 (en) | 1997-07-11 | 2001-03-27 | Nec Corporation | Voice coding and decoding system |
US6581031B1 (en) | 1998-11-27 | 2003-06-17 | Nec Corporation | Speech encoding method and speech encoding system |
US6826526B1 (en) | 1996-07-01 | 2004-11-30 | Matsushita Electric Industrial Co., Ltd. | Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization |
US6856955B1 (en) | 1998-07-13 | 2005-02-15 | Nec Corporation | Voice encoding/decoding device |
US6904404B1 (en) | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
US6973424B1 (en) | 1998-06-30 | 2005-12-06 | Nec Corporation | Voice coder |
US6978235B1 (en) | 1998-05-11 | 2005-12-20 | Nec Corporation | Speech coding apparatus and speech decoding apparatus |
US7680669B2 (en) | 2001-03-07 | 2010-03-16 | Nec Corporation | Sound encoding apparatus and method, and sound decoding apparatus and method |
JP4764956B1 (ja) * | 2011-02-08 | 2011-09-07 | パナソニック株式会社 | 音声符号化装置及び音声符号化方法 |
WO2012035781A1 (ja) * | 2010-09-17 | 2012-03-22 | パナソニック株式会社 | 量子化装置及び量子化方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3861400B2 (ja) | 1997-09-01 | 2006-12-20 | セイコーエプソン株式会社 | 電界発光素子およびその製造方法 |
CN101027799B (zh) | 2004-09-24 | 2010-06-16 | 株式会社半导体能源研究所 | 发光器件 |
KR101426717B1 (ko) | 2006-12-04 | 2014-08-06 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치 및 전자 기기 |
-
1990
- 1990-11-02 JP JP02297600A patent/JP3114197B2/ja not_active Expired - Lifetime
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0744200A (ja) * | 1993-07-29 | 1995-02-14 | Nec Corp | 音声符号化方式 |
EP0696026A2 (en) | 1994-08-02 | 1996-02-07 | Nec Corporation | Speech coding device |
US5778334A (en) * | 1994-08-02 | 1998-07-07 | Nec Corporation | Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion |
US5774840A (en) * | 1994-08-11 | 1998-06-30 | Nec Corporation | Speech coder using a non-uniform pulse type sparse excitation codebook |
JPH08195722A (ja) * | 1995-01-17 | 1996-07-30 | Nec Corp | スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置 |
US5787389A (en) * | 1995-01-17 | 1998-07-28 | Nec Corporation | Speech encoder with features extracted from current and previous frames |
US5832180A (en) * | 1995-02-23 | 1998-11-03 | Nec Corporation | Determination of gain for pitch period in coding of speech signal |
US5884252A (en) * | 1995-05-31 | 1999-03-16 | Nec Corporation | Method of and apparatus for coding speech signal |
EP0756268A2 (en) | 1995-07-27 | 1997-01-29 | Nec Corporation | Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits |
US6006178A (en) * | 1995-07-27 | 1999-12-21 | Nec Corporation | Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits |
US5826226A (en) * | 1995-09-27 | 1998-10-20 | Nec Corporation | Speech coding apparatus having amplitude information set to correspond with position information |
EP0778561A2 (en) | 1995-12-06 | 1997-06-11 | Nec Corporation | Speech coding device |
US5857168A (en) * | 1996-04-12 | 1999-01-05 | Nec Corporation | Method and apparatus for coding signal while adaptively allocating number of pulses |
US5873060A (en) * | 1996-05-27 | 1999-02-16 | Nec Corporation | Signal coder for wide-band signals |
US6826526B1 (en) | 1996-07-01 | 2004-11-30 | Matsushita Electric Industrial Co., Ltd. | Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization |
US6904404B1 (en) | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
US7243061B2 (en) | 1996-07-01 | 2007-07-10 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having a plurality of frequency bands |
US5963896A (en) * | 1996-08-26 | 1999-10-05 | Nec Corporation | Speech coder including an excitation quantizer for retrieving positions of amplitude pulses using spectral parameters and different gains for groups of the pulses |
US6009388A (en) * | 1996-12-18 | 1999-12-28 | Nec Corporation | High quality speech code and coding method |
US5902244A (en) * | 1997-02-05 | 1999-05-11 | Olympus Optical Co., Ltd. | Ultrasonic diagnosis apparatus including simple digital scan converter |
US6192334B1 (en) | 1997-04-04 | 2001-02-20 | Nec Corporation | Audio encoding apparatus and audio decoding apparatus for encoding in multiple stages a multi-pulse signal |
WO1998052188A1 (fr) * | 1997-05-15 | 1998-11-19 | Matsushita Electric Industrial Co., Ltd. | Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio |
US6208957B1 (en) | 1997-07-11 | 2001-03-27 | Nec Corporation | Voice coding and decoding system |
US6978235B1 (en) | 1998-05-11 | 2005-12-20 | Nec Corporation | Speech coding apparatus and speech decoding apparatus |
US6973424B1 (en) | 1998-06-30 | 2005-12-06 | Nec Corporation | Voice coder |
US6856955B1 (en) | 1998-07-13 | 2005-02-15 | Nec Corporation | Voice encoding/decoding device |
US6581031B1 (en) | 1998-11-27 | 2003-06-17 | Nec Corporation | Speech encoding method and speech encoding system |
US7680669B2 (en) | 2001-03-07 | 2010-03-16 | Nec Corporation | Sound encoding apparatus and method, and sound decoding apparatus and method |
WO2012035781A1 (ja) * | 2010-09-17 | 2012-03-22 | パナソニック株式会社 | 量子化装置及び量子化方法 |
US20130173263A1 (en) * | 2010-09-17 | 2013-07-04 | Panasonic Corporation | Quantization device and quantization method |
JP5687706B2 (ja) * | 2010-09-17 | 2015-03-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 量子化装置及び量子化方法 |
US9135919B2 (en) | 2010-09-17 | 2015-09-15 | Panasonic Intellectual Property Corporation Of America | Quantization device and quantization method |
JP4764956B1 (ja) * | 2011-02-08 | 2011-09-07 | パナソニック株式会社 | 音声符号化装置及び音声符号化方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3114197B2 (ja) | 2000-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH04171500A (ja) | 音声パラメータ符号化方法 | |
JP3151874B2 (ja) | 音声パラメータ符号化方式および装置 | |
US5208862A (en) | Speech coder | |
US5271089A (en) | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits | |
JP3196595B2 (ja) | 音声符号化装置 | |
JP3143956B2 (ja) | 音声パラメータ符号化方式 | |
KR100194775B1 (ko) | 벡터양자화장치 | |
CZ304212B6 (cs) | Způsob kódování a dekódování akustického parametru, kódovací a dekódovací zařízení akustického parametru, a program pro provedení způsobu kódování a dekódování akustického parametru | |
JP2800618B2 (ja) | 音声パラメータ符号化方式 | |
JP3089769B2 (ja) | 音声符号化装置 | |
US7680669B2 (en) | Sound encoding apparatus and method, and sound decoding apparatus and method | |
JP2624130B2 (ja) | 音声符号化方式 | |
EP0483882B1 (en) | Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits | |
JP2003345392A (ja) | 分割型スケーリング因子を用いたスペクトル包絡パラメータのベクトル量子化器 | |
JP3194930B2 (ja) | 音声符号化装置 | |
JP3256215B2 (ja) | 音声符号化装置 | |
JP3153075B2 (ja) | 音声符号化装置 | |
JP3252285B2 (ja) | 音声帯域信号符号化方法 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3144194B2 (ja) | 音声符号化装置 | |
JP3024467B2 (ja) | 音声符号化装置 | |
EP0755047B1 (en) | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits | |
Ozaydin et al. | A 1200 bps speech coder with LSF matrix quantization | |
JP2002221998A (ja) | 音響パラメータ符号化、復号化方法、装置及びプログラム、音声符号化、復号化方法、装置及びプログラム | |
JP3428595B2 (ja) | 音声符号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080929 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080929 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090929 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090929 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100929 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110929 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110929 Year of fee payment: 11 |