JPH05165499A - Lsp係数の量子化方法 - Google Patents
Lsp係数の量子化方法Info
- Publication number
- JPH05165499A JPH05165499A JP3335010A JP33501091A JPH05165499A JP H05165499 A JPH05165499 A JP H05165499A JP 3335010 A JP3335010 A JP 3335010A JP 33501091 A JP33501091 A JP 33501091A JP H05165499 A JPH05165499 A JP H05165499A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- quantization
- stage
- lsp
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
であり、初段の量子化テーブル11は予め定められたベ
クトルを蓄積している固定部11bと置き換え可能にベ
クトルを蓄積する可変部11aとから構成される。ま
た、各フレームの量子化終了後、可変部の最も古いベク
トルを、前フレームで決定された合成ベクトルで置き換
える。LSP係数にはフレーム間の相関があるので、固
定ベクトルの数が少なくても、量子化歪みが小さくな
る。
Description
化方式に関するものであり、特にそこでの線スペクトル
対の量子化方法に関するものである。
としては、線形予測係数、反射係数などがあるが、中で
も、板倉等によって提案された線スペクトル対(以下L
SP係数)は、量子化に対して比較的歪みが少ないこ
と、補間特性が良いこと、及び安定性の判別が容易なこ
となどの長所をもっている。そのためLSP係数は、音
声の高能率圧縮符号化技術に関する分野では、極めて有
効なパラメータであると言える。LSP係数は、それを
直接的に量子化することもでき(文献1参照)、又AD
PCM的手法で間接的に量子化することができる(文献
2参照)。
トル対(LSP)音声分析合成方式による音声情報圧
縮」、電子通信学会論文誌、Vol.J64−A、No. 8
(1981/8) 文献2:F.K.Soong & B.H.Juang,“Optimal Quantizati
on of LSP ParametersUsing Delayed Decision",Proc.
ICASSP-90 (April 1990) LSP係数は、通常の音声信号の場合、6個から12個
程度の次元(要素)からなるベクトルとして表現され、
また、各ベクトルの要素は、周波数に関する昇順に並ん
でいるという性質を持っており、各要素の値は独立では
ない。従ってその量子化には、例えば文献3で開示され
ているようなベクトル量子化手法が極めて有効である。
ル量子化による破裂音の認識」、電子通信学会技術研究
報告、SP90−6(1990年5月25日)
量子化は、通常、多数のベクトルをテーブルとして蓄積
しておき、入力音声信号のLSP係数類似したベクトル
を探索しそのコードを出力することによって行う。予め
用意しておくベクトルの数は、ビットレートや探索時間
から制限されるため、音声信号の性質によっては量子化
歪みが大きくなることがある。
係数に相関があることに着目して、テーブルのベクトル
を補うようにするものである。
LSP係数の間には、相関が存在し、近接する音声フレ
ームから求められたLSP係数は似ている。従って、本
発明の目的は、その相関を十分に有効に活用して、量子
化能率を向上させる手法を提供することにある。
(ベクトル)の複数段量子化方法に関する。
め定められたベクトルを蓄積している固定部と、置き換
え可能にベクトルを蓄積する可変部とから構成される。
の最も古いベクトルを、現フレームで決定されたベクト
ルの合成ベクトルで置き換える。すなわち、現フレーム
の出力符号に対応したものであり、現フレームのLSP
係数に対応したベクトルで置き換える。
効に活用するために、スカラー量子化ではなくベクトル
量子化を行う。但し、そのままベクトル量子化したので
は、量子化テーブルの大きさが非常に大きくなってしま
うので、例えば、まず10ビット程度で粗くベクトル量
子化し、その量子化誤差を、別の量子化テーブルを用い
てベクトル量子化し、さらにその時の量子化誤差を、以
前の2つの量子化テーブルとは異なる量子化テーブルを
用いてベクトル量子化するというように、小さい量子化
テーブルを用いたベクトル量子化を複数回繰り返すこと
で、ベクトル量子化の効果を用いる。
P係数の相関を有効に利用するために、1段目の量子化
テーブルの一部を可変にしておき、以前のフレームで量
子化されたLSP係数の値を1段目の量子化テーブルの
ベクトルとして用いる。
化器のブロック図を示す。ここでは初段(1段目)と最
終段(2段目)との2個の量子化テーブルを用意するも
のとする。
11aと、あらかじめ定められた固定のベクトルからな
る部分11bから構成されている。
れた最適なベクトルV10と、2段目で選択された最適な
ベクトルV20とが加算器15で加算されて、前フレーム
における合成ベクトル(量子化されたLSP係数)を求
め、量子化テーブル1の可変部分11aの中で最も古い
ベクトルを前フレームの量子化されたLSP係数(合成
ベクトル)置き換える。
11の全てのベクトルについて、入力音声のLSP係数
との誤差の評価を行い、最適のベクトルV1 を選択し、
1段目の最適なベクトルV1 とその符号(インデック
ス)C1 を出力する。
力音声のLSP係数から減算器16で差し引き1段目で
の量子化誤差ベクトルを求める。
められた固定のベクトルからなっている。
の全てのベクトルについて、1段目での量子化誤差ベク
トルに対する誤差の評価を行い、最適のベクトルを選択
し、2段目の最適なベクトルV2 とその符号(インデッ
クス)C2 を出力する。
を示す。1段目の量子化テーブル21は可変の部分21
aと、あらかじめ定められた固定のベクトルからなる部
分21bから構成されている。固定部分21bは図1の
11bと一致する。
分21aの中で最も古いベクトルを前フレームの合成ベ
クトル(V10+V20)で置き換える。
示される最適な1段目のベクトルV1 が取り出される。
する。あらかじめ定められた固定のベクトルからなって
いる。
される最適な2段目のベクトルV2 が取り出される。
最適なベクトルV2 が加算器23で加算されて、量子化
されたLSP係数(合成ベクトル)を構成する。
化)と、図1の符号化器によるLSPの量子化の効果の
比較結果を示す。なお、実験に用いた声道パラメータは
分析フレーム長40ミリ秒で10次の分析を行ったもの
を用いた。従来の方法は各次数のLSP係数を4、4、
3、3、3、3、3、3、2、2ビットで、非線形スカ
ラー量子化したものであり、また、本実施例によるもの
は1段目10ビット、2段目12ビットでベクトル量子
化したものである。また、1段目の可変部分ベクトルの
個数は6ベクトルである。どちらの量子化器も、約3分
の学習データを用いて構成したものであり、また、試験
は学習データに含まれない約15秒分のデータを用いて
行った。
圧縮効率が高い。また、スペクトル歪みは小さいほど良
く、音声信号に関しては1dB以上になると、聴覚上、気
になると言われている。SNR(信号対ノイズ比)は大
きいほど良い。
及びその符号を各量子化段階毎に決定しているが、文献
2に示されている方法と同様に、各量子化段階では複数
の候補を探索し、最終段完了後に量子化誤差を総合的に
評価することによって、各量子化段階のベクトル及び、
その特号を選択するようにしてもよい。
変部を設け、最近の合成ベクトル(量子化されたLSP
係数)で置き換えるようにしているため、近接フレーム
間のLSP係数の相関を有効に利用でき、量子化能率を
向上させることができる。
Claims (1)
- 【請求項1】 少なくとも2段の量子化テーブルを備
え、 初段のベクトル量子化は各フレームの入力音声信号のL
SP係数を対象として行い、 次段以後の各ベクトル量子化は前段までの量子化誤差を
対象として行い、 各段毎に量子化誤差を評価しまたは全ての段の量子化誤
差を総合評価して各段のベクトル量子化に対応してそれ
ぞれ1個のベクトルを決定し、それらのベクトルに対応
したそれぞれの符号を出力するLSP係数の量子化方法
において、 初段の前記量子化テーブルは、予め定められたベクトル
を蓄積している固定部と、置き換え可能にベクトルを蓄
積する可変部とから構成され、 各フレームの量子化終了後、前記可変部の最も古いベク
トルを、当該フレームで決定された前記ベクトルの合成
ベクトルで置き換える、 ことを特徴としたLSP係数の量子化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03335010A JP3088163B2 (ja) | 1991-12-18 | 1991-12-18 | Lsp係数の量子化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03335010A JP3088163B2 (ja) | 1991-12-18 | 1991-12-18 | Lsp係数の量子化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05165499A true JPH05165499A (ja) | 1993-07-02 |
JP3088163B2 JP3088163B2 (ja) | 2000-09-18 |
Family
ID=18283730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03335010A Expired - Lifetime JP3088163B2 (ja) | 1991-12-18 | 1991-12-18 | Lsp係数の量子化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3088163B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08195722A (ja) * | 1995-01-17 | 1996-07-30 | Nec Corp | スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置 |
WO1998052188A1 (fr) * | 1997-05-15 | 1998-11-19 | Matsushita Electric Industrial Co., Ltd. | Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio |
US6826526B1 (en) | 1996-07-01 | 2004-11-30 | Matsushita Electric Industrial Co., Ltd. | Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization |
US6904404B1 (en) | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
JP2010181893A (ja) * | 1998-08-24 | 2010-08-19 | Mindspeed Technologies Inc | 線スペクトル周波数の量子化のための符号帳の共有 |
JP2018532155A (ja) * | 2016-04-22 | 2018-11-01 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | 音声検出方法、装置及び記憶媒体 |
-
1991
- 1991-12-18 JP JP03335010A patent/JP3088163B2/ja not_active Expired - Lifetime
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08195722A (ja) * | 1995-01-17 | 1996-07-30 | Nec Corp | スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置 |
US6826526B1 (en) | 1996-07-01 | 2004-11-30 | Matsushita Electric Industrial Co., Ltd. | Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization |
US6904404B1 (en) | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
US7243061B2 (en) | 1996-07-01 | 2007-07-10 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having a plurality of frequency bands |
WO1998052188A1 (fr) * | 1997-05-15 | 1998-11-19 | Matsushita Electric Industrial Co., Ltd. | Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio |
JP2010181893A (ja) * | 1998-08-24 | 2010-08-19 | Mindspeed Technologies Inc | 線スペクトル周波数の量子化のための符号帳の共有 |
JP2018532155A (ja) * | 2016-04-22 | 2018-11-01 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | 音声検出方法、装置及び記憶媒体 |
US10872620B2 (en) | 2016-04-22 | 2020-12-22 | Tencent Technology (Shenzhen) Company Limited | Voice detection method and apparatus, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP3088163B2 (ja) | 2000-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3114197B2 (ja) | 音声パラメータ符号化方法 | |
JP3707153B2 (ja) | ベクトル量子化方法、音声符号化方法及び装置 | |
US6952671B1 (en) | Vector quantization with a non-structured codebook for audio compression | |
CA2430111C (en) | Speech parameter coding and decoding methods, coder and decoder, and programs, and speech coding and decoding methods, coder and decoder, and programs | |
JPH09127991A (ja) | 音声符号化方法及び装置、音声復号化方法及び装置 | |
KR20050089071A (ko) | 가변 비트율 음성 부호화에서의 선형 예측 매개변수들의견실한 예측 벡터 양자화를 위한 방법 및 장치 | |
JPH09127990A (ja) | 音声符号化方法及び装置 | |
US5659659A (en) | Speech compressor using trellis encoding and linear prediction | |
JPH08263099A (ja) | 符号化装置 | |
JP4750366B2 (ja) | ブロック制限されたtcqにおけるトレリス経路決定方法、ならびに音声符号化システムにおいてそのtcqにおけるトレリス経路決定方法を採用したラインスペクトル周波数係数の量子化方法及び装置 | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
JP2800618B2 (ja) | 音声パラメータ符号化方式 | |
JP3070955B2 (ja) | 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法 | |
JP2002268696A (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JP3088163B2 (ja) | Lsp係数の量子化方法 | |
JP2658816B2 (ja) | 音声のピッチ符号化装置 | |
JP3148778B2 (ja) | 音声の符号化方法 | |
JP3296363B2 (ja) | 音声の線形予測パラメータ符号化方法 | |
JPH11219196A (ja) | 音声合成方法 | |
JPH0786952A (ja) | 音声の予測符号化方法 | |
JP3335650B2 (ja) | 音声符号化方式 | |
JP3700310B2 (ja) | ベクトル量子化装置及びベクトル量子化方法 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
JPH07134600A (ja) | 音声符号化装置及び音声復号化装置 | |
JP2897940B2 (ja) | 音声の線形予測パラメータ符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000627 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080714 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090714 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100714 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110714 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120714 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120714 Year of fee payment: 12 |