JPH11143499A - 切替え型予測量子化の改良された方法 - Google Patents

切替え型予測量子化の改良された方法

Info

Publication number
JPH11143499A
JPH11143499A JP10242057A JP24205798A JPH11143499A JP H11143499 A JPH11143499 A JP H11143499A JP 10242057 A JP10242057 A JP 10242057A JP 24205798 A JP24205798 A JP 24205798A JP H11143499 A JPH11143499 A JP H11143499A
Authority
JP
Japan
Prior art keywords
vector
quantization
value
codebook
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10242057A
Other languages
English (en)
Inventor
Alan V Mccree
ブイ.マックリー アラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JPH11143499A publication Critical patent/JPH11143499A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/12Analogue/digital converters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Abstract

(57)【要約】 【課題】 より低いビット速度でも高性能の量子化を可
能にする。 【解決手段】 音声符号器のLPC係数を量子化する新
しい方法であって、切替え型予測多段ベクトル量子化の
改良された形式を含む。スイッチ予測量子化は、MSV
Q量子化器の少なくとも1対のコードブックの組、コー
ドブックの組1と共に用いられる第1の予測行列1及び
コードブックの組2と共に用いられる第2の予測行列2
を含む第1及び第2の予測行列24a及び24bを含
み、符号器はどの予測行列/コードブックの組が検出器
35で最小量子化誤差を生成するかを決定し、制御装置
29は誤差が最小である指数を音声符号器の外部へゲー
トする。

Description

【発明の詳細な説明】
【0001】
【関連出願との関係】本発明は、ウィルフレッド・P・
ルブラン(Wilfred P. LeBlanc)他による、1997年
1月6日出願の同時継続中の仮出願、出願番号60/0
35,764、発明の名称「効率の良いコードブック検
索を用いる多段ベクトル量子化」に関連する。この出願
は参照として本発明に組込まれている。
【0002】本発明は更に、マックリー(McCree)によ
る、1996年5月20日出願の同時継続中の出願、出
願番号08/650,585、発明の名称「端数ピッチ
を用いたMELP(Mixed Excitation Linear Predicti
on with Fractional Pitch)」に関連する。この出願は
参照として本発明に組込まれている。
【0003】本発明は更に、アラン・マックリーによ
る、本発明と同日(1997年8月28日)に出願され
た同時継続中の仮出願、出願番号60/057,11
4、発明の名称「知覚加重(weighting )を用いる線形
予測係数の量子化」に関連する。この出願は参照として
本発明に組込まれている。
【0004】
【発明の属する技術分野】本発明は、切替え型(switch
ed)予測量子化に関連する。
【0005】
【従来の技術及びその課題】新しい2.4 kビット/
秒の連邦基準混合励振線形予測(MELP)(Mixed Ex
citation Linear Prediction)符号器(マックリー他の
論文「新しい合衆国連邦基準の候補となる2.4 kビ
ット/秒MELP符号器」、Proc.ICASSP−
96、pp.200−203、1996年5月号)のよ
うな多くの音声符号器は、音声信号のスペクトルを表す
ために何らかの線形予測符号化(LPC)の形式を使っ
ている。MELP符号器は、1996年5月20日出願
の同時継続中の出願、出願番号08/650,585、
発明の名称「端数ピッチを用いたMELP」の出願で説
明されており、参照として本発明に組込まれている。図
1はこのようなMELP符号器を示す。MELP符号器
は、従来のLPCボコーダに基づいており、周期インパ
ルス列又はホワイトノイズが全極(all-pole)LPCフ
ィルタの10次の励振をする。強化されたものでは、合
成器は、図1に示すように、パルス及びノイズ混合励振
周期又は非周期パルス、適応型スペクトル強化及びパル
ス分散フィルタの付加的能力を有する。LPCの精度を
保つことが処理後の音声品質に対し重要な影響を持つ
が、音声符号器の全体のビット速度を遅く保つためにL
PC量子化器のビット速度は低くなくてはならないた
め、LPC係数の効率的な量子化はこれらの符号器にお
ける重要な問題である。新しい連邦基準のためのMEL
P符号器は、ライン・スぺクトル周波数(LSF)に対
して25ビット多段ベクトル量子化器(MSVQ)を用
いる。LPC係数とLSF係数の間には1対1の変換が
ある。
【0006】量子化は、ある忠実度の基準(fidelity c
riterion)に従って、入力値を離散的な値に変換する工
程である。量子化の典型的な例は、連続する振幅信号を
離散的な振幅値へ変換する例である。信号は先ずサンプ
リングされ、その後量子化される。量子化のため、入力
信号の予測値の範囲は、一連のサブレンジに分けられ
る。それぞれのサブレンジは、関連する量子化レベルを
有する。例えば、8ビット値への量子化では256個の
レベルがある。あるサブレンジ内にある入力信号のサン
プル値は、関連する量子化レベルに変換される。例え
ば、8ビットの量子化では、入力信号のサンプルは、各
レベルが8ビット値で表わされる256個のレベルの内
の1つに変換される。
【0007】ベクトル量子化は量子化の1つの方法であ
り、サンプルと確率分布の形との間の線形及び非線形相
関に基づく。本質的には、ベクトル量子化は、ルックア
ップ・テーブルが「コードブック」と呼ばれる、ルック
アップ工程である。コードブックは各量子化レベルをリ
ストし、各レベルは関連する「コード・ベクトル」を有
する。ベクトル量子化工程は、入力ベクトルをコード・
ベクトルと比較し、歪みが最小という点で、最良のコー
ド・ベクトルを決定する。xが入力ベクトルであると
き、歪み値の比較は次の様に表わすことができる。
【0008】
【数1】
【0009】これはkに等しくない全てのjに対して成
立する。コードブックはy(j) で表わされ、ここでy
(j) はj番目のコード・ベクトル、0≦j≦Lであり、
Lはコードブック内のレベルの数である。
【0010】多段ベクトル量子化(MSVQ)は、ベク
トル量子化の一形式である。この工程は、多数の量子化
ベクトルを加算することによって、中央の量子化ベクト
ル(出力ベクトル)を求める。この出力ベクトルは、
「再生(reconstructed )」ベクトルと呼ばれることが
ある。再生に使われる各ベクトルは異なるコードブック
からのものであり、各コードブックは量子化工程の
「段」に対応する。各コードブックは、特に検索の段に
対し設計される。入力ベクトルが第1のコードブックで
量子化され、その結果の誤差ベクトルが第2のコードブ
ックで量子化される、という様になる。再生に用いられ
るベクトルの組は、次のように表わすことができる。
【0011】
【数2】
【0012】ここで、Sは段の数であり、ys はs番目
の段に対するコードブックである。例えば、x=(2,
3,4)のような3次元の入力ベクトルに対し、2段検
索の再生ベクトルは、y0 =(1,2,3)及びy1
(1,1,1)である(これは完全な量子化であるが、
常にそうとは限らない)。
【0013】多段ベクトル量子化の間、Mアルゴリズム
としても知られているサブ・オプティマル・ツリー検索
アルゴリズムを用いて、コードブックを検索することが
できる。各段で、最良のM個の(M-best number of)
「最良」コード・ベクトルは、1つの段から次の段へパ
スされる。「最良」コード・ベクトルは、歪みが最小と
いう点で選択される。1つの最良コード・ベクトルのみ
が決定されるとき、検索は最終段まで続けられる。
【0014】予測量子化では、現在のフレームの量子化
のための目標ベクトルは、平均を取除いた入力ベクトル
から予測値を差引いたものである。予測値は、前の量子
化ベクトルに既知の予測行列を乗算したものである。切
替え型予測では、とり得る予測行列が1つ以上あり、各
フレームに対し最良の予測行列が選択される。「無線及
びネットワーク用途のための音声及び音響符号化」C
h.31、pp.251−258、クルーワ(Kluwer)
・アカデミック・パブリッシャーズ、1993年発行
の、S.ワン(S. Wang )他の「LPCパラメータの積
コード・ベクトル量子化」参照。
【0015】切替え型予測ベクトル量子化のための改良
された方法を提供することが非常に望ましい。
【0016】
【課題を達成するための手段及び作用】本発明の一実施
例に従って、時間冗長性を活用するため予測子/コード
ブックの組が切替えられる切替え型予測量子化の改良さ
れた方法及びシステムが提供される。
【0017】本発明の上記及びその他の特徴は、本発明
が添付の図面と共に以下に詳細に説明されることから、
当業者には明らかであろう。
【0018】
【実施例】本発明の一実施例を図面を参照して説明す
る。新しい量子化方法は、2.4 kビット/秒の連邦
基準のMELP符号器に用いられるものと同じく、LP
C係数のライン・スペクトル周波数(LSF)変換の多
段ベクトル量子化(MSVQ)を用いる(ルブラン他の
論文「4 kビット/秒音声符号化のための頑丈な多段
VQ又はLPCパラメータの効率のよい検索および設計
手順」、IEEE トランザクションズ・オン・スピー
チ・アンド・オーディオ・プロセッシング、Vol.
1,No.4、1993年10月号、pp.373−3
85)。多段VQに対する効率のよいコードブック検索
は、前に引用した出願番号60/035,764に開示
されている。しかし、本発明に従った新しい方法は2つ
の点で以前の方法を改良している。即ち、時間冗長性を
活用するために切替え型予測を使用すること、及び主観
的な(subjective)音声品質に一層よく相関する新しい
加重距離の目安(measure )を使用することである。
【0019】連邦基準MELP符号器では、入力LSF
ベクトルはMSVQを用いて直接量子化される。しか
し、隣り合うフレームのLSFベクトルの間にはかなり
の冗長性があり、この冗長性を利用することによって量
子化の精度を改良することができる。前に予測量子化で
述べたように、現在のフレームの量子化のための目標ベ
クトルは、平均を取除いた入力ベクトルから予測値を差
し引いたものであり、予測値は、前の量子化ベクトルに
既知の予測行列を乗算したものである。切替え型予測で
は、とり得る予測行列は1つ以上あり、各フレームに対
し最良の予測子(predictor )又は予測行列が選択され
る。本発明に従って、予測行列及びMSVQコードブッ
クの両方が切替えられる。各入力フレームに対し、自乗
誤差を最小にする予測子/コードブックの組を求めて、
考えられる全ての予測子/コードブックの組を検索す
る。その後、この対に対応する指数及びMSVQコード
ブック指数が、伝送のため符号化される。これは、予測
子と同様にコードブックが切替えられる点で従来の方法
と異なる。従来の方法は、コードブック蓄積量を減らす
ために単一のコードブック組を共有しているが、切替え
型予測量子化に用いられるMSVQコードブックは、非
予測コードブックよりかなり小さくできること、及び多
数の一層小さいコードブックは、1つのより大きなコー
ドブック以上の蓄積スペースを必要としないことが分か
った。発明者の実験により、個別の予測子/コードブッ
クの対を使うと、ビット速度を高くせずに、単一の共有
コードブックに比べて著しい性能改良が得られる。
【0020】図2の切替え型予測量子化器20を用いる
LSF符号化器に関し、10個のLPC係数が、変換器
23によってライン・スペクトル周波数(LSF)ベク
トルの10個のLSF係数に変換される。LSFは10
次元の要素又は係数を有する(10次全極フィルタに対
し)。加算器22で、選択された平均ベクトルをLSF
入力ベクトルから差し引き、加算器25で、平均を取除
いた入力ベクトルから予測値を差引く。こうして求めら
れた、現在のフレームの量子化ベクトルeに対する目標
ベクトルが、多段ベクトル量子化器(MSVQ)27に
供給される。予測値は、乗算器26で、前の量子化ベク
トルに既知の予測行列を乗算したものである。切替え型
予測で予測された値は、とり得る予測行列が1つより多
い。各フレームに対し最良の予測子(予測行列及び平均
ベクトル)が選択される。本発明に従って、予測子(予
測行列及び平均ベクトル)とMSVQコードブックの組
の両方が切替えられる。制御装置29が、先ずスイッチ
28を介して予測行列1及び平均ベクトル1及び量子化
器27の第1組のコードブック1を切替える。その後、
この第1の予測行列に対応する指数及び第1組のコード
ブックに対するMSVQコードブック指数が、量子化器
からゲート37へ供給される。予測値は、目標ベクトル
eに対する量子化出力
【外1】 に加算器31で加算され、平均を取除いた量子化ベクト
ルを生成する。加算器70で、選択された平均ベクトル
に平均を取除いたベクトルが加算され、量子化ベクトル
【外2】 を求める。各次元の自乗誤差は自乗器35で決定され
る。入力ベクトルXi と遅延され量子化されたベクトル
【外3】 との間の加重自乗誤差は、制御装置29に蓄積される。
制御装置29はスイッチ28を介して予測行列2及び平
均ベクトル2及びコードブック2の組を切替える制御信
号を提供し、同様に自乗器35でこの組の加重自乗誤差
を測定する。予測行列1(平均ベクトル1を含む)とコ
ードブックの組1の第1の対からの測定された誤差は、
予測行列2(平均ベクトル2を含む)及びコードブック
の組2と比較される。最小誤差を有するコードブックに
対する指数の組は、ゲート37で、符号化された指数の
伝送として符号化器の外にゲートされ、予測行列及びコ
ードブックの組のどちらの対から指数が送り出されたか
(平均ベクトル1を有するコードブックの組1及び予測
行列1か、コードブック2及び平均ベクトル2を有する
予測行列2か) を示すビットが制御装置29から端子3
8で送り出される。最小誤差に関連する、加算器31か
らの平均を取除いた量子化ベクトルは、ゲート33aで
フレーム遅延装置33にゲートされ、前の平均を取除い
た量子化ベクトルを乗算器26に供給する。
【0021】図3はLSF符号化器20と共に用いる復
号器40を示す。復号器40では、符号化からのコード
ブックに対する指数を、符号化器のコードブックの組1
及び2に対応する2組のコードブックを有する量子化部
44で受信する。端子38からのビットは、符号化器で
用いられた適切なコードブックの組を選択する。LSF
量子化入力が加算器41で予測値に加算され、この予測
値は、平均を取除いた量子化ベクトルを求めるために符
号化器で選択された最良の1つと整合する、42の予測
行列に乗算器45で乗算された前の平均を取除いた量子
化値(遅延装置43からの)である。予測行列1と平均
値1及び予測行列2と平均値2の両方が復号器の蓄積装
置42に蓄積される。符号化器の端子38からの1ビッ
トは、蓄積装置42で、符号化器の予測行列及び平均値
と整合する予測行列及び平均値を選択する。平均を取除
いた量子化ベクトルは、選択された平均値に加算器48
で加算され、量子化LSFベクトルを求める。量子化さ
れたLSFベクトルは、変換器46によってLPC係数
に変換される。
【0022】前に述べたように、LSFベクトル係数は
LPC係数に対応する。LSFベクトル係数は、LPC
係数よりも一層良い量子化特性を有する。これら2つの
ベクトル係数の間には1対1変換がある。対応する特定
の1組のLPC係数に対する特定の1組のLSF係数に
加重関数が適用される。
【0023】連邦基準MELP符号器は、その計算の簡
単さのために、LSF量子化に加重ユークリッド(Eucl
idean )距離を用いる。しかし、LSF領域(domain)
のこの距離は、量子化の精度の理想的な目安、即ち、処
理された音声信号の知覚される品質とは必ずしもうまく
対応しない。出願人は以前に、新しい2.4 kビット
/秒連邦基準に関する論文で、知覚加重形式の対数スペ
クトル歪みが主観的な音声品質に対して密接な相関性を
持つことを示した。出願人はこの論文で、1実施例に従
って、このスペクトル歪みに密接に対応する加重LSF
距離を説明している。この加重関数は、その組に対応す
る特定の1組のLPC係数に対する1組のLSF係数で
ある、特定の入力ベクトルxに対する特定の1組のLS
F係数に対するこの変換の詳細を考えることを必要とす
る。符号器がLPC係数を計算し、上述したように、量
子化のため、一層良く作用するLSFベクトルに変換さ
れる。図1に示すように、実際の合成器は、量子化され
たベクトル
【外4】 を受け取り、逆変換を行い、実際の音声合成に用いるL
PCフィルタを求める。加重されていないスペクトル歪
みに対する最適のLSF重みは、ガードナー他の論文
「LPCパラメータの高速ベクトル量子化の理論的な分
析」、IEEE トランザクションズ・オン・スピーチ
・アンド・オーディオ・プロセッシング、Vol.3,
No.5、1995年9月号、pp.367−381に
示された式を用いて計算される。
【0024】
【数3】
【0025】ここでRA (m)は、遅延(lag )mにお
けるLPC合成フィルタのインパルス応答の自己相関で
あり、Ri (m)はLSF係数からLPC係数への変換
のヤコビ行列(Jacobian matrix )のi番目の列の要素
の相関である。従って、特定の入力ベクトルxに対し、
重みWi を計算する。
【0026】この解決策の違いは、知覚加重の形式のス
ペクトル歪みを反映するように、自己相関関数R
A (m)の計算の前に、知覚加重が合成フィルタのイン
パルス応答に適用されることである。
【0027】図2の実施例に適用される加重関数では、
35で自乗誤差に加重Wi が適用される。誤差検出器3
5からの加重出力は、
【数4】 である。10次元のベクトルの各エントリーは重みの値
(加重値)を有する。誤差は、各要素に対する加重値を
合計する。たとえば、重みを適用するとき、1つの要素
は3の重みの値を持ち、他は1であるとき、3の要素
は、誤差を決定するとき他の要素に対し3倍のファクタ
により強められる。
【0028】前に述べたように、加重関数は、LPCか
らLSFへの変換の詳細を考えることを必要とする。重
みの値は、LPC合成フィルタ21にインパルスを提供
し、その結果サンプリングされたLPC合成フィルタ2
1の出力を知覚加重フィルタ47へ供給することによっ
て決定される。コンピュータ39は、以下及び図4のフ
ローチャートに示す擬似コードに基づくコードでプログ
ラムされる。インパルスがLPCフィルタ21にゲート
され、LPC合成フィルタ応答のN個のサンプルを求め
(工程51)、知覚加重フィルタ37へ供給される(工
程52)。本発明の1つの好ましい実施例では、低い周
波数は高い周波数よりも一層大きな加重がなされ、特に
好ましい実施例は、人間の耳が音に対してどのように応
答するかを整合する周知のバーク・スケール(Bark sca
le)を用いる。バーク加重WB (f)の式は次の通りで
ある。
【0029】
【数5】
【0030】この応答を持つフィルタの係数を前もって
決定し、蓄積し、時間領域の係数を蓄積する。このスペ
クトルに当てはまる8次全極を決定し、これらの8個の
係数を知覚加重フィルタとして用いる。以下の工程は、
次の式で表わされる、ガードナー他の論文の375頁に
見られる加重されていないスペクトル歪みの式に従う。
【0031】
【数6】 ここで、RA (m)は遅延mにおけるLPC合成フィル
タのインパルス応答の自己相関であり、
【数7】 h(n)は、インパルス応答であり、Ri (m)は、
【数8】 LSF係数からLPC係数への変換のヤコビ行列
【外5】 のi番目の列の要素の相関関数である。
【外6】 の各列は次の式によって見つけることができる。
【0032】
【数9】 なぜならば、
【数10】 であるからである。ji (n)の値は、
【外7】 の係数によるP(ω)の係数の簡単な多項式除算で求め
られる。
【外8】 の第1の係数=1であるため、この工程では実際の除算
は必要ではない。更に、ji (n)=ji (v+1−
n):i奇数、0<n≦vであるため、計算する必要が
あるのは半分の値だけである。偶数の列でも、反対称特
性から、同様の状態になる。
【0033】加重インパルス応答の自己相関関数を計算
する(図4の工程53)。そこからLSF係数に対する
ヤコビ行列を計算する(工程54)。次に、ヤコビ行列
の行の相関を計算する(工程55)。次に、相関行列を
乗算することによってLSF重みを計算する(工程5
6)。図2のコンピュータ39からの計算された重み値
は、誤差検出器35へ供給される。その後、誤差が最小
である予測行列/コードブックの組の指数が、量子化器
27からゲートされる。以下の擬似コードを利用するコ
ンピュータ39及び制御装置29をカプセル封止するマ
イクロプロセッサを用いて、システムが実施化され得
る。現在のLPC及びLSFから加重ベクトルを計算す
る擬似コードは次の通りである。
【0034】 /* 現在のLPC及びLSFから加重ベクトルを計算する*/ LPC合成フィルタのインパルス応答のN個のサンプルを計算する 知覚加重フィルタを用いてインパルス応答をフィルタリングする 加重インパルス応答の自己相関関数を計算する LSF係数に対するヤコビ行列を計算する ヤコビ行列の行の相関を計算する 相関行列を乗算することによってLSF重みを計算する。 上述のコードを図5及び図6に示す。 入力ベクトル符号化に対する擬似コードは以下の通りである。 /* 入力ベクトルを符号化する*/ 全ての予測子とコードブックの対に対し 入力LSFベクトルから平均を取除く 予測値を差引いて目標ベクトルを求める 加重距離を用いて、目標ベクトルに最良の整合のMSVQコードブッ クを検索する 誤差<Eminの場合 Emin=誤差 最良の予測子指数=現在の予測子 Endif End 最適な予測指数及びコードブック指数を転送のために符号化する。
【0035】 量子化ベクトルを再生する擬似コードは以下の通りである。 /* 量子化ベクトルを再生する*/ MSVQコード・ベクトルを合計し、量子化された目標を生成する 予測値を加算する 過去の量子化値(平均を取除いた)のメモリを更新する 平均を加算し、量子化LSFベクトルを生成する。
【0036】この新規なアプローチに基き、20ビット
LSF量子化器を構成したが、これは、一層低いビット
速度で、連邦基準MELP符号器に用いられている25
ビット量子化器に相当する性能を生じる。予測子/コー
ドブックの2つの対があり、それぞれが対角線1次予測
行列及びそれぞれ64、32、16及び16個のベクト
ルの寸法のコードブックを有する4段MSVQで構成さ
れる。この新しい量子化器のコードブックの蓄積、及び
計算の複雑さは従来のものよりも小さい。
【0037】本発明及びその利点が詳細に説明された
が、添付の特許請求の範囲によって定義された本発明の
精神及び範囲を逸脱せずに、この実施例に種々の変更を
加えることができることを理解されたい。
【0038】例えば、予測行列1の組合せはコードブッ
クの組2と共に、及び予測行列2はコードブックの組1
と共に、又はコードブックの組と予測行列の任意の組合
せで用いられることが予想される。より多くのコードブ
ックの組及び又は予測行列があってもよい。このような
組合せには、付加的なビットが符号器から送られること
が必要である。平均ベクトルは1つのみであっても、多
数の平均ベクトルがあってもよい。この切替型予測量子
化は、LSF以外のベクトルに用いることもできるが、
スカラー量子化にも適用でき、その場合、ここに用いら
れたような行列はスカラー値であり得る。
【0039】本発明は例示用の実施例を参照して説明さ
れたが、本説明が限定的な意味に解釈されることを意図
しているのではない。これら例示用の実施例の種々の変
形及び組合せばかりでなく本発明の他の実施例も、本説
明を参照すれば当業者にとって明白である。したがっ
て、添付の特許請求の範囲はあらゆるこれらの変形及び
組合せを包含することを意図する。
【0040】以上の説明に関して更に次の項を開示す
る。 (1) 入力を量子化する切替え型予測方法であって、
平均値を提供し、前記入力から前記平均値を差引いて、
平均を取除いた入力を求め、第1及び第2のコードブッ
クの組を有する量子化器を提供し、第1及び第2の予測
行列を提供し、前のフレーム平均を取除いた量子化値を
前記第1の予測行列に、その後、前記第2の予測行列に
乗算して、第1の予測値及びその後第2の予測値を求
め、前記平均を取除いた入力から前記予測値を差引い
て、目標値を求め、前記目標値を前記コードブックの組
に適用して、量子化された目標値を求め、前記予測値を
前記量子化された目標値に加算して、平均を取除いた量
子化値を求め、前記平均を取除いた量子化値に平均値を
加算して、量子化値を求め、コードブックの組及び予測
行列のどの組が最小誤差を有するかを決定し、最小誤差
を有する組に対応する量子化出力を提供する工程を含む
方法。
【0041】(2) 第1項に記載の方法であって、前
記入力は、一連のLPC係数に対応するLSF係数であ
る方法。 (3) 第2項に記載の方法であって、前記決定する工
程は、入力ベクトルと量子化された出力との間の各次元
の自乗誤差を決定する工程を含む方法。 (4) 第3項に記載の方法であって、前記自乗誤差
は、各次元の加重値で乗算される方法。 (5) 第4項に記載の方法であって、加重関数は、L
SF量子化のためのユークリッド距離である方法。 (6) 第3項に記載の方法であって、前記加重関数
は、スペクトル歪みの知覚加重された形式に密接に対応
する加重LSF距離である方法。
【0042】(7) 音声符号器のLPC係数を量子化
する新しい方法であって、切替え型予測多段ベクトル量
子化の改良された形式を含む。スイッチ予測量子化は、
MSVQ量子化器の少なくとも1対のコードブックの
組、コードブックの組1と共に用いられる第1の予測行
列1及びコードブックの組2と共に用いられる第2の予
測行列2を含む第1及び第2の予測行列24a及び24
bを含み、符号器はどの予測行列/コードブックの組が
検出器35で最小量子化誤差を生成するかを決定し、制
御装置29は誤差が最小である指数を音声符号器の外部
へゲートする。
【図面の簡単な説明】
【図1】混合励振線形予測符号器のブロック図。
【図2】本発明に従った切替え型予測ベクトル量子化符
号化器のブロック図。
【図3】本発明に従った復号器のブロック図。
【図4】本発明の別の実施例に従った加重距離の目安を
決定するフローチャート。
【図5】LPC及びLSFから加重ベクトルを計算する
擬似コード。
【図6】LPC及びLSFから加重ベクトルを計算する
擬似コード。
【符号の説明】
20 切替え型予測量子化器 21 合成フィルタ 22、25、31、70 加算器 23 変換器 24a及び24b 予測行列 26 乗算器 27 多段ベクトル量子化器 28 スイッチ 29 制御装置 33 遅延装置 33a、37 ゲート 35 検出器 38 端子 39 コンピュータ 47 加重フィルタ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力を量子化する切替え型予測方法であ
    って、 平均値を提供し、前記入力から前記平均値を差引いて、
    平均を取除いた入力を求め、 第1及び第2のコードブックの組を有する量子化器を提
    供し、 第1及び第2の予測行列を提供し、 前のフレーム平均を取除いた量子化値を前記第1の予測
    行列に、その後、前記第2の予測行列に乗算して、第1
    の予測値及びその後第2の予測値を求め、 前記平均を取除いた入力から前記予測値を差引いて、目
    標値を求め、 前記目標値を前記コードブックの組に適用して、量子化
    された目標値を求め、 前記予測値を前記量子化された目標値に加算して、平均
    を取除いた量子化値を求め、 前記平均を取除いた量子化値に平均値を加算して、量子
    化値を求め、 コードブックの組及び予測行列のどの組が最小誤差を有
    するかを決定し、最小誤差を有する組に対応する量子化
    出力を提供する工程を含む方法。
JP10242057A 1997-08-28 1998-08-27 切替え型予測量子化の改良された方法 Pending JPH11143499A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US5711997P 1997-08-28 1997-08-28
US057119 1997-08-28

Publications (1)

Publication Number Publication Date
JPH11143499A true JPH11143499A (ja) 1999-05-28

Family

ID=22008627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10242057A Pending JPH11143499A (ja) 1997-08-28 1998-08-27 切替え型予測量子化の改良された方法

Country Status (6)

Country Link
US (1) US6122608A (ja)
EP (1) EP0905680B1 (ja)
JP (1) JPH11143499A (ja)
KR (1) KR100889399B1 (ja)
DE (1) DE69815242T2 (ja)
TW (1) TW408298B (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001051698A (ja) * 1999-08-06 2001-02-23 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
JP2001188598A (ja) * 1999-12-24 2001-07-10 Korea Electronics Telecommun 線スペクトルペアー量子化器の高速探索方法
JP2004252462A (ja) * 2003-02-19 2004-09-09 Samsung Electronics Co Ltd ブロック制限されたトレリス符号化量子化方法、ならびに音声符号化システムにおいてそのトレリス符号化量子化方法を採用したラインスペクトル周波数係数の量子化方法及び装置
JP2006510922A (ja) * 2002-08-08 2006-03-30 クゥアルコム・インコーポレイテッド 帯域幅適応性量子化方法と装置
JP2006510947A (ja) * 2002-12-24 2006-03-30 ノキア コーポレイション 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置
JP2013140494A (ja) * 2012-01-05 2013-07-18 Kddi Corp 高次元の特徴ベクトルを検索する検索装置及びプログラム

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0899720B1 (en) * 1997-08-28 2004-12-15 Texas Instruments Inc. Quantization of linear prediction coefficients
DE69840008D1 (de) * 1997-10-22 2008-10-23 Matsushita Electric Ind Co Ltd Verfahren und Vorrichtung für die Erzeugung von gestreuten Vektoren
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US7295974B1 (en) * 1999-03-12 2007-11-13 Texas Instruments Incorporated Encoding in speech compression
EP1199812A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
US20030195745A1 (en) * 2001-04-02 2003-10-16 Zinser, Richard L. LPC-to-MELP transcoder
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US20030135547A1 (en) * 2001-07-23 2003-07-17 Kent J. Thomas Extensible modular communication executive with active message queue and intelligent message pre-validation
WO2003071522A1 (fr) * 2002-02-20 2003-08-28 Matsushita Electric Industrial Co., Ltd. Procede de production de vecteur de source sonore fixe et table de codage de source sonore fixe
US6917914B2 (en) * 2003-01-31 2005-07-12 Harris Corporation Voice over bandwidth constrained lines with mixed excitation linear prediction transcoding
KR100647290B1 (ko) * 2004-09-22 2006-11-23 삼성전자주식회사 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
US20060080090A1 (en) * 2004-10-07 2006-04-13 Nokia Corporation Reusing codebooks in parameter quantization
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
JP2008170488A (ja) * 2007-01-06 2008-07-24 Yamaha Corp 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法
US20080249767A1 (en) * 2007-04-05 2008-10-09 Ali Erdem Ertan Method and system for reducing frame erasure related error propagation in predictive speech parameter coding
CN101335004B (zh) * 2007-11-02 2010-04-21 华为技术有限公司 一种多级量化的方法及装置
CA2729751C (en) * 2008-07-10 2017-10-24 Voiceage Corporation Device and method for quantizing and inverse quantizing lpc filters in a super-frame
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) * 2009-01-06 2013-11-13 Skype Speech coding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
KR101660843B1 (ko) * 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
TWI456516B (zh) * 2010-12-17 2014-10-11 Univ Nat Chiao Tung 獨立成分分析處理器
CN110853659B (zh) 2014-03-28 2024-01-05 三星电子株式会社 用于对音频信号进行编码的量化装置
CN110444216B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 解码装置、解码方法、记录介质
KR102593442B1 (ko) 2014-05-07 2023-10-25 삼성전자주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56111899A (en) * 1980-02-08 1981-09-03 Matsushita Electric Ind Co Ltd Voice synthetizing system and apparatus
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
JPH0451199A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化・復号化方式
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
JPH05232996A (ja) * 1992-02-20 1993-09-10 Olympus Optical Co Ltd 音声符号化装置
CA2159571C (en) * 1994-09-30 2000-03-14 Kimio Miseki Vector quantization apparatus
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
US5664053A (en) * 1995-04-03 1997-09-02 Universite De Sherbrooke Predictive split-matrix quantization of spectral parameters for efficient coding of speech
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
US5774839A (en) * 1995-09-29 1998-06-30 Rockwell International Corporation Delayed decision switched prediction multi-stage LSF vector quantization
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
EP0899720B1 (en) * 1997-08-28 2004-12-15 Texas Instruments Inc. Quantization of linear prediction coefficients
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001051698A (ja) * 1999-08-06 2001-02-23 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
JP2001188598A (ja) * 1999-12-24 2001-07-10 Korea Electronics Telecommun 線スペクトルペアー量子化器の高速探索方法
JP2006510922A (ja) * 2002-08-08 2006-03-30 クゥアルコム・インコーポレイテッド 帯域幅適応性量子化方法と装置
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP2006510947A (ja) * 2002-12-24 2006-03-30 ノキア コーポレイション 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置
JP2004252462A (ja) * 2003-02-19 2004-09-09 Samsung Electronics Co Ltd ブロック制限されたトレリス符号化量子化方法、ならびに音声符号化システムにおいてそのトレリス符号化量子化方法を採用したラインスペクトル周波数係数の量子化方法及び装置
JP2013140494A (ja) * 2012-01-05 2013-07-18 Kddi Corp 高次元の特徴ベクトルを検索する検索装置及びプログラム

Also Published As

Publication number Publication date
KR19990023932A (ko) 1999-03-25
EP0905680B1 (en) 2003-06-04
DE69815242T2 (de) 2004-04-15
US6122608A (en) 2000-09-19
KR100889399B1 (ko) 2009-06-03
EP0905680A3 (en) 1999-09-29
DE69815242D1 (de) 2003-07-10
TW408298B (en) 2000-10-11
EP0905680A2 (en) 1999-03-31

Similar Documents

Publication Publication Date Title
JPH11143499A (ja) 切替え型予測量子化の改良された方法
US5684920A (en) Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
KR100283547B1 (ko) 오디오 신호 부호화 방법 및 복호화 방법, 오디오 신호 부호화장치 및 복호화 장치
KR100304092B1 (ko) 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
KR100469002B1 (ko) 오디오 코딩 방법 및 장치
KR100788706B1 (ko) 광대역 음성 신호의 부호화/복호화 방법
RU2453932C2 (ru) Способ и устройство многоступенчатого квантования
JP3254687B2 (ja) 音声符号化方式
KR20080074234A (ko) Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
US6889185B1 (en) Quantization of linear prediction coefficients using perceptual weighting
JP2002335161A (ja) 信号処理装置及び方法、信号符号化装置及び方法、並びに信号復号装置及び方法
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
EP0899720B1 (en) Quantization of linear prediction coefficients
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JPH11184498A (ja) 音声符号化/復号化方法
JPH11504733A (ja) 聴覚モデルによる量子化を伴う予測残余信号の変形符号化による多段音声符号器
JP2842276B2 (ja) 広帯域信号符号化装置
JPH09230898A (ja) 音響信号変換符号化方法及び復号化方法
JP4848049B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP3194930B2 (ja) 音声符号化装置
JP4618823B2 (ja) 信号符号化装置及び方法
WO2011087333A2 (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081202

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090424