JP4871246B2 - ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP4871246B2
JP4871246B2 JP2007281506A JP2007281506A JP4871246B2 JP 4871246 B2 JP4871246 B2 JP 4871246B2 JP 2007281506 A JP2007281506 A JP 2007281506A JP 2007281506 A JP2007281506 A JP 2007281506A JP 4871246 B2 JP4871246 B2 JP 4871246B2
Authority
JP
Japan
Prior art keywords
vector
quantization
representative
vector quantization
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007281506A
Other languages
English (en)
Other versions
JP2009111674A (ja
Inventor
誠之 高村
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007281506A priority Critical patent/JP4871246B2/ja
Publication of JP2009111674A publication Critical patent/JP2009111674A/ja
Application granted granted Critical
Publication of JP4871246B2 publication Critical patent/JP4871246B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は,音声や画像・映像を効率よく符号化する高能率マルチメディア信号符号化のための方法および装置に関する。
従来のベクトル符号化においては,代表ベクトルが空間内に規則的に位置するピラミッドベクトル量子化(非特許文献1参照),ラティスベクトル量子化,区分的一様ベクトル量子化(非特許文献2参照)や,代表ベクトルを学習により最適化し,結果としてそれらを空間内に不規則に配置する,良く知られたLBGアルゴリズム(非特許文献3参照)に基づくベクトル量子化,エントロピ拘束ベクトル量子化(非特許文献4参照)という方式がある。
エントロピ拘束ベクトル量子化は,別途与えられる未定乗数(λ)を元に,ラグランジュコストと呼ばれる値C,
C=D+λR (1)
を最小化するように,代表ベクトルを選択するものである(非特許文献4参照)。ここで,Dはベクトル量子化により発生する二乗誤差,Rは符号量(あるいはエントロピ)である。
Figure 0004871246
ここで,q(i)はベクトル量子化の結果の学習ベクトルxi が属する代表ベクトルの番号であり,vq(i)はその代表ベクトルである。p(vi )はベクトルvi の発生する確率を表す。また,‖x‖p は次式のようにベクトルxのLp ノルムを表す。次式のx(i)はベクトルxの第i番目の座標値を表す。
Figure 0004871246
これは,p=1のとき(L1 ノルム),ベクトル要素の絶対値和を示し,p=∞のとき(L∞ノルム;∞はLの右上添字,以下同様),ベクトル要素の絶対値の最大値を示す。
また,それらを融合したエントロピ拘束ラティスベクトル量子化(ECLVQ)という方法もある(非特許文献5参照)。これは格子全体を均等に拡大あるいは縮小し,ビットレートに応じた最適な拡大率を選択するものである。
しかしながら,従来のECLVQは最適化の余地が小さく,かつ演算が簡易な方式は知られていなかった。
例えば,画像の予測誤差信号は原点付近に信号が集中し,原点から離れるに従って疎になる。このような場合,代表ベクトルは原点から離れるに従い疎になる方が,符号量−歪みの関係からは好ましい。しかしながら,全格子を均等に拡大あるいは縮小するECLVQでは,そのような機構を実現できない。
なお,非特許文献6には,本発明の実施形態の説明で用いているL次元の超直方体表面における超平面の個数に関しての記載がある。
T.R.Fischer:"A pyramid vector quantizer",IEEE Trans. Inform. Theory,vol.IT-32 ,pp.568-583,1986. D.G.Jeong ,J.Gibson: "Uniform and Piecewise Uniform Lattice Vector Quantization for Memoryless. Gaussian and Laplacian Sources",IEEE Trans. ,1993,IT-39(3),pp.786-804. Y.Linde ,A.Buzo and R.M.Gray:"An algorithm for vector quantizer design",IEEE Trans. on Communications ,vol.com-28,no.1,pp.84-95,Jan. 1980 . P.A.Chou,T.Lookabaugh,and R.M.Gray: "Entropy-constrained vector quantization ",IEEE Trans. Acoust. Speech Signal Processing,vol.37,pp.31-42,Jan. 1989 . W.H.Kim ,Y.H.Hu,T.Nguyen: "Adaptive Wavelet Packet Basis For Entropy-Constrained Lattice Vector Quantizer (ECLVQ)",Proc. ICIP'97 ,vol.1 ,pp.656-659,Oct. 1997 . J.An,Y-P.Chen and Q.Xu:"Surface Spatial Index Structure of High-Dimensional Space ",Lecture Notes in Computer Science ,Volume 3177 ,pp.272-278,Oct ,2004.
ベクトル量子化では,量子化代表ベクトルの配置を任意とした場合が最も自由度が高く,理想的な(ラグランジュコストが小さくなる)ベクトル量子化となる。しかし,ベクトルの配置(設計)や量子化・符号化といった処理は,量子化代表ベクトルの個数に応じて増加するため,量子化代表ベクトルの個数は数千が限度である。例えば16次元で1[bit/sample]でベクトル量子化・符号化する場合,およそ216*1=65536個の代表ベクトルが必要であり,処理量が膨大になってしまう。
そこで,ピラミッドベクトル量子化のように格子点を基本としたベクトル量子化において,実用的に処理可能な範囲内で,より高い自由度でベクトル量子化を最適化する技術が望まれる。
本発明は上記問題点の解決を図り,高い符号化効率を実現でき,かつ処理が簡易であるベクトル量子化の技術を提供することを目的とする。
本発明は上記課題を解決し,ピラミッドベクトル量子化のように格子点を基本としたベクトル量子化において,エントロピ拘束型ベクトル量子化を,より高い自由度で最適化するため,代表ベクトルの配置(設計)における自由度として,代表ベクトル群の原点からの距離と,各距離に対して一対一に対応する分割数の2自由度を有することを,もっとも主要な特徴とする。
本発明において,上記代表ベクトル群の原点からの距離の尺度として,ベクトルの全要素の絶対値和を用いることができる。これは,L∞ノルムを距離尺度として用いることに相当する。
また,本発明は,原点からの距離の尺度として,ベクトルの全要素の絶対値の最大値を用いることもできる。これは,L1 ノルムを距離尺度として用いることに相当する。
本発明の特徴は,次のように捉えることもできる。すなわち,本発明は,エントロピ拘束型ベクトル量子化において,零ベクトルを量子化代表ベクトルの一つとして保持する手段と,量子化代表ベクトル群の原点からの距離を示すN個の半径ci (0≦i≦N−1,c0 <c1 <…<cN-1 となる実数)とN個の分割数Ki (2Ki は1以上の整数)を入力する手段と,あるi(0≦i≦N−1)において,間隔q=ci /Ki を得る手段と,ベクトルvの要素の絶対値のうち最大値がci であり,ベクトルvの要素の値が−ci +kq(kは整数,0≦k≦2Ki )となっているベクトルvを量子化代表ベクトルとする手段と,前記量子化代表ベクトルに基づきベクトル量子化または逆量子化を行う手段とを備えることを特徴とする。
また,本発明は,エントロピ拘束型ベクトル量子化において,零ベクトルを量子化代表ベクトルの一つとして保持する手段と,量子化代表ベクトル群の原点からの距離を示すN個の半径ci (0≦i≦N−1,c0 <c1 <…<cN-1 となる実数)とN個の分割数Ki (Ki は1以上の整数)を入力する手段と,あるi(0≦i≦N−1)において,間隔q=ci /Ki を得る手段と,ベクトルvの要素の絶対値の和がci であり,ベクトルvの要素の絶対値がkq(kは整数,0≦k≦Ki )となっているベクトルvを量子化代表ベクトルとする手段と,前記量子化代表ベクトルに基づきベクトル量子化または逆量子化を行う手段とを備えることを特徴とする。
本発明によれば,規則的・計算容易ながら従来よりもより柔軟な量子化代表ベクトルの配置を実現することができ,結果として,より低いラグランジュコスト,すなわち,より高い符号化効率を実現することができるようになる。
まず,本発明の実施形態についての考え方の概要を簡単に説明する。
・本発明では,量子化代表ベクトルの位置を,原点を中心とする多次元の立方体(超立方体)の表面に存在する格子点に限定する(図1,図2参照)。
・ただし,超立方体は複数存在し,その一辺の長さ(2ci )を可変とする(図8のフローチャートのステップ102)。また,格子点の間隔も,一辺の長さの整数(2K+1)分の1とし,これを可変とする(図8のフローチャートのステップ106)。
・このように量子化代表ベクトルの配置を規則的としながら,従来よりも自由度の高い配置をとること(図2,図7参照)により,量子化・符号化において,これら自由度の最適化を施すことで(図8のフローチャート全体),従来よりも低いラグランジュコストを実現する。
・量子化代表ベクトル多次元の立方体(超立方体)の表面に存在する格子点配置が規則的なため,量子化・逆量子化が簡易である。量子化自体は通常の四捨五入でできるほか,そのインデクスの列挙・符号化も,符号化方法においては,例えば図11のフローチャートのステップ401,403,404,405,406の5ステップに分割して高速に行うことができる。また,復号方法においても,図12のフローチャートのステップ501,504,505,506,507の5ステップに分割して高速に行える。
・処理が簡易なため,例えば,画像・映像符号化への適用においては,一旦設計した量子化代表ベクトルを画像・映像全体に使うのではなく,符号化単位毎に最適ベクトルの設計を繰り返し,適応設計することも可能で,さらに効率を高めることができる。この最適ベクトルの設計は,1次元最適化を繰り返すようになっているため,多次元探索よりも処理量のオーダーが小さい。例えば図8のフローチャートのステップ102,ステップ103,ステップ104,ステップ105,ステップ106は全て1変数を最適化しているのみで,処理が簡易である。
以下,本発明を実現するための基本的な仕組みについて詳細に説明する。
[1]距離尺度がL∞ノルムの場合
まず,距離尺度が最も単純なL∞ノルムの場合を例に説明する。この場合,格子(代表ベクトルに対応する)の分布は,図1のようになる。
[2]その一般化
本発明ではこれをより一般化し,図2に示すように,原点からの等確率面の距離(cn )と分割数(Kn )を自由に選択できるようにする。
0=c0 <c1 <c2 <... <ck (5)
0 =1, 2Ki ≧1(i>0) (6)
とする。
i ,Ki から代表ベクトルが一意に定まることに注意されたい。また,本モデルでは,Ki の値として,整数だけでなく小数部分が0.5のいわゆる半整数も扱える。以降,扱う空間をL次元とする。図2は2次元の例であるが,一般性は失われていない。
この一般化モデルにおいて,先ほどの図1は,
L=2,ci =i,Ki =i (7)
という特殊なケースに相当する。また,従来のECLVQは,格子点を単純に拡大した
i =αi,Ki =i (8)
という,特殊なケースに相当する。ここでαは格子の拡大率である。また同様の量子化に基づき若干自由度の増した方式(非特許文献2参照)も,部分的に半分・またその半分にした図3に示すようなケースに相当する。
i =2a a ,Ki =2b b (a,bは整数,ia ,ib は自然数)(9)
いずれも本モデルよりも自由度が著しく低い。
[3]代表ベクトルの設計
ここで,学習データとしてIn を用いる。これは,原点からの距離nに対応するデータの個数を表すものとする。nは適宜離散化されており,ここでは0以上の整数であるとしておく。
ここで,量子化境界ti を考える。原点からの距離nがti-1 ≦n<ti を満たす点は,ci の面内に分布する間隔ci /Ki の離散点のうち最も近い点に量子化されると仮定し,確率pi ,二乗誤差di を次のように見積もる。
Figure 0004871246
ただし,Iは全学習データ点数(=Σn n )である。
i番目の等確率面に量子化される学習データの平均二乗誤差を次のように近似する。
Figure 0004871246
ここで〔(ci /Ki 2 L/12〕の項は,L次元空間内において,間隔ci /Ki で各次元均等量子化した際の二乗誤差の期待値である。
i ,ti ,pi の空間的説明を図4に示す。
[4]ベクトル量子化
量子化境界を表すti は,厳密には,後に定義する符号量(ri )や歪み(di )を見積もるための目安であり,実際には,ベクトルv=(v1 ,v2 ,... ,vL )が与えられたときのベクトル量子化は,次のように行う:
1.ci-1 ≦‖v‖∞<ci を満たす整数iを求める(∞は右下添字),
2.ci-1 の等確率面内でvに最も近い代表ベクトルv′i-1 を求める,
3.ci の等確率面内でvに最も近い代表ベクトルv′i を求める,
4.‖v−v′i-1 2 +λri-1 ≦‖v−v′i 2 +λri ならば,v′i-1 を結果として出力;‖v−v′i-1 2 +λri-1 >‖v−v′i 2 +λri ならば,v′i を結果として出力する。
この模式図を図5に示す。上記で「ci の等確率面内でvに最も近い代表ベクトルv′i を求める」処理は,具体的に次のようになる:
Figure 0004871246
ただし,f(x)はスカラーxを四捨五入し,xがベクトルの場合はxの全要素を四捨五入する関数である。
Figure 0004871246
i番目の等確率面に対応する代表ベクトルの平均符号量より算出される,学習データの符号量は次のように見積もることができる。
Figure 0004871246
ここでN(L,Ki )はci の面に存在する格子点(一辺につき(2Ki +1)個)の総数を求める関数であり,Nとして次のN0 ()を用いることとする。これは,
0 (L,K)=(2K+1)L −(2K−1)L (16)
で与えられる。
以上述べたエントロピ拘束型ベクトル量子化方法は,すなわち,量子化代表ベクトル群の原点からの距離を示すN個の半径ci (0≦i≦N−1,c0 <c1 <…<cN-1 となる実数)とN個の分割数Ki (2Ki は1以上の整数)を入力するステップと,量子化すべきベクトルvを入力するステップと,前記ベクトルvの全要素の絶対値の最大値(L∞ノルム)がci-1 以上ci 未満となるような整数iを求めるステップと,間隔qi-1 =ci-1 /Ki-1 を得るステップと,L∞ノルムがci-1 でベクトル要素の値が−ci-1 +kqi-1 (kは整数,0≦k≦2Ki-1 )となるようなベクトルのうち,前記ベクトルvと最もユークリッド距離が近いベクトルv′i-1 を求めるステップと,間隔qi =ci /Ki を得るステップと,L∞ノルムがci でベクトル要素の値が−ci +kqi (kは整数,0≦k≦2Ki )となるようなベクトルのうち,前記ベクトルvと最もユークリッド距離が近いベクトルv′i を求めるステップと,前記ベクトルvを,前記ベクトルv′i-1 または前記ベクトルv′i のいずれにベクトル量子化した場合のラグランジュコストが小さいかを判定するステップと,より小さいラグランジュコストを与える前記ベクトルv′i-1 または前記ベクトルv′i を,前記ベクトルvのベクトル量子化結果として出力するステップとを有する。
本モデルにおけるエントロピ拘束型ベクトル量子化器の設計は,未定乗数λにより定まるラグランジュコスト
Figure 0004871246
を最小化するci ,Ki を求めることに相当する。例えば,次のような手順でこの最適化を行う。
[5]最適化アルゴリズム
1.外部よりラグランジュ未定乗数λを入力する。
2.Ki ,ti を適切に初期化する。C′を十分大きな値とする。
3.ci を区間(ti-1 ,ti )の重心として求める。
4.pi を第10式に従って求める。
5.ti を,‖ci −ti 2 2 +λri =‖ci+1 −ti 2 2 +λri+1 を満たすよう修正する。
6.現状のci ,pi ,ti よりラグランジュコストCを求める。
7.各iについて,Ki をKi +1と見倣した場合のコスト,Ki をKi −1と見倣した場合のコスト,および上記Cを比べ,最も小さなコスト値を与える値にKi をセットする。その最小コストを新たにCとする。
8.前回の値(C′)からの変化が十分少なければ(例えば|C−C′|/C<0.005),収束したと判断し終了する。そうでなければC′:=Cとして3に戻る。
[6]距離尺度がL1 ノルムの場合と一般化
次に,L1 ノルムの場合を例に説明する。この場合,格子(代表ベクトルに対応する)の分布は,図6のようになる。
より一般化されたモデルは,図7のようになる。
ここでNとしては,次のように漸化的に求められるN1 を用いる。
・K=1の場合:N1 (L,K)=2L ・L=1の場合:N1 (L,K)=2
・それ以外 :N1 (L,K)=N1 (L,K−1)+N1 (L−1,K−1)
+N1 (L−1,K)
その他の諸量の計算は,L∞ノルムの場合と同様である。
[7]ベクトル量子化
量子化は,次のようになる:
1.ci-1 ≦‖v‖1 <ci を満たす整数iを求める,
2.ci-1 の等確率面内でvに最も近い代表ベクトルv′i-1 を求める,
3.ci の等確率面内でvに最も近い代表ベクトルv′i を求める,
4.‖v−v′i-1 2 +λri-1 ≦‖v−v′i 2 +λri ならば,v′i-1 を結果として出力;‖v−v′i-1 2 +λri-1 >‖v−v′i 2 +λri ならば,v′i を結果として出力。
上記で「ci の等確率面内でvに最も近い代表ベクトルv′i を求める」処理は,具体的には次のようになる。
・vの各要素をci /Ki で割ったベクトルをv0 とする。ベクトルの各要素を四捨五入し整数化する作用素をf()とする。‖f(v0 )‖1 =Ki であれば終了。
・そうでなければ,vからsgn(v)方向へk(>0)だけ移動しながら‖f(v0 +k・sgn(v))‖1 =Ki となるようなkを探す。
ここで関数sgn(x)は,スカラーxの符号を返し,xがベクトルの場合には,xの全要素の符号を要素とするベクトルを返す関数である。
・x<0の場合:sgn(x)=−1
・x=0の場合:sgn(x)=0
・x>0の場合:sgn(x)=1 (19)
関数sgn()も同様に,スカラー,ベクトルいずれにも作用する関数とする。
具体的には,‖f(v0 )‖1 <Ki であれば,v0 の各要素の絶対値(|v0 (i)|)の小数部分gi のうち,gi <0.5を満たすうちで値の大きい上位‖f(V0 )‖1 −Ki 個に入る要素番号について,f(v0 )の該当要素をsgn(vj )だけ増加させる。
‖f(v0 )‖1 >Ki であれば,v0 の各要素の絶対値(|v0 (i)|)の小数部分gi のうち,gi ≧0.5を満たすうちで値の小さい上位‖Ki −f(v0 )‖1 個に入る要素番号について,f(v0 )の該当要素をsgn(vj )だけ減少させる。
以上述べたエントロピ拘束型ベクトル量子化方法は,すなわち,量子化代表ベクトル群の原点からの距離を示すN個の半径ci (0≦i≦N−1,c0 <c1 <…<cN-1 となる実数)とN個の分割数Ki (2Ki は1以上の整数)を入力するステップと,量子化すべきベクトルvを入力するステップと,前記ベクトルvの全要素の絶対値和(L1 ノルム)がci-1 以上ci 未満となるような整数iを求めるステップと,間隔qi-1 =ci-1 /Ki-1 を得るステップと,L1 ノルムがci-1 でベクトル要素の値が−ci-1 +kqi-1 (kは整数,0≦k≦2Ki-1 )となるようなベクトルのうち,前記ベクトルvと最もユークリッド距離が近いベクトルv′i-1 を求めるステップと,間隔qi =ci /Ki を得るステップと,L1 ノルムがci でベクトル要素の値が−ci +kqi (kは整数,0≦k≦2Ki )となるようなベクトルのうち,前記ベクトルvと最もユークリッド距離が近いベクトルv′i を求めるステップと,前記ベクトルvを,前記ベクトルv′i-1 または前記ベクトルv′i のいずれにベクトル量子化した場合のラグランジュコストが小さいかを判定するステップと,より小さいラグランジュコストを与える前記ベクトルv′i-1 または前記ベクトルv′i を,前記ベクトルvのベクトル量子化結果として出力するステップとを有する。
図8に,本発明の一実施形態を示す。基本的には先に述べた「最適化アルゴリズム」の処理を実施する。
まず,外部よりラグランジュ未定乗数λを入力し,メモリ100に記憶する。次に,初期化ステップ101において,C′,Ki ,ti を初期化する。次に,c設定ステップ102において,ci を区間(ti-1 ,ti )の重心として求める。次に,p設定ステップ103において,pi を第10式に従って求める。次に,t修正ステップ104において,ti を次式を満たすように修正する。
‖ci −ti 2 2 +λr1 =‖ci+1 −ti 2 2 +λri+1
次に,C算出ステップ105において,現状のci ,pi ,ti よりラグランジュコストCを求める。次に,K微修正・C算出ステップ106において,各iについて,Ki をKi +1と見倣した場合のコスト,Ki をKi −1と見倣した場合のコスト,および上記Cを比べ,最も小さなコスト値を与える値にKi をセットする。その最小コストを新たにCとする。次に,収束判定ステップ107において,前回の値(C′)からの変化が十分少なければ(|C−C′|/C<0.005),収束したと判断し終了する。そうでなければ,ステップ108においてC′:=Cとしてc設定ステップ102に戻る。
図9に,本発明の一実施形態のブロック図を示す。初期化器302は,信号端子301よりラグランジュ未定乗数λを入力し,これをメモリ303に蓄積すると同時に,C′,Ki ,ti を初期化する。次に,設定・修正器304にて,ci およびpi の設定,またメモリ303のλ値を参照しながらti の修正を行う。次に,コスト算出器305にて,ci ,pi ,ti よりラグランジュコストCを求める。次に,微修正器306にて,Kを±1しつつコスト算出器305にて求まるコストCが小さくなるKの値を採用する。次に,変化量算出器307において,|C−C′|/Cの値を算出する。次に,比較器308において,これが0.005より小さいかを判断し,小さければ出力端子309にci ,ti ,Ki を出力し,終了する。そうでなければ,設定・修正器304へ戻る。
[距離尺度がL∞ノルムの場合の格子点列挙方法]
次に,本実施形態におけるベクトル量子化による符号化および復号処理について,詳細に説明する。一辺の長さがJ−1のL次元の超直方体表面の間隔1の格子点の列挙方法は,以下のとおりである。
この超直方体の表面には,L−1次元,L−2次元,... ,2次元(平面),1次元(辺),0次元(頂点)と,様々な次元の「超平面」が存在する。それぞれの(L−i)次元(i=1... L)の超平面の個数は,2i Li ,として与えられる(非特許文献6 参照)。ただし, nm はn個からm個を選ぶ取り出し方の総数であり, nm =n!/((n−m)!m!)として与えられる。
そして,各超平面中の,端を除く格子点の数は(J−2)16-i個である。
L=16,J=5の場合のこれらの数を図10に一覧として示す。ちなみに,図10の右端の数は次元毎の超平面内の格子点の個数であり,その和は,
Figure 0004871246
となっている。この値は,別の形式である式(16)を用いて求まる格子点の数,
N(L,K)=516−316=152544843904 (ただしJ=2K+1)
に一致する。つまりこのように次元毎に分類することで,漏れなく超立方体表面の格子点が列挙できる。
ここでiは,与えられた代表ベクトルの座標値(全L個)のうち,絶対値がcn に等しいものの個数に一致する(残りのL−i個の座標値は絶対値がcn より小さい)。ここで,n番目の超立方体平面に着目しているとする。
[距離尺度がL∞ノルムの場合の符号化アルゴリズムの一例]
既にベクトル量子化は別述の手続きにより済んでいるとする。すなわち,符号化対象のデータが属する量子化代表ベクトルが確定しているものとする。量子化インデックスと量子化代表ベクトルとの対応情報が格納されたコードブックを利用して量子化インデックスを特定し,それを符号化することも考えられるが,次元数が多い場合に事前にコードブックを作成するのは膨大な量となるため現実的ではない。ここでの符号化対象データが対応する一つの量子化代表ベクトルの符号化アルゴリズムは次のようになる:
〔手順1〕まず,量子化代表ベクトルがどの超立方体表面に属するかという情報を,何番目かを示す番号nの生起確率p0 ,p1 ,... を用いて符号化する。内側からn番目だとすると,この符号量は−log2 n [bit]となる。
〔手順2〕もし,n=0であれば符号化処理を終了する。
〔手順3〕次に,超平面の次元数(L−i)を特定するための整数値iを表す情報を確率区間p=(2i Li (J−2)L-i )/N(L,K)を用いて符号化する。この符号量は−log2 p[bit]となる。
〔手順4〕L個の次元のうち,どのi個の次元の絶対値が最大値c=cn に等しいのかを特定する情報を符号化する。全部で Li 通りあるので,log2 Li [bit]となる。
〔手順5〕絶対値がcであるi個の座標値がそれぞれ正(c)か負(−c)のどちらかを特定する情報を各1[bit]を使い符号化する。例えば0なら正側,1なら負側とする。長さiの二進列なのでi[bit]となる。
〔手順6〕残るL−i個の座標値は,−c..cをJ等分し両端(−cとc)を除いた値のどれかに量子化されている。これはJ−2通りの値を取り得る。小さい方から順に0,1,2,…,J−3と番号を付け,生起確率が一様として,log2 (J−2)[bit]を用いて符号化する。これを残る軸の数(L−i)だけ繰り返す。符号量は(L−i)log2 (J−2)[bit]となる。なお,生起確率を予め定められた不均等分布とみなし,算術符号等で非等長符号化をしてもよい。
[距離尺度がL∞ノルムの場合の復号アルゴリズムの一例]
復号アルゴリズムは,次のようになる:
〔手順1〕生起確率p0 ,p1 ,... を用いて,整数値nを復号する。この情報から量子化代表ベクトルが内側からn番目の超立方体表面に属することがわかる。こうして復号代表ベクトル要素の絶対値最大値がc=cn であり,分割数がJ=2Kn +1とわかる。
〔手順2〕もしn=0であれば,代表ベクトルとして原点を出力し,復号処理を終了する。
〔手順3〕次に,生起確率分布N(L,K)/(2i Li (J−2)L-i )を用いて,整数値iを復号する。これは超平面の次元数(L−i)を特定する情報となる。
〔手順4〕log2 Li [bit]を復号し,L個の次元のうちどのi個の次元の絶対値がcに等しいのかを特定する情報を復号する。
〔手順5〕i[bit]を読み込み,そのi個の座標値の符号(正か負か)を決定する。例えばビットが0なら正(c),1なら負(−c)と確定する作業をi回繰り返す。
〔手順6〕残るL−i個の座標値を各軸log2 (J−2)[bit]を用いて確定する。具体的には0以上の整数値xを復号し,座標値を2c(x−(J−2)/2)/Jとして復号する。これを軸の数(L−i)だけ繰り返す。符号量は(L−i)log2 (J−2)[bit]となる。なお生起確率を予め定められた不均等分布とみなし,算術符号等で符号化をしてもよい。
この手続きにより,符号化された量子化代表ベクトルのL個の座標値が全て復元される。
[符号化フローチャート]
図11は,本実施形態によるベクトル量子化符号化方法の一例を示すフローチャートである。
まず,401の超立方体表面番号n符号化ステップにて,量子化代表ベクトルが内側から何番目の超立方体表面に属するかという情報を,番号nの生起確率p0 ,p1 ,... を用いて符号化する。
条件判断ステップ402でn=0か判定し,真であれば符号化処理を終了する。
次に,403の境界座標個数i符号化ステップにて,超平面の次元数(L−i)を特定するための整数値iを表す情報を,確率区間p=(2i Li (J−2)L-i )/N(L,K)を用いて符号化する。
次に,404の境界座標特定情報符号化ステップにて,被符号化代表ベクトルのL個の座標のうち,どのi個の次元の絶対値が最大値c=cn に等しいのかを特定する情報を符号化する。
次に,405の境界座標符号情報符号化ステップにて,絶対値がcであるi個の座標値がそれぞれ正(c)か負(−c)のどちらかを特定する情報を各1[bit]を使い符号化する。例えば0なら正側,1なら負側とする。
次に,406の残り座標値符号化ステップにて,残るL−i個の座標値が,−c..cをJ等分し両端(−cとc)を除いた値のどれかに量子化されているかを符号化する作業を残る軸の数(L−i)だけ繰り返す。
[復号フローチャート]
図12は,本実施形態によるベクトル量子化復号方法の一例を示すフローチャートである。
まず,501の超立方体表面番号n復号ステップにおいて,生起確率p0 ,p1 ,…を用いて,整数値nを復号する。この情報から量子化代表ベクトルが内側からn番目の超立方体表面に属することがわかる。こうして復号代表ベクトル要素の絶対値の最大値がc=cn であり,分割数がJ=2Kn +1とわかる。
次に,条件判断ステップ502でn=0か判定し,真であれば,503の0ベクトル出力ステップにて代表ベクトルとして原点を出力し,復号処理を終了する。
次に,504の境界座標個数i復号ステップにおいて,生起確率分布N(L,K)/(2i Li (J−2)L-i )を用いて,整数値iを復号する。これは超平面の次元数(L−i)を特定する情報となる。
次に,505の境界座標特定情報復号ステップにおいて,L個の次元のうちどのi個の次元の絶対値がcに等しいのかを特定する情報を復号する。
次に,506の境界座標符号情報復号ステップにおいて,そのi個の座標値の符号(正か負か)を決定する。例えば読み込んだビットが0なら正(c),1なら負(−c)と確定する。これをj回繰り返す。
次に,507の残り座標値復号ステップにおいて,残るL−i個の座標値を確定する。具体的には0以上の整数値xを復号し,座標値を2c(x−(J−2)/2)/Jとして復号する。これを軸の数(L−i)だけ繰り返す。
最後に,508のベクトル出力ステップにおいて,ここまでの作業で確定したL個の座標値をベクトルとして出力する。
以上,距離尺度がL∞ノルムの場合の符号化および復号処理の例を説明したが,距離尺度がL1 ノルムの場合にも,上記説明から同様に実施できることは明らかである。
以上のベクトル量子化の処理は,コンピュータとソフトウェアプログラムとによっても実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。
L∞がノルムにおいて最も単純な場合の代表ベクトルの配置例を示す図である。 L∞ノルムにおいて一般化された場合の代表ベクトルの配置例を示す図である。 区分的に均等な量子化の例を示す図である。 補助変数ci ,ti ,pi の空間的な説明図である。 ベクトル量子化の手順模式図である。 1 ノルムにおいて最も単純な場合の代表ベクトルの配置例を示す図である。 1 ノルムにおいて一般化された場合の代表ベクトルの配置例を示す図である。 本発明の一実施形態における処理の流れを示す図である。 本発明の一実施形態のブロック図である。 L=16,J=5の場合の,次元毎の超平面の数とその中の格子点の数を示す図である。 符号化処理の一例を示すフローチャートである。 復号処理の一例を示すフローチャートである。
符号の説明
301 信号端子
302 初期化器
303 メモリ
304 設定・修正器
305 コスト算出器
306 微修正器
307 変化量算出器
308 比較器
309 出力端子

Claims (4)

  1. ベクトル量子化符号化またはベクトル量子化復号における,規則的な量子化代表ベクトルの並びに基づくエントロピ拘束型ベクトル量子化方法であって,
    ラグランジュの未定乗数λを入力するステップと,
    量子化代表ベクトルの配置の自由度として,ベクトルの全要素の絶対値和または全要素の絶対値の最大値を距離尺度とする,量子化代表ベクトル群の原点からの距離と,前記各距離に対して一対一に対応する分割数との二自由度を有する量子化代表ベクトルを,与えられた学習データの前記ラグランジュの未定乗数λに基づく符号化コストが最適化されるように設定する最適化ステップと,
    前記設定された量子化代表ベクトルに基づき,符号化対象データのベクトル量子化または復号対象データのベクトル逆量子化を行う量子化処理ステップとを有する
    ことを特徴とするベクトル量子化方法。
  2. ベクトル量子化符号化またはベクトル量子化復号における,規則的な量子化代表ベクトルの並びに基づくエントロピ拘束型ベクトル量子化装置であって,
    ラグランジュの未定乗数λを入力する手段と,
    量子化代表ベクトルの配置の自由度として,ベクトルの全要素の絶対値和または全要素の絶対値の最大値を距離尺度とする,量子化代表ベクトル群の原点からの距離と,前記各距離に対して一対一に対応する分割数との二自由度を有する量子化代表ベクトルを,与えられた学習データの前記ラグランジュの未定乗数λに基づく符号化コストが最適化されるように設定する最適化手段と,
    前記設定された量子化代表ベクトルに基づき,符号化対象データのベクトル量子化または復号対象データのベクトル逆量子化を行う量子化処理手段とを備える
    ことを特徴とするベクトル量子化装置。
  3. 請求項1に記載のベクトル量子化方法を,コンピュータに実行させるためのベクトル量子化プログラム。
  4. 請求項1に記載のベクトル量子化方法を,コンピュータに実行させるためのベクトル量子化プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2007281506A 2007-10-30 2007-10-30 ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 Active JP4871246B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007281506A JP4871246B2 (ja) 2007-10-30 2007-10-30 ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007281506A JP4871246B2 (ja) 2007-10-30 2007-10-30 ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011236995A Division JP5032697B2 (ja) 2011-10-28 2011-10-28 ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2009111674A JP2009111674A (ja) 2009-05-21
JP4871246B2 true JP4871246B2 (ja) 2012-02-08

Family

ID=40779699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007281506A Active JP4871246B2 (ja) 2007-10-30 2007-10-30 ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4871246B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5888297B2 (ja) 2013-08-22 2016-03-16 トヨタ自動車株式会社 車両の制御装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3254109B2 (ja) * 1995-05-15 2002-02-04 株式会社エヌ・ティ・ティ・データ ベクトル量子化のための代表ベクトル生成方式及び方法
CA2388358A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
CN101292427B (zh) * 2005-09-23 2012-05-23 艾利森电话股份有限公司 用于矢量量化、编码、解码的方法及装置
KR101370018B1 (ko) * 2006-03-21 2014-03-06 오렌지 제한된 벡터 양자화
TWI388218B (zh) * 2007-10-30 2013-03-01 Nippon Telegraph & Telephone 影像編碼方法與解碼方法、其程式及記錄有程式的記錄媒體

Also Published As

Publication number Publication date
JP2009111674A (ja) 2009-05-21

Similar Documents

Publication Publication Date Title
US11153566B1 (en) Variable bit rate generative compression method based on adversarial learning
US11606560B2 (en) Image encoding and decoding, video encoding and decoding: methods, systems and training methods
Mentzer et al. Conditional probability models for deep image compression
CN107967517A (zh) 用于神经网络量化的方法和设备
Li et al. Compressing volumetric radiance fields to 1 mb
CN111818346A (zh) 图像编码方法和装置、图像解码方法和装置
WO2023051783A1 (zh) 一种编码方法、解码方法、装置、设备及可读存储介质
US20230300354A1 (en) Method and System for Image Compressing and Coding with Deep Learning
CN114402596B (zh) 神经网络模型解码方法、装置、系统和介质
US20200226797A1 (en) Systems and methods for image compression at multiple, different bitrates
CN103188494A (zh) 跳过离散余弦变换对深度图像编码/解码的设备和方法
CN110753225A (zh) 一种视频压缩方法、装置及终端设备
El-Nouby et al. Image compression with product quantized masked image modeling
Amjoun et al. Efficient compression of 3d dynamic mesh sequences
Zhang et al. Lvqac: Lattice vector quantization coupled with spatially adaptive companding for efficient learned image compression
EP4128059A1 (en) Quantization for neural networks
CN107231556B (zh) 一种图像云储存设备
JP4871246B2 (ja) ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体
JP5032697B2 (ja) ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体
CN106331719A (zh) 一种基于k‑l变换误差空间拆分的图像数据压缩方法
WO2020147971A1 (en) Training in communication systems
Shi et al. Variable-rate image compression based on side information compensation and r-λ model rate control
Hajizadeh et al. Predictive compression of animated 3D models by optimized weighted blending of key‐frames
CN112437300B (zh) 一种基于自适应区间重叠因子的分布式视频编码方法
Hwang et al. Genetic entropy-constrained vector quantizer design algorithm

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100331

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110805

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111115

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111118

R150 Certificate of patent or registration of utility model

Ref document number: 4871246

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350