JP4871246B2 - ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP4871246B2 JP4871246B2 JP2007281506A JP2007281506A JP4871246B2 JP 4871246 B2 JP4871246 B2 JP 4871246B2 JP 2007281506 A JP2007281506 A JP 2007281506A JP 2007281506 A JP2007281506 A JP 2007281506A JP 4871246 B2 JP4871246 B2 JP 4871246B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- quantization
- representative
- vector quantization
- quantized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
C=D+λR (1)
を最小化するように,代表ベクトルを選択するものである(非特許文献4参照)。ここで,Dはベクトル量子化により発生する二乗誤差,Rは符号量(あるいはエントロピ)である。
T.R.Fischer:"A pyramid vector quantizer",IEEE Trans. Inform. Theory,vol.IT-32 ,pp.568-583,1986. D.G.Jeong ,J.Gibson: "Uniform and Piecewise Uniform Lattice Vector Quantization for Memoryless. Gaussian and Laplacian Sources",IEEE Trans. ,1993,IT-39(3),pp.786-804. Y.Linde ,A.Buzo and R.M.Gray:"An algorithm for vector quantizer design",IEEE Trans. on Communications ,vol.com-28,no.1,pp.84-95,Jan. 1980 . P.A.Chou,T.Lookabaugh,and R.M.Gray: "Entropy-constrained vector quantization ",IEEE Trans. Acoust. Speech Signal Processing,vol.37,pp.31-42,Jan. 1989 . W.H.Kim ,Y.H.Hu,T.Nguyen: "Adaptive Wavelet Packet Basis For Entropy-Constrained Lattice Vector Quantizer (ECLVQ)",Proc. ICIP'97 ,vol.1 ,pp.656-659,Oct. 1997 . J.An,Y-P.Chen and Q.Xu:"Surface Spatial Index Structure of High-Dimensional Space ",Lecture Notes in Computer Science ,Volume 3177 ,pp.272-278,Oct ,2004.
まず,距離尺度が最も単純なL∞ノルムの場合を例に説明する。この場合,格子(代表ベクトルに対応する)の分布は,図1のようになる。
本発明ではこれをより一般化し,図2に示すように,原点からの等確率面の距離(cn )と分割数(Kn )を自由に選択できるようにする。
K0 =1, 2Ki ≧1(i>0) (6)
とする。
L=2,ci =i,Ki =i (7)
という特殊なケースに相当する。また,従来のECLVQは,格子点を単純に拡大した
ci =αi,Ki =i (8)
という,特殊なケースに相当する。ここでαは格子の拡大率である。また同様の量子化に基づき若干自由度の増した方式(非特許文献2参照)も,部分的に半分・またその半分にした図3に示すようなケースに相当する。
いずれも本モデルよりも自由度が著しく低い。
ここで,学習データとしてIn を用いる。これは,原点からの距離nに対応するデータの個数を表すものとする。nは適宜離散化されており,ここでは0以上の整数であるとしておく。
量子化境界を表すti は,厳密には,後に定義する符号量(ri )や歪み(di )を見積もるための目安であり,実際には,ベクトルv=(v1 ,v2 ,... ,vL )が与えられたときのベクトル量子化は,次のように行う:
1.ci-1 ≦‖v‖∞<ci を満たす整数iを求める(∞は右下添字),
2.ci-1 の等確率面内でvに最も近い代表ベクトルv′i-1 を求める,
3.ci の等確率面内でvに最も近い代表ベクトルv′i を求める,
4.‖v−v′i-1 ‖2 +λri-1 ≦‖v−v′i ‖2 +λri ならば,v′i-1 を結果として出力;‖v−v′i-1 ‖2 +λri-1 >‖v−v′i ‖2 +λri ならば,v′i を結果として出力する。
N0 (L,K)=(2K+1)L −(2K−1)L (16)
で与えられる。
1.外部よりラグランジュ未定乗数λを入力する。
2.Ki ,ti を適切に初期化する。C′を十分大きな値とする。
3.ci を区間(ti-1 ,ti )の重心として求める。
4.pi を第10式に従って求める。
5.ti を,‖ci −ti ‖2 2 +λri =‖ci+1 −ti ‖2 2 +λri+1 を満たすよう修正する。
6.現状のci ,pi ,ti よりラグランジュコストCを求める。
7.各iについて,Ki をKi +1と見倣した場合のコスト,Ki をKi −1と見倣した場合のコスト,および上記Cを比べ,最も小さなコスト値を与える値にKi をセットする。その最小コストを新たにCとする。
8.前回の値(C′)からの変化が十分少なければ(例えば|C−C′|/C<0.005),収束したと判断し終了する。そうでなければC′:=Cとして3に戻る。
次に,L1 ノルムの場合を例に説明する。この場合,格子(代表ベクトルに対応する)の分布は,図6のようになる。
・K=1の場合:N1 (L,K)=2L ・L=1の場合:N1 (L,K)=2
・それ以外 :N1 (L,K)=N1 (L,K−1)+N1 (L−1,K−1)
+N1 (L−1,K)
その他の諸量の計算は,L∞ノルムの場合と同様である。
量子化は,次のようになる:
1.ci-1 ≦‖v‖1 <ci を満たす整数iを求める,
2.ci-1 の等確率面内でvに最も近い代表ベクトルv′i-1 を求める,
3.ci の等確率面内でvに最も近い代表ベクトルv′i を求める,
4.‖v−v′i-1 ‖2 +λri-1 ≦‖v−v′i ‖2 +λri ならば,v′i-1 を結果として出力;‖v−v′i-1 ‖2 +λri-1 >‖v−v′i ‖2 +λri ならば,v′i を結果として出力。
・vの各要素をci /Ki で割ったベクトルをv0 とする。ベクトルの各要素を四捨五入し整数化する作用素をf()とする。‖f(v0 )‖1 =Ki であれば終了。
・そうでなければ,vからsgn(v)方向へk(>0)だけ移動しながら‖f(v0 +k・sgn(v))‖1 =Ki となるようなkを探す。
・x<0の場合:sgn(x)=−1
・x=0の場合:sgn(x)=0
・x>0の場合:sgn(x)=1 (19)
関数sgn()も同様に,スカラー,ベクトルいずれにも作用する関数とする。
次に,C算出ステップ105において,現状のci ,pi ,ti よりラグランジュコストCを求める。次に,K微修正・C算出ステップ106において,各iについて,Ki をKi +1と見倣した場合のコスト,Ki をKi −1と見倣した場合のコスト,および上記Cを比べ,最も小さなコスト値を与える値にKi をセットする。その最小コストを新たにCとする。次に,収束判定ステップ107において,前回の値(C′)からの変化が十分少なければ(|C−C′|/C<0.005),収束したと判断し終了する。そうでなければ,ステップ108においてC′:=Cとしてc設定ステップ102に戻る。
次に,本実施形態におけるベクトル量子化による符号化および復号処理について,詳細に説明する。一辺の長さがJ−1のL次元の超直方体表面の間隔1の格子点の列挙方法は,以下のとおりである。
N(L,K)=516−316=152544843904 (ただしJ=2K+1)
に一致する。つまりこのように次元毎に分類することで,漏れなく超立方体表面の格子点が列挙できる。
既にベクトル量子化は別述の手続きにより済んでいるとする。すなわち,符号化対象のデータが属する量子化代表ベクトルが確定しているものとする。量子化インデックスと量子化代表ベクトルとの対応情報が格納されたコードブックを利用して量子化インデックスを特定し,それを符号化することも考えられるが,次元数が多い場合に事前にコードブックを作成するのは膨大な量となるため現実的ではない。ここでの符号化対象データが対応する一つの量子化代表ベクトルの符号化アルゴリズムは次のようになる:
〔手順1〕まず,量子化代表ベクトルがどの超立方体表面に属するかという情報を,何番目かを示す番号nの生起確率p0 ,p1 ,... を用いて符号化する。内側からn番目だとすると,この符号量は−log2 pn [bit]となる。
〔手順2〕もし,n=0であれば符号化処理を終了する。
〔手順3〕次に,超平面の次元数(L−i)を特定するための整数値iを表す情報を確率区間p=(2i LCi (J−2)L-i )/N(L,K)を用いて符号化する。この符号量は−log2 p[bit]となる。
〔手順4〕L個の次元のうち,どのi個の次元の絶対値が最大値c=cn に等しいのかを特定する情報を符号化する。全部で LCi 通りあるので,log2 LCi [bit]となる。
〔手順5〕絶対値がcであるi個の座標値がそれぞれ正(c)か負(−c)のどちらかを特定する情報を各1[bit]を使い符号化する。例えば0なら正側,1なら負側とする。長さiの二進列なのでi[bit]となる。
〔手順6〕残るL−i個の座標値は,−c..cをJ等分し両端(−cとc)を除いた値のどれかに量子化されている。これはJ−2通りの値を取り得る。小さい方から順に0,1,2,…,J−3と番号を付け,生起確率が一様として,log2 (J−2)[bit]を用いて符号化する。これを残る軸の数(L−i)だけ繰り返す。符号量は(L−i)log2 (J−2)[bit]となる。なお,生起確率を予め定められた不均等分布とみなし,算術符号等で非等長符号化をしてもよい。
復号アルゴリズムは,次のようになる:
〔手順1〕生起確率p0 ,p1 ,... を用いて,整数値nを復号する。この情報から量子化代表ベクトルが内側からn番目の超立方体表面に属することがわかる。こうして復号代表ベクトル要素の絶対値最大値がc=cn であり,分割数がJ=2Kn +1とわかる。
〔手順2〕もしn=0であれば,代表ベクトルとして原点を出力し,復号処理を終了する。
〔手順3〕次に,生起確率分布N(L,K)/(2i LCi (J−2)L-i )を用いて,整数値iを復号する。これは超平面の次元数(L−i)を特定する情報となる。
〔手順4〕log2 LCi [bit]を復号し,L個の次元のうちどのi個の次元の絶対値がcに等しいのかを特定する情報を復号する。
〔手順5〕i[bit]を読み込み,そのi個の座標値の符号(正か負か)を決定する。例えばビットが0なら正(c),1なら負(−c)と確定する作業をi回繰り返す。
〔手順6〕残るL−i個の座標値を各軸log2 (J−2)[bit]を用いて確定する。具体的には0以上の整数値xを復号し,座標値を2c(x−(J−2)/2)/Jとして復号する。これを軸の数(L−i)だけ繰り返す。符号量は(L−i)log2 (J−2)[bit]となる。なお生起確率を予め定められた不均等分布とみなし,算術符号等で符号化をしてもよい。
図11は,本実施形態によるベクトル量子化符号化方法の一例を示すフローチャートである。
図12は,本実施形態によるベクトル量子化復号方法の一例を示すフローチャートである。
302 初期化器
303 メモリ
304 設定・修正器
305 コスト算出器
306 微修正器
307 変化量算出器
308 比較器
309 出力端子
Claims (4)
- ベクトル量子化符号化またはベクトル量子化復号における,規則的な量子化代表ベクトルの並びに基づくエントロピ拘束型ベクトル量子化方法であって,
ラグランジュの未定乗数λを入力するステップと,
量子化代表ベクトルの配置の自由度として,ベクトルの全要素の絶対値和または全要素の絶対値の最大値を距離尺度とする,量子化代表ベクトル群の原点からの距離と,前記各距離に対して一対一に対応する分割数との二自由度を有する量子化代表ベクトルを,与えられた学習データの前記ラグランジュの未定乗数λに基づく符号化コストが最適化されるように設定する最適化ステップと,
前記設定された量子化代表ベクトルに基づき,符号化対象データのベクトル量子化または復号対象データのベクトル逆量子化を行う量子化処理ステップとを有する
ことを特徴とするベクトル量子化方法。 - ベクトル量子化符号化またはベクトル量子化復号における,規則的な量子化代表ベクトルの並びに基づくエントロピ拘束型ベクトル量子化装置であって,
ラグランジュの未定乗数λを入力する手段と,
量子化代表ベクトルの配置の自由度として,ベクトルの全要素の絶対値和または全要素の絶対値の最大値を距離尺度とする,量子化代表ベクトル群の原点からの距離と,前記各距離に対して一対一に対応する分割数との二自由度を有する量子化代表ベクトルを,与えられた学習データの前記ラグランジュの未定乗数λに基づく符号化コストが最適化されるように設定する最適化手段と,
前記設定された量子化代表ベクトルに基づき,符号化対象データのベクトル量子化または復号対象データのベクトル逆量子化を行う量子化処理手段とを備える
ことを特徴とするベクトル量子化装置。 - 請求項1に記載のベクトル量子化方法を,コンピュータに実行させるためのベクトル量子化プログラム。
- 請求項1に記載のベクトル量子化方法を,コンピュータに実行させるためのベクトル量子化プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007281506A JP4871246B2 (ja) | 2007-10-30 | 2007-10-30 | ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007281506A JP4871246B2 (ja) | 2007-10-30 | 2007-10-30 | ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011236995A Division JP5032697B2 (ja) | 2011-10-28 | 2011-10-28 | ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009111674A JP2009111674A (ja) | 2009-05-21 |
JP4871246B2 true JP4871246B2 (ja) | 2012-02-08 |
Family
ID=40779699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007281506A Active JP4871246B2 (ja) | 2007-10-30 | 2007-10-30 | ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4871246B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5888297B2 (ja) | 2013-08-22 | 2016-03-16 | トヨタ自動車株式会社 | 車両の制御装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3254109B2 (ja) * | 1995-05-15 | 2002-02-04 | 株式会社エヌ・ティ・ティ・データ | ベクトル量子化のための代表ベクトル生成方式及び方法 |
CA2388358A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
CN101292427B (zh) * | 2005-09-23 | 2012-05-23 | 艾利森电话股份有限公司 | 用于矢量量化、编码、解码的方法及装置 |
KR101370018B1 (ko) * | 2006-03-21 | 2014-03-06 | 오렌지 | 제한된 벡터 양자화 |
TWI388218B (zh) * | 2007-10-30 | 2013-03-01 | Nippon Telegraph & Telephone | 影像編碼方法與解碼方法、其程式及記錄有程式的記錄媒體 |
-
2007
- 2007-10-30 JP JP2007281506A patent/JP4871246B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009111674A (ja) | 2009-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11153566B1 (en) | Variable bit rate generative compression method based on adversarial learning | |
US11606560B2 (en) | Image encoding and decoding, video encoding and decoding: methods, systems and training methods | |
Mentzer et al. | Conditional probability models for deep image compression | |
CN107967517A (zh) | 用于神经网络量化的方法和设备 | |
Li et al. | Compressing volumetric radiance fields to 1 mb | |
CN111818346A (zh) | 图像编码方法和装置、图像解码方法和装置 | |
WO2023051783A1 (zh) | 一种编码方法、解码方法、装置、设备及可读存储介质 | |
US20230300354A1 (en) | Method and System for Image Compressing and Coding with Deep Learning | |
CN114402596B (zh) | 神经网络模型解码方法、装置、系统和介质 | |
US20200226797A1 (en) | Systems and methods for image compression at multiple, different bitrates | |
CN103188494A (zh) | 跳过离散余弦变换对深度图像编码/解码的设备和方法 | |
CN110753225A (zh) | 一种视频压缩方法、装置及终端设备 | |
El-Nouby et al. | Image compression with product quantized masked image modeling | |
Amjoun et al. | Efficient compression of 3d dynamic mesh sequences | |
Zhang et al. | Lvqac: Lattice vector quantization coupled with spatially adaptive companding for efficient learned image compression | |
EP4128059A1 (en) | Quantization for neural networks | |
CN107231556B (zh) | 一种图像云储存设备 | |
JP4871246B2 (ja) | ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 | |
JP5032697B2 (ja) | ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体 | |
CN106331719A (zh) | 一种基于k‑l变换误差空间拆分的图像数据压缩方法 | |
WO2020147971A1 (en) | Training in communication systems | |
Shi et al. | Variable-rate image compression based on side information compensation and r-λ model rate control | |
Hajizadeh et al. | Predictive compression of animated 3D models by optimized weighted blending of key‐frames | |
CN112437300B (zh) | 一种基于自适应区间重叠因子的分布式视频编码方法 | |
Hwang et al. | Genetic entropy-constrained vector quantizer design algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100331 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110621 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110805 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110830 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111115 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4871246 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141125 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |