JP4871246B2

JP4871246B2 - ベクトル量子化方法，装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number: JP4871246B2
Application number: JP2007281506A
Authority: JP
Inventors: 誠之高村; 由幸八島
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2007-10-30
Filing date: 2007-10-30
Publication date: 2012-02-08
Anticipated expiration: 2027-10-30
Also published as: JP2009111674A

Description

本発明は，音声や画像・映像を効率よく符号化する高能率マルチメディア信号符号化のための方法および装置に関する。

従来のベクトル符号化においては，代表ベクトルが空間内に規則的に位置するピラミッドベクトル量子化（非特許文献１参照），ラティスベクトル量子化，区分的一様ベクトル量子化（非特許文献２参照）や，代表ベクトルを学習により最適化し，結果としてそれらを空間内に不規則に配置する，良く知られたＬＢＧアルゴリズム（非特許文献３参照）に基づくベクトル量子化，エントロピ拘束ベクトル量子化（非特許文献４参照）という方式がある。

エントロピ拘束ベクトル量子化は，別途与えられる未定乗数（λ）を元に，ラグランジュコストと呼ばれる値Ｃ，
Ｃ＝Ｄ＋λＲ（１）
を最小化するように，代表ベクトルを選択するものである（非特許文献４参照）。ここで，Ｄはベクトル量子化により発生する二乗誤差，Ｒは符号量（あるいはエントロピ）である。

ここで，ｑ（ｉ）はベクトル量子化の結果の学習ベクトルｘ_iが属する代表ベクトルの番号であり，ｖ_q(i)はその代表ベクトルである。ｐ（ｖ_i）はベクトルｖ_iの発生する確率を表す。また，‖ｘ‖_pは次式のようにベクトルｘのＬ^pノルムを表す。次式のｘ（ｉ）はベクトルｘの第ｉ番目の座標値を表す。

これは，ｐ＝１のとき（Ｌ¹ノルム），ベクトル要素の絶対値和を示し，ｐ＝∞のとき（Ｌ∞ノルム；∞はＬの右上添字，以下同様），ベクトル要素の絶対値の最大値を示す。

また，それらを融合したエントロピ拘束ラティスベクトル量子化（ＥＣＬＶＱ）という方法もある（非特許文献５参照）。これは格子全体を均等に拡大あるいは縮小し，ビットレートに応じた最適な拡大率を選択するものである。

しかしながら，従来のＥＣＬＶＱは最適化の余地が小さく，かつ演算が簡易な方式は知られていなかった。

例えば，画像の予測誤差信号は原点付近に信号が集中し，原点から離れるに従って疎になる。このような場合，代表ベクトルは原点から離れるに従い疎になる方が，符号量−歪みの関係からは好ましい。しかしながら，全格子を均等に拡大あるいは縮小するＥＣＬＶＱでは，そのような機構を実現できない。

なお，非特許文献６には，本発明の実施形態の説明で用いているＬ次元の超直方体表面における超平面の個数に関しての記載がある。
T.R.Fischer:"A pyramid vector quantizer"，IEEE Trans. Inform. Theory，vol.IT-32 ，pp.568-583，1986. D.G.Jeong ，J.Gibson: "Uniform and Piecewise Uniform Lattice Vector Quantization for Memoryless. Gaussian and Laplacian Sources"，IEEE Trans. ，1993，IT-39(3)，pp.786-804． Y.Linde ，A.Buzo and R.M.Gray:"An algorithm for vector quantizer design"，IEEE Trans. on Communications ，vol.com-28，no.1，pp.84-95，Jan. 1980 ． P.A.Chou，T.Lookabaugh，and R.M.Gray: "Entropy-constrained vector quantization "，IEEE Trans. Acoust. Speech Signal Processing，vol.37，pp.31-42，Jan. 1989 ． W.H.Kim ，Y.H.Hu，T.Nguyen: "Adaptive Wavelet Packet Basis For Entropy-Constrained Lattice Vector Quantizer (ECLVQ)"，Proc. ICIP'97 ，vol.1 ，pp.656-659，Oct. 1997 ． J.An，Y-P.Chen and Q.Xu:"Surface Spatial Index Structure of High-Dimensional Space "，Lecture Notes in Computer Science ，Volume 3177 ，pp.272-278，Oct ，2004．

ベクトル量子化では，量子化代表ベクトルの配置を任意とした場合が最も自由度が高く，理想的な（ラグランジュコストが小さくなる）ベクトル量子化となる。しかし，ベクトルの配置（設計）や量子化・符号化といった処理は，量子化代表ベクトルの個数に応じて増加するため，量子化代表ベクトルの個数は数千が限度である。例えば１６次元で１［ｂｉｔ／ｓａｍｐｌｅ］でベクトル量子化・符号化する場合，およそ２^16*1＝６５５３６個の代表ベクトルが必要であり，処理量が膨大になってしまう。

そこで，ピラミッドベクトル量子化のように格子点を基本としたベクトル量子化において，実用的に処理可能な範囲内で，より高い自由度でベクトル量子化を最適化する技術が望まれる。

本発明は上記問題点の解決を図り，高い符号化効率を実現でき，かつ処理が簡易であるベクトル量子化の技術を提供することを目的とする。

本発明は上記課題を解決し，ピラミッドベクトル量子化のように格子点を基本としたベクトル量子化において，エントロピ拘束型ベクトル量子化を，より高い自由度で最適化するため，代表ベクトルの配置（設計）における自由度として，代表ベクトル群の原点からの距離と，各距離に対して一対一に対応する分割数との２自由度を有することを，もっとも主要な特徴とする。

本発明において，上記代表ベクトル群の原点からの距離の尺度として，ベクトルの全要素の絶対値和を用いることができる。これは，Ｌ∞ノルムを距離尺度として用いることに相当する。

また，本発明は，原点からの距離の尺度として，ベクトルの全要素の絶対値の最大値を用いることもできる。これは，Ｌ¹ノルムを距離尺度として用いることに相当する。

本発明の特徴は，次のように捉えることもできる。すなわち，本発明は，エントロピ拘束型ベクトル量子化において，零ベクトルを量子化代表ベクトルの一つとして保持する手段と，量子化代表ベクトル群の原点からの距離を示すＮ個の半径ｃ_i（０≦ｉ≦Ｎ−１，ｃ₀＜ｃ₁＜…＜ｃ_N-1となる実数）とＮ個の分割数Ｋ_i（２Ｋ_iは１以上の整数）を入力する手段と，あるｉ（０≦ｉ≦Ｎ−１）において，間隔ｑ＝ｃ_i／Ｋ_iを得る手段と，ベクトルｖの要素の絶対値のうち最大値がｃ_iであり，ベクトルｖの要素の値が−ｃ_i＋ｋｑ（ｋは整数，０≦ｋ≦２Ｋ_i）となっているベクトルｖを量子化代表ベクトルとする手段と，前記量子化代表ベクトルに基づきベクトル量子化または逆量子化を行う手段とを備えることを特徴とする。

また，本発明は，エントロピ拘束型ベクトル量子化において，零ベクトルを量子化代表ベクトルの一つとして保持する手段と，量子化代表ベクトル群の原点からの距離を示すＮ個の半径ｃ_i（０≦ｉ≦Ｎ−１，ｃ₀＜ｃ₁＜…＜ｃ_N-1となる実数）とＮ個の分割数Ｋ_i（Ｋ_iは１以上の整数）を入力する手段と，あるｉ（０≦ｉ≦Ｎ−１）において，間隔ｑ＝ｃ_i／Ｋ_iを得る手段と，ベクトルｖの要素の絶対値の和がｃ_iであり，ベクトルｖの要素の絶対値がｋｑ（ｋは整数，０≦ｋ≦Ｋ_i）となっているベクトルｖを量子化代表ベクトルとする手段と，前記量子化代表ベクトルに基づきベクトル量子化または逆量子化を行う手段とを備えることを特徴とする。

本発明によれば，規則的・計算容易ながら従来よりもより柔軟な量子化代表ベクトルの配置を実現することができ，結果として，より低いラグランジュコスト，すなわち，より高い符号化効率を実現することができるようになる。

まず，本発明の実施形態についての考え方の概要を簡単に説明する。

・本発明では，量子化代表ベクトルの位置を，原点を中心とする多次元の立方体（超立方体）の表面に存在する格子点に限定する（図１，図２参照）。

・ただし，超立方体は複数存在し，その一辺の長さ（２ｃ_i）を可変とする（図８のフローチャートのステップ１０２）。また，格子点の間隔も，一辺の長さの整数（２Ｋ＋１）分の１とし，これを可変とする（図８のフローチャートのステップ１０６）。

・このように量子化代表ベクトルの配置を規則的としながら，従来よりも自由度の高い配置をとること（図２，図７参照）により，量子化・符号化において，これら自由度の最適化を施すことで（図８のフローチャート全体），従来よりも低いラグランジュコストを実現する。

・量子化代表ベクトル多次元の立方体（超立方体）の表面に存在する格子点配置が規則的なため，量子化・逆量子化が簡易である。量子化自体は通常の四捨五入でできるほか，そのインデクスの列挙・符号化も，符号化方法においては，例えば図１１のフローチャートのステップ４０１，４０３，４０４，４０５，４０６の５ステップに分割して高速に行うことができる。また，復号方法においても，図１２のフローチャートのステップ５０１，５０４，５０５，５０６，５０７の５ステップに分割して高速に行える。

・処理が簡易なため，例えば，画像・映像符号化への適用においては，一旦設計した量子化代表ベクトルを画像・映像全体に使うのではなく，符号化単位毎に最適ベクトルの設計を繰り返し，適応設計することも可能で，さらに効率を高めることができる。この最適ベクトルの設計は，１次元最適化を繰り返すようになっているため，多次元探索よりも処理量のオーダーが小さい。例えば図８のフローチャートのステップ１０２，ステップ１０３，ステップ１０４，ステップ１０５，ステップ１０６は全て１変数を最適化しているのみで，処理が簡易である。

以下，本発明を実現するための基本的な仕組みについて詳細に説明する。

［１］距離尺度がＬ∞ノルムの場合
まず，距離尺度が最も単純なＬ∞ノルムの場合を例に説明する。この場合，格子（代表ベクトルに対応する）の分布は，図１のようになる。

［２］その一般化
本発明ではこれをより一般化し，図２に示すように，原点からの等確率面の距離（ｃ_n）と分割数（Ｋ_n）を自由に選択できるようにする。

０＝ｃ₀＜ｃ₁＜ｃ₂＜... ＜ｃ_k （５）
Ｋ₀＝１，２Ｋ_i≧１（ｉ＞０）（６）
とする。

ｃ_i，Ｋ_iから代表ベクトルが一意に定まることに注意されたい。また，本モデルでは，Ｋ_iの値として，整数だけでなく小数部分が０．５のいわゆる半整数も扱える。以降，扱う空間をＬ次元とする。図２は２次元の例であるが，一般性は失われていない。

この一般化モデルにおいて，先ほどの図１は，
Ｌ＝２，ｃ_i＝ｉ，Ｋ_i＝ｉ（７）
という特殊なケースに相当する。また，従来のＥＣＬＶＱは，格子点を単純に拡大した
ｃ_i＝αｉ，Ｋ_i＝ｉ（８）
という，特殊なケースに相当する。ここでαは格子の拡大率である。また同様の量子化に基づき若干自由度の増した方式（非特許文献２参照）も，部分的に半分・またその半分にした図３に示すようなケースに相当する。

ｃ_i＝２^aｉ_a，Ｋ_i＝２^bｉ_b （ａ，ｂは整数，ｉ_a，ｉ_bは自然数）（９）
いずれも本モデルよりも自由度が著しく低い。

［３］代表ベクトルの設計
ここで，学習データとしてＩ_nを用いる。これは，原点からの距離ｎに対応するデータの個数を表すものとする。ｎは適宜離散化されており，ここでは０以上の整数であるとしておく。

ここで，量子化境界ｔ_iを考える。原点からの距離ｎがｔ_i-1≦ｎ＜ｔ_iを満たす点は，ｃ_iの面内に分布する間隔ｃ_i／Ｋ_iの離散点のうち最も近い点に量子化されると仮定し，確率ｐ_i，二乗誤差ｄ_iを次のように見積もる。

ただし，Ｉは全学習データ点数（＝Σ_nＩ_n）である。

ｉ番目の等確率面に量子化される学習データの平均二乗誤差を次のように近似する。

ここで〔（ｃ_i／Ｋ_i）²Ｌ／１２〕の項は，Ｌ次元空間内において，間隔ｃ_i／Ｋ_iで各次元均等量子化した際の二乗誤差の期待値である。

ｃ_i，ｔ_i，ｐ_iの空間的説明を図４に示す。

［４］ベクトル量子化
量子化境界を表すｔ_iは，厳密には，後に定義する符号量（ｒ_i）や歪み（ｄ_i）を見積もるための目安であり，実際には，ベクトルｖ＝（ｖ₁，ｖ₂，... ，ｖ_L）が与えられたときのベクトル量子化は，次のように行う：
１．ｃ_i-1≦‖ｖ‖∞＜ｃ_iを満たす整数ｉを求める（∞は右下添字），
２．ｃ_i-1の等確率面内でｖに最も近い代表ベクトルｖ′_i-1を求める，
３．ｃ_iの等確率面内でｖに最も近い代表ベクトルｖ′_iを求める，
４．‖ｖ−ｖ′_i-1‖₂＋λｒ_i-1≦‖ｖ−ｖ′_i‖₂＋λｒ_iならば，ｖ′_i-1を結果として出力；‖ｖ−ｖ′_i-1‖₂＋λｒ_i-1＞‖ｖ−ｖ′_i‖₂＋λｒ_iならば，ｖ′_iを結果として出力する。

この模式図を図５に示す。上記で「ｃ_iの等確率面内でｖに最も近い代表ベクトルｖ′_iを求める」処理は，具体的に次のようになる：

ただし，ｆ（ｘ）はスカラーｘを四捨五入し，ｘがベクトルの場合はｘの全要素を四捨五入する関数である。

ｉ番目の等確率面に対応する代表ベクトルの平均符号量より算出される，学習データの符号量は次のように見積もることができる。

ここでＮ（Ｌ，Ｋ_i）はｃ_iの面に存在する格子点（一辺につき（２Ｋ_i＋１）個）の総数を求める関数であり，Ｎとして次のＮ₀（）を用いることとする。これは，
Ｎ₀（Ｌ，Ｋ）＝（２Ｋ＋１）^L−（２Ｋ−１）^L （１６）
で与えられる。

以上述べたエントロピ拘束型ベクトル量子化方法は，すなわち，量子化代表ベクトル群の原点からの距離を示すＮ個の半径ｃ_i（０≦ｉ≦Ｎ−１，ｃ₀＜ｃ₁＜…＜ｃ_N-1となる実数）とＮ個の分割数Ｋ_i（２Ｋ_iは１以上の整数）を入力するステップと，量子化すべきベクトルｖを入力するステップと，前記ベクトルｖの全要素の絶対値の最大値（Ｌ∞ノルム）がｃ_i-1以上ｃ_i未満となるような整数ｉを求めるステップと，間隔ｑ_i-1＝ｃ_i-1／Ｋ_i-1を得るステップと，Ｌ∞ノルムがｃ_i-1でベクトル要素の値が−ｃ_i-1＋ｋｑ_i-1（ｋは整数，０≦ｋ≦２Ｋ_i-1）となるようなベクトルのうち，前記ベクトルｖと最もユークリッド距離が近いベクトルｖ′_i-1を求めるステップと，間隔ｑ_i＝ｃ_i／Ｋ_iを得るステップと，Ｌ∞ノルムがｃ_iでベクトル要素の値が−ｃ_i＋ｋｑ_i（ｋは整数，０≦ｋ≦２Ｋ_i）となるようなベクトルのうち，前記ベクトルｖと最もユークリッド距離が近いベクトルｖ′_iを求めるステップと，前記ベクトルｖを，前記ベクトルｖ′_i-1または前記ベクトルｖ′_iのいずれにベクトル量子化した場合のラグランジュコストが小さいかを判定するステップと，より小さいラグランジュコストを与える前記ベクトルｖ′_i-1または前記ベクトルｖ′_iを，前記ベクトルｖのベクトル量子化結果として出力するステップとを有する。

本モデルにおけるエントロピ拘束型ベクトル量子化器の設計は，未定乗数λにより定まるラグランジュコスト

を最小化するｃ_i，Ｋ_iを求めることに相当する。例えば，次のような手順でこの最適化を行う。

［５］最適化アルゴリズム
１．外部よりラグランジュ未定乗数λを入力する。
２．Ｋ_i，ｔ_iを適切に初期化する。Ｃ′を十分大きな値とする。
３．ｃ_iを区間（ｔ_i-1，ｔ_i）の重心として求める。
４．ｐ_iを第１０式に従って求める。
５．ｔ_iを，‖ｃ_i−ｔ_i‖₂ ²＋λｒ_i＝‖ｃ_i+1−ｔ_i‖₂ ²＋λｒ_i+1を満たすよう修正する。
６．現状のｃ_i，ｐ_i，ｔ_iよりラグランジュコストＣを求める。
７．各ｉについて，Ｋ_iをＫ_i＋１と見倣した場合のコスト，Ｋ_iをＫ_i−１と見倣した場合のコスト，および上記Ｃを比べ，最も小さなコスト値を与える値にＫ_iをセットする。その最小コストを新たにＣとする。
８．前回の値（Ｃ′）からの変化が十分少なければ（例えば｜Ｃ−Ｃ′｜／Ｃ＜０．００５），収束したと判断し終了する。そうでなければＣ′：＝Ｃとして３に戻る。

［６］距離尺度がＬ¹ノルムの場合と一般化
次に，Ｌ¹ノルムの場合を例に説明する。この場合，格子（代表ベクトルに対応する）の分布は，図６のようになる。

より一般化されたモデルは，図７のようになる。

ここでＮとしては，次のように漸化的に求められるＮ₁を用いる。
・Ｋ＝１の場合：Ｎ₁（Ｌ，Ｋ）＝２Ｌ・Ｌ＝１の場合：Ｎ₁（Ｌ，Ｋ）＝２
・それ以外：Ｎ₁（Ｌ，Ｋ）＝Ｎ₁（Ｌ，Ｋ−１）＋Ｎ₁（Ｌ−１，Ｋ−１）
＋Ｎ₁（Ｌ−１，Ｋ）
その他の諸量の計算は，Ｌ∞ノルムの場合と同様である。

［７］ベクトル量子化
量子化は，次のようになる：
１．ｃ_i-1≦‖ｖ‖₁＜ｃ_iを満たす整数ｉを求める，
２．ｃ_i-1の等確率面内でｖに最も近い代表ベクトルｖ′_i-1を求める，
３．ｃ_iの等確率面内でｖに最も近い代表ベクトルｖ′_iを求める，
４．‖ｖ−ｖ′_i-1‖₂＋λｒ_i-1≦‖ｖ−ｖ′_i‖₂＋λｒ_iならば，ｖ′_i-1を結果として出力；‖ｖ−ｖ′_i-1‖₂＋λｒ_i-1＞‖ｖ−ｖ′_i‖₂＋λｒ_iならば，ｖ′_iを結果として出力。

上記で「ｃ_iの等確率面内でｖに最も近い代表ベクトルｖ′_iを求める」処理は，具体的には次のようになる。
・ｖの各要素をｃ_i／Ｋ_iで割ったベクトルをｖ₀とする。ベクトルの各要素を四捨五入し整数化する作用素をｆ（）とする。‖ｆ（ｖ₀）‖₁＝Ｋ_iであれば終了。
・そうでなければ，ｖからｓｇｎ（ｖ）方向へｋ（＞０）だけ移動しながら‖ｆ（ｖ₀＋ｋ・ｓｇｎ（ｖ））‖₁＝Ｋ_iとなるようなｋを探す。

ここで関数ｓｇｎ（ｘ）は，スカラーｘの符号を返し，ｘがベクトルの場合には，ｘの全要素の符号を要素とするベクトルを返す関数である。
・ｘ＜０の場合：ｓｇｎ（ｘ）＝−１
・ｘ＝０の場合：ｓｇｎ（ｘ）＝０
・ｘ＞０の場合：ｓｇｎ（ｘ）＝１（１９）
関数ｓｇｎ（）も同様に，スカラー，ベクトルいずれにも作用する関数とする。

具体的には，‖ｆ（ｖ₀）‖₁＜Ｋ_iであれば，ｖ₀の各要素の絶対値（｜ｖ₀（ｉ）｜）の小数部分ｇ_iのうち，ｇ_i＜０．５を満たすうちで値の大きい上位‖ｆ（Ｖ₀）‖₁−Ｋ_i個に入る要素番号について，ｆ（ｖ₀）の該当要素をｓｇｎ（ｖ_j）だけ増加させる。

‖ｆ（ｖ₀）‖₁＞Ｋ_iであれば，ｖ₀の各要素の絶対値（｜ｖ₀（ｉ）｜）の小数部分ｇ_iのうち，ｇ_i≧０．５を満たすうちで値の小さい上位‖Ｋ_i−ｆ（ｖ₀）‖₁個に入る要素番号について，ｆ（ｖ₀）の該当要素をｓｇｎ（ｖ_j）だけ減少させる。

以上述べたエントロピ拘束型ベクトル量子化方法は，すなわち，量子化代表ベクトル群の原点からの距離を示すＮ個の半径ｃ_i（０≦ｉ≦Ｎ−１，ｃ₀＜ｃ₁＜…＜ｃ_N-1となる実数）とＮ個の分割数Ｋ_i（２Ｋ_iは１以上の整数）を入力するステップと，量子化すべきベクトルｖを入力するステップと，前記ベクトルｖの全要素の絶対値和（Ｌ¹ノルム）がｃ_i-1以上ｃ_i未満となるような整数ｉを求めるステップと，間隔ｑ_i-1＝ｃ_i-1／Ｋ_i-1を得るステップと，Ｌ¹ノルムがｃ_i-1でベクトル要素の値が−ｃ_i-1＋ｋｑ_i-1（ｋは整数，０≦ｋ≦２Ｋ_i-1）となるようなベクトルのうち，前記ベクトルｖと最もユークリッド距離が近いベクトルｖ′_i-1を求めるステップと，間隔ｑ_i＝ｃ_i／Ｋ_iを得るステップと，Ｌ¹ノルムがｃ_iでベクトル要素の値が−ｃ_i＋ｋｑ_i（ｋは整数，０≦ｋ≦２Ｋ_i）となるようなベクトルのうち，前記ベクトルｖと最もユークリッド距離が近いベクトルｖ′_iを求めるステップと，前記ベクトルｖを，前記ベクトルｖ′_i-1または前記ベクトルｖ′_iのいずれにベクトル量子化した場合のラグランジュコストが小さいかを判定するステップと，より小さいラグランジュコストを与える前記ベクトルｖ′_i-1または前記ベクトルｖ′_iを，前記ベクトルｖのベクトル量子化結果として出力するステップとを有する。

図８に，本発明の一実施形態を示す。基本的には先に述べた「最適化アルゴリズム」の処理を実施する。

まず，外部よりラグランジュ未定乗数λを入力し，メモリ１００に記憶する。次に，初期化ステップ１０１において，Ｃ′，Ｋ_i，ｔ_iを初期化する。次に，ｃ設定ステップ１０２において，ｃ_iを区間（ｔ_i-1，ｔ_i）の重心として求める。次に，ｐ設定ステップ１０３において，ｐ_iを第１０式に従って求める。次に，ｔ修正ステップ１０４において，ｔ_iを次式を満たすように修正する。

‖ｃ_i−ｔ_i‖₂ ²＋λｒ₁＝‖ｃ_i+1−ｔ_i‖₂ ²＋λｒ_i+1
次に，Ｃ算出ステップ１０５において，現状のｃ_i，ｐ_i，ｔ_iよりラグランジュコストＣを求める。次に，Ｋ微修正・Ｃ算出ステップ１０６において，各ｉについて，Ｋ_iをＫ_i＋１と見倣した場合のコスト，Ｋ_iをＫ_i−１と見倣した場合のコスト，および上記Ｃを比べ，最も小さなコスト値を与える値にＫ_iをセットする。その最小コストを新たにＣとする。次に，収束判定ステップ１０７において，前回の値（Ｃ′）からの変化が十分少なければ（｜Ｃ−Ｃ′｜／Ｃ＜０．００５），収束したと判断し終了する。そうでなければ，ステップ１０８においてＣ′：＝Ｃとしてｃ設定ステップ１０２に戻る。

図９に，本発明の一実施形態のブロック図を示す。初期化器３０２は，信号端子３０１よりラグランジュ未定乗数λを入力し，これをメモリ３０３に蓄積すると同時に，Ｃ′，Ｋ_i，ｔ_iを初期化する。次に，設定・修正器３０４にて，ｃ_iおよびｐ_iの設定，またメモリ３０３のλ値を参照しながらｔ_iの修正を行う。次に，コスト算出器３０５にて，ｃ_i，ｐ_i，ｔ_iよりラグランジュコストＣを求める。次に，微修正器３０６にて，Ｋを±１しつつコスト算出器３０５にて求まるコストＣが小さくなるＫの値を採用する。次に，変化量算出器３０７において，｜Ｃ−Ｃ′｜／Ｃの値を算出する。次に，比較器３０８において，これが０．００５より小さいかを判断し，小さければ出力端子３０９にｃ_i，ｔ_i，Ｋ_iを出力し，終了する。そうでなければ，設定・修正器３０４へ戻る。

［距離尺度がＬ∞ノルムの場合の格子点列挙方法］
次に，本実施形態におけるベクトル量子化による符号化および復号処理について，詳細に説明する。一辺の長さがＪ−１のＬ次元の超直方体表面の間隔１の格子点の列挙方法は，以下のとおりである。

この超直方体の表面には，Ｌ−１次元，Ｌ−２次元，... ，２次元（平面），１次元（辺），０次元（頂点）と，様々な次元の「超平面」が存在する。それぞれの（Ｌ−ｉ）次元（ｉ＝１... Ｌ）の超平面の個数は，２ⁱ _LＣ_i，として与えられる（非特許文献６参照）。ただし，_nＣ_mはｎ個からｍ個を選ぶ取り出し方の総数であり，_nＣ_m＝ｎ！／（（ｎ−ｍ）！ｍ！）として与えられる。

そして，各超平面中の，端を除く格子点の数は（Ｊ−２）^16-i個である。

Ｌ＝１６，Ｊ＝５の場合のこれらの数を図１０に一覧として示す。ちなみに，図１０の右端の数は次元毎の超平面内の格子点の個数であり，その和は，

となっている。この値は，別の形式である式（１６）を用いて求まる格子点の数，
Ｎ（Ｌ，Ｋ）＝５¹⁶−３¹⁶＝１５２５４４８４３９０４（ただしＪ＝２Ｋ＋１）
に一致する。つまりこのように次元毎に分類することで，漏れなく超立方体表面の格子点が列挙できる。

ここでｉは，与えられた代表ベクトルの座標値（全Ｌ個）のうち，絶対値がｃ_nに等しいものの個数に一致する（残りのＬ−ｉ個の座標値は絶対値がｃ_nより小さい）。ここで，ｎ番目の超立方体平面に着目しているとする。

［距離尺度がＬ∞ノルムの場合の符号化アルゴリズムの一例］
既にベクトル量子化は別述の手続きにより済んでいるとする。すなわち，符号化対象のデータが属する量子化代表ベクトルが確定しているものとする。量子化インデックスと量子化代表ベクトルとの対応情報が格納されたコードブックを利用して量子化インデックスを特定し，それを符号化することも考えられるが，次元数が多い場合に事前にコードブックを作成するのは膨大な量となるため現実的ではない。ここでの符号化対象データが対応する一つの量子化代表ベクトルの符号化アルゴリズムは次のようになる：
〔手順１〕まず，量子化代表ベクトルがどの超立方体表面に属するかという情報を，何番目かを示す番号ｎの生起確率ｐ₀，ｐ₁，... を用いて符号化する。内側からｎ番目だとすると，この符号量は−ｌｏｇ₂ｐ_n［ｂｉｔ］となる。
〔手順２〕もし，ｎ＝０であれば符号化処理を終了する。
〔手順３〕次に，超平面の次元数（Ｌ−ｉ）を特定するための整数値ｉを表す情報を確率区間ｐ＝（２ⁱ _LＣ_i（Ｊ−２）^L-i）／Ｎ（Ｌ，Ｋ）を用いて符号化する。この符号量は−ｌｏｇ₂ｐ［ｂｉｔ］となる。
〔手順４〕Ｌ個の次元のうち，どのｉ個の次元の絶対値が最大値ｃ＝ｃ_nに等しいのかを特定する情報を符号化する。全部で_LＣ_i通りあるので，ｌｏｇ_{2 L}Ｃ_i［ｂｉｔ］となる。
〔手順５〕絶対値がｃであるｉ個の座標値がそれぞれ正（ｃ）か負（−ｃ）のどちらかを特定する情報を各１［ｂｉｔ］を使い符号化する。例えば０なら正側，１なら負側とする。長さｉの二進列なのでｉ［ｂｉｔ］となる。
〔手順６〕残るＬ−ｉ個の座標値は，−ｃ..ｃをＪ等分し両端（−ｃとｃ）を除いた値のどれかに量子化されている。これはＪ−２通りの値を取り得る。小さい方から順に０，１，２，…，Ｊ−３と番号を付け，生起確率が一様として，ｌｏｇ₂（Ｊ−２）［ｂｉｔ］を用いて符号化する。これを残る軸の数（Ｌ−ｉ）だけ繰り返す。符号量は（Ｌ−ｉ）ｌｏｇ₂（Ｊ−２）［ｂｉｔ］となる。なお，生起確率を予め定められた不均等分布とみなし，算術符号等で非等長符号化をしてもよい。

［距離尺度がＬ∞ノルムの場合の復号アルゴリズムの一例］
復号アルゴリズムは，次のようになる：
〔手順１〕生起確率ｐ₀，ｐ₁，... を用いて，整数値ｎを復号する。この情報から量子化代表ベクトルが内側からｎ番目の超立方体表面に属することがわかる。こうして復号代表ベクトル要素の絶対値最大値がｃ＝ｃ_nであり，分割数がＪ＝２Ｋ_n＋１とわかる。
〔手順２〕もしｎ＝０であれば，代表ベクトルとして原点を出力し，復号処理を終了する。
〔手順３〕次に，生起確率分布Ｎ（Ｌ，Ｋ）／（２ⁱ _LＣ_i（Ｊ−２）^L-i）を用いて，整数値ｉを復号する。これは超平面の次元数（Ｌ−ｉ）を特定する情報となる。
〔手順４〕ｌｏｇ_{2 L}Ｃ_i［ｂｉｔ］を復号し，Ｌ個の次元のうちどのｉ個の次元の絶対値がｃに等しいのかを特定する情報を復号する。
〔手順５〕ｉ［ｂｉｔ］を読み込み，そのｉ個の座標値の符号（正か負か）を決定する。例えばビットが０なら正（ｃ），１なら負（−ｃ）と確定する作業をｉ回繰り返す。
〔手順６〕残るＬ−ｉ個の座標値を各軸ｌｏｇ₂（Ｊ−２）［ｂｉｔ］を用いて確定する。具体的には０以上の整数値ｘを復号し，座標値を２ｃ（ｘ−（Ｊ−２）／２）／Ｊとして復号する。これを軸の数（Ｌ−ｉ）だけ繰り返す。符号量は（Ｌ−ｉ）ｌｏｇ₂（Ｊ−２）［ｂｉｔ］となる。なお生起確率を予め定められた不均等分布とみなし，算術符号等で符号化をしてもよい。

この手続きにより，符号化された量子化代表ベクトルのＬ個の座標値が全て復元される。

［符号化フローチャート］
図１１は，本実施形態によるベクトル量子化符号化方法の一例を示すフローチャートである。

まず，４０１の超立方体表面番号ｎ符号化ステップにて，量子化代表ベクトルが内側から何番目の超立方体表面に属するかという情報を，番号ｎの生起確率ｐ₀，ｐ₁，... を用いて符号化する。

条件判断ステップ４０２でｎ＝０か判定し，真であれば符号化処理を終了する。

次に，４０３の境界座標個数ｉ符号化ステップにて，超平面の次元数（Ｌ−ｉ）を特定するための整数値ｉを表す情報を，確率区間ｐ＝（２ⁱ _LＣ_i（Ｊ−２）^L-i）／Ｎ（Ｌ，Ｋ）を用いて符号化する。

次に，４０４の境界座標特定情報符号化ステップにて，被符号化代表ベクトルのＬ個の座標のうち，どのｉ個の次元の絶対値が最大値ｃ＝ｃ_nに等しいのかを特定する情報を符号化する。

次に，４０５の境界座標符号情報符号化ステップにて，絶対値がｃであるｉ個の座標値がそれぞれ正（ｃ）か負（−ｃ）のどちらかを特定する情報を各１［ｂｉｔ］を使い符号化する。例えば０なら正側，１なら負側とする。

次に，４０６の残り座標値符号化ステップにて，残るＬ−ｉ個の座標値が，−ｃ..ｃをＪ等分し両端（−ｃとｃ）を除いた値のどれかに量子化されているかを符号化する作業を残る軸の数（Ｌ−ｉ）だけ繰り返す。

［復号フローチャート］
図１２は，本実施形態によるベクトル量子化復号方法の一例を示すフローチャートである。

まず，５０１の超立方体表面番号ｎ復号ステップにおいて，生起確率ｐ₀，ｐ₁，…を用いて，整数値ｎを復号する。この情報から量子化代表ベクトルが内側からｎ番目の超立方体表面に属することがわかる。こうして復号代表ベクトル要素の絶対値の最大値がｃ＝ｃ_nであり，分割数がＪ＝２Ｋ_n＋１とわかる。

次に，条件判断ステップ５０２でｎ＝０か判定し，真であれば，５０３の０ベクトル出力ステップにて代表ベクトルとして原点を出力し，復号処理を終了する。

次に，５０４の境界座標個数ｉ復号ステップにおいて，生起確率分布Ｎ（Ｌ，Ｋ）／（２ⁱ _LＣ_i（Ｊ−２）^L-i）を用いて，整数値ｉを復号する。これは超平面の次元数（Ｌ−ｉ）を特定する情報となる。

次に，５０５の境界座標特定情報復号ステップにおいて，Ｌ個の次元のうちどのｉ個の次元の絶対値がｃに等しいのかを特定する情報を復号する。

次に，５０６の境界座標符号情報復号ステップにおいて，そのｉ個の座標値の符号（正か負か）を決定する。例えば読み込んだビットが０なら正（ｃ），１なら負（−ｃ）と確定する。これをｊ回繰り返す。

次に，５０７の残り座標値復号ステップにおいて，残るＬ−ｉ個の座標値を確定する。具体的には０以上の整数値ｘを復号し，座標値を２ｃ（ｘ−（Ｊ−２）／２）／Ｊとして復号する。これを軸の数（Ｌ−ｉ）だけ繰り返す。

最後に，５０８のベクトル出力ステップにおいて，ここまでの作業で確定したＬ個の座標値をベクトルとして出力する。

以上，距離尺度がＬ∞ノルムの場合の符号化および復号処理の例を説明したが，距離尺度がＬ¹ノルムの場合にも，上記説明から同様に実施できることは明らかである。

以上のベクトル量子化の処理は，コンピュータとソフトウェアプログラムとによっても実現することができ，そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも，ネットワークを通して提供することも可能である。

Ｌ∞がノルムにおいて最も単純な場合の代表ベクトルの配置例を示す図である。Ｌ∞ノルムにおいて一般化された場合の代表ベクトルの配置例を示す図である。区分的に均等な量子化の例を示す図である。補助変数ｃ_i，ｔ_i，ｐ_iの空間的な説明図である。ベクトル量子化の手順模式図である。Ｌ¹ノルムにおいて最も単純な場合の代表ベクトルの配置例を示す図である。Ｌ¹ノルムにおいて一般化された場合の代表ベクトルの配置例を示す図である。本発明の一実施形態における処理の流れを示す図である。本発明の一実施形態のブロック図である。Ｌ＝１６，Ｊ＝５の場合の，次元毎の超平面の数とその中の格子点の数を示す図である。符号化処理の一例を示すフローチャートである。復号処理の一例を示すフローチャートである。

符号の説明

３０１信号端子
３０２初期化器
３０３メモリ
３０４設定・修正器
３０５コスト算出器
３０６微修正器
３０７変化量算出器
３０８比較器
３０９出力端子

Claims

ベクトル量子化符号化またはベクトル量子化復号における，規則的な量子化代表ベクトルの並びに基づくエントロピ拘束型ベクトル量子化方法であって，
ラグランジュの未定乗数λを入力するステップと，
量子化代表ベクトルの配置の自由度として，ベクトルの全要素の絶対値和または全要素の絶対値の最大値を距離尺度とする，量子化代表ベクトル群の原点からの距離と，前記各距離に対して一対一に対応する分割数との二自由度を有する量子化代表ベクトルを，与えられた学習データの前記ラグランジュの未定乗数λに基づく符号化コストが最適化されるように設定する最適化ステップと，
前記設定された量子化代表ベクトルに基づき，符号化対象データのベクトル量子化または復号対象データのベクトル逆量子化を行う量子化処理ステップとを有する
ことを特徴とするベクトル量子化方法。
ベクトル量子化符号化またはベクトル量子化復号における，規則的な量子化代表ベクトルの並びに基づくエントロピ拘束型ベクトル量子化装置であって，
ラグランジュの未定乗数λを入力する手段と，
量子化代表ベクトルの配置の自由度として，ベクトルの全要素の絶対値和または全要素の絶対値の最大値を距離尺度とする，量子化代表ベクトル群の原点からの距離と，前記各距離に対して一対一に対応する分割数との二自由度を有する量子化代表ベクトルを，与えられた学習データの前記ラグランジュの未定乗数λに基づく符号化コストが最適化されるように設定する最適化手段と，
前記設定された量子化代表ベクトルに基づき，符号化対象データのベクトル量子化または復号対象データのベクトル逆量子化を行う量子化処理手段とを備える
ことを特徴とするベクトル量子化装置。
請求項１に記載のベクトル量子化方法を，コンピュータに実行させるためのベクトル量子化プログラム。
請求項１に記載のベクトル量子化方法を，コンピュータに実行させるためのベクトル量子化プログラムを記録したコンピュータ読み取り可能な記録媒体。