JP2007259306A - 予測器及び画像符号化器 - Google Patents

予測器及び画像符号化器 Download PDF

Info

Publication number
JP2007259306A
JP2007259306A JP2006083873A JP2006083873A JP2007259306A JP 2007259306 A JP2007259306 A JP 2007259306A JP 2006083873 A JP2006083873 A JP 2006083873A JP 2006083873 A JP2006083873 A JP 2006083873A JP 2007259306 A JP2007259306 A JP 2007259306A
Authority
JP
Japan
Prior art keywords
pixel
value
gradient
encoding
context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006083873A
Other languages
English (en)
Inventor
Seiichiro Kamata
清一郎 鎌田
Kaiko To
海江 唐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Waseda University
Original Assignee
Waseda University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Waseda University filed Critical Waseda University
Priority to JP2006083873A priority Critical patent/JP2007259306A/ja
Publication of JP2007259306A publication Critical patent/JP2007259306A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】任意方向のエッジが存在する場合でもエッジ方向に適応した予測を行うことが可能な予測器を提供する。
【解決手段】予測の参照領域の各画素に対し、水平,垂直,45°対角,−45°対角方向に隣接する画素対の加重平均を各方向の勾配とする。対象画素に対し、水平,垂直,45°対角,−45°対角方向の各方向に隣接する4つの隣接画素のうち少なくとも2つの画素の画素値の加重平均を演算し、当該加重平均を対象画素の画素値の予測値として出力する。このとき、加重平均において、各画素の画素値の重みを、その画素の隣接方向の勾配の逆数に比例させる。
【選択図】図1

Description

本発明は、可逆画像符号化の技術に関し、特に、二次元画像を予測符号化により符号化する画像符号化技術に関する。
従来、二次元画像を符号化する画像符号化技術としては、低複雑度可逆画像圧縮法(low complexity lossless compression for images :以下「LOCO-I」という。非特許文献1,7参照)や、コンテキスト・ベース適応型非可逆符号化器(context-based, adaptive, lossless image coder :以下「CALIC」という。非特許文献2参照)などが開発されている。LOCO-Iは、JPEG−LS規格の基礎とされた技術であり、現在のところ、圧縮性能と計算量との間で最もよく釣り合いのとれた画像符号化方法である(非特許文献3参照)。一方、CALICは、ここ数年において圧縮比に関するベンチマークとして使用されてきた画像符号化方法であり、計算量も比較的少ない方法である。画像符号化の分野において、これらの方法は、技術進歩を測る上での工程目標(Milestone)として広く受け入れられている。
以下、LOCO-Iの予測器として用いられているMED(median edge detector)とCALICの予測器として用いられているGAP(gradient adjusted predictor)について説明する。
MEDとGAPは、画像をラスタ走査しながら現在の画素の画素値の予測を行う。画素値の予測においては、次の3つの仮定を基礎としている。
(1)予測する画素は局所的なエッジに沿って存在する。
(2)実際の予測値は、局所的なエッジの強度によって調整される。
(3)局所的なエッジの向きと強度は、簡単な局所的な勾配情報に関する走査済みの画素の情報を取り入れることによって検出される。
LOCO−IにおけるMEDでは、座標(x,y)の対象画素p(x, y)に対して、走査済みの最隣接画素p(x-1,y),p(x,y-1),p(x-1,y-1)からなる参照テンプレート(causal template)に基づいて、垂直方向又は水平方向のエッジ検出を行い、対象画素p(x, y)の画素値P(x, y)の予測が行われる。具体的には、予測値P^(x, y)は次式に基づいて計算される。
Figure 2007259306
ここで、W,N,NWは、それぞれ、画素p(x-1,y),p(x,y-1),p(x-1,y-1)の画素値を表す(図1参照)。
一方、CALICの予測フェーズで使用されるGAPにおいては、先に走査された画素の勾配情報を取り入れて予測が行われる。GAPにおいて、現在のピクセルにおける画素強度関数の水平方向及び垂直方向の勾配の大きさdh,dvは、次式に基づいて計算される。
Figure 2007259306
ここで、W,N,NW,NE,WW,NN,NNEは、それぞれ、画素p(x-1,y),p(x,y-1),p(x-1,y-1),p(x+1,y-1),p(x-2,y),p(x,y-2),p(x+1,y-2)の画素値を表す。
そして、これらの勾配の大きさdh,dvの差分に基づいて、7つの予測方法の何れかを選択し、対象画素p(x, y)の画素値xの予測が行われる。具体的には、この手順は次のようなアルゴリズムにより実行される。
Figure 2007259306
ここで、閾値dth1, dth2, dth3, dth4, dth5は実験的に求められる値である。これらの係数を選ぶにあたっては、計算の容易さを考慮する必要もある。画素値が0〜255の値をとるとすれば、一般に各閾値はdth1=80, dth2=32, dth3=8, dth4=32, dth5=8 が用いられている。
M. J.Weinberger, G. Seroussi, and G. Sapiro, "The LOCO-I lossless image compression algorithm: Principles and standardization into JPEG-LS," IEEE Trans. Image Process., vol. 9, pp. 1309-1324, Aug. 2000. X. Wu and N. D. Memon, "Context-based, adaptive, lossless image coding," IEEE Trans. Commun., vol. 45, pp. 437-444, Apr. 1997. B. Carpentieri, M. J. Weinberger and G. Seroussi, "Lossless compression of continuous-tone image", Proceedings of the IEEE, vol.88, No. 11, November 2000. B. Carpentieri, M. J. Weinberger and G. Seroussi, "Lossless compression of continuous-tone image", Proceedings of the IEEE, vol.88, No. 11, November 2000. X. Wu, "Efficient lossless compression of continuous-tone images via context selection and quantization," IEEE Trans. Image Process., vol. 6, pp. 656-664, May 1997. S.P. Lloyd, "Least squares quantization in PCM," IEEE Trans. Inform. Theory, IT-28, pp. 127-135, March 1982. N. Memon and X. Wu, "Recent developments in context-based predictive techniques for lossless image compression," Comput. J., vol. 40, no. 2/3, pp. 127--136, 1997. Ian H. Witten and Radford Neal, "Calgary arithmetic coding", [online], 2005年11月28日, Ian H. Witten, Rasford M. Neal, and Jhon G. Cleary, [平成18年3月15日検索], インターネット<URL : ftp://ftp.cpsc.ucalgary.ca/pub/projects/arithmetic.coding> Witten, I.H., Neal, R. and Cleary, J.G., "Arithmetic coding for data compression," Communication of the ACM, 30(6), pp.520-540, June 1987.
まず、上述したMEDの予測値を算出する式(1)について考察する。式(1)の右辺の最初の2段は、3つの隣接画素の最小値又は最大値がNWである場合には、対象画素はエッジ上に存在することが想定されていると考えることができる。想定されるエッジが水平であるか垂直であるかは、W,Nのうちどちらが最大であるかにより判定される。条件NW≧max(N,W)が満たされている場合、max(N,W)=Wの場合は垂直エッジ、max(N,W)=Nの場合は水平エッジが想定されると考える。同様に、条件NW≦min(N,W)が満たされている場合、min(N,W)=Wの場合は垂直エッジ、min(N,W)=Nの場合は水平エッジが想定されると考える。そして、想定されるエッジが水平の場合には対象画素p(x, y)の予測値P(x, y)^としてWが用いられ、想定されるエッジが水平の場合にはNが用いられる。
式(1)の右辺の3段目はそれ以外の場合、すなわち、条件min(N,W)≦NW≦max(N,W)の場合である。MEDにおいては、この場合は、エッジがあるか否かの判定はできない。仮に、エッジが存在したとしても、その方向を適切に判定するのは困難である。そこで、MEDでは、この場合、式(1)の右辺3段目に示したように、予測値としてN+W−NWを選択している。実際、この予測値N+W−NWは、あらゆる条件に対して極めてバランスのよい予測値となっている。
見方を変えると、MEDは、N,W,N+W+NWのうち最良のもの又は2番目に最良のものを常に選択しているといえる。最初の2つは対象画素p(x, y)の隣接画素である。また、N+W+NWは、画像の水平軸、垂直軸、及び画素値の軸で規定された三次元空間において、4つの画素(参照テンプレート及び対象画素p(x, y))が1平面上にあると仮定して、空間外挿を行ったものである。
一方、CALICの予測器も、対象画素における水平エッジ又は垂直エッジに基づいて予測を行っていると考えることができる。
式(2a),(2b)のdh及びdvは、水平方向及び垂直方向に近接する画素の強度関数の勾配を評価するスケーリング・ファクターである。dh及びdvの値は、局所エッジがある場合に予測性能を向上させるために、入力画像におけるエッジの大きさと方向を検出して、後の予測において必要な調整をするために使用される。各方向の勾配の評価には、3つの絶対値差が使用されている。
勾配評価において、代数的な差の計算ではなく絶対値差が使用されている理由は、異符号の値同士でキャンセルするのを防ぐためである。また、(数3)における閾値dth1, dth2, dth3, dth4, dth5は実験的に選ばれる。また、これらの閾値は、計算の容易さも重視して選択される。
しかしながら、LOCO-IとCALICにおいて採用された上記予測法は、予測値を計算する際に、予測テンプレートにおいて水平エッジと垂直エッジのみしか考慮されない。これは、予測の基礎となる画素が局所的な予測テンプレートに制限されている場合、近接領域の周辺の画素強度の変化が常に上記2種類のエッジにより表現できるという意味では論理的である。すなわち、多数の水平エッジと垂直エッジを組み合わせることによって、いかなる画像における任意の形状又はエッジの線を発生させることができる。しかし、ここで重要なのは、2つのエッジによる表現が、予測誤差を十分最小化するほどに正確となるか否かということである。上述した2つの予測方法においては、予測テンプレートの中に対角線エッジが存在する場合、生じる誤差が不必要に大きくなることが予想される。
そこで、本発明の目的は、予測テンプレートの中に任意方向のエッジが存在する場合においてもエッジ方向に適応した予測を行うことにより、従来よりも高精度で画素値の予測を行うことが可能な予測器、及びそれを用いた画像符号化器を提供することにある。
ここでは、まず、本発明の考え方の基礎となる高精度勾配選択予測器(accurate gradient selection predictor:以下「AGSP」という。)とそれを用いた画像符号化器について説明し、その後、本発明の構成及び作用について説明する。
〔1〕本発明の基本的な考え方
〔1−1〕高精度勾配選択予測器(AGSP)
上記従来の予測器における方法では、予測対象の画素毎に、固定の線形予測量が選択される。このとき、垂直方向の勾配と水平方向の勾配との差分を粗く量子化して、局所的なテクスチャを分類し、その分類に従って線形予測量が選択される。
しかしながら、この方法ではすべての種類の局所的なテクスチャの性質に対して予測器を十分に適応させることはできない。
そこで、本発明の予測器においては、より高精度で動的に局所的なテクスチャに予測器を適応させるようにすることを考える。そのために、垂直方向と水平方向の画素値関数の勾配に加えて、本発明ではそれ以外の任意の方向の画素値関数の勾配も評価して予測を行えるようにする。
さらに、勾配の評価においては、対象画素(current pixel)と各参照画素(causal pixel)との距離も考慮する。例えば、画素対{p(x+1,y-1), p(x+1,y-2)}は画素対{p(x,y-1), p(x,y-2)}よりも対象画素p(x,y)から離れているので、|NN-N|は|NE-NNE|よりも勾配に対しての寄与度は大きい。また、画素対が対象画素から著しく離れている場合には、その画素対は予測に対してはノイズ的な効果をもたらすに過ぎないと考えられる。
以上のような仮定のもとで、ここでは、新たに提案する高精度勾配選択予測器(AGSP)を提案する。AGSPは、従来の垂直エッジか水平エッジかの選択に替えて、局所的なテクスチャの優位な方向の検出を行う。以下、AGSPにおける予測方法について説明する。
まず、AGSPにおいては、局所的なテクスチャの情報を精度よく得るために、図2に示すように、対象画素p(x,y)の周りの4方向(垂直方向,水平方向,45°対角方向,−45°対角方向)で勾配の計算を行う。さらに、勾配の評価がノイズに対してロバストとなるように、図1に示した対象画素p(x,y)の周辺の走査済みの9つの画素を参照テンプレート(causal template)として用いる。また、対象画素は、高い確率で、それに隣接する優位なテクスチャに従うであろうという仮定をする。
この仮定に従うと、対象画素の予測においては、勾配の大きさがより小さい方向の隣接画素ほど、より大きな寄与をもたらすといえる。各方向の勾配の評価は、各参照画素間の絶対値差を対象画素方向に補外することによって計算することができる。また、対象画素から大きく離れた画素対については考慮しないこととする。以上の事項を考慮して、垂直方向,水平方向,45°対角方向,−45°対角方向の各方向に対する勾配d1, d2, d3, d4を、次式により評価する。
Figure 2007259306
一方、上述したとおり、勾配に対する各画素対の絶対値差の寄与率は、対象画素からの距離によって異なるべきである。そこで、一つの方向の勾配は、この方向に沿った各画素対の絶対値差の加重和として計算する。各画素対の重み係数は、計算量を考慮して、当該画素対の画素のうち対象画素から最も近い画素までのマンハッタン距離の逆数で定義する。
例えば、画素対{p(x-2, y-1), p(x-1, y-1)}と考える。p(x-2, y-1)から対象画素p(x, y)までのマンハッタン距離は3であり、p(x-1, y-1)から対象画素p(x, y)までのマンハッタン距離は2である。従って、対象画素から最も近い画素はp(x-1, y-1)であり、絶対値差|NWW-NW|の重み係数は1/2となる。
AGSPにおいては、図1に示した参照テンプレート内の画素対のみが勾配に寄与すると考える。従って、取り得る重み係数の値は、1又は1/2である。従って、簡単な規格化を行うことによって、勾配d1', d2', d3', d4'として次式が得られる。
Figure 2007259306
4つの勾配を比較する必要があるため、上記式(4a)〜(4d)の4つの加重和を1に規格化する。さらに、どのような勾配であっても0として評価される事態を避けるため(後述の式(7)に特異点が生じることを防止するため)、勾配の各項に1を加える。最終的に、対象画素の近傍における画素値関数の勾配の評価は次式で定義される勾配D1, D2, D3, D4を用いて行う。
Figure 2007259306
勾配D1の方向は水平方向、勾配D2の方向は垂直方向、勾配D3の方向は45°対角方向、勾配D4の方向は−45°対角方向である。
AGSPでは、参照テンプレート内の各画素値を用いて計算されるこれらの勾配D1, D2, D3, D4を比較して、対象画素p(x, y)に隣接する4つの際隣接画素p(x-1, y), p(x, y-1), p(x+1, y-1), p(x-1, y-1)の寄与率の大きさを決定し、対象画素p(x, y)の画素値P(x, y)の予測を行う。このとき、勾配の大きさが小さい方向の最隣接画素ほど寄与率が大きくなるようにする。
尚、勾配D1, D2, D3, D4の方向の対象画素p(x, y)の最隣接画素は、それぞれ、p(x-1, y), p(x, y-1), p(x+1, y-1), p(x-1, y-1)である。
本発明者は、各種の入力画像を用いて計算機実験を行った結果、勾配が最小の方向と2番目に小さい方向の2つの最隣接画素を用いて対象画素の画素値予測を行った場合に最もよい結果が得られることが判った。
そこで、AGSPにおいては、上記勾配D1, D2, D3, D4のうち、最小のものと2番目に小さいものを選択し、これを勾配Dmin, Dmin2とする。
Figure 2007259306
また、勾配Dmin, Dmin2の方向の最隣接画素の画素値を、それぞれCmin, Cmin2とする。例えば、もしDmin=D1, Dmin2=D2ならばCmin=W, Cmin2=Nである。
対象画素p(x, y)の画素値の予測は、これら2つの最隣接画素Cmin, Cmin2を用いて行う。対象画素p(x, y)の予測画素値P^(x, y)は、次式のようにCmin, Cmin2の加重平均を用いて計算する。
Figure 2007259306
ここで、勾配の大きさが小さい方向の最隣接画素ほど寄与率が大きくなるようにするため、Cmin, Cmin2の重み係数は、それぞれ、Dmin2/(Dmin+Dmin2), Dmin/(Dmin+Dmin2)とした。例えば、もしDmin=D2, Dmin2=D4ならばP^(x, y)=(D2NW+D4N)/(D2+D4)となる。
最後に、AGSPの計算量を評価するため、GAPとの比較を行う。まず、両予測器とも、勾配の評価、勾配の比較、及び予測値の決定という3つのステップから構成される。最初のステップは、式(5)と式(2)を比較すると、AGSPはGAPに比べて4倍程度の解散を必要とすることが分かる。第2番目のステップでは、AGSPはGAPとほぼ等しい計算量を要する。最後のステップにおいても、2つの予測器はほぼ等しい計算量を要する。従って、AGSPの計算量は、勾配評価の計算のみ計算量を必要とする点を除いて、GAPとほぼ等しい。
〔1−2〕画像符号化器
次に、上記AGSPを用いて構成される画像符号化器について説明する。本発明の画像符号化器は、入力画像の画素をラスタ走査しながら、各対象画素p(x, y)について上記AGSPにより画素値予測を行い、予測値P^(x, y)と実際の画素値P(x, y)との予測誤差e(x, y)を計算する。そして、予測誤差e(x, y)をエントロピー符号化により符号化することによって、入力画像を符号化する。このエントロピー符号化においては、コンテキスト・モデルによる対象画素の分類を行い、分類ごとに異なるハフマン・テーブルを用いてエントロピー符号化を行うことにより、符号化効率を向上させる。ここで、「コンテキスト(context)」とは、画素パターンの類似性を示す指標をいう。
予測器において、画像の冗長性が完全に除去されれば、予測誤差は対象画素周辺のコンテキストの種類によらず常にランダムである。しかしながら、一般に、特定の予測器は絶えず同じコンテキストにおいて同じ予測誤差を繰り返すことが知られている。これは、予測段階において、画像の冗長性を完全に除去することはできないことを意味している(特許文献4参照)。
例えば、入力画像全体の予測誤差の度数分布をとった場合、図3(a)のような度数分布が得られたとする。画像の冗長性が完全に除去されていれば、入力画像のどの部分領域の予測誤差の度数分布をとっても図3(a)と同様の分布が得られるはずである。しかしながら、実際には、予測後にも画像の冗長性は残るため、画像内において画素値関数の勾配が緩やかな領域(以下「平坦領域」という。)では、予測誤差の度数分布は図3(b)のように0付近に集中し、画像内のエッジ領域の部分の度数分布は図3(c)のように0付近で極小となり正負のある値付近にピークを有するような分布となる。
もし、予測誤差をコンテキストに高い精度で適合させることができれば、圧縮利得をさらに向上させることが可能となる。
上述のような画素値関数の勾配やエッジの方向、又はテクスチャなどのような多くの画像の特徴は、予測誤差の分布をモデル化するための情報として非常に有用である(非特許文献5参照)。そこで、本発明においては、テクスチャ,勾配,及び誤差エネルギーの3タイプのコンテキストの組み合わせを用いて、各画素の周辺のコンテキスト・モデルを構成する。
(1)テクスチャ・コンテキスト
対象画素p(x, y)のテクスチャ・コンテキストを次式(8)のように定義する。
Figure 2007259306
ここで、表記の都合上、C1=W, C2=N, C3=NW, C4=NEとおく。次に、C(x,y)のすべてのピクセルの平均値μtを計算する。
Figure 2007259306
このμtを参照値として、次式によりテクスチャ・コンテキストT(x,y)を計算する。
Figure 2007259306
ここで、T(x,y)は4ビットのバイナリ・ベクトルである。T(x,y)の各要素Tiは、平均値μtを基準として、各隣接画素Ciの画素値が平均値μtより大きいか否かで類別した分類情報となっている。このテクスチャ・コンテキストT(x,y)をコンテキストC(x,y)の類別に用いることとする。
(2)勾配コンテキスト
同様に、勾配コンテキストG(x, y)を、次式(12)により定義する。
Figure 2007259306
ここで、各Diは上記式(5a)〜(5d)により定義され、μdは次式(14)により定義されるDiの平均値である。
Figure 2007259306
(3)誤差エネルギー・コンテキスト
誤差エネルギーは次式(15)により定義される。
Figure 2007259306
この誤差エネルギーμEはLloyd-Maxスカラー量子化器(非特許文献6参照)により4値に量子化され、量子化された誤差エネルギーを2進表記することにより2次元の2値ベクトルを得る。量子化器の各閾値レベルは、トレーニング画像の組を用いて学習され、最適な値に設定される。そして、一旦設定した後は、常に同じ状態が維持される。量子化された誤差エネルギーμEを2値ベクトルで表したものを誤差エネルギー・コンテキストといい、QE(x, y)(∈{00,01,10,11})と記す。
(4)コンテキスト・モデル
以上のような3種類のコンテキストを用いて、対象画素の予測誤差を効果的に分類する。コンテキストI(x,y)を次式(16)により定義する:
Figure 2007259306
この場合、I(x,y)は0から1023の間の整数値を採り得ることになるが、実際は、G(x,y)とT(x,y)は0と15の値は取り得ないため、全部で784通りの可能なI(x,y)の値が存在する。このI(x,y)の値は、予測誤差の分類のインデックスとして使用される。即ち、784通りのコンテキストが存在する。
画像符号化器は、コンテキストI(x,y)の値に基づいて、最適なハフマン・テーブルを選択する。そして、そのハフマン・テーブルを用いて、予測誤差e(x, y)を符号化する。符号化は、適応M-ary算術符号化器(adaptive M-Ary arithmetic coder)により行うことができる(非特許文献8,9参照)。
〔2〕本発明の構成
本発明の予測器の第1の構成は、二次元の入力画像のラスタ走査により順次入力される対象画素に対し、その画素値を予測する予測器であって、
前記入力画像の既走査領域のうちの前記対象画素の近傍の所定の領域を参照領域(causal area)とすると、少なくとも前記参照領域内の画素の画素値を保持する参照領域記憶手段と、
当該参照領域の各画素に対して、水平方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を水平勾配Dとして出力する水平勾配演算手段と、
当該参照領域の各画素に対して、垂直方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を垂直勾配Dとして出力する垂直勾配演算手段と、
当該参照領域の各画素に対して、45°対角方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を正対角勾配Dとして出力する正対角勾配演算手段と、
当該参照領域の各画素に対して、−45°対角方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を負対角勾配Dとして出力する負対角勾配演算手段と、
前記対象画素に対し、水平方向,垂直方向,45°対角方向,及び−45°対角方向の各方向に隣接する既走査領域内の4つの画素のうち少なくとも2つの画素の画素値の加重平均を演算し、当該加重平均を対象画素の画素値の予測値として出力する予測値演算手段と、を備え、
前記予測値演算手段は、前記加重平均において、各画素の画素値の重みを、その画素の隣接方向の勾配の逆数に比例させることを特徴とする。
この構成によれば、対象画素の予測値は、水平方向,垂直方向,45°対角方向,及び−45°対角方向の4方向の勾配を考慮して、対象画素に隣接する既走査領域内の4つの隣接画素のうち少なくとも2つの画素の画素値の加重平均により決定される。このとき、勾配が小さい方向の隣接画素の重みは大きく、勾配が大きい方向の隣接画素の重みは小さくなる。従って、エッジの方向である可能性が大きい方向の隣接画素の画素値が予測値に大きく寄与し、エッジの方向である可能性が小さい方向の隣接画素の画素値の寄与は小さくなる。このように、対象画素の予測演算にすべての方向のエッジを考慮することが可能となるため、予測精度を向上させることが可能となる。
本発明の予測器の第2の構成は、前記第1の構成において、前記水平勾配D,前記垂直勾配D,前記正対角勾配D,及び前記負対角勾配Dのうち、最小の勾配Dmin及び2番目に小さい勾配Dmin2を決定する参照方向決定手段を備え、
前記予測値演算手段は、前記対象画素に対し前記勾配Dminに対応する方向に隣接する画素の画素値Cminの重みをη/Dmin2(ηは規格化定数)、前記勾配Dmin2に対応する方向に隣接する画素の画素値Cmin2の重みをη/Dminとして、画素値Cmin及び画素値Cmin2の加重平均を演算し、当該加重平均を対象画素の画素値の予測値として出力することを特徴とする。
この構成により、水平,垂直,45°,−45°の4方向のうち、エッジ方向である確率の高い2方向の隣接画素(対象画素に隣接する既走査領域内の画素)を用いて、その加重平均で予測を行うため、すべての方向のエッジに対して適切に隣接画素の寄与率を設定することが可能となる。
ここで、ηは規格化定数であり、画素値Cminの重みと画素値Cmin2の重みの和が1となるように設定すればよい。従って、η=D/(D+D)とすればよい。
本発明の予測器の第3の構成は、前記第1又は2の構成において、前記水平勾配演算手段、前記垂直勾配演算手段、前記正対角勾配演算手段、及び前記負対角勾配演算手段は、各画素対の重み係数を、当該画素対の2つの画素のうち前記対象画素に最も近い画素から前記対象画素までの距離の逆数に比例する値として、前記絶対値差の所定の加重和又は加重平均を演算することを特徴とする。
この構成により、画素対の絶対値差は、対象画素に近いほど大きく勾配に寄与し、対象画素に遠いほど小さく勾配に寄与する。従って、参照領域を広くとっても十分な精度で対象画素近傍の勾配を評価することができ、参照領域内のノイズに対するロバスト性を高めることができる。
本発明の予測器の第4の構成は、前記第1乃至3の何れか一の構成において、前記ラスタ走査の水平進行方向をx軸、垂直進行方向をy軸とし、対象画素の座標を(x,y)としたとき、前記参照領域は、座標が(x−1,y),(x−2,y),(x+1,y−1),(x,y−1),(x−1,y−1),(x−2,y−1),(x+1,y−2),(x,y−2),(x−1,y−1)の9つの画素で構成されていることを特徴とする。
この構成により、予測演算の精度と計算時間とのバランスが適度な状態となり、予測演算の精度を十分に維持しつつ、高速に予測演算を行うことが可能となる。
本発明の画像符号化器の第1の構成は、二次元の入力画像をラスタ走査により1次元化し、予測符号化により符号化する画像符号化器であって、
前記入力画像をラスタ走査により順次入力される対象画素に対し、その画素値を予測する前記第1乃至4の何れか一の構成の予測器と、
前記対象画素の画素値と前記予測器が出力する出力値との差分を、当該対象画素の予測誤差として出力する予測誤差演算手段と、
前記入力画像の各画素について得られる前記予測誤差を符号化する符号化手段と、
を備えたことを特徴とする。
この構成により、予測誤差を小さくできるため、圧縮効率の高い符号化が可能となる。
本発明の画像符号化器の第2の構成は、前記第1の構成において、前記符号化手段は、
前記対象画素の近傍の所定の領域の画素の画素値又は予測誤差に基づいてコンテキストを生成するコンテキスト生成手段と、
前記コンテキストの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行う選択符号化手段と、
を備えていることを特徴とする。
この構成により、コンテキストの値に応じて符号化テーブルを切り替えることにより、より高い効率での圧縮が可能となる。
本発明の画像符号化器の第3の構成は、前記第2の構成において、前記コンテキスト生成手段は、
前記入力画像の既走査領域のうちの前記対象画素の近傍の所定の領域(以下「テクスチャ判定領域」という。)内のN個の画素の画素値の平均値μを算出する画素平均値演算手段と、
前記テクスチャ判定領域内のN個の画素のそれぞれに対し、当該画素の画素値が前記平均値μより大きいか否かにより2値化し、N次元の2値ベクトルTをテクスチャ・コンテキストとして出力するテクスチャ・コンテキスト生成手段を備え、
前記選択符号化手段は、前記テクスチャ・コンテキストの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行うことを特徴とする。
この構成により、対象画素の周辺の画素値の変化パターンに基づいて符号化テーブルが切り替えられ、より高い効率での圧縮が可能となる。
本発明の画像符号化器の第4の構成は、前記第3の構成において、前記テクスチャ判定領域は、前記対象画素に隣接する4つの画素からなる領域であることを特徴とする。
本発明の画像符号化器の第5の構成は、前記第2の構成において、前記コンテキスト生成手段は、
前記前記水平勾配演算手段、前記垂直勾配演算手段、前記正対角勾配演算手段、及び前記負対角勾配演算手段が算出する前記対象画素の4つの勾配の平均値μを算出する勾配平均値演算手段と、
前記4つの勾配のそれぞれに対し、当該勾配が前記平均値μより大きいか否かにより2値化し、4次元の2値ベクトルGを勾配コンテキストとして出力する勾配コンテキスト生成手段を備え、
前記選択符号化手段は、前記勾配コンテキストの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行うことを特徴とする。
この構成により、対象画素の周辺の勾配のパターンに基づいて符号化テーブルが切り替えられ、より高い効率での圧縮が可能となる。
本発明の画像符号化器の第6の構成は、前記第2の構成において、前記コンテキスト生成手段は、
前記入力画像の既走査領域のうちの前記対象画素の近傍の所定の領域(以下「誤差判定領域」という。)内の画素の予測誤差の平均値μを算出する誤差平均値演算手段と、
前記平均値μを量子化し、N次元の2値ベクトルQを誤差エネルギー・コンテキストとして出力する誤差エネルギー・コンテキスト生成手段を備え、
前記選択符号化手段は、前記誤差エネルギー・コンテキストの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行うことを特徴とする。
この構成により、対象画素の周辺の誤差エネルギーに基づいて符号化テーブルが切り替えられ、より高い効率での圧縮が可能となる。
本発明の画像符号化器の第7の構成は、前記第6の構成において、前記誤差判定領域は、前記対象画素に隣接する4つの画素からなる領域であることを特徴とする。
本発明の画像符号化器の第8の構成は、前記第2の構成において、前記コンテキスト生成手段は、
前記画像符号化器の第7又は8の構成に記載のテクスチャ・コンテキスト生成手段と、
前記画像符号化器の第9の構成に記載の勾配コンテキスト生成手段と、
前記画像符号化器の第10又は11の構成に記載の誤差エネルギー・コンテキスト生成手段と、
を備え、
前記選択符号化手段は、前記テクスチャ・コンテキスト,前記勾配コンテキスト,及び前記誤差エネルギー・コンテキストの直積ベクトルの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行うことを特徴とする。
本発明のプログラムの第1の構成は、コンピュータに読み込ませて実行させることにより、コンピュータを前記第1乃至4の何れか一の構成の予測器として機能させることを特徴とする。
本発明のプログラムの第2の構成は、コンピュータに読み込ませて実行させることにより、コンピュータを前記5乃至12の何れか一の構成の画像符号化器として機能させることを特徴とする。
本発明の画素値予測方法は、二次元の入力画像のラスタ走査により順次入力される対象画素に対し、その画素値を予測する画素値予測方法であって、
前記入力画像の既走査領域のうちの前記対象画素の近傍の所定の領域を参照領域(causal area)とし、
当該参照領域の各画素に対して、水平方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を水平勾配Dとする水平勾配演算ステップと、
当該参照領域の各画素に対して、垂直方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を垂直勾配Dとする垂直勾配演算ステップと、
当該参照領域の各画素に対して、45°対角方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を正対角勾配Dとする正対角勾配演算ステップと、
当該参照領域の各画素に対して、−45°対角方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を負対角勾配Dとする負対角勾配演算ステップと、
前記対象画素に対し、水平方向,垂直方向,45°対角方向,及び−45°対角方向の各方向に隣接する既走査領域内の4つの画素のうち少なくとも2つの画素の画素値の加重平均を演算し、当該加重平均を対象画素の画素値の予測値として出力する予測値演算ステップと、
を備え、
前記予測値演算ステップにおいては、前記加重平均において、各画素の画素値の重みを、その画素の隣接方向の勾配の逆数に比例させることを特徴とする。
本発明の画像符号化方法の第1の構成は、二次元の入力画像をラスタ走査により1次元化し、予測符号化により符号化する画像符号化方法であって、
前記入力画像をラスタ走査により順次入力される対象画素に対し、その画素値を前記画素値予測方法により予測して予測画素値を算出する画素値予測ステップと、
前記対象画素の画素値と前記予測画素値との差分を、当該対象画素の予測誤差として出力する予測誤差演算ステップと、
前記入力画像の各画素について得られる前記予測誤差を符号化する符号化ステップと、
を備えたことを特徴とする。
本発明の画像符号化方法の第2の構成は、前記第1の構成において、前記符号化ステップにおいては、
前記対象画素の近傍の所定の領域の画素の画素値又は予測誤差に基づいてコンテキストを生成するコンテキスト生成ステップと、
前記コンテキストの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行う選択符号化ステップと、
を備えていることを特徴とする。
以上のように、本発明の予測器によれば、対象画素の予測演算にすべての方向のエッジを考慮することが可能となるため、予測精度を向上させることが可能となる。
また、本発明に係る画像符号化器によれば、対象画素を既走査領域の画素値情報から高精度で予測できるため、予測誤差が小さく、高効率で画像圧縮をすることが可能となる。
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。
〔1〕装置構成
図4は、本発明の実施例1に係る画像符号化器1の構成を表すブロック図である。画像メモリ10には、二次元の入力画像が記憶されている。走査手段11は、画像メモリ10に記憶された入力画像を、ラスタ走査しながら対象画素の画素値を画像符号化器1に出力する。画像符号化器1は、走査手段11から順次出力する画像データを符号化し、符号化画像記憶手段12に格納する。
画像符号化器1は、予測器2,コンテキスト生成手段3,選択符号化手段4,量子化テーブル記憶手段5,符号化テーブル記憶手段6,及び予測誤差記憶手段7を備えている。予測器2は、走査手段11が出力する対象画素の予測値の演算を行う。コンテキスト生成手段3は、対象画素の画素値と予測値との間の予測誤差を分類するためのコンテキストを生成する。選択符号化手段4は、対象画素の予測誤差の演算を行うとともに、当該予測誤差の符号化を行う。
量子化テーブル記憶手段5には、コンテキスト生成手段3において、予測誤差の量子化を行う際のLloyd-Max量子化器の量子化テーブルが記憶されている。また、符号化テーブル記憶手段6には、選択符号化手段4において符号化を行う際の符号化テーブルが、それぞれのコンテキストに対応する数だけ記憶されている。予測誤差記憶手段7は、選択符号化手段4において算出される予測誤差を、コンテキストの生成に使用するために一時的に記憶する。
尚、本実施例の画像符号化器1は、ACICチップとしてLISにより構成し、又はPLA(プログラマブル・ロジック・アレイ)を用いて構成するなど、ハードウェア的に実現してもよいが、プログラム・モジュールとしてソフトウェア的に構成し、当該プログラム・モジュールをコンピュータで実行することによってコンピュータを画像符号化器1として機能させるようしてもよい。
〔2〕予測・符号化処理手順
以上のように構成された本実施例1に係る画像符号化器1について、以下その動作を説明する。
まず、画像メモリ10に記憶された入力画像は、走査手段11によりラスタ走査され、1画素ずつ対象画素として出力される。また、現在走査を行っている走査線の走査済みの画素と、その走査線の前に既に走査された所定本数の走査線の画素とが、参照領域記憶手段25に逐次記憶される。
尚、以下の説明のため、走査手段11が入力画像を走査する際の水平走査進行方向をx軸方向とし、垂直走査進行方向をy軸とする。また、対象画素の座業を(x,y)と記す。
図5は、実施例1の画像符号化器1による画像符号化処理の流れを表すフローチャートである。
まず、ステップS1において、走査手段11から画像符号化器1に対象画素p(x,y)の画素値P(x,y)が入力される。
ステップS2において、画素値P(x,y)は、参照領域記憶手段25に一時的に保存される。参照領域記憶手段25は、シフト・メモリ等により構成されており、対象画素p(x、y)が位置する走査線からM(≧2)本前の走査線までの画素値を一時的に記憶する。Mは、参照領域の大きさにより適宜決まる。例えば、参照領域が図1に示したような領域の場合、M=2である。
ステップS3において、予測器2の水平勾配演算手段21,垂直勾配演算手段22,正対角勾配演算手段23,及び負対角勾配演算手段24は、参照領域記憶手段25に記憶された参照領域内の各画素の画素値{P(xi,xj)}に基づいて、それぞれ、水平勾配D1,垂直勾配D2,45°対角勾配D3,−45°対角勾配D4を次式(17a)〜(17d)により演算する。
Figure 2007259306
ここで、Sは参照領域に含まれる画素の座標の集合を表す。Li1,Li2,Li3,Li4は、対象画素p(x,y)から絶対値差の画素対の各画素までのシティーブロック距離の最小値を表し、式(18a)〜(18d)で表される。ξ1,ξ2,ξ3,ξ4は、規格化定数であり、式(19a)〜(19d)で表される。また、ε1,ε2,ε3,ε4は、最隣接画素の加重平均の計算の際の発散防止のために加えられる定数であり、通常は最小値1に設定される。
Figure 2007259306
Figure 2007259306
式(17a)〜(17d)より、対象画素に近い画素対の絶対値差ほど、勾配に対する寄与が大きくなっていることが分かる。これにより、対象画素の近傍の隣接画素間勾配の影響を大きく取り入れて対象画素における勾配の予測を精度よく行うことができると共に、加重平均により対象画素の近傍のノイズの影響が軽減され、ノイズに対するロバストとなる。
参照領域の取り方については任意であるが、対象画素周辺のノイズに対するロバスト性と計算量との釣り合いを考慮して決める必要がある。例えば、参照領域が図1のような領域の場合、式(17a)〜(17d)は、前述した式(5a)〜(5d)となる。
次に、ステップS4において、参照方向決定手段26は、各勾配D1〜D4を比較して、予測に使用する隣接画素(既走査領域の画素のうち対象画素の最隣接する画素(図1のW,N,NW,NE)をいう。以下同じ。)の方向(以下「参照方向」という。)を決定する。予測に使用する隣接画素の数は2個,3個,4個の何れかである。
予測に使用する隣接画素の数が2個の場合は、参照方向決定手段26は、勾配D1〜D4のうち最小の勾配Dmin1及び2番目に小さい勾配Dmin2を決定し、これらの勾配に対応する方向が参照方向とされる。
予測に使用する隣接画素の数が3個の場合は、参照方向決定手段26は、勾配D1〜D4のうち最小の勾配Dmin1、2番目に小さい勾配Dmin2、及び3番目に小さい勾配Dmin3を決定し、これらの勾配に対応する方向が参照方向とされる。
予測に使用する隣接画素の数が4個の場合には、すべての隣接画素が予測に使用されるので、参照方向決定手段26は特に参照方向を決定する必要はない。
ステップS5において、予測値演算手段27は、隣接画素の画素値と参照方向決定手段26により決定された参照方向及びその方向の勾配とに基づいて、次式(20)により対象画素p(x,y)の予測値P^(x,y)を算出する。
Figure 2007259306
ここで、勾配Dminα(α=1,2,3,4)に対応する参照方向の隣接画素の画素値をCminαと記す。αについての和は、それぞれ、予測に使用する隣接画素の数が2個の場合は1,2、予測に使用する隣接画素の数が3個の場合は1,2,3、予測に使用する隣接画素の数が4個の場合は1,2,3,4についてとる。ηは規格化定数であり、式(21)により決められる。
Figure 2007259306
例えば、予測に使用する隣接画素の数が2個の場合、式(20)は式(14)となる。また、例えば、予測に使用する隣接画素の数が3個の場合、式(20)は式(22)となる。
Figure 2007259306
式(20)より、参照方向の勾配が小さいほど、その参照方向の隣接画素の画素値が予測値に大きく寄与することが分かる。また、2方向以上の参照方向の隣接画素を参照し、各隣接画素の画素値の重みをその参照方向の勾配の逆数に比例した値として、加重平均により予測値を算出することで、対象画素p(x,y)のエッジの向きがどの方向であっても、そのエッジ方向に適応した予測値の算出が可能となる。
尚、予測に使用する隣接画素の数は、2,3,4のいずれでもよいが、予測値計算の計算量を考慮して2個とすることが好ましい。
次に、ステップS6において、コンテキスト生成手段3は、テクスチャ・コンテキストC(x,y)を式(8)と同様にして算出する。また、勾配コンテキストG(x, y)を、式(12)と同様にして算出する。また、誤差エネルギー・コンテキストQE(x, y)を式(15)と同様にして算出する。さらに、これら3種のコンテキストを直積により合成し(式(15)参照)、最終的なコンテキストI(x,y)を生成する。
尚、誤差エネルギー・コンテキストを計算する際には、予測誤差記憶手段7に先に記憶された参照領域の各画素の予測誤差を使用する。また、誤差エネルギー・コンテキストの演算の過程で、誤差エネルギーを量子化する際には、調子かテーブル記憶手段5に記憶された量子化テーブルが用いられる。量子化器としては、入力画像への適応性の観点から、Lloyd-Max量子化器を使用することが好ましい。
生成される最終的なコンテキストは、誤差エネルギー・コンテキストQE(x, y)の次元を2とすれば、4+4+2=10次元のベクトルとなる。従って、表現可能なコンテキストの種類としては210=1,024通りが考えられる。しかしながら、テクスチャ・コンテキストC(x,y)と勾配コンテキストG(x, y)とは、平均値に対する大小により各ビットを量子化しているため、(0,0,0,0)と(1,1,1,1)という値は取り得ない。従って、出現可能なコンテキストI(x,y)の種類は、14×14×4=784通りとなる。これら784通りのコンテキストI(x,y)に一対一に対応して、784個の符号化テーブルが用意され、符号化テーブル記憶手段6に記憶されている。
次に、ステップS7において、選択符号化手段4は、対象画素p(x,y)における予測誤差e(x,y)を次式(23)で計算する。
Figure 2007259306
ステップS8において、選択符号化手段4は、算出した予測誤差e(x,y)を予測誤差記憶手段7に記憶させる。この予測誤差e(x,y)は、後の対象画素の誤差エネルギー・コンテキストの計算に使用される。
ステップS9において、選択符号化手段4は、コンテキストI(x,y)の値に応じて符号化テーブル記憶手段6からそれに対応する符号化テーブルを算出する。そして、その符号化テーブルを用いて、予測誤差e(x,y)を符号化しする。符号化器としては、通常のエントロピ符号化器を使用することができ、符号化テーブルとしては、複数のトレーニング画像を用いて学習を行うことにより得られるハフマン・テーブルを使用することができる。
次に、ステップS10において、選択符号化手段4は、符号化された予測誤差を符号化画像記憶手段12に保存する。
最後に、ステップS11において、すべての走査が終了していなければステップS1に戻って次の対象画素の符号化を行い、すべての走査が終了したならば、画像符号化処理を終了する。
〔3〕実験結果
最後に、上記本発明の画像符号化器を用いて各種画像に対して符号化実験を行った結果及びCALICとの比較について説明する。実験に使用する本発明の画像符号化器としては、〔課題を解決するための手段〕の欄で説明したAGSPを用いた画像符号化器を使用する。また、本発明の画像符号化器の性能比較にCALICを使用する理由は、CALICは現在のところ可逆符号化方法においては最も有効な方法であるといわれているからである。
テスト画像として、9個の8bitグレースケールの画像を使用した。各画像のサイズは512×512 pixelである。画像符号化の性能の比較に当たっては、符号化効率と計算量の両面から評価を行う。AGSPはCALICtp比較すると若干計算量は多くなる。AGSPの勾配評価の方法のほうがより複雑だからである。
図6は、MEDにより得られたテスト画像「Lenna」の予測誤差画像である。図7は、CAPにより得られたテスト画像「Lenna」の予測誤差画像である。図8は、本発明のAGSPにより得られたテスト画像「Lenna」の予測誤差画像である。図6〜8において、予測誤差の絶対値が画素強度としてグレースケールで表されている。一見して分かるように、AGSPによる予測誤差は、MEDやCAPの予測誤差に比べて全体的に小さいことが分かる。
予測誤差の比較を行うため、客観的な指標として予測誤差の0次エントロピーを用いた。(表1)にその結果を示す。(表1)より、すべてのテスト画像において、本発明のAGSPによる予測誤差は、CALICにおける予測誤差よりも全体的に小さくなっていることが分かる。
Figure 2007259306
また、CALICとAGSPとの可逆圧縮率の比較を(表2)に示す。(表2)から分かるように、すべてのテスト画像において、本発明のAGSPによる符号化のほうが、CALICによる符号化に比べて5%程度圧縮率が改善されていることが分かる。
Figure 2007259306
参照テンプレートを示す図である。 勾配の4方向を示す図である。 予測誤差の分布を表す図である。 本発明の実施例1に係る画像符号化器の構成を表すブロック図である。 実施例1の画像符号化器1による画像符号化処理の流れを表すフローチャートである。 MEDにより得られたテスト画像「Lenna」の予測誤差画像である。 CAPにより得られたテスト画像「Lenna」の予測誤差画像である。 本発明のAGSPにより得られたテスト画像「Lenna」の予測誤差画像である。
符号の説明
1 画像符号化器
2 予測器
3 コンテキスト生成手段
4 選択符号化手段
5 量子化テーブル記憶手段
6 符号化テーブル記憶手段
7 予測誤差記憶手段
10 画像メモリ
11 走査手段
12 符号化画像記憶手段
21 水平勾配演算手段
22 垂直勾配演算手段
23 正対角勾配演算手段
24 負対角勾配演算手段
25 参照領域記憶手段
26 参照方向決定手段
27 予測値演算手段

Claims (17)

  1. 二次元の入力画像のラスタ走査により順次入力される対象画素に対し、その画素値を予測する予測器であって、
    前記入力画像の既走査領域のうちの前記対象画素の近傍の所定の領域を参照領域(causal area)とすると、少なくとも前記参照領域内の画素の画素値を保持する参照領域記憶手段と、
    当該参照領域の各画素に対して、水平方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を水平勾配Dとして出力する水平勾配演算手段と、
    当該参照領域の各画素に対して、垂直方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を垂直勾配Dとして出力する垂直勾配演算手段と、
    当該参照領域の各画素に対して、45°対角方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を正対角勾配Dとして出力する正対角勾配演算手段と、
    当該参照領域の各画素に対して、−45°対角方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を負対角勾配Dとして出力する負対角勾配演算手段と、
    前記対象画素に対し、水平方向,垂直方向,45°対角方向,及び−45°対角方向の各方向に隣接する既走査領域内の4つの画素のうち少なくとも2つの画素の画素値の加重平均を演算し、当該加重平均を対象画素の画素値の予測値として出力する予測値演算手段と、
    を備え、
    前記予測値演算手段は、前記加重平均において、各画素の画素値の重みを、その画素の隣接方向の勾配の逆数に比例させることを特徴とする予測器。
  2. 前記水平勾配D,前記垂直勾配D,前記正対角勾配D,及び前記負対角勾配Dのうち、最小の勾配Dmin及び2番目に小さい勾配Dmin2を決定する参照方向決定手段を備え、
    前記予測値演算手段は、前記対象画素に対し前記勾配Dminに対応する方向に隣接する画素の画素値Cminの重みをη/Dmin2(ηは規格化定数)、前記勾配Dmin2に対応する方向に隣接する画素の画素値Cmin2の重みをη/Dminとして、画素値Cmin及び画素値Cmin2の加重平均を演算し、当該加重平均を対象画素の画素値の予測値として出力することを特徴とする請求項1記載の予測器。
  3. 前記水平勾配演算手段、前記垂直勾配演算手段、前記正対角勾配演算手段、及び前記負対角勾配演算手段は、各画素対の重み係数を、当該画素対の2つの画素のうち前記対象画素に最も近い画素から前記対象画素までの距離の逆数に比例する値として、前記絶対値差の所定の加重和又は加重平均を演算することを特徴とする請求項1又は2に記載の予測器。
  4. 前記ラスタ走査の水平進行方向をx軸、垂直進行方向をy軸とし、対象画素の座標を(x,y)としたとき、前記参照領域は、座標が(x−1,y),(x−2,y),(x+1,y−1),(x,y−1),(x−1,y−1),(x−2,y−1),(x+1,y−2),(x,y−2),(x−1,y−1)の9つの画素で構成されていることを特徴とする請求項1乃至3の何れか一に記載の予測器。
  5. 二次元の入力画像をラスタ走査により1次元化し、予測符号化により符号化する画像符号化器であって、
    前記入力画像をラスタ走査により順次入力される対象画素に対し、その画素値を予測する請求項1乃至4の何れか一に記載の予測器と、
    前記対象画素の画素値と前記予測器が出力する出力値との差分を、当該対象画素の予測誤差として出力する予測誤差演算手段と、
    前記入力画像の各画素について得られる前記予測誤差を符号化する符号化手段と、
    を備えたことを特徴とする画像符号化器。
  6. 前記符号化手段は、
    前記対象画素の近傍の所定の領域の画素の画素値又は予測誤差に基づいてコンテキストを生成するコンテキスト生成手段と、
    前記コンテキストの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行う選択符号化手段と、
    を備えていることを特徴とする請求項5記載の画像符号化器。
  7. 前記コンテキスト生成手段は、
    前記入力画像の既走査領域のうちの前記対象画素の近傍の所定の領域(以下「テクスチャ判定領域」という。)内のN個の画素の画素値の平均値μを算出する画素平均値演算手段と、
    前記テクスチャ判定領域内のN個の画素のそれぞれに対し、当該画素の画素値が前記平均値μより大きいか否かにより2値化し、N次元の2値ベクトルTをテクスチャ・コンテキストとして出力するテクスチャ・コンテキスト生成手段を備え、
    前記選択符号化手段は、前記テクスチャ・コンテキストの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行うことを特徴とする請求項6記載の画像符号化器。
  8. 前記テクスチャ判定領域は、前記対象画素に隣接する4つの画素からなる領域であることを特徴とする請求項7記載の画像符号化器。
  9. 前記コンテキスト生成手段は、
    前記前記水平勾配演算手段、前記垂直勾配演算手段、前記正対角勾配演算手段、及び前記負対角勾配演算手段が算出する前記対象画素の4つの勾配の平均値μを算出する勾配平均値演算手段と、
    前記4つの勾配のそれぞれに対し、当該勾配が前記平均値μより大きいか否かにより2値化し、4次元の2値ベクトルGを勾配コンテキストとして出力する勾配コンテキスト生成手段を備え、
    前記選択符号化手段は、前記勾配コンテキストの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行うことを特徴とする請求項6記載の画像符号化器。
  10. 前記コンテキスト生成手段は、
    前記入力画像の既走査領域のうちの前記対象画素の近傍の所定の領域(以下「誤差判定領域」という。)内の画素の予測誤差の平均値μを算出する誤差平均値演算手段と、
    前記平均値μを量子化し、N次元の2値ベクトルQを誤差エネルギー・コンテキストとして出力する誤差エネルギー・コンテキスト生成手段を備え、
    前記選択符号化手段は、前記誤差エネルギー・コンテキストの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行うことを特徴とする請求項6記載の画像符号化器。
  11. 前記誤差判定領域は、前記対象画素に隣接する4つの画素からなる領域であることを特徴とする請求項10記載の画像符号化器。
  12. 前記コンテキスト生成手段は、
    請求項7又は8に記載のテクスチャ・コンテキスト生成手段と、
    請求項9に記載の勾配コンテキスト生成手段と、
    請求項10又は11に記載の誤差エネルギー・コンテキスト生成手段と、
    を備え、
    前記選択符号化手段は、前記テクスチャ・コンテキスト,前記勾配コンテキスト,及び前記誤差エネルギー・コンテキストの直積ベクトルの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行うことを特徴とする請求項6記載の画像符号化器。
  13. コンピュータに読み込ませて実行させることにより、コンピュータを請求項1乃至4の何れか一に記載の予測器として機能させることを特徴とするプログラム。
  14. コンピュータに読み込ませて実行させることにより、コンピュータを請求項5乃至12の何れか一に記載の画像符号化器として機能させることを特徴とするプログラム。
  15. 二次元の入力画像のラスタ走査により順次入力される対象画素に対し、その画素値を予測する画素値予測方法であって、
    前記入力画像の既走査領域のうちの前記対象画素の近傍の所定の領域を参照領域(causal area)とし、
    当該参照領域の各画素に対して、水平方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を水平勾配Dとする水平勾配演算ステップと、
    当該参照領域の各画素に対して、垂直方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を垂直勾配Dとする垂直勾配演算ステップと、
    当該参照領域の各画素に対して、45°対角方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を正対角勾配Dとする正対角勾配演算ステップと、
    当該参照領域の各画素に対して、−45°対角方向に相隣接する画素対について画素値の絶対値差の所定の加重和又は加重平均を演算し、その演算値又はそれに定数を加えた値を負対角勾配Dとする負対角勾配演算ステップと、
    前記対象画素に対し、水平方向,垂直方向,45°対角方向,及び−45°対角方向の各方向に隣接する既走査領域内の4つの画素のうち少なくとも2つの画素の画素値の加重平均を演算し、当該加重平均を対象画素の画素値の予測値として出力する予測値演算ステップと、
    を備え、
    前記予測値演算ステップにおいては、前記加重平均において、各画素の画素値の重みを、その画素の隣接方向の勾配の逆数に比例させることを特徴とする画素値予測方法。
  16. 二次元の入力画像をラスタ走査により1次元化し、予測符号化により符号化する画像符号化方法であって、
    前記入力画像をラスタ走査により順次入力される対象画素に対し、その画素値を請求項15に記載の画素値予測方法により予測して予測画素値を算出する画素値予測ステップと、
    前記対象画素の画素値と前記予測画素値との差分を、当該対象画素の予測誤差として出力する予測誤差演算ステップと、
    前記入力画像の各画素について得られる前記予測誤差を符号化する符号化ステップと、
    を備えたことを特徴とする画像符号化方法。
  17. 前記符号化ステップにおいては、
    前記対象画素の近傍の所定の領域の画素の画素値又は予測誤差に基づいてコンテキストを生成するコンテキスト生成ステップと、
    前記コンテキストの値に応じて符号化テーブルを選択し、前記予測誤差のエントロピー符号化を行う選択符号化ステップと、
    を備えていることを特徴とする請求項16記載の画像符号化方法。
JP2006083873A 2006-03-24 2006-03-24 予測器及び画像符号化器 Pending JP2007259306A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006083873A JP2007259306A (ja) 2006-03-24 2006-03-24 予測器及び画像符号化器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006083873A JP2007259306A (ja) 2006-03-24 2006-03-24 予測器及び画像符号化器

Publications (1)

Publication Number Publication Date
JP2007259306A true JP2007259306A (ja) 2007-10-04

Family

ID=38633045

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006083873A Pending JP2007259306A (ja) 2006-03-24 2006-03-24 予測器及び画像符号化器

Country Status (1)

Country Link
JP (1) JP2007259306A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011024002A (ja) * 2009-07-16 2011-02-03 Akuseru:Kk 予測処理システム
JP2012070395A (ja) * 2011-10-18 2012-04-05 Axell Corp 予測処理システム
WO2012087034A3 (ko) * 2010-12-22 2012-09-07 엘지전자 주식회사 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
JP2015515350A (ja) * 2012-04-26 2015-05-28 ビジョン アールティ リミテッド 3dカメラシステム
CN110569683A (zh) * 2018-06-06 2019-12-13 伟诠电子股份有限公司 条码检测方法及条码检测系统
US11405623B2 (en) 2019-10-31 2022-08-02 Samsung Electronics Co., Ltd. Image encoder, image decoder, and image processing method

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011024002A (ja) * 2009-07-16 2011-02-03 Akuseru:Kk 予測処理システム
US11006145B2 (en) 2010-12-22 2021-05-11 Lg Electronics Inc. Intra prediction method and apparatus using the method
WO2012087034A3 (ko) * 2010-12-22 2012-09-07 엘지전자 주식회사 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
US9693054B2 (en) 2010-12-22 2017-06-27 Lg Electronics Inc. Intra prediction method and apparatus based on interpolation
US9860557B2 (en) 2010-12-22 2018-01-02 Lg Electronics Inc. Intra prediction method and apparatus using the method
US10136158B2 (en) 2010-12-22 2018-11-20 Lg Electronics Inc. Intra prediction method and apparatus using the method
US10609410B2 (en) 2010-12-22 2020-03-31 Lg Electronics Inc. Intra prediction method and apparatus using the method
US11622129B2 (en) 2010-12-22 2023-04-04 Lg Electronics Inc. Intra prediction method and apparatus using the method
JP2012070395A (ja) * 2011-10-18 2012-04-05 Axell Corp 予測処理システム
JP2015515350A (ja) * 2012-04-26 2015-05-28 ビジョン アールティ リミテッド 3dカメラシステム
CN110569683A (zh) * 2018-06-06 2019-12-13 伟诠电子股份有限公司 条码检测方法及条码检测系统
CN110569683B (zh) * 2018-06-06 2023-06-09 伟诠电子股份有限公司 条码检测方法及条码检测系统
US11405623B2 (en) 2019-10-31 2022-08-02 Samsung Electronics Co., Ltd. Image encoder, image decoder, and image processing method
US11770541B2 (en) 2019-10-31 2023-09-26 Samsung Electronics Co., Ltd. Image encoder, image decoder, and image processing method

Similar Documents

Publication Publication Date Title
US10911787B2 (en) Hierarchical point cloud compression
US11276203B2 (en) Point cloud compression using fixed-point numbers
US11409998B2 (en) Trimming search space for nearest neighbor determinations in point cloud compression
Hu et al. Intra-prediction and generalized graph Fourier transform for image coding
US9467681B2 (en) Representation and compression of depth data
JP4217657B2 (ja) 画像処理方法、プログラム、記憶媒体及び装置
JP2007259306A (ja) 予測器及び画像符号化器
KR20080050491A (ko) 시간 예측을 위한 분류 필터링
US20220156987A1 (en) Adaptive convolutions in neural networks
US10382711B2 (en) Method and device for processing graph-based signal using geometric primitives
CN102081789B (zh) 图像处理装置和图像处理方法
Tang et al. A gradient based predictive coding for lossless image compression
JP4622265B2 (ja) 動きベクトル検出装置、および動きベクトル検出方法、並びにプログラム
JP4862186B2 (ja) 予測処理システム
TW201812697A (zh) 使用二階區域二元圖的分群方法及疊代影像測試系統
JP6242055B2 (ja) 画像符号化装置
CN113055546A (zh) 处理图像的系统和方法
JP2008098796A (ja) 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体
Mondal et al. A hybrid particle swarm optimization and artificial bee colony algorithm for image contrast enhancement
Chen et al. Nonlocal context modeling and adaptive prediction for lossless image coding
US20220300818A1 (en) Structure optimization apparatus, structure optimization method, and computer-readable recording medium
Sumi et al. Lossless Image Coding Based on Probability Modeling Using Template Matching and Linear Prediction
JP3075049B2 (ja) 画像符号化装置
Lu et al. 16-bit DICOM medical images lossless hiding scheme based on edge sensing prediction mechanism
JP2009272765A (ja) 動きベクトル検出装置及び動きベクトル検出方法