JP5937946B2 - 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム - Google Patents

画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム Download PDF

Info

Publication number
JP5937946B2
JP5937946B2 JP2012228865A JP2012228865A JP5937946B2 JP 5937946 B2 JP5937946 B2 JP 5937946B2 JP 2012228865 A JP2012228865 A JP 2012228865A JP 2012228865 A JP2012228865 A JP 2012228865A JP 5937946 B2 JP5937946 B2 JP 5937946B2
Authority
JP
Japan
Prior art keywords
image
converter
encoding
encoded data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012228865A
Other languages
English (en)
Other versions
JP2014082616A (ja
Inventor
誠之 高村
誠之 高村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012228865A priority Critical patent/JP5937946B2/ja
Publication of JP2014082616A publication Critical patent/JP2014082616A/ja
Application granted granted Critical
Publication of JP5937946B2 publication Critical patent/JP5937946B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラムに関する。
非可逆な映像・画像符号化の構成要素は、予測・変換・量子化・エントロピー符号化の4要素に分類できる。従来、この要素中の「変換」部分は「線形変換」である。固定的な変換の例を説明する。変換には、例えば「離散コサイン変換(DCT)」や「双直交ウェーブレット変換」、実数変換であるDCTを整数近似した「整数変換」がもっぱら使われていた。
線形変換の簡単な例を挙げると、2入力(x0,x1)を2出力(y0,y1)に変換する際、
y0=x0+x1
y1=x0−x1 ・・・(1)
と線形に演算するものである。画像・映像符号化で用いられるほとんどの変換式はDCTあるいはその近似であり、言い換えれば予め定められた変換に固定されている。
次に、非固定的な変換の例を説明する。非固定的な変換を行うものとして、変換式を動的に変化させるものも存在する(例えば、非特許文献1参照)。これは、同じく簡単な例を示すと
y0=ax0+bx1
y1=cx0+dx1 ・・・(2)
において、画像の性質に応じて最適な係数(a,b,c,d)の値を調整し、符号化効率を高めるというものである。しかしながら変換そのものは線形の範疇に属するものである。
次に、選択的な変換の例を説明する。例えば映像符号化規格High Efficiency Video Coding(HEVC、非特許文献2参照)では、四種のサイズ(4点・8点・16点・32点)の整数変換が使われている。HEVCのエンコーダ参照ソフトウェアでは、符号化効率を最も高めるサイズの変換を選択し、その選択情報とともに映像を符号化している。例えば、精細なテクスチャを含む画像ブロックには小さな点数の変換が、起伏のないなだらかな画像ブロックには大きな点数の変換が適しており、これらを選択的に用いることで符号化効率を高めるというものである。これらの変換も、線形の範疇に属するものである。
松田,亀田,伊東,宇都宮:"適応的可変ブロック形状KL変換符号化の性能改善, テレビジョン学会誌 Vol.49,No.3,pp.309−318,1995 Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, "High efficiency video coding (HEVC) text specification draft 8", JCTVC-J1003_d7, July 2012
非可逆な映像・画像符号化に線形変換が用いられる理由の一つは、復号時に必要になる「逆変換」が、線形変換の場合は容易であるが、非線形な変換では一般に極めて困難になるためである。(2)式の変換において出力(y0,y1)を入力(x0,x1)へ戻す変換(逆変換)は解析的に容易に求めることができ、
x0=(dy0−by1)/(ad−bc)
x1=(−cy0+ay1)/(ad−bc) ・・・(3)
となる。しかしながら非線形変換の場合、次のような比較的単純な変換
y0=x0^3+x1
y1=x0−x1^3 ・・・(4)
ですら、逆変換は解析的手段では求められず、数値計算的手段により反復計算を行い、近似値を求めることになり、計算量が膨大になるため高速処理には向かないという問題がある。また反復計算に要する演算量は不定であるため、実時間処理にも向かないという問題もある。
本発明は、このような事情に鑑みてなされたもので、画像・映像の信号に応じて最適な変換処理を適応的に自動生成することができる画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラムを提供することを目的とする。
本発明は、入力画像信号を符号化する画像符号化装置であって、遺伝的プログラミングを用いて、前記入力画像信号の符号化処理に用いる変換器の演算式を前記入力画像信号毎に適応構成して変換器データを出力する変換器生成手段と、前記符号化処理における変換処理を前記変換器データにより置換して前記変換処理を行う変換処理手段と、前記符号化処理における逆変換処理を前記変換器データに対応する逆変換処理により置換して前記逆変換処理を行う逆変換処理手段と、前記変換処理手段と前記逆変換処理手段とを用いて、前記入力画像信号を符号化し、映像符号化データを出力する画像符号化手段と、前記変換器データを符号化し、変換器符号化データを出力する変換器符号化手段と、前記変換器符号化データと前記映像符号化データとを多重化し、符号化データを出力する多重化手段とを備えることを特徴とする。
本発明は、前記変換処理手段による前記変換処理及び前記逆変換処理手段による逆変換処理は、リフティング構造によって表現されていることを特徴とする。
本発明は、前記変換器生成手段は、前記入力画像信号を符号化し、発生する符号量Rを推定する画像符号量推定手段と、前記適応構成の手順を符号化し、手順符号量Roを推定する手順符号量推定手段と、前記演算式を用いて導出された復元画像と前記入力画像信号に基づく原画像の間の二乗誤差和Dを導出する導出手段と、ラグランジュ未定乗数λを用いて、ラグランジュコストCをC=D+λ(R+Ro)によって算出するコスト算出手段とから構成し、前記演算式を適応構成する際の最小化規準を前記ラグランジュコストCとすることを特徴とする。
本発明は、前記画像符号化装置によって符号化された画像信号を復号する画像復号装置であって、符号化データを逆多重化して、変換器符号化データと映像符号化データとを得る逆多重化手段と、前記変換器符号化データを復号して変換器データを得る変換器復号手段と、前記映像符号化データの復号処理における逆変換処理を前記変換器データに対応する逆変換処理により置換して前記逆変換処理を行う逆変換処理手段とを備えることを特徴とする。
本発明は、入力画像信号を符号化する画像符号化方法であって、遺伝的プログラミングを用いて、前記入力画像信号の符号化処理に用いる変換器の演算式を前記入力画像信号毎に適応構成して変換器データを出力する変換器生成ステップと、前記符号化処理における変換処理を前記変換器データにより置換して前記変換処理を行う変換処理ステップと、前記符号化処理における逆変換処理を前記変換器データに対応する逆変換処理により置換して前記逆変換処理を行う逆変換処理ステップと、前記変換処理ステップと前記逆変換処理ステップとを用いて、前記入力画像信号を符号化し、映像符号化データを出力する画像符号化ステップと、前記変換器データを符号化し、変換器符号化データを出力する変換器符号化ステップと、前記変換器符号化データと前記映像符号化データとを多重化し、符号化データを出力する多重化ステップとを有することを特徴とする。
本発明は、前記画像符号化方法によって符号化された画像信号を復号する画像復号方法であって、符号化データを逆多重化して、変換器符号化データと映像符号化データとを得る逆多重化ステップと、前記変換器符号化データを復号して変換器データを得る変換器復号ステップと、前記映像符号化データの復号処理における逆変換処理を前記変換器データに対応する逆変換処理により置換して前記逆変換処理を行う逆変換処理ステップとを有することを特徴とする。
本発明は、コンピュータを、前記画像符号化装置として機能させるための画像符号化プログラムである。
本発明は、コンピュータを、前記画像復号装置として機能させるための画像復号プログラムである。
本発明によれば、画像・映像の信号に応じて、最適な変換処理を適応的に自動生成することができる。また同時に、非線形変換に見られる逆変換処理の計算の困難さを回避し、反復計算などを用いず容易に逆変換処理を行うことが可能になるという効果が得られる。
H.264における4点変換を2×2行列で等価に表した図である。 行列表現の入出力と信号線とを機能ブロックで表したブロック図である。 典型的なリフティング構造変換のブロック図である。 図3に示す変換に対応する逆変換を表すブロック図である。 図1に示す変換を一部リフティング構造で置換したブロック図である。 図1に示す変換を一部リフティング構造で置換したブロック図である。 図1に示す変換を全部リフティング構造で置換したブロック図である。 図5に示す変換を書き直したブロック図である。 図8示す演算器の入力数をそれぞれ1個から3個にしたブロック図である。 単純な演算式を木により表現し、上位・下位ノードや最上位ノード、終端ノードを示す説明図である。 演算式の符号量の推定処理(アルゴリズム1)を示す説明図である。 与えられた木に基づく演算器出力値を求める処理(アルゴリズム2)を示す説明図である。 演算式の符号化処理(アルゴリズム3)を示す説明図である。 演算式の復号処理(アルゴリズム4)を示す説明図である。 本発明の一実施形態における画像符号化装置の構成を示すブロック図である。 本発明の一実施形態における変換器生成・画像符号化の構成を示すブロック図である。 図15に示す変換処理部104の動作を示すフローチャートである。 図1に示す逆変換処理部107の動作を示すフローチャートである。 図16に示す変換器生成部151の動作を示すフローチャートである。 本発明の一実施形態における画像復号装置の構成を示すブロック図である。 本発明の一実施形態における変換器復号・画像復号の構成を示すブロック図である。
以下、図面を参照して、本発明の一実施形態による画像符号化装置及び画像復号装置を説明する。本実施形態では、音声・画像の変換でしばしば用いられる「リフティング構造」と呼ばれる構造を、変換・逆変換に用いる。またこのリフティング構造の構成要素である「演算器」を、「遺伝的プログラミング」と呼ばれる手法により、線形に限らず非線形の範疇も含みながら自動構築する。リフティング構造を用いた変換は、その線形性・非線形性とは無関係に逆変換が可能である。
次に、符号化に用いられている変換・逆変換のリフティング構造による表現について説明する。DCTなどの直交変換は、数学的に等価な「リフティング構造」により表現することができる。例えばH.264/AVCの4点変換行列を4×4行列で表現すると、
Figure 0005937946
のようになっている。ここでx,…,xの4点が入力、y,…,yが同じく4点の出力である。これは、2×2行列を4個用いた図1の変換と数学的に等価である。図1は、H.264における4点変換を2×2行列で等価に表した図である。なお、2×2行列Aによる、(a,a)の2点を(b,b)の2点に変換する数式
Figure 0005937946
を、図2に示すブロック図により表している。図2は、行列表現の入出力と信号線とを機能ブロックで表したブロック図である。行列は入力が右、出力が左なのに対し、図2に示すブロック図では入力が左、出力が右になっている。
この2種の2×2行列は、どちらも平面回転行列を定数倍したものになっている。
Figure 0005937946
ここでc=cosα、s=sinα、αはその行列の回転角、c=cosα、s=sinα、αはその行列の回転角である。
角度αの平面回転行列は、c=cosα、s=sinαを使って、
Figure 0005937946
と変形できる。これに基づき、平面回転行列を図3に示す「リフティング構造」で等価表現できる。図3は、典型的なリフティング構造変換のブロック図である。図3に示すブロック図中で、「+」は2個の信号線からの入力の和を生成する操作を示し、「△」で示される要素は、1入力1出力の演算器である。以下で参照する図においては、「+」は省略する。具体的には(6)式と整合させるように、Pは入力を(c−1)/s倍して出力する。また、Qは入力をs倍して出力し、Rは入力を(c−1)/s倍して出力する。例えば(4)式の変換に対応するリフティング構造は、定数倍を除くと、Pは入力を(1/√2−1)√2倍(−0.4142倍)して出力する。また、Qは入力を1/√2倍(0.7071倍)して出力し、Rは入力を(1/√2−1)√2倍(−0.4142倍)し出力することになる。
この逆変換は、図4に示すように、変換と同じ演算器P,Q,Rを逆順(R,P,Qの順)に用い、加算を減算にしたリフティング構造で表現できる。図4は、図3に示す変換に対応する逆変換を表すブロック図である。図4に示す「−」は、水平の信号線の入力から垂直の信号線の入力を減じる操作を示している。
以下で説明するより複雑なリフティング構造も、すべてこのように演算器を逆順に並べ加算を減算にするだけで逆変換にすることができる。
H.264/AVCが用いている整数変換は、4点と8点があるが、いずれも「平面回転行列」と呼ばれる、2×2行列による変換を組み合わせた構造で表現される。HEVCの4点・8点・16点・32点変換も同様である。したがって、これらの変換および逆変換はいずれも、リフティング構造を組み合わせた変換によって表現することができる。
次に、リフティング構造による変換・逆変換の性質について説明する。前述の説明では演算器P,Q,Rはいずれも入力を定数倍して出力していたが、これらは線形・非線形を問わず任意の演算(入力に無関係な出力を行う演算(例えば「入力を0倍する」やゼロ除算を伴うものなどを除く)でよい。例えば入力x、出力yとすると
y=sinx
y=x^5+x
など、非線形な演算器でも問題はなく、図3に示す変換に続き図4に示す逆変換を施すことにより、入力値が完全再構成される。当然ながら、符号化処理において変換後に行われる「量子化・逆量子化」が加わり、変換後の値が変化したものを逆変換する場合は、入力値の完全再構成はなされない。
次に、自動生成演算器の利用について説明する。ここでは、リフティング構造の演算器を「遺伝的プログラミング」と呼ばれる方法により自動生成する。例えば、図1に示す変換を一部リフティング構造で置換した図5に示す変換において、P,Q,R,S,T,Uの6演算器を、それぞれ遺伝的プログラミングにより自動生成する。図5は、図1に示す変換を一部リフティング構造で置換したブロック図である。
他にも、図6に示す変換においてP,Q,Rを自動生成する、あるいはすべてを置換し、図7に示す変換のA,B,C,D,E,F,P,Q,R,S,T,Uの12個を自動生成するようにしてもよい。図6は、図1に示す変換を一部リフティング構造で置換したブロック図である。図7は、図1に示す変換を全部リフティング構造で置換したブロック図である。
前述の説明ではいずれも、各演算器(△)は1入力である。言い換えると入力数は、特定の信号線からの値1つのみである。しかしながらこの制約は必須ではなく、2入力あるいはそれ以上の入力を用いてもよい。特定の信号線以外からの入力値としては、例えば、ブロック内の他の信号線の値、変換しようとしているブロックの画面内x座標やy座標、変換しようとしているブロックの(画面内・画面間)予測画像の画像特徴量(例えば、分散、予測モード番号、縦エッジ強度、横エッジ強度)、当該フレームの表示番号、当該フレームのピクチャタイプなど、「復号器でも得られる情報」であれば何でもよい。ブロック内の他の信号線を用いることで、変換の自由度を高めることができ、より良好な符号化性能を与える変換を獲得する可能性が高まる。入力値として画面内x座標やy座標を用いると、例えば「画面の左下に向いた変換」や「画面の上1/3に向いた変換」など、空間的な絵柄の性質の違いに応じた変換が生成できる。予測画像の分散を用いると、「起伏の激しい領域(分散が大きい)に向いた変換」や「起伏の穏やかな領域(分散が小さい)に向いた変換」など、局所的な絵柄の性質に応じた変換を生成できる。また、画面内予測はエッジ方向に沿って行われることが多いため、予測モード番号を用いると、そのエッジ方向に適した変換を生成できる。同様に、縦エッジ強度、横エッジ強度を用いれば、「縦エッジの優勢な領域に向いた変換」や「縦にも横にもエッジのある領域に向いた変換」など、局所的な絵柄の性質に応じた変換を生成できる。当該フレームの表示番号を用いることで、符号化シーケンスが例えばフェードイン・フェードアウトなど時間的に変化する場合に、そのフェードの強度に応じた変換が生成でき、時間的な絵柄の性質の違いに応じた変換を生成できる。また、予測残差信号の統計的性質は、そのピクチャが画面内予測なのか、一方向画面間予測なのか、双方向画面間予測なのかというピクチャタイプにより異なっている。そのため当該フレームのピクチャタイプを用いることで、予測残差信号の統計的性質に応じた変換を生成できる。
例えば、図5に示す変換は、図8に示す変換とすることができるが、これを例えば、図9に示す変換のように、他の信号線からも値を参照するようにしてもよい。図8は、図5に示す変換を書き直したブロック図である。図9は、図8示す演算器の入力数をそれぞれ1個から3個にしたブロック図である。この場合も逆変換は、前述の説明と全く同様、演算器を逆順に配置し、信号線との交点を加算から減算に変更することで実現することができる。
次に、前述の演算器を高性能かつ自動に構成する方法について説明する。まず、遺伝的プログラミングについて説明する。ここでは遺伝的プログラミングを用いて演算器を自動構成する。遺伝的プログラミングは、生物進化にヒントを得た「手順の最適化探索」の一手法であり、手順を木で表現するものである。そして、(1)そのような木を多数生成して母集団を形成し、(2)その母集団から適宜取り出された木(親)から遺伝的手法(交叉や突然変異)により新しい木(子)を生成し、(3)その木(子)を評価して、より適したものであれば母集団に加える、という手順を繰り返すことにより、より評価の高い木を獲得(発見)する枠組みである。
上記(3)の「評価」は、映像符号化で広く用いられているラグランジュの未定乗数法により行う。これは、別途入力されるラグランジュ未定乗数λ、変換器を伝送するための符号量Ro[bits]、この変換器を用いて入力信号を符号化した場合の符号量R[bits]と、復号画像と原信号の間の二乗誤差和Dから求まるラグランジュコストC=D+λ(Ro+R)を求め、Cが小さいほど高評価とするものである。ここで変換器の符号量は、変換器を構成する要素である演算器の符号量の和となる。
次に、木構造と演算器(変換器を構成する要素)の対応について説明する。演算器は次のように木構造により記述できる。例えば「1番目の信号線s1と2番目の信号線s2の平均を求める演算器」つまり(s1+s2)/2という演算は、図10に示すように、非終端ノードと終端ノードから構成される木構造により表現することができる。図10は、単純な演算式を木により表現し、上位・下位ノードや最上位ノード、終端ノードを示す説明図である。ここで非終端ノードはいわゆる「関数」であり、例えば条件分岐、加減乗除、三角関数、二乗、平方根、指数・対数、絶対値、最小値、最大値など、一つあるいは複数の入力(引数)から一つの値を返すものである。これらの関数は引数をとるため、木の終端でない部分に現れるため「非終端ノード」と呼ばれる。
また、ノード自体が値を持つ(引数を要しない)ため木の終端に位置する「終端ノード」として、「0.148」のような数値や、s0,s1などのような信号線(信号線が4本あれば、その演算器が加算する信号線を除いた3本をs0、s1、s2と名付ける)の値、変換ブロックの画面内x座標やy座標、変換ブロックの予測値の平均値や分散値、その他変換ブロックの予測モード番号など、符号化器と復号器で共有可能な値などがある。終端ノードおよび非終端ノードは事前に用意しておくもののほか、動的に定義してもよい(automatically defined function,ADF)。ADFについては、文献:「J. Koza: ``Genetic Programming II, Automatic Discovery of Reusable Programs'', The MIT Press, 1998」等に記載されている。
次に、演算器の符号量の推定について説明する。演算器の木構造を表現するのに必要なビット数は、図11に示す再帰的関数(アルゴリズム1)により求めることができる。図11は、演算式の符号量の推定処理(アルゴリズム1)を示す説明図である。ここで木の終端ノードが表す数値は、例えば10ビット固定小数点整数により表現されており、各関数には0からN−1までの固有の通し番号がついているものとする。FUNCINFOは、用いる関数がN種類としたとき、関数を固定長符号化したときの符号量を表す以下の量であり、FUNCINFO=log_2(N+1)となる。
ここでN+1となっているのは、関数の場合に加え数値(0.148など)の場合も含めるためである。ここでは固定長符号化を仮定しているが、関数毎の生起頻度を考慮した可変長符号化を行ってもよい。そして、着目している手順(木)の最上位ノードをrootとしたとき、R=tree_info(root)を実行すれば、木の情報量Rが求まる。
次に、与えられた木に基づく演算結果(出力値)について説明する。出力値は、図12に示すように再帰的な手続き(アルゴリズム2)により求めることができる。図12は、与えられた木に基づく演算器出力値を求める処理(アルゴリズム2)を示す説明図である。図12においては、引数の個数が3個までの例を示しているが、引数の個数上限が4個、5個と増えても処理は同様で、容易に拡張できる。そして、着目している手順(木)の最上位ノードをrootとしたとき、演算器出力=tree_eval(root)として、この演算器の出力値を求めることができる。
次に、演算式の符号化・復号について説明する。符号化も、情報量推定(アルゴリズム1)と同様に、図13に示す再帰的手続き(アルゴリズム3)で実行できる。図13は、演算式の符号化処理(アルゴリズム3)を示す説明図である。そして、着目している手順(木)の最上位ノードをrootとしたとき、tree_encode(root)を実行すれば、その木が符号化できる。このときの必要符号量の下限はtree_info(root)に一致する。
また復号についても同様に図14に示す再帰的関数(アルゴリズム4)で実行できる。図14は、演算式の復号処理(アルゴリズム4)を示す説明図である。図14において、「Fが必要とする引数の数」とは、たとえばFがadd等の2項演算子であれば2、三項演算子あれば3、など、その関数が値を出すのに使用する値の個数(符号化側、復号側ともに既知)である。Fはその個数だけ下位ノードを直下に持っている。そして、tree_decode()を実行すれば、ビットストリームより木が復号され、返される。
このように、従来の変換においては入力画像の画素値または時空間予測差分値に関し、線形な処理でのみ変換結果を求めていたところ、本実施形態では遺伝的プログラミングにより、従来の変換と等価な変換その他の線形変換も含み、かつ線形の範疇にとらわれない変換を次々と生成させるようにしたため、変換設計の自由度を飛躍的に高めることができる。また、生成された変換はラグランジュコストにより符号量−歪みの面で評価し、生存選択を行うようにしたため、必ず性能を改善した変換が生き残り、従来の変換を用いては達成できなかった高い符号化効率を達成することができる。
次に、図面を参照して、本発明の一実施形態による画像符号化装置を説明する。図15は同実施形態における画像符号化装置の構成を示すブロック図である。この画像符号化装置は、符号化対象画像の入力画像信号を入力し、入力画像信号のフレームをブロックに分割してブロック毎に符号化し、符号化データとして出力する。図15に示す画像符号化装置は、変換器データ117を入力する点と、変換処理部104、逆変換処理部107に変更を加えている点が従来技術と異なる点であり、他の構成は、H.264/AVCその他の画像符号化装置として用いられている従来の一般的な構成と同様であるため、図15に示す画像符号化装置の構成の説明を簡単に行う。
予測残差信号生成部103は、入力画像信号とインター予測処理部102あるいはイントラ予測処理部101の出力である予測信号との差分を求め、それを予測残差信号として出力する。変換処理部104は、入力した変換器データ117を参照し、予測残差信号に対して、前述した「変換」を行い、変換係数を出力する。量子化処理部105は、変換係数を量子化し、量子化後の値を出力する。逆量子化処理部106は、量子化後変換係数を入力し、逆量子化処理を行う。逆変換処理部107は、変換器データ117を参照し、逆量子化処理部106の出力である逆量子化後変換係数に対して、前述した「逆変換」を施し、予測残差復号信号を出力する。復号信号生成部108は、この予測残差復号信号とインター予測処理部102あるいはイントラ予測処理部101の出力である予測信号とを加算し、符号化した符号化対象ブロックの復号信号を生成する。この復号信号は、イントラ予測処理部101にて参照画像として用いるために、フレームメモリ109に格納する。イントラ予測処理部101は、フレームメモリ109に格納された画像から予測モードなどを設定する。
また、インター予測処理部102において参照するために、ループ内フィルタ処理部110は、フレームメモリ109に格納した画像を入力して、符号化歪みを低減するフィルタリング処理を行い、フレームメモリ115に格納する。インター予測処理部102は、フレームメモリ115に格納されている過去の画像と、現在の入力画像信号から動きベクトルや動き単位などの情報を求める。ループ内フィルタ処理部110において設定された予測係数等の情報は、ループ内フィルタ情報格納部114に格納される。イントラ予測処理部101において設定された予測モードなどの情報は、イントラ予測情報格納部112に格納される。エントロピー符号化処理部113は、量子化処理部105の出力である量子化後変換係数、ループ内フィルタ情報格納部114に格納された予測係数等の情報、インター予測情報格納部111に格納された動きベクトルなどの情報及びイントラ予測情報格納部112に格納された予測モードなどの情報をエントロピー符号化し、符号化データとして出力する。
次に、図16を参照して、変換器生成・符号化の動作を説明する。図16は、本発明の一実施形態における変換器生成・画像符号化の構成を示すブロック図である。図16に示す符号化器154は、図1に示す装置全体であり、入力信号と変換器データ152を入力としている。変換器生成部151は、入力信号を繰り返し符号化しながら変換器を進化生成させ、最良である変換器の情報を変換器データ152として出力する。この「変換器データ」は、例えば図5に示す全演算器(P,Q,R,S,T,U)を、前述のように「木」として表現したものである。変換器データ152は変換器符号化部153において符号化され、変換器符号化データとして出力される。これは、前述のアルゴリズム3(図13参照)により、「木」で表現された演算器を符号化する。符号化器154はこの変換器データと入力信号から符号化を行い、映像符号化データを出力する。変換器符号化データと映像符号化データはMux部155にて結合され、符号化データとして出力する。
次に、図17を参照して、図15に示す変換処理部104の動作を説明する。図17は、図1に示す変換処理部104の動作を示すフローチャートである。まず、変換処理部104は、変換する点数に応じた数の信号線から値を入力する(ステップS1)。次いで、変換処理部104は、リフティングに用いる演算器Aを処理順に列挙する(ステップS2)。例えば、図8ではS,T,U,P,Q,Rの順に演算器Aに割り当てられる。次いで、変換処理部104は、この演算器Aの出力値を計算する(ステップS3)。これは前述したアルゴリズム2(図12参照)の処理動作によって実現できる。次いで、変換処理部104は、その結果を接続されている信号線へ加算する(ステップS4)。全ループが終了したら(ステップS5)、変換処理部104は、信号線の値を出力する(ステップS6)。
次に、図18を参照して、図15に示す逆変換処理部107の動作を説明する。図18は、図1に示す逆変換処理部107の動作を示すフローチャートである。まず、逆変換処理部107は、変換する点数に応じた数の信号線から値を入力する(ステップS11)。次いで、逆変換処理部107は、リフティングに用いる演算器Aを正変換とは逆順に列挙する(ステップS12)。例えば、図8に示す変換の逆変換ではR,Q,P,U,T,Sの順に演算器Aに割り当てられる。次いで、逆変換処理部107は、この演算器Aの出力値を計算する(ステップS13)。これは前述したアルゴリズム2(図12参照)の処理動作によって実現できる。次いで、逆変換処理部107は、その結果を接続されている信号線の値から減算する(ステップS14)。全ループが終了したら(ステップS15)、逆変換処理部107は、信号線の値を出力する(ステップS16)。
次に、図19を参照して、図16に示す変換器生成部151の詳細動作を説明する。図19は、図16に示す変換器生成部151の動作を示すフローチャートである。まず、変換器生成部151は、母集団生成処理により、進化の元となる変換器(P,Q,Rなど演算器の集合)の集団を生成する(ステップS21)。次いで、変換器生成部151は、複製選択・子の生成処理において親集合の選択と子個体の生成を行う(ステップS22)。「子の生成」は交叉、突然変異、逆位などの処理により行われる。
次に、変換器生成部151は、ステップS22において生成した個体(変換手順を表す)を用い、符号化処理にて、この変換を用いた符号化・復号された画像を生成する(ステップS23)。この変換動作は、前述したアルゴリズム2(図12参照)の処理動作によって実現できる。次いで、変換器生成部151は、二乗誤差和D・符号量R算出処理において全画面の誤差和Dと符号量Rを算出する(ステップS24)とともに、その個体の情報量を木情報量Ro算出処理において算出する(ステップS25)。これは前述したアルゴリズム1(図11参照)の処理動作によって実現できる。
次に、変換器生成部151は、ラグランジュコストC=D+λ(R+Ro)の値を評価値として、生存選択処理において生存するか否かを決定する(ステップS26)。ラグランジュ未定乗数λは、符号化プロセスがRD最適化で用いているのと同一の値であってもよいし、異なったものを別途指定してもよい。そして、変換器生成部151は、進化が収束したか否かを判定する(ステップS27)。例えば、収束条件として、Cの減少割合が一定値(例えば、0.1%)を下回る、評価回数が一定値(例えば、1万回)を超える、などが適用できる。変換器生成部151は、まだ収束していないと判定されればステップS22へ戻り処理を繰り返し、収束と判定されれば処理を終了する。この処理動作によって、高能率変換器が自動生成されることになる。
なお、図15に示す変換動作は、従来の変換処理(4点・8点・16点・32点変換、DCT、DSTなど)と併用してもよいし、一部を置き換えるようにしてもよい。またH.264/AVCやHEVCでは、変換するブロックに対し縦方向(1次元)と横方向(同じく1次元)別々に変換を施しているが、変換を縦横同時に行うような変換(2次元変換)を、変換動作としてもよい。
次に、本発明の一実施形態による画像復号装置を説明する。図20は同実施形態における画像復号装置の構成を示すブロック図である。この画像復号装置は、図15に示す画像符号化装置により符号化された符号化データを入力して復号することにより復号画像の映像信号を出力する。図20に示す画像復号装置は、変換器データ212を入力する点と逆変換処理部205に変更を加えている点が従来技術と異なる点であり、他の構成は、H.264その他の画像復号装置として用いられている従来の一般的な構成と同様であるため、図20に示す画像復号装置の構成の説明を簡単に行う。
復号を行うため、エントロピー復号処理部201は、符号化データを入力し、復号対象ブロックの量子化後変換係数をエントロピー復号するとともに、イントラ予測、インター予測、およびループ内フィルタに関する情報を復号し、イントラ予測情報格納部210、インター予測情報格納部209、ループ内フィルタ情報格納部211にそれぞれ格納する。逆量子化処理部204は、量子化後変換係数を入力し、それを逆量子化して復号変換係数を出力する。逆変換処理部205は、変換器データ212を参照し、復号変換信号に前述した「逆変換」を施し、予測残差復号信号を出力する。
この予測残差復号信号とインター予測処理部203あるいはイントラ予測処理部202の出力である予測信号とを加算し、復号対象ブロックの復号信号を生成する。この復号信号は、イントラ予測処理部202にて参照画像として用いるために、フレームメモリ207に格納する。また、インター予測処理部203にて参照するために、ループ内フィルタ処理部208において、フレームメモリ207に格納された画像を入力して、符号化歪みを低減するフィルタリング処理を行い、出力信号として出力すると同時に、フレームメモリ206に格納する。ループ内フィルタ処理部208は、画質改善フィルタを復号し、得られた画質改善フィルタを使用して、フィルタを施した画素値を生成して出力信号として出力する。
次に、図21を参照して、変換器復号・映像復号の動作を説明する。図21は、本発明の一実施形態における変換器復号・画像復号の構成を示すブロック図である。図21に示す復号器254は、図20に示す装置全体であり、入力信号と変換器データ253を入力としている。符号化データはDeMux部251に入力され、変換器符号化データと映像符号化データに分離される。変換器復号部252は、変換器データ253を復号する。復号器254はこの変換器データと映像符号化データから復号を行い出力信号を出力する。
以上説明したように、画像・映像の非可逆符号化において、映像品質の改善と符号化ビットレートの削減を目的とし、自動的に高性能な符号化方式を生成する際に、画像・映像の信号に応じて最適な変換処理を、非線形の範疇まで含めて、適応的に自動生成するようにした。また同時に、非線形変換に見られたような逆変換処理の計算の困難さを回避し、反復計算などを用いず容易に逆変換処理が可能であるよう変換処理を構成するようにした。これにより、画像・映像符号化において、変換処理後の符号量と逆変換処理後の符号化歪のバランス(ラグランジュコスト)を最適化できるため、より少ない符号量でより高い品質の復号映像を得ることができる。
なお、図15、図20における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより画像符号化処理及び画像復号処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行っても良い。
画像・映像の非可逆符号化において、映像品質の改善および符号化ビットレートの削減を目的として、画像の符号化・復号を行うことが不可欠な用途に適用できる。
101・・・イントラ予測処理部、102・・・インター予測処理部、103・・・予測残差信号生成部、104・・・変換処理部、105・・・量子化処理部、106・・・逆量子化処理部、107・・・逆変換処理部、108・・・復号信号生成部、109・・・フレームメモリ、110・・・ループ内フィルタ処理部、111・・・インター予測情報格納部、112・・・イントラ予測情報格納部、113・・・エントロピー符号化処理部、114・・・ループ内フィルタ情報格納部、115・・・フレームメモリ、116・・・動きベクトル検出部、117・・・変換器データ、201・・・エントロピー復号処理部、202・・・イントラ予測処理部、203・・・インター予測処理部、204・・・逆量子化処理部、205・・・逆変換処理部、206・・・フレームメモリ、207・・・フレームメモリ、208・・・ループ内フィルタ処理部、209・・・インター予測情報格納部、210・・・イントラ予測情報格納部、211・・・ループ内フィルタ情報格納部、212・・・変換器データ、151・・・変換器生成部、152・・・変換器データ、153・・・変換器符号化部、154・・・符号化器、155・・・Mux部、251・・・DeMux部、252・・・変換器復号部、253・・・変換器データ、254・・・復号器

Claims (9)

  1. 入力画像信号を符号化する画像符号化装置であって、
    遺伝的プログラミングを用いて、前記入力画像信号の符号化処理に用いる変換器の演算式を前記入力画像信号と、画像復号装置で得られる情報の少なくとも1つとを入力信号とし、前記入力信号毎に適応構成して変換器データを出力する変換器生成手段と、
    前記符号化処理における変換処理を前記変換器データにより置換して前記変換処理を行う変換処理手段と、
    前記符号化処理における逆変換処理を前記変換器データに対応する逆変換処理により置換して前記逆変換処理を行う逆変換処理手段と、
    前記変換処理手段と前記逆変換処理手段とを用いて、前記入力信号を符号化し、映像符号化データを出力する画像符号化手段と、
    前記変換器データを符号化し、変換器符号化データを出力する変換器符号化手段と、
    前記変換器符号化データと前記映像符号化データとを多重化し、符号化データを出力する多重化手段と
    を備えることを特徴とする画像符号化装置。
  2. 前記画像復号装置で得られる情報は、ブロック内の他の信号線の値、変換しようとしているブロックの画面内座標、変換しようとしているブロックの画面内または画面間予測画像の画像特徴量、フレームの表示番号、フレームのピクチャタイプのいずれかである請求項1に記載の画像符号化装置。
  3. 前記変換処理手段による前記変換処理及び前記逆変換処理手段による逆変換処理は、リフティング構造によって表現されていることを特徴とする請求項1に記載の画像符号化装置。
  4. 前記変換器生成手段は、
    前記入力画像信号を符号化し、発生する符号量Rを推定する画像符号量推定手段と、
    前記適応構成の手順を符号化し、手順符号量Roを推定する手順符号量推定手段と、
    前記演算式を用いて導出された復元画像と前記入力画像信号に基づく原画像の間の二乗誤差和Dを導出する導出手段と、
    ラグランジュ未定乗数λを用いて、ラグランジュコストCをC=D+λ(R+Ro)によって算出するコスト算出手段とから構成し、
    前記演算式を適応構成する際の最小化規準を前記ラグランジュコストCとすることを特徴とする請求項1から3のいずれか1項に記載の画像符号化装置。
  5. 請求項1からのいずれか1項に記載の画像符号化装置によって符号化された画像信号を復号する画像復号装置であって、
    符号化データを逆多重化して、変換器符号化データと映像符号化データとを得る逆多重化手段と、
    前記変換器符号化データを復号して変換器データを得る変換器復号手段と、
    前記映像符号化データの復号処理における逆変換処理を前記変換器データに対応する逆変換処理により置換して前記逆変換処理を行う逆変換処理手段と
    を備えることを特徴とする画像復号装置。
  6. 入力画像信号を符号化する画像符号化方法であって、
    遺伝的プログラミングを用いて、前記入力画像信号の符号化処理に用いる変換器の演算式を前記入力画像信号と、画像復号装置で得られる情報の少なくとも1つとを入力信号とし、前記入力信号毎に適応構成して変換器データを出力する変換器生成ステップと、
    前記符号化処理における変換処理を前記変換器データにより置換して前記変換処理を行う変換処理ステップと、
    前記符号化処理における逆変換処理を前記変換器データに対応する逆変換処理により置換して前記逆変換処理を行う逆変換処理ステップと、
    前記変換処理ステップと前記逆変換処理ステップとを用いて、前記入力信号を符号化し、映像符号化データを出力する画像符号化ステップと、
    前記変換器データを符号化し、変換器符号化データを出力する変換器符号化ステップと、
    前記変換器符号化データと前記映像符号化データとを多重化し、符号化データを出力する多重化ステップと
    を有することを特徴とする画像符号化方法。
  7. 請求項に記載の画像符号化方法によって符号化された画像信号を復号する画像復号方法であって、
    符号化データを逆多重化して、変換器符号化データと映像符号化データとを得る逆多重化ステップと、
    前記変換器符号化データを復号して変換器データを得る変換器復号ステップと、
    前記映像符号化データの復号処理における逆変換処理を前記変換器データに対応する逆変換処理により置換して前記逆変換処理を行う逆変換処理ステップと
    を有することを特徴とする画像復号方法。
  8. コンピュータを、請求項1からのいずれか1項に記載の画像符号化装置として機能させるための画像符号化プログラム。
  9. コンピュータを、請求項に記載の画像復号装置として機能させるための画像復号プログラム。
JP2012228865A 2012-10-16 2012-10-16 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム Expired - Fee Related JP5937946B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012228865A JP5937946B2 (ja) 2012-10-16 2012-10-16 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012228865A JP5937946B2 (ja) 2012-10-16 2012-10-16 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム

Publications (2)

Publication Number Publication Date
JP2014082616A JP2014082616A (ja) 2014-05-08
JP5937946B2 true JP5937946B2 (ja) 2016-06-22

Family

ID=50786428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012228865A Expired - Fee Related JP5937946B2 (ja) 2012-10-16 2012-10-16 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム

Country Status (1)

Country Link
JP (1) JP5937946B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6357073B2 (ja) * 2014-10-24 2018-07-11 日本電信電話株式会社 画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム
KR102379634B1 (ko) * 2020-10-14 2022-03-28 세종대학교산학협력단 쌍직교 웨이블릿을 이용한 원격감지 이미지의 다중레벨 이미지 압축 장치 및 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3887178B2 (ja) * 2001-04-09 2007-02-28 株式会社エヌ・ティ・ティ・ドコモ 信号符号化方法及び装置並びに復号方法及び装置
JP4127818B2 (ja) * 2003-12-24 2008-07-30 株式会社東芝 動画像符号化方法及びその装置
JP2011003946A (ja) * 2009-06-16 2011-01-06 Keio Gijuku 画像符号化復号化方法及び装置
JP5307681B2 (ja) * 2009-10-06 2013-10-02 日本電信電話株式会社 画像符号化構造の自動生成方法,画像符号化構造の自動生成装置およびそのプログラム
JP2011160075A (ja) * 2010-01-29 2011-08-18 Sony Corp 画像処理装置および方法
WO2012127706A1 (ja) * 2011-03-18 2012-09-27 株式会社日立国際電気 動画像符号化装置及び動画像符号化方法

Also Published As

Publication number Publication date
JP2014082616A (ja) 2014-05-08

Similar Documents

Publication Publication Date Title
KR102015374B1 (ko) 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치
JP6407962B2 (ja) 変換がスキップされたときの非可逆コード化のためのイントラ予測モード
JP5797774B2 (ja) メディアデータコーディングのための32点変換
JP5718363B2 (ja) 大きいサイズの変換単位を用いた映像符号化、復号化方法及び装置
JP5590133B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
CN104838650A (zh) 帧内预测编码方法、帧内预测解码方法、帧内预测编码装置、帧内预测解码装置、它们的程序以及记录程序的记录介质
KR20090097688A (ko) 영상의 인트라 예측 부호화/복호화 방법 및 장치
KR20120034582A (ko) 영상/화상을 부호화하기 위한 장치 및 방법
JP2021529477A (ja) 画像の符号化方法、復号化方法、エンコーダ、およびデコーダ
CN105556973A (zh) 水平和垂直变换的并行处理
KR20120015495A (ko) 필터링모드 생략가능한 영상 부호화/복호화 방법 및 장치
JP5937946B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム
JP6030989B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、それらのプログラム並びにプログラムを記録した記録媒体
JP2013093662A (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
WO2012118359A2 (ko) 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치
JP6037521B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
JP6357073B2 (ja) 画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム
JP6727900B2 (ja) 符号化装置、復号装置、及びプログラム
JP2016025529A (ja) 符号化装置、方法、プログラム及び機器
JP2020195096A (ja) 映像符号化装置及びプログラム、並びに、映像復号装置及びプログラム、並びに、映像処理システム
JP2018032900A (ja) 映像符号化装置及び映像復号装置
JP2015061143A (ja) 映像符号化装置、および、映像符号化プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160513

R150 Certificate of patent or registration of utility model

Ref document number: 5937946

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees