JP5674596B2 - 画像符号化装置、画像復号装置、及びこれらのプログラム - Google Patents

画像符号化装置、画像復号装置、及びこれらのプログラム Download PDF

Info

Publication number
JP5674596B2
JP5674596B2 JP2011182485A JP2011182485A JP5674596B2 JP 5674596 B2 JP5674596 B2 JP 5674596B2 JP 2011182485 A JP2011182485 A JP 2011182485A JP 2011182485 A JP2011182485 A JP 2011182485A JP 5674596 B2 JP5674596 B2 JP 5674596B2
Authority
JP
Japan
Prior art keywords
base
transform
fixed
conversion
orthogonal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011182485A
Other languages
English (en)
Other versions
JP2013046206A (ja
Inventor
境田 慎一
慎一 境田
市ヶ谷 敦郎
敦郎 市ヶ谷
俊枝 三須
俊枝 三須
善明 鹿喰
善明 鹿喰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2011182485A priority Critical patent/JP5674596B2/ja
Publication of JP2013046206A publication Critical patent/JP2013046206A/ja
Application granted granted Critical
Publication of JP5674596B2 publication Critical patent/JP5674596B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、画像の圧縮符号化技術に関するものであり、特に、画像の圧縮符号化において、複数種類の直交変換から1つの直交変換を選択し、ブロック単位の画像信号を周波数領域に直交変換して圧縮を行う画像符号化装置、画像復号装置、及びこれらのプログラムに関する。
MPEG−2やAVC/H.264(ISO/IEC 14496-10, Advanced Video Coding/ITU-T Rec. H. 264)などの近年多く利用されている画像の圧縮符号化方式では、画像の各フレームをブロックと呼ばれる矩形領域に分割し、ブロックを単位として画像信号を周波数領域の信号に変換する変換符号化が採用されている。多くの方式では、この周波数変換としてDCT(Discrete Cosine Transform:離散コサイン変換)と呼ばれる直交変換が採用されている。DCTは、画素間相関が高いという画像信号の性質に非常に適しており、簡単な回路計算で画像信号を周波数領域の信号に変換し、できるだけ低周波成分に信号を偏らせることが可能である(例えば、非特許文献1参照)。
AVC/H.264などの方式では、周波数変換処理を施す前に、画面内予測や動き補償予測といった高度な予測処理がなされる。そのため、変換対象の信号は予測後の誤差信号(以下、「予測誤差信号」と称する)となり、元の画像信号の性質とは異なった相関の低い信号になっている可能性もある。このような信号に対応するため、DST(Discrete Sine Transform:離散サイン変換)が利用されることがある。或いは、任意の変換対象の信号に対して最適な変換であるKL(カルーネン・レーベ)変換を利用する試みもある(例えば、特許文献1参照)。ただしKL変換の場合は、信号ごとに最適な変換を計算するとともに変換処理の計算式を構成するパラメータ値(例えば、基底)も符号化して復号側に伝送する必要がある。
また、DCTやDSTには計算式の違いにより複数のタイプが定義されている。それぞれのタイプには一長一短があり、変換対象の信号などに応じて使い分けられる。
このように、周波数への変換には種々の方式があり、それぞれ変換対象の信号に応じた得失があるため、近年の符号化方式では、多くの周波数変換方式の中から適したものを選択する方式がとられることがある。選択の方法としては、変換対象の信号に対して候補である周波数変換を施し、量子化及びエントロピー符号化の処理を実際に行い、それぞれの周波数変換における符号量(Rate)と画質(Distortion:原画像との差分による歪み量)の両方を鑑みて最適化するRD(Rate- Distortion)最適化によることが多い。
特開2001−309380号公報
貴家仁志、「よくわかるディジタル画像処理」、CQ出版社、第6章、1996年2月20日発行
上述したように、多くの周波数変換方式から適したものを選択する処理としてRD最適化が用いられることが多いが、変換対象の信号に対して直交変換、量子化及びエントロピー符号化の一通りの処理を施した上で選択するため非常に処理量が多くなるという問題がある。
例えば、図6に、直交変換の選択を行う従来の画像符号化装置100のブロック図を示す。画像符号化装置100は、DCTやDSTなどの固定の直交変換の基底を有する直交変換(以下、「固定変換」と称する)の基底(以下、「固定変換基底」と称する)を複数用意して、RD最適化に基づく直交変換の選択を行う装置である。尚、本願明細書中、固定変換基底とは対照的に、KL変換などの、画像信号ごとに異なりうる直交変換の基底を算出する直交変換を「基準変換」と称し、この基底を「基準変換基底」と称することにする。尚、基準変換としては、KL変換のほかに、SVD(特異値展開)があり、固定変換としてはDCT、DST、DFT(離散フーリエ変換)、WHT(アダマール変換)又はSLT(スラント変換)などがある。また、固定変換及び基準変換を含む周波数変換について、2次元周波数変換を総括して直交変換と称する。
画像符号化装置100は、固定変換部101と、歪み量算出部1011を有する量子化部102と、符号量算出部1031を有するエントロピー符号化部103と、出力部104と、固定変換基底蓄積部105と、選択制御部106とを備える。固定変換基底蓄積部105は、DCTやDSTなどの固定の直交変換の基底を有する固定変換基底を複数種類蓄積している。
固定変換部101は、画像信号である予測誤差信号を入力して、選択制御部106からの選択信号により固定変換基底蓄積部105から候補選択された1つの直交変換の基底候補を用いて直交変換を施す。
量子化部102は、直交変換を施した予測誤差信号の直交変換係数を量子化するとともに、歪み量算出部1011によって量子化された信号の歪み量を算出する。
エントロピー符号化部103は、量子化された信号に対してエントロピー符号化を施すとともに、符号量算出部1031によって符号化された信号の符号量を算出する。
選択制御部106は、固定変換基底蓄積部105に蓄積された複数種類の直交変換について、量子化部102からの歪み量とエントロピー符号化部103からの符号量を取得し、RD(Rate- Distortion)最適化によるRDコストが最も小さい固定変換を選択し、選択した固定変換の基底による直交変換係数にエントロピー符号化を施した符号化信号を符号化ストリームとして外部に送出するよう出力部104に対して出力制御信号を送出するとともに、選択した固定変換に関する補助情報を符号化ストリームに含めて固定変換基底蓄積部105から出力部104に送出させる。尚、選択した固定変換に関する補助情報は、エントロピー符号化を施して外部に送出するように構成することもできる。
出力部104は、選択した固定変換に関する補助情報とともに、選択制御部106により選択された固定変換の基底による直交変換係数にエントロピー符号化を施した符号化信号の符号化ストリームを外部に送出する。復号側では、この選択した固定変換に関する補助情報を基に符号化信号の復号や逆量子化及び逆直交変換を施すことで画像信号である予測誤差信号を復元する。
このように、多くの周波数変換方式から適したものを選択する処理としてRD最適化を用いると非常に処理量が多くなるという問題が生じる。
本発明は、上述の問題を鑑みて、多くの周波数変換方式から適したものを選択する計算負荷を低減させて複数種類の直交変換から1つの直交変換を選択し、ブロック単位の画像信号を周波数領域に直交変換して圧縮を行う画像符号化装置、画像復号装置、及びこれらのプログラムを提供することを目的とする。
上記課題を解決するために、本発明による一態様では、任意の変換対象の信号に対して最適な変換である最適なKL変換を行い、このKL変換の基底と最も類似する固定変換基底を選択する。
即ち、本発明の画像符号化装置は、複数種類の直交変換から1つの直交変換を選択し、ブロック単位の画像信号を周波数領域に直交変換して圧縮を行う画像符号化装置であって、画像信号ごとに異なりうる直交変換の基底を算出する基準変換を用いて、複数のブロックを対象に周波数領域への変換を行う基準変換基底算出部と、画像信号ごとに固定の直交変換の基底を有する固定変換について、複数種類の固定変換に関する複数の固定変換基底候補を蓄積している固定変換基底蓄積部と、前記固定変換基底蓄積部に蓄積された複数の変換基底候補から、前記ブロックごとに前記基準変換による基底と最も類似する基底を選択する固定変換基底選択部と、当該選択した基底を用いて直交変換が施された前記ブロックごとの直交変換係数に対してエントロピー符号化を施し、当該選択した基底の番号を示す変換基底番号を含む符号化ストリームを生成するエントロピー符号化部とを備え、前記固定変換基底選択部は、前記類似する基底を選択するにあたり、直交変換の変換行列を構成する個々のベクトルの内積和によって最も大きい値を持つ基底を選択する際に、当該内積和に閾値を設けるか、又は個々のベクトルの内積値に閾値を設けることで、前記閾値を超える内積和の値を持つ基底を類似度が高いとして選択するとともに、前記閾値により当該類似度が高いとして前記複数の変換基底候補から選択する基底がないときに、前記基準変換自体の基底を前記エントロピー符号化部によりエントロピー符号化させることを特徴とする。
更に、本発明の画像復号装置は、本発明の画像符号化装置によって出力される符号化ビットストリームから、前記変換基底番号及び符号化されたブロックごとの直交変換係数を抽出する分離部と、前記符号化されたブロックごとの直交変換係数に対してエントロピー復号を施すエントロピー復号部と、号したブロックごとの直交変換係数に対して逆周波数変換を施す逆周波数変換部とを備え、前記逆周波数変換部は、前記変換基底番号が与えられているブロックについては前記変換基底番号に対応する逆固定変換基底を用いて逆周波数変換を施し、前記変換基底番号が与えられておらず前記基準変換自体の基底が用いられているブロックについては、該基準変換自体の基底を用いて逆周波数変換を施すことを特徴とする。
また、本発明のプログラムは、本発明画像符号化装置又は画像復号装置の各構成要素をコンピュータに実行させるためのプログラムとして構成することができる。
本発明によれば、RD最適化の計算量を削減でき、またKL変換そのものを利用する場合のパラメータ符号化・伝送を不要とするため、計算負荷の低減を図ることができ、さらには、符号量低減に伴う画質向上が期待できる。
本発明による一実施形態の画像符号化装置のブロック図である。 本発明による一実施形態の画像復号装置のブロック図である。 本発明による一実施形態の画像符号化装置の動作を示すフロー図である。 本発明による一実施形態の画像復号装置の動作を示すフロー図である。 本発明による一実施形態の画像符号化装置におけるベクトルの内積に関する説明図である。 従来の画像符号化装置の一例を示すブロック図である。
以下、本発明による一実施形態の画像符号化装置及び画像復号装置について、図面を参照しながら説明する。
〔装置構成〕
(画像符号化装置)
図1は、本発明による一実施形態の画像符号化装置のブロック図である。本実施形態の画像符号化装置10は、複数種類の直交変換から1つの直交変換を選択し、ブロック単位の画像信号を周波数領域に直交変換して圧縮を行う装置である。画像符号化装置10は、直交変換・量子化部20と、エントロピー符号化部30とを備える。
直交変換・量子化部20は、複数種類の直交変換から1つの直交変換を選択し、ブロック単位の画像信号を周波数領域に直交変換して量子化を施す機能部であり、基準変換基底算出部201と、固定変換基底選択部202と、固定変換基底蓄積部203とを備える。
基準変換基底算出部201は、画像信号ごとに異なりうる直交変換の基底を算出する基準変換(例えば、KL変換)を用いて、複数のブロックを対象に周波数領域への変換を行い、この基準変換基底を変換対象の画像信号とともに固定変換基底選択部202に送出する。
固定変換基底選択部202は、固定変換基底蓄積部203に蓄積された複数の固定変換基底候補(例えば、DCT又はDSTのタイプ別の基底候補)から、ブロックごとに基準変換(例えば、KL変換)による基底と最も類似する基底を選択する。また、固定変換基底選択部202は、類似する基底を選択するにあたり、直交変換の変換行列を構成する個々のベクトルの内積和(内積値の総和)によって最も大きい値を持つ基底を選択するのが好適である。さらに、固定変換基底選択部202は、類似する基底を選択するにあたり、内積和に対して閾値を設けるか、又は個々のベクトルの内積値に閾値を設けることで、この閾値を超える内積和の値を持つ基底のみを類似度が高いとして決定するのが好適である。また、固定変換基底選択部202は、選択した基底を用いて変換対象の画像信号のブロックに対して直交変換及び量子化を施し、選択された固定変換の直交変換係数のブロックをエントロピー符号化部30に送出する。
固定変換基底蓄積部203は、画像信号ごとに固定の直交変換の基底を有する固定変換について、複数種類の固定変換(例えば、DCT又はDST)に関する複数の固定変換基底候補(例えば、DCT又はDSTのタイプ別の基底候補)を蓄積している。したがって、固定変換基底選択部202は、固定変換基底蓄積部203から、複数の固定変換基底候補を取り出し、ブロックごとに基準変換(例えば、KL変換)による基底と最も類似する基底を選択することができる。
エントロピー符号化部30は、固定変換基底選択部202によって選択した基底を用いて直交変換が施されたブロックごとの直交変換係数に対してエントロピー符号化(例えば、可変長符号化)を施し、当該選択した基底の番号を示す変換基底番号を含む符号化ストリームを生成する。
(画像復号装置)
図2は、本発明による一実施形態の画像復号装置のブロック図である。本実施形態の画像復号装置50は、本実施形態の画像符号化装置10によって符号化された直交変換係数を復号する装置である。画像復号装置50は、分離部51と、エントロピー復号部52と、逆量子化・逆直交変換部53と、逆固定変換基底生成部54とを備える。
分離部51は、画像符号化装置10によって出力される符号化ビットストリームから、変換基底番号及び符号化されたブロックごとの直交変換係数を分離して抽出する。
エントロピー復号部52は、符号化されたブロックごとの直交変換係数に対してエントロピー復号を施す。尚、変換基底番号についてもエントロピー符号化が施されている場合には、同様にエントロピー復号を施す(図示せず)。
逆量子化・逆直交変換部53は、逆周波数変換部として機能し、復号したブロックごとの直交変換係数に対して、逆量子化後に変換基底番号に対応する逆固定変換基底を用いて逆直交変換を施す。
逆固定変換基底生成部54は、変換基底番号に対応する逆固定変換基底を生成する。例えば、画像符号化装置10における固定変換基底蓄積部203と同様に、画像信号ごとに固定の直交変換の基底を有する固定変換について、複数種類の固定変換(例えば、DCT又はDST)に関する複数の固定変換基底候補(例えば、DCT又はDSTのタイプ別の基底候補)を蓄積しておき、変換基底番号に対応する逆固定変換基底を選出するように構成することができる。
本実施形態の画像符号化装置10又は画像復号装置50をコンピュータとして機能させることができ、当該コンピュータに、本発明に係る各構成要素を実現させるためのプログラムは、当該コンピュータの内部又は外部に備えられるメモリ(図示せず)に記憶される。コンピュータに備えられる中央演算処理装置(CPU)などの制御で、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、メモリから読み込んで、本実施形態の画像符号化装置10又は画像復号装置50の各構成要素の機能をコンピュータに実現させることができる。ここで、各構成要素の機能をハードウェアの一部で実現してもよい。
以下、より具体的に、本発明による一実施形態の画像符号化装置10及び画像復号装置50の動作について説明する。
〔装置動作〕
(画像符号化処理)
図3は、本発明による一実施形態の画像符号化装置の動作を示すフロー図である。先ず、変換対象の画像信号(本例では、画面内予測や動き補償予測後の予測誤差信号)は、基準変換基底算出部201に供給される。基準変換として、KL変換により、変換対象の画像信号に最適な直交変換が計算される。基準変換基底(KL変換基底)を求めるために、複数の信号の集合を用いる。この集合は、画像信号の1フレーム、フレームを分割した1スライス、或いは複数の変換ブロックからなる符号化ユニットなどとすることができる。つまり、基準変換基底算出部201によって、画像信号に対する基準変換基底(KL変換基底)の計算集合を複数のブロックとして決定する(ステップS11)。
次に、基準変換基底算出部201によって、KL変換を用いて、決定した複数のブロックを対象に周波数領域への変換を行ない、複数のブロックを対象にした基準変換基底を生成する(ステップS12)。
KL変換は、直交変換ブロック内の画素を無相関化するという意味において最適である。その導出について述べる。直交変換のブロックの数をM、各ブロック内の画素数をNとする。
各ブロックの画素値x(m)をベクトルの要素とし、
x(m)=[x(m), x(m),...,x(m)] m=1,...,M
とする。尚、tは転置行列を示す。
KL変換は、各x(m)に対する平均的に最適な直交変換Vを次式から求めることになる。尚、y(m)は直交変換後の無相関な信号である。
y(m)=Vx(m)
x(m),y(m)の共分散行列をCxx, Cyyとすると、次式の関係が導かれる。
yy=Vxx
y(m)は無相関な信号であるため、その共分散行列Cyyは対角行列になる。よって、VはCxxを対角化する行列となる。対角化する行列VはCxxの固有ベクトルを並べた行列となる。Cxxの固有値を求め、Cxxの固有値を大きさの順(寄与率の高い順)に並べて固有ベクトルを導出し、ノルムが1となるよう正規化することにより、直交変換Vを正規直交変換行列として得る。求められたKL変換基底に対応する第1主成分の固有値の寄与率が低い場合(例えば、50%程度)、基底計算に用いられた集合が多様で、集合自体の相関が低すぎることが想定される。この場合は、KL変換の基底計算に用いる集合を狭めることで対処する。即ち、仮に変換対象の複数のブロックとして1フレーム分を集合としていたならば、この集合を1スライス分に変更する。或いは変換対象の複数のブロックとして1スライス分を集合としていたならば、この集合を1スライス分以下の複数ブロックからなる符号化ユニットとする。
計算されたKL変換の基準変換基底は、固定変換基底選択部202に供給される。固定変換基底選択部202では、固定変換基底蓄積部203に予め蓄えられた複数種類の固定変換(例えば、DCT又はDST)の基底の中から、ブロックごとに基準変換基底に最も類似したものを選択する(ステップS13,S14)。蓄積されている複数種類の固定変換の基底の候補(固定変換基底候補)としては、例えば、下記に示す8タイプ(種類)のDCT(離散コサイン変換)や8タイプ(種類)DST(離散サイン変換)などの基底を候補とする。
例えば、DCT Type Iは式(1)で与えられる。尚、正規化係数C(n),C(k)に関して、n=k=0,Nのとき、C(n),C(k)=1/√2とし、n,k≠0,Nのとき、C(n),C(k)=1とする。また、N個の実数列(画素値列)のうちn番目の画素値x(n)を用いて累積して得られるN個の実数列(周波数成分列)のうち周波数kに変換する変換係数が、X(k)で与えられるものとする。
DCT Type IIは式(2)で与えられる。
DCT Type IIIは式(3)で与えられる。
DCT Type IVは式(4)で与えられる。
DCTにおけるType V〜VIIIは、cos関数の引数の分母にN+1/2の係数がある。
また、DST Type Iは式(5)で与えられる。
DST Type IIは式(6)で与えられる。
DST Type IIIは式(7)で与えられる。
DST Type IVは式(8)で与えられる。
DSTにおけるType V〜VIIIは、sin関数の引数の分母にN+1/2の係数がある。
このように、固定変換基底選択部202は、基準変換基底(本例では、KL変換基底)と固定変換基底侯補との間でブロックごとに類似度を計算する(ステップS13)。つまり、類似度として変換基底であるベクトル間の内積を計算し、その総和が最大となるものを基準変換基底に最も類似した固定変換基底とする。
例えば、図5に示すように、原点Oから固定変換基底のベクトルuとKL変換基底のベクトルvとで表すとき、これらのベクトルは、元の画像信号のベクトルからの回転行列で表すことができ、固定変換基底のベクトルuとKL変換基底のベクトルvの回転角をθとし、正規化された2つのベクトルu,v(|u|=|v|=1)同士の内積を計算すると、ベクトルが同一方向の場合(θ=0)は|u||v|cos0=1*1*1=1、逆方向の場合(θ=180°)は|u||v|cos180°=−1、直交している場合(θ=90°)は|u||v|cos90°=0となる。尚、図5において、単に変換行列の回転角の大小によって類似度を判別するよりも、内積計算を用いることにより、類似度の判定における精度を高めることができ、さらに、類似度の判定における高精度化に伴う計算負担を低減させることができる。
このため、個々のベクトルの類似度は、個々のベクトルの内積により計算でき、個々のベクトルの内積の総和が最大になるものを類似度が最も高い基底であると定義する(ステップS14)。ただし、単純に総和を取るだけでは、基準変換基底との類似度の絶対値が低い場合でも選択されてしまう恐れがあるため、寄与率閾値処理による制約を設ける。
具体的には、固定変換基底選択部202は、類似する基底を選択するにあたり、当該内積和に関して閾値を設け、この閾値を超える内積和の値を持つ基底のみを類似度が高いとして決定する(ステップS15〜S17)。つまり、個々のベクトルの内積値の総和の最も大きい基底に対し、個々のベクトルの内積値の総和に対して閾値を設けるか、又は個々の内積値に閾値を設けることで、KL変換による基準変換基底に類似した基底を高精度で選択するようにする(ステップS16のYes)。
尚、固定変換基底選択部202は、類似度の算出に伴い、KL変換による基準変換基底と、固定変換基底蓄積部203に蓄えられている固定変換基底の双方とも、直交変換における各主成分の固有値の総和に対する寄与率が最も高いものから順に並べて一時メモリ(図示せず)に保存するのが閾値の設定に便利である。
前述したように、DCTやDSTに限らず、KL変換においても正規直交変換行列として得られ、類似度を求める際に得られる内積値もN個のベクトルの要素となり、共分散行列はN個の内積値の総和となる。ここで、変数全体のもつ変動(内積値の総和)についていわゆる主成分分析を行うと、N個の内積値の総和を構成する主成分を、その総和に対する寄与率の高い順に、第1主成分、第2主成分、・・・、第5主成分などのように分析することができる。個々のベクトルの内積値の総和においても、各主成分の係数が固有ベクトルとなり、各主成分の変動の大きさが固有値となる。個々のベクトルの内積値の総和に対して閾値を設ける場合には、閾値判定の主成分分析を行う必要はないが、より高精度の閾値判定を行うために、個々の内積値(主成分)ごとに閾値を設けるのが好適である。
特に、類似度が高い第1主成分の寄与率は80〜90%となることが多いため、第1主成分の内積値に対する閾値は大きめの閾値(例えば、50%)とし、第2主成分以降については小さい値の閾値(例えば、0〜10%)を設定する。仮に、全ての固定変換基底の候補について、設定した閾値より内積値が小さい場合、固定変換基底選択部202は、選択する基底がないものとし、KL変換自体の基底を変換基底として選択する(ステップS16のNo)。
選択された変換基底は、エントロピー符号化部30に供給される。固定変換基底の候補は予め定められたものであるため、選択された基底は番号などによって特定することができる。そこで、エントロピー符号化部30は、選択された基底を特定する番号(変換基底番号)を符号化・伝送することで符号量を削減することができる(ステップS17)。
ただし、KL変換自体が変換基底となった場合、即ち変換基底蓄積部に蓄えられた変換基底が使われない場合は、エントロピー符号化部30は、KL変換の基底を符号化する(ステップS18)。
(画像復号処理)
図4は、本発明による一実施形態の画像復号装置の動作を示すフロー図である。画像復号装置50では、分離部51によって、符号化ビットストリームから変換基底番号を分離する(ステップS21)。変換基底番号についてエントロピー符号化されていた場合は、エントロピー復号を施して抽出する。
続いて、逆固定変換基底生成部54によって、変換基底番号に対応する逆固定変換基底を生成し(ステップS22)、エントロピー復号部52によって、符号化された直交変換係数の符号化信号に対してエントロピー復号を施す(ステップS23)。
続いて、逆量子化・逆直交変換部53によって、変換基底番号に対応する逆固定変換基底を用いて、復号したブロックごとの直交変換係数に対して逆周波数変換を施す(ステップS24)。尚、変換基底番号によらず、KL変換の基底が符号化・伝送されている場合には、この基底によるKL逆変換を施す。
これにより、従来のようなRD最適化を用いずに、またKL変換そのものを利用する場合のパラメータ符号化・伝送を不要とし、計算負荷の低減を図ることができる。
本発明によれば、例えば複数のブロックからなる1フレーム(1画面)毎にKL変換基底を求めて、ブロックごとに8種類の固定変換基底との内積を計算することができる。一方で、従来において、KL変換があまり使われないのは、画像によって基底が変化するので逐一計算する必要があり、その処理量が増加し、かつ変換行列を復号側に伝送しなければならない等の欠点があるためである。
つまり、従来では、例えば8種類の固定変換基底から一つを選択するための比較計算として、先ず、ブロックごとに、実際の直交変換・量子化・符号化により、符号量及び歪み量の見積を算出しなければならず(処理量大)、次に、これらの符号量及び歪み量の見積りについて8種類の固定変換基底を比較して最適なものを決定することになる(処理量軽)。
一方、本発明では、先ず、1画面に対してKL変換を1回だけ実行し、次に、ブロックごとに、求めたKL変換との内積計算により8種類の固定変換基底を比較して最も類似したものを決定する(処理量軽)。このため、本発明では、従来と比較して、KL変換の1回分の処理量が増えるが、ブロックごとの処理量が減るため、複数種類の固定変換基底から一つを選択するための計算全体での処理量を低減させることができ、さらに、基本的にはKL変換基底を伝送しないように構成しているため、伝送効率が悪化することもない。特に、従来のようなRD最適化を用いることなくとも、任意の信号に対して最適な直交変換が実現可能なKL変換を基準変換としているため、符号量低減に伴う画質向上が期待できる。
本発明によれば、RD最適化の計算量を削減でき、またKL変換そのものを利用する場合のパラメータ符号化・伝送を不要とし、計算負荷の低減を図ることができるため、複数種類の直交変換から1つの直交変換を選択し、ブロック単位の画像信号を周波数領域に直交変換して圧縮を行う用途に有用である。
10 画像符号化装置
20 直交変換・量子化部
30 エントロピー符号化部
50 画像符号化装置
51 分離部
52 エントロピー復号部
53 逆量子化・逆直交変換部
54 逆固定変換基底生成部
100 画像符号化装置
101 固定変換部
102 量子化部
103 エントロピー符号化部
104 出力部
105 固定変換基底蓄積部
106 選択制御部
201 基準変換基底算出部
202 固定変換基底選択部
203 固定変換基底蓄積部
1011 歪み量算出部
1031 符号量算出部

Claims (4)

  1. 複数種類の直交変換から1つの直交変換を選択し、ブロック単位の画像信号を周波数領域に直交変換して圧縮を行う画像符号化装置であって、
    画像信号ごとに異なりうる直交変換の基底を算出する基準変換を用いて、複数のブロックを対象に周波数領域への変換を行う基準変換基底算出部と、
    画像信号ごとに固定の直交変換の基底を有する固定変換について、複数種類の固定変換に関する複数の固定変換基底候補を蓄積している固定変換基底蓄積部と、
    前記固定変換基底蓄積部に蓄積された複数の変換基底候補から、前記ブロックごとに前記基準変換による基底と最も類似する基底を選択する固定変換基底選択部と、
    当該選択した基底を用いて直交変換が施された前記ブロックごとの直交変換係数に対してエントロピー符号化を施し、当該選択した基底の番号を示す変換基底番号を含む符号化ストリームを生成するエントロピー符号化部とを備え、
    前記固定変換基底選択部は、前記類似する基底を選択するにあたり、直交変換の変換行列を構成する個々のベクトルの内積和によって最も大きい値を持つ基底を選択する際に、当該内積和に閾値を設けるか、又は個々のベクトルの内積値に閾値を設けることで、前記閾値を超える内積和の値を持つ基底を類似度が高いとして選択するとともに、前記閾値により当該類似度が高いとして前記複数の変換基底候補から選択する基底がないときに、前記基準変換自体の基底を前記エントロピー符号化部によりエントロピー符号化させることを特徴とする画像符号化装置。
  2. 請求項に記載の画像符号化装置によって出力される符号化ビットストリームから、前記変換基底番号及び符号化されたブロックごとの直交変換係数を抽出する分離部と、
    前記符号化されたブロックごとの直交変換係数に対してエントロピー復号を施すエントロピー復号部と、
    号したブロックごとの直交変換係数に対して逆周波数変換を施す逆周波数変換部とを備え
    前記逆周波数変換部は、前記変換基底番号が与えられているブロックについては前記変換基底番号に対応する逆固定変換基底を用いて逆周波数変換を施し、前記変換基底番号が与えられておらず前記基準変換自体の基底が用いられているブロックについては、該基準変換自体の基底を用いて逆周波数変換を施すことを特徴とする画像復号装置。
  3. 複数種類の直交変換から1つの直交変換を選択し、ブロック単位の画像信号を周波数領域に直交変換して圧縮を行う画像符号化装置として機能するコンピュータに、
    (A)画像信号ごとに異なりうる直交変換の基底を算出する基準変換を用いて、複数のブロックを対象に周波数領域への変換を行うステップと、
    (B)画像信号ごとに固定の直交変換の基底を有する固定変換について複数種類の固定変換に関する複数の固定変換基底候補を蓄積している固定変換基底蓄積部から、前記複数の固定変換基底候補を取り出し、前記ブロックごとに前記基準変換による基底と最も類似する基底を選択するステップと、
    (C)当該選択した基底を用いて直交変換が施された前記ブロックごとの直交変換係数に対してエントロピー符号化を施し、当該選択した基底の番号を示す変換基底番号を含む符号化ストリームを生成するステップとを実行させるためのプログラムであって、
    前記ステップ(B)は、前記類似する基底を選択するにあたり、直交変換の変換行列を構成する個々のベクトルの内積和によって最も大きい値を持つ基底を選択する際に、当該内積和に閾値を設けるか、又は個々のベクトルの内積値に閾値を設けることで、前記閾値を超える内積和の値を持つ基底を類似度が高いとして選択するステップを含み、
    前記ステップ(C)は、前記ステップ(B)により前記閾値により当該類似度が高いとして前記複数の変換基底候補から選択する基底がないときに、前記基準変換自体の基底をエントロピー符号化するステップを含む、プログラム。
  4. コンピュータに、
    (A)請求項に記載の画像符号化装置によって出力される符号化ビットストリームから、前記変換基底番号及び符号化されたブロックごとの直交変換係数を抽出するステップと、
    (B)前記符号化されたブロックごとの直交変換係数に対してエントロピー復号を施すステップと、
    (C)前記変換基底番号に対応する逆固定変換基底を用いて、復号したブロックごとの直交変換係数に対して逆周波数変換を施すステップとを実行させるためのプログラムであって、
    前記ステップ(C)は、前記変換基底番号が与えられているブロックについては前記変換基底番号に対応する逆固定変換基底を用いて逆周波数変換を施し、前記変換基底番号が与えられておらず前記基準変換自体の基底が用いられているブロックについては、該基準変換自体の基底を用いて逆周波数変換を施すステップを含む、プログラム。
JP2011182485A 2011-08-24 2011-08-24 画像符号化装置、画像復号装置、及びこれらのプログラム Expired - Fee Related JP5674596B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011182485A JP5674596B2 (ja) 2011-08-24 2011-08-24 画像符号化装置、画像復号装置、及びこれらのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011182485A JP5674596B2 (ja) 2011-08-24 2011-08-24 画像符号化装置、画像復号装置、及びこれらのプログラム

Publications (2)

Publication Number Publication Date
JP2013046206A JP2013046206A (ja) 2013-03-04
JP5674596B2 true JP5674596B2 (ja) 2015-02-25

Family

ID=48009784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011182485A Expired - Fee Related JP5674596B2 (ja) 2011-08-24 2011-08-24 画像符号化装置、画像復号装置、及びこれらのプログラム

Country Status (1)

Country Link
JP (1) JP5674596B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6159139B2 (ja) * 2013-05-07 2017-07-05 日本放送協会 画像処理装置、符号化装置、及びプログラム
US10390048B2 (en) * 2016-02-15 2019-08-20 Qualcomm Incorporated Efficient transform coding using optimized compact multi-pass transforms
CN116963111A (zh) * 2022-04-19 2023-10-27 华为技术有限公司 信号处理方法和设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0380713A (ja) * 1989-08-24 1991-04-05 Sony Corp 信号伝送装置
JP3887178B2 (ja) * 2001-04-09 2007-02-28 株式会社エヌ・ティ・ティ・ドコモ 信号符号化方法及び装置並びに復号方法及び装置

Also Published As

Publication number Publication date
JP2013046206A (ja) 2013-03-04

Similar Documents

Publication Publication Date Title
US10425649B2 (en) Method and apparatus for performing graph-based prediction using optimization function
EP1379000B1 (en) Signal encoding method and apparatus and decoding method and apparatus
JP6033725B2 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
US9204154B2 (en) Image encoding device and image decoding device
US20070237236A1 (en) Estimating sample-domain distortion in the transform domain with rounding compensation
US9554145B2 (en) Re-encoding image sets using frequency-domain differences
JP2013502140A (ja) 動きベクトルの正確度の調節を利用した映像符号化、復号化方法及び装置
EP2536147A1 (en) Predictive coding method for motion vector, predictive decoding method for motion vector, video coding device, video decoding device, and programs therefor
EP2536148A1 (en) Predictive coding method for motion vector, predictive decoding method for motion vector, video coding device, video decoding device, and programs therefor
KR20130139285A (ko) 모션 매트릭스를 사용하여 비디오 인코딩 및 디코딩하기 위한 방법 및 장치
JP7483964B2 (ja) 画像符号化装置、画像復号装置、及びプログラム
WO2015115645A1 (ja) 動画像符号化装置及び動画像符号化方法
JP5909149B2 (ja) 色変換装置、符号化器および復号器ならびにそれらのプログラム
KR101170799B1 (ko) 영상 압축 방법 및 그 장치와 영상 복원 방법 및 그 장치
JP5674596B2 (ja) 画像符号化装置、画像復号装置、及びこれらのプログラム
US8503810B2 (en) Image compression using partial region determination
CN109076248A (zh) 通过由选出的训练信号生成的码本进行视频编码的矢量量化
Irannejad et al. Block matching video compression based on sparse representation and dictionary learning
KR100788704B1 (ko) 영상 변환 방법 및 그 장치
JP2013017128A (ja) イントラ予測モード推定装置、画像符号化装置、画像復号装置、及びプログラム
JP4697111B2 (ja) 画像比較装置および方法、並びに、画像検索装置および方法
Kolekar et al. An Efficient and Secure Fractal Image and Video Compression
KR101370706B1 (ko) 영상 부호화기의 전처리 장치 및 방법
KR101075670B1 (ko) 다수의 기본 블록들을 이용하여 다차원 변환하고 임계 처리하는 방법 및 장치
JP2003069999A (ja) 画像符号化方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140930

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141222

R150 Certificate of patent or registration of utility model

Ref document number: 5674596

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees