JP2014068251A - 画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラム - Google Patents
画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラム Download PDFInfo
- Publication number
- JP2014068251A JP2014068251A JP2012212946A JP2012212946A JP2014068251A JP 2014068251 A JP2014068251 A JP 2014068251A JP 2012212946 A JP2012212946 A JP 2012212946A JP 2012212946 A JP2012212946 A JP 2012212946A JP 2014068251 A JP2014068251 A JP 2014068251A
- Authority
- JP
- Japan
- Prior art keywords
- image
- component
- predicted
- distortion
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
【課題】 画像間の歪の評価を効率的に行う。
【解決手段】 本発明は、第1の画像と第2の画像の間の歪を評価する画像評価処理装置に関する。そして、画像評価処理装置は、第1の画像と第2の画像の差分に係るDC成分を抽出する手段と、第1の画像と上記第2の画像の差分に係るAC成分を抽出する手段と、求めたDC成分とAC成分に基づいて、第1の画像と第2の画像との間の歪を評価する歪評価値を計算する手段とを有することを特徴とする。
【選択図】 図1
【解決手段】 本発明は、第1の画像と第2の画像の間の歪を評価する画像評価処理装置に関する。そして、画像評価処理装置は、第1の画像と第2の画像の差分に係るDC成分を抽出する手段と、第1の画像と上記第2の画像の差分に係るAC成分を抽出する手段と、求めたDC成分とAC成分に基づいて、第1の画像と第2の画像との間の歪を評価する歪評価値を計算する手段とを有することを特徴とする。
【選択図】 図1
Description
本発明は画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラムに関し、例えば、H.264/MPEG−4AVC等の動画像符号化技術による動画像圧縮符号の処理に適用できる。
従来、H.264/MPEG−4AVC(以下、単に「H.264」と呼ぶ)等に代表される映像符号化技術による動画像の符号化処理(圧縮符号化処理)では、入力された対象画像を分割した処理単位毎に、動き補償予測等を行った予測画像と、入力された対象画像との差分である予測残差信号に、離散コサイン変換等の空間変換を施した変換係数を量子化して、これを算術符号等のエントロピー符号化することによって高効率の映像圧縮を実現している。
上述の通り、従来H.264に基づく従来の動画像の符号化処理では、入力画像に対応する予測画像を求める。そして、従来の符号化処理では、複数の動きベクトルや、複数の予測モードで求めた予測画像候補のそれぞれについて、対象画像との歪を評価し、歪が小さくなる動きベクトルや予測モードによる候補を選択して、対象画像の符号化に用いることで、符号化効率を高めることができる。
従来、予測画像の生成における動き探索(ME:motion estimation)等で歪の評価に用いられているのは、差分絶対値和SAD(sum of absolute difference)や、ブロックの差分値を直行変換した変換係数の絶対値和で得られるSATD(sum of absolute transformed difference)等の歪指標がある。
以下では、歪指標SAD、SATDの算出方法について説明する。
まず、歪指標SADの算出方法について説明する。歪指標SADは以下の(1)、(2)式により求められる。以下の(1)式では、符号化対象となる入力画像のブロックを0(i、j)と表している。また、以下(1)式では、入力画像のブロックを0(i、j)に対して動き補償やイントラ予測で求めた予測画像ブロックをP(i、j)と表している。さらに、以下の(1)式では、0(i、j)とP(i、j)との差分値をDiff(i、j)と表している。そして、SADは差分値Diff(i、j)の絶対値和であるため、以下の(2)式により求めることができる。
次に、歪指標SATDの算出方法について説明する。SATDは差分値を直行変換した変換係数の絶対値和である。通常、直行変換としてはアダマール変換が用いられる。この場合、アダマール変換Tとして用いられる変換行列は、例えば4×4のブロックに対する変換行列で表すと以下の(3)式の内容となる。
入力画像と予測画像との残差はDCT等で空間変換して符号化されるため、一般にSATDを用いて選択した方が周波数領域での歪が評価され符号化効率は高くなるが、SADに比べて演算量が非常に多い。
図9は、予測画像における歪の成分を示した説明図である。例えば、図9(a)のようなグラフで示されるブロックOとブロックPの場合、図9(b)に示すように画素値の差分は大きなものとなってしまう。しかし、図9(c)のように空間周波数領域で分析すると、差分はDC成分に集中しており、歪は比較的小さいということになる。SADによる評価ではこのような予測候補は選択されない。
H.264の符号化処理(リファレンスエンコーダ)において、予測画像の歪評価を行う場合、演算量削減のため、探索回数の多い整数画素精度のMEはSADで行い、整数精度ベクトルを精緻化するサブピクセル精度のMEはSATDで行う方法が採用されている。
また、他にも、SATDの演算量を削減する方法として、特許文献1の記載技術がある。特許文献1では、アダマール変換の周波数成分を間引いて、一部の周波数成分の変換係数の絶対値和から求めた簡易SATDを用いる方法が開示されている。
従来の動画像符号化処理において、符号化効率を向上させたい場合は、SADのみを用いて予測画像の歪を評価するよりも、SATDを用いる方法が使用される場合がある。しかし、従来の動画像符号化処理では、SATDを用いて歪を評価するためには、アダマール変換処理が必要となり、演算量が非常に多くなってしまうという問題があった。
また、特許文献1のように、SATDのアダマール変換の周波数成分を間引いて演算量を削減する方法では、間引かれた周波数成分における歪が考慮されずに歪が評価されてしまい符号化効率が低下する場合があるという問題があった。
そこで、上述のような問題に鑑みて、画像間の歪の評価を効率的に行うことができる画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラムが望まれている。
第1の本発明の画像評価処理装置は、(1)第1の画像と第2の画像の差分に係るDC成分を抽出するDC成分抽出手段と、(2)上記第1の画像と上記第2の画像の差分に係るAC成分を抽出するAC成分抽出手段と、(3)上記DC成分と、上記AC成分に基づいて、上記第1の画像と上記第2の画像との間の歪を評価する歪評価値を計算する歪評価値計算手段とを有することを特徴とする。
第2の本発明の動画像符号化装置は、(1)動画像を構成する対象画像に対応する複数の予測画像を生成する予測画像生成手段と、(2)上記予測画像生成手段が生成した予測画像のそれぞれについて、当該予測画像の上記対象画像に対する歪を評価する画像評価処理手段と、(3)少なくとも上記画像評価処理手段の評価結果を利用して、上記予測画像生成手段が生成したいずれかの予測画像を選択する予測画像選択手段と、(4)上記対象画像と、上記予測画像選択手段が選択した予測画像との残差信号に基づいて、上記動画像の符号化処理を行う符号化手段とを有し、(5)上記画像評価処理手段は、(5−1)上記対象画像と上記予測画像の差分に係るDC成分を抽出するDC成分抽出手段と、(5−2)上記対象画像と上記予測画像の差分に係るAC成分を抽出するAC成分抽出手段と、(5−3) 上記DC成分と、上記AC成分に基づいて、上記対象画像と上記予測画像との間の歪を評価する歪評価値を計算する歪評価値計算手段とを有することを特徴とする。
第3の本発明の画像評価処理プログラムは、コンピュータを、(1)第1の画像と第2の画像の差分に係るDC成分を抽出するDC成分抽出手段と、(2)上記第1の画像と上記第2の画像の差分に係るAC成分を抽出するAC成分抽出手段と、(3)上記DC成分と、上記AC成分に基づいて、上記第1の画像と上記第2の画像との間の歪を評価する歪評価値を計算する歪評価値計算手段として機能させることを特徴とする。
第4の本発明の動画像符号化プログラムは、コンピュータを、(1)動画像を構成する対象画像に対応する複数の予測画像を生成する複数の予測画像生成手段と、(2)上記予測画像生成手段が生成した予測画像のそれぞれについて、当該予測画像の上記対象画像に対する歪を評価する画像評価処理手段と、(3)少なくとも上記画像評価処理手段の評価結果を利用して、上記予測画像生成手段が生成したいずれかの予測画像を選択する予測画像選択手段と、(4) 上記対象画像と、上記予測画像選択手段が選択した予測画像との残差信号に基づいて、上記動画像の符号化処理を行う符号化手段として機能させ、(5)上記画像評価処理手段は、(5−1)上記対象画像と上記予測画像の差分に係るDC成分を抽出するDC成分抽出手段と、(5−2)上記対象画像と上記予測画像の差分に係るAC成分を抽出するAC成分抽出手段と、(5−3)上記DC成分と、上記AC成分に基づいて、上記対象画像と上記予測画像との間の歪を評価する歪評価値を計算する歪評価値計算手段とを有することを特徴とする。
本発明によれば、画像間の歪の評価を効率的に行うことができる。
(A)第1の実施形態
以下、本発明による画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラムの第1の実施形態を、図面を参照しながら詳述する。第1の実施形態では、本発明の画像評価処理装置を、SADD計算部として実現した例について説明する。
以下、本発明による画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラムの第1の実施形態を、図面を参照しながら詳述する。第1の実施形態では、本発明の画像評価処理装置を、SADD計算部として実現した例について説明する。
(A−1)第1の実施形態の構成
図2は、この実施形態の動画像符号化装置1の全体構成を示すブロック図である。なお、図2において、括弧内の符号は、後述する第2の実施形態でのみ用いられる符号である。
図2は、この実施形態の動画像符号化装置1の全体構成を示すブロック図である。なお、図2において、括弧内の符号は、後述する第2の実施形態でのみ用いられる符号である。
動画像符号化装置1は、画面分割部101、空間変換部102、量子化部103、エントロピー符号化部104、逆量子化部105、逆空間変換部106、ループ内フィルタ部107、参照画像バッファ108、インター予測部109、イントラ予測部110、予測画像選択部111、残差信号生成部112、復号画像生成部113、及び予測画像制御部114を有している。
動画像符号化装置1は、プロセッサ及びメモリ等を有するコンピュータ(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い。)に、実施形態の動画像符号化プログラム(実施形態の画像評価処理プログラムを含む)等をインストールすることにより構築しても良く、その場合でも、機能的には上述の図2のように示すことができる。なお、図2において、予測画像選択部111以外の構成について限定されないものであり、例えば、H.264等に準拠した種々の動画像符号化装置と同様のものを適用することができるため、詳細については説明省略する。
画面分割部101は、対象画像(入力画像)を、マクロブロックや予測パーティション等の処理単位領域ごとに画面分割して、残差信号生成部112に供給する。以下では、画面分割部101が出力する対象画像を分割したブロックを、対象画像ブロックOと呼ぶものとする。
残差信号生成部112は、画面分割部101から供給される分割済の画像データとインター予測部109又はイントラ予測部110から供給される予測画像とから、予測残差信号を得て、空間変換部102に供給するものである。
空間変換部102は、予測残差信号を、DCT(離散コサイン変換)やその整数近似変換等によって空間変換して変換係数を得る。そして、量子化部103は、その変換係数を、所定の量子化幅で量子化した結果として、量子化された予測残差信号を得て、エントロピー符号化部104に供給する。
そして、エントロピー符号化部104は、量子化された予測残差信号についてエントロピー符号化(例えば、可変長符号化等)を行って、その他の符号化情報とともに符号化ストリームのデータを生成する。この符号化ストリームのデータが、動画像符号化装置1の出力となる。
逆量子化部105は、量子化された予測残差信号を逆量子化する。そして、逆空間変換部106は、予測残差信号が逆量子化された結果に対して、逆空間変換(逆直交変換等)を行い、量子化誤差を伴う予測残差信号を得て、復号画像生成部113に供給する。
復号画像生成部113は、量子化誤差を伴う予測残差信号(逆空間変換部106からの入力信号)と予測画像(インター予測部109又はイントラ予測部110からの予測画像)より復号画像を得る。復号画像生成部113は、復号画像をループ内フィルタ部107及びイントラ予測部110に供給する。
ループ内フィルタ部107は、復号画像に対して、量子化によるブロック歪を軽減するデブロッキングフィルタ等として機能するものである。そして、ループ内フィルタ部107は、フィルタ処理した復号画像を参照画像バッファ108に供給する。
参照画像バッファ108は、ループ内フィルタ部107からのフィルタ処理した復号画像を、後続画像の符号化時のインター予測の動き補償に係る参照画像として保持する。なお、H.264/AVC標準の場合、動き補償で参照する画像は、現在符号化を行おうとしている画像の直前画像に限定されず、複数の時刻の画像が参照画像となり得る。
インター予測部109は、現在符号化を行おうとしている対象画像と、参照画像バッファ108内の参照画像から動き補償等の予測情報を得て予測画像データを生成するものである。イントラ予測部110は、対象画像の既に符号化され、局所復号された復号画像を用いて予測画像データを生成するものである。インター予測部109及びイントラ予測部110は、対象画像ブロックO単位で予測画像(以下、「予測画像ブロックP」と呼ぶ)を生成して出力する。
予測画像選択部111は、対象画像(対象画像ブロックO)ごとに、対応する予測画像(予測画像ブロックP)の複数の候補からいずれかを選択するものである。すなわち、予測画像選択部111は、インター予測部109で生成された複数の予測画像ブロックP、又はイントラ予測部110で生成された複数の予測画像ブロックPを評価して、その評価結果に基づいて、いずれかの予測画像を選択する処理を行う。この実施形態の動画像符号化装置1では、上述のインター予測部109、又はイントラ予測部110が複数の予測画像を生成していずれかを選択するものとして説明するが、動画像符号化装置1において、生成される予測画像の種類の数は限定されないものである。そして、予測画像選択部111は、その選択結果を示す情報(以下、「選択結果情報」と呼ぶ)を出力する。選択結果情報の形式は限定されないものであるが、例えば、予測画像ブロックPの候補番号情報(例えば、インター予測部109の動きベクトル探索の候補動きベクトル番号、又はイントラ予測部110の予測モード番号)としてもよい。
そして、予測画像選択部111から出力される選択結果情報は、予測画像制御部114に供給される。予測画像制御部114は、供給される選択結果情報に応じた予測画像ブロックP(インター予測部109の複数の候補、又はイントラ予測部110の複数の候補のいずれかの出力)が、復号画像生成部113に供給されるようにする制御処理を行う。
次に、予測画像選択部111の内部構成の詳細について説明する。
図3は、予測画像選択部111内部の機能的構成について示したブロック図である。
予測画像選択部111は、SADD計算部201、予測情報符号量計算部202、コスト計算部203、及びコスト最小予測選択部204を有している。
SADD計算部201は、対象画像に係る対象画像ブロックOと、予測画像に係る予測画像ブロックPとが入力されると、予測画像ブロックPの対象画像ブロックOに対する歪指標を計算するものである。SADD計算部201は、予測画像ブロックPの候補ごとに歪指標値SADDを計算する。SADD計算部201は、対象画像ブロックOと予測画像ブロックPとの間の差分に係るDC成分の絶対値とAC成分の絶対値和との加重和により求められる歪指標(以下、「歪指標値SADD」と呼ぶ)を求める。SADD計算部201の詳細構成については後述する。すなわち、歪指標値SADDは、対象画像ブロックOと予測画像ブロックPとの間の歪みについて評価した評価値であると言える。
SADD計算部201は、対象画像に係る対象画像ブロックOと、予測画像に係る予測画像ブロックPとが入力されると、予測画像ブロックPの対象画像ブロックOに対する歪指標を計算するものである。SADD計算部201は、予測画像ブロックPの候補ごとに歪指標値SADDを計算する。SADD計算部201は、対象画像ブロックOと予測画像ブロックPとの間の差分に係るDC成分の絶対値とAC成分の絶対値和との加重和により求められる歪指標(以下、「歪指標値SADD」と呼ぶ)を求める。SADD計算部201の詳細構成については後述する。すなわち、歪指標値SADDは、対象画像ブロックOと予測画像ブロックPとの間の歪みについて評価した評価値であると言える。
予測情報符号量計算部202は、予測画像ブロックPの候補ごとに、予測画像ブロックPの生成に関わる情報を符号化する場合に必要となる符号量Rを計算し出力するものである。予測情報符号量計算部202は、例えば、予測画像ブロックPの候補ごとに、当該予測画像ブロックPの生成に関わる情報として動きベクトル情報やモード情報を生成元(インター予測部109又はイントラ予測部110)から取得し、これらの予測情報を符号化する場合に必要となる符号量Rを計算し出力する。なお、予測情報符号量計算部202では、近似値等を用いて、符号量Rを求める計算を簡略化する構成としても良い。
コスト計算部203は、予測画像ブロックPの候補ごとに、歪指標値SADDと符号量Rを用いて、以下の(6)式により、符号化コストJを算出する。ここで、λは符号量Rに関するコストの重みを表す乗数であり、例えば量子化パラメータに依存してあらかじめ設定されるものである。
J=歪指標値+λR …(6)
コスト最小予測選択部204は、予測画像ブロックPの候補ごとに得られるコストJを確認し、コストJが最小となる予測画像ブロックPの候補を選択し、選択された予測画像ブロックPの候補を示す選択結果情報を出力する。
コスト最小予測選択部204は、予測画像ブロックPの候補ごとに得られるコストJを確認し、コストJが最小となる予測画像ブロックPの候補を選択し、選択された予測画像ブロックPの候補を示す選択結果情報を出力する。
動画像符号化装置1では、以上の処理で得られた選択結果情報に基づいて予測画像の選択を行い、選択された予測画像を用いて対象画像の符号化処理を行う。
次に、SADD計算部201の内部構成について説明する。図1は、SADD計算部201内部の機能的構成について示したブロック図である。
SADD計算部201は、差分計算部301、DC成分抽出部302、AC成分抽出部303、及び歪指標計算部304を有している。
差分計算部301は、対象画像ブロックOと予測画像ブロックPの差分値(画素ごとの画素値の差分値)を計算するものである。
DC成分抽出部302は、対象画像ブロックOと予測画像ブロックPとの間の差分に係るDC成分を求める。具体的には、DC成分抽出部302は、差分計算部301で計算された差分値の総和と平均値を求める。
AC成分抽出部303は、対象画像ブロックOと予測画像ブロックPとの差分に係るAC成分を求める。具体的には、AC成分抽出部303は、差分計算部301で求められた差分値から、DC成分抽出部302で得られた差分の平均値を除去したAC成分画像を抽出する。
歪指標計算部304は、DC成分抽出部302からのDC成分(差分値の総和)の絶対値と、AC成分抽出部303からのAC成分(AC成分画像)の絶対値和との加重和を求め、歪指標値SADDとして出力する。
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の動画像符号化装置1の動作を説明する。
次に、以上のような構成を有する第1の実施形態の動画像符号化装置1の動作を説明する。
上述の通り、動画像符号化装置1では、予測画像選択部111以外の処理については、種々の動画像符号化装置と同様のものを適用することができるため、予測画像選択部111以外の動作説明については省略する。
(A−2−1)予測画像選択部111の動作の概要
まず、予測画像選択部111の全体の動作の概要について、図4のフローチャートを用いて説明する。
まず、予測画像選択部111の全体の動作の概要について、図4のフローチャートを用いて説明する。
まず、予測画像選択部111の差分計算部301に、画面分割部101からの対象画像ブロックO、インター予測部109からの予測画像ブロックPの複数の候補、又はイントラ予測部110からの複数の予測画像ブロックPの候補が供給されたものとする。そして、予測画像選択部111は、それぞれの予測画像ブロックPの候補について、歪指標値SADDを算出する(S101)。
そして、予測情報符号量計算部202は、予測画像ブロックPの候補ごとに、予測画像ブロックPの生成に関わる情報をエントロピー符号化する場合に必要となる符号量Rを計算し出力する(S102)。
そして、コスト計算部203は、予測画像ブロックPの候補ごとに、歪指標値SADDと符号量Rを用いて符号化コストJを算出する(S103)。
そして、コスト最小予測選択部204は、予測画像ブロックPの候補ごとに得られるコストJを確認し、コストJが最小となる予測画像ブロックPの候補を選択し、選択された予測画像ブロックPの候補を示す選択結果情報を出力する(S104)。
(A−2−2)予測画像選択部111の動作の詳細
次に、SADD計算部201の動作の詳細について、図5のフローチャートを用いて説明する。
次に、SADD計算部201の動作の詳細について、図5のフローチャートを用いて説明する。
SADD計算部201では、予測画像ブロックPの候補ごとに、図5のフローチャートの処理が実行され、歪指標値SADDが算出される。
まず、差分計算部301では、対象画像ブロックO(i、j)と、これに対する歪を評価する予測画像ブロックP(i、j)について、画素ごとの差分値Diff(i、j)が求められる(S201)。差分計算部301は、以下の(7)式により画素ごとの差分値Diff(i、j)を求めることができる。
diff(i,j)=O(i,j)−P(i,j) …(7)
そして、DC成分抽出部302では、入力ブロック間の差分画像に係るDC成分を抽出するため、画素ごとの差分値Diff(i、j)の総和sと、これをブロックの画素数Nで割った、差分画像の平均値dが求められる(S202)。具体的には、DC成分抽出部302は、総和sを以下の(8)式により求めることができる。また、DC成分抽出部302は、平均値dを以下の(9)式により求めることができる。なお、DC成分抽出部302は、dを整数に丸めるようにしてもよい。また、DC成分抽出部302は、画素数が2のべき乗の場合は、以下の(9)式の除算をビットシフト演算により実現して、処理量を低減するようにしてもよい。なお、DC成分抽出部302の処理は、上述の図9(c)の差分のDC成分を求めることに相当するが、それ以外の周波数成分に関する演算は行わないため、比較的演算量は小さい。
そして、DC成分抽出部302では、入力ブロック間の差分画像に係るDC成分を抽出するため、画素ごとの差分値Diff(i、j)の総和sと、これをブロックの画素数Nで割った、差分画像の平均値dが求められる(S202)。具体的には、DC成分抽出部302は、総和sを以下の(8)式により求めることができる。また、DC成分抽出部302は、平均値dを以下の(9)式により求めることができる。なお、DC成分抽出部302は、dを整数に丸めるようにしてもよい。また、DC成分抽出部302は、画素数が2のべき乗の場合は、以下の(9)式の除算をビットシフト演算により実現して、処理量を低減するようにしてもよい。なお、DC成分抽出部302の処理は、上述の図9(c)の差分のDC成分を求めることに相当するが、それ以外の周波数成分に関する演算は行わないため、比較的演算量は小さい。
そして、AC成分抽出部303は、画素ごとの差分値Diff(i、j)(差分画像)から平均値dを減算したAC成分画像a(i、j)を求める(S203)。AC成分抽出部303は、以下の(10)式により、AC成分画像a(i、j)を求めることができる。なお、AC成分抽出部303は、上述の図9(b)に示すように画像間の差分に係るAC成分を求めることに相当する。
a(i,j)=Diff(i,j)−d …(10)
そして、歪指標計算部304は、DC成分抽出部302で得られたDC成分(総和s)と、AC成分抽出部で得られたAC成分画像a(i、j)から、歪指標値SADDを求める(S204)。
そして、歪指標計算部304は、DC成分抽出部302で得られたDC成分(総和s)と、AC成分抽出部で得られたAC成分画像a(i、j)から、歪指標値SADDを求める(S204)。
具体的には、歪指標計算部304は、以下の(11)式により、歪指標値SADDを求める。以下の(11)式の「w」は歪のDC成分に関する所定の重みであり、例えば、4×4画素ブロックでは、1/2、8×8画素ブロックでは1/4を用いるようにしてもよい。また、重みwを2のべき乗とする場合、歪指標計算部304は、ビットシフト演算を用いて処理量を低減するようにしてもよい。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
第1の実施形態によれば、以下のような効果を奏することができる。
動画像符号化装置1の予測画像選択部111では、SADD計算部201により、差分画像に係るDC成分及びAC成分(AC成分画像)に基づいた歪指標値SADDを求め、この歪指標値SADDを用いて、予測画像の選択を行っている。歪指標値SADDは、SADを用いるよりも周波数領域での歪に近く、SATDを用いるよりも演算量の少ない歪指標値である。さらに、歪指標値SADDは、差分画像に係るAC成分を反映している。AC成分は空間変換せずに評価可能な成分であるため、歪指標値SADDは、特定の周波数成分に限定されないすべての周波数成分が考慮された歪指標値となる。したがって、SADD計算部201では、従来技術(SAD、SATD等)よりも、少ない処理量で高精度な予測画像の評価を行うことができる。
(B)第2の実施形態
以下、本発明による画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラムの第2の実施形態を、図面を参照しながら詳述する。第2の実施形態では、本発明の画像評価処理装置を、SADD計算部として実現した例について説明する。
以下、本発明による画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラムの第2の実施形態を、図面を参照しながら詳述する。第2の実施形態では、本発明の画像評価処理装置を、SADD計算部として実現した例について説明する。
(B−1)第2の実施形態の構成
第2の実施形態の動画像符号化装置1Aの全体構成も、上述の図2を用いて示すことができる。
第2の実施形態の動画像符号化装置1Aの全体構成も、上述の図2を用いて示すことができる。
第2の実施形態の動画像符号化装置1Aでは、予測画像選択部111が予測画像選択部111Aに置き換わっている点で第1の実施形態と異なっている。
そして、図6は、第2の実施形態の動画像符号化装置1Aに搭載される予測画像選択部111Aの機能的構成について示したブロック図であり、上述の図3と同一又は対応する部分には同一又は対応する符号を付している。
第2の実施形態の予測画像選択部111Aでは、SAD計算部205、SATD計算部206、及び歪指標値制御部207が追加されている点で第1の実施形態と異なっている。第2の実施形態の予測画像選択部111Aでは、歪指標値として、3種類の値(SADD、SAD、及びSATD)のいずれかが算出され、歪指標値制御部207の制御に応じたいずれかの歪指標値が、コスト計算部203に供給されるものとする。歪指標値制御部207の制御内容の詳細については後述する動作説明において説明する。
次に、SAD計算部205の詳細について説明する。SAD計算部205は、予測画像ブロックPの候補ごとに歪指標値SADを計算する。
図7は、SAD計算部205の内部構成について示したブロック図である。
SAD計算部205は、差分計算部401及び絶対値和計算部402を有している。
差分計算部401は、対象画像ブロックO(i、j)と、これに対する歪を評価する予測画像ブロックPについて、画素ごとの差分値Diff(i、j)が求める。具体的には、差分計算部401は、上記の(1)式により、差分値Diff(i、j)を求めることができる。
そして、絶対値和計算部402は、差分値Diff(i、j)の絶対値和を求めて、歪指標値SADとして出力する。絶対値和計算部402は、例えば、上記(2)式によりSADを求めることができる。
次に、SATD計算部206の詳細について説明する。SATD計算部206は、予測画像ブロックPの候補ごとに歪指標値SATDを計算する。
図8は、SATD計算部206の内部構成について示したブロック図である。
SATD計算部206は、差分計算部501、アダマール変換部502、及び絶対値和計算部503を有している。
差分計算部501は、対象画像ブロックO(i、j)と、これに対する予測画像ブロックP(i、j)について、画素ごとの差分値Diff(i、j)を求める。差分計算部501は、上記の(1)式により、差分値Diff(i、j)を求めることができる。
アダマール変換部502は、差分値Diff(i、j)をアダマール変換して変換係数を得るものである。アダマール変換部502は、例えば、上記の(4)式により差分値に係るアダマール変換を行い、変換係数DiffT(i,j)を得ることができる。なお、アダマール変換部502は、対象ブロックのサイズに応じて、使用するアダマール変換の変換行列を4×4サイズ、8×8サイズ等切りかえるように構成しても良い。
そして、絶対値和計算部503は、アダマール変換部502が得た変換係数の絶対値和を歪指標値SATDとして出力するものである。絶対値和計算部503は、例えば、上記の(5)式により、歪指標値SATDを求めることができる。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の動画像符号化装置1A(予測画像選択部111A)の動作について、第1の実施形態との差異を中心に説明する。
次に、以上のような構成を有する第2の実施形態の動画像符号化装置1A(予測画像選択部111A)の動作について、第1の実施形態との差異を中心に説明する。
動画像符号化装置1Aを構成する予測画像選択部111Aの処理についても、第1の実施形態と同様のフローチャート(上述の図4)により示すことができる。
第2の実施形態の予測画像選択部111Aでは、ステップS101の動作(歪指標値を計算してコスト計算部203に供給する動作)が異なるだけである。
第2の実施形態のステップS101では、予測画像選択部111AのSADD計算部201、SAD計算部205、及びSATD計算部206のそれぞれに、画面分割部101からの対象画像ブロックO、インター予測部109からの予測画像ブロックPの複数の候補、又はイントラ予測部110からの予測画像ブロックPの複数の候補が供給されたものとする。そして、歪指標値制御部207の制御に応じて、SADD計算部201、SAD計算部205、又はSATD計算部206のいずれかが選択され、選択された計算部で歪指標値(SADD、SAD、又はSATDのいずれか)が計算され、コスト計算部203に供給される。
歪指標値制御部207が、歪指標値を取得する計算部を選択する方式については限定されないものである。例えば、整数画素精度動きベクトル探索の場合、歪指標値制御部207は、SAD計算部205(SAD)を選択するようにしてもよい。また、サブピクセル精度動きベクトル探索の場合、歪指標値制御部207は、SADD計算部201(SADD)を選択するようにしてもよい。さらに、歪指標値制御部207は、ユーザ設定(プログラミング等)に基づいて、歪指標値の計算部を選択するようにしてもよい。さらにまた、歪指標値制御部207は、動画像符号化装置1の構成要素の負荷状態等に基づいて、歪指標値の計算部を選択するようにしてもよい。
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて、以下のような効果を奏することができる。
第2の実施形態によれば、第1の実施形態の効果に加えて、以下のような効果を奏することができる。
以上のように、第2の実施形態によれば以下のような効果が得られる。
符号化効率と演算処理量のトレードオフについて、SADとSATDの中間的な性能をもつ歪指標を選択することが可能となり、SADを用いるよりも符号化効率を向上させ、SATDを用いるよりも演算量の少ない符号化処理を行うことができる。
(C)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(C−1)上記の各実施形態では、画像評価処理装置としてのSADD計算部は、動画像符号化装置の一部を構成するものとして説明したが、SADD計算部を独立した装置(画像評価処理装置)として構築するようにしてもよい。その場合、本発明の画像評価処理装置の機能的構成は、図1のように示すことができる。なお、本発明の画像評価処理装置は、プロセッサ及びメモリ等を有するコンピュータ(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い。)に、本発明の画像評価処理プログラム等をインストールすることにより構築しても良く、その場合でも、機能的には上述の図1のように示すことができる。
(C−2)上記の各実施形態では、本発明の画像評価処理装置(SADD計算部)を動画像符号化装置に適用する例について説明したが、本発明の画像評価処理装置の用途はこれに限定されず、任意の画像間の歪の評価(歪指標値SADDの算出)を必要とする種々の画像処理に適用することができる。
1…動画像符号化装置、101…画面分割部、102…空間変換部、103…量子化部、104…エントロピー符号化部、105…逆量子化部、106…逆空間変換部、107…ループ内フィルタ部、108…参照画像バッファ、109…インター予測部、110…イントラ予測部、111…予測画像選択部、112…残差信号生成部、113…復号画像生成部、114…予測画像制御部、201…SADD計算部、202…予測情報符号量計算部、203…コスト計算部、204…コスト最小予測選択部、301…差分計算部、302…DC成分抽出部、303…AC成分抽出部、304…歪指標計算部。
Claims (10)
- 第1の画像と第2の画像の差分に係るDC成分を抽出するDC成分抽出手段と、
上記第1の画像と上記第2の画像の差分に係るAC成分を抽出するAC成分抽出手段と、
上記DC成分と、上記AC成分に基づいて、上記第1の画像と上記第2の画像との間の歪を評価する歪評価値を計算する歪評価値計算手段と
を有することを特徴とする画像評価処理装置。 - 上記第1の画像と上記第2の画像との間の画素ごとの差分値を求める差分計算手段をさらに備え、
上記DC成分抽出手段は、上記差分計算手段が求めた画素ごとの差分値の総和をDC成分として求め、
上記AC成分抽出手段は、上記差分計算手段が求めた画素ごとの差分値のそれぞれから、上記差分計算手段が求めた画素ごとの差分値の平均値を減算した値で示されるAC成分画像をAC成分として求める
ことを特徴とする請求項1に記載の画像評価処理装置。 - 上記歪評価値計算手段は、上記DC成分抽出手段で求めた総和の絶対値と、上記AC成分抽出手段で求めたAC成分画像の各画素値の絶対値和との加重和を、歪評価値として算出することを特徴とする請求項2に記載の画像評価処理装置。
- 動画像を構成する対象画像に対応する複数の予測画像を生成する予測画像生成手段と、
上記予測画像生成手段が生成した予測画像のそれぞれについて、当該予測画像の上記対象画像に対する歪を評価する画像評価処理手段と、
少なくとも上記画像評価処理手段の評価結果を利用して、上記予測画像生成手段が生成したいずれかの予測画像を選択する予測画像選択手段と、
上記対象画像と、上記予測画像選択手段が選択した予測画像との残差信号に基づいて、上記動画像の符号化処理を行う符号化手段とを有し、
上記画像評価処理手段は、
上記対象画像と上記予測画像の差分に係るDC成分を抽出するDC成分抽出手段と、
上記対象画像と上記予測画像の差分に係るAC成分を抽出するAC成分抽出手段と、
上記DC成分と、上記AC成分に基づいて、上記対象画像と上記予測画像との間の歪を評価する歪評価値を計算する歪評価値計算手段とを有する
ことを特徴とする動画像符号化装置。 - 上記予測画像ごとに、予測画像生成に係る情報を上記符号化手段が符号化した場合の符号量を計算する符号量計算手段と
上記予測画像ごとに、上記画像評価処理手段が評価結果として算出した歪評価値と、上記符号量計算手段が計算した符号量との加重和に基づいて、符号化に係るコスト値を算出するコスト計算手段とをさらに備え、
上記予測画像選択手段は、上記コスト計算手段で計算したコスト値が最も低い上記予測画像を選択する
ことを特徴とする請求項4に記載の動画像符号化装置。 - 請求項1〜3のいずれかに記載の画像評価処理装置を適用した上記画像評価処理手段以外に、1又は複数の他の上記画像評価処理手段をさらに有し、
いずれかの上記画像評価処理手段を選択する画像評価処理選択手段をさらに有し、
上記予測画像選択手段は、上記画像評価処理選択手段が選択した上記画像評価処理手段が求めた歪評価値を利用して、上記予測画像生成手段が生成したいずれかの予測画像を選択する
ことを特徴とする請求項4又は5に記載の動画像符号化装置。 - 上記他の画像評価処理手段の1つとして、上記対象画像と予測画像の差分に係る絶対値和を、歪評価値としてもとめる画像評価処理手段を適用したことを特徴とする請求項6に記載の動画像符号化装置。
- 上記他の画像評価処理手段の1つとして、上記対象画像と予測画像の差分をアダマール変換した変換係数の絶対値和を、歪評価値として求める画像評価処理手段を適用したことを特徴とする請求項6又は7に記載の動画像符号化装置。
- コンピュータを、
第1の画像と第2の画像の差分に係るDC成分を抽出するDC成分抽出手段と、
上記第1の画像と上記第2の画像の差分に係るAC成分を抽出するAC成分抽出手段と、
上記DC成分と、上記AC成分に基づいて、上記第1の画像と上記第2の画像との間の歪を評価する歪評価値を計算する歪評価値計算手段と
して機能させることを特徴とする画像評価処理プログラム。 - コンピュータを、
動画像を構成する対象画像に対応する複数の予測画像を生成する予測画像生成手段と、
上記予測画像生成手段が生成した予測画像のそれぞれについて、当該予測画像の上記対象画像に対する歪を評価する画像評価処理手段と、
少なくとも上記画像評価処理手段の評価結果を利用して、上記予測画像生成手段が生成したいずれかの予測画像を選択する予測画像選択手段と、
上記対象画像と、上記予測画像選択手段が選択した予測画像との残差信号に基づいて、上記動画像の符号化処理を行う符号化手段として機能させ、
上記画像評価処理手段は、
上記対象画像と上記予測画像の差分に係るDC成分を抽出するDC成分抽出手段と、
上記対象画像と上記予測画像の差分に係るAC成分を抽出するAC成分抽出手段と、
上記DC成分と、上記AC成分に基づいて、上記対象画像と上記予測画像との間の歪を評価する歪評価値を計算する歪評価値計算手段とを有する
ことを特徴とする動画像符号化プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012212946A JP2014068251A (ja) | 2012-09-26 | 2012-09-26 | 画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012212946A JP2014068251A (ja) | 2012-09-26 | 2012-09-26 | 画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014068251A true JP2014068251A (ja) | 2014-04-17 |
Family
ID=50744234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012212946A Pending JP2014068251A (ja) | 2012-09-26 | 2012-09-26 | 画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014068251A (ja) |
-
2012
- 2012-09-26 JP JP2012212946A patent/JP2014068251A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7004782B2 (ja) | 画像予測方法および関連装置 | |
KR101684209B1 (ko) | 동화상 복호 장치, 동화상 부호화 장치, 동화상 복호 방법, 및 동화상 부호화 방법 | |
KR101770047B1 (ko) | 차세대 비디오 코팅용 콘텐츠 적응적 예측 거리 분석기 및 계층적 움직임 추정 시스템 | |
JP6169554B2 (ja) | ビデオ符号化のための簡素化されたイントラ予測 | |
US9900594B2 (en) | Image encoding and decoding method with predicted and representative motion information | |
JPWO2011061880A1 (ja) | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 | |
JP4656003B2 (ja) | 画像符号化装置及び画像符号化方法 | |
JP2023168518A (ja) | 予測ブロック生成装置、画像符号化装置、画像復号装置、及びプログラム | |
JP2018074491A (ja) | 動画像符号化装置、動画像符号化方法、および動画像符号化プログラム | |
JP2010081498A (ja) | 画像圧縮符号化方法、及び装置 | |
KR20110090841A (ko) | 가중치 예측을 이용한 영상 부호화/복호화 장치 및 방법 | |
WO2020054060A1 (ja) | 動画像符号化方法及び動画像符号化装置 | |
US9549205B2 (en) | Method and device for encoding video | |
JP2014068251A (ja) | 画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラム | |
JP2011130192A (ja) | エンコーダおよび画像変換装置 | |
JP5281597B2 (ja) | 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム | |
JP5281596B2 (ja) | 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム | |
KR101997003B1 (ko) | 픽셀 블록을 코딩하고 재구성하기 위한 방법 및 대응하는 디바이스들 | |
JP2013017128A (ja) | イントラ予測モード推定装置、画像符号化装置、画像復号装置、及びプログラム | |
JP2018186456A (ja) | 画像符号化装置、画像符号化方法及びプログラム | |
JP2012120086A (ja) | 動画像符号化装置 |