JP2010109903A - 動きベクトル探索装置及び動きベクトル探索方法 - Google Patents

動きベクトル探索装置及び動きベクトル探索方法 Download PDF

Info

Publication number
JP2010109903A
JP2010109903A JP2008282158A JP2008282158A JP2010109903A JP 2010109903 A JP2010109903 A JP 2010109903A JP 2008282158 A JP2008282158 A JP 2008282158A JP 2008282158 A JP2008282158 A JP 2008282158A JP 2010109903 A JP2010109903 A JP 2010109903A
Authority
JP
Japan
Prior art keywords
motion vector
macroblock
search
value
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008282158A
Other languages
English (en)
Other versions
JP5339855B2 (ja
Inventor
Daisuke Sakamoto
大輔 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008282158A priority Critical patent/JP5339855B2/ja
Publication of JP2010109903A publication Critical patent/JP2010109903A/ja
Application granted granted Critical
Publication of JP5339855B2 publication Critical patent/JP5339855B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】圧縮率の高い符号化を行うとともに、画質の劣化を抑えることができるようにする。
【解決手段】損失情報量演算部105は、符号化劣化度として、減算器100において求めた画素ごとの差分データと、復元した差分データとの差分値の絶対値和LOSTを演算する。さらに、差分絶対値和演算部108は、減算器100で求めた画素ごとの差分値の絶対値和MADを演算する。そして、演算した2つの絶対値和を用いて評価関数costを算出して、評価関数costが最も小さくなるような動きベクトルを探索するようにして、圧縮率の高い符号化を行うとともに、画質の劣化を抑えることができるようにする。
【選択図】図1

Description

本発明は動きベクトル探索装置、動きベクトル探索方法、プログラム及び記憶媒体に関し、特に、H.264方式等の動画像符号化技術に用いて好適な技術に関する。
近年、音声信号、映像信号などマルチメディアに関連する情報のデジタル化が急進しており、これに対応して映像信号の圧縮符号化及び復号化技術が注目されている。圧縮符号化及び復号化技術により、映像信号の格納に必要な記憶容量や伝送に必要な帯域を減少させることができるため、マルチメディア産業にとっては極めて重要な技術である。
これらの圧縮符号化及び復号化技術は、多くの映像信号が有する自己相関性の高さ(すなわち、冗長性)を用いて情報量/データ量を圧縮している。映像信号が有する冗長性には、時間冗長性及び二次元の空間冗長性があり、時間冗長性は、ブロック単位の動き推定及び動き補償を用いて低減させることができる。一方、空間冗長性は、離散コサイン変換(DCT)を用いて低減させることができる。
圧縮符号化及び復号化技術として知られるMPEG方式などでは、これらの手法により映像信号の冗長性を低減させ、経時的に変わるビデオフレーム/フィールド(以下、フレーム/フィールドを代表してフレームと称す)のデータ圧縮効果を向上させている。ここで、前述した時間冗長性を低減させるためのブロック単位の動き推定とは、連続して入力される参照フレーム(過去のフレーム)と符号化対象フレームとの間で最も近似するブロックを探し出す作業である。また、対応するブロックの移動方向、移動量を表すベクトルは動きベクトルと呼ばれている。したがって、動き推定とは動きベクトルの推定と同義である。
動きベクトルを推定する方法としては、ブロックマッチング方式が一般に用いられている。ブロックマッチング方式とは、参照フレームと符号化対象フレームとの2枚の映像をブロック単位で比較し、信号類型の整合度に基づいてブロック単位で動きを推定する方法である。このブロックマッチング方式により、参照フレームと符号化対象フレームとからブロックごとに動きベクトルを推定し、推定された動きベクトルを用いて動き補償予測を行う。このブロックマッチング方式については、例えば特許文献1に記載されている。
特開平4−323780号公報
前記のブロックマッチング方式では、一般的に参照フレームのブロックと符号化対象フレームのブロックとの画素差分が最も小さくなるベクトルを動きベクトルとして採用している。しかしながら、画素差分の絶対値が最小となるベクトルを動きベクトルとした場合、多くの場合においてマクロブロックの発生符号量を小さくすることはできるものの、符号化劣化については十分に対処できていない。
符号化劣化が十分に対処できていない理由について、図8を参照しながら説明する。例えば、MPEG方式では、ブロックごとに現在ピクチャと参照ピクチャとの画素差分を直交変換した後、量子化して、さらに逆量子化、逆直交変換することにより復号する。なお、図8の説明においては、直交変換、逆直交変換処理については本題とは関係がないため、説明は省略する。また、量子化、逆量子化処理についても本題とは関係の無いため、詳細な説明を省略し、各々、除算、積算のみで説明する。その際、図8では、量子化において画素差分値を8で割ることにより情報量を圧縮し、逆量子化の際には8が掛けられることにより情報を復元するものとする。また、図8では、処理単位となるブロック中の1画素に注目して説明する。
図8(a)を参照しながら、現在画素値40aが108であり、参照画素値41aが100である場合について説明する。
図8(a)において、現在画素値40aから参照画素値41aを減算器42で減算した結果、差分値=8となる。そして、その結果が量子化部43に送信される。
量子化部43では、差分値=8を量子化した(8で割った)結果、量子化後値=1となる。そして、その結果が逆量子化部44に送信される。逆量子化部44では、量子化後値=1を逆量子化した(8を掛けた)結果、逆量子化後値=8となる。ここで、差分値と逆量子化後値とを比較すると、ともに値が8であるので量子化によって失われた情報量は無く、逆量子化により差分値=8が完全に復元できる。
次に、図8(b)を参照しながら、現在画素値40bが108であり、参照画素値41bが103である場合について説明する。
図8(b)において、現在画素値40bから参照画素値41bを減算器42で減算した結果、差分値=5となる。そして、その結果が量子化部43に送信される。
量子化部43では、差分値=5を量子化した(8で割った)結果、量子化後値=0となる。そして、その結果が逆量子化部44に送信される。逆量子化部44では、量子化後値=0を逆量子化した(8を掛けた)結果、逆量子化後値=0となる。ここで、差分値と逆量子化後値とを比較すると、逆量子化で完全に情報量を復元できず、量子化によって(差分値=5)−(逆量子化後値=0)=5だけ情報量が失われる。
以上のように図8(a)では差分値=8に対して、図8(b)では差分値=5と差分値は小さくなっている。ところが、図8(a)の場合は情報を完全に復元できているのに対し、図8(b)の場合は情報が完全に復元できておらず画像の画質が劣化してしまうことがわかる。このように、差分値によって符号化劣化が生じてしまうという問題点があった。
本発明は前述の問題点に鑑み、圧縮率の高い符号化を行うとともに、画質の劣化を抑えることができるようにすることを目的としている。
本発明の動きベクトル探索装置は、符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、前記各々のマクロブロックの動きベクトルを探索する動きベクトル探索装置であって、前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度を算出し、前記算出した符号化劣化度が最も小さくなる動きベクトルを探索する動きベクトル探索手段を有することを特徴とする。
また、本発明の動きベクトル探索装置の他の特徴とするところは、符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、前記各々のマクロブロックの動きベクトルを探索する動きベクトル探索装置であって、前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度と発生符号量を評価する値とが関連する評価関数を用いて動きベクトルを決定する動きベクトル探索手段を有することを特徴とする。
本発明の動きベクトル探索方法は、符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、前記各々のマクロブロックの動きベクトルを探索する動きベクトル探索方法であって、前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度を算出し、前記算出した符号化劣化度が最も小さくなる動きベクトルを探索する動きベクトル探索工程を有することを特徴とする。
また、本発明の動きベクトル探索方法の他の特徴とするところは、符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、前記各々のマクロブロックの動きベクトルを探索する動きベクトル探索方法であって、前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度と発生符号量を評価する値とが関連する評価関数を用いて動きベクトルを決定する動きベクトル探索工程を有することを特徴とする。
本発明のプログラムは、符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、前記各々のマクロブロックの動きベクトルを探索するようにコンピュータに実行させるプログラムであって、前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度を算出し、前記算出した符号化劣化度が最も小さくなる動きベクトルを探索する動きベクトル探索工程をコンピュータに実行させることを特徴とする。
また、本発明のプログラムの他の特徴とするところは、符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、前記各々のマクロブロックの動きベクトルを探索するようにコンピュータに実行させるプログラムであって、前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度と発生符号量を評価する値とが関連する評価関数を用いて動きベクトルを決定する動きベクトル探索工程をコンピュータに実行させることを特徴とする。
本発明の記憶媒体は、前記に記載のプログラムを記憶したことを特徴とする。
本発明によれば、符号化効率を良好にするとともに画質の劣化を抑えることができる。
(第1の実施形態)
以下、本発明の実施形態について図面を参照しながら説明する。まず、従来のブロックマッチング方式を説明するために、従来の動きベクトル探索装置の構成について説明する。
図6は、従来のブロックマッチング方式を用いた動きベクトル探索装置の構成例を示すブロック図である。
図6において、動きベクトル探索装置は、符号化対象のピクチャを保存する現在フレーム/フィールド保存部20と、参照ピクチャを保存する参照フレーム/フィールド保存部21とを備えている。さらに、符号化対象のピクチャのうち、符号化対象の画素ブロック(マクロブロック)を保存する現在マクロブロック保存バッファ22と、サーチウィンドウ保存バッファ23と、動きベクトル探索部24とを備えている。
現在マクロブロック保存バッファ22は現在フレーム/フィールド保存部20から符号化対象のマクロブロック(現在のマクロブロック)の画像を取り出すためのものである。サーチウィンドウ保存バッファ23は、現在のマクロブロックの中心に探索領域の中心を設定し、探索領域の範囲(以下、サーチウィンドウと称す)分だけ参照フレーム/フィールド保存部21から画像を取り出して保存するためのものである。
動きベクトル探索部24では、サーチウィンドウ内で現在のマクロブロックの画素値と参照フレーム/フィールド(以下、フレーム/フィールドを代表してフレームと称す)の画素値との差分を画素ごとに取る。そして、画素差分の絶対値和が最も小さくなるベクトルを探索し、現在のマクロブロックについての最終的な動きベクトルを推定する。
また、ブロックマッチング方式には、図7に示すように、図6の動きベクトル探索装置に、動きベクトル探索部24で推定された動きベクトルを保存する動きベクトル保存部35を加えた構成も存在する。図7に示す構成では、動きベクトル保存部35から1つ前のマクロブロックについて推定した動きベクトルを参照フレーム/フィールド保存部21に提供する。そして、参照フレーム/フィールド保存部21は、1つ前のマクロブロックの動きベクトル分だけ符号化対象のマクロブロックからずらした位置に探索領域の中心位置を設定し、サーチウィンドウ保存バッファ23へ参照画像を出力する。
以上のように説明したローカル動き補償方式は現在国際標準方式であるH.261、H.263、MPEG1、MPEG2、MPEG4で用いられており、最も広く採用されている動き補償方式である。
以下、図1のブロック図及び図2のフローチャートを参照しながら、本発明に係る動きベクトル探索装置の好適な実施形態について詳細に説明する。なお、本実施形態では、動きベクトル探索部14の動作が従来とは異なっている。
図1は、本実施形態に係る動きベクトル探索装置50の構成例を示すブロック図である。
図1において、現在フレーム/フィールド保存部10は、符号化対象のピクチャを保存するためのものである。参照フレーム/フィールド保存部11は、参照ピクチャを保存するためのものである。
現在マクロブロック保存バッファ12は、現在フレーム/フィールド保存部20から符号化対象のマクロブロック(現在のマクロブロック)の画像を取り出して保存するためのものである。サーチウィンドウ保存バッファ13は、現在のマクロブロックの中心に探索領域の中心を設定し、探索領域の範囲(サーチウィンドウ)分だけ参照フレーム/フィールド保存部21から画像を取り出して保存するためのものである。
動きベクトル探索部14は、サーチウィンドウ内で最終的な動きベクトルを推定するためのものである。以下、動きベクトル探索部14を構成する各ブロックの詳細な構成について説明する。
減算器100は、符号化対象のマクロブロックとサーチウィンドウ内の探索位置の参照フレームとの差分を求めるためのものである。直交変換部101は、減算器100において求めた差分値に対して整数直交変換を行うためのものである。量子化部102は、直交変換部101において整数直交変換された変換係数に対して所定の量子化スケールで量子化を施すためのものである。
逆量子化部103は、量子化部102において量子化された変換係数に対して所定の逆量子化処理を施すためのものである。逆直交変換部104は、逆量子化部103において逆量子化された変換係数を元の画像データ空間に戻す逆整数直交変換を行うためのものである。
損失情報量演算部105は、逆直交変換部104において逆直交変換されて復元された符号化対象のマクロブロックとサーチウィンドウ内の探索位置の参照フレームとの差分値を求める。また、損失情報量演算部105は、符号化対象のマクロブロックとサーチウィンドウ内の探索位置の参照フレームとの差分値も求め、さらに、求めた2つの差分値の差分(損失情報量)を求める。
評価関数演算部106は、符号化対象のマクロブロックとサーチウィンドウ内の探索位置の参照フレームとの差分値と、損失情報量演算部105において求めた損失情報量とを用いて、動きベクトルを決定するための評価関数costを演算するためのものである。動きベクトル決定部107は、評価関数costが小さいサーチウィンドウ内の探索位置を最終的な動きベクトルとして決定する動きベクトル決定部である。差分絶対値和演算部108は、減算器100において求めた画素ごとの差分値の絶対値和を演算するためのものである。
次に、本実施形態におけるベクトル探索の処理の流れを、図1のブロック図及び図2のフローチャートを参照しながら説明する。図2は、本実施形態における動きベクトルの探索処理手順の一例を示すフローチャートである。なお、本実施系形態では、特に、動きベクトル探索部14の処理について詳細に説明する。
まず、ステップS200において、減算器100は符号化対象マクロブロックとサーチウィンドウ内の探索位置の参照フレームとの画素ごとの差分を求める。そして、差分データを差分絶対値和演算部108、損失情報量演算部105及び直交変換部101に送信する。次に、ステップS201において、直交変換部101は、減算器100において求めた画素ごとの差分に対して整数直交変換を施し、一般の画像空間からエネルギー集中を高めた変換係数の空間に直交変換して量子化部102に送信する。
次に、ステップS202において、量子化部102は、直交変換された差分データの変換係数に対して所定のステップ幅で直交変換成分に応じた量子化を行い、逆量子化部103に送信する。そして、ステップS204において、逆量子化部103は、量子化された変換係数に対して逆量子化を行うことにより変換係数を復元し、逆直交変換部104に送信する。
次に、ステップS204において、逆直交変換部104は、逆量子化部103において復元された変換係数を元の画像データ空間に戻し、予測画像情報との差分データとして復元する。そして、復元した差分データを損失情報量演算部105に送信する。なお、復元した差分データは量子化処理における量子化誤差によって、入力画像データよりも僅かに劣化している画像となっている。
次に、ステップS205において、損失情報量演算部105は、符号化劣化度として、ステップS200で減算器100において求めた画素ごとの差分データと、ステップS204で復元した差分データとの差分値の絶対値和LOSTを演算する。そして、絶対値和LOSTの情報を評価関数演算部106に送信する。なお、ステップS205で求めた絶対値和LOSTは量子化処理における量子化誤差によって損失した情報量を数値化した符号化劣化の程度を表している。
次に、ステップS206において、差分絶対値和演算部108は、減算器100で求めた画素ごとの差分値の絶対値和MAD(Mean Absolute Difference)を演算し、評価関数演算部106に送信する。そして、評価関数演算部106は、差分絶対値和演算部108から送信された絶対値和MAD及び損失情報量演算部105から送信された絶対値和LOSTを用いて、以下の数1に示す二乗の評価関数演算式を計算する。そして、動きベクトルを決定するための評価関数costを演算し、動きベクトル決定部107に送信する。
Figure 2010109903
ここで、α、βは絶対値和MAD、LOSTの次元を正規化するための実数である。数1に示す式では、MAD=0、LOST=0の時を最小とし、絶対値和MAD、LOSTを二軸に取った時の距離を最も短くする動きベクトルを最適な動きベクトルとする。したがって、MADが同じ値であるならば絶対値和LOSTが最も小さくなるような動きベクトルの探索を行うことになる。
なお、以下の数2に示す式を用いて評価関数costを演算し、MAD=0、LOST=0の時を最小とし、絶対値和MAD、LOSTの次元を正規化した時の和が最も小さくなる動きベクトルを最適な動きベクトルとしてもよい。
Figure 2010109903
次に、ステップS207において、動きベクトル決定部107は、評価関数演算部106から送信される評価関数costと、今までそれ以前に送信されてきた評価関数のうち最小の値である最小評価関数costminとを比較する。この比較の結果、評価関数costの方が小さい場合は、ステップS208に進む。そして、ステップS208において、最小評価関数costminをcostに更新するとともに、最終的な動きベクトルの候補であるvecをそのときの探索位置に更新する。なお、サーチウィンドウの最初の探索位置では無条件に最小評価関数costmin及びvecを更新する。一方、ステップS207の比較の結果、最小評価関数costminの方が小さいもしくは同じである場合は、ステップS209に進む。
次に、ステップS209において、サーチウィンドウ内の全ての画素に対して動きベクトルの探索を行ったか否かを判断する。この判断の結果、全ての画素に対して探索を行っていない場合は、ステップS200に戻り、同様の処理を繰り返す。一方、ステップS209の判断の結果、全ての画素に対して動きベクトルの探索を行った場合は、ステップS210に進み、そのときのvecを最終的な動きベクトルとして決定し、処理を終了する。
以上、説明したように本実施形態によれば、評価関数には、発生符号量と相関のある値である現マクロブロックと参照画像との差分絶対値のみならず、符号化劣化とも関連のある値を含んでいる。このため、符号化効率と画質とを両立させた動きベクトルを探索することが可能になる。
また、本実施形態では、符号化劣化と相関のある値として符号化対象のフレームの画素と復号化した参照フレームの画素との差分絶対値和を用いている。一方、符号化対象のフレームの画素と復号化した参照フレームの画素との差分から、さらに以下の数3に示す式を用いて、PSNR(ピーク信号対雑音比)の逆数を算出して用いてもよい。
Figure 2010109903
なお、N及びMはそれぞれ画像の縦方向及び横方向の画素数であり、p(i,j)は現行入力画像の場所(i,j)の画素値である。また、p′(i,j)は復元画像の場所(i,j)の画素値であり、Tは画像の階調数−1(8ビット/ピクセル画像ではT=255)である。
(第2の実施形態)
以下、図3を参照しながら、本実施形態に係る動きベクトル探索装置について詳細に説明する。なお、本実施形態に係る動きベクトル探索装置は、差分絶対値和演算部108の代わりに直交変換係数絶対値和演算部308を有する点が第1の実施形態とは異なるが、それ以外の構成は第1の実施形態とほぼ同じである。また、直交変換係数絶対値和演算部308及び評価関数演算部106以外の動作は第1の実施形態と同様のため説明は省く。
直交変換係数絶対値和演算部308は、直交変換部101から差分データの直交変換係数を受信する。そして、直交変換係数の絶対値和SATD(Sum of Absolute Transform Difference)を演算し、評価関数演算部106に送信する。
次に、評価関数演算部106は、直交変換係数絶対値和演算部608から送信される絶対値和SATD及び損失情報量演算部105から送信されてくる絶対値和LOSTを用いて、以下の数4に示す二乗の評価関数演算式を計算する。そして、動きベクトルを決定するための評価関数costを演算し、動きベクトル決定部107に送信する。
Figure 2010109903
ここで、α、βは絶対値和SATD、LOSTの次元を正規化するための実数である。
数4に示す式ではSATD=0、LOST=0の時を最小とし、絶対値和SATD、LOSTを二軸に取った時の距離を最も短くする動きベクトルを最適な動きベクトルとする。
なお、以下の数5に示す式を用いて評価関数costを演算し、SATD=0、LOST=0の時を最小とし、絶対値和SATD、LOSTの次元を正規化した時の和が最も小さくなる動きベクトルを最適な動きベクトルとしてもよい。
Figure 2010109903
次に、動きベクトル決定部107は、評価関数演算部106から送信される評価関数costと今までそれ以前に送信されてきた評価関数のうち最小の値である最小評価関数costminとを比較する。この比較の結果、評価関数costの方が小さい場合は、最小評価関数costminをcostに更新するとともに、最終的な動きベクトルの候補であるvecをそのときの探索位置に更新する。なお、サーチウィンドウの最初の探索位置では無条件に最小評価関数costmin及びvecを更新する。そして、以上の処理をサーチウィンドウ内の全ての画素に対して行った後、そのときのvecを最終的な動きベクトルとして決定する。
以上のように本実施形態によれば、評価関数が発生符号量と相関のある値である絶対値和MADの代わりに更に発生符号量との相関が強い値である絶対値和SATDを用いるようにした。これにより、より符号化効率を考慮し、かつ画質を両立させた動きベクトルを探索することが可能になる。
(第3の実施形態)
以下、図4を参照しながら、本実施形態に係る動きベクトル探索装置について詳細に説明する。なお、本実施形態に係る動きベクトル探索装置は、直交変換係数絶対値和演算部308の代わりに二値符号量演算部408を有する点が第2の実施形態と異なるが、それ以外の構成は第2の実施形態とほぼ同じである。また、二値符号量演算部408及び評価関数演算部106以外の動作は第2の実施形態と同様のため説明は省く。また、本実施形態では符号化方式としてH.264を想定するものとする。
二値符号量演算部708は、量子化部102から直交変換係数を量子化した値coefを受信し、値coefの二値符号量を演算して評価関数演算部106に送信する。評価関数演算部106は、二値符号量演算部708から送信される二値符号量及び損失情報量演算部105から送信される絶対値和LOSTを用いて、以下の数6に示す二乗の評価関数演算式を計算する。そして、動きベクトルを決定するための評価関数costを演算し、動きベクトル決定部107に送信する。
Figure 2010109903
ここで、α、βは二値符号量及び絶対値和LOSTの次元を正規化するための実数である。数6に示す式は、二値符号量=0、LOST=0の時を最小とし、二値符号量及び絶対値和LOSTを二軸に取った時の距離を最も短くする動きベクトルを最適な動きベクトルとする。
なお、以下の数7に示す式を用いて評価関数costを演算し、二値符号量=0、LOST=0の時を最小とし、二値符号量及び絶対値和LOSTの次元を正規化した時の和が最も小さくなる動きベクトルを最適な動きベクトルとしてもよい。
Figure 2010109903
次に、動きベクトル決定部107は、評価関数演算部106から送信される評価関数costと今までそれ以前に送信されてきた評価関数のうち最小の値である最小評価関数costminとを比較する。この比較の結果、評価関数costの方が小さい場合は、最小評価関数costminをcostに更新するとともに、最終的な動きベクトルの候補であるvecをそのときの探索位置に更新する。なお、サーチウィンドウの最初の探索位置では無条件に最小評価関数costmin及びvecを更新する。そして、以上の処理をサーチウィンドウ内の全ての画素に対して行った後、そのときのvecを最終的な動きベクトルとして決定する。
以上のように本実施形態によれば、評価関数が発生符号量と相関のある値である絶対値和SATDの代わりに更に発生符号量との相関が強い値である二値符号量を用いるようにした。これにより、より符号化効率を考慮し、かつ画質を両立させた動きベクトルを探索することが可能になる。
(第4の実施形態)
以下、図5を参照しながら、本実施形態に係る動きベクトル探索装置について詳細に説明する。なお、本実施形態に係る動きベクトル探索装置は、ベクトル符号量演算部809及び動きベクトル保存部810を有する点が第3の実施形態と異なるが、それ以外の構成は第2の実施形態とほぼ同じである。また、ベクトル符号量演算部809、動きベクトル保存部810及び評価関数演算部106以外の動作は第3の実施形態と同様のため、説明は省略する。
ベクトル符号量演算部809は、サーチウィンドウ保存バッファ13からサーチウィンドウ内の探索位置の参照フレームを読み出し、動きベクトル保存部810から予め求められている周辺マクロブロックの動きベクトルを受信する。そして、動きベクトルの符号量VEC_CODEを算出し、評価関数演算部106に送信する。
評価関数演算部106は、二値符号量演算部708から送信される二値符号量、前述のベクトル符号量VEC_CODE、及び損失情報量演算部105から送信される絶対値和LOSTを用いて以下の数8に示す二乗の評価関数演算式を計算する。そして、動きベクトルを決定するための評価関数costを演算し、動きベクトル決定部107に送信する。
Figure 2010109903
ここで、α、β、γは二値符号量、絶対値和LOST、及びベクトル符号量VEC_CODEの次元を正規化するための実数である。数8に示す式は、二値符号量=0、LOST=0、VEC_CODE=0の時を最小とし、二値符号量、絶対値和LOST、及びベクトル符号量VEC_CODEを三軸に取った時の距離を最も短くする動きベクトルを最適な動きベクトルとする。
また、二値符号量及びベクトル符号量VEC_CODEはともに符号量として相関のある値であるので、二つの値をまとめて、以下の数9に示す式を用いて評価関数costを演算してもよい。
Figure 2010109903
なお、以下の数10に示す式を用いて評価関数costを演算してもよい。この場合、二値符号量=0、LOST=0、VEC_CODE=0の時を最小とし、二値符号量、絶対値和LOST、及びベクトル符号量VEC_CODEの次元を正規化した時の和が最も小さくなる動きベクトルを最適な動きベクトルとしてもよい。
Figure 2010109903
さらに、二値符号量及びベクトル符号量VEC_CODEはともに符号量として相関のある値であるので、二つの値をまとめて、以下の数11に示す式を用いて評価関数costを演算してもよい。
Figure 2010109903
動きベクトル決定部107は、評価関数演算部106から送信される評価関数costと今までそれ以前に送信されてきた評価関数のうち最小の値である最小評価関数costminとを比較する。この比較の結果、評価関数costの方が小さい場合は、最小評価関数costminをcostに更新するとともに、最終的な動きベクトルの候補であるvecをそのときの探索位置に更新する。なお、サーチウィンドウの最初の探索位置では無条件に最小評価関数costmin及びvecを更新する。そして、以上の処理をサーチウィンドウ内の全ての画素に対して行った後、そのときのvecを最終的な動きベクトルとして決定し、動きベクトル保存部810に保存する。
以上のように本実施形態によれば、評価関数にベクトル符号量を加味して発生する符号量との相関を強めることにより、より符号化効率を考慮し、かつ画質を両立させた動きベクトルを探索することが可能になる。
(本発明に係る他の実施形態)
前述した本発明の実施形態における動きベクトル探索装置を構成する各手段、並びに動きベクトル探索方法の各工程は、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記憶したコンピュータ読み取り可能な記憶媒体は本発明に含まれる。
また、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図2に示すフローチャートに対応したプログラム)を、システムまたは装置に直接、または遠隔から供給する場合も含む。そして、そのシステムまたは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスクなどがある。さらに、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM、DVD−R)などもある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する方法がある。そして、前記ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記憶媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、その他の方法として、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。さらに、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、その他の方法として、まず記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。そして、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
本発明の第1の実施形態に係る動きベクトル探索装置の構成例を示すブロック図である。 本発明の第1の実施形態における動きベクトルの探索処理手順の一例を示すフローチャートである。 本発明の第2の実施形態に係る動きベクトル探索装置の構成例を示すブロック図である。 本発明の第3の実施形態に係る動きベクトル探索装置の構成例を示すブロック図である。 本発明の第4の実施形態に係る動きベクトル探索装置の構成例を示すブロック図である。 従来のブロックマッチング方式を用いた動きベクトル探索装置の構成例を示すブロック図である。 従来のブロックマッチング方式を用いた動きベクトル探索装置の他の構成例を示すブロック図である。 ブロックごとに現在ピクチャと参照ピクチャとの画素差分の直交変換等を行い、符号化劣化が生じることを説明する図である。
符号の説明
10 現在フレーム/フィールド保存部
11 参照フレーム/フィールド保存部
12 現在マクロブロック保存バッファ
13 サーチウィンドウ保存バッファ
14 動きベクトル探索部
50 動きベクトル探索装置
100 減算器
101 直交変換部
102 量子化部
103 逆量子化部
104 逆直交変換部
105 損失情報量演算部
106 評価関数演算部
107 動きベクトル決定部
108 差分絶対値和演算部
308 直交変換係数絶対値和演算部
408 二値符号量演算部
509 ベクトル符号量演算部
510 動きベクトル保存部

Claims (16)

  1. 符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、符号化効率を考慮した前記各々のマクロブロックの動きベクトルを探索する動きベクトル探索装置であって、
    前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度を算出し、前記算出した符号化劣化度が最も小さくなる動きベクトルを探索する動きベクトル探索手段を有することを特徴とする動きベクトル探索装置。
  2. 前記符号化劣化度とは、前記符号化の対象となるマクロブロックと前記参照ピクチャの探索位置における画素との差分と、前記符号化の対象となるマクロブロックと参照ピクチャの探索位置における画素との差分を符号化して復号化した画素の差分と、の差分の絶対値和であることを特徴とする請求項1に記載の動きベクトル探索装置。
  3. 前記符号化劣化度とは、前記符号化の対象となるマクロブロックと前記参照ピクチャの探索位置における画素との差分と、前記符号化の対象となるマクロブロックと参照ピクチャの探索位置における画素との差分を符号化して復号化した画素の差分と、から求めるピーク信号対雑音比の逆数であることを特徴とする請求項1に記載の動きベクトル探索装置。
  4. 符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、符号化効率を考慮した前記各々のマクロブロックの動きベクトルを探索する動きベクトル探索装置であって、
    前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度と発生符号量を評価する値とが関連する評価関数を用いて動きベクトルを決定する動きベクトル探索手段を有することを特徴とする動きベクトル探索装置。
  5. 前記発生符号量を評価する値とは、前記符号化の対象となるマクロブロックと前記参照ピクチャの探索位置における画素との差分の絶対値和であることを特徴とする請求項4に記載の動きベクトル探索装置。
  6. 前記発生符号量を評価する値とは、前記符号化の対象となるマクロブロックと前記参照ピクチャの探索位置における画素との差分値を直交変換した係数の絶対値和であることを特徴とする請求項4に記載の動きベクトル探索装置。
  7. 前記発生符号量を評価する値とは、前記符号化の対象となるマクロブロックと前記参照ピクチャの探索位置における画素との差分値を符号化することにより発生する符号量であることを特徴とする請求項4に記載の動きベクトル探索装置。
  8. 前記発生符号量を評価する値とは、動きベクトルの符号量であることを特徴とする請求項4に記載の動きベクトル探索装置。
  9. 前記発生符号量を評価する値とは、前記符号化の対象となるマクロブロックと前記参照ピクチャの探索位置における画素との差分値を符号化することにより発生する符号量に所定の重みを掛けた値と、動きベクトルの符号量に重み付けした値と、の和であることを特徴とする請求項4に記載の動きベクトル探索装置。
  10. 前記評価関数とは、前記発生符号量を評価する値を二乗して所定の重みを掛けた値と前記符号化劣化度を二乗して所定の重みを掛けた値との和であることを特徴とする請求項4に記載の動きベクトル探索装置。
  11. 前記評価関数とは、前記発生符号量を評価する値に所定の重みを掛けた値と前記符号化劣化度に所定の重みを掛けた値との和であることを特徴とする請求項4に記載の動きベクトル探索装置。
  12. 符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、符号化効率を考慮した前記各々のマクロブロックの動きベクトルを探索する動きベクトル探索方法であって、
    前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度を算出し、前記算出した符号化劣化度が最も小さくなる動きベクトルを探索する動きベクトル探索工程を有することを特徴とする動きベクトル探索方法。
  13. 符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、符号化効率を考慮した前記各々のマクロブロックの動きベクトルを探索する動きベクトル探索方法であって、
    前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度と発生符号量を評価する値とが関連する評価関数を用いて動きベクトルを決定する動きベクトル探索工程を有することを特徴とする動きベクトル探索方法。
  14. 符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、符号化効率を考慮した前記各々のマクロブロックの動きベクトルを探索するようにコンピュータに実行させるプログラムであって、
    前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度を算出し、前記算出した符号化劣化度が最も小さくなる動きベクトルを探索する動きベクトル探索工程をコンピュータに実行させることを特徴とするプログラム。
  15. 符号化の対象となるピクチャを構成する複数のマクロブロックの各々について、前記各々のマクロブロックに対応する参照ピクチャに設定された探索領域で探索することにより、符号化効率を考慮した前記各々のマクロブロックの動きベクトルを探索するようにコンピュータに実行させるプログラムであって、
    前記符号化の対象となるマクロブロックを符号化して復号化したマクロブロックにおいて損失した情報量を数値化した符号化劣化度と発生符号量を評価する値とが関連する評価関数を用いて動きベクトルを決定する動きベクトル探索工程をコンピュータに実行させることを特徴とするプログラム。
  16. 請求項14又は15に記載のプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。
JP2008282158A 2008-10-31 2008-10-31 動きベクトル探索装置、動きベクトル探索方法、画像処理装置、画像処理方法、プログラム及び記憶媒体 Expired - Fee Related JP5339855B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008282158A JP5339855B2 (ja) 2008-10-31 2008-10-31 動きベクトル探索装置、動きベクトル探索方法、画像処理装置、画像処理方法、プログラム及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008282158A JP5339855B2 (ja) 2008-10-31 2008-10-31 動きベクトル探索装置、動きベクトル探索方法、画像処理装置、画像処理方法、プログラム及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2010109903A true JP2010109903A (ja) 2010-05-13
JP5339855B2 JP5339855B2 (ja) 2013-11-13

Family

ID=42298856

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008282158A Expired - Fee Related JP5339855B2 (ja) 2008-10-31 2008-10-31 動きベクトル探索装置、動きベクトル探索方法、画像処理装置、画像処理方法、プログラム及び記憶媒体

Country Status (1)

Country Link
JP (1) JP5339855B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10327420A (ja) * 1997-03-05 1998-12-08 Samsung Electron Co Ltd 動き予測方法
WO2005120077A1 (ja) * 2004-06-03 2005-12-15 Sony Corporation 画像処理装置、そのプログラムおよびその方法
JP2006135461A (ja) * 2004-11-04 2006-05-25 Casio Comput Co Ltd 動画像符号化装置および動画像符号化処理プログラム
JP2007074100A (ja) * 2005-09-05 2007-03-22 Nippon Telegr & Teleph Corp <Ntt> 量子化歪み推定方法,量子化歪み推定装置,量子化歪み推定プログラムおよびその記録媒体
WO2008044511A1 (en) * 2006-10-12 2008-04-17 Kabushiki Kaisha Toshiba Method and apparatus for encoding image

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10327420A (ja) * 1997-03-05 1998-12-08 Samsung Electron Co Ltd 動き予測方法
WO2005120077A1 (ja) * 2004-06-03 2005-12-15 Sony Corporation 画像処理装置、そのプログラムおよびその方法
JP2006135461A (ja) * 2004-11-04 2006-05-25 Casio Comput Co Ltd 動画像符号化装置および動画像符号化処理プログラム
JP2007074100A (ja) * 2005-09-05 2007-03-22 Nippon Telegr & Teleph Corp <Ntt> 量子化歪み推定方法,量子化歪み推定装置,量子化歪み推定プログラムおよびその記録媒体
WO2008044511A1 (en) * 2006-10-12 2008-04-17 Kabushiki Kaisha Toshiba Method and apparatus for encoding image

Also Published As

Publication number Publication date
JP5339855B2 (ja) 2013-11-13

Similar Documents

Publication Publication Date Title
US11438575B2 (en) Bi-prediction coding method and apparatus, bi-prediction decoding method and apparatus, and recording medium
KR100856411B1 (ko) 조도 보상 방법 및 그 장치와 그 방법을 기록한 컴퓨터로 읽을 수 있는 기록매체
KR100803611B1 (ko) 영상의 부호화, 복호화 방법 및 장치
JP5277257B2 (ja) 動画像復号化方法および動画像符号化方法
US8761254B2 (en) Image prediction encoding device, image prediction decoding device, image prediction encoding method, image prediction decoding method, image prediction encoding program, and image prediction decoding program
KR100955152B1 (ko) 비디오 인코딩을 위한 다차원 인접 블록 예측
US7444026B2 (en) Image processing apparatus and method of motion vector detection in a moving picture, and recording medium used therewith
KR102032771B1 (ko) 화상 예측 부호화 장치, 화상 예측 부호화 방법, 화상 예측 복호 장치, 및 화상 예측 복호 방법
US8315309B2 (en) Method and apparatus for encoding and decoding an image by using consecutive motion estimation
US7620108B2 (en) Integrated spatial-temporal prediction
RU2580942C2 (ru) Устройство прогнозирующего кодирования изображений, способ прогнозирующего кодирования изображений, программа прогнозирующего кодирования изображений, устройство прогнозирующего декодирования изображений, способ прогнозирующего декодирования изображений и программа прогнозирующего декодирования изображений
JP4494803B2 (ja) 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置
US8050324B2 (en) Method and apparatus for selecting a reference frame for motion estimation in video encoding
US20240098251A1 (en) Bi-prediction coding method and apparatus, bi-prediction decoding method and apparatus, and recording medium
KR100727988B1 (ko) 변환 영역에서의 dc 계수 예측 방법 및 장치
JP4197695B2 (ja) 動画像符号化方法、装置及びプログラム
KR101187580B1 (ko) 조도 보상 방법 및 그 장치와 이를 이용한 동영상 부호화방법 및 그 장치
JP5339855B2 (ja) 動きベクトル探索装置、動きベクトル探索方法、画像処理装置、画像処理方法、プログラム及び記憶媒体
KR100906473B1 (ko) 개선된 움직임 벡터 부호화 및 복호화 방법과 그 장치
JP2008301270A (ja) 動画像符号化装置及び動画像符号化方法
JP4061505B2 (ja) 画像符号化装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130521

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130806

R151 Written notification of patent or utility model registration

Ref document number: 5339855

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees