JP5520687B2 - 動き推定装置及びプログラム - Google Patents

動き推定装置及びプログラム Download PDF

Info

Publication number
JP5520687B2
JP5520687B2 JP2010114729A JP2010114729A JP5520687B2 JP 5520687 B2 JP5520687 B2 JP 5520687B2 JP 2010114729 A JP2010114729 A JP 2010114729A JP 2010114729 A JP2010114729 A JP 2010114729A JP 5520687 B2 JP5520687 B2 JP 5520687B2
Authority
JP
Japan
Prior art keywords
motion
motion estimation
rank
power
horizontal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010114729A
Other languages
English (en)
Other versions
JP2011243008A (ja
Inventor
康孝 松尾
善明 鹿喰
俊枝 三須
慎一 境田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2010114729A priority Critical patent/JP5520687B2/ja
Publication of JP2011243008A publication Critical patent/JP2011243008A/ja
Application granted granted Critical
Publication of JP5520687B2 publication Critical patent/JP5520687B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Description

本発明は、動画像の時間方向及び/又は空間方向のスペクトルパワーによって動画像の動き量を階層的に分析し、動画像の動きベクトルを高精度に検出する動き推定装置及びプログラムに関する。
近年、撮像装置及び表示装置の高精細化が進んでおり、超解像(Super−Resolution)と称される動画像の高解像化技術が研究されている(例えば、特許文献1参照)。いわゆる8Kシステムと呼ばれるスーパーハイビジョン(SHV)のような超高精細映像、又は4Kシステムと呼ばれるデジタルシネマのような高精細映像は、従来のハイビジョン(HV)映像の4倍ないし16倍の高解像度を有するに至っている。
しかしながら、動画像を表示する表示装置の画面が高精細化されるほど、同じ画角で撮影した場合の動領域における1画素あたりの動きボケ量が大きくなる。
例えば、図15(a)に示すように、ハイビジョン(HV:Hi-Vision)画面は水平1920画素×垂直1080ライン、時間60フレーム/秒であり、図15(b)に示すように、スーパーハイビジョン(SHV:Super Hi-Vision)画面は、水平7680画素×垂直4320ライン、時間60フレーム/秒である。ハイビジョン画面用の動画像と同じFOV (FOV: Field Of View)で撮像した動画像をスーパーハイビジョン画面で見ると、水平・垂直解像度ともに4倍となるため、動きのある被写体の動き量は4倍となり、動領域における1画素あたりの動きボケ量も4倍となる。特に、画面全体が大きく変化するスポーツシーン等の高速動きシーンでは、視覚的なボケ感は顕著となる。
尚、或る動画像の1つの画面に対して異なる解像度の画像データを階層的に複数設定して、或る解像度の画像データについて動き量のための評価値を求めるとともに、この解像度とは異なる画像データについて動き量のための評価値を求め、各評価値を加算して得られる値から最終的な動き量を決定する技法が知られている(例えば、特許文献2参照)。
また、或る動画像の1つの画面に対して空間方向に複数階のウェーブレット変換を施して、高周波成分の領域を多く含む階数の優先度を低くする輪郭情報を抽出するとともに、動画像の1つの画面をブロック分割し、輪郭情報で示されるブロックにおけるアクティビティ(画像の局所的性質)が小さいほど優先度を高くなるように、輪郭情報で示されるブロックに同一の優先度を設定して、優先度が低いブロックから順に切り捨て処理を行って符号化データ量を制御する技法が知られている(例えば、特許文献3参照)。
特開2009−105490号公報 特許第3334271号 特許第4195978号
前述したように、SHV画面の映像フォーマットは、水平7680画素、垂直4320ライン、時間60フレーム/秒であり、HV画面の映像フォーマットと比較して、水平及び垂直標本化周波数が、時間標本化周波数に対して相対的に増大している。
従って、SHV画面の動領域は、同じ画角で撮像された動画像で比較した場合、HV画面と比較して大きな動き量(フレーム単位の動きを示す画素数:画素/フレーム)を示し、動領域ではフレーム間の相関が低くなり時間方向の高周波領域のパワーが高くなることが想定されるとともに、動領域のボケ量が大きくなり、空間方向の高周波領域のパワーが低くなることが想定される。符号化処理や超解像処理における複数フレーム間での動き量を推定するには、これらの想定に基づく処理が有効となる。尚、HDTV標準の動画像の動き量は、一般的に数画素/フレーム〜数十画素/フレーム程度であることが知られている。
一般に、空間高周波成分の多い絵柄は、小さいブロックサイズ(例えば、2×2画素)を用いた動き推定装置が適している。一方、空間高周波成分が少ない絵柄は、小さいブロックサイズでは誤った動き推定装置となる可能性が高くなるため、大きなブロックサイズ(例えば、16×16画素)を用いた動き推定装置が有効である。更に、大きなブロックサイズを用いた動き推定装置では、大きな動きによるボケの影響も考えられるため、大きな動き探索範囲が要求される。
一方、このような符号化処理や超解像処理における複数フレーム間での動き量の推定において、特許文献2の技法を適用しても、時空間周波領域のパワーに基づいて階層化するものではなく予め規定した階層数で処理を行うために、処理負担が大きくなり、且つ時間方向のボケの影響が反映された動き量を検出することができない。
また、このような符号化処理や超解像処理における複数フレーム間での動き量の推定において、特許文献3の技法を適用しても、高周波成分の領域を多く含む階数に依存して符号化データ量を取捨選択するためのブロックの優先度を決定することができるが、時空間周波領域のパワーに基づいて階層化するものではないので、動きベクトルを高精度化させることができない。
したがって、大きな動き量は、動領域の動きぼけ量が増し、空間高周波領域のパワー割合を低下させる。大きな動領域面積は、動領域の時間変動面積を増し、時間高周波領域のパワー割合を増加させる。
一般に動き量が大きく、動きぼけ量が大きな画像の動き推定は、大きなブロックサイズと探索範囲が適している。SHV画面の動き推定では、大きな動き量から小さな動き量まで、幅広い動き量に対応する動き推定方法が望まれる。
そこで、本発明の目的は、動画像の時間方向及び/又は空間方向のスペクトルパワーによって動画像の動き量を階層的に分析し、動画像の動き推定情報を高精度に求める動き推定装置及びプログラムを提供することにある。
前述のように、動き量と時空間方向の高周波領域のパワーとの間には一定の相関を持つことが多いため、動画像の時間及び空間スペクトルのパワー分析を行って、動き推定装置における適切なブロックサイズを推定するとともに、推定したブロックサイズを空間的に階層化して動きベクトルを検出することが有効である。
動画像の時空間方向のスペクトルを考察すると、動領域における空間方向の高周波領域のパワーは、動き量の面積が大きくなるにつれて減少する。即ち、大面積の動オブジェクトが大きな動き量を持つ動画像は、空間方向の高周波領域のパワーが小さくなるが、時間方向の高周波領域のパワーは大きくなる傾向がある。これは、画面中で大きな面積のオブジェクトが大きく動く場合は、時間方向の変動が大きくなることに起因する。
そこで、本発明の動き推定装置及びプログラムは、動画像における動領域の面積及び動き量の推定のために、動画像の時間方向及び/又は空間方向のスペクトルパワー分析を行って、画像内の動領域では時間周波数が大きく変動し、動き量が大きい方向に画像は大きく動きぼけする特徴を利用し、時空間周波数帯域のパワーを解析することにより、画像の持つ大凡の動き量と動き方向を推定する。この大凡の動き量と動き方向の推定結果から、画像が持つ周波数帯域ごとのパワーに応じて(階層型動き推定の階数を決定して)、帯域毎にブロックサイズと動き探索範囲の水平方向および垂直方向の大きさを決定する。そして、この階層毎のブロックサイズと動き探索範囲を用いて、階層的動き推定を行う。これにより、大凡の動き量と動き方向の推定により、ブロックサイズと動き探索範囲の水平、垂直方向の大きさが階層的に異なることとなり(等価的に様々なサイズのブロックサイズ及び探索範囲を用いて動き推定を行うこととなり)、従来法よりも高確度に動き推定を行うことが可能となり、さらに、動き方向を水平、垂直だけでなく、斜め方向をも考慮に入れてブロックサイズ及び探索範囲を決定して動き推定を行うことにより、動きぼけ量や方向に応じた動き推定を従来法よりもさらに高確度に行うことが可能となる。
即ち、本発明の動き推定装置は、動画像の動き推定を行う動き推定装置であって、複数フレームのフレーム画像列について時間方向の周波数帯域毎のパワーを算出する算出時間方向周波数分解部と、前記時間方向の周波数帯域別のパワー値と、予め定めた第1閾値とを比較し、前記第1閾値を上回るパワーとなる階数を空間周波数の空間分解階数値として決定する空間分解階数決定部と、前記空間分解階数値に基づいて、動き推定対象のフレームに対してオクターブ分解を行い、前記空間分解階数値に対応する階数毎に、水平、垂直、斜め方向の周波数帯域毎のパワー値を算出する空間方向周波数分解部と、前記空間分解階数値に対応する階数毎に算出した水平、垂直、斜め方向の周波数帯域毎のパワー値と、予め定めた第2閾値とを比較し、当該水平、垂直、斜め方向の周波数帯域毎のパワー値の全てが前記第2閾値を下回るパワーとなる階数を動き検出開始階数として決定し、前記動き検出開始階数の各階層について該水平、垂直、斜め方向の周波数帯域毎のパワー値に応じたブロックサイズ及び動き探索範囲を決定する画像解析部と、前記動き検出開始階数の階数毎に決定されたブロックサイズ及び動き探索範囲に基づいて、前記動き推定対象のフレームに対して階層型の動き推定を行う動き推定部と、を具えることを特徴とする。
また、本発明の動き推定装置において、前記画像解析部は、前記動き検出開始階数における各階層の水平、垂直、斜め方向の周波数帯域毎のパワーの割合を算出して、前記動き検出開始階数における階層毎の基準の動き検出のブロックサイズ及び動き探索範囲に対する倍数を算出し、該倍数を前記基準の動き検出のブロックサイズ及び動き探索範囲に乗じて、当該水平、垂直、斜め方向の周波数帯域毎のパワー値に応じたブロックサイズ及び動き探索範囲を決定する手段を有することを特徴とする。
また、本発明の動き推定装置において、前記動き推定部は、階層型の動き推定を行う際に、階層間で同位置にブロックがない場合に、階層間のブロックの面積割合に応じた加重平均を行って、最終的な動きベクトルを決定する手段を有することを特徴とする。
さらに、本発明は、動画像の動き推定を行う動き推定装置として構成するコンピュータに、複数フレームのフレーム画像列について時間方向の周波数帯域毎のパワーを算出するステップと、前記時間方向の周波数帯域別のパワー値と、予め定めた第1閾値とを比較し、前記第1閾値を上回るパワーとなる階数を空間周波数の空間分解階数値として決定するステップと、前記空間分解階数値に基づいて、動き推定対象のフレームに対してオクターブ分解を行い、前記空間分解階数値に対応する階数毎に、水平、垂直、斜め方向の周波数帯域毎のパワー値を算出するステップと、前記空間分解階数値に対応する階数毎に算出した水平、垂直、斜め方向の周波数帯域毎のパワー値と、予め定めた第2閾値とを比較し、当該水平、垂直、斜め方向の周波数帯域毎のパワー値の全てが前記第2閾値を下回るパワーとなる階数を動き検出開始階数として決定し、前記動き検出開始階数の各階層について該水平、垂直、斜め方向の周波数帯域毎のパワー値に応じたブロックサイズ及び動き探索範囲を決定するステップと、前記動き検出開始階数の階数毎に決定されたブロックサイズ及び動き探索範囲に基づいて、前記動き推定対象のフレームに対して階層型の動き推定を行うステップと、を実行させるためのプログラムとして構成される。
本発明によれば、動画像における動き推定にあたって、適切なブロックサイズを推定して動き推定装置を開始することができるだけでなく、時空間方向のスペクトルパワーから画像が持つ大凡の動き量、動き方向(水平・垂直・斜めの動き方向)及び動領域を帯域毎に推定してブロックサイズ及び動き探索範囲の大きさを決定し、帯域毎にブロックサイズ及び動き探索範囲の大きさが異なる階層的に動き推定を行うことで、雑音に強く、且つ高精度の動き推定装置の計算量を削減することができるとともに、動きぼけ量や方向に応じた高確度動き推定を行うことが可能となる。
本発明による一実施例の動き推定装置の概略図である。 本発明による一実施例の動き推定装置における時間方向周波数分解部の概略図である。 本発明による一実施例の動き推定装置における空間分解階数決定部の概略図である。 本発明による一実施例の動き推定装置における空間方向周波数分解部の概略図である。 本発明による一実施例の動き推定装置における画像解析部の概略図である。 本発明による一実施例の動き推定装置における動き推定部の概略図である。 本発明による一実施例の動き推定装置の動作を示す動作フロー図である。 本発明による一実施例の動き推定装置におけるフレーム画像列を示す図である。 本発明による一実施例の動き推定装置における時間方向周波数分解部の動作説明図である。 (a),(b)本発明による一実施例の動き推定装置に係る2次元2階離散ウェーブレット分解の説明図である。 (a),(b),(c),(d)本発明による一実施例の動き推定装置における動き検出部の動作説明図である。 (a),(b),(c),(d)本発明による一実施例の動き推定装置における動き検出部に係るブロックサイズの説明図である。 本発明による一実施例の動き推定装置に係る2次関数近似による小数画素位置のブロックマッチング法の説明図である。 本発明による一実施例の動き推定装置における動き検出部に係る面積割合の荷重平均で動きベクトルを算出する説明図である。 (a),(b)動領域における1画素あたりの動きボケ量が映像フォーマットに従って変化する様子を示す図である。
以下、本発明による一実施例の動き推定装置について説明する。
一実施例の動き推定装置1として、時間方向及び空間方向の周波数解析にウェーブレット変換によるオクターブ分解処理を用いる場合について説明する。尚、時間方向及び空間方向の周波数解析には、ウェーブレット変換を用いる場合以外に、他の直交変換又はFFT(Fast Fourier transform)を用いることができるが、画像を低解像度化するにしたがってくり返し同じ処理を行って、時間方向及び空間方向の周波数解析を行う点を考慮すれば、ウェーブレット変換によるオクターブ分解処理を用いることが特に処理効率が向上する点で有利である。
[装置構成]
図1に、本発明による一実施例の動き推定装置1を示す。本実施例の動き推定装置1は、時間方向周波数分解部11と、空間分解階数決定部12と、空間方向周波数分解部13と、画像解析部14と、動き推定部15とを備える。尚、各構成要素で処理するのに必要な画像データは、動き推定装置1が備える記憶部(図示せず)に適宜格納して読み出すように構成することができる。
時間方向周波数分解部11は、動きベクトルの検出を行う基準フレームF(t)及び動き探索に用いる参照フレームF(t)を含む、時刻t=t・・・tにおける複数フレームのフレーム画像列F(t),・・・,F(t),・・・,F(t),・・・,F(t)を入力し、基準フレームF(t)における全画素について、この複数フレームを時間方向に予め規定した最大階数の周波領域に分解した後、全画素における時間方向の周波数帯域毎のパワーを算出し、この複数フレームの全画素に対するパワー値で正規化し、全画素におけるn階の各時間方向の周波数帯域別のパワー値P(n)を算出して空間分解階数決定部12に送出する。
例えば、図2に示すように、時間方向周波数分解部11は、基準フレームF(t)及び参照フレームF(t)を含む、時刻t=t・・・tにおけるフレーム画像列F(t),・・・,F(t),・・・,F(t),・・・,F(t)を入力し、基準フレームF(t)の全画素について時間方向に予め規定したNmax階(例えば、4階)の離散ウェーブレット分解を行う時間方向1次元Nmax階離散ウェーブレット分解処理部111と、基準フレームF(t)の全画素における時間方向の周波数帯域毎のパワーを算出し、この複数フレームの全画素に対するパワー値で正規化し、算出した全画素におけるn階の各時間方向の周波数帯域別のパワー値P(n)を算出して空間分解階数決定部12に送出する時間方向周波数帯域別パワー算出部112から構成することができる。
空間分解階数決定部12は、時間方向周波数分解部11によって算出したn階の各時間方向の周波数帯域別のパワー値P(n)と、時間方向の高周波領域のパワーの割合が大きいほど動領域面積が大きく、且つ動き量が大きいとして判断するための予め定めた閾値Thとを比較し、閾値Thを上回るパワーとなる階数(尚、パワーの割合は階数によって区分される)を、時間方向の高周波領域のパワーの割合に応じた空間周波数の分解階数Ns(以下、「空間分解階数値」とも称する)として決定し、決定した空間分解階数値Nsの情報を空間方向周波数分解部13に送出する。時間方向の周波数帯域分割した階数nの階層が大きいほど、動領域面積が大きく、且つ動き量が大きいと判断することができる。
例えば、図3に示すように、空間分解階数決定部12は、時間方向周波数分解部11によって算出したn階の各時間方向の周波数帯域別のパワー値P(n)と閾値Thとを入力して比較する比較部121と、比較部121の比較によって得られる閾値Thを上回るパワーとなる階数を、時間方向の高周波領域のパワーの割合に応じた空間分解階数値Nsとして決定し、決定した空間分解階数値Nsの情報を空間方向周波数分解部13に送出する空間分解階数値決定部122から構成することができる。
空間方向周波数分解部13は、基準フレームF(t)及び参照フレームF(t)を入力し、空間分解階数決定部12によって決定した空間分解階数値Nsに基づいて、基準フレームF(t)及び参照フレームF(t)の各々の全画素に対して空間Ns階離散ウェーブレット分解を行い、基準フレームF(t)及び参照フレームF(t)の各々における空間分解階数値Nsに対応するn階の水平、垂直、斜め方向の周波数帯域毎に平均して正規化したパワー値P(n),P(n),P(n)を算出し、画像解析部14に送出する。
尚、基準フレームF(t)及び参照フレームF(t)の双方に対して空間Ns階離散ウェーブレット分解を実行することは、元画像に対して可変のブロックサイズ及び探索範囲の大きさとする階層型動き推定を行うことができる点で有利であり、特に、動き推定装置を階層的に行うための分解能の決定のためには、基準フレームF(t)及び参照フレームF(t)のうちの空間方向の低周波領域のパワーの割合が大きいほうを選定するのが好適となる。以下の説明では、基準フレームF(t)及び参照フレームF(t)の双方について空間Ns階離散ウェーブレット分解を行う例を説明する。
例えば、図4に示すように、空間方向周波数分解部13は、基準フレームF(t)及び参照フレームF(t)を入力し、空間分解階数決定部12によって決定した空間分解階数値Nsに基づいて、基準フレームF(t)及び参照フレームF(t)の各々の全画素に対して空間Ns階離散ウェーブレット分解を行う空間方向2次元Ns階離散ウェーブレット分解処理部131と、基準フレームF(t)及び参照フレームF(t)の各々における空間分解階数値Nsに対応するn階の水平、垂直、斜め方向の周波数帯域毎に平均して正規化したパワー値P(n),P(n),P(n)を算出して画像解析部14に送出する水平・垂直・斜め方向周波数帯域別パワー算出部132から構成することができる。
画像解析部14は、空間方向周波数分解部13によって算出したn階の水平、垂直、斜め方向の周波数帯域毎のパワー値P(n),P(n),P(n)と、空間方向の低周波領域のパワーの割合が大きいほど(空間方向の高周波領域のパワーの割合が小さいほど)動領域面積が大きく、且つ動き量が大きいと判断するための予め定めた閾値Thとを入力して比較し、水平、垂直、斜め方向の周波数帯域毎のパワー値P(n),P(n),P(n)の全てが閾値Thを下回るパワーとなる階数n(尚、パワーの割合は階数によって区分される)を、動き検出を開始する階数(以下、「動き検出開始階数」と称する)として決定し、動き検出開始階数nにおける各n階における水平、垂直、斜め方向の周波数帯域毎のパワーの割合PHR(n),PVR(n),PDR(n)を算出して、動き検出開始階数nにおける動き検出のブロックサイズ及び動き探索範囲の倍数α,βを算出し、倍数α,βによって動き検出開始階数nにおける動き検出のブロックサイズ及び動き探索範囲を決定し、それぞれブロックサイズ情報及び動き探索範囲情報として動き検出部15に送出する。動き検出開始階数nの階層が小さいほど、動領域面積が大きく、且つ動き量が大きいと判断することができる。
例えば、図5に示すように、画像解析部14は、空間方向周波数分解部13によって算出したn階の水平、垂直、斜め方向の周波数帯域毎のパワー値P(n),P(n),P(n)と、予め定めた閾値Thとを入力して比較する比較部141と、比較部141の比較によって水平、垂直、斜め方向の周波数帯域毎のパワー値P(n),P(n),P(n)の全てが閾値Thを下回るパワーとなる動き検出開始階数nを決定し、動き検出開始階数nにおける各n階における水平、垂直、斜め方向の周波数帯域毎のパワーの割合PHR(n),PVR(n),PDR(n)を算出する水平・垂直・斜め方向パワー割合算出部142と、動き検出開始階数nにおける動き検出のブロックサイズ及び動き探索範囲の倍数α,βを算出する水平・垂直方向倍数算出部143と、倍数α,βによって動き検出開始階数nにおける動き検出のブロックサイズ及び動き探索範囲を決定し、それぞれブロックサイズ情報及び動き探索範囲情報として動き検出部15に送出するブロックサイズ・動き探索範囲決定部144として構成することができる。
動き検出開始階数nにおける水平、垂直、斜め方向の周波数帯域毎のパワーの割合PHR(n),PVR(n),PDR(n)は、以下の式から得られる。
水平方向パワーの割合:
HR(n)=P(n)/(P(n)+P(n)+P(n))
垂直方向パワーの割合:
VR(n)=P(n)/(P(n)+P(n)+P(n))
斜め方向パワーの割合:
DR(n)=P(n)/(P(n)+P(n)+P(n))
動き検出開始階数nにおける動き検出のブロックサイズ及び動き探索範囲の倍数α,βは、以下の式から得られる。尚、aは適宜設定可能な係数であるが、等分配するにはa=1/2とすることができる。
水平方向の倍数:
α=a×(PVR(n)+PDR(n))
/(PHR(n)+PVR(n)+PDR(n))
垂直方向の倍数:
β=(1−a)×(PHR(n)+PDR(n))
/(PHR(n)+PVR(n)+PDR(n))
従って、倍数α,βは、斜め方向パワーの割合PDR(n)を考慮して決定されるので、後述する高確度な動き推定に寄与することになる。
動き検出開始階数nにおける動き検出のブロックサイズ情報及び動き探索範囲情報は、以下の式から得られる。動き検出開始階数nにおける予め定めた基準のブロックサイズをB(n)画素、垂直B(n)ラインとし、動き検出開始階数nにおける予め定めた基準の動き探索範囲を水平S(n)画素、垂直SS(n)ラインとする。
ブロックサイズ情報:水平αB(n)画素、垂直βB(n)ライン
動き探索範囲情報:水平αS(n)画素、垂直βS(n)ライン
動き推定部15は、動き検出開始階数nに応じた空間方向に低周波領域の基準フレームF(t)及び参照フレームF(t)の画像を得るために、基準フレームF(t)及び参照フレームF(t)の空間方向2次元Ns階離散ウェーブレット分解したデータに対して、動き検出開始階数nに応じた空間n階ウェーブレットの再構成を行い、画像解析部14から得られるブロックサイズ情報及び動き探索範囲情報に従う大きさで動き推定を実行し、続いて空間n−1階ウェーブレットの再構成を行い、当該ブロックサイズ情報及び動き探索範囲情報に従う大きさで動き推定を再度実行し、最上位の階層(即ち、元の画像レベル)にて当該ブロックサイズ情報及び動き探索範囲情報に従う大きさで動き推定を行うまで階数をデクリメントして繰り返す。この動き推定部15の動作は、基準フレームF(t)及び参照フレームF(t)を入力し、動き検出開始階数nに基づいて、基準フレームF(t)に対して順次ブロックサイズ及び探索範囲の大きさを縮小しながら動き推定を行うことと類似した処理となる。ただし、空間n階ウェーブレット分解及び再構成を経て順次繰り返すことによる動き推定部15によれば、階層に応じて順次水平、垂直、斜め方向の周波数帯域毎のパワー値P(n),P(n),P(n)に基づいて決定したブロックサイズ情報及び動き探索範囲情報に従って動き推定を行うため、画像シーンに応じた動き検出開始階数nに応じた動き推定を高確度に行うことができ、高精度化が期待できる。
例えば、図6に示すように、動き推定部15は、動き検出開始階数nに応じた空間方向に低周波領域の基準フレームF(t)及び参照フレームF(t)の画像を得るために動き検出開始階数nに応じた空間n階ウェーブレットの再構成を行い、画像解析部14から得られるブロックサイズ情報及び動き探索範囲情報に従う大きさで小数画素精度のブロックマッチングによる動き推定を行う階層型動き推定部151と、この動き推定の処理を最上位の階数に対応する元の画像レベルとなるまで階数をデクリメントして繰り返すために、空間方向に1階上位のウェーブレット再構成を実行した画像を階層型動き推定部151に送出する空間1階ウェーブレット再構成部152から構成することができる。従って、階層型動き推定部151は、空間1階ウェーブレット再構成部152から得られる基準フレームF(t)及び参照フレームF(t)の再構成画像を用いて、動き推定処理を階層的に繰り返し、最終的な動き推定情報(例えば、動きベクトル)を決定して出力することができる。
以下、本発明による一実施例の動き推定装置1の動作について更に詳細に説明する。
[装置動作]
図7は、本発明による一実施例の動き推定装置の動作を示す動作フローである。
ステップS1にて、動き推定装置1は、基準フレームF(t)及び参照フレームF(t)を含む、時刻t=t・・・tにおけるフレーム画像列F(t),・・・,F(t),・・・,F(t),・・・,F(t)を入力して、動き推定装置1が備える記憶部(図示せず)に適宜読み出し可能に格納する。
ステップS2にて、時間方向周波数分解部11により、フレーム画像列F(t),・・・,F(t),・・・,F(t),・・・,F(t)を入力し、基準フレームF(t)における全画素について時間方向に予め規定した最大階数の周波領域に分解した後、全画素における時間方向の周波数帯域毎のパワーを算出する。
例えば、図8に示すように、フレーム画像列F(t),・・・,F(t),・・・,F(t),・・・,F(t)における或る画素R(k,l)について、時間方向に予め規定した最大階数(Nmax)の周波領域に分解した後、全画素における時間方向周波数帯域毎のパワーを算出することができる。例えば、図9に示すように、16フレームのフレーム画像列F(t)を時間方向にNmax階に分解するとすれば、Nmax=1では、低周波領域L及び高周波領域Hとして分割することができ(図9(a)参照)、Nmax=2では、低周波領域L及び高周波領域H,Hとして分割することができ(図9(b)参照)、Nmax=3では、低周波領域L及び高周波領域H,H,Hとして分割することができ(図9(c)参照)、Nmax=4では、低周波領域L及び高周波領域H,H,H,Hとして分割することができる(図9(d)参照)。
ステップS3にて、空間分解階数決定部12により、算出した時間方向の周波数帯域毎のパワーP(n)と、時間方向の高周波領域のパワーの割合が大きいほど動領域面積が大きく、且つ動き量が大きくなると判断するための予め定めた閾値Thとを比較し、この閾値Thを上回るパワーとなる階数を、時間方向の高周波領域のパワーの割合に応じた空間周波数の分解階数(空間分解階数値)Nsとして決定する。
パワーP(n)と閾値Thとの比較として構成する代わりに、例えば、表1に示すように、時間方向の高周波領域のパワーの割合と空間周波数の分解階数Nsとの間で規定されるテーブルを予め保持しておき、パワーP(n)から空間周波数の分解階数Nsを求めるように構成することもできる。
Figure 0005520687
ステップS4にて、空間方向周波数分解部13により、基準フレームF(t)及び参照フレームF(t)を入力し、空間分解階数決定部12によって決定した空間周波数の分解階数Nsに基づいて、基準フレームF(t)及び参照フレームF(t)に対して空間Ns階離散ウェーブレット分解を実行し、基準フレームF(t)及び参照フレームF(t)の各々における空間分解階数値Nsに対応するn階の水平、垂直、斜め方向の周波数帯域毎のパワー値P(n),P(n),P(n)を算出する。尚、動き検出開始階数nの決定のために、基準フレームF(t)及び参照フレームF(t)における空間周波数帯域毎のパワーの割合の大きいほうを選定することや、基準フレームF(t)又は参照フレームF(t)における空間周波数帯域毎のパワーの割合のみを算出してもよい。
例えば、図10(a)に示すように、基準フレームF(t)の全画素に対して空間方向に2次元2階離散ウェーブレット分解を実行して、基準フレームF(t)及び参照フレームF(t)の各々における空間分解階数値Nsに対応するn階の水平、垂直、斜め方向の周波数帯域毎のパワー値P(n),P(n),P(n)を算出することができる。また、図10(b)に示すように、基準フレームF(t)の空間方向の低周波領域(例えば、LL)のみを抽出して基準フレームF(t)の低周波領域のみの画像を再構成することができる。
続いて、画像解析部14により、空間分解階数値Nsに対応するn階の水平、垂直、斜め方向の周波数帯域毎のパワー値P(n),P(n),P(n)と、空間方向の低周波領域のパワーの割合が大きいほど(空間方向の高周波領域のパワーの割合が小さいほど)動領域面積が大きく、且つ動き量が大きいと判断するための予め定めた閾値Thとを入力して比較し、この比較によって得られる閾値Thを下回るパワーとなる階数n(尚、パワーの割合は階数によって区分される)を、動き検出を開始する階数(以下、「動き検出開始階数」と称する)として決定し(ステップS4)、動き検出開始階数nにおける各n階における水平、垂直、斜め方向の周波数帯域毎のパワーの割合PHR(n),PVR(n),PDR(n)を算出して(ステップS5)、動き検出開始階数nにおける動き検出のブロックサイズ及び動き探索範囲の倍数α,βを算出し、倍数α,βによって動き検出開始階数nにおける動き検出のブロックサイズ及び動き探索範囲を決定する(ステップS6)。ただし、n≦Nsである。
階の水平、垂直、斜め方向の周波数帯域毎のパワー値P(n),P(n),P(n)と閾値Thとの比較で動き検出開始階数nを求めるように構成する代わりに、例えば、表2に示すように、n階の水平、垂直、斜め方向の周波数帯域毎のパワー値P(n),P(n),P(n)における低周波領域のパワーの割合と動き検出開始階数nとの間で規定されるテーブルを予め保持しておき、低周波領域のパワーの割合を算出して動き検出開始階数nを求めるように構成することもできる。尚、動き検出開始階数nが大きくなるにつれて、元の画像が低解像度化することを意味しており、元の画像に対して相対的にブロックサイズ及び動き探索範囲の大きさが増大することを意味している。例えば、空間分解能1/16,1/8,1/4,1/2とすれば、それぞれ(ブロックサイズ,動き探索範囲の大きさ)は、(16×16,水平・垂直16画素),(8×8,水平・垂直8画素),(4×4,水平・垂直4画素),(2×2,水平・垂直2画素)などである。ここで、例えば、空間分解能1/16は、元の画像における水平標本化周波数Hs及び垂直標本化周波数Vsにおいて、16画素を1画素として標本化する低解像度化を意味する。
Figure 0005520687
つまり、図11に示すように、空間方向の低周波領域のパワーの割合によって、動き検出開始階数nを関連付けることができる。例えば、Ns=4のとき、低周波領域(LL)及び高周波領域(LL以外)のそれぞれのパワーを算出して、全体における低周波領域(LL)の割合が、99.5%以上であれば、動き検出開始階数n=4として4階層の低周波領域のみの画像を再構成することができる(図11(d)参照)。また、全体における低周波領域(LL)の割合が、98.0%以上99.5%未満であれば、動き検出開始階数n=3として3階層の低周波領域(この場合、LL)のみの画像を再構成することができる(図11(c)参照)。同様に、全体における低周波領域(LL)の割合が、95.0%以上98.0%未満であれば、動き検出開始階数n=2として2階層の低周波領域(この場合、LL)のみの画像を再構成することができ(図11(b)参照)、全体における低周波領域(LL)の割合が、95.0%未満であれば、動き検出開始階数n=1として1階層の低周波領域(この場合、LL)のみの画像を再構成することができる。
ステップS7にて、動き推定部15により、動き検出開始階数nに基づいた基準フレームF(t)及び参照フレームF(t)の低周波画像に対して、基準フレームF(t)の低周波画像を所定のブロックサイズに分割し、分割した各ブロックについて、所定の動き探索範囲の大きさで、小数画素精度のブロックマッチングによる動き推定を行う。
ステップS8にて、動き推定部15により、基準フレームF(t)及び参照フレームF(t)に対してブロックサイズ及び動き探索範囲の大きさを縮小しながら動き推定装置を繰り返す効果を得るために、算出していた基準フレームF(t)及び参照フレームF(t)の空間n階離散ウェーブレット分解データに対して動き検出開始階数nよりも上位の階数の画像となるように空間方向に1階上位のウェーブレット再構成を実行する。
動き推定部15は、空間1階ウェーブレット再構成部152から得られる基準フレームF(t)及び参照フレームF(t)の再構成画像を用いて、最上位の階層(即ち、元の画像レベルにおける動き推定装置)となるまで順次階数をデクリメントして動き推定装置の処理を繰り返し(ステップS9)、最終的な動きベクトルを決定して動き推定情報を出力することができる(ステップS10)。
例えば、図12(a)〜(d)に示すように、動き検出開始階数nが大きいほどブロックサイズが大きくなる様子を示しており、ブロックサイズが大きいほど参照フレームF(t)における動き探索範囲の大きさも大きくなる。
つまり、基準フレームF(t)のn階低周波画像を水平及び垂直のブロックサイズ(Bxns,Byns)の或るブロックBns(上添え字は、階級を示す)に分割し、参照フレームF(t)の±Sxns,±Synsの範囲(例えば、±2ブロック)で探索し、各ブロックの動きベクトルvnsを算出する。次に、基準フレームF(t)のn−1階低周波画像を、ブロックサイズ(Bxns,Byns)で分割し、参照フレームF(t)のn階低周波画像上の同じ位置から2×vnsだけずらした場所を中心位置とする水平及び垂直画素数としてそれぞれ±Sxns,±Synsの範囲で探索し、得られた動きベクトルに2×vnsをベクトル加算して、n−1階低周波画像における動きベクトルvns−1を算出する。
尚、動き推定装置は、2次関数近似による小数画素位置のブロックマッチング法を用いて行うのは、最上位の階数(即ち、1階)でのみ行うのが好適であり、式(1)で与えられる。
Figure 0005520687
尚、探索位置における画素位置をxとしたとき、SSD(x)は、画素位置におけるSSD値(誤差二乗和)を表し、より具体的には、SSD(0)は中心位置におけるSSD値、SSD(−1)は中心位置から−Sx(Sy)画素の位置におけるSSD値、SSD(1)は中心位置から+Sx(Sy)画素の位置におけるSSD値を表す。式(1)から、水平又は垂直方向の小数画素精度の画素位置(小数画素位置)をそれぞれ算出することができる。例えば、図13に示すように、式(1)から2次関数近似して、小数画素位置として例えば−0.33を得ることができる。
また、n階におけるブロックサイズは固定でないため、n階からみてn−1階のブロックが階層間で同位置及び同サイズとならない場合も考えられる。このような場合には、図14に示すように、階層間のブロックの面積割合に応じた加重平均をとるのが好適である。例えば、n階における面積A1〜A4の4ブロックに対して、n−1階のブロックがまたがる場合に(面積A1+A2’+A3’+A4’)、n階における面積A1〜A4の4ブロックにおけるそれぞれ動きベクトルがv1〜v4とすると、n−1階の動きベクトルは、(A1・2v1+A2’・2v2+A3’・2v3+A4’・2v4)/(A1+A2+A3+A4)として求めることができる。このようにして、最上位の階数(即ち、1階)まで動き推定装置を繰り返すことにより、高精度化を図ることができる。
以上のように、一実施例の動き推定装置によれば、動画像における動き推定にあたって、適切なブロックサイズを推定して動き推定装置を開始することができるだけでなく、時空間方向のスペクトルパワーから画像が持つ大凡の動き量、動き方向(水平・垂直・斜めの動き方向)及び動領域を帯域毎に推定してブロックサイズ及び動き探索範囲の大きさを決定し、帯域毎にブロックサイズ及び動き探索範囲の大きさが異なる階層的に動き推定を行うことで、雑音に強く、且つ高精度の動き推定装置の計算量を削減することができるとともに、動きぼけ量や方向に応じた高確度動き推定を行うことが可能となる。例えば、SHV画面における大きな動きをするオブジェクトを高精度に推定した動き推定装置が可能となる。
また、このように高精度で効率的に求めた動きベクトルを既存の符号化装置の符号化処理や超解像処理に適用することで、更なる高品質化が期待できる。
また、上述の実施例では、各周波領域のパワーの算出のために、ウェーブレット変換を用いる例を説明したが、離散コサイン変換などの既知の直交変換や、フィルターバンク等を用いて各周波領域のパワーを算出することができる。ウェーブレット変換を用いる場合には、画像の周波数変化を高精度に捉えることができる点で優れており、離散コサイン変換を用いる場合には、既存のシステムが離散コサイン変換を用いている場合に装置構成が容易になる。
更に、本発明の一態様として、本発明の動き推定装置をコンピュータとして構成させることができる。コンピュータに、前述した本発明の動き推定装置の各構成要素を実現させるためのプログラムは、コンピュータの内部又は外部に備えられる記憶部に記憶される。そのような記憶部は、外付けハードディスクなどの外部記憶装置、或いはROM又はRAMなどの内部記憶装置で実現することができる。コンピュータに備えられる制御部は、中央演算処理装置(CPU)などの制御で実現することができる。即ち、CPUが、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、記憶部から読み込んで、各構成要素の機能をコンピュータ上で実現させることができる。ここで、各構成要素の機能をハードウェアの一部で実現しても良い。
また、この処理内容を記述したプログラムを、例えばDVD又はCD−ROMなどの可搬型記録媒体の販売、譲渡、貸与等により流通させることができるほか、そのようなプログラムを、例えばネットワーク上にあるサーバの記憶部に記憶しておき、ネットワークを介してサーバから他のコンピュータにそのプログラムを転送することにより、流通させることができる。
また、そのようなプログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム又はサーバから転送されたプログラムを、一旦、自己の記憶部に記憶することができる。また、このプログラムの別の実施態様として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、更に、このコンピュータにサーバからプログラムが転送される度に、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。
以上、具体例を挙げて本発明の実施例を詳細に説明したが、本発明の特許請求の範囲から逸脱しない限りにおいて、あらゆる変形や変更が可能であることは当業者に明らかである。
本発明によれば、動画像の超解像処理及び映像符号化、又はその他の画像処理で用いられる動き推定装置の精度を高めることができる。近年における動画像処理は益々高精細化しており、本発明による動き推定装置は、高精度の動き推定装置が求められる任意の動画像処理の用途に有用である。
1 動き推定装置
11 時間方向周波数分解部
12 空間分解階数決定部
13 空間方向周波数分解部
14 画像解析部
15 動き推定部
121 比較部
122 空間分解階数値決定部
131 空間方向2次元Ns階離散ウェーブレット分解処理部
132 水平・垂直・斜め方向周波数帯域別パワー算出部
141 比較部
142 水平・垂直・斜め方向パワー割合算出部
143 水平・垂直方向倍数算出部
144 ブロックサイズ・動き探索範囲決定部
151 階層型動き推定部
152 空間1階ウェーブレット再構成部

Claims (4)

  1. 動画像の動き推定を行う動き推定装置であって、
    複数フレームのフレーム画像列について時間方向の周波数帯域毎のパワーを算出する算出時間方向周波数分解部と、
    前記時間方向の周波数帯域別のパワー値と、予め定めた第1閾値とを比較し、前記第1閾値を上回るパワーとなる階数を空間周波数の空間分解階数値として決定する空間分解階数決定部と、
    前記空間分解階数値に基づいて、動き推定対象のフレームに対してオクターブ分解を行い、前記空間分解階数値に対応する階数毎に、水平、垂直、斜め方向の周波数帯域毎のパワー値を算出する空間方向周波数分解部と、
    前記空間分解階数値に対応する階数毎に算出した水平、垂直、斜め方向の周波数帯域毎のパワー値と、予め定めた第2閾値とを比較し、当該水平、垂直、斜め方向の周波数帯域毎のパワー値の全てが前記第2閾値を下回るパワーとなる階数を動き検出開始階数として決定し、前記動き検出開始階数の各階層について該水平、垂直、斜め方向の周波数帯域毎のパワー値に応じたブロックサイズ及び動き探索範囲を決定する画像解析部と、
    前記動き検出開始階数の階数毎に決定されたブロックサイズ及び動き探索範囲に基づいて、前記動き推定対象のフレームに対して階層型の動き推定を行う動き推定部と、
    を具えることを特徴とする動き推定装置。
  2. 前記画像解析部は、前記動き検出開始階数における各階層の水平、垂直、斜め方向の周波数帯域毎のパワーの割合を算出して、前記動き検出開始階数における階層毎の基準の動き検出のブロックサイズ及び動き探索範囲に対する倍数を算出し、該倍数を前記基準の動き検出のブロックサイズ及び動き探索範囲に乗じて、当該水平、垂直、斜め方向の周波数帯域毎のパワー値に応じたブロックサイズ及び動き探索範囲を決定する手段を有することを特徴とする、請求項1に記載の動き推定装置。
  3. 前記動き推定部は、階層型の動き推定を行う際に、階層間で同位置にブロックがない場合に、階層間のブロックの面積割合に応じた加重平均を行って、最終的な動きベクトルを決定する手段を有することを特徴とする、請求項1又は2に記載の動き推定装置。
  4. 動画像の動き推定を行う動き推定装置として構成するコンピュータに、
    複数フレームのフレーム画像列について時間方向の周波数帯域毎のパワーを算出するステップと、
    前記時間方向の周波数帯域別のパワー値と、予め定めた第1閾値とを比較し、前記第1閾値を上回るパワーとなる階数を空間周波数の空間分解階数値として決定するステップと、
    前記空間分解階数値に基づいて、動き推定対象のフレームに対してオクターブ分解を行い、前記空間分解階数値に対応する階数毎に、水平、垂直、斜め方向の周波数帯域毎のパワー値を算出するステップと、
    前記空間分解階数値に対応する階数毎に算出した水平、垂直、斜め方向の周波数帯域毎のパワー値と、予め定めた第2閾値とを比較し、当該水平、垂直、斜め方向の周波数帯域毎のパワー値の全てが前記第2閾値を下回るパワーとなる階数を動き検出開始階数として決定し、前記動き検出開始階数の各階層について該水平、垂直、斜め方向の周波数帯域毎のパワー値に応じたブロックサイズ及び動き探索範囲を決定するステップと、
    前記動き検出開始階数の階数毎に決定されたブロックサイズ及び動き探索範囲に基づいて、前記動き推定対象のフレームに対して階層型の動き推定を行うステップと、
    を実行させるためのプログラム。
JP2010114729A 2010-05-18 2010-05-18 動き推定装置及びプログラム Expired - Fee Related JP5520687B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010114729A JP5520687B2 (ja) 2010-05-18 2010-05-18 動き推定装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010114729A JP5520687B2 (ja) 2010-05-18 2010-05-18 動き推定装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2011243008A JP2011243008A (ja) 2011-12-01
JP5520687B2 true JP5520687B2 (ja) 2014-06-11

Family

ID=45409586

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010114729A Expired - Fee Related JP5520687B2 (ja) 2010-05-18 2010-05-18 動き推定装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5520687B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810721A (zh) * 2013-12-30 2014-05-21 华中科技大学 单臂x射线血管造影图像多运动参数分解估计方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08186815A (ja) * 1994-12-28 1996-07-16 Pioneer Electron Corp サブバンド符号化方法

Also Published As

Publication number Publication date
JP2011243008A (ja) 2011-12-01

Similar Documents

Publication Publication Date Title
US8958484B2 (en) Enhanced image and video super-resolution processing
JP5727873B2 (ja) 動きベクトル検出装置、符号化装置、及びこれらのプログラム
US7881539B2 (en) Image processing apparatus and method, program recording medium, and program
CN102136144B (zh) 图像配准可靠性模型和超分辨率图像的重构方法
KR20140135968A (ko) 초해상도화를 수행하는 방법 및 장치
US8264600B2 (en) Image processing apparatus for converting a lower resolution image into a higher resolution image using cyclic coefficients
US8098962B2 (en) Signal processing method, apparatus, and program
JP2004526363A (ja) ビデオ符号化における中間画素高精度高速探索を実現する装置及び方法
EP3637363B1 (en) Image processing device, image processing method and image processing program
JP5717548B2 (ja) 超解像補助情報生成装置、符号化装置、復号装置、及びこれらのプログラム
JP2002539657A (ja) 符号化された画像を評価するための処理、装置及び、使用
JP5829898B2 (ja) 画像空間超解像装置及びプログラム
JP5331643B2 (ja) 動きベクトル検出装置及びプログラム
TW201322769A (zh) 運動向量改善裝置及其影像改善方法
JP6202725B2 (ja) 画像差分量算出装置、画像符号化装置及びプログラム
JP5520687B2 (ja) 動き推定装置及びプログラム
US8830394B2 (en) System, method, and apparatus for providing improved high definition video from upsampled standard definition video
JP5514132B2 (ja) 画像縮小装置、画像拡大装置、及びこれらのプログラム
US9064190B2 (en) Estimating pixel values in digital image processing
JP5498970B2 (ja) 画像縮小装置、画像拡大装置、及びこれらのプログラム
Lama et al. Image interpolation for high-resolution display based on the complex dual-tree wavelet transform and hidden Markov model
JP5894422B2 (ja) 時空間低相関画像超解像装置、画像空間超解像装置、及びそれらのプログラム
JP6817784B2 (ja) 超解像装置及びプログラム
JP5309097B2 (ja) 動き推定装置及びプログラム
US8805101B2 (en) Converting the frame rate of video streams

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140407

R150 Certificate of patent or registration of utility model

Ref document number: 5520687

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees