特許法第30条第2項適用 平成31年2月26日 https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=194749&item_no=1&page_id=13&block_id=8にて公開
本発明の実施形態について、図面を参照して詳細に説明する。
(第1実施形態)
図1は、画像処理装置1の構成例を示す図である。画像処理装置1は、動画像に対して所定の画像処理を実行する装置である。所定の画像処理とは、例えば、ビデオ・マグニフィケーションの画像処理である。画像処理装置1は、動画像に対してビデオ・マグニフィケーションの画像処理を実行することによって、被写体の微小な運動変化を強調又は減弱する。
画像処理装置1は、画像入力部2と、分解変換部3と、変化検出部4と、信頼度推定部5と、乗算部6と、変化量調整部7と、画像再構成部8とを備える。各機能部は、組み合わされて単体の機能部として設けられてもよいし、分割されて複数の機能部として設けられてもよい。
画像処理装置1の各機能部の一部又は全部は、CPU(Central Processing Unit)等のプロセッサが、不揮発性の記録媒体(非一時的な記録媒体)であるメモリに記憶されたプログラムを実行することにより、ソフトウェアとして実現される。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc Read Only Memory)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置などの非一時的な記憶媒体である。プログラムは、電気通信回線を介して送信されてもよい。画像処理装置1の各機能部の一部又は全部は、例えば、LSI(Large Scale Integration circuit)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)又はFPGA(Field Programmable Gate Array)等を用いた電子回路(electronic circuit又はcircuitry)を含むハードウェアを用いて実現されてもよい。
以下、動画像のフレームの輝度情報を表す画像を「輝度画像」という。以下、動画像のフレームの色情報を表す画像を「色画像」という。以下では、動画像のフレームには、水平方向のx座標と、垂直方向のy座標とが定められている。
画像入力部2は、画像処理の対象となる動画像の複数のフレームを入力とする。画像入力部2は、動画像の複数のフレームから、輝度画像と色画像とを生成する。画像入力部2は、画像処理の対象となる原解像度の輝度画像を、分解変換部3に出力する。画像入力部2は、画像処理の対象となる原解像度の色画像を、画像再構成部8に出力する。
分解変換部3(エッジ画像生成部)は、原解像度の輝度画像を入力とする。分解変換部3は、互いに異なる解像度のエッジ画像を、原解像度の輝度画像から生成する。エッジ画像は、画像処理対象の画像内における一定周波数以上の空間周波成分(高周波成分)を表す画像である。例えば、エッジ画像では、被写体画像の輪郭(エッジ)が抽出される。分解変換部3は、画像分解部30と、画像変換部31とを備える。
画像分解部30は、原解像度の輝度画像を入力とする。画像分解部30は、互いに異なる解像度の輝度画像(以下「多重解像度の輝度画像」という。)を、入力された原解像度の輝度画像から生成する。画像分解部30は、互いに異なる解像度のエッジ画像(以下「多重解像度のエッジ画像」という。)を、多重解像度の輝度画像から生成する。例えば、画像分解部30は、互いに異なる解像度のうちの所定解像度の輝度画像同士の差分画像を、多重解像度のエッジ画像として生成する。画像分解部30は、多重解像度のエッジ画像(解像度方向のエッジ画像)を、解像度ごとに画像変換部31に出力する。
以下では、数式において文字の上に付されている記号は、その文字の直前に記載される。例えば、数式において文字「C」の上に付されている記号「^」は、「^C」のように文字「C」の直前に記載される。例えば、数式において文字「t」の上に付されている記号「-」は、「(-)t」のように文字「t」の直前に記載される。例えば、数式において文字「C」の上に付されている記号「~」は、「~C」のように文字「C」の直前に記載される。
以下、画素においてエッジに直交している尤もらしい方向の時間的変動を「方向変化」という。方向変化「θ(x,y,t)」は、時刻「t」のエッジ画像内の座標(x,y)の画素ごとに定まる。エッジに直交している尤もらしい方向は、一定量以上の輝度成分によって表現されるエッジが存在するエッジ画像に対するリース変換等の出力として導出される。したがって、方向変化「θ(x,y,t)」は、リース変換の出力である尤もらしい方向θ(x,y)が時刻「t」の動画像のフレームに関して保持された時系列データである。画素にエッジが存在していない場合でも、尤もらしい方向はリース変換等の出力として導出される。以下、方向変化に沿った高周波成分の位相の時系列変化を「位相変化」という。
画像変換部31は、多重解像度のエッジ画像(解像度方向のエッジ画像)を入力とする。画像変換部31は、エッジ画像ごとに、時刻「t」のエッジ画像内の座標(x,y)の画素ごとに、方向変化「θ(x,y,t)」に沿って生じている輝度変化を、同じ方向変化「θ(x,y,t)」に沿った輝度情報の位相変化「Φ(x,y,t)」及び振幅変化「A(x,y,t)」に変換する。すなわち、動画像において、方向変化「θ(x,y,t)」と、位相の時系列変化「φ(x,y,t)」と、振幅変化「A(x,y,t)」とが導出される。
例えば、画像変換部31は、30枚のエッジ画像の時間幅「(-)t」内の時刻t(=15)について、エッジ画像内の座標(10,20)の画素における方向変化「θ(10,20,15)=18.3°」に沿って生じている輝度変化を、同じ方向変化「θ(10,20,15)=18.3°」に沿った輝度情報の位相変化「Φ(10,20,15)=0.4」に変換する。
なお、時系列のエッジ画像における輝度情報の位相変化は、時系列のエッジ画像における画像の運動変化を表す。
画像変換部31は、多重解像度のエッジ画像における、方向変化に沿った位相変化を表す情報(以下「位相変化情報」という。)と、方向変化を表す情報(以下「方向変化情報」という。)とを、動画像の時刻「t」のエッジ画像内の画素ごとに、変化検出部4に出力する。
変化検出部4は、多重解像度のエッジ画像の位相変化情報と方向変化情報とを入力とする。時刻「t」を中心とした時間幅「(-)t」(例えば、単位時間当たり)の各エッジ画像について、変化検出部4は、方向変化情報「θn(x,y,t)」を、信頼度推定部5に出力する。
時刻「t」を中心とした時間幅「(-)t」の各エッジ画像について、変化検出部4は、多重解像度のエッジ画像内の画素における、方向変化に沿った微小な位相変化を検出する。変化検出部4は、多重解像度のエッジ画像内の画素における、方向変化に沿った微小な位相変化を表す情報(以下「微小位相変化情報」という。)を、乗算部6に出力する。
信頼度推定部5は、時間幅「(-)t」の方向変化情報を入力とする。信頼度推定部5は、微小な位相変化「Cn(x,y,t)」の信頼度「maskSn」を、方向変化情報に基づいて推定する。ここで「n」は、n番目の解像度を表す。「n=0」番目の解像度は、最も高い解像度を表す。微小な位相変化の信頼度とは、ランダムノイズ以外の物理現象によって画像のピクセル値に生じた微小な位相変化であることの信頼度である。撮像素子の熱雑音等に起因して画像に混入したランダムノイズによって画像のピクセル値に生じた微小な位相変化の信頼度が、ランダムノイズ以外の物理現象によって画像のピクセル値に生じた微小な位相変化の信頼度よりも低くなるように、信頼度推定部5は信頼度を推定する。信頼度推定部5は、推定された信頼度「maskSn」を、乗算部6に出力する。
乗算部6は、微小位相変化情報と、信頼度とを入力とする。乗算部6は、微小位相変化情報(微小な位相変化を表す値)と、信頼度推定部5によって推定された信頼度とを、エッジ画像内の画素ごとに乗算し、乗算された結果を変化量調整部7に出力する。微小位相変化情報と信頼度とが乗算されることによって、微小位相変化情報と信頼度とが対応付けられるので、ランダムノイズ以外の物理現象によって画像のピクセル値に生じた微小な位相変化「^Cn(x,y,t)」が、高精度に検出される。
変化量調整部7は、乗算部6が出力した乗算結果(信頼度が乗算された位相変化)を入力とし、乗算結果に対して、ビデオ・マグニフィケーションを実行する。すなわち、変化量調整部7は、信頼度が乗算された微小な位相変化(運動変化)の変化量を、強調又は減弱によって調整する。調整によって、変化量調整部7は、微小な運動変化の変化量が調整された輝度画像のエッジ画像(以下「調整エッジ画像」という。)を生成する。変化量調整部7は、互いに異なる解像度の複数の調整エッジ画像を、画像再構成部8に出力する。
画像再構成部8(画像合成部)は、互いに異なる解像度の複数の調整エッジ画像を入力とし、画像を再構成する。画像再構成部8は、互いに異なる解像度の複数の調整エッジ画像を、変化量調整部7から取得する。画像再構成部8は、互いに異なる解像度の複数の調整エッジ画像を合成することによって、原解像度の輝度画像を再構成する。
画像再構成部8は、原解像度の色画像を、画像入力部2から取得する。画像再構成部8は、再構成された原解像度の輝度画像と、原解像度の色画像とを合成する。画像再構成部8は、合成後の画像を、ビデオ・マグニフィケーションを用いて最終的に調整された画像として、所定の外部装置に出力する。
次に、画像処理装置1の詳細を説明する。
画像入力部2は、画像処理の対象となる動画像の複数のフレームを入力とする。画像入力部2は、取得された複数のフレームから、原解像度の輝度画像「I(x,y,t)」と、原解像度の色画像とを生成する。「x」は、動画像のフレーム(輝度画像等)におけるx座標を表す。「y」は、動画像のフレーム(輝度画像等)におけるy座標を表す。「t」は、時系列の動画像のフレームの時刻を表す。画像入力部2は、原解像度の輝度画像「I(x,y,t)」を、画像分解部30に出力する。画像入力部2は、原解像度の色画像を、画像再構成部8に出力する。
画像分解部30は、動画像の複数のフレームの輝度画像を入力とする。画像分解部30は、原解像度の輝度画像「I(x,y,t)」を、式(1)のように0番目の解像度(最も高い解像度)の輝度画像「I0(x,y,t)」とする。
画像分解部30は、複数の解像度の輝度画像に対して、空間周波数の帯域を分割する処理(帯域分割処理)を実行する。すなわち、画像分解部30は、複数の解像度の輝度画像に対して、エッジ検出処理を実行する。エッジ検出処理によって、画像分解部30は、複数の解像度の輝度画像のエッジ画像(帯域分割画像)を生成する。
エッジ画像を生成する方法は、特定の方法に限定されない。例えば、画像分解部30は、微分フィルタ又はハイパスフィルタ等の帯域分割フィルタ(エッジフィルタ)を輝度画像に対して用いて、エッジ画像を生成する。例えば、画像分解部30は、輝度画像に対してウェーブレット変換(オクターブ分割)を実行することによって、エッジ画像を生成してもよい。以下では、画像分解部30は、エッジ画像の一例として差分画像を生成する。画像分解部30は、以下のようにダウンサンプリングとガウシアンフィルタとを用いて、差分画像「Ln(x,y,t)」を生成する。
図2は、差分画像の生成の例を示す図である。輝度画像301は、0番目の解像度(最も高い解像度)の輝度画像である。画像分解部30は、輝度画像301に対してダウンサンプリングを実行することによって、輝度画像302を生成する。画像分解部30は、輝度画像302に対してアップサンプリングを実行することによって、輝度画像303を生成する。画像分解部30は、0番目の解像度の輝度画像301及び輝度画像303の差分を導出することによって、0番目の解像度の差分画像304を生成する。
画像分解部30は、輝度画像302に対してダウンサンプリングを実行することによって、輝度画像305を生成する。画像分解部30は、輝度画像305に対してアップサンプリングを実行することによって、輝度画像306を生成する。画像分解部30は、0番目の解像度の輝度画像302及び輝度画像306の差分を導出することによって、1番目の解像度の差分画像307を生成する。このようにして、画像分解部30は、多重解像度の輝度画像に基づいて、多重解像度のエッジ画像を生成する。
すなわち、画像分解部30は、(n-1)番目の予め定められた解像度の輝度画像「In-1(x,y,t)」に対して、ダウンサンプリングを実行する。解像度の段階数は、3段階以上であり、例えば8段階である。画像分解部30は、解像度の段階数が8段階と定められている場合、原解像度の輝度画像に対して7回のダウンサンプリングを実行する。
画像分解部30は、ダウンサンプリングの結果に対して、ガウシアンフィルタ「Gσ(x,y)」を畳み込む。輝度画像の解像度の段階数は、ガウシアンフィルタのフィルタサイズに応じて定められる。すなわち、輝度画像に定められるブロックの最小サイズは、ガウシアンフィルタのフィルタサイズに応じて定められる。画像分解部30は、式(2)に示された演算を1番目からn番目までの解像度の輝度画像に対して繰り返すことによって、多重解像度の輝度画像(「I0(x,y,t)」,…,「In(x,y,t)」)を生成する。以下では、数式に示された演算子のうちで「〇」印の中に「×」印を含む演算子は、畳み込み演算子である。
式(2)の右辺は、「Gσ(x,y)」と「downsample(In-1(x,y,z))」との畳み込み演算を表す。「Gσ(x,y)」は、分散「σ2」の2次元のガウシアンフィルタを表す。「downsample(Z)」は、解像度「Z」の画像をダウンサンプル量に基づいて縮小する処理(ダウンサンプリング)を表す。ダウンサンプル量は、分数であり、例えば2分の1である。以下、「n」は、0以上N以下の整数である。「N」は、予め定められた2以上の整数である。このように、画像分解部30は、縮小する処理が実行された輝度画像に対して、所定の補間処理を実行してもよい。
画像分解部30は、「n+1」番目の解像度の輝度画像「In+1(x,y,t)」に対してアップサンプリングを実行する。これによって、画像分解部30は、「n+1」番目の解像度の輝度画像「In+1(x,y,t)」の解像度を、n番目の予め定められた解像度に揃える。すなわち、画像分解部30は、「n+1」番目の解像度の輝度画像「In+1(x,y,t)」を、「n(=n+1-1)」番目の解像度の輝度画像「upsample(In+1(x,y,t))」にする。「upsample(X)」は、解像度「X」の画像をn番目の解像度に合わせるように拡大する処理(アップサンプリング)を表す。
式(2)に示されたn番目の解像度の輝度画像「In(x,y,t)」と、n番目の解像度の輝度画像「upsample(In+1(x,y,t))」との差分画像「Ln(x,y,t)」(解像度方向の差分画像)は、式(3)のように表される。
画像処理装置1の各機能部は、n番目(0≦n<N)の解像度の差分画像「Ln(x,y,t)」に対して、所定の画像処理を実行する。
画像変換部31は、n番目の解像度の差分画像「Ln(x,y,t)」を入力とする。画像変換部31は、差分画像「Ln(x,y,t)」に含まれた処理領域(x,y)における方向変化に沿って生じている輝度変化を、同じ方向変化における輝度情報の位相変化及び振幅変化に変換する。
画像変換部31は、例えば、低い(粗い)解像度から高い(細かい)解像度の順に、差分画像における時間方向の位相変化を検出する。すなわち、画像変換部31は、低い解像度の差分画像において時間方向の位相変化を検出する処理を、高い解像度の差分画像において位相変化を検出する処理をよりも先に実行する。
方向変化に沿って生じている輝度変化を画像変換部31が位相変化及び振幅変化に変換する方法は、特定の方法に限定されない。以下では、画像変換部31は、一例としてリース変換によって、方向変化に沿って生じている輝度変化を、同じ方向変化に沿って生じている位相変化及び振幅変化に変換する。
画像変換部31は、n番目の解像度の差分画像「Ln(x,y,t)」に対して、例えば、フーリエ変換「fft」と逆フーリエ変換「ifft」とを実行する。すなわち、画像変換部31は、差分画像「Ln(x,y,t)」に対して式(4)から式(9)までのようにリース変換を実行する。
式(4)から式(6)までにおいて、式(7)から式(9)までの関係式が成立している。
ここで、「θn(x,y,t)」は、n番目の解像度の差分画像「Ln(x,y,t)」内の座標(x,y)の画素における方向変化を表す。「Φn(x,y,t)」は、方向変化「θn(x,y,t)」に沿って生じている位相変化を表す。「An(x,y,t)」は、方向変化「θn(x,y,t)」に沿って生じている振幅変化を表す。方向変化「θn(x,y,t)」に沿って生じている位相変化「Φn(x,y,t)」は、式(10)のように表される。画像変換部31は、方向変化「θn(x,y,t)」に沿って生じている位相変化「Φn(x,y,t)」の情報を、変化検出部4に出力する。
変化検出部4は、方向変化「θn(x,y,t)」に沿って生じている位相変化「Φn(x,y,t)」の情報を、入力とする。変化検出部4は、位相変化「Φn(x,y,t)」に、時系列フィルタ「H(t)」を畳み込む。これによって、変化検出部4は、位相変化「Φn(x,y,t)」の微小変化(subtle changes)を検出する。時系列フィルタ「H(t)」は、調整対象(強調又は減弱の対象)とされた方向変化に沿った位相変化(例えば、微小な位相変化)に対して周波数応答を持つ時系列フィルタであれば、特定のフィルタに限定されない。時系列フィルタ「H(t)」は、例えば、バンドパスフィルタ(非特許文献1参照)である。
変化検出部4は、方向変化に沿った位相変化(例えば、微小な位相変化)に対して、時空間フィルタ「J(x,y,t)」を乗算してもよい。乗算によって、変化検出部4は、n番目の解像度の差分画像「Ln(x,y,t)」における時間及び空間について急峻な位相変化(緩やかでない位相変化)を除去することができる。
時空間フィルタ「J(x,y,t)」は、急峻な位相変化を除去する時空間フィルタであれば、特定のフィルタに限定されない。時空間フィルタ「J(x,y,t)」は、例えば、躍度フィルタ(非特許文献2参照)である。例えば、変化検出部4は、微小な変化を三次微分して、微小ではない急峻な変化を検出及び正規化する。検出及び正規化の結果は、微小な変化が現れるときには0であり、急峻な変化が現れるときには1である。したがって、検出及び正規化の結果の逆は、微小な変化が現れるときには1であり、急峻な変化が現れるときには0である。変化検出部4は、検出及び正規化の結果の逆を、躍度フィルタとする。
変化検出部4は、三次微分と正規化と反転との順で、位相変化に対して演算を実行する。これによって、変化検出部4は、微小ではない急峻な位相変化のみを除去する躍度フィルタを生成することができる。変化検出部4は、元の位相変化に躍度フィルタを乗算する。
換言すれば、変化検出部4は、位相変化に対して、三次微分と正規化の演算とを実行する。これによって、変化検出部4は、微小な位相変化が差分画像に現れるときには、0の値を持つ演算結果を得る。変化検出部4は、急峻な位相変化が差分画像に現れるときには、1の値を持つ演算結果を得る。
変化検出部4は、演算結果を反転することによって、躍度フィルタを生成する。躍度フィルタは、微小な位相変化が差分画像に現れるときには、1の値のフィルタ応答を持つ。躍度フィルタは、急峻な位相変化が差分画像に現れるときには、0の値のフィルタ応答を持つ。変化検出部4は、元の位相変化に躍度フィルタ「J」を乗算する。微小な位相変化が差分画像に現れる場合、元の位相変化に1の値が乗算されるので、変化検出部4は、微小な位相変化のみを検出することができる。急峻な位相変化が差分画像に現れる場合、元の位相変化に0の値が乗算されるので、変化検出部4は、急峻な位相変化を抑制することができる。
緩やかで微小な位相変化「Cn(x,y,t)」は、式(11)のように表される。式(11)に示された演算子「〇」は、乗算(要素積)を表す。
ここで、式(11)に示された微小な位相変化「Cn(x,y,t)」は、意味のある位相の微小変化「^Cn(x,y,t)」と、意味のない微小な位相変化「~Cn (x,y,t)」とを、式(12)のように含む。ここで、意味のない微小な位相変化(運動変化)とは、撮像素子の熱雑音、手振れ、地面の振動等に起因して画像に混入したランダムノイズによって画像のピクセル値に生じた位相変化である。意味のある微小な位相変化(運動変化)とは、ランダムノイズ以外の物理現象(例えば、撮像素子への光の入射)によって画像のピクセル値に生じた位相変化である。
信頼度推定部5は、方向変化情報を入力とする。信頼度推定部5は、方向変化「θn(x,y,t)」に基づいて、微小な位相変化「Cn(x,y,t)」の信頼度を推定する。これによって、信頼度推定部5は、微小な位相変化「Cn(x,y,t)」における、意味のある位相の微小変化「^Cn(x,y,t)」と、意味のない微小な位相変化「~Cn(x,y,t)」とを切り分けることができる。
時刻tを含む時間幅「(-)t」において、意味のある微小な位相変化は、意味のない微小な位相変化と比較して、エッジ画像において限定された空間方向に生じる。このため、座標(x,y)の画素における時系列の方向変化「θn(x,y,(-)t)」の分散値は小さい。
そこで、信頼度推定部5は、時間幅「(-)t」における時系列の方向変化「θn(x,y,(-)t)」の分散値に基づいて、微小な位相変化の信頼度「maskn(x,y,t)」を、式(13)のように推定する。微小な位相変化の信頼度は、時系列の方向変化の分散値が小さいほど高い。
ここで、「Norm(X)」は、引数「X」の値を0から1までの範囲に正規化することを表す。正規化の方法は、特定の方法に限定されない。「Var(X)」は、時間幅「(-)t」における引数「X」の分散値を表す。「Gσ」は、Var(θn(x,y,(-)t))を空間的に平滑化する関数を表す。パラメータ「σ」は、空間的な平滑化の強さを表す。パラメータ「γ」は、信頼度を表す。
信頼度「maskn(x,y,t)」では、領域でない座標(x,y)における時系列の方向変化「θn(x,y,(-)t)」の分散値のみが考慮されている。このため、座標(x,y)の画素のピクセル値に瞬間的なノイズが混入した場合、分散値の推定精度が低下する可能性がある。そこで、信頼度推定部5は、座標(x,y)の画素を含む領域について、式(14)及び式(15)のように分散共分散行列を推定する。すなわち、信頼度推定部5は、座標(x,y)の画素を含む領域における方向変化「θ(x,y,t)」の振る舞いに基づいて、信頼度を推定する。
ここで、「(-)x」は、座標(x,y)の画素を含む領域を表す。「cov(X)」は、行列「X」の分散共分散行列「D」を生成する関数(次元を拡張する関数)を表す。「d」は、領域内の画素数(サンプル数)を表す。「w」は、領域の水平方向(x軸方向)の長さを表す。「h」は、領域の垂直方向(y軸方向)の長さを表す。
信頼度推定部5は、分散共分散行列「D」に対して、固有値分解を実行する。信頼度推定部5は、分散共分散行列「D」の固有値「λ1,…,λd」の平均「(-)λ」に基づいて、式(15)に示されたような座標(x,y)を含む領域における微小な位相変化の信頼度「maskSn(x,y,t)」を、式(16)のように推定する。信頼度「maskSn(x,y,t)」は、座標(x,y)を含む領域「S」における微小な位相変化の信頼度を、0から1までの範囲で表す。
乗算部6は、式(16)に示された信頼度「maskSn(x,y,t)」と、式(11)に示された「Cn(x,y,t)」とを、式(17)のように乗算する。
なお、乗算部6は、画素の座標(x,y)における微小な位相変化の信頼度「maskn(x,y,t)」と、式(11)に示された「Cn(x,y,t)」とを、乗算してもよい。
乗算によって、ランダムノイズ以外の物理現象によって画像内の画素のピクセル値に生じた微小な位相変化「^Cn(x,y,t)」が、高精度に検出される。乗算部6は、分散値が揃った微小な位相変化「^Cn(x,y,t)」を検出することができる。
変化量調整部7は、n番目の解像度の差分画像「Ln(x,y,t)」における緩やかで微小な位相変化「^Cn(x,y,t)」の情報を、意味のある位相変化として、乗算部6から取得する。変化量調整部7は、緩やかで微小な位相変化「^Cn(x,y,t)」に対して、所定の調整率(強調率)「α」を乗算する。すなわち、変化量調整部7は,式(17)のように高い精度で導出された微小な位相変化に、所定の調整率(強調率)αを、式(18)のように乗算する。変化量調整部7は、元の位相変化「Φn(x,y,t)」と乗算結果とを加算することによって、時系列のエッジ画像内の画素ごとに定まる方向変化において緩やかで微小な位相変化の変化量が調整された位相変化「^Φn(x,y,t)」を、式(18)のように導出する。
このようにして、変化量調整部7は、検出された微小な位相変化の変化量を調整する。なお、調整率は、解像度、方向、時刻又は位置ごとに同じでもよいし、異なっていてもよい。
微小な位相変化が強調される場合、所定の調整率「α」は正の値とされる。微小な位相変化が減弱される場合、所定の調整率「α」は負の値とされる。「α」の上限値及び下限値は、特に定められなくてもよいが、例えば、微小な位相変化が減弱される場合、元の位相変化「Φn(x,y,t)」の値が0となる場合における「α」の値が「α」の下限値とされる。なお、「α」が0に設定された場合には、位相変化は調整されない。
画像再構成部8は、変化量が調整された位相変化「^Φn(x,y,t)」に基づいて、緩やかで微小な運動変化の変化量が調整されたn番目の解像度の差分画像「^Ln(x,y,t)」を、式(19)のように生成する。すなわち、画像再構成部8は、n番目(0≦n≦N)の解像度の調整差分画像「^Ln(x,y,t)」を、変化量が調整された位相変化「^Φn(x,y,t)」と、振幅変化「An(x,y,t)」とに基づいて、式(19)のように生成する。
画像再構成部8は、色画像を画像入力部2から取得する。画像再構成部8は、式(3)及び式(19)に基づいて、式(20)に示された処理を解像度番号「n」に関して逐次的に実行する。画像再構成部8は、「n-1」番目の解像度の調整差分画像「^Ln-1(x,y,t)」と、n番目の解像度の輝度画像「^In(x,y,t)」とに基づいて、「n-1」番目の解像度の輝度画像「^In-1(x,y,t)」を、式(20)のように再構成する。
ここで、「upsample(X)」は、解像度「X」の画像をn番目の解像度に合わせるように拡大する処理(アップサンプリング)を表す。画像再構成部8は、式(20)に示された処理を「n」に関して逐次的に実行することによって、原解像度(0番目の解像度)の輝度画像を再構成する。画像再構成部8は、再構成された原解像度の輝度画像「^I0(x,y,t)」と、原解像度の色画像とを合成する。画像再構成部8は、合成結果を、ビデオ・マグニフィケーションを用いて最終的に調整された画像として、所定の外部装置に出力する。
所定の外部装置は、例えば、ビデオ・マグニフィケーション以外の画像処理を実行する装置、画像認識を実行する装置(以下「画像認識装置」という。)、又は、表示装置である。所定の外部装置が画像認識装置である場合、画像認識装置は、合成結果(ビデオ・マグニフィケーションを用いて最終的に調整された画像)を、画像認識のための特徴量として使用してもよい。
次に、画像処理装置1の動作例を説明する。
図3は、画像処理装置1の動作例を示すフローチャートである。画像入力部2は、動画像の複数のフレームから、輝度画像と色画像とを生成する(ステップS101)。画像入力部2は、原解像度の輝度画像を、分解変換部3に出力する(ステップS102)。画像入力部2は、原解像度の色画像を、画像再構成部8に出力する(ステップS103)。
画像分解部30は、多重解像度の輝度画像を、原解像度の輝度画像から生成する(ステップS104)。画像分解部30は、多重解像度のエッジ画像を、多重解像度の輝度画像から生成する(ステップS105)。
画像変換部31は、時刻tを含む時間幅のエッジ画像内の画素において方向変化に沿って生じている輝度変化を、同じ方向変化に沿って生じている位相変化及び振幅変化に変換する(ステップS106)。画像変換部31は、多重解像度のエッジ画像の位相変化情報と方向変化情報とを、エッジ画像内の画素ごとに変化検出部4に出力する(ステップS107)。
変化検出部4は、エッジ画像内の画素において方向変化に沿って生じている微小な位相変化を検出する(ステップS108)。変化検出部4は、微小位相変化情報を、乗算部6に出力する(ステップS109)。変化検出部4は、方向変化情報を信頼度推定部5に出力する(ステップS110)。
信頼度推定部5は、方向変化に沿って生じている微小な位相変化「Cn(x,y,t)」の信頼度「maskSn」を、時系列の方向変化の分散値に基づいて推定する(ステップS111)。乗算部6は、微小位相変化情報と、推定された信頼度とを乗算する(ステップS112)。変化量調整部7は、式(17)のように信頼度が乗算された微小な運動変化の変化量を、式(18)のように強調又は減弱によって調整する(ステップS113)。
画像再構成部8は、互いに異なる解像度の複数の調整エッジ画像に基づいて、原解像度の輝度画像を再構成する(ステップS114)。画像再構成部8は、再構成された原解像度の輝度画像と、原解像度の色画像とを合成する(ステップS115)。
画像変換部31は、画像処理装置1が処理を終了するか否かを、例えばユーザから得られた命令に基づいて判定する(ステップS116)。画像処理装置1が処理を続ける場合(ステップS116:NO)、画像処理装置1の各機能部は、ステップS106に処理を戻す。画像処理装置1が処理を終了する場合(ステップS116:YES)、画像処理装置1の各機能部は、処理を終了する。
次に、画像の運動変化(位相変化)の変化量が調整された結果の例を説明する。
図4は、動画像のフレームの例を示す図である。図4に示されたフレームには、切り株に斧が降り下ろされた動作(薪割りの動作)が撮像されている。切り株に斧が衝突した時刻以降の時系列のフレームでは、y軸方向に切り株が微小振動する。
図4に示されたフレームは、画素群320と、画素321とを含む。画素群320は、フレーム内の第1部分領域に撮像された切り株画像312において垂直方向(y軸方向)に並ぶ画素である。画素321は、フレーム内の第2部分領域に撮像された壁の画像に含まれている画素である。
動画像のフレームでは、壁の画像の画素321のピクセル値には、ランダムな空間方向の微小な位相変化が、ランダムノイズによって定常的に生じている。切り株に向けてy軸方向に斧が降り下ろされた場合、切り株と斧との衝突に起因して、切り株画像312の画素群320のピクセル値には、主にy軸方向の微小な位相変化が、切り株画像312の振動によって生じる。
図5、図6及び図7は、図8との比較用の画像である。横軸は時間を表す。縦軸は、図4に示された動画像のフレームにおける画素群320の各ピクセル値を表す。
図5は、元画像の画素群320のピクセル値の変化の例を示す図である。図5では、微小な運動変化の変化量が調整されていない。このため、切り株と斧とが衝突した時刻「t1」の前後において、画素群320の各ピクセル値(運動変化)の変化量が小さい。
図6は、加速度法に基づいて運動変化の変化量が調整された画素群320のピクセル値の例を示す図である。図6では、加速度法に基づいて運動変化の変化量が調整され、加速度に基づいてランダムノイズが拡大されている。このため、切り株と斧とが衝突した時刻「t1」以降(破線に囲まれた領域)において、ピクセル値(運動変化)の変化量が大きい。この場合、拡大(強調)されたランダムノイズによって、動画像の品質が低下する。
図7は、躍度法に基づいて運動変化の変化量が調整された画素群320のピクセル値の例を示す図である。図7では、躍度法に基づいて運動変化の変化量が拡大されている。このため、切り株と斧とが衝突した時刻「t1」以降において、ピクセル値(運動変化)の変化量が大きい。
図8は、単位時間当たりの方向変化の分散値に基づいて運動変化の変化量が調整された画素群320のピクセル値の例を示す図である。図8では、分散値に基づいて運動変化の変化量が拡大されている。このため、切り株と斧とが衝突した時刻「t1」以降において、ピクセル値(運動変化)の変化量が大きい。
図9は、運動変化の変化量が調整されていない元画像の画素321のピクセル値と、運動変化の変化量が調整された各画像の画素321のピクセル値との例を示す図である。横軸は、フレーム番号(時刻)を表す。縦軸は、ピクセル値を表す。
加速度又は躍度に基づいて調整された画像の画素321と、元画像の画素321のピクセル値との差は、分散値に基づいて調整された画像の画素321と、元画像の画素321のピクセル値との差よりも大きい。このように、分散値に基づいて調整された画像では、微小な位相変化の変化量が調整されても、ランダムノイズが拡大又は減弱されることが低減されている。このように、動画像に混入したランダムノイズが拡大又は減弱されることを、分散値に基づいて低減することが可能である。
以上のように、第1実施形態の画像処理装置1は、変化検出部4と、信頼度推定部5とを備える。変化検出部4は、分解変換部3が実行する処理を、分解変換部3の代わりに実行してもよい。変化検出部4は、画像処理対象の画像内の高周波成分を表すエッジ画像内の画素ごとに定まるエッジに直交している尤もらしい方向の時間的変動である方向変化と、方向変化(尤もらしい方向)に沿った高周波成分の位相の時間的変動である位相変化とを検出する。変化検出部4は、予め定められた変化量の微小な位相変化を検出してもよい。信頼度推定部5は、検出された位相変化がノイズに起因する変化ではないことを表す信頼度「maskSn」を、単位時間当たりの方向変化の分散値に基づいて推定する。信頼度推定部5は、信頼度「maskn」を、単位時間当たりの方向変化の分散値に基づいて推定してもよい。
これによって、動画像の微小な運動変化の変化量を画像処理装置が調整する場合に、動画像に混入したランダムノイズが調整されることを低減することが可能である。
第1実施形態の信頼度推定部5は、検出された位相変化を示す画素における、方向変化の分散値に基づいて、検出された位相変化の信頼度を推定してもよい。信頼度は、方向変化の分散値が小さいほど高い値となる。信頼度推定部5は、エッジ画像の画素を含む領域における位相変化に基づいて、画素ごとに信頼度を推定してもよい。
(第2実施形態)
第2実施形態では、色又は輝度の微小変化の変化量を画像処理装置が調整する場合に、動画像に混入したランダムノイズが調整されることを低減する点が、第1実施形態と相違する。第2実施形態では、第1実施形態との相違点を説明する。
図10は、画像処理装置1aの構成例(第1の組み合わせ)を示す図である。画像処理装置1aは、動画像に対して所定の画像処理を実行する装置である。所定の画像処理とは、例えば、ビデオ・マグニフィケーションの画像処理である。
画像処理装置1aは、画像入力部2aと、分解変換部3aと、変化検出部4aと、信頼度推定部5aと、乗算部6aと、変化量調整部7aと、画像再構成部8aとを備える。
第2実施形態では、画像処理装置1aは、第1の画像処理及び第2の画像処理を逐次実行する。すなわち、画像処理装置1aは、動画像に対して第1の画像処理を実行し、更に、動画像に対して第2の画像処理を実行する。第1の画像処理と第2の画像処理との実行順は、逆でもよい。
第1の画像処理では、画像処理装置1aの各機能部は、第1実施形態の画像処理装置1の各機能部と同様の処理を実行する。すなわち、画像処理装置1aは、動画像に対して第1の画像処理を実行することによって、被写体の微小な運動変化を強調又は減弱する。
画像処理装置1aは、動画像に対して第2の画像処理を実行することによって、被写体の特定の微小な色又は輝度変化を強調又は減弱する。第2の画像処理では、位相変化の調整率「α」は0である。例えば、画像処理装置1aは、動画像内の選択された画素値を強調又は減弱することによって、被写体の特定の微小な色又は輝度変化を強調又は減弱する。ここで、選択された画素値とは、予め処理対象として選択される色又は輝度の画素値であって、例えばRの画素値、Gの画素値、Bの画素値、Yの画素値、Eの画素値、Qの画素値のいずれかの画素値である。Y、E、Qの画素値は、RGBから変換された明度を表す値である。
次に、色もしくは輝度の微小変化を強調又は減弱する処理について説明する。
図11は、被写体の特定の微小な色又は輝度変化を強調又は減弱する各機能部の構成例を示す図である。図10に示された分解変換部3aは、画像分解部30aを備える。画像処理装置1aは、画像入力部2aと、画像分解部30aと、変化検出部4aと、信頼度推定部5aと、乗算部6aと、変化量調整部7aと、画像再構成部8aとを、被写体の特定の微小な色又は輝度変化を強調又は減弱する各機能部として備える。
画像入力部2aは、画像処理の対象となる動画像の複数のフレームと、処理対象として選択された色又は輝度の情報を入力とする。又は、画像入力部2aは、動画像のフレームを任意の輝度空間もしくは色空間に変換した後の色画像又は輝度画像を入力とする。画像入力部2aは、画像処理の対象となる原解像度の色画像又は輝度画像と、選択された色又は輝度の情報とを画像分解部30aに出力する。以下の説明では、原解像度の色画像が入力された場合を例に説明する。なお、色画像の代わりに輝度画像が入力された場合も処理は、色画像が入力された場合と同様である。
画像分解部30aは、画像処理の対象となる原解像度の色画像と、選択された色の情報とを入力とする。画像分解部30aは、入力した動画像の時刻tの原解像度の色画像のうち、選択された選択された色の情報を、互いに異なる解像度に分解する。具体的には、画像分解部30aは、入力した原解像度の色画像のうち、選択された選択された色の情報に対してガウシアンフィルタを畳み込んでからダウンサンプリングする処理を複数回繰り返すことで、入力された原解像度の色画像を複数の解像度に分解する。ダウンサンプリングとは、ダウンサンプル量に基づいて解像度を縮小する処理である。ダウンサンプリング量は、1より小さい(例1/2)値である。画像分解部30aは、互いに異なる解像度の色画像を、変化検出部4に出力する。
図12は、動画像のフレーム内の画素の例を示す図である。以下では、動画像のフレームには、水平方向のx座標と、垂直方向のy座標とが定められている。図12に示されたフレームには、3個の電球が点灯されている様子が撮像されている。図12に示されたフレームは、画素410と、画素411と、電球画像412とを含む。画素410は、フレームの第3部分領域に撮像された背景の画像に含まれている画素である。画素411は、フレームの第4部分領域に撮像された電球画像412に含まれている画素である。
図13は、微小な色又は輝度変化の等方性拡散を示す図である。図13において、縦軸はフレーム内のある画素x1の色又は輝度の変化を表し、横軸はフレーム内のある画素x2の色又は輝度の変化を表す。図13に示された微小な色又は輝度の変化は、色画像又は輝度画像の時系列の微小な色又は輝度の変化である。意味のない微小な色又は輝度の変化は、図13に示された例のように、等方性拡散となる。
図14は、微小な色又は輝度変化の異方性拡散を示す図である。図14において、縦軸はフレーム内のある画素x1の色又は輝度の変化を表し、横軸はフレーム内のある画素x2の色又は輝度の変化を表す。図14に示された微小な色又は輝度の変化は、色画像又は輝度画像の時系列の微小な色又は輝度の変化である。意味のある微小な色又は輝度の変化は異方性拡散となる。意味のある微小な色又は輝度変化の変化量は、特定の方向に時間分布が偏るように変化する。
図11に戻り、画像処理装置1aの構成例の説明を続ける。変化検出部4aは、画像分解部30aから出力された各解像度の色画像を入力とする。変化検出部4aは、入力した各解像度の色画像に基づいて、各解像度の色画像における色の微小変化を検出する。変化検出部4aは、検出した色画像又は輝度画像における色又は輝度の微小な変化を表す情報(以下「色又は輝度変化情報」という。)を、解像度毎に信頼度推定部5a及び乗算部6aに出力する。
信頼度推定部5aは、色又は輝度変化情報を入力とする。信頼度推定部5aは、入力した色又は輝度変化情報に基づいて、微小な色又は輝度変化「Bn(x,y,t)」の信頼度を推定する。微小な色又は輝度変化の信頼度とは、ランダムノイズ以外の物理現象によって画像のピクセル値に生じた微小な色又は輝度変化であることの信頼度である。信頼度推定部5aは、撮像素子の熱雑音等に起因して画像に混入したランダムノイズによって画像のピクセル値に生じた微小な色又は輝度変化の信頼度が、ランダムノイズ以外の物理現象によって画像のピクセル値に生じた微小な色又は輝度変化の信頼度よりも低くなるように、信頼度を推定する。信頼度推定部5aは、推定した信頼度を、乗算部6aに出力する。信頼度推定部5aは、推定した信頼度を、乗算部6aに出力する。信頼度推定部5aが推定する信頼度は、微小な色又は輝度変化の時間分布が異方性を示すほど高い値となる。言い換えると、信頼度は、拡散結果が異方性を示すほど高い値となる。
乗算部6aは、色又は輝度変化情報と、信頼度とを入力とする。乗算部6aは、入力した色又は輝度変化情報と、信頼度とを、画素ごとに乗算し、乗算した結果(乗算結果)を変化量調整部7aに出力する。乗算部6aが色又は輝度変化情報と、信頼度とを乗算することによって、ランダムノイズ以外の物理現象によって画像のピクセル値に生じた微小な色又は輝度変化「^Cn(x,y,t,θ)」が、高精度に検出される。
変化量調整部7aは、乗算部6aが出力した乗算結果(信頼度が乗算された色又は輝度変化)を入力とする。変化量調整部7aは、入力した乗算部6aによる乗算結果に対して、ビデオ・マグニフィケーションを実行する。すなわち、変化量調整部7aは、信頼度が乗算された微小な色又は輝度変化の変化量を、強調又は減弱によって調整する。これによって、変化量調整部7aは、微小な色又は輝度変化の変化量が調整された画像(以下「調整画像」という。)を解像度毎に生成する。変化量調整部7aは、互いに異なる解像度の複数の調整画像を、画像再構成部8に出力する。
画像再構成部8a(画像合成部)は、互いに異なる解像度の複数の調整画像を入力とする。画像再構成部8a(画像合成部)は、入力した調整画像に基づいて画像を再構成する。具体的には、画像再構成部8aは、互いに異なる解像度の複数の調整画像のサイズを同様のサイズに調整し、足し合わせることで微小な色又は輝度変化が強調された画像を再構成する。なお、画像再構成部8aは、色空間や輝度空間への変換を行っていた場合、それらの逆変換を行うことで最終的な映像出力を得る。画像再構成部8aは、合成後の画像を、ビデオ・マグニフィケーションを用いて最終的に調整された画像として、所定の外部装置に出力する。
所定の外部装置は、例えば、ビデオ・マグニフィケーション以外の画像処理を実行する装置、画像認識装置、又は、表示装置である。所定の外部装置が画像認識装置である場合、画像認識装置は、合成結果(ビデオ・マグニフィケーションを用いて最終的に調整された画像)を、画像認識のための特徴量として使用してもよい。
次に、画像処理装置1aの詳細を説明する。画像入力部2aは、画像処理の対象となる動画像の複数のフレームと、処理対象として選択された色又は輝度の情報とを取得する。画像入力部2aは、画像処理の対象となる原解像度の色画像又は輝度画像と、選択された色又は輝度の情報とを画像分解部30aに出力する。
画像分解部30aは、入力した動画像の時刻tの原解像度の色画像のうち、選択された選択された色の情報の色画像を、互いに異なる解像度に分解する。画像分解部30aは、互いに異なる解像度の色画像を変化検出部4aに出力する。
変化検出部4aは、各解像度の色画像における色画像における色の微小変化を検出する。なお、変化検出部4aは、各解像度の輝度画像が入力された場合には、各解像度の輝度画像における輝度の微小変化を検出する。変化検出部4aは、画像分解部30aにおいて求められる各解像度の映像における色又は輝度変化「In(x,y,t))」に対して、強調したい微小変化の周波数応答を持つ時系列フィルタ「H(t)」を畳み込んだり、大きい変化を除去するための時空間フィルタ「J(x,y,t)」を乗算することで、微小な色又は輝度変化「Bn(x,y,t)」を以下の式(21)のように検出する。なお、変化検出部4aは、時空間フィルタ「J(x,y,t)」を乗算しなくてもよい。すなわち、変化検出部4aは、微小な色又は輝度変化「Bn(x,y,t)」を検出する際に、時空間フィルタ「J(x,y,t)」を用いなくてもよい。
式(21)において、演算子のうちで「〇」印の中に「×」印を含む演算子は、畳み込み演算子を表しており,演算子「〇」は、乗算(要素積)を表す。なお、H(t)はバンドパスフィルタを表し、「J(x,y,t)」は急峻な変化のみを除去することを目的とした躍度フィルタといったものが代表的な例として挙げられる。変化検出部4aが用いるフィルタは、これらに限定されない。
変化検出部4aによって求められた微小な色又は輝度変化「Bn(x,y,t)」は自然現象や物理現象によって生じる「意味のある」微小な色又は輝度変化と、撮像素子の熱雑音等に起因して画像に混入したランダムノイズのように撮像過程で混入するノイズ由来の「意味のない」微小な色又は輝度変化が以下の式(22)のように共存している。撮像過程で混入するノイズは、例えば熱雑音、手振れ、地面の振動等である。
式(22)の、「^Bn(x,y,t)」は「意味のある」微小な色又は輝度変化を表し、「~Bn(x,y,t)」は「意味のない」微小な色又は輝度変化を表している。
信頼度推定部5aは、変化検出部a4によって求められる微小な色又は輝度変化「Bn(x,y,t)」を利用して、微小な色又は輝度変化「Bn(x,y,t)」の信頼度を推定する。具体的には、信頼度推定部5aは、変化検出部4によって求められる微小な色又は輝度変化「Bn(x,y,t)」の時間的な振る舞い(時間分布)を評価することで微小な色又は輝度変化の信頼度を推定する。変化検出部4aから出力される微小な色又は輝度変化「Bn(x,y,t)」に対して、ある場所(x,y)を中心とした映像領域(-)x∈R(h×w)=Rdとある時間tを中心とした時間幅「(-)t」を考えると、微小な色又は輝度変化「Bn((-)x,(-)t)」に関する拡散方程式は以下の式(23)のように定式化することができる。
式(23)において「f(Bn((-)x,(-)t))」は微小な色又は輝度変化の時間分布を表しており、「D」は時間幅「(-)t」における拡散テンソル行列を表す。上記式(23)から、拡散テンソル行列は以下の式(24)のように得ることができる。
式(24)において、「cov(X)」はX行列の分散共分散行列を計算することを意味する。その後、信頼度推定部5aは、「D」に対して固有値分解を行い、微小な色又は輝度変化の時間分布に関する特徴量であるFractional Anisotropy(以下「FA」という。)を以下の式(25)から得る。
式5において、(λ1,…,λd)は「D」の固有値であり、「(-)λ」はその平均であり、「d」は処理対象となる画素の数を表す。ここで、処理対象となる画素の数「d」は、調整を行いたい画素の数である。「FA」は、時間分布が異方性を示す際には「1」を、時間分布が等方性を示す場合に「0」を取る特徴量である。自然現象や物理現象によって生じる「意味のある」微小な色又は輝度変化はある特定の方向に時間分布が偏っており、異方性が高い。そのため、「意味のある」微小な色又は輝度変化はFA値が「1」に近い値を示す。一方で、撮像過程で混入するノイズ由来の「意味のない」微小な色又は輝度変化はランダムな方向に時間分布が拡散しており異方性が低く、等方性が高い。そのため、「意味のない」微小な色又は輝度変化はFA値が「0」に近い値を示す。したがって、信頼度推定部5aは、FAを用いて、微小な色又は輝度変化の信頼度を以下の式(26)に基づいて推定する。
式(26)において、「FAFσ,γ
n(x,y,t)」は微小な色又は輝度変化の信頼度を表す時空間フィルタであり、「Gσ」は「FAFσ,γ
n(x,y,t)」を空間的に平滑化する関数であり、パラメータ「σ」は平滑化の強さを表すパラメータである。また、「Norm(X)」は、引数「X」の値を0から1までの範囲に正規化することを表す。なお、パラメータ「Gσ」の空間平滑化の方法や、正規化の方法は、特定の方法に限定されない。信頼度「FAFσ,γ
n(x,y,t)」は、座標(x,y)を含む領域における微小な色又は輝度変化の信頼度を、0から1までの範囲で表す。微小な色又は輝度変化の信頼度は、値が大きくなるほど信頼度は高い。
乗算部6aは、色又は輝度変化情報と、信頼度推定部5aによって推定された信頼度とを、画素ごとに乗算する。より具体的には、乗算部6aは、式(26)に示された信頼度「FAFσ,γ
n(x,y,t)」と、式(21)に示された「Bn(x,y,t)」とを以下の式(27)のように乗算する。
式(27)によって、ランダムノイズ以外の物理現象によって画像のピクセル値に生じた微小な色又は輝度変化「^Bn(x,y,t)」が、高精度に検出される。
変化量調整部7aは、式(27)によって求められた微小な色又は輝度変化「^Bn(x,y,t)」に対して、色又は輝度の調整率(強調率)「α」を乗算する。すなわち、変化量調整部7aは、式(27)のように高い精度で導出された微小な色又は輝度変化「^Bn(x,y,t)」に、色又は輝度の調整率(強調率)「α」を、以下の式(28)のように乗算する。変化量調整部7aは、元の色又は輝度の変化元の色又は輝度の変化「In(x,y,t)」と乗算結果とを加算することによって、緩やかで微小な色又は輝度の変化の変化量が調整(例えば、強調又は減弱)された色又は輝度の変化「^In(x,y,t)」を式(28)のように導出する。
このようにして、変化量調整部7aは、検出された微小な色又は輝度の変化の変化量を調整する。なお、調整率は、解像度、方向、時刻又は位置ごとに同じでもよいし、異なっていてもよい。
微小な色又は輝度が強調される場合、所定の調整率「α」は、0より大きい正の値とされる。微小な色又は輝度が減弱される場合、所定の調整率「α」は、0より小さい負の値とされる。「α」の上限値及び下限値は、特に定められなくてもよいが、例えば、微小な色又は輝度が減弱される場合、元の微小な色又は輝度変化「In(x,y,t)」の値が0となる場合における所定の調整率「α」の値が「α」の下限値とされる。なお、「α」が0に設定された場合には、微小な色又は輝度変化は調整されない。
画像再構成部8a(画像合成部)は、画像を再構成する。画像再構成部8aは、解像度毎に式(28)を求め、アップサンプリングを行いながら解像度方向に足し合わせることによって、「意味のある」微小な色又は輝度変化のみが強調された色又は輝度情報に変換して、原解像度の画像を再構成する。画像再構成部8aは、もし色空間や輝度空間への変換を行っていた場合、それらの逆変換を行うことで最終的な映像出力を得ることができる。
画像再構成部8aは、色又は輝度変化が強調された原解像度の画像と、再構成された原解像度の輝度画像とを合成する。例えば、画像再構成部8aは、色又は輝度変化が強調された原解像度の画像と、再構成された原解像度の輝度画像との平均画像を生成する。
次に、画像処理装置1aの動作例を説明する。
図15は、画像処理装置1aの動作例を示すフローチャートである。なお、図15では、画像入力部2aに画像処理の対象となる原解像度の色画像と、選択された色の情報とを入力する場合を例に説明する。画像入力部2aに画像処理の対象となる原解像度の輝度画像と、選択された輝度の情報とを入力する場合には、図15における処理において、原解像度の色画像を原解像度の輝度画像、色の情報を輝度の情報と読み替えればよい。
画像入力部2aは、画像処理の対象となる原解像度の色画像と、選択された色の情報とを入力する(ステップS201)。画像入力部2aは、原解像度の色画像と、選択された色の情報とを画像分解部30aに出力する。分解変換部3は、入力した動画像の時刻tの原解像度の色画像のうち、選択された選択された色の情報の色画像を、互いに異なる解像度に分解する(ステップS202)。画像分解部30aは、各解像度の色画像を変化検出部4aに出力する。
変化検出部4aは、画像分解部30aから出力された色画像に基づいて、各解像度の色画像における色の微小変化を検出する(ステップS203)。変化検出部4aは、各解像度の検出した色の微小変化を色又は輝度変化情報として信頼度推定部5a及び乗算部6aに出力する。
信頼度推定部5aは、変化検出部4から出力された色又は輝度変化情報に基づいて、微小な色又は輝度変化「Bn(x,y,t)」の信頼度「FAFσ,γ
n(x,y,t)」を推定する(ステップS204)。信頼度推定部5aは、推定した信頼度「FAFσ,γ
n(x,y,t)」を乗算部6aに出力する。
乗算部6aは、変化検出部4aから出力された色又は輝度変化情報と、信頼度推定部5aから出力された信頼度「FAFσ,γ
n(x,y,t)」とを乗算する(ステップS205)。乗算部6aは、乗算結果を変化量調整部7に出力する。変化量調整部7aは、乗算部6aから出力された乗算結果を用いて、信頼度が乗算された微小な色又は輝度の変化の変化量を強調又は減弱によって調整する(ステップS206)。変化量調整部7aは、微小な色又は輝度の変化の変化量の情報を画像再構成部8aに出力する。画像再構成部8は、互いに異なる解像度の複数の調整画像に基づいて、原解像度の色画像を再構成する(ステップS207)。
画像分解部30aは、画像処理装置1aが処理を終了するか否かを、例えばユーザから得られた命令に基づいて判定する(ステップS208)。画像処理装置1aが処理を続ける場合(ステップS208:NO)、画像処理装置1aの各機能部は、ステップS202に処理を戻す。画像処理装置1aが処理を終了する場合(ステップS208:YES)、画像処理装置1aの各機能部は、処理を終了する。
以上のように、第2実施形態の画像処理装置1aは、変化検出部4aと、信頼度推定部5aとを備える。変化検出部4aは、複数の解像度の色又は輝度画像における色又は輝度の変化のうち、予め定められた色又は輝度変化を検出する。信頼度推定部5aは、色又は輝度画像内における時系列の色又は輝度変化に基づいて、検出された色又は輝度変化の信頼度「FAFσ,γ
n(x,y,t)」を推定する。
これによって、画像処理装置1aは、検出した映像内の微小変化のうち「意味のある」微小な色又は輝度変化をより精度よく検出することができる。したがって、「意味のある」微小な色又は輝度変化の変化量を調整することができる。そのため、動画像の微小な色又は輝度変化の変化量を調整する場合に、動画像に混入したランダムノイズが調整されることを低減することが可能である。
(第3実施形態)
第3実施形態では、位相変化(運動変化)の変化量を画像処理装置が調整する処理と、色又は輝度の微小変化の変化量を画像処理装置が調整する処理とが並列に実行される点が、第2実施形態と相違する。第3実施形態では、第2実施形態との相違点を説明する。
図16は、画像処理装置1bの構成例(第2の組み合わせ)を示す図である。画像処理装置1bは、動画像に対して所定の画像処理を実行する装置である。所定の画像処理とは、例えば、ビデオ・マグニフィケーションの画像処理である。
画像処理装置1bは、画像入力部2bと、分解変換部3と、変化検出部4と、信頼度推定部5と、乗算部6と、変化量調整部7と、画像再構成部8bとを備える。画像処理装置1bは、画像分解部30bと、変化検出部4bと、信頼度推定部5bと、乗算部6bと、変化量調整部7bとを、更に備える。
第3実施形態では、画像処理装置1bは、第1の画像処理及び第2の画像処理を並列に実行する。画像処理装置1bは、動画像に対して第1の画像処理を実行することによって、被写体の微小な運動変化を強調又は減弱する。第1の画像処理では、画像入力部2bと分解変換部3と変化検出部4と信頼度推定部5と乗算部6と変化量調整部7と画像再構成部8bとは、第1実施形態の画像処理装置1の各機能部と同様の処理を実行する。
画像処理装置1bは、動画像に対して第2の画像処理を実行することによって、被写体の特定の微小な色又は輝度変化を強調又は減弱する。第2の画像処理では、画像入力部2bと画像分解部30bと変化検出部4bと信頼度推定部5bと乗算部6bと変化量調整部7bと画像再構成部8bとは、第2実施形態の画像入力部2aと画像分解部30aと変化検出部4aと信頼度推定部5aと乗算部6aと変化量調整部7aと画像再構成部8aと同様の処理を実行する。
画像再構成部8bは、互いに異なる解像度の複数の調整エッジ画像を、変化量調整部7から取得する。画像再構成部8は、互いに異なる解像度の複数の調整エッジ画像を合成することによって、原解像度の輝度画像を再構成する。画像再構成部8bは、原解像度の色画像を、画像入力部2から取得してもよい。画像再構成部8bは、再構成された原解像度の輝度画像と、原解像度の色画像とを合成してもよい。
画像再構成部8bは、色又は輝度変化が強調された原解像度の画像を、変化量調整部7bから取得する。画像再構成部8bは、色又は輝度変化が強調された原解像度の画像と、再構成された原解像度の輝度画像とを合成する。例えば、画像再構成部8bは、色又は輝度変化が強調された原解像度の画像と、再構成された原解像度の輝度画像との平均画像を生成する。
なお、第3実施形態の画像処理装置1bは、第2実施形態のように、第1の画像処理及び第2の画像処理を逐次実行してもよい。すなわち、画像処理装置1bは、動画像に対して第1の画像処理を実行し、更に、動画像に対して第2の画像処理を実行してもよい。第1の画像処理と第2の画像処理との実行順は、逆でもよい。
以上のように、第3実施形態の画像処理装置1bは、変化検出部4bと、信頼度推定部5bとを備える。変化検出部4bは、複数の解像度の色又は輝度画像における色又は輝度の変化のうち、予め定められた色又は輝度変化を検出する。信頼度推定部5bは、色又は輝度画像内における時系列の色又は輝度変化に基づいて、検出された色又は輝度変化の信頼度「FAFσ,γ
n(x,y,t)」を推定する。
これによって、画像処理装置1bは、検出した映像内の微小変化のうち「意味のある」微小な色又は輝度変化をより精度よく検出することができる。したがって、「意味のある」微小な色又は輝度変化の変化量を調整することができる。そのため、動画像の微小な色又は輝度変化の変化量を調整する場合に、動画像に混入したランダムノイズが調整されることを低減することが可能である。
(第4実施形態)
第4実施形態では、位相変化の変化量を調整する処理を、エッジ画像の部分領域に対して画像処理装置が実行する点が、第1実施形態から第3実施形態までと相違する。第4実施形態では、第1実施形態から第3実施形態までとの相違点を説明する。
図17は、画像処理装置1cの構成例を示す図である。画像処理装置1cは、動画像に対して所定の画像処理を実行する装置である。所定の画像処理とは、例えば、ビデオ・マグニフィケーションの処理である。
画像処理装置1cは、画像入力部2cと、分解変換部3cと、画像調整部100と、画像再構成部8cとを備える。分解変換部3cは、画像分解部30cと、画像変換部31cとを備える。分解変換部3cが画像変換部31cを備える代わりに、画像調整部100が分解変換部3cを備えてもよい。これらの機能部は、単体の装置、例えば制御装置として設けられてもよい。
画像入力部2cは、画像処理の対象となる動画像の複数のフレームを取得する。画像入力部2cは、動画像の複数のフレームから、輝度画像と色画像とを生成する。画像入力部2cは、原解像度の輝度画像を、画像分解部30cに出力する。画像入力部2cは、原解像度の色画像を、画像再構成部8cに出力する。
画像分解部30cは、互いに異なる解像度のエッジ画像を生成する。例えば、画像分解部30c(差分画像生成部)は、互いに異なる解像度のうちの所定の解像度の輝度画像同士の差分に基づく画像(以下「多重解像度の差分画像」という。)を、互いに異なる解像度のエッジ画像として生成する。画像分解部30cは、原解像度の輝度画像を、画像入力部2cから取得する。画像分解部30cは、互いに異なる解像度の輝度画像(多重解像度の輝度画像)を、原解像度の輝度画像から生成する。画像分解部30cは、多重解像度の差分画像を生成する。画像分解部30cは、多重解像度の差分画像(解像度方向の差分画像)を、解像度ごとに画像調整部100に出力する。
画像調整部100は、画像処理の対象となる動画像の微小な運動変化等の変化量を強調又は減弱によって調整する。画像調整部100は、多重解像度の差分画像を、画像分解部30cから取得する。画像調整部100は、多重解像度の差分画像に対して、ビデオ・マグニフィケーションを実行する。画像調整部100は、ビデオ・マグニフィケーションを実行することによって、動画像のフレームにおける微小な運動変化の変化量が強調又は減弱によって調整された輝度画像同士の差分画像(以下「調整差分画像」という。)を生成する。画像調整部100は、互いに異なる解像度の複数の調整差分画像を、画像再構成部8cに出力する。
画像調整部100は、変化検出部4cと、信頼度推定部5cと、乗算部6cと、変化量調整部7cと、調整画像生成部9cと、領域決定部10cとを備える。画像調整部100は、画像変換部31cを備えてもよい。
画像再構成部8c(画像合成部)は、画像を再構成する。画像再構成部8cは、互いに異なる解像度の複数の調整差分画像を、画像調整部100から取得する。画像再構成部8cは、互いに異なる解像度の複数の調整差分画像に基づいて、原解像度の輝度画像を再構成する。画像再構成部8cは、原解像度の色画像を、画像入力部2cから取得する。画像再構成部8cは、再構成された原解像度の輝度画像と、原解像度の色画像とを合成する。画像再構成部8cは、合成結果を、ビデオ・マグニフィケーションを用いて最終的に調整された画像として、所定の外部装置に出力する。
次に、画像処理装置1cの詳細を説明する。
画像入力部2cは、画像処理の対象となる動画像の複数のフレームを取得する。画像入力部2cは、取得された複数のフレームから、原解像度の輝度画像「I(x,y,t)」と、原解像度の色画像とを生成する。「x」は、動画像のフレーム(輝度画像等)におけるx座標を表す。「y」は、動画像のフレーム(輝度画像等)におけるy座標を表す。「t」は、時系列の動画像のフレームの時刻を表す。画像入力部2cは、原解像度の輝度画像「I(x,y,t)」を、画像分解部30cに出力する。画像入力部2cは、原解像度の色画像を、画像再構成部8cに出力する。
画像分解部30cは、動画像の複数のフレームの輝度画像を、画像入力部2cから取得する。画像分解部30cは、原解像度の輝度画像「I(x,y,t)」を、式(1)のように0番目の解像度(最も高い解像度)の輝度画像「I0(x,y,t)」とする。
画像分解部30cは、複数の解像度の輝度画像に対して、空間周波数の帯域を分割する処理(帯域分割処理)を実行する。すなわち、画像分解部30cは、複数の解像度の輝度画像に対して、エッジ検出処理を実行する。これによって、画像分解部30cは、複数の解像度の輝度画像のエッジ画像(帯域分割画像)を生成する。エッジ画像を生成する方法は、特定の方法に限定されない。例えば、画像分解部30cは、微分フィルタ又はハイパスフィルタ等の帯域分割フィルタ(エッジフィルタ)を輝度画像に対して用いて、エッジ画像を生成する。例えば、画像分解部30cは、輝度画像に対してウェーブレット変換(オクターブ分割)を実行することによって、エッジ画像を生成してもよい。以下では、画像分解部30cは、エッジ画像の一例として差分画像を生成する。画像分解部30cは、以下のようにダウンサンプリングとガウシアンフィルタとを用いて、差分画像「Ln(x,y,t)」を生成する。
画像分解部30cは、(n-1)番目の予め定められた解像度の輝度画像「In-1(x,y,t)」に対して、ダウンサンプリングを実行する。解像度の段階数は、3段階以上であり、例えば8段階である。画像分解部30cは、解像度の段階数が8段階と定められている場合、原解像度の輝度画像に対して7回のダウンサンプリングを実行する。
画像分解部30cは、ダウンサンプリングの結果に対して、ガウシアンフィルタ「Gσ(x,y)」を畳み込む。輝度画像の解像度の段階数は、ガウシアンフィルタのフィルタサイズに応じて定められる。すなわち、輝度画像に定められるブロックの最小サイズは、ガウシアンフィルタのフィルタサイズに応じて定められる。画像分解部30cは、式(2)に示された演算を1番目からn番目までの解像度の輝度画像に対して繰り返すことによって、多重解像度の輝度画像(「I0(x,y,t)」,…,「In(x,y,t)」)を生成する。
式(2)の右辺は、「Gσ(x,y)」と「downsample(In-1(x,y,z))」との畳み込み演算を表す。画像分解部30cは、縮小する処理が実行された輝度画像に対して、所定の補間処理を実行してもよい。「Gσ(x,y)」は、分散「σ2」の2次元のガウシアンフィルタを表す。「downsample(Z)」は、解像度「Z」の画像をダウンサンプル量に基づいて縮小する処理(ダウンサンプリング)を表す。ダウンサンプル量は、分数であり、例えば2分の1である。以下、「n」は、0以上N以下の整数である。「N」は、予め定められた2以上の整数である。
画像分解部30cは、(n+1)番目の解像度の輝度画像「In+1(x,y,t)」に対してアップサンプリングを実行する。これによって、画像分解部30cは、(n+1)番目の解像度の輝度画像「In+1(x,y,t)」の解像度を、n番目の予め定められた解像度に揃える。すなわち、画像分解部30cは、(n+1)番目の解像度の輝度画像「In+1(x,y,t)」を、(n(=n+1-1))番目の解像度の輝度画像「upsample(In+1(x,y,t))」にする。「upsample(X)」は、解像度「X」の画像を拡大する処理(アップサンプリング)を表す。
式(2)に示されたn番目の解像度の輝度画像「In(x,y,t)」と、n番目の解像度の輝度画像「upsample(In+1(x,y,t))」との差分画像「Ln(x,y,t)」(解像度方向の差分画像)は、式(3)のように表される。
画像調整部100の各機能部は、n番目(0≦n<N)の解像度の差分画像「Ln(x,y,t)」に対して、所定の画像処理を実行する。
画像変換部31cは、n番目の解像度の差分画像「Ln(x,y,t)」を、画像分解部30cから取得する。画像変換部31cは、n番目の解像度の差分画像の部分領域(X,Y)の情報(領域情報)を、領域決定部10cから取得する。低い解像度から高い解像度の順に差分画像が処理対象とされるので、「n=N(n>0)」において、部分領域(X,Y)の情報(領域情報)の初期値が必要とされる。部分領域の手掛かりが画像変換部31cに与えられていないので、「n=N(n>0)」番目の解像度の差分画像の部分領域(X,Y)の情報の初期値は、差分画像の全領域(x,y)を表す値である。画像変換部31cは、差分画像「Ln(x,y,t)」に含まれた処理領域(X,Y)における輝度変化を、特定の空間方向における輝度情報の位相変化及び振幅変化に変換する。
画像変換部31cは、例えば、低い(粗い)解像度から高い(細かい)解像度の順に、差分画像における時間方向の位相変化を検出する。すなわち、画像変換部31cは、低い解像度の差分画像において時間方向の位相変化を検出する処理を、高い解像度の差分画像において位相変化を検出する処理をよりも先に実行する。
画像変換部31cが輝度変化を位相変化及び振幅変化に変換する方法は、特定の方法に限定されない。以下では、画像変換部31cは、一例としてリース変換によって、輝度変化を位相変化及び振幅変化に変換する。
画像変換部31cは、n番目の解像度の差分画像「Ln(x,y,t)」に含まれた領域「Ln(X,Y,t)」に対して、例えば、フーリエ変換「fft」と逆フーリエ変換「ifft」とを実行する。すなわち、画像変換部31cは、領域「Ln(X,Y,t)」に対して式(29)から式(34)までのようにリース変換を実行する。
式(29)から式(31)までにおいて、式(32)から式(34)までの関係式が成立している。
ここで、「Φn(X,Y,t)」は、n番目の解像度の差分画像「Ln(x,y,t)」の部分領域(X,Y)における、方向変化「θn(x,y,t)」に沿って生じている位相変化を表す。「θn(X,Y,t)」は、位相変化が生じている方向変化を表す。「An(X,Y,t)」は、振幅変化を表す。n番目の解像度の差分画像「Ln(x,y,t)」の部分領域(X,Y)における位相変化「Φn(X,Y,t)」は、式(35)のように表される。
画像変換部31cは、n番目の解像度の差分画像「Ln(x,y,t)」の部分領域(X,Y)における位相変化「Φn(X,Y,t)」の情報を、変化検出部4cに出力する。
変化検出部4cは、n番目の解像度の差分画像「Ln(x,y,t)」の部分領域(X,Y)における位相変化「Φn(X,Y,t)」の情報を、画像変換部31cから取得する。変化検出部4cは、位相変化「Φn(X,Y,t)」に、時系列フィルタ「H(t)」を畳み込む。これによって、変化検出部4cは、位相変化「Φn(X,Y,t)」の微小変化を検出する。時系列フィルタ「H(t)」は、調整対象(強調又は減弱の対象)とされた所定の変化量の位相変化(例えば、微小な位相変化)に対して周波数応答を持つ時系列フィルタであれば、特定のフィルタに限定されない。時系列フィルタ「H(t)」は、例えば、バンドパスフィルタ(非特許文献1参照)である。
変化検出部4cは、所定の変化量の位相変化(例えば、微小な位相変化)に対して、時空間フィルタ「J(x,y,t)」を乗算する。これによって、変化検出部4cは、n番目の解像度の差分画像「Ln(x,y,t)」における時間及び空間について急峻な位相変化(緩やかでない位相変化)を除去することができる。
時空間フィルタ「J(X、Y、t)」は、急峻な位相変化を除去する時空間フィルタであれば、特定のフィルタに限定されない。時空間フィルタ「J(X、Y、t)」は、例えば、躍度フィルタ(非特許文献2参照)である。例えば、変化検出部4cは、微小な変化を三次微分して、微小ではない急峻な変化を検出及び正規化する。検出及び正規化の結果は、微小な変化が現れるときには0であり、急峻な変化が現れるときには1である。したがって、検出及び正規化の結果の逆は、微小な変化が現れるときには1であり、急峻な変化が現れるときには0である。変化検出部4cは、検出及び正規化の結果の逆を、躍度フィルタとする。
すなわち、変化検出部4cは、三次微分と正規化と反転との順で、位相変化に対して演算を実行する。これによって、変化検出部4cは、微小ではない急峻な位相変化のみを除去する躍度フィルタを生成することができる。変化検出部4cは、元の位相変化に躍度フィルタを乗算する。
換言すれば、変化検出部4cは、位相変化に対して、三次微分と正規化の演算とを実行する。これによって、変化検出部4cは、微小な位相変化が差分画像に現れるときには、0の値を持つ演算結果を得る。変化検出部4cは、急峻な位相変化が差分画像に現れるときには、1の値を持つ演算結果を得る。
変化検出部4cは、演算結果を反転することによって、躍度フィルタを生成する。躍度フィルタは、微小な位相変化が差分画像に現れるときには、1の値のフィルタ応答を持つ。躍度フィルタは、急峻な位相変化が差分画像に現れるときには、0の値のフィルタ応答を持つ。変化検出部4cは、元の位相変化に躍度フィルタを乗算する。微小な位相変化が差分画像に現れる場合、元の位相変化に1の値が乗算されるので、変化検出部4cは、微小な位相変化のみを検出することができる。急峻な位相変化が差分画像に現れる場合、元の位相変化に0の値が乗算されるので、変化検出部4cは、急峻な位相変化を抑制することができる。
変化検出部4cは、多重解像度のエッジ画像の位相変化情報と方向変化情報とを入力としてもよい。時刻「t」を中心とした時間幅「(-)t」(例えば、単位時間当たり)の各エッジ画像について、変化検出部4cは、方向変化情報「θn(x,y,t)」を、信頼度推定部5cに出力する。
時刻「t」を中心とした時間幅「(-)t」の各エッジ画像について、変化検出部4は、多重解像度のエッジ画像内の画素における、方向変化に沿った微小な位相変化を検出する。変化検出部4cは、多重解像度のエッジ画像内の画素における微小位相変化情報を、乗算部6cに出力する。
信頼度推定部5cは、時間幅「(-)t」の方向変化情報を入力とする。信頼度推定部5cは、微小な位相変化「Cn(x,y,t)」の信頼度「maskSn」を、方向変化情報に基づいて推定する。微小な位相変化の信頼度とは、ランダムノイズ以外の物理現象によって画像のピクセル値に生じた微小な位相変化であることの信頼度である。撮像素子の熱雑音等に起因して画像に混入したランダムノイズによって画像のピクセル値に生じた微小な位相変化の信頼度が、ランダムノイズ以外の物理現象によって画像のピクセル値に生じた微小な位相変化の信頼度よりも低くなるように、信頼度推定部5cは信頼度を推定する。信頼度推定部5は、例えば、推定された信頼度「maskSn」を、乗算部6cに出力する。
乗算部6cは、微小位相変化情報と、信頼度とを入力とする。乗算部c6は、微小位相変化情報(微小な位相変化を表す値)と、信頼度推定部5cによって推定された信頼度とを、エッジ画像内の画素ごとに乗算し、乗算された結果を変化量調整部7cに出力する。
緩やかで微小な位相変化「Cn(X,Y,t)」は、式(36)のように表される。式(36)に示された演算子「〇」は、乗算(要素積)を表す。
変化量調整部7cは、n番目の解像度の差分画像「Ln(x,y,t)」の部分領域(X,Y)における緩やかで微小な位相変化「Cn(X,Y,t)」の情報を、変化検出部4cから取得する。変化量調整部7cは、緩やかで微小な位相変化「Cn(X,Y,t)」に対して、所定の調整率(強調率)「α」を乗算する。
微小な位相変化が強調される場合、所定の調整率「α」は、正の値とされる。微小な位相変化が減弱される場合、所定の調整率「α」は、負の値とされる。「α」の上限値及び下限値は、特に定められなくてもよいが、例えば、微小な位相変化が減弱される場合、元の位相変化「Φn(X,Y,t)」の値が0となる場合における「α」の値が「α」の下限値とされる。なお、「α」が0に設定された場合には、微小な位相変化は調整されない。
以下では、例えば、式(37)において文字「Φ」の上に付されている記号「^」は、文字「Φ」の直前に記載される。変化量調整部7cは、元の位相変化「Φn(X,Y,t)」と乗算結果とを加算することによって、緩やかで微小な位相変化の変化量が調整された位相変化「^Φn(X,Y,t)」を式(37)のように導出する。このようにして、変化量調整部7cは、検出された微小な位相変化の変化量を調整する。
ここで、部分領域(X,Y)以外の領域における位相変化の変化量が調整(α倍)されずに、部分領域(X,Y)における位相変化の変化量が調整されている。このため、部分領域(X,Y)以外の領域と部分領域(X,Y)との境界面における位相変化が整合していないために、差分画像にブロックノイズが発生する場合がある。そこで、調整率「α」が部分領域(X,Y)ごとに調整可能となるように、式(37)は式(38)のように拡張される。
部分領域ごとの調整率「α(X,Y)」の値の決定方法は、特定の方法に限定されない。部分領域ごとの調整率「α(X,Y)」の値の決定方法は、例えば、式(37)と同様に一様な重みが与えられる方法でもよいし、任意の重みが事前に与えられる方法でもよいし、ガウス関数等に基づいて重みが与えられる方法でもよい。変化量調整部7cは、変化量が調整された位相変化「^Φn(X,Y,t)」の情報を、調整画像生成部9cに出力する。
調整画像生成部9cは、変化量が調整された位相変化「^Φn(X,Y,t)」の情報を、変化量調整部7cから取得する。調整画像生成部9cは、変化量が調整された位相変化「^Φn(X,Y,t)」に基づいて、緩やかで微小な運動変化の変化量が調整されたn番目の解像度の差分画像「^Ln(x,y,t)」を、式(39)のように生成する。すなわち、調整画像生成部9cは、n番目の解像度の調整差分画像「^Ln(x,y,t)」を、変化量が調整された位相変化「^Φn(X,Y,t)」と、振幅変化「An(X,Y,t)」とに基づいて、式(39)のように生成する。
調整画像生成部9cは、調整差分画像「^Ln(x,y,t)」を、解像度ごとに領域決定部10cに出力する。調整画像生成部9cは、n番目(0≦n≦N)の解像度の調整差分画像「^Ln(x,y,t)」を、画像再構成部8cに出力する。
領域決定部10cは、n番目(0≦n≦N)の解像度の調整差分画像「^Ln(x,y,t)」を、運動変化の変化量が調整されたエッジ画像として、調整画像生成部9cから取得する。領域決定部10cは、n番目(0≦n≦N)の解像度の差分画像「Ln(x,y,t)」を、運動変化の変化量が調整されていないエッジ画像として、画像分解部30cから取得する。領域決定部10cは、n番目の解像度の調整差分画像「^Ln(x,y,t)」と、n番目の解像度の差分画像「Ln(x,y,t)」とを比較する。例えば、領域決定部10cは、時刻「t」における、n番目の解像度の調整差分画像「^Ln(x,y,t)」と、n番目の解像度の差分画像「Ln(x,y,t)」との座標(x,y)ごとの差(二乗値)の空間方向の最大値を、比較結果「det(x,y)」として式(40)のように導出する。
なお、比較結果「det(x,y)」は、時刻「t」における、差分画像と調整差分画像との差(二乗値)の空間方向の最大値でなくてもよい。例えば、比較結果「det(x,y)」は、時刻「t」を含む時間幅における、差分画像と調整差分画像との差(二乗値)の時間方向の合計値又は分散値でもよい。
領域決定部10cは、n番目の次に処理対象(新たな処理対象)となる例えば(n+1)番目の解像度の差分画像「Ln+1(x,y,t)」の部分領域(X,Y)を、比較結果に基づいて決定する。領域決定部10cは、比較結果「det(x,y)」と閾値とを比較することによって、比較結果「det(x,y)」を式(41)のように二値化する。
ここで、「thr」は閾値を表す。閾値の決定方法は、特定の方法に限定されない。閾値の決定方法は、例えば、「det(x,y)」の値の分布が正規分布であると仮定された場合に「平均値+2×標準偏差」の値が閾値「thr」と決定される方法でもよい。大津の二値化法のように、「det(x,y)」が二つのクラスに分けられた場合にクラス間の分散が最大となるように導出された閾値が、新たに使用される閾値「thr」とされてもよい。
差分画像「Ln(x,y,t)」及び調整差分画像「^Ln(x,y,t)」には、所定の縦「h」及び横「w」のサイズの部分領域(パッチ)が定められている。部分領域のサイズは、例えば、所定の細かい方眼(最小単位)に差分画像及び調整差分画像が分割されるサイズ(例えば、「2×2」の4分割のサイズ)に定められる。領域決定部10cは、縦「h」及び横「w」のサイズの部分領域に、二値化の結果「BW(x,y)」を割り当てる。
領域決定部10cは、差が閾値を超えていることを表す「BW(x,y)=1」を1個以上含む部分領域の集合領域(x’,y’)を、n番目の次に処理対象となる例えば(n-1)番目の解像度に合うように、集合領域(X,Y)としてアップサンプリングする。領域決定部10cは、アップサンプリングされた集合領域(X、Y)を、次に処理対象となる新たな部分領域(X,Y)とする。領域決定部10cは、新たな部分領域(X,Y)を表す領域情報を、画像変換部31cに出力する。
最も高い解像度(0番目の解像度)の画像の全領域を処理対象としなくてもよいように領域決定部10cが処理領域を決定すると効果的である。例えば、領域決定部10cは、最も低い解像度((N-1)番目の解像度)から始めて逐次的に処理領域を決定する。領域決定部10cは、所定の解像度の差分画像に対する処理結果に基づいて、他の解像度の差分画像に対して処理対象とされる新たな部分領域を決める。新たな部分領域は、他の解像度の差分画像の一部領域であり、他の解像度の差分画像の全領域ではない。
すなわち、領域決定部10cは、最も高い解像度(0番目の解像度)の差分画像の全領域ではなく一部領域が処理対象とされるように、処理対象とされる部分領域(X,Y)を決定する処理を、なるべく低い解像度の差分画像から開始する。例えば、領域決定部10cは、最も低い解像度から高い解像度の順で逐次的に、差分画像における処理対象とされる部分領域を決定する。また例えば、領域決定部10cは、奇数(又は偶数)番目の解像度の順で差分画像における処理対象とされる部分領域を決定した後で、偶数(又は奇数)番目の解像度の順で、差分画像における処理対象とされる部分領域を決定してもよい。
画像再構成部8cは、n番目(0≦n≦N)の解像度の調整差分画像「^Ln(x,y,t)」を、調整画像生成部9cから取得する。画像再構成部8cは、色画像を画像入力部2cから取得する。画像再構成部8cは、式(1)、式(2)、式(3)及び式(39)に基づいて、式(20)に示された処理を解像度番号「n」に関して逐次的に実行する。画像再構成部8cは、(n-1)番目の解像度の調整差分画像「^Ln-1(x,y,t)」と、n番目の解像度の輝度画像「^In(x,y,t)」とに基づいて、(n-1)番目の解像度の輝度画像「^In-1(x,y,t)」を、式(20)のように再構成する。
画像再構成部8cは、式(20)に示された処理を「n」に関して逐次的に実行することによって、原解像度(0番目の解像度)の輝度画像を再構成する。画像再構成部8cは、再構成された原解像度の輝度画像「^I0(x,y,t)」と、原解像度の色画像とを合成する。画像再構成部8cは、合成結果を、ビデオ・マグニフィケーションを用いて最終的に調整された画像として、所定の外部装置に出力する。
所定の外部装置は、例えば、ビデオ・マグニフィケーション以外の画像処理を実行する装置、画像認識装置又は表示装置である。所定の外部装置が画像認識装置である場合、画像認識装置は、合成結果(ビデオ・マグニフィケーションを用いて最終的に調整された画像)を、画像認識のための特徴量として使用してもよい。
次に、画像処理装置1cの動作例を説明する。
図18は、画像処理装置1cの動作例を示すフローチャートである。画像変換部31cは、n番目の解像度の差分画像「Ln(x,y,t)」を取得する(ステップS301)。画像変換部31cは、指示された部分領域(X,Y)を表す領域情報を取得する(ステップS302)。画像変換部31cは、指示された部分領域(X,Y)を表す領域情報に基づいて、n番目の解像度の差分画像の部分領域の輝度変化を、位相変化及び振幅変化に変換する(ステップS303)。変化検出部4cは、変換された位相変化のうちから、所定の変化量の位相変化を検出する(ステップS304)。
変化量調整部7cは、検出された位相変化の変化量を調整する(ステップS305)。調整画像生成部9cは、変化量が調整された位相変化に基づいて、運動変化の変化量が調整されたn番目の解像度の差分画像を生成する(ステップS306)。領域決定部10cは、運動変化の変化量が調整されていないn番目の解像度の差分画像と、運動変化の変化量が調整されたn番目の解像度の差分画像とに基づいて、新たな所定の解像度(例えば、(n-1)番目の解像度)の差分画像の部分領域(X,Y)を決定する(ステップS307)。
領域決定部10cは、決定された部分領域(X,Y)を表す領域情報を、新たな所定の解像度の差分画像の新たな部分領域として画像変換部31cに指示する(ステップS308)。画像変換部31cは、所定の解像度の番号「n」を、新たな所定の解像度の番号に更新する(ステップS309)。
画像変換部31cは、(0≦n<N)番目の全ての解像度について処理が完了しているか否かを判定する(ステップS310)。(0≦n<N)番目の全ての解像度の差分画像のいずれかの解像度について処理が完了していない場合(ステップS310:NO)、画像変換部31cは、ステップS301に処理を戻す。(0≦n<N)番目の全ての解像度の差分画像の全ての解像度について処理が完了している場合(ステップS310:YES)、画像処理装置1cの各機能部は、図18のフローチャートに示された処理を終了する。
以上のように、第4実施形態の画像処理装置1cは、変化検出部4cと、変化量調整部7cと、調整画像生成部9cと、領域決定部10cとを備える。画像処理装置1cは、画像変換部31cを備えてもよい。画像変換部31cは、互いに異なる解像度のエッジ画像(多重解像度のエッジ画像)を取得する。画像変換部31cは、指示された部分領域を表す領域情報(X,Y)に基づいて、取得された多重解像度のエッジ画像の部分領域の輝度変化を、位相変化及び振幅変化に変換する。変化検出部4cは、互いに異なる解像度のうちの所定の解像度のエッジ画像の部分領域における位相変化のうちから、所定の変化量の位相変化を検出する。変化量調整部7cは、検出された位相変化「Cn(X,Y,t)」の変化量を調整する。調整画像生成部9cは、位相変化の変化量が調整された位相変化「α(X,Y)・Cn(X,Y,t)」「^Φn(X,Y,t)」と振幅変化「An(X,Y,t)」とに基づいて、運動変化の変化量が調整されたn番目の解像度のエッジ画像「^Ln(x,y,t)」を生成する。領域決定部10cは、n番目の解像度のエッジ画像「Ln(x,y,t)」と運動変化の変化量が調整されたn番目の解像度のエッジ画像「^Ln(x,y,t)」とに基づいて、新たな所定の解像度(例えば、(n-1)番目の解像度)のエッジ画像の新たな部分領域を表す領域情報(X,Y)を決定する。領域決定部10cは、決定された新たな部分領域(X,Y)を表す領域情報を、新たな所定の解像度のエッジ画像の新たな部分領域として画像変換部31cに指示する。
このように、領域決定部10cは、運動変化の変化量が調整されていないn番目の解像度の差分画像と、運動変化の変化量が調整されたn番目の解像度の差分画像とに基づいて、新たな所定の解像度の差分画像の新たな部分領域を画像変換部31cに指示する。画像変換部31cは、指示された新たな部分領域について処理を実行する。
これによって、ビデオ・マグニフィケーションの演算量の増加を低減することが可能である。動画像のフレームにおいてビデオ・マグニフィケーションの処理対象となる領域を画像処理装置1cが適応的に導出するので、動画像のフレームにおける位相変化の演算量を大幅に削減することが可能である。動画像のフレームにおける所望の微小な運動変化の変化量が調整された画像を、高速に生成することが可能である。
領域決定部10cは、式(40)に示された差分画像「Ln-1(x,y,t)」と調整差分画像「^Ln-1(x,y,t)」との座標ごとの差(二乗値)の最大値「det(x,y)」と、所定値「thr」とを、式(41)のように比較してもよい。領域決定部10cは、最大値「BW」が所定値「thr」を超える座標と、最大値「BW」が所定値「thr」以上となる座標とのいずれかに基づいて、新たな所定の解像度のエッジ画像の新たな部分領域を表す領域情報(X,Y)を決定してもよい。
変化量調整部7cは、式(37)又は式(38)のように、検出された位相変化「Cn(X,Y,t)」に所定の調整率「α」を乗算する。これによって、変化量調整部7cは、検出された位相変化の変化量を調整することができる。変化量調整部7cは、乗算結果(調整結果)に、所定の解像度のエッジ画像の部分領域における元の位相変化「Φn(X,Y,t)」を加算することによって、変化量が調整された位相変化「^Φn(X,Y,t)」を導出する。調整画像生成部9cは、変化量が調整された位相変化に応じた値「cos(^Φn(X,Y,t))」を、所定の解像度のエッジ画像の部分領域における振幅変化を表す値「An(X,Y,t)」に乗算する。これによって、調整画像生成部9cは、画像の運動変化の変化量が調整された所定の解像度の差分画像を生成することができる。なお、上記の各実施形態は、互いに組み合わされてもよい。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。