JP4596205B2 - Image processing apparatus and method, and program - Google Patents

Image processing apparatus and method, and program Download PDF

Info

Publication number
JP4596205B2
JP4596205B2 JP2001111438A JP2001111438A JP4596205B2 JP 4596205 B2 JP4596205 B2 JP 4596205B2 JP 2001111438 A JP2001111438 A JP 2001111438A JP 2001111438 A JP2001111438 A JP 2001111438A JP 4596205 B2 JP4596205 B2 JP 4596205B2
Authority
JP
Japan
Prior art keywords
foreground
pixel
unit
area
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001111438A
Other languages
Japanese (ja)
Other versions
JP2002312783A5 (en
JP2002312783A (en
Inventor
哲二郎 近藤
貴志 沢尾
淳一 石橋
隆浩 永野
直樹 藤原
徹 三宅
成司 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001111438A priority Critical patent/JP4596205B2/en
Priority to US10/297,632 priority patent/US8134613B2/en
Publication of JP2002312783A publication Critical patent/JP2002312783A/en
Publication of JP2002312783A5 publication Critical patent/JP2002312783A5/ja
Application granted granted Critical
Publication of JP4596205B2 publication Critical patent/JP4596205B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Picture Signal Circuits (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理装置および方法、並びにプログラムに関し、特に、センサにより検出した信号と現実世界との違いを考慮した画像処理装置および方法、並びにプログラムに関する。
【0002】
【従来の技術】
現実世界における事象をセンサで検出し、センサが出力するサンプリングデータを処理する技術が広く利用されている。
【0003】
例えば、静止している所定の背景の前で移動する物体をビデオカメラで撮像して得られる画像には、物体の移動速度が比較的速い場合、動きボケが生じることになる。
【0004】
従来、このような動きボケを抑制するのに、例えば、電子シャッタの速度を速め、露光時間を短くするようにしている。
【0005】
【発明が解決しようとする課題】
しかしながら、このようにシャッタ速度を速める方法は、撮像を行う前にビデオカメラのシャッタ速度を調整する必要がある。従って、既に得られたボケた画像を補正して、鮮明な画像を得ることはできない課題があった。
【0006】
本発明はこのような状況に鑑みてなされたものであり、ボケた画像に含まれる動きボケを除去することができるようにすることを目的とする。
【0007】
【課題を解決するための手段】
請求項1に記載の画像処理装置は、時間積分効果により画像データに形成された、前景オブジェクトを構成する前景オブジェクト成分からなる前景領域、および背景オブジェクトを構成する背景オブジェクト成分からなる背景領域により構成される非混合領域、並びに前景オブジェクト成分および背景オブジェクト成分が混合されてなる混合領域を特定する領域情報、並びに画像データに基づいて、前景領域における画素データであって、隣接する画素データとその値がほぼ等しい画素データからなる均等部を検出する均等部検出手段と、領域情報および均等部の位置に基づいて、均等部の画素データ以外の画素データであって、1つの直線上の、混合領域または前景領域に属する画素データに対応し、複数の前景オブジェクト成分からなる処理単位を決定する処理単位決定手段と、処理単位および前景オブジェクトの動きベクトルに基づいて、前景領域と混合領域からなる領域の時間方向の分割数と画素ごとの前景オブジェクト成分の数を決定して、領域における画素データと前景オブジェクト成分との対応を指定するモデルを生成するモデル生成手段と、モデルに基づいて、処理単位の画素データと、処理単位に含まれる前景オブジェクト成分との関係を示す方程式を生成する方程式生成手段と、方程式を解くことで、処理単位の画素データに含まれる前景オブジェクト成分を演算する演算手段と、前景オブジェクト成分の演算結果、および検出された均等部に基づいて、前景領域に生じている動きボケを除去する動きボケ除去手段とを含むことを特徴とする。
【0010】
画像処理装置は、前景領域、背景領域、または混合領域を特定する領域特定手段をさらに設けることができる。
【0011】
均等部検出手段は、画素データの差分としきい値とを比較することにより、均等部を検出するようにすることができる。
【0012】
均等部検出手段は、前景オブジェクトの動き量に対応する画素の数以上の数の隣接する画素データからなる均等部を検出するようにすることができる。
【0015】
請求項5に記載の画像処理方法、または請求項6に記載のプログラムは、時間積分効果により画像データに形成された、前景オブジェクトを構成する前景オブジェクト成分からなる前景領域、および背景オブジェクトを構成する背景オブジェクト成分からなる背景領域により構成される非混合領域、並びに前景オブジェクト成分および背景オブジェクト成分が混合されてなる混合領域を特定する領域情報、並びに画像データに基づいて、前景領域における画素データであって、隣接する画素データとその値がほぼ等しい画素データからなる均等部を検出する均等部検出ステップと、領域情報および均等部の位置に基づいて、均等部の画素データ以外の画素データであって、1つの直線上の、混合領域または前景領域に属する画素データに対応し、複数の前景オブジェクト成分からなる処理単位を決定する処理単位決定ステップと、処理単位および前景オブジェクトの動きベクトルに基づいて、前景領域と混合領域からなる領域の時間方向の分割数と画素ごとの前景オブジェクト成分の数を決定して、領域における画素データと前景オブジェクト成分との対応を指定するモデルを生成するモデル生成ステップと、モデルに基づいて、処理単位の画素データと、処理単位に含まれる前景オブジェクト成分との関係を示す方程式を生成する方程式生成ステップと、方程式を解くことで、処理単位の画素データに含まれる前景オブジェクト成分を演算する演算ステップと、前景オブジェクト成分の演算結果、および検出された均等部に基づいて、前景領域に生じている動きボケを除去する動きボケ除去ステップとを含むことを特徴とする。
【0031】
請求項1に記載の画像処理装置、請求項5に記載の画像処理方法、および請求項6に記載のプログラムにおいては、時間積分効果により画像データに形成された、前景オブジェクトを構成する前景オブジェクト成分からなる前景領域、および背景オブジェクトを構成する背景オブジェクト成分からなる背景領域により構成される非混合領域、並びに前景オブジェクト成分および背景オブジェクト成分が混合されてなる混合領域を特定する領域情報、並びに画像データに基づいて、前景領域における画素データであって、隣接する画素データとその値がほぼ等しい画素データからなる均等部が検出され、領域情報および均等部の位置に基づいて、均等部の画素データ以外の画素データであって、1つの直線上の、混合領域または前景領域に属する画素データに対応し、複数の前景オブジェクト成分からなる処理単位が決定され、処理単位および前景オブジェクトの動きベクトルに基づいて、前景領域と混合領域からなる領域の時間方向の分割数と画素ごとの前景オブジェクト成分の数が決定されて、領域における画素データと前景オブジェクト成分との対応を指定するモデルが生成され、モデルに基づいて、処理単位の画素データと、処理単位に含まれる前景オブジェクト成分との関係を示す方程式が生成され、方程式を解くことで、処理単位の画素データに含まれる前景オブジェクト成分が演算され、前景オブジェクト成分の演算結果、および検出された均等部に基づいて、前景領域に生じている動きボケが除去される。
【0032】
【発明の実施の形態】
図1は、本発明に係る信号処理装置の一実施の形態の構成を示すブロック図である。CPU(Central Processing Unit)21は、ROM(Read Only Memory)22、または記憶部28に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)23には、CPU21が実行するプログラムやデータなどが適宜記憶される。これらのCPU21、ROM22、およびRAM23は、バス24により相互に接続されている。
【0033】
CPU21にはまた、バス24を介して入出力インタフェース25が接続されている。入出力インタフェース25には、キーボード、マウス、マイクロホンなどよりなる入力部26、ディスプレイ、スピーカなどよりなる出力部27が接続されている。CPU21は、入力部26から入力される指令に対応して各種の処理を実行する。そして、CPU21は、処理の結果得られた画像や音声等を出力部27に出力する。
【0034】
入出力インタフェース25に接続されている記憶部28は、例えばハードディスクなどで構成され、CPU21が実行するプログラムや各種のデータを記憶する。通信部29は、インターネット、その他のネットワークを介して外部の装置と通信する。この例の場合、通信部29はセンサの出力を取り込む取得部として働く。
【0035】
また、通信部29を介してプログラムを取得し、記憶部28に記憶してもよい。
【0036】
入出力インタフェース25に接続されているドライブ30は、磁気ディスク51、光ディスク52、光磁気ディスク53、或いは半導体メモリ54などが装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部28に転送され、記憶される。
【0037】
次に、センサにより取得されたデータから、有意情報が埋もれている領域を特定したり、埋もれた有意情報を抽出する処理を行う信号処理装置についてより具体的な例を挙げて説明する。以下の例において、CCDラインセンサまたはCCDエリアセンサがセンサに対応し、領域情報や混合比が有意情報に対応し、混合領域において、前景と背景が混合していることや動きボケが歪みに対応する。
【0038】
図2は、信号処理装置を示すブロック図である。
【0039】
なお、信号処理装置の各機能をハードウェアで実現するか、ソフトウェアで実現するかは問わない。つまり、本明細書の各ブロック図は、ハードウェアのブロック図と考えても、ソフトウェアによる機能ブロック図と考えても良い。
【0040】
ここで、動きボケとは、撮像の対象となる、現実世界におけるオブジェクトの動きと、センサの撮像の特性とにより生じる、動いているオブジェクトに対応する画像に含まれている歪みをいう。
【0041】
この明細書では、撮像の対象となる、現実世界におけるオブジェクトに対応する画像を、画像オブジェクトと称する。
【0042】
信号処理装置に供給された入力画像は、オブジェクト抽出部101、領域特定部103、混合比算出部104、および前景背景分離部105に供給される。
【0043】
オブジェクト抽出部101は、入力画像に含まれる前景のオブジェクトに対応する画像オブジェクトを粗く抽出して、抽出した画像オブジェクトを動き検出部102に供給する。オブジェクト抽出部101は、例えば、入力画像に含まれる前景のオブジェクトに対応する画像オブジェクトの輪郭を検出することで、前景のオブジェクトに対応する画像オブジェクトを粗く抽出する。
【0044】
オブジェクト抽出部101は、入力画像に含まれる背景のオブジェクトに対応する画像オブジェクトを粗く抽出して、抽出した画像オブジェクトを動き検出部102に供給する。オブジェクト抽出部101は、例えば、入力画像と、抽出された前景のオブジェクトに対応する画像オブジェクトとの差から、背景のオブジェクトに対応する画像オブジェクトを粗く抽出する。
【0045】
また、例えば、オブジェクト抽出部101は、内部に設けられている背景メモリに記憶されている背景の画像と、入力画像との差から、前景のオブジェクトに対応する画像オブジェクト、および背景のオブジェクトに対応する画像オブジェクトを粗く抽出するようにしてもよい。
【0046】
動き検出部102は、例えば、ブロックマッチング法、勾配法、位相相関法、およびペルリカーシブ法などの手法により、粗く抽出された前景のオブジェクトに対応する画像オブジェクトの動きベクトルを算出して、算出した動きベクトルおよび動きベクトルの位置情報(動きベクトルに対応する画素の位置を特定する情報)を領域特定部103および動きボケ抽出部106に供給する。
【0047】
動き検出部102が出力する動きベクトルには、動き量vに対応する情報が含まれるている。
【0048】
また、例えば、動き検出部102は、画像オブジェクトに画素を特定する画素位置情報と共に、画像オブジェクト毎の動きベクトルを動きボケ調整部106に出力するようにしてもよい。
【0049】
動き量vは、動いているオブジェクトに対応する画像の位置の変化を画素間隔を単位として表す値である。例えば、前景に対応するオブジェクトの画像が、あるフレームを基準として次のフレームにおいて4画素分離れた位置に表示されるように移動しているとき、前景に対応するオブジェクトの画像の動き量vは、4とされる。
【0050】
なお、オブジェクト抽出部101および動き検出部102は、動いているオブジェクトに対応した動きボケ量の調整を行う場合に必要となる。
【0051】
領域特定部103は、入力された画像の画素のそれぞれを、前景領域、背景領域、または混合領域のいずれかに特定し、画素毎に前景領域、背景領域、または混合領域のいずれかに属するかを示す情報(以下、領域情報と称する)を混合比算出部104、前景背景分離部105、および動きボケ調整部106に供給する。
【0052】
混合比算出部104は、入力画像、および領域特定部103から供給された領域情報を基に、混合領域63に含まれる画素に対応する混合比(以下、混合比αと称する)を算出して、算出した混合比を前景背景分離部105に供給する。
【0053】
混合比αは、後述する式(3)に示されるように、画素値における、背景のオブジェクトに対応する画像の成分(以下、背景の成分とも称する)の割合を示す値である。
【0054】
前景背景分離部105は、領域特定部103から供給された領域情報、および混合比算出部104から供給された混合比αを基に、前景のオブジェクトに対応する画像の成分(以下、前景の成分とも称する)のみから成る前景成分画像と、背景の成分のみから成る背景成分画像とに入力画像を分離して、前景成分画像を動きボケ調整部106および選択部107に供給する。なお、分離された前景成分画像を最終的な出力とすることも考えられる。従来の混合領域を考慮しないで前景と背景だけを特定し、分離していた方式に比べ正確な前景と背景を得ることが出来る。
【0055】
動きボケ調整部106は、動きベクトルからわかる動き量vおよび領域情報を基に、前景成分画像に含まれる1以上の画素を示す処理単位を決定する。処理単位は、動きボケの量の調整の処理の対象となる1群の画素を指定するデータである。
【0056】
動きボケ調整部106は、信号処理装置に入力された動きボケ調整量、前景背景分離部105から供給された前景成分画像、動き検出部102から供給された動きベクトルおよびその位置情報、並びに処理単位を基に、前景成分画像に含まれる動きボケを除去する、動きボケの量を減少させる、または動きボケの量を増加させるなど前景成分画像に含まれる動きボケの量を調整して、動きボケの量を調整した前景成分画像を選択部107に出力する。動きベクトルとその位置情報は使わないこともある。
【0057】
選択部107は、例えば使用者の選択に対応した選択信号を基に、前景背景分離部105から供給された前景成分画像、および動きボケ調整部106から供給された動きボケの量が調整された前景成分画像のいずれか一方を選択して、選択した前景成分画像を出力する。
【0058】
次に、図3乃至図18を参照して、信号処理装置に供給される入力画像について説明する。
【0059】
図3は、センサによる撮像を説明する図である。センサは、例えば、固体撮像素子であるCCD(Charge-Coupled Device)エリアセンサを備えたCCDビデオカメラなどで構成される。現実世界における、前景に対応するオブジェクトは、現実世界における、背景に対応するオブジェクトと、センサとの間を、例えば、図中の左側から右側に水平に移動する。
【0060】
センサは、前景に対応するオブジェクトを、背景に対応するオブジェクトと共に撮像する。センサは、撮像した画像を1フレーム単位で出力する。例えば、センサは、1秒間に30フレームから成る画像を出力する。センサの露光時間は、1/30秒とすることができる。露光時間は、センサが入力された光の電荷への変換を開始してから、入力された光の電荷への変換を終了するまでの期間である。以下、露光時間をシャッタ時間とも称する。
【0061】
図4は、画素の配置を説明する図である。図4中において、A乃至Iは、個々の画素を示す。画素は、画像に対応する平面上に配置されている。1つの画素に対応する1つの検出素子は、センサ上に配置されている。センサが画像を撮像するとき、1つの検出素子は、画像を構成する1つの画素に対応する画素値を出力する。例えば、検出素子のX方向の位置は、画像上の横方向の位置に対応し、検出素子のY方向の位置は、画像上の縦方向の位置に対応する。
【0062】
図5に示すように、例えば、CCDである検出素子は、シャッタ時間に対応する期間、入力された光を電荷に変換して、変換された電荷を蓄積する。電荷の量は、入力された光の強さと、光が入力されている時間にほぼ比例する。検出素子は、シャッタ時間に対応する期間において、入力された光から変換された電荷を、既に蓄積されている電荷に加えていく。すなわち、検出素子は、シャッタ時間に対応する期間、入力される光を積分して、積分された光に対応する量の電荷を蓄積する。検出素子は、時間に対して、積分効果があるとも言える。
【0063】
検出素子に蓄積された電荷は、図示せぬ回路により、電圧値に変換され、電圧値は更にデジタルデータなどの画素値に変換されて出力される。従って、センサから出力される個々の画素値は、前景または背景に対応するオブジェクトの空間的に広がりを有するある部分を、シャッタ時間について積分した結果である、1次元の空間に射影された値を有する。
【0064】
信号処理装置は、このようなセンサの蓄積の動作により、出力信号に埋もれてしまった有意な情報、例えば、混合比αを抽出する。信号処理装置は、前景の画像オブジェクト自身が混ざり合うことによる生ずる歪みの量、例えば、動きボケの量などを調整する。また、信号処理装置は、前景の画像オブジェクトと背景の画像オブジェクトとが混ざり合うことにより生ずる歪みの量を調整する。
【0065】
図6は、動いている前景に対応するオブジェクトと、静止している背景に対応するオブジェクトとを撮像して得られる画像を説明する図である。図6(A)は、動きを伴う前景に対応するオブジェクトと、静止している背景に対応するオブジェクトとを撮像して得られる画像を示している。図6(A)に示す例において、前景に対応するオブジェクトは、画面に対して水平に左から右に動いている。
【0066】
図6(B)は、図6(A)に示す画像の1つのラインに対応する画素値を時間方向に展開したモデル図である。図6(B)の横方向は、図6(A)の空間方向Xに対応している。
【0067】
背景領域の画素は、背景の成分、すなわち、背景のオブジェクトに対応する画像の成分のみから、その画素値が構成されている。前景領域の画素は、前景の成分、すなわち、前景のオブジェクトに対応する画像の成分のみから、その画素値が構成されている。
【0068】
混合領域の画素は、背景の成分、および前景の成分から、その画素値が構成されている。混合領域は、背景の成分、および前景の成分から、その画素値が構成されているので、歪み領域ともいえる。混合領域は、更に、カバードバックグラウンド領域およびアンカバードバックグラウンド領域に分類される。
【0069】
カバードバックグラウンド領域は、前景領域に対して、前景のオブジェクトの進行方向の前端部に対応する位置の混合領域であり、時間の経過に対応して背景成分が前景に覆い隠される領域をいう。
【0070】
これに対して、アンカバードバックグラウンド領域は、前景領域に対して、前景のオブジェクトの進行方向の後端部に対応する位置の混合領域であり、時間の経過に対応して背景成分が現れる領域をいう。
【0071】
このように、前景領域、背景領域、またはカバードバックグラウンド領域若しくはアンカバードバックグラウンド領域を含む画像が、領域特定部103、混合比算出部104、および前景背景分離部105に入力画像として入力される。
【0072】
図7は、以上のような、背景領域、前景領域、混合領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域を説明する図である。図6に示す画像に対応する場合、背景領域は、静止部分であり、前景領域は、動き部分であり、混合領域のカバードバックグラウンド領域は、背景から前景に変化する部分であり、混合領域のアンカバードバックグラウンド領域は、前景から背景に変化する部分である。
【0073】
図8は、静止している前景に対応するオブジェクトおよび静止している背景に対応するオブジェクトを撮像した画像における、隣接して1列に並んでいる画素の画素値を時間方向に展開したモデル図である。例えば、隣接して1列に並んでいる画素として、画面の1つのライン上に並んでいる画素を選択することができる。
【0074】
図8に示すF01乃至F04の画素値は、静止している前景のオブジェクトに対応する画素の画素値である。図8に示すB01乃至B04の画素値は、静止している背景のオブジェクトに対応する画素の画素値である。
【0075】
図8における縦方向は、図中の上から下に向かって時間が経過する。図8中の矩形の上辺の位置は、センサが入力された光の電荷への変換を開始する時刻に対応し、図8中の矩形の下辺の位置は、センサが入力された光の電荷への変換を終了する時刻に対応する。すなわち、図8中の矩形の上辺から下辺までの距離は、シャッタ時間に対応する。
【0076】
以下において、シャッタ時間とフレーム間隔とが同一である場合を例に説明する。
【0077】
図8における横方向は、図6で説明した空間方向Xに対応する。より具体的には、図8に示す例において、図8中の”F01”と記載された矩形の左辺から”B04”と記載された矩形の右辺までの距離は、画素のピッチの8倍、すなわち、連続している8つの画素の間隔に対応する。
【0078】
前景のオブジェクトおよび背景のオブジェクトが静止している場合、シャッタ時間に対応する期間において、センサに入力される光は変化しない。
【0079】
ここで、シャッタ時間に対応する期間を2つ以上の同じ長さの期間に分割する。例えば、仮想分割数を4とすると、図8に示すモデル図は、図11に示すモデルとして表すことができる。仮想分割数は、前景に対応するオブジェクトのシャッタ時間内での動き量vなどに対応して設定される。例えば、4である動き量vに対応して、仮想分割数は、4とされ、シャッタ時間に対応する期間は4つに分割される。
【0080】
図中の最も上の行は、シャッタが開いて最初の、分割された期間に対応する。図中の上から2番目の行は、シャッタが開いて2番目の、分割された期間に対応する。図中の上から3番目の行は、シャッタが開いて3番目の、分割された期間に対応する。図中の上から4番目の行は、シャッタが開いて4番目の、分割された期間に対応する。
【0081】
以下、動き量vに対応して分割されたシャッタ時間をシャッタ時間/vとも称する。
【0082】
前景に対応するオブジェクトが静止しているとき、センサに入力される光は変化しないので、前景の成分F01/vは、画素値F01を仮想分割数で除した値に等しい。同様に、前景に対応するオブジェクトが静止しているとき、前景の成分F02/vは、画素値F02を仮想分割数で除した値に等しく、前景の成分F03/vは、画素値F03を仮想分割数で除した値に等しく、前景の成分F04/vは、画素値F04を仮想分割数で除した値に等しい。
【0083】
背景に対応するオブジェクトが静止しているとき、センサに入力される光は変化しないので、背景の成分B01/vは、画素値B01を仮想分割数で除した値に等しい。同様に、背景に対応するオブジェクトが静止しているとき、背景の成分B02/vは、画素値B02を仮想分割数で除した値に等しく、B03/vは、画素値B03を仮想分割数で除した値に等しく、B04/vは、画素値B04を仮想分割数で除した値に等しい。
【0084】
すなわち、前景に対応するオブジェクトが静止している場合、シャッタ時間に対応する期間において、センサに入力される前景のオブジェクトに対応する光が変化しないので、シャッタが開いて最初の、シャッタ時間/vに対応する前景の成分F01/vと、シャッタが開いて2番目の、シャッタ時間/vに対応する前景の成分F01/vと、シャッタが開いて3番目の、シャッタ時間/vに対応する前景の成分F01/vと、シャッタが開いて4番目の、シャッタ時間/vに対応する前景の成分F01/vとは、同じ値となる。F02/v乃至F04/vも、F01/vと同様の関係を有する。
【0085】
背景に対応するオブジェクトが静止している場合、シャッタ時間に対応する期間において、センサに入力される背景のオブジェクトに対応する光は変化しないので、シャッタが開いて最初の、シャッタ時間/vに対応する背景の成分B01/vと、シャッタが開いて2番目の、シャッタ時間/vに対応する背景の成分B01/vと、シャッタが開いて3番目の、シャッタ時間/vに対応する背景の成分B01/vと、シャッタが開いて4番目の、シャッタ時間/vに対応する背景の成分B01/vとは、同じ値となる。B02/v乃至B04/vも、同様の関係を有する。
【0086】
次に、前景に対応するオブジェクトが移動し、背景に対応するオブジェクトが静止している場合について説明する。
【0087】
図10は、前景に対応するオブジェクトが図中の右側に向かって移動する場合の、カバードバックグラウンド領域を含む、1つのライン上の画素の画素値を時間方向に展開したモデル図である。図10において、前景の動き量vは、4である。1フレームは短い時間なので、前景に対応するオブジェクトが剛体であり、等速で移動していると仮定することができる。図10において、前景に対応するオブジェクトの画像は、あるフレームを基準として次のフレームにおいて4画素分右側に表示されるように移動する。
【0088】
図10において、最も左側の画素乃至左から4番目の画素は、前景領域に属する。図10において、左から5番目乃至左から7番目の画素は、カバードバックグラウンド領域である混合領域に属する。図10において、最も右側の画素は、背景領域に属する。
【0089】
前景に対応するオブジェクトが時間の経過と共に背景に対応するオブジェクトを覆い隠すように移動しているので、カバードバックグラウンド領域に属する画素の画素値に含まれる成分は、シャッタ時間に対応する期間のある時点で、背景の成分から、前景の成分に替わる。
【0090】
例えば、図10中に太線枠を付した画素値Mは、式(1)で表される。
【0091】
M=B02/v+B02/v+F07/v+F06/v (1)
【0092】
例えば、左から5番目の画素は、1つのシャッタ時間/vに対応する背景の成分を含み、3つのシャッタ時間/vに対応する前景の成分を含むので、左から5番目の画素の混合比αは、1/4である。左から6番目の画素は、2つのシャッタ時間/vに対応する背景の成分を含み、2つのシャッタ時間/vに対応する前景の成分を含むので、左から6番目の画素の混合比αは、1/2である。左から7番目の画素は、3つのシャッタ時間/vに対応する背景の成分を含み、1つのシャッタ時間/vに対応する前景の成分を含むので、左から7番目の画素の混合比αは、3/4である。
【0093】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図10中の左から4番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F07/vは、図10中の左から5番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F07/vは、図10中の左から6番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図10中の左から7番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0094】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図10中の左から3番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分F06/vは、図10中の左から4番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F06/vは、図10中の左から5番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図10中の左から6番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0095】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図10中の左から2番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分F05/vは、図10中の左から3番目の画素の、シャッタが開いて2番目のシャッタ時間/vのに対応する前景の成分に等しい。同様に、前景の成分F05/vは、図10中の左から4番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図10中の左から5番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0096】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図10中の最も左側の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分F04/vは、図10中の左から2番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F04/vは、図10中の左から3番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図10中の左から4番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0097】
動いているオブジェクトに対応する前景の領域は、このように動きボケを含むので、歪み領域とも言える。
【0098】
図11は、前景が図中の右側に向かって移動する場合の、アンカバードバックグラウンド領域を含む、1つのライン上の画素の画素値を時間方向に展開したモデル図である。図11において、前景の動き量vは、4である。1フレームは短い時間なので、前景に対応するオブジェクトが剛体であり、等速で移動していると仮定することができる。図11において、前景に対応するオブジェクトの画像は、あるフレームを基準として次のフレームにおいて4画素分右側に移動する。
【0099】
図11において、最も左側の画素乃至左から4番目の画素は、背景領域に属する。図11において、左から5番目乃至左から7番目の画素は、アンカバードバックグラウンドである混合領域に属する。図11において、最も右側の画素は、前景領域に属する。
【0100】
背景に対応するオブジェクトを覆っていた前景に対応するオブジェクトが時間の経過と共に背景に対応するオブジェクトの前から取り除かれるように移動しているので、アンカバードバックグラウンド領域に属する画素の画素値に含まれる成分は、シャッタ時間に対応する期間のある時点で、前景の成分から、背景の成分に替わる。
【0101】
例えば、図11中に太線枠を付した画素値M'は、式(2)で表される。
【0102】
M'=F02/v+F01/v+B26/v+B26/v (2)
【0103】
例えば、左から5番目の画素は、3つのシャッタ時間/vに対応する背景の成分を含み、1つのシャッタ時間/vに対応する前景の成分を含むので、左から5番目の画素の混合比αは、3/4である。左から6番目の画素は、2つのシャッタ時間/vに対応する背景の成分を含み、2つのシャッタ時間/vに対応する前景の成分を含むので、左から6番目の画素の混合比αは、1/2である。左から7番目の画素は、1つのシャッタ時間/vに対応する背景の成分を含み、3つのシャッタ時間/vに対応する前景の成分を含むので、左から7番目の画素の混合比αは、1/4である。
【0104】
式(1)および式(2)をより一般化すると、画素値Mは、式(3)で表される。
【0105】
【数1】

Figure 0004596205
ここで、αは、混合比である。Bは、背景の画素値であり、Fi/vは、前景の成分である。
【0106】
前景に対応するオブジェクトが剛体であり、等速で動くと仮定でき、かつ、動き量vが4であるので、例えば、図11中の左から5番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F01/vは、図11中の左から6番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、F01/vは、図11中の左から7番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図11中の左から8番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0107】
前景に対応するオブジェクトが剛体であり、等速で動くと仮定でき、かつ、仮想分割数が4であるので、例えば、図11中の左から6番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F02/vは、図11中の左から7番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F02/vは、図11中の左から8番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分に等しい。
【0108】
前景に対応するオブジェクトが剛体であり、等速で動くと仮定でき、かつ、動き量vが4であるので、例えば、図11中の左から7番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F03/vは、図11中の左から8番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。
【0109】
図9乃至図11の説明において、仮想分割数は、4であるとして説明したが、仮想分割数は、動き量vに対応する。動き量vは、一般に、前景に対応するオブジェクトの移動速度に対応する。例えば、前景に対応するオブジェクトが、あるフレームを基準として次のフレームにおいて4画素分右側に表示されるように移動しているとき、動き量vは、4とされる。動き量vに対応し、仮想分割数は、4とされる。同様に、例えば、前景に対応するオブジェクトが、あるフレームを基準として次のフレームにおいて6画素分左側に表示されるように移動しているとき、動き量vは、6とされ、仮想分割数は、6とされる。
【0110】
図12および図13に、以上で説明した、前景領域、背景領域、カバードバックグラウンド領域若しくはアンカバードバックグラウンド領域から成る混合領域と、分割されたシャッタ時間に対応する前景の成分および背景の成分との関係を示す。
【0111】
図12は、静止している背景の前を移動しているオブジェクトに対応する前景を含む画像から、前景領域、背景領域、および混合領域の画素を抽出した例を示す。図12に示す例において、前景に対応するオブジェクトは、画面に対して水平に移動している。
【0112】
フレーム#n+1は、フレーム#nの次のフレームであり、フレーム#n+2は、フレーム#n+1の次のフレームである。
【0113】
フレーム#n乃至フレーム#n+2のいずれかから抽出した、前景領域、背景領域、および混合領域の画素を抽出して、動き量vを4として、抽出された画素の画素値を時間方向に展開したモデルを図13に示す。
【0114】
前景領域の画素値は、前景に対応するオブジェクトが移動するので、シャッタ時間/vの期間に対応する、4つの異なる前景の成分から構成される。例えば、図13に示す前景領域の画素のうち最も左側に位置する画素は、F01/v,F02/v,F03/v、およびF04/vから構成される。すなわち、前景領域の画素は、動きボケを含んでいる。
【0115】
背景に対応するオブジェクトが静止しているので、シャッタ時間に対応する期間において、センサに入力される背景に対応する光は変化しない。この場合、背景領域の画素値は、動きボケを含まない。
【0116】
カバードバックグラウンド領域若しくはアンカバードバックグラウンド領域から成る混合領域に属する画素の画素値は、前景の成分と、背景の成分とから構成される。
【0117】
次に、オブジェクトに対応する画像が動いているとき、複数のフレームにおける、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデルについて説明する。例えば、オブジェクトに対応する画像が画面に対して水平に動いているとき、隣接して1列に並んでいる画素として、画面の1つのライン上に並んでいる画素を選択することができる。
【0118】
図14は、静止している背景に対応するオブジェクトを撮像した画像の3つのフレームの、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデル図である。フレーム#nは、フレーム#n-1の次のフレームであり、フレーム#n+1は、フレーム#nの次のフレームである。他のフレームも同様に称する。
【0119】
図14に示すB01乃至B12の画素値は、静止している背景のオブジェクトに対応する画素の画素値である。背景に対応するオブジェクトが静止しているので、フレーム#n-1乃至フレームn+1において、対応する画素の画素値は、変化しない。例えば、フレーム#n-1におけるB05の画素値を有する画素の位置に対応する、フレーム#nにおける画素、およびフレーム#n+1における画素は、それぞれ、B05の画素値を有する。
【0120】
図15は、静止している背景に対応するオブジェクトと共に図中の右側に移動する前景に対応するオブジェクトを撮像した画像の3つのフレームの、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデル図である。図15に示すモデルは、カバードバックグラウンド領域を含む。
【0121】
図15において、前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、前景の動き量vは、4であり、仮想分割数は、4である。
【0122】
例えば、図15中のフレーム#n-1の最も左側の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F12/vとなり、図15中の左から2番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F12/vとなる。図15中の左から3番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図15中の左から4番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F12/vとなる。
【0123】
図15中のフレーム#n-1の最も左側の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分は、F11/vとなり、図15中の左から2番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分も、F11/vとなる。図15中の左から3番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F11/vとなる。
【0124】
図15中のフレーム#n-1の最も左側の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分は、F10/vとなり、図15中の左から2番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分も、F10/vとなる。図15中のフレーム#n-1の最も左側の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F09/vとなる。
【0125】
背景に対応するオブジェクトが静止しているので、図15中のフレーム#n-1の左から2番目の画素の、シャッタが開いて最初のシャッタ時間/vの背景の成分は、B01/vとなる。図15中のフレーム#n-1の左から3番目の画素の、シャッタが開いて最初および2番目のシャッタ時間/vの背景の成分は、B02/vとなる。図15中のフレーム#n-1の左から4番目の画素の、シャッタが開いて最初乃至3番目のシャッタ時間/vの背景の成分は、B03/vとなる。
【0126】
図15中のフレーム#n-1において、最も左側の画素は、前景領域に属し、左側から2番目乃至4番目の画素は、カバードバックグラウンド領域である混合領域に属する。
【0127】
図15中のフレーム#n-1の左から5番目の画素乃至12番目の画素は、背景領域に属し、その画素値は、それぞれ、B04乃至B11となる。
【0128】
図15中のフレーム#nの左から1番目の画素乃至5番目の画素は、前景領域に属する。フレーム#nの前景領域における、シャッタ時間/vの前景の成分は、F05/v乃至F12/vのいずれかである。
【0129】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図15中のフレーム#nの左から5番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F12/vとなり、図15中の左から6番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F12/vとなる。図15中の左から7番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図15中の左から8番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F12/vとなる。
【0130】
図15中のフレーム#nの左から5番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分は、F11/vとなり、図15中の左から6番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分も、F11/vとなる。図15中の左から7番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F11/vとなる。
【0131】
図15中のフレーム#nの左から5番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分は、F10/vとなり、図15中の左から6番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分も、F10/vとなる。図15中のフレーム#nの左から5番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F09/vとなる。
【0132】
背景に対応するオブジェクトが静止しているので、図15中のフレーム#nの左から6番目の画素の、シャッタが開いて最初のシャッタ時間/vの背景の成分は、B05/vとなる。図15中のフレーム#nの左から7番目の画素の、シャッタが開いて最初および2番目のシャッタ時間/vの背景の成分は、B06/vとなる。図15中のフレーム#nの左から8番目の画素の、シャッタが開いて最初乃至3番目の、シャッタ時間/vの背景の成分は、B07/vとなる。
【0133】
図15中のフレーム#nにおいて、左側から6番目乃至8番目の画素は、カバードバックグラウンド領域である混合領域に属する。
【0134】
図15中のフレーム#nの左から9番目の画素乃至12番目の画素は、背景領域に属し、画素値は、それぞれ、B08乃至B11となる。
【0135】
図15中のフレーム#n+1の左から1番目の画素乃至9番目の画素は、前景領域に属する。フレーム#n+1の前景領域における、シャッタ時間/vの前景の成分は、F01/v乃至F12/vのいずれかである。
【0136】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図15中のフレーム#n+1の左から9番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F12/vとなり、図15中の左から10番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F12/vとなる。図15中の左から11番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図15中の左から12番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F12/vとなる。
【0137】
図15中のフレーム#n+1の左から9番目の画素の、シャッタが開いて2番目のシャッタ時間/vの期間の前景の成分は、F11/vとなり、図15中の左から10番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分も、F11/vとなる。図15中の左から11番目の画素の、シャッタが開いて4番目の、シャッタ時間/vの前景の成分は、F11/vとなる。
【0138】
図15中のフレーム#n+1の左から9番目の画素の、シャッタが開いて3番目の、シャッタ時間/vの前景の成分は、F10/vとなり、図15中の左から10番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分も、F10/vとなる。図15中のフレーム#n+1の左から9番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F09/vとなる。
【0139】
背景に対応するオブジェクトが静止しているので、図15中のフレーム#n+1の左から10番目の画素の、シャッタが開いて最初のシャッタ時間/vの背景の成分は、B09/vとなる。図15中のフレーム#n+1の左から11番目の画素の、シャッタが開いて最初および2番目のシャッタ時間/vの背景の成分は、B10/vとなる。図15中のフレーム#n+1の左から12番目の画素の、シャッタが開いて最初乃至3番目の、シャッタ時間/vの背景の成分は、B11/vとなる。
【0140】
図15中のフレーム#n+1において、左側から10番目乃至12番目の画素は、カバードバックグラウンド領域である混合領域に対応する。
【0141】
図16は、図15に示す画素値から前景の成分を抽出した画像のモデル図である。
【0142】
図17は、静止している背景と共に図中の右側に移動するオブジェクトに対応する前景を撮像した画像の3つのフレームの、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデル図である。図17において、アンカバードバックグラウンド領域が含まれている。
【0143】
図17において、前景に対応するオブジェクトは、剛体であり、かつ等速で移動していると仮定できる。前景に対応するオブジェクトが、次のフレームにおいて4画素分右側に表示されるように移動しているので、動き量vは、4である。
【0144】
例えば、図17中のフレーム#n-1の最も左側の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分は、F13/vとなり、図17中の左から2番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F13/vとなる。図17中の左から3番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図17中の左から4番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F13/vとなる。
【0145】
図17中のフレーム#n-1の左から2番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F14/vとなり、図17中の左から3番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F14/vとなる。図17中の左から3番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分は、F15/vとなる。
【0146】
背景に対応するオブジェクトが静止しているので、図17中のフレーム#n-1の最も左側の画素の、シャッタが開いて2番目乃至4番目の、シャッタ時間/vの背景の成分は、B25/vとなる。図17中のフレーム#n-1の左から2番目の画素の、シャッタが開いて3番目および4番目の、シャッタ時間/vの背景の成分は、B26/vとなる。図17中のフレーム#n-1の左から3番目の画素の、シャッタが開いて4番目のシャッタ時間/vの背景の成分は、B27/vとなる。
【0147】
図17中のフレーム#n-1において、最も左側の画素乃至3番目の画素は、アンカバードバックグラウンド領域である混合領域に属する。
【0148】
図17中のフレーム#n-1の左から4番目の画素乃至12番目の画素は、前景領域に属する。フレームの前景の成分は、F13/v乃至F24/vのいずれかである。
【0149】
図17中のフレーム#nの最も左側の画素乃至左から4番目の画素は、背景領域に属し、画素値は、それぞれ、B25乃至B28となる。
【0150】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図17中のフレーム#nの左から5番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F13/vとなり、図17中の左から6番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F13/vとなる。図17中の左から7番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図17中の左から8番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F13/vとなる。
【0151】
図17中のフレーム#nの左から6番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F14/vとなり、図17中の左から7番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F14/vとなる。図17中の左から8番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F15/vとなる。
【0152】
背景に対応するオブジェクトが静止しているので、図17中のフレーム#nの左から5番目の画素の、シャッタが開いて2番目乃至4番目のシャッタ時間/vの背景の成分は、B29/vとなる。図17中のフレーム#nの左から6番目の画素の、シャッタが開いて3番目および4番目のシャッタ時間/vの背景の成分は、B30/vとなる。図17中のフレーム#nの左から7番目の画素の、シャッタが開いて4番目のシャッタ時間/vの背景の成分は、B31/vとなる。
【0153】
図17中のフレーム#nにおいて、左から5番目の画素乃至7番目の画素は、アンカバードバックグラウンド領域である混合領域に属する。
【0154】
図17中のフレーム#nの左から8番目の画素乃至12番目の画素は、前景領域に属する。フレーム#nの前景領域における、シャッタ時間/vの期間に対応する値は、F13/v乃至F20/vのいずれかである。
【0155】
図17中のフレーム#n+1の最も左側の画素乃至左から8番目の画素は、背景領域に属し、画素値は、それぞれ、B25乃至B32となる。
【0156】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図17中のフレーム#n+1の左から9番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F13/vとなり、図17中の左から10番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F13/vとなる。図17中の左から11番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図17中の左から12番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F13/vとなる。
【0157】
図17中のフレーム#n+1の左から10番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F14/vとなり、図17中の左から11番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F14/vとなる。図17中の左から12番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F15/vとなる。
【0158】
背景に対応するオブジェクトが静止しているので、図17中のフレーム#n+1の左から9番目の画素の、シャッタが開いて2番目乃至4番目の、シャッタ時間/vの背景の成分は、B33/vとなる。図17中のフレーム#n+1の左から10番目の画素の、シャッタが開いて3番目および4番目のシャッタ時間/vの背景の成分は、B34/vとなる。図17中のフレーム#n+1の左から11番目の画素の、シャッタが開いて4番目のシャッタ時間/vの背景の成分は、B35/vとなる。
【0159】
図17中のフレーム#n+1において、左から9番目の画素乃至11番目の画素は、アンカバードバックグラウンド領域である混合領域に属する。
【0160】
図17中のフレーム#n+1の左から12番目の画素は、前景領域に属する。フレーム#n+1の前景領域における、シャッタ時間/vの前景の成分は、F13/v乃至F16/vのいずれかである。
【0161】
図18は、図17に示す画素値から前景の成分を抽出した画像のモデル図である。
【0162】
図2に戻り、領域特定部103は、複数のフレームの画素値を用いて、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域に属することを示すフラグを画素毎に対応付けて、領域情報として、混合比算出部104および動きボケ調整部106に供給する。
【0163】
混合比算出部104は、複数のフレームの画素値、および領域情報を基に、混合領域に含まれる画素について画素毎に混合比αを算出し、算出した混合比αを前景背景分離部105に供給する。
【0164】
前景背景分離部105は、複数のフレームの画素値、領域情報、および混合比αを基に、前景の成分のみからなる前景成分画像を抽出して、動きボケ調整部106に供給する。
【0165】
動きボケ調整部106は、前景背景分離部105から供給された前景成分画像、動き検出部102から供給された動きベクトル、および領域特定部103から供給された領域情報を基に、前景成分画像に含まれる動きボケの量を調整して、動きボケの量を調整した前景成分画像を出力する。
【0166】
図19のフローチャートを参照して、信号処理装置による動きボケの量の調整の処理を説明する。ステップS11において、領域特定部103は、入力画像を基に、入力画像の画素毎に前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す領域情報を生成する領域特定の処理を実行する。領域特定の処理の詳細は、後述する。
領域特定部103は、生成した領域情報を混合比算出部104に供給する。
【0167】
なお、ステップS11において、領域特定部103は、入力画像を基に、入力画像の画素毎に前景領域、背景領域、または混合領域(カバードバックグラウンド領域、またはアンカバードバックグラウンド領域の区別をしない)のいずれかに属するかを示す領域情報を生成するようにしてもよい。この場合において、前景背景分離部105および動きボケ調整部106は、動きベクトルの方向を基に、混合領域がカバードバックグラウンド領域であるか、またはアンカバードバックグラウンド領域であるかを判定する。例えば、動きベクトルの方向に対応して、前景領域、混合領域、および背景領域と順に並んでいるとき、その混合領域は、カバードバックグラウンド領域と判定され、動きベクトルの方向に対応して、背景領域、混合領域、および前景領域と順に並んでいるとき、その混合領域は、アンカバードバックグラウンド領域と判定される。
【0168】
ステップS12において、混合比算出部104は、入力画像および領域情報を基に、混合領域に含まれる画素毎に、混合比αを算出する。混合比算出の処理の詳細は、後述する。混合比算出部104は、算出した混合比αを前景背景分離部105に供給する。
【0169】
ステップS13において、前景背景分離部105は、領域情報、および混合比αを基に、入力画像から前景の成分を抽出して、前景成分画像として動きボケ調整部106に供給する。
【0170】
ステップS14において、動きボケ調整部106は、動きベクトルおよび領域情報を基に、動き方向に並ぶ連続した画素であって、アンカバードバックグラウンド領域、前景領域、およびカバードバックグラウンド領域のいずれかに属するものの画像上の位置を示す処理単位を生成し、処理単位に対応する前景成分に含まれる動きボケの量を調整する。動きボケの量の調整の処理の詳細については、後述する。
【0171】
ステップS15において、信号処理装置は、画面全体について処理を終了したか否かを判定し、画面全体について処理を終了していないと判定された場合、ステップS14に進み、処理単位に対応する前景の成分を対象とした動きボケの量の調整の処理を繰り返す。
【0172】
ステップS15において、画面全体について処理を終了したと判定された場合、処理は終了する。
【0173】
このように、信号処理装置は、前景と背景を分離して、前景に含まれる動きボケの量を調整することができる。すなわち、信号処理装置は、前景の画素の画素値であるサンプルデータに含まれる動きボケの量を調整することができる。
【0174】
以下、領域特定部103、混合比算出部104、前景背景分離部105、および動きボケ調整部106のそれぞれの構成について説明する。
【0175】
図20は、領域特定部103の構成の一例を示すブロック図である。図20に構成を示す領域特定部103は、動きベクトルを利用しない。フレームメモリ201は、入力された画像をフレーム単位で記憶する。フレームメモリ201は、処理の対象がフレーム#nであるとき、フレーム#nの2つ前のフレームであるフレーム#n-2、フレーム#nの1つ前のフレームであるフレーム#n-1、フレーム#n、フレーム#nの1つ後のフレームであるフレーム#n+1、およびフレーム#nの2つ後のフレームであるフレーム#n+2を記憶する。
【0176】
静動判定部202−1は、フレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n+2の画素の画素値、およびフレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n+1の画素の画素値をフレームメモリ201から読み出して、読み出した画素値の差の絶対値を算出する。静動判定部202−1は、フレーム#n+2の画素値とフレーム#n+1の画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、差の絶対値が閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部203−1に供給する。フレーム#n+2の画素の画素値とフレーム#n+1の画素の画素値との差の絶対値が閾値Th以下であると判定された場合、静動判定部202−1は、静止を示す静動判定を領域判定部203−1に供給する。
【0177】
静動判定部202−2は、フレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n+1の画素の画素値、およびフレーム#nの対象となる画素の画素値をフレームメモリ201から読み出して、画素値の差の絶対値を算出する。静動判定部202−2は、フレーム#n+1の画素値とフレーム#nの画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、画素値の差の絶対値が、閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部203−1および領域判定部203−2に供給する。フレーム#n+1の画素の画素値とフレーム#nの画素の画素値との差の絶対値が、閾値Th以下であると判定された場合、静動判定部202−2は、静止を示す静動判定を領域判定部203−1および領域判定部203−2に供給する。
【0178】
静動判定部202−3は、フレーム#nの領域特定の対象である画素の画素値、およびフレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n-1の画素の画素値をフレームメモリ201から読み出して、画素値の差の絶対値を算出する。静動判定部202−3は、フレーム#nの画素値とフレーム#n-1の画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、画素値の差の絶対値が、閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部203−2および領域判定部203−3に供給する。フレーム#nの画素の画素値とフレーム#n-1の画素の画素値との差の絶対値が、閾値Th以下であると判定された場合、静動判定部202−3は、静止を示す静動判定を領域判定部203−2および領域判定部203−3に供給する。
【0179】
静動判定部202−4は、フレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n-1の画素の画素値、およびフレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n-2の画素の画素値をフレームメモリ201から読み出して、画素値の差の絶対値を算出する。静動判定部202−4は、フレーム#n-1の画素値とフレーム#n-2の画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、画素値の差の絶対値が、閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部203−3に供給する。フレーム#n-1の画素の画素値とフレーム#n-2の画素の画素値との差の絶対値が、閾値Th以下であると判定された場合、静動判定部202−4は、静止を示す静動判定を領域判定部203−3に供給する。
【0180】
領域判定部203−1は、静動判定部202−1から供給された静動判定が静止を示し、かつ、静動判定部202−2から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素がアンカバードバックグラウンド領域に属すると判定し、領域の判定される画素に対応するアンカバードバックグラウンド領域判定フラグに、アンカバードバックグラウンド領域に属することを示す”1”を設定する。
【0181】
領域判定部203−1は、静動判定部202−1から供給された静動判定が動きを示すか、または、静動判定部202−2から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素がアンカバードバックグラウンド領域に属しないと判定し、領域の判定される画素に対応するアンカバードバックグラウンド領域判定フラグに、アンカバードバックグラウンド領域に属しないことを示す”0”を設定する。
【0182】
領域判定部203−1は、このように”1”または”0”が設定されたアンカバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ204に供給する。
【0183】
領域判定部203−2は、静動判定部202−2から供給された静動判定が静止を示し、かつ、静動判定部202−3から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素が静止領域に属すると判定し、領域の判定される画素に対応する静止領域判定フラグに、静止領域に属することを示す”1”を設定する。
【0184】
領域判定部203−2は、静動判定部202−2から供給された静動判定が動きを示すか、または、静動判定部202−3から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素が静止領域に属しないと判定し、領域の判定される画素に対応する静止領域判定フラグに、静止領域に属しないことを示す”0”を設定する。
【0185】
領域判定部203−2は、このように”1”または”0”が設定された静止領域判定フラグを判定フラグ格納フレームメモリ204に供給する。
【0186】
領域判定部203−2は、静動判定部202−2から供給された静動判定が動きを示し、かつ、静動判定部202−3から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素が動き領域に属すると判定し、領域の判定される画素に対応する動き領域判定フラグに、動き領域に属することを示す”1”を設定する。
【0187】
領域判定部203−2は、静動判定部202−2から供給された静動判定が静止を示すか、または、静動判定部202−3から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素が動き領域に属しないと判定し、領域の判定される画素に対応する動き領域判定フラグに、動き領域に属しないことを示す”0”を設定する。
【0188】
領域判定部203−2は、このように”1”または”0”が設定された動き領域判定フラグを判定フラグ格納フレームメモリ204に供給する。
【0189】
領域判定部203−3は、静動判定部202−3から供給された静動判定が動きを示し、かつ、静動判定部202−4から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素がカバードバックグラウンド領域に属すると判定し、領域の判定される画素に対応するカバードバックグラウンド領域判定フラグに、カバードバックグラウンド領域に属することを示す”1”を設定する。
【0190】
領域判定部203−3は、静動判定部202−3から供給された静動判定が静止を示すか、または、静動判定部202−4から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素がカバードバックグラウンド領域に属しないと判定し、領域の判定される画素に対応するカバードバックグラウンド領域判定フラグに、カバードバックグラウンド領域に属しないことを示す”0”を設定する。
【0191】
領域判定部203−3は、このように”1”または”0”が設定されたカバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ204に供給する。
【0192】
判定フラグ格納フレームメモリ204は、領域判定部203−1から供給されたアンカバードバックグラウンド領域判定フラグ、領域判定部203−2から供給された静止領域判定フラグ、領域判定部203−2から供給された動き領域判定フラグ、および領域判定部203−3から供給されたカバードバックグラウンド領域判定フラグをそれぞれ記憶する。
【0193】
判定フラグ格納フレームメモリ204は、記憶しているアンカバードバックグラウンド領域判定フラグ、静止領域判定フラグ、動き領域判定フラグ、およびカバードバックグラウンド領域判定フラグを合成部205に供給する。合成部205は、判定フラグ格納フレームメモリ204から供給された、アンカバードバックグラウンド領域判定フラグ、静止領域判定フラグ、動き領域判定フラグ、およびカバードバックグラウンド領域判定フラグを基に、各画素が、アンカバードバックグラウンド領域、静止領域、動き領域、およびカバードバックグラウンド領域のいずれかに属することを示す領域情報を生成し、判定フラグ格納フレームメモリ206に供給する。
【0194】
判定フラグ格納フレームメモリ206は、合成部205から供給された領域情報を記憶すると共に、記憶している領域情報を出力する。
【0195】
次に、領域特定部103の処理の例を図21乃至図25を参照して説明する。
【0196】
前景に対応するオブジェクトが移動しているとき、オブジェクトに対応する画像の画面上の位置は、フレーム毎に変化する。図21に示すように、フレーム#nにおいて、Yn(x,y)で示される位置に位置するオブジェクトに対応する画像は、次のフレームであるフレーム#n+1において、Yn+1(x,y)に位置する。
【0197】
前景のオブジェクトに対応する画像の動き方向に隣接して1列に並ぶ画素の画素値を時間方向に展開したモデル図を図24に示す。例えば、前景のオブジェクトに対応する画像の動き方向が画面に対して水平であるとき、図22におけるモデル図は、1つのライン上の隣接する画素の画素値を時間方向に展開したモデルを示す。
【0198】
図22において、フレーム#nにおけるラインは、フレーム#n+1におけるラインと同一である。
【0199】
フレーム#nにおいて、左から2番目の画素乃至13番目の画素に含まれているオブジェクトに対応する前景の成分は、フレーム#n+1において、左から6番目乃至17番目の画素に含まれる。
【0200】
フレーム#nにおいて、カバードバックグラウンド領域に属する画素は、左から11番目乃至13番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から2番目乃至4番目の画素である。フレーム#n+1において、カバードバックグラウンド領域に属する画素は、左から15番目乃至17番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から6番目乃至8番目の画素である。
【0201】
図22に示す例において、フレーム#nに含まれる前景の成分が、フレーム#n+1において4画素移動しているので、動き量vは、4である。仮想分割数は、動き量vに対応し、4である。
【0202】
次に、注目しているフレームの前後における混合領域に属する画素の画素値の変化について説明する。
【0203】
図23に示す、背景が静止し、前景の動き量vが4であるフレーム#nにおいて、カバードバックグラウンド領域に属する画素は、左から15番目乃至17番目の画素である。動き量vが4であるので、1つ前のフレーム#n-1において、左から15番目乃至17番目の画素は、背景の成分のみを含み、背景領域に属する。また、更に1つ前のフレーム#n-2において、左から15番目乃至17番目の画素は、背景の成分のみを含み、背景領域に属する。
【0204】
ここで、背景に対応するオブジェクトが静止しているので、フレーム#n-1の左から15番目の画素の画素値は、フレーム#n-2の左から15番目の画素の画素値から変化しない。同様に、フレーム#n-1の左から16番目の画素の画素値は、フレーム#n-2の左から16番目の画素の画素値から変化せず、フレーム#n-1の左から17番目の画素の画素値は、フレーム#n-2の左から17番目の画素の画素値から変化しない。
【0205】
すなわち、フレーム#nにおけるカバードバックグラウンド領域に属する画素に対応する、フレーム#n-1およびフレーム#n-2の画素は、背景の成分のみから成り、画素値が変化しないので、その差の絶対値は、ほぼ0の値となる。従って、フレーム#nにおける混合領域に属する画素に対応する、フレーム#n-1およびフレーム#n-2の画素に対する静動判定は、静動判定部202−4により、静止と判定される。
【0206】
フレーム#nにおけるカバードバックグラウンド領域に属する画素は、前景の成分を含むので、フレーム#n-1における背景の成分のみから成る場合と、画素値が異なる。従って、フレーム#nにおける混合領域に属する画素、および対応するフレーム#n-1の画素に対する静動判定は、静動判定部202−3により、動きと判定される。
【0207】
このように、領域判定部203−3は、静動判定部202−3から動きを示す静動判定の結果が供給され、静動判定部202−4から静止を示す静動判定の結果が供給されたとき、対応する画素がカバードバックグラウンド領域に属すると判定する。
【0208】
図24に示す、背景が静止し、前景の動き量vが4であるフレーム#nにおいて、アンカバードバックグラウンド領域に含まれる画素は、左から2番目乃至4番目の画素である。動き量vが4であるので、1つ後のフレーム#n+1において、左から2番目乃至4番目の画素は、背景の成分のみを含み、背景領域に属する。また、更に1つ後のフレーム#n+2において、左から2番目乃至4番目の画素は、背景の成分のみを含み、背景領域に属する。
【0209】
ここで、背景に対応するオブジェクトが静止しているので、フレーム#n+2の左から2番目の画素の画素値は、フレーム#n+1の左から2番目の画素の画素値から変化しない。同様に、フレーム#n+2の左から3番目の画素の画素値は、フレーム#n+1の左から3番目の画素の画素値から変化せず、フレーム#n+2の左から4番目の画素の画素値は、フレーム#n+1の左から4番目の画素の画素値から変化しない。
【0210】
すなわち、フレーム#nにおけるアンカバードバックグラウンド領域に属する画素に対応する、フレーム#n+1およびフレーム#n+2の画素は、背景の成分のみから成り、画素値が変化しないので、その差の絶対値は、ほぼ0の値となる。従って、フレーム#nにおける混合領域に属する画素に対応する、フレーム#n+1およびフレーム#n+2の画素に対する静動判定は、静動判定部202−1により、静止と判定される。
【0211】
フレーム#nにおけるアンカバードバックグラウンド領域に属する画素は、前景の成分を含むので、フレーム#n+1における背景の成分のみから成る場合と、画素値が異なる。従って、フレーム#nにおける混合領域に属する画素、および対応するフレーム#n+1の画素に対する静動判定は、静動判定部202−2により、動きと判定される。
【0212】
このように、領域判定部203−1は、静動判定部202−2から動きを示す静動判定の結果が供給され、静動判定部202−1から静止を示す静動判定の結果が供給されたとき、対応する画素がアンカバードバックグラウンド領域に属すると判定する。
【0213】
図25は、フレーム#nにおける領域特定部103の判定条件を示す図である。フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-2の画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素とが静止と判定され、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素と、フレーム#nの画素とが動きと判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素がカバードバックグラウンド領域に属すると判定する。
【0214】
フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素と、フレーム#nの画素とが静止と判定され、フレーム#nの画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素とが静止と判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素が静止領域に属すると判定する。
【0215】
フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素と、フレーム#nの画素とが動きと判定され、フレーム#nの画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素とが動きと判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素が動き領域に属すると判定する。
【0216】
フレーム#nの画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素とが動きと判定され、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+2の画素とが静止と判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素がアンカバードバックグラウンド領域に属すると判定する。
【0217】
図26は、領域特定部103の領域の特定の結果の例を示す図である。図26(A)において、カバードバックグラウンド領域に属すると判定された画素は、白で表示されている。図26(B)において、アンカバードバックグラウンド領域に属すると判定された画素は、白で表示されている。
【0218】
図26(C)において、動き領域に属すると判定された画素は、白で表示されている。図26(D)において、静止領域に属すると判定された画素は、白で表示されている。
【0219】
図27は、判定フラグ格納フレームメモリ206が出力する領域情報の内、混合領域を示す領域情報を画像として示す図である。図27において、カバードバックグラウンド領域またはアンカバードバックグラウンド領域に属すると判定された画素、すなわち混合領域に属すると判定された画素は、白で表示されている。判定フラグ格納フレームメモリ206が出力する混合領域を示す領域情報は、混合領域、および前景領域内のテクスチャの無い部分に囲まれたテクスチャの有る部分を示す。
【0220】
次に、図28のフローチャートを参照して、領域特定部103の領域特定の処理を説明する。ステップS201において、フレームメモリ201は、判定の対象となるフレーム#nを含むフレーム#n-2乃至フレーム#n+2の画像を取得する。
【0221】
ステップS202において、静動判定部202−3は、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、静止か否かを判定し、静止と判定された場合、ステップS203に進み、静動判定部202−2は、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止か否かを判定する。
【0222】
ステップS203において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止と判定された場合、ステップS204に進み、領域判定部203−2は、領域の判定される画素に対応する静止領域判定フラグに、静止領域に属することを示す”1”を設定する。領域判定部203−2は、静止領域判定フラグを判定フラグ格納フレームメモリ204に供給し、手続きは、ステップS205に進む。
【0223】
ステップS202において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きと判定された場合、または、ステップS203において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きと判定された場合、フレーム#nの画素が静止領域には属さないので、ステップS204の処理はスキップされ、手続きは、ステップS205に進む。
【0224】
ステップS205において、静動判定部202−3は、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きか否かを判定し、動きと判定された場合、ステップS206に進み、静動判定部202−2は、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きか否かを判定する。
【0225】
ステップS206において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きと判定された場合、ステップS207に進み、領域判定部203−2は、領域の判定される画素に対応する動き領域判定フラグに、動き領域に属することを示す”1”を設定する。領域判定部203−2は、動き領域判定フラグを判定フラグ格納フレームメモリ204に供給し、手続きは、ステップS208に進む。
【0226】
ステップS205において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、静止と判定された場合、または、ステップS206において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止と判定された場合、フレーム#nの画素が動き領域には属さないので、ステップS207の処理はスキップされ、手続きは、ステップS208に進む。
【0227】
ステップS208において、静動判定部202−4は、フレーム#n-2の画素とフレーム#n-1の同一位置の画素とで、静止か否かを判定し、静止と判定された場合、ステップS209に進み、静動判定部202−3は、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きか否かを判定する。
【0228】
ステップS209において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きと判定された場合、ステップS210に進み、領域判定部203−3は、領域の判定される画素に対応するカバードバックグラウンド領域判定フラグに、カバードバックグラウンド領域に属することを示す”1”を設定する。領域判定部203−3は、カバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ204に供給し、手続きは、ステップS211に進む。
【0229】
ステップS208において、フレーム#n-2の画素とフレーム#n-1の同一位置の画素とで、動きと判定された場合、または、ステップS209において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、静止と判定された場合、フレーム#nの画素がカバードバックグラウンド領域には属さないので、ステップS210の処理はスキップされ、手続きは、ステップS211に進む。
【0230】
ステップS211において、静動判定部202−2は、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きか否かを判定し、動きと判定された場合、ステップS212に進み、静動判定部202−1は、フレーム#n+1の画素とフレーム#n+2の同一位置の画素とで、静止か否かを判定する。
【0231】
ステップS212において、フレーム#n+1の画素とフレーム#n+2の同一位置の画素とで、静止と判定された場合、ステップS213に進み、領域判定部203−1は、領域の判定される画素に対応するアンカバードバックグラウンド領域判定フラグに、アンカバードバックグラウンド領域に属することを示す”1”を設定する。領域判定部203−1は、アンカバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ204に供給し、手続きは、ステップS214に進む。
【0232】
ステップS211において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止と判定された場合、または、ステップS212において、フレーム#n+1の画素とフレーム#n+2の同一位置の画素とで、動きと判定された場合、フレーム#nの画素がアンカバードバックグラウンド領域には属さないので、ステップS213の処理はスキップされ、手続きは、ステップS214に進む。
【0233】
ステップS214において、領域特定部103は、フレーム#nの全ての画素について領域を特定したか否かを判定し、フレーム#nの全ての画素について領域を特定していないと判定された場合、手続きは、ステップS202に戻り、他の画素について、領域特定の処理を繰り返す。
【0234】
ステップS214において、フレーム#nの全ての画素について領域を特定したと判定された場合、ステップS215に進み、合成部205は、判定フラグ格納フレームメモリ204に記憶されているアンカバードバックグラウンド領域判定フラグ、およびカバードバックグラウンド領域判定フラグを基に、混合領域を示す領域情報を生成し、更に、各画素が、アンカバードバックグラウンド領域、静止領域、動き領域、およびカバードバックグラウンド領域のいずれかに属することを示す領域情報を生成し、生成した領域情報を判定フラグ格納フレームメモリ206に設定し、処理は終了する。
【0235】
このように、領域特定部103は、フレームに含まれている画素のそれぞれについて、動き領域、静止領域、アンカバードバックグラウンド領域、またはカバードバックグラウンド領域に属することを示す領域情報を生成することができる。
【0236】
なお、領域特定部103は、アンカバードバックグラウンド領域およびカバードバックグラウンド領域に対応する領域情報に論理和を適用することにより、混合領域に対応する領域情報を生成して、フレームに含まれている画素のそれぞれについて、動き領域、静止領域、または混合領域に属することを示すフラグから成る領域情報を生成するようにしてもよい。
【0237】
前景に対応するオブジェクトがテクスチャを有す場合、領域特定部103は、より正確に動き領域を特定することができる。
【0238】
領域特定部103は、動き領域を示す領域情報を前景領域を示す領域情報として、また、静止領域を示す領域情報を背景領域を示す領域情報として出力することができる。
【0239】
なお、背景に対応するオブジェクトが静止しているとして説明したが、背景領域に対応する画像が動きを含んでいても上述した領域を特定する処理を適用することができる。例えば、背景領域に対応する画像が一様に動いているとき、領域特定部103は、この動きに対応して画像全体をシフトさせ、背景に対応するオブジェクトが静止している場合と同様に処理する。また、背景領域に対応する画像が局所毎に異なる動きを含んでいるとき、領域特定部103は、動きに対応した画素を選択して、上述の処理を実行する。
【0240】
図29は、領域特定部103の構成の他の例を示すブロック図である。図29に示す領域特定部103は、動きベクトルを使用しない。背景画像生成部301は、入力画像に対応する背景画像を生成し、生成した背景画像を2値オブジェクト画像抽出部302に供給する。背景画像生成部301は、例えば、入力画像に含まれる背景のオブジェクトに対応する画像オブジェクトを抽出して、背景画像を生成する。
【0241】
前景のオブジェクトに対応する画像の動き方向に隣接して1列に並ぶ画素の画素値を時間方向に展開したモデル図の例を図30に示す。例えば、前景のオブジェクトに対応する画像の動き方向が画面に対して水平であるとき、図30におけるモデル図は、1つのライン上の隣接する画素の画素値を時間方向に展開したモデルを示す。
【0242】
図30において、フレーム#nにおけるラインは、フレーム#n-1およびフレーム#n+1におけるラインと同一である。
【0243】
フレーム#nにおいて、左から6番目の画素乃至17番目の画素に含まれているオブジェクトに対応する前景の成分は、フレーム#n-1において、左から2番目乃至13番目の画素に含まれ、フレーム#n+1において、左から10番目乃至21番目の画素に含まれる。
【0244】
フレーム#n-1において、カバードバックグラウンド領域に属する画素は、左から11番目乃至13番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から2番目乃至4番目の画素である。フレーム#nにおいて、カバードバックグラウンド領域に属する画素は、左から15番目乃至17番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から6番目乃至8番目の画素である。フレーム#n+1において、カバードバックグラウンド領域に属する画素は、左から19番目乃至21番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から10番目乃至12番目の画素である。
【0245】
フレーム#n-1において、背景領域に属する画素は、左から1番目の画素、および左から14番目乃至21番目の画素である。フレーム#nにおいて、背景領域に属する画素は、左から1番目乃至5番目の画素、および左から18番目乃至21番目の画素である。フレーム#n+1において、背景領域に属する画素は、左から1番目乃至9番目の画素である。
【0246】
背景画像生成部301が生成する、図30の例に対応する背景画像の例を図31に示す。背景画像は、背景のオブジェクトに対応する画素から構成され、前景のオブジェクトに対応する画像の成分を含まない。
【0247】
2値オブジェクト画像抽出部302は、背景画像および入力画像の相関を基に、2値オブジェクト画像を生成し、生成した2値オブジェクト画像を時間変化検出部303に供給する。
【0248】
図32は、2値オブジェクト画像抽出部302の構成を示すブロック図である。相関値演算部321は、背景画像生成部301から供給された背景画像および入力画像の相関を演算し、相関値を生成して、生成した相関値をしきい値処理部322に供給する。
【0249】
相関値演算部321は、例えば、図33(A)に示すように、X4を中心とした3×3の背景画像の中のブロックと、図33(B)に示すように、背景画像の中のブロックに対応するY4を中心とした3×3の入力画像の中のブロックに、式(4)を適用して、Y4に対応する相関値を算出する。
【0250】
【数2】
Figure 0004596205
【0251】
【数3】
Figure 0004596205
【0252】
【数4】
Figure 0004596205
【0253】
相関値演算部321は、このように各画素に対応して算出された相関値をしきい値処理部322に供給する。
【0254】
また、相関値演算部321は、例えば、図34(A)に示すように、X4を中心とした3×3の背景画像の中のブロックと、図34(B)に示すように、背景画像の中のブロックに対応するY4を中心とした3×3の入力画像の中のブロックに、式(7)を適用して、Y4に対応する差分絶対値和を算出するようにしてもよい。
【0255】
【数5】
Figure 0004596205
【0256】
相関値演算部321は、このように算出された差分絶対値和を相関値として、しきい値処理部322に供給する。
【0257】
しきい値処理部322は、相関画像の画素値としきい値th0とを比較して、相関値がしきい値th0以下である場合、2値オブジェクト画像の画素値に1を設定し、相関値がしきい値th0より大きい場合、2値オブジェクト画像の画素値に0を設定して、0または1が画素値に設定された2値オブジェクト画像を出力する。しきい値処理部322は、しきい値th0を予め記憶するようにしてもよく、または、外部から入力されたしきい値th0を使用するようにしてもよい。
【0258】
図35は、図30に示す入力画像のモデルに対応する2値オブジェクト画像の例を示す図である。2値オブジェクト画像において、背景画像と相関の高い画素には、画素値に0が設定される。
【0259】
図36は、時間変化検出部303の構成を示すブロック図である。フレームメモリ341は、フレーム#nの画素について領域を判定するとき、2値オブジェクト画像抽出部302から供給された、フレーム#n-1、フレーム#n、およびフレーム#n+1の2値オブジェクト画像を記憶する。
【0260】
領域判定部342は、フレームメモリ341に記憶されているフレーム#n-1、フレーム#n、およびフレーム#n+1の2値オブジェクト画像を基に、フレーム#nの各画素について領域を判定して、領域情報を生成し、生成した領域情報を出力する。
【0261】
図37は、領域判定部342の判定を説明する図である。フレーム#nの2値オブジェクト画像の注目している画素が0であるとき、領域判定部342は、フレーム#nの注目している画素が背景領域に属すると判定する。
【0262】
フレーム#nの2値オブジェクト画像の注目している画素が1であり、フレーム#n-1の2値オブジェクト画像の対応する画素が1であり、フレーム#n+1の2値オブジェクト画像の対応する画素が1であるとき、領域判定部342は、フレーム#nの注目している画素が前景領域に属すると判定する。
【0263】
フレーム#nの2値オブジェクト画像の注目している画素が1であり、フレーム#n-1の2値オブジェクト画像の対応する画素が0であるとき、領域判定部342は、フレーム#nの注目している画素がカバードバックグラウンド領域に属すると判定する。
【0264】
フレーム#nの2値オブジェクト画像の注目している画素が1であり、フレーム#n+1の2値オブジェクト画像の対応する画素が0であるとき、領域判定部342は、フレーム#nの注目している画素がアンカバードバックグラウンド領域に属すると判定する。
【0265】
図38は、図30に示す入力画像のモデルに対応する2値オブジェクト画像について、時間変化検出部303の判定した例を示す図である。時間変化検出部303は、2値オブジェクト画像のフレーム#nの対応する画素が0なので、フレーム#nの左から1番目乃至5番目の画素を背景領域に属すると判定する。
【0266】
時間変化検出部303は、2値オブジェクト画像のフレーム#nの画素が1であり、フレーム#n+1の対応する画素が0なので、左から6番目乃至9番目の画素をアンカバードバックグラウンド領域に属すると判定する。
【0267】
時間変化検出部303は、2値オブジェクト画像のフレーム#nの画素が1であり、フレーム#n-1の対応する画素が1であり、フレーム#n+1の対応する画素が1なので、左から10番目乃至13番目の画素を前景領域に属すると判定する。
【0268】
時間変化検出部303は、2値オブジェクト画像のフレーム#nの画素が1であり、フレーム#n-1の対応する画素が0なので、左から14番目乃至17番目の画素をカバードバックグラウンド領域に属すると判定する。
【0269】
時間変化検出部303は、2値オブジェクト画像のフレーム#nの対応する画素が0なので、左から18番目乃至21番目の画素を背景領域に属すると判定する。
【0270】
次に、図39のフローチャートを参照して、領域判定部103の領域特定の処理を説明する。ステップS301において、領域判定部103の背景画像生成部301は、入力画像を基に、例えば、入力画像に含まれる背景のオブジェクトに対応する画像オブジェクトを抽出して背景画像を生成し、生成した背景画像を2値オブジェクト画像抽出部302に供給する。
【0271】
ステップS302において、2値オブジェクト画像抽出部302は、例えば、図33を参照して説明した演算により、入力画像と背景画像生成部301から供給された背景画像との相関値を演算する。ステップS303において、2値オブジェクト画像抽出部302は、例えば、相関値としきい値th0とを比較することにより、相関値およびしきい値th0から2値オブジェクト画像を演算する。
【0272】
ステップS304において、時間変化検出部303は、領域判定の処理を実行して、処理は終了する。
【0273】
図40のフローチャートを参照して、ステップS304に対応する領域判定の処理の詳細を説明する。ステップS321において、時間変化検出部303の領域判定部342は、フレームメモリ341に記憶されているフレーム#nにおいて、注目する画素が0であるか否かを判定し、フレーム#nにおいて、注目する画素が0であると判定された場合、ステップS322に進み、フレーム#nの注目する画素が背景領域に属すると設定して、処理は終了する。
【0274】
ステップS321において、フレーム#nにおいて、注目する画素が1であると判定された場合、ステップS323に進み、時間変化検出部303の領域判定部342は、フレームメモリ341に記憶されているフレーム#nにおいて、注目する画素が1であり、かつ、フレーム#n-1において、対応する画素が0であるか否かを判定し、フレーム#nにおいて、注目する画素が1であり、かつ、フレーム#n-1において、対応する画素が0であると判定された場合、ステップS324に進み、フレーム#nの注目する画素がカバードバックグラウンド領域に属すると設定して、処理は終了する。
【0275】
ステップS323において、フレーム#nにおいて、注目する画素が0であるか、または、フレーム#n-1において、対応する画素が1であると判定された場合、ステップS325に進み、時間変化検出部303の領域判定部342は、フレームメモリ341に記憶されているフレーム#nにおいて、注目する画素が1であり、かつ、フレーム#n+1において、対応する画素が0であるか否かを判定し、フレーム#nにおいて、注目する画素が1であり、かつ、フレーム#n+1において、対応する画素が0であると判定された場合、ステップS326に進み、フレーム#nの注目する画素がアンカバードバックグラウンド領域に属すると設定して、処理は終了する。
【0276】
ステップS325において、フレーム#nにおいて、注目する画素が0であるか、または、フレーム#n+1において、対応する画素が1であると判定された場合、ステップS327に進み、時間変化検出部303の領域判定部342は、フレーム#nの注目する画素を前景領域と設定して、処理は終了する。
【0277】
このように、領域特定部103は、入力された画像と対応する背景画像との相関値を基に、入力画像の画素が前景領域、背景領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域のいずれかに属するかを特定して、特定した結果に対応する領域情報を生成することができる。
【0278】
図41は、領域特定部103の他の構成を示すブロック図である。図41に示す領域特定部103は、動き検出部102から供給される動きベクトルとその位置情報を使用する。図29に示す場合と同様の部分には、同一の番号を付してあり、その説明は省略する。
【0279】
ロバスト化部361は、2値オブジェクト画像抽出部302から供給された、N個のフレームの2値オブジェクト画像を基に、ロバスト化された2値オブジェクト画像を生成して、時間変化検出部303に出力する。
【0280】
図42は、ロバスト化部361の構成を説明するブロック図である。動き補償部381は、動き検出部102から供給された動きベクトルとその位置情報を基に、N個のフレームの2値オブジェクト画像の動きを補償して、動きが補償された2値オブジェクト画像をスイッチ382に出力する。
【0281】
図43および図44の例を参照して、動き補償部381の動き補償について説明する。例えば、フレーム#nの領域を判定するとき、図43に例を示すフレーム#n-1、フレーム#n、およびフレーム#n+1の2値オブジェクト画像が入力された場合、動き補償部381は、動き検出部102から供給された動きベクトルを基に、図44に例を示すように、フレーム#n-1の2値オブジェクト画像、およびフレーム#n+1の2値オブジェクト画像を動き補償して、動き補償された2値オブジェクト画像をスイッチ382に供給する。
【0282】
スイッチ382は、1番目のフレームの動き補償された2値オブジェクト画像をフレームメモリ383−1に出力し、2番目のフレームの動き補償された2値オブジェクト画像をフレームメモリ383−2に出力する。同様に、スイッチ382は、3番目乃至N−1番目のフレームの動き補償された2値オブジェクト画像のそれぞれをフレームメモリ383−3乃至フレームメモリ383−(N−1)のいずれかに出力し、N番目のフレームの動き補償された2値オブジェクト画像をフレームメモリ383−Nに出力する。
【0283】
フレームメモリ383−1は、1番目のフレームの動き補償された2値オブジェクト画像を記憶し、記憶されている2値オブジェクト画像を重み付け部384−1に出力する。フレームメモリ383−2は、2番目のフレームの動き補償された2値オブジェクト画像を記憶し、記憶されている2値オブジェクト画像を重み付け部384−2に出力する。
【0284】
同様に、フレームメモリ383−3乃至フレームメモリ383−(N−1)のそれぞれは、3番目のフレーム乃至N−1番目のフレームの動き補償された2値オブジェクト画像のいずれかを記憶し、記憶されている2値オブジェクト画像を重み付け部384−3乃至重み付け部384−(N−1)のいずれかに出力する。フレームメモリ383−Nは、N番目のフレームの動き補償された2値オブジェクト画像を記憶し、記憶されている2値オブジェクト画像を重み付け部384−Nに出力する。
【0285】
重み付け部384−1は、フレームメモリ383−1から供給された1番目のフレームの動き補償された2値オブジェクト画像の画素値に予め定めた重みw1を乗じて、積算部385に供給する。重み付け部384−2は、フレームメモリ383−2から供給された2番目のフレームの動き補償された2値オブジェクト画像の画素値に予め定めた重みw2を乗じて、積算部385に供給する。
【0286】
同様に、重み付け部384−3乃至重み付け部384−(N−1)のそれぞれは、フレームメモリ383−3乃至フレームメモリ383−(N−1)のいずれかから供給された3番目乃至N−1番目のいずれかのフレームの動き補償された2値オブジェクト画像の画素値に予め定めた重みw3乃至重みw(N-1)のいずれかを乗じて、積算部385に供給する。重み付け部384−Nは、フレームメモリ383−Nから供給されたN番目のフレームの動き補償された2値オブジェクト画像の画素値に予め定めた重みwNを乗じて、積算部385に供給する。
【0287】
積算部385は、1乃至N番目のフレームの動き補償され、それぞれ重みw1乃至wNのいずれかが乗じられた、2値オブジェクト画像の対応する画素値を積算して、積算された画素値を予め定めたしきい値th0と比較することにより2値オブジェクト画像を生成する。
【0288】
このように、ロバスト化部361は、N個の2値オブジェクト画像からロバスト化された2値オブジェト画像を生成して、時間変化検出部303に供給するので、図41に構成を示す領域特定部103は、入力画像にノイズが含まれていても、図29に示す場合に比較して、より正確に領域を特定することができる。
【0289】
次に、図41に構成を示す領域特定部103の領域特定の処理について、図45のフローチャートを参照して説明する。ステップS341乃至ステップS343の処理は、図39のフローチャートで説明したステップS301乃至ステップS303とそれぞれ同様なのでその説明は省略する。
【0290】
ステップS344において、ロバスト化部361は、ロバスト化の処理を実行する。
【0291】
ステップS345において、時間変化検出部303は、領域判定の処理を実行して、処理は終了する。ステップS345の処理の詳細は、図40のフローチャートを参照して説明した処理と同様なのでその説明は省略する。
【0292】
次に、図46のフローチャートを参照して、図45のステップS344の処理に対応する、ロバスト化の処理の詳細について説明する。ステップS361において、動き補償部381は、動き検出部102から供給される動きベクトルとその位置情報を基に、入力された2値オブジェクト画像の動き補償の処理を実行する。ステップS362において、フレームメモリ383−1乃至383−Nのいずれかは、スイッチ382を介して供給された動き補償された2値オブジェクト画像を記憶する。
【0293】
ステップS363において、ロバスト化部361は、N個の2値オブジェクト画像が記憶されたか否かを判定し、N個の2値オブジェクト画像が記憶されていないと判定された場合、ステップS361に戻り、2値オブジェクト画像の動き補償の処理および2値オブジェクト画像の記憶の処理を繰り返す。
【0294】
ステップS363において、N個の2値オブジェクト画像が記憶されたと判定された場合、ステップS364に進み、重み付け部384−1乃至384−Nのそれぞれは、N個の2値オブジェクト画像のそれぞれにw1乃至wNのいずれかの重みを乗じて、重み付けする。
【0295】
ステップS365において、積算部385は、重み付けされたN個の2値オブジェクト画像を積算する。
【0296】
ステップS366において、積算部385は、例えば、予め定められたしきい値th1との比較などにより、積算された画像から2値オブジェクト画像を生成して、処理は終了する。
【0297】
このように、図41に構成を示す領域特定部103は、ロバスト化された2値オブジェクト画像を基に、領域情報を生成することができる。
【0298】
以上のように、領域特定部103は、フレームに含まれている画素のそれぞれについて、動き領域、静止領域、アンカバードバックグラウンド領域、またはカバードバックグラウンド領域に属することを示す領域情報を生成することができる。
【0299】
図47は、混合比算出部104の構成の一例を示すブロック図である。推定混合比処理部401は、入力画像を基に、カバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を混合比決定部403に供給する。
【0300】
推定混合比処理部402は、入力画像を基に、アンカバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を混合比決定部403に供給する。
【0301】
前景に対応するオブジェクトがシャッタ時間内に等速で動いていると仮定できるので、混合領域に属する画素の混合比αは、以下の性質を有する。すなわち、混合比αは、画素の位置の変化に対応して、直線的に変化する。画素の位置の変化を1次元とすれば、混合比αの変化は、直線で表現することができ、画素の位置の変化を2次元とすれば、混合比αの変化は、平面で表現することができる。
【0302】
なお、1フレームの期間は短いので、前景に対応するオブジェクトが剛体であり、等速で移動していると仮定が成り立つ。
【0303】
この場合、混合比αの傾きは、前景のシャッタ時間内での動き量vの逆比となる。
【0304】
理想的な混合比αの例を図48に示す。理想的な混合比αの混合領域における傾きlは、動き量vの逆数として表すことができる。
【0305】
図48に示すように、理想的な混合比αは、背景領域において、1の値を有し、前景領域において、0の値を有し、混合領域において、0を越え1未満の値を有する。
【0306】
図49の例において、フレーム#nの左から7番目の画素の画素値C06は、フレーム#n-1の左から7番目の画素の画素値P06を用いて、式(8)で表すことができる。
【0307】
【数6】
Figure 0004596205
【0308】
式(8)において、画素値C06を混合領域の画素の画素値Mと、画素値P06を背景領域の画素の画素値Bと表現する。すなわち、混合領域の画素の画素値Mおよび背景領域の画素の画素値Bは、それぞれ、式(9)および式(10)のように表現することができる。
【0309】
M=C06 (9)
B=P06 (10)
【0310】
式(8)中の2/vは、混合比αに対応する。動き量vが4なので、フレーム#nの左から7番目の画素の混合比αは、0.5となる。
【0311】
以上のように、注目しているフレーム#nの画素値Cを混合領域の画素値と見なし、フレーム#nの前のフレーム#n-1の画素値Pを背景領域の画素値と見なすことで、混合比αを示す式(3)は、式(11)のように書き換えられる。
【0312】
C=α・P+f (11)
式(11)のfは、注目している画素に含まれる前景の成分の和ΣiFi/vである。
式(11)に含まれる変数は、混合比αおよび前景の成分の和fの2つである。
【0313】
同様に、アンカバードバックグラウンド領域における、動き量vが4であり、時間方向の仮想分割数が4である、画素値を時間方向に展開したモデルを図50に示す。
【0314】
アンカバードバックグラウンド領域において、上述したカバードバックグラウンド領域における表現と同様に、注目しているフレーム#nの画素値Cを混合領域の画素値と見なし、フレーム#nの後のフレーム#n+1の画素値Nを背景領域の画素値と見なすことで、混合比αを示す式(3)は、式(12)のように表現することができる。
【0315】
C=α・N+f (12)
【0316】
なお、背景のオブジェクトが静止しているとして説明したが、背景のオブジェクトが動いている場合においても、背景の動き量vに対応させた位置の画素の画素値を利用することにより、式(8)乃至式(12)を適用することができる。例えば、図49において、背景に対応するオブジェクトの動き量vが2であり、仮想分割数が2であるとき、背景に対応するオブジェクトが図中の右側に動いているとき、式(10)における背景領域の画素の画素値Bは、画素値P04とされる。
【0317】
式(11)および式(12)は、それぞれ2つの変数を含むので、そのままでは混合比αを求めることができない。ここで、画像は一般的に空間的に相関が強いので近接する画素同士でほぼ同じ画素値となる。
【0318】
そこで、前景成分は、空間的に相関が強いので、前景の成分の和fを前または後のフレームから導き出せるように式を変形して、混合比αを求める。
【0319】
図51のフレーム#nの左から7番目の画素の画素値Mcは、式(13)で表すことができる。
【0320】
【数7】
Figure 0004596205
式(13)の右辺第1項の2/vは、混合比αに相当する。式(13)の右辺第2項は、後のフレーム#n+1の画素値を利用して、式(14)のように表すこととする。
【0321】
【数8】
Figure 0004596205
【0322】
ここで、前景の成分の空間相関を利用して、式(15)が成立するとする。
【0323】
F=F05=F06=F07=F08=F09=F10=F11=F12 (15)
式(14)は、式(15)を利用して、式(16)のように置き換えることができる。
【0324】
【数9】
Figure 0004596205
【0325】
結果として、βは、式(17)で表すことができる。
【0326】
β=2/4 (17)
【0327】
一般的に、式(15)に示すように混合領域に関係する前景の成分が等しいと仮定すると、混合領域の全ての画素について、内分比の関係から式(18)が成立する。
【0328】
β=1-α (18)
【0329】
式(18)が成立するとすれば、式(11)は、式(19)に示すように展開することができる。
【0330】
【数10】
Figure 0004596205
【0331】
同様に、式(18)が成立するとすれば、式(12)は、式(20)に示すように展開することができる。
【0332】
【数11】
Figure 0004596205
【0333】
式(19)および式(20)において、C,N、およびPは、既知の画素値なので、式(19)および式(20)に含まれる変数は、混合比αのみである。式(19)および式(20)における、C,N、およびPの関係を図52に示す。Cは、混合比αを算出する、フレーム#nの注目している画素の画素値である。Nは、注目している画素と空間方向の位置が対応する、フレーム#n+1の画素の画素値である。Pは、注目している画素と空間方向の位置が対応する、フレーム#n-1の画素の画素値である。
【0334】
従って、式(19)および式(20)のそれぞれに1つの変数が含まれることとなるので、3つのフレームの画素の画素値を利用して、混合比αを算出することができる。式(19)および式(20)を解くことにより、正しい混合比αが算出されるための条件は、混合領域に関係する前景の成分が等しい、すなわち、前景のオブジェクトが静止しているとき撮像された前景の画像オブジェクトにおいて、前景のオブジェクトの動きの方向に対応する、画像オブジェクトの境界に位置する画素であって、動き量vの2倍の数の連続している画素の画素値が、一定であることである。
【0335】
以上のように、カバードバックグラウンド領域に属する画素の混合比αは、式(21)により算出され、アンカバードバックグラウンド領域に属する画素の混合比αは、式(22)により算出される。
【0336】
α=(C-N)/(P-N) (21)
α=(C-P)/(N-P) (22)
【0337】
図53は、推定混合比処理部401の構成を示すブロック図である。フレームメモリ421は、入力された画像をフレーム単位で記憶し、入力画像として入力されているフレームから1つ後のフレームをフレームメモリ422および混合比演算部423に供給する。
【0338】
フレームメモリ422は、入力された画像をフレーム単位で記憶し、フレームメモリ421から供給されているフレームから1つ後のフレームを混合比演算部423に供給する。
【0339】
従って、入力画像としてフレーム#n+1が混合比演算部423に入力されているとき、フレームメモリ421は、フレーム#nを混合比演算部423に供給し、フレームメモリ422は、フレーム#n-1を混合比演算部423に供給する。
【0340】
混合比演算部423は、式(21)に示す演算により、フレーム#nの注目している画素の画素値C、注目している画素と空間的位置が対応する、フレーム#n+1の画素の画素値N、および注目している画素と空間的位置が対応する、フレーム#n-1の画素の画素値Pを基に、注目している画素の推定混合比を算出して、算出した推定混合比を出力する。例えば、背景が静止しているとき、混合比演算部423は、フレーム#nの注目している画素の画素値C、注目している画素とフレーム内の位置が同じ、フレーム#n+1の画素の画素値N、および注目している画素とフレーム内の位置が同じ、フレーム#n-1の画素の画素値Pを基に、注目している画素の推定混合比を算出して、算出した推定混合比を出力する。
【0341】
このように、推定混合比処理部401は、入力画像を基に、推定混合比を算出して、混合比決定部403に供給することができる。
【0342】
なお、推定混合比処理部402は、推定混合比処理部401が式(21)に示す演算により、注目している画素の推定混合比を算出するのに対して、式(22)に示す演算により、注目している画素の推定混合比を算出する部分が異なることを除き、推定混合比処理部401と同様なので、その説明は省略する。
【0343】
図54は、推定混合比処理部401により算出された推定混合比の例を示す図である。図54に示す推定混合比は、等速で動いているオブジェクトに対応する前景の動き量vが11である場合の結果を、1ラインに対して示すものである。
【0344】
推定混合比は、混合領域において、図48に示すように、ほぼ直線的に変化していることがわかる。
【0345】
図47に戻り、混合比決定部403は、領域特定部103から供給された、混合比αの算出の対象となる画素が、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す領域情報を基に、混合比αを設定する。混合比決定部403は、対象となる画素が前景領域に属する場合、0を混合比αに設定し、対象となる画素が背景領域に属する場合、1を混合比αに設定し、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部401から供給された推定混合比を混合比αに設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部402から供給された推定混合比を混合比αに設定する。混合比決定部403は、領域情報を基に設定した混合比αを出力する。
【0346】
図55は、混合比算出部104の他の構成を示すブロック図である。選択部441は、領域特定部103から供給された領域情報を基に、カバードバックグラウンド領域に属する画素および、これに対応する前および後のフレームの画素を推定混合比処理部442に供給する。選択部441は、領域特定部103から供給された領域情報を基に、アンカバードバックグラウンド領域に属する画素および、これに対応する前および後のフレームの画素を推定混合比処理部443に供給する。
【0347】
推定混合比処理部442は、選択部441から入力された画素値を基に、式(21)に示す演算により、カバードバックグラウンド領域に属する、注目している画素の推定混合比を算出して、算出した推定混合比を選択部444に供給する。
【0348】
推定混合比処理部443は、選択部441から入力された画素値を基に、式(22)に示す演算により、アンカバードバックグラウンド領域に属する、注目している画素の推定混合比を算出して、算出した推定混合比を選択部444に供給する。
【0349】
選択部444は、領域特定部103から供給された領域情報を基に、対象となる画素が前景領域に属する場合、0である推定混合比を選択して、混合比αに設定し、対象となる画素が背景領域に属する場合、1である推定混合比を選択して、混合比αに設定する。選択部444は、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部442から供給された推定混合比を選択して混合比αに設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部443から供給された推定混合比を選択して混合比αに設定する。選択部444は、領域情報を基に選択して設定した混合比αを出力する。
【0350】
このように、図55に示す他の構成を有する混合比算出部104は、画像の含まれる画素毎に混合比αを算出して、算出した混合比αを出力することができる。
【0351】
図56のフローチャートを参照して、図47に構成を示す混合比算出部104の混合比αの算出の処理を説明する。ステップS401において、混合比算出部104は、領域特定部103から供給された領域情報を取得する。ステップS402において、推定混合比処理部401は、カバードバックグラウンド領域に対応するモデルにより推定混合比の演算の処理を実行し、算出した推定混合比を混合比決定部403に供給する。混合比推定の演算の処理の詳細は、図57のフローチャートを参照して、後述する。
【0352】
ステップS403において、推定混合比処理部402は、アンカバードバックグラウンド領域に対応するモデルにより推定混合比の演算の処理を実行し、算出した推定混合比を混合比決定部403に供給する。
【0353】
ステップS404において、混合比算出部104は、フレーム全体について、混合比αを推定したか否かを判定し、フレーム全体について、混合比αを推定していないと判定された場合、ステップS402に戻り、次の画素について混合比αを推定する処理を実行する。
【0354】
ステップS404において、フレーム全体について、混合比αを推定したと判定された場合、ステップS405に進み、混合比決定部403は、画素が、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す、領域特定部103から供給された領域情報を基に、混合比αを設定する。混合比決定部403は、対象となる画素が前景領域に属する場合、0を混合比αに設定し、対象となる画素が背景領域に属する場合、1を混合比αに設定し、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部401から供給された推定混合比を混合比αに設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部402から供給された推定混合比を混合比αに設定し、処理は終了する。
【0355】
このように、混合比算出部104は、領域特定部103から供給された領域情報、および入力画像を基に、各画素に対応する特徴量である混合比αを算出することができる。
【0356】
図55に構成を示す混合比算出部104の混合比αの算出の処理は、図56のフローチャートで説明した処理と同様なので、その説明は省略する。
【0357】
次に、図56のステップS402に対応する、カバードバックグラウンド領域に対応するモデルによる混合比推定の処理を図57のフローチャートを参照して説明する。
【0358】
ステップS421において、混合比演算部423は、フレームメモリ421から、フレーム#nの注目画素の画素値Cを取得する。
【0359】
ステップS422において、混合比演算部423は、フレームメモリ422から、注目画素に対応する、フレーム#n-1の画素の画素値Pを取得する。
【0360】
ステップS423において、混合比演算部423は、入力画像に含まれる注目画素に対応する、フレーム#n+1の画素の画素値Nを取得する。
【0361】
ステップS424において、混合比演算部423は、フレーム#nの注目画素の画素値C、フレーム#n-1の画素の画素値P、およびフレーム#n+1の画素の画素値Nを基に、推定混合比を演算する。
【0362】
ステップS425において、混合比演算部423は、フレーム全体について、推定混合比を演算する処理を終了したか否かを判定し、フレーム全体について、推定混合比を演算する処理を終了していないと判定された場合、ステップS421に戻り、次の画素について推定混合比を算出する処理を繰り返す。
【0363】
ステップS425において、フレーム全体について、推定混合比を演算する処理を終了したと判定された場合、処理は終了する。
【0364】
このように、推定混合比処理部401は、入力画像を基に、推定混合比を演算することができる。
【0365】
図56のステップS403におけるアンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理は、アンカバードバックグラウンド領域のモデルに対応する式を利用した、図57のフローチャートに示す処理と同様なので、その説明は省略する。
【0366】
なお、図55に示す推定混合比処理部442および推定混合比処理部443は、図57に示すフローチャートと同様の処理を実行して推定混合比を演算するので、その説明は省略する。
【0367】
また、背景に対応するオブジェクトが静止しているとして説明したが、背景領域に対応する画像が動きを含んでいても上述した混合比αを求める処理を適用することができる。例えば、背景領域に対応する画像が一様に動いているとき、推定混合比処理部401は、背景の動きに対応して画像全体をシフトさせ、背景に対応するオブジェクトが静止している場合と同様に処理する。また、背景領域に対応する画像が局所毎に異なる背景の動きを含んでいるとき、推定混合比処理部401は、混合領域に属する画素に対応する画素として、背景の動きに対応した画素を選択して、上述の処理を実行する。
【0368】
また、混合比算出部104は、全ての画素について、カバードバックグラウンド領域に対応するモデルによる混合比推定の処理のみを実行して、算出された推定混合比を混合比αとして出力するようにしてもよい。この場合において、混合比αは、カバードバックグラウンド領域に属する画素について、背景の成分の割合を示し、アンカバードバックグラウンド領域に属する画素について、前景の成分の割合を示す。アンカバードバックグラウンド領域に属する画素について、このように算出された混合比αと1との差分の絶対値を算出して、算出した絶対値を混合比αに設定すれば、信号処理装置は、アンカバードバックグラウンド領域に属する画素について、背景の成分の割合を示す混合比αを求めることができる。
【0369】
なお、同様に、混合比算出部104は、全ての画素について、アンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理のみを実行して、算出された推定混合比を混合比αとして出力するようにしてもよい。
【0370】
次に、混合比算出部104の他の処理について説明する。
【0371】
シャッタ時間内において、前景に対応するオブジェクトが等速で動くことによる、画素の位置の変化に対応して、混合比αが直線的に変化する性質を利用して、空間方向に、混合比αと前景の成分の和fとを近似した式を立てることができる。混合領域に属する画素の画素値および背景領域に属する画素の画素値の組の複数を利用して、混合比αと前景の成分の和fとを近似した式を解くことにより、混合比αを算出する。
【0372】
混合比αの変化を、直線として近似すると、混合比αは、式(23)で表される。
【0373】
α=il+p (23)
式(23)において、iは、注目している画素の位置を0とした空間方向のインデックスである。lは、混合比αの直線の傾きである。pは、混合比αの直線の切片である共に、注目している画素の混合比αである。式(23)において、インデックスiは、既知であるが、傾きlおよび切片pは、未知である。
【0374】
インデックスi、傾きl、および切片pの関係を図58に示す。
【0375】
混合比αを式(23)のように近似することにより、複数の画素に対して複数の異なる混合比αは、2つの変数で表現される。図58に示す例において、5つの画素に対する5つの混合比は、2つの変数である傾きlおよび切片pにより表現される。
【0376】
図59に示す平面で混合比αを近似すると、画像の水平方向および垂直方向の2つの方向に対応する動きvを考慮したとき、式(23)を平面に拡張して、混合比αは、式(24)で表される。
【0377】
α=jm+kq+p (24)
式(24)において、jは、注目している画素の位置を0とした水平方向のインデックスであり、kは、垂直方向のインデックスである。mは、混合比αの面の水平方向の傾きであり、qは、混合比αの面の垂直方向の傾きである。pは、混合比αの面の切片である。
【0378】
例えば、図49に示すフレーム#nにおいて、C05乃至C07について、それぞれ、式(25)乃至式(27)が成立する。
【0379】
C05=α05・B05/v+f05 (25)
C06=α06・B06/v+f06 (26)
C07=α07・B07/v+f07 (27)
【0380】
前景の成分が近傍で一致する、すなわち、F01乃至F03が等しいとして、F01乃至F03をFcに置き換えると式(28)が成立する。
【0381】
f(x)=(1-α(x))・Fc (28)
式(28)において、xは、空間方向の位置を表す。
【0382】
α(x)を式(24)で置き換えると、式(28)は、式(29)として表すことができる。
【0383】
Figure 0004596205
【0384】
式(29)において、(-m・Fc)、(-q・Fc)、および(1-p)・Fcは、式(30)乃至式(32)に示すように置き換えられている。
【0385】
s=-m・Fc (30)
t=-q・Fc (31)
u=(1-p)・Fc (32)
【0386】
式(29)において、jは、注目している画素の位置を0とした水平方向のインデックスであり、kは、垂直方向のインデックスである。
【0387】
このように、前景に対応するオブジェクトがシャッタ時間内において等速に移動し、前景に対応する成分が近傍において一定であるという仮定が成立するので、前景の成分の和は、式(29)で近似される。
【0388】
なお、混合比αを直線で近似する場合、前景の成分の和は、式(33)で表すことができる。
【0389】
f(x)=is+u (33)
【0390】
式(13)の混合比αおよび前景成分の和を、式(24)および式(29)を利用して置き換えると、画素値Mは、式(34)で表される。
【0391】
Figure 0004596205
【0392】
式(34)において、未知の変数は、混合比αの面の水平方向の傾きm、混合比αの面の垂直方向の傾きq、混合比αの面の切片p、s、t、およびuの6つである。
【0393】
注目している画素の近傍の画素に対応させて、式(34)に、画素値Mおよび画素値Bを設定し、画素値Mおよび画素値Bが設定された複数の式に対して最小自乗法で解くことにより、混合比αを算出する。
【0394】
例えば、注目している画素の水平方向のインデックスjを0とし、垂直方向のインデックスkを0とし、注目している画素の近傍の3×3の画素について、式(34)に示す正規方程式に画素値Mまたは画素値Bを設定すると、式(35)乃至式(43)を得る。
【0395】
Figure 0004596205
【0396】
注目している画素の水平方向のインデックスjが0であり、垂直方向のインデックスkが0であるので、注目している画素の混合比αは、式(24)より、j=0およびk=0のときの値、すなわち、切片pに等しい。
【0397】
従って、式(35)乃至式(43)の9つの式を基に、最小自乗法により、水平方向の傾きm、垂直方向の傾きq、切片p、s、t、およびuのそれぞれの値を算出し、切片pを混合比αとして出力すればよい。
【0398】
次に、最小自乗法を適用して混合比αを算出するより具体的な手順を説明する。
【0399】
インデックスiおよびインデックスkを1つのインデックスxで表現すると、インデックスi、インデックスk、およびインデックスxの関係は、式(44)で表される。
【0400】
x=(j+1)・3+(k+1) (44)
【0401】
水平方向の傾きm、垂直方向の傾きq、切片p、s、t、およびuをそれぞれ変数w0,w1,w2,w3,w4、およびw5と表現し、jB,kB,B,j,k、および1をそれぞれa0,a1,a2,a3,a4、およびa5と表現する。誤差exを考慮すると、式(35)乃至式(43)は、式(45)に書き換えることができる。
【0402】
【数12】
Figure 0004596205
式(45)において、xは、0乃至8の整数のいずれかの値である。
【0403】
式(45)から、式(46)を導くことができる。
【0404】
【数13】
Figure 0004596205
【0405】
ここで、最小自乗法を適用するため、誤差の自乗和Eを式(47)に示すようにに定義する。
【0406】
【数14】
Figure 0004596205
【0407】
誤差が最小になるためには、誤差の自乗和Eに対する、変数Wvの偏微分が0になればよい。ここで、vは、0乃至5の整数のいずれかの値である。従って、式(48)を満たすようにwyを求める。
【0408】
【数15】
Figure 0004596205
【0409】
式(48)に式(46)を代入すると、式(49)を得る。
【0410】
【数16】
Figure 0004596205
【0411】
式(49)のvに0乃至5の整数のいずれか1つを代入して得られる6つの式からなる正規方程式に、例えば、掃き出し法(Gauss-Jordanの消去法)などを適用して、wyを算出する。上述したように、w0は水平方向の傾きmであり、w1は垂直方向の傾きqであり、w2は切片pであり、w3はsであり、w4はtであり、w5はuである。
【0412】
以上のように、画素値Mおよび画素値Bを設定した式に、最小自乗法を適用することにより、水平方向の傾きm、垂直方向の傾きq、切片p、s、t、およびuを求めることができる。
【0413】
ここで、切片pが、インデックスi,kが0の点、すなわち中心位置における混合比αとなっているので、これを出力する。
【0414】
式(35)乃至式(43)に対応する説明において、混合領域に含まれる画素の画素値をMとし、背景領域に含まれる画素の画素値をBとして説明したが、注目している画素が、カバードバックグラウンド領域に含まれる場合、またはアンカバードバックグラウンド領域に含まれる場合のそれぞれに対して、正規方程式を立てる必要がある。
【0415】
例えば、図49に示す、フレーム#nのカバードバックグラウンド領域に含まれる画素の混合比αを求める場合、フレーム#nの画素のC04乃至C08、およびフレーム#n-1の画素の画素値P04乃至P08が、正規方程式に設定される。
【0416】
図50に示す、フレーム#nのアンカバードバックグラウンド領域に含まれる画素の混合比αを求める場合、フレーム#nの画素のC28乃至C32、およびフレーム#n+1の画素の画素値N28乃至N32が、正規方程式に設定される。
【0417】
また、例えば、図60に示す、カバードバックグラウンド領域に含まれる画素の混合比αを算出するとき、以下の式(50)乃至式(58)が立てられる。混合比αを算出する画素の画素値は、Mc5である。
【0418】
Mc1=(-1)・Bc1・m+(-1)・Bc1・q+Bc1・p+(-1)・s+(-1)・t+u (50)
Mc2=(0)・Bc2・m+(-1)・Bc2・q+Bc2・p+(0)・s+(-1)・t+u (51)
Mc3=(+1)・Bc3・m+(-1)・Bc3・q+Bc3・p+(+1)・s+(-1)・t+u (52)
Mc4=(-1)・Bc4・m+(0)・Bc4・q+Bc4・p+(-1)・s+(0)・t+u (53)
Mc5=(0)・Bc5・m+(0)・Bc5・q+Bc5・p+(0)・s+(0)・t+u (54)
Mc6=(+1)・Bc6・m+(0)・Bc6・q+Bc6・p+(+1)・s+(0)・t+u (55)
Mc7=(-1)・Bc7・m+(+1)・Bc7・q+Bc7・p+(-1)・s+(+1)・t+u (56)
Mc8=(0)・Bc8・m+(+1)・Bc8・q+Bc8・p+(0)・s+(+1)・t+u (57)
Mc9=(+1)・Bc9・m+(+1)・Bc9・q+Bc9・p+(+1)・s+(+1)・t+u (58)
【0419】
フレーム#nのカバードバックグラウンド領域に含まれる画素の混合比αを算出するとき、式(50)乃至式(58)において、フレーム#nの画素に対応する、フレーム#n-1の画素の背景領域の画素の画素値Bc1乃至Bc9が使用される。
【0420】
図60に示す、アンカバードバックグラウンド領域に含まれる画素の混合比αを算出するとき、以下の式(59)乃至式(67)が立てられる。混合比αを算出する画素の画素値は、Mu5である。
【0421】
Mu1=(-1)・Bu1・m+(-1)・Bu1・q+Bu1・p+(-1)・s+(-1)・t+u (59)
Mu2=(0)・Bu2・m+(-1)・Bu2・q+Bu2・p+(0)・s+(-1)・t+u (60)
Mu3=(+1)・Bu3・m+(-1)・Bu3・q+Bu3・p+(+1)・s+(-1)・t+u (61)
Mu4=(-1)・Bu4・m+(0)・Bu4・q+Bu4・p+(-1)・s+(0)・t+u (62)
Mu5=(0)・Bu5・m+(0)・Bu5・q+Bu5・p+(0)・s+(0)・t+u (63)
Mu6=(+1)・Bu6・m+(0)・Bu6・q+Bu6・p+(+1)・s+(0)・t+u (64)
Mu7=(-1)・Bu7・m+(+1)・Bu7・q+Bu7・p+(-1)・s+(+1)・t+u (65)
Mu8=(0)・Bu8・m+(+1)・Bu8・q+Bu8・p+(0)・s+(+1)・t+u (66)
Mu9=(+1)・Bu9・m+(+1)・Bu9・q+Bu9・p+(+1)・s+(+1)・t+u (67)
【0422】
フレーム#nのアンカバードバックグラウンド領域に含まれる画素の混合比αを算出するとき、式(59)乃至式(67)において、フレーム#nの画素に対応する、フレーム#n+1の画素の背景領域の画素の画素値Bu1乃至Bu9が使用される。
【0423】
図61は、推定混合比処理部401の構成を示すブロック図である。推定混合比処理部401に入力された画像は、遅延部501および足し込み部502に供給される。
【0424】
遅延回路221は、入力画像を1フレーム遅延させ、足し込み部502に供給する。足し込み部502に、入力画像としてフレーム#nが入力されているとき、遅延回路221は、フレーム#n-1を足し込み部502に供給する。
【0425】
足し込み部502は、混合比αを算出する画素の近傍の画素の画素値、およびフレーム#n-1の画素値を、正規方程式に設定する。例えば、足し込み部502は、式(50)乃至式(58)に基づいて、正規方程式に画素値Mc1乃至Mc9および画素値Bc1乃至Bc9を設定する。足し込み部502は、画素値が設定された正規方程式を演算部503に供給する。
【0426】
演算部503は、足し込み部502から供給された正規方程式を掃き出し法などにより解いて推定混合比を求め、求められた推定混合比を出力する。
【0427】
このように、推定混合比処理部401は、入力画像を基に、推定混合比を算出して、混合比決定部403に供給することができる。
【0428】
なお、推定混合比処理部402は、推定混合比処理部401と同様の構成を有するので、その説明は省略する。
【0429】
図62は、推定混合比処理部401により算出された推定混合比の例を示す図である。図62に示す推定混合比は、等速で動いているオブジェクトに対応する前景の動きvが11であり、7×7画素のブロックを単位として方程式を生成して算出された結果を、1ラインに対して示すものである。
【0430】
推定混合比は、混合領域において、図48に示すように、ほぼ直線的に変化していることがわかる。
【0431】
混合比決定部403は、領域特定部101から供給された、混合比が算出される画素が、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す領域情報を基に、混合比を設定する。混合比決定部403は、対象となる画素が前景領域に属する場合、0を混合比に設定し、対象となる画素が背景領域に属する場合、1を混合比に設定し、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部401から供給された推定混合比を混合比に設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部402から供給された推定混合比を混合比に設定する。混合比決定部403は、領域情報を基に設定した混合比を出力する。
【0432】
図63のフローチャートを参照して、推定混合比処理部401が図61に示す構成を有する場合における、混合比算出部102の混合比の算出の処理を説明する。ステップS501において、混合比算出部102は、領域特定部101から供給された領域情報を取得する。ステップS502において、推定混合比処理部401は、カバードバックグラウンド領域に対応するモデルによる混合比推定の処理を実行し、推定混合比を混合比決定部403に供給する。混合比推定の処理の詳細は、図64のフローチャートを参照して、後述する。
【0433】
ステップS503において、推定混合比処理部402は、アンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理を実行し、推定混合比を混合比決定部403に供給する。
【0434】
ステップS504において、混合比算出部102は、フレーム全体について、混合比を推定したか否かを判定し、フレーム全体について、混合比を推定していないと判定された場合、ステップS502に戻り、次の画素について混合比を推定する処理を実行する。
【0435】
ステップS504において、フレーム全体について、混合比を推定したと判定された場合、ステップS505に進み、混合比決定部403は、領域特定部101から供給された、混合比が算出される画素が、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す領域情報を基に、混合比を設定する。混合比決定部403は、対象となる画素が前景領域に属する場合、0を混合比に設定し、対象となる画素が背景領域に属する場合、1を混合比に設定し、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部401から供給された推定混合比を混合比に設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部402から供給された推定混合比を混合比に設定し、処理は終了する。
【0436】
このように、混合比算出部102は、領域特定部101から供給された領域情報、および入力画像を基に、各画素に対応する特徴量である混合比αを算出することができる。
【0437】
混合比αを利用することにより、動いているオブジェクトに対応する画像に含まれる動きボケの情報を残したままで、画素値に含まれる前景の成分と背景の成分とを分離することが可能になる。
【0438】
また、混合比αに基づいて画像を合成すれば、実世界を実際に撮影し直したような動いているオブジェクトのスピードに合わせた正しい動きボケを含む画像を作ることが可能になる。
【0439】
次に、図63のステップS502に対応する、カバードバックグラウンド領域に対応するモデルによる混合比推定の処理を図64のフローチャートを参照して説明する。
【0440】
ステップS521において、足し込み部502は、入力された画像に含まれる画素値、および遅延回路221から供給される画像に含まれる画素値を、カバードバックグラウンド領域のモデルに対応する正規方程式に設定する。
【0441】
ステップS522において、推定混合比処理部401は、対象となる画素についての設定が終了したか否かを判定し、対象となる画素についての設定が終了していないと判定された場合、ステップS521に戻り、正規方程式への画素値の設定の処理を繰り返す。
【0442】
ステップS522において、対象となる画素についての画素値の設定が終了したと判定された場合、ステップS523に進み、演算部173は、画素値が設定された正規方程式を基に、推定混合比を演算して、求められた推定混合比を出力する。
【0443】
このように、推定混合比処理部401は、入力画像を基に、推定混合比を演算することができる。
【0444】
図63のステップS153におけるアンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理は、アンカバードバックグラウンド領域のモデルに対応する正規方程式を利用した、図64のフローチャートに示す処理と同様なので、その説明は省略する。
【0445】
なお、背景に対応するオブジェクトが静止しているとして説明したが、背景領域に対応する画像が動きを含んでいても上述した混合比を求める処理を適用することができる。例えば、背景領域に対応する画像が一様に動いているとき、推定混合比処理部401は、この動きに対応して画像全体をシフトさせ、背景に対応するオブジェクトが静止している場合と同様に処理する。また、背景領域に対応する画像が局所毎に異なる動きを含んでいるとき、推定混合比処理部401は、混合領域に属する画素に対応する画素として、動きに対応した画素を選択して、上述の処理を実行する。
【0446】
次に、前景背景分離部105について説明する。図65は、前景背景分離部105の構成の一例を示すブロック図である。前景背景分離部105に供給された入力画像は、分離部601、スイッチ602、およびスイッチ604に供給される。カバードバックグラウンド領域を示す情報、およびアンカバードバックグラウンド領域を示す、領域特定部103から供給された領域情報は、分離部601に供給される。前景領域を示す領域情報は、スイッチ602に供給される。背景領域を示す領域情報は、スイッチ604に供給される。
【0447】
混合比算出部104から供給された混合比αは、分離部601に供給される。
【0448】
分離部601は、カバードバックグラウンド領域を示す領域情報、アンカバードバックグラウンド領域を示す領域情報、および混合比αを基に、入力画像から前景の成分を分離して、分離した前景の成分を合成部603に供給するとともに、入力画像から背景の成分を分離して、分離した背景の成分を合成部605に供給する。
【0449】
スイッチ602は、前景領域を示す領域情報を基に、前景に対応する画素が入力されたとき、閉じられ、入力画像に含まれる前景に対応する画素のみを合成部603に供給する。
【0450】
スイッチ604は、背景領域を示す領域情報を基に、背景に対応する画素が入力されたとき、閉じられ、入力画像に含まれる背景に対応する画素のみを合成部605に供給する。
【0451】
合成部603は、分離部601から供給された前景に対応する成分、スイッチ602から供給された前景に対応する画素を基に、前景成分画像を合成し、合成した前景成分画像を出力する。前景領域と混合領域とは重複しないので、合成部603は、例えば、前景に対応する成分と、前景に対応する画素とに論理和の演算を適用して、前景成分画像を合成する。
【0452】
合成部603は、前景成分画像の合成の処理の最初に実行される初期化の処理において、内蔵しているフレームメモリに全ての画素値が0である画像を格納し、前景成分画像の合成の処理において、前景成分画像を格納(上書き)する。従って、合成部603が出力する前景成分画像の内、背景領域に対応する画素には、画素値として0が格納されている。
【0453】
合成部605は、分離部601から供給された背景に対応する成分、スイッチ604から供給された背景に対応する画素を基に、背景成分画像を合成して、合成した背景成分画像を出力する。背景領域と混合領域とは重複しないので、合成部605は、例えば、背景に対応する成分と、背景に対応する画素とに論理和の演算を適用して、背景成分画像を合成する。
【0454】
合成部605は、背景成分画像の合成の処理の最初に実行される初期化の処理において、内蔵しているフレームメモリに全ての画素値が0である画像を格納し、背景成分画像の合成の処理において、背景成分画像を格納(上書き)する。従って、合成部605が出力する背景成分画像の内、前景領域に対応する画素には、画素値として0が格納されている。
【0455】
図66は、前景背景分離部105に入力される入力画像、並びに前景背景分離部105から出力される前景成分画像および背景成分画像を示す図である。
【0456】
図66(A)は、表示される画像の模式図であり、図66(B)は、図66(A)に対応する前景領域に属する画素、背景領域に属する画素、および混合領域に属する画素を含む1ラインの画素を時間方向に展開したモデル図を示す。
【0457】
図66(A)および図66(B)に示すように、前景背景分離部105から出力される背景成分画像は、背景領域に属する画素、および混合領域の画素に含まれる背景の成分から構成される。
【0458】
図66(A)および図66(B)に示すように、前景背景分離部105から出力される前景成分画像は、前景領域に属する画素、および混合領域の画素に含まれる前景の成分から構成される。
【0459】
混合領域の画素の画素値は、前景背景分離部105により、背景の成分と、前景の成分とに分離される。分離された背景の成分は、背景領域に属する画素と共に、背景成分画像を構成する。分離された前景の成分は、前景領域に属する画素と共に、前景成分画像を構成する。
【0460】
このように、前景成分画像は、背景領域に対応する画素の画素値が0とされ、前景領域に対応する画素および混合領域に対応する画素に意味のある画素値が設定される。同様に、背景成分画像は、前景領域に対応する画素の画素値が0とされ、背景領域に対応する画素および混合領域に対応する画素に意味のある画素値が設定される。
【0461】
次に、分離部601が実行する、混合領域に属する画素から前景の成分、および背景の成分を分離する処理について説明する。
【0462】
図67は、図中の左から右に移動するオブジェクトに対応する前景を含む、2つのフレームの前景の成分および背景の成分を示す画像のモデルである。図67に示す画像のモデルにおいて、前景の動き量vは4であり、仮想分割数は、4とされている。
【0463】
フレーム#nにおいて、最も左の画素、および左から14番目乃至18番目の画素は、背景の成分のみから成り、背景領域に属する。フレーム#nにおいて、左から2番目乃至4番目の画素は、背景の成分および前景の成分を含み、アンカバードバックグラウンド領域に属する。フレーム#nにおいて、左から11番目乃至13番目の画素は、背景の成分および前景の成分を含み、カバードバックグラウンド領域に属する。フレーム#nにおいて、左から5番目乃至10番目の画素は、前景の成分のみから成り、前景領域に属する。
【0464】
フレーム#n+1において、左から1番目乃至5番目の画素、および左から18番目の画素は、背景の成分のみから成り、背景領域に属する。フレーム#n+1において、左から6番目乃至8番目の画素は、背景の成分および前景の成分を含み、アンカバードバックグラウンド領域に属する。フレーム#n+1において、左から15番目乃至17番目の画素は、背景の成分および前景の成分を含み、カバードバックグラウンド領域に属する。フレーム#n+1において、左から9番目乃至14番目の画素は、前景の成分のみから成り、前景領域に属する。
【0465】
図68は、カバードバックグラウンド領域に属する画素から前景の成分を分離する処理を説明する図である。図68において、α1乃至α18は、フレーム#nにおける画素のぞれぞれに対応する混合比である。図68において、左から15番目乃至17番目の画素は、カバードバックグラウンド領域に属する。
【0466】
フレーム#nの左から15番目の画素の画素値C15は、式(68)で表される。
【0467】
Figure 0004596205
ここで、α15は、フレーム#nの左から15番目の画素の混合比である。P15は、フレーム#n-1の左から15番目の画素の画素値である。
【0468】
式(68)を基に、フレーム#nの左から15番目の画素の前景の成分の和f15は、式(69)で表される。
【0469】
Figure 0004596205
【0470】
同様に、フレーム#nの左から16番目の画素の前景の成分の和f16は、式(70)で表され、フレーム#nの左から17番目の画素の前景の成分の和f17は、式(71)で表される。
【0471】
f16=C16-α16・P16 (70)
f17=C17-α17・P17 (71)
【0472】
このように、カバードバックグラウンド領域に属する画素の画素値Cに含まれる前景の成分fcは、式(72)で計算される。
【0473】
fc=C-α・P (72)
Pは、1つ前のフレームの、対応する画素の画素値である。
【0474】
図69は、アンカバードバックグラウンド領域に属する画素から前景の成分を分離する処理を説明する図である。図69において、α1乃至α18は、フレーム#nにおける画素のぞれぞれに対応する混合比である。図69において、左から2番目乃至4番目の画素は、アンカバードバックグラウンド領域に属する。
【0475】
フレーム#nの左から2番目の画素の画素値C02は、式(73)で表される。
【0476】
Figure 0004596205
ここで、α2は、フレーム#nの左から2番目の画素の混合比である。N02は、フレーム#n+1の左から2番目の画素の画素値である。
【0477】
式(73)を基に、フレーム#nの左から2番目の画素の前景の成分の和f02は、式(74)で表される。
【0478】
Figure 0004596205
【0479】
同様に、フレーム#nの左から3番目の画素の前景の成分の和f03は、式(75)で表され、フレーム#nの左から4番目の画素の前景の成分の和f04は、式(76)で表される。
【0480】
f03=C03-α3・N03 (75)
f04=C04-α4・N04 (76)
【0481】
このように、アンカバードバックグラウンド領域に属する画素の画素値Cに含まれる前景の成分fuは、式(77)で計算される。
【0482】
fu=C-α・N (77)
Nは、1つ後のフレームの、対応する画素の画素値である。
【0483】
このように、分離部601は、領域情報に含まれる、カバードバックグラウンド領域を示す情報、およびアンカバードバックグラウンド領域を示す情報、並びに画素毎の混合比αを基に、混合領域に属する画素から前景の成分、および背景の成分を分離することができる。
【0484】
図70は、以上で説明した処理を実行する分離部601の構成の一例を示すブロック図である。分離部601に入力された画像は、フレームメモリ621に供給され、混合比算出部104から供給されたカバードバックグラウンド領域およびアンカバードバックグラウンド領域を示す領域情報、並びに混合比αは、分離処理ブロック622に入力される。
【0485】
フレームメモリ621は、入力された画像をフレーム単位で記憶する。フレームメモリ621は、処理の対象がフレーム#nであるとき、フレーム#nの1つ前のフレームであるフレーム#n-1、フレーム#n、およびフレーム#nの1つ後のフレームであるフレーム#n+1を記憶する。
【0486】
フレームメモリ621は、フレーム#n-1、フレーム#n、およびフレーム#n+1の対応する画素を分離処理ブロック622に供給する。
【0487】
分離処理ブロック622は、カバードバックグラウンド領域およびアンカバードバックグラウンド領域を示す領域情報、並びに混合比αを基に、フレームメモリ621から供給されたフレーム#n-1、フレーム#n、およびフレーム#n+1の対応する画素の画素値に図68および図69を参照して説明した演算を適用して、フレーム#nの混合領域に属する画素から前景の成分および背景の成分を分離して、フレームメモリ623に供給する。
【0488】
分離処理ブロック622は、アンカバード領域処理部631、カバード領域処理部632、合成部633、および合成部634で構成されている。
【0489】
アンカバード領域処理部631の乗算器641は、混合比αを、フレームメモリ621から供給されたフレーム#n+1の画素の画素値に乗じて、スイッチ642に出力する。スイッチ642は、フレームメモリ621から供給されたフレーム#nの画素(フレーム#n+1の画素に対応する)がアンカバードバックグラウンド領域であるとき、閉じられ、乗算器641から供給された混合比αを乗じた画素値を演算器643および合成部634に供給する。スイッチ642から出力されるフレーム#n+1の画素の画素値に混合比αを乗じた値は、フレーム#nの対応する画素の画素値の背景の成分に等しい。
【0490】
演算器643は、フレームメモリ621から供給されたフレーム#nの画素の画素値から、スイッチ642から供給された背景の成分を減じて、前景の成分を求める。演算器643は、アンカバードバックグラウンド領域に属する、フレーム#nの画素の前景の成分を合成部633に供給する。
【0491】
カバード領域処理部632の乗算器651は、混合比αを、フレームメモリ621から供給されたフレーム#n-1の画素の画素値に乗じて、スイッチ652に出力する。スイッチ652は、フレームメモリ621から供給されたフレーム#nの画素(フレーム#n-1の画素に対応する)がカバードバックグラウンド領域であるとき、閉じられ、乗算器651から供給された混合比αを乗じた画素値を演算器653および合成部634に供給する。スイッチ652から出力されるフレーム#n-1の画素の画素値に混合比αを乗じた値は、フレーム#nの対応する画素の画素値の背景の成分に等しい。
【0492】
演算器653は、フレームメモリ621から供給されたフレーム#nの画素の画素値から、スイッチ652から供給された背景の成分を減じて、前景の成分を求める。演算器653は、カバードバックグラウンド領域に属する、フレーム#nの画素の前景の成分を合成部633に供給する。
【0493】
合成部633は、フレーム#nの、演算器643から供給された、アンカバードバックグラウンド領域に属する画素の前景の成分、および演算器653から供給された、カバードバックグラウンド領域に属する画素の前景の成分を合成して、フレームメモリ623に供給する。
【0494】
合成部634は、フレーム#nの、スイッチ642から供給された、アンカバードバックグラウンド領域に属する画素の背景の成分、およびスイッチ652から供給された、カバードバックグラウンド領域に属する画素の背景の成分を合成して、フレームメモリ623に供給する。
【0495】
フレームメモリ623は、分離処理ブロック622から供給された、フレーム#nの混合領域の画素の前景の成分と、背景の成分とをそれぞれに記憶する。
【0496】
フレームメモリ623は、記憶しているフレーム#nの混合領域の画素の前景の成分、および記憶しているフレーム#nの混合領域の画素の背景の成分を出力する。
【0497】
特徴量である混合比αを利用することにより、画素値に含まれる前景の成分と背景の成分とを完全に分離することが可能になる。
【0498】
合成部603は、分離部601から出力された、フレーム#nの混合領域の画素の前景の成分と、前景領域に属する画素とを合成して前景成分画像を生成する。
合成部605は、分離部601から出力された、フレーム#nの混合領域の画素の背景の成分と、背景領域に属する画素とを合成して背景成分画像を生成する。
【0499】
図71は、図67のフレーム#nに対応する、前景成分画像の例と、背景成分画像の例を示す図である。
【0500】
図71(A)は、図67のフレーム#nに対応する、前景成分画像の例を示す。
最も左の画素、および左から14番目の画素は、前景と背景が分離される前において、背景の成分のみから成っていたので、画素値が0とされる。
【0501】
左から2番目乃至4番目の画素は、前景と背景とが分離される前において、アンカバードバックグラウンド領域に属し、背景の成分が0とされ、前景の成分がそのまま残されている。左から11番目乃至13番目の画素は、前景と背景とが分離される前において、カバードバックグラウンド領域に属し、背景の成分が0とされ、前景の成分がそのまま残されている。左から5番目乃至10番目の画素は、前景の成分のみから成るので、そのまま残される。
【0502】
図71(B)は、図67のフレーム#nに対応する、背景成分画像の例を示す。
最も左の画素、および左から14番目の画素は、前景と背景とが分離される前において、背景の成分のみから成っていたので、そのまま残される。
【0503】
左から2番目乃至4番目の画素は、前景と背景とが分離される前において、アンカバードバックグラウンド領域に属し、前景の成分が0とされ、背景の成分がそのまま残されている。左から11番目乃至13番目の画素は、前景と背景とが分離される前において、カバードバックグラウンド領域に属し、前景の成分が0とされ、背景の成分がそのまま残されている。左から5番目乃至10番目の画素は、前景と背景とが分離される前において、前景の成分のみから成っていたので、画素値が0とされる。
【0504】
次に、図72に示すフローチャートを参照して、前景背景分離部105による前景と背景との分離の処理を説明する。ステップS601において、分離部601のフレームメモリ621は、入力画像を取得し、前景と背景との分離の対象となるフレーム#nを、その前のフレーム#n-1およびその後のフレーム#n+1と共に記憶する。
【0505】
ステップS602において、分離部601の分離処理ブロック622は、混合比算出部104から供給された領域情報を取得する。ステップS603において、分離部601の分離処理ブロック622は、混合比算出部104から供給された混合比αを取得する。
【0506】
ステップS604において、アンカバード領域処理部631は、領域情報および混合比αを基に、フレームメモリ621から供給された、アンカバードバックグラウンド領域に属する画素の画素値から、背景の成分を抽出する。
【0507】
ステップS605において、アンカバード領域処理部631は、領域情報および混合比αを基に、フレームメモリ621から供給された、アンカバードバックグラウンド領域に属する画素の画素値から、前景の成分を抽出する。
【0508】
ステップS606において、カバード領域処理部632は、領域情報および混合比αを基に、フレームメモリ621から供給された、カバードバックグラウンド領域に属する画素の画素値から、背景の成分を抽出する。
【0509】
ステップS607において、カバード領域処理部632は、領域情報および混合比αを基に、フレームメモリ621から供給された、カバードバックグラウンド領域に属する画素の画素値から、前景の成分を抽出する。
【0510】
ステップS608において、合成部633は、ステップS605の処理で抽出されたアンカバードバックグラウンド領域に属する画素の前景の成分と、ステップS607の処理で抽出されたカバードバックグラウンド領域に属する画素の前景の成分とを合成する。合成された前景の成分は、合成部603に供給される。
更に、合成部603は、スイッチ602を介して供給された前景領域に属する画素と、分離部601から供給された前景の成分とを合成して、前景成分画像を生成する。
【0511】
ステップS609において、合成部634は、ステップS604の処理で抽出されたアンカバードバックグラウンド領域に属する画素の背景の成分と、ステップS606の処理で抽出されたカバードバックグラウンド領域に属する画素の背景の成分とを合成する。合成された背景の成分は、合成部605に供給される。
更に、合成部605は、スイッチ604を介して供給された背景領域に属する画素と、分離部601から供給された背景の成分とを合成して、背景成分画像を生成する。
【0512】
ステップS610において、合成部603は、前景成分画像を出力する。ステップS611において、合成部605は、背景成分画像を出力し、処理は終了する。
【0513】
このように、前景背景分離部105は、領域情報および混合比αを基に、入力画像から前景の成分と、背景の成分とを分離し、前景の成分のみから成る前景成分画像、および背景の成分のみから成る背景成分画像を出力することができる。
【0514】
図73は、動きボケ調整部106の構成を示すブロック図である。
【0515】
平坦部抽出部801は、領域特定部103から供給された領域情報を基に、前景背景分離部105から供給された前景成分画像から、隣接する画素であって、その画素値の変化量が少ない平坦部を抽出する。平坦部抽出部801により抽出される平坦部は、画素値が均等な画素からなる。以下、平坦部は、均等部とも称する。
【0516】
例えば、平坦部抽出部801は、領域特定部103から供給された領域情報を基に、前景背景分離部105から供給された前景成分画像から、隣接する画素であって、その画素値の変化量が、予め記憶している閾値Thf未満である平坦部を抽出する。
【0517】
また、例えば、平坦部抽出部801は、前景成分画像の隣接する画素であって、その画素値の変化量が1%以内である平坦部を抽出する。平坦部の抽出の基準となる、画素値の変化量の割合は、所望の値とすることができる。
【0518】
または、平坦部抽出部801は、前景成分画像の隣接する画素であって、その画素値の標準偏差が、予め記憶している閾値Thf未満である平坦部を抽出する。
【0519】
さらに、例えば、平坦部抽出部801は、前景成分画像の隣接する画素であって、その画素値に対応する回帰直線を基準として、回帰直線と各画素値との誤差の和が、予め記憶している閾値Thf未満である平坦部を抽出する。
【0520】
閾値Thfまたは画素値の変化量の割合などの平坦部の抽出の基準の値は、所望の値とすることができ、本発明は、平坦部の抽出の基準の値によって限定されない。平坦部の抽出の基準の値は、適応的に変化させることができる。
【0521】
平坦部抽出部801は、抽出した平坦部に属する画素について、平坦部に属する旨を示す平坦部フラグを設定して、前景成分画像および平坦部フラグを処理単位決定部802に供給する。さらに、平坦部抽出部801は、平坦部に属する画素のみから成る平坦部画像を生成して、動きボケ除去部803に供給する。
【0522】
処理単位決定部802は、平坦部抽出部801から供給された前景成分画像および平坦部フラグ、並びに領域特定部103から供給された領域情報を基に、前景成分画像から平坦部を取り除いた画素を指定するデータである処理単位を生成し、生成した処理単位を平坦部フラグと共に、動きボケ除去部803に供給する。
【0523】
動きボケ除去部803は、処理単位決定部802から供給された平坦部フラグを基に、前景背景分離部105から供給された前景成分画像から、平坦部に属する画素に含まれる前景の成分を算出する。
【0524】
動きボケ除去部803は、領域特定部103から供給された領域情報、および処理単位決定部802から供給された処理単位を基に、前景背景分離部105から供給された前景成分画像から平坦部に対応する前景の成分を除去する。動きボケ除去部803は、領域特定部103から供給された領域情報、および処理単位決定部802から供給された処理単位を基に、処理単位で指定される画素に含まれる、残りの前景の成分を算出する。
【0525】
動きボケ除去部803は、算出した処理単位で指定される画素に含まれる前景の成分を基に生成した画素、および平坦部抽出部801から供給された平坦部画像の画素を合成して、動きボケを除去した前景成分画像を生成する。
【0526】
動きボケ除去部803は、動きボケを除去した前景成分画像を動きボケ付加部804および選択部805に供給する。
【0527】
図74は、動きボケ除去部803の構成を示すブロック図である。前景背景分離部105から供給された前景成分画像、処理単位決定部802から供給された処理単位、並びに動き検出部102から供給された動きベクトルおよびその位置情報は、モデル化部821に供給される。
【0528】
モデル化部821は、動きベクトルの動き量vおよび処理単位を基に、モデル化を実行する。より具体的には、モデル化部821は、動き量vおよび処理単位を基に、画素値の時間方向の分割数および画素毎の前景の成分の数を決定し、画素値と前景の成分のとの対応を指定するモデルを生成する。モデル化部821は、予め記憶している複数のモデルの内、動き量vおよび処理単位に対応するモデルを選択するようにしてもよい。モデル化部821は、生成したモデルを前景成分画像と共に方程式生成部822に供給する。
【0529】
方程式生成部822は、モデル化部821から供給されたモデルを基に、方程式を生成し、生成した方程式を前景成分画像と共に足し込み部823に供給する。
【0530】
足し込み部823は、方程式生成部822から供給された方程式に、処理単位に対応する前景成分画像の画素値を設定し、画素値を設定した方程式を演算部824に供給する。処理単位で指定されたる画素は、平坦部に対応する画素を含まない。
【0531】
演算部824は、足し込み部823により画素値が設定された方程式を解いて、前景の成分を算出する。演算部824は、算出した前景の成分を基に、処理単位に対応する、動きボケを除去した画素を生成し、生成した処理単位に対応する画素を合成部825に出力する。
【0532】
合成部825は、演算部824から供給された処理単位に対応する画素、および平坦部抽出部801から供給された平坦部画像の画素を基に、動きボケを除去した前景成分画像を生成して、生成した前景成分画像を出力する。
【0533】
次に、図75乃至図80を参照して、動きボケ調整部106の動作を説明する。
【0534】
図75は、前景背景分離部105から出力され、平坦部抽出部801に入力される前景成分画像の動きベクトルに対応する直線上の画素の画素値を時間方向に展開したモデル図である。C01'乃至C23'は、前景成分画像のそれぞれの画素の画素値を示す。前景成分画像は、前景の成分のみから構成される。
【0535】
平坦部抽出部801は、閾値Thfを基に、前景背景分離部105から供給された前景成分画像に含まれる画素の内、その画素値の変化量が閾値Thf未満である連続する画素を抽出する。閾値Thfは、十分に小さな値である。平坦部抽出部801により抽出される連続した画素の数は、1フレーム内における、前景オブジェクトの動き量vより大きくなければならない。例えば、1フレーム内における、前景オブジェクトの動き量vが5のとき、平坦部抽出部801は、5つ以上の、画素値にほとんど変化の無い連続した画素、すなわち平坦部を抽出する。
【0536】
例えば、図76に示す例において、式(78)が成立するとき、前景の成分F06/v乃至F14/vは、式(79)乃至式(83)の関係より、その値が等しいことがわかる。
【0537】
C10'=C11'=C12'=C13'=C14' (78)
C10'=F06/v+F07/v+F08/v+F09/v+F10/v (79)
C11'=F07/v+F08/v+F09/v+F10/v+F11/v (80)
C12'=F08/v+F09/v+F10/v+F11/v+F12/v (81)
C13'=F09/v+F10/v+F11/v+F12/v+F13/v (82)
C14'=F10/v+F11/v+F12/v+F13/v+F14/v (83)
すなわち、前景の成分F06/v乃至F14/vは、式(84)に示す関係が成立する。
【0538】
F06/v=F07/v=F08/v=F09/v=F10/v=F11/v=F12/v=F13/v=F14/v (84)
【0539】
従って、その後の前景の成分を算出する処理においては、図77に示すように、前景の成分F06/v乃至F14/v以外の残りの前景の成分F01/v乃至F05/vおよび前景の成分F15/v乃至F19/vを算出すれば良いことがわかる。
【0540】
平坦部抽出部801は、このような処理に必要な画素値が均等な平坦部を抽出し、平坦部の抽出に対応して、平坦部に属する画素であるか否かを示す平坦部フラグを生成し、処理単位決定部802に供給する。また、平坦部抽出部801は、平坦部に属する画素のみから成る平坦部画像を動きボケ除去部803に供給する。
【0541】
処理単位決定部802は、前景成分画像に含まれる直線上の画素のうち、平坦部を取り除いた画素を示すデータである処理単位を生成し、処理単位を平坦部フラグと共に動きボケ除去部803に供給する。
【0542】
動きボケ除去部803は、処理単位決定部802から供給された平坦部フラグを基に、平坦部に属する画素に含まれる前景の成分を算出する。動きボケ除去部803は、平坦部フラグを基に、前景成分画像から、平坦部に属する画素に含まれる前景の成分を除去する。
【0543】
動きボケ除去部803は、処理単位決定部802から供給された処理単位を基に、前景成分画像に含まれる直線上の画素のうち、平坦部を取り除いた画素について画素値から残りの前景の成分を算出するための式を生成する。
【0544】
例えば、図76に示すように、前景成分画像の直線上の23個の画素の内、左から10番目乃至14番目の画素が平坦部に属する場合、左から10番目乃至14番目の画素に属する前景の成分を前景成分画像から取り除くことができるので、図77に示すように、残った前景の成分、すなわち前景の成分F01/v乃至F05/v、および前景の成分F15/v乃至F19/vについて式(85)乃至式(102)を生成すれば良い。
【0545】
Figure 0004596205
【0546】
式(85)乃至式(102)に、上述した最小自乗法を適用して、式(103)および式(104)を導く。
【0547】
【数17】
Figure 0004596205
【0548】
【数18】
Figure 0004596205
【0549】
動きボケ除去部803の方程式生成部822は、式(103)および式(104)に例を示す、処理単位に対応した方程式を生成する。動きボケ除去部803の足し込み部823は、平坦部に属する画素に含まれる前景の成分が除去された前景成分画像に含まれる画素値を、方程式生成部822により生成された方程式に設定する。動きボケ除去部803の演算部824は、画素値が設定された方程式にコレスキー分解などの解法を適用して、平坦部に属する画素に含まれる前景の成分以外の、前景成分画像に含まれる前景の成分を算出する。
【0550】
演算部824は、図78に例を示す、動きボケが除去された画素値であるFiから成る、動きボケが除去された前景成分画像を生成する。
【0551】
なお、図78に示す動きボケが除去された前景成分画像において、C04''乃至C05''のそれぞれにF01乃至F05のそれぞれが設定され、C18''乃至C19''のそれぞれにF15乃至F19のそれぞれが設定されているのは、画面に対する前景成分画像の位置を変化させないためであり、任意の位置に対応させることができる。
【0552】
演算部824は、平坦部抽出部801から供給された平坦部画像を基に、処理単位で除去された前景の成分に対応する画素を生成して、生成した画素を図78に示す動きボケが除去された前景成分画像に合成することにより、例えば、図79に示す前景成分画像を生成する。
【0553】
なお、動きボケ除去部803は、式(84)により算出される前景の成分F06/v乃至F14/vを基に、平坦部に対応する画素を生成するようにしてもよい。
【0554】
動きボケ付加部804は、動き量vとは異なる値の動きボケ調整量v'、例えば、動き量vの半分の値の動きボケ調整量v'や、動き量vと無関係の値の動きボケ調整量v'を与えることで、動きボケの量を調整することができる。例えば、図80に示すように、動きボケ付加部804は、動きボケが除去された前景の画素値Fiを動きボケ調整量v'で除すことにより、前景成分Fi/v'を算出して、前景成分Fi/v'の和を算出して、動きボケの量が調整された画素値を生成する。例えば、動きボケ調整量v'が3のとき、画素値C02''は、(F01)/v'とされ、画素値C03''は、(F01+F02)/v'とされ、画素値C04''は、(F01+F02+F03)/v'とされ、画素値C05''は、(F02+F03+F04)/v'とされる。
【0555】
動きボケ付加部804は、動きボケの量を調整した前景成分画像を選択部805に供給する。
【0556】
選択部805は、例えば使用者の選択に対応した選択信号を基に、演算部805から供給された動きボケが除去された前景成分画像、および動きボケ付加部804から供給された動きボケの量が調整された前景成分画像のいずれか一方を選択して、選択した前景成分画像を出力する。
【0557】
このように、動きボケ調整部106は、選択信号および動きボケ調整量v'を基に、動きボケの量を調整することができる。
【0558】
なお、動きボケ調整部106は、前景背景分離部105から背景成分画像を取得し、混合領域に属する画素に対応する背景の成分を調整するようにしてもよい。
【0559】
図81は、動きボケ調整部106による背景の成分の補正の処理を説明する図である。背景成分画像に含まれる画素の内、分離される前に混合領域に属していた画素は、前景背景分離部105により、前景の成分が除去される。
【0560】
動きボケ調整部106は、領域情報および動き量vを基に、背景成分画像に含まれる画素の内、混合領域に属していた画素に、対応する背景の成分を加えるように補正する。
【0561】
例えば、動きボケ調整部106は、画素値C02'''が4つの背景の成分B02/vを含むとき、画素値C02'''に1つの背景の成分(B02/V)'(背景の成分B02/vと同じ値)を加え、画素値C03'''が3つの背景の成分B03/vを含むとき、画素値C03'''に2つの背景の成分(B03/V)'(背景の成分B03/vと同じ値)を加える。
【0562】
動きボケ調整部106は、画素値C23'''が3つの背景の成分B23/vを含むとき、画素値C23'''に2つの背景の成分(B23/V)'(背景の成分B23/vと同じ値)を加え、画素値C24'''が4つの背景の成分B24/vを含むとき、画素値C24'''に1つの背景の成分(B24/V)'(背景の成分B24/vと同じ値)を加える。
【0563】
次に、図73に構成を示す動きボケ調整部106による処理の結果の例について説明する。
【0564】
図82は、静止している黒い四角を撮像した画像である。これに対して、図83は、図82の画像で撮像された黒い四角を移動させて撮像した画像である。図83に示す画像において、黒い四角の画像は、動きボケによって互いに干渉している。
【0565】
図83において点線で示す直線上の画素を対象に、図73に構成を示す動きボケ調整部106が処理を実行した結果の例を図84に示す。
【0566】
図84において、実線は、図73に構成を示す動きボケ調整部106が処理を実行し得られた画素値を示し、点線は、図83に示す直線上の画素値を示し、一点鎖線は、図82に示す対応する直線上の画素値を示す。
【0567】
図84に示す点線において、図中の両端の画素値がほぼ一定で平坦(均等)なので、動きボケ調整部106は、これを平坦部と見なして除去し、残った画素値に対して上述した処理を実行した。
【0568】
図84に示す結果より、動きボケ調整部106が、動いている黒い四角を撮像することにより、干渉して画素値が埋もれてしまっている画像から、静止している黒い四角を撮像した画像とほぼ同等の画素値を生成していることがわかる。
【0569】
図84に示す結果は、CCDにより撮像され、入射される光量と画素値との間に線形な関係が確保されている、ガンマ補正が適用されていない画像について本発明を適用したものである。同様に、ガンマ補正が適用された画像に対する本発明の有効性は、実験により確認されている。
【0570】
次に、図85のフローチャートを参照して、図73に構成を示す動きボケ調整部106による動きボケの量の調整の処理を説明する。
【0571】
ステップS801において、平坦部抽出部801は、前景背景分離部105から供給された前景成分画像から、隣接する画素であって、その画素値が均等である平坦部を抽出し、抽出した平坦部に対応する平坦部フラグを処理単位決定部802に供給すると共に、平坦部に属する画素から成る平坦部画像を動きボケ除去部803に供給する。
【0572】
ステップS802において、処理単位決定部802は、平坦部フラグを基に、前景成分画像に含まれる直線上の隣接する画素であって、平坦部に属する画素以外の画素の位置を示す処理単位を生成し、処理単位を動きボケ除去部803に供給する。
【0573】
ステップS803において、動きボケ除去部803は、前景背景分離部105から供給された前景成分画像、処理単位決定部802から供給された処理単位を基に、平坦部に属する画素に対応する前景の成分を算出すると共に、処理単位に対応する前景の成分を算出して、前景の成分から動きボケを除去する。動きボケ除去部803は、動きボケを除去した前景の成分を動きボケ付加部804および選択部805に出力する。ステップS803の動きボケの除去の処理の詳細については、図86のフローチャートを参照して後述する。
【0574】
ステップS804において、動きボケ調整部106は、前景成分画像全体について処理を終了したか否かを判定し、前景成分画像全体について処理を終了していないと判定された場合、ステップS803に戻り、次の処理単位に対応する前景の成分を対象とした動きボケの除去の処理を繰り返す。
【0575】
ステップS804において、前景成分画像全体について処理を終了したと判定された場合、ステップS805に進み、動きボケ調整部106の動きボケ付加部804および選択部805は、動きボケの量が調整された背景成分画像を算出し、動きボケが除去された前景成分画像および動きボケが付加された前景成分画像のいずれかを選択して、選択した画像を出力して、処理は終了する。
【0576】
このように、動きボケ調整部106は、入力された前景成分画像の動きボケの量を調整することができる。
【0577】
次に、図85のステップS803に対応する、動きボケ除去部803による処理単位に対応する前景成分画像の動きボケの除去の処理を、図86のフローチャートを参照して説明する。
【0578】
ステップS821において、動きボケ除去部803のモデル化部821は、動き量vおよび処理単位に対応して、モデルを生成する。ステップS822において、方程式生成部822は、生成されたモデルを基に、方程式を生成する。
【0579】
ステップS823において、足し込み部823は、生成された方程式に、平坦部に対応する前景の成分が除去された前景成分画像の画素値を設定する。ステップS824において、足し込み部823は、処理単位に対応する全ての画素の画素値の設定を行ったか否かを判定し、処理単位に対応する全ての画素の画素値の設定を行っていないと判定された場合、ステップS823に戻り、方程式への画素値の設定の処理を繰り返す。
【0580】
ステップS824において、処理単位の全ての画素の画素値の設定を行ったと判定された場合、ステップS825に進み、演算部824は、足し込み部823から供給された画素値が設定された方程式を基に、動きボケを除去した前景の画素値を算出する。
【0581】
ステップS826において、演算部824は、ステップS825の処理で算出された動きボケを除去した前景の画素値を設定した画素に、および平坦部抽出部801から供給された平坦部画像を合成して、動きボケを除去した前景成分画像を生成して、処理は終了する。
【0582】
このように、動きボケ除去部803は、動き量vおよび処理単位を基に、動きボケを含む前景成分画像から動きボケを除去することができる。
【0583】
以上のように、図73に構成を示す動きボケ調整部106は、入力された前景成分画像に含まれる動きボケの量を調整することができる。
【0584】
ウィナー・フィルタなど従来の動きボケを部分的に除去する手法においては、理想状態では効果が認められるが、量子化され、ノイズを含んだ実際の画像に対して十分な効果が得られない。これに対し、図73に構成を示す動きボケ調整部106において、量子化され、ノイズを含んだ実際の画像に対しても十分な効果が認められ、精度の良い動きボケの除去が可能となる。
【0585】
また、前景成分画像から平坦部を除去して、残った画素について前景の成分を算出するようにしたので、量子化またはノイズの影響が波及しにくくなり、図73に構成を示す動きボケ調整部106は、より精度良く動きボケの量を調整した画像を求めることができる。
【0586】
図87は、信号処理装置の機能の他の構成を示すブロック図である。
【0587】
図2に示す部分と同様の部分には同一の番号を付してあり、その説明は適宜省略する。
【0588】
領域特定部103は、領域情報を混合比算出部104および合成部1001に供給する。
【0589】
混合比算出部104は、混合比αを前景背景分離部105および合成部1001に供給する。
【0590】
前景背景分離部105は、前景成分画像を合成部1001に供給する。
【0591】
合成部1001は、混合比算出部104から供給された混合比α、領域特定部103から供給された領域情報を基に、任意の背景画像と、前景背景分離部105から供給された前景成分画像とを合成して、任意の背景画像と前景成分画像とが合成された合成画像を出力する。
【0592】
図88は、合成部1001の構成を示す図である。背景成分生成部1021は、混合比αおよび任意の背景画像を基に、背景成分画像を生成して、混合領域画像合成部1022に供給する。
【0593】
混合領域画像合成部1022は、背景成分生成部1021から供給された背景成分画像と前景成分画像とを合成することにより、混合領域合成画像を生成して、生成した混合領域合成画像を画像合成部1023に供給する。
【0594】
画像合成部1023は、領域情報を基に、前景成分画像、混合領域画像合成部1022から供給された混合領域合成画像、および任意の背景画像を合成して、合成画像を生成して出力する。
【0595】
このように、合成部1001は、前景成分画像を、任意の背景画像に合成することができる。
【0596】
特徴量である混合比αを基に前景成分画像を任意の背景画像と合成して得られた画像は、単に画素を合成した画像に比較し、より自然なものと成る。
【0597】
図89は、動きボケの量を調整する信号処理装置の機能の更に他の構成を示すブロック図である。図2に示す信号処理装置が領域特定と混合比αの算出を順番に行うのに対して、図89に示す信号処理装置は、領域特定と混合比αの算出を並行して行う。
【0598】
図2のブロック図に示す機能と同様の部分には同一の番号を付してあり、その説明は省略する。
【0599】
入力画像は、混合比算出部1101、前景背景分離部1102、領域特定部103、およびオブジェクト抽出部101に供給される。
【0600】
混合比算出部1101は、入力画像を基に、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比を、入力画像に含まれる画素のそれぞれに対して算出し、算出した画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比を前景背景分離部1102に供給する。
【0601】
図90は、混合比算出部1101の構成の一例を示すブロック図である。
【0602】
図90に示す推定混合比処理部401は、図47に示す推定混合比処理部401と同じである。図90に示す推定混合比処理部402は、図47に示す推定混合比処理部402と同じである。
【0603】
推定混合比処理部401は、入力画像を基に、カバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を出力する。
【0604】
推定混合比処理部402は、入力画像を基に、アンカバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を出力する。
【0605】
前景背景分離部1102は、混合比算出部1101から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比、並びに領域特定部103から供給された領域情報を基に、入力画像から前景成分画像を生成し、生成した前景成分画像を動きボケ調整部106および選択部107に供給する。
【0606】
図91は、前景背景分離部1102の構成の一例を示すブロック図である。
【0607】
図65に示す前景背景分離部105と同様の部分には同一の番号を付してあり、その説明は省略する。
【0608】
選択部1121は、領域特定部103から供給された領域情報を基に、混合比算出部1101から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比のいずれか一方を選択して、選択した推定混合比を混合比αとして分離部601に供給する。
【0609】
分離部601は、選択部1121から供給された混合比αおよび領域情報を基に、混合領域に属する画素の画素値から前景の成分および背景の成分を抽出し、抽出した前景の成分を合成部603に供給すると共に、背景の成分を合成部605に供給する。
【0610】
分離部601は、図70に示す構成と同じ構成とすることができる。
【0611】
合成部603は、前景成分画像を合成して、出力する。合成部605は、背景成分画像を合成して出力する。
【0612】
図89に示す動きボケ調整部106は、図2に示す場合と同様の構成とすることができ、領域情報および動きベクトルを基に、前景背景分離部1102から供給された前景成分画像に含まれる動きボケの量を調整して、動きボケの量が調整された前景成分画像を出力する。
【0613】
図89に示す選択部107は、例えば使用者の選択に対応した選択信号を基に、前景背景分離部1102から供給された前景成分画像、および動きボケ調整部106から供給された動きボケの量が調整された前景成分画像のいずれか一方を選択して、選択した前景成分画像を出力する。
【0614】
このように、図89に構成を示す信号処理装置は、入力画像に含まれる前景のオブジェクトに対応する画像に対して、その画像に含まれる動きボケの量を調整して出力することができる。図89に構成を示す信号処理装置は、第1の実施例と同様に、埋もれた情報である混合比αを算出して、算出した混合比αを出力することができる。
【0615】
図92は、前景成分画像を任意の背景画像と合成する信号処理装置の機能の他の構成を示すブロック図である。図87に示す信号処理装置が領域特定と混合比αの算出をシリアルに行うのに対して、図92に示す信号処理装置は、領域特定と混合比αの算出をパラレルに行う。
【0616】
図89のブロック図に示す機能と同様の部分には同一の番号を付してあり、その説明は省略する。
【0617】
図92に示す混合比算出部1101は、入力画像を基に、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比を、入力画像に含まれる画素のそれぞれに対して算出し、算出した画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比を前景背景分離部1102および合成部1201に供給する。
【0618】
図92に示す前景背景分離部1102は、混合比算出部1101から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比、並びに領域特定部103から供給された領域情報を基に、入力画像から前景成分画像を生成し、生成した前景成分画像を合成部1201に供給する。
【0619】
合成部1201は、混合比算出部1101から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比、領域特定部103から供給された領域情報を基に、任意の背景画像と、前景背景分離部1102から供給された前景成分画像とを合成して、任意の背景画像と前景成分画像とが合成された合成画像を出力する。
【0620】
図93は、合成部1201の構成を示す図である。図88のブロック図に示す機能と同様の部分には同一の番号を付してあり、その説明は省略する。
【0621】
選択部1221は、領域特定部103から供給された領域情報を基に、混合比算出部1101から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比のいずれか一方を選択して、選択した推定混合比を混合比αとして背景成分生成部1021に供給する。
【0622】
図93に示す背景成分生成部1021は、選択部1221から供給された混合比αおよび任意の背景画像を基に、背景成分画像を生成して、混合領域画像合成部1022に供給する。
【0623】
図93に示す混合領域画像合成部1022は、背景成分生成部1021から供給された背景成分画像と前景成分画像とを合成することにより、混合領域合成画像を生成して、生成した混合領域合成画像を画像合成部1023に供給する。
【0624】
画像合成部1023は、領域情報を基に、前景成分画像、混合領域画像合成部1022から供給された混合領域合成画像、および任意の背景画像を合成して、合成画像を生成して出力する。
【0625】
このように、合成部1201は、前景成分画像を、任意の背景画像に合成することができる。
【0626】
図94は、信号処理装置のさらに他の構成を示すブロック図である。
【0627】
図2に示す場合と同様の部分には、同一の番号を付してあり、その説明は適宜省略する。
【0628】
信号処理装置に供給された入力画像は、オブジェクト抽出部101、領域特定部103、平坦部抽出部1501、分離ボケ除去部1503、および合成部1504に供給される。
【0629】
オブジェクト抽出部101は、入力画像に含まれる前景のオブジェクトに対応する画像オブジェクトを粗く抽出して、抽出した画像オブジェクトを動き検出部102に供給する。オブジェクト抽出部101は、入力画像に含まれる背景のオブジェクトに対応する画像オブジェクトを粗く抽出して、抽出した画像オブジェクトを動き検出部102に供給する。
【0630】
動き検出部102は、粗く抽出された前景のオブジェクトに対応する画像オブジェクトの動きベクトルを算出して、算出した動きベクトルおよび動きベクトルの位置情報を領域特定部103、平坦部抽出部1501、処理単位決定部1502、および分離ボケ除去部1503に供給する。
【0631】
領域特定部103は、入力された画像の画素のそれぞれを、前景領域、背景領域、または混合領域のいずれかに特定し、画素毎に前景領域、背景領域、または混合領域のいずれかに属するかを示す情報(以下、領域情報と称する)を平坦部抽出部1501、処理単位決定部1502、および合成部1504に供給する。
【0632】
平坦部抽出部1501は、入力画像、動き検出部102から供給された動きベクトルおよびその位置情報、並びに領域特定部103から供給された領域情報を基に、アンカバードバックグラウンド領域に属する画素から始まり、カバードバックグラウンド領域に属する画素までの動き方向に並ぶ連続する画素の内、前景領域に属し隣接する画素であって、その画素値の変化量が少ない平坦部を抽出する。平坦部抽出部1501により抽出される平坦部は、画素値が均等な画素からなる。
【0633】
例えば、平坦部抽出部1501は、入力画像、動き検出部102から供給された動きベクトルおよびその位置情報、並びに領域特定部103から供給された領域情報を基に、アンカバードバックグラウンド領域に属する画素から始まり、カバードバックグラウンド領域に属する画素までの動き方向に並ぶ連続する画素の内、前景領域に属し隣接する画素であって、その画素値の変化量が予め記憶している閾値Thf1未満である平坦部を抽出する。
【0634】
また、例えば、平坦部抽出部1501は、前景成分画像の隣接する画素であって、その画素値の変化量が1%以内である平坦部を抽出する。平坦部の抽出の基準となる、画素値の変化量の割合は、所望の値とすることができる。
【0635】
または、平坦部抽出部1501は、前景成分画像の隣接する画素であって、その画素値の標準偏差が、予め記憶している閾値Thf1未満である平坦部を抽出する。
【0636】
さらに、例えば、平坦部抽出部1501は、前景成分画像の隣接する画素であって、その画素値に対応する回帰直線を基準として、回帰直線と各画素値との誤差の和が、予め記憶している閾値Thf1未満である平坦部を抽出する。
【0637】
閾値Thf1または画素値の変化量の割合などの平坦部の抽出の基準の値は、所望の値とすることができ、本発明は、平坦部の抽出の基準の値によって限定されない。平坦部の抽出の基準の値は、適応的に変化させることができる。
【0638】
平坦部抽出部1501は、抽出した平坦部の位置を示す情報である前景平坦部位置情報を生成し、生成した前景平坦部位置情報を処理単位決定部1502に供給する。
【0639】
処理単位決定部1502は、平坦部抽出部1501から供給された前景平坦部位置情報、動き検出部102から供給された動きベクトルおよびその位置情報、並びに領域特定部103から供給された領域情報を基に、前景領域または混合領域に属する1以上の画素を示す処理単位を決定する。
【0640】
処理単位決定部1502は、生成した処理単位を、分離ボケ除去部1503に供給する。
【0641】
分離ボケ除去部1503は、処理単位決定部1502から供給された処理単位、並びに動き検出部102から供給された動きベクトルおよびその位置情報を基に、入力画像の画素の内、処理単位に指定される画素について、動きボケの除去された前景成分画像、および分離された背景成分画像を生成し、生成した前景成分画像および背景成分画像を合成部1504に供給する。
【0642】
合成部1504は、領域特定部103から供給された領域情報を基に、分離ボケ除去部1503から供給された、動きボケの除去された前景成分画像、および分離された背景成分画像、並びに入力画像から、前景のオブジェクトの動きボケが除去された画像を合成して、合成した動きボケが除去された画像を出力する。
【0643】
図95は、分離ボケ除去部1503の構成を示すブロック図である。動き検出部102から供給された動きベクトルとその位置情報、および処理単位決定部1502から供給された処理単位は、モデル化部1521に供給される。
【0644】
モデル化部1521は、動き検出部102から供給された動きベクトルとその位置情報、および処理単位決定部1502から供給された処理単位を基に、モデルを生成し、生成したモデルを方程式生成部1522に供給する。
【0645】
図96乃至図99を参照して、処理単位、および処理単位に対応するモデルについて説明する。
【0646】
図96は、センサのシャッタスピードを十分に速くし、動きボケを生じないときの、画素の例を示す図である。F01乃至F20は、前景のオブジェクトに対応する画像の成分である。
【0647】
前景のオブジェクトに対応する、画素値C04は、F01であり、画素値C05は、F02であり、画素値C06は、F03であり、それぞれの画素値は、前景のオブジェクトに対応する1つの画像の成分からなる。同様に、画素値C07乃至C23は、それぞれF04乃至F20である。
【0648】
図96に示す例において、背景のオブジェクトが静止しているので、背景にも、動きボケが生じていない。
【0649】
背景のオブジェクトに対応する、画素値C01は、B01であり、画素値C02は、B02であり、画素値C03は、B03である。同様に、背景のオブジェクトに対応する、画素値C24は、B24であり、画素値C25は、B25であり、画素値C26は、B26である。
【0650】
図97は、図96に対応する、動きボケを生じているときの、画素値を時間方向に展開したモデル図である。
【0651】
図97に示す例において、動き量vは、5であり、前景のオブジェクトは、図中の左側から右側に向かって動いている。
【0652】
図97に示す例において、左から2番目乃至5番目に位置する画素は、混合領域に属する。また、左から22番目乃至25番目に位置する画素は、混合領域に属する。
【0653】
左から6番目乃至21番目に位置する画素は、前景領域に属する。
【0654】
平坦部抽出部1501は、予め記憶している閾値Thf1を基に、カバードバックグラウンド領域に属する画素までの動き方向に並ぶ連続する画素の内、前景領域に属する画素であって、その画素値の変化量が閾値Thf1未満である連続する画素を抽出する。
【0655】
閾値Thf1は、十分に小さな値である。平坦部抽出部1501により抽出される連続した画素の数は、1フレーム内における、前景オブジェクトの動き量vより大きくなければならない。例えば、1フレーム内における、前景オブジェクトの動き量vが5のとき、平坦部抽出部1501は、5つ以上の、画素値にほとんど変化の無い連続した画素、すなわち平坦部を抽出する。
【0656】
例えば、図98に示す例において、式(105)が成立するとき、前景の成分F06/v乃至F14/vは、式(106)乃至式(110)の関係より、その値が等しいことがわかる。
【0657】
C11=C12=C13=C14=C15 (105)
C11=F06/v+F07/v+F08/v+F09/v+F10/v (106)
C12=F07/v+F08/v+F09/v+F10/v+F11/v (107)
C13=F08/v+F09/v+F10/v+F11/v+F12/v (108)
C14=F09/v+F10/v+F11/v+F12/v+F13/v (109)
C15=F10/v+F11/v+F12/v+F13/v+F14/v (110)
すなわち、前景の成分F06/v乃至F14/vは、式(111)に示す関係が成立する。
【0658】
F06/v=F07/v=F08/v=F09/v=F10/v=F11/v=F12/v=F13/v=F14/v (111)
【0659】
従って、その後の前景の成分および背景の成分を算出する処理においては、図99に示すように、前景の成分F06/v乃至F14/v以外の残りの前景の成分F01/v乃至F05/vおよび前景の成分F15/v乃至F20/v、並びに背景の成分B02/v乃至B05/vおよび背景の成分B22/v乃至B25/vを算出すれば良いことがわかる。
【0660】
例えば、図98に示すように、アンカバードバックグラウンド領域に属する画素から始まり、カバードバックグラウンド領域に属する画素までの動き方向に並ぶ連続する画素である、図中の左から2番目乃至25番目の直線上の24個の画素の内、左から11番目乃至15番目の画素が平坦部に属する場合、左から11番目乃至15番目の画素に含まれる前景の成分を取り除くことができるので、図99に示すように、残った連続する画素に対応する前景の成分および背景の成分、すなわち前景の成分F01/v乃至F05/vおよび背景の成分B02/v乃至B05/vについて式(112)乃至式(120)を生成すれば良い。
【0661】
Figure 0004596205
【0662】
9個の式(112)乃至式(120)に対して、変数が、前景の成分F01/v乃至F05/vおよび背景の成分B02/v乃至B05/vの9個なので、式(112)乃至式(120)を解くことにより、前景の成分F01/v乃至F05/vおよび背景の成分B02/v乃至B05/vの値を求めることができる。
【0663】
同様に、前景の成分F15/v乃至F20/vおよび背景の成分B22/v乃至B25/vについて式(121)乃至式(130)を生成すれば良い。
【0664】
Figure 0004596205
【0665】
10個の式(121)乃至式(130)に対して、変数が、前景の成分F15/v乃至F20/vおよび背景の成分B22/v乃至B25/vの10個なので、式(121)乃至式(130)を解くことにより、前景の成分F15/v乃至F20/vおよび背景の成分B22/v乃至B25/vの値を求めることができる。
【0666】
図95に戻り、モデル化部1521は、動き検出部102から供給された動きベクトルとその位置情報、および処理単位決定部1502から供給された処理単位を基に、画素値の時間方向の分割数、画素毎の前景の成分の数、および画素毎の背景の成分の数を決定し、上述した前景の成分および背景の成分を算出するための方程式を生成するためのモデルを生成し、生成したモデルを方程式生成部1522に供給する。
【0667】
方程式生成部1522は、モデル化部1521から供給されたモデルを基に、方程式を生成する。方程式生成部1522は、生成された方程式に、モデルに対応する前景領域または背景領域に属する画素値を設定し、画素値を設定した方程式を演算部1523に供給する。
【0668】
演算部1523は、方程式生成部1522から供給された方程式を解いて、前景の成分および背景の成分を算出する。
【0669】
例えば、演算部1523は、式(112)乃至式(120)に対応する方程式が供給されたとき、式(131)に示す方程式の左辺の行列の逆行列を求めて、前景の成分F01/v乃至F05/vおよび背景の成分B02/v乃至B05/vを算出する。
【0670】
【数19】
Figure 0004596205
【0671】
また、演算部1523は、式(121)乃至式(130)に対応する方程式が供給されたとき、式(132)に示す方程式の左辺の行列の逆行列を求めて、前景の成分F15/v乃至F20/vおよび背景の成分B22/v乃至B25/vを算出する。
【0672】
【数20】
Figure 0004596205
【0673】
演算部1523は、前景の成分および背景の成分を基に、動きボケの除去された前景成分画像、および分離された背景成分画像を生成し、動きボケの除去された前景成分画像、および分離された背景成分画像を出力する。
【0674】
例えば、演算部1523は、方程式を解いて、前景の成分F01/v乃至F05/vおよび背景の成分B02/v乃至B05/v、並びに前景の成分F15/v乃至F20/vおよび背景の成分B22/v乃至B25/vを求めたとき、図100に示すように、前景の成分F01/v乃至F05/v、背景の成分B02/v、および背景の成分B03/v、並びに前景の成分F15/v乃至F20/v、背景の成分B24/v、および背景の成分B25/vに、動き量vを乗じて、画素値F01乃至F05、画素値B02、画素値B03、画素値F15乃至F20、画素値B24、および画素値B25を算出する。
【0675】
演算部1523は、例えば、画素値F01乃至F05および画素値F15乃至F20からなる動きボケの除去された前景成分画像、並びに、画素値B02、画素値B03、画素値B24、および画素値B25からなる分離された背景成分画像を生成する。
【0676】
図101および図102を参照して、分離ボケ除去部1503の実際の処理結果の例を説明する。
【0677】
図101は、前景オブジェクトおよび背景オブジェクトの混ざり込みが生じている入力画像の例を示す図である。図中の右上側の画像が背景オブジェクトに相当し、図中の左下側の画像が前景オブジェクトに相当する。前景のオブジェクトは、左から右に進んでいる。図中の左上側から右下側の間の帯状の領域が、混合領域である。
【0678】
図101の中央の線の上の画素について、上述した処理を適用した結果を図102に示す。図102中の細かい点線は、入力画像の画素値を示す。
【0679】
図102中の粗い点線は、動きボケの無い前景オブジェクトの画素値を示し、一点鎖線は、前景オブジェクトが混合されていない背景オブジェクトの画素値を示す。
【0680】
図102中の実線は、入力画像に上述した処理を適用した結果得られた、動きボケの除去された前景成分画像および分離された背景成分画像の画素値を示す。
【0681】
以上の結果から、図94に構成を示す情報処理装置は、入力画像に上述した処理を適用することにより、動きボケの無い前景オブジェクトの画素値、および前景オブジェクトが混合されていない背景オブジェクトの画素値に近い画素値を出力することが可能であることがわかる。
【0682】
図103のフローチャートを参照して、図94に構成を示す信号処理装置による動きボケの除去の処理を説明する。ステップS1001において、領域特定部103は、入力画像を基に、入力画像の画素毎に前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す領域情報を生成する領域特定の処理を実行する。領域特定部103は、生成した領域情報を平坦部抽出部1501に供給する。
【0683】
ステップS1002において、平坦部抽出部1501は、入力画像、動きベクトルおよびその位置情報、並びに領域情報を基に、アンカバードバックグラウンド領域に属する画素から始まり、カバードバックグラウンド領域に属する画素までの動き方向に並ぶ連続する画素の内、前景領域に属する画素であって、その画素値の変化量が予め記憶している閾値Thf1未満である平坦部を抽出する。平坦部抽出部1501は、抽出した平坦部の位置を示す情報である前景平坦部位置情報を生成し、生成した前景平坦部位置情報を処理単位決定部1502に供給する。
【0684】
ステップS1003において、処理単位決定部1502は、動きベクトルおよびその位置情報、並びに領域情報を基に、前景に対応するオブジェクトに含まれる1以上の画素を示す処理単位を決定して、処理単位を分離ボケ除去部1503に供給する。
【0685】
ステップS1004において、分離ボケ除去部1503は、処理単位決定部1502から供給された処理単位、並びに動き検出部102から供給された動きベクトルおよびその位置情報を基に、入力画像の画素の内、処理単位に指定される画素について、前景および背景の分離並びに動きボケ除去の一括処理を実行し、処理単位に指定される画素に対応する前景の成分および背景の成分を算出する。
前景および背景の分離並びに動きボケ除去の一括処理の詳細は、図104のフローチャートを参照して説明する。
【0686】
ステップS1005において、分離ボケ除去部1503は、平坦部の前景の成分を算出する。
【0687】
ステップS1006において、分離ボケ除去部1503は、ステップS1004の処理で算出した前景の成分および背景の成分、並びにステップS1005の処理で算出した平坦部の前景の成分を基に、動きボケが除去された前景成分画像の画素値および背景成分画像の画素値を算出する。分離ボケ除去部1503は、動きボケが除去された前景成分画像および背景成分画像を合成部1504に供給する。
【0688】
ステップS1007において、信号処理装置は、画面全体について処理を終了したか否かを判定し、画面全体について処理を終了していないと判定された場合、ステップS1004に戻り、前景および背景の分離および動きボケの除去の処理を繰り返す。
【0689】
ステップS1007において、画面全体について処理を終了したと判定された場合、ステップS1008に進み、合成部1504は、背景、並びに動きボケが除去された前景成分画像および背景成分画像を合成して、処理は終了する。
【0690】
このように、信号処理装置は、前景と背景を分離して、前景に含まれる動きボケを除去することができる。
【0691】
図104のフローチャートを参照して、分離ボケ除去部1503が実行する、前景および背景の分離並びに動きボケ除去の一括処理を説明する。
【0692】
ステップS1021において、モデル化部1521は、処理単位決定部1502から供給された処理単位、並びに動き検出部102から供給された動きベクトルおよびその位置情報を基に、モデルを生成する。モデル化部1521は、生成したモデルを方程式生成部1522に供給する。
【0693】
ステップS1022において、方程式生成部1522は、モデル化部1521から供給されたモデルを基に、画素値、前景の成分、および背景の成分の関係に対応する連立方程式を生成する。
【0694】
ステップS1023において、方程式生成部1522は、生成した連立方程式に、入力画像の対応する画素値を設定する。
【0695】
ステップS1024において、方程式生成部1522は、連立方程式に全ての画素値を設定したか否かを判定し、全ての画素値を設定していないと判定された場合、ステップS1023に戻り、画素値の設定の処理を繰り返す。
【0696】
ステップS1024において、全ての画素値を設定したと判定された場合、方程式生成部1522は、画素値を設定した連立方程式を演算部1523に供給し、演算部1523は、画素値が設定された連立方程式を演算することにより、前景の成分および背景の成分を算出して、処理は終了する。
【0697】
このように、分離ボケ除去部1503は、算出された前景の成分および背景の成分を基に、動きボケの除去された前景成分画像、および分離された背景成分画像を生成することができる。
【0698】
図105は、信号処理装置のさらに他の構成を示すブロック図である。図94に示す場合と同様の部分には、同一の番号を付してあり、その説明は省略する。
【0699】
処理単位決定分類部1601は、動き検出部102から供給された動きベクトルおよびその位置情報、領域特定部103から供給された領域情報、並びに平坦部抽出部1501から供給された前景平坦部位置情報を基に、処理単位を生成すると共に、入力画像の画素を分類して、分類された画素を分離ボケ除去部1503、動きボケ除去部1602、前景成分画像復元部1603、および背景成分画像復元部1604のいずれか1つに供給する。
【0700】
処理単位決定分類部1601は、アンカバードバックグラウンド領域に属する画素から始まり、カバードバックグラウンド領域に属する画素までの動き方向に並ぶ連続する画素の内、前景領域に属する画素から、平坦部に対応する前景の成分を除去し、前景領域の平坦部に対応する前景の成分が除去された、混合領域に属する画素および前景領域に属する画素を、対応する処理単位と共に、分離ボケ除去部1503に供給する。
【0701】
処理単位決定分類部1601は、前景領域の平坦部画像を前景成分画像復元部1603に供給する。
【0702】
処理単位決定分類部1601は、前景領域に属し、平坦部に挟まれた、平坦部に対応する前景の成分が除去された画素を、対応する処理単位と共に、動きボケ除去部1602に供給する。
【0703】
処理単位決定分類部1601は、背景領域に属する画素を背景成分画像復元部1604に供給する。
【0704】
分離ボケ除去部1503は、図104のフローチャートを参照して説明した処理と同様の処理で、前景領域に属する画素または混合領域に属する画素に対応する、動きボケの除去された前景成分画像および分離された背景成分画像を生成して、動きボケの除去された前景成分画像を前景成分画像復元部1603に供給し、分離された背景成分画像を背景成分画像復元部1604に供給する。
【0705】
動きボケ除去部1602は、処理単位決定分類部1601から供給された処理単位を基に、前景領域に属し、平坦部に挟まれた画素に対応する前景の成分を算出して、算出した前景の成分に対応する動きボケが除去された前景成分画像を生成する。動きボケ除去部1602は、生成した前景成分画像を前景成分画像復元部1603に供給する。
【0706】
図106は、動きボケ除去部1602の構成を示すブロック図である。
【0707】
動き検出部102から供給された動きベクトルとその位置情報、および処理単位決定分類部1601から供給された処理単位は、モデル化部1621に供給される。
【0708】
モデル化部1621は、動き検出部102から供給された動きベクトルとその位置情報、および処理単位決定分類部1601から供給された処理単位を基に、モデルを生成し、生成したモデルを方程式生成部1622に供給する。
【0709】
図107および図108を参照して、方程式生成部1622に供給されるモデルについて説明する。
【0710】
図107は、前景領域に属する画素に対応する、画素値を時間方向に展開したモデル図である。
【0711】
処理単位決定分離部601は、図98を参照して説明した処理と同様の処理で、前景領域に属する画素から、平坦部に対応する前景の成分を除去する。
【0712】
例えば、図107に示す例において、式(133)が成立するとき、式(134)乃至式(138)の関係より、前景の成分F106/v乃至F114/vの値が等しいことがわかるので、図108に示すように、前景の成分F106/v乃至F114/vは、前景領域に属する画素から除去される。
【0713】
C110=C111=C112=C113=C114 (133)
C110=F106/v+F107/v+F108/v+F109/v+F110/v (134)
C111=F107/v+F108/v+F109/v+F110/v+F111/v (135)
C112=F108/v+F109/v+F110/v+F111/v+F112/v (136)
C113=F109/v+F110/v+F111/v+F112/v+F113/v (137)
C114=F110/v+F111/v+F112/v+F113/v+F114/v (138)
【0714】
同様に、他の平坦部に対応する前景の成分F096/v乃至F100/v、および前景の成分F120/v乃至F124/vは、前景領域に属する画素から除去される。
【0715】
このように、平坦部に挟まれ、その平坦部に対応する前景の成分が除去された前景領域に属する画素が、対応する処理単位と共に、処理単位決定分類部1601から動きボケ除去部1602に供給される。
【0716】
動きボケ除去部1602のモデル化部1621は、処理単位を基に、平坦部に挟まれ、その平坦部に対応する前景の成分が除去された前景領域に属する画素と、残った前景の成分との関係に対応する式を生成するためのモデルを生成する。
【0717】
モデル化部1621は、生成したモデルを方程式生成部1622に供給する。
【0718】
方程式生成部1622は、モデル化部1621から供給されたモデルを基に、平坦部に挟まれ、その平坦部に対応する前景の成分が除去された前景領域に属する画素と、残った前景の成分との関係に対応する式を生成する。
【0719】
例えば、前景の成分F101/v乃至F105/v、および画素値の関係は、式(139)乃至式(147)で表される。
【0720】
Figure 0004596205
【0721】
また、前景の成分F101/v乃至F105/v、および画素値の関係は、式(148)乃至式(156)で表される。
【0722】
Figure 0004596205
【0723】
方程式生成部1622は、画素値が設定された式(139)乃至式(147)、および式(148)乃至式(156)に最小自乗法を適用して、式(157)および式(158)に例を示す正規方程式を導く。
【0724】
【数21】
Figure 0004596205
【0725】
【数22】
Figure 0004596205
【0726】
方程式生成部1622は、生成した式に、画素値を設定して、画素値が設定された式を演算部1623に供給する。
【0727】
演算部1623は、画素値が設定された正規方程式にコレスキー分解などの解法を適用して、平坦部に属する画素に含まれる前景の成分以外の、前景成分画像に含まれる前景の成分を算出する。演算部1623は、算出した前景の成分を基に、動きボケの除去された前景成分画像を生成し、動きボケの除去された前景成分画像を出力する。
【0728】
例えば、演算部1623は、前景の成分F101/v乃至F105/vおよび前景の成分F115/v乃至F119/vを求めたとき、図109に示すように、前景の成分F101/v乃至F105/vおよび前景の成分F115/v乃至F119/vに、動き量vを乗じて、画素値F101乃至F105および画素値F115乃至F119を算出する。
【0729】
演算部1623は、例えば、画素値F101乃至F105および画素値F115乃至F119からなる動きボケの除去された前景成分画像を生成する。
【0730】
図110のフローチャートを参照して、図94に構成を示す信号処理装置による動きボケの除去の処理を説明する。
【0731】
ステップS1101乃至ステップS1103の処理のそれぞれは、図103のステップS1001乃至ステップS1003の処理のそれぞれと同様なので、その説明は省略する。
【0732】
ステップS1104において、処理単位決定分類部1601は、動き検出部102から供給された動きベクトルおよびその位置情報、領域特定部103から供給された領域情報、並びに平坦部抽出部1501から供給された前景平坦部位置情報を基に、入力画像の画素を分類して、分類された画素を分離ボケ除去部1503、動きボケ除去部1602、前景成分画像復元部1603、および背景成分画像復元部1604のいずれか1つに供給する。
【0733】
ステップS1105において、分離ボケ除去部1503は、アンカバードバックグラウンド領域に属する画素から始まり、カバードバックグラウンド領域に属する画素までの動き方向に並ぶ連続する画素の内、前景領域に属する画素から、前景領域の平坦部に対応する前景の成分が除去された、混合領域に属する画素および前景領域に属する画素について、前景および背景の分離並びに動きボケ除去の一括の処理を実行する。ステップS1105の処理の詳細は、図103のステップS1004の処理の詳細と同様なので、その説明は省略する。
【0734】
ステップS1106において、分離ボケ除去部1503は、算出した前景の成分および背景の成分を基に、動きボケが除去された前景成分画像の画素値および背景成分画像の画素値を算出する。分離ボケ除去部1503は、動きボケが除去された前景成分画像を前景成分画像復元部1603に供給すると共に、背景成分画像を背景成分画像復元部1604に供給する。
【0735】
ステップS1107において、信号処理装置は、混合領域および前景領域について処理を終了したか否かを判定し、混合領域および前景領域について処理を終了していないと判定された場合、ステップS1105に戻り、前景および背景の分離および動きボケの除去の処理を繰り返す。
【0736】
ステップS1107において、混合領域および前景領域について処理を終了したと判定された場合、ステップS1108に進み、動きボケ除去部1602は、動き方向に並ぶ連続する画素の内、両側に平坦部が位置し、前景領域に属する画素から、平坦部に対応する前景の成分が除去された前景領域に属する画素について、動きボケの除去の処理を実行する。動きボケの除去の処理の詳細は、図111のフローチャートを参照して、説明する。
【0737】
ステップS1109において、動きボケ除去部1602は、算出した前景の成分を基に、動きボケが除去された前景成分画像の画素値を算出する。動きボケ除去部1602は、動きボケが除去された前景成分画像を前景成分画像復元部1603に供給する。
【0738】
ステップS1110において、信号処理装置は、前景領域について処理を終了したか否かを判定し、前景領域について処理を終了していないと判定された場合、ステップS1108に戻り、動きボケの除去の処理を繰り返す。
【0739】
ステップS1110において、前景領域について処理を終了したと判定された場合、手続きは、ステップS1111に進む。
【0740】
なお、ステップS1108乃至ステップS1110の処理は、ステップS1105乃至ステップS1107の処理と並列に実行される。
【0741】
ステップS1111において、前景成分画像復元部1603は、処理単位決定分類部1601から供給された平坦部画像、分離ボケ除去部1503から供給された動きボケが除去された前景成分画像、および動きボケ除去部1602から供給された動きボケが除去された前景成分画像を基に、動きボケが除去された前景成分画像の全体を復元する。背景成分画像復元部1604は、処理単位決定分類部1601から供給された背景領域画像、および分離ボケ除去部1503から供給された分離された背景成分画像を基に、背景成分画像の全体を復元して、処理は終了する。
【0742】
このように、図105に構成を示す情報処理装置は、前景オブジェクトから動きボケを除去することができる。
【0743】
次に、図110のステップS1108に対応する、動きボケ除去部1602による処理単位に対応する前景成分画像の動きボケの除去の処理を、図111のフローチャートを参照して説明する。
【0744】
ステップS1121において、動きボケ除去部1602のモデル化部1621は、動き量vおよび処理単位に対応して、モデルを生成する。ステップS1122において、方程式生成部1622は、生成されたモデルを基に、方程式を生成する。
【0745】
ステップS1123において、方程式生成部1622は、生成された方程式に、平坦部に対応する前景の成分が除去された前景成分画像の画素値を設定する。
ステップS1124において、方程式生成部1622は、処理単位に対応する全ての画素の画素値の設定を行ったか否かを判定し、処理単位に対応する全ての画素の画素値の設定を行っていないと判定された場合、ステップS1123に戻り、方程式への画素値の設定の処理を繰り返す。
【0746】
ステップS1124において、処理単位の全ての画素の画素値の設定を行ったと判定された場合、ステップS1125に進み、演算部1623は、方程式生成部1622から供給された画素値が設定された方程式を基に、動きボケを除去した前景の成分を算出して、処理は終了する。
【0747】
このように、動きボケ除去部1602は、動き量vおよび処理単位を基に、動きボケを含む前景成分画像から動きボケを除去することができる。
【0748】
なお、混合比αは、画素値に含まれる背景の成分の割合として説明したが、画素値に含まれる前景の成分の割合としてもよい。
【0749】
また、前景となるオブジェクトの動きの方向は左から右として説明したが、その方向に限定されないことは勿論である。
【0750】
以上においては、3次元空間と時間軸情報を有する現実空間の画像をビデオカメラを用いて2次元空間と時間軸情報を有する時空間への射影を行った場合を例としたが、本発明は、この例に限らず、より多くの第1の次元の第1の情報を、より少ない第2の次元の第2の情報に射影した場合に、その射影によって発生する歪みを補正したり、有意情報を抽出したり、またはより自然に画像を合成する場合に適応することが可能である。
【0751】
なお、センサは、CCDに限らす、固体撮像素子である、例えば、BBD(Bucket Brigade Device)、CID(Charge Injection Device)、またはCPD(Charge Priming Device)などのセンサでもよく、また、検出素子がマトリックス状に配置されているセンサに限らず、検出素子が1列に並んでいるセンサでもよい。
【0752】
本発明の信号処理を行うプログラムを記録した記録媒体は、図1に示すように、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク51(フロッピディスクを含む)、光ディスク52(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク53(MD(Mini-Disk)を含む)、もしくは半導体メモリ54などよりなるパッケージメディアにより構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM22や、記憶部28に含まれるハードディスクなどで構成される。
【0753】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0754】
【発明の効果】
本発明によれば、ボケた画像データに含まれる動きボケを除去することができるようになる。
【図面の簡単な説明】
【図1】本発明に係る信号処理装置の一実施の形態の構成を示すブロック図である。
【図2】信号処理装置を示すブロック図である。
【図3】センサによる撮像を説明する図である。
【図4】画素の配置を説明する図である。
【図5】検出素子の動作を説明する図である。
【図6】動いている前景に対応するオブジェクトと、静止している背景に対応するオブジェクトとを撮像して得られる画像を説明する図である。
【図7】背景領域、前景領域、混合領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域を説明する図である。
【図8】静止している前景に対応するオブジェクトおよび静止している背景に対応するオブジェクトを撮像した画像における、隣接して1列に並んでいる画素の画素値を時間方向に展開したモデル図である。
【図9】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図10】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図11】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図12】前景領域、背景領域、および混合領域の画素を抽出した例を示す図である。
【図13】画素と画素値を時間方向に展開したモデルとの対応を示す図である。
【図14】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図15】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図16】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図17】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図18】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図19】動きボケの量の調整の処理を説明するフローチャートである。
【図20】領域特定部103の構成の一例を示すブロック図である。
【図21】前景に対応するオブジェクトが移動しているときの画像を説明する図である。
【図22】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図23】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図24】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図25】領域判定の条件を説明する図である。
【図26】領域特定部103の領域の特定の結果の例を示す図である。
【図27】領域特定部103の領域の特定の結果の例を示す図である。
【図28】領域特定の処理を説明するフローチャートである。
【図29】領域特定部103の構成の他の一例を示すブロック図である。
【図30】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図31】背景画像の例を示す図である。
【図32】2値オブジェクト画像抽出部302の構成を示すブロック図である。
【図33】相関値の算出を説明する図である。
【図34】相関値の算出を説明する図である。
【図35】2値オブジェクト画像の例を示す図である。
【図36】時間変化検出部303の構成を示すブロック図である。
【図37】領域判定部342の判定を説明する図である。
【図38】時間変化検出部303の判定の例を示す図である。
【図39】領域判定部103の領域特定の処理を説明するフローチャートである。
【図40】領域判定の処理の詳細を説明するフローチャートである。
【図41】領域特定部103のさらに他の構成を示すブロック図である。
【図42】ロバスト化部361の構成を説明するブロック図である。
【図43】動き補償部381の動き補償を説明する図である。
【図44】動き補償部381の動き補償を説明する図である。
【図45】領域特定の処理を説明するフローチャートである。
【図46】ロバスト化の処理の詳細を説明するフローチャートである。
【図47】混合比算出部104の構成の一例を示すブロック図である。
【図48】理想的な混合比αの例を示す図である。
【図49】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図50】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図51】前景の成分の相関を利用した近似を説明する図である。
【図52】C,N、およびPの関係を説明する図である。
【図53】推定混合比処理部401の構成を示すブロック図である。
【図54】推定混合比の例を示す図である。
【図55】混合比算出部104の他の構成を示すブロック図である。
【図56】混合比の算出の処理を説明するフローチャートである。
【図57】推定混合比の演算の処理を説明するフローチャートである。
【図58】混合比αを近似する直線を説明する図である。
【図59】混合比αを近似する平面を説明する図である。
【図60】混合比αを算出するときの複数のフレームの画素の対応を説明する図である。
【図61】混合比推定処理部401の他の構成を示すブロック図である。
【図62】推定混合比の例を示す図である。
【図63】混合比の算出の処理を説明するフローチャートである。
【図64】カバードバックグラウンド領域に対応するモデルによる混合比推定の処理を説明するフローチャートである。
【図65】前景背景分離部105の構成の一例を示すブロック図である。
【図66】入力画像、前景成分画像、および背景成分画像を示す図である。
【図67】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図68】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図69】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図70】分離部601の構成の一例を示すブロック図である。
【図71】分離された前景成分画像、および背景成分画像の例を示す図である。
【図72】前景と背景との分離の処理を説明するフローチャートである。
【図73】動きボケ調整部106の構成を示すブロック図である。
【図74】動きボケ除去部803の構成を示すブロック図である。
【図75】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図76】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図77】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図78】動きボケが除去された画素の例を示す図である。
【図79】動きボケが除去された画素の例を示す図である。
【図80】動きボケが付加された画素の例を示す図である。
【図81】背景の成分の補正の処理を説明する図である。
【図82】静止している黒い四角を撮像した画像である。
【図83】黒い四角を移動させて撮像した画像である。
【図84】動きボケ調整部106が処理を実行した結果の例を示す図である。
【図85】る動きボケの量の調整の処理を説明するフローチャートである。
【図86】前景成分画像の動きボケの除去の処理を説明するフローチャートである。
【図87】信号処理装置の機能の他の構成を示すブロック図である。
【図88】合成部1001の構成を示す図である。
【図89】信号処理装置の機能のさらに他の構成を示すブロック図である。
【図90】混合比算出部1101の構成を示すブロック図である。
【図91】前景背景分離部1102の構成を示すブロック図である。
【図92】信号処理装置の機能のさらに他の構成を示すブロック図である。
【図93】合成部1201の構成を示す図である。
【図94】信号処理装置のさらに他の構成を示すブロック図である。
【図95】分離ボケ除去部1503の構成を示すブロック図である。
【図96】処理単位、および処理単位に対応するモデルについて説明する図である。
【図97】処理単位、および処理単位に対応するモデルについて説明する図である。
【図98】処理単位、および処理単位に対応するモデルについて説明する図である。
【図99】処理単位、および処理単位に対応するモデルについて説明する図である。
【図100】画素値の算出を説明する図である。
【図101】入力画像の例を示す図である。
【図102】処理結果の例を示す図である。
【図103】動きボケの除去の処理を説明するフローチャートである。
【図104】前景および背景の分離並びに動きボケ除去の一括処理を説明するフローチャートである。
【図105】信号処理装置のさらに他の構成を示すブロック図である。
【図106】動きボケ除去部1602の構成を示すブロック図である。
【図107】方程式生成部1622に供給されるモデルを説明する図である。
【図108】方程式生成部1622に供給されるモデルを説明する図である。
【図109】画素値の算出を説明する図である。
【図110】動きボケの除去の処理を説明するフローチャートである。
【図111】前景成分画像の動きボケの除去の処理を説明するフローチャートである。
【符号の説明】
21 CPU, 22 ROM, 23 RAM, 26 入力部, 27 出力部,28 記憶部, 29 通信部, 51 磁気ディスク, 52 光ディスク, 53 光磁気ディスク, 54 半導体メモリ, 101 オブジェクト抽出部, 102 動き検出部, 103 領域特定部, 104 混合比算出部, 105 前景背景分離部, 106 動きボケ調整部, 107 選択部,201 フレームメモリ, 202−1乃至202−4 静動判定部, 203−1乃至203−3 領域判定部, 204 判定フラグ格納フレームメモリ, 205 合成部, 206 判定フラグ格納フレームメモリ, 301 背景画像生成部, 302 2値オブジェクト画像抽出部, 303 時間変化検出部, 321 相関値演算部, 322 しきい値処理部, 341 フレームメモリ, 342 領域判定部, 361 ロバスト化部, 381 動き補償部, 382 スイッチ, 383−1乃至383−N フレームメモリ、 384−1乃至384−N 重み付け部, 385 積算部, 401 推定混合比処理部, 402 推定混合比処理部, 403 混合比決定部, 421フレームメモリ, 422 フレームメモリ, 423 混合比演算部, 441 選択部, 442 推定混合比処理部, 443 推定混合比処理部, 444 選択部, 501 遅延回路, 502 足し込み部, 503 演算部, 601 分離部, 602 スイッチ, 603 合成部, 604 スイッチ, 605 合成部, 621 フレームメモリ, 622 分離処理ブロック, 623 フレームメモリ, 631 アンカバード領域処理部, 632 カバード領域処理部, 633 合成部, 634 合成部, 801 平坦部抽出部, 802 処理単位決定部, 803 動きボケ除去部, 804 動きボケ付加部, 805 選択部, 821 モデル化部, 822 方程式生成部, 823 足し込み部, 824 演算部, 825 合成部, 1001 合成部, 1021 背景成分生成部, 1022 混合領域画像合成部, 1023 画像合成部, 1101 混合比算出部, 1102 前景背景分離部, 1121 選択部, 1201 合成部, 1221 選択部,1501 平坦部抽出部, 1502 処理単位決定部, 1503 分離ボケ除去部, 1504 合成部, 1521 モデル化部, 1522 方程式生成部, 1523 演算部, 1601 処理単位決定分類部, 1602 動きボケ除去部, 1603 前景成分画像復元部, 1604 背景成分画像復元部, 1621 モデル化部, 1622 方程式生成部, 1623 演算部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus, method, and program, and more particularly, to an image processing apparatus, method, and program that take into account the difference between a signal detected by a sensor and the real world.
[0002]
[Prior art]
A technique of detecting an event in the real world with a sensor and processing sampling data output from the sensor is widely used.
[0003]
For example, in an image obtained by capturing an object moving in front of a predetermined background with a video camera, motion blur occurs when the moving speed of the object is relatively fast.
[0004]
Conventionally, in order to suppress such motion blur, for example, the speed of the electronic shutter is increased and the exposure time is shortened.
[0005]
[Problems to be solved by the invention]
However, this method of increasing the shutter speed requires adjusting the shutter speed of the video camera before imaging. Therefore, there has been a problem that it is impossible to correct a blurred image already obtained and obtain a clear image.
[0006]
The present invention has been made in view of such a situation, and an object thereof is to be able to remove motion blur included in a blurred image.
[0007]
[Means for Solving the Problems]
The image processing apparatus according to claim 1 is configured by a foreground region composed of a foreground object component constituting a foreground object and a background region composed of a background object component constituting a background object, which are formed in the image data by a time integration effect. Pixel data in the foreground area based on the area information specifying the unmixed area, the mixed area formed by mixing the foreground object component and the background object component, and the image data, and the adjacent pixel data and its value Equality part detecting means for detecting an equality part consisting of substantially equal pixel data; Based on the area information and the position of the equal part, pixel data other than the pixel data of the equal part, corresponding to the pixel data belonging to the mixed area or the foreground area on one straight line, and composed of a plurality of foreground object components Based on the processing unit determining means for determining the processing unit and the motion vector of the processing unit and the foreground object, the number of divisions in the time direction of the foreground region and the mixed region and the number of foreground object components for each pixel are determined. Model generating means for generating a model for specifying the correspondence between pixel data and foreground object components in the area, and an equation indicating the relationship between the pixel data of the processing unit and the foreground object component included in the processing unit based on the model Foreground object component included in pixel data of processing unit by solving equation and generating equation Calculating means for calculating, calculation results of the foreground object component, and Motion blur removing means for removing motion blur occurring in the foreground area based on the detected equal part.
[0010]
The image processing apparatus may further include an area specifying unit that specifies a foreground area, a background area, or a mixed area.
[0011]
The uniform part detecting means can detect the uniform part by comparing the difference between the pixel data and the threshold value.
[0012]
The equal part detection means can detect an equal part composed of adjacent pixel data of a number equal to or greater than the number of pixels corresponding to the amount of motion of the foreground object.
[0015]
Claim 5 Image processing method described in Or the program according to claim 6 Is a foreground area composed of foreground object components constituting a foreground object, a background region composed of background object components constituting a background object, and a foreground object formed in image data by a time integration effect Based on area information for specifying a mixed area in which components and background object components are mixed, and image data, an equal portion consisting of pixel data in the foreground area and pixel data whose values are substantially equal to adjacent pixel data An equal part detecting step for detecting Based on the area information and the position of the equal part, pixel data other than the pixel data of the equal part, corresponding to the pixel data belonging to the mixed area or the foreground area on one straight line, and composed of a plurality of foreground object components Based on the processing unit determination step for determining the processing unit, and the processing unit and the motion vector of the foreground object, the number of divisions in the time direction of the region composed of the foreground region and the mixed region and the number of foreground object components for each pixel are determined. A model generation step for generating a model for specifying the correspondence between the pixel data in the region and the foreground object component, and an equation indicating the relationship between the pixel data of the processing unit and the foreground object component included in the processing unit based on the model An equation generation step for generating a foreground object included in the pixel data of the processing unit by solving the equation. A computing step of computing-object components, the calculation result of the foreground object component, and And a motion blur removal step of removing motion blur occurring in the foreground region based on the detected equal part.
[0031]
The image processing apparatus according to claim 1, Claim 5 An image processing method according to claim 1, and Claim 6 In the program described in the above, the unmixed image formed by the time integration effect is composed of the foreground area composed of the foreground object component constituting the foreground object and the background area composed of the background object component constituting the background object. Pixel data in the foreground area that is substantially equal to the adjacent pixel data, based on the area information specifying the area and the mixed area formed by mixing the foreground object component and the background object component, and the image data An equal part consisting of data is detected, Based on the area information and the position of the equal part, pixel data other than the pixel data of the equal part, corresponding to the pixel data belonging to the mixed area or the foreground area on one straight line, and composed of a plurality of foreground object components The processing unit is determined, and based on the processing unit and the motion vector of the foreground object, the number of divisions in the time direction of the foreground region and the mixed region and the number of foreground object components for each pixel are determined, and the pixel data in the region And a foreground object component are specified, and an equation indicating the relationship between the pixel data of the processing unit and the foreground object component included in the processing unit is generated based on the model. The foreground object component included in the pixel data of the processing unit is calculated, the calculation result of the foreground object component, and Based on the detected equal part, the motion blur occurring in the foreground area is removed.
[0032]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 1 is a block diagram showing a configuration of an embodiment of a signal processing apparatus according to the present invention. A CPU (Central Processing Unit) 21 executes various processes according to a program stored in a ROM (Read Only Memory) 22 or a storage unit 28. A RAM (Random Access Memory) 23 appropriately stores programs executed by the CPU 21 and data. The CPU 21, ROM 22, and RAM 23 are connected to each other by a bus 24.
[0033]
An input / output interface 25 is also connected to the CPU 21 via the bus 24. The input / output interface 25 is connected to an input unit 26 including a keyboard, a mouse, and a microphone, and an output unit 27 including a display and a speaker. The CPU 21 executes various processes in response to commands input from the input unit 26. Then, the CPU 21 outputs an image, sound, or the like obtained as a result of the processing to the output unit 27.
[0034]
The storage unit 28 connected to the input / output interface 25 is configured by, for example, a hard disk and stores programs executed by the CPU 21 and various data. The communication unit 29 communicates with an external device via the Internet or other networks. In this example, the communication unit 29 functions as an acquisition unit that captures the output of the sensor.
[0035]
A program may be acquired via the communication unit 29 and stored in the storage unit 28.
[0036]
The drive 30 connected to the input / output interface 25, when a magnetic disk 51, an optical disk 52, a magneto-optical disk 53, or a semiconductor memory 54 is mounted, drives them, and programs and data recorded there. Get etc. The acquired program and data are transferred to and stored in the storage unit 28 as necessary.
[0037]
Next, a signal processing apparatus that performs processing for identifying a region where significant information is buried or extracting the buried significant information from data acquired by a sensor will be described with a more specific example. In the following example, the CCD line sensor or CCD area sensor corresponds to the sensor, the area information and mixing ratio correspond to significant information, and the foreground and background are mixed and motion blur corresponds to distortion in the mixed area. To do.
[0038]
FIG. 2 is a block diagram illustrating the signal processing apparatus.
[0039]
It does not matter whether each function of the signal processing device is realized by hardware or software. That is, each block diagram in this specification may be considered as a hardware block diagram or a software functional block diagram.
[0040]
Here, the motion blur refers to a distortion included in an image corresponding to a moving object, which is caused by the movement of an object in the real world to be imaged and the imaging characteristics of the sensor.
[0041]
In this specification, an image corresponding to an object in the real world to be imaged is referred to as an image object.
[0042]
The input image supplied to the signal processing apparatus is supplied to the object extraction unit 101, the region specifying unit 103, the mixture ratio calculation unit 104, and the foreground / background separation unit 105.
[0043]
The object extraction unit 101 roughly extracts an image object corresponding to a foreground object included in the input image, and supplies the extracted image object to the motion detection unit 102. For example, the object extraction unit 101 detects the outline of the image object corresponding to the foreground object included in the input image, thereby roughly extracting the image object corresponding to the foreground object.
[0044]
The object extraction unit 101 roughly extracts an image object corresponding to a background object included in the input image, and supplies the extracted image object to the motion detection unit 102. For example, the object extraction unit 101 roughly extracts an image object corresponding to the background object from the difference between the input image and the image object corresponding to the extracted foreground object.
[0045]
Further, for example, the object extraction unit 101 corresponds to the image object corresponding to the foreground object and the background object from the difference between the background image stored in the background memory provided therein and the input image. You may make it extract the image object to perform roughly.
[0046]
The motion detection unit 102 calculates the motion vector of the image object corresponding to the coarsely extracted foreground object by a method such as a block matching method, a gradient method, a phase correlation method, and a per-recursive method. The motion vector and the position information of the motion vector (information specifying the position of the pixel corresponding to the motion vector) are supplied to the region specifying unit 103 and the motion blur extracting unit 106.
[0047]
The motion vector output from the motion detection unit 102 includes information corresponding to the motion amount v.
[0048]
Further, for example, the motion detection unit 102 may output a motion vector for each image object to the motion blur adjustment unit 106 together with pixel position information for specifying a pixel in the image object.
[0049]
The motion amount v is a value that represents a change in the position of the image corresponding to the moving object in units of pixel intervals. For example, when the image of the object corresponding to the foreground is moved so as to be displayed at a position separated by four pixels in the next frame with reference to a certain frame, the motion amount v of the image of the object corresponding to the foreground is 4.
[0050]
Note that the object extraction unit 101 and the motion detection unit 102 are necessary when adjusting the amount of motion blur corresponding to a moving object.
[0051]
The area specifying unit 103 specifies each pixel of the input image as one of the foreground area, the background area, or the mixed area, and whether each pixel belongs to one of the foreground area, the background area, or the mixed area (Hereinafter referred to as region information) is supplied to the mixture ratio calculation unit 104, foreground / background separation unit 105, and motion blur adjustment unit 106.
[0052]
Based on the input image and the region information supplied from the region specifying unit 103, the mixture ratio calculation unit 104 calculates a mixture ratio (hereinafter referred to as a mixture ratio α) corresponding to the pixels included in the mixture region 63. The calculated mixture ratio is supplied to the foreground / background separator 105.
[0053]
The mixing ratio α is a value indicating a ratio of an image component (hereinafter also referred to as a background component) corresponding to a background object in a pixel value, as shown in an equation (3) described later.
[0054]
Based on the region information supplied from the region specifying unit 103 and the mixture ratio α supplied from the mixture ratio calculation unit 104, the foreground / background separation unit 105 performs image component corresponding to the foreground object (hereinafter referred to as foreground component). The input image is separated into a foreground component image consisting of only the background component and a background component image consisting only of the background component, and the foreground component image is supplied to the motion blur adjustment unit 106 and the selection unit 107. Note that the separated foreground component image may be the final output. Only the foreground and the background can be specified without considering the conventional mixed region, and an accurate foreground and background can be obtained as compared with the separated method.
[0055]
The motion blur adjustment unit 106 determines a processing unit indicating one or more pixels included in the foreground component image based on the motion amount v and the region information that can be known from the motion vector. The processing unit is data that designates a group of pixels to be subjected to a process for adjusting the amount of motion blur.
[0056]
The motion blur adjustment unit 106 includes a motion blur adjustment amount input to the signal processing device, a foreground component image supplied from the foreground / background separation unit 105, a motion vector and position information supplied from the motion detection unit 102, and a processing unit. Based on the above, the amount of motion blur included in the foreground component image is adjusted by removing the motion blur included in the foreground component image, decreasing the amount of motion blur, or increasing the amount of motion blur. The foreground component image having the adjusted amount is output to the selection unit 107. The motion vector and its position information may not be used.
[0057]
For example, the selection unit 107 adjusts the foreground component image supplied from the foreground / background separation unit 105 and the amount of motion blur supplied from the motion blur adjustment unit 106 based on a selection signal corresponding to the user's selection. One of the foreground component images is selected, and the selected foreground component image is output.
[0058]
Next, an input image supplied to the signal processing device will be described with reference to FIGS.
[0059]
FIG. 3 is a diagram for explaining imaging by the sensor. The sensor is composed of, for example, a CCD video camera equipped with a CCD (Charge-Coupled Device) area sensor which is a solid-state image sensor. The object corresponding to the foreground in the real world moves horizontally between the object corresponding to the background and the sensor in the real world, for example, from the left side to the right side in the drawing.
[0060]
The sensor images an object corresponding to the foreground together with an object corresponding to the background. The sensor outputs the captured image in units of one frame. For example, the sensor outputs an image composed of 30 frames per second. The exposure time of the sensor can be 1/30 second. The exposure time is a period from the start of the conversion of the input light into the electric charge until the end of the conversion of the input light into the electric charge. Hereinafter, the exposure time is also referred to as shutter time.
[0061]
FIG. 4 is a diagram for explaining the arrangement of pixels. In FIG. 4, A to I indicate individual pixels. The pixels are arranged on a plane corresponding to the image. One detection element corresponding to one pixel is arranged on the sensor. When the sensor captures an image, one detection element outputs a pixel value corresponding to one pixel constituting the image. For example, the position of the detection element in the X direction corresponds to the horizontal position on the image, and the position of the detection element in the Y direction corresponds to the vertical position on the image.
[0062]
As shown in FIG. 5, for example, a detection element that is a CCD converts input light into electric charge for a period corresponding to the shutter time, and accumulates the converted electric charge. The amount of charge is approximately proportional to the intensity of input light and the time during which light is input. The detection element adds the electric charge converted from the input light to the already accumulated electric charge in a period corresponding to the shutter time. That is, the detection element integrates the input light for a period corresponding to the shutter time, and accumulates an amount of charge corresponding to the integrated light. It can be said that the detection element has an integration effect with respect to time.
[0063]
The electric charge accumulated in the detection element is converted into a voltage value by a circuit (not shown), and the voltage value is further converted into a pixel value such as digital data and output. Therefore, each pixel value output from the sensor is a value projected onto a one-dimensional space, which is the result of integrating a part of the object corresponding to the foreground or background having a spatial extent with respect to the shutter time. Have.
[0064]
The signal processing apparatus extracts significant information buried in the output signal, for example, the mixing ratio α, by the accumulation operation of the sensor. The signal processing apparatus adjusts the amount of distortion caused by the mixture of the foreground image objects themselves, for example, the amount of motion blur. The signal processing apparatus also adjusts the amount of distortion caused by the mixture of the foreground image object and the background image object.
[0065]
FIG. 6 is a diagram for explaining an image obtained by imaging an object corresponding to a moving foreground and an object corresponding to a stationary background. FIG. 6A shows an image obtained by imaging an object corresponding to the foreground with movement and an object corresponding to the stationary background. In the example shown in FIG. 6A, the object corresponding to the foreground is moving horizontally from the left to the right with respect to the screen.
[0066]
FIG. 6B is a model diagram in which pixel values corresponding to one line of the image shown in FIG. The horizontal direction in FIG. 6B corresponds to the spatial direction X in FIG.
[0067]
The pixel value of the background region pixel is composed of only the background component, that is, the image component corresponding to the background object. The pixel value of the foreground region pixel is composed of only the foreground component, that is, the image component corresponding to the foreground object.
[0068]
The pixel value of the pixel in the mixed area is composed of a background component and a foreground component. Since the pixel value is composed of the background component and the foreground component, the mixed region can be said to be a distortion region. The mixed area is further classified into a covered background area and an uncovered background area.
[0069]
The covered background area is a mixed area at a position corresponding to the front end of the foreground object in the advancing direction with respect to the foreground area, and is an area where the background component is covered with the foreground as time passes.
[0070]
On the other hand, the uncovered background area is a mixed area at a position corresponding to the rear end portion of the foreground object in the advancing direction with respect to the foreground area, and an area where a background component appears as time passes. Say.
[0071]
In this way, an image including a foreground area, a background area, or a covered background area or an uncovered background area is input as an input image to the area specifying unit 103, the mixture ratio calculation unit 104, and the foreground / background separation unit 105. .
[0072]
FIG. 7 is a diagram illustrating the background area, the foreground area, the mixed area, the covered background area, and the uncovered background area as described above. In the case of the image shown in FIG. 6, the background area is a stationary part, the foreground area is a moving part, and the covered background area of the mixed area is a part that changes from the background to the foreground. The uncovered background area is a portion that changes from the foreground to the background.
[0073]
FIG. 8 is a model diagram in which pixel values of pixels arranged in a row adjacent to each other in an image obtained by capturing an object corresponding to a stationary foreground and an object corresponding to a stationary background are expanded in the time direction. It is. For example, pixels arranged on one line of the screen can be selected as the pixels arranged adjacent to each other in one column.
[0074]
The pixel values F01 to F04 shown in FIG. 8 are pixel values corresponding to the still foreground object. The pixel values B01 to B04 shown in FIG. 8 are pixel values corresponding to the stationary background object.
[0075]
In the vertical direction in FIG. 8, time elapses from the top to the bottom in the figure. The position of the upper side of the rectangle in FIG. 8 corresponds to the time when the sensor starts to convert the input light into electric charge, and the position of the lower side of the rectangle in FIG. 8 indicates the electric charge of the light input by the sensor. Corresponds to the time to finish conversion of. That is, the distance from the upper side to the lower side of the rectangle in FIG. 8 corresponds to the shutter time.
[0076]
Hereinafter, a case where the shutter time and the frame interval are the same will be described as an example.
[0077]
The horizontal direction in FIG. 8 corresponds to the spatial direction X described in FIG. More specifically, in the example shown in FIG. 8, the distance from the left side of the rectangle described as “F01” in FIG. 8 to the right side of the rectangle described as “B04” is 8 times the pixel pitch, That is, it corresponds to the interval between eight consecutive pixels.
[0078]
When the foreground object and the background object are stationary, the light input to the sensor does not change during the period corresponding to the shutter time.
[0079]
Here, the period corresponding to the shutter time is divided into two or more periods having the same length. For example, when the number of virtual divisions is 4, the model diagram shown in FIG. 8 can be represented as the model shown in FIG. The virtual division number is set corresponding to the amount of movement v of the object corresponding to the foreground within the shutter time. For example, the number of virtual divisions is 4 corresponding to the motion amount v being 4, and the period corresponding to the shutter time is divided into 4.
[0080]
The top row in the figure corresponds to the first divided period after the shutter opens. The second row from the top in the figure corresponds to the second divided period from when the shutter has opened. The third line from the top in the figure corresponds to the third divided period from when the shutter has opened. The fourth row from the top in the figure corresponds to the fourth divided period from when the shutter has opened.
[0081]
Hereinafter, the shutter time divided in accordance with the motion amount v is also referred to as shutter time / v.
[0082]
Since the light input to the sensor does not change when the object corresponding to the foreground is stationary, the foreground component F01 / v is equal to a value obtained by dividing the pixel value F01 by the virtual division number. Similarly, when the object corresponding to the foreground is stationary, the foreground component F02 / v is equal to the value obtained by dividing the pixel value F02 by the number of virtual divisions, and the foreground component F03 / v is the virtual value of the pixel value F03. The foreground component F04 / v is equal to the value obtained by dividing the pixel value F04 by the virtual division number.
[0083]
Since the light input to the sensor does not change when the object corresponding to the background is stationary, the background component B01 / v is equal to the value obtained by dividing the pixel value B01 by the virtual division number. Similarly, when the object corresponding to the background is stationary, the background component B02 / v is equal to the value obtained by dividing the pixel value B02 by the virtual division number, and B03 / v is obtained by dividing the pixel value B03 by the virtual division number. B04 / v is equal to a value obtained by dividing the pixel value B04 by the number of virtual divisions.
[0084]
That is, when the object corresponding to the foreground is stationary, the light corresponding to the foreground object input to the sensor does not change during the period corresponding to the shutter time. The foreground component F01 / v corresponding to, the foreground component F01 / v corresponding to the second shutter time / v after the shutter opens, and the third foreground corresponding to the shutter time / v corresponding to the shutter time / v. And the foreground component F01 / v corresponding to the fourth shutter time / v after the shutter is opened have the same value. F02 / v to F04 / v have the same relationship as F01 / v.
[0085]
When the object corresponding to the background is stationary, the light corresponding to the background object input to the sensor does not change during the period corresponding to the shutter time, so it corresponds to the first shutter time / v after the shutter opens. Background component B01 / v, the second background component B01 / v corresponding to the shutter time / v after the shutter opens, and the third background component corresponding to the shutter time / v corresponding to the shutter time / v B01 / v and the fourth background component B01 / v corresponding to the shutter time / v after the shutter is opened have the same value. B02 / v to B04 / v have the same relationship.
[0086]
Next, a case where the object corresponding to the foreground moves and the object corresponding to the background is stationary will be described.
[0087]
FIG. 10 is a model diagram in which pixel values of pixels on one line including the covered background area are expanded in the time direction when the object corresponding to the foreground moves toward the right side in the drawing. In FIG. 10, the foreground motion amount v is 4. Since one frame is a short time, it can be assumed that the object corresponding to the foreground is a rigid body and is moving at a constant speed. In FIG. 10, the image of the object corresponding to the foreground moves so as to be displayed on the right side by four pixels in the next frame with reference to a certain frame.
[0088]
In FIG. 10, the leftmost pixel through the fourth pixel from the left belong to the foreground area. In FIG. 10, the fifth through seventh pixels from the left belong to the mixed area, which is a covered background area. In FIG. 10, the rightmost pixel belongs to the background area.
[0089]
Since the object corresponding to the foreground is moving so as to cover the object corresponding to the background with the passage of time, the component included in the pixel value of the pixel belonging to the covered background area has a period corresponding to the shutter time. At this point, the background component is replaced by the foreground component.
[0090]
For example, a pixel value M with a thick frame in FIG. 10 is expressed by Expression (1).
[0091]
M = B02 / v + B02 / v + F07 / v + F06 / v (1)
[0092]
For example, since the fifth pixel from the left includes a background component corresponding to one shutter time / v and includes a foreground component corresponding to three shutter times / v, the mixture ratio of the fifth pixel from the left α is 1/4. The sixth pixel from the left includes a background component corresponding to two shutter times / v and includes a foreground component corresponding to two shutter times / v. Therefore, the mixture ratio α of the sixth pixel from the left is 1/2. The seventh pixel from the left includes a background component corresponding to three shutter times / v, and includes a foreground component corresponding to one shutter time / v. Therefore, the mixture ratio α of the seventh pixel from the left is 3/4.
[0093]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the fourth pixel from the left in FIG. The foreground component F07 / v of the first shutter time / v after the shutter is opened is the foreground component corresponding to the second shutter time / v of the fifth pixel from the left in FIG. be equivalent to. Similarly, the foreground component F07 / v corresponds to the foreground component of the sixth pixel from the left in FIG. 10 corresponding to the third shutter time / v from when the shutter has opened, and the seventh pixel from the left in FIG. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0094]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the third pixel from the left in FIG. The foreground component F06 / v of the first shutter time / v after the shutter is opened is the foreground component of the fourth pixel from the left in FIG. 10 corresponding to the second shutter time / v after the shutter is opened. equal. Similarly, the foreground component F06 / v is the sixth pixel from the left in FIG. 10 and the foreground component of the fifth pixel from the left in FIG. 10 corresponding to the third shutter time / v from when the shutter has opened. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0095]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the second pixel from the left in FIG. The foreground component F05 / v of the first shutter time / v after the shutter is opened is the foreground component corresponding to the second shutter time / v of the third pixel from the left in FIG. be equivalent to. Similarly, the foreground component F05 / v is the fifth pixel from the left in FIG. 10 and the foreground component of the fourth pixel from the left in FIG. 10 corresponding to the third shutter time / v from when the shutter has opened. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0096]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the shutter of the leftmost pixel in FIG. The foreground component F04 / v of the first shutter time / v after opening is equal to the foreground component of the second pixel from the left in FIG. 10 corresponding to the second shutter time / v after the shutter is opened. Similarly, the foreground component F04 / v corresponds to the foreground component of the third pixel from the left in FIG. 10 corresponding to the third shutter time / v from when the shutter has opened, and the fourth pixel from the left in FIG. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0097]
Since the foreground area corresponding to the moving object includes motion blur as described above, it can be said to be a distortion area.
[0098]
FIG. 11 is a model diagram in which pixel values of pixels on one line including the uncovered background area are expanded in the time direction when the foreground moves toward the right side in the drawing. In FIG. 11, the foreground motion amount v is 4. Since one frame is a short time, it can be assumed that the object corresponding to the foreground is a rigid body and is moving at a constant speed. In FIG. 11, the image of the object corresponding to the foreground moves to the right by four pixels in the next frame with reference to a certain frame.
[0099]
In FIG. 11, the leftmost pixel through the fourth pixel from the left belong to the background area. In FIG. 11, the fifth pixel from the left to the seventh pixel from the left belong to the mixed area which is an uncovered background. In FIG. 11, the rightmost pixel belongs to the foreground area.
[0100]
Since the object corresponding to the foreground that covered the object corresponding to the background is moved so as to be removed from the front of the object corresponding to the background over time, it is included in the pixel value of the pixel belonging to the uncovered background area The component to be changed from the foreground component to the background component at a certain point in time corresponding to the shutter time.
[0101]
For example, a pixel value M ′ with a thick line frame in FIG. 11 is expressed by Expression (2).
[0102]
M '= F02 / v + F01 / v + B26 / v + B26 / v (2)
[0103]
For example, since the fifth pixel from the left includes a background component corresponding to three shutter times / v and includes a foreground component corresponding to one shutter time / v, the mixture ratio of the fifth pixel from the left α is 3/4. The sixth pixel from the left includes a background component corresponding to two shutter times / v and includes a foreground component corresponding to two shutter times / v. Therefore, the mixture ratio α of the sixth pixel from the left is 1/2. Since the seventh pixel from the left includes a background component corresponding to one shutter time / v and includes a foreground component corresponding to three shutter times / v, the mixture ratio α of the seventh pixel from the left is 1/4.
[0104]
When the expressions (1) and (2) are generalized, the pixel value M is expressed by the expression (3).
[0105]
[Expression 1]
Figure 0004596205
Here, α is a mixing ratio. B is a background pixel value, and Fi / v is a foreground component.
[0106]
Since the object corresponding to the foreground is a rigid body and can be assumed to move at a constant speed and the amount of movement v is 4, for example, the first pixel from the left in FIG. The foreground component F01 / v of the shutter time / v is equal to the foreground component of the sixth pixel from the left in FIG. 11 corresponding to the second shutter time / v after the shutter is opened. Similarly, F01 / v represents the foreground component of the seventh pixel from the left in FIG. 11 corresponding to the third shutter time / v from when the shutter has opened, and the eighth pixel from the left in FIG. , And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0107]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the number of virtual divisions is 4, for example, the first pixel from the left in FIG. The foreground component F02 / v of the shutter time / v is equal to the foreground component of the seventh pixel from the left in FIG. 11 corresponding to the second shutter time / v after the shutter is opened. Similarly, the foreground component F02 / v is equal to the foreground component of the eighth pixel from the left in FIG. 11 corresponding to the third shutter time / v from when the shutter has opened.
[0108]
Since the object corresponding to the foreground is a rigid body and can be assumed to move at a constant speed and the amount of movement v is 4, for example, the seventh pixel from the left in FIG. The foreground component F03 / v of the shutter time / v is equal to the foreground component of the eighth pixel from the left in FIG. 11 corresponding to the second shutter time / v after the shutter is opened.
[0109]
In the description of FIG. 9 to FIG. 11, it is assumed that the virtual division number is 4, but the virtual division number corresponds to the motion amount v. The amount of movement v generally corresponds to the moving speed of the object corresponding to the foreground. For example, when the object corresponding to the foreground is moving so as to be displayed to the right by four pixels in the next frame with reference to a certain frame, the amount of movement v is 4. Corresponding to the motion amount v, the number of virtual divisions is 4. Similarly, for example, when the object corresponding to the foreground is moving so that it is displayed on the left by 6 pixels in the next frame with reference to a certain frame, the motion amount v is set to 6, and the number of virtual divisions is , 6.
[0110]
12 and 13, the above-described mixed area composed of the foreground area, the background area, the covered background area, or the uncovered background area, and the foreground component and the background component corresponding to the divided shutter time, The relationship is shown.
[0111]
FIG. 12 shows an example in which pixels in the foreground area, background area, and mixed area are extracted from an image including a foreground corresponding to an object moving in front of a stationary background. In the example shown in FIG. 12, the object corresponding to the foreground is moving horizontally with respect to the screen.
[0112]
Frame # n + 1 is the next frame after frame #n, and frame # n + 2 is the next frame after frame # n + 1.
[0113]
Extract the pixels in the foreground area, background area, and mixed area extracted from any of frame #n to frame # n + 2, set the amount of motion v to 4, and set the pixel values of the extracted pixels in the time direction The developed model is shown in FIG.
[0114]
Since the object corresponding to the foreground moves, the pixel value in the foreground area is composed of four different foreground components corresponding to the shutter time / v period. For example, the leftmost pixel among the pixels in the foreground area shown in FIG. 13 is composed of F01 / v, F02 / v, F03 / v, and F04 / v. That is, the pixels in the foreground area include motion blur.
[0115]
Since the object corresponding to the background is stationary, the light corresponding to the background input to the sensor does not change during the period corresponding to the shutter time. In this case, the pixel value in the background area does not include motion blur.
[0116]
The pixel value of the pixel belonging to the mixed area composed of the covered background area or the uncovered background area is composed of a foreground component and a background component.
[0117]
Next, when the image corresponding to the object is moving, the pixel values of the pixels at the same position on the frame that are adjacent to each other in a plurality of frames are developed in the time direction. The model will be described. For example, when the image corresponding to the object moves horizontally with respect to the screen, the pixels arranged on one line of the screen can be selected as the pixels arranged in a row adjacent to each other.
[0118]
FIG. 14 shows pixels arranged in a row adjacent to three frames of an image obtained by capturing an object corresponding to a stationary background, and the pixel values of the pixels at the same position on the frame are represented by time. It is the model figure developed in the direction. Frame #n is the next frame after frame # n-1, and frame # n + 1 is the next frame after frame #n. Other frames are also referred to in the same manner.
[0119]
The pixel values B01 to B12 shown in FIG. 14 are pixel values corresponding to a stationary background object. Since the object corresponding to the background is stationary, the pixel value of the corresponding pixel does not change in frame # n−1 to frame n + 1. For example, the pixel in frame #n and the pixel in frame # n + 1 corresponding to the position of the pixel having a pixel value of B05 in frame # n−1 each have a pixel value of B05.
[0120]
FIG. 15 shows pixels arranged in a row adjacent to three frames of an image obtained by imaging an object corresponding to the foreground moving to the right side in the drawing together with an object corresponding to the stationary background, FIG. 5 is a model diagram in which pixel values of pixels at the same position on a frame are developed in the time direction. The model shown in FIG. 15 includes a covered background area.
[0121]
In FIG. 15, it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image is moved so that it is displayed on the right side by four pixels in the next frame. 4 and the number of virtual divisions is 4.
[0122]
For example, the foreground component of the leftmost pixel of frame # n−1 in FIG. 15 for the first shutter time / v after the shutter opens is F12 / v, and the second pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F12 / v. The foreground component of the third pixel from the left in FIG. 15 for the third shutter time / v after the shutter opens, and the fourth shutter time for the fourth pixel from the left in FIG. The foreground component of / v is F12 / v.
[0123]
The foreground component of the leftmost pixel of frame # n-1 in FIG. 15 for the second shutter time / v after the shutter opens is F11 / v, and the second pixel from the left in FIG. The foreground component of the third shutter time / v after the shutter is opened is also F11 / v. The foreground component of the third pixel from the left in FIG. 15 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F11 / v.
[0124]
The foreground component of the leftmost pixel of frame # n-1 in FIG. 15 corresponding to the third shutter time / v from when the shutter has opened is F10 / v, and the second pixel from the left in FIG. The foreground component of the fourth shutter time / v after the shutter is opened is also F10 / v. The foreground component of the leftmost pixel in frame # n−1 in FIG. 15 corresponding to the fourth shutter time / v from when the shutter has opened is F09 / v.
[0125]
Since the object corresponding to the background is stationary, the background component of the second pixel from the left of frame # n-1 in FIG. 15 corresponding to the first shutter time / v after the shutter is opened is B01 / v Become. The background component of the third pixel from the left of frame # n−1 in FIG. 15 corresponding to the first and second shutter time / v from when the shutter has opened is B02 / v. The background component of the fourth pixel from the left of frame # n−1 in FIG. 15 corresponding to the first through third shutter time / v from when the shutter has opened is B03 / v.
[0126]
In frame # n−1 in FIG. 15, the leftmost pixel belongs to the foreground area, and the second to fourth pixels from the left belong to the mixed area, which is a covered background area.
[0127]
The fifth through twelfth pixels from the left of frame # n−1 in FIG. 15 belong to the background area, and the pixel values thereof are B04 through B11, respectively.
[0128]
The first through fifth pixels from the left of frame #n in FIG. 15 belong to the foreground area. The foreground component of the shutter time / v in the foreground area of frame #n is any one of F05 / v to F12 / v.
[0129]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image moves so as to be displayed on the right side of four pixels in the next frame, so from the left of frame #n in FIG. The foreground component of the fifth pixel from the first shutter time / v after the shutter opens is F12 / v, and the sixth pixel from the left in FIG. The foreground component is also F12 / v. The foreground component of the seventh pixel from the left in FIG. 15 corresponding to the third shutter time / v from when the shutter has opened, and the fourth shutter time from the shutter opening of the eighth pixel from the left in FIG. The foreground component of / v is F12 / v.
[0130]
The foreground component of the fifth pixel from the left in frame #n in FIG. 15 corresponding to the second shutter time / v from when the shutter has opened is F11 / v, and the sixth pixel from the left in FIG. The foreground component of the third shutter time / v after the shutter is opened is also F11 / v. The foreground component of the seventh pixel from the left in FIG. 15 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F11 / v.
[0131]
The foreground component of the fifth pixel from the left in frame #n in FIG. 15 corresponding to the third shutter time / v from when the shutter has opened is F10 / v, and the sixth pixel from the left in FIG. The foreground component of the fourth shutter time / v after the shutter is opened is also F10 / v. The foreground component of the fifth pixel from the left of frame #n in FIG. 15 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F09 / v.
[0132]
Since the object corresponding to the background is stationary, the background component of the sixth pixel from the left of frame #n in FIG. 15 corresponding to the first shutter time / v after the shutter is opened is B05 / v. The background component of the seventh pixel from the left of frame #n in FIG. 15 corresponding to the first and second shutter time / v from when the shutter has opened is B06 / v. The background component of the eighth pixel from the left of frame #n in FIG. 15 corresponding to the first through third shutter time / v from when the shutter has opened is B07 / v.
[0133]
In frame #n in FIG. 15, the sixth through eighth pixels from the left belong to the mixed area, which is a covered background area.
[0134]
The ninth through twelfth pixels from the left of frame #n in FIG. 15 belong to the background area, and the pixel values thereof are B08 through B11, respectively.
[0135]
The first through ninth pixels from the left in frame # n + 1 in FIG. 15 belong to the foreground area. The foreground component of the shutter time / v in the foreground area of frame # n + 1 is any one of F01 / v to F12 / v.
[0136]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image moves so as to be displayed on the right side by four pixels in the next frame, so that the frame # n + 1 in FIG. The foreground component of the ninth pixel from the left when the shutter is opened and the first shutter time / v is F12 / v, and the tenth pixel from the left in FIG. 15 is the second shutter time after the shutter is opened. The foreground component of / v is also F12 / v. The foreground component of the eleventh pixel from the left in FIG. 15 corresponding to the third shutter time / v from when the shutter has opened, and the fourth shutter time from the shutter opening of the twelfth pixel from the left in FIG. The foreground component of / v is F12 / v.
[0137]
The foreground component of the ninth pixel from the left of frame # n + 1 in FIG. 15 corresponding to the second shutter time / v from when the shutter has opened is F11 / v, which is the tenth from the left in FIG. The foreground component of the third shutter time / v after the shutter opens is also F11 / v. The foreground component of the eleventh pixel from the left in FIG. 15 corresponding to the fourth shutter time / v from when the shutter has opened is F11 / v.
[0138]
The foreground component of the ninth pixel from the left of frame # n + 1 in FIG. 15 corresponding to the third shutter time / v from when the shutter has opened is F10 / v, which is the tenth pixel from the left in FIG. The foreground component of the fourth shutter time / v after the shutter is opened is also F10 / v. The foreground component of the ninth pixel from the left of frame # n + 1 in FIG. 15 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F09 / v.
[0139]
Since the object corresponding to the background is stationary, the background component of the tenth pixel from the left of frame # n + 1 in FIG. 15 from the left of the first shutter time / v after the shutter opens is B09 / v Become. The background component of the eleventh pixel from the left of frame # n + 1 in FIG. 15 corresponding to the first and second shutter time / v from when the shutter has opened is B10 / v. The background component of the twelfth pixel from the left of frame # n + 1 in FIG. 15 corresponding to the first through third shutter time / v from when the shutter has opened is B11 / v.
[0140]
In frame # n + 1 in FIG. 15, the tenth through twelfth pixels from the left correspond to the mixed area, which is a covered background area.
[0141]
FIG. 16 is a model diagram of an image obtained by extracting foreground components from the pixel values shown in FIG.
[0142]
FIG. 17 shows pixels arranged in a row adjacent to each other in three frames of an image obtained by imaging a foreground corresponding to an object moving to the right side in the figure together with a stationary background. It is the model figure which expand | deployed the pixel value of the pixel of the position of time direction. In FIG. 17, an uncovered background area is included.
[0143]
In FIG. 17, it can be assumed that the object corresponding to the foreground is a rigid body and is moving at a constant speed. Since the object corresponding to the foreground is moved so as to be displayed on the right side by four pixels in the next frame, the motion amount v is 4.
[0144]
For example, the foreground component of the leftmost pixel of frame # n-1 in FIG. 17 that is the first shutter time / v after the shutter opens is F13 / v, and is the second pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F13 / v. The foreground component of the third pixel from the left in FIG. 17 for the third shutter time / v after the shutter opens, and the fourth shutter time for the fourth pixel from the left in FIG. The foreground component of / v is F13 / v.
[0145]
The foreground component of the second pixel from the left in frame # n-1 in FIG. 17 corresponding to the first shutter time / v from when the shutter has opened is F14 / v, and the third pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F14 / v. The foreground component of the third pixel from the left in FIG. 17 corresponding to the first shutter time / v from when the shutter has opened is F15 / v.
[0146]
Since the object corresponding to the background is stationary, the background component of the leftmost pixel of frame # n−1 in FIG. 17 corresponding to the second to fourth shutter time / v from when the shutter has opened is B25. / v. The background components of the second pixel from the left of frame # n−1 in FIG. 17 corresponding to the third and fourth shutter time / v from when the shutter has opened are B26 / v. The background component of the third pixel from the left of frame # n−1 in FIG. 17 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is B27 / v.
[0147]
In frame # n-1 in FIG. 17, the leftmost pixel through the third pixel belong to the mixed area, which is an uncovered background area.
[0148]
The fourth through twelfth pixels from the left of frame # n−1 in FIG. 17 belong to the foreground area. The foreground component of the frame is any one of F13 / v to F24 / v.
[0149]
The leftmost pixel through the fourth pixel from the left in frame #n in FIG. 17 belong to the background area, and the pixel values are B25 through B28, respectively.
[0150]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image moves so as to be displayed on the right side of four pixels in the next frame, so from the left of frame #n in FIG. The foreground component of the fifth pixel at the first shutter time / v after the shutter opens is F13 / v, and the sixth pixel from the left in FIG. 17 opens the shutter at the second shutter time / v. The foreground component is also F13 / v. The foreground component of the seventh pixel from the left in FIG. 17 corresponding to the third shutter time / v from when the shutter has opened, and the fourth shutter time from the shutter opening of the eighth pixel from the left in FIG. The foreground component of / v is F13 / v.
[0151]
The foreground component of the sixth pixel from the left in frame #n in FIG. 17 corresponding to the first shutter time / v from when the shutter has opened is F14 / v, and the seventh pixel from the left in FIG. The foreground component of the second shutter time / v after opening is also F14 / v. The foreground component of the eighth pixel from the left in FIG. 17 corresponding to the first portion of the shutter time / v from when the shutter has opened is F15 / v.
[0152]
Since the object corresponding to the background is stationary, the background component of the fifth pixel from the left of frame #n in FIG. 17 corresponding to the second to fourth shutter time / v from when the shutter has opened is B29 / v. The background component of the sixth pixel from the left of frame #n in FIG. 17 corresponding to the third and fourth shutter time / v from when the shutter has opened is B30 / v. The background component of the seventh pixel from the left of frame #n in FIG. 17 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is B31 / v.
[0153]
In frame #n in FIG. 17, the fifth through seventh pixels from the left belong to the mixed area, which is an uncovered background area.
[0154]
The eighth through twelfth pixels from the left in frame #n in FIG. 17 belong to the foreground area. The value corresponding to the period of the shutter time / v in the foreground area of frame #n is any one of F13 / v to F20 / v.
[0155]
The leftmost pixel through the eighth pixel from the left in frame # n + 1 in FIG. 17 belong to the background area, and the pixel values are B25 through B32, respectively.
[0156]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image moves so as to be displayed on the right side by four pixels in the next frame. Therefore, the frame # n + 1 in FIG. The foreground component of the ninth pixel from the left when the shutter is opened and the first shutter time / v is F13 / v, and the tenth pixel from the left in FIG. The foreground component of / v is also F13 / v. The foreground component of the eleventh pixel from the left in FIG. 17 and the third shutter time / v from when the shutter has opened, and the fourth shutter time from the shutter of the twelfth pixel from the left in FIG. The foreground component of / v is F13 / v.
[0157]
The foreground component of the tenth pixel from the left of frame # n + 1 in FIG. 17 corresponding to the first shutter time / v from when the shutter has opened is F14 / v, and the eleventh pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F14 / v. The foreground component of the twelfth pixel from the left in FIG. 17 corresponding to the first shutter time / v from when the shutter has opened is F15 / v.
[0158]
Since the object corresponding to the background is stationary, the background components of the ninth pixel from the left of frame # n + 1 in FIG. , B33 / v. The background component of the tenth pixel from the left of frame # n + 1 in FIG. 17 corresponding to the third and fourth shutter time / v from when the shutter has opened is B34 / v. The background component of the eleventh pixel from the left of frame # n + 1 in FIG. 17 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is B35 / v.
[0159]
In frame # n + 1 in FIG. 17, the ninth through eleventh pixels from the left belong to the mixed area, which is an uncovered background area.
[0160]
The twelfth pixel from the left of frame # n + 1 in FIG. 17 belongs to the foreground area. The foreground component of the shutter time / v in the foreground area of frame # n + 1 is any one of F13 / v to F16 / v.
[0161]
FIG. 18 is a model diagram of an image obtained by extracting foreground components from the pixel values shown in FIG.
[0162]
Returning to FIG. 2, the region specifying unit 103 associates a flag indicating that the pixel belongs to the foreground region, the background region, the covered background region, or the uncovered background region for each pixel using the pixel values of a plurality of frames. Then, the region information is supplied to the mixture ratio calculation unit 104 and the motion blur adjustment unit 106.
[0163]
The mixture ratio calculation unit 104 calculates the mixture ratio α for each pixel for the pixels included in the mixed region based on the pixel values of a plurality of frames and the region information, and supplies the calculated mixture ratio α to the foreground / background separation unit 105. Supply.
[0164]
The foreground / background separation unit 105 extracts a foreground component image including only foreground components based on the pixel values of a plurality of frames, region information, and the mixture ratio α, and supplies the foreground component image to the motion blur adjustment unit 106.
[0165]
The motion blur adjustment unit 106 converts the foreground component image based on the foreground component image supplied from the foreground / background separation unit 105, the motion vector supplied from the motion detection unit 102, and the region information supplied from the region specifying unit 103. The amount of motion blur included is adjusted, and a foreground component image in which the amount of motion blur is adjusted is output.
[0166]
With reference to the flowchart of FIG. 19, the process of adjusting the amount of motion blur by the signal processing device will be described. In step S11, the area specifying unit 103 obtains area information indicating whether each pixel of the input image belongs to the foreground area, the background area, the covered background area, or the uncovered background area based on the input image. A process for specifying the area to be generated is executed. Details of the area specifying process will be described later.
The area specifying unit 103 supplies the generated area information to the mixture ratio calculating unit 104.
[0167]
In step S11, the area specifying unit 103, based on the input image, foreground area, background area, or mixed area for each pixel of the input image (does not distinguish between a covered background area or an uncovered background area). It may be possible to generate region information indicating which one of the items belongs to. In this case, the foreground / background separation unit 105 and the motion blur adjustment unit 106 determine whether the mixed region is a covered background region or an uncovered background region based on the direction of the motion vector. For example, when the foreground region, the mixed region, and the background region are arranged in order corresponding to the direction of the motion vector, the mixed region is determined as the covered background region, and the background is determined corresponding to the direction of the motion vector. When the region, the mixed region, and the foreground region are arranged in this order, the mixed region is determined as an uncovered background region.
[0168]
In step S12, the mixture ratio calculation unit 104 calculates the mixture ratio α for each pixel included in the mixed area based on the input image and the area information. Details of the mixing ratio calculation process will be described later. The mixture ratio calculation unit 104 supplies the calculated mixture ratio α to the foreground / background separation unit 105.
[0169]
In step S13, the foreground / background separator 105 extracts a foreground component from the input image based on the region information and the mixture ratio α, and supplies the foreground component image to the motion blur adjustment unit 106 as a foreground component image.
[0170]
In step S14, the motion blur adjustment unit 106 is a continuous pixel lined up in the motion direction based on the motion vector and the region information, and belongs to any one of the uncovered background region, the foreground region, and the covered background region. A processing unit indicating the position of the object on the image is generated, and the amount of motion blur included in the foreground component corresponding to the processing unit is adjusted. Details of the process of adjusting the amount of motion blur will be described later.
[0171]
In step S15, the signal processing apparatus determines whether or not the process has been completed for the entire screen. If it is determined that the process has not been completed for the entire screen, the process proceeds to step S14, and the foreground corresponding to the processing unit is determined. The process of adjusting the amount of motion blur for the component is repeated.
[0172]
If it is determined in step S15 that the process has been completed for the entire screen, the process ends.
[0173]
As described above, the signal processing apparatus can adjust the amount of motion blur included in the foreground by separating the foreground and the background. That is, the signal processing apparatus can adjust the amount of motion blur included in the sample data that is the pixel value of the foreground pixel.
[0174]
Hereinafter, the configurations of the area specifying unit 103, the mixture ratio calculating unit 104, the foreground / background separating unit 105, and the motion blur adjusting unit 106 will be described.
[0175]
FIG. 20 is a block diagram illustrating an example of the configuration of the area specifying unit 103. The area specifying unit 103 shown in FIG. 20 does not use a motion vector. The frame memory 201 stores the input image in units of frames. When the processing target is the frame #n, the frame memory 201 is a frame # n-2 that is a frame immediately before the frame #n, a frame # n-1 that is a frame immediately before the frame #n, A frame #n, a frame # n + 1 that is a frame subsequent to the frame #n, and a frame # n + 2 that is a frame subsequent to the frame #n are stored.
[0176]
The static motion determination unit 202-1 determines the pixel value of the pixel of frame # n + 2 at the same position on the image of the pixel that is the target of region specification of frame #n, and the region specification of frame #n. The pixel value of the pixel of frame # n + 1 at the same position as the position of the target pixel on the image is read from the frame memory 201, and the absolute value of the difference between the read pixel values is calculated. The static motion determination unit 202-1 determines whether or not the absolute value of the difference between the pixel value of frame # n + 2 and the pixel value of frame # n + 1 is greater than a preset threshold Th, When it is determined that the absolute value of the difference is greater than the threshold value Th, a static motion determination indicating motion is supplied to the region determination unit 203-1. When it is determined that the absolute value of the difference between the pixel value of the pixel of frame # n + 2 and the pixel value of the pixel of frame # n + 1 is equal to or less than the threshold value Th, the static motion determination unit 202-1 The static motion determination shown is supplied to the region determination unit 203-1.
[0177]
The static motion determination unit 202-2 is the target of the pixel value of the frame # n + 1 at the same position on the image of the pixel that is the target of region identification of the frame #n, and the target of the frame #n The pixel value of the pixel is read from the frame memory 201, and the absolute value of the difference between the pixel values is calculated. The static motion determination unit 202-2 determines whether or not the absolute value of the difference between the pixel value of the frame # n + 1 and the pixel value of the frame #n is greater than a preset threshold value Th. When it is determined that the absolute value of the difference between the two is greater than the threshold value Th, a static motion determination indicating motion is supplied to the region determination unit 203-1 and the region determination unit 203-2. When it is determined that the absolute value of the difference between the pixel value of the pixel of frame # n + 1 and the pixel value of the pixel of frame #n is equal to or less than the threshold value Th, the static motion determination unit 202-2 indicates stillness. The static motion determination is supplied to the region determination unit 203-1 and the region determination unit 203-2.
[0178]
The static motion determination unit 202-3 determines the frame #n at the same position as the pixel value of the pixel that is the region specification target of the frame #n and the position of the pixel that is the region specification target of the frame #n. The pixel value of −1 pixel is read from the frame memory 201, and the absolute value of the difference between the pixel values is calculated. The static motion determination unit 202-3 determines whether or not the absolute value of the difference between the pixel value of the frame #n and the pixel value of the frame # n-1 is larger than a preset threshold value Th. When it is determined that the absolute value of the difference between the two is greater than the threshold value Th, a static motion determination indicating motion is supplied to the region determination unit 203-2 and the region determination unit 203-3. When it is determined that the absolute value of the difference between the pixel value of the pixel of frame #n and the pixel value of the pixel of frame # n-1 is equal to or less than the threshold value Th, the static motion determination unit 202-3 indicates the still state The static motion determination is supplied to the region determination unit 203-2 and the region determination unit 203-3.
[0179]
The static motion determination unit 202-4 determines the pixel value of the pixel of frame # n-1 at the same position on the image of the pixel that is the target of region specification of frame #n, and the region specification of frame #n. The pixel value of the pixel of frame # n-2 located at the same position on the image of the target pixel is read from the frame memory 201, and the absolute value of the difference between the pixel values is calculated. The static motion determination unit 202-4 determines whether or not the absolute value of the difference between the pixel value of the frame # n-1 and the pixel value of the frame # n-2 is greater than a preset threshold Th, When it is determined that the absolute value of the difference between the pixel values is greater than the threshold value Th, a static motion determination indicating motion is supplied to the region determination unit 203-3. When it is determined that the absolute value of the difference between the pixel value of the pixel of frame # n-1 and the pixel value of the pixel of frame # n-2 is equal to or less than the threshold value Th, the static motion determination unit 202-4 Is supplied to the region determination unit 203-3.
[0180]
The region determination unit 203-1 is configured such that the static motion determination supplied from the static motion determination unit 202-1 indicates stillness and the static motion determination supplied from the static motion determination unit 202-2 indicates movement. The pixel that is the target of region identification in frame #n is determined to belong to the uncovered background region, and the uncovered background region determination flag corresponding to the pixel that is determined to belong to the region belongs to the uncovered background region. “1” indicating “” is set.
[0181]
The area determination unit 203-1 indicates that the static motion determination supplied from the static motion determination unit 202-1 indicates movement, or the static motion determination supplied from the static motion determination unit 202-2 indicates stillness. When determining that the pixel that is the target of region identification in frame #n does not belong to the uncovered background region, the uncovered background region determination flag corresponding to the pixel to be determined for the region is set to the uncovered background region. “0” is set to indicate that it does not belong.
[0182]
The area determination unit 203-1 supplies the uncovered background area determination flag in which “1” or “0” is set as described above to the determination flag storage frame memory 204.
[0183]
The region determination unit 203-2 is configured such that the static motion determination supplied from the static motion determination unit 202-2 indicates static and the static motion determination supplied from the static motion determination unit 202-3 indicates static. Then, it is determined that the pixel that is the target of region identification in frame #n belongs to the still region, and “1” indicating that it belongs to the still region is set in the still region determination flag corresponding to the pixel to be determined for the region.
[0184]
In the area determination unit 203-2, the static motion determination supplied from the static motion determination unit 202-2 indicates a motion, or the static motion determination supplied from the static motion determination unit 202-3 indicates a motion. At this time, it is determined that the pixel that is the region identification target in frame #n does not belong to the still region, and “0” indicating that it does not belong to the still region is set in the still region determination flag corresponding to the pixel to be determined for the region. Set.
[0185]
The region determination unit 203-2 supplies the still region determination flag in which “1” or “0” is set as described above to the determination flag storage frame memory 204.
[0186]
The region determination unit 203-2 is configured such that the static motion determination supplied from the static motion determination unit 202-2 indicates movement and the static motion determination supplied from the static motion determination unit 202-3 indicates movement. Then, it is determined that the pixel that is the target of region identification in frame #n belongs to the motion region, and “1” indicating that it belongs to the motion region is set in the motion region determination flag corresponding to the pixel determined for the region.
[0187]
The region determination unit 203-2 indicates that the static motion determination supplied from the static motion determination unit 202-2 indicates static or the static motion determination supplied from the static motion determination unit 202-3 indicates static. At this time, it is determined that the pixel that is the region identification target in frame #n does not belong to the motion region, and “0” indicating that it does not belong to the motion region is set in the motion region determination flag corresponding to the pixel that is determined to be the region Set.
[0188]
The region determination unit 203-2 supplies the motion region determination flag set to “1” or “0” to the determination flag storage frame memory 204 in this way.
[0189]
The region determination unit 203-3 is configured such that the static motion determination supplied from the static motion determination unit 202-3 indicates movement and the static motion determination supplied from the static motion determination unit 202-4 indicates stillness. , It is determined that the pixel that is the target of region identification in frame #n belongs to the covered background region, and the covered background region determination flag corresponding to the pixel to be determined of the region indicates that it belongs to the covered background region. 1 ”is set.
[0190]
In the area determination unit 203-3, the static motion determination supplied from the static motion determination unit 202-3 indicates stillness, or the static motion determination supplied from the static motion determination unit 202-4 indicates movement. When determining that the pixel that is the target of region identification in frame #n does not belong to the covered background region, the covered background region determination flag corresponding to the pixel to be determined for the region does not belong to the covered background region. “0” is set to indicate.
[0191]
The area determination unit 203-3 supplies the covered background area determination flag set to “1” or “0” to the determination flag storage frame memory 204 in this way.
[0192]
The determination flag storage frame memory 204 is supplied from the uncovered background region determination flag supplied from the region determination unit 203-1, the still region determination flag supplied from the region determination unit 203-2, and the region determination unit 203-2. The movement area determination flag and the covered background area determination flag supplied from the area determination unit 203-3 are stored.
[0193]
The determination flag storage frame memory 204 supplies the stored uncovered background area determination flag, still area determination flag, motion area determination flag, and covered background area determination flag to the synthesis unit 205. Based on the uncovered background area determination flag, the still area determination flag, the motion area determination flag, and the covered background area determination flag supplied from the determination flag storage frame memory 204, the combining unit 205 Area information indicating that it belongs to any one of the covered background area, the stationary area, the motion area, and the covered background area is generated and supplied to the determination flag storage frame memory 206.
[0194]
The determination flag storage frame memory 206 stores the area information supplied from the synthesis unit 205 and outputs the stored area information.
[0195]
Next, an example of processing of the area specifying unit 103 will be described with reference to FIGS.
[0196]
When the object corresponding to the foreground is moving, the position on the screen of the image corresponding to the object changes for each frame. As shown in FIG. 21, in the frame #n, the image corresponding to the object located at the position indicated by Yn (x, y) is Yn + 1 (x, y in the frame # n + 1 which is the next frame. Located in y).
[0197]
FIG. 24 shows a model diagram in which pixel values of pixels arranged in a row adjacent to the moving direction of the image corresponding to the foreground object are developed in the time direction. For example, when the moving direction of the image corresponding to the foreground object is horizontal with respect to the screen, the model diagram in FIG. 22 shows a model in which pixel values of adjacent pixels on one line are expanded in the time direction.
[0198]
In FIG. 22, the line in frame #n is the same as the line in frame # n + 1.
[0199]
Foreground components corresponding to the objects included in the second through thirteenth pixels from the left in frame #n are included in the sixth through seventeenth pixels from the left in frame # n + 1.
[0200]
In frame #n, the pixels belonging to the covered background area are the 11th to 13th pixels from the left, and the pixels belonging to the uncovered background area are the 2nd to 4th pixels from the left. In frame # n + 1, the pixels belonging to the covered background area are the 15th to 17th pixels from the left, and the pixels belonging to the uncovered background area are the 6th to 8th pixels from the left.
[0201]
In the example illustrated in FIG. 22, the foreground component included in the frame #n has moved four pixels in the frame # n + 1, and thus the motion amount v is four. The virtual division number corresponds to the motion amount v and is 4.
[0202]
Next, changes in pixel values of pixels belonging to the mixed region before and after the frame of interest will be described.
[0203]
In frame #n shown in FIG. 23 where the background is stationary and the foreground motion amount v is 4, the pixels belonging to the covered background area are the fifteenth through seventeenth pixels from the left. Since the motion amount v is 4, in the previous frame # n−1, the fifteenth through seventeenth pixels from the left include only background components and belong to the background area. In frame # n-2, the fifteenth through seventeenth pixels from the left include only background components and belong to the background area.
[0204]
Here, since the object corresponding to the background is stationary, the pixel value of the fifteenth pixel from the left in frame # n-1 does not change from the pixel value of the fifteenth pixel from the left in frame # n-2. . Similarly, the pixel value of the 16th pixel from the left of frame # n-1 does not change from the pixel value of the 16th pixel from the left of frame # n-2, and the 17th pixel from the left of frame # n-1 The pixel value of this pixel does not change from the pixel value of the 17th pixel from the left in frame # n-2.
[0205]
That is, the pixels of frame # n-1 and frame # n-2 corresponding to the pixels belonging to the covered background area in frame #n are composed of only background components, and the pixel value does not change. The value is almost zero. Therefore, the static motion determination for the pixels in frame # n-1 and frame # n-2 corresponding to the pixels belonging to the mixed region in frame #n is determined as static by the static motion determination unit 202-4.
[0206]
Since the pixels belonging to the covered background area in frame #n include the foreground components, the pixel values are different from the case of only the background components in frame # n-1. Therefore, the static motion determination for the pixels belonging to the mixed region in frame #n and the corresponding pixels in frame # n-1 is determined as motion by the static motion determination unit 202-3.
[0207]
As described above, the region determination unit 203-3 is supplied with the result of the static motion determination indicating the motion from the static motion determination unit 202-3, and is supplied with the result of the static motion determination indicating the static motion from the static motion determination unit 202-4. When it is done, it is determined that the corresponding pixel belongs to the covered background area.
[0208]
In the frame #n shown in FIG. 24 where the background is still and the foreground motion amount v is 4, the pixels included in the uncovered background area are the second through fourth pixels from the left. Since the motion amount v is 4, in the next frame # n + 1, the second through fourth pixels from the left include only background components and belong to the background area. Further, in the next frame # n + 2, the second through fourth pixels from the left include only background components and belong to the background area.
[0209]
Here, since the object corresponding to the background is stationary, the pixel value of the second pixel from the left of frame # n + 2 does not change from the pixel value of the second pixel from the left of frame # n + 1. . Similarly, the pixel value of the third pixel from the left of frame # n + 2 does not change from the pixel value of the third pixel from the left of frame # n + 1, and is the fourth from the left of frame # n + 2. The pixel value of this pixel does not change from the pixel value of the fourth pixel from the left in frame # n + 1.
[0210]
That is, the pixels of frame # n + 1 and frame # n + 2, which correspond to the pixels belonging to the uncovered background area in frame #n, consist only of background components, and the pixel value does not change. The absolute value is almost zero. Therefore, the static motion determination for the pixels in frame # n + 1 and frame # n + 2 corresponding to the pixels belonging to the mixed region in frame #n is determined as static by the static motion determination unit 202-1.
[0211]
Since the pixels belonging to the uncovered background area in frame #n include the foreground components, the pixel values are different from the case of only the background components in frame # n + 1. Therefore, the static motion determination for the pixels belonging to the mixed region in frame #n and the corresponding pixels in frame # n + 1 is determined as motion by the static motion determination unit 202-2.
[0212]
As described above, the region determination unit 203-1 is supplied with the result of the static motion determination indicating the motion from the static motion determination unit 202-2, and is supplied with the result of the static motion determination indicating the static motion from the static motion determination unit 202-1. Is determined to belong to the uncovered background area.
[0213]
FIG. 25 is a diagram illustrating determination conditions of the area specifying unit 103 in frame #n. The pixel in frame # n-2 at the same position on the image of the pixel to be judged in frame #n and the same position on the image of the pixel to be judged in frame #n A pixel in frame # n-1 is determined to be stationary, and a pixel in frame # n-1 and a pixel in frame #n at the same position on the image of the pixel to be determined in frame #n Are determined to be movements, the area specifying unit 103 determines that the pixel to be determined for frame #n belongs to the covered background area.
[0214]
The pixel in frame # n-1 and the pixel in frame #n at the same position on the image of the pixel to be determined in frame #n are determined to be stationary, and the pixel in frame #n When it is determined that the pixel of frame # n + 1 at the same position on the image of the pixel to be determined as #n is still, the area specifying unit 103 determines that the determination target of frame #n is Is determined to belong to the still region.
[0215]
The pixel in frame # n-1 and the pixel in frame #n at the same position on the image of the pixel to be determined in frame #n are determined to move, and the pixel in frame #n When it is determined that the pixel in frame # n + 1 at the same position on the image of the pixel to be determined as #n is a motion, the area specifying unit 103 determines that the determination is as frame #n. Is determined to belong to the motion region.
[0216]
The pixel in frame #n and the pixel in frame # n + 1 at the same position on the image of the pixel to be determined in frame #n are determined as motion, and the determination target in frame #n The pixel of frame # n + 1 at the same position as the position of the pixel on the image and the pixel of frame # n + 2 at the same position as the position of the pixel to be determined at frame #n on the image Are determined to be stationary, the area specifying unit 103 determines that the pixel to be determined for frame #n belongs to the uncovered background area.
[0217]
FIG. 26 is a diagram illustrating an example of the result of specifying the area of the area specifying unit 103. In FIG. 26A, pixels determined to belong to the covered background area are displayed in white. In FIG. 26B, pixels determined to belong to the uncovered background area are displayed in white.
[0218]
In FIG. 26C, pixels determined to belong to the motion region are displayed in white. In FIG. 26D, the pixels determined to belong to the still area are displayed in white.
[0219]
FIG. 27 is a diagram illustrating, as an image, region information indicating a mixed region among region information output from the determination flag storage frame memory 206. In FIG. 27, a pixel determined to belong to the covered background area or the uncovered background area, that is, a pixel determined to belong to the mixed area is displayed in white. The area information indicating the mixed area output from the determination flag storage frame memory 206 indicates a mixed area and a portion having a texture surrounded by a portion having no texture in the foreground area.
[0220]
Next, the area specifying process of the area specifying unit 103 will be described with reference to the flowchart of FIG. In step S201, the frame memory 201 acquires images of frames # n-2 to # n + 2 including the frame #n to be determined.
[0221]
In step S202, the static motion determination unit 202-3 determines whether or not the pixel in frame # n-1 and the pixel at the same position in frame #n are stationary. Then, the static motion determination unit 202-2 determines whether or not the frame #n and the pixel at the same position in the frame # n + 1 are still.
[0222]
In step S203, if it is determined that the pixel in frame #n and the pixel in the same position in frame # n + 1 are determined to be stationary, the process proceeds to step S204, and the region determination unit 203-2 determines that the region is determined. A corresponding still area determination flag is set to “1” indicating that it belongs to a still area. The region determination unit 203-2 supplies the still region determination flag to the determination flag storage frame memory 204, and the procedure proceeds to step S205.
[0223]
When it is determined in step S202 that the pixel in frame # n-1 and the pixel at the same position in frame #n are in motion, or in step S203, the pixel in frame #n and the same position in frame # n + 1 If the pixel is determined to be moving, the pixel in frame #n does not belong to the still region, so the process of step S204 is skipped, and the procedure proceeds to step S205.
[0224]
In step S205, the static motion determination unit 202-3 determines whether or not the pixel in frame # n-1 and the pixel at the same position in frame #n are in motion, and if it is determined as motion, the process proceeds to step S206. Then, the static motion determination unit 202-2 determines whether or not there is motion between the pixel of frame #n and the pixel at the same position of frame # n + 1.
[0225]
If it is determined in step S206 that the pixel in frame #n and the pixel in the same position in frame # n + 1 are in motion, the process proceeds to step S207, and the region determination unit 203-2 determines that the region is determined. “1” indicating that it belongs to a motion region is set in the corresponding motion region determination flag. The region determination unit 203-2 supplies the motion region determination flag to the determination flag storage frame memory 204, and the procedure proceeds to step S208.
[0226]
If it is determined in step S205 that the pixel in frame # n-1 and the pixel in the same position in frame #n are still, or in step S206, the pixel in frame #n and the same position in frame # n + 1 If the current pixel is determined to be still, the pixel of frame #n does not belong to the motion region, so the process of step S207 is skipped, and the procedure proceeds to step S208.
[0227]
In step S208, the static motion determination unit 202-4 determines whether or not the pixel in frame # n-2 and the pixel in the same position in frame # n-1 are stationary. In step S209, the static motion determination unit 202-3 determines whether or not there is motion between the pixel in frame # n-1 and the pixel at the same position in frame #n.
[0228]
If it is determined in step S209 that the motion of the pixel in frame # n-1 and the pixel at the same position in frame #n is determined as moving, the process proceeds to step S210, and the region determination unit 203-3 determines that the region is to be determined. The corresponding covered background area determination flag is set to “1” indicating that it belongs to the covered background area. The area determination unit 203-3 supplies the covered background area determination flag to the determination flag storage frame memory 204, and the procedure proceeds to step S211.
[0229]
If it is determined in step S208 that the pixel in frame # n-2 and the pixel in the same position in frame # n-1 are in motion, or in step S209, the pixel in frame # n-1 and the pixel in frame #n If it is determined that the pixel at the same position is still, the pixel of frame #n does not belong to the covered background area, so the process of step S210 is skipped, and the procedure proceeds to step S211.
[0230]
In step S211, the static motion determination unit 202-2 determines whether or not the pixel in the frame #n and the pixel in the same position in the frame # n + 1 are in motion, and if it is determined to be in motion, the process proceeds to step S212. Then, the static motion determination unit 202-1 determines whether or not the pixel of frame # n + 1 and the pixel at the same position of frame # n + 2 are still.
[0231]
If it is determined in step S212 that the pixel in frame # n + 1 and the pixel in the same position in frame # n + 2 are stationary, the process proceeds to step S213, and the region determination unit 203-1 determines the region. In the uncovered background area determination flag corresponding to the pixel, “1” indicating that the pixel belongs to the uncovered background area is set. The region determination unit 203-1 supplies the uncovered background region determination flag to the determination flag storage frame memory 204, and the procedure proceeds to step S214.
[0232]
If it is determined in step S211 that the pixel in frame #n and the pixel in the same position in frame # n + 1 are stationary, or in step S212, the pixel in frame # n + 1 and the frame # n + 2 If it is determined that the motion is the same pixel, the pixel of frame #n does not belong to the uncovered background area, so the process of step S213 is skipped, and the procedure proceeds to step S214.
[0233]
In step S214, the area specifying unit 103 determines whether or not an area has been specified for all the pixels of frame #n. If it is determined that no area has been specified for all the pixels of frame #n, Returns to step S202 and repeats the area specifying process for other pixels.
[0234]
If it is determined in step S214 that the area has been specified for all the pixels of frame #n, the process proceeds to step S215, where the synthesis unit 205 stores the uncovered background area determination flag stored in the determination flag storage frame memory 204. And a covered background area determination flag, area information indicating a mixed area is generated, and each pixel belongs to one of an uncovered background area, a stationary area, a motion area, and a covered background area. The region information indicating this is generated, the generated region information is set in the determination flag storage frame memory 206, and the process ends.
[0235]
As described above, the region specifying unit 103 may generate region information indicating that each pixel included in the frame belongs to the motion region, the still region, the uncovered background region, or the covered background region. it can.
[0236]
The area specifying unit 103 generates area information corresponding to the mixed area by applying a logical sum to the area information corresponding to the uncovered background area and the covered background area, and is included in the frame. For each pixel, region information including a flag indicating that the pixel belongs to a motion region, a still region, or a mixed region may be generated.
[0237]
When the object corresponding to the foreground has a texture, the area specifying unit 103 can specify the movement area more accurately.
[0238]
The area specifying unit 103 can output area information indicating a motion area as area information indicating a foreground area, and area information indicating a still area as area information indicating a background area.
[0239]
In addition, although the object corresponding to the background has been described as stationary, the above-described processing for specifying the region can be applied even if the image corresponding to the background region includes a motion. For example, when the image corresponding to the background area is moving uniformly, the area specifying unit 103 shifts the entire image corresponding to this movement, and performs the same processing as when the object corresponding to the background is stationary. To do. In addition, when the image corresponding to the background region includes a different motion for each local area, the region specifying unit 103 selects a pixel corresponding to the motion and executes the above-described processing.
[0240]
FIG. 29 is a block diagram illustrating another example of the configuration of the area specifying unit 103. The area specifying unit 103 illustrated in FIG. 29 does not use a motion vector. The background image generation unit 301 generates a background image corresponding to the input image, and supplies the generated background image to the binary object image extraction unit 302. For example, the background image generation unit 301 extracts an image object corresponding to a background object included in the input image, and generates a background image.
[0241]
FIG. 30 shows an example of a model diagram in which pixel values of pixels arranged in a line adjacent to the moving direction of the image corresponding to the foreground object are developed in the time direction. For example, when the motion direction of the image corresponding to the foreground object is horizontal with respect to the screen, the model diagram in FIG. 30 shows a model in which pixel values of adjacent pixels on one line are expanded in the time direction.
[0242]
In FIG. 30, the lines in frame #n are the same as the lines in frame # n−1 and frame # n + 1.
[0243]
In frame #n, the foreground components corresponding to the objects included in the sixth through seventeenth pixels from the left are included in the second through thirteenth pixels from the left in frame # n-1. In frame # n + 1, they are included in the 10th to 21st pixels from the left.
[0244]
In frame # n−1, the pixels belonging to the covered background area are the 11th to 13th pixels from the left, and the pixels belonging to the uncovered background area are the 2nd to 4th pixels from the left. In frame #n, the pixels belonging to the covered background area are the 15th to 17th pixels from the left, and the pixels belonging to the uncovered background area are the 6th to 8th pixels from the left. In frame # n + 1, the pixels belonging to the covered background area are the 19th to 21st pixels from the left, and the pixels belonging to the uncovered background area are the 10th to 12th pixels from the left.
[0245]
In frame # n−1, the pixels belonging to the background area are the first pixel from the left and the fourteenth through twenty-first pixels from the left. In frame #n, the pixels belonging to the background area are the first through fifth pixels from the left, and the eighteenth through twenty-first pixels from the left. In frame # n + 1, the pixels belonging to the background area are the first through ninth pixels from the left.
[0246]
An example of a background image generated by the background image generation unit 301 and corresponding to the example of FIG. 30 is shown in FIG. The background image is composed of pixels corresponding to the background object, and does not include image components corresponding to the foreground object.
[0247]
The binary object image extraction unit 302 generates a binary object image based on the correlation between the background image and the input image, and supplies the generated binary object image to the time change detection unit 303.
[0248]
FIG. 32 is a block diagram illustrating a configuration of the binary object image extraction unit 302. The correlation value calculation unit 321 calculates the correlation between the background image and the input image supplied from the background image generation unit 301, generates a correlation value, and supplies the generated correlation value to the threshold processing unit 322.
[0249]
For example, as shown in FIG. Four And a block corresponding to a block in the background image as shown in FIG. 33 (B). Four Applying equation (4) to a block in a 3 × 3 input image centered at Y Four The correlation value corresponding to is calculated.
[0250]
[Expression 2]
Figure 0004596205
[0251]
[Equation 3]
Figure 0004596205
[0252]
[Expression 4]
Figure 0004596205
[0253]
The correlation value calculation unit 321 supplies the correlation value calculated for each pixel in this way to the threshold processing unit 322.
[0254]
In addition, the correlation value calculation unit 321 performs, for example, as shown in FIG. Four And a block corresponding to the block in the background image as shown in FIG. 34 (B). Four Applying equation (7) to a block in a 3 × 3 input image centered at Y Four The sum of absolute differences may be calculated.
[0255]
[Equation 5]
Figure 0004596205
[0256]
The correlation value calculation unit 321 supplies the sum of absolute differences calculated as described above to the threshold processing unit 322 as a correlation value.
[0257]
The threshold value processing unit 322 compares the pixel value of the correlation image with the threshold value th0. When the correlation value is equal to or less than the threshold value th0, the threshold value processing unit 322 sets the pixel value of the binary object image to 1, and Is greater than the threshold th0, the pixel value of the binary object image is set to 0, and a binary object image with 0 or 1 set to the pixel value is output. The threshold processing unit 322 may store the threshold th0 in advance, or may use the threshold th0 input from the outside.
[0258]
FIG. 35 is a diagram showing an example of a binary object image corresponding to the model of the input image shown in FIG. In the binary object image, the pixel value is set to 0 for a pixel having a high correlation with the background image.
[0259]
FIG. 36 is a block diagram illustrating a configuration of the time change detection unit 303. The frame memory 341 determines the area for the pixel of frame #n, and the binary object image of frame # n−1, frame #n, and frame # n + 1 supplied from the binary object image extraction unit 302 Remember.
[0260]
The area determination unit 342 determines an area for each pixel of the frame #n based on the binary object images of the frame # n−1, the frame #n, and the frame # n + 1 stored in the frame memory 341. Region information is generated, and the generated region information is output.
[0261]
FIG. 37 is a diagram illustrating the determination of the region determination unit 342. When the pixel of interest of the binary object image of frame #n is 0, the region determination unit 342 determines that the pixel of interest of frame #n belongs to the background region.
[0262]
The pixel of interest of the binary object image of frame #n is 1, the corresponding pixel of the binary object image of frame # n-1 is 1, and the correspondence of the binary object image of frame # n + 1 When the pixel to be processed is 1, the region determination unit 342 determines that the pixel of interest in frame #n belongs to the foreground region.
[0263]
When the pixel of interest of the binary object image of frame #n is 1 and the corresponding pixel of the binary object image of frame # n-1 is 0, the region determination unit 342 It is determined that the pixel in question belongs to the covered background area.
[0264]
When the pixel of interest of the binary object image of frame #n is 1 and the corresponding pixel of the binary object image of frame # n + 1 is 0, the region determination unit 342 It is determined that the current pixel belongs to the uncovered background area.
[0265]
FIG. 38 is a diagram illustrating an example in which the time change detection unit 303 determines the binary object image corresponding to the input image model illustrated in FIG. Since the corresponding pixel of frame #n of the binary object image is 0, the time change detection unit 303 determines that the first to fifth pixels from the left of the frame #n belong to the background area.
[0266]
The temporal change detection unit 303 has the uncovered background region as the sixth to ninth pixels from the left because the pixel of frame #n of the binary object image is 1 and the corresponding pixel of frame # n + 1 is 0. It is determined that it belongs to.
[0267]
The temporal change detection unit 303 has a pixel of frame #n of 1 in the binary object image, a corresponding pixel of frame # n−1 is 1, and a corresponding pixel of frame # n + 1 is 1. The tenth through thirteenth pixels are determined to belong to the foreground area.
[0268]
Since the pixel of frame #n of the binary object image is 1 and the corresponding pixel of frame # n−1 is 0, the time change detection unit 303 sets the 14th to 17th pixels from the left as the covered background area. Judge as belonging.
[0269]
The time change detection unit 303 determines that the 18th to 21st pixels from the left belong to the background area because the corresponding pixel of frame #n of the binary object image is 0.
[0270]
Next, the area specifying process of the area determination unit 103 will be described with reference to the flowchart of FIG. In step S301, the background image generation unit 301 of the region determination unit 103 generates a background image by extracting, for example, an image object corresponding to a background object included in the input image based on the input image, and generates the generated background. The image is supplied to the binary object image extraction unit 302.
[0271]
In step S302, the binary object image extraction unit 302 calculates a correlation value between the input image and the background image supplied from the background image generation unit 301, for example, by the calculation described with reference to FIG. In step S303, the binary object image extraction unit 302 calculates a binary object image from the correlation value and the threshold value th0, for example, by comparing the correlation value with the threshold value th0.
[0272]
In step S304, the time change detection unit 303 executes region determination processing, and the processing ends.
[0273]
Details of the area determination process corresponding to step S304 will be described with reference to the flowchart of FIG. In step S321, the region determination unit 342 of the time change detection unit 303 determines whether or not the pixel of interest is 0 in the frame #n stored in the frame memory 341, and pays attention in the frame #n. If it is determined that the pixel is 0, the process proceeds to step S322, the pixel of interest in frame #n is set as belonging to the background area, and the process ends.
[0274]
If it is determined in step S321 that the pixel of interest is 1 in frame #n, the process proceeds to step S323, where the area determination unit 342 of the time change detection unit 303 stores the frame #n stored in the frame memory 341. In frame # n-1, it is determined whether or not the corresponding pixel is 0, and in frame #n, the target pixel is 1 and frame #n If it is determined at n−1 that the corresponding pixel is 0, the process proceeds to step S324, the pixel of interest in frame #n is set as belonging to the covered background area, and the process ends.
[0275]
If it is determined in step S323 that the pixel of interest is 0 in frame #n or the corresponding pixel is 1 in frame # n-1, the process proceeds to step S325, and the time change detection unit 303 The area determination unit 342 determines whether the pixel of interest is 1 in frame #n stored in the frame memory 341 and whether the corresponding pixel is 0 in frame # n + 1. If it is determined that the pixel of interest is 1 in frame #n and the corresponding pixel is 0 in frame # n + 1, the process proceeds to step S326, and the pixel of interest of frame #n is undefined. The process ends with setting to belong to the covered background area.
[0276]
If it is determined in step S325 that the pixel of interest is 0 in frame #n or the corresponding pixel is 1 in frame # n + 1, the process proceeds to step S327, and the time change detection unit 303 The area determination unit 342 sets the pixel of interest in frame #n as the foreground area, and the process ends.
[0277]
As described above, the area specifying unit 103 determines whether the pixels of the input image are the foreground area, the background area, the covered background area, and the uncovered background area based on the correlation value between the input image and the corresponding background image. It is possible to specify which one belongs, and generate region information corresponding to the specified result.
[0278]
FIG. 41 is a block diagram showing another configuration of the area specifying unit 103. The area specifying unit 103 illustrated in FIG. 41 uses the motion vector supplied from the motion detection unit 102 and its position information. The same parts as those shown in FIG. 29 are denoted by the same reference numerals, and the description thereof is omitted.
[0279]
The robust unit 361 generates a robust binary object image based on the binary object images of N frames supplied from the binary object image extraction unit 302, and sends it to the time change detection unit 303. Output.
[0280]
FIG. 42 is a block diagram illustrating the configuration of the robust unit 361. The motion compensation unit 381 compensates for the motion of the binary object image of N frames based on the motion vector supplied from the motion detection unit 102 and its position information, and obtains a binary object image with motion compensated. Output to the switch 382.
[0281]
With reference to the example of FIG. 43 and FIG. 44, the motion compensation of the motion compensation unit 381 will be described. For example, when the region of frame #n is determined, when binary object images of frame # n−1, frame #n, and frame # n + 1 shown in FIG. 43 are input, the motion compensation unit 381 Based on the motion vector supplied from the motion detector 102, motion compensation is performed on the binary object image of frame # n-1 and the binary object image of frame # n + 1 as shown in an example in FIG. Then, the binary object image subjected to motion compensation is supplied to the switch 382.
[0282]
The switch 382 outputs the motion-compensated binary object image of the first frame to the frame memory 383-1, and outputs the motion-compensated binary object image of the second frame to the frame memory 383-2. Similarly, the switch 382 outputs each of the motion compensated binary object images of the third to N−1th frames to any of the frame memory 383-3 to the frame memory 383- (N−1), The motion-compensated binary object image of the Nth frame is output to the frame memory 383-N.
[0283]
The frame memory 383-1 stores the binary object image for which motion compensation has been performed for the first frame, and outputs the stored binary object image to the weighting unit 384-1. The frame memory 383-2 stores the binary object image with motion compensation of the second frame, and outputs the stored binary object image to the weighting unit 384-2.
[0284]
Similarly, each of the frame memories 383-3 to 383- (N-1) stores and stores any of the motion compensated binary object images of the third frame to the (N-1) th frame. The binary object image thus output is output to any one of the weighting unit 384-3 to the weighting unit 384- (N-1). The frame memory 383-N stores the binary object image with motion compensation of the Nth frame, and outputs the stored binary object image to the weighting unit 384-N.
[0285]
The weighting unit 384-1 multiplies the pixel value of the motion-compensated binary object image of the first frame supplied from the frame memory 383-1 by a predetermined weight w1 and supplies the result to the integrating unit 385. The weighting unit 384-2 multiplies the pixel value of the motion compensated binary object image of the second frame supplied from the frame memory 383-2 by a predetermined weight w2, and supplies the result to the integrating unit 385.
[0286]
Similarly, each of the weighting units 384-3 to 384- (N-1) is the third to N-1 supplied from any one of the frame memories 383-3 to 383- (N-1). The pixel value of the motion-compensated binary object image of any one of the frames is multiplied by one of the predetermined weights w3 to w (N−1) and supplied to the accumulating unit 385. The weighting unit 384-N multiplies the pixel value of the motion-compensated binary object image of the Nth frame supplied from the frame memory 383-N by a predetermined weight wN and supplies the result to the integrating unit 385.
[0287]
The accumulating unit 385 accumulates the corresponding pixel values of the binary object image that have been subjected to motion compensation of the 1st to Nth frames and multiplied by one of the weights w1 to wN, respectively, and the accumulated pixel values are obtained in advance. A binary object image is generated by comparing with a predetermined threshold value th0.
[0288]
In this way, the robust unit 361 generates a robust binary object image from the N binary object images and supplies the generated binary object image to the time change detection unit 303. Therefore, the region specifying unit whose configuration is shown in FIG. No. 103 can specify a region more accurately compared to the case shown in FIG. 29 even if noise is included in the input image.
[0289]
Next, the area specifying process of the area specifying unit 103 shown in FIG. 41 will be described with reference to the flowchart of FIG. The processing in steps S341 through S343 is the same as that in steps S301 through S303 described with reference to the flowchart of FIG.
[0290]
In step S344, the robust unit 361 executes a robust process.
[0291]
In step S345, the time change detection unit 303 executes region determination processing, and the processing ends. Details of the processing in step S345 are the same as the processing described with reference to the flowchart of FIG.
[0292]
Next, details of the robust processing corresponding to the processing in step S344 in FIG. 45 will be described with reference to the flowchart in FIG. In step S361, the motion compensation unit 381 performs motion compensation processing on the input binary object image based on the motion vector supplied from the motion detection unit 102 and its position information. In step S362, any of the frame memories 383-1 to 383-N stores the motion compensated binary object image supplied via the switch 382.
[0293]
In step S363, the robust unit 361 determines whether or not N binary object images are stored. If it is determined that N binary object images are not stored, the process returns to step S361. The motion compensation processing of the binary object image and the storage processing of the binary object image are repeated.
[0294]
If it is determined in step S363 that N binary object images have been stored, the process proceeds to step S364, and each of the weighting units 384-1 to 384-N adds w1 to w in each of the N binary object images. Multiply by one of the weights of wN.
[0295]
In step S365, the integration unit 385 integrates the weighted N binary object images.
[0296]
In step S366, the integrating unit 385 generates a binary object image from the integrated image, for example, by comparison with a predetermined threshold value th1, and the process ends.
[0297]
As described above, the region specifying unit 103 having the configuration illustrated in FIG. 41 can generate region information based on the robust binary object image.
[0298]
As described above, the area specifying unit 103 generates area information indicating that each of the pixels included in the frame belongs to the motion area, the still area, the uncovered background area, or the covered background area. Can do.
[0299]
FIG. 47 is a block diagram illustrating an example of the configuration of the mixture ratio calculation unit 104. Based on the input image, the estimated mixture ratio processing unit 401 calculates an estimated mixture ratio for each pixel by an operation corresponding to the model of the covered background area, and supplies the calculated estimated mixture ratio to the mixture ratio determining unit 403. To do.
[0300]
Based on the input image, the estimated mixture ratio processing unit 402 calculates an estimated mixture ratio for each pixel by an operation corresponding to the model of the uncovered background region, and the calculated estimated mixture ratio is sent to the mixture ratio determining unit 403. Supply.
[0301]
Since it can be assumed that the object corresponding to the foreground is moving at a constant speed within the shutter time, the mixture ratio α of the pixels belonging to the mixed area has the following properties. That is, the mixture ratio α changes linearly in response to changes in the pixel position. If the change in the pixel position is one-dimensional, the change in the mixture ratio α can be expressed by a straight line. If the change in the pixel position is two-dimensional, the change in the mixture ratio α is expressed by a plane. be able to.
[0302]
Since the period of one frame is short, it is assumed that the object corresponding to the foreground is a rigid body and is moving at a constant speed.
[0303]
In this case, the gradient of the mixture ratio α is the inverse ratio of the motion amount v within the foreground shutter time.
[0304]
An example of an ideal mixing ratio α is shown in FIG. The gradient l in the mixing region of the ideal mixing ratio α can be expressed as the reciprocal of the motion amount v.
[0305]
As shown in FIG. 48, the ideal mixture ratio α has a value of 1 in the background area, a value of 0 in the foreground area, and a value greater than 0 and less than 1 in the mixed area. .
[0306]
In the example of FIG. 49, the pixel value C06 of the seventh pixel from the left of frame #n can be expressed by Expression (8) using the pixel value P06 of the seventh pixel from the left of frame # n-1. it can.
[0307]
[Formula 6]
Figure 0004596205
[0308]
In Expression (8), the pixel value C06 is expressed as the pixel value M of the pixel in the mixed region, and the pixel value P06 is expressed as the pixel value B of the pixel in the background region. That is, the pixel value M of the pixel in the mixed region and the pixel value B of the pixel in the background region can be expressed as Equation (9) and Equation (10), respectively.
[0309]
M = C06 (9)
B = P06 (10)
[0310]
2 / v in equation (8) corresponds to the mixing ratio α. Since the motion amount v is 4, the mixture ratio α of the seventh pixel from the left of the frame #n is 0.5.
[0311]
As described above, the pixel value C of the focused frame #n is regarded as the pixel value of the mixed region, and the pixel value P of the frame # n-1 before the frame #n is regarded as the pixel value of the background region. Equation (3) indicating the mixing ratio α can be rewritten as Equation (11).
[0312]
C = α ・ P + f (11)
F in Expression (11) is the sum of the foreground components included in the pixel of interest Σ i Fi / v.
There are two variables included in equation (11): the mixture ratio α and the sum f of the foreground components.
[0313]
Similarly, FIG. 50 shows a model in which pixel values are expanded in the time direction, in which the amount of motion v is 4 and the number of virtual divisions in the time direction is 4, in the uncovered background area.
[0314]
In the uncovered background area, similarly to the above-described representation in the covered background area, the pixel value C of the frame #n of interest is regarded as the pixel value of the mixed area, and the frame # n + 1 after the frame #n Eq. (3) indicating the mixture ratio α can be expressed as Eq. (12) by regarding the pixel value N of と as the pixel value of the background region.
[0315]
C = α ・ N + f (12)
[0316]
Although it has been described that the background object is stationary, even when the background object is moving, by using the pixel value of the pixel at the position corresponding to the background motion amount v, the expression (8 ) To (12) can be applied. For example, in FIG. 49, when the amount of motion v of the object corresponding to the background is 2 and the number of virtual divisions is 2, when the object corresponding to the background is moving to the right side in the figure, The pixel value B of the pixel in the background area is set to a pixel value P04.
[0317]
Since Expression (11) and Expression (12) each include two variables, the mixture ratio α cannot be obtained as it is. Here, since an image generally has a strong spatial correlation, adjacent pixels have almost the same pixel value.
[0318]
Therefore, since the foreground components have a strong spatial correlation, the formula is modified so that the sum f of the foreground components can be derived from the previous or subsequent frame to obtain the mixture ratio α.
[0319]
The pixel value Mc of the seventh pixel from the left in frame #n in FIG. 51 can be expressed by Expression (13).
[0320]
[Expression 7]
Figure 0004596205
2 / v in the first term on the right side of Equation (13) corresponds to the mixing ratio α. The second term on the right side of Expression (13) is expressed as Expression (14) using the pixel value of the subsequent frame # n + 1.
[0321]
[Equation 8]
Figure 0004596205
[0322]
Here, Equation (15) is established using the spatial correlation of the foreground components.
[0323]
F = F05 = F06 = F07 = F08 = F09 = F10 = F11 = F12 (15)
Expression (14) can be replaced with Expression (16) using Expression (15).
[0324]
[Equation 9]
Figure 0004596205
[0325]
As a result, β can be expressed by equation (17).
[0326]
β = 2/4 (17)
[0327]
In general, assuming that the foreground components related to the mixed region are equal as shown in Equation (15), Equation (18) is established from the relationship of the internal ratio for all the pixels in the mixed region.
[0328]
β = 1-α (18)
[0329]
If Expression (18) is established, Expression (11) can be expanded as shown in Expression (19).
[0330]
[Expression 10]
Figure 0004596205
[0331]
Similarly, if equation (18) holds, equation (12) can be expanded as shown in equation (20).
[0332]
[Expression 11]
Figure 0004596205
[0333]
In Expression (19) and Expression (20), C, N, and P are known pixel values, and therefore the variable included in Expression (19) and Expression (20) is only the mixture ratio α. FIG. 52 shows the relationship between C, N, and P in the equations (19) and (20). C is the pixel value of the pixel of interest in frame #n for calculating the mixture ratio α. N is a pixel value of a pixel in frame # n + 1 corresponding to a pixel of interest corresponding to a position in the spatial direction. P is a pixel value of a pixel in frame # n−1 in which the pixel of interest corresponds to the position in the spatial direction.
[0334]
Accordingly, since one variable is included in each of the equations (19) and (20), the mixture ratio α can be calculated using the pixel values of the pixels of the three frames. The condition for calculating the correct mixture ratio α by solving the equations (19) and (20) is that the foreground components related to the mixed region are equal, that is, the imaging is performed when the foreground object is stationary. In the foreground image object thus obtained, the pixel values of the pixels located at the boundary of the image object corresponding to the direction of the motion of the foreground object, which are twice as many as the movement amount v, are continuous. It is constant.
[0335]
As described above, the mixing ratio α of the pixels belonging to the covered background area is calculated by Expression (21), and the mixing ratio α of the pixels belonging to the uncovered background area is calculated by Expression (22).
[0336]
α = (CN) / (PN) (21)
α = (CP) / (NP) (22)
[0337]
FIG. 53 is a block diagram illustrating a configuration of the estimated mixture ratio processing unit 401. The frame memory 421 stores the input image in units of frames, and supplies the frame immediately after the frame input as the input image to the frame memory 422 and the mixture ratio calculation unit 423.
[0338]
The frame memory 422 stores the input image in units of frames, and supplies the frame immediately after the frame supplied from the frame memory 421 to the mixture ratio calculation unit 423.
[0339]
Therefore, when the frame # n + 1 is input to the mixing ratio calculation unit 423 as an input image, the frame memory 421 supplies the frame #n to the mixing ratio calculation unit 423, and the frame memory 422 stores the frame # n− 1 is supplied to the mixture ratio calculation unit 423.
[0340]
The mixture ratio calculation unit 423 calculates the pixel value C of the pixel of interest in frame #n and the pixel of frame # n + 1 corresponding to the spatial position of the pixel of interest by the calculation shown in Expression (21). And the estimated mixture ratio of the pixel of interest was calculated based on the pixel value N of the pixel and the pixel value P of the pixel of frame # n-1 whose spatial position corresponds to the pixel of interest. Output the estimated mixture ratio. For example, when the background is stationary, the mixture ratio calculation unit 423 determines that the pixel value C of the pixel of interest in frame #n is the same as the pixel of interest in the frame # n + 1. Calculate the estimated mixture ratio of the pixel of interest based on the pixel value N of the pixel and the pixel value P of the pixel of frame # n-1, which has the same position in the frame as the pixel of interest. The estimated mixture ratio is output.
[0341]
As described above, the estimated mixture ratio processing unit 401 can calculate the estimated mixture ratio based on the input image and supply the estimated mixture ratio to the mixture ratio determining unit 403.
[0342]
The estimated mixture ratio processing unit 402 calculates the estimated mixture ratio of the pixel of interest by the calculation shown in the equation (21) by the estimated mixture ratio processing unit 401, whereas the calculation shown in the equation (22). Thus, the estimated mixture ratio processing unit 401 is the same as the estimated mixture ratio processing unit 401 except that a part for calculating the estimated mixture ratio of the pixel of interest is different.
[0343]
FIG. 54 is a diagram illustrating an example of the estimated mixture ratio calculated by the estimated mixture ratio processing unit 401. The estimated mixture ratio shown in FIG. 54 indicates the result when the foreground motion amount v corresponding to an object moving at a constant speed is 11, for one line.
[0344]
It can be seen that the estimated mixture ratio changes almost linearly in the mixed region as shown in FIG.
[0345]
Returning to FIG. 47, the mixture ratio determining unit 403 determines that the pixel for which the mixture ratio α supplied from the region specifying unit 103 is to be calculated is the foreground region, the background region, the covered background region, or the uncovered background region. The mixing ratio α is set on the basis of the area information indicating which of the two. The mixture ratio determining unit 403 sets 0 as the mixture ratio α when the target pixel belongs to the foreground area, and sets 1 as the mixture ratio α when the target pixel belongs to the background area. When the pixel belongs to the covered background area, the estimated mixture ratio supplied from the estimated mixture ratio processing unit 401 is set to the mixture ratio α, and when the target pixel belongs to the uncovered background area, the estimated mixture ratio processing unit The estimated mixing ratio supplied from 402 is set to the mixing ratio α. The mixture ratio determination unit 403 outputs a mixture ratio α set based on the region information.
[0346]
FIG. 55 is a block diagram showing another configuration of the mixture ratio calculation unit 104. Based on the region information supplied from the region specifying unit 103, the selection unit 441 supplies the pixels belonging to the covered background region and the corresponding pixels of the previous and subsequent frames to the estimated mixture ratio processing unit 442. Based on the region information supplied from the region specifying unit 103, the selection unit 441 supplies the pixels belonging to the uncovered background region and the corresponding pixels in the previous and subsequent frames to the estimated mixture ratio processing unit 443. .
[0347]
Based on the pixel value input from the selection unit 441, the estimated mixture ratio processing unit 442 calculates the estimated mixture ratio of the pixel of interest belonging to the covered background region by the calculation shown in Expression (21). The calculated estimated mixture ratio is supplied to the selection unit 444.
[0348]
Based on the pixel value input from the selection unit 441, the estimated mixture ratio processing unit 443 calculates an estimated mixture ratio of the pixel of interest belonging to the uncovered background region by the calculation shown in Expression (22). Then, the calculated estimated mixture ratio is supplied to the selection unit 444.
[0349]
When the target pixel belongs to the foreground area based on the area information supplied from the area specifying unit 103, the selection unit 444 selects an estimated mixture ratio that is 0, sets the mixture ratio α, If the pixel belongs to the background region, an estimated mixture ratio of 1 is selected and set to the mixture ratio α. When the target pixel belongs to the covered background area, the selection unit 444 selects the estimated mixture ratio supplied from the estimated mixture ratio processing unit 442 and sets it to the mixture ratio α, and the target pixel is uncovered back. When belonging to the ground region, the estimated mixture ratio supplied from the estimated mixture ratio processing unit 443 is selected and set to the mixture ratio α. The selection unit 444 outputs the mixture ratio α selected and set based on the region information.
[0350]
As described above, the mixture ratio calculation unit 104 having another configuration shown in FIG. 55 can calculate the mixture ratio α for each pixel included in the image and output the calculated mixture ratio α.
[0351]
With reference to the flowchart of FIG. 56, the process of calculating the mixture ratio α of the mixture ratio calculator 104 shown in FIG. 47 will be described. In step S <b> 401, the mixture ratio calculation unit 104 acquires the region information supplied from the region specifying unit 103. In step S <b> 402, the estimated mixture ratio processing unit 401 performs an estimated mixture ratio calculation process using a model corresponding to the covered background region, and supplies the calculated estimated mixture ratio to the mixture ratio determining unit 403. Details of the processing of the mixture ratio estimation will be described later with reference to the flowchart of FIG.
[0352]
In step S <b> 403, the estimated mixture ratio processing unit 402 performs an estimated mixture ratio calculation process using a model corresponding to the uncovered background region, and supplies the calculated estimated mixture ratio to the mixture ratio determining unit 403.
[0353]
In step S404, the mixture ratio calculation unit 104 determines whether or not the mixture ratio α is estimated for the entire frame. If it is determined that the mixture ratio α is not estimated for the entire frame, the process returns to step S402. Then, the process of estimating the mixture ratio α for the next pixel is executed.
[0354]
If it is determined in step S404 that the mixture ratio α has been estimated for the entire frame, the process proceeds to step S405, where the mixture ratio determination unit 403 determines that the pixel is a foreground area, background area, covered background area, or uncovered back. The mixture ratio α is set based on the area information supplied from the area specifying unit 103 indicating which of the ground areas belongs. The mixture ratio determining unit 403 sets 0 as the mixture ratio α when the target pixel belongs to the foreground area, and sets 1 as the mixture ratio α when the target pixel belongs to the background area. When the pixel belongs to the covered background area, the estimated mixture ratio supplied from the estimated mixture ratio processing unit 401 is set to the mixture ratio α, and when the target pixel belongs to the uncovered background area, the estimated mixture ratio processing unit The estimated mixture ratio supplied from 402 is set to the mixture ratio α, and the process ends.
[0355]
As described above, the mixture ratio calculation unit 104 can calculate the mixture ratio α, which is a feature amount corresponding to each pixel, based on the region information supplied from the region specifying unit 103 and the input image.
[0356]
55 is the same as the process described with reference to the flowchart of FIG. 56, and thus the description thereof is omitted.
[0357]
Next, the mixing ratio estimation process using the model corresponding to the covered background area corresponding to step S402 in FIG. 56 will be described with reference to the flowchart in FIG.
[0358]
In step S421, the mixture ratio calculation unit 423 acquires the pixel value C of the target pixel of frame #n from the frame memory 421.
[0359]
In step S422, the mixture ratio calculation unit 423 acquires the pixel value P of the pixel of frame # n−1 corresponding to the target pixel from the frame memory 422.
[0360]
In step S423, the mixture ratio calculation unit 423 acquires the pixel value N of the pixel of frame # n + 1 corresponding to the target pixel included in the input image.
[0361]
In step S424, the mixture ratio calculation unit 423, based on the pixel value C of the pixel of interest in frame #n, the pixel value P of the pixel of frame # n-1, and the pixel value N of the pixel of frame # n + 1, Calculate the estimated mixture ratio.
[0362]
In step S425, the mixture ratio calculation unit 423 determines whether or not the process of calculating the estimated mixture ratio has been completed for the entire frame, and determines that the process of calculating the estimated mixture ratio has not been completed for the entire frame. If so, the process returns to step S421, and the process of calculating the estimated mixture ratio for the next pixel is repeated.
[0363]
If it is determined in step S425 that the process of calculating the estimated mixture ratio has been completed for the entire frame, the process ends.
[0364]
Thus, the estimated mixture ratio processing unit 401 can calculate the estimated mixture ratio based on the input image.
[0365]
The process of estimating the mixture ratio by the model corresponding to the uncovered background area in step S403 of FIG. 56 is the same as the process shown in the flowchart of FIG. 57 using the expression corresponding to the model of the uncovered background area. Description is omitted.
[0366]
55. The estimated mixture ratio processing unit 442 and the estimated mixture ratio processing unit 443 shown in FIG. 55 perform the same processing as the flowchart shown in FIG.
[0367]
In addition, although it has been described that the object corresponding to the background is stationary, the above-described processing for obtaining the mixture ratio α can be applied even if the image corresponding to the background region includes a motion. For example, when the image corresponding to the background region is moving uniformly, the estimated mixture ratio processing unit 401 shifts the entire image corresponding to the movement of the background, and the object corresponding to the background is stationary. Process in the same way. In addition, when the image corresponding to the background region includes a different background motion for each local area, the estimated mixture ratio processing unit 401 selects a pixel corresponding to the background motion as a pixel corresponding to the pixel belonging to the mixed region. Then, the above-described processing is executed.
[0368]
In addition, the mixture ratio calculation unit 104 executes only the mixture ratio estimation process using the model corresponding to the covered background region for all pixels, and outputs the calculated estimated mixture ratio as the mixture ratio α. Also good. In this case, the mixing ratio α indicates the ratio of the background components for the pixels belonging to the covered background area, and indicates the ratio of the foreground components for the pixels belonging to the uncovered background area. For a pixel belonging to the uncovered background area, if the absolute value of the difference between the mixture ratio α and 1 calculated in this way is calculated and the calculated absolute value is set to the mixture ratio α, the signal processing apparatus For the pixels belonging to the uncovered background area, the mixing ratio α indicating the ratio of the background components can be obtained.
[0369]
Similarly, the mixture ratio calculation unit 104 executes only the mixture ratio estimation process using the model corresponding to the uncovered background area for all pixels, and outputs the calculated estimated mixture ratio as the mixture ratio α. You may make it do.
[0370]
Next, another process of the mixture ratio calculation unit 104 will be described.
[0371]
Using the property that the mixture ratio α changes linearly in response to a change in pixel position due to the object corresponding to the foreground moving at a constant speed within the shutter time, the mixture ratio α in the spatial direction. And an equation that approximates the sum f of the foreground components. By using a plurality of sets of pixel values of pixels belonging to the mixed area and pixel values belonging to the background area, the mixing ratio α is calculated by solving an equation that approximates the mixing ratio α and the sum f of the foreground components. calculate.
[0372]
When the change in the mixing ratio α is approximated as a straight line, the mixing ratio α is expressed by Expression (23).
[0373]
α = il + p (23)
In Expression (23), i is an index in the spatial direction where the position of the pixel of interest is 0. l is the slope of the straight line of the mixing ratio α. p is a straight line intercept of the mixing ratio α and is the mixing ratio α of the pixel of interest. In equation (23), the index i is known, but the slope l and the intercept p are unknown.
[0374]
The relationship between the index i, the slope l, and the intercept p is shown in FIG.
[0375]
By approximating the mixture ratio α as shown in Expression (23), a plurality of different mixture ratios α for a plurality of pixels can be expressed by two variables. In the example shown in FIG. 58, five mixing ratios for five pixels are expressed by two variables, gradient l and intercept p.
[0376]
When the mixture ratio α is approximated in the plane shown in FIG. 59, when considering the motion v corresponding to the two directions of the horizontal direction and the vertical direction of the image, the formula (23) is expanded to a plane, and the mixture ratio α is It is represented by Formula (24).
[0377]
α = jm + kq + p (24)
In Expression (24), j is a horizontal index with the position of the pixel of interest being 0, and k is a vertical index. m is the horizontal inclination of the surface of the mixing ratio α, and q is the vertical inclination of the surface of the mixing ratio α. p is an intercept of the surface of the mixing ratio α.
[0378]
For example, in frame #n shown in FIG. 49, equations (25) to (27) are established for C05 to C07, respectively.
[0379]
C05 = α05 ・ B05 / v + f05 (25)
C06 = α06 ・ B06 / v + f06 (26)
C07 = α07 ・ B07 / v + f07 (27)
[0380]
When the foreground components match in the vicinity, that is, F01 to F03 are equal, and F01 to F03 are replaced with Fc, Expression (28) is established.
[0381]
f (x) = (1-α (x)) · Fc (28)
In Expression (28), x represents a position in the spatial direction.
[0382]
When α (x) is replaced with Expression (24), Expression (28) can be expressed as Expression (29).
[0383]
Figure 0004596205
[0384]
In the equation (29), (−m · Fc), (−q · Fc), and (1-p) · Fc are replaced as shown in the equations (30) to (32).
[0385]
s = -m · Fc (30)
t = -q · Fc (31)
u = (1-p) ・ Fc (32)
[0386]
In Expression (29), j is an index in the horizontal direction with the position of the pixel of interest set to 0, and k is an index in the vertical direction.
[0387]
In this way, since it is assumed that the object corresponding to the foreground moves at a constant speed within the shutter time and the component corresponding to the foreground is constant in the vicinity, the sum of the foreground components is expressed by Equation (29). Approximated.
[0388]
When the mixture ratio α is approximated by a straight line, the sum of the foreground components can be expressed by Expression (33).
[0389]
f (x) = is + u (33)
[0390]
When the sum of the mixture ratio α and the foreground component in Expression (13) is replaced using Expression (24) and Expression (29), the pixel value M is expressed by Expression (34).
[0390]
Figure 0004596205
[0392]
In equation (34), the unknown variables are the horizontal gradient m of the surface of the mixing ratio α, the vertical inclination q of the surface of the mixing ratio α, the intercepts p, s, t, and u of the surface of the mixing ratio α. These are six.
[0393]
The pixel value M and the pixel value B are set in the equation (34) in correspondence with the pixel in the vicinity of the pixel of interest, and the minimum value for the plurality of equations in which the pixel value M and the pixel value B are set The mixing ratio α is calculated by solving by multiplication.
[0394]
For example, the horizontal index j of the pixel of interest is set to 0, the index k of the vertical direction is set to 0, and a 3 × 3 pixel in the vicinity of the pixel of interest is expressed by the normal equation shown in Expression (34). When the pixel value M or the pixel value B is set, Expressions (35) to (43) are obtained.
[0395]
Figure 0004596205
[0396]
Since the index j in the horizontal direction of the pixel of interest is 0 and the index k in the vertical direction is 0, the mixture ratio α of the pixel of interest is expressed by j = 0 and k = It is equal to the value at 0, that is, the intercept p.
[0397]
Accordingly, based on the nine equations (35) to (43), the values of the horizontal gradient m, the vertical gradient q, the intercepts p, s, t, and u are calculated by the method of least squares. The intercept p may be output as the mixing ratio α.
[0398]
Next, a more specific procedure for calculating the mixture ratio α by applying the least square method will be described.
[0399]
When the index i and the index k are expressed by one index x, the relationship between the index i, the index k, and the index x is expressed by Expression (44).
[0400]
x = (j + 1) ・ 3+ (k + 1) (44)
[0401]
Express horizontal slope m, vertical slope q, intercepts p, s, t, and u as variables w0, w1, w2, w3, w4, and w5, respectively, jB, kB, B, j, k, And 1 are expressed as a0, a1, a2, a3, a4, and a5, respectively. In consideration of the error ex, Expressions (35) to (43) can be rewritten into Expression (45).
[0402]
[Expression 12]
Figure 0004596205
In the formula (45), x is an integer value from 0 to 8.
[0403]
From equation (45), equation (46) can be derived.
[0404]
[Formula 13]
Figure 0004596205
[0405]
Here, in order to apply the method of least squares, an error sum of squares E is defined as shown in equation (47).
[0406]
[Expression 14]
Figure 0004596205
[0407]
In order to minimize the error, it is only necessary that the partial differential of the variable Wv with respect to the square sum E of the error becomes zero. Here, v is one of integers from 0 to 5. Therefore, wy is obtained so as to satisfy the equation (48).
[0408]
[Expression 15]
Figure 0004596205
[0409]
Substituting equation (46) into equation (48) yields equation (49).
[0410]
[Expression 16]
Figure 0004596205
[0411]
For example, a sweeping method (Gauss-Jordan elimination method) or the like is applied to a normal equation consisting of six equations obtained by substituting any one of integers 0 to 5 for v in equation (49), Calculate wy. As described above, w0 is the horizontal gradient m, w1 is the vertical gradient q, w2 is the intercept p, w3 is s, w4 is t, and w5 is u.
[0412]
As described above, horizontal slope m, vertical slope q, intercepts p, s, t, and u are obtained by applying the method of least squares to the equation in which pixel value M and pixel value B are set. be able to.
[0413]
Here, since the intercept p is the point where the index i, k is 0, that is, the mixing ratio α at the center position, this is output.
[0414]
In the description corresponding to the expressions (35) to (43), the pixel value of the pixel included in the mixed area has been described as M and the pixel value of the pixel included in the background area has been described as B. Therefore, it is necessary to establish a normal equation for each of the cases where they are included in the covered background region or the uncovered background region.
[0415]
For example, when obtaining the mixture ratio α of the pixels included in the covered background area of frame #n shown in FIG. 49, pixel values C04 to C08 of the pixels of frame #n and pixel values P04 to P04 of the pixels of frame # n−1 P08 is set as a normal equation.
[0416]
When obtaining the mixture ratio α of pixels included in the uncovered background area of frame #n shown in FIG. 50, pixel values N28 to N32 of pixels C28 to C32 of frame #n and pixels of frame # n + 1 Is set to a normal equation.
[0417]
Further, for example, when calculating the mixture ratio α of the pixels included in the covered background region shown in FIG. 60, the following equations (50) to (58) are established. The pixel value of the pixel for calculating the mixture ratio α is Mc5.
[0418]
Mc1 = (-1) ・ Bc1 ・ m + (-1) ・ Bc1 ・ q + Bc1 ・ p + (-1) ・ s + (-1) ・ t + u (50)
Mc2 = (0) ・ Bc2 ・ m + (-1) ・ Bc2 ・ q + Bc2 ・ p + (0) ・ s + (-1) ・ t + u (51)
Mc3 = (+ 1) ・ Bc3 ・ m + (-1) ・ Bc3 ・ q + Bc3 ・ p + (+ 1) ・ s + (-1) ・ t + u (52)
Mc4 = (-1) ・ Bc4 ・ m + (0) ・ Bc4 ・ q + Bc4 ・ p + (-1) ・ s + (0) ・ t + u (53)
Mc5 = (0) ・ Bc5 ・ m + (0) ・ Bc5 ・ q + Bc5 ・ p + (0) ・ s + (0) ・ t + u (54)
Mc6 = (+ 1) ・ Bc6 ・ m + (0) ・ Bc6 ・ q + Bc6 ・ p + (+ 1) ・ s + (0) ・ t + u (55)
Mc7 = (-1) ・ Bc7 ・ m + (+ 1) ・ Bc7 ・ q + Bc7 ・ p + (-1) ・ s + (+ 1) ・ t + u (56)
Mc8 = (0) ・ Bc8 ・ m + (+ 1) ・ Bc8 ・ q + Bc8 ・ p + (0) ・ s + (+ 1) ・ t + u (57)
Mc9 = (+ 1) ・ Bc9 ・ m + (+ 1) ・ Bc9 ・ q + Bc9 ・ p + (+ 1) ・ s + (+ 1) ・ t + u (58)
[0419]
When calculating the mixture ratio α of the pixels included in the covered background area of frame #n, the background of the pixel of frame # n−1 corresponding to the pixel of frame #n in equations (50) to (58) Pixel values Bc1 to Bc9 of the pixels in the area are used.
[0420]
When calculating the mixture ratio α of the pixels included in the uncovered background area shown in FIG. 60, the following equations (59) to (67) are established. The pixel value of the pixel for calculating the mixture ratio α is Mu5.
[0421]
Mu1 = (-1) ・ Bu1 ・ m + (-1) ・ Bu1 ・ q + Bu1 ・ p + (-1) ・ s + (-1) ・ t + u (59)
Mu2 = (0) ・ Bu2 ・ m + (-1) ・ Bu2 ・ q + Bu2 ・ p + (0) ・ s + (-1) ・ t + u (60)
Mu3 = (+ 1) ・ Bu3 ・ m + (-1) ・ Bu3 ・ q + Bu3 ・ p + (+ 1) ・ s + (-1) ・ t + u (61)
Mu4 = (-1) ・ Bu4 ・ m + (0) ・ Bu4 ・ q + Bu4 ・ p + (-1) ・ s + (0) ・ t + u (62)
Mu5 = (0) ・ Bu5 ・ m + (0) ・ Bu5 ・ q + Bu5 ・ p + (0) ・ s + (0) ・ t + u (63)
Mu6 = (+ 1) ・ Bu6 ・ m + (0) ・ Bu6 ・ q + Bu6 ・ p + (+ 1) ・ s + (0) ・ t + u (64)
Mu7 = (-1) ・ Bu7 ・ m + (+ 1) ・ Bu7 ・ q + Bu7 ・ p + (-1) ・ s + (+ 1) ・ t + u (65)
Mu8 = (0) ・ Bu8 ・ m + (+ 1) ・ Bu8 ・ q + Bu8 ・ p + (0) ・ s + (+ 1) ・ t + u (66)
Mu9 = (+ 1) ・ Bu9 ・ m + (+ 1) ・ Bu9 ・ q + Bu9 ・ p + (+ 1) ・ s + (+ 1) ・ t + u (67)
[0422]
When calculating the mixture ratio α of the pixels included in the uncovered background area of frame #n, in the equations (59) to (67), the pixels of the frame # n + 1 corresponding to the pixels of the frame #n are calculated. The pixel values Bu1 to Bu9 of the pixels in the background area are used.
[0423]
FIG. 61 is a block diagram illustrating a configuration of the estimated mixture ratio processing unit 401. The image input to the estimated mixture ratio processing unit 401 is supplied to the delay unit 501 and the adding unit 502.
[0424]
The delay circuit 221 delays the input image by one frame and supplies it to the adding unit 502. When the frame #n is input as an input image to the adding unit 502, the delay circuit 221 supplies the frame # n-1 to the adding unit 502.
[0425]
The adding unit 502 sets the pixel value of the pixel near the pixel for calculating the mixture ratio α and the pixel value of the frame # n−1 in a normal equation. For example, the adding unit 502 sets the pixel values Mc1 to Mc9 and the pixel values Bc1 to Bc9 in the normal equation based on the equations (50) to (58). The adding unit 502 supplies the normal equation in which the pixel value is set to the calculation unit 503.
[0426]
The computing unit 503 solves the normal equation supplied from the adding unit 502 by a sweeping method or the like to obtain an estimated mixture ratio, and outputs the obtained estimated mixture ratio.
[0427]
As described above, the estimated mixture ratio processing unit 401 can calculate the estimated mixture ratio based on the input image and supply the estimated mixture ratio to the mixture ratio determining unit 403.
[0428]
Note that the estimated mixture ratio processing unit 402 has the same configuration as the estimated mixture ratio processing unit 401, and thus description thereof is omitted.
[0429]
FIG. 62 is a diagram illustrating an example of the estimated mixture ratio calculated by the estimated mixture ratio processing unit 401. The estimated mixture ratio shown in FIG. 62 indicates that the foreground motion v corresponding to an object moving at a constant speed is 11, and the result obtained by generating an equation with a block of 7 × 7 pixels as one unit is 1 line. Is shown.
[0430]
It can be seen that the estimated mixture ratio changes almost linearly in the mixed region as shown in FIG.
[0431]
The mixture ratio determining unit 403 indicates whether the pixel supplied from the region specifying unit 101 and for which the mixture ratio is calculated belongs to any of the foreground region, the background region, the covered background region, or the uncovered background region. The mixing ratio is set based on the area information. When the target pixel belongs to the foreground area, the mixing ratio determination unit 403 sets 0 as the mixing ratio, and when the target pixel belongs to the background area, sets the mixing ratio to 1 so that the target pixel is When belonging to the covered background region, the estimated mixture ratio supplied from the estimated mixture ratio processing unit 401 is set as the mixture ratio, and when the target pixel belongs to the uncovered background region, supplied from the estimated mixture ratio processing unit 402 The estimated estimated mixing ratio is set as the mixing ratio. The mixture ratio determination unit 403 outputs a mixture ratio set based on the region information.
[0432]
With reference to the flowchart of FIG. 63, the process of calculating the mixture ratio of the mixture ratio calculation unit 102 when the estimated mixture ratio processing unit 401 has the configuration shown in FIG. 61 will be described. In step S <b> 501, the mixture ratio calculation unit 102 acquires the region information supplied from the region specifying unit 101. In step S <b> 502, the estimated mixture ratio processing unit 401 executes a mixture ratio estimation process using a model corresponding to the covered background region, and supplies the estimated mixture ratio to the mixture ratio determining unit 403. Details of the mixing ratio estimation process will be described later with reference to the flowchart of FIG.
[0433]
In step S <b> 503, the estimated mixture ratio processing unit 402 executes a mixture ratio estimation process using a model corresponding to the uncovered background region, and supplies the estimated mixture ratio to the mixture ratio determining unit 403.
[0434]
In step S504, the mixture ratio calculation unit 102 determines whether or not the mixture ratio has been estimated for the entire frame. If it is determined that the mixture ratio has not been estimated for the entire frame, the process returns to step S502, and the next step A process of estimating the mixture ratio is performed for the pixels.
[0435]
If it is determined in step S504 that the mixture ratio has been estimated for the entire frame, the process proceeds to step S505, where the mixture ratio determining unit 403 determines that the pixel supplied from the region specifying unit 101 and for which the mixture ratio is calculated is the foreground. The mixing ratio is set based on region information indicating whether the region belongs to one of the region, the background region, the covered background region, and the uncovered background region. When the target pixel belongs to the foreground area, the mixing ratio determination unit 403 sets 0 as the mixing ratio, and when the target pixel belongs to the background area, sets the mixing ratio to 1 so that the target pixel is When belonging to the covered background region, the estimated mixture ratio supplied from the estimated mixture ratio processing unit 401 is set as the mixture ratio, and when the target pixel belongs to the uncovered background region, supplied from the estimated mixture ratio processing unit 402 The estimated mixture ratio thus set is set as the mixture ratio, and the process ends.
[0436]
As described above, the mixture ratio calculation unit 102 can calculate the mixture ratio α, which is a feature amount corresponding to each pixel, based on the region information supplied from the region specifying unit 101 and the input image.
[0437]
By using the mixing ratio α, it becomes possible to separate the foreground component and the background component included in the pixel value while leaving the motion blur information included in the image corresponding to the moving object. .
[0438]
Also, by compositing images based on the mixture ratio α, it is possible to create an image including correct motion blur that matches the speed of a moving object as if the real world was actually recaptured.
[0439]
Next, the mixing ratio estimation process using the model corresponding to the covered background area corresponding to step S502 in FIG. 63 will be described with reference to the flowchart in FIG.
[0440]
In step S521, the adding unit 502 sets the pixel value included in the input image and the pixel value included in the image supplied from the delay circuit 221 to a normal equation corresponding to the model of the covered background area. .
[0441]
In step S522, the estimated mixture ratio processing unit 401 determines whether or not the setting for the target pixel has been completed. If it is determined that the setting for the target pixel has not been completed, the process proceeds to step S521. Returning, the process of setting the pixel value to the normal equation is repeated.
[0442]
If it is determined in step S522 that the pixel value setting for the target pixel has been completed, the process proceeds to step S523, and the calculation unit 173 calculates the estimated mixture ratio based on the normal equation in which the pixel value is set. Then, the obtained estimated mixture ratio is output.
[0443]
Thus, the estimated mixture ratio processing unit 401 can calculate the estimated mixture ratio based on the input image.
[0444]
The process of estimating the mixture ratio by the model corresponding to the uncovered background area in step S153 of FIG. 63 is the same as the process shown in the flowchart of FIG. 64 using the normal equation corresponding to the model of the uncovered background area. The description is omitted.
[0445]
Note that although the object corresponding to the background has been described as stationary, the above-described processing for obtaining the mixture ratio can be applied even if the image corresponding to the background area includes movement. For example, when the image corresponding to the background region is moving uniformly, the estimated mixture ratio processing unit 401 shifts the entire image corresponding to this movement, and is the same as when the object corresponding to the background is stationary. To process. Further, when the image corresponding to the background region includes a different motion for each local area, the estimated mixture ratio processing unit 401 selects a pixel corresponding to the motion as a pixel corresponding to the pixel belonging to the mixed region, and Execute the process.
[0446]
Next, the foreground / background separation unit 105 will be described. FIG. 65 is a block diagram illustrating an example of the configuration of the foreground / background separator 105. The input image supplied to the foreground / background separator 105 is supplied to the separator 601, the switch 602, and the switch 604. The information indicating the covered background area and the area information supplied from the area specifying unit 103 indicating the uncovered background area are supplied to the separation unit 601. Area information indicating the foreground area is supplied to the switch 602. Area information indicating the background area is supplied to the switch 604.
[0447]
The mixing ratio α supplied from the mixing ratio calculation unit 104 is supplied to the separation unit 601.
[0448]
The separation unit 601 separates the foreground components from the input image based on the region information indicating the covered background region, the region information indicating the uncovered background region, and the mixing ratio α, and synthesizes the separated foreground components. The background component is separated from the input image, and the separated background component is supplied to the synthesis unit 605.
[0449]
The switch 602 is closed when a pixel corresponding to the foreground is input based on the region information indicating the foreground region, and supplies only the pixel corresponding to the foreground included in the input image to the combining unit 603.
[0450]
The switch 604 is closed when a pixel corresponding to the background is input based on the region information indicating the background region, and supplies only the pixel corresponding to the background included in the input image to the combining unit 605.
[0451]
The combining unit 603 combines the foreground component image based on the component corresponding to the foreground supplied from the separation unit 601 and the pixel corresponding to the foreground supplied from the switch 602, and outputs the combined foreground component image. Since the foreground area and the mixed area do not overlap, the synthesis unit 603 synthesizes the foreground component image by applying a logical sum operation to the component corresponding to the foreground and the pixel corresponding to the foreground, for example.
[0452]
In the initialization process executed at the beginning of the foreground component image synthesis process, the synthesis unit 603 stores an image in which all pixel values are 0 in the built-in frame memory, and performs synthesis of the foreground component image. In the process, the foreground component image is stored (overwritten). Accordingly, 0 is stored as the pixel value in the pixel corresponding to the background area in the foreground component image output by the synthesis unit 603.
[0453]
The combining unit 605 combines the background component images based on the components corresponding to the background supplied from the separation unit 601 and the pixels corresponding to the background supplied from the switch 604, and outputs the combined background component image. Since the background area and the mixed area do not overlap, the synthesis unit 605 synthesizes the background component image by applying a logical sum operation to the component corresponding to the background and the pixel corresponding to the background, for example.
[0454]
In the initialization process executed at the beginning of the background component image synthesis process, the synthesis unit 605 stores an image in which all pixel values are 0 in the built-in frame memory, and performs synthesis of the background component image. In the processing, the background component image is stored (overwritten). Accordingly, 0 is stored as the pixel value in the pixel corresponding to the foreground area in the background component image output from the synthesis unit 605.
[0455]
FIG. 66 is a diagram illustrating an input image input to the foreground / background separator 105 and a foreground component image and a background component image output from the foreground / background separator 105.
[0456]
66A is a schematic diagram of a displayed image, and FIG. 66B is a diagram of pixels belonging to the foreground area, pixels belonging to the background area, and pixels belonging to the mixed area corresponding to FIG. 66A. 1 is a model diagram in which one line of pixels including is expanded in the time direction.
[0457]
As shown in FIGS. 66 (A) and 66 (B), the background component image output from the foreground / background separator 105 is composed of pixels belonging to the background area and background components included in the pixels in the mixed area. The
[0458]
As shown in FIGS. 66A and 66B, the foreground component image output from the foreground / background separator 105 is composed of pixels belonging to the foreground area and foreground components included in the pixels of the mixed area. The
[0459]
The pixel values of the pixels in the mixed region are separated into a background component and a foreground component by the foreground / background separation unit 105. The separated background components together with the pixels belonging to the background area constitute a background component image. The separated foreground components together with the pixels belonging to the foreground area constitute a foreground component image.
[0460]
Thus, in the foreground component image, the pixel value of the pixel corresponding to the background area is set to 0, and a meaningful pixel value is set to the pixel corresponding to the foreground area and the pixel corresponding to the mixed area. Similarly, in the background component image, the pixel value of the pixel corresponding to the foreground area is set to 0, and a meaningful pixel value is set to the pixel corresponding to the background area and the pixel corresponding to the mixed area.
[0461]
Next, a process performed by the separation unit 601 to separate the foreground components and the background components from the pixels belonging to the mixed area will be described.
[0462]
FIG. 67 is an image model showing foreground components and background components of two frames including a foreground corresponding to an object moving from left to right in the drawing. In the image model shown in FIG. 67, the amount of foreground motion v is 4, and the number of virtual divisions is 4.
[0463]
In frame #n, the leftmost pixel and the fourteenth through eighteenth pixels from the left consist only of background components and belong to the background area. In frame #n, the second through fourth pixels from the left include a background component and a foreground component, and belong to the uncovered background area. In frame #n, the eleventh through thirteenth pixels from the left include a background component and a foreground component, and belong to the covered background area. In frame #n, the fifth through tenth pixels from the left consist of only the foreground components and belong to the foreground area.
[0464]
In frame # n + 1, the first through fifth pixels from the left and the eighteenth pixel from the left consist of only the background components, and belong to the background area. In frame # n + 1, the sixth through eighth pixels from the left include a background component and a foreground component, and belong to the uncovered background area. In frame # n + 1, the fifteenth through seventeenth pixels from the left include a background component and a foreground component, and belong to the covered background area. In frame # n + 1, the ninth through fourteenth pixels from the left consist of only the foreground components, and belong to the foreground area.
[0465]
FIG. 68 is a diagram for explaining the process of separating the foreground components from the pixels belonging to the covered background area. In FIG. 68, α1 to α18 are mixing ratios corresponding to the respective pixels in frame #n. In FIG. 68, the fifteenth through seventeenth pixels from the left belong to the covered background area.
[0466]
The pixel value C15 of the fifteenth pixel from the left in frame #n is expressed by equation (68).
[0467]
Figure 0004596205
Here, α15 is the mixture ratio of the fifteenth pixel from the left in frame #n. P15 is the pixel value of the fifteenth pixel from the left in frame # n-1.
[0468]
Based on Expression (68), the sum f15 of the foreground components of the fifteenth pixel from the left in frame #n is expressed by Expression (69).
[0469]
Figure 0004596205
[0470]
Similarly, the foreground component sum f16 of the 16th pixel from the left in frame #n is expressed by equation (70), and the foreground component sum f17 of the 17th pixel from the left in frame #n is expressed by equation (70). (71)
[0471]
f16 = C16-α16 ・ P16 (70)
f17 = C17-α17 ・ P17 (71)
[0472]
As described above, the foreground component fc included in the pixel value C of the pixel belonging to the covered background area is calculated by Expression (72).
[0473]
fc = C-α ・ P (72)
P is the pixel value of the corresponding pixel in the previous frame.
[0474]
FIG. 69 is a diagram illustrating a process of separating foreground components from pixels belonging to the uncovered background area. In FIG. 69, α1 to α18 are mixing ratios corresponding to the respective pixels in frame #n. In FIG. 69, the second through fourth pixels from the left belong to the uncovered background area.
[0475]
The pixel value C02 of the second pixel from the left in frame #n is expressed by Expression (73).
[0476]
Figure 0004596205
Here, α2 is the mixture ratio of the second pixel from the left in frame #n. N02 is the pixel value of the second pixel from the left in frame # n + 1.
[0477]
Based on Expression (73), the sum f02 of the foreground components of the second pixel from the left of frame #n is expressed by Expression (74).
[0478]
Figure 0004596205
[0479]
Similarly, the sum f03 of the foreground components of the third pixel from the left in frame #n is expressed by Expression (75), and the sum f04 of the foreground components of the fourth pixel from the left of frame #n is expressed by Expression (75). (76)
[0480]
f03 = C03-α3 ・ N03 (75)
f04 = C04-α4 ・ N04 (76)
[0481]
In this way, the foreground component fu included in the pixel value C of the pixel belonging to the uncovered background area is calculated by Expression (77).
[0482]
fu = C-α ・ N (77)
N is the pixel value of the corresponding pixel in the next frame.
[0483]
As described above, the separation unit 601 determines from the pixels belonging to the mixed region based on the information indicating the covered background region, the information indicating the uncovered background region, and the mixing ratio α for each pixel included in the region information. Foreground and background components can be separated.
[0484]
FIG. 70 is a block diagram illustrating an example of the configuration of the separation unit 601 that executes the processing described above. The image input to the separation unit 601 is supplied to the frame memory 621, and the region information indicating the covered background region and the uncovered background region supplied from the mixture ratio calculation unit 104, and the mixture ratio α are the separation processing block. It is input to 622.
[0485]
The frame memory 621 stores the input image in units of frames. When the object of processing is frame #n, the frame memory 621 is a frame that is the frame immediately after frame # n-1, frame #n, and frame #n. Remember # n + 1.
[0486]
The frame memory 621 supplies the pixels corresponding to the frame # n−1, the frame #n, and the frame # n + 1 to the separation processing block 622.
[0487]
The separation processing block 622 includes the frame # n−1, the frame #n, and the frame #n supplied from the frame memory 621 based on the area information indicating the covered background area and the uncovered background area, and the mixing ratio α. By applying the calculation described with reference to FIGS. 68 and 69 to the pixel value of the corresponding pixel of +1, the foreground component and the background component are separated from the pixels belonging to the mixed region of frame #n, and the frame This is supplied to the memory 623.
[0488]
The separation processing block 622 includes an uncovered area processing unit 631, a covered area processing unit 632, a combining unit 633, and a combining unit 634.
[0489]
The multiplier 641 of the uncovered area processing unit 631 multiplies the mixing ratio α by the pixel value of the pixel of frame # n + 1 supplied from the frame memory 621 and outputs the result to the switch 642. The switch 642 is closed when the pixel of frame #n (corresponding to the pixel of frame # n + 1) supplied from the frame memory 621 is an uncovered background area, and the mixture ratio supplied from the multiplier 641 The pixel value multiplied by α is supplied to the calculator 643 and the synthesis unit 634. The value obtained by multiplying the pixel value of the pixel of frame # n + 1 output from the switch 642 by the mixing ratio α is equal to the background component of the pixel value of the corresponding pixel of frame #n.
[0490]
The computing unit 643 subtracts the background component supplied from the switch 642 from the pixel value of the pixel of frame #n supplied from the frame memory 621 to obtain the foreground component. The computing unit 643 supplies the foreground component of the pixel of frame #n belonging to the uncovered background area to the synthesis unit 633.
[0491]
The multiplier 651 of the covered area processing unit 632 multiplies the mixture ratio α by the pixel value of the pixel of frame # n−1 supplied from the frame memory 621 and outputs the result to the switch 652. The switch 652 is closed when the pixel of the frame #n supplied from the frame memory 621 (corresponding to the pixel of the frame # n−1) is the covered background region, and the mixture ratio α supplied from the multiplier 651 is The pixel value multiplied by is supplied to the calculator 653 and the combining unit 634. A value obtained by multiplying the pixel value of the pixel of frame # n−1 output from the switch 652 by the mixing ratio α is equal to the background component of the pixel value of the corresponding pixel of frame #n.
[0492]
The arithmetic unit 653 subtracts the background component supplied from the switch 652 from the pixel value of the pixel of frame #n supplied from the frame memory 621 to obtain the foreground component. The calculator 653 supplies the foreground components of the pixels of the frame #n belonging to the covered background area to the synthesis unit 633.
[0493]
The synthesizer 633 outputs the foreground components of the pixels belonging to the uncovered background area supplied from the calculator 643 and the foregrounds of the pixels belonging to the covered background area supplied from the calculator 653 of the frame #n. The components are combined and supplied to the frame memory 623.
[0494]
The combining unit 634 receives the background component of the pixel belonging to the uncovered background area supplied from the switch 642 and the background component of the pixel belonging to the covered background area supplied from the switch 652 of the frame #n. Combined and supplied to the frame memory 623.
[0495]
The frame memory 623 stores the foreground components and the background components of the pixels in the mixed area of the frame #n supplied from the separation processing block 622, respectively.
[0496]
The frame memory 623 outputs the stored foreground components of the pixels in the mixed area of frame #n and the stored background components of the pixels of the mixed area in frame #n.
[0497]
By using the mixture ratio α, which is a feature amount, it is possible to completely separate the foreground component and the background component included in the pixel value.
[0498]
The synthesizing unit 603 combines the foreground components of the pixels in the mixed area of frame #n output from the separating unit 601 with the pixels belonging to the foreground area to generate a foreground component image.
The synthesizing unit 605 synthesizes the background component of the pixel in the mixed area of frame #n output from the separating unit 601 and the pixel belonging to the background area to generate a background component image.
[0499]
FIG. 71 is a diagram illustrating an example of a foreground component image and an example of a background component image corresponding to frame #n in FIG.
[0500]
FIG. 71A shows an example of the foreground component image corresponding to frame #n in FIG.
Since the leftmost pixel and the fourteenth pixel from the left consist of only background components before the foreground and the background are separated, the pixel value is set to zero.
[0501]
The second through fourth pixels from the left belong to the uncovered background area before the foreground and the background are separated, the background component is 0, and the foreground component is left as it is. The eleventh to thirteenth pixels from the left belong to the covered background area before the foreground and the background are separated, the background component is 0, and the foreground component is left as it is. The fifth through tenth pixels from the left are composed of only the foreground components and are left as they are.
[0502]
FIG. 71B shows an example of a background component image corresponding to frame #n in FIG.
The leftmost pixel and the fourteenth pixel from the left are left as they are because they consisted only of the background components before the foreground and the background were separated.
[0503]
The second through fourth pixels from the left belong to the uncovered background area before the foreground and the background are separated, the foreground components are set to 0, and the background components are left as they are. The eleventh to thirteenth pixels from the left belong to the covered background area before the foreground and the background are separated, and the foreground components are set to 0 and the background components are left as they are. Since the fifth through tenth pixels from the left consist of only the foreground components before the foreground and the background are separated, the pixel value is set to zero.
[0504]
Next, foreground / background separation processing by the foreground / background separation unit 105 will be described with reference to the flowchart shown in FIG. In step S601, the frame memory 621 of the separation unit 601 obtains an input image, and determines the frame #n to be separated from the foreground and the background as the previous frame # n-1 and the subsequent frame # n + 1. Remember with.
[0505]
In step S <b> 602, the separation processing block 622 of the separation unit 601 acquires the region information supplied from the mixture ratio calculation unit 104. In step S <b> 603, the separation processing block 622 of the separation unit 601 acquires the mixture ratio α supplied from the mixture ratio calculation unit 104.
[0506]
In step S604, the uncovered area processing unit 631 extracts a background component from the pixel values of the pixels belonging to the uncovered background area supplied from the frame memory 621 based on the area information and the mixture ratio α.
[0507]
In step S605, the uncovered area processing unit 631 extracts foreground components from the pixel values of the pixels belonging to the uncovered background area supplied from the frame memory 621 based on the area information and the mixture ratio α.
[0508]
In step S606, the covered area processing unit 632 extracts a background component from the pixel values of the pixels belonging to the covered background area supplied from the frame memory 621 based on the area information and the mixture ratio α.
[0509]
In step S607, the covered area processing unit 632 extracts the foreground components from the pixel values of the pixels belonging to the covered background area supplied from the frame memory 621 based on the area information and the mixture ratio α.
[0510]
In step S608, the synthesis unit 633 extracts the foreground components of the pixels belonging to the uncovered background area extracted in step S605 and the foreground components of the pixels belonging to the covered background area extracted in step S607. And synthesize. The synthesized foreground components are supplied to the synthesis unit 603.
Further, the synthesizing unit 603 combines the pixels belonging to the foreground area supplied via the switch 602 with the foreground components supplied from the separating unit 601 to generate a foreground component image.
[0511]
In step S609, the synthesizer 634 extracts the background component of the pixel belonging to the uncovered background area extracted in step S604 and the background component of the pixel belonging to the covered background area extracted in step S606. And synthesize. The synthesized background component is supplied to the synthesis unit 605.
Furthermore, the synthesis unit 605 synthesizes the pixels belonging to the background area supplied via the switch 604 and the background components supplied from the separation unit 601 to generate a background component image.
[0512]
In step S610, the synthesis unit 603 outputs the foreground component image. In step S611, the synthesis unit 605 outputs a background component image, and the process ends.
[0513]
As described above, the foreground / background separation unit 105 separates the foreground component and the background component from the input image based on the region information and the mixture ratio α, and the foreground component image including only the foreground component and the background A background component image consisting only of components can be output.
[0514]
FIG. 73 is a block diagram illustrating a configuration of the motion blur adjusting unit 106.
[0515]
The flat part extraction unit 801 is an adjacent pixel from the foreground component image supplied from the foreground / background separation unit 105 based on the region information supplied from the region specifying unit 103, and the amount of change in the pixel value is small. Extract the flat part. The flat portion extracted by the flat portion extraction unit 801 is composed of pixels with uniform pixel values. Hereinafter, the flat portion is also referred to as an equal portion.
[0516]
For example, the flat part extraction unit 801 is a pixel adjacent to the foreground component image supplied from the foreground / background separation unit 105 based on the region information supplied from the region specifying unit 103, and the amount of change in the pixel value. However, the flat part which is less than the threshold value Thf memorize | stored beforehand is extracted.
[0517]
Further, for example, the flat portion extraction unit 801 extracts a flat portion that is an adjacent pixel of the foreground component image and whose pixel value change amount is within 1%. The ratio of the change amount of the pixel value, which is a reference for extracting the flat portion, can be a desired value.
[0518]
Alternatively, the flat part extraction unit 801 extracts flat parts that are adjacent pixels of the foreground component image and whose standard deviation of the pixel values is less than the threshold Thf stored in advance.
[0519]
Further, for example, the flat part extraction unit 801 stores in advance the sum of errors between the regression line and each pixel value with reference to the regression line corresponding to the pixel value of the adjacent pixel in the foreground component image. A flat portion that is less than the threshold value Thf is extracted.
[0520]
The reference value for extracting the flat portion such as the threshold value Thf or the rate of change in the pixel value can be a desired value, and the present invention is not limited by the reference value for extracting the flat portion. The reference value for extracting the flat portion can be changed adaptively.
[0521]
The flat part extraction unit 801 sets a flat part flag indicating that the extracted pixel belongs to the flat part, and supplies the foreground component image and the flat part flag to the processing unit determination unit 802. Further, the flat part extraction unit 801 generates a flat part image including only pixels belonging to the flat part, and supplies the flat part image to the motion blur removal unit 803.
[0522]
Based on the foreground component image and the flat part flag supplied from the flat part extraction unit 801 and the region information supplied from the region specifying unit 103, the processing unit determination unit 802 determines pixels obtained by removing the flat part from the foreground component image. A processing unit that is data to be specified is generated, and the generated processing unit is supplied to the motion blur removal unit 803 together with the flat portion flag.
[0523]
The motion blur removal unit 803 calculates the foreground components included in the pixels belonging to the flat part from the foreground component image supplied from the foreground / background separation unit 105 based on the flat part flag supplied from the processing unit determination unit 802. To do.
[0524]
The motion blur removal unit 803 converts the foreground component image supplied from the foreground / background separation unit 105 into a flat part based on the region information supplied from the region specifying unit 103 and the processing unit supplied from the processing unit determination unit 802. Remove the corresponding foreground components. Based on the region information supplied from the region specifying unit 103 and the processing unit supplied from the processing unit determination unit 802, the motion blur removal unit 803 includes the remaining foreground components included in the pixels specified by the processing unit. Is calculated.
[0525]
The motion blur removal unit 803 combines the pixel generated based on the foreground component included in the pixel specified in the calculated processing unit and the pixel of the flat part image supplied from the flat part extraction unit 801 to generate motion. A foreground component image from which blur is removed is generated.
[0526]
The motion blur removal unit 803 supplies the foreground component image from which motion blur has been removed to the motion blur addition unit 804 and the selection unit 805.
[0527]
FIG. 74 is a block diagram showing the configuration of the motion blur removal unit 803. The foreground component image supplied from the foreground / background separation unit 105, the processing unit supplied from the processing unit determination unit 802, the motion vector supplied from the motion detection unit 102, and the position information thereof are supplied to the modeling unit 821. .
[0528]
The modeling unit 821 performs modeling based on the motion amount v of the motion vector and the processing unit. More specifically, the modeling unit 821 determines the number of divisions of the pixel value in the time direction and the number of foreground components for each pixel based on the motion amount v and the processing unit, and determines the pixel value and the foreground component. Generate a model that specifies the correspondence with. The modeling unit 821 may select a model corresponding to the motion amount v and the processing unit from among a plurality of models stored in advance. The modeling unit 821 supplies the generated model to the equation generation unit 822 together with the foreground component image.
[0529]
The equation generation unit 822 generates an equation based on the model supplied from the modeling unit 821, and supplies the generated equation to the addition unit 823 together with the foreground component image.
[0530]
The adding unit 823 sets the pixel value of the foreground component image corresponding to the processing unit in the equation supplied from the equation generating unit 822 and supplies the equation in which the pixel value is set to the calculating unit 824. The pixel specified in the processing unit does not include a pixel corresponding to the flat portion.
[0531]
The computing unit 824 calculates the foreground component by solving the equation in which the pixel value is set by the adding unit 823. Based on the calculated foreground components, the calculation unit 824 generates a pixel from which motion blur is removed corresponding to the processing unit, and outputs the pixel corresponding to the generated processing unit to the synthesis unit 825.
[0532]
The synthesis unit 825 generates a foreground component image from which motion blur has been removed based on the pixels corresponding to the processing unit supplied from the calculation unit 824 and the pixels of the flat part image supplied from the flat part extraction unit 801. The generated foreground component image is output.
[0533]
Next, the operation of the motion blur adjusting unit 106 will be described with reference to FIGS. 75 to 80.
[0534]
FIG. 75 is a model diagram in which pixel values of pixels on a straight line corresponding to the motion vector of the foreground component image output from the foreground / background separation unit 105 and input to the flat part extraction unit 801 are expanded in the time direction. C01 ′ to C23 ′ indicate pixel values of the respective pixels of the foreground component image. The foreground component image is composed only of foreground components.
[0535]
Based on the threshold value Thf, the flat part extraction unit 801 extracts consecutive pixels whose pixel value change amount is less than the threshold value Thf from among the pixels included in the foreground component image supplied from the foreground / background separation unit 105. . The threshold value Thf is a sufficiently small value. The number of continuous pixels extracted by the flat part extraction unit 801 must be larger than the motion amount v of the foreground object in one frame. For example, when the amount of motion v of the foreground object in one frame is 5, the flat part extraction unit 801 extracts five or more continuous pixels with almost no change in pixel value, that is, flat parts.
[0536]
For example, in the example shown in FIG. 76, when the equation (78) is satisfied, the values of the foreground components F06 / v to F14 / v are equal from the relationship of the equations (79) to (83). .
[0537]
C10 '= C11' = C12 '= C13' = C14 '(78)
C10 '= F06 / v + F07 / v + F08 / v + F09 / v + F10 / v (79)
C11 '= F07 / v + F08 / v + F09 / v + F10 / v + F11 / v (80)
C12 '= F08 / v + F09 / v + F10 / v + F11 / v + F12 / v (81)
C13 '= F09 / v + F10 / v + F11 / v + F12 / v + F13 / v (82)
C14 '= F10 / v + F11 / v + F12 / v + F13 / v + F14 / v (83)
That is, the foreground components F06 / v to F14 / v hold the relationship shown in the equation (84).
[0538]
F06 / v = F07 / v = F08 / v = F09 / v = F10 / v = F11 / v = F12 / v = F13 / v = F14 / v (84)
[0539]
Therefore, in the subsequent process of calculating the foreground components, as shown in FIG. 77, the remaining foreground components F01 / v to F05 / v other than the foreground components F06 / v to F14 / v and the foreground component F15 It can be seen that / v to F19 / v may be calculated.
[0540]
The flat part extraction unit 801 extracts a flat part with uniform pixel values necessary for such processing, and in response to the extraction of the flat part, a flat part flag indicating whether or not the pixel belongs to the flat part. It is generated and supplied to the processing unit determination unit 802. The flat part extraction unit 801 supplies a flat part image including only pixels belonging to the flat part to the motion blur removal unit 803.
[0541]
The processing unit determination unit 802 generates a processing unit that is data indicating pixels obtained by removing the flat portion from the pixels on the straight line included in the foreground component image, and sets the processing unit together with the flat portion flag to the motion blur removal unit 803. Supply.
[0542]
The motion blur removal unit 803 calculates the foreground components included in the pixels belonging to the flat part based on the flat part flag supplied from the processing unit determination unit 802. The motion blur removal unit 803 removes foreground components included in pixels belonging to the flat part from the foreground component image based on the flat part flag.
[0543]
Based on the processing unit supplied from the processing unit determination unit 802, the motion blur removal unit 803 determines the remaining foreground components from the pixel values of pixels on the straight line included in the foreground component image from which the flat portion has been removed. An expression for calculating is generated.
[0544]
For example, as shown in FIG. 76, when the tenth through fourteenth pixels from the left among the 23 pixels on the straight line of the foreground component image belong to the flat portion, they belong to the tenth through fourteenth pixels from the left. Since the foreground components can be removed from the foreground component image, as shown in FIG. 77, the remaining foreground components, that is, foreground components F01 / v to F05 / v, and foreground components F15 / v to F19 / v Equations (85) to (102) may be generated for.
[0545]
Figure 0004596205
[0546]
By applying the least square method described above to the equations (85) to (102), the equations (103) and (104) are derived.
[0547]
[Expression 17]
Figure 0004596205
[0548]
[Formula 18]
Figure 0004596205
[0549]
The equation generation unit 822 of the motion blur removal unit 803 generates an equation corresponding to the processing unit, as shown in the equations (103) and (104). The adding unit 823 of the motion blur removing unit 803 sets the pixel value included in the foreground component image from which the foreground component included in the pixel belonging to the flat portion is removed to the equation generated by the equation generating unit 822. The calculation unit 824 of the motion blur removal unit 803 applies a solution such as Cholesky decomposition to an equation in which pixel values are set, and is included in the foreground component image other than the foreground components included in the pixels belonging to the flat portion. Calculate foreground components.
[0550]
The calculation unit 824 generates a foreground component image from which motion blur is removed, which includes Fi, which is a pixel value from which motion blur has been removed, as shown in FIG.
[0551]
In the foreground component image from which the motion blur shown in FIG. 78 is removed, F01 to F05 are set for C04 ″ to C05 ″, and F15 to F19 are set for C18 ″ to C19 ″, respectively. Each is set in order not to change the position of the foreground component image with respect to the screen, and can correspond to an arbitrary position.
[0552]
The calculation unit 824 generates pixels corresponding to the foreground components removed in units of processing based on the flat portion image supplied from the flat portion extraction unit 801, and the generated pixels are subjected to motion blur shown in FIG. For example, a foreground component image shown in FIG. 79 is generated by combining with the removed foreground component image.
[0553]
The motion blur removal unit 803 may generate pixels corresponding to the flat portion based on the foreground components F06 / v to F14 / v calculated by the equation (84).
[0554]
The motion blur adding unit 804 is a motion blur adjustment amount v ′ having a value different from the motion amount v, for example, a motion blur adjustment amount v ′ having a value half that of the motion amount v, or a motion blur having a value unrelated to the motion amount v. By giving the adjustment amount v ′, the amount of motion blur can be adjusted. For example, as shown in FIG. 80, the motion blur adding unit 804 calculates the foreground component Fi / v ′ by dividing the foreground pixel value Fi from which motion blur is removed by the motion blur adjustment amount v ′. Then, the sum of the foreground components Fi / v ′ is calculated to generate a pixel value in which the amount of motion blur is adjusted. For example, when the motion blur adjustment amount v ′ is 3, the pixel value C02 ″ is (F01) / v ′, the pixel value C03 ″ is (F01 + F02) / v ′, and the pixel value C04 ″ Is (F01 + F02 + F03) / v ′, and the pixel value C05 ″ is (F02 + F03 + F04) / v ′.
[0555]
The motion blur adding unit 804 supplies the foreground component image in which the amount of motion blur is adjusted to the selection unit 805.
[0556]
For example, based on a selection signal corresponding to the user's selection, the selection unit 805 removes the motion blur supplied from the calculation unit 805 and the amount of motion blur supplied from the motion blur addition unit 804. Is selected, and the selected foreground component image is output.
[0557]
Thus, the motion blur adjusting unit 106 can adjust the amount of motion blur based on the selection signal and the motion blur adjustment amount v ′.
[0558]
The motion blur adjusting unit 106 may acquire the background component image from the foreground / background separating unit 105 and adjust the background component corresponding to the pixels belonging to the mixed region.
[0559]
FIG. 81 is a diagram for explaining the background component correction processing by the motion blur adjusting unit 106. The foreground / background separation unit 105 removes the foreground components of the pixels included in the background component image that belonged to the mixed area before being separated.
[0560]
Based on the region information and the motion amount v, the motion blur adjustment unit 106 performs correction so as to add the corresponding background component to the pixels belonging to the mixed region among the pixels included in the background component image.
[0561]
For example, when the pixel value C02 ′ ″ includes four background components B02 / v, the motion blur adjusting unit 106 includes one background component (B02 / V) ′ (background component) in the pixel value C02 ′ ″. When the pixel value C03 '''includes three background components B03 / v, the two background components (B03 / V)' (background Add the same value as component B03 / v).
[0562]
When the pixel value C23 ′ ″ includes three background components B23 / v, the motion blur adjustment unit 106 adds two background components (B23 / V) ′ (background component B23 / V) to the pixel value C23 ″ ′. v), and when the pixel value C24 ′ ″ includes four background components B24 / v, one background component (B24 / V) ′ (background component B24) is included in the pixel value C24 ′ ″. Add the same value as / v).
[0563]
Next, an example of a result of processing by the motion blur adjustment unit 106 having the configuration illustrated in FIG. 73 will be described.
[0564]
FIG. 82 is an image obtained by capturing a stationary black square. On the other hand, FIG. 83 is an image captured by moving the black square captured in the image of FIG. In the image shown in FIG. 83, the black square images interfere with each other due to motion blur.
[0565]
FIG. 84 shows an example of the result of processing performed by the motion blur adjustment unit 106 shown in FIG. 73 for pixels on a straight line indicated by a dotted line in FIG.
[0566]
In FIG. 84, the solid line indicates the pixel value obtained by executing the process by the motion blur adjusting unit 106 having the configuration illustrated in FIG. 73, the dotted line indicates the pixel value on the straight line illustrated in FIG. The pixel values on the corresponding straight line shown in FIG. 82 are shown.
[0567]
In the dotted line shown in FIG. 84, since the pixel values at both ends in the figure are substantially constant and flat (equal), the motion blur adjustment unit 106 considers this as a flat part and removes it, and the remaining pixel values are described above. The process was executed.
[0568]
From the result shown in FIG. 84, the motion blur adjustment unit 106 captures an image of a stationary black square from an image in which pixel values are buried due to interference by capturing the moving black square. It can be seen that substantially equivalent pixel values are generated.
[0569]
The results shown in FIG. 84 are obtained by applying the present invention to an image that is imaged by a CCD and in which a linear relationship is ensured between an incident light quantity and a pixel value, and to which gamma correction is not applied. Similarly, the effectiveness of the present invention for images to which gamma correction has been applied has been confirmed by experiments.
[0570]
Next, with reference to the flowchart of FIG. 85, the process of adjusting the amount of motion blur by the motion blur adjustment unit 106 having the configuration shown in FIG. 73 will be described.
[0571]
In step S801, the flat part extraction unit 801 extracts, from the foreground component image supplied from the foreground / background separation unit 105, flat parts that are adjacent pixels and have the same pixel value, and outputs the extracted flat parts. A corresponding flat part flag is supplied to the processing unit determination unit 802 and a flat part image including pixels belonging to the flat part is supplied to the motion blur removal unit 803.
[0572]
In step S <b> 802, the processing unit determination unit 802 generates a processing unit indicating the positions of pixels adjacent to the straight line included in the foreground component image other than the pixels belonging to the flat part, based on the flat part flag. Then, the processing unit is supplied to the motion blur removal unit 803.
[0573]
In step S803, the motion blur removal unit 803 determines the foreground components corresponding to the pixels belonging to the flat part based on the foreground component image supplied from the foreground / background separation unit 105 and the processing unit supplied from the processing unit determination unit 802. And foreground components corresponding to the processing unit are calculated, and motion blur is removed from the foreground components. The motion blur removal unit 803 outputs the foreground components from which the motion blur is removed to the motion blur addition unit 804 and the selection unit 805. Details of the motion blur removal processing in step S803 will be described later with reference to the flowchart in FIG.
[0574]
In step S804, the motion blur adjustment unit 106 determines whether or not the process has been completed for the entire foreground component image. If it is determined that the process has not been completed for the entire foreground component image, the process returns to step S803. The process of removing motion blur for the foreground components corresponding to the processing unit is repeated.
[0575]
If it is determined in step S804 that the processing has been completed for the entire foreground component image, the process advances to step S805, and the motion blur adding unit 804 and the selection unit 805 of the motion blur adjusting unit 106 adjust the background of the motion blur adjusted. The component image is calculated, and either the foreground component image from which motion blur has been removed or the foreground component image to which motion blur has been added is selected, the selected image is output, and the process ends.
[0576]
In this way, the motion blur adjusting unit 106 can adjust the amount of motion blur of the input foreground component image.
[0577]
Next, the process of removing motion blur from the foreground component image corresponding to the processing unit by the motion blur removal unit 803 corresponding to step S803 in FIG. 85 will be described with reference to the flowchart in FIG.
[0578]
In step S821, the modeling unit 821 of the motion blur removing unit 803 generates a model corresponding to the motion amount v and the processing unit. In step S822, the equation generation unit 822 generates an equation based on the generated model.
[0579]
In step S823, the adding unit 823 sets the pixel value of the foreground component image from which the foreground component corresponding to the flat portion is removed, in the generated equation. In step S824, the adding unit 823 determines whether or not the pixel values of all the pixels corresponding to the processing unit have been set, and if the pixel values of all the pixels corresponding to the processing unit have not been set. If it is determined, the process returns to step S823, and the process of setting the pixel value to the equation is repeated.
[0580]
If it is determined in step S824 that the pixel values of all the pixels of the processing unit have been set, the process proceeds to step S825, and the calculation unit 824 is based on an equation in which the pixel values supplied from the addition unit 823 are set. In addition, a foreground pixel value from which motion blur is removed is calculated.
[0581]
In step S826, the calculation unit 824 combines the flat part image supplied from the flat part extraction unit 801 with the pixel set with the foreground pixel value from which the motion blur calculated in the process of step S825 is removed, and The foreground component image from which motion blur has been removed is generated, and the process ends.
[0582]
In this way, the motion blur removal unit 803 can remove motion blur from the foreground component image including motion blur based on the motion amount v and the processing unit.
[0583]
As described above, the motion blur adjusting unit 106 having the configuration shown in FIG. 73 can adjust the amount of motion blur included in the input foreground component image.
[0584]
In the conventional method of partially removing motion blur such as a Wiener filter, an effect is recognized in an ideal state, but it is quantized and a sufficient effect cannot be obtained for an actual image including noise. On the other hand, in the motion blur adjustment unit 106 having the configuration shown in FIG. 73, a sufficient effect is recognized even for an actual image that is quantized and includes noise, and motion blur can be accurately removed. .
[0585]
Also, since the foreground component is calculated from the remaining pixels by removing the flat portion from the foreground component image, the influence of quantization or noise is less likely to spread, and the motion blur adjustment unit shown in FIG. 73 is configured. 106 can obtain an image in which the amount of motion blur is adjusted more accurately.
[0586]
FIG. 87 is a block diagram illustrating another configuration of the function of the signal processing device.
[0587]
The same parts as those shown in FIG. 2 are denoted by the same reference numerals, and description thereof will be omitted as appropriate.
[0588]
The area specifying unit 103 supplies the area information to the mixture ratio calculation unit 104 and the synthesis unit 1001.
[0589]
The mixture ratio calculation unit 104 supplies the mixture ratio α to the foreground / background separation unit 105 and the synthesis unit 1001.
[0590]
The foreground / background separation unit 105 supplies the foreground component image to the synthesis unit 1001.
[0591]
The synthesizing unit 1001 determines an arbitrary background image and a foreground component image supplied from the foreground / background separating unit 105 based on the mixture ratio α supplied from the mixture ratio calculating unit 104 and the region information supplied from the region specifying unit 103. Are combined to output a composite image in which an arbitrary background image and a foreground component image are combined.
[0592]
FIG. 88 is a diagram illustrating a configuration of the synthesis unit 1001. The background component generation unit 1021 generates a background component image based on the mixing ratio α and an arbitrary background image, and supplies the background component image to the mixed region image synthesis unit 1022.
[0593]
The mixed region image combining unit 1022 generates a mixed region combined image by combining the background component image and the foreground component image supplied from the background component generating unit 1021, and the generated mixed region combined image is used as the image combining unit. 1023.
[0594]
The image composition unit 1023 synthesizes the foreground component image, the mixed region composite image supplied from the mixed region image composition unit 1022 and an arbitrary background image based on the region information, and generates and outputs a composite image.
[0595]
As described above, the synthesizing unit 1001 can synthesize the foreground component image with an arbitrary background image.
[0596]
An image obtained by combining the foreground component image with an arbitrary background image based on the mixing ratio α, which is a feature amount, is more natural than an image obtained by simply combining pixels.
[0597]
FIG. 89 is a block diagram showing still another configuration of the function of the signal processing device for adjusting the amount of motion blur. The signal processing apparatus shown in FIG. 2 performs region specification and calculation of the mixing ratio α in order, whereas the signal processing device shown in FIG. 89 performs region specification and calculation of the mixing ratio α in parallel.
[0598]
The same parts as those shown in the block diagram of FIG. 2 are denoted by the same reference numerals, and the description thereof is omitted.
[0599]
The input image is supplied to the mixture ratio calculation unit 1101, foreground / background separation unit 1102, region specifying unit 103, and object extraction unit 101.
[0600]
Based on the input image, the mixture ratio calculation unit 1101 calculates the estimated mixture ratio when it is assumed that the pixel belongs to the covered background area, and the estimated mixture ratio when the pixel belongs to the uncovered background area. Calculated for each pixel included in the input image, estimated mixture ratio when the calculated pixel is assumed to belong to the covered background area, and estimated mixture when the pixel is assumed to belong to the uncovered background area The ratio is supplied to the foreground / background separator 1102.
[0601]
FIG. 90 is a block diagram illustrating an example of the configuration of the mixture ratio calculation unit 1101.
[0602]
The estimated mixture ratio processing unit 401 shown in FIG. 90 is the same as the estimated mixture ratio processing unit 401 shown in FIG. The estimated mixture ratio processing unit 402 shown in FIG. 90 is the same as the estimated mixture ratio processing unit 402 shown in FIG.
[0603]
Based on the input image, the estimated mixture ratio processing unit 401 calculates an estimated mixture ratio for each pixel by an operation corresponding to the model of the covered background region, and outputs the calculated estimated mixture ratio.
[0604]
The estimated mixture ratio processing unit 402 calculates an estimated mixture ratio for each pixel by an operation corresponding to the model of the uncovered background area based on the input image, and outputs the calculated estimated mixture ratio.
[0605]
The foreground / background separation unit 1102 is supplied from the mixture ratio calculation unit 1101 and is estimated when the pixel is assumed to belong to the covered background area, and is estimated when the pixel is assumed to belong to the uncovered background area. Based on the mixing ratio and the region information supplied from the region specifying unit 103, a foreground component image is generated from the input image, and the generated foreground component image is supplied to the motion blur adjusting unit 106 and the selecting unit 107.
[0606]
FIG. 91 is a block diagram illustrating an example of the configuration of the foreground / background separator 1102.
[0607]
Portions similar to those in the foreground / background separation unit 105 shown in FIG.
[0608]
Based on the region information supplied from the region specifying unit 103, the selection unit 1121 supplies the estimated mixture ratio supplied from the mixture ratio calculation unit 1101 and assuming that the pixel belongs to the covered background region, and the pixel is undefined. One of the estimated mixture ratios when it is assumed to belong to the covered background region is selected, and the selected estimated mixture ratio is supplied to the separation unit 601 as the mixture ratio α.
[0609]
The separation unit 601 extracts the foreground components and the background components from the pixel values of the pixels belonging to the mixed region based on the mixture ratio α and the region information supplied from the selection unit 1121, and combines the extracted foreground components. At the same time, the background component is supplied to the synthesis unit 605.
[0610]
The separation unit 601 can have the same configuration as that shown in FIG.
[0611]
The synthesizing unit 603 synthesizes and outputs the foreground component image. The synthesizing unit 605 synthesizes and outputs the background component image.
[0612]
The motion blur adjustment unit 106 illustrated in FIG. 89 can have the same configuration as that illustrated in FIG. 2 and is included in the foreground component image supplied from the foreground / background separation unit 1102 based on the region information and the motion vector. The amount of motion blur is adjusted, and a foreground component image in which the amount of motion blur is adjusted is output.
[0613]
89, for example, based on a selection signal corresponding to the user's selection, the foreground component image supplied from the foreground / background separation unit 1102 and the amount of motion blur supplied from the motion blur adjustment unit 106 Is selected, and the selected foreground component image is output.
[0614]
As described above, the signal processing apparatus having the configuration shown in FIG. 89 can adjust and output the amount of motion blur included in the image corresponding to the foreground object included in the input image. As in the first embodiment, the signal processing apparatus having the configuration shown in FIG. 89 can calculate the mixture ratio α, which is buried information, and output the calculated mixture ratio α.
[0615]
FIG. 92 is a block diagram illustrating another configuration of the function of the signal processing device that synthesizes the foreground component image with an arbitrary background image. The signal processing apparatus shown in FIG. 87 serially performs area specification and calculation of the mixing ratio α, whereas the signal processing apparatus shown in FIG. 92 performs area specification and calculation of the mixing ratio α in parallel.
[0616]
Parts that are the same as those shown in the block diagram of FIG. 89 are given the same reference numerals, and descriptions thereof are omitted.
[0617]
The mixture ratio calculation unit 1101 illustrated in FIG. 92 is based on the input image and is estimated when the pixel is assumed to belong to the covered background area, and is estimated when the pixel is assumed to belong to the uncovered background area. The mixture ratio is calculated for each pixel included in the input image, and the estimated mixture ratio when the calculated pixel is assumed to belong to the covered background area and the pixel is assumed to belong to the uncovered background area are assumed. The estimated mixture ratio in the case is supplied to the foreground / background separation unit 1102 and the synthesis unit 1201.
[0618]
The foreground / background separation unit 1102 illustrated in FIG. 92 is supplied from the mixture ratio calculation unit 1101 and is assumed to have the estimated mixture ratio when the pixel belongs to the covered background area, and the pixel belongs to the uncovered background area. The foreground component image is generated from the input image based on the estimated mixture ratio in this case and the region information supplied from the region specifying unit 103, and the generated foreground component image is supplied to the combining unit 1201.
[0619]
The combining unit 1201 supplies the estimated mixture ratio supplied from the mixture ratio calculation unit 1101 when it is assumed that the pixel belongs to the covered background area, and the estimated mixture ratio when the pixel belongs to the uncovered background area. The arbitrary background image and the foreground component image supplied from the foreground / background separation unit 1102 are combined based on the region information supplied from the region specifying unit 103, and the arbitrary background image and the foreground component image are combined. The synthesized image is output.
[0620]
FIG. 93 is a diagram illustrating a configuration of the combining unit 1201. Parts that are the same as the functions shown in the block diagram of FIG. 88 are given the same reference numerals, and descriptions thereof are omitted.
[0621]
Based on the region information supplied from the region specifying unit 103, the selection unit 1221 supplies the estimated mixture ratio supplied from the mixture ratio calculation unit 1101 when it is assumed that the pixel belongs to the covered background region, and the pixel is undefined. One of the estimated mixture ratios when it is assumed to belong to the covered background region is selected, and the selected estimated mixture ratio is supplied to the background component generation unit 1021 as the mixture ratio α.
[0622]
The background component generation unit 1021 illustrated in FIG. 93 generates a background component image based on the mixing ratio α and an arbitrary background image supplied from the selection unit 1221 and supplies the background component image to the mixed region image composition unit 1022.
[0623]
The mixed region image combining unit 1022 shown in FIG. 93 generates a mixed region combined image by combining the background component image and the foreground component image supplied from the background component generating unit 1021, and generates the generated mixed region combined image. Is supplied to the image composition unit 1023.
[0624]
The image composition unit 1023 synthesizes the foreground component image, the mixed region composite image supplied from the mixed region image composition unit 1022 and an arbitrary background image based on the region information, and generates and outputs a composite image.
[0625]
As described above, the synthesis unit 1201 can synthesize the foreground component image with an arbitrary background image.
[0626]
FIG. 94 is a block diagram showing still another configuration of the signal processing apparatus.
[0627]
The same parts as those shown in FIG. 2 are denoted by the same reference numerals, and description thereof will be omitted as appropriate.
[0628]
The input image supplied to the signal processing apparatus is supplied to the object extraction unit 101, the region specifying unit 103, the flat part extraction unit 1501, the separation blur removal unit 1503, and the synthesis unit 1504.
[0629]
The object extraction unit 101 roughly extracts an image object corresponding to a foreground object included in the input image, and supplies the extracted image object to the motion detection unit 102. The object extraction unit 101 roughly extracts an image object corresponding to a background object included in the input image, and supplies the extracted image object to the motion detection unit 102.
[0630]
The motion detection unit 102 calculates a motion vector of an image object corresponding to the coarsely extracted foreground object, and the calculated motion vector and motion vector position information are included in the region specifying unit 103, the flat part extraction unit 1501, and the processing unit. The data is supplied to the determination unit 1502 and the separation blur removal unit 1503.
[0631]
The area specifying unit 103 specifies each pixel of the input image as one of the foreground area, the background area, or the mixed area, and whether each pixel belongs to one of the foreground area, the background area, or the mixed area (Hereinafter referred to as region information) is supplied to the flat part extraction unit 1501, the processing unit determination unit 1502, and the synthesis unit 1504.
[0632]
The flat part extraction unit 1501 starts from pixels belonging to the uncovered background area based on the input image, the motion vector and the position information supplied from the motion detection unit 102, and the area information supplied from the area specifying unit 103. Among the continuous pixels lined up in the movement direction up to the pixels belonging to the covered background area, a flat part which is an adjacent pixel belonging to the foreground area and having a small change amount of the pixel value is extracted. The flat portion extracted by the flat portion extraction unit 1501 is composed of pixels with uniform pixel values.
[0633]
For example, the flat part extraction unit 1501 includes pixels that belong to the uncovered background area based on the input image, the motion vector supplied from the motion detection unit 102 and its position information, and the area information supplied from the area specifying unit 103. Among the continuous pixels lined up in the direction of movement up to the pixels belonging to the covered background area, the pixels belonging to the foreground area and adjacent to each other, and the amount of change in the pixel value is less than the threshold Thf1 stored in advance Extract the flat part.
[0634]
In addition, for example, the flat part extraction unit 1501 extracts a flat part that is an adjacent pixel of the foreground component image and the change amount of the pixel value is within 1%. The ratio of the change amount of the pixel value, which is a reference for extracting the flat portion, can be a desired value.
[0635]
Alternatively, the flat part extraction unit 1501 extracts a flat part which is a pixel adjacent to the foreground component image and whose standard deviation of the pixel value is less than the threshold Thf1 stored in advance.
[0636]
Further, for example, the flat portion extraction unit 1501 stores in advance the sum of errors between the regression line and each pixel value, which is a pixel adjacent to the foreground component image and uses the regression line corresponding to the pixel value as a reference. A flat portion that is less than the threshold value Thf1 is extracted.
[0637]
The reference value for extracting the flat portion, such as the threshold Thf1 or the rate of change in the pixel value, can be a desired value, and the present invention is not limited by the reference value for extracting the flat portion. The reference value for extracting the flat portion can be changed adaptively.
[0638]
The flat part extraction unit 1501 generates foreground flat part position information that is information indicating the position of the extracted flat part, and supplies the generated foreground flat part position information to the processing unit determination unit 1502.
[0639]
The processing unit determination unit 1502 is based on the foreground flat portion position information supplied from the flat portion extraction unit 1501, the motion vector and position information supplied from the motion detection unit 102, and the region information supplied from the region specifying unit 103. Next, a processing unit indicating one or more pixels belonging to the foreground area or the mixed area is determined.
[0640]
The processing unit determination unit 1502 supplies the generated processing unit to the separation blur removal unit 1503.
[0641]
The separation blur removal unit 1503 is designated as a processing unit among the pixels of the input image based on the processing unit supplied from the processing unit determination unit 1502 and the motion vector and position information supplied from the motion detection unit 102. The foreground component image from which motion blur is removed and the separated background component image are generated, and the generated foreground component image and background component image are supplied to the synthesis unit 1504.
[0642]
Based on the region information supplied from the region specifying unit 103, the combining unit 1504 supplies the foreground component image from which motion blur has been removed, the separated background component image, and the input image supplied from the separation blur removing unit 1503. Then, an image from which the motion blur of the foreground object is removed is synthesized, and an image from which the synthesized motion blur is removed is output.
[0643]
FIG. 95 is a block diagram showing a configuration of the separation blur removal unit 1503. The motion vector and its position information supplied from the motion detection unit 102 and the processing unit supplied from the processing unit determination unit 1502 are supplied to the modeling unit 1521.
[0644]
The modeling unit 1521 generates a model based on the motion vector supplied from the motion detection unit 102 and its position information, and the processing unit supplied from the processing unit determination unit 1502, and the generated model is used as an equation generation unit 1522. To supply.
[0645]
The processing unit and the model corresponding to the processing unit will be described with reference to FIGS.
[0646]
FIG. 96 is a diagram illustrating an example of a pixel when the shutter speed of the sensor is sufficiently increased and no motion blur occurs. F01 to F20 are image components corresponding to the foreground object.
[0647]
The pixel value C04 corresponding to the foreground object is F01, the pixel value C05 is F02, the pixel value C06 is F03, and each pixel value corresponds to one image corresponding to the foreground object. Consists of ingredients. Similarly, the pixel values C07 to C23 are F04 to F20, respectively.
[0648]
In the example shown in FIG. 96, since the background object is stationary, no motion blur occurs in the background.
[0649]
The pixel value C01 corresponding to the background object is B01, the pixel value C02 is B02, and the pixel value C03 is B03. Similarly, the pixel value C24 corresponding to the background object is B24, the pixel value C25 is B25, and the pixel value C26 is B26.
[0650]
FIG. 97 is a model diagram corresponding to FIG. 96 in which pixel values are expanded in the time direction when motion blur occurs.
[0651]
In the example shown in FIG. 97, the motion amount v is 5, and the foreground object is moving from the left side to the right side in the drawing.
[0652]
In the example shown in FIG. 97, the second to fifth pixels from the left belong to the mixed area. In addition, the 22nd to 25th pixels from the left belong to the mixed region.
[0653]
The pixels located from the sixth to the 21st from the left belong to the foreground area.
[0654]
The flat part extraction unit 1501 is a pixel belonging to the foreground area among the continuous pixels arranged in the movement direction up to the pixel belonging to the covered background area based on the threshold Thf1 stored in advance, and the pixel value of the pixel value Continuous pixels whose change amount is less than the threshold value Thf1 are extracted.
[0655]
The threshold value Thf1 is a sufficiently small value. The number of continuous pixels extracted by the flat part extraction unit 1501 must be larger than the motion amount v of the foreground object in one frame. For example, when the amount of motion v of the foreground object in one frame is 5, the flat part extraction unit 1501 extracts five or more continuous pixels with almost no change in pixel value, that is, flat parts.
[0656]
For example, in the example shown in FIG. 98, when the formula (105) is established, the foreground components F06 / v to F14 / v are found to have the same value from the relationships of the formulas (106) to (110). .
[0657]
C11 = C12 = C13 = C14 = C15 (105)
C11 = F06 / v + F07 / v + F08 / v + F09 / v + F10 / v (106)
C12 = F07 / v + F08 / v + F09 / v + F10 / v + F11 / v (107)
C13 = F08 / v + F09 / v + F10 / v + F11 / v + F12 / v (108)
C14 = F09 / v + F10 / v + F11 / v + F12 / v + F13 / v (109)
C15 = F10 / v + F11 / v + F12 / v + F13 / v + F14 / v (110)
That is, the foreground components F06 / v to F14 / v hold the relationship shown in the equation (111).
[0658]
F06 / v = F07 / v = F08 / v = F09 / v = F10 / v = F11 / v = F12 / v = F13 / v = F14 / v (111)
[0659]
Therefore, in the subsequent processing of calculating the foreground components and the background components, as shown in FIG. 99, the remaining foreground components F01 / v to F05 / v other than the foreground components F06 / v to F14 / v and It can be seen that the foreground components F15 / v to F20 / v, the background components B02 / v to B05 / v, and the background components B22 / v to B25 / v may be calculated.
[0660]
For example, as shown in FIG. 98, the second to the 25th pixels from the left in the figure, which are continuous pixels starting from the pixels belonging to the uncovered background area and arranged in the movement direction to the pixels belonging to the covered background area. If the eleventh through fifteenth pixels from the left belong to the flat portion among the 24 pixels on the straight line, the foreground components contained in the eleventh through fifteenth pixels from the left can be removed, and FIG. As shown, the foreground components and the background components corresponding to the remaining consecutive pixels, that is, the foreground components F01 / v to F05 / v and the background components B02 / v to B05 / v (120) may be generated.
[0661]
Figure 0004596205
[0662]
For the nine equations (112) to (120), since there are nine variables, foreground components F01 / v to F05 / v and background components B02 / v to B05 / v, equations (112) to By solving the equation (120), the values of the foreground components F01 / v to F05 / v and the background components B02 / v to B05 / v can be obtained.
[0663]
Similarly, the equations (121) to (130) may be generated for the foreground components F15 / v to F20 / v and the background components B22 / v to B25 / v.
[0664]
Figure 0004596205
[0665]
For the ten equations (121) to (130), since the variables are ten foreground components F15 / v to F20 / v and background components B22 / v to B25 / v, equations (121) to By solving the equation (130), the values of the foreground components F15 / v to F20 / v and the background components B22 / v to B25 / v can be obtained.
[0666]
Returning to FIG. 95, the modeling unit 1521 divides the pixel value in the time direction based on the motion vector and the position information supplied from the motion detection unit 102 and the processing unit supplied from the processing unit determination unit 1502. Determine the number of foreground components for each pixel, and the number of background components for each pixel, and generate and generate a model to generate the equations for calculating the foreground and background components described above The model is supplied to the equation generation unit 1522.
[0667]
The equation generation unit 1522 generates an equation based on the model supplied from the modeling unit 1521. The equation generation unit 1522 sets a pixel value belonging to the foreground region or the background region corresponding to the model in the generated equation, and supplies an equation in which the pixel value is set to the calculation unit 1523.
[0668]
The calculation unit 1523 solves the equation supplied from the equation generation unit 1522 to calculate the foreground component and the background component.
[0669]
For example, when the equations corresponding to the equations (112) to (120) are supplied, the calculation unit 1523 obtains an inverse matrix of the matrix on the left side of the equation shown in the equation (131), and calculates the foreground component F01 / v To F05 / v and background components B02 / v to B05 / v are calculated.
[0670]
[Equation 19]
Figure 0004596205
[0671]
Further, when the equations corresponding to the equations (121) to (130) are supplied, the calculation unit 1523 obtains an inverse matrix of the matrix on the left side of the equation shown in the equation (132), and calculates the foreground component F15 / v. To F20 / v and background components B22 / v to B25 / v are calculated.
[0672]
[Expression 20]
Figure 0004596205
[0673]
The computing unit 1523 generates a foreground component image from which motion blur has been removed and a separated background component image based on the foreground component and background component, and the foreground component image from which motion blur has been removed and separated. Output a background component image.
[0674]
For example, the calculation unit 1523 solves the equations, foreground components F01 / v to F05 / v, background components B02 / v to B05 / v, foreground components F15 / v to F20 / v, and background component B22 When obtaining / v to B25 / v, as shown in FIG. 100, foreground components F01 / v to F05 / v, background components B02 / v, background components B03 / v, and foreground components F15 / v v to F20 / v, background component B24 / v, and background component B25 / v are multiplied by the motion amount v to obtain pixel values F01 to F05, pixel value B02, pixel value B03, pixel values F15 to F20, pixel A value B24 and a pixel value B25 are calculated.
[0675]
The calculation unit 1523 includes, for example, a foreground component image from which motion blur is removed including pixel values F01 to F05 and pixel values F15 to F20, and a pixel value B02, a pixel value B03, a pixel value B24, and a pixel value B25. A separated background component image is generated.
[0676]
An example of an actual processing result of the separation blur removal unit 1503 will be described with reference to FIG. 101 and FIG.
[0677]
FIG. 101 is a diagram illustrating an example of an input image in which a foreground object and a background object are mixed. The upper right image in the figure corresponds to the background object, and the lower left image in the figure corresponds to the foreground object. Foreground objects progress from left to right. A band-like region between the upper left side and the lower right side in the figure is a mixed region.
[0678]
FIG. 102 shows the result of applying the above-described processing to the pixels on the center line in FIG. A fine dotted line in FIG. 102 indicates a pixel value of the input image.
[0679]
The rough dotted line in FIG. 102 indicates the pixel value of the foreground object without motion blur, and the alternate long and short dash line indicates the pixel value of the background object in which the foreground object is not mixed.
[0680]
The solid lines in FIG. 102 indicate the pixel values of the foreground component image from which motion blur is removed and the separated background component image, which are obtained as a result of applying the above-described processing to the input image.
[0681]
From the above results, the information processing apparatus having the configuration shown in FIG. 94 applies the above-described processing to the input image, so that the pixel values of the foreground object without motion blur and the pixels of the background object without mixing the foreground object are obtained. It can be seen that a pixel value close to the value can be output.
[0682]
With reference to the flowchart of FIG. 103, the motion blur removal processing by the signal processing device having the configuration shown in FIG. 94 will be described. In step S1001, the area specifying unit 103 obtains area information indicating whether each pixel of the input image belongs to the foreground area, the background area, the covered background area, or the uncovered background area based on the input image. A process for specifying the area to be generated is executed. The area specifying unit 103 supplies the generated area information to the flat part extracting unit 1501.
[0683]
In step S1002, the flat part extraction unit 1501 starts from the pixels belonging to the uncovered background area and moves to the pixels belonging to the covered background area based on the input image, the motion vector and its position information, and the area information. Among the continuous pixels lined up in (b), a flat portion that is a pixel belonging to the foreground area and whose pixel value change amount is less than the threshold Thf1 stored in advance is extracted. The flat part extraction unit 1501 generates foreground flat part position information that is information indicating the position of the extracted flat part, and supplies the generated foreground flat part position information to the processing unit determination unit 1502.
[0684]
In step S1003, the processing unit determination unit 1502 determines a processing unit indicating one or more pixels included in the object corresponding to the foreground based on the motion vector, its position information, and region information, and separates the processing unit. This is supplied to the blur removal unit 1503.
[0685]
In step S <b> 1004, the separation blur removal unit 1503 performs processing among the pixels of the input image based on the processing unit supplied from the processing unit determination unit 1502 and the motion vector and position information supplied from the motion detection unit 102. For each pixel designated as a unit, foreground and background separation and motion blur removal are collectively processed, and foreground components and background components corresponding to the pixels designated as processing units are calculated.
Details of batch processing for foreground and background separation and motion blur removal will be described with reference to the flowchart of FIG.
[0686]
In step S1005, the separation blur removal unit 1503 calculates the foreground component of the flat portion.
[0687]
In step S1006, the separation blur removal unit 1503 removes motion blur based on the foreground component and background component calculated in step S1004 and the flat portion foreground component calculated in step S1005. The pixel value of the foreground component image and the pixel value of the background component image are calculated. The separation blur removal unit 1503 supplies the foreground component image and the background component image from which motion blur has been removed to the synthesis unit 1504.
[0688]
In step S1007, the signal processing apparatus determines whether or not the process has been completed for the entire screen. If it is determined that the process has not been completed for the entire screen, the process returns to step S1004 to separate and move the foreground and the background. Repeat the blur removal process.
[0689]
If it is determined in step S1007 that the process has been completed for the entire screen, the process advances to step S1008, and the synthesis unit 1504 synthesizes the foreground component image and the background component image from which the background and motion blur have been removed, and the process is performed. finish.
[0690]
In this way, the signal processing apparatus can separate the foreground and the background and remove motion blur included in the foreground.
[0691]
With reference to the flowchart in FIG. 104, foreground and background separation and motion blur removal batch processing executed by the separation blur removal unit 1503 will be described.
[0692]
In step S1021, the modeling unit 1521 generates a model based on the processing unit supplied from the processing unit determination unit 1502, the motion vector supplied from the motion detection unit 102, and the position information thereof. The modeling unit 1521 supplies the generated model to the equation generation unit 1522.
[0693]
In step S1022, the equation generation unit 1522 generates simultaneous equations corresponding to the relationship between the pixel value, the foreground components, and the background components based on the model supplied from the modeling unit 1521.
[0694]
In step S1023, the equation generation unit 1522 sets the corresponding pixel value of the input image in the generated simultaneous equations.
[0695]
In step S1024, the equation generation unit 1522 determines whether all the pixel values are set in the simultaneous equations, and when it is determined that all the pixel values are not set, the process returns to step S1023, Repeat the setting process.
[0696]
If it is determined in step S1024 that all pixel values have been set, the equation generation unit 1522 supplies the simultaneous equations in which the pixel values are set to the calculation unit 1523, and the calculation unit 1523 sets the simultaneous values in which the pixel values are set. By calculating the equations, the foreground component and the background component are calculated, and the process ends.
[0697]
In this way, the separation blur removal unit 1503 can generate a foreground component image from which motion blur has been removed and a separated background component image based on the calculated foreground and background components.
[0698]
FIG. 105 is a block diagram showing still another configuration of the signal processing apparatus. Parts that are the same as those shown in FIG. 94 are given the same reference numerals, and descriptions thereof are omitted.
[0699]
The processing unit determination classifying unit 1601 receives the motion vector supplied from the motion detecting unit 102 and its position information, the region information supplied from the region specifying unit 103, and the foreground flat part position information supplied from the flat part extracting unit 1501. Based on this, the processing unit is generated, the pixels of the input image are classified, and the classified pixels are separated by the separation blur removal unit 1503, the motion blur removal unit 1602, the foreground component image restoration unit 1603, and the background component image restoration unit 1604. To any one of the above.
[0700]
The processing unit determination classifying unit 1601 corresponds to a flat part from pixels belonging to the foreground area among consecutive pixels starting from the pixels belonging to the uncovered background area and arranged in the moving direction to the pixels belonging to the covered background area. The foreground components are removed, and the pixels belonging to the mixed area and the pixels belonging to the foreground area from which the foreground components corresponding to the flat part of the foreground area are removed are supplied to the separation blur removal unit 1503 together with the corresponding processing units. .
[0701]
The processing unit determination classification unit 1601 supplies the foreground region flat portion image to the foreground component image restoration unit 1603.
[0702]
The processing unit determination classifying unit 1601 supplies the pixels, which belong to the foreground area and are sandwiched between the flat parts, from which the foreground components corresponding to the flat part are removed, together with the corresponding processing units, to the motion blur removing unit 1602.
[0703]
The processing unit determination classification unit 1601 supplies the pixels belonging to the background area to the background component image restoration unit 1604.
[0704]
The separation blur removal unit 1503 is a process similar to the process described with reference to the flowchart of FIG. 104, and the foreground component image and the separation corresponding to the pixels belonging to the foreground area or the pixels belonging to the mixed area are removed. The generated background component image is generated, the foreground component image from which motion blur is removed is supplied to the foreground component image restoration unit 1603, and the separated background component image is supplied to the background component image restoration unit 1604.
[0705]
Based on the processing unit supplied from the processing unit determination and classification unit 1601, the motion blur removal unit 1602 calculates the foreground components that belong to the foreground area and correspond to the pixels sandwiched between the flat portions, and the calculated foreground A foreground component image from which motion blur corresponding to the component is removed is generated. The motion blur removal unit 1602 supplies the generated foreground component image to the foreground component image restoration unit 1603.
[0706]
FIG. 106 is a block diagram showing a configuration of the motion blur removal unit 1602.
[0707]
The motion vector and its position information supplied from the motion detection unit 102 and the processing unit supplied from the processing unit determination and classification unit 1601 are supplied to the modeling unit 1621.
[0708]
The modeling unit 1621 generates a model based on the motion vector supplied from the motion detection unit 102 and its position information, and the processing unit supplied from the processing unit determination classification unit 1601, and the generated model is converted into an equation generation unit. 1622.
[0709]
The model supplied to the equation generation unit 1622 will be described with reference to FIGS.
[0710]
FIG. 107 is a model diagram in which pixel values corresponding to pixels belonging to the foreground area are expanded in the time direction.
[0711]
The processing unit determination / separation unit 601 removes the foreground components corresponding to the flat part from the pixels belonging to the foreground region by the same process as described with reference to FIG.
[0712]
For example, in the example shown in FIG. 107, when the expression (133) is established, the relationship between the expressions (134) to (138) indicates that the values of the foreground components F106 / v to F114 / v are equal. As shown in FIG. 108, the foreground components F106 / v to F114 / v are removed from the pixels belonging to the foreground area.
[0713]
C110 = C111 = C112 = C113 = C114 (133)
C110 = F106 / v + F107 / v + F108 / v + F109 / v + F110 / v (134)
C111 = F107 / v + F108 / v + F109 / v + F110 / v + F111 / v (135)
C112 = F108 / v + F109 / v + F110 / v + F111 / v + F112 / v (136)
C113 = F109 / v + F110 / v + F111 / v + F112 / v + F113 / v (137)
C114 = F110 / v + F111 / v + F112 / v + F113 / v + F114 / v (138)
[0714]
Similarly, foreground components F096 / v to F100 / v and foreground components F120 / v to F124 / v corresponding to other flat portions are removed from the pixels belonging to the foreground area.
[0715]
In this way, the pixels belonging to the foreground area from which the foreground components corresponding to the flat part are removed are supplied from the processing unit determination classifying unit 1601 to the motion blur removing unit 1602 together with the corresponding processing unit. Is done.
[0716]
Based on the processing unit, the modeling unit 1621 of the motion blur removal unit 1602 is sandwiched between flat parts, and the foreground components corresponding to the flat parts are removed, and the remaining foreground components A model for generating an expression corresponding to the relationship is generated.
[0717]
The modeling unit 1621 supplies the generated model to the equation generation unit 1622.
[0718]
Based on the model supplied from the modeling unit 1621, the equation generation unit 1622 is sandwiched between the flat portions, the foreground components corresponding to the flat portions are removed, and the remaining foreground components Generates an expression corresponding to the relation.
[0719]
For example, the relationship between the foreground components F101 / v to F105 / v and the pixel values is expressed by equations (139) to (147).
[0720]
Figure 0004596205
[0721]
In addition, the relationship between the foreground components F101 / v to F105 / v and the pixel values is expressed by equations (148) to (156).
[0722]
Figure 0004596205
[0723]
The equation generation unit 1622 applies the least square method to Equations (139) to (147) and Equations (148) to (156) in which pixel values are set, and Equations (157) and (158) are applied. An example normal equation is derived.
[0724]
[Expression 21]
Figure 0004596205
[0725]
[Expression 22]
Figure 0004596205
[0726]
The equation generation unit 1622 sets a pixel value in the generated equation and supplies the equation with the pixel value set to the arithmetic unit 1623.
[0727]
The calculation unit 1623 calculates a foreground component included in the foreground component image other than the foreground component included in the pixel belonging to the flat portion by applying a solution such as Cholesky decomposition to the normal equation in which the pixel value is set. To do. The calculation unit 1623 generates a foreground component image from which motion blur has been removed based on the calculated foreground component, and outputs the foreground component image from which motion blur has been removed.
[0728]
For example, when calculating the foreground components F101 / v to F105 / v and the foreground components F115 / v to F119 / v, the arithmetic unit 1623 obtains the foreground components F101 / v to F105 / v as shown in FIG. Pixel values F101 to F105 and pixel values F115 to F119 are calculated by multiplying the foreground components F115 / v to F119 / v by the motion amount v.
[0729]
The calculation unit 1623 generates, for example, a foreground component image from which motion blur is removed, which includes pixel values F101 to F105 and pixel values F115 to F119.
[0730]
With reference to the flowchart of FIG. 110, the motion blur removal processing by the signal processing apparatus having the configuration shown in FIG. 94 will be described.
[0731]
Since the processes in steps S1101 to S1103 are the same as the processes in steps S1001 to S1003 in FIG. 103, description thereof will be omitted.
[0732]
In step S1104, the processing unit determination classifying unit 1601 obtains the motion vector supplied from the motion detecting unit 102 and its position information, the region information supplied from the region specifying unit 103, and the foreground flatness supplied from the flat part extracting unit 1501. Based on the position information, the pixels of the input image are classified, and the classified pixels are any of the separation blur removal unit 1503, the motion blur removal unit 1602, the foreground component image restoration unit 1603, and the background component image restoration unit 1604. Supply to one.
[0733]
In step S1105, the separation blur removal unit 1503 starts from the pixels belonging to the foreground area from the pixels belonging to the foreground area among the continuous pixels starting from the pixels belonging to the uncovered background area and moving to the pixels belonging to the covered background area. Collective processing of foreground and background separation and motion blur removal is performed on the pixels belonging to the mixed area and the pixels belonging to the foreground area from which the foreground components corresponding to the flat portion of the image are removed. The details of the process in step S1105 are the same as the details of the process in step S1004 in FIG. 103, and a description thereof will be omitted.
[0734]
In step S1106, the separation blur removal unit 1503 calculates the pixel value of the foreground component image and the pixel value of the background component image from which motion blur has been removed, based on the calculated foreground component and background component. The separation blur removal unit 1503 supplies the foreground component image from which motion blur has been removed to the foreground component image restoration unit 1603 and also supplies the background component image to the background component image restoration unit 1604.
[0735]
In step S1107, the signal processing apparatus determines whether or not the processing for the mixed region and the foreground region is finished. If it is determined that the processing is not finished for the mixed region and the foreground region, the signal processing apparatus returns to step S1105 and returns to the foreground. Then, the process of background separation and motion blur removal is repeated.
[0736]
If it is determined in step S1107 that the processing has been completed for the mixed region and the foreground region, the process proceeds to step S1108, and the motion blur removal unit 1602 has flat portions located on both sides of the continuous pixels arranged in the motion direction. Motion blur removal processing is executed for the pixels belonging to the foreground area from which the foreground components corresponding to the flat portion have been removed from the pixels belonging to the foreground area. Details of the motion blur removal process will be described with reference to the flowchart of FIG.
[0737]
In step S1109, the motion blur removal unit 1602 calculates the pixel value of the foreground component image from which the motion blur has been removed based on the calculated foreground component. The motion blur removal unit 1602 supplies the foreground component image from which the motion blur has been removed to the foreground component image restoration unit 1603.
[0738]
In step S1110, the signal processing apparatus determines whether or not the process has been completed for the foreground area. If it is determined that the process has not been completed for the foreground area, the process returns to step S1108 to perform a motion blur removal process. repeat.
[0739]
If it is determined in step S1110 that the process has been completed for the foreground area, the procedure proceeds to step S1111.
[0740]
Note that the processing from step S1108 to step S1110 is executed in parallel with the processing from step S1105 to step S1107.
[0741]
In step S <b> 1111, the foreground component image restoration unit 1603 includes a flat part image supplied from the processing unit determination classification unit 1601, a foreground component image from which motion blur supplied from the separation blur removal unit 1503 has been removed, and a motion blur removal unit. Based on the foreground component image from which motion blur is removed supplied from 1602, the entire foreground component image from which motion blur has been removed is restored. The background component image restoration unit 1604 restores the entire background component image based on the background region image supplied from the processing unit determination classification unit 1601 and the separated background component image supplied from the separation blur removal unit 1503. Then, the process ends.
[0741]
In this way, the information processing apparatus having the configuration shown in FIG. 105 can remove motion blur from the foreground object.
[0743]
Next, the motion blur removal processing of the foreground component image corresponding to the processing unit by the motion blur removal unit 1602 corresponding to step S1108 in FIG. 110 will be described with reference to the flowchart in FIG.
[0744]
In step S1121, the modeling unit 1621 of the motion blur removal unit 1602 generates a model corresponding to the motion amount v and the processing unit. In step S1122, the equation generation unit 1622 generates an equation based on the generated model.
[0745]
In step S1123, the equation generation unit 1622 sets the pixel value of the foreground component image from which the foreground component corresponding to the flat portion is removed, in the generated equation.
In step S1124, the equation generation unit 1622 determines whether or not the pixel values of all the pixels corresponding to the processing unit have been set, and if the pixel values of all the pixels corresponding to the processing unit have not been set. If it is determined, the process returns to step S1123 to repeat the process of setting the pixel value in the equation.
[0746]
If it is determined in step S1124 that the pixel values of all the pixels in the processing unit have been set, the process proceeds to step S1125, and the calculation unit 1623 is based on the equation in which the pixel values supplied from the equation generation unit 1622 are set. Then, the foreground component from which motion blur is removed is calculated, and the process ends.
[0747]
In this manner, the motion blur removal unit 1602 can remove motion blur from the foreground component image including motion blur based on the motion amount v and the processing unit.
[0748]
The mixing ratio α has been described as the ratio of the background component included in the pixel value, but may be the ratio of the foreground component included in the pixel value.
[0749]
In addition, the direction of the foreground object has been described as being from left to right, but is not limited to that direction.
[0750]
In the above, the case where the image of the real space having the three-dimensional space and the time axis information is projected onto the time space having the two-dimensional space and the time axis information by using a video camera is taken as an example. In addition to this example, when the first information of more first dimensions is projected onto the second information of fewer second dimensions, distortion generated by the projection is corrected or significant It is possible to adapt to extracting information or synthesizing an image more naturally.
[0751]
The sensor is not limited to the CCD, and may be a solid-state image sensor, for example, a sensor such as BBD (Bucket Brigade Device), CID (Charge Injection Device), or CPD (Charge Priming Device). The sensor is not limited to a sensor arranged in a matrix, and may be a sensor in which detection elements are arranged in a line.
[0752]
As shown in FIG. 1, a recording medium recording a program for performing signal processing according to the present invention is distributed to provide a program to a user separately from a computer. Disk), optical disk 52 (including compact disk-read only memory (CD-ROM), DVD (digital versatile disk)), magneto-optical disk 53 (including MD (mini-disk)), or semiconductor memory 54 In addition to the package medium, the program is configured by a ROM 22 on which a program is recorded and a hard disk included in the storage unit 28 provided to the user in a state of being preinstalled in a computer.
[0753]
In the present specification, the step of describing the program recorded on the recording medium is not limited to the processing performed in chronological order according to the described order, but is not necessarily performed in chronological order. It also includes processes that are executed individually.
[0754]
【The invention's effect】
According to the present invention, Motion blur included in the blurred image data can be removed.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an embodiment of a signal processing apparatus according to the present invention.
FIG. 2 is a block diagram showing a signal processing device.
FIG. 3 is a diagram illustrating imaging by a sensor.
FIG. 4 is a diagram illustrating an arrangement of pixels.
FIG. 5 is a diagram illustrating the operation of a detection element.
FIG. 6 is a diagram illustrating an image obtained by imaging an object corresponding to a moving foreground and an object corresponding to a stationary background.
FIG. 7 is a diagram illustrating a background area, a foreground area, a mixed area, a covered background area, and an uncovered background area.
FIG. 8 is a model diagram in which pixel values of pixels arranged in a row adjacent to each other in an image obtained by capturing an object corresponding to a stationary foreground and an object corresponding to a stationary background are developed in the time direction; It is.
FIG. 9 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 10 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 11 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 12 is a diagram illustrating an example in which pixels in a foreground area, a background area, and a mixed area are extracted.
FIG. 13 is a diagram illustrating a correspondence between a pixel and a model in which pixel values are expanded in the time direction.
FIG. 14 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 15 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 16 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 17 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 18 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 19 is a flowchart illustrating processing for adjusting the amount of motion blur.
20 is a block diagram illustrating an example of a configuration of a region specifying unit 103. FIG.
FIG. 21 is a diagram illustrating an image when an object corresponding to the foreground is moving.
FIG. 22 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 23 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 24 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 25 is a diagram for explaining region determination conditions;
FIG. 26 is a diagram illustrating an example of a result of specifying a region by the region specifying unit 103;
FIG. 27 is a diagram illustrating an example of the result of specifying a region by the region specifying unit 103;
FIG. 28 is a flowchart illustrating an area specifying process.
29 is a block diagram illustrating another example of the configuration of the area specifying unit 103. FIG.
30 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided. FIG.
FIG. 31 is a diagram illustrating an example of a background image.
32 is a block diagram showing a configuration of a binary object image extraction unit 302. FIG.
FIG. 33 is a diagram illustrating calculation of a correlation value.
FIG. 34 is a diagram illustrating calculation of correlation values.
FIG. 35 is a diagram illustrating an example of a binary object image.
36 is a block diagram showing a configuration of a time change detection unit 303. FIG.
FIG. 37 is a diagram for explaining determination by an area determination unit 342;
38 is a diagram showing an example of determination by a time change detection unit 303. FIG.
FIG. 39 is a flowchart for describing region specifying processing by the region determining unit 103;
FIG. 40 is a flowchart illustrating details of a region determination process.
41 is a block diagram showing still another configuration of the area specifying unit 103. FIG.
42 is a block diagram illustrating a configuration of a robust unit 361. FIG.
43 is a diagram for explaining motion compensation by a motion compensation unit 381. FIG.
44 is a diagram illustrating motion compensation of the motion compensation unit 381. FIG.
FIG. 45 is a flowchart illustrating an area specifying process.
FIG. 46 is a flowchart illustrating details of robust processing.
47 is a block diagram illustrating an exemplary configuration of a mixture ratio calculation unit 104. FIG.
FIG. 48 is a diagram illustrating an example of an ideal mixing ratio α.
FIG. 49 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 50 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 51 is a diagram illustrating approximation using the correlation of foreground components.
FIG. 52 is a diagram illustrating the relationship between C, N, and P.
53 is a block diagram showing a configuration of an estimated mixture ratio processing unit 401. FIG.
FIG. 54 is a diagram illustrating an example of an estimated mixture ratio.
55 is a block diagram showing another configuration of the mixture ratio calculation unit 104. FIG.
FIG. 56 is a flowchart illustrating processing for calculating a mixture ratio.
FIG. 57 is a flowchart illustrating processing for calculating an estimated mixture ratio.
FIG. 58 is a diagram illustrating a straight line approximating the mixture ratio α.
FIG. 59 is a diagram illustrating a plane that approximates the mixture ratio α.
FIG. 60 is a diagram for explaining the correspondence of pixels in a plurality of frames when calculating the mixture ratio α.
61 is a block diagram illustrating another configuration of the mixture ratio estimation processing unit 401. FIG.
FIG. 62 is a diagram illustrating an example of an estimated mixture ratio.
FIG. 63 is a flowchart for describing processing for calculating a mixture ratio.
[Fig. 64] Fig. 64 is a flowchart for describing mixing ratio estimation processing using a model corresponding to a covered background region.
65 is a block diagram illustrating an example of a configuration of a foreground / background separator 105. FIG.
FIG. 66 is a diagram illustrating an input image, a foreground component image, and a background component image.
FIG. 67 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 68 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 69 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
70 is a block diagram illustrating an example of a configuration of a separation unit 601. FIG.
FIG. 71 is a diagram illustrating an example of a separated foreground component image and background component image.
FIG. 72 is a flowchart for describing foreground and background separation processing;
73 is a block diagram showing a configuration of a motion blur adjusting unit 106. FIG.
74 is a block diagram showing a configuration of a motion blur removal unit 803. FIG.
FIG. 75 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 76 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 77 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 78 is a diagram illustrating an example of pixels from which motion blur has been removed.
FIG. 79 is a diagram illustrating an example of a pixel from which motion blur has been removed.
FIG. 80 is a diagram illustrating an example of a pixel to which motion blur is added.
FIG. 81 is a diagram for describing background component correction processing;
FIG. 82 is an image of a black square that is stationary.
FIG. 83 is an image captured by moving a black square.
84 is a diagram illustrating an example of a result of processing performed by the motion blur adjustment unit 106. FIG.
FIG. 85 is a flowchart illustrating processing for adjusting the amount of motion blur.
FIG. 86 is a flowchart illustrating a process for removing motion blur from a foreground component image.
FIG. 87 is a block diagram illustrating another configuration of the function of the signal processing device.
88 is a diagram illustrating a configuration of a synthesis unit 1001. FIG.
FIG. 89 is a block diagram showing still another configuration of the function of the signal processing device.
90 is a block diagram showing a configuration of a mixture ratio calculation unit 1101. FIG.
FIG. 91 is a block diagram illustrating a configuration of a foreground / background separation unit 1102;
FIG. 92 is a block diagram showing still another configuration of the function of the signal processing device.
FIG. 93 is a diagram illustrating a configuration of a combining unit 1201. FIG.
FIG. 94 is a block diagram showing still another configuration of the signal processing apparatus.
95 is a block diagram showing a configuration of a separation blur removal unit 1503. FIG.
Fig. 96 is a diagram for describing a processing unit and a model corresponding to the processing unit.
Fig. 97 is a diagram for describing a processing unit and a model corresponding to the processing unit.
Fig. 98 is a diagram for describing a processing unit and a model corresponding to the processing unit.
[Fig. 99] Fig. 99 is a diagram for describing a processing unit and a model corresponding to the processing unit.
Fig. 100 is a diagram for describing calculation of a pixel value.
Fig. 101 is a diagram illustrating an example of an input image.
FIG. 102 is a diagram illustrating an example of a processing result.
FIG. 103 is a flowchart for describing motion blur removal processing;
FIG. 104 is a flowchart for describing a collective process of foreground and background separation and motion blur removal.
Fig. 105 is a block diagram illustrating still another configuration of the signal processing device.
106 is a block diagram showing a configuration of a motion blur removal unit 1602. FIG.
FIG. 107 is a diagram for explaining a model supplied to the equation generation unit 1622;
FIG. 108 is a diagram for explaining a model supplied to the equation generation unit 1622;
FIG. 109 is a diagram for describing calculation of a pixel value.
FIG. 110 is a flowchart for describing motion blur removal processing;
FIG. 111 is a flowchart illustrating a process for removing motion blur from a foreground component image.
[Explanation of symbols]
21 CPU, 22 ROM, 23 RAM, 26 input section, 27 output section, 28 storage section, 29 communication section, 51 magnetic disk, 52 optical disk, 53 magneto-optical disk, 54 semiconductor memory, 101 object extraction section, 102 motion detection section , 103 area specifying unit, 104 mixing ratio calculation unit, 105 foreground / background separation unit, 106 motion blur adjustment unit, 107 selection unit, 201 frame memory, 202-1 to 202-4 static motion determination unit, 203-1 to 203- 3 area determination unit, 204 determination flag storage frame memory, 205 composition unit, 206 determination flag storage frame memory, 301 background image generation unit, 302 binary object image extraction unit, 303 time change detection unit, 321 correlation value calculation unit, 322 Threshold processing unit, 341 frame memory, 342 region determination unit, 3 1 Robust Unit, 381 Motion Compensator, 382 Switch, 383-1 to 383-N Frame Memory, 384-1 to 384-N Weight Unit, 385 Accumulator, 401 Estimated Mixture Ratio Processor, 402 Estimated Mixture Ratio Processor , 403 mixing ratio determination unit, 421 frame memory, 422 frame memory, 423 mixing ratio calculation unit, 441 selection unit, 442 estimation mixing ratio processing unit, 443 estimation mixing ratio processing unit, 444 selection unit, 501 delay circuit, 502 addition Unit, 503 arithmetic unit, 601 separation unit, 602 switch, 603 synthesis unit, 604 switch, 605 synthesis unit, 621 frame memory, 622 separation processing block, 623 frame memory, 631 uncovered region processing unit, 632 covered region processing unit, 633 synthesis unit, 634 synthesis unit, 8 DESCRIPTION OF SYMBOLS 1 Flat part extraction part, 802 processing unit determination part, 803 motion blur removal part, 804 motion blur addition part, 805 selection part, 821 modeling part, 822 equation generation part, 823 addition part, 824 arithmetic part, 825 composition part , 1001 synthesis unit, 1021 background component generation unit, 1022 mixed region image synthesis unit, 1023 image synthesis unit, 1101 mixing ratio calculation unit, 1102 foreground / background separation unit, 1121 selection unit, 1201 synthesis unit, 1221 selection unit, 1501 flat unit Extraction unit, 1502 processing unit determination unit, 1503 separation blur removal unit, 1504 synthesis unit, 1521 modeling unit, 1522 equation generation unit, 1523 calculation unit, 1601 processing unit determination classification unit, 1602 motion blur removal unit, 1603 foreground component image Restoration unit, 1604 Background component image restoration unit, 1621 Le unit, 1622 equation generator, 1623 arithmetic unit

Claims (6)

時間積分効果を有する所定数の画素を有する撮像素子によって取得された所定数の画素データからなる画像データを処理する画像処理装置において、
時間積分効果により前記画像データに形成された、前景オブジェクトを構成する前景オブジェクト成分からなる前景領域、および背景オブジェクトを構成する背景オブジェクト成分からなる背景領域により構成される非混合領域、並びに前記前景オブジェクト成分および前記背景オブジェクト成分が混合されてなる混合領域を特定する領域情報、並びに前記画像データに基づいて、前記前景領域における前記画素データであって、隣接する前記画素データとその値がほぼ等しい前記画素データからなる均等部を検出する均等部検出手段と、
前記領域情報および前記均等部の位置に基づいて、前記均等部の前記画素データ以外の画素データであって、1つの直線上の、前記混合領域または前記前景領域に属する前記画素データに対応し、複数の前記前景オブジェクト成分からなる処理単位を決定する処理単位決定手段と、
前記処理単位および前記前景オブジェクトの動きベクトルに基づいて、前記前景領域と前記混合領域からなる領域の時間方向の分割数と画素ごとの前記前景オブジェクト成分の数を決定して、前記領域における前記画素データと前記前景オブジェクト成分との対応を指定するモデルを生成するモデル生成手段と、
前記モデルに基づいて、前記処理単位の前記画素データと、前記処理単位に含まれる前景オブジェクト成分との関係を示す方程式を生成する方程式生成手段と、
前記方程式を解くことで、前記処理単位の前記画素データに含まれる前景オブジェクト成分を演算する演算手段と、
前記前景オブジェクト成分の演算結果、および検出された前記均等部に基づいて、前記前景領域に生じている動きボケを除去する動きボケ除去手段と
を含むことを特徴とする画像処理装置。
In an image processing apparatus for processing image data composed of a predetermined number of pixel data acquired by an imaging device having a predetermined number of pixels having a time integration effect,
The foreground area formed by the foreground object component that forms the foreground object, the unmixed region that is formed by the background object component that forms the background object, and the foreground object formed in the image data by the time integration effect The pixel data in the foreground area based on area information for specifying a mixed area obtained by mixing a component and the background object component, and the image data, and the value of the pixel data in the foreground area is substantially equal to the pixel data. An equal part detecting means for detecting an equal part composed of pixel data;
Based on the region information and the position of the equivalent portion, pixel data other than the pixel data of the equivalent portion, corresponding to the pixel data belonging to the mixed region or the foreground region on one straight line, Processing unit determining means for determining a processing unit comprising a plurality of foreground object components;
Based on the processing unit and the motion vector of the foreground object, the number of divisions in the time direction of the area composed of the foreground area and the mixed area and the number of the foreground object components for each pixel are determined, and the pixels in the area Model generation means for generating a model for designating correspondence between data and the foreground object component;
Equation generating means for generating an equation indicating a relationship between the pixel data of the processing unit and a foreground object component included in the processing unit based on the model;
An arithmetic means for calculating a foreground object component included in the pixel data of the processing unit by solving the equation;
An image processing apparatus comprising: motion blur removing means for removing motion blur occurring in the foreground area based on the calculation result of the foreground object component and the detected equal part.
前記前景領域、前記背景領域、または前記混合領域を特定する領域特定手段をさらに含む
ことを特徴とする請求項1に記載の画像処理装置。
The image processing apparatus according to claim 1, further comprising an area specifying unit that specifies the foreground area, the background area, or the mixed area.
前記均等部検出手段は、前記画素データの差分としきい値とを比較することにより、前記均等部を検出する
ことを特徴とする請求項1に記載の画像処理装置。
The image processing apparatus according to claim 1, wherein the equal part detection unit detects the equal part by comparing a difference between the pixel data and a threshold value.
前記均等部検出手段は、前記前景オブジェクトの動き量に対応する画素の数以上の数の隣接する前記画素データからなる均等部を検出する
ことを特徴とする請求項1に記載の画像処理装置。
The image processing apparatus according to claim 1, wherein the equal part detection unit detects an equal part including the number of adjacent pixel data equal to or greater than the number of pixels corresponding to the amount of motion of the foreground object.
時間積分効果を有する所定数の画素を有する撮像素子によって取得された所定数の画素データからなる画像データを処理する画像処理装置の画像処理方法において、
前記画像処理装置の均等部検出手段が、時間積分効果により前記画像データに形成された、前景オブジェクトを構成する前景オブジェクト成分からなる前景領域、および背景オブジェクトを構成する背景オブジェクト成分からなる背景領域により構成される非混合領域、並びに前記前景オブジェクト成分および前記背景オブジェクト成分が混合されてなる混合領域を特定する領域情報、並びに前記画像データに基づいて、前記前景領域における前記画素データであって、隣接する前記画素データとその値がほぼ等しい前記画素データからなる均等部を検出する均等部検出ステップと、
前記画像処理装置の処理単位決定手段が、前記領域情報および前記均等部の位置に基づいて、前記均等部の前記画素データ以外の画素データであって、1つの直線上の、前記混合領域または前記前景領域に属する前記画素データに対応し、複数の前記前景オブジェクト成分からなる処理単位を決定する処理単位決定ステップと、
前記画像処理装置のモデル生成手段が、前記処理単位および前記前景オブジェクトの動きベクトルに基づいて、前記前景領域と前記混合領域からなる領域の時間方向の分割数と画素ごとの前記前景オブジェクト成分の数を決定して、前記領域における前記画素データと前記前景オブジェクト成分との対応を指定するモデルを生成するモデル生成ステップと、
前記画像処理装置の方程式生成手段が、前記モデルに基づいて、前記処理単位の前記画素データと、前記処理単位に含まれる前景オブジェクト成分との関係を示す方程式を生成する方程式生成ステップと、
前記画像処理装置の演算手段が、前記方程式を解くことで、前記処理単位の前記画素データに含まれる前景オブジェクト成分を演算する演算ステップと、
前記画像処理装置の動きボケ除去手段が、前記前景オブジェクト成分の演算結果、および検出された前記均等部に基づいて、前記前景領域に生じている動きボケを除去する動きボケ除去ステップと
を含むことを特徴とする画像処理方法。
In an image processing method of an image processing apparatus for processing image data composed of a predetermined number of pixel data acquired by an imaging device having a predetermined number of pixels having a time integration effect,
The equal part detection means of the image processing device includes a foreground region formed of a foreground object component forming a foreground object and a background region formed of a background object component forming a background object, formed in the image data by a time integration effect. The pixel data in the foreground area based on the image data based on the non-mixed area configured, area information for specifying the mixed area formed by mixing the foreground object component and the background object component, and the image data. An equal part detecting step for detecting an equal part composed of the pixel data and the pixel data whose value is substantially equal to the pixel data;
The processing unit determining means of the image processing device is pixel data other than the pixel data of the equal portion based on the region information and the position of the equal portion, and the mixed region or the A processing unit determination step for determining a processing unit corresponding to the pixel data belonging to the foreground region and including a plurality of the foreground object components;
The model generation means of the image processing device, based on the unit of processing and the motion vector of the foreground object, the number of divisions in the time direction of the area consisting of the foreground area and the mixed area and the number of the foreground object components for each pixel A model generation step for generating a model for designating a correspondence between the pixel data in the region and the foreground object component;
An equation generating step for generating an equation indicating a relationship between the pixel data of the processing unit and a foreground object component included in the processing unit based on the model;
A calculation step of calculating a foreground object component included in the pixel data of the processing unit by calculating means of the image processing apparatus by solving the equation;
A motion blur removing unit that removes motion blur occurring in the foreground area based on the calculation result of the foreground object component and the detected equal part; An image processing method characterized by the above.
時間積分効果を有する所定数の画素を有する撮像素子によって取得された所定数の画素データからなる画像データを処理するコンピュータに、
時間積分効果により前記画像データに形成された、前景オブジェクトを構成する前景オブジェクト成分からなる前景領域、および背景オブジェクトを構成する背景オブジェクト成分からなる背景領域により構成される非混合領域、並びに前記前景オブジェクト成分および前記背景オブジェクト成分が混合されてなる混合領域を特定する領域情報、並びに前記画像データに基づいて、前記前景領域における前記画素データであって、隣接する前記画素データとその値がほぼ等しい前記画素データからなる均等部を検出する均等部検出ステップと、
前記領域情報および前記均等部の位置に基づいて、前記均等部の前記画素データ以外の画素データであって、1つの直線上の、前記混合領域または前記前景領域に属する前記画素データに対応し、複数の前記前景オブジェクト成分からなる処理単位を決定する処理単位決定ステップと、
前記処理単位および前記前景オブジェクトの動きベクトルに基づいて、前記前景領域と前記混合領域からなる領域の時間方向の分割数と画素ごとの前記前景オブジェクト成分の数を決定して、前記領域における前記画素データと前記前景オブジェクト成分との対応を指定するモデルを生成するモデル生成ステップと、
前記モデルに基づいて、前記処理単位の前記画素データと、前記処理単位に含まれる前景オブジェクト成分との関係を示す方程式を生成する方程式生成ステップと、
前記方程式を解くことで、前記処理単位の前記画素データに含まれる前景オブジェクト成分を演算する演算ステップと、
前記前景オブジェクト成分の演算結果、および検出された前記均等部に基づいて、前記前景領域に生じている動きボケを除去する動きボケ除去ステップと
を実行させるプログラム。
In a computer that processes image data consisting of a predetermined number of pixel data acquired by an imaging device having a predetermined number of pixels having a time integration effect,
The foreground area formed by the foreground object component that forms the foreground object, the unmixed region that is formed by the background object component that forms the background object, and the foreground object formed in the image data by the time integration effect The pixel data in the foreground area based on area information for specifying a mixed area obtained by mixing a component and the background object component, and the image data, and the value of the pixel data in the foreground area is substantially equal to the pixel data. An equal part detection step for detecting an equal part composed of pixel data;
Based on the region information and the position of the equivalent portion, pixel data other than the pixel data of the equivalent portion, corresponding to the pixel data belonging to the mixed region or the foreground region on one straight line, A processing unit determining step for determining a processing unit comprising a plurality of the foreground object components;
Based on the processing unit and the motion vector of the foreground object, the number of divisions in the time direction of the area composed of the foreground area and the mixed area and the number of the foreground object components for each pixel are determined, and the pixels in the area A model generation step for generating a model for specifying correspondence between data and the foreground object component;
An equation generating step for generating an equation indicating a relationship between the pixel data of the processing unit and a foreground object component included in the processing unit based on the model;
A calculation step of calculating a foreground object component included in the pixel data of the processing unit by solving the equation;
A motion blur removing step of removing motion blur occurring in the foreground area based on the calculation result of the foreground object component and the detected equal part.
JP2001111438A 2001-04-10 2001-04-10 Image processing apparatus and method, and program Expired - Fee Related JP4596205B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001111438A JP4596205B2 (en) 2001-04-10 2001-04-10 Image processing apparatus and method, and program
US10/297,632 US8134613B2 (en) 2001-04-10 2002-04-01 Image processing apparatus and method, and image pickup apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001111438A JP4596205B2 (en) 2001-04-10 2001-04-10 Image processing apparatus and method, and program

Publications (3)

Publication Number Publication Date
JP2002312783A JP2002312783A (en) 2002-10-25
JP2002312783A5 JP2002312783A5 (en) 2008-04-24
JP4596205B2 true JP4596205B2 (en) 2010-12-08

Family

ID=18963040

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001111438A Expired - Fee Related JP4596205B2 (en) 2001-04-10 2001-04-10 Image processing apparatus and method, and program

Country Status (1)

Country Link
JP (1) JP4596205B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4441846B2 (en) * 2003-02-28 2010-03-31 ソニー株式会社 Image processing apparatus and method, recording medium, and program
KR101851896B1 (en) * 2017-05-10 2018-06-08 중앙대학교 산학협력단 Method and apparatus for video stabilization using feature based particle keypoints
CN112985263B (en) * 2021-02-09 2022-09-23 中国科学院上海微系统与信息技术研究所 Method, device and equipment for detecting geometrical parameters of bow net

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000030040A (en) * 1998-07-14 2000-01-28 Canon Inc Image processor and computer readable recording medium

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2280812B (en) * 1993-08-05 1997-07-30 Sony Uk Ltd Image enhancement
JPH08111810A (en) * 1994-10-07 1996-04-30 Canon Inc Image pickup device with shake correction function and method for correcting shake of image pickup device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000030040A (en) * 1998-07-14 2000-01-28 Canon Inc Image processor and computer readable recording medium

Also Published As

Publication number Publication date
JP2002312783A (en) 2002-10-25

Similar Documents

Publication Publication Date Title
JP4596202B2 (en) Image processing apparatus and method, and recording medium
JP4729812B2 (en) Image processing apparatus and method, recording medium, and program
JP4596220B2 (en) Image processing apparatus and method, recording medium, and program
JP4596222B2 (en) Image processing apparatus and method, recording medium, and program
JP4596224B2 (en) Image processing apparatus and method, recording medium, and program
JP4106874B2 (en) Image processing apparatus and method, and recording medium
JP4596221B2 (en) Image processing apparatus and method, recording medium, and program
JP4596226B2 (en) Image processing apparatus and method, recording medium, and program
JP4596203B2 (en) Image processing apparatus and method, recording medium, and program
JP4674408B2 (en) Image processing apparatus and method, recording medium, and program
JP4596223B2 (en) Image processing apparatus and method, recording medium, and program
JP4596219B2 (en) Image processing apparatus and method, recording medium, and program
JP4840630B2 (en) Image processing apparatus and method, recording medium, and program
JP4596214B2 (en) Image processing apparatus and method, recording medium, and program
JP4596215B2 (en) Image processing apparatus and method, recording medium, and program
JP4150949B2 (en) Image processing apparatus and method, recording medium, and program
JP4596217B2 (en) Image processing apparatus and method, recording medium, and program
JP4596209B2 (en) Image processing apparatus and method, recording medium, and program
JP4596205B2 (en) Image processing apparatus and method, and program
JP4596218B2 (en) Image processing apparatus and method, recording medium, and program
JP4596225B2 (en) Image processing apparatus and method, recording medium, and program
KR100895744B1 (en) Image processing apparatus, method and recording medium, and image pickup apparatus
JP4325252B2 (en) Image processing apparatus and method, recording medium, and program
JP4333183B2 (en) Image processing apparatus and method, recording medium, and program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080307

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100826

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100908

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees