JP4596211B2 - Image processing apparatus and method, recording medium, and program - Google Patents
Image processing apparatus and method, recording medium, and program Download PDFInfo
- Publication number
- JP4596211B2 JP4596211B2 JP2001181394A JP2001181394A JP4596211B2 JP 4596211 B2 JP4596211 B2 JP 4596211B2 JP 2001181394 A JP2001181394 A JP 2001181394A JP 2001181394 A JP2001181394 A JP 2001181394A JP 4596211 B2 JP4596211 B2 JP 4596211B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- image
- pixel
- background
- foreground
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Processing (AREA)
- Picture Signal Circuits (AREA)
- Studio Circuits (AREA)
- Closed-Circuit Television Systems (AREA)
- Image Analysis (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、画像処理装置および方法、記録媒体、並びにプログラムに関し、特に、センサにより検出した信号と現実世界との違いを考慮した画像処理装置および方法、記録媒体、並びにプログラムに関する。
【0002】
【従来の技術】
入力画像を基に、より高解像度の画像を生成する処理の1つとして、クラス分類適応処理がある。クラス分類適応処理の例として、空間方向に、より高解像度の画像を生成する処理で使用される係数を予め生成し、生成した係数を基に、空間方向に、より高解像度の画像を生成する処理があげられる。
【0003】
図1は、SD(Standard Definition(標準精細度))画像からHD(High Definition(高精細度))画像を生成するクラス分類適応処理において使用される係数を生成する、従来の画像処理装置の構成を示すブロック図である。
【0004】
フレームメモリ11は、HD画像である入力画像を、フレーム単位で記憶する。
フレームメモリ11は、記憶しているHD画像を加重平均部12および対応画素取得部16に供給する。
【0005】
加重平均部12は、フレームメモリ11に記憶されているHD画像を4分の1加重平均して、SD画像を生成し、生成したSD画像をフレームメモリ13に供給する。
【0006】
フレームメモリ13は、加重平均部12から供給されたSD画像をフレーム単位で記憶し、記憶しているSD画像をクラス分類部14および予測タップ取得部15に供給する。
【0007】
クラス分類部14は、クラスタップ取得部21および波形分類部22で構成され、フレームメモリ13に記憶されているSD画像の、注目している画素である注目画素をクラス分類する。クラスタップ取得部21は、フレームメモリ13から、注目画素に対応するSD画像の画素である、所定の数のクラスタップを取得し、取得したクラスタップを波形分類部22に供給する。
【0008】
図2は、クラスタップ取得部21が取得するクラスタップを説明する図である。クラスタップ取得部21は、図2に示すように、所定の位置の11個のクラスタップを取得する。
【0009】
波形分類部22は、クラスタップを基に、注目画素を複数のクラスのうちの1つのクラスに分類し、分類されたクラスに対応するクラス番号を予測タップ取得部15に供給する。波形分類部22は、11個のクラスタップを基に、注目画素を、2048のクラスのうちの1つのクラスに分類する。
【0010】
予測タップ取得部15は、クラス番号を基に、フレームメモリ13から分類されたクラスに対応する、SD画像の画素である、所定の数の予測タップを取得し、取得した予測タップおよびクラス番号を対応画素取得部16に供給する。
【0011】
図3は、予測タップ取得部15が取得する予測タップを説明する図である。予測タップ取得部15は、図3に示すように、所定の位置の9個の予測タップを取得する。
【0012】
対応画素取得部16は、予測タップおよびクラス番号を基に、フレームメモリ11から、予測すべき画素値に対応するHD画像の画素を取得し、予測タップ、クラス番号、および取得した予測すべき画素値に対応するHD画像の画素を正規方程式生成部17に供給する。
【0013】
正規方程式生成部17は、予測タップ、クラス番号、および取得した予測すべき画素値を基に、各クラスに対応し、予測タップおよび予測すべき画素値の関係に対応する正規方程式を生成し、各クラスに対応する、生成した正規方程式を係数計算部18に供給する。
【0014】
係数計算部18は、正規方程式生成部17から供給された正規方程式を解いて、各クラスに対応する係数セットを計算し、クラス番号と共に、計算した係数セットを係数セットメモリ19に供給する。
【0015】
係数セットメモリ19は、クラス番号を基に、算出された係数セットをクラスに対応させて記憶する。
【0016】
図4は、クラス分類適応処理の概略を説明する図である。クラス分類適応処理において、HD画像である教師画像から、4分の1加重平均の処理により、対応するSD画像を生成する。生成されたSD画像は、生徒画像と称する。
【0017】
次に、HD画像である教師画像、および対応するSD画像である生徒画像を基に、SD画像からHD画像を生成するための係数セットが生成される。係数セットは、線形予測などにより、SD画像からHD画像を生成するための係数で構成される。
【0018】
このように生成された係数セットおよびSD画像から、線形予測などにより、4倍密画像が生成される。係数セットおよび入力画像から、より高密度な画像などを生成する処理をマッピングとも称する。
【0019】
生成された4倍密画像、および対応するHD画像を基に、SNRの比較、または目視による定性評価が行われる。
【0020】
特定の教師画像、および対応する生徒画像から生成された係数セットは、特定の教師画像、および対応する生徒画像のセルフの係数セットと称する。セルフの係数セットを使用したマッピングは、セルフマッピングと称する。複数の他の教師画像、および対応する生徒画像から生成された係数セットは、クロスの係数セットと称する。
【0021】
一方、静止している所定の背景の前で移動する前景である物体をビデオカメラで撮像して得られる画像には、物体の移動速度が比較的速い場合、動きボケが生じ、背景と前景の混ざり合いが生ずる。
【0022】
従来のクラス分類適応処理においては、図5に示すように、前景、背景、並びに前景および背景の混ざり合いが生じている部分の全てに対して、以上のような学習の処理により、1つの係数セットが生成され、この係数セットを基に、マッピングの処理が実行される。
【0023】
図6のフローチャートを参照して、SD画像からHD画像を生成する処理において使用される係数を生成する、従来の学習の処理を説明する。ステップS11において、画像処理装置は、生徒画像に未処理の画素があるか否かを判定し、生徒画像に未処理の画素があると判定された場合、ステップS12に進み、ラスタースキャン順に、生徒画像から注目画素を取得する。
【0024】
ステップS13において、クラス分類部14のクラスタップ取得部21は、フレームメモリ13に記憶されている生徒画像から、注目画素に対応するクラスタップを取得する。ステップS14において、クラス分類部14の波形分類部22は、クラスタップを基に、注目画素をクラス分類する。ステップS15において、予測タップ取得部15は、分類されたクラスを基に、フレームメモリ13に記憶されている生徒画像から、注目画素に対応する予測タップを取得する。
【0025】
ステップS16において、対応画素取得部16は、分類されたクラスを基に、フレームメモリ11に記憶されている教師画像から、予測すべき画素値に対応する画素を取得する。
【0026】
ステップS17において、正規方程式生成部17は、分類されたクラスを基に、クラス毎の行列に、予測タップおよび予測すべき画素値に対応する画素の画素値を足し込み、ステップS11に戻り、画像処理装置は、未処理の画素があるか否かの判定を繰り返す。予測タップおよび予測すべき画素値に対応する画素の画素値を足し込まれるクラス毎の行列は、クラス毎の係数を計算するための正規方程式に対応する。
【0027】
ステップS11において、生徒画像に未処理の画素がないと判定された場合、ステップS18に進み、正規方程式生成部17は、予測タップおよび予測すべき画素値に対応する画素の画素値が設定された、クラス毎の行列を係数計算部18に供給する。係数計算部18は、予測タップおよび予測すべき画素値に対応する画素の画素値が設定された、クラス毎の行列を解いて、クラス毎の係数セットを計算する。
【0028】
ステップS19において、係数計算部18は、計算されたクラス毎の係数を係数セットメモリ19に出力する。係数セットメモリ19は、クラス毎に係数セットを記憶し、処理は終了する。
【0029】
図7は、クラス分類適応処理により、SD画像からHD画像を生成する従来の画像処理装置の構成を示すブロック図である。
【0030】
フレームメモリ31は、SD画像である入力画像を、フレーム単位で記憶する。
フレームメモリ31は、記憶しているSD画像をマッピング部32に供給する。
【0031】
マッピング部32に入力されたSD画像は、クラス分類部41および予測タップ取得部42に供給される。
【0032】
クラス分類部41は、クラスタップ取得部51および波形分類部52で構成され、フレームメモリ31に記憶されているSD画像の、注目している画素である、注目画素をクラス分類する。クラスタップ取得部51は、フレームメモリ31から注目画素に対応する、所定の数のクラスタップを取得し、取得したクラスタップを波形分類部52に供給する。
【0033】
波形分類部52は、クラスタップを基に、所定の数のクラスのうちの、1つのクラスに注目画素を分類し、分類されたクラスに対応するクラス番号を予測タップ取得部42に供給する。
【0034】
予測タップ取得部42は、クラス番号を基に、フレームメモリ31に記憶されている入力画像から、分類されたクラスに対応する、所定の数の予測タップを取得し、取得した予測タップおよびクラス番号を予測演算部43に供給する。
【0035】
予測演算部43は、クラス番号を基に、係数セットメモリ33に記憶されている係数セットから、クラスに対応する係数セットを取得する。予測演算部43は、クラスに対応する係数セット、および予測タップを基に、線形予測により予測画像の画素値を予測する。予測演算部43は、予測した画素値をフレームメモリ34に供給する。
【0036】
フレームメモリ34は、予測演算部43から供給された予測された画素値を記憶し、予測された画素値が設定されたHD画像を出力する。
【0037】
図8は、入力画像の画素値、およびクラス分類適応処理により生成された出力画像の画素値を示す図である。図8に示すように、クラス分類適応処理により生成される画像は、SD画像の帯域制限で失われた波形を含む。その意味で、クラス分類適応処理による、より高解像度の画像の生成の処理は、解像度を創造していると言える。
【0038】
図9のフローチャートを参照して、クラス分類適応処理による解像度創造の処理を実行する画像処理装置による、SD画像からHD画像を生成する、従来の画像の創造の処理を説明する。
【0039】
ステップS31において、画像処理装置は、入力画像に未処理の画素があるか否かを判定し、入力画像に未処理の画素があると判定された場合、ステップS32に進み、マッピング部32は、係数セットメモリ33に記憶されている係数セットを取得する。ステップS33において、画像処理装置は、ラスタースキャン順に、入力画像から注目画素を取得する。
【0040】
ステップS34において、クラス分類部41のクラスタップ取得部51は、フレームメモリ31に記憶されている入力画像から、注目画素に対応するクラスタップを取得する。ステップS35において、クラス分類部41の波形分類部52は、クラスタップを基に、注目画素を1つのクラスにクラス分類する。
【0041】
ステップS36において、予測タップ取得部42は、分類されたクラスを基に、フレームメモリ31に記憶されている入力画像から、注目画素に対応する予測タップを取得する。
【0042】
ステップS37において、予測演算部43は、分類されたクラスに対応する係数セット、および予測タップを基に、線形予測により、予測画像の画素値を予測する。
【0043】
ステップS38において、予測演算部43は、予測された画素値をフレームメモリ34に出力する。フレームメモリ34は、予測演算部43から供給された画素値を記憶する。手続きは、ステップS31に戻り、未処理の画素があるか否かの判定を繰り返す。
【0044】
ステップS31において、入力画像に未処理の画素がないと判定された場合、ステップS39に進み、フレームメモリ34は、予測値が設定された、記憶している予測画像を出力して、処理は終了する。
【0045】
また、入力画像をより解像度感を強調した画像に変換するため、エッジ強調の処理が利用される。エッジ強調の処理においても、以上で説明したクラス分類適応処理と同様に、同一の処理が画面全体に対して実行される。
【0046】
【発明が解決しようとする課題】
静止している背景の前で物体が移動するとき、移動する物体の画像自身の混ざり合いによる動きボケのみならず、背景の画像と移動する物体の画像との混ざり合いが生じる。従来、背景の画像と移動する物体の画像との混ざり合いに対応して画像を処理することは、考えられていなかった。
【0047】
本発明はこのような状況に鑑みてなされたものであり、背景の画像と移動する物体の画像との混ざり合いに対応して画像を処理することができるようにすることを目的とする。
【0048】
【課題を解決するための手段】
本発明の画像処理装置は、入力画像の画素ごとの、所定フレームと、所定フレームの1つ前のフレームとの間の動きの有無、および所定フレームと、所定フレームの1つ後のフレームとの間の動きの有無に基づいて、画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前景オブジェクト成分と背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定手段と、領域情報により、入力画像の画素が混合領域であると特定されている場合、混合領域の画素における前景オブジェクト成分と背景オブジェクト成分の混合の割合を示す混合比を基に、混合領域を、前景オブジェクト成分からなる混合前景領域と、背景オブジェクト成分からなる混合背景領域とに分離する分離手段と、前景領域、背景領域、混合前景領域、および混合背景領域毎に、クラス分類適応処理を実行することにより、出力画像を生成する処理手段とを備え、処理手段は、前景領域、背景領域、混合前景領域、および混合背景領域毎に、入力画像の画素を、順次、注目画素とし、入力画像から求められる高解像度の予測画像における、注目画素に対応する所定数の画素である予測タップを構成する画素と乗算される予測係数のセットを取得し、入力画像から、注目画素を含む所定数の画素であるクラスタップを取得し、クラスタップに基づいて、注目画素を複数のクラスのうちのいずれかに分類し、分類されたクラスを基に、注目画素に対応する予測タップを取得し、予測タップを構成する画素と予測係数の線形結合演算を行うことで、予測画像における画素の画素値を求めるクラス分類適応処理を実行し、前景領域、背景領域、混合前景領域、および混合背景領域毎に求められた画素値を合成することで、出力画像を生成する。
【0049】
領域特定手段は、入力画像の画素ごとの、所定フレームと、所定フレームの1つ前のフレームとの間の動きの有無、および所定フレームと、所定フレームの1つ後のフレームとの間の動きの有無に基づいて、混合領域において、前景オブジェクトの動き方向先端部側に形成されるカバードバックグラウンド領域および前景オブジェクトの動き方向後端部側に形成されるアンカバードバックグラウンド領域をさらに特定し、その特定結果を示す領域情報を生成し、分離手段は、領域情報により、入力画像の画素がカバードバックグラウンド領域であると特定されている場合、カバードバックグラウンド領域の画素における前景オブジェクト成分と背景オブジェクト成分の混合の割合を示す混合比を基に、カバードバックグラウンド領域を、前景オブジェクト成分からなるカバードバックグラウンド前景領域と、背景オブジェクト成分からなるカバードバックグラウンド背景領域とに分離するとともに、入力画像の画素がアンカバードバックグラウンド領域であると特定されている場合、アンカバードバックグラウンド領域の画素における前景オブジェクト成分と背景オブジェクト成分の混合の割合を示す混合比を基に、アンカバードバックグラウンド領域を、前景オブジェクト成分からなるアンカバードバックグラウンド前景領域と、背景オブジェクト成分からなるアンカバードバックグラウンド背景領域とに分離し、処理手段は、前景領域、背景領域、カバードバックグラウンド前景領域、カバードバックグラウンド背景領域、アンカバードバックグラウンド前景領域、およびアンカバードバックグラウンド背景領域毎に、クラス分類適応処理を実行することにより、出力画像を生成するようにすることができるようになる。
【0053】
本発明の画像処理方法は、入力画像の画素ごとの、所定フレームと、所定フレームの1つ前のフレームとの間の動きの有無、および所定フレームと、所定フレームの1つ後のフレームとの間の動きの有無に基づいて、画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前景オブジェクト成分と背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定ステップと、領域情報により、入力画像の画素が混合領域であると特定されている場合、混合領域の画素における前景オブジェクト成分と背景オブジェクト成分の混合の割合を示す混合比を基に、混合領域を、前景オブジェクト成分からなる混合前景領域と、背景オブジェクト成分からなる混合背景領域とに分離する分離ステップと、前景領域、背景領域、混合前景領域、および混合背景領域毎に、クラス分類適応処理を実行することにより、出力画像を生成する処理ステップとを含み、処理ステップは、前景領域、背景領域、混合前景領域、および混合背景領域毎に、入力画像の画素を、順次、注目画素とし、入力画像から求められる高解像度の予測画像における、注目画素に対応する所定数の画素である予測タップを構成する画素と乗算される予測係数のセットを取得し、入力画像から、注目画素を含む所定数の画素であるクラスタップを取得し、クラスタップに基づいて、注目画素を複数のクラスのうちのいずれかに分類し、分類されたクラスを基に、注目画素に対応する予測タップを取得し、予測タップを構成する画素と予測係数の線形結合演算を行うことで、予測画像における画素の画素値を求めるクラス分類適応処理を実行し、前景領域、背景領域、混合前景領域、および混合背景領域毎に求められた画素値を合成することで、出力画像を生成する。
【0058】
本発明の記録媒体のプログラムは、入力画像データに基づいて、前景オブジェクトを構成する前景オブジェクト成分、および背景オブジェクトを構成する背景オブジェクト成分が混合されてなる混合領域と、前景オブジェクト成分からなる前景領域、および背景オブジェクトを構成する背景オブジェクト成分からなる背景領域の一方により構成される非混合領域とを特定し、特定結果に対応する領域特定情報を出力する領域特定ステップと、領域特定情報に対応して、少なくとも混合領域において、入力画像データを、前景オブジェクト成分と背景オブジェクト成分とに分離する分離ステップと、分離結果に対応して、前景オブジェクト成分および背景オブジェクト成分を個々に処理する処理ステップとを含むことを特徴とする。
【0063】
本発明のプログラムは、入力画像の画素ごとの、所定フレームと、所定フレームの1つ前のフレームとの間の動きの有無、および所定フレームと、所定フレームの1つ後のフレームとの間の動きの有無に基づいて、画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前景オブジェクト成分と背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定ステップと、領域情報により、入力画像の画素が混合領域であると特定されている場合、混合領域の画素における前景オブジェクト成分と背景オブジェクト成分の混合の割合を示す混合比を基に、混合領域を、前景オブジェクト成分からなる混合前景領域と、背景オブジェクト成分からなる混合背景領域とに分離する分離ステップと、前景領域、背景領域、混合前景領域、および混合背景領域毎に、クラス分類適応処理を実行することにより、出力画像を生成する処理ステップとを含む処理をコンピュータに実行させ、処理ステップは、前景領域、背景領域、混合前景領域、および混合背景領域毎に、入力画像の画素を、順次、注目画素とし、入力画像から求められる高解像度の予測画像における、注目画素に対応する所定数の画素である予測タップを構成する画素と乗算される予測係数のセットを取得し、入力画像から、注目画素を含む所定数の画素であるクラスタップを取得し、クラスタップに基づいて、注目画素を複数のクラスのうちのいずれかに分類し、分類されたクラスを基に、注目画素に対応する予測タップを取得し、予測タップを構成する画素と予測係数の線形結合演算を行うことで、予測画像における画素の画素値を求めるクラス分類適応処理を実行し、前景領域、背景領域、混合前景領域、および混合背景領域毎に求められた画素値を合成することで、出力画像を生成する。
【0068】
本発明の画像処理装置および方法、記録媒体、並びにプロクラムにおいては、入力画像の画素ごとの、所定フレームと、所定フレームの1つ前のフレームとの間の動きの有無、および所定フレームと、所定フレームの1つ後のフレームとの間の動きの有無に基づいて、画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前景オブジェクト成分と背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報が生成され、領域情報により、入力画像の画素が混合領域であると特定されている場合、混合領域の画素における前景オブジェクト成分と背景オブジェクト成分の混合の割合を示す混合比を基に、混合領域が、前景オブジェクト成分からなる混合前景領域と、背景オブジェクト成分からなる混合背景領域とに分離され、前景領域、背景領域、混合前景領域、および混合背景領域毎に、クラス分類適応処理を実行することにより、出力画像が生成される。特に、前景領域、背景領域、混合前景領域、および混合背景領域毎に、入力画像の画素が、順次、注目画素とされ、入力画像から求められる高解像度の予測画像における、注目画素に対応する所定数の画素である予測タップを構成する画素と乗算される予測係数のセットが取得され、入力画像から、注目画素を含む所定数の画素であるクラスタップが取得され、クラスタップに基づいて、注目画素が複数のクラスのうちのいずれかに分類され、分類されたクラスを基に、注目画素に対応する予測タップが取得され、予測タップを構成する画素と予測係数の線形結合演算を行うことで、予測画像における画素の画素値を求めるクラス分類適応処理が実行され、前景領域、背景領域、混合前景領域、および混合背景領域毎に求められた画素値が合成されることで、出力画像が生成される。
【0069】
【発明の実施の形態】
図10は、本発明に係る画像処理装置の一実施の形態の構成を示すブロック図である。CPU(Central Processing Unit)71は、ROM(Read Only Memory)72、または記憶部78に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)73には、CPU71が実行するプログラムやデータなどが適宜記憶される。これらのCPU71、ROM72、およびRAM73は、バス74により相互に接続されている。
【0070】
CPU71にはまた、バス74を介して入出力インタフェース75が接続されている。入出力インタフェース75には、キーボード、マウス、マイクロホンなどよりなる入力部76、ディスプレイ、スピーカなどよりなる出力部77が接続されている。CPU71は、入力部76から入力される指令に対応して各種の処理を実行する。そして、CPU71は、処理の結果得られた画像や音声等を出力部77に出力する。
【0071】
入出力インタフェース75に接続されている記憶部78は、例えばハードディスクなどで構成され、CPU71が実行するプログラムや各種のデータを記憶する。通信部79は、インターネット、その他のネットワークを介して外部の装置と通信する。この例の場合、通信部79はセンサの出力を取り込む取得部として働く。
【0072】
また、通信部79を介してプログラムを取得し、記憶部78に記憶してもよい。
【0073】
入出力インタフェース75に接続されているドライブ80は、磁気ディスク91、光ディスク92、光磁気ディスク93、または半導体メモリ94などが装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部78に転送され、記憶される。
【0074】
図11は、画像処理装置の機能の構成を示すブロック図である。
【0075】
なお、画像処理装置の各機能をハードウェアで実現するか、ソフトウェアで実現するかは問わない。つまり、本明細書の各ブロック図は、ハードウェアのブロック図と考えても、ソフトウェアによる機能ブロック図と考えても良い。
【0076】
ここで、画像処理装置に入力される入力画像には、動きボケが含まれている。
動きボケとは、撮像の対象となる、現実世界におけるオブジェクトの動きと、センサの撮像の特性とにより生じる、動いているオブジェクトに対応する画像に含まれている歪みをいう。
【0077】
この明細書では、撮像の対象となる、現実世界におけるオブジェクトに対応する画像を、画像オブジェクトと称する。
【0078】
画像処理装置に供給された入力画像は、オブジェクト抽出部101、領域特定部103、混合比算出部104、および前景背景分離部105に供給される。
【0079】
オブジェクト抽出部101は、入力画像に含まれる前景のオブジェクトに対応する画像オブジェクトを粗く抽出して、抽出した画像オブジェクトを動き検出部102に供給する。オブジェクト抽出部101は、例えば、入力画像に含まれる前景のオブジェクトに対応する画像オブジェクトの輪郭を検出することで、前景のオブジェクトに対応する画像オブジェクトを粗く抽出する。
【0080】
オブジェクト抽出部101は、入力画像に含まれる背景のオブジェクトに対応する画像オブジェクトを粗く抽出して、抽出した画像オブジェクトを動き検出部102に供給する。オブジェクト抽出部101は、例えば、入力画像と、抽出された前景のオブジェクトに対応する画像オブジェクトとの差から、背景のオブジェクトに対応する画像オブジェクトを粗く抽出する。
【0081】
また、例えば、オブジェクト抽出部101は、内部に設けられている背景メモリに記憶されている背景の画像と、入力画像との差から、前景のオブジェクトに対応する画像オブジェクト、および背景のオブジェクトに対応する画像オブジェクトを粗く抽出するようにしてもよい。
【0082】
動き検出部102は、例えば、ブロックマッチング法、勾配法、位相相関法、およびペルリカーシブ法などの手法により、粗く抽出された前景のオブジェクトに対応する画像オブジェクトの動きベクトルを算出して、算出した動きベクトルおよび動きベクトルの位置情報(動きベクトルに対応する画素の位置を特定する情報)を領域特定部103に供給する。
【0083】
動き検出部102が出力する動きベクトルには、動き量vに対応する情報が含まれている。
【0084】
また、例えば、動き検出部102は、画像オブジェクトの画素を特定する画素位置情報と共に、画像オブジェクト毎の動きベクトルを動きボケ調整部106に出力するようにしてもよい。
【0085】
動き量vは、動いているオブジェクトに対応する画像の位置の変化を画素間隔を単位として表す値である。例えば、前景に対応するオブジェクトの画像が、あるフレームを基準として次のフレームにおいて4画素分離れた位置に表示されるように移動しているとき、前景に対応するオブジェクトの画像の動き量vは、4とされる。
【0086】
領域特定部103は、入力された画像の画素のそれぞれを、前景領域、背景領域、またはアンカバードバックグラウンド領域、若しくはカバードバックグラウンド領域からなる混合領域のいずれかに特定し、画素毎に前景領域、背景領域、またはアンカバードバックグラウンド領域、若しくはカバードバックグラウンド領域からなる混合領域のいずれかに属するかを示す情報(以下、領域情報と称する)を混合比算出部104、および前景背景分離部105に供給する。
【0087】
なお、混合領域、アンカバードバックグラウンド領域、およびカバードバックグラウンド領域の詳細については、後述する。
【0088】
混合比算出部104は、入力画像、および領域特定部103から供給された領域情報を基に、混合領域に含まれる画素に対応する混合比(以下、混合比αと称する)を算出して、算出した混合比を前景背景分離部105に供給する。
【0089】
混合比αは、後述する式(3)に示されるように、画素値における、背景のオブジェクトに対応する画像の成分(以下、背景の成分とも称する)の割合を示す値である。
【0090】
前景背景分離部105は、領域特定部103から供給された領域情報、および混合比算出部104から供給された混合比αを基に、前景のオブジェクトに対応する画像の成分(以下、前景の成分とも称する)と、背景の成分のみから成る背景成分画像とを分離して、背景領域の画像、アンカバードバックグラウンド領域の背景の成分のみからなる画像(以下、アンカバードバックグラウンド領域の背景成分画像と称する)、アンカバードバックグラウンド領域の前景の成分のみからなる画像(以下、アンカバードバックグラウンド領域の前景成分画像と称する)、カバードバックグラウンド領域の背景の成分のみからなる画像(以下、カバードバックグラウンド領域の背景成分画像と称する)、カバードバックグラウンド領域の前景の成分のみからなる画像(以下、カバードバックグラウンド領域の前景成分画像と称する)、および前景領域の画像を分離画像処理部106に供給する。
【0091】
分離画像処理部106は、前景背景分離部105から供給された、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像をそれぞれ処理する。
【0092】
例えば、分離画像処理部106は、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像毎に、より高解像度の画像を生成するクラス分類適応処理で使用される係数を生成する。
【0093】
例えば、分離画像処理部106は、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像毎にクラス分類適応処理を適用して、より高解像度の画像を創造する。
【0094】
または、例えば、分離画像処理部106は、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像毎に、それぞれ異なる係数を使用した、エッジ強調の度合いの異なるエッジ強調の処理を適用する。
【0095】
次に、図12乃至図27を参照して、画像処理装置に供給される入力画像について説明する。
【0096】
図12は、センサによる撮像を説明する図である。センサは、例えば、固体撮像素子であるCCD(Charge-Coupled Device)エリアセンサを備えたCCDビデオカメラなどで構成される。現実世界における、前景に対応するオブジェクトは、現実世界における、背景に対応するオブジェクトと、センサとの間を、例えば、図中の左側から右側に水平に移動する。
【0097】
センサは、前景に対応するオブジェクトを、背景に対応するオブジェクトと共に撮像する。センサは、撮像した画像を1フレーム単位で出力する。例えば、センサは、1秒間に30フレームから成る画像を出力する。センサの露光時間は、1/30秒とすることができる。露光時間は、センサが入力された光の電荷への変換を開始してから、入力された光の電荷への変換を終了するまでの期間である。以下、露光時間をシャッタ時間とも称する。
【0098】
図13は、画素の配置を説明する図である。図13中において、A乃至Iは、個々の画素を示す。画素は、画像に対応する平面上に配置されている。1つの画素に対応する1つの検出素子は、センサ上に配置されている。センサが画像を撮像するとき、1つの検出素子は、画像を構成する1つの画素に対応する画素値を出力する。例えば、検出素子のX方向の位置は、画像上の横方向の位置に対応し、検出素子のY方向の位置は、画像上の縦方向の位置に対応する。
【0099】
図14に示すように、例えば、CCDである検出素子は、シャッタ時間に対応する期間、入力された光を電荷に変換して、変換された電荷を蓄積する。電荷の量は、入力された光の強さと、光が入力されている時間にほぼ比例する。検出素子は、シャッタ時間に対応する期間において、入力された光から変換された電荷を、既に蓄積されている電荷に加えていく。すなわち、検出素子は、シャッタ時間に対応する期間、入力される光を積分して、積分された光に対応する量の電荷を蓄積する。検出素子は、時間に対して、積分効果があるとも言える。
【0100】
検出素子に蓄積された電荷は、図示せぬ回路により、電圧値に変換され、電圧値は更にデジタルデータなどの画素値に変換されて出力される。従って、センサから出力される個々の画素値は、前景または背景に対応するオブジェクトの空間的に広がりを有するある部分を、シャッタ時間について積分した結果である、1次元の空間に射影された値を有する。
【0101】
画像処理装置は、このようなセンサの蓄積の動作により、出力信号に埋もれてしまった有意な情報、例えば、混合比αを抽出する。
【0102】
図15は、動いている前景に対応するオブジェクトと、静止している背景に対応するオブジェクトとを撮像して得られる画像を説明する図である。図15(A)は、動きを伴う前景に対応するオブジェクトと、静止している背景に対応するオブジェクトとを撮像して得られる画像を示している。図15(A)に示す例において、前景に対応するオブジェクトは、画面に対して水平に左から右に動いている。
【0103】
図15(B)は、図15(A)に示す画像の1つのラインに対応する画素値を時間方向に展開したモデル図である。図15(B)の横方向は、図15(A)の空間方向Xに対応している。
【0104】
背景領域の画素は、背景の成分、すなわち、背景のオブジェクトに対応する画像の成分のみから、その画素値が構成されている。前景領域の画素は、前景の成分、すなわち、前景のオブジェクトに対応する画像の成分のみから、その画素値が構成されている。
【0105】
混合領域の画素は、背景の成分、および前景の成分から、その画素値が構成されている。混合領域は、背景の成分、および前景の成分から、その画素値が構成されているので、歪み領域ともいえる。混合領域は、更に、カバードバックグラウンド領域およびアンカバードバックグラウンド領域に分類される。
【0106】
カバードバックグラウンド領域は、前景領域に対して、前景のオブジェクトの進行方向の前端部に対応する位置の混合領域であり、時間の経過に対応して背景成分が前景に覆い隠される領域をいう。
【0107】
これに対して、アンカバードバックグラウンド領域は、前景領域に対して、前景のオブジェクトの進行方向の後端部に対応する位置の混合領域であり、時間の経過に対応して背景成分が現れる領域をいう。
【0108】
このように、前景領域、背景領域、またはカバードバックグラウンド領域若しくはアンカバードバックグラウンド領域を含む画像が、領域特定部103、混合比算出部104、および前景背景分離部105に入力画像として入力される。
【0109】
図16は、以上のような、背景領域、前景領域、混合領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域を説明する図である。
図15に示す画像に対応する場合、背景領域は、静止部分であり、前景領域は、動き部分であり、混合領域のカバードバックグラウンド領域は、背景から前景に変化する部分であり、混合領域のアンカバードバックグラウンド領域は、前景から背景に変化する部分である。
【0110】
図17は、静止している前景に対応するオブジェクトおよび静止している背景に対応するオブジェクトを撮像した画像における、隣接して1列に並んでいる画素の画素値を時間方向に展開したモデル図である。例えば、隣接して1列に並んでいる画素として、画面の1つのライン上に並んでいる画素を選択することができる。
【0111】
図17に示すF01乃至F04の画素値は、静止している前景のオブジェクトに対応する画素の画素値である。図17に示すB01乃至B04の画素値は、静止している背景のオブジェクトに対応する画素の画素値である。
【0112】
図17における縦方向は、図中の上から下に向かって時間が経過する。図17中の矩形の上辺の位置は、センサが入力された光の電荷への変換を開始する時刻に対応し、図17中の矩形の下辺の位置は、センサが入力された光の電荷への変換を終了する時刻に対応する。すなわち、図17中の矩形の上辺から下辺までの距離は、シャッタ時間に対応する。
【0113】
以下において、シャッタ時間とフレーム間隔とが同一である場合を例に説明する。
【0114】
図17における横方向は、図15で説明した空間方向Xに対応する。より具体的には、図17に示す例において、図17中の”F01”と記載された矩形の左辺から”B04”と記載された矩形の右辺までの距離は、画素のピッチの8倍、すなわち、連続している8つの画素の間隔に対応する。
【0115】
前景のオブジェクトおよび背景のオブジェクトが静止している場合、シャッタ時間に対応する期間において、センサに入力される光は変化しない。
【0116】
ここで、シャッタ時間に対応する期間を2つ以上の同じ長さの期間に分割する。例えば、仮想分割数を4とすると、図17に示すモデル図は、図18に示すモデルとして表すことができる。仮想分割数は、前景に対応するオブジェクトのシャッタ時間内での動き量vなどに対応して設定される。例えば、4である動き量vに対応して、仮想分割数は、4とされ、シャッタ時間に対応する期間は4つに分割される。
【0117】
図中の最も上の行は、シャッタが開いて最初の、分割された期間に対応する。
図中の上から2番目の行は、シャッタが開いて2番目の、分割された期間に対応する。図中の上から3番目の行は、シャッタが開いて3番目の、分割された期間に対応する。図中の上から4番目の行は、シャッタが開いて4番目の、分割された期間に対応する。
【0118】
以下、動き量vに対応して分割されたシャッタ時間をシャッタ時間/vとも称する。
【0119】
前景に対応するオブジェクトが静止しているとき、センサに入力される光は変化しないので、前景の成分F01/vは、画素値F01を仮想分割数で除した値に等しい。同様に、前景に対応するオブジェクトが静止しているとき、前景の成分F02/vは、画素値F02を仮想分割数で除した値に等しく、前景の成分F03/vは、画素値F03を仮想分割数で除した値に等しく、前景の成分F04/vは、画素値F04を仮想分割数で除した値に等しい。
【0120】
背景に対応するオブジェクトが静止しているとき、センサに入力される光は変化しないので、背景の成分B01/vは、画素値B01を仮想分割数で除した値に等しい。同様に、背景に対応するオブジェクトが静止しているとき、背景の成分B02/vは、画素値B02を仮想分割数で除した値に等しく、B03/vは、画素値B03を仮想分割数で除した値に等しく、B04/vは、画素値B04を仮想分割数で除した値に等しい。
【0121】
すなわち、前景に対応するオブジェクトが静止している場合、シャッタ時間に対応する期間において、センサに入力される前景のオブジェクトに対応する光が変化しないので、シャッタが開いて最初の、シャッタ時間/vに対応する前景の成分F01/vと、シャッタが開いて2番目の、シャッタ時間/vに対応する前景の成分F01/vと、シャッタが開いて3番目の、シャッタ時間/vに対応する前景の成分F01/vと、シャッタが開いて4番目の、シャッタ時間/vに対応する前景の成分F01/vとは、同じ値となる。F02/v乃至F04/vも、F01/vと同様の関係を有する。
【0122】
背景に対応するオブジェクトが静止している場合、シャッタ時間に対応する期間において、センサに入力される背景のオブジェクトに対応する光は変化しないので、シャッタが開いて最初の、シャッタ時間/vに対応する背景の成分B01/vと、シャッタが開いて2番目の、シャッタ時間/vに対応する背景の成分B01/vと、シャッタが開いて3番目の、シャッタ時間/vに対応する背景の成分B01/vと、シャッタが開いて4番目の、シャッタ時間/vに対応する背景の成分B01/vとは、同じ値となる。B02/v乃至B04/vも、同様の関係を有する。
【0123】
次に、前景に対応するオブジェクトが移動し、背景に対応するオブジェクトが静止している場合について説明する。
【0124】
図19は、前景に対応するオブジェクトが図中の右側に向かって移動する場合の、カバードバックグラウンド領域を含む、1つのライン上の画素の画素値を時間方向に展開したモデル図である。図19において、前景の動き量vは、4である。1フレームは短い時間なので、前景に対応するオブジェクトが剛体であり、等速で移動していると仮定することができる。図19において、前景に対応するオブジェクトの画像は、あるフレームを基準として次のフレームにおいて4画素分右側に表示されるように移動する。
【0125】
図19において、最も左側の画素乃至左から4番目の画素は、前景領域に属する。図19において、左から5番目乃至左から7番目の画素は、カバードバックグラウンド領域である混合領域に属する。図19において、最も右側の画素は、背景領域に属する。
【0126】
前景に対応するオブジェクトが時間の経過と共に背景に対応するオブジェクトを覆い隠すように移動しているので、カバードバックグラウンド領域に属する画素の画素値に含まれる成分は、シャッタ時間に対応する期間のある時点で、背景の成分から、前景の成分に替わる。
【0127】
例えば、図19中に太線枠を付した画素値Mは、式(1)で表される。
【0128】
M=B02/v+B02/v+F07/v+F06/v (1)
【0129】
例えば、左から5番目の画素は、1つのシャッタ時間/vに対応する背景の成分を含み、3つのシャッタ時間/vに対応する前景の成分を含むので、左から5番目の画素の混合比αは、1/4である。左から6番目の画素は、2つのシャッタ時間/vに対応する背景の成分を含み、2つのシャッタ時間/vに対応する前景の成分を含むので、左から6番目の画素の混合比αは、1/2である。左から7番目の画素は、3つのシャッタ時間/vに対応する背景の成分を含み、1つのシャッタ時間/vに対応する前景の成分を含むので、左から7番目の画素の混合比αは、3/4である。
【0130】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図19中の左から4番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F07/vは、図19中の左から5番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F07/vは、図19中の左から6番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図19中の左から7番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0131】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図19中の左から3番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分F06/vは、図19中の左から4番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F06/vは、図19中の左から5番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図19中の左から6番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0132】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図19中の左から2番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分F05/vは、図19中の左から3番目の画素の、シャッタが開いて2番目のシャッタ時間/vのに対応する前景の成分に等しい。同様に、前景の成分F05/vは、図19中の左から4番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図19中の左から5番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0133】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図19中の最も左側の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分F04/vは、図19中の左から2番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F04/vは、図19中の左から3番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図19中の左から4番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0134】
動いているオブジェクトに対応する前景の領域は、このように動きボケを含むので、歪み領域とも言える。
【0135】
図20は、前景が図中の右側に向かって移動する場合の、アンカバードバックグラウンド領域を含む、1つのライン上の画素の画素値を時間方向に展開したモデル図である。図20において、前景の動き量vは、4である。1フレームは短い時間なので、前景に対応するオブジェクトが剛体であり、等速で移動していると仮定することができる。図20において、前景に対応するオブジェクトの画像は、あるフレームを基準として次のフレームにおいて4画素分右側に移動する。
【0136】
図20において、最も左側の画素乃至左から4番目の画素は、背景領域に属する。図20において、左から5番目乃至左から7番目の画素は、アンカバードバックグラウンドである混合領域に属する。図20において、最も右側の画素は、前景領域に属する。
【0137】
背景に対応するオブジェクトを覆っていた前景に対応するオブジェクトが時間の経過と共に背景に対応するオブジェクトの前から取り除かれるように移動しているので、アンカバードバックグラウンド領域に属する画素の画素値に含まれる成分は、シャッタ時間に対応する期間のある時点で、前景の成分から、背景の成分に替わる。
【0138】
例えば、図20中に太線枠を付した画素値M'は、式(2)で表される。
【0139】
M'=F02/v+F01/v+B26/v+B26/v (2)
【0140】
例えば、左から5番目の画素は、3つのシャッタ時間/vに対応する背景の成分を含み、1つのシャッタ時間/vに対応する前景の成分を含むので、左から5番目の画素の混合比αは、3/4である。左から6番目の画素は、2つのシャッタ時間/vに対応する背景の成分を含み、2つのシャッタ時間/vに対応する前景の成分を含むので、左から6番目の画素の混合比αは、1/2である。左から7番目の画素は、1つのシャッタ時間/vに対応する背景の成分を含み、3つのシャッタ時間/vに対応する前景の成分を含むので、左から7番目の画素の混合比αは、1/4である。
【0141】
式(1)および式(2)をより一般化すると、画素値Mは、式(3)で表される。
【0142】
【数1】
ここで、αは、混合比である。Bは、背景の画素値であり、Fi/vは、前景の成分である。
【0143】
前景に対応するオブジェクトが剛体であり、等速で動くと仮定でき、かつ、動き量vが4であるので、例えば、図20中の左から5番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F01/vは、図20中の左から6番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、F01/vは、図20中の左から7番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図20中の左から8番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0144】
前景に対応するオブジェクトが剛体であり、等速で動くと仮定でき、かつ、仮想分割数が4であるので、例えば、図20中の左から6番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F02/vは、図20中の左から7番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F02/vは、図20中の左から8番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分に等しい。
【0145】
前景に対応するオブジェクトが剛体であり、等速で動くと仮定でき、かつ、動き量vが4であるので、例えば、図20中の左から7番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F03/vは、図20中の左から8番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。
【0146】
図18乃至図20の説明において、仮想分割数は、4であるとして説明したが、仮想分割数は、動き量vに対応する。動き量vは、一般に、前景に対応するオブジェクトの移動速度に対応する。例えば、前景に対応するオブジェクトが、あるフレームを基準として次のフレームにおいて4画素分右側に表示されるように移動しているとき、動き量vは、4とされる。動き量vに対応し、仮想分割数は、4とされる。同様に、例えば、前景に対応するオブジェクトが、あるフレームを基準として次のフレームにおいて6画素分左側に表示されるように移動しているとき、動き量vは、6とされ、仮想分割数は、6とされる。
【0147】
図21および図22に、以上で説明した、前景領域、背景領域、カバードバックグラウンド領域若しくはアンカバードバックグラウンド領域から成る混合領域と、分割されたシャッタ時間に対応する前景の成分および背景の成分との関係を示す。
【0148】
図21は、静止している背景の前を移動しているオブジェクトに対応する前景を含む画像から、前景領域、背景領域、および混合領域の画素を抽出した例を示す。図21に示す例において、前景に対応するオブジェクトは、画面に対して水平に移動している。
【0149】
フレーム#n+1は、フレーム#nの次のフレームであり、フレーム#n+2は、フレーム#n+1の次のフレームである。
【0150】
フレーム#n乃至フレーム#n+2のいずれかから抽出した、前景領域、背景領域、および混合領域の画素を抽出して、動き量vを4として、抽出された画素の画素値を時間方向に展開したモデルを図22に示す。
【0151】
前景領域の画素値は、前景に対応するオブジェクトが移動するので、シャッタ時間/vの期間に対応する、4つの異なる前景の成分から構成される。例えば、図22に示す前景領域の画素のうち最も左側に位置する画素は、F01/v,F02/v,F03/v、およびF04/vから構成される。すなわち、前景領域の画素は、動きボケを含んでいる。
【0152】
背景に対応するオブジェクトが静止しているので、シャッタ時間に対応する期間において、センサに入力される背景に対応する光は変化しない。この場合、背景領域の画素値は、動きボケを含まない。
【0153】
カバードバックグラウンド領域若しくはアンカバードバックグラウンド領域から成る混合領域に属する画素の画素値は、前景の成分と、背景の成分とから構成される。
【0154】
次に、オブジェクトに対応する画像が動いているとき、複数のフレームにおける、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデルについて説明する。例えば、オブジェクトに対応する画像が画面に対して水平に動いているとき、隣接して1列に並んでいる画素として、画面の1つのライン上に並んでいる画素を選択することができる。
【0155】
図23は、静止している背景に対応するオブジェクトを撮像した画像の3つのフレームの、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデル図である。フレーム#nは、フレーム#n-1の次のフレームであり、フレーム#n+1は、フレーム#nの次のフレームである。他のフレームも同様に称する。
【0156】
図23に示すB01乃至B12の画素値は、静止している背景のオブジェクトに対応する画素の画素値である。背景に対応するオブジェクトが静止しているので、フレーム#n-1乃至フレームn+1において、対応する画素の画素値は、変化しない。例えば、フレーム#n-1におけるB05の画素値を有する画素の位置に対応する、フレーム#nにおける画素、およびフレーム#n+1における画素は、それぞれ、B05の画素値を有する。
【0157】
図24は、静止している背景に対応するオブジェクトと共に図中の右側に移動する前景に対応するオブジェクトを撮像した画像の3つのフレームの、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデル図である。図24に示すモデルは、カバードバックグラウンド領域を含む。
【0158】
図24において、前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、前景の動き量vは、4であり、仮想分割数は、4である。
【0159】
例えば、図24中のフレーム#n-1の最も左側の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F12/vとなり、図24中の左から2番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F12/vとなる。図24中の左から3番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図24中の左から4番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F12/vとなる。
【0160】
図24中のフレーム#n-1の最も左側の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分は、F11/vとなり、図24中の左から2番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分も、F11/vとなる。図24中の左から3番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F11/vとなる。
【0161】
図24中のフレーム#n-1の最も左側の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分は、F10/vとなり、図24中の左から2番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分も、F10/vとなる。図24中のフレーム#n-1の最も左側の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F09/vとなる。
【0162】
背景に対応するオブジェクトが静止しているので、図24中のフレーム#n-1の左から2番目の画素の、シャッタが開いて最初のシャッタ時間/vの背景の成分は、B01/vとなる。図24中のフレーム#n-1の左から3番目の画素の、シャッタが開いて最初および2番目のシャッタ時間/vの背景の成分は、B02/vとなる。図24中のフレーム#n-1の左から4番目の画素の、シャッタが開いて最初乃至3番目のシャッタ時間/vの背景の成分は、B03/vとなる。
【0163】
図24中のフレーム#n-1において、最も左側の画素は、前景領域に属し、左側から2番目乃至4番目の画素は、カバードバックグラウンド領域である混合領域に属する。
【0164】
図24中のフレーム#n-1の左から5番目の画素乃至12番目の画素は、背景領域に属し、その画素値は、それぞれ、B04乃至B11となる。
【0165】
図24中のフレーム#nの左から1番目の画素乃至5番目の画素は、前景領域に属する。フレーム#nの前景領域における、シャッタ時間/vの前景の成分は、F05/v乃至F12/vのいずれかである。
【0166】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図24中のフレーム#nの左から5番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F12/vとなり、図24中の左から6番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F12/vとなる。図24中の左から7番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図24中の左から8番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F12/vとなる。
【0167】
図24中のフレーム#nの左から5番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分は、F11/vとなり、図24中の左から6番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分も、F11/vとなる。図24中の左から7番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F11/vとなる。
【0168】
図24中のフレーム#nの左から5番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分は、F10/vとなり、図24中の左から6番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分も、F10/vとなる。図24中のフレーム#nの左から5番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F09/vとなる。
【0169】
背景に対応するオブジェクトが静止しているので、図24中のフレーム#nの左から6番目の画素の、シャッタが開いて最初のシャッタ時間/vの背景の成分は、B05/vとなる。図24中のフレーム#nの左から7番目の画素の、シャッタが開いて最初および2番目のシャッタ時間/vの背景の成分は、B06/vとなる。図24中のフレーム#nの左から8番目の画素の、シャッタが開いて最初乃至3番目の、シャッタ時間/vの背景の成分は、B07/vとなる。
【0170】
図24中のフレーム#nにおいて、左側から6番目乃至8番目の画素は、カバードバックグラウンド領域である混合領域に属する。
【0171】
図24中のフレーム#nの左から9番目の画素乃至12番目の画素は、背景領域に属し、画素値は、それぞれ、B08乃至B11となる。
【0172】
図24中のフレーム#n+1の左から1番目の画素乃至9番目の画素は、前景領域に属する。フレーム#n+1の前景領域における、シャッタ時間/vの前景の成分は、F01/v乃至F12/vのいずれかである。
【0173】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図24中のフレーム#n+1の左から9番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F12/vとなり、図24中の左から10番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F12/vとなる。図24中の左から11番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図24中の左から12番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F12/vとなる。
【0174】
図24中のフレーム#n+1の左から9番目の画素の、シャッタが開いて2番目のシャッタ時間/vの期間の前景の成分は、F11/vとなり、図24中の左から10番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分も、F11/vとなる。図24中の左から11番目の画素の、シャッタが開いて4番目の、シャッタ時間/vの前景の成分は、F11/vとなる。
【0175】
図24中のフレーム#n+1の左から9番目の画素の、シャッタが開いて3番目の、シャッタ時間/vの前景の成分は、F10/vとなり、図24中の左から10番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分も、F10/vとなる。図24中のフレーム#n+1の左から9番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F09/vとなる。
【0176】
背景に対応するオブジェクトが静止しているので、図24中のフレーム#n+1の左から10番目の画素の、シャッタが開いて最初のシャッタ時間/vの背景の成分は、B09/vとなる。図24中のフレーム#n+1の左から11番目の画素の、シャッタが開いて最初および2番目のシャッタ時間/vの背景の成分は、B10/vとなる。図24中のフレーム#n+1の左から12番目の画素の、シャッタが開いて最初乃至3番目の、シャッタ時間/vの背景の成分は、B11/vとなる。
【0177】
図24中のフレーム#n+1において、左側から10番目乃至12番目の画素は、カバードバックグラウンド領域である混合領域に対応する。
【0178】
図25は、図24に示す画素値から前景の成分を抽出した画像のモデル図である。
【0179】
図26は、静止している背景と共に図中の右側に移動するオブジェクトに対応する前景を撮像した画像の3つのフレームの、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデル図である。図26において、アンカバードバックグラウンド領域が含まれている。
【0180】
図26において、前景に対応するオブジェクトは、剛体であり、かつ等速で移動していると仮定できる。前景に対応するオブジェクトが、次のフレームにおいて4画素分右側に表示されるように移動しているので、動き量vは、4である。
【0181】
例えば、図26中のフレーム#n-1の最も左側の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分は、F13/vとなり、図26中の左から2番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F13/vとなる。図26中の左から3番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図26中の左から4番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F13/vとなる。
【0182】
図26中のフレーム#n-1の左から2番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F14/vとなり、図26中の左から3番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F14/vとなる。図26中の左から3番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分は、F15/vとなる。
【0183】
背景に対応するオブジェクトが静止しているので、図26中のフレーム#n-1の最も左側の画素の、シャッタが開いて2番目乃至4番目の、シャッタ時間/vの背景の成分は、B25/vとなる。図26中のフレーム#n-1の左から2番目の画素の、シャッタが開いて3番目および4番目の、シャッタ時間/vの背景の成分は、B26/vとなる。図26中のフレーム#n-1の左から3番目の画素の、シャッタが開いて4番目のシャッタ時間/vの背景の成分は、B27/vとなる。
【0184】
図26中のフレーム#n-1において、最も左側の画素乃至3番目の画素は、アンカバードバックグラウンド領域である混合領域に属する。
【0185】
図26中のフレーム#n-1の左から4番目の画素乃至12番目の画素は、前景領域に属する。フレームの前景の成分は、F13/v乃至F24/vのいずれかである。
【0186】
図26中のフレーム#nの最も左側の画素乃至左から4番目の画素は、背景領域に属し、画素値は、それぞれ、B25乃至B28となる。
【0187】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図26中のフレーム#nの左から5番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F13/vとなり、図26中の左から6番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F13/vとなる。図26中の左から7番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図26中の左から8番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F13/vとなる。
【0188】
図26中のフレーム#nの左から6番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F14/vとなり、図26中の左から7番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F14/vとなる。図26中の左から8番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F15/vとなる。
【0189】
背景に対応するオブジェクトが静止しているので、図26中のフレーム#nの左から5番目の画素の、シャッタが開いて2番目乃至4番目のシャッタ時間/vの背景の成分は、B29/vとなる。図26中のフレーム#nの左から6番目の画素の、シャッタが開いて3番目および4番目のシャッタ時間/vの背景の成分は、B30/vとなる。図26中のフレーム#nの左から7番目の画素の、シャッタが開いて4番目のシャッタ時間/vの背景の成分は、B31/vとなる。
【0190】
図26中のフレーム#nにおいて、左から5番目の画素乃至7番目の画素は、アンカバードバックグラウンド領域である混合領域に属する。
【0191】
図26中のフレーム#nの左から8番目の画素乃至12番目の画素は、前景領域に属する。フレーム#nの前景領域における、シャッタ時間/vの期間に対応する値は、F13/v乃至F20/vのいずれかである。
【0192】
図26中のフレーム#n+1の最も左側の画素乃至左から8番目の画素は、背景領域に属し、画素値は、それぞれ、B25乃至B32となる。
【0193】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図26中のフレーム#n+1の左から9番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F13/vとなり、図26中の左から10番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F13/vとなる。図26中の左から11番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図26中の左から12番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F13/vとなる。
【0194】
図26中のフレーム#n+1の左から10番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F14/vとなり、図26中の左から11番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F14/vとなる。図26中の左から12番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F15/vとなる。
【0195】
背景に対応するオブジェクトが静止しているので、図26中のフレーム#n+1の左から9番目の画素の、シャッタが開いて2番目乃至4番目の、シャッタ時間/vの背景の成分は、B33/vとなる。図26中のフレーム#n+1の左から10番目の画素の、シャッタが開いて3番目および4番目のシャッタ時間/vの背景の成分は、B34/vとなる。図26中のフレーム#n+1の左から11番目の画素の、シャッタが開いて4番目のシャッタ時間/vの背景の成分は、B35/vとなる。
【0196】
図26中のフレーム#n+1において、左から9番目の画素乃至11番目の画素は、アンカバードバックグラウンド領域である混合領域に属する。
【0197】
図26中のフレーム#n+1の左から12番目の画素は、前景領域に属する。フレーム#n+1の前景領域における、シャッタ時間/vの前景の成分は、F13/v乃至F16/vのいずれかである。
【0198】
図27は、図26に示す画素値から前景の成分を抽出した画像のモデル図である。
【0199】
図28は、前景領域の画像、背景領域の画像、カバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域の背景成分画像に分離された入力画像と、画素の画素値を時間方向に展開したモデル図との対応を示す図である。
【0200】
図28に示すように、入力画像は、領域特定部103により、前景領域、背景領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域を特定される。入力画像は、前景背景分離部105により、特定された前景領域、背景領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域、および混合比算出部104により検出された混合比αを基に、前景領域の画像、背景領域の画像、カバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域の背景成分画像に分離される。
【0201】
分離された前景領域の画像、背景領域の画像、カバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域の背景成分画像は、それぞれの画像毎に、処理される。
【0202】
図29は、前景領域、背景領域、および混合領域に分割された画像の例を示す図である。領域特定部103は、入力画像の、前景領域、背景領域、および混合領域を特定する。画像処理装置は、前景領域、背景領域、および混合領域を示す領域情報を基に、入力画像を、前景領域の画像、背景領域の画像、および混合領域の画像に分割することができる。
【0203】
図30に示すように、前景背景分離部105は、領域特定部103から供給された領域情報、および混合比算出部104から供給された混合比αを基に、混合領域の画像を、前景成分画像および背景成分画像に分離する。
【0204】
図31は、本発明に係る画像処理装置の画像の処理を説明するフローチャートである。
【0205】
ステップS101において、領域特定部103は、動き検出部102から供給された動きベクトルおよびその位置情報、並びに入力画像を基に、入力画像の前景領域、背景領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域を特定する。領域特定の処理の詳細は、後述する。
【0206】
ステップS102において、混合比算出部104は、領域特定部103から供給された領域情報および入力画像を基に、混合比αを算出する。混合比算出部104の混合比αを算出する処理の詳細は、後述する。
【0207】
ステップS103において、前景背景分離部105は、領域特定部103から供給された領域情報、および混合比算出部104から供給された混合比αを基に、入力画像を、前景領域の画像、背景領域の画像、カバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域の背景成分画像に分離する。前景背景分離部105の画像の分離の処理の詳細は、後述する。
【0208】
ステップS104において、分離画像処理部106は、分離された、前景領域の画像、背景領域の画像、カバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域の背景成分画像毎に、画像の処理を実行して、処理は終了する。分離画像処理部106が実行する画像処理の詳細は、後述する。
【0209】
このように、本発明に係る画像処理装置は、入力画像を、前景領域の画像、背景領域の画像、カバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域の背景成分画像に分離し、分離された、前景領域の画像、背景領域の画像、カバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域の背景成分画像毎に画像処理を実行する。
【0210】
図32は、領域特定部103の構成の一例を示すブロック図である。図32に構成を示す領域特定部103は、動きベクトルを利用しない。フレームメモリ201は、入力された画像をフレーム単位で記憶する。フレームメモリ201は、処理の対象がフレーム#nであるとき、フレーム#nの2つ前のフレームであるフレーム#n-2、フレーム#nの1つ前のフレームであるフレーム#n-1、フレーム#n、フレーム#nの1つ後のフレームであるフレーム#n+1、およびフレーム#nの2つ後のフレームであるフレーム#n+2を記憶する。
【0211】
静動判定部202−1は、フレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n+2の画素の画素値、およびフレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n+1の画素の画素値をフレームメモリ201から読み出して、読み出した画素値の差の絶対値を算出する。静動判定部202−1は、フレーム#n+2の画素値とフレーム#n+1の画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、差の絶対値が閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部203−1に供給する。フレーム#n+2の画素の画素値とフレーム#n+1の画素の画素値との差の絶対値が閾値Th以下であると判定された場合、静動判定部202−1は、静止を示す静動判定を領域判定部203−1に供給する。
【0212】
静動判定部202−2は、フレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n+1の画素の画素値、およびフレーム#nの対象となる画素の画素値をフレームメモリ201から読み出して、画素値の差の絶対値を算出する。静動判定部202−2は、フレーム#n+1の画素値とフレーム#nの画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、画素値の差の絶対値が、閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部203−1および領域判定部203−2に供給する。フレーム#n+1の画素の画素値とフレーム#nの画素の画素値との差の絶対値が、閾値Th以下であると判定された場合、静動判定部202−2は、静止を示す静動判定を領域判定部203−1および領域判定部203−2に供給する。
【0213】
静動判定部202−3は、フレーム#nの領域特定の対象である画素の画素値、およびフレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n-1の画素の画素値をフレームメモリ201から読み出して、画素値の差の絶対値を算出する。静動判定部202−3は、フレーム#nの画素値とフレーム#n-1の画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、画素値の差の絶対値が、閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部203−2および領域判定部203−3に供給する。
フレーム#nの画素の画素値とフレーム#n-1の画素の画素値との差の絶対値が、閾値Th以下であると判定された場合、静動判定部202−3は、静止を示す静動判定を領域判定部203−2および領域判定部203−3に供給する。
【0214】
静動判定部202−4は、フレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n-1の画素の画素値、およびフレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n-2の画素の画素値をフレームメモリ201から読み出して、画素値の差の絶対値を算出する。静動判定部202−4は、フレーム#n-1の画素値とフレーム#n-2の画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、画素値の差の絶対値が、閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部203−3に供給する。フレーム#n-1の画素の画素値とフレーム#n-2の画素の画素値との差の絶対値が、閾値Th以下であると判定された場合、静動判定部202−4は、静止を示す静動判定を領域判定部203−3に供給する。
【0215】
領域判定部203−1は、静動判定部202−1から供給された静動判定が静止を示し、かつ、静動判定部202−2から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素がアンカバードバックグラウンド領域に属すると判定し、領域の判定される画素に対応するアンカバードバックグラウンド領域判定フラグに、アンカバードバックグラウンド領域に属することを示す”1”を設定する。
【0216】
領域判定部203−1は、静動判定部202−1から供給された静動判定が動きを示すか、または、静動判定部202−2から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素がアンカバードバックグラウンド領域に属しないと判定し、領域の判定される画素に対応するアンカバードバックグラウンド領域判定フラグに、アンカバードバックグラウンド領域に属しないことを示す”0”を設定する。
【0217】
領域判定部203−1は、このように”1”または”0”が設定されたアンカバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ204に供給する。
【0218】
領域判定部203−2は、静動判定部202−2から供給された静動判定が静止を示し、かつ、静動判定部202−3から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素が静止領域に属すると判定し、領域の判定される画素に対応する静止領域判定フラグに、静止領域に属することを示す”1”を設定する。
【0219】
領域判定部203−2は、静動判定部202−2から供給された静動判定が動きを示すか、または、静動判定部202−3から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素が静止領域に属しないと判定し、領域の判定される画素に対応する静止領域判定フラグに、静止領域に属しないことを示す”0”を設定する。
【0220】
領域判定部203−2は、このように”1”または”0”が設定された静止領域判定フラグを判定フラグ格納フレームメモリ204に供給する。
【0221】
領域判定部203−2は、静動判定部202−2から供給された静動判定が動きを示し、かつ、静動判定部202−3から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素が動き領域に属すると判定し、領域の判定される画素に対応する動き領域判定フラグに、動き領域に属することを示す”1”を設定する。
【0222】
領域判定部203−2は、静動判定部202−2から供給された静動判定が静止を示すか、または、静動判定部202−3から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素が動き領域に属しないと判定し、領域の判定される画素に対応する動き領域判定フラグに、動き領域に属しないことを示す”0”を設定する。
【0223】
領域判定部203−2は、このように”1”または”0”が設定された動き領域判定フラグを判定フラグ格納フレームメモリ204に供給する。
【0224】
領域判定部203−3は、静動判定部202−3から供給された静動判定が動きを示し、かつ、静動判定部202−4から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素がカバードバックグラウンド領域に属すると判定し、領域の判定される画素に対応するカバードバックグラウンド領域判定フラグに、カバードバックグラウンド領域に属することを示す”1”を設定する。
【0225】
領域判定部203−3は、静動判定部202−3から供給された静動判定が静止を示すか、または、静動判定部202−4から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素がカバードバックグラウンド領域に属しないと判定し、領域の判定される画素に対応するカバードバックグラウンド領域判定フラグに、カバードバックグラウンド領域に属しないことを示す”0”を設定する。
【0226】
領域判定部203−3は、このように”1”または”0”が設定されたカバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ204に供給する。
【0227】
判定フラグ格納フレームメモリ204は、領域判定部203−1から供給されたアンカバードバックグラウンド領域判定フラグ、領域判定部203−2から供給された静止領域判定フラグ、領域判定部203−2から供給された動き領域判定フラグ、および領域判定部203−3から供給されたカバードバックグラウンド領域判定フラグをそれぞれ記憶する。
【0228】
判定フラグ格納フレームメモリ204は、記憶しているアンカバードバックグラウンド領域判定フラグ、静止領域判定フラグ、動き領域判定フラグ、およびカバードバックグラウンド領域判定フラグを合成部205に供給する。合成部205は、判定フラグ格納フレームメモリ204から供給された、アンカバードバックグラウンド領域判定フラグ、静止領域判定フラグ、動き領域判定フラグ、およびカバードバックグラウンド領域判定フラグを基に、各画素が、アンカバードバックグラウンド領域、静止領域、動き領域、およびカバードバックグラウンド領域のいずれかに属することを示す領域情報を生成し、判定フラグ格納フレームメモリ206に供給する。
【0229】
判定フラグ格納フレームメモリ206は、合成部205から供給された領域情報を記憶すると共に、記憶している領域情報を出力する。
【0230】
次に、領域特定部103の処理の例を図33乃至図37を参照して説明する。
【0231】
前景に対応するオブジェクトが移動しているとき、オブジェクトに対応する画像の画面上の位置は、フレーム毎に変化する。図33に示すように、フレーム#nにおいて、Yn(x,y)で示される位置に位置するオブジェクトに対応する画像は、次のフレームであるフレーム#n+1において、Yn+1(x,y)に位置する。
【0232】
前景のオブジェクトに対応する画像の動き方向に隣接して1列に並ぶ画素の画素値を時間方向に展開したモデル図を図34に示す。例えば、前景のオブジェクトに対応する画像の動き方向が画面に対して水平であるとき、図34におけるモデル図は、1つのライン上の隣接する画素の画素値を時間方向に展開したモデルを示す。
【0233】
図34において、フレーム#nにおけるラインは、フレーム#n+1におけるラインと同一である。
【0234】
フレーム#nにおいて、左から2番目の画素乃至13番目の画素に含まれているオブジェクトに対応する前景の成分は、フレーム#n+1において、左から6番目乃至17番目の画素に含まれる。
【0235】
フレーム#nにおいて、カバードバックグラウンド領域に属する画素は、左から11番目乃至13番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から2番目乃至4番目の画素である。フレーム#n+1において、カバードバックグラウンド領域に属する画素は、左から15番目乃至17番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から6番目乃至8番目の画素である。
【0236】
図34に示す例において、フレーム#nに含まれる前景の成分が、フレーム#n+1において4画素移動しているので、動き量vは、4である。仮想分割数は、動き量vに対応し、4である。
【0237】
次に、注目しているフレームの前後における混合領域に属する画素の画素値の変化について説明する。
【0238】
図35に示す、背景が静止し、前景の動き量vが4であるフレーム#nにおいて、カバードバックグラウンド領域に属する画素は、左から15番目乃至17番目の画素である。動き量vが4であるので、1つ前のフレーム#n-1において、左から15番目乃至17番目の画素は、背景の成分のみを含み、背景領域に属する。
また、更に1つ前のフレーム#n-2において、左から15番目乃至17番目の画素は、背景の成分のみを含み、背景領域に属する。
【0239】
ここで、背景に対応するオブジェクトが静止しているので、フレーム#n-1の左から15番目の画素の画素値は、フレーム#n-2の左から15番目の画素の画素値から変化しない。同様に、フレーム#n-1の左から16番目の画素の画素値は、フレーム#n-2の左から16番目の画素の画素値から変化せず、フレーム#n-1の左から17番目の画素の画素値は、フレーム#n-2の左から17番目の画素の画素値から変化しない。
【0240】
すなわち、フレーム#nにおけるカバードバックグラウンド領域に属する画素に対応する、フレーム#n-1およびフレーム#n-2の画素は、背景の成分のみから成り、画素値が変化しないので、その差の絶対値は、ほぼ0の値となる。従って、フレーム#nにおける混合領域に属する画素に対応する、フレーム#n-1およびフレーム#n-2の画素に対する静動判定は、静動判定部202−4により、静止と判定される。
【0241】
フレーム#nにおけるカバードバックグラウンド領域に属する画素は、前景の成分を含むので、フレーム#n-1における背景の成分のみから成る場合と、画素値が異なる。従って、フレーム#nにおける混合領域に属する画素、および対応するフレーム#n-1の画素に対する静動判定は、静動判定部202−3により、動きと判定される。
【0242】
このように、領域判定部203−3は、静動判定部202−3から動きを示す静動判定の結果が供給され、静動判定部202−4から静止を示す静動判定の結果が供給されたとき、対応する画素がカバードバックグラウンド領域に属すると判定する。
【0243】
図36に示す、背景が静止し、前景の動き量vが4であるフレーム#nにおいて、アンカバードバックグラウンド領域に含まれる画素は、左から2番目乃至4番目の画素である。動き量vが4であるので、1つ後のフレーム#n+1において、左から2番目乃至4番目の画素は、背景の成分のみを含み、背景領域に属する。また、更に1つ後のフレーム#n+2において、左から2番目乃至4番目の画素は、背景の成分のみを含み、背景領域に属する。
【0244】
ここで、背景に対応するオブジェクトが静止しているので、フレーム#n+2の左から2番目の画素の画素値は、フレーム#n+1の左から2番目の画素の画素値から変化しない。同様に、フレーム#n+2の左から3番目の画素の画素値は、フレーム#n+1の左から3番目の画素の画素値から変化せず、フレーム#n+2の左から4番目の画素の画素値は、フレーム#n+1の左から4番目の画素の画素値から変化しない。
【0245】
すなわち、フレーム#nにおけるアンカバードバックグラウンド領域に属する画素に対応する、フレーム#n+1およびフレーム#n+2の画素は、背景の成分のみから成り、画素値が変化しないので、その差の絶対値は、ほぼ0の値となる。従って、フレーム#nにおける混合領域に属する画素に対応する、フレーム#n+1およびフレーム#n+2の画素に対する静動判定は、静動判定部202−1により、静止と判定される。
【0246】
フレーム#nにおけるアンカバードバックグラウンド領域に属する画素は、前景の成分を含むので、フレーム#n+1における背景の成分のみから成る場合と、画素値が異なる。従って、フレーム#nにおける混合領域に属する画素、および対応するフレーム#n+1の画素に対する静動判定は、静動判定部202−2により、動きと判定される。
【0247】
このように、領域判定部203−1は、静動判定部202−2から動きを示す静動判定の結果が供給され、静動判定部202−1から静止を示す静動判定の結果が供給されたとき、対応する画素がアンカバードバックグラウンド領域に属すると判定する。
【0248】
図37は、フレーム#nにおける領域特定部103の判定条件を示す図である。
フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-2の画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素とが静止と判定され、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素と、フレーム#nの画素とが動きと判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素がカバードバックグラウンド領域に属すると判定する。
【0249】
フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素と、フレーム#nの画素とが静止と判定され、フレーム#nの画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素とが静止と判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素が静止領域に属すると判定する。
【0250】
フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素と、フレーム#nの画素とが動きと判定され、フレーム#nの画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素とが動きと判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素が動き領域に属すると判定する。
【0251】
フレーム#nの画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素とが動きと判定され、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+2の画素とが静止と判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素がアンカバードバックグラウンド領域に属すると判定する。
【0252】
図38は、領域特定部103の領域の特定の結果の例を示す図である。図38(A)において、カバードバックグラウンド領域に属すると判定された画素は、白で表示されている。図38(B)において、アンカバードバックグラウンド領域に属すると判定された画素は、白で表示されている。
【0253】
図38(C)において、動き領域に属すると判定された画素は、白で表示されている。図38(D)において、静止領域に属すると判定された画素は、白で表示されている。
【0254】
図39は、判定フラグ格納フレームメモリ206が出力する領域情報の内、混合領域を示す領域情報を画像として示す図である。図39において、カバードバックグラウンド領域またはアンカバードバックグラウンド領域に属すると判定された画素、すなわち混合領域に属すると判定された画素は、白で表示されている。判定フラグ格納フレームメモリ206が出力する混合領域を示す領域情報は、混合領域、および前景領域内のテクスチャの無い部分に囲まれたテクスチャの有る部分を示す。
【0255】
次に、図40のフローチャートを参照して、領域特定部103の領域特定の処理を説明する。ステップS201において、フレームメモリ201は、判定の対象となるフレーム#nを含むフレーム#n-2乃至フレーム#n+2の画像を取得する。
【0256】
ステップS202において、静動判定部202−3は、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、静止か否かを判定し、静止と判定された場合、ステップS203に進み、静動判定部202−2は、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止か否かを判定する。
【0257】
ステップS203において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止と判定された場合、ステップS204に進み、領域判定部203−2は、領域の判定される画素に対応する静止領域判定フラグに、静止領域に属することを示す”1”を設定する。領域判定部203−2は、静止領域判定フラグを判定フラグ格納フレームメモリ204に供給し、手続きは、ステップS205に進む。
【0258】
ステップS202において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きと判定された場合、または、ステップS203において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きと判定された場合、フレーム#nの画素が静止領域には属さないので、ステップS204の処理はスキップされ、手続きは、ステップS205に進む。
【0259】
ステップS205において、静動判定部202−3は、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きか否かを判定し、動きと判定された場合、ステップS206に進み、静動判定部202−2は、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きか否かを判定する。
【0260】
ステップS206において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きと判定された場合、ステップS207に進み、領域判定部203−2は、領域の判定される画素に対応する動き領域判定フラグに、動き領域に属することを示す”1”を設定する。領域判定部203−2は、動き領域判定フラグを判定フラグ格納フレームメモリ204に供給し、手続きは、ステップS208に進む。
【0261】
ステップS205において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、静止と判定された場合、または、ステップS206において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止と判定された場合、フレーム#nの画素が動き領域には属さないので、ステップS207の処理はスキップされ、手続きは、ステップS208に進む。
【0262】
ステップS208において、静動判定部202−4は、フレーム#n-2の画素とフレーム#n-1の同一位置の画素とで、静止か否かを判定し、静止と判定された場合、ステップS209に進み、静動判定部202−3は、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きか否かを判定する。
【0263】
ステップS209において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きと判定された場合、ステップS210に進み、領域判定部203−3は、領域の判定される画素に対応するカバードバックグラウンド領域判定フラグに、カバードバックグラウンド領域に属することを示す”1”を設定する。領域判定部203−3は、カバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ204に供給し、手続きは、ステップS211に進む。
【0264】
ステップS208において、フレーム#n-2の画素とフレーム#n-1の同一位置の画素とで、動きと判定された場合、または、ステップS209において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、静止と判定された場合、フレーム#nの画素がカバードバックグラウンド領域には属さないので、ステップS210の処理はスキップされ、手続きは、ステップS211に進む。
【0265】
ステップS211において、静動判定部202−2は、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きか否かを判定し、動きと判定された場合、ステップS212に進み、静動判定部202−1は、フレーム#n+1の画素とフレーム#n+2の同一位置の画素とで、静止か否かを判定する。
【0266】
ステップS212において、フレーム#n+1の画素とフレーム#n+2の同一位置の画素とで、静止と判定された場合、ステップS213に進み、領域判定部203−1は、領域の判定される画素に対応するアンカバードバックグラウンド領域判定フラグに、アンカバードバックグラウンド領域に属することを示す”1”を設定する。領域判定部203−1は、アンカバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ204に供給し、手続きは、ステップS214に進む。
【0267】
ステップS211において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止と判定された場合、または、ステップS212において、フレーム#n+1の画素とフレーム#n+2の同一位置の画素とで、動きと判定された場合、フレーム#nの画素がアンカバードバックグラウンド領域には属さないので、ステップS213の処理はスキップされ、手続きは、ステップS214に進む。
【0268】
ステップS214において、領域特定部103は、フレーム#nの全ての画素について領域を特定したか否かを判定し、フレーム#nの全ての画素について領域を特定していないと判定された場合、手続きは、ステップS202に戻り、他の画素について、領域特定の処理を繰り返す。
【0269】
ステップS214において、フレーム#nの全ての画素について領域を特定したと判定された場合、ステップS215に進み、合成部205は、判定フラグ格納フレームメモリ204に記憶されているアンカバードバックグラウンド領域判定フラグ、およびカバードバックグラウンド領域判定フラグを基に、混合領域を示す領域情報を生成し、更に、各画素が、アンカバードバックグラウンド領域、静止領域、動き領域、およびカバードバックグラウンド領域のいずれかに属することを示す領域情報を生成し、生成した領域情報を判定フラグ格納フレームメモリ206に設定し、処理は終了する。
【0270】
このように、領域特定部103は、フレームに含まれている画素のそれぞれについて、動き領域、静止領域、アンカバードバックグラウンド領域、またはカバードバックグラウンド領域に属することを示す領域情報を生成することができる。
【0271】
なお、領域特定部103は、アンカバードバックグラウンド領域およびカバードバックグラウンド領域に対応する領域情報に論理和を適用することにより、混合領域に対応する領域情報を生成して、フレームに含まれている画素のそれぞれについて、動き領域、静止領域、または混合領域に属することを示すフラグから成る領域情報を生成するようにしてもよい。
【0272】
前景に対応するオブジェクトがテクスチャを有す場合、領域特定部103は、より正確に動き領域を特定することができる。
【0273】
領域特定部103は、動き領域を示す領域情報を前景領域を示す領域情報として、また、静止領域を示す領域情報を背景領域を示す領域情報として出力することができる。
【0274】
なお、背景に対応するオブジェクトが静止しているとして説明したが、背景領域に対応する画像が動きを含んでいても上述した領域を特定する処理を適用することができる。例えば、背景領域に対応する画像が一様に動いているとき、領域特定部103は、この動きに対応して画像全体をシフトさせ、背景に対応するオブジェクトが静止している場合と同様に処理する。また、背景領域に対応する画像が局所毎に異なる動きを含んでいるとき、領域特定部103は、動きに対応した画素を選択して、上述の処理を実行する。
【0275】
図41は、領域特定部103の構成の他の例を示すブロック図である。図41に示す領域特定部103は、動きベクトルを使用しない。背景画像生成部301は、入力画像に対応する背景画像を生成し、生成した背景画像を2値オブジェクト画像抽出部302に供給する。背景画像生成部301は、例えば、入力画像に含まれる背景のオブジェクトに対応する画像オブジェクトを抽出して、背景画像を生成する。
【0276】
前景のオブジェクトに対応する画像の動き方向に隣接して1列に並ぶ画素の画素値を時間方向に展開したモデル図の例を図42に示す。例えば、前景のオブジェクトに対応する画像の動き方向が画面に対して水平であるとき、図42におけるモデル図は、1つのライン上の隣接する画素の画素値を時間方向に展開したモデルを示す。
【0277】
図42において、フレーム#nにおけるラインは、フレーム#n-1およびフレーム#n+1におけるラインと同一である。
【0278】
フレーム#nにおいて、左から6番目の画素乃至17番目の画素に含まれているオブジェクトに対応する前景の成分は、フレーム#n-1において、左から2番目乃至13番目の画素に含まれ、フレーム#n+1において、左から10番目乃至21番目の画素に含まれる。
【0279】
フレーム#n-1において、カバードバックグラウンド領域に属する画素は、左から11番目乃至13番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から2番目乃至4番目の画素である。フレーム#nにおいて、カバードバックグラウンド領域に属する画素は、左から15番目乃至17番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から6番目乃至8番目の画素である。フレーム#n+1において、カバードバックグラウンド領域に属する画素は、左から19番目乃至21番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から10番目乃至12番目の画素である。
【0280】
フレーム#n-1において、背景領域に属する画素は、左から1番目の画素、および左から14番目乃至21番目の画素である。フレーム#nにおいて、背景領域に属する画素は、左から1番目乃至5番目の画素、および左から18番目乃至21番目の画素である。フレーム#n+1において、背景領域に属する画素は、左から1番目乃至9番目の画素である。
【0281】
背景画像生成部301が生成する、図42の例に対応する背景画像の例を図43に示す。背景画像は、背景のオブジェクトに対応する画素から構成され、前景のオブジェクトに対応する画像の成分を含まない。
【0282】
2値オブジェクト画像抽出部302は、背景画像および入力画像の相関を基に、2値オブジェクト画像を生成し、生成した2値オブジェクト画像を時間変化検出部303に供給する。
【0283】
図44は、2値オブジェクト画像抽出部302の構成を示すブロック図である。相関値演算部321は、背景画像生成部301から供給された背景画像および入力画像の相関を演算し、相関値を生成して、生成した相関値をしきい値処理部322に供給する。
【0284】
相関値演算部321は、例えば、図45(A)に示すように、X4を中心とした3×3の背景画像の中のブロックと、図45(B)に示すように、背景画像の中のブロックに対応するY4を中心とした3×3の入力画像の中のブロックに、式(4)を適用して、Y4に対応する相関値を算出する。
【0285】
【数2】
【数3】
【数4】
【0286】
相関値演算部321は、このように各画素に対応して算出された相関値をしきい値処理部322に供給する。
【0287】
また、相関値演算部321は、例えば、図46(A)に示すように、X4を中心とした3×3の背景画像の中のブロックと、図46(B)に示すように、背景画像の中のブロックに対応するY4を中心とした3×3の入力画像の中のブロックに、式(7)を適用して、Y4に対応する差分絶対値を算出するようにしてもよい。
【0288】
【数5】
【0289】
相関値演算部321は、このように算出された差分絶対値を相関値として、しきい値処理部322に供給する。
【0290】
しきい値処理部322は、相関画像の画素値としきい値th0とを比較して、相関値がしきい値th0以下である場合、2値オブジェクト画像の画素値に1を設定し、相関値がしきい値th0より大きい場合、2値オブジェクト画像の画素値に0を設定して、0または1が画素値に設定された2値オブジェクト画像を出力する。しきい値処理部322は、しきい値th0を予め記憶するようにしてもよく、または、外部から入力されたしきい値th0を使用するようにしてもよい。
【0291】
図47は、図42に示す入力画像のモデルに対応する2値オブジェクト画像の例を示す図である。2値オブジェクト画像において、背景画像と相関の高い画素には、画素値に0が設定される。
【0292】
図48は、時間変化検出部303の構成を示すブロック図である。フレームメモリ341は、フレーム#nの画素について領域を判定するとき、2値オブジェクト画像抽出部302から供給された、フレーム#n-1、フレーム#n、およびフレーム#n+1の2値オブジェクト画像を記憶する。
【0293】
領域判定部342は、フレームメモリ341に記憶されているフレーム#n-1、フレーム#n、およびフレーム#n+1の2値オブジェクト画像を基に、フレーム#nの各画素について領域を判定して、領域情報を生成し、生成した領域情報を出力する。
【0294】
図49は、領域判定部342の判定を説明する図である。フレーム#nの2値オブジェクト画像の注目している画素が0であるとき、領域判定部342は、フレーム#nの注目している画素が背景領域に属すると判定する。
【0295】
フレーム#nの2値オブジェクト画像の注目している画素が1であり、フレーム#n-1の2値オブジェクト画像の対応する画素が1であり、フレーム#n+1の2値オブジェクト画像の対応する画素が1であるとき、領域判定部342は、フレーム#nの注目している画素が前景領域に属すると判定する。
【0296】
フレーム#nの2値オブジェクト画像の注目している画素が1であり、フレーム#n-1の2値オブジェクト画像の対応する画素が0であるとき、領域判定部342は、フレーム#nの注目している画素がカバードバックグラウンド領域に属すると判定する。
【0297】
フレーム#nの2値オブジェクト画像の注目している画素が1であり、フレーム#n+1の2値オブジェクト画像の対応する画素が0であるとき、領域判定部342は、フレーム#nの注目している画素がアンカバードバックグラウンド領域に属すると判定する。
【0298】
図50は、図42に示す入力画像のモデルに対応する2値オブジェクト画像について、時間変化検出部303の判定した例を示す図である。時間変化検出部303は、2値オブジェクト画像のフレーム#nの対応する画素が0なので、フレーム#nの左から1番目乃至5番目の画素を背景領域に属すると判定する。
【0299】
時間変化検出部303は、2値オブジェクト画像のフレーム#nの画素が1であり、フレーム#n+1の対応する画素が0なので、左から6番目乃至9番目の画素をアンカバードバックグラウンド領域に属すると判定する。
【0300】
時間変化検出部303は、2値オブジェクト画像のフレーム#nの画素が1であり、フレーム#n-1の対応する画素が1であり、フレーム#n+1の対応する画素が1なので、左から10番目乃至13番目の画素を前景領域に属すると判定する。
【0301】
時間変化検出部303は、2値オブジェクト画像のフレーム#nの画素が1であり、フレーム#n-1の対応する画素が0なので、左から14番目乃至17番目の画素をカバードバックグラウンド領域に属すると判定する。
【0302】
時間変化検出部303は、2値オブジェクト画像のフレーム#nの対応する画素が0なので、左から18番目乃至21番目の画素を背景領域に属すると判定する。
【0303】
次に、図51のフローチャートを参照して、領域判定部103の領域特定の処理を説明する。ステップS301において、領域判定部103の背景画像生成部301は、入力画像を基に、例えば、入力画像に含まれる背景のオブジェクトに対応する画像オブジェクトを抽出して背景画像を生成し、生成した背景画像を2値オブジェクト画像抽出部302に供給する。
【0304】
ステップS302において、2値オブジェクト画像抽出部302は、例えば、図45を参照して説明した演算により、入力画像と背景画像生成部301から供給された背景画像との相関値を演算する。ステップS303において、2値オブジェクト画像抽出部302は、例えば、相関値としきい値th0とを比較することにより、相関値およびしきい値th0から2値オブジェクト画像を演算する。
【0305】
ステップS304において、時間変化検出部303は、領域判定の処理を実行して、処理は終了する。
【0306】
図52のフローチャートを参照して、ステップS304に対応する領域判定の処理の詳細を説明する。ステップS321において、時間変化検出部303の領域判定部342は、フレームメモリ341に記憶されているフレーム#nにおいて、注目する画素が0であるか否かを判定し、フレーム#nにおいて、注目する画素が0であると判定された場合、ステップS322に進み、フレーム#nの注目する画素が背景領域に属すると設定して、処理は終了する。
【0307】
ステップS321において、フレーム#nにおいて、注目する画素が1であると判定された場合、ステップS323に進み、時間変化検出部303の領域判定部342は、フレームメモリ341に記憶されているフレーム#nにおいて、注目する画素が1であり、かつ、フレーム#n-1において、対応する画素が0であるか否かを判定し、フレーム#nにおいて、注目する画素が1であり、かつ、フレーム#n-1において、対応する画素が0であると判定された場合、ステップS324に進み、フレーム#nの注目する画素がカバードバックグラウンド領域に属すると設定して、処理は終了する。
【0308】
ステップS323において、フレーム#nにおいて、注目する画素が0であるか、または、フレーム#n-1において、対応する画素が1であると判定された場合、ステップS325に進み、時間変化検出部303の領域判定部342は、フレームメモリ341に記憶されているフレーム#nにおいて、注目する画素が1であり、かつ、フレーム#n+1において、対応する画素が0であるか否かを判定し、フレーム#nにおいて、注目する画素が1であり、かつ、フレーム#n+1において、対応する画素が0であると判定された場合、ステップS326に進み、フレーム#nの注目する画素がアンカバードバックグラウンド領域に属すると設定して、処理は終了する。
【0309】
ステップS325において、フレーム#nにおいて、注目する画素が0であるか、または、フレーム#n+1において、対応する画素が1であると判定された場合、ステップS327に進み、時間変化検出部303の領域判定部342は、フレーム#nの注目する画素を前景領域と設定して、処理は終了する。
【0310】
このように、領域特定部103は、入力された画像と対応する背景画像との相関値を基に、入力画像の画素が前景領域、背景領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域のいずれかに属するかを特定して、特定した結果に対応する領域情報を生成することができる。
【0311】
図53は、領域特定部103の他の構成を示すブロック図である。図53に示す領域特定部103は、動き検出部102から供給される動きベクトルとその位置情報を使用する。図41に示す場合と同様の部分には、同一の番号を付してあり、その説明は省略する。
【0312】
ロバスト化部361は、2値オブジェクト画像抽出部302から供給された、N個のフレームの2値オブジェクト画像を基に、ロバスト化された2値オブジェクト画像を生成して、時間変化検出部303に出力する。
【0313】
図54は、ロバスト化部361の構成を説明するブロック図である。動き補償部381は、動き検出部102から供給された動きベクトルとその位置情報を基に、N個のフレームの2値オブジェクト画像の動きを補償して、動きが補償された2値オブジェクト画像をスイッチ382に出力する。
【0314】
図55および図56の例を参照して、動き補償部381の動き補償について説明する。例えば、フレーム#nの領域を判定するとき、図55に例を示すフレーム#n-1、フレーム#n、およびフレーム#n+1の2値オブジェクト画像が入力された場合、動き補償部381は、動き検出部102から供給された動きベクトルを基に、図56に例を示すように、フレーム#n-1の2値オブジェクト画像、およびフレーム#n+1の2値オブジェクト画像を動き補償して、動き補償された2値オブジェクト画像をスイッチ382に供給する。
【0315】
スイッチ382は、1番目のフレームの動き補償された2値オブジェクト画像をフレームメモリ383−1に出力し、2番目のフレームの動き補償された2値オブジェクト画像をフレームメモリ383−2に出力する。同様に、スイッチ382は、3番目乃至N−1番目のフレームの動き補償された2値オブジェクト画像のそれぞれをフレームメモリ383−3乃至フレームメモリ383−(N−1)のいずれかに出力し、N番目のフレームの動き補償された2値オブジェクト画像をフレームメモリ383−Nに出力する。
【0316】
フレームメモリ383−1は、1番目のフレームの動き補償された2値オブジェクト画像を記憶し、記憶されている2値オブジェクト画像を重み付け部384−1に出力する。フレームメモリ383−2は、2番目のフレームの動き補償された2値オブジェクト画像を記憶し、記憶されている2値オブジェクト画像を重み付け部384−2に出力する。
【0317】
同様に、フレームメモリ383−3乃至フレームメモリ383−(N−1)のそれぞれは、3番目のフレーム乃至N−1番目のフレームの動き補償された2値オブジェクト画像のいずれかを記憶し、記憶されている2値オブジェクト画像を重み付け部384−3乃至重み付け部384−(N−1)のいずれかに出力する。フレームメモリ383−Nは、N番目のフレームの動き補償された2値オブジェクト画像を記憶し、記憶されている2値オブジェクト画像を重み付け部384−Nに出力する。
【0318】
重み付け部384−1は、フレームメモリ383−1から供給された1番目のフレームの動き補償された2値オブジェクト画像の画素値に予め定めた重みw1を乗じて、積算部385に供給する。重み付け部384−2は、フレームメモリ383−2から供給された2番目のフレームの動き補償された2値オブジェクト画像の画素値に予め定めた重みw2を乗じて、積算部385に供給する。
【0319】
同様に、重み付け部384−3乃至重み付け部384−(N−1)のそれぞれは、フレームメモリ383−3乃至フレームメモリ383−(N−1)のいずれかから供給された3番目乃至N−1番目のいずれかのフレームの動き補償された2値オブジェクト画像の画素値に予め定めた重みw3乃至重みw(N-1)のいずれかを乗じて、積算部385に供給する。重み付け部384−Nは、フレームメモリ383−Nから供給されたN番目のフレームの動き補償された2値オブジェクト画像の画素値に予め定めた重みwNを乗じて、積算部385に供給する。
【0320】
積算部385は、1乃至N番目のフレームの動き補償され、それぞれ重みw1乃至wNのいずれかが乗じられた、2値オブジェクト画像の対応する画素値を積算して、積算された画素値を予め定めたしきい値th0と比較することにより2値オブジェクト画像を生成する。
【0321】
このように、ロバスト化部361は、N個の2値オブジェクト画像からロバスト化された2値オブジェト画像を生成して、時間変化検出部303に供給するので、図53に構成を示す領域特定部103は、入力画像にノイズが含まれていても、図41に示す場合に比較して、より正確に領域を特定することができる。
【0322】
次に、図53に構成を示す領域特定部103の領域特定の処理について、図57のフローチャートを参照して説明する。ステップS341乃至ステップS343の処理は、図51のフローチャートで説明したステップS301乃至ステップS303とそれぞれ同様なのでその説明は省略する。
【0323】
ステップS344において、ロバスト化部361は、ロバスト化の処理を実行する。
【0324】
ステップS345において、時間変化検出部303は、領域判定の処理を実行して、処理は終了する。ステップS345の処理の詳細は、図52のフローチャートを参照して説明した処理と同様なのでその説明は省略する。
【0325】
次に、図58のフローチャートを参照して、図57のステップS344の処理に対応する、ロバスト化の処理の詳細について説明する。ステップS361において、動き補償部381は、動き検出部102から供給される動きベクトルとその位置情報を基に、入力された2値オブジェクト画像の動き補償の処理を実行する。ステップS362において、フレームメモリ383−1乃至383−Nのいずれかは、スイッチ382を介して供給された動き補償された2値オブジェクト画像を記憶する。
【0326】
ステップS363において、ロバスト化部361は、N個の2値オブジェクト画像が記憶されたか否かを判定し、N個の2値オブジェクト画像が記憶されていないと判定された場合、ステップS361に戻り、2値オブジェクト画像の動き補償の処理および2値オブジェクト画像の記憶の処理を繰り返す。
【0327】
ステップS363において、N個の2値オブジェクト画像が記憶されたと判定された場合、ステップS364に進み、重み付け部384−1乃至384−Nのそれぞれは、N個の2値オブジェクト画像のそれぞれにw1乃至wNのいずれかの重みを乗じて、重み付けする。
【0328】
ステップS365において、積算部385は、重み付けされたN個の2値オブジェクト画像を積算する。
【0329】
ステップS366において、積算部385は、例えば、予め定められたしきい値th1との比較などにより、積算された画像から2値オブジェクト画像を生成して、処理は終了する。
【0330】
このように、図53に構成を示す領域特定部103は、ロバスト化された2値オブジェクト画像を基に、領域情報を生成することができる。
【0331】
以上のように、領域特定部103は、フレームに含まれている画素のそれぞれについて、動き領域、静止領域、アンカバードバックグラウンド領域、またはカバードバックグラウンド領域に属することを示す領域情報を生成することができる。
【0332】
図59は、混合比算出部104の構成の一例を示すブロック図である。推定混合比処理部401は、入力画像を基に、カバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を混合比決定部403に供給する。
【0333】
推定混合比処理部402は、入力画像を基に、アンカバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を混合比決定部403に供給する。
【0334】
前景に対応するオブジェクトがシャッタ時間内に等速で動いていると仮定できるので、混合領域に属する画素の混合比αは、以下の性質を有する。すなわち、混合比αは、画素の位置の変化に対応して、直線的に変化する。画素の位置の変化を1次元とすれば、混合比αの変化は、直線で表現することができ、画素の位置の変化を2次元とすれば、混合比αの変化は、平面で表現することができる。
【0335】
なお、1フレームの期間は短いので、前景に対応するオブジェクトが剛体であり、等速で移動していると仮定が成り立つ。
【0336】
この場合、混合比αの傾きは、前景のシャッタ時間内での動き量vの逆比となる。
【0337】
理想的な混合比αの例を図60に示す。理想的な混合比αの混合領域における傾きlは、動き量vの逆数として表すことができる。
【0338】
図60に示すように、理想的な混合比αは、背景領域において、1の値を有し、前景領域において、0の値を有し、混合領域において、0を越え1未満の値を有する。
【0339】
図61の例において、フレーム#nの左から7番目の画素の画素値C06は、フレーム#n-1の左から7番目の画素の画素値P06を用いて、式(8)で表すことができる。
【0340】
【数6】
【0341】
式(8)において、画素値C06を混合領域の画素の画素値Mと、画素値P06を背景領域の画素の画素値Bと表現する。すなわち、混合領域の画素の画素値Mおよび背景領域の画素の画素値Bは、それぞれ、式(9)および式(10)のように表現することができる。
【0342】
M=C06 (9)
B=P06 (10)
【0343】
式(8)中の2/vは、混合比αに対応する。動き量vが4なので、フレーム#nの左から7番目の画素の混合比αは、0.5となる。
【0344】
以上のように、注目しているフレーム#nの画素値Cを混合領域の画素値と見なし、フレーム#nの前のフレーム#n-1の画素値Pを背景領域の画素値と見なすことで、混合比αを示す式(3)は、式(11)のように書き換えられる。
【0345】
C=α・P+f (11)
式(11)のfは、注目している画素に含まれる前景の成分の和ΣiFi/vである。
式(11)に含まれる変数は、混合比αおよび前景の成分の和fの2つである。
【0346】
同様に、アンカバードバックグラウンド領域における、動き量vが4であり、時間方向の仮想分割数が4である、画素値を時間方向に展開したモデルを図62に示す。
【0347】
アンカバードバックグラウンド領域において、上述したカバードバックグラウンド領域における表現と同様に、注目しているフレーム#nの画素値Cを混合領域の画素値と見なし、フレーム#nの後のフレーム#n+1の画素値Nを背景領域の画素値と見なすことで、混合比αを示す式(3)は、式(12)のように表現することができる。
【0348】
C=α・N+f (12)
【0349】
なお、背景のオブジェクトが静止しているとして説明したが、背景のオブジェクトが動いている場合においても、背景の動き量vに対応させた位置の画素の画素値を利用することにより、式(8)乃至式(12)を適用することができる。
例えば、図61において、背景に対応するオブジェクトの動き量vが2であり、仮想分割数が2であるとき、背景に対応するオブジェクトが図中の右側に動いているとき、式(10)における背景領域の画素の画素値Bは、画素値P04とされる。
【0350】
式(11)および式(12)は、それぞれ2つの変数を含むので、そのままでは混合比αを求めることができない。ここで、画像は一般的に空間的に相関が強いので近接する画素同士でほぼ同じ画素値となる。
【0351】
そこで、前景成分は、空間的に相関が強いので、前景の成分の和fを前または後のフレームから導き出せるように式を変形して、混合比αを求める。
【0352】
図63のフレーム#nの左から7番目の画素の画素値Mcは、式(13)で表すことができる。
【0353】
【数7】
式(13)の右辺第1項の2/vは、混合比αに相当する。式(13)の右辺第2項は、後のフレーム#n+1の画素値を利用して、式(14)のように表すこととする。
【0354】
【数8】
【0355】
ここで、前景の成分の空間相関を利用して、式(15)が成立するとする。
【0356】
F=F05=F06=F07=F08=F09=F10=F11=F12 (15)
式(14)は、式(15)を利用して、式(16)のように置き換えることができる。
【0357】
【数9】
【0358】
結果として、βは、式(17)で表すことができる。
【0359】
β=2/4 (17)
【0360】
一般的に、式(15)に示すように混合領域に関係する前景の成分が等しいと仮定すると、混合領域の全ての画素について、内分比の関係から式(18)が成立する。
【0361】
β=1-α (18)
【0362】
式(18)が成立するとすれば、式(11)は、式(19)に示すように展開することができる。
【0363】
【数10】
【0364】
同様に、式(18)が成立するとすれば、式(12)は、式(20)に示すように展開することができる。
【0365】
【数11】
【0366】
式(19)および式(20)において、C,N、およびPは、既知の画素値なので、式(19)および式(20)に含まれる変数は、混合比αのみである。式(19)および式(20)における、C,N、およびPの関係を図64に示す。Cは、混合比αを算出する、フレーム#nの注目している画素の画素値である。Nは、注目している画素と空間方向の位置が対応する、フレーム#n+1の画素の画素値である。Pは、注目している画素と空間方向の位置が対応する、フレーム#n-1の画素の画素値である。
【0367】
従って、式(19)および式(20)のそれぞれに1つの変数が含まれることとなるので、3つのフレームの画素の画素値を利用して、混合比αを算出することができる。式(19)および式(20)を解くことにより、正しい混合比αが算出されるための条件は、混合領域に関係する前景の成分が等しい、すなわち、前景のオブジェクトが静止しているとき撮像された前景の画像オブジェクトにおいて、前景のオブジェクトの動きの方向に対応する、画像オブジェクトの境界に位置する画素であって、動き量vの2倍の数の連続している画素の画素値が、一定であることである。
【0368】
以上のように、カバードバックグラウンド領域に属する画素の混合比αは、式(21)により算出され、アンカバードバックグラウンド領域に属する画素の混合比αは、式(22)により算出される。
【0369】
α=(C-N)/(P-N) (21)
α=(C-P)/(N-P) (22)
【0370】
図65は、推定混合比処理部401の構成を示すブロック図である。フレームメモリ421は、入力された画像をフレーム単位で記憶し、入力画像として入力されているフレームから1つ後のフレームをフレームメモリ422および混合比演算部423に供給する。
【0371】
フレームメモリ422は、入力された画像をフレーム単位で記憶し、フレームメモリ421から供給されているフレームから1つ後のフレームを混合比演算部423に供給する。
【0372】
従って、入力画像としてフレーム#n+1が混合比演算部423に入力されているとき、フレームメモリ421は、フレーム#nを混合比演算部423に供給し、フレームメモリ422は、フレーム#n-1を混合比演算部423に供給する。
【0373】
混合比演算部423は、式(21)に示す演算により、フレーム#nの注目している画素の画素値C、注目している画素と空間的位置が対応する、フレーム#n+1の画素の画素値N、および注目している画素と空間的位置が対応する、フレーム#n-1の画素の画素値Pを基に、注目している画素の推定混合比を算出して、算出した推定混合比を出力する。例えば、背景が静止しているとき、混合比演算部423は、フレーム#nの注目している画素の画素値C、注目している画素とフレーム内の位置が同じ、フレーム#n+1の画素の画素値N、および注目している画素とフレーム内の位置が同じ、フレーム#n-1の画素の画素値Pを基に、注目している画素の推定混合比を算出して、算出した推定混合比を出力する。
【0374】
このように、推定混合比処理部401は、入力画像を基に、推定混合比を算出して、混合比決定部403に供給することができる。
【0375】
なお、推定混合比処理部402は、推定混合比処理部401が式(21)に示す演算により、注目している画素の推定混合比を算出するのに対して、式(22)に示す演算により、注目している画素の推定混合比を算出する部分が異なることを除き、推定混合比処理部401と同様なので、その説明は省略する。
【0376】
図66は、推定混合比処理部401により算出された推定混合比の例を示す図である。図66に示す推定混合比は、等速で動いているオブジェクトに対応する前景の動き量vが11である場合の結果を、1ラインに対して示すものである。
【0377】
推定混合比は、混合領域において、図60に示すように、ほぼ直線的に変化していることがわかる。
【0378】
図59に戻り、混合比決定部403は、領域特定部103から供給された、混合比αの算出の対象となる画素が、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す領域情報を基に、混合比αを設定する。混合比決定部403は、対象となる画素が前景領域に属する場合、0を混合比αに設定し、対象となる画素が背景領域に属する場合、1を混合比αに設定し、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部401から供給された推定混合比を混合比αに設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部402から供給された推定混合比を混合比αに設定する。混合比決定部403は、領域情報を基に設定した混合比αを出力する。
【0379】
図67は、混合比算出部104の他の構成を示すブロック図である。選択部441は、領域特定部103から供給された領域情報を基に、カバードバックグラウンド領域に属する画素および、これに対応する前および後のフレームの画素を推定混合比処理部442に供給する。選択部441は、領域特定部103から供給された領域情報を基に、アンカバードバックグラウンド領域に属する画素および、これに対応する前および後のフレームの画素を推定混合比処理部443に供給する。
【0380】
推定混合比処理部442は、選択部441から入力された画素値を基に、式(21)に示す演算により、カバードバックグラウンド領域に属する、注目している画素の推定混合比を算出して、算出した推定混合比を選択部444に供給する。
【0381】
推定混合比処理部443は、選択部441から入力された画素値を基に、式(22)に示す演算により、アンカバードバックグラウンド領域に属する、注目している画素の推定混合比を算出して、算出した推定混合比を選択部444に供給する。
【0382】
選択部444は、領域特定部103から供給された領域情報を基に、対象となる画素が前景領域に属する場合、0である推定混合比を選択して、混合比αに設定し、対象となる画素が背景領域に属する場合、1である推定混合比を選択して、混合比αに設定する。選択部444は、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部442から供給された推定混合比を選択して混合比αに設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部443から供給された推定混合比を選択して混合比αに設定する。選択部444は、領域情報を基に選択して設定した混合比αを出力する。
【0383】
このように、図67に示す他の構成を有する混合比算出部104は、画像の含まれる画素毎に混合比αを算出して、算出した混合比αを出力することができる。
【0384】
図68のフローチャートを参照して、図59に構成を示す混合比算出部104の混合比αの算出の処理を説明する。ステップS401において、混合比算出部104は、領域特定部103から供給された領域情報を取得する。ステップS402において、推定混合比処理部401は、カバードバックグラウンド領域に対応するモデルにより推定混合比の演算の処理を実行し、算出した推定混合比を混合比決定部403に供給する。混合比推定の演算の処理の詳細は、図69のフローチャートを参照して、後述する。
【0385】
ステップS403において、推定混合比処理部402は、アンカバードバックグラウンド領域に対応するモデルにより推定混合比の演算の処理を実行し、算出した推定混合比を混合比決定部403に供給する。
【0386】
ステップS404において、混合比算出部104は、フレーム全体について、混合比αを推定したか否かを判定し、フレーム全体について、混合比αを推定していないと判定された場合、ステップS402に戻り、次の画素について混合比αを推定する処理を実行する。
【0387】
ステップS404において、フレーム全体について、混合比αを推定したと判定された場合、ステップS405に進み、混合比決定部403は、画素が、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す、領域特定部103から供給された領域情報を基に、混合比αを設定する。混合比決定部403は、対象となる画素が前景領域に属する場合、0を混合比αに設定し、対象となる画素が背景領域に属する場合、1を混合比αに設定し、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部401から供給された推定混合比を混合比αに設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部402から供給された推定混合比を混合比αに設定し、処理は終了する。
【0388】
このように、混合比算出部104は、領域特定部103から供給された領域情報、および入力画像を基に、各画素に対応する特徴量である混合比αを算出することができる。
【0389】
図67に構成を示す混合比算出部104の混合比αの算出の処理は、図68のフローチャートで説明した処理と同様なので、その説明は省略する。
【0390】
次に、図68のステップS402に対応する、カバードバックグラウンド領域に対応するモデルによる混合比推定の処理を図69のフローチャートを参照して説明する。
【0391】
ステップS421において、混合比演算部423は、フレームメモリ421から、フレーム#nの注目画素の画素値Cを取得する。
【0392】
ステップS422において、混合比演算部423は、フレームメモリ422から、注目画素に対応する、フレーム#n-1の画素の画素値Pを取得する。
【0393】
ステップS423において、混合比演算部423は、入力画像に含まれる注目画素に対応する、フレーム#n+1の画素の画素値Nを取得する。
【0394】
ステップS424において、混合比演算部423は、フレーム#nの注目画素の画素値C、フレーム#n-1の画素の画素値P、およびフレーム#n+1の画素の画素値Nを基に、推定混合比を演算する。
【0395】
ステップS425において、混合比演算部423は、フレーム全体について、推定混合比を演算する処理を終了したか否かを判定し、フレーム全体について、推定混合比を演算する処理を終了していないと判定された場合、ステップS421に戻り、次の画素について推定混合比を算出する処理を繰り返す。
【0396】
ステップS425において、フレーム全体について、推定混合比を演算する処理を終了したと判定された場合、処理は終了する。
【0397】
このように、推定混合比処理部401は、入力画像を基に、推定混合比を演算することができる。
【0398】
図68のステップS403におけるアンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理は、アンカバードバックグラウンド領域のモデルに対応する式を利用した、図69のフローチャートに示す処理と同様なので、その説明は省略する。
【0399】
なお、図67に示す推定混合比処理部442および推定混合比処理部443は、図69に示すフローチャートと同様の処理を実行して推定混合比を演算するので、その説明は省略する。
【0400】
また、背景に対応するオブジェクトが静止しているとして説明したが、背景領域に対応する画像が動きを含んでいても上述した混合比αを求める処理を適用することができる。例えば、背景領域に対応する画像が一様に動いているとき、推定混合比処理部401は、背景の動きに対応して画像全体をシフトさせ、背景に対応するオブジェクトが静止している場合と同様に処理する。また、背景領域に対応する画像が局所毎に異なる背景の動きを含んでいるとき、推定混合比処理部401は、混合領域に属する画素に対応する画素として、背景の動きに対応した画素を選択して、上述の処理を実行する。
【0401】
また、混合比算出部104は、全ての画素について、カバードバックグラウンド領域に対応するモデルによる混合比推定の処理のみを実行して、算出された推定混合比を混合比αとして出力するようにしてもよい。この場合において、混合比αは、カバードバックグラウンド領域に属する画素について、背景の成分の割合を示し、アンカバードバックグラウンド領域に属する画素について、前景の成分の割合を示す。アンカバードバックグラウンド領域に属する画素について、このように算出された混合比αと1との差分の絶対値を算出して、算出した絶対値を混合比αに設定すれば、画像処理装置は、アンカバードバックグラウンド領域に属する画素について、背景の成分の割合を示す混合比αを求めることができる。
【0402】
なお、同様に、混合比算出部104は、全ての画素について、アンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理のみを実行して、算出された推定混合比を混合比αとして出力するようにしてもよい。
【0403】
次に、混合比算出部104の他の処理について説明する。
【0404】
シャッタ時間内において、前景に対応するオブジェクトが等速で動くことによる、画素の位置の変化に対応して、混合比αが直線的に変化する性質を利用して、空間方向に、混合比αと前景の成分の和fとを近似した式を立てることができる。混合領域に属する画素の画素値および背景領域に属する画素の画素値の組の複数を利用して、混合比αと前景の成分の和fとを近似した式を解くことにより、混合比αを算出する。
【0405】
混合比αの変化を、直線として近似すると、混合比αは、式(23)で表される。
【0406】
α=il+p (23)
式(23)において、iは、注目している画素の位置を0とした空間方向のインデックスである。lは、混合比αの直線の傾きである。pは、混合比αの直線の切片である共に、注目している画素の混合比αである。式(23)において、インデックスiは、既知であるが、傾きlおよび切片pは、未知である。
【0407】
インデックスi、傾きl、および切片pの関係を図70に示す。
【0408】
混合比αを式(23)のように近似することにより、複数の画素に対して複数の異なる混合比αは、2つの変数で表現される。図70に示す例において、5つの画素に対する5つの混合比は、2つの変数である傾きlおよび切片pにより表現される。
【0409】
図71に示す平面で混合比αを近似すると、画像の水平方向および垂直方向の2つの方向に対応する動きvを考慮したとき、式(23)を平面に拡張して、混合比αは、式(24)で表される。
【0410】
α=jm+kq+p (24)
式(24)において、jは、注目している画素の位置を0とした水平方向のインデックスであり、kは、垂直方向のインデックスである。mは、混合比αの面の水平方向の傾きであり、qは、混合比αの面の垂直方向の傾きである。pは、混合比αの面の切片である。
【0411】
例えば、図61に示すフレーム#nにおいて、C05乃至C07について、それぞれ、式(25)乃至式(27)が成立する。
【0412】
C05=α05・B05/v+f05 (25)
C06=α06・B06/v+f06 (26)
C07=α07・B07/v+f07 (27)
【0413】
前景の成分が近傍で一致する、すなわち、F01乃至F03が等しいとして、F01乃至F03をFcに置き換えると式(28)が成立する。
【0414】
f(x)=(1-α(x))・Fc (28)
式(28)において、xは、空間方向の位置を表す。
【0415】
α(x)を式(24)で置き換えると、式(28)は、式(29)として表すことができる。
【0416】
【0417】
式(29)において、(-m・Fc)、(-q・Fc)、および(1-p)・Fcは、式(30)乃至式(32)に示すように置き換えられている。
【0418】
s=-m・Fc (30)
t=-q・Fc (31)
u=(1-p)・Fc (32)
【0419】
式(29)において、jは、注目している画素の位置を0とした水平方向のインデックスであり、kは、垂直方向のインデックスである。
【0420】
このように、前景に対応するオブジェクトがシャッタ時間内において等速に移動し、前景に対応する成分が近傍において一定であるという仮定が成立するので、前景の成分の和は、式(29)で近似される。
【0421】
なお、混合比αを直線で近似する場合、前景の成分の和は、式(33)で表すことができる。
【0422】
f(x)=is+u (33)
【0423】
式(13)の混合比αおよび前景成分の和を、式(24)および式(29)を利用して置き換えると、画素値Mは、式(34)で表される。
【0424】
【0425】
式(34)において、未知の変数は、混合比αの面の水平方向の傾きm、混合比αの面の垂直方向の傾きq、混合比αの面の切片p、s、t、およびuの6つである。
【0426】
注目している画素の近傍の画素に対応させて、式(34)に示す正規方程式に、画素値Mまたは画素値Bを設定し、画素値Mまたは画素値Bが設定された複数の正規方程式を最小自乗法で解いて、混合比αを算出する。
【0427】
例えば、注目している画素の水平方向のインデックスjを0とし、垂直方向のインデックスkを0とし、注目している画素の近傍の3×3の画素について、式(34)に示す正規方程式に画素値Mまたは画素値Bを設定すると、式(35)乃至式(43)を得る。
【0428】
注目している画素の水平方向のインデックスjが0であり、垂直方向のインデックスkが0であるので、注目している画素の混合比αは、式(24)より、j=0およびk=0のときの値、すなわち、切片pに等しい。
【0429】
従って、式(35)乃至式(43)の9つの式を基に、最小自乗法により、水平方向の傾きm、垂直方向の傾きq、切片p、s、t、およびuのそれぞれの値を算出し、切片pを混合比αとして出力すればよい。
【0430】
次に、最小自乗法を適用して混合比αを算出するより具体的な手順を説明する。
【0431】
インデックスiおよびインデックスkを1つのインデックスxで表現すると、インデックスi、インデックスk、およびインデックスxの関係は、式(44)で表される。
【0432】
x=(j+1)・3+(k+1) (44)
【0433】
水平方向の傾きm、垂直方向の傾きq、切片p、s、t、およびuをそれぞれ変数w0,w1,w2,w3,w4、およびW5と表現し、jB,kB,B,j,k、および1をそれぞれa0,a1,a2,a3,a4、およびa5と表現する。誤差exを考慮すると、式(35)乃至式(43)は、式(45)に書き換えることができる。
【0434】
【数12】
式(45)において、xは、0乃至8の整数のいずれかの値である。
【0435】
式(45)から、式(46)を導くことができる。
【0436】
【数13】
【0437】
ここで、最小自乗法を適用するため、誤差の自乗和Eを式(47)に示すようにに定義する。
【0438】
【数14】
【0439】
誤差が最小になるためには、誤差の自乗和Eに対する、変数Wvの偏微分が0になればよい。ここで、vは、0乃至5の整数のいずれかの値である。従って、式(48)を満たすようにwyを求める。
【0440】
【数15】
【0441】
式(48)に式(46)を代入すると、式(49)を得る。
【0442】
【数16】
【0443】
式(49)のvに0乃至5の整数のいずれか1つを代入して得られる6つの式に、例えば、掃き出し法(Gauss-Jordanの消去法)などを適用して、wyを算出する。上述したように、w0は水平方向の傾きmであり、w1は垂直方向の傾きqであり、w2は切片pであり、w3はsであり、w4はtであり、w5はuである。
【0444】
以上のように、画素値Mおよび画素値Bを設定した式に、最小自乗法を適用することにより、水平方向の傾きm、垂直方向の傾きq、切片p、s、t、およびuを求めることができる。
【0445】
式(35)乃至式(43)に対応する説明において、混合領域に含まれる画素の画素値をMとし、背景領域に含まれる画素の画素値をBとして説明したが、注目している画素が、カバードバックグラウンド領域に含まれる場合、またはアンカバードバックグラウンド領域に含まれる場合のそれぞれに対して、正規方程式を立てる必要がある。
【0446】
例えば、図61に示す、フレーム#nのカバードバックグラウンド領域に含まれる画素の混合比αを求める場合、フレーム#nの画素のC04乃至C08、およびフレーム#n-1の画素の画素値P04乃至P08が、正規方程式に設定される。
【0447】
図62に示す、フレーム#nのアンカバードバックグラウンド領域に含まれる画素の混合比αを求める場合、フレーム#nの画素のC28乃至C32、およびフレーム#n+1の画素の画素値N28乃至N32が、正規方程式に設定される。
【0448】
また、例えば、図72に示す、カバードバックグラウンド領域に含まれる画素の混合比αを算出するとき、以下の式(50)乃至式(58)が立てられる。混合比αを算出する画素の画素値は、Mc5である。
Mc1=(-1)・Bc1・m+(-1)・Bc1・q+Bc1・p+(-1)・s+(-1)・t+u (50)
Mc2=(0)・Bc2・m+(-1)・Bc2・q+Bc2・p+(0)・s+(-1)・t+u (51)
Mc3=(+1)・Bc3・m+(-1)・Bc3・q+Bc3・p+(+1)・s+(-1)・t+u (52)
Mc4=(-1)・Bc4・m+(0)・Bc4・q+Bc4・p+(-1)・s+(0)・t+u (53)
Mc5=(0)・Bc5・m+(0)・Bc5・q+Bc5・p+(0)・s+(0)・t+u (54)
Mc6=(+1)・Bc6・m+(0)・Bc6・q+Bc6・p+(+1)・s+(0)・t+u (55)
Mc7=(-1)・Bc7・m+(+1)・Bc7・q+Bc7・p+(-1)・s+(+1)・t+u (56)
Mc8=(0)・Bc8・m+(+1)・Bc8・q+Bc8・p+(0)・s+(+1)・t+u (57)
Mc9=(+1)・Bc9・m+(+1)・Bc9・q+Bc9・p+(+1)・s+(+1)・t+u (58)
【0449】
フレーム#nのカバードバックグラウンド領域に含まれる画素の混合比αを算出するとき、式(50)乃至式(58)において、フレーム#nの画素に対応する、フレーム#n-1の画素の背景領域の画素の画素値Bc1乃至Bc9が使用される。
【0450】
図72に示す、アンカバードバックグラウンド領域に含まれる画素の混合比αを算出するとき、以下の式(59)乃至式(67)が立てられる。混合比αを算出する画素の画素値は、Mu5である。
Mu1=(-1)・Bu1・m+(-1)・Bu1・q+Bu1・p+(-1)・s+(-1)・t+u (59)
Mu2=(0)・Bu2・m+(-1)・Bu2・q+Bu2・p+(0)・s+(-1)・t+u (60)
Mu3=(+1)・Bu3・m+(-1)・Bu3・q+Bu3・p+(+1)・s+(-1)・t+u (61)
Mu4=(-1)・Bu4・m+(0)・Bu4・q+Bu4・p+(-1)・s+(0)・t+u (62)
Mu5=(0)・Bu5・m+(0)・Bu5・q+Bu5・p+(0)・s+(0)・t+u (63)
Mu6=(+1)・Bu6・m+(0)・Bu6・q+Bu6・p+(+1)・s+(0)・t+u (64)
Mu7=(-1)・Bu7・m+(+1)・Bu7・q+Bu7・p+(-1)・s+(+1)・t+u (65)
Mu8=(0)・Bu8・m+(+1)・Bu8・q+Bu8・p+(0)・s+(+1)・t+u (66)
Mu9=(+1)・Bu9・m+(+1)・Bu9・q+Bu9・p+(+1)・s+(+1)・t+u (67)
【0451】
フレーム#nのアンカバードバックグラウンド領域に含まれる画素の混合比αを算出するとき、式(59)乃至式(67)において、フレーム#nの画素に対応する、フレーム#n+1の画素の背景領域の画素の画素値Bu1乃至Bu9が使用される。
【0452】
図73は、推定混合比処理部401の構成を示すブロック図である。推定混合比処理部401に入力された画像は、遅延部501および足し込み部502に供給される。
【0453】
遅延回路221は、入力画像を1フレーム遅延させ、足し込み部502に供給する。足し込み部502に、入力画像としてフレーム#nが入力されているとき、遅延回路221は、フレーム#n-1を足し込み部502に供給する。
【0454】
足し込み部502は、混合比αを算出する画素の近傍の画素の画素値、およびフレーム#n-1の画素値を、正規方程式に設定する。例えば、足し込み部502は、式(50)乃至式(58)に基づいて、正規方程式に画素値Mc1乃至Mc9および画素値Bc1乃至Bc9を設定する。足し込み部502は、画素値が設定された正規方程式を演算部503に供給する。
【0455】
演算部503は、足し込み部502から供給された正規方程式を掃き出し法などにより解いて推定混合比を求め、求められた推定混合比を出力する。
【0456】
このように、推定混合比処理部401は、入力画像を基に、推定混合比を算出して、混合比決定部403に供給することができる。
【0457】
なお、推定混合比処理部402は、推定混合比処理部401と同様の構成を有するので、その説明は省略する。
【0458】
図74は、推定混合比処理部401により算出された推定混合比の例を示す図である。図74に示す推定混合比は、等速で動いているオブジェクトに対応する前景の動きvが11であり、7×7画素のブロックを単位として方程式を生成して算出された結果を、1ラインに対して示すものである。
【0459】
推定混合比は、混合領域において、図60に示すように、ほぼ直線的に変化していることがわかる。
【0460】
混合比決定部403は、領域特定部101から供給された、混合比が算出される画素が、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す領域情報を基に、混合比を設定する。混合比決定部403は、対象となる画素が前景領域に属する場合、0を混合比に設定し、対象となる画素が背景領域に属する場合、1を混合比に設定し、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部401から供給された推定混合比を混合比に設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部402から供給された推定混合比を混合比に設定する。混合比決定部403は、領域情報を基に設定した混合比を出力する。
【0461】
図75のフローチャートを参照して、推定混合比処理部401が図73に示す構成を有する場合における、混合比算出部102の混合比の算出の処理を説明する。ステップS501において、混合比算出部102は、領域特定部101から供給された領域情報を取得する。ステップS502において、推定混合比処理部401は、カバードバックグラウンド領域に対応するモデルによる混合比推定の処理を実行し、推定混合比を混合比決定部403に供給する。混合比推定の処理の詳細は、図76のフローチャートを参照して、後述する。
【0462】
ステップS503において、推定混合比処理部402は、アンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理を実行し、推定混合比を混合比決定部403に供給する。
【0463】
ステップS504において、混合比算出部102は、フレーム全体について、混合比を推定したか否かを判定し、フレーム全体について、混合比を推定していないと判定された場合、ステップS502に戻り、次の画素について混合比を推定する処理を実行する。
【0464】
ステップS504において、フレーム全体について、混合比を推定したと判定された場合、ステップS505に進み、混合比決定部403は、領域特定部101から供給された、混合比が算出される画素が、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す領域情報を基に、混合比を設定する。混合比決定部403は、対象となる画素が前景領域に属する場合、0を混合比に設定し、対象となる画素が背景領域に属する場合、1を混合比に設定し、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部401から供給された推定混合比を混合比に設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部402から供給された推定混合比を混合比に設定し、処理は終了する。
【0465】
このように、混合比算出部102は、領域特定部101から供給された領域情報、および入力画像を基に、各画素に対応する特徴量である混合比αを算出することができる。
【0466】
混合比αを利用することにより、動いているオブジェクトに対応する画像に含まれる動きボケの情報を残したままで、画素値に含まれる前景の成分と背景の成分とを分離することが可能になる。
【0467】
また、混合比αに基づいて画像を合成すれば、実世界を実際に撮影し直したような動いているオブジェクトのスピードに合わせた正しい動きボケを含む画像を作ることが可能になる。
【0468】
次に、図75のステップS502に対応する、カバードバックグラウンド領域に対応するモデルによる混合比推定の処理を図76のフローチャートを参照して説明する。
【0469】
ステップS521において、足し込み部502は、入力された画像に含まれる画素値、および遅延回路221から供給される画像に含まれる画素値を、カバードバックグラウンド領域のモデルに対応する正規方程式に設定する。
【0470】
ステップS522において、推定混合比処理部401は、対象となる画素についての設定が終了したか否かを判定し、対象となる画素についての設定が終了していないと判定された場合、ステップS521に戻り、正規方程式への画素値の設定の処理を繰り返す。
【0471】
ステップS522において、対象となる画素についての画素値の設定が終了したと判定された場合、ステップS523に進み、演算部173は、画素値が設定された正規方程式を基に、推定混合比を演算して、求められた推定混合比を出力する。
【0472】
このように、推定混合比処理部401は、入力画像を基に、推定混合比を演算することができる。
【0473】
図75のステップS153におけるアンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理は、アンカバードバックグラウンド領域のモデルに対応する正規方程式を利用した、図76のフローチャートに示す処理と同様なので、その説明は省略する。
【0474】
なお、背景に対応するオブジェクトが静止しているとして説明したが、背景領域に対応する画像が動きを含んでいても上述した混合比を求める処理を適用することができる。例えば、背景領域に対応する画像が一様に動いているとき、推定混合比処理部401は、この動きに対応して画像全体をシフトさせ、背景に対応するオブジェクトが静止している場合と同様に処理する。また、背景領域に対応する画像が局所毎に異なる動きを含んでいるとき、推定混合比処理部401は、混合領域に属する画素に対応する画素として、動きに対応した画素を選択して、上述の処理を実行する。
【0475】
次に、前景背景分離部105について説明する。図77は、前景背景分離部105の構成の一例を示すブロック図である。前景背景分離部105に供給された入力画像は、分離部601、スイッチ602、およびスイッチ603に供給される。カバードバックグラウンド領域を示す情報、およびアンカバードバックグラウンド領域を示す、領域特定部103から供給された領域情報は、分離部601に供給される。前景領域を示す領域情報は、スイッチ602に供給される。背景領域を示す領域情報は、スイッチ603に供給される。
【0476】
混合比算出部104から供給された混合比αは、分離部601に供給される。
【0477】
分離部601は、カバードバックグラウンド領域を示す領域情報、および混合比αを基に、入力画像のカバードバックグラウンド領域から前景の成分を分離するとともに、背景の成分を分離して、分離された前景の成分より構成されるカバードバックグラウンド領域の前景成分画像、および分離された背景の成分より構成されるカバードバックグラウンド領域の背景成分画像を出力する。
【0478】
分離部601は、アンカバードバックグラウンド領域を示す領域情報、および混合比αを基に、入力画像のアンカバードバックグラウンド領域から前景の成分を分離するとともに、背景の成分を分離して、分離された前景の成分より構成されるアンカバードバックグラウンド領域の前景成分画像、および分離された背景の成分より構成されるアンカバードバックグラウンド領域の背景成分画像を出力する。
【0479】
スイッチ602は、前景領域を示す領域情報を基に、前景領域に対応する画素が入力されたとき、閉じられ、前景領域の画像を出力する。
【0480】
スイッチ603は、背景領域を示す領域情報を基に、背景領域に対応する画素が入力されたとき、閉じられ、背景領域の画像を出力する。
【0481】
図78は、前景背景分離部105に入力される入力画像、並びに前景背景分離部105から出力される前景成分画像および背景成分画像を示す図である。
【0482】
図78(A)は、表示される画像の模式図であり、図78(B)は、図78(A)に対応する前景領域に属する画素、背景領域に属する画素、および混合領域に属する画素を含む1ラインの画素を時間方向に展開したモデル図を示す。
【0483】
図78(A)および図78(B)に示すように、前景背景分離部105から出力される背景領域の画像は、背景領域に属する画素から構成される。
【0484】
図78(A)および図78(B)に示すように、前景背景分離部105から出力される前景領域の画像は、前景領域に属する画素から構成される。
【0485】
アンカバードバックグラウンド領域の画素の画素値は、前景背景分離部105により、背景の成分と、前景の成分とに分離される。分離された背景の成分は、アンカバードバックグラウンド領域の背景成分画像を構成し、分離された前景の成分は、アンカバードバックグラウンド領域の前景成分画像を構成する。
【0486】
カバードバックグラウンド領域の画素の画素値は、前景背景分離部105により、背景の成分と、前景の成分とに分離される。分離された背景の成分は、カバードバックグラウンド領域の背景成分画像を構成し、分離された前景の成分は、カバードバックグラウンド領域の前景成分画像を構成する。
【0487】
次に、分離部601が実行する、混合領域に属する画素から前景の成分、および背景の成分を分離する処理について説明する。
【0488】
図79は、図中の左から右に移動するオブジェクトに対応する前景を含む、2つのフレームの前景の成分および背景の成分を示す画像のモデルである。図79に示す画像のモデルにおいて、前景の動き量vは4であり、仮想分割数は、4とされている。
【0489】
フレーム#nにおいて、最も左の画素、および左から14番目乃至18番目の画素は、背景の成分のみから成り、背景領域に属する。フレーム#nにおいて、左から2番目乃至4番目の画素は、背景の成分および前景の成分を含み、アンカバードバックグラウンド領域に属する。フレーム#nにおいて、左から11番目乃至13番目の画素は、背景の成分および前景の成分を含み、カバードバックグラウンド領域に属する。フレーム#nにおいて、左から5番目乃至10番目の画素は、前景の成分のみから成り、前景領域に属する。
【0490】
フレーム#n+1において、左から1番目乃至5番目の画素、および左から18番目の画素は、背景の成分のみから成り、背景領域に属する。フレーム#n+1において、左から6番目乃至8番目の画素は、背景の成分および前景の成分を含み、アンカバードバックグラウンド領域に属する。フレーム#n+1において、左から15番目乃至17番目の画素は、背景の成分および前景の成分を含み、カバードバックグラウンド領域に属する。フレーム#n+1において、左から9番目乃至14番目の画素は、前景の成分のみから成り、前景領域に属する。
【0491】
図80は、カバードバックグラウンド領域に属する画素から前景の成分を分離する処理を説明する図である。図80において、α1乃至α18は、フレーム#nにおける画素のぞれぞれに対応する混合比である。図80において、左から15番目乃至17番目の画素は、カバードバックグラウンド領域に属する。
【0492】
フレーム#nの左から15番目の画素の画素値C15は、式(68)で表される。
【0493】
ここで、α15は、フレーム#nの左から15番目の画素の混合比である。P15は、フレーム#n-1の左から15番目の画素の画素値である。
【0494】
式(68)を基に、フレーム#nの左から15番目の画素の前景の成分の和f15は、式(69)で表される。
【0495】
【0496】
同様に、フレーム#nの左から16番目の画素の前景の成分の和f16は、式(70)で表され、フレーム#nの左から17番目の画素の前景の成分の和f17は、式(71)で表される。
【0497】
f16=C16-α16・P16 (70)
f17=C17-α17・P17 (71)
【0498】
このように、カバードバックグラウンド領域に属する画素の画素値Cに含まれる前景の成分fcは、式(72)で計算される。
【0499】
fc=C-α・P (72)
Pは、1つ前のフレームの、対応する画素の画素値である。
【0500】
図81は、アンカバードバックグラウンド領域に属する画素から前景の成分を分離する処理を説明する図である。図81において、α1乃至α18は、フレーム#nにおける画素のぞれぞれに対応する混合比である。図81において、左から2番目乃至4番目の画素は、アンカバードバックグラウンド領域に属する。
【0501】
フレーム#nの左から2番目の画素の画素値C02は、式(73)で表される。
【0502】
ここで、α2は、フレーム#nの左から2番目の画素の混合比である。N02は、フレーム#n+1の左から2番目の画素の画素値である。
【0503】
式(73)を基に、フレーム#nの左から2番目の画素の前景の成分の和f02は、式(74)で表される。
【0504】
【0505】
同様に、フレーム#nの左から3番目の画素の前景の成分の和f03は、式(75)で表され、フレーム#nの左から4番目の画素の前景の成分の和f04は、式(76)で表される。
【0506】
f03=C03-α3・N03 (75)
f04=C04-α4・N04 (76)
【0507】
このように、アンカバードバックグラウンド領域に属する画素の画素値Cに含まれる前景の成分fuは、式(77)で計算される。
【0508】
fu=C-α・N (77)
Nは、1つ後のフレームの、対応する画素の画素値である。
【0509】
このように、分離部601は、領域情報に含まれる、カバードバックグラウンド領域を示す情報、およびアンカバードバックグラウンド領域を示す情報、並びに画素毎の混合比αを基に、混合領域に属する画素から前景の成分、および背景の成分を分離することができる。
【0510】
図82は、以上で説明した処理を実行する分離部601の構成の一例を示すブロック図である。分離部601に入力された画像は、フレームメモリ621に供給され、混合比算出部104から供給されたカバードバックグラウンド領域およびアンカバードバックグラウンド領域を示す領域情報、並びに混合比αは、分離処理ブロック622に入力される。
【0511】
フレームメモリ621は、入力された画像をフレーム単位で記憶する。フレームメモリ621は、処理の対象がフレーム#nであるとき、フレーム#nの1つ前のフレームであるフレーム#n-1、フレーム#n、およびフレーム#nの1つ後のフレームであるフレーム#n+1を記憶する。
【0512】
フレームメモリ621は、フレーム#n-1、フレーム#n、およびフレーム#n+1の対応する画素を分離処理ブロック622に供給する。
【0513】
分離処理ブロック622は、カバードバックグラウンド領域およびアンカバードバックグラウンド領域を示す領域情報、並びに混合比αを基に、フレームメモリ621から供給されたフレーム#n-1、フレーム#n、およびフレーム#n+1の対応する画素の画素値に図80および図81を参照して説明した演算を適用して、フレーム#nの混合領域に属する画素から前景の成分および背景の成分を分離する。
【0514】
分離処理ブロック622は、アンカバード領域処理部631、およびカバード領域処理部632で構成されている。
【0515】
アンカバード領域処理部631の乗算器641は、混合比αを、フレームメモリ621から供給されたフレーム#n+1の画素の画素値に乗じて、スイッチ642に出力する。スイッチ642は、フレームメモリ621から供給されたフレーム#nの画素(フレーム#n+1の画素に対応する)がアンカバードバックグラウンド領域であるとき、閉じられ、乗算器641から供給された混合比αを乗じた画素値を演算器643に供給する。スイッチ642から出力されるフレーム#n+1の画素の画素値に混合比αを乗じた値は、フレーム#nの対応する画素の画素値の背景の成分に等しく、アンカバードバックグラウンド領域の背景成分画像として出力される。
【0516】
演算器643は、フレームメモリ621から供給されたフレーム#nの画素の画素値から、スイッチ642から供給された背景の成分を減じて、前景の成分を求める。演算器643は、アンカバードバックグラウンド領域に属する、フレーム#nの画素の前景成分画像を出力する。
【0517】
カバード領域処理部632の乗算器651は、混合比αを、フレームメモリ621から供給されたフレーム#n-1の画素の画素値に乗じて、スイッチ652に出力する。スイッチ652は、フレームメモリ621から供給されたフレーム#nの画素(フレーム#n-1の画素に対応する)がカバードバックグラウンド領域であるとき、閉じられ、乗算器651から供給された混合比αを乗じた画素値を演算器653に供給する。スイッチ652から出力されるフレーム#n-1の画素の画素値に混合比αを乗じた値は、フレーム#nの対応する画素の画素値の背景の成分に等しく、カバードバックグラウンド領域の背景成分画像として出力される。
【0518】
演算器653は、フレームメモリ621から供給されたフレーム#nの画素の画素値から、スイッチ652から供給された背景の成分を減じて、前景の成分を求める。演算器653は、カバードバックグラウンド領域に属する、フレーム#nの画素の前景成分画像を出力する。
【0519】
特徴量である混合比αを利用することにより、画素値に含まれる前景の成分と背景の成分とを完全に分離することが可能になる。
【0520】
次に、図83に示すフローチャートを参照して、前景背景分離部105による前景と背景との分離の処理を説明する。ステップS601において、分離部601のフレームメモリ621は、入力画像を取得し、前景と背景との分離の対象となるフレーム#nを、その前のフレーム#n-1およびその後のフレーム#n+1と共に記憶する。
【0521】
ステップS602において、分離部601の分離処理ブロック622は、混合比算出部104から供給された領域情報を取得する。ステップS603において、分離部601の分離処理ブロック622は、混合比算出部104から供給された混合比αを取得する。
【0522】
ステップS604において、アンカバード領域処理部631は、領域情報および混合比αを基に、フレームメモリ621から供給された、アンカバードバックグラウンド領域に属する画素の画素値から、背景の成分を抽出し、アンカバードバックグラウンド領域の背景成分画像として出力する。
【0523】
ステップS605において、アンカバード領域処理部631は、領域情報および混合比αを基に、フレームメモリ621から供給された、アンカバードバックグラウンド領域に属する画素の画素値から、前景の成分を抽出し、アンカバードバックグラウンド領域の前景成分画像として出力する。
【0524】
ステップS606において、カバード領域処理部632は、領域情報および混合比αを基に、フレームメモリ621から供給された、カバードバックグラウンド領域に属する画素の画素値から、背景の成分を抽出し、カバードバックグラウンド領域の背景成分画像として出力する。
【0525】
ステップS607において、カバード領域処理部632は、領域情報および混合比αを基に、フレームメモリ621から供給された、カバードバックグラウンド領域に属する画素の画素値から、前景の成分を抽出し、カバードバックグラウンド領域の前景成分画像として出力し、処理は終了する。
【0526】
このように、前景背景分離部105は、領域情報および混合比αを基に、入力画像から前景の成分と、背景の成分とを分離し、前景の成分のみから成る前景成分画像、および背景の成分のみから成る背景成分画像を出力することができる。
【0527】
図84は、空間方向に、より高解像度な画像を生成するクラス分類適応処理において使用される係数セットを生成する分離画像処理部106の構成を示すブロック図である。例えば、図84に構成を示す分離画像処理部106は、入力されたHD画像を基に、SD画像からHD画像を生成するクラス分類適応処理において使用される係数セットを生成する。
【0528】
背景領域教師画像フレームメモリ701は、前景背景分離部105から供給された、教師画像の背景領域の画像を記憶する。背景領域教師画像フレームメモリ701は、記憶している教師画像の背景領域の画像を加重平均部707−1および学習部714−1に供給する。
【0529】
アンカバードバックグラウンド領域背景成分教師画像フレームメモリ702は、前景背景分離部105から供給された、教師画像のアンカバードバックグラウンド領域の背景成分画像を記憶する。アンカバードバックグラウンド領域背景成分教師画像フレームメモリ702は、記憶している教師画像のアンカバードバックグラウンド領域の背景成分画像を加重平均部707−2および学習部714−2に供給する。
【0530】
アンカバードバックグラウンド領域前景成分教師画像フレームメモリ703は、前景背景分離部105から供給された、教師画像のアンカバードバックグラウンド領域の前景成分画像を記憶する。アンカバードバックグラウンド領域前景成分教師画像フレームメモリ703は、記憶している教師画像のアンカバードバックグラウンド領域の前景成分画像を加重平均部707−3および学習部714−4に供給する。
【0531】
カバードバックグラウンド領域背景成分教師画像フレームメモリ704は、前景背景分離部105から供給された、教師画像のカバードバックグラウンド領域の背景成分画像を記憶する。カバードバックグラウンド領域背景成分教師画像フレームメモリ704は、記憶している教師画像のカバードバックグラウンド領域の背景成分画像を加重平均部707−4および学習部714−4に供給する。
【0532】
カバードバックグラウンド領域前景成分教師画像フレームメモリ705は、前景背景分離部105から供給された、教師画像のカバードバックグラウンド領域の前景成分画像を記憶する。カバードバックグラウンド領域前景成分教師画像フレームメモリ705は、記憶している教師画像のカバードバックグラウンド領域の前景成分画像を加重平均部707−5および学習部714−5に供給する。
【0533】
前景領域教師画像フレームメモリ706は、前景背景分離部105から供給された、教師画像の前景領域の画像を記憶する。前景領域教師画像フレームメモリ706は、記憶している教師画像の前景画像を加重平均部707−6および学習部714−6に供給する。
【0534】
加重平均部707−1は、背景領域教師画像フレームメモリ701から供給された、例えば、HD画像である教師画像の背景領域の画像を4分の1加重平均して、生徒画像であるSD画像を生成し、生成したSD画像を背景領域生徒画像フレームメモリ708に供給する。
【0535】
例えば、加重平均部707−1は、図85に示すように、教師画像の2×2(横×縦)の4つの画素(同図において、白丸で示す部分)を1単位とし、各単位の4つの画素の画素値を加算して、加算された結果を4で除算する。加重平均部707−1は、このように、4分の1加重平均された結果を、各単位の中心に位置する生徒画像の画素(同図において、黒丸で示す部分)に設定する。
【0536】
背景領域生徒画像フレームメモリ708は、加重平均部707−1から供給された、教師画像の背景領域の画像に対応する、生徒画像を記憶する。背景領域生徒画像フレームメモリ708は、記憶している、教師画像の背景領域の画像に対応する生徒画像を学習部714−1に供給する。
【0537】
加重平均部707−2は、アンカバードバックグラウンド領域背景成分教師画像フレームメモリ702から供給された、HD画像である教師画像のアンカバードバックグラウンド領域の背景成分画像を、例えば、4分の1加重平均して、生徒画像であるSD画像を生成し、生成したSD画像をアンカバードバックグラウンド領域背景成分生徒画像フレームメモリ709に供給する。
【0538】
アンカバードバックグラウンド領域背景成分生徒画像フレームメモリ709は、加重平均部707−2から供給された、教師画像のアンカバードバックグラウンド領域の背景成分画像に対応する、SD画像である生徒画像を記憶する。アンカバードバックグラウンド領域背景成分生徒画像フレームメモリ709は、記憶している、教師画像のアンカバードバックグラウンド領域の背景成分画像に対応する生徒画像を学習部714−2に供給する。
【0539】
加重平均部707−3は、アンカバードバックグラウンド領域前景成分教師画像フレームメモリ703から供給された、HD画像である教師画像のアンカバードバックグラウンド領域の前景成分画像を、例えば、4分の1加重平均して、生徒画像であるSD画像を生成し、生成したSD画像をアンカバードバックグラウンド領域前景成分生徒画像フレームメモリ710に供給する。
【0540】
アンカバードバックグラウンド領域前景成分生徒画像フレームメモリ710は、加重平均部707−3から供給された、教師画像のアンカバードバックグラウンド領域の前景成分画像に対応する、SD画像である生徒画像を記憶する。アンカバードバックグラウンド領域前景成分生徒画像フレームメモリ710は、記憶している、教師画像のアンカバードバックグラウンド領域の前景成分画像に対応する生徒画像を学習部714−3に供給する。
【0541】
加重平均部707−4は、カバードバックグラウンド領域背景成分教師画像フレームメモリ704から供給された、教師画像のカバードバックグラウンド領域の背景成分画像を、例えば、4分の1加重平均して、生徒画像であるSD画像を生成し、生成したSD画像をカバードバックグラウンド領域背景成分生徒画像フレームメモリ711に供給する。
【0542】
カバードバックグラウンド領域背景成分生徒画像フレームメモリ711は、加重平均部707−4から供給された、教師画像のカバードバックグラウンド領域の背景成分画像に対応する、SD画像である生徒画像を記憶する。カバードバックグラウンド領域背景成分生徒画像フレームメモリ711は、記憶している、教師画像のカバードバックグラウンド領域の背景成分画像に対応する生徒画像を学習部714−4に供給する。
【0543】
加重平均部707−5は、カバードバックグラウンド領域前景成分教師画像フレームメモリ705から供給された、教師画像のカバードバックグラウンド領域の前景成分画像を、例えば、4分の1加重平均して、生徒画像であるSD画像を生成し、生成したSD画像をカバードバックグラウンド領域前景成分生徒画像フレームメモリ712に供給する。
【0544】
カバードバックグラウンド領域前景成分生徒画像フレームメモリ712は、加重平均部707−5から供給された、教師画像のカバードバックグラウンド領域の前景成分画像に対応する、SD画像である生徒画像を記憶する。カバードバックグラウンド領域前景成分生徒画像フレームメモリ712は、記憶している、教師画像のカバードバックグラウンド領域の前景成分画像に対応する生徒画像を学習部714−5に供給する。
【0545】
加重平均部707−6は、前景領域教師画像フレームメモリ706から供給された、例えば、HD画像である教師画像の前景領域の画像を4分の1加重平均して、生徒画像であるSD画像を生成し、生成したSD画像を前景領域生徒画像フレームメモリ713に供給する。
【0546】
前景領域生徒画像フレームメモリ713は、加重平均部707−6から供給された、教師画像の前景領域の画像に対応する、SD画像である生徒画像を記憶する。前景領域生徒画像フレームメモリ713は、記憶している、教師画像の前景領域の画像に対応する生徒画像を学習部714−6に供給する。
【0547】
学習部714−1は、背景領域教師画像フレームメモリ701から供給された教師画像の背景領域の画像、および背景領域生徒画像フレームメモリ708から供給された、教師画像の背景領域の画像に対応する生徒画像を基に、背景領域に対応する係数セットを生成し、生成した係数セットを係数セットメモリ715に供給する。
【0548】
学習部714−2は、アンカバードバックグラウンド領域背景成分教師画像フレームメモリ702から供給された教師画像のアンカバードバックグラウンド領域の背景成分画像、およびアンカバードバックグラウンド領域背景成分生徒画像フレームメモリ709から供給された、教師画像のアンカバードバックグラウンド領域の背景成分画像に対応する生徒画像を基に、アンカバードバックグラウンド領域の背景成分画像に対応する係数セットを生成し、生成した係数セットを係数セットメモリ715に供給する。
【0549】
学習部714−3は、アンカバードバックグラウンド領域前景成分教師画像フレームメモリ703から供給された教師画像のアンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域前景成分生徒画像フレームメモリ909から供給された、教師画像のアンカバードバックグラウンド領域の前景成分画像に対応する生徒画像を基に、アンカバードバックグラウンド領域の前景成分画像に対応する係数セットを生成し、生成した係数セットを係数セットメモリ715に供給する。
【0550】
学習部714−4は、カバードバックグラウンド領域背景成分教師画像フレームメモリ704から供給された教師画像のカバードバックグラウンド領域の背景成分画像、およびカバードバックグラウンド領域背景成分生徒画像フレームメモリ711から供給された、教師画像のカバードバックグラウンド領域の背景成分画像に対応する生徒画像を基に、カバードバックグラウンド領域の背景成分画像に対応する係数セットを生成し、生成した係数セットを係数セットメモリ715に供給する。
【0551】
学習部714−5は、カバードバックグラウンド領域前景成分教師画像フレームメモリ705から供給された教師画像のカバードバックグラウンド領域の前景成分画像、およびカバードバックグラウンド領域前景成分生徒画像フレームメモリ712から供給された、教師画像のカバードバックグラウンド領域の前景成分画像に対応する生徒画像を基に、カバードバックグラウンド領域の前景成分画像に対応する係数セットを生成し、生成した係数セットを係数セットメモリ715に供給する。
【0552】
学習部714−6は、前景領域教師画像フレームメモリ706から供給された教師画像の前景領域の画像、および前景領域生徒画像フレームメモリ713から供給された、教師画像の前景領域の画像に対応する生徒画像を基に、前景領域に対応する係数セットを生成し、生成した係数セットを係数セットメモリ715に供給する。
【0553】
係数セットメモリ715は、学習部714−1から供給された背景領域に対応する係数セット、学習部714−2から供給されたアンカバードバックグラウンド領域の背景成分画像に対応する係数セット、学習部714−3から供給されたアンカバードバックグラウンド領域の前景成分画像に対応する係数セット、学習部714−4から供給されたカバードバックグラウンド領域の背景成分画像に対応する係数セット、学習部714−5から供給されたカバードバックグラウンド領域の前景成分画像に対応する係数セット、および学習部714−6から供給された前景領域に対応する係数セットを記憶する。
【0554】
以下、学習部714−1乃至学習部714−6を個々に区別する必要がないとき、単に学習部714と称する。
【0555】
図86は、学習部714の構成を示すブロック図である。
【0556】
クラス分類部731は、クラスタップ取得部751および波形分類部752で構成され、入力された生徒画像の、注目している画素である、注目画素をクラス分類する。クラスタップ取得部751は、注目画素に対応する、生徒画像の画素である、所定の数のクラスタップを取得し、取得したクラスタップを波形分類部752に供給する。
【0557】
例えば、図85において、上からi番目で、左からj番目の生徒画像の画素(図中、黒丸で示す部分)をXijと表すとすると、クラスタップ取得部751は、注目画素Xijの左上、上、右上、左、右、左下、下、右下に隣接する8つの画素X(i-1)(j-1),X(i-1)j,X(i-1)(j+1),Xi(j-1),Xi(j+1),X(i-1)(j-1),X(i-1)j,X(i+1)(j+1)に、自身を含め、合計9画素で構成されるクラスタップを取得する。このクラスタップは、波形分類部752に供給される。
【0558】
なお、この場合、クラスタップは、3×3画素でなる正方形状のブロックで構成されることとなるが、クラス分類用ブロックの形状は、正方形である必要はなく、その他、例えば、長方形や、十文字形、その他の任意な形とすることが可能である。また、クラスタップを構成する画素数も、3×3の9画素に限定されるものではない。
【0559】
波形分類部752は、入力信号を、その特徴に基づいていくつかのクラスに分類する、クラス分類処理を実行して、クラスタップを基に、注目画素を1つのクラスに分類する。波形分類部752は、例えば、注目画素を512のクラスのうちの1つのクラスに分類し、分類されたクラスに対応するクラス番号を予測タップ取得部732に供給する。
【0560】
ここで、クラス分類処理について簡単に説明する。
【0561】
いま、例えば、図87(A)に示すように、ある注目画素と、それに隣接する3つの画素により、2×2画素でなるクラスタップを構成し、また、各画素は、1ビットで表現される(0または1のうちのいずれかのレベルをとる)ものとする。この場合、注目画素を含む2×2の4画素のブロックは、各画素のレベル分布により、図87(B)に示すように、16(=(21)4)パターンに分類することができる。従って、いまの場合、注目画素は、16のパターンに分類することができ、このようなパターン分けが、クラス分類処理であり、クラス分類部731において行われる。
【0562】
ここで、通常、各画素には、例えば8ビット程度が割り当てられる。また、本実施の形態においては、上述したように、クラスタップは、3×3の9画素で構成される。従って、このようなクラスタップを対象にクラス分類処理を行ったのでは、(28)9という膨大な数のクラスに分類されることになる。
【0563】
そこで、本実施の形態においては、波形分類部752において、クラスタップに対して、ADRC処理が施され、これにより、クラスタップを構成する画素のビット数を小さくすることで、クラス数を削減する。
【0564】
説明を簡単にするため、図88(A)に示すように、直線上に並んだ4画素で構成されるクラスタップを考えると、ADRC処理においては、その画素値の最大値MAXと最小値MINが検出される。そして、DR=MAX−MINを、クラスタップで構成されるブロックの局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップのブロックを構成する画素の画素値がKビットに再量子化される。
【0565】
即ち、ブロック内の各画素値から、最小値MINを減算し、その減算値をDR/2Kで除算する。そして、その結果得られる除算値に対応するコード(ADRCコード)に変換される。具体的には、例えば、K=2とした場合、図88(B)に示すように、除算値が、ダイナミックレンジDRを4(=22)等分して得られるいずれの範囲に属するかが判定され、除算値が、最も下のレベルの範囲、下から2番目のレベルの範囲、下から3番目のレベルの範囲、または最も上のレベルの範囲に属する場合には、それぞれ、例えば、00B,01B,10B、または11Bなどの2ビットにコード化される(Bは2進数であることを表す)。
そして、復号側においては、ADRCコード00B,01B,10B、または11Bは、ダイナミックレンジDRを4等分して得られる最も下のレベルの範囲の中心値L00、下から2番目のレベルの範囲の中心値L01、下から3番目のレベルの範囲の中心値L10、または最も上のレベルの範囲の中心値L11に変換され、その値に、最小値MINが加算されることで復号が行われる。
【0566】
ここで、このようなADRC処理はノンエッジマッチングと呼ばれる。
【0567】
なお、ADRC処理については、本件出願人が先に出願した、例えば、特開平3−53778号公報などに、その詳細が開示されている。
【0568】
クラスタップを構成する画素に割り当てられているビット数より少ないビット数で再量子化を行うADRC処理を施すことにより、上述したように、クラス数を削減することができ、このようなADRC処理が、波形分類部752において行われる。
【0569】
なお、本実施の形態では、波形分類部752において、ADRCコードに基づいて、クラス分類処理が行われるが、クラス分類処理は、その他、例えば、DPCM(予測符号化)や、BTC(Block Truncation Coding)、VQ(ベクトル量子化)、DCT(離散コサイン変換)、アダマール変換などを施したデータを対象に行うようにすることも可能である。
【0570】
予測タップ取得部732は、クラス番号を基に、生徒画像の画素から、クラスに対応し、元の画像(教師画像)の予測値を計算するための単位である、予測タップを取得し、取得した予測タップおよびクラス番号を対応画素取得部733に供給する。
【0571】
例えば、図85において、生徒画像の画素Xij(図中、黒丸で示す部分)を中心とする、元の画像(教師画像)における2×2の9画素の画素値を、その最も左から右方向、かつ上から下方向に、Yij(1),Yij(2),Yij(3),Yij(4)と表すとすると、画素Yij(1)乃至Yij(4)の予測値の計算に必要な係数を算出するために、予測タップ取得部732は、例えば、生徒画像の画素Xijを中心とする3×3の9画素X(i-1)(j-1),X(i-1)j,X(i-1)(j+1),Xi(j-1),Xij,Xi(j+1),X(i+1)(j-1),X(i+1)j,X(i+1)(j+1)で構成される正方形状の予測タップを取得する。
【0572】
具体的には、例えば、図85において四角形で囲む、教師画像における画素Y33(1)乃至Y33(4)の4画素の予測値の計算に必要な係数を算出するには、画素X22,X23,X24,X32,X33,X34,X42,X43,X44により、予測タップが構成される(この場合の注目画素は、X33となる)。
【0573】
対応画素取得部733は、予測タップおよびクラス番号を基に、予測すべき画素値に対応する教師画像の画素の画素値を取得し、予測タップ、クラス番号、および取得した予測すべき画素値に対応する教師画像の画素の画素値を正規方程式生成部734に供給する。
【0574】
例えば、対応画素取得部733は、教師画像における画素Y33(1)乃至Y33(4)の4画素の予測値の計算に必要な係数を算出するとき、予測すべき画素値に対応する教師画像の画素として、画素Y33(1)乃至Y33(4)の画素値を取得する。
【0575】
正規方程式生成部734は、予測タップ、クラス番号、および取得した予測すべき画素値を基に、予測タップおよび予測すべき画素値の関係に対応する、適応処理において使用される係数セットを算出するための正規方程式を生成し、クラス番号と共に、生成した正規方程式を係数計算部735に供給する。
【0576】
係数計算部735は、正規方程式生成部734から供給された正規方程式を解いて、分類されたクラスに対応する、適応処理において使用される係数セットを計算する。係数計算部735は、クラス番号と共に、計算した係数セットを係数セットメモリ715に供給する。
【0577】
正規方程式生成部734は、このような正規方程式に対応する行列を生成し、係数計算部735は、生成された行列を基に、係数セットを計算するようにしてもよい。
【0578】
ここで、適応処理について説明する。
【0579】
例えば、いま、教師画像の画素値yの予測値E[y]を、その周辺の幾つかの画素の画素値(以下、適宜、生徒データという)x1,x2,・・・と、所定の予測係数w1,w2,・・・の線形結合により規定される線形1次結合モデルにより求めることを考える。この場合、予測値E[y]は、次式で表すことができる。
【0580】
E[y]=w1x1+w2x2+・・・ (78)
【0581】
そこで、一般化するために、予測係数wの集合でなる行列W、生徒データの集合でなる行列X、および予測値E[y]の集合でなる行列Y’を、
【数17】
で定義すると、次のような観測方程式が成立する。
【0582】
XW=Y’ (79)
【0583】
そして、この観測方程式に最小自乗法を適用して、元の画像の画素値yに近い予測値E[y]を求めることを考える。この場合、元の画像の画素値(以下、適宜、教師データという)yの集合でなる行列Y、および元の画像の画素値yに対する予測値E[y]の残差eの集合でなる行列Eを、
【数18】
で定義すると、式(79)から、次のような残差方程式が成立する。
【0584】
XW=Y+E (80)
【0585】
この場合、元の画像の画素値yに近い予測値E[y]を求めるための予測係数wiは、自乗誤差
【数19】
を最小にすることで求めることができる。
【0586】
従って、上述の自乗誤差を予測係数wiで微分したものが0になる場合、即ち、次式を満たす予測係数wiが、元の画像の画素値yに近い予測値E[y]を求めるため最適値ということになる。
【0587】
【数20】
【0588】
そこで、まず、式(80)を、予測係数wiで微分することにより、次式が成立する。
【0589】
【数21】
【0590】
式(81)および(82)より、式(83)が得られる。
【0591】
【数22】
【0592】
さらに、式(80)の残差方程式における生徒データx、予測係数w、教師データy、および残差eの関係を考慮すると、式(83)から、次のような正規方程式を得ることができる。
【0593】
【数23】
【0594】
式(84)の正規方程式は、求めるべき予測係数wの数と同じ数だけたてることができ、従って、式(84)を解くことで、最適な予測係数wを求めることができる。なお、式(84)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを適用することが可能である。
【0595】
以上のようにして、クラスごとに最適な予測係数wを求め、さらに、その予測係数wを用い、式(78)により、教師画像の画素値yに近い予測値E[y]を求めるのが適応処理である。
【0596】
正規方程式生成部734は、クラスごとに最適な予測係数wを算出するための正規方程式を生成し、係数計算部735は、生成された正規方程式を基に、予測係数wを算出する。
【0597】
なお、適応処理は、間引かれた画像には含まれていない、元の画像に含まれる成分が再現される点で、補間処理とは異なる。即ち、適応処理は、式(78)だけを見る限りは、いわゆる補間フィルタを用いての補間処理と同一であるが、その補間フィルタのタップ係数に相当する予測係数wが、教師データyを用いての、いわば学習により求められるため、元の画像に含まれる成分を再現することができる。このことから、適応処理は、いわば画像の創造作用がある処理ということができる。
【0598】
図89は、図84に構成を示す分離画像処理部106が生成する係数セットを説明する図である。入力画像は、領域特定部103により、前景領域、背景領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域が特定される。
【0599】
領域が特定され、混合比算出部104により混合比αが検出された入力画像は、前景背景分離部105により、前景領域の画像、背景領域の画像、カバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域の背景成分画像に分離される。
【0600】
分離画像処理部106は、分離された前景領域の画像、背景領域の画像、カバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域の背景成分画像を基に、前景領域の画像に対応する係数セット、背景領域の画像に対応する係数セット、カバードバックグラウンド領域の前景成分画像に対応する係数セット、カバードバックグラウンド領域の背景成分画像に対応する係数セット、アンカバードバックグラウンド領域の前景成分画像に対応する係数セット、およびアンカバードバックグラウンド領域の背景成分画像に対応する係数セットを個々に算出する。
【0601】
すなわち、学習部714−1は、分離された背景領域の画像を基に、背景領域に対応する係数セットを算出し、学習部714−2は、分離されたアンカバードバックグラウンド領域の背景成分画像を基に、アンカバードバックグラウンド領域の背景成分画像に対応する係数セットを算出し、学習部714−3は、分離されたアンカバードバックグラウンド領域の前景成分画像を基に、アンカバードバックグラウンド領域の前景成分画像に対応する係数セットを算出し、学習部714−4は、分離されたカバードバックグラウンド領域の背景成分画像を基に、カバードバックグラウンド領域の背景成分画像に対応する係数セットを算出し、学習部714−5は、分離されたカバードバックグラウンド領域の前景成分画像を基に、カバードバックグラウンド領域の前景成分画像に対応する係数セットを算出し、学習部714−6は、分離された前景領域の画像を基に、前景領域に対応する係数セットを算出する。
【0602】
背景領域に対応する係数セットは、画素値を予測するクラス分類適応処理において、背景領域の画素値の予測に使用される。アンカバードバックグラウンド領域の背景成分画像に対応する係数セットは、画素値を予測するクラス分類適応処理において、アンカバードバックグラウンド領域の背景成分画像に対応する画素値の予測に使用される。アンカバードバックグラウンド領域の前景成分画像に対応する係数セットは、画素値を予測するクラス分類適応処理において、アンカバードバックグラウンド領域の前景成分画像に対応する画素値の予測に使用される。
【0603】
カバードバックグラウンド領域の背景成分画像に対応する係数セットは、画素値を予測するクラス分類適応処理において、カバードバックグラウンド領域の背景成分画像に対応する画素値の予測に使用される。カバードバックグラウンド領域の前景成分画像に対応する係数セットは、画素値を予測するクラス分類適応処理において、カバードバックグラウンド領域の前景成分画像に対応する画素値の予測に使用される。
【0604】
前景領域に対応する係数セットは、画素値を予測するクラス分類適応処理において、前景領域の画素値の予測に使用される。
【0605】
背景領域の画像に対応する予測画像、アンカバードバックグラウンド領域の背景成分画像に対応する予測画像、アンカバードバックグラウンド領域の前景成分画像に対応する予測画像、カバードバックグラウンド領域の背景成分画像に対応する予測画像、カバードバックグラウンド領域の前景成分画像に対応する予測画像、および前景領域の画像に対応する予測画像は、合成され、1つの予測画像とされる。
【0606】
図90のフローチャートを参照して、図84に構成を示す分離画像処理部106による、クラス分類適応処理による画素値の予測に使用される係数セットを生成する学習の処理を説明する。
【0607】
ステップS701において、加重平均部707−1乃至707−6は、背景領域の画像、前景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、およびカバードバックグラウンド領域の前景成分画像の生徒画像を生成する。すなわち、加重平均部707−1は、背景領域教師画像フレームメモリ701に記憶されている、教師画像の背景領域の画像を、例えば、4分の1加重平均して、教師画像の背景領域の画像に対応する生徒画像を生成する。
【0608】
加重平均部707−2は、アンカバードバックグラウンド領域背景成分教師画像フレームメモリ702に記憶されている、教師画像のアンカバードバックグラウンド領域の背景成分画像を、例えば、4分の1加重平均して、教師画像のアンカバードバックグラウンド領域の背景成分画像に対応する生徒画像を生成する。
【0609】
加重平均部707−3は、アンカバードバックグラウンド領域前景成分教師画像フレームメモリ703に記憶されている、教師画像のアンカバードバックグラウンド領域の前景成分画像を、例えば、4分の1加重平均して、教師画像のアンカバードバックグラウンド領域の前景成分画像に対応する生徒画像を生成する。
【0610】
加重平均部707−4は、カバードバックグラウンド領域背景成分教師画像フレームメモリ704に記憶されている、教師画像のカバードバックグラウンド領域の背景成分画像を、例えば、4分の1加重平均して、教師画像のカバードバックグラウンド領域の背景成分画像に対応する生徒画像を生成する。
【0611】
加重平均部707−5は、カバードバックグラウンド領域前景成分教師画像フレームメモリ705に記憶されている、教師画像のカバードバックグラウンド領域の前景成分画像を、例えば、4分の1加重平均して、教師画像のカバードバックグラウンド領域の前景成分画像に対応する生徒画像を生成する。
【0612】
加重平均部707−6は、前景領域教師画像フレームメモリ706に記憶されている、教師画像の前景領域の画像を、例えば、4分の1加重平均して、教師画像の前景領域の画像に対応する生徒画像を生成する。
【0613】
ステップS702において、学習部714−1は、背景領域教師画像フレームメモリ701に記憶されている教師画像の背景領域の画像、および背景領域生徒画像フレームメモリ708に記憶されている、教師画像の背景領域の画像に対応する生徒画像を基に、背景領域に対応する係数セットを生成する。ステップS702における係数セットの生成の処理の詳細は、図91のフローチャートを参照して後述する。
【0614】
ステップS703において、学習部714−2は、アンカバードバックグラウンド領域背景成分教師画像フレームメモリ702に記憶されている、教師画像のアンカバードバックグラウンド領域の背景成分画像、およびアンカバードバックグラウンド領域背景成分生徒画像フレームメモリ709に記憶されている、教師画像のアンカバードバックグラウンド領域の背景成分画像に対応する生徒画像を基に、アンカバードバックグラウンド領域の背景成分画像に対応する係数セットを生成する。
【0615】
ステップS704において、学習部714−3は、アンカバードバックグラウンド領域前景成分教師画像フレームメモリ703に記憶されている、教師画像のアンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域前景成分生徒画像フレームメモリ710に記憶されている、教師画像のアンカバードバックグラウンド領域の前景成分画像に対応する生徒画像を基に、アンカバードバックグラウンド領域の前景成分画像に対応する係数セットを生成する。
【0616】
ステップS705において、学習部714−4は、カバードバックグラウンド領域背景成分教師画像フレームメモリ704に記憶されている、教師画像のカバードバックグラウンド領域の背景成分画像、およびカバードバックグラウンド領域背景成分生徒画像フレームメモリ711に記憶されている、教師画像のカバードバックグラウンド領域の背景成分画像に対応する生徒画像を基に、カバードバックグラウンド領域の背景成分画像に対応する係数セットを生成する。
【0617】
ステップS706において、学習部714−5は、カバードバックグラウンド領域前景成分教師画像フレームメモリ705に記憶されている、教師画像のカバードバックグラウンド領域の前景成分画像、およびカバードバックグラウンド領域前景成分生徒画像フレームメモリ712に記憶されている、教師画像のカバードバックグラウンド領域の前景成分画像に対応する生徒画像を基に、カバードバックグラウンド領域の前景成分画像に対応する係数セットを生成する。
【0618】
ステップS707において、学習部714−6は、前景領域教師画像フレームメモリ706に記憶されている教師画像の前景領域の画像、および前景領域生徒画像フレームメモリ713に記憶されている、教師画像の前景領域の画像に対応する生徒画像を基に、前景領域に対応する係数セットを生成する。
【0619】
ステップS708において、学習部714−1乃至712−4は、それぞれ、背景領域に対応する係数セット、アンカバードバックグラウンド領域の背景成分画像に対応する係数セット、アンカバードバックグラウンド領域の前景成分画像に対応する係数セット、カバードバックグラウンド領域の背景成分画像に対応する係数セット、カバードバックグラウンド領域の前景成分画像に対応する係数セット、または前景領域に対応する係数セットを係数セットメモリ715に出力する。係数セットメモリ715は、背景領域、前景領域、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、またはカバードバックグラウンド領域の前景成分画像のそれぞれに対応する係数セットを記憶して、処理は終了する。
【0620】
このように、図84に構成を示す分離画像処理部106は、背景領域の画像に対応する係数セット、アンカバードバックグラウンド領域の背景成分画像に対応する係数セット、アンカバードバックグラウンド領域の前景成分画像に対応する係数セット、カバードバックグラウンド領域の背景成分画像に対応する係数セット、カバードバックグラウンド領域の前景成分画像に対応する係数セット、および前景領域の画像に対応する係数セットを生成することができる。
【0621】
なお、ステップS702乃至ステップS707の処理を、シリアルに実行しても、パラレルに実行しても良いことは勿論である。
【0622】
次に、図91のフローチャートを参照して、ステップS702の処理に対応する、学習部714−1が実行する背景領域に対応する係数セットの生成の処理を説明する。
【0623】
ステップS721において、学習部714−1は、背景領域に対応する生徒画像に未処理の画素があるか否かを判定し、背景領域に対応する生徒画像に未処理の画素があると判定された場合、ステップS722に進み、ラスタースキャン順に、背景領域に対応する生徒画像から注目画素を取得する。
【0624】
ステップS723において、クラス分類部731のクラスタップ取得部751は、背景領域生徒画像フレームメモリ708に記憶されている生徒画像から、注目画素に対応するクラスタップを取得する。ステップS724において、クラス分類部731の波形分類部752は、クラスタップに対して、ADRC処理を適用し、これにより、クラスタップを構成する画素のビット数を小さくして、注目画素をクラス分類する。ステップS725において、予測タップ取得部732は、分類されたクラスを基に、背景領域生徒画像フレームメモリ708に記憶されている生徒画像から、注目画素に対応する予測タップを取得する。
【0625】
ステップS726において、対応画素取得部733は、分類されたクラスを基に、背景領域教師画像フレームメモリ701に記憶されている教師画像の背景領域の画像から、予測すべき画素値に対応する画素を取得する。
【0626】
ステップS727において、正規方程式生成部734は、分類されたクラスを基に、クラス毎の行列に、予測タップおよび予測すべき画素値に対応する画素の画素値を足し込み、ステップS721に戻り、分離画像処理部106は、未処理の画素があるか否かの判定を繰り返す。予測タップおよび予測すべき画素値に対応する画素の画素値を足し込まれるクラス毎の行列は、クラス毎の係数セットを計算するための正規方程式に対応している。
【0627】
ステップS721において、生徒画像に未処理の画素がないと判定された場合、ステップS728に進み、正規方程式生成部734は、予測タップおよび予測すべき画素値に対応する画素の画素値が設定された、クラス毎の行列を係数計算部735に供給する。係数計算部735は、予測タップおよび予測すべき画素値に対応する画素の画素値が設定された、クラス毎の行列を解いて、背景領域に対応する、クラス毎の係数セットを計算する。
【0628】
なお、係数計算部735は、線形予測により画素値を予測するための係数セットに限らず、非線形予測により画素値を予測するための係数セットを計算するようにしてもよい。
【0629】
ステップS729において、係数計算部735は、背景領域に対応する、クラス毎の係数セットを係数セットメモリ715に出力し、処理は終了する。
【0630】
このように、学習部714−1は、背景領域に対応する係数セットを生成することができる。
【0631】
ステップS703に対応する、学習部714−2による、アンカバードバックグラウンド領域の背景成分画像に対応する係数セットの生成の処理は、アンカバードバックグラウンド領域背景成分教師画像フレームメモリ702に記憶されているアンカバードバックグラウンド領域の背景成分画像、およびアンカバードバックグラウンド領域背景成分生徒画像フレームメモリ709に記憶されているアンカバードバックグラウンド領域の背景成分画像に対応する生徒画像を使用することを除いて、図91のフローチャートを参照して説明した処理と同様なので、その説明は省略する。
【0632】
ステップS704に対応する、学習部714−3による、アンカバードバックグラウンド領域の前景成分画像に対応する係数セットの生成の処理は、アンカバードバックグラウンド領域前景成分教師画像フレームメモリ703に記憶されているアンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域前景成分生徒画像フレームメモリ710に記憶されているアンカバードバックグラウンド領域の前景成分画像に対応する生徒画像を使用することを除いて、図91のフローチャートを参照して説明した処理と同様なので、その説明は省略する。
【0633】
ステップS705に対応する、学習部714−4による、カバードバックグラウンド領域の背景成分画像に対応する係数セットの生成の処理は、カバードバックグラウンド領域背景成分教師画像フレームメモリ704に記憶されているカバードバックグラウンド領域の背景成分画像、およびカバードバックグラウンド領域背景成分生徒画像フレームメモリ711に記憶されているカバードバックグラウンド領域の背景成分画像に対応する生徒画像を使用することを除いて、図91のフローチャートを参照して説明した処理と同様なので、その説明は省略する。
【0634】
ステップS706に対応する、学習部714−5による、カバードバックグラウンド領域の前景成分画像に対応する係数セットの生成の処理は、カバードバックグラウンド領域前景成分教師画像フレームメモリ705に記憶されているカバードバックグラウンド領域の前景成分画像、およびカバードバックグラウンド領域前景成分生徒画像フレームメモリ712に記憶されているカバードバックグラウンド領域の前景成分画像に対応する生徒画像を使用することを除いて、図91のフローチャートを参照して説明した処理と同様なので、その説明は省略する。
【0635】
ステップS707に対応する、学習部714−6による、前景領域に対応する係数セットの生成の処理は、前景領域教師画像フレームメモリ706に記憶されている前景領域の画像、および前景領域生徒画像フレームメモリ713に記憶されている前景領域の画像に対応する生徒画像を使用することを除いて、図91のフローチャートを参照して説明した処理と同様なので、その説明は省略する。
【0636】
このように、図84に構成を示す分離画像処理部106は、背景領域に対応する係数セット、アンカバードバックグラウンド領域の背景成分画像に対応する係数セット、アンカバードバックグラウンド領域の前景成分画像に対応する係数セット、カバードバックグラウンド領域の背景成分画像に対応する係数セット、カバードバックグラウンド領域の前景成分画像に対応する係数セット、および前景領域に対応する係数セットを個々に生成することができる。
【0637】
図92は、クラス分類適応処理を実行して、空間方向に、より高解像度な画像を生成する分離画像処理部106の構成を示すブロック図である。例えば、図92に構成を示す分離画像処理部106は、SD画像である入力画像を基に、クラス分類適応処理を実行して、HD画像を生成する。
【0638】
背景領域フレームメモリ801は、前景背景分離部105から供給された、背景領域に属する画素からなる背景領域の画像を記憶する。背景領域フレームメモリ801は、記憶している背景領域の画像をマッピング部807−1に供給する。
【0639】
アンカバードバックグラウンド領域背景成分画像フレームメモリ802は、前景背景分離部105から供給された、アンカバードバックグラウンド領域の背景成分画像を記憶する。アンカバードバックグラウンド領域背景成分画像フレームメモリ802は、記憶しているアンカバードバックグラウンド領域の背景成分画像をマッピング部807−2に供給する。
【0640】
アンカバードバックグラウンド領域前景成分画像フレームメモリ803は、前景背景分離部105から供給された、アンカバードバックグラウンド領域の前景成分画像を記憶する。アンカバードバックグラウンド領域前景成分画像フレームメモリ803は、記憶しているアンカバードバックグラウンド領域の前景成分画像をマッピング部807−3に供給する。
【0641】
カバードバックグラウンド領域背景成分画像フレームメモリ804は、前景背景分離部105から供給された、カバードバックグラウンド領域の背景成分画像を記憶する。カバードバックグラウンド領域背景成分画像フレームメモリ804は、記憶しているカバードバックグラウンド領域の背景成分画像をマッピング部807−4に供給する。
【0642】
カバードバックグラウンド領域前景成分画像フレームメモリ805は、前景背景分離部105から供給された、カバードバックグラウンド領域の前景成分画像を記憶する。カバードバックグラウンド領域前景成分画像フレームメモリ805は、記憶しているカバードバックグラウンド領域の前景成分画像をマッピング部807−5に供給する。
【0643】
前景領域フレームメモリ806は、前景背景分離部105から供給された、前景領域に属する画素からなる前景領域の画像を記憶する。前景領域画像フレームメモリ806は、記憶している前景領域の画像をマッピング部807−6に供給する。
【0644】
マッピング部807−1は、係数セットメモリ808に記憶されている、背景領域に対応する係数セットを基に、クラス分類適応処理により、背景領域フレームメモリ801に記憶されている背景領域の画像に対応する予測画像を生成する。マッピング部807−1は、生成した予測画像を合成部809に供給する。
【0645】
マッピング部807−2は、係数セットメモリ808に記憶されている、アンカバードバックグラウンド領域の背景成分画像に対応する係数セットを基に、クラス分類適応処理により、アンカバードバックグラウンド領域背景成分画像フレームメモリ802に記憶されている、アンカバードバックグラウンド領域の背景成分画像に対応する予測画像を生成する。マッピング部807−2は、生成した予測画像を合成部809に供給する。
【0646】
マッピング部807−3は、係数セットメモリ808に記憶されている、アンカバードバックグラウンド領域の前景成分画像に対応する係数セットを基に、クラス分類適応処理により、アンカバードバックグラウンド領域前景成分画像フレームメモリ803に記憶されている、アンカバードバックグラウンド領域の前景成分画像に対応する予測画像を生成する。マッピング部807−3は、生成した予測画像を合成部809に供給する。
【0647】
マッピング部807−4は、係数セットメモリ808に記憶されている、カバードバックグラウンド領域の背景成分画像に対応する係数セットを基に、クラス分類適応処理により、カバードバックグラウンド領域背景成分画像フレームメモリ804に記憶されている、カバードバックグラウンド領域の背景成分画像に対応する予測画像を生成する。マッピング部807−4は、生成した予測画像を合成部809に供給する。
【0648】
マッピング部807−5は、係数セットメモリ808に記憶されている、カバードバックグラウンド領域の前景成分画像に対応する係数セットを基に、クラス分類適応処理により、カバードバックグラウンド領域前景成分画像フレームメモリ805に記憶されている、カバードバックグラウンド領域の前景成分画像に対応する予測画像を生成する。マッピング部807−5は、生成した予測画像を合成部809に供給する。
【0649】
マッピング部807−6は、係数セットメモリ808に記憶されている、前景領域に対応する係数セットを基に、クラス分類適応処理により、前景領域フレームメモリ806に記憶されている前景領域の画像に対応する予測画像を生成する。マッピング部807−6は、生成した予測画像を合成部809に供給する。
【0650】
合成部809は、マッピング部807−1から供給された背景領域の画像に対応する予測画像、マッピング部807−2から供給されたアンカバードバックグラウンド領域の背景成分画像に対応する予測画像、マッピング部807−3から供給されたアンカバードバックグラウンド領域の前景成分画像に対応する予測画像、マッピング部807−4から供給されたカバードバックグラウンド領域の背景成分画像に対応する予測画像、マッピング部807−5から供給されたカバードバックグラウンド領域の前景成分画像に対応する予測画像、およびマッピング部807−6から供給された前景領域の画像に対応する予測画像を合成し、合成された予測画像をフレームメモリ810に供給する。
【0651】
フレームメモリ810は、合成部809から供給された予測画像を記憶すると共に、記憶している画像を出力画像として出力する。
【0652】
以下、マッピング部807−1乃至807−6を個々に区別する必要がないとき、単にマッピング部807と称する。
【0653】
図93は、マッピング部807の構成を示すブロック図である。
【0654】
マッピング処理部831は、クラス分類処理を実行するクラス分類部841、並びに適応処理を実行する予測タップ取得部842および予測演算部843で構成されている。
【0655】
クラス分類部841は、クラスタップ取得部851および波形分類部852で構成され、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、または前景領域の画像のいずれかである、分離された入力画像の、注目している画素である、注目画素をクラス分類する。
【0656】
クラスタップ取得部851は、分離された入力画像の注目画素に対応する、所定の数のクラスタップを取得し、取得したクラスタップを波形分類部852に供給する。例えば、クラスタップ取得部851は、9個のクラスタップを取得し、取得したクラスタップを波形分類部852に供給する。
【0657】
波形分類部852は、クラスタップに対して、ADRC処理を適用し、これにより、クラスタップを構成する画素のビット数を小さくして、注目画素を所定の数のクラスのうちの1つのクラスに分類し、分類されたクラスに対応するクラス番号を予測タップ取得部842に供給する。例えば、波形分類部852は、注目画素を512のクラスのうちの1つのクラスに分類し、分類されたクラスに対応するクラス番号を予測タップ取得部842に供給する。
【0658】
予測タップ取得部842は、クラス番号を基に、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、または前景領域の画像のいずれかである、分離された入力画像から、クラスに対応する、所定の数の予測タップを取得し、取得した予測タップおよびクラス番号を予測演算部843に供給する。
【0659】
予測演算部843は、クラス番号を基に、係数セットメモリ808に記憶されている背景領域、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域に対応する係数セットから、予測しようとする画像に対応し、クラスに対応する係数セットを取得する。予測演算部843は、予測しようとする画像に対応し、クラスに対応する係数セット、および予測タップを基に、線形予測により予測画像の画素値を予測する。予測演算部43は、予測した画素値をフレームメモリ832に供給する。
【0660】
なお、予測演算部843は、非線形予測により予測画像の画素値を予測するようしてもよい。
【0661】
フレームメモリ832は、マッピング処理部831から供給された、予測された画素値を記憶し、予測された画素値からなる画像を出力する。
【0662】
図94乃至図99に示す画像を参照して、図92に構成を示す分離画像処理部106を有する本発明の画像処理装置の処理の結果の例を説明する。
【0663】
例に示す結果を生成する処理において、本発明の画像処理装置のクラス分類適応処理におけるクラスの数の総和は、従来のクラス分類適応処理におけるクラスの数とほぼ同一である。すなわち、従来のクラス分類適応処理におけるクラスの数は、2048とし、各領域の画像に対応する、本発明の画像処理装置のクラス分類適応処理におけるクラスの数は、512とした。
【0664】
また、従来のクラス分類適応処理における予測タップの数、および本発明の画像処理装置の各領域のクラス分類適応処理における予測タップの数は、9個とし、同一とした。
【0665】
図94乃至図96を参照して、カバードバックグラウンド領域における予測の結果を説明する。
【0666】
図94(A)は、教師画像の混合領域における画像の例を示す図である。図94(B)は、教師画像の混合領域における画像の、空間方向の位置に対応する画素値の変化を示す図である。
【0667】
図95(A)は、図94に示す教師画像に対応する、従来のクラス分類適応処理により生成された、混合領域の画像の例を示す図である。図95(B)は、図94に示す教師画像に対応する、従来のクラス分類適応処理により生成された、混合領域における画像の、空間方向の位置に対応する画素値の変化を示す図である。
【0668】
図96(A)は、図94に示す教師画像に対応する、図92に構成を示す分離画像処理部106により生成された、混合領域の画像の例を示す図である。図95(B)は、図94に示す教師画像に対応する、図92に構成を示す分離画像処理部106により生成された、混合領域における画像の、空間方向の位置に対応する画素値の変化を示す図である。
【0669】
従来のクラス分類適応処理により生成された、混合領域における画像の画素値は、教師画像に比較して、階段状に変化し、生成された実際の画像においても、段階的に変化していることが、目視により確認できる。
【0670】
これに対して、図92に構成を示す分離画像処理部106により生成された、混合領域における画像の画素値は、従来に比較して、より滑らかに変化し、教師画像により近い変化を示す。分離画像処理部106により生成された画像を目視により確認しても、従来に比較して、滑らかな画像であることが確認できる。
【0671】
図92に構成を示す分離画像処理部106により生成された、混合領域における画像は、入力画像を前景領域、混合領域、または背景領域に分割して、生成された画像に比較しても、より滑らかに変化している。
【0672】
図97乃至図99を参照して、画素の位置に対して画素値がほぼ直線的に変化している前景領域における予測の結果を説明する。
【0673】
図97(A)は、画素値がほぼ直線的に変化している、教師画像の前景領域における画像の例を示す図である。図97(B)は、画素値がほぼ直線的に変化している、教師画像の前景領域における画像の、空間方向の位置に対応する画素値の変化を示す図である。
【0674】
図98(A)は、従来のクラス分類適応処理により生成された、図97の画像に対応する、前景領域の画像の例を示す図である。図98(B)は、従来のクラス分類適応処理により生成された、図97の画像に対応する、前景領域における画像の、空間方向の位置に対応する画素値の変化を示す図である。
【0675】
図99(A)は、図92に構成を示す分離画像処理部106により生成された、図97の画像に対応する、前景領域の画像の例を示す図である。図99(B)は、図92に構成を示す分離画像処理部106により生成された、図97の画像に対応する、前景領域における画像の、空間方向の位置に対応する画素値の変化を示す図である。
【0676】
従来のクラス分類適応処理により生成された、前景領域における画像の画素値は、混合領域と同様に、教師画像に比較して、階段状に変化し、実際の画像においても、段階的に変化していることが、目視により確認できる。
【0677】
これに対して、図92に構成を示す分離画像処理部106により生成された、前景領域における画像の画素値は、従来に比較して、より滑らかに変化し、教師画像に極めて近い値となる。分離画像処理部106により生成された画像の目視による確認においては、教師画像との違いが認められなかった。
【0678】
次に、図100のフローチャートを参照して、図92に構成を示す分離画像処理部106の画像の創造の処理を説明する。
【0679】
ステップS801において、マッピング部807−1は、係数セットメモリ808に記憶されている、背景領域に対応する係数セットを基に、クラス分類適応処理により、背景領域フレームメモリ801に記憶されている背景領域の画像に対応する画像を予測する。背景領域の画像に対応する画像の予測の処理の詳細は、図101のフローチャートを参照して後述する。
【0680】
ステップS802において、マッピング部807−2は、係数セットメモリ808に記憶されている、アンカバードバックグラウンド領域の背景成分画像に対応する係数セットを基に、クラス分類適応処理により、アンカバードバックグラウンド領域背景成分画像フレームメモリ802に記憶されている、アンカバードバックグラウンド領域の背景成分画像に対応する画像を予測する。
【0681】
ステップS803において、マッピング部807−3は、係数セットメモリ808に記憶されている、アンカバードバックグラウンド領域の前景成分画像に対応する係数セットを基に、クラス分類適応処理により、アンカバードバックグラウンド領域前景成分画像フレームメモリ803に記憶されている、アンカバードバックグラウンド領域の前景成分画像に対応する画像を予測する。
【0682】
ステップS804において、マッピング部807−4は、係数セットメモリ808に記憶されている、カバードバックグラウンド領域の背景成分画像に対応する係数セットを基に、クラス分類適応処理により、カバードバックグラウンド領域背景成分画像フレームメモリ804に記憶されている、カバードバックグラウンド領域の背景成分画像に対応する画像を予測する。
【0683】
ステップS805において、マッピング部807−5は、係数セットメモリ808に記憶されている、カバードバックグラウンド領域の前景成分画像に対応する係数セットを基に、クラス分類適応処理により、カバードバックグラウンド領域前景成分画像フレームメモリ805に記憶されている、カバードバックグラウンド領域の前景成分画像に対応する画像を予測する。
【0684】
ステップS806において、マッピング部807−6は、係数セットメモリ808に記憶されている、前景領域に対応する係数セットを基に、クラス分類適応処理により、前景領域フレームメモリ806に記憶されている前景領域の画像に対応する画像を予測する。
【0685】
ステップS807において、合成部809は、背景領域の画像に対応する予測画像、アンカバードバックグラウンド領域の背景成分画像に対応する予測画像、アンカバードバックグラウンド領域の前景成分画像に対応する予測画像、カバードバックグラウンド領域の背景成分画像に対応する予測画像、カバードバックグラウンド領域の前景成分画像に対応する予測画像、および前景領域に対応する予測画像を合成する。合成部809は、合成された画像をフレームメモリ810に供給する。フレームメモリ810は、合成部809から供給された画像を記憶する。
【0686】
ステップS808において、フレームメモリ810は、記憶している、合成された画像を出力し、処理は終了する。
【0687】
このように、図92に構成を示す分離画像処理部106を有する画像処理装置は、分離された、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像毎に、予測画像を生成することができる。
【0688】
なお、ステップS801乃至ステップS806の処理を、シリアルに実行しても、パラレルに実行しても良いことは勿論である。
【0689】
図101のフローチャートを参照して、ステップS801に対応する、マッピング部807−1による背景領域に対応する画像の予測の処理を説明する。
【0690】
ステップS821において、マッピング部807−1は、背景領域の画像に未処理の画素があるか否かを判定し、背景領域の画像に未処理の画素があると判定された場合、ステップS822に進み、マッピング処理部831は、係数セットメモリ808に記憶されている、背景領域に対応する係数セットを取得する。ステップS823において、マッピング処理部831は、ラスタースキャン順に、背景領域フレームメモリ801に記憶されている背景領域の画像から注目画素を取得する。
【0691】
ステップS824において、クラス分類部841のクラスタップ取得部851は、背景領域フレームメモリ801に記憶されている背景領域の画像から、注目画素に対応するクラスタップを取得する。ステップS825において、クラス分類部841の波形分類部852は、クラスタップに対して、ADRC処理を適用し、これにより、クラスタップを構成する画素のビット数を小さくして、注目画素をクラス分類する。ステップS826において、予測タップ取得部842は、分類されたクラスを基に、背景領域フレームメモリ801に記憶されている背景領域の画像から、注目画素に対応する予測タップを取得する。
【0692】
ステップS827において、予測演算部843は、背景領域および分類されたクラスに対応する係数セット、および予測タップを基に、線形予測により、予測画像の画素値を予測する。
【0693】
なお、予測演算部843は、線形予測に限らず、非線形予測により予測画像の画素値を予測するようにしてもよい。
【0694】
ステップS828において、予測演算部843は、予測された画素値をフレームメモリ832に出力する。フレームメモリ832は、予測演算部843から供給された画素値を記憶する。手続きは、ステップS821に戻り、未処理の画素があるか否かの判定を繰り返す。
【0695】
ステップS821において、背景領域の画像に未処理の画素がないと判定された場合、ステップS829に進み、フレームメモリ832は、記憶されている背景領域の画像に対応する予測画像を出力して、処理は終了する。
【0696】
このように、マッピング部807−1は、分離された入力画像の背景領域の画像を基に、背景領域の画像に対応する画像を予測することができる。
【0697】
ステップS802に対応する、マッピング部807−2による、アンカバードバックグラウンド領域の背景成分画像に対応する予測画像の生成の処理は、アンカバードバックグラウンド領域背景成分画像フレームメモリ802に記憶されているアンカバードバックグラウンド領域の背景成分画像、およびアンカバードバックグラウンド領域の背景成分画像に対応する係数セットを使用することを除いて、図101のフローチャートを参照して説明した処理と同様なので、その説明は省略する。
【0698】
ステップS803に対応する、マッピング部807−3による、アンカバードバックグラウンド領域の前景成分画像に対応する予測画像の生成の処理は、アンカバードバックグラウンド領域前景成分画像フレームメモリ803に記憶されているアンカバードバックグラウンド領域の前景成分画像、およびアンカバードバックグラウンド領域の前景成分画像に対応する係数セットを使用することを除いて、図101のフローチャートを参照して説明した処理と同様なので、その説明は省略する。
【0699】
ステップS804に対応する、マッピング部807−4による、カバードバックグラウンド領域の背景成分画像に対応する予測画像の生成の処理は、カバードバックグラウンド領域背景成分画像フレームメモリ804に記憶されているカバードバックグラウンド領域の背景成分画像、およびカバードバックグラウンド領域の背景成分画像に対応する係数セットを使用することを除いて、図101のフローチャートを参照して説明した処理と同様なので、その説明は省略する。
【0700】
ステップS805に対応する、マッピング部807−5による、カバードバックグラウンド領域の前景成分画像に対応する予測画像の生成の処理は、カバードバックグラウンド領域前景成分画像フレームメモリ805に記憶されているカバードバックグラウンド領域の前景成分画像、およびカバードバックグラウンド領域の前景成分画像に対応する係数セットを使用することを除いて、図101のフローチャートを参照して説明した処理と同様なので、その説明は省略する。
【0701】
ステップS806に対応する、マッピング部807−6による、前景領域の画像に対応する予測画像の生成の処理は、前景領域フレームメモリ806に記憶されている前景領域の画像、および前景領域に対応する係数セットを使用することを除いて、図101のフローチャートを参照して説明した処理と同様なので、その説明は省略する。
【0702】
このように、図92に構成を示す分離画像処理部106は、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、または前景領域の画像毎に予測画像を生成することができる。
【0703】
図102は、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、または前景領域の画像毎に、異なる効果のエッジ強調処理を適用する分離画像処理部106の構成を示すブロック図である。
【0704】
背景領域フレームメモリ901は、前景背景分離部105から供給された、背景領域に属する画素からなる背景領域の画像を記憶する。背景領域フレームメモリ901は、記憶している背景領域の画像をエッジ強調部907−1に供給する。
【0705】
アンカバードバックグラウンド領域背景成分画像フレームメモリ902は、前景背景分離部105から供給された、アンカバードバックグラウンド領域の背景成分画像を記憶する。アンカバードバックグラウンド領域背景成分画像フレームメモリ902は、記憶しているアンカバードバックグラウンド領域の背景成分画像をエッジ強調部907−2に供給する。
【0706】
アンカバードバックグラウンド領域前景成分画像フレームメモリ903は、前景背景分離部105から供給された、アンカバードバックグラウンド領域の前景成分画像を記憶する。アンカバードバックグラウンド領域前景成分画像フレームメモリ903は、記憶しているアンカバードバックグラウンド領域の前景成分画像をエッジ強調部907−3に供給する。
【0707】
カバードバックグラウンド領域背景成分画像フレームメモリ904は、前景背景分離部105から供給された、カバードバックグラウンド領域の背景成分画像を記憶する。カバードバックグラウンド領域背景成分画像フレームメモリ904は、記憶しているカバードバックグラウンド領域の背景成分画像をエッジ強調部907−4に供給する。
【0708】
カバードバックグラウンド領域前景成分画像フレームメモリ905は、前景背景分離部105から供給された、カバードバックグラウンド領域の前景成分画像を記憶する。カバードバックグラウンド領域前景成分画像フレームメモリ905は、記憶しているカバードバックグラウンド領域の前景成分画像をエッジ強調部907−5に供給する。
【0709】
前景領域フレームメモリ906は、前景背景分離部105から供給された、前景領域に属する画素からなる前景領域の画像を記憶する。前景領域フレームメモリ906は、記憶している前景領域の画像をエッジ強調部907−6に供給する。
【0710】
エッジ強調部907−1は、背景領域フレームメモリ901に記憶されている背景領域の画像に、背景領域の画像に適したエッジ強調の処理を適用して、エッジ強調した背景領域の画像を合成部908に供給する。
【0711】
例えば、エッジ強調部907−1は、静止している画像である背景領域の画像に、前景領域に比較して、エッジをより強調するエッジ強調の処理を実行する。
このようにすることで、動いている画像にエッジ強調の処理を適用したときの不自然な画像の劣化を発生させることなく、背景領域の画像の解像度感をより増加させることができる。
【0712】
エッジ強調部907−2は、アンカバードバックグラウンド領域背景成分画像フレームメモリ902に記憶されている画像に、アンカバードバックグラウンド領域の背景成分画像に適したエッジ強調の処理を適用して、エッジ強調した画像を合成部908に供給する。
【0713】
例えば、エッジ強調部907−2は、静止している画像であるアンカバードバックグラウンド領域の背景成分画像に、前景領域に比較して、エッジをより強調するエッジ強調の処理を実行する。このようにすることで、動いている画像にエッジ強調の処理を適用したときの不自然な画像の劣化を発生させることなく、背景領域の画像の解像度感をより増加させることができる。
【0714】
エッジ強調部907−3は、アンカバードバックグラウンド領域前景成分画像フレームメモリ903に記憶されている画像に、アンカバードバックグラウンド領域の前景成分画像に適したエッジ強調の処理を適用して、エッジ強調した画像を合成部908に供給する。
【0715】
例えば、エッジ強調部907−3は、動いている前景成分からなるカバードバックグラウンド領域の前景成分画像に、背景領域に比較して、エッジ強調の度合いの少ないエッジ強調の処理を実行する。このようにすることで、カバードバックグラウンド領域の前景成分画像において、解像度感を向上させつつ、動いている画像にエッジ強調の処理を適用したときの不自然な画像の劣化を減少させることができる。
【0716】
エッジ強調部907−4は、カバードバックグラウンド領域背景成分画像フレームメモリ904に記憶されている画像に、カバードバックグラウンド領域の背景成分画像に適したエッジ強調の処理を適用して、エッジ強調した画像を合成部908に供給する。
【0717】
例えば、エッジ強調部907−4は、静止している画像であるカバードバックグラウンド領域の背景成分画像に、前景領域に比較して、エッジをより強調するエッジ強調の処理を実行する。このようにすることで、動いている画像にエッジ強調の処理を適用したときの不自然な画像の劣化を発生させることなく、背景領域の画像の解像度感をより増加させることができる。
【0718】
エッジ強調部907−5は、カバードバックグラウンド領域前景成分画像フレームメモリ905に記憶されている画像に、カバードバックグラウンド領域の前景成分画像に適したエッジ強調の処理を適用して、エッジ強調した画像を合成部908に供給する。
【0719】
例えば、エッジ強調部907−5は、動いている前景成分からなるカバードバックグラウンド領域の前景成分画像に、背景領域に比較して、エッジ強調の度合いの少ないエッジ強調の処理を実行する。このようにすることで、カバードバックグラウンド領域の前景成分画像において、解像度感を向上させつつ、動いている画像にエッジ強調の処理を適用したときの不自然な画像の劣化を減少させることができる。
【0720】
エッジ強調部907−6は、前景領域フレームメモリ906に記憶されている前景領域の画像に、前景領域の画像に適したエッジ強調の処理を適用して、エッジ強調した前景領域の画像を合成部908に供給する。
【0721】
例えば、エッジ強調部907−6は、動いている前景領域の画像に、背景領域に比較して、エッジ強調の度合いの少ないエッジ強調の処理を実行する。このようにすることで、前景領域の画像において、解像度感を向上させつつ、動いている画像にエッジ強調の処理を適用したときの不自然な画像の劣化を減少させることができる。
【0722】
合成部908は、エッジ強調部907−1から供給された、エッジ強調された背景領域の画像、エッジ強調部907−2から供給された、エッジ強調されたアンカバードバックグラウンド領域の背景成分画像、エッジ強調部907−3から供給された、エッジ強調されたアンカバードバックグラウンド領域の前景成分画像、エッジ強調部907−4から供給された、エッジ強調されたカバードバックグラウンド領域の背景成分画像、エッジ強調部907−5から供給された、エッジ強調されたカバードバックグラウンド領域の前景成分画像、およびエッジ強調部907−6から供給された、エッジ強調された前景領域の画像を合成し、合成された画像をフレームメモリ909に供給する。
【0723】
フレームメモリ909は、合成部908から供給された、合成された画像を記憶すると共に、記憶している画像を出力画像として出力する。
【0724】
このように、図74に構成を示す分離画像処理部106は、背景領域、アンカバードバックグラウンド領域、カバードバックグラウンド領域、または前景領域毎に、それぞれの画像の性質に対応したエッジ強調処理を適用するので、画像を不自然に劣化させることなく、画像の解像度感を増すことができる。
【0725】
以下、エッジ強調部907−1乃至907−6を個々に区別する必要がないとき、単にエッジ強調部907と称する。
【0726】
図103は、エッジ強調部907の構成を示すブロック図である。分離された入力画像は、ハイパスフィルタ921および加算部923に入力される。
【0727】
ハイパスフィルタ921は、入力されたフィルタ係数を基に、入力画像から、画素位置に対して画素値が急激に変化している、いわゆる画像の周波数の高い成分を抽出し、画素位置に対して画素値の変化が少ない、いわゆる画像の周波数の低い成分を除去して、エッジ画像を生成する。
【0728】
例えば、ハイパスフィルタ921は、図104(A)に示す画像が入力されたとき、図104(B)に示すエッジ画像を生成する。
【0729】
入力されるフィルタ係数が変化したとき、ハイパスフィルタ921は、抽出する画像の周波数、除去する画像の周波数、および抽出する画像のゲインを変化させる。
【0730】
図105乃至図108を参照して、フィルタ係数とエッジ画像との関係を説明する。
【0731】
図105は、フィルタ係数の第1の例を示す図である。図105において、Eは、10の階乗を示す。例えば、E-04は、10-4を示し、E-02は、10-2を示す。
【0732】
例えば、ハイパスフィルタ921は、入力画像の、注目している画素である注目画素の画素値、注目画素を基準として、空間方向Yの所定の方向に1画素乃至15画素の距離だけ離れている画素の画素値、および注目画素を基準として、空間方向Yの他の方向に1画素乃至15画素の距離だけ離れている画素の画素値のそれぞれに、図105に示すフィルタ係数のうち、対応する係数を乗算する。ハイパスフィルタ921は、それぞれの画素の画素値に対応する係数を乗算して得られた結果の総和を算出して、算出された総和を注目画素の画素値に設定する。
【0733】
例えば、図105に示すフィルタ係数を使用するとき、ハイパスフィルタ921は、注目画素の画素値に1.2169396を乗算し、注目画素から画面の上方向に1画素の距離だけ離れている画素の画素値に-0.52530356を乗算し、注目画素から画面の上方向に2画素の距離だけ離れている画素の画素値に-0.22739914を乗算する。
【0734】
図105に示すフィルタ係数を使用するとき、ハイパスフィルタ921は、同様に、注目画素から画面の上方向に3画素乃至13画素の距離だけ離れている画素に対応する係数を乗算し、注目画素から画面の上方向に14画素の距離だけ離れている画素の画素値に-0.00022540586を乗算し、注目画素から画面の上方向に15画素の距離だけ離れている画素の画素値に-0.00039273163を乗算する。
【0735】
図105に示すフィルタ係数を使用するとき、ハイパスフィルタ921は、注目画素から画面の下方向に1画素乃至15画素の距離だけ離れている画素に同様に対応する係数を乗算する。
【0736】
ハイパスフィルタ921は、注目画素の画素値、注目画素から画面の上方向に1画素乃至15画素の距離だけ離れている画素の画素値、および注目画素から画面の下方向に1画素乃至15画素の距離だけ離れている画素の画素値のそれぞれに、対応する係数を乗算して得られた結果の総和を算出する。ハイパスフィルタ921は、算出された総和を注目画素の画素値に設定する。
【0737】
ハイパスフィルタ921は、注目画素の位置を空間方向Xに順次移動させて、上述した処理を繰り返し、画面全体の画素について、画素値を算出する。
【0738】
次に、ハイパスフィルタ921は、上述のように係数を基に画素値が算出された画像の、注目している画素である注目画素の画素値、注目画素を基準として、空間方向Xの所定の方向に1画素乃至15画素の距離だけ離れている画素の画素値、および注目画素を基準として、空間方向Xの他の方向に1画素乃至15画素の距離だけ離れている画素の画素値のそれぞれに、図105に示すフィルタ係数のうち、対応する係数を乗算する。ハイパスフィルタ921は、それぞれの画素の画素値に対応する係数を乗算して得られた結果の総和を算出して、算出された総和を注目画素の画素値に設定する。
【0739】
ハイパスフィルタ921は、注目画素の位置を空間方向Yに順次移動させて、上述した処理を繰り返し、画面全体の画素について、画素値を算出する。
【0740】
すなわち、この例において、ハイパスフィルタ921は、図105に示す係数を使用する、いわゆる1次元フィルタである。
【0741】
図106は、図105の係数を使用するときのハイパスフィルタ921の動作を示す図である。図106に示すように、図105の係数を使用するとき、ハイパスフィルタ921における、抽出される画像成分の最大のゲインは、1である。
【0742】
図107は、フィルタ係数の第2の例を示す図である。
【0743】
図108は、図105に示すフィルタ係数を使用した処理と同様の処理を、図107の係数を使用して実行したときのハイパスフィルタ921の動作を示す図である。図108に示すように、図107の係数を使用するとき、ハイパスフィルタ921における、抽出される画像成分の最大のゲインは、1.5である。
【0744】
このように、ハイパスフィルタ921は、供給されるフィルタ係数により、抽出する画像成分のゲインを変化させる。
【0745】
ここでは例示しないが、同様に、異なるフィルタ係数が供給されたとき、ハイパスフィルタ921は、抽出する画像の周波数、および除去する画像の周波数を変化させることができる。
【0746】
図103に戻り、ハイパスフィルタ921は、生成したエッジ画像をゲイン調整部922に供給する。
【0747】
ゲイン調整部922は、入力されたゲイン調整係数を基に、ハイパスフィルタ921から供給されたエッジ画像を増幅するか、または減衰する。入力されるゲイン調整係数が変化したとき、ゲイン調整部922は、エッジ画像の増幅率(減衰率)を変化させる。例えば、ゲイン調整部922は、1以上の増幅率を指定するゲイン調整係数が入力されたとき、エッジ画像を増幅し、1未満の増幅率を指定するゲイン調整係数が入力されたとき、エッジ画像を減衰する。
【0748】
ゲイン調整部922は、ゲインが調整されたエッジ画像を加算部923に供給する。
【0749】
加算部923は、分割された入力画像と、ゲイン調整部922から供給された、ゲインが調整されたエッジ画像とを加算して、加算された画像を出力する。
【0750】
例えば、加算部923は、図104(A)に示す入力画像が入力され、図104(B)に示すエッジ画像がハイパスフィルタ921から供給されたとき、図104(A)の入力画像と図104(B)のエッジ画像とを加算して、図104(C)に示す画像を出力する。
【0751】
このように、エッジ強調部907は、分割された画像にエッジ強調の処理を適用する。
【0752】
例えば、図103に構成を示すエッジ強調部907−1は、図107に示す係数を使用して、エッジ強調の度合いのより強いエッジ強調処理を、背景領域の画像に適用する。図103に構成を示すエッジ強調部907−6は、図105に示す係数を使用して、エッジ強調の度合いの比較的弱いエッジ強調処理を、前景領域の画像に適用する。
【0753】
図109は、エッジ強調部907の他の構成を示すブロック図である。図109に示す例において、エッジ強調部907は、フィルタ941から構成されている。
【0754】
フィルタ941は、入力されたフィルタ係数を基に、入力画像の、画素位置に対して画素値が急激に変化している、いわゆる画像の周波数の高い成分を増幅して、エッジ強調画像を生成する。
【0755】
例えば、フィルタ941は、図110に例を示す係数が供給されたとき、図110に例を示す係数を基に、ハイパスフィルタ921で説明した処理と同様の処理を実行する。
【0756】
図111は、図110の係数を使用するときのフィルタ941の動作を示す図である。図111に示すように、図110の係数を使用するとき、フィルタ941は、画像の周波数の高い成分を2倍に増幅し、画像の周波数の低い成分をそのまま通過させて、エッジ強調画像を生成する。
【0757】
図110の係数を使用するときのフィルタ941は、図105の係数を利用し、ゲイン調整部922のゲインが1であるときの、図103に構成を示すエッジ強調部907の出力画像と同一の出力画像を出力する。
【0758】
図112は、フィルタ941に供給されるフィルタ係数の第2の例を示す図である。
【0759】
図113は、図112の係数を使用するときのフィルタ941の動作を示す図である。図113に示すように、図112の係数を使用するとき、フィルタ941は、画像の周波数の高い成分を2.5倍に増幅し、画像の周波数の低い成分をそのまま通過させて、エッジ強調画像を生成する。
【0760】
図112の係数を使用するときのフィルタ941は、図107の係数を利用し、ゲイン調整部922のゲインが1であるときの、図103に構成を示すエッジ強調部907の出力画像と同一の出力画像を出力する。
【0761】
このように、図109に構成を示すエッジ強調部907は、入力されるフィルタ係数により、画像の高周波成分のゲインを変化させて、画像のエッジの強調の度合いを変更することができる。
【0762】
例えば、図109に構成を示すエッジ強調部907−1は、図112に示す係数を使用して、エッジ強調の度合いのより強いエッジ強調処理を、背景領域の画像に適用する。図109に構成を示すエッジ強調部907−6は、図110に示す係数を使用して、エッジ強調の度合いの比較的弱いエッジ強調処理を、前景領域の画像に適用する。
【0763】
以上のように、エッジ強調部907−1乃至907−6は、例えば、異なるフィルタ係数またはゲイン調整係数を基に、分割された画像の性質に対応したエッジ強調の処理を実行する。
【0764】
図114は、図102に構成を示す分離画像処理部106の処理を説明する図である。
【0765】
入力画像の前景領域、アンカバードバックグラウンド領域、カバードバックグラウンド領域、および背景領域は、領域特定部103に特定される。領域が特定された入力画像は、前景背景分離部105により、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像に分離される。
【0766】
背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像は、図102に構成を示す分離画像処理部106により、それぞれの画像の性質に対応して、それぞれの画像毎にエッジ強調される。
【0767】
それぞれにエッジ強調された、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像は、合成される。
【0768】
次に、図115のフローチャートを参照して、図102に構成を示す分離画像処理部106のエッジ強調の処理を説明する。
【0769】
ステップS901において、エッジ強調部907−1は、背景領域の画像の性質に対応したエッジ強調に処理により、背景領域フレームメモリ901に記憶されている背景領域の画像をエッジ強調する。
【0770】
ステップS902において、エッジ強調部907−2は、アンカバードバックグラウンド領域の背景成分画像の性質に対応したエッジ強調に処理により、アンカバードバックグラウンド領域背景成分画像フレームメモリ902に記憶されている、アンカバードバックグラウンド領域の背景成分画像をエッジ強調する。
【0771】
ステップS903において、エッジ強調部907−3は、アンカバードバックグラウンド領域の前景成分画像の性質に対応したエッジ強調に処理により、アンカバードバックグラウンド領域前景成分画像フレームメモリ903に記憶されている、アンカバードバックグラウンド領域の前景成分画像をエッジ強調する。
【0772】
ステップS904において、エッジ強調部907−4は、カバードバックグラウンド領域の背景成分画像の性質に対応したエッジ強調に処理により、カバードバックグラウンド領域背景成分画像フレームメモリ904に記憶されている、カバードバックグラウンド領域の背景成分画像をエッジ強調する。
【0773】
ステップS905において、エッジ強調部907−5は、カバードバックグラウンド領域の前景成分画像の性質に対応したエッジ強調に処理により、カバードバックグラウンド領域前景成分画像フレームメモリ905に記憶されている、カバードバックグラウンド領域の前景成分画像をエッジ強調する。
【0774】
ステップS906において、エッジ強調部907−6は、前景領域の画像の性質に対応したエッジ強調に処理により、前景領域フレームメモリ906に記憶されている前景領域の画像をエッジ強調する。
【0775】
ステップS907において、合成部908は、それぞれにエッジ強調された、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像を合成する。合成部908は、合成された画像をフレームメモリ909に供給する。フレームメモリ909は、合成部908から供給された画像を記憶する。
【0776】
ステップS908において、フレームメモリ909は、記憶している、合成された画像を出力し、処理は終了する。
【0777】
このように、図102に構成を示す分離画像処理部106は、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像毎に、それぞれの性質に対応してエッジ強調の処理を実行することができるので、動いている画像に不自然な歪みを生じさせることなく、解像度感を向上させることができる。
【0778】
なお、ステップS901乃至ステップS906の処理を、シリアルに実行しても、パラレルに実行しても良いことは勿論である。
【0779】
また、分離画像処理部106が実行する処理は、SD画像とHD画像とに対応する係数の生成、またはSD画像からHD画像を生成する処理に限らず、例えば、空間方向により解像度の高いの画像を生成するための係数を生成し、空間方向により解像度の高い画像を生成するようにしてもよい。さらに、分離画像処理部106は、時間方向に、より解像度の高い画像を生成する処理を実行するようにしてもよい。
【0780】
なお、分離画像処理部106は、クラス分類適応処理による解像度創造の処理またはエッジ強調処理に限らず、例えば、所望の大きさへの画像のサイズの変換、RGBなどの色信号の抽出、ノイズの除去、画像の圧縮、または符号化など他の処理を特定された領域の画像毎に実行するようにしてもよい。例えば、分離画像処理部106に、それぞれの領域の画像に対応する動きベクトルを基に、動きベクトルに沿った方向の圧縮率を低く、動きベクトルに直交する方向の圧縮率を高くして、各領域毎の画像を圧縮させるようにすれば、従来に比較して、画像の劣化が少ないまま、圧縮比を高くすることができる。
【0781】
図116は、入力画像を分離して、分離された画像毎に処理する画像処理装置の機能の他の構成を示すブロック図である。図11に示す画像処理装置が領域特定と混合比αの算出を順番に行うのに対して、図116に示す画像処理装置は、領域特定と混合比αの算出を並行して行う。
【0782】
図11のブロック図に示す機能と同様の部分には同一の番号を付してあり、その説明は省略する。
【0783】
入力画像は、オブジェクト抽出部101、領域特定部103、混合比算出部1101、および前景背景分離部1102に供給される。
【0784】
混合比算出部1101は、入力画像を基に、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比を、入力画像に含まれる画素のそれぞれに対して算出し、算出した画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比を前景背景分離部1102に供給する。
【0785】
図117は、混合比算出部1101の構成の一例を示すブロック図である。
【0786】
図117に示す推定混合比処理部401は、図59に示す推定混合比処理部401と同じである。図117に示す推定混合比処理部402は、図59に示す推定混合比処理部402と同じである。
【0787】
推定混合比処理部401は、入力画像を基に、カバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を出力する。
【0788】
推定混合比処理部402は、入力画像を基に、アンカバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を出力する。
【0789】
前景背景分離部1102は、混合比算出部1101から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比、並びに領域特定部103から供給された領域情報を基に、入力画像を、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像に分離し、分離された画像を分離画像処理部106に供給する。
【0790】
図118は、前景背景分離部1102の構成の一例を示すブロック図である。
【0791】
図77に示す前景背景分離部105と同様の部分には同一の番号を付してあり、その説明は省略する。
【0792】
選択部1121は、領域特定部103から供給された領域情報を基に、混合比算出部1101から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比のいずれか一方を選択して、選択した推定混合比を混合比αとして分離部601に供給する。
【0793】
分離部601は、選択部1121から供給された混合比αおよび領域情報を基に、混合領域に属する画素の画素値から前景の成分および背景の成分を抽出し、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、およびカバードバックグラウンド領域の前景成分画像に分離する。
【0794】
分離部601は、図82に示す構成と同じ構成とすることができる。
【0795】
このように、図116に構成を示す画像処理装置は、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像毎に、それぞれの性質に対応して処理を実行することができる。
【0796】
以上のように、本発明の画像処理装置においては、背景領域の画像、アンカバードバックグラウンド領域の背景成分画像、アンカバードバックグラウンド領域の前景成分画像、カバードバックグラウンド領域の背景成分画像、カバードバックグラウンド領域の前景成分画像、および前景領域の画像に入力画像が分離され、分離された画像に適した処理が実行されるので、例えば、解像度のより高い画像が生成される。
【0797】
なお、前景となるオブジェクトの動きの方向は左から右として説明したが、その方向に限定されないことは勿論である。
【0798】
以上においては、3次元空間と時間軸情報を有する現実空間の画像をビデオカメラを用いて2次元空間と時間軸情報を有する時空間への射影を行った場合を例としたが、本発明は、この例に限らず、より多くの第1の次元の第1の情報を、より少ない第2の次元の第2の情報に射影した場合に適応することが可能である。
【0799】
なお、センサは、CCDに限らす、固体撮像素子である、例えば、BBD(Bucket Brigade Device)、CID(Charge Injection Device)、またはCPD(Charge Priming Device)などのセンサでもよく、また、検出素子がマトリックス状に配置されているセンサに限らず、検出素子が1列に並んでいるセンサでもよい。
【0800】
本発明の信号処理を行うプログラムを記録した記録媒体は、図10に示すように、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク91(フロッピ(登録商標)ディスクを含む)、光ディスク92(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク93(MD(Mini-Disc)(商標)を含む)、もしくは半導体メモリ94などよりなるパッケージメディアにより構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM72や、記憶部78に含まれるハードディスクなどで構成される。
【0801】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0802】
【発明の効果】
本発明の画像処理装置および方法、記録媒体、並びにプログラムによれば、入力画像データに基づいて、前景オブジェクトを構成する前景オブジェクト成分、および背景オブジェクトを構成する背景オブジェクト成分が混合されてなる混合領域と、前景オブジェクト成分からなる前景領域、および背景オブジェクトを構成する背景オブジェクト成分からなる背景領域の一方により構成される非混合領域とが特定され、特定結果に対応する領域特定情報が出力され、領域特定情報に対応して、少なくとも混合領域において、入力画像データが、前景オブジェクト成分と背景オブジェクト成分とに分離され、分離結果に対応して、前景オブジェクト成分および背景オブジェクト成分が個々に処理されるようにしたので、背景の画像と移動する物体の画像との混ざり合い対応して画像を処理することができるようになる。
【図面の簡単な説明】
【図1】従来の画像処理装置の構成を示すブロック図である。
【図2】クラスタップを説明する図である。
【図3】予測タップを説明する図である。
【図4】クラス分類適応処理の概略を説明する図である。
【図5】従来の係数セットを説明する図である。
【図6】従来の学習の処理を説明するフローチャートである。
【図7】従来の画像処理装置の構成を示すブロック図である。
【図8】入力画像の画素値、およびクラス分類適応処理により生成された出力画像の画素値を示す図である。
【図9】従来の画像の創造の処理を説明するフローチャートである。
【図10】本発明に係る画像処理装置の一実施の形態の構成を示すブロック図である。
【図11】画像処理装置の機能の構成を示すブロック図である。
【図12】センサによる撮像を説明する図である。
【図13】画素の配置を説明する図である。
【図14】検出素子の動作を説明する図である。
【図15】動いている前景に対応するオブジェクトと、静止している背景に対応するオブジェクトとを撮像して得られる画像を説明する図である。
【図16】背景領域、前景領域、混合領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域を説明する図である。
【図17】静止している前景に対応するオブジェクトおよび静止している背景に対応するオブジェクトを撮像した画像における、隣接して1列に並んでいる画素の画素値を時間方向に展開したモデル図である。
【図18】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図19】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図20】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図21】前景領域、背景領域、および混合領域の画素を抽出した例を示す図である。
【図22】画素と画素値を時間方向に展開したモデルとの対応を示す図である。
【図23】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図24】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図25】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図26】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図27】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図28】分離された画像と、画素の画素値を時間方向に展開したモデル図との対応を示す図である。
【図29】分割された画像の例を示す図である。
【図30】分離された画像の例を示す図である。
【図31】本発明に係る画像処理装置の画像の処理を説明するフローチャートである。
【図32】領域特定部103の構成の一例を示すブロック図である。
【図33】前景に対応するオブジェクトが移動しているときの画像を説明する図である。
【図34】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図35】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図36】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図37】領域判定の条件を説明する図である。
【図38】領域特定部103の領域の特定の結果の例を示す図である。
【図39】領域特定部103の領域の特定の結果の例を示す図である。
【図40】領域特定の処理を説明するフローチャートである。
【図41】領域特定部103の構成の他の一例を示すブロック図である。
【図42】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図43】背景領域の画像の例を示す図である。
【図44】2値オブジェクト画像抽出部302の構成を示すブロック図である。
【図45】相関値の算出を説明する図である。
【図46】相関値の算出を説明する図である。
【図47】2値オブジェクト画像の例を示す図である。
【図48】時間変化検出部303の構成を示すブロック図である。
【図49】領域判定部342の判定を説明する図である。
【図50】時間変化検出部303の判定の例を示す図である。
【図51】領域判定部103の領域特定の処理を説明するフローチャートである。
【図52】領域判定の処理の詳細を説明するフローチャートである。
【図53】領域特定部103のさらに他の構成を示すブロック図である。
【図54】ロバスト化部361の構成を説明するブロック図である。
【図55】動き補償部381の動き補償を説明する図である。
【図56】動き補償部381の動き補償を説明する図である。
【図57】領域特定の処理を説明するフローチャートである。
【図58】ロバスト化の処理の詳細を説明するフローチャートである。
【図59】混合比算出部104の構成の一例を示すブロック図である。
【図60】理想的な混合比αの例を示す図である。
【図61】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図62】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図63】前景の成分の相関を利用した近似を説明する図である。
【図64】C,N、およびPの関係を説明する図である。
【図65】推定混合比処理部401の構成を示すブロック図である。
【図66】推定混合比の例を示す図である。
【図67】混合比算出部104の他の構成を示すブロック図である。
【図68】混合比の算出の処理を説明するフローチャートである。
【図69】推定混合比の演算の処理を説明するフローチャートである。
【図70】混合比αを近似する直線を説明する図である。
【図71】混合比αを近似する平面を説明する図である。
【図72】混合比αを算出するときの複数のフレームの画素の対応を説明する図である。
【図73】混合比推定処理部401の他の構成を示すブロック図である。
【図74】推定混合比の例を示す図である。
【図75】混合比の算出の処理を説明するフローチャートである。
【図76】カバードバックグラウンド領域に対応するモデルによる混合比推定の処理を説明するフローチャートである。
【図77】前景背景分離部105の構成の一例を示すブロック図である。
【図78】入力画像、前景領域の画像、背景領域の画像、前景成分画像、および背景成分画像を示す図である。
【図79】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図80】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図81】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図82】分離部601の構成の一例を示すブロック図である。
【図83】前景と背景との分離の処理を説明するフローチャートである。
【図84】係数セットを生成する分離画像処理部106の構成を示すブロック図である。
【図85】教師画像と生徒画像との関係を説明する図である。
【図86】学習部714の構成を示すブロック図である。
【図87】クラス分類処理を説明する図である。
【図88】ADRC処理を説明する図である。
【図89】分離画像処理部106が生成する係数セットを説明する図である。
【図90】分離画像処理部106による、係数セットを生成する学習の処理を説明するフローチャートである。
【図91】背景領域に対応する係数セットの生成の処理を説明するフローチャートである。
【図92】クラス分類適応処理を実行して、空間方向に、より高解像度な画像を生成する分離画像処理部106の構成を示すブロック図である。
【図93】マッピング部807の構成を示すブロック図である。
【図94】教師画像の混合領域における画像の例を示す図である。
【図95】従来のクラス分類適応処理により生成された、混合領域の画像の例を示す図である。
【図96】本発明に係る画像処理装置により生成された、混合領域の画像の例を示す図である。
【図97】教師画像の前景領域における画像の例を示す図である。
【図98】従来のクラス分類適応処理により生成された、前景領域の画像の例を示す図である。
【図99】本発明に係る画像処理装置により生成された、前景領域の画像の例を示す図である。
【図100】分離画像処理部106の画像の創造の処理を説明するフローチャートである。
【図101】背景領域に対応する画像の予測の処理を説明するフローチャートである。
【図102】領域毎に、異なる効果のエッジ強調処理を適用する分離画像処理部106の構成を示すブロック図である。
【図103】エッジ強調部907の構成を示すブロック図である。
【図104】エッジ強調の処理を説明する図である。
【図105】フィルタ係数を示す図である。
【図106】ハイパスフィルタ921の動作を説明する図である。
【図107】フィルタ係数を示す図である。
【図108】ハイパスフィルタ921の動作を説明する図である。
【図109】エッジ強調部907の他の構成を示すブロック図である。
【図110】フィルタ係数を示す図である。
【図111】フィルタ941の動作を説明する図である。
【図112】フィルタ係数を示す図である。
【図113】フィルタ941の動作を説明する図である。
【図114】分離画像処理部106の処理を説明する図である。
【図115】分離画像処理部106のエッジ強調の処理を説明するフローチャートである。
【図116】画像処理装置の機能の他の構成を示すブロック図である。
【図117】混合比算出部1101の構成の一例を示すブロック図である。
【図118】前景背景分離部1102の構成の一例を示すブロック図である。
【符号の説明】
71 CPU, 72 ROM, 73 RAM, 76 入力部, 77 出力部,78 記憶部, 79 通信部, 91 磁気ディスク, 92 光ディスク, 93 光磁気ディスク, 94 半導体メモリ, 101 オブジェクト抽出部, 102 動き検出部, 103 領域特定部, 104 混合比算出部, 105 前景背景分離部, 106 分離画像処理部, 201 フレームメモリ, 202−1乃至202−4 静動判定部, 203−1乃至203−3 領域判定部, 204 判定フラグ格納フレームメモリ, 205 合成部, 206 判定フラグ格納フレームメモリ, 301 背景領域の画像生成部, 302 2値オブジェクト画像抽出部, 303 時間変化検出部, 321 相関値演算部, 322 しきい値処理部, 341 フレームメモリ, 342 領域判定部, 361 ロバスト化部, 381 動き補償部, 382 スイッチ, 383−1乃至383−N フレームメモリ、 384−1乃至384−N 重み付け部, 385 積算部, 401 推定混合比処理部,402 推定混合比処理部, 403 混合比決定部, 421 フレームメモリ, 422 フレームメモリ, 423 混合比演算部, 441 選択部, 442 推定混合比処理部, 443 推定混合比処理部, 444 選択部, 501 遅延回路, 502 足し込み部, 503 演算部, 601分離部, 602 スイッチ, 603 スイッチ, 621 フレームメモリ, 622 分離処理ブロック, 631 アンカバード領域処理部, 632 カバード領域処理部, 701 背景領域教師画像フレームメモリ, 702 アンカバードバックグラウンド領域背景成分教師画像フレームメモリ, 703 アンカバードバックグラウンド領域前景成分教師画像フレームメモリ, 704 カバードバックグラウンド領域背景成分教師画像フレームメモリ, 705 カバードバックグラウンド領域前景成分教師画像フレームメモリ, 706 前景領域教師画像フレームメモリ, 707−1乃至707−6 加重平均部, 708 背景領域生徒画像フレームメモリ, 709 アンカバードバックグラウンド領域背景成分生徒画像フレームメモリ, 710 アンカバードバックグラウンド領域前景成分生徒画像フレームメモリ, 711 カバードバックグラウンド領域背景成分生徒画像フレームメモリ, 712 カバードバックグラウンド領域前景成分生徒画像フレームメモリ, 713 前景領域生徒画像フレームメモリ, 714−1乃至714−6 学習部, 715 係数セットメモリ, 731 クラス分類部, 732 予測タップ取得部, 733 対応画素取得部, 734 正規方程式生成部, 735 係数計算部, 751クラスタップ取得部, 752 波形分類部, 801 背景領域フレームメモリ, 802 アンカバードバックグラウンド領域背景成分画像フレームメモリ, 803 アンカバードバックグラウンド領域前景成分画像フレームメモリ, 804 カバードバックグラウンド領域背景成分画像フレームメモリ, 805 カバードバックグラウンド領域前景成分画像フレームメモリ, 806 前景領域フレームメモリ, 807−1乃至807−6 マッピング部, 808 係数セットメモリ, 809 合成部, 831 マッピング処理部, 841 クラス分類部, 842 予測タップ取得部, 843 予測演算部, 851 クラスタップ取得部, 852 波形分類部, 901 背景領域フレームメモリ, 902 アンカバードバックグラウンド領域背景成分画像フレームメモリ, 903 アンカバードバックグラウンド領域前景成分画像フレームメモリ, 904 カバードバックグラウンド領域背景成分画像フレームメモリ, 905 カバードバックグラウンド領域前景成分画像フレームメモリ, 906 前景領域フレームメモリ, 907−1乃至907−6 エッジ強調部,908 合成部, 921 ハイパスフィルタ, 922 ゲイン調整部, 923 加算部, 941 フィルタ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus and method, a recording medium, and a program, and more particularly, to an image processing apparatus and method, a recording medium, and a program that take into consideration a difference between a signal detected by a sensor and the real world.
[0002]
[Prior art]
One of the processes for generating a higher resolution image based on the input image is a class classification adaptive process. As an example of class classification adaptive processing, coefficients used in processing for generating a higher resolution image in the spatial direction are generated in advance, and a higher resolution image is generated in the spatial direction based on the generated coefficient. Processing.
[0003]
FIG. 1 shows a configuration of a conventional image processing apparatus that generates coefficients used in class classification adaptive processing for generating HD (High Definition) images from SD (Standard Definition) images. FIG.
[0004]
The
The
[0005]
The weighted
[0006]
The
[0007]
The
[0008]
FIG. 2 is a diagram illustrating class taps acquired by the class
[0009]
The
[0010]
The prediction
[0011]
FIG. 3 is a diagram illustrating the prediction tap acquired by the prediction
[0012]
The corresponding
[0013]
The normal
[0014]
The
[0015]
The coefficient set
[0016]
FIG. 4 is a diagram for explaining the outline of the class classification adaptation process. In the class classification adaptation process, a corresponding SD image is generated from the teacher image, which is an HD image, by a quarter-weighted average process. The generated SD image is referred to as a student image.
[0017]
Next, a coefficient set for generating an HD image from the SD image is generated based on the teacher image that is an HD image and the student image that is a corresponding SD image. The coefficient set includes coefficients for generating an HD image from an SD image by linear prediction or the like.
[0018]
A quadruple density image is generated from the coefficient set and the SD image generated in this way by linear prediction or the like. The process of generating a higher-density image or the like from the coefficient set and the input image is also referred to as mapping.
[0019]
Based on the generated quadruple density image and the corresponding HD image, SNR comparison or visual qualitative evaluation is performed.
[0020]
The coefficient set generated from the specific teacher image and the corresponding student image is referred to as the self coefficient set of the specific teacher image and the corresponding student image. Mapping using a self coefficient set is called self-mapping. A coefficient set generated from a plurality of other teacher images and corresponding student images is referred to as a cross coefficient set.
[0021]
On the other hand, in an image obtained by capturing an object that is a foreground moving in front of a predetermined stationary background with a video camera, motion blur occurs when the moving speed of the object is relatively fast, and the background and foreground Mixing occurs.
[0022]
In the conventional classification adaptation process, as shown in FIG. 5, one coefficient is obtained by the above learning process for all of the foreground, background, and foreground / background mixture. A set is generated, and mapping processing is executed based on the coefficient set.
[0023]
A conventional learning process for generating a coefficient used in a process for generating an HD image from an SD image will be described with reference to a flowchart of FIG. In step S11, the image processing apparatus determines whether or not there are unprocessed pixels in the student image. If it is determined that there are unprocessed pixels in the student image, the process proceeds to step S12 and the students are processed in the raster scan order. Obtain a pixel of interest from the image.
[0024]
In step S <b> 13, the class
[0025]
In step S <b> 16, the corresponding
[0026]
In step S17, the normal
[0027]
When it is determined in step S11 that there are no unprocessed pixels in the student image, the process proceeds to step S18, and the normal
[0028]
In step S <b> 19, the
[0029]
FIG. 7 is a block diagram showing a configuration of a conventional image processing apparatus that generates an HD image from an SD image by class classification adaptive processing.
[0030]
The
The
[0031]
The SD image input to the
[0032]
The
[0033]
The
[0034]
The prediction
[0035]
The
[0036]
The
[0037]
FIG. 8 is a diagram illustrating the pixel value of the input image and the pixel value of the output image generated by the class classification adaptation process. As shown in FIG. 8, the image generated by the classification adaptation process includes a waveform lost due to the band limitation of the SD image. In that sense, it can be said that the process of generating a higher-resolution image by the class classification adaptive process creates a resolution.
[0038]
With reference to the flowchart of FIG. 9, a conventional image creation process for generating an HD image from an SD image by an image processing apparatus that executes a resolution creation process by a class classification adaptation process will be described.
[0039]
In step S31, the image processing apparatus determines whether there is an unprocessed pixel in the input image. If it is determined that there is an unprocessed pixel in the input image, the process proceeds to step S32, where the
[0040]
In step S <b> 34, the class tap acquisition unit 51 of the
[0041]
In step S <b> 36, the prediction
[0042]
In step S37, the
[0043]
In step S <b> 38, the
[0044]
If it is determined in step S31 that there are no unprocessed pixels in the input image, the process proceeds to step S39, where the
[0045]
Also, edge enhancement processing is used to convert the input image into an image with a higher sense of resolution. In the edge enhancement processing, the same processing is executed for the entire screen as in the class classification adaptation processing described above.
[0046]
[Problems to be solved by the invention]
When an object moves in front of a stationary background, not only motion blur due to mixing of the moving object image itself, but also mixing of the background image and the moving object image occurs. Conventionally, it has not been considered to process an image corresponding to a mixture of a background image and an image of a moving object.
[0047]
SUMMARY An advantage of some aspects of the invention is that an image can be processed in accordance with a mixture of a background image and a moving object image.
[0048]
[Means for Solving the Problems]
The image processing apparatus of the present inventionBased on the presence / absence of motion between the predetermined frame and the frame immediately before the predetermined frame and the presence / absence of motion between the predetermined frame and the frame immediately after the predetermined frame for each pixel of the input image , A foreground area consisting of only foreground object components that make up the foreground object, a background area consisting only of background object components that make up the background object, or a mixture of foreground object components and background object components Specify which area of the area, and generate area information indicating the result of the identificationArea identification means;When the region information specifies that the pixel of the input image is a mixed region, the mixed region is determined as the foreground object based on the mixing ratio indicating the mixing ratio of the foreground object component and the background object component in the pixel of the mixed region. A mixed foreground area consisting of components and a mixed background area consisting of background object componentsSeparating means for separating;An output image is generated by executing a class classification adaptive process for each foreground area, background area, mixed foreground area, and mixed background area.Processing meansThe processing means includes, for each of the foreground region, the background region, the mixed foreground region, and the mixed background region, the pixel of the input image is sequentially set as the target pixel, and the target pixel in the high-resolution predicted image obtained from the input image Obtain a set of prediction coefficients to be multiplied with the pixels constituting the prediction tap that is the corresponding predetermined number of pixels, acquire the class tap that is the predetermined number of pixels including the target pixel from the input image, and based on the class tap The target pixel is classified into one of a plurality of classes, a prediction tap corresponding to the target pixel is obtained based on the classified class, and a linear combination operation of the pixels constituting the prediction tap and the prediction coefficient is performed. By doing so, a class classification adaptive process for obtaining the pixel value of the pixel in the predicted image is executed, and the pixel values obtained for each of the foreground area, background area, mixed foreground area, and mixed background area are combined. By, to generate an output image.
[0049]
The area identification means isBased on the presence / absence of motion between the predetermined frame and the frame immediately before the predetermined frame and the presence / absence of motion between the predetermined frame and the frame immediately after the predetermined frame for each pixel of the input image In the mixed area, the foreground object is formed on the front end side in the movement direction.Covered background area andFormed on the rear edge side of the foreground object in the direction of movementFurther identify the uncovered background area,Area information indicating the identification result is generated, and the separation unit identifies the foreground object component and the background object in the pixel of the covered background area when the pixel of the input image is identified as the covered background area by the area information. Based on the mixing ratio indicating the mixing ratio of the components, the covered background area is separated into a covered background foreground area consisting of foreground object components and a covered background background area consisting of background object components, and the input image If the pixel is specified to be an uncovered background area, the uncovered background area is determined based on a mixing ratio that indicates the ratio of the foreground object component and the background object component in the uncovered background area pixel. foreground Separated into an uncovered background foreground area made up of object components and an uncovered background background area made up of background object components, the processing means is foreground area, background area, covered background foreground area, covered background background area, An output image is generated by executing the classification adaptation process for each uncovered background foreground area and uncovered background background area.To be able to do so.
[0053]
The image processing method of the present invention includes:Based on the presence / absence of motion between the predetermined frame and the frame immediately before the predetermined frame and the presence / absence of motion between the predetermined frame and the frame immediately after the predetermined frame for each pixel of the input image , A foreground area consisting of only foreground object components that make up the foreground object, a background area consisting only of background object components that make up the background object, or a mixture of foreground object components and background object components Specify which area of the area, and generate area information indicating the result of the identificationAn area identification step;When the region information specifies that the pixel of the input image is a mixed region, the mixed region is determined as the foreground object based on the mixing ratio indicating the mixing ratio of the foreground object component and the background object component in the pixel of the mixed region. A mixed foreground area consisting of components and a mixed background area consisting of background object componentsA separation step to separate;An output image is generated by executing a class classification adaptive process for each foreground area, background area, mixed foreground area, and mixed background area.Processing steps andThe processing step includes, for each of the foreground region, the background region, the mixed foreground region, and the mixed background region, the pixel of the input image is sequentially set as the pixel of interest, and the pixel of interest in the high-resolution predicted image obtained from the input image Obtain a set of prediction coefficients to be multiplied with the pixels constituting the prediction tap that is the corresponding predetermined number of pixels, acquire the class tap that is the predetermined number of pixels including the target pixel from the input image, and based on the class tap The target pixel is classified into one of a plurality of classes, a prediction tap corresponding to the target pixel is obtained based on the classified class, and a linear combination operation of the pixels constituting the prediction tap and the prediction coefficient is performed. By performing class classification adaptive processing to obtain the pixel value of the pixel in the predicted image, the pixel value obtained for each foreground area, background area, mixed foreground area, and mixed background area By combining, to produce an output image.
[0058]
The recording medium program of the present invention is based on input image data, a foreground object component constituting a foreground object and a background region comprising a background object component constituting a background object, and a foreground region comprising a foreground object component And a non-mixed area constituted by one of the background areas made up of background object components constituting the background object, and an area specifying step for outputting area specifying information corresponding to the specifying result, and corresponding to the area specifying information The separation step of separating the input image data into the foreground object component and the background object component at least in the mixed region, and the processing step of individually processing the foreground object component and the background object component corresponding to the separation result It is characterized by including.
[0063]
The program of the present inventionBased on the presence / absence of motion between the predetermined frame and the frame immediately before the predetermined frame and the presence / absence of motion between the predetermined frame and the frame immediately after the predetermined frame for each pixel of the input image , A foreground area consisting of only foreground object components that make up the foreground object, a background area consisting only of background object components that make up the background object, or a mixture of foreground object components and background object components Specify which area of the area, and generate area information indicating the result of the identificationAn area identification step;When the region information specifies that the pixel of the input image is a mixed region, the mixed region is determined as the foreground object based on the mixing ratio indicating the mixing ratio of the foreground object component and the background object component in the pixel of the mixed region. A mixed foreground area consisting of components and a mixed background area consisting of background object componentsA separation step to separate;An output image is generated by executing a class classification adaptive process for each foreground area, background area, mixed foreground area, and mixed background area.Processing steps andThe processing step is executed by the computer, and the processing step sequentially sets the pixel of the input image as the target pixel for each of the foreground region, the background region, the mixed foreground region, and the mixed background region, and predicts the high resolution obtained from the input image. Get a set of prediction coefficients that are multiplied by the pixels that make up a prediction tap that is a predetermined number of pixels corresponding to the pixel of interest in the image, and obtain a class tap that is a predetermined number of pixels including the pixel of interest from the input image Then, based on the class tap, the target pixel is classified into one of a plurality of classes, and based on the classified class, a prediction tap corresponding to the target pixel is acquired, and the pixel constituting the prediction tap is predicted. Performs class classification adaptive processing to obtain the pixel value of the pixel in the predicted image by performing a linear combination of coefficients, foreground region, background region, mixed foreground region, and mixed By combining the pixel values obtained for each scene area, and generates an output image.
[0068]
In the image processing apparatus and method, the recording medium, and the program of the present invention,Based on the presence / absence of motion between the predetermined frame and the frame immediately before the predetermined frame and the presence / absence of motion between the predetermined frame and the frame immediately after the predetermined frame for each pixel of the input image , A foreground area consisting of only foreground object components that make up the foreground object, a background area consisting only of background object components that make up the background object, or a mixture of foreground object components and background object components Foreground object in the pixel of the mixed area when the area information indicating the identification result is generated and the area information indicating the identification result is generated and the pixel of the input image is specified as the mixed area by the area information. Based on the mixing ratio, which indicates the mixing ratio of the component and the background object component, the mixing area is separated from the foreground object component. A mixed foreground area and a mixed background area consisting of background object components are generated, and an output image is generated by executing class classification adaptive processing for each of the foreground area, background area, mixed foreground area, and mixed background area. Is done. In particular, for each of the foreground region, the background region, the mixed foreground region, and the mixed background region, the pixel of the input image is sequentially set as the target pixel, and the predetermined pixel corresponding to the target pixel in the high-resolution predicted image obtained from the input image A set of prediction coefficients to be multiplied with pixels constituting a prediction tap that is a number of pixels is acquired, and a class tap that is a predetermined number of pixels including the target pixel is acquired from the input image. A pixel is classified into one of a plurality of classes, a prediction tap corresponding to the pixel of interest is acquired based on the classified class, and a linear combination operation of a pixel constituting the prediction tap and a prediction coefficient is performed. Then, the class classification adaptive process for obtaining the pixel value of the pixel in the predicted image is executed, and the pixel value obtained for each of the foreground region, the background region, the mixed foreground region, and the mixed background region By being the output image is generated.
[0069]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 10 is a block diagram showing a configuration of an embodiment of an image processing apparatus according to the present invention. A CPU (Central Processing Unit) 71 executes various processes according to a program stored in a ROM (Read Only Memory) 72 or a
[0070]
An input /
[0071]
The
[0072]
A program may be acquired via the
[0073]
The
[0074]
FIG. 11 is a block diagram illustrating a functional configuration of the image processing apparatus.
[0075]
It does not matter whether each function of the image processing apparatus is realized by hardware or software. That is, each block diagram in this specification may be considered as a hardware block diagram or a software functional block diagram.
[0076]
Here, the input image input to the image processing apparatus includes motion blur.
Motion blur refers to distortion included in an image corresponding to a moving object, which is caused by the movement of an object in the real world to be imaged and the imaging characteristics of a sensor.
[0077]
In this specification, an image corresponding to an object in the real world to be imaged is referred to as an image object.
[0078]
The input image supplied to the image processing apparatus is supplied to the
[0079]
The
[0080]
The
[0081]
Further, for example, the
[0082]
The
[0083]
The motion vector output from the
[0084]
In addition, for example, the
[0085]
The motion amount v is a value that represents a change in the position of the image corresponding to the moving object in units of pixel intervals. For example, when the image of the object corresponding to the foreground is moved so as to be displayed at a position separated by four pixels in the next frame with reference to a certain frame, the motion amount v of the image of the object corresponding to the foreground is 4.
[0086]
The
[0087]
Details of the mixed area, the uncovered background area, and the covered background area will be described later.
[0088]
Based on the input image and the region information supplied from the
[0089]
The mixing ratio α is a value indicating a ratio of an image component (hereinafter also referred to as a background component) corresponding to a background object in a pixel value, as shown in an equation (3) described later.
[0090]
Based on the region information supplied from the
[0091]
The separated
[0092]
For example, the separated
[0093]
For example, the separated
[0094]
Alternatively, for example, the separated
[0095]
Next, an input image supplied to the image processing apparatus will be described with reference to FIGS.
[0096]
FIG. 12 is a diagram for explaining imaging by a sensor. The sensor is composed of, for example, a CCD video camera equipped with a CCD (Charge-Coupled Device) area sensor which is a solid-state image sensor. The object corresponding to the foreground in the real world moves horizontally between the object corresponding to the background and the sensor in the real world, for example, from the left side to the right side in the drawing.
[0097]
The sensor images an object corresponding to the foreground together with an object corresponding to the background. The sensor outputs the captured image in units of one frame. For example, the sensor outputs an image composed of 30 frames per second. The exposure time of the sensor can be 1/30 second. The exposure time is a period from the start of the conversion of the input light into the electric charge until the end of the conversion of the input light into the electric charge. Hereinafter, the exposure time is also referred to as shutter time.
[0098]
FIG. 13 is a diagram illustrating the arrangement of pixels. In FIG. 13, A to I indicate individual pixels. The pixels are arranged on a plane corresponding to the image. One detection element corresponding to one pixel is arranged on the sensor. When the sensor captures an image, one detection element outputs a pixel value corresponding to one pixel constituting the image. For example, the position of the detection element in the X direction corresponds to the horizontal position on the image, and the position of the detection element in the Y direction corresponds to the vertical position on the image.
[0099]
As shown in FIG. 14, for example, a detection element that is a CCD converts input light into electric charges for a period corresponding to a shutter time, and accumulates the converted electric charges. The amount of charge is approximately proportional to the intensity of the input light and the time during which the light is input. In the period corresponding to the shutter time, the detection element adds the electric charge converted from the input light to the already accumulated electric charge. That is, the detection element integrates the input light for a period corresponding to the shutter time, and accumulates an amount of charge corresponding to the integrated light. It can be said that the detection element has an integration effect with respect to time.
[0100]
The electric charge accumulated in the detection element is converted into a voltage value by a circuit (not shown), and the voltage value is further converted into a pixel value such as digital data and output. Therefore, each pixel value output from the sensor is a value projected onto a one-dimensional space, which is the result of integrating a part of the object corresponding to the foreground or background having a spatial extent with respect to the shutter time. Have.
[0101]
The image processing apparatus extracts significant information buried in the output signal, for example, the mixing ratio α, by the accumulation operation of the sensor.
[0102]
FIG. 15 is a diagram illustrating an image obtained by imaging an object corresponding to a moving foreground and an object corresponding to a stationary background. FIG. 15A shows an image obtained by imaging an object corresponding to a foreground with movement and an object corresponding to a stationary background. In the example shown in FIG. 15A, the object corresponding to the foreground is moving horizontally from the left to the right with respect to the screen.
[0103]
FIG. 15B is a model diagram in which pixel values corresponding to one line of the image shown in FIG. The horizontal direction in FIG. 15B corresponds to the spatial direction X in FIG.
[0104]
The pixel value of the background region pixel is composed of only the background component, that is, the image component corresponding to the background object. The pixel value of the foreground region pixel is composed of only the foreground component, that is, the image component corresponding to the foreground object.
[0105]
The pixel value of the pixel in the mixed area is composed of a background component and a foreground component. Since the pixel value is composed of the background component and the foreground component, the mixed region can be said to be a distortion region. The mixed area is further classified into a covered background area and an uncovered background area.
[0106]
The covered background area is a mixed area at a position corresponding to the front end in the advancing direction of the foreground object with respect to the foreground area, and is an area where the background component is covered with the foreground as time passes.
[0107]
On the other hand, the uncovered background area is a mixed area at a position corresponding to the rear end portion of the foreground object in the advancing direction with respect to the foreground area, and an area where a background component appears as time passes. Say.
[0108]
As described above, an image including a foreground area, a background area, or a covered background area or an uncovered background area is input as an input image to the
[0109]
FIG. 16 is a diagram illustrating the background area, the foreground area, the mixed area, the covered background area, and the uncovered background area as described above.
In the case of the image shown in FIG. 15, the background area is a stationary part, the foreground area is a moving part, the covered background area of the mixed area is a part that changes from the background to the foreground, The uncovered background area is a portion that changes from the foreground to the background.
[0110]
FIG. 17 is a model diagram in which pixel values of pixels arranged in a row adjacent to each other in an image obtained by capturing an object corresponding to a stationary foreground and an object corresponding to a stationary background are expanded in the time direction. It is. For example, pixels arranged on one line of the screen can be selected as the pixels arranged adjacent to each other in one column.
[0111]
The pixel values F01 to F04 shown in FIG. 17 are pixel values corresponding to the still foreground object. The pixel values B01 to B04 shown in FIG. 17 are the pixel values of the pixels corresponding to the stationary background object.
[0112]
In the vertical direction in FIG. 17, time elapses from the top to the bottom in the figure. The position of the upper side of the rectangle in FIG. 17 corresponds to the time at which the sensor starts to convert the input light into charges, and the position of the lower side of the rectangle in FIG. 17 indicates the charge of the light input by the sensor. Corresponds to the time to finish conversion of. That is, the distance from the upper side to the lower side of the rectangle in FIG. 17 corresponds to the shutter time.
[0113]
Hereinafter, a case where the shutter time and the frame interval are the same will be described as an example.
[0114]
The horizontal direction in FIG. 17 corresponds to the spatial direction X described in FIG. More specifically, in the example shown in FIG. 17, the distance from the left side of the rectangle described as “F01” in FIG. 17 to the right side of the rectangle described as “B04” is 8 times the pixel pitch, That is, it corresponds to the interval between eight consecutive pixels.
[0115]
When the foreground object and the background object are stationary, the light input to the sensor does not change during the period corresponding to the shutter time.
[0116]
Here, the period corresponding to the shutter time is divided into two or more periods having the same length. For example, if the number of virtual divisions is 4, the model diagram shown in FIG. 17 can be represented as the model shown in FIG. The virtual division number is set corresponding to the amount of movement v of the object corresponding to the foreground within the shutter time. For example, the number of virtual divisions is 4 corresponding to the motion amount v being 4, and the period corresponding to the shutter time is divided into 4.
[0117]
The top row in the figure corresponds to the first divided period after the shutter opens.
The second row from the top in the figure corresponds to the second divided period from when the shutter has opened. The third line from the top in the figure corresponds to the third divided period from when the shutter has opened. The fourth row from the top in the figure corresponds to the fourth divided period from when the shutter has opened.
[0118]
Hereinafter, the shutter time divided in accordance with the motion amount v is also referred to as shutter time / v.
[0119]
Since the light input to the sensor does not change when the object corresponding to the foreground is stationary, the foreground component F01 / v is equal to a value obtained by dividing the pixel value F01 by the virtual division number. Similarly, when the object corresponding to the foreground is stationary, the foreground component F02 / v is equal to the value obtained by dividing the pixel value F02 by the virtual division number, and the foreground component F03 / v is the virtual value of the pixel value F03. The foreground component F04 / v is equal to the value obtained by dividing the pixel value F04 by the virtual division number.
[0120]
Since the light input to the sensor does not change when the object corresponding to the background is stationary, the background component B01 / v is equal to the value obtained by dividing the pixel value B01 by the virtual division number. Similarly, when the object corresponding to the background is stationary, the background component B02 / v is equal to the value obtained by dividing the pixel value B02 by the virtual division number, and B03 / v is obtained by dividing the pixel value B03 by the virtual division number. B04 / v is equal to a value obtained by dividing the pixel value B04 by the number of virtual divisions.
[0121]
That is, when the object corresponding to the foreground is stationary, the light corresponding to the foreground object input to the sensor does not change during the period corresponding to the shutter time. The foreground component F01 / v corresponding to, the foreground component F01 / v corresponding to the second shutter time / v after the shutter opens, and the third foreground corresponding to the shutter time / v corresponding to the shutter time / v. And the foreground component F01 / v corresponding to the fourth shutter time / v after the shutter is opened have the same value. F02 / v to F04 / v have the same relationship as F01 / v.
[0122]
When the object corresponding to the background is stationary, the light corresponding to the background object input to the sensor does not change during the period corresponding to the shutter time, so it corresponds to the first shutter time / v after the shutter opens. Background component B01 / v, the second background component B01 / v corresponding to the shutter time / v after the shutter opens, and the third background component corresponding to the shutter time / v corresponding to the shutter time / v B01 / v and the fourth background component B01 / v corresponding to the shutter time / v after the shutter is opened have the same value. B02 / v to B04 / v have the same relationship.
[0123]
Next, a case where the object corresponding to the foreground moves and the object corresponding to the background is stationary will be described.
[0124]
FIG. 19 is a model diagram in which pixel values of pixels on one line including the covered background area are expanded in the time direction when the object corresponding to the foreground moves toward the right side in the drawing. In FIG. 19, the foreground motion amount v is 4. Since one frame is a short time, it can be assumed that the object corresponding to the foreground is a rigid body and is moving at a constant speed. In FIG. 19, the image of the object corresponding to the foreground moves so as to be displayed on the right side by four pixels in the next frame with reference to a certain frame.
[0125]
In FIG. 19, the leftmost pixel through the fourth pixel from the left belong to the foreground area. In FIG. 19, the fifth through seventh pixels from the left belong to the mixed area, which is a covered background area. In FIG. 19, the rightmost pixel belongs to the background area.
[0126]
Since the object corresponding to the foreground is moving so as to cover the object corresponding to the background with the passage of time, the component included in the pixel value of the pixel belonging to the covered background area has a period corresponding to the shutter time. At this point, the background component is replaced by the foreground component.
[0127]
For example, a pixel value M with a thick frame in FIG. 19 is expressed by Expression (1).
[0128]
M = B02 / v + B02 / v + F07 / v + F06 / v (1)
[0129]
For example, since the fifth pixel from the left includes a background component corresponding to one shutter time / v and includes a foreground component corresponding to three shutter times / v, the mixture ratio of the fifth pixel from the left α is 1/4. The sixth pixel from the left includes a background component corresponding to two shutter times / v and includes a foreground component corresponding to two shutter times / v. Therefore, the mixture ratio α of the sixth pixel from the left is 1/2. The seventh pixel from the left includes a background component corresponding to three shutter times / v, and includes a foreground component corresponding to one shutter time / v. Therefore, the mixture ratio α of the seventh pixel from the left is 3/4.
[0130]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the fourth pixel from the left in FIG. The foreground component F07 / v of the first shutter time / v after the shutter is opened is the foreground component of the fifth pixel from the left in FIG. 19 corresponding to the second shutter time / v after the shutter is opened. be equivalent to. Similarly, the foreground component F07 / v corresponds to the foreground component of the sixth pixel from the left in FIG. 19 corresponding to the third shutter time / v from when the shutter has opened, and the seventh pixel from the left in FIG. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0131]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the third pixel from the left in FIG. The foreground component F06 / v of the first shutter time / v after the shutter is opened is the foreground component of the fourth pixel from the left in FIG. 19 corresponding to the second shutter time / v after the shutter is opened. equal. Similarly, the foreground component F06 / v is the sixth pixel from the left in FIG. 19 and the foreground component of the fifth pixel from the left in FIG. 19 corresponding to the third shutter time / v from when the shutter has opened. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0132]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the second pixel from the left in FIG. The foreground component F05 / v of the first shutter time / v after the shutter is opened is the foreground component of the third pixel from the left in FIG. 19 corresponding to the second shutter time / v after the shutter is opened. be equivalent to. Similarly, the foreground component F05 / v is the fourth pixel from the left in FIG. 19 and the foreground component corresponding to the third shutter time / v from when the shutter is opened, and the fifth pixel from the left in FIG. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0133]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the shutter of the leftmost pixel in FIG. The foreground component F04 / v of the first shutter time / v after opening is equal to the foreground component of the second pixel from the left in FIG. 19 corresponding to the second shutter time / v after the shutter is opened. Similarly, the foreground component F04 / v corresponds to the foreground component of the third pixel from the left in FIG. 19 corresponding to the third shutter time / v from when the shutter has opened, and the fourth pixel from the left in FIG. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0134]
Since the foreground area corresponding to the moving object includes motion blur as described above, it can be said to be a distortion area.
[0135]
FIG. 20 is a model diagram in which pixel values of pixels on one line including the uncovered background area are expanded in the time direction when the foreground moves toward the right side in the drawing. In FIG. 20, the foreground motion amount v is 4. Since one frame is a short time, it can be assumed that the object corresponding to the foreground is a rigid body and is moving at a constant speed. In FIG. 20, the image of the object corresponding to the foreground moves to the right by four pixels in the next frame with reference to a certain frame.
[0136]
In FIG. 20, the leftmost pixel through the fourth pixel from the left belong to the background area. In FIG. 20, the fifth through seventh pixels from the left belong to the mixed area, which is an uncovered background. In FIG. 20, the rightmost pixel belongs to the foreground area.
[0137]
Since the object corresponding to the foreground that covered the object corresponding to the background is moved so as to be removed from the front of the object corresponding to the background over time, it is included in the pixel value of the pixel belonging to the uncovered background area The component to be changed from the foreground component to the background component at a certain point in time corresponding to the shutter time.
[0138]
For example, a pixel value M ′ with a thick line frame in FIG. 20 is expressed by Expression (2).
[0139]
M '= F02 / v + F01 / v + B26 / v + B26 / v (2)
[0140]
For example, the fifth pixel from the left includes a background component corresponding to three shutter times / v, and includes a foreground component corresponding to one shutter time / v, so the mixing ratio of the fifth pixel from the left α is 3/4. The sixth pixel from the left includes a background component corresponding to two shutter times / v and includes a foreground component corresponding to two shutter times / v. Therefore, the mixture ratio α of the sixth pixel from the left is 1/2. Since the seventh pixel from the left includes a background component corresponding to one shutter time / v and includes a foreground component corresponding to three shutter times / v, the mixture ratio α of the seventh pixel from the left is 1/4.
[0141]
When the expressions (1) and (2) are generalized, the pixel value M is expressed by the expression (3).
[0142]
[Expression 1]
Here, α is a mixing ratio. B is a background pixel value, and Fi / v is a foreground component.
[0143]
Since the object corresponding to the foreground is a rigid body and can be assumed to move at a constant speed, and the amount of movement v is 4, for example, the first pixel from the left in FIG. The foreground component F01 / v of the shutter time / v is equal to the foreground component of the sixth pixel from the left in FIG. 20 corresponding to the second shutter time / v after the shutter is opened. Similarly, F01 / v represents the foreground component of the seventh pixel from the left in FIG. 20 corresponding to the third shutter time / v from when the shutter has opened, and the eighth pixel from the left in FIG. , And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0144]
Since the object corresponding to the foreground is a rigid body and can be assumed to move at a constant speed, and the number of virtual divisions is 4, for example, the first pixel from the left in FIG. The foreground component F02 / v of the shutter time / v is equal to the foreground component of the seventh pixel from the left in FIG. 20 corresponding to the second shutter time / v after the shutter is opened. Similarly, the foreground component F02 / v is equal to the foreground component of the eighth pixel from the left in FIG. 20 corresponding to the third shutter time / v from when the shutter has opened.
[0145]
Since the object corresponding to the foreground is a rigid body and can be assumed to move at a constant speed, and the amount of movement v is 4, for example, the seventh pixel from the left in FIG. The foreground component F03 / v of the shutter time / v is equal to the foreground component of the eighth pixel from the left in FIG. 20 corresponding to the second shutter time / v after the shutter is opened.
[0146]
In the description of FIG. 18 to FIG. 20, it is described that the virtual division number is 4, but the virtual division number corresponds to the motion amount v. The amount of movement v generally corresponds to the moving speed of the object corresponding to the foreground. For example, when the object corresponding to the foreground is moving so as to be displayed to the right by four pixels in the next frame with reference to a certain frame, the amount of movement v is 4. Corresponding to the motion amount v, the number of virtual divisions is 4. Similarly, for example, when the object corresponding to the foreground is moving so that it is displayed on the left by 6 pixels in the next frame with reference to a certain frame, the motion amount v is set to 6, and the number of virtual divisions is , 6.
[0147]
21 and 22, the above-described mixed area composed of the foreground area, the background area, the covered background area, or the uncovered background area, and the foreground components and the background components corresponding to the divided shutter times. The relationship is shown.
[0148]
FIG. 21 shows an example in which pixels in the foreground area, the background area, and the mixed area are extracted from an image including a foreground corresponding to an object moving in front of a stationary background. In the example shown in FIG. 21, the object corresponding to the foreground is moving horizontally with respect to the screen.
[0149]
Frame # n + 1 is the next frame after frame #n, and frame # n + 2 is the next frame after frame # n + 1.
[0150]
Extract the pixels in the foreground area, background area, and mixed area extracted from any of frame #n to frame # n + 2, set the amount of motion v to 4, and set the pixel values of the extracted pixels in the time direction The developed model is shown in FIG.
[0151]
Since the object corresponding to the foreground moves, the pixel value in the foreground area is composed of four different foreground components corresponding to the shutter time / v period. For example, the leftmost pixel among the pixels in the foreground area shown in FIG. 22 is composed of F01 / v, F02 / v, F03 / v, and F04 / v. That is, the pixels in the foreground area include motion blur.
[0152]
Since the object corresponding to the background is stationary, the light corresponding to the background input to the sensor does not change during the period corresponding to the shutter time. In this case, the pixel value in the background area does not include motion blur.
[0153]
The pixel value of the pixel belonging to the mixed area composed of the covered background area or the uncovered background area is composed of a foreground component and a background component.
[0154]
Next, when the image corresponding to the object is moving, the pixel values of the pixels at the same position on the frame that are adjacent to each other in a plurality of frames are developed in the time direction. The model will be described. For example, when the image corresponding to the object moves horizontally with respect to the screen, the pixels arranged on one line of the screen can be selected as the pixels arranged in a row adjacent to each other.
[0155]
FIG. 23 shows pixels arranged in a row adjacent to three frames of an image obtained by imaging an object corresponding to a stationary background, and the pixel values of the pixels at the same position on the frame are represented by time. It is the model figure developed in the direction. Frame #n is the next frame after frame # n-1, and frame # n + 1 is the next frame after frame #n. Other frames are also referred to in the same manner.
[0156]
The pixel values B01 to B12 shown in FIG. 23 are pixel values corresponding to the stationary background object. Since the object corresponding to the background is stationary, the pixel value of the corresponding pixel does not change in frame # n−1 to frame
[0157]
FIG. 24 shows pixels arranged in a row adjacent to each other in three frames of an image obtained by imaging an object corresponding to a foreground moving to the right side in the drawing together with an object corresponding to a stationary background, FIG. 5 is a model diagram in which pixel values of pixels at the same position on a frame are developed in the time direction. The model shown in FIG. 24 includes a covered background area.
[0158]
In FIG. 24, it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image is moved so that the foreground image is displayed on the right side by four pixels in the next frame. 4 and the number of virtual divisions is 4.
[0159]
For example, the foreground component of the leftmost pixel of frame # n−1 in FIG. 24 for the first shutter time / v after the shutter opens is F12 / v, and the second pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F12 / v. The foreground component of the third pixel from the left in FIG. 24 and the third shutter time / v from when the shutter opened, and the fourth shutter time from the shutter of the fourth pixel from the left in FIG. The foreground component of / v is F12 / v.
[0160]
The foreground component of the leftmost pixel of frame # n-1 in FIG. 24 for the second shutter time / v after the shutter opens is F11 / v, and the second pixel from the left in FIG. The foreground component of the third shutter time / v after the shutter is opened is also F11 / v. The foreground component of the third pixel from the left in FIG. 24 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F11 / v.
[0161]
The foreground component of the leftmost pixel of frame # n-1 in FIG. 24 for the third shutter time / v after the shutter opens is F10 / v, and the second pixel from the left in FIG. The foreground component of the fourth shutter time / v after the shutter is opened is also F10 / v. The foreground component of the leftmost pixel of frame # n−1 in FIG. 24 corresponding to the fourth shutter time / v from when the shutter has opened is F09 / v.
[0162]
Since the object corresponding to the background is stationary, the background component of the second pixel from the left of frame # n-1 in FIG. Become. The background component of the third pixel from the left of frame # n−1 in FIG. 24 corresponding to the first and second shutter time / v from when the shutter has opened is B02 / v. The background component of the fourth pixel from the left of frame # n−1 in FIG. 24 corresponding to the first through third shutter time / v from when the shutter has opened is B03 / v.
[0163]
In frame # n−1 in FIG. 24, the leftmost pixel belongs to the foreground area, and the second to fourth pixels from the left belong to the mixed area, which is a covered background area.
[0164]
The fifth through twelfth pixels from the left of frame # n−1 in FIG. 24 belong to the background area, and the pixel values thereof are B04 through B11, respectively.
[0165]
The first through fifth pixels from the left of frame #n in FIG. 24 belong to the foreground area. The foreground component of the shutter time / v in the foreground area of frame #n is any one of F05 / v to F12 / v.
[0166]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image moves so as to be displayed on the right side by four pixels in the next frame, so from the left of frame #n in FIG. The foreground component of the fifth pixel at the first shutter time / v after the shutter opens is F12 / v, and the sixth pixel from the left in FIG. 24 opens the shutter at the second shutter time / v. The foreground component is also F12 / v. The foreground component of the seventh pixel from the left in FIG. 24 for the third shutter time / v after the shutter opens, and the fourth shutter time for the eighth pixel from the left in FIG. The foreground component of / v is F12 / v.
[0167]
The foreground component of the fifth pixel from the left of frame #n in FIG. 24 corresponding to the second shutter time / v from when the shutter has opened is F11 / v, and the sixth pixel from the left in FIG. The foreground component of the third shutter time / v after the shutter is opened is also F11 / v. The foreground component of the seventh pixel from the left in FIG. 24 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F11 / v.
[0168]
The foreground component of the fifth pixel from the left in frame #n in FIG. 24 corresponding to the third shutter time / v from when the shutter has opened is F10 / v, and the sixth pixel from the left in FIG. The foreground component of the fourth shutter time / v after the shutter is opened is also F10 / v. The foreground component of the fifth pixel from the left of frame #n in FIG. 24 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F09 / v.
[0169]
Since the object corresponding to the background is stationary, the background component of the sixth pixel from the left of frame #n in FIG. 24 corresponding to the first shutter time / v after the shutter is opened is B05 / v. The background component of the seventh pixel from the left of frame #n in FIG. 24 corresponding to the first and second shutter time / v from when the shutter has opened is B06 / v. The background component of the eighth pixel from the left of frame #n in FIG. 24 corresponding to the first through third shutter time / v from when the shutter has opened is B07 / v.
[0170]
In frame #n in FIG. 24, the sixth through eighth pixels from the left belong to the mixed area, which is a covered background area.
[0171]
The ninth through twelfth pixels from the left of frame #n in FIG. 24 belong to the background area, and the pixel values thereof are B08 through B11, respectively.
[0172]
The first through ninth pixels from the left in frame # n + 1 in FIG. 24 belong to the foreground area. The foreground component of the shutter time / v in the foreground area of frame # n + 1 is any one of F01 / v to F12 / v.
[0173]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image moves so as to be displayed on the right side by four pixels in the next frame, so that the frame # n + 1 in FIG. The foreground component of the ninth pixel from the left when the shutter opens is the first shutter time / v is F12 / v, and the tenth pixel from the left in FIG. 24 is the second shutter time after the shutter is opened. The foreground component of / v is also F12 / v. The foreground component of the eleventh pixel from the left in FIG. 24 and the third shutter time / v from when the shutter opens, and the fourth shutter time from the shutter of the twelfth pixel from the left in FIG. The foreground component of / v is F12 / v.
[0174]
The foreground component of the ninth pixel from the left in frame # n + 1 in FIG. 24 corresponding to the second shutter time / v from when the shutter has opened is F11 / v, which is the tenth from the left in FIG. The foreground component of the third shutter time / v after the shutter opens is also F11 / v. The foreground component of the eleventh pixel from the left in FIG. 24 corresponding to the fourth shutter time / v from when the shutter has opened is F11 / v.
[0175]
The foreground component of the ninth pixel from the left of frame # n + 1 in FIG. 24 corresponding to the third shutter time / v from when the shutter has opened is F10 / v, which is the tenth pixel from the left in FIG. The foreground component of the fourth shutter time / v after the shutter is opened is also F10 / v. The foreground component of the ninth pixel from the left of frame # n + 1 in FIG. 24 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F09 / v.
[0176]
Since the object corresponding to the background is stationary, the background component of the tenth pixel from the left of frame # n + 1 in FIG. Become. The background component of the eleventh pixel from the left of frame # n + 1 in FIG. 24 corresponding to the first and second shutter time / v from when the shutter has opened is B10 / v. The background component of the twelfth pixel from the left of frame # n + 1 in FIG. 24 corresponding to the first through third shutter time / v from when the shutter has opened is B11 / v.
[0177]
In frame # n + 1 in FIG. 24, the tenth through twelfth pixels from the left correspond to the mixed area, which is a covered background area.
[0178]
FIG. 25 is a model diagram of an image obtained by extracting foreground components from the pixel values shown in FIG.
[0179]
FIG. 26 shows pixels arranged in a row adjacent to each other in three frames of an image obtained by capturing a foreground corresponding to an object moving to the right side in the drawing together with a stationary background. It is the model figure which expand | deployed the pixel value of the pixel of the position of the time direction. In FIG. 26, an uncovered background area is included.
[0180]
In FIG. 26, it can be assumed that the object corresponding to the foreground is a rigid body and is moving at a constant speed. Since the object corresponding to the foreground is moved so as to be displayed on the right side by four pixels in the next frame, the motion amount v is 4.
[0181]
For example, the foreground component of the leftmost pixel of frame # n−1 in FIG. 26 that is the first for the shutter time / v after the shutter opens is F13 / v, and is the second pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F13 / v. The foreground component of the third pixel from the left in FIG. 26 for the third shutter time / v after the shutter opens, and the fourth shutter time for the fourth pixel from the left in FIG. The foreground component of / v is F13 / v.
[0182]
The foreground component of the second pixel from the left of frame # n-1 in FIG. 26 corresponding to the first shutter time / v from when the shutter has opened is F14 / v, and the third pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F14 / v. The foreground component of the third pixel from the left in FIG. 26 corresponding to the first shutter time / v from when the shutter has opened is F15 / v.
[0183]
Since the object corresponding to the background is stationary, the background component of the leftmost pixel of frame # n−1 in FIG. 26 corresponding to the second to fourth shutter time / v from the shutter opening is B25. / v. The background components of the second pixel from the left of frame # n−1 in FIG. 26 corresponding to the third and fourth shutter time / v from when the shutter has opened are B26 / v. The background component of the third pixel from the left of frame # n−1 in FIG. 26 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is B27 / v.
[0184]
In frame # n-1 in FIG. 26, the leftmost pixel through the third pixel belong to the mixed area, which is an uncovered background area.
[0185]
The fourth through twelfth pixels from the left of frame # n−1 in FIG. 26 belong to the foreground area. The foreground component of the frame is any one of F13 / v to F24 / v.
[0186]
The leftmost pixel through the fourth pixel from the left in frame #n in FIG. 26 belong to the background area, and the pixel values are B25 through B28, respectively.
[0187]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image moves so as to be displayed on the right side of four pixels in the next frame. Therefore, from the left of frame #n in FIG. The foreground component of the fifth pixel at the first shutter time / v after the shutter opens is F13 / v, and the sixth shutter pixel from the left in FIG. 26 opens the shutter at the second shutter time / v. The foreground component is also F13 / v. The foreground component of the seventh pixel from the left in FIG. 26 for the third shutter time / v after the shutter opens, and the fourth shutter time for the eighth pixel from the left in FIG. The foreground component of / v is F13 / v.
[0188]
The foreground component of the sixth pixel from the left of frame #n in FIG. 26 corresponding to the first shutter time / v from when the shutter has opened is F14 / v, and the seventh pixel from the left in FIG. The foreground component of the second shutter time / v after opening is also F14 / v. The foreground component of the eighth pixel from the left in FIG. 26 corresponding to the first shutter time / v from when the shutter has opened is F15 / v.
[0189]
Since the object corresponding to the background is stationary, the background components of the fifth pixel from the left of frame #n in FIG. 26 corresponding to the second to fourth shutter time / v from when the shutter has opened are B29 / v. The background component of the sixth pixel from the left of frame #n in FIG. 26 corresponding to the third and fourth shutter time / v from when the shutter has opened is B30 / v. The background component of the seventh pixel from the left of frame #n in FIG. 26 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is B31 / v.
[0190]
In frame #n in FIG. 26, the fifth through seventh pixels from the left belong to the mixed area, which is an uncovered background area.
[0191]
The eighth through twelfth pixels from the left of frame #n in FIG. 26 belong to the foreground area. The value corresponding to the period of the shutter time / v in the foreground area of frame #n is any one of F13 / v to F20 / v.
[0192]
The leftmost pixel through the eighth pixel from the left of frame # n + 1 in FIG. 26 belong to the background area, and the pixel values thereof are B25 through B32, respectively.
[0193]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image moves so as to be displayed on the right side by four pixels in the next frame, so that the frame # n + 1 in FIG. The foreground component of the ninth pixel from the left when the shutter opens is the first shutter time / v is F13 / v, and the tenth pixel from the left in FIG. The foreground component of / v is also F13 / v. The foreground component of the eleventh pixel from the left in FIG. 26 and the third shutter time / v from when the shutter has opened, and the fourth shutter time from the shutter of the twelfth pixel from the left in FIG. The foreground component of / v is F13 / v.
[0194]
The foreground component of the tenth pixel from the left of frame # n + 1 in FIG. 26 corresponding to the first shutter time / v from when the shutter has opened is F14 / v, and the eleventh pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F14 / v. The foreground component of the twelfth pixel from the left in FIG. 26 corresponding to the first shutter time / v from when the shutter has opened is F15 / v.
[0195]
Since the object corresponding to the background is stationary, the background components of the ninth pixel from the left of frame # n + 1 in FIG. , B33 / v. The background component of the tenth pixel from the left of frame # n + 1 in FIG. 26 corresponding to the third and fourth shutter time / v from when the shutter has opened is B34 / v. The background component of the eleventh pixel from the left of frame # n + 1 in FIG. 26 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is B35 / v.
[0196]
In frame # n + 1 in FIG. 26, the ninth through eleventh pixels from the left belong to the mixed area, which is an uncovered background area.
[0197]
The twelfth pixel from the left of frame # n + 1 in FIG. 26 belongs to the foreground area. The foreground component of the shutter time / v in the foreground area of frame # n + 1 is any one of F13 / v to F16 / v.
[0198]
FIG. 27 is a model diagram of an image obtained by extracting foreground components from the pixel values shown in FIG.
[0199]
FIG. 28 shows a foreground area image, a background area image, a covered background area foreground component image, a covered background area background component image, an uncovered background area foreground component image, and an uncovered background area background. It is a figure which shows a response | compatibility with the input image separated into the component image, and the model figure which expand | deployed the pixel value of the pixel in the time direction.
[0200]
As shown in FIG. 28, the input image of the input image is specified by the
[0201]
Separated foreground area image, background area image, covered background area foreground component image, covered background area background component image, uncovered background area foreground component image, and uncovered background area background component The image is processed for each image.
[0202]
FIG. 29 is a diagram illustrating an example of an image divided into a foreground area, a background area, and a mixed area. The
[0203]
As illustrated in FIG. 30, the foreground /
[0204]
FIG. 31 is a flowchart illustrating image processing of the image processing apparatus according to the present invention.
[0205]
In step S101, the
[0206]
In step S <b> 102, the mixture
[0207]
In step S103, the foreground /
[0208]
In step S104, the separated
[0209]
As described above, the image processing apparatus according to the present invention converts an input image into a foreground area image, a background area image, a covered background area foreground component image, a covered background area background component image, and an uncovered background area. The foreground component image and the background component image of the uncovered background area are separated and separated into the foreground area image, the background area image, the foreground component image of the covered background area, and the background component image of the covered background area. Image processing is executed for each foreground component image in the uncovered background area and for each background component image in the uncovered background area.
[0210]
FIG. 32 is a block diagram illustrating an example of the configuration of the
[0211]
The static motion determination unit 202-1 determines the pixel value of the pixel of frame # n + 2 at the same position on the image of the pixel that is the target of region specification of frame #n, and the region specification of frame #n. The pixel value of the pixel of frame # n + 1 at the same position as the position of the target pixel on the image is read from the
[0212]
The static motion determination unit 202-2 is the target of the pixel value of the frame # n + 1 at the same position on the image of the pixel that is the target of region identification of the frame #n, and the target of the frame #n. The pixel value of the pixel is read from the
[0213]
The static motion determination unit 202-3 determines the frame #n at the same position as the pixel value of the pixel that is the region specification target of the frame #n and the position of the pixel that is the region specification target of the frame #n. The pixel value of −1 pixel is read from the
When it is determined that the absolute value of the difference between the pixel value of the pixel of frame #n and the pixel value of the pixel of frame # n-1 is equal to or less than the threshold value Th, the static motion determination unit 202-3 indicates the still The static motion determination is supplied to the region determination unit 203-2 and the region determination unit 203-3.
[0214]
The static motion determination unit 202-4 determines the pixel value of the pixel of frame # n-1 at the same position on the image of the pixel that is the target of region specification of frame #n, and the region specification of frame #n. The pixel value of the pixel of frame # n-2 located at the same position on the image of the target pixel is read from the
[0215]
The region determination unit 203-1 is configured such that the static motion determination supplied from the static motion determination unit 202-1 indicates stillness and the static motion determination supplied from the static motion determination unit 202-2 indicates movement. The pixel that is the target of region identification in frame #n is determined to belong to the uncovered background region, and the uncovered background region determination flag corresponding to the pixel that is determined to belong to the region belongs to the uncovered background region. “1” indicating “” is set.
[0216]
The area determination unit 203-1 indicates that the static motion determination supplied from the static motion determination unit 202-1 indicates movement, or the static motion determination supplied from the static motion determination unit 202-2 indicates stillness. When determining that the pixel that is the target of region identification in frame #n does not belong to the uncovered background region, the uncovered background region determination flag corresponding to the pixel to be determined for the region is set to the uncovered background region. “0” is set to indicate that it does not belong.
[0217]
The area determination unit 203-1 supplies the uncovered background area determination flag in which “1” or “0” is set as described above to the determination flag
[0218]
The region determination unit 203-2 is configured such that the static motion determination supplied from the static motion determination unit 202-2 indicates static and the static motion determination supplied from the static motion determination unit 202-3 indicates static. Then, it is determined that the pixel that is the target of region identification in frame #n belongs to the still region, and “1” indicating that it belongs to the still region is set in the still region determination flag corresponding to the pixel to be determined for the region.
[0219]
In the area determination unit 203-2, the static motion determination supplied from the static motion determination unit 202-2 indicates a motion, or the static motion determination supplied from the static motion determination unit 202-3 indicates a motion. At this time, it is determined that the pixel that is the region identification target in frame #n does not belong to the still region, and “0” indicating that it does not belong to the still region is set in the still region determination flag corresponding to the pixel to be determined for the region. Set.
[0220]
The region determination unit 203-2 supplies the still region determination flag in which “1” or “0” is set as described above to the determination flag
[0221]
The region determination unit 203-2 is configured such that the static motion determination supplied from the static motion determination unit 202-2 indicates movement and the static motion determination supplied from the static motion determination unit 202-3 indicates movement. Then, it is determined that the pixel that is the target of region identification in frame #n belongs to the motion region, and “1” indicating that it belongs to the motion region is set in the motion region determination flag corresponding to the pixel determined for the region.
[0222]
The region determination unit 203-2 indicates that the static motion determination supplied from the static motion determination unit 202-2 indicates static or the static motion determination supplied from the static motion determination unit 202-3 indicates static. At this time, it is determined that the pixel that is the region identification target in frame #n does not belong to the motion region, and “0” indicating that it does not belong to the motion region is set in the motion region determination flag corresponding to the pixel that is determined to be the region. Set.
[0223]
The region determination unit 203-2 supplies the motion region determination flag set to “1” or “0” to the determination flag
[0224]
The region determination unit 203-3 is configured such that the static motion determination supplied from the static motion determination unit 202-3 indicates movement and the static motion determination supplied from the static motion determination unit 202-4 indicates stillness. , It is determined that the pixel that is the target of region identification in frame #n belongs to the covered background region, and the covered background region determination flag corresponding to the pixel to be determined of the region indicates that it belongs to the covered background region. 1 ”is set.
[0225]
In the area determination unit 203-3, the static motion determination supplied from the static motion determination unit 202-3 indicates stillness, or the static motion determination supplied from the static motion determination unit 202-4 indicates movement. When determining that the pixel that is the target of region identification in frame #n does not belong to the covered background region, the covered background region determination flag corresponding to the pixel to be determined for the region does not belong to the covered background region. “0” is set to indicate.
[0226]
The area determination unit 203-3 supplies the covered background area determination flag set to “1” or “0” to the determination flag
[0227]
The determination flag
[0228]
The determination flag
[0229]
The determination flag
[0230]
Next, an example of processing of the
[0231]
When the object corresponding to the foreground is moving, the position on the screen of the image corresponding to the object changes for each frame. As shown in FIG. 33, in the frame #n, the image corresponding to the object located at the position indicated by Yn (x, y) is Yn + 1 (x, y in the frame # n + 1 which is the next frame. Located in y).
[0232]
FIG. 34 shows a model diagram in which pixel values of pixels arranged in a row adjacent to the moving direction of the image corresponding to the foreground object are developed in the time direction. For example, when the motion direction of the image corresponding to the foreground object is horizontal with respect to the screen, the model diagram in FIG. 34 shows a model in which pixel values of adjacent pixels on one line are expanded in the time direction.
[0233]
In FIG. 34, the line in frame #n is the same as the line in frame # n + 1.
[0234]
Foreground components corresponding to the objects included in the second through thirteenth pixels from the left in frame #n are included in the sixth through seventeenth pixels from the left in frame # n + 1.
[0235]
In frame #n, the pixels belonging to the covered background area are the 11th to 13th pixels from the left, and the pixels belonging to the uncovered background area are the 2nd to 4th pixels from the left. In frame # n + 1, the pixels belonging to the covered background area are the 15th to 17th pixels from the left, and the pixels belonging to the uncovered background area are the 6th to 8th pixels from the left.
[0236]
In the example shown in FIG. 34, the foreground component included in frame #n has moved four pixels in frame # n + 1, so the amount of motion v is four. The virtual division number corresponds to the motion amount v and is 4.
[0237]
Next, changes in pixel values of pixels belonging to the mixed region before and after the frame of interest will be described.
[0238]
In frame #n shown in FIG. 35 in which the background is stationary and the foreground motion amount v is 4, the pixels belonging to the covered background area are the fifteenth through seventeenth pixels from the left. Since the motion amount v is 4, in the previous frame # n−1, the fifteenth through seventeenth pixels from the left include only background components and belong to the background area.
In frame # n-2, the fifteenth through seventeenth pixels from the left include only background components and belong to the background area.
[0239]
Here, since the object corresponding to the background is stationary, the pixel value of the fifteenth pixel from the left in frame # n-1 does not change from the pixel value of the fifteenth pixel from the left in frame # n-2. . Similarly, the pixel value of the 16th pixel from the left of frame # n-1 does not change from the pixel value of the 16th pixel from the left of frame # n-2, and the 17th pixel from the left of frame # n-1 The pixel value of this pixel does not change from the pixel value of the 17th pixel from the left in frame # n-2.
[0240]
That is, the pixels of frame # n-1 and frame # n-2 corresponding to the pixels belonging to the covered background area in frame #n are composed of only background components, and the pixel value does not change. The value is almost zero. Therefore, the static motion determination for the pixels in frame # n-1 and frame # n-2 corresponding to the pixels belonging to the mixed region in frame #n is determined as static by the static motion determination unit 202-4.
[0241]
Since the pixels belonging to the covered background area in frame #n include the foreground components, the pixel values are different from the case of only the background components in frame # n-1. Therefore, the static motion determination for the pixels belonging to the mixed region in frame #n and the corresponding pixels in frame # n-1 is determined as motion by the static motion determination unit 202-3.
[0242]
As described above, the region determination unit 203-3 is supplied with the result of the static motion determination indicating the motion from the static motion determination unit 202-3, and is supplied with the result of the static motion determination indicating the static motion from the static motion determination unit 202-4. When it is done, it is determined that the corresponding pixel belongs to the covered background area.
[0243]
In the frame #n shown in FIG. 36 in which the background is stationary and the foreground motion amount v is 4, the pixels included in the uncovered background area are the second through fourth pixels from the left. Since the motion amount v is 4, in the next frame # n + 1, the second through fourth pixels from the left include only background components and belong to the background area. Further, in the next frame # n + 2, the second through fourth pixels from the left include only background components and belong to the background area.
[0244]
Here, since the object corresponding to the background is stationary, the pixel value of the second pixel from the left of frame # n + 2 does not change from the pixel value of the second pixel from the left of frame # n + 1. . Similarly, the pixel value of the third pixel from the left of frame # n + 2 does not change from the pixel value of the third pixel from the left of frame # n + 1, and is the fourth from the left of frame # n + 2. The pixel value of this pixel does not change from the pixel value of the fourth pixel from the left in frame # n + 1.
[0245]
That is, the pixels of frame # n + 1 and frame # n + 2, which correspond to the pixels belonging to the uncovered background area in frame #n, consist only of background components, and the pixel value does not change. The absolute value is almost zero. Therefore, the static motion determination for the pixels in frame # n + 1 and frame # n + 2 corresponding to the pixels belonging to the mixed region in frame #n is determined as static by the static motion determination unit 202-1.
[0246]
Since the pixels belonging to the uncovered background area in frame #n include the foreground components, the pixel values are different from the case of only the background components in frame # n + 1. Therefore, the static motion determination for the pixels belonging to the mixed region in frame #n and the corresponding pixels in frame # n + 1 is determined as motion by the static motion determination unit 202-2.
[0247]
As described above, the region determination unit 203-1 is supplied with the result of the static motion determination indicating the motion from the static motion determination unit 202-2, and is supplied with the result of the static motion determination indicating the static motion from the static motion determination unit 202-1. Is determined to belong to the uncovered background area.
[0248]
FIG. 37 is a diagram showing the determination conditions of the
The pixel in frame # n-2 at the same position on the image of the pixel to be judged in frame #n and the same position on the image of the pixel to be judged in frame #n A pixel in frame # n-1 is determined to be stationary, and a pixel in frame # n-1 and a pixel in frame #n at the same position on the image of the pixel to be determined in frame #n Are determined to be movements, the
[0249]
The pixel in frame # n-1 and the pixel in frame #n at the same position on the image of the pixel to be determined in frame #n are determined to be stationary, and the pixel in frame #n When it is determined that the pixel of frame # n + 1 at the same position on the image of the pixel to be determined as #n is still, the
[0250]
The pixel in frame # n-1 and the pixel in frame #n at the same position on the image of the pixel to be determined in frame #n are determined to move, and the pixel in frame #n When it is determined that a pixel in frame # n + 1 located at the same position on the image of a pixel to be determined as #n is a motion, the
[0251]
The pixel in frame #n and the pixel in frame # n + 1 at the same position on the image of the pixel to be determined in frame #n are determined as motion, and the determination target in frame #n The pixel of frame # n + 1 at the same position as the position of the pixel on the image and the pixel of frame # n + 2 at the same position as the position of the pixel to be determined at frame #n on the image Are determined to be stationary, the
[0252]
FIG. 38 is a diagram illustrating an example of the result of specifying the area by the
[0253]
In FIG. 38C, pixels determined to belong to the motion region are displayed in white. In FIG. 38D, the pixels determined to belong to the still area are displayed in white.
[0254]
FIG. 39 is a diagram showing, as an image, the region information indicating the mixed region in the region information output from the determination flag
[0255]
Next, the area specifying process of the
[0256]
In step S202, the static motion determination unit 202-3 determines whether or not the pixel in frame # n-1 and the pixel at the same position in frame #n are stationary. Then, the static motion determination unit 202-2 determines whether or not the frame #n and the pixel at the same position in the frame # n + 1 are still.
[0257]
In step S203, if it is determined that the pixel in frame #n and the pixel in the same position in frame # n + 1 are determined to be stationary, the process proceeds to step S204, and the region determination unit 203-2 determines that the region is determined. A corresponding still area determination flag is set to “1” indicating that it belongs to a still area. The region determination unit 203-2 supplies the still region determination flag to the determination flag
[0258]
When it is determined in step S202 that the pixel in frame # n-1 and the pixel at the same position in frame #n are in motion, or in step S203, the pixel in frame #n and the same position in frame # n + 1 If the pixel is determined to be moving, the pixel in frame #n does not belong to the still region, so the process of step S204 is skipped, and the procedure proceeds to step S205.
[0259]
In step S205, the static motion determination unit 202-3 determines whether or not the pixel in frame # n-1 and the pixel at the same position in frame #n are in motion, and if it is determined as motion, the process proceeds to step S206. Then, the static motion determination unit 202-2 determines whether or not there is motion between the pixel of frame #n and the pixel at the same position of frame # n + 1.
[0260]
If it is determined in step S206 that the pixel in frame #n and the pixel in the same position in frame # n + 1 are in motion, the process proceeds to step S207, and the region determination unit 203-2 determines that the region is determined. “1” indicating that it belongs to a motion region is set in the corresponding motion region determination flag. The region determination unit 203-2 supplies the motion region determination flag to the determination flag
[0261]
If it is determined in step S205 that the pixel in frame # n-1 and the pixel in the same position in frame #n are still, or in step S206, the pixel in frame #n and the same position in frame # n + 1 If the current pixel is determined to be still, the pixel of frame #n does not belong to the motion region, so the process of step S207 is skipped, and the procedure proceeds to step S208.
[0262]
In step S208, the static motion determination unit 202-4 determines whether or not the pixel in frame # n-2 and the pixel in the same position in frame # n-1 are stationary. In step S209, the static motion determination unit 202-3 determines whether or not there is motion between the pixel in frame # n-1 and the pixel at the same position in frame #n.
[0263]
If it is determined in step S209 that the motion of the pixel in frame # n-1 and the pixel at the same position in frame #n is determined as moving, the process proceeds to step S210, and the region determination unit 203-3 determines that the region is to be determined. The corresponding covered background area determination flag is set to “1” indicating that it belongs to the covered background area. The area determination unit 203-3 supplies the covered background area determination flag to the determination flag
[0264]
If it is determined in step S208 that the pixel in frame # n-2 and the pixel in the same position in frame # n-1 are in motion, or in step S209, the pixel in frame # n-1 and the pixel in frame #n If it is determined that the pixel at the same position is still, the pixel of frame #n does not belong to the covered background area, so the process of step S210 is skipped, and the procedure proceeds to step S211.
[0265]
In step S211, the static motion determination unit 202-2 determines whether or not the pixel in the frame #n and the pixel in the same position in the frame # n + 1 are in motion, and if it is determined to be in motion, the process proceeds to step S212. Then, the static motion determination unit 202-1 determines whether or not the pixel of frame # n + 1 and the pixel at the same position of frame # n + 2 are still.
[0266]
If it is determined in step S212 that the pixel in frame # n + 1 and the pixel in the same position in frame # n + 2 are stationary, the process proceeds to step S213, and the region determination unit 203-1 determines the region. In the uncovered background area determination flag corresponding to the pixel, “1” indicating that the pixel belongs to the uncovered background area is set. The area determination unit 203-1 supplies the uncovered background area determination flag to the determination flag
[0267]
If it is determined in step S211 that the pixel in frame #n and the pixel in the same position in frame # n + 1 are stationary, or in step S212, the pixel in frame # n + 1 and the frame # n + 2 If it is determined that the motion is the same pixel, the pixel of frame #n does not belong to the uncovered background area, so the process of step S213 is skipped, and the procedure proceeds to step S214.
[0268]
In step S214, the
[0269]
If it is determined in step S214 that the area has been specified for all the pixels of frame #n, the process proceeds to step S215, where the
[0270]
As described above, the
[0271]
The
[0272]
When the object corresponding to the foreground has a texture, the
[0273]
The
[0274]
In addition, although the object corresponding to the background has been described as stationary, the above-described processing for specifying the region can be applied even if the image corresponding to the background region includes a motion. For example, when the image corresponding to the background area is moving uniformly, the
[0275]
FIG. 41 is a block diagram illustrating another example of the configuration of the
[0276]
FIG. 42 shows an example of a model diagram in which pixel values of pixels arranged in a line adjacent to the moving direction of the image corresponding to the foreground object are developed in the time direction. For example, when the moving direction of the image corresponding to the foreground object is horizontal to the screen, the model diagram in FIG. 42 shows a model in which pixel values of adjacent pixels on one line are expanded in the time direction.
[0277]
In FIG. 42, the line in frame #n is the same as the line in frame # n−1 and frame # n + 1.
[0278]
In frame #n, the foreground components corresponding to the objects included in the sixth through seventeenth pixels from the left are included in the second through thirteenth pixels from the left in frame # n-1. In frame # n + 1, they are included in the 10th to 21st pixels from the left.
[0279]
In frame # n−1, the pixels belonging to the covered background area are the 11th to 13th pixels from the left, and the pixels belonging to the uncovered background area are the 2nd to 4th pixels from the left. In frame #n, the pixels belonging to the covered background area are the 15th to 17th pixels from the left, and the pixels belonging to the uncovered background area are the 6th to 8th pixels from the left. In frame # n + 1, the pixels belonging to the covered background area are the 19th to 21st pixels from the left, and the pixels belonging to the uncovered background area are the 10th to 12th pixels from the left.
[0280]
In frame # n−1, the pixels belonging to the background area are the first pixel from the left and the fourteenth through twenty-first pixels from the left. In frame #n, the pixels belonging to the background area are the first through fifth pixels from the left, and the eighteenth through twenty-first pixels from the left. In frame # n + 1, the pixels belonging to the background area are the first through ninth pixels from the left.
[0281]
An example of a background image corresponding to the example of FIG. 42 generated by the background
[0282]
The binary object
[0283]
FIG. 44 is a block diagram illustrating a configuration of the binary object
[0284]
For example, as shown in FIG.FourAnd a block corresponding to the block in the background image as shown in FIG. 45 (B).FourApplying equation (4) to a block in a 3 × 3 input image centered at YFourThe correlation value corresponding to is calculated.
[0285]
[Expression 2]
[Equation 3]
[Expression 4]
[0286]
The correlation
[0287]
In addition, the correlation
[0288]
[Equation 5]
[0289]
The correlation
[0290]
The threshold
[0291]
47 is a diagram showing an example of a binary object image corresponding to the model of the input image shown in FIG. In the binary object image, the pixel value is set to 0 for a pixel having a high correlation with the background image.
[0292]
FIG. 48 is a block diagram illustrating a configuration of the time
[0293]
The
[0294]
FIG. 49 is a diagram for explaining the determination by the
[0295]
The pixel of interest of the binary object image of frame #n is 1, the corresponding pixel of the binary object image of frame # n-1 is 1, and the correspondence of the binary object image of frame # n + 1 When the pixel to be processed is 1, the
[0296]
When the pixel of interest of the binary object image of frame #n is 1 and the corresponding pixel of the binary object image of frame # n-1 is 0, the
[0297]
When the pixel of interest of the binary object image of frame #n is 1 and the corresponding pixel of the binary object image of frame # n + 1 is 0, the
[0298]
FIG. 50 is a diagram illustrating an example in which the time
[0299]
The temporal
[0300]
The temporal
[0301]
Since the pixel of frame #n of the binary object image is 1 and the corresponding pixel of frame # n−1 is 0, the time
[0302]
The time
[0303]
Next, the area specifying process of the
[0304]
In step S302, the binary object
[0305]
In step S304, the time
[0306]
Details of the area determination processing corresponding to step S304 will be described with reference to the flowchart of FIG. In step S321, the
[0307]
If it is determined in step S321 that the pixel of interest is 1 in frame #n, the process proceeds to step S323, where the
[0308]
If it is determined in step S323 that the pixel of interest is 0 in frame #n or the corresponding pixel is 1 in frame # n-1, the process proceeds to step S325, and the time
[0309]
If it is determined in step S325 that the pixel of interest is 0 in frame #n or the corresponding pixel is 1 in frame # n + 1, the process proceeds to step S327, and the time
[0310]
As described above, the
[0311]
FIG. 53 is a block diagram showing another configuration of the
[0312]
The
[0313]
FIG. 54 is a block diagram illustrating the configuration of the
[0314]
With reference to the example of FIG. 55 and FIG. 56, the motion compensation of the
[0315]
The
[0316]
The frame memory 383-1 stores the binary object image for which motion compensation has been performed for the first frame, and outputs the stored binary object image to the weighting unit 384-1. The frame memory 383-2 stores the binary object image with motion compensation of the second frame, and outputs the stored binary object image to the weighting unit 384-2.
[0317]
Similarly, each of the frame memories 383-3 to 383- (N-1) stores and stores any of the motion compensated binary object images of the third frame to the (N-1) th frame. The binary object image thus output is output to any one of the weighting unit 384-3 to the weighting unit 384- (N-1). The frame memory 383-N stores the binary object image with motion compensation of the Nth frame, and outputs the stored binary object image to the weighting unit 384-N.
[0318]
The weighting unit 384-1 multiplies the pixel value of the motion-compensated binary object image of the first frame supplied from the frame memory 383-1 by a predetermined weight w1 and supplies the result to the integrating
[0319]
Similarly, each of the weighting units 384-3 to 384- (N-1) is the third to N-1 supplied from any one of the frame memories 383-3 to 383- (N-1). The pixel value of the motion-compensated binary object image of any one of the frames is multiplied by one of the predetermined weights w3 to w (N−1) and supplied to the accumulating
[0320]
The accumulating
[0321]
In this way, the
[0322]
Next, the area specifying process of the
[0323]
In step S344, the
[0324]
In step S345, the time
[0325]
Next, details of the robust processing corresponding to the processing in step S344 in FIG. 57 will be described with reference to the flowchart in FIG. In step S361, the
[0326]
In step S363, the
[0327]
If it is determined in step S363 that N binary object images have been stored, the process proceeds to step S364, and each of the weighting units 384-1 to 384-N adds w1 to w in each of the N binary object images. Multiply by one of the weights of wN.
[0328]
In step S365, the
[0329]
In step S366, the integrating
[0330]
As described above, the
[0331]
As described above, the
[0332]
FIG. 59 is a block diagram illustrating an example of the configuration of the mixture
[0333]
Based on the input image, the estimated mixture
[0334]
Since it can be assumed that the object corresponding to the foreground is moving at a constant speed within the shutter time, the mixture ratio α of the pixels belonging to the mixed area has the following properties. That is, the mixture ratio α changes linearly in response to changes in the pixel position. If the change in the pixel position is one-dimensional, the change in the mixture ratio α can be expressed by a straight line. If the change in the pixel position is two-dimensional, the change in the mixture ratio α is expressed by a plane. be able to.
[0335]
Since the period of one frame is short, it is assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed.
[0336]
In this case, the gradient of the mixture ratio α is the inverse ratio of the motion amount v within the foreground shutter time.
[0337]
An example of an ideal mixing ratio α is shown in FIG. The gradient l in the mixing region of the ideal mixing ratio α can be expressed as the reciprocal of the motion amount v.
[0338]
As shown in FIG. 60, the ideal mixture ratio α has a value of 1 in the background area, a value of 0 in the foreground area, and a value greater than 0 and less than 1 in the mixed area. .
[0339]
In the example of FIG. 61, the pixel value C06 of the seventh pixel from the left of frame #n can be expressed by Expression (8) using the pixel value P06 of the seventh pixel from the left of frame # n-1. it can.
[0340]
[Formula 6]
[0341]
In Expression (8), the pixel value C06 is expressed as the pixel value M of the pixel in the mixed region, and the pixel value P06 is expressed as the pixel value B of the pixel in the background region. That is, the pixel value M of the pixel in the mixed region and the pixel value B of the pixel in the background region can be expressed as Equation (9) and Equation (10), respectively.
[0342]
M = C06 (9)
B = P06 (10)
[0343]
2 / v in equation (8) corresponds to the mixing ratio α. Since the motion amount v is 4, the mixture ratio α of the seventh pixel from the left of the frame #n is 0.5.
[0344]
As described above, the pixel value C of the focused frame #n is regarded as the pixel value of the mixed region, and the pixel value P of the frame # n-1 before the frame #n is regarded as the pixel value of the background region. Equation (3) indicating the mixing ratio α can be rewritten as Equation (11).
[0345]
C = α ・ P + f (11)
F in Expression (11) is the sum of the foreground components included in the pixel of interest ΣiFi / v.
There are two variables included in equation (11): the mixture ratio α and the sum f of the foreground components.
[0346]
Similarly, FIG. 62 shows a model in which pixel values are expanded in the time direction in which the amount of motion v is 4 and the number of virtual divisions in the time direction is 4 in the uncovered background area.
[0347]
In the uncovered background area, similarly to the above-described representation in the covered background area, the pixel value C of the frame #n of interest is regarded as the pixel value of the mixed area, and the frame # n + 1 after the frame #n Eq. (3) indicating the mixture ratio α can be expressed as Eq. (12) by regarding the pixel value N of と as the pixel value of the background region.
[0348]
C = α ・ N + f (12)
[0349]
Although it has been described that the background object is stationary, even when the background object is moving, by using the pixel value of the pixel at the position corresponding to the background motion amount v, the expression (8 ) To (12) can be applied.
For example, in FIG. 61, when the motion amount v of the object corresponding to the background is 2 and the number of virtual divisions is 2, when the object corresponding to the background is moving to the right side in the figure, The pixel value B of the pixel in the background area is set to a pixel value P04.
[0350]
Since Expression (11) and Expression (12) each include two variables, the mixture ratio α cannot be obtained as it is. Here, since an image generally has a strong spatial correlation, adjacent pixels have almost the same pixel value.
[0351]
Therefore, since the foreground components have a strong spatial correlation, the formula is modified so that the sum f of the foreground components can be derived from the previous or subsequent frame to obtain the mixture ratio α.
[0352]
The pixel value Mc of the seventh pixel from the left in frame #n in FIG. 63 can be expressed by Expression (13).
[0353]
[Expression 7]
2 / v in the first term on the right side of Equation (13) corresponds to the mixing ratio α. The second term on the right side of Expression (13) is expressed as Expression (14) using the pixel value of the subsequent frame # n + 1.
[0354]
[Equation 8]
[0355]
Here, Equation (15) is established using the spatial correlation of the foreground components.
[0356]
F = F05 = F06 = F07 = F08 = F09 = F10 = F11 = F12 (15)
Expression (14) can be replaced with Expression (16) using Expression (15).
[0357]
[Equation 9]
[0358]
As a result, β can be expressed by equation (17).
[0359]
β = 2/4 (17)
[0360]
In general, assuming that the foreground components related to the mixed region are equal as shown in Equation (15), Equation (18) is established from the relationship of the internal ratio for all the pixels in the mixed region.
[0361]
β = 1-α (18)
[0362]
If Expression (18) is established, Expression (11) can be expanded as shown in Expression (19).
[0363]
[Expression 10]
[0364]
Similarly, if equation (18) holds, equation (12) can be expanded as shown in equation (20).
[0365]
## EQU11 ##
[0366]
In Expression (19) and Expression (20), C, N, and P are known pixel values, and therefore the variable included in Expression (19) and Expression (20) is only the mixture ratio α. FIG. 64 shows the relationship between C, N, and P in the equations (19) and (20). C is the pixel value of the pixel of interest in frame #n for calculating the mixture ratio α. N is a pixel value of a pixel in frame # n + 1 corresponding to a pixel of interest corresponding to a position in the spatial direction. P is a pixel value of a pixel in frame # n−1 in which the pixel of interest corresponds to the position in the spatial direction.
[0367]
Accordingly, since one variable is included in each of the equations (19) and (20), the mixture ratio α can be calculated using the pixel values of the pixels of the three frames. The condition for calculating the correct mixture ratio α by solving the equations (19) and (20) is that the foreground components related to the mixed region are equal, that is, the imaging is performed when the foreground object is stationary. In the foreground image object thus obtained, the pixel values of the pixels located at the boundary of the image object corresponding to the direction of the motion of the foreground object, which are twice as many as the movement amount v, are continuous. It is constant.
[0368]
As described above, the mixing ratio α of the pixels belonging to the covered background area is calculated by Expression (21), and the mixing ratio α of the pixels belonging to the uncovered background area is calculated by Expression (22).
[0369]
α = (C-N) / (P-N) (21)
α = (C-P) / (N-P) (22)
[0370]
FIG. 65 is a block diagram illustrating a configuration of the estimated mixture
[0371]
The
[0372]
Therefore, when the frame # n + 1 is input to the mixing
[0373]
The mixture
[0374]
As described above, the estimated mixture
[0375]
The estimated mixture
[0376]
FIG. 66 is a diagram illustrating an example of the estimated mixture ratio calculated by the estimated mixture
[0377]
It can be seen that the estimated mixture ratio changes substantially linearly in the mixed region as shown in FIG.
[0378]
Returning to FIG. 59, the mixture
[0379]
FIG. 67 is a block diagram showing another configuration of the mixture
[0380]
Based on the pixel value input from the
[0381]
Based on the pixel value input from the
[0382]
When the target pixel belongs to the foreground area based on the area information supplied from the
[0383]
As described above, the mixture
[0384]
With reference to the flowchart of FIG. 68, the process of calculating the mixture ratio α of the
[0385]
In step S <b> 403, the estimated mixture
[0386]
In step S404, the mixture
[0387]
If it is determined in step S404 that the mixture ratio α has been estimated for the entire frame, the process proceeds to step S405, where the mixture
[0388]
As described above, the mixture
[0389]
The processing for calculating the mixing ratio α by the mixing
[0390]
Next, the mixing ratio estimation processing by the model corresponding to the covered background area corresponding to step S402 in FIG. 68 will be described with reference to the flowchart in FIG.
[0390]
In step S421, the mixture
[0392]
In step S422, the mixture
[0393]
In step S423, the mixture
[0394]
In step S424, the mixture
[0395]
In step S425, the mixture
[0396]
If it is determined in step S425 that the process of calculating the estimated mixture ratio has been completed for the entire frame, the process ends.
[0397]
Thus, the estimated mixture
[0398]
The process of estimating the mixture ratio by the model corresponding to the uncovered background area in step S403 in FIG. 68 is the same as the process shown in the flowchart of FIG. 69 using the expression corresponding to the model of the uncovered background area. Description is omitted.
[0399]
67. The estimated mixture
[0400]
In addition, although it has been described that the object corresponding to the background is stationary, the above-described processing for obtaining the mixture ratio α can be applied even if the image corresponding to the background region includes a motion. For example, when the image corresponding to the background region is moving uniformly, the estimated mixture
[0401]
In addition, the mixture
[0402]
Similarly, the mixture
[0403]
Next, another process of the mixture
[0404]
Using the property that the mixture ratio α changes linearly in response to a change in pixel position due to the object corresponding to the foreground moving at a constant speed within the shutter time, the mixture ratio α in the spatial direction. And an equation that approximates the sum f of the foreground components. By using a plurality of sets of pixel values of pixels belonging to the mixed area and pixel values belonging to the background area, the mixing ratio α is calculated by solving an equation that approximates the mixing ratio α and the sum f of the foreground components. calculate.
[0405]
When the change in the mixing ratio α is approximated as a straight line, the mixing ratio α is expressed by Expression (23).
[0406]
α = il + p (23)
In Expression (23), i is an index in the spatial direction where the position of the pixel of interest is 0. l is the slope of the straight line of the mixing ratio α. p is a straight line intercept of the mixing ratio α and is the mixing ratio α of the pixel of interest. In equation (23), the index i is known, but the slope l and the intercept p are unknown.
[0407]
The relationship between the index i, the slope l, and the intercept p is shown in FIG.
[0408]
By approximating the mixture ratio α as shown in Expression (23), a plurality of different mixture ratios α are expressed by two variables for a plurality of pixels. In the example shown in FIG. 70, the five mixing ratios for the five pixels are expressed by two variables, the gradient l and the intercept p.
[0409]
When the mixture ratio α is approximated in the plane shown in FIG. 71, when considering the motion v corresponding to the two directions of the horizontal direction and the vertical direction of the image, the formula (23) is expanded to a plane, It is represented by Formula (24).
[0410]
α = jm + kq + p (24)
In Expression (24), j is a horizontal index with the position of the pixel of interest being 0, and k is a vertical index. m is the horizontal inclination of the surface of the mixing ratio α, and q is the vertical inclination of the surface of the mixing ratio α. p is an intercept of the surface of the mixing ratio α.
[0411]
For example, in frame #n shown in FIG. 61, equations (25) to (27) are established for C05 to C07, respectively.
[0412]
C05 = α05 ・ B05 / v + f05 (25)
C06 = α06 ・ B06 / v + f06 (26)
C07 = α07 ・ B07 / v + f07 (27)
[0413]
When the foreground components match in the vicinity, that is, F01 to F03 are equal, and F01 to F03 are replaced with Fc, Expression (28) is established.
[0414]
f (x) = (1-α (x)) · Fc (28)
In Expression (28), x represents a position in the spatial direction.
[0415]
When α (x) is replaced with Expression (24), Expression (28) can be expressed as Expression (29).
[0416]
[0417]
In the equation (29), (−m · Fc), (−q · Fc), and (1-p) · Fc are replaced as shown in the equations (30) to (32).
[0418]
s = -m · Fc (30)
t = -q · Fc (31)
u = (1-p) ・ Fc (32)
[0419]
In Expression (29), j is a horizontal index with the position of the pixel of interest as 0, and k is a vertical index.
[0420]
In this way, since it is assumed that the object corresponding to the foreground moves at a constant speed within the shutter time and the component corresponding to the foreground is constant in the vicinity, the sum of the foreground components is expressed by Equation (29). Approximated.
[0421]
When the mixture ratio α is approximated by a straight line, the sum of the foreground components can be expressed by Expression (33).
[0422]
f (x) = is + u (33)
[0423]
When the sum of the mixture ratio α and the foreground component in Expression (13) is replaced using Expression (24) and Expression (29), the pixel value M is expressed by Expression (34).
[0424]
[0425]
In equation (34), the unknown variables are the horizontal gradient m of the surface of the mixing ratio α, the vertical inclination q of the surface of the mixing ratio α, the intercepts p, s, t, and u of the surface of the mixing ratio α. These are six.
[0426]
A plurality of normal equations in which the pixel value M or the pixel value B is set in the normal equation shown in the equation (34) in correspondence with the pixel in the vicinity of the pixel of interest, and the pixel value M or the pixel value B is set. Is calculated by the method of least squares to calculate the mixture ratio α.
[0427]
For example, the horizontal index j of the pixel of interest is set to 0, the index k of the vertical direction is set to 0, and a 3 × 3 pixel in the vicinity of the pixel of interest is expressed by the normal equation shown in Expression (34). When the pixel value M or the pixel value B is set, Expressions (35) to (43) are obtained.
[0428]
Since the index j in the horizontal direction of the pixel of interest is 0 and the index k in the vertical direction is 0, the mixture ratio α of the pixel of interest is expressed by j = 0 and k = It is equal to the value at 0, that is, the intercept p.
[0429]
Accordingly, based on the nine equations (35) to (43), the values of the horizontal gradient m, the vertical gradient q, the intercepts p, s, t, and u are calculated by the method of least squares. The intercept p may be output as the mixing ratio α.
[0430]
Next, a more specific procedure for calculating the mixture ratio α by applying the least square method will be described.
[0431]
When the index i and the index k are expressed by one index x, the relationship between the index i, the index k, and the index x is expressed by Expression (44).
[0432]
x = (j + 1) ・ 3+ (k + 1) (44)
[0433]
Express horizontal slope m, vertical slope q, intercepts p, s, t, and u as variables w0, w1, w2, w3, w4, and W5, respectively, jB, kB, B, j, k, And 1 are expressed as a0, a1, a2, a3, a4, and a5, respectively. In consideration of the error ex, Expressions (35) to (43) can be rewritten into Expression (45).
[0434]
[Expression 12]
In the formula (45), x is an integer value from 0 to 8.
[0435]
From equation (45), equation (46) can be derived.
[0436]
[Formula 13]
[0437]
Here, in order to apply the method of least squares, an error sum of squares E is defined as shown in equation (47).
[0438]
[Expression 14]
[0439]
In order to minimize the error, it is only necessary that the partial differentiation of the variable Wv with respect to the square sum E of the error becomes zero. Here, v is one of integers from 0 to 5. Therefore, wy is obtained so as to satisfy the equation (48).
[0440]
[Expression 15]
[0441]
Substituting equation (46) into equation (48) yields equation (49).
[0442]
[Expression 16]
[0443]
For example, a sweep method (Gauss-Jordan elimination method) is applied to six formulas obtained by substituting any one of
[0444]
As described above, horizontal slope m, vertical slope q, intercepts p, s, t, and u are obtained by applying the method of least squares to the equation in which pixel value M and pixel value B are set. be able to.
[0445]
In the description corresponding to the expressions (35) to (43), the pixel value of the pixel included in the mixed area has been described as M, and the pixel value of the pixel included in the background area has been described as B. Therefore, it is necessary to establish a normal equation for each of the cases where they are included in the covered background region or the uncovered background region.
[0446]
For example, when obtaining the mixture ratio α of the pixels included in the covered background area of frame #n shown in FIG. 61, the pixel values C04 to C08 of the pixels of frame #n and the pixel values P04 to P04 of the pixels of frame # n−1 P08 is set as a normal equation.
[0447]
When obtaining the mixture ratio α of pixels included in the uncovered background area of frame #n shown in FIG. 62, pixel values N28 to N32 of pixels C28 to C32 of frame #n and pixels of frame # n + 1 Is set to a normal equation.
[0448]
For example, when calculating the mixture ratio α of the pixels included in the covered background area shown in FIG. 72, the following equations (50) to (58) are established. The pixel value of the pixel for calculating the mixture ratio α is Mc5.
Mc1 = (-1) ・ Bc1 ・ m + (-1) ・ Bc1 ・ q + Bc1 ・ p + (-1) ・ s + (-1) ・ t + u (50)
Mc2 = (0) ・ Bc2 ・ m + (-1) ・ Bc2 ・ q + Bc2 ・ p + (0) ・ s + (-1) ・ t + u (51)
Mc3 = (+ 1) ・ Bc3 ・ m + (-1) ・ Bc3 ・ q + Bc3 ・ p + (+ 1) ・ s + (-1) ・ t + u (52)
Mc4 = (-1) ・ Bc4 ・ m + (0) ・ Bc4 ・ q + Bc4 ・ p + (-1) ・ s + (0) ・ t + u (53)
Mc5 = (0) ・ Bc5 ・ m + (0) ・ Bc5 ・ q + Bc5 ・ p + (0) ・ s + (0) ・ t + u (54)
Mc6 = (+ 1) ・ Bc6 ・ m + (0) ・ Bc6 ・ q + Bc6 ・ p + (+ 1) ・ s + (0) ・ t + u (55)
Mc7 = (-1) ・ Bc7 ・ m + (+ 1) ・ Bc7 ・ q + Bc7 ・ p + (-1) ・ s + (+ 1) ・ t + u (56)
Mc8 = (0) ・ Bc8 ・ m + (+ 1) ・ Bc8 ・ q + Bc8 ・ p + (0) ・ s + (+ 1) ・ t + u (57)
Mc9 = (+ 1) ・ Bc9 ・ m + (+ 1) ・ Bc9 ・ q + Bc9 ・ p + (+ 1) ・ s + (+ 1) ・ t + u (58)
[0449]
When calculating the mixture ratio α of the pixels included in the covered background area of frame #n, the background of the pixel of frame # n−1 corresponding to the pixel of frame #n in equations (50) to (58) Pixel values Bc1 to Bc9 of the pixels in the area are used.
[0450]
When calculating the mixing ratio α of the pixels included in the uncovered background area shown in FIG. 72, the following equations (59) to (67) are established. The pixel value of the pixel for calculating the mixture ratio α is Mu5.
Mu1 = (-1) ・ Bu1 ・ m + (-1) ・ Bu1 ・ q + Bu1 ・ p + (-1) ・ s + (-1) ・ t + u (59)
Mu2 = (0) ・ Bu2 ・ m + (-1) ・ Bu2 ・ q + Bu2 ・ p + (0) ・ s + (-1) ・ t + u (60)
Mu3 = (+ 1) ・ Bu3 ・ m + (-1) ・ Bu3 ・ q + Bu3 ・ p + (+ 1) ・ s + (-1) ・ t + u (61)
Mu4 = (-1) ・ Bu4 ・ m + (0) ・ Bu4 ・ q + Bu4 ・ p + (-1) ・ s + (0) ・ t + u (62)
Mu5 = (0) ・ Bu5 ・ m + (0) ・ Bu5 ・ q + Bu5 ・ p + (0) ・ s + (0) ・ t + u (63)
Mu6 = (+ 1) ・ Bu6 ・ m + (0) ・ Bu6 ・ q + Bu6 ・ p + (+ 1) ・ s + (0) ・ t + u (64)
Mu7 = (-1) ・ Bu7 ・ m + (+ 1) ・ Bu7 ・ q + Bu7 ・ p + (-1) ・ s + (+ 1) ・ t + u (65)
Mu8 = (0) ・ Bu8 ・ m + (+ 1) ・ Bu8 ・ q + Bu8 ・ p + (0) ・ s + (+ 1) ・ t + u (66)
Mu9 = (+ 1) ・ Bu9 ・ m + (+ 1) ・ Bu9 ・ q + Bu9 ・ p + (+ 1) ・ s + (+ 1) ・ t + u (67)
[0451]
When calculating the mixture ratio α of the pixels included in the uncovered background area of frame #n, in the equations (59) to (67), the pixels of the frame # n + 1 corresponding to the pixels of the frame #n are calculated. The pixel values Bu1 to Bu9 of the pixels in the background area are used.
[0452]
FIG. 73 is a block diagram illustrating a configuration of the estimated mixture
[0453]
The
[0454]
The adding
[0455]
The
[0456]
As described above, the estimated mixture
[0457]
Note that the estimated mixture
[0458]
FIG. 74 is a diagram illustrating an example of the estimated mixture ratio calculated by the estimated mixture
[0459]
It can be seen that the estimated mixture ratio changes substantially linearly in the mixed region as shown in FIG.
[0460]
The mixture
[0461]
With reference to the flowchart of FIG. 75, the mixing ratio calculation processing of the mixing
[0462]
In step S <b> 503, the estimated mixture
[0463]
In step S504, the mixture
[0464]
If it is determined in step S504 that the mixture ratio has been estimated for the entire frame, the process proceeds to step S505, where the mixture
[0465]
As described above, the mixture
[0466]
By using the mixing ratio α, it becomes possible to separate the foreground component and the background component included in the pixel value while leaving the motion blur information included in the image corresponding to the moving object. .
[0467]
Also, by compositing images based on the mixture ratio α, it is possible to create an image including correct motion blur that matches the speed of a moving object as if the real world was actually recaptured.
[0468]
Next, the mixing ratio estimation process using the model corresponding to the covered background area corresponding to step S502 in FIG. 75 will be described with reference to the flowchart in FIG.
[0469]
In step S521, the adding
[0470]
In step S522, the estimated mixture
[0471]
If it is determined in step S522 that the pixel value setting for the target pixel has been completed, the process proceeds to step S523, and the calculation unit 173 calculates the estimated mixture ratio based on the normal equation in which the pixel value is set. Then, the obtained estimated mixture ratio is output.
[0472]
Thus, the estimated mixture
[0473]
The process of estimating the mixture ratio by the model corresponding to the uncovered background area in step S153 of FIG. 75 is the same as the process shown in the flowchart of FIG. 76 using the normal equation corresponding to the model of the uncovered background area. The description is omitted.
[0474]
Note that although the object corresponding to the background has been described as stationary, the above-described processing for obtaining the mixture ratio can be applied even if the image corresponding to the background area includes movement. For example, when the image corresponding to the background region is moving uniformly, the estimated mixture
[0475]
Next, the foreground /
[0476]
The mixing ratio α supplied from the mixing
[0477]
The
[0478]
The
[0479]
The
[0480]
The
[0481]
FIG. 78 is a diagram illustrating an input image input to the foreground /
[0482]
FIG. 78A is a schematic diagram of a displayed image, and FIG. 78B shows pixels belonging to the foreground area, pixels belonging to the background area, and pixels belonging to the mixed area corresponding to FIG. 78A. 1 is a model diagram in which pixels of one line including are expanded in the time direction.
[0483]
As shown in FIGS. 78A and 78B, the image of the background area output from the foreground /
[0484]
As shown in FIGS. 78A and 78B, the foreground area image output from the foreground /
[0485]
The pixel values of the pixels in the uncovered background area are separated into a background component and a foreground component by the foreground /
[0486]
The pixel values of the pixels in the covered background area are separated into a background component and a foreground component by the foreground /
[0487]
Next, a process performed by the
[0488]
FIG. 79 is a model of an image showing foreground components and background components of two frames including a foreground corresponding to an object moving from left to right in the drawing. In the image model shown in FIG. 79, the foreground motion amount v is 4, and the number of virtual divisions is 4.
[0489]
In frame #n, the leftmost pixel and the fourteenth through eighteenth pixels from the left consist only of background components and belong to the background area. In frame #n, the second through fourth pixels from the left include a background component and a foreground component, and belong to the uncovered background area. In frame #n, the eleventh through thirteenth pixels from the left include a background component and a foreground component, and belong to the covered background area. In frame #n, the fifth through tenth pixels from the left consist of only the foreground components and belong to the foreground area.
[0490]
In frame # n + 1, the first through fifth pixels from the left and the eighteenth pixel from the left consist of only the background components, and belong to the background area. In frame # n + 1, the sixth through eighth pixels from the left include a background component and a foreground component, and belong to the uncovered background area. In frame # n + 1, the fifteenth through seventeenth pixels from the left include a background component and a foreground component, and belong to the covered background area. In frame # n + 1, the ninth through fourteenth pixels from the left consist of only the foreground components, and belong to the foreground area.
[0491]
FIG. 80 is a diagram illustrating processing for separating foreground components from pixels belonging to the covered background area. In FIG. 80, α1 to α18 are mixing ratios corresponding to the respective pixels in frame #n. In FIG. 80, the fifteenth through seventeenth pixels from the left belong to the covered background area.
[0492]
The pixel value C15 of the fifteenth pixel from the left in frame #n is expressed by equation (68).
[0493]
Here, α15 is the mixture ratio of the fifteenth pixel from the left in frame #n. P15 is the pixel value of the fifteenth pixel from the left in frame # n-1.
[0494]
Based on Expression (68), the sum f15 of the foreground components of the fifteenth pixel from the left in frame #n is expressed by Expression (69).
[0495]
[0496]
Similarly, the foreground component sum f16 of the 16th pixel from the left in frame #n is expressed by Equation (70), and the foreground component sum f17 of the 17th pixel from the left in frame #n is expressed by Equation (70). (71)
[0497]
f16 = C16-α16 ・ P16 (70)
f17 = C17-α17 ・ P17 (71)
[0498]
In this way, the foreground component fc included in the pixel value C of the pixel belonging to the covered background area is calculated by Expression (72).
[0499]
fc = C-α ・ P (72)
P is the pixel value of the corresponding pixel in the previous frame.
[0500]
FIG. 81 is a diagram for explaining processing for separating foreground components from pixels belonging to the uncovered background area. In FIG. 81, α1 to α18 are mixing ratios corresponding to the respective pixels in frame #n. In FIG. 81, the second through fourth pixels from the left belong to the uncovered background area.
[0501]
The pixel value C02 of the second pixel from the left in frame #n is expressed by Expression (73).
[0502]
Here, α2 is the mixture ratio of the second pixel from the left in frame #n. N02 is the pixel value of the second pixel from the left in frame # n + 1.
[0503]
Based on Expression (73), the sum f02 of the foreground components of the second pixel from the left in frame #n is expressed by Expression (74).
[0504]
[0505]
Similarly, the sum f03 of the foreground components of the third pixel from the left in frame #n is expressed by Expression (75), and the sum f04 of the foreground components of the fourth pixel from the left of frame #n is expressed by Expression (75). (76)
[0506]
f03 = C03-α3 ・ N03 (75)
f04 = C04-α4 ・ N04 (76)
[0507]
In this way, the foreground component fu included in the pixel value C of the pixel belonging to the uncovered background area is calculated by Expression (77).
[0508]
fu = C-α ・ N (77)
N is the pixel value of the corresponding pixel in the next frame.
[0509]
As described above, the
[0510]
FIG. 82 is a block diagram illustrating an example of the configuration of the
[0511]
The
[0512]
The
[0513]
The
[0514]
The
[0515]
The
[0516]
The
[0517]
The multiplier 651 of the covered
[0518]
The
[0519]
By using the mixture ratio α, which is a feature amount, it is possible to completely separate the foreground component and the background component included in the pixel value.
[0520]
Next, foreground / background separation processing by the foreground /
[0521]
In step S <b> 602, the
[0522]
In step S604, the uncovered
[0523]
In step S605, the uncovered
[0524]
In step S606, the covered
[0525]
In step S607, the covered
[0526]
As described above, the foreground /
[0527]
FIG. 84 is a block diagram illustrating a configuration of the separated
[0528]
The background area teacher
[0529]
The uncovered background area background component teacher
[0530]
The uncovered background area foreground component teacher
[0531]
The covered background area background component teacher
[0532]
The covered background area foreground component teacher
[0533]
The foreground area teacher
[0534]
The weighted average unit 707-1 performs, for example, a 1/4 weighted average of the background area images of the teacher image, which is the HD image, supplied from the background area teacher
[0535]
For example, as shown in FIG. 85, the weighted average unit 707-1 uses four 2 × 2 (horizontal × vertical) pixels (portions indicated by white circles in the figure) of the teacher image as one unit. The pixel values of the four pixels are added, and the added result is divided by four. In this way, the weighted average unit 707-1 sets the result of the weighted average by a quarter to the pixel of the student image (the part indicated by a black circle in the figure) located at the center of each unit.
[0536]
The background area student
[0537]
The weighted average unit 707-2 weights the background component image of the uncovered background area of the teacher image, which is an HD image, supplied from the uncovered background area background component teacher
[0538]
The uncovered background area background component student
[0539]
The weighted average unit 707-3 weights the foreground component image in the uncovered background area of the teacher image, which is an HD image, supplied from the uncovered background area foreground component teacher
[0540]
The uncovered background area foreground component student
[0541]
The weighted average unit 707-4 performs a weighted average of the background component images in the covered background area of the teacher image supplied from the covered background area background component teacher
[0542]
The covered background area background component student
[0543]
The weighted average unit 707-5 performs a weighted average of the foreground component images in the covered background area of the teacher image supplied from the covered background area foreground component teacher
[0544]
The covered background area foreground component student
[0545]
The weighted average unit 707-6 performs, for example, a one-fourth weighted average of the images in the foreground area of the teacher image that is the HD image supplied from the foreground area teacher
[0546]
The foreground area student
[0547]
The learning unit 714-1 includes a background image of the teacher image supplied from the background region teacher
[0548]
The learning unit 714-2 includes the background component image of the uncovered background area of the teacher image supplied from the uncovered background area background component teacher
[0549]
The learning unit 714-3 includes a foreground component image in the uncovered background area of the teacher image supplied from the uncovered background area foreground component teacher
[0550]
The learning unit 714-4 supplies the background component image of the covered background area of the teacher image supplied from the covered background area background component teacher
[0551]
The learning unit 714-5 supplies the foreground component image of the covered background area of the teacher image supplied from the covered background area foreground component teacher
[0552]
The learning unit 714-6 stores the foreground area image of the teacher image supplied from the foreground area teacher
[0553]
The coefficient set
[0554]
Hereinafter, the learning units 714-1 to 714-6 are simply referred to as learning units 714 when it is not necessary to distinguish them individually.
[0555]
FIG. 86 is a block diagram illustrating a configuration of the learning unit 714.
[0556]
The
[0557]
For example, in FIG. 85, the pixel of the i th student image from the top and the j th student image from the left (the part indicated by a black circle in the figure) is XijWhen the class tap acquisition unit 751 represents the pixel of
[0558]
In this case, the class tap is configured by a square block of 3 × 3 pixels, but the shape of the class classification block does not have to be a square, for example, a rectangle, It can be a cross shape or any other shape. Also, the number of pixels constituting the class tap is not limited to 3 × 3 9 pixels.
[0559]
The
[0560]
Here, the class classification process will be briefly described.
[0561]
Now, for example, as shown in FIG. 87 (A), a class tap of 2 × 2 pixels is configured by a certain target pixel and three pixels adjacent thereto, and each pixel is represented by 1 bit. (Takes a level of 0 or 1). In this case, a 2 × 2 4-pixel block including the pixel of interest has 16 (= (2) as shown in FIG. 87B due to the level distribution of each pixel.1)Four) Can be classified into patterns. Therefore, in this case, the target pixel can be classified into 16 patterns, and such pattern classification is a class classification process, and is performed in the
[0562]
Here, normally, for example, about 8 bits are assigned to each pixel. Further, in the present embodiment, as described above, the class tap is composed of 3 × 3 9 pixels. Therefore, when class classification processing is performed for such a class tap, (28)9It will be classified into a huge number of classes.
[0563]
Therefore, in the present embodiment, the
[0564]
To simplify the description, as shown in FIG. 88 (A), when considering a class tap composed of four pixels arranged on a straight line, in the ADRC process, the maximum value MAX and the minimum value MIN of the pixel value are considered. Is detected. Then, DR = MAX-MIN is set as the local dynamic range of the block constituted by class taps, and the pixel values of the pixels constituting the class tap block are requantized to K bits based on the dynamic range DR. Is done.
[0565]
That is, the minimum value MIN is subtracted from each pixel value in the block, and the subtracted value is converted into DR / 2.KDivide by. Then, it is converted into a code (ADRC code) corresponding to the division value obtained as a result. Specifically, for example, when K = 2, as shown in FIG. 88 (B), the division value has a dynamic range DR of 4 (= 22) It is determined which range is obtained by equally dividing, and the division value is the range of the lowest level, the range of the second level from the bottom, the range of the third level from the bottom, or the top In the case of belonging to the level range, for example, it is encoded into 2 bits such as 00B, 01B, 10B, or 11B (B represents a binary number).
On the decoding side, the ADRC code 00B, 01B, 10B, or 11B is the center value L of the lowest level range obtained by dividing the dynamic range DR into four equal parts.00, Center value L of the second level range from the bottom01, Center value L of the third level range from the bottomTenOr the center value L of the range of the highest level11Decoding is performed by adding the minimum value MIN to the value.
[0566]
Here, such ADRC processing is called non-edge matching.
[0567]
The details of the ADRC processing are disclosed in, for example, Japanese Patent Application Laid-Open No. 3-53778 filed by the applicant of the present application.
[0568]
By performing ADRC processing that performs requantization with a smaller number of bits than the number of bits allocated to the pixels constituting the class tap, the number of classes can be reduced as described above. This is performed in the
[0569]
In the present embodiment, class classification processing is performed in the
[0570]
Based on the class number, the prediction
[0571]
For example, in FIG. 85, pixel X of the student imageijThe pixel value of 9 pixels of 2 × 2 in the original image (teacher image) centered on (indicated by the black circle in the figure) is Y from the left to the right and from the top to the bottom.ij(1), Yij(2), Yij(3), YijIf expressed as (4), pixel Yij(1) to YijIn order to calculate the coefficient necessary for the calculation of the predicted value in (4), the prediction
[0572]
Specifically, for example, the pixel Y in the teacher image surrounded by a rectangle in FIG.33(1) to Y33In order to calculate the coefficient necessary for calculating the predicted value of four pixels in (4), the pixel Xtwenty two, Xtwenty three, Xtwenty four, X32, X33, X34, X42, X43, X44(A pixel of interest in this case is X33Becomes).
[0573]
The corresponding
[0574]
For example, the corresponding
[0575]
The normal
[0576]
The
[0577]
The normal
[0578]
Here, the adaptation process will be described.
[0579]
For example, the predicted value E [y] of the pixel value y of the teacher image is now set to the pixel values of some surrounding pixels (hereinafter referred to as student data as appropriate) x1, X2, ... and a predetermined prediction coefficient w1, W2Consider a linear primary combination model defined by the linear combination of. In this case, the predicted value E [y] can be expressed by the following equation.
[0580]
E [y] = w1x1+ W2x2+ ... (78)
[0581]
Therefore, in order to generalize, a matrix W composed of a set of prediction coefficients w, a matrix X composed of a set of student data, and a matrix Y ′ composed of a set of predicted values E [y]
[Expression 17]
Then, the following observation equation holds.
[0582]
XW = Y ′ (79)
[0583]
Then, it is considered to apply the least square method to this observation equation to obtain a predicted value E [y] close to the pixel value y of the original image. In this case, a matrix Y consisting of a set of pixel values y of the original image (hereinafter referred to as teacher data as appropriate) y and a set of residuals e of predicted values E [y] for the pixel values y of the original image. E
[Expression 18]
From the equation (79), the following residual equation is established.
[0584]
XW = Y + E (80)
[0585]
In this case, the prediction coefficient w for obtaining the predicted value E [y] close to the pixel value y of the original imageiIs the square error
[Equation 19]
Can be obtained by minimizing.
[0586]
Therefore, the above square error is converted into the prediction coefficient w.iWhen the value differentiated by 0 is 0, that is, the prediction coefficient w satisfying the following equation:iHowever, this is the optimum value for obtaining the predicted value E [y] close to the pixel value y of the original image.
[0587]
[Expression 20]
[0588]
Therefore, first, the equation (80) is converted into the prediction coefficient w.iIs differentiated by the following equation.
[0589]
[Expression 21]
[0590]
From equations (81) and (82), equation (83) is obtained.
[0591]
[Expression 22]
[0592]
Further, considering the relationship among the student data x, the prediction coefficient w, the teacher data y, and the residual e in the residual equation of Equation (80), the following normal equation can be obtained from Equation (83). .
[0593]
[Expression 23]
[0594]
The normal equation of the equation (84) can be formed by the same number as the number of prediction coefficients w to be obtained. Therefore, the optimal prediction coefficient w can be obtained by solving the equation (84). In solving the equation (84), for example, a sweeping method (Gauss-Jordan elimination method) or the like can be applied.
[0595]
As described above, the optimum prediction coefficient w is obtained for each class, and further, using the prediction coefficient w, the prediction value E [y] close to the pixel value y of the teacher image is obtained by Expression (78). It is an adaptive process.
[0596]
The normal
[0597]
Note that the adaptive processing is different from the interpolation processing in that a component included in the original image that is not included in the thinned image is reproduced. That is, the adaptive process is the same as the interpolation process using a so-called interpolation filter as long as only Expression (78) is seen, but the prediction coefficient w corresponding to the tap coefficient of the interpolation filter uses the teacher data y. In other words, since it is obtained by learning, the components included in the original image can be reproduced. From this, it can be said that the adaptive process is a process having an image creating action.
[0598]
FIG. 89 is a diagram for explaining a coefficient set generated by the separated
[0599]
The input image in which the area is specified and the mixture ratio α is detected by the mixture
[0600]
The separated
[0601]
That is, the learning unit 714-1 calculates a coefficient set corresponding to the background region based on the separated background region image, and the learning unit 714-2 performs the background component image of the separated uncovered background region. The coefficient set corresponding to the background component image of the uncovered background area is calculated based on the uncovered background area, and the learning unit 714-3 calculates the uncovered background area based on the foreground component image of the separated uncovered background area. The learning unit 714-4 calculates a coefficient set corresponding to the background component image of the covered background area based on the separated background component image of the covered background area. Then, the learning unit 714-5 performs the covered back based on the foreground component image of the separated covered background area. Calculating a coefficient set corresponding to the foreground component image in the round region, the learning unit 714-6, based on the image of the separated foreground area, calculates the coefficient set corresponding to the foreground area.
[0602]
The coefficient set corresponding to the background region is used for prediction of the pixel value of the background region in the class classification adaptive process for predicting the pixel value. The coefficient set corresponding to the background component image in the uncovered background area is used for prediction of the pixel value corresponding to the background component image in the uncovered background area in the class classification adaptive process for predicting the pixel value. The coefficient set corresponding to the foreground component image in the uncovered background area is used for prediction of the pixel value corresponding to the foreground component image in the uncovered background area in the class classification adaptive process for predicting the pixel value.
[0603]
The coefficient set corresponding to the background component image in the covered background area is used for predicting the pixel value corresponding to the background component image in the covered background area in the class classification adaptation process for predicting the pixel value. The coefficient set corresponding to the foreground component image in the covered background area is used for predicting the pixel value corresponding to the foreground component image in the covered background area in the class classification adaptation process for predicting the pixel value.
[0604]
The coefficient set corresponding to the foreground region is used for predicting the pixel value of the foreground region in the class classification adaptive process for predicting the pixel value.
[0605]
Corresponding to the predicted image corresponding to the background region image, the predicted image corresponding to the background component image of the uncovered background region, the predicted image corresponding to the foreground component image of the uncovered background region, and the background component image of the covered background region The predicted image corresponding to the foreground component image in the covered background area and the predicted image corresponding to the image in the foreground area are combined into one predicted image.
[0606]
A learning process for generating a coefficient set used for pixel value prediction by the class classification adaptive process by the separated
[0607]
In step S701, the weighted average units 707-1 to 707-6 perform the background area image, the foreground area image, the uncovered background area background component image, the uncovered background area foreground component image, and the covered background area. And a student image of the foreground component image of the covered background region are generated. That is, the weighted average unit 707-1 averages, for example, a quarter weighted average of the images of the background area of the teacher image stored in the background area teacher
[0608]
The weighted average unit 707-2 performs, for example, a quarter weighted average of the background component images of the uncovered background area of the teacher image stored in the uncovered background area background component teacher
[0609]
The weighted average unit 707-3 performs, for example, a one-quarter weighted average of the foreground component images in the uncovered background area of the teacher image stored in the uncovered background area foreground component teacher
[0610]
The weighted average unit 707-4 performs a weighted average of the background component images of the covered background area of the teacher image stored in the covered background area background component teacher
[0611]
The weighted average unit 707-5 performs a weighted average of the foreground component images in the covered background area of the teacher image stored in the covered background area foreground component teacher
[0612]
The weighted average unit 707-6 performs, for example, a one-fourth weighted average of the images in the foreground area of the teacher image stored in the foreground area teacher
[0613]
In step S <b> 702, the learning unit 714-1 determines the background area image of the teacher image stored in the background area teacher
[0614]
In step S703, the learning unit 714-2 stores the background component image of the uncovered background area and the uncovered background area background component of the teacher image stored in the uncovered background area background component teacher
[0615]
In step S704, the learning unit 714-3 performs the foreground component image of the uncovered background area of the teacher image and the uncovered background area foreground component stored in the uncovered background area foreground component teacher
[0616]
In step S <b> 705, the learning unit 714-4 stores the background component image of the covered background area and the covered background area background component student image frame of the teacher image stored in the covered background area background component teacher
[0617]
In step S <b> 706, the learning unit 714-5 stores the foreground component image of the covered background area of the teacher image and the covered background area foreground component student image frame stored in the covered background area foreground component teacher
[0618]
In step S <b> 707, the learning unit 714-6 determines the foreground area image of the teacher image stored in the foreground area teacher
[0619]
In step S708, the learning units 714-1 to 712-4 respectively convert the coefficient set corresponding to the background region, the coefficient set corresponding to the background component image of the uncovered background region, and the foreground component image of the uncovered background region. The coefficient set corresponding to the background component image in the covered background area, the coefficient set corresponding to the foreground component image in the covered background area, or the coefficient set corresponding to the foreground area is output to the coefficient set
[0620]
As described above, the separated
[0621]
Of course, the processing in steps S702 to S707 may be executed serially or in parallel.
[0622]
Next, processing for generating a coefficient set corresponding to the background region executed by the learning unit 714-1 and corresponding to the processing in step S702 will be described with reference to the flowchart in FIG.
[0623]
In step S721, the learning unit 714-1 determines whether there is an unprocessed pixel in the student image corresponding to the background area, and determines that there is an unprocessed pixel in the student image corresponding to the background area. In step S722, the target pixel is acquired from the student image corresponding to the background area in the raster scan order.
[0624]
In step S723, the class tap acquisition unit 751 of the
[0625]
In step S726, the corresponding
[0626]
In step S727, the normal
[0627]
If it is determined in step S721 that there is no unprocessed pixel in the student image, the process proceeds to step S728, and the normal
[0628]
The
[0629]
In step S729, the
[0630]
As described above, the learning unit 714-1 can generate a coefficient set corresponding to the background region.
[0631]
The processing of generating a coefficient set corresponding to the background component image of the uncovered background area by the learning unit 714-2 corresponding to step S703 is stored in the uncovered background area background component teacher
[0632]
The processing of generating a coefficient set corresponding to the foreground component image in the uncovered background area by the learning unit 714-3 corresponding to step S704 is stored in the uncovered background area foreground component teacher
[0633]
The processing of generating a coefficient set corresponding to the background component image in the covered background area by the learning unit 714-4 corresponding to step S705 is performed by the covered back stored in the covered background area background component teacher
[0634]
The processing of generating a coefficient set corresponding to the foreground component image in the covered background area by the learning unit 714-5 corresponding to step S706 is performed by the covered back stored in the covered background area foreground component teacher
[0635]
The learning unit 714-6 corresponding to step S707 generates the coefficient set corresponding to the foreground area by using the foreground area image stored in the foreground area teacher
[0636]
As described above, the separated
[0637]
FIG. 92 is a block diagram illustrating a configuration of the separated
[0638]
The background
[0639]
The uncovered background area background component
[0640]
The uncovered background area foreground component
[0641]
The covered background area background component
[0642]
The covered background area foreground component
[0643]
The foreground
[0644]
The mapping unit 807-1 corresponds to the image of the background area stored in the background
[0645]
The mapping unit 807-2 performs an uncovered background area background component image frame by class classification adaptive processing based on the coefficient set corresponding to the background component image of the uncovered background area stored in the coefficient set
[0646]
The mapping unit 807-3 performs an uncovered background area foreground component image frame by class classification adaptation processing based on the coefficient set corresponding to the foreground component image of the uncovered background area stored in the coefficient set
[0647]
The mapping unit 807-4 performs the covered background area background component
[0648]
Based on the coefficient set corresponding to the foreground component image in the covered background area stored in the coefficient set
[0649]
Based on the coefficient set corresponding to the foreground area stored in the coefficient set
[0650]
The combining
[0651]
The
[0652]
Hereinafter, when the mapping units 807-1 to 807-6 do not need to be individually distinguished, they are simply referred to as the
[0653]
FIG. 93 is a block diagram showing the configuration of the
[0654]
The
[0655]
The
[0656]
The class
[0657]
The
[0658]
Based on the class number, the prediction
[0659]
Based on the class number, the
[0660]
Note that the
[0661]
The
[0662]
An example of processing results of the image processing apparatus of the present invention having the separated
[0663]
In the process of generating the result shown in the example, the total number of classes in the class classification adaptation process of the image processing apparatus of the present invention is substantially the same as the number of classes in the conventional class classification adaptation process. That is, the number of classes in the conventional class classification adaptive processing is 2048, and the number of classes in the class classification adaptive processing of the image processing apparatus of the present invention corresponding to the image of each region is 512.
[0664]
In addition, the number of prediction taps in the conventional class classification adaptation process and the number of prediction taps in the class classification adaptation process of each region of the image processing apparatus of the present invention are set to nine and the same.
[0665]
The prediction results in the covered background area will be described with reference to FIGS. 94 to 96. FIG.
[0666]
FIG. 94A is a diagram illustrating an example of an image in the teacher image mixed region. FIG. 94B is a diagram illustrating a change in pixel value corresponding to a position in the spatial direction of the image in the mixed region of the teacher images.
[0667]
FIG. 95A is a diagram showing an example of a mixed region image generated by the conventional class classification adaptation process corresponding to the teacher image shown in FIG. FIG. 95B is a diagram showing a change in pixel value corresponding to the position in the spatial direction of the image in the mixed region generated by the conventional class classification adaptation process corresponding to the teacher image shown in FIG. .
[0668]
FIG. 96A is a diagram illustrating an example of a mixed region image generated by the separated
[0669]
The pixel value of the image in the mixed area generated by the conventional classification adaptation process changes stepwise compared to the teacher image, and also changes stepwise in the generated actual image. However, it can be confirmed visually.
[0670]
On the other hand, the pixel value of the image in the mixed region generated by the separated
[0671]
The image in the mixed region generated by the separated
[0672]
The prediction results in the foreground area where the pixel value changes almost linearly with respect to the pixel position will be described with reference to FIGS. 97 to 99. FIG.
[0673]
FIG. 97A is a diagram illustrating an example of an image in the foreground area of the teacher image in which the pixel value changes substantially linearly. FIG. 97B is a diagram illustrating a change in pixel value corresponding to a position in the spatial direction of an image in the foreground region of the teacher image in which the pixel value changes substantially linearly.
[0674]
FIG. 98A is a diagram illustrating an example of an image in the foreground area corresponding to the image in FIG. 97 generated by the conventional class classification adaptation process. FIG. 98B is a diagram showing a change in pixel value corresponding to the position in the spatial direction of the image in the foreground area corresponding to the image of FIG. 97 generated by the conventional class classification adaptation process.
[0675]
FIG. 99A is a diagram illustrating an example of an image of the foreground area corresponding to the image of FIG. 97 generated by the separated
[0676]
The pixel values of the image in the foreground area generated by the conventional classification adaptation process change stepwise as compared to the teacher image, as in the mixed area, and change stepwise in the actual image. It can be confirmed visually.
[0677]
On the other hand, the pixel value of the image in the foreground area generated by the separated
[0678]
Next, an image creation process of the separated
[0679]
In step S801, the mapping unit 807-1 performs the background classification stored in the background
[0680]
In step S <b> 802, the mapping unit 807-2 performs an uncovered background area by class classification adaptation processing based on the coefficient set corresponding to the background component image of the uncovered background area stored in the coefficient set
[0681]
In step S803, the mapping unit 807-3 performs unclassified background area by class classification adaptation processing based on the coefficient set corresponding to the foreground component image of the uncovered background area stored in the coefficient set
[0682]
In step S <b> 804, the mapping unit 807-4 performs the covered background area background component by class classification adaptive processing based on the coefficient set corresponding to the background component image of the covered background area stored in the coefficient set
[0683]
In step S805, the mapping unit 807-5 performs the classified background adaptive foreground component by class classification adaptive processing based on the coefficient set corresponding to the foreground component image of the covered background area stored in the coefficient set
[0684]
In step S <b> 806, the mapping unit 807-6 performs the foreground area stored in the foreground
[0685]
In step S807, the
[0686]
In step S808, the
[0687]
In this way, the image processing apparatus having the separated
[0688]
Of course, the processing in steps S801 to S806 may be executed serially or in parallel.
[0689]
With reference to the flowchart of FIG. 101, the process of predicting an image corresponding to the background area by the mapping unit 807-1 corresponding to step S801 will be described.
[0690]
In step S821, the mapping unit 807-1 determines whether or not there is an unprocessed pixel in the background area image. If it is determined that there is an unprocessed pixel in the background area image, the mapping unit 807-1 proceeds to step S822. The
[0691]
In step S824, the class
[0692]
In step S827, the
[0693]
Note that the
[0694]
In step S828, the
[0695]
If it is determined in step S821 that there are no unprocessed pixels in the background area image, the process advances to step S829, and the
[0696]
As described above, the mapping unit 807-1 can predict an image corresponding to the image of the background area based on the image of the background area of the separated input image.
[0697]
The process of generating a predicted image corresponding to the background component image in the uncovered background area by the mapping unit 807-2 corresponding to step S802 is the unstored background area background component
[0698]
The process of generating a predicted image corresponding to the foreground component image in the uncovered background area by the mapping unit 807-3 corresponding to step S803 is performed in the unstored background area foreground component
[0699]
The process of generating a predicted image corresponding to the background component image in the covered background area by the mapping unit 807-4 corresponding to step S804 is the same as the covered background stored in the covered background area background component
[0700]
The process of generating a predicted image corresponding to the foreground component image in the covered background area by the mapping unit 807-5 corresponding to step S805 is the same as the covered background stored in the covered background area foreground component
[0701]
The process of generating a predicted image corresponding to the image in the foreground area by the mapping unit 807-6 corresponding to step S806 includes the foreground area image stored in the foreground
[0702]
In this way, the separated
[0703]
FIG. 102 shows an image of a background area, a background component image of an uncovered background area, a foreground component image of an uncovered background area, a background component image of a covered background area, a foreground component image of a covered background area, or a foreground area It is a block diagram which shows the structure of the separate
[0704]
The background
[0705]
The uncovered background area background component
[0706]
The uncovered background area foreground component
[0707]
The covered background area background component
[0708]
The covered background area foreground component
[0709]
The foreground
[0710]
The edge enhancement unit 907-1 applies edge enhancement processing suitable for the background region image to the background region image stored in the background
[0711]
For example, the edge emphasizing unit 907-1 performs an edge emphasis process that further emphasizes the edge of the background image, which is a still image, as compared to the foreground region.
By doing so, it is possible to further increase the sense of resolution of the image in the background region without causing unnatural degradation of the image when the edge enhancement processing is applied to the moving image.
[0712]
The edge enhancement unit 907-2 applies edge enhancement processing suitable for the background component image in the uncovered background area to the image stored in the uncovered background area background component
[0713]
For example, the edge emphasizing unit 907-2 performs an edge emphasis process that emphasizes the edge more than the background component image of the uncovered background area, which is a still image, compared to the foreground area. By doing so, it is possible to further increase the sense of resolution of the image in the background region without causing unnatural degradation of the image when the edge enhancement processing is applied to the moving image.
[0714]
The edge enhancement unit 907-3 applies edge enhancement processing suitable for the foreground component image in the uncovered background area to the image stored in the uncovered background area foreground component
[0715]
For example, the edge enhancement unit 907-3 performs edge enhancement processing with a lower degree of edge enhancement on the foreground component image of the covered background region composed of the moving foreground components than the background region. In this way, in the foreground component image in the covered background area, it is possible to reduce the unnatural degradation of the image when edge enhancement processing is applied to a moving image while improving the sense of resolution. .
[0716]
The edge enhancement unit 907-4 applies an edge enhancement process suitable for the background component image in the covered background area to the image stored in the covered background area background component
[0717]
For example, the edge emphasizing unit 907-4 executes edge emphasis processing that emphasizes the edge more than the foreground area on the background component image of the covered background area that is a still image. By doing so, it is possible to further increase the sense of resolution of the image in the background region without causing unnatural degradation of the image when the edge enhancement processing is applied to the moving image.
[0718]
The edge enhancement unit 907-5 applies an edge enhancement process suitable for the foreground component image in the covered background area to the image stored in the covered background area foreground component
[0719]
For example, the edge enhancement unit 907-5 performs edge enhancement processing with a lower degree of edge enhancement on the foreground component image of the covered background region composed of the moving foreground components than the background region. In this way, in the foreground component image in the covered background area, it is possible to reduce the unnatural degradation of the image when edge enhancement processing is applied to a moving image while improving the sense of resolution. .
[0720]
The edge enhancement unit 907-6 applies edge enhancement processing suitable for the foreground region image to the foreground region image stored in the foreground
[0721]
For example, the edge enhancement unit 907-6 performs edge enhancement processing with a lower degree of edge enhancement on the moving foreground region image than the background region. By doing so, it is possible to improve the sense of resolution in the image in the foreground region and reduce unnatural degradation of the image when the edge enhancement process is applied to the moving image.
[0722]
The synthesizing
[0723]
The
[0724]
As described above, the separated
[0725]
Hereinafter, when there is no need to distinguish the edge emphasizing units 907-1 to 907-6, they are simply referred to as
[0726]
FIG. 103 is a block diagram illustrating a configuration of the
[0727]
The high-
[0728]
For example, when the image shown in FIG. 104A is input, the high-
[0729]
When the input filter coefficient changes, the high-
[0730]
The relationship between the filter coefficient and the edge image will be described with reference to FIGS.
[0731]
FIG. 105 is a diagram illustrating a first example of filter coefficients. In FIG. 105, E indicates the factorial of 10. For example, E-04 is 10-FourE-02 is 10-2Indicates.
[0732]
For example, the high-
[0733]
For example, when the filter coefficient shown in FIG. 105 is used, the high-
[0734]
When the filter coefficient shown in FIG. 105 is used, the high-
[0735]
When the filter coefficient shown in FIG. 105 is used, the
[0736]
The high-
[0737]
The high-
[0738]
Next, the high-
[0739]
The high-
[0740]
That is, in this example, the high-
[0741]
FIG. 106 is a diagram showing the operation of the high-
[0741]
FIG. 107 is a diagram illustrating a second example of filter coefficients.
[0743]
FIG. 108 is a diagram illustrating the operation of the high-
[0744]
As described above, the high-
[0745]
Although not illustrated here, similarly, when different filter coefficients are supplied, the high-
[0746]
Returning to FIG. 103, the high-
[0747]
The
[0748]
The
[0749]
The adding
[0750]
For example, when the input image shown in FIG. 104A is input to the
[0751]
In this way, the
[0752]
For example, the edge emphasizing unit 907-1 having the configuration illustrated in FIG. 103 uses the coefficients illustrated in FIG. 107 to apply edge emphasis processing with a higher degree of edge emphasis to the image of the background region. The edge enhancement unit 907-6 having the configuration shown in FIG. 103 uses the coefficients shown in FIG. 105 to apply edge enhancement processing with relatively weak edge enhancement to the image in the foreground region.
[0753]
FIG. 109 is a block diagram showing another configuration of the
[0754]
Based on the input filter coefficients, the
[0755]
For example, when the coefficient illustrated in FIG. 110 is supplied, the
[0756]
FIG. 111 is a diagram illustrating the operation of the
[0757]
The
[0758]
FIG. 112 is a diagram illustrating a second example of filter coefficients supplied to the
[0759]
FIG. 113 is a diagram illustrating the operation of the
[0760]
The
[0761]
As described above, the
[0762]
For example, the edge emphasizing unit 907-1 having the configuration illustrated in FIG. 109 uses the coefficients illustrated in FIG. 112 to apply edge emphasis processing having a higher degree of edge emphasis to the image of the background region. The edge enhancement unit 907-6 having the configuration shown in FIG. 109 uses the coefficients shown in FIG. 110 to apply edge enhancement processing with relatively weak edge enhancement to the image in the foreground region.
[0763]
As described above, the edge enhancement units 907-1 to 907-6 execute edge enhancement processing corresponding to the properties of the divided images based on, for example, different filter coefficients or gain adjustment coefficients.
[0764]
FIG. 114 is a diagram for explaining processing of the separated
[0765]
The foreground area, uncovered background area, covered background area, and background area of the input image are specified by the
[0766]
The image of the background area, the background component image of the uncovered background area, the foreground component image of the uncovered background area, the background component image of the covered background area, the foreground component image of the covered background area, and the image of the foreground area are The separated
[0767]
Edge-enhanced background area image, uncovered background area background component image, uncovered background area foreground component image, covered background area background component image, covered background area foreground component image, And the image of the foreground area is synthesized.
[0768]
Next, edge enhancement processing of the separated
[0769]
In step S <b> 901, the edge enhancement unit 907-1 performs edge enhancement on the background region image stored in the background
[0770]
In step S902, the edge enhancement unit 907-2 performs an edge enhancement process corresponding to the nature of the background component image of the uncovered background area, and stores the unenclosed background area background component
[0771]
In step S903, the edge enhancement unit 907-3 performs the edge enhancement corresponding to the property of the foreground component image of the uncovered background area, and stores the unenclosed background area foreground component
[0772]
In step S904, the edge enhancement unit 907-4 performs processing for edge enhancement corresponding to the nature of the background component image in the covered background area, and stores the covered background stored in the covered background area background component
[0773]
In step S905, the edge enhancement unit 907-5 performs the edge enhancement corresponding to the property of the foreground component image in the covered background area, and stores the covered background stored in the covered background area foreground component
[0774]
In step S906, the edge enhancement unit 907-6 performs edge enhancement on the foreground region image stored in the foreground
[0775]
In step S907, the
[0776]
In step S908, the
[0777]
As described above, the separated
[0778]
Of course, the processing in steps S901 to S906 may be executed serially or in parallel.
[0779]
The process executed by the separated
[0780]
Note that the separated
[0781]
FIG. 116 is a block diagram illustrating another configuration of the function of the image processing apparatus that separates an input image and processes each separated image. The image processing apparatus shown in FIG. 11 sequentially performs area specification and calculation of the mixture ratio α, whereas the image processing apparatus shown in FIG. 116 performs area specification and calculation of the mixture ratio α in parallel.
[0782]
The same parts as those shown in the block diagram of FIG. 11 are denoted by the same reference numerals, and the description thereof is omitted.
[0783]
The input image is supplied to the
[0784]
Based on the input image, the mixture
[0785]
FIG. 117 is a block diagram illustrating an example of the configuration of the mixture
[0786]
The estimated mixture
[0787]
Based on the input image, the estimated mixture
[0788]
The estimated mixture
[0789]
The foreground /
[0790]
FIG. 118 is a block diagram illustrating an example of the configuration of the foreground /
[0791]
The same parts as those in the foreground /
[0792]
Based on the region information supplied from the
[0793]
The
[0794]
The
[0795]
As described above, the image processing apparatus having the configuration shown in FIG. 116 includes a background area image, an uncovered background area background component image, an uncovered background area foreground component image, a covered background area background component image, and a covered area image. For each of the foreground component image in the background area and the image in the foreground area, processing can be executed corresponding to each property.
[0796]
As described above, in the image processing apparatus of the present invention, the background region image, the background component image in the uncovered background region, the foreground component image in the uncovered background region, the background component image in the covered background region, and the covered back Since the input image is separated into the foreground component image in the ground region and the image in the foreground region, and processing suitable for the separated image is executed, for example, an image with higher resolution is generated.
[0797]
Note that the direction of movement of the foreground object has been described from left to right, but it is needless to say that the direction is not limited thereto.
[0798]
In the above, the case where the image of the real space having the three-dimensional space and the time axis information is projected onto the time space having the two-dimensional space and the time axis information by using a video camera is taken as an example. However, the present invention is not limited to this example, and it is possible to apply a case where more first information of the first dimension is projected onto second information of a smaller second dimension.
[0799]
The sensor is not limited to the CCD, and may be a solid-state image sensor, for example, a sensor such as BBD (Bucket Brigade Device), CID (Charge Injection Device), or CPD (Charge Priming Device). The sensor is not limited to a sensor arranged in a matrix, and may be a sensor in which detection elements are arranged in a line.
[0800]
As shown in FIG. 10, a recording medium recording a program for performing signal processing according to the present invention is distributed to provide a program to a user separately from a computer. (Including a registered trademark) disc, optical disc 92 (including compact disc-read only memory (CD-ROM), DVD (digital versatile disc)), and magneto-optical disc 93 (including MD (mini-disc) (trademark)) ), Or a
[0801]
In the present specification, the step of describing the program recorded on the recording medium is not limited to the processing performed in chronological order according to the described order, but is not necessarily performed in chronological order. It also includes processes that are executed individually.
[0802]
【The invention's effect】
According to the image processing apparatus and method, the recording medium, and the program of the present invention, the mixed region in which the foreground object component constituting the foreground object and the background object component constituting the background object are mixed based on the input image data. And a foreground area made up of foreground object components and a non-mixed area made up of one of the background areas made up of background object components that make up the background object, and area identification information corresponding to the identification result is output, Corresponding to the specific information, at least in the mixed region, the input image data is separated into the foreground object component and the background object component, and the foreground object component and the background object component are individually processed according to the separation result. So that the background image and the moving object Corresponding mixes with the image it is possible to process the image.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration of a conventional image processing apparatus.
FIG. 2 is a diagram illustrating class taps.
FIG. 3 is a diagram illustrating a prediction tap.
FIG. 4 is a diagram for explaining an outline of class classification adaptation processing;
FIG. 5 is a diagram illustrating a conventional coefficient set.
FIG. 6 is a flowchart illustrating a conventional learning process.
FIG. 7 is a block diagram illustrating a configuration of a conventional image processing apparatus.
FIG. 8 is a diagram illustrating a pixel value of an input image and a pixel value of an output image generated by the class classification adaptation process.
FIG. 9 is a flowchart illustrating a conventional image creation process.
FIG. 10 is a block diagram showing a configuration of an embodiment of an image processing apparatus according to the present invention.
FIG. 11 is a block diagram illustrating a functional configuration of the image processing apparatus.
FIG. 12 is a diagram illustrating imaging by a sensor.
FIG. 13 is a diagram illustrating an arrangement of pixels.
FIG. 14 is a diagram illustrating the operation of a detection element.
FIG. 15 is a diagram illustrating an image obtained by imaging an object corresponding to a moving foreground and an object corresponding to a stationary background.
FIG. 16 is a diagram illustrating a background area, a foreground area, a mixed area, a covered background area, and an uncovered background area.
FIG. 17 is a model diagram in which pixel values of pixels arranged in a row adjacent to each other in an image obtained by capturing an object corresponding to a stationary foreground and an object corresponding to a stationary background are developed in the time direction; It is.
FIG. 18 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 19 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 20 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 21 is a diagram illustrating an example in which pixels in a foreground area, a background area, and a mixed area are extracted.
FIG. 22 is a diagram illustrating a correspondence between a pixel and a model in which pixel values are expanded in the time direction.
FIG. 23 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 24 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 25 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 26 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 27 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 28 is a diagram illustrating a correspondence between a separated image and a model diagram in which pixel values of pixels are developed in the time direction.
FIG. 29 is a diagram illustrating an example of a divided image.
FIG. 30 is a diagram illustrating an example of a separated image.
FIG. 31 is a flowchart illustrating image processing of the image processing apparatus according to the present invention.
32 is a block diagram illustrating an example of a configuration of a
FIG. 33 is a diagram illustrating an image when an object corresponding to the foreground is moving.
FIG. 34 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 35 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 36 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 37 is a diagram for explaining region determination conditions;
FIG. 38 is a diagram illustrating an example of the result of specifying an area by the
FIG. 39 is a diagram illustrating an example of a result of specifying a region by the
FIG. 40 is a flowchart illustrating an area specifying process.
41 is a block diagram illustrating another example of the configuration of the
FIG. 42 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 43 is a diagram illustrating an example of an image of a background area.
44 is a block diagram showing a configuration of a binary object
FIG. 45 is a diagram illustrating calculation of correlation values.
FIG. 46 is a diagram illustrating calculation of correlation values.
FIG. 47 is a diagram illustrating an example of a binary object image.
48 is a block diagram showing a configuration of a time
49 is a diagram for describing determination by an
FIG. 50 is a diagram illustrating an example of determination by the time
FIG. 51 is a flowchart for describing region specifying processing by the
FIG. 52 is a flowchart illustrating details of a region determination process.
53 is a block diagram showing still another configuration of the
54 is a block diagram illustrating the configuration of a
FIG. 55 is a diagram for explaining motion compensation by a
[Fig. 56] Fig. 56 is a diagram for describing motion compensation by a
FIG. 57 is a flowchart illustrating an area specifying process.
FIG. 58 is a flowchart for describing the details of the robust processing.
59 is a block diagram illustrating an example of a configuration of a mixture
FIG. 60 is a diagram illustrating an example of an ideal mixing ratio α.
FIG. 61 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 62 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 63 is a diagram for explaining approximation using the correlation of foreground components.
FIG. 64 is a diagram for explaining the relationship between C, N, and P;
65 is a block diagram showing a configuration of an estimated mixture
FIG. 66 is a diagram illustrating an example of an estimated mixture ratio.
67 is a block diagram showing another configuration of the mixture
FIG. 68 is a flowchart illustrating processing for calculating a mixture ratio.
FIG. 69 is a flowchart illustrating processing for calculating an estimated mixture ratio.
FIG. 70 is a diagram illustrating a straight line approximating the mixture ratio α.
FIG. 71 is a diagram illustrating a plane that approximates the mixture ratio α.
FIG. 72 is a diagram for explaining the correspondence of pixels of a plurality of frames when calculating the mixture ratio α.
73 is a block diagram illustrating another configuration of the mixture ratio
FIG. 74 is a diagram illustrating an example of an estimated mixture ratio.
FIG. 75 is a flowchart illustrating a process for calculating a mixture ratio.
[Fig. 76] Fig. 76 is a flowchart for describing processing of mixture ratio estimation using a model corresponding to a covered background region.
77 is a block diagram illustrating an exemplary configuration of a foreground /
78 is a diagram illustrating an input image, a foreground area image, a background area image, a foreground component image, and a background component image; FIG.
FIG. 79 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 80 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 81 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
82 is a block diagram illustrating an exemplary configuration of a
FIG. 83 is a flowchart for describing foreground and background separation processing;
Fig. 84 is a block diagram illustrating a configuration of a separated
FIG. 85 is a diagram illustrating the relationship between a teacher image and a student image.
86 is a block diagram showing a configuration of a learning unit 714. FIG.
87 is a diagram for describing class classification processing; FIG.
FIG. 88 is a diagram for explaining ADRC processing;
FIG. 89 is a diagram illustrating a coefficient set generated by the separated
FIG. 90 is a flowchart for describing learning processing for generating a coefficient set by the separated image processing unit;
Fig. 91 is a flowchart for describing processing for generating a coefficient set corresponding to a background region.
FIG. 92 is a block diagram illustrating a configuration of a separated image processing unit that executes class classification adaptation processing to generate a higher resolution image in the spatial direction.
93 is a block diagram showing a configuration of a
FIG. 94 is a diagram illustrating an example of an image in a mixed region of teacher images.
FIG. 95 is a diagram showing an example of a mixed region image generated by conventional class classification adaptation processing;
FIG. 96 is a diagram showing an example of a mixed region image generated by the image processing apparatus according to the present invention.
FIG. 97 is a diagram illustrating an example of an image in a foreground area of a teacher image.
FIG. 98 is a diagram illustrating an example of an image in the foreground area generated by the conventional class classification adaptation process.
FIG. 99 is a diagram showing an example of an image in the foreground area generated by the image processing apparatus according to the present invention.
FIG. 100 is a flowchart illustrating an image creation process performed by a separated image processing unit.
Fig. 101 is a flowchart for describing prediction processing of an image corresponding to a background region.
FIG. 102 is a block diagram illustrating a configuration of a separated image processing unit that applies edge enhancement processing with different effects for each region.
103 is a block diagram illustrating a configuration of an
Fig. 104 is a diagram for describing edge enhancement processing;
FIG. 105 is a diagram illustrating filter coefficients.
106 is a diagram for explaining the operation of the high-
FIG. 107 is a diagram illustrating filter coefficients.
108 is a diagram for explaining the operation of the high-
109 is a block diagram illustrating another configuration of the
FIG. 110 is a diagram illustrating filter coefficients.
111 is a diagram illustrating the operation of the
FIG. 112 is a diagram illustrating filter coefficients.
113 is a diagram for explaining the operation of a
FIG. 114 is a diagram for describing processing of a separated image processing unit.
FIG. 115 is a flowchart for describing edge enhancement processing by the separated
Fig. 116 is a block diagram illustrating another configuration of the functions of the image processing device.
117 is a block diagram illustrating an example of a configuration of a mixture
118 is a block diagram illustrating an example of a configuration of a foreground /
[Explanation of symbols]
71 CPU, 72 ROM, 73 RAM, 76 input section, 77 output section, 78 storage section, 79 communication section, 91 magnetic disk, 92 optical disk, 93 magneto-optical disk, 94 semiconductor memory, 101 object extraction section, 102 motion detection section , 103 region specifying unit, 104 mixing ratio calculating unit, 105 foreground / background separating unit, 106 separated image processing unit, 201 frame memory, 202-1 to 202-4 static motion determining unit, 203-1 to 203-3 region determining unit , 204 determination flag storage frame memory, 205 synthesis unit, 206 determination flag storage frame memory, 301 background region image generation unit, 302 binary object image extraction unit, 303 time change detection unit, 321 correlation value calculation unit, 322 threshold Value processing unit, 341 frame Mori, 342 region determination unit, 361 robust unit, 381 motion compensation unit, 382 switch, 383-1 to 383-N frame memory, 384-1 to 384-N weighting unit, 385 integration unit, 401 estimation mixture ratio processing unit , 402 Estimated mixing ratio processing unit, 403 Mixing ratio determination unit, 421 Frame memory, 422 Frame memory, 423 Mixing ratio calculation unit, 441 Selection unit, 442 Estimated mixing ratio processing unit, 443 Estimated mixing ratio processing unit, 444 Selection unit, 501 delay circuit, 502 addition unit, 503 operation unit, 601 separation unit, 602 switch, 603 switch, 621 frame memory, 622 separation processing block, 631 uncovered region processing unit, 632 covered region processing unit, 701 background region teacher image Frame memory, 702 Uncovered background area background component teacher image frame memory, 703 Uncovered background area foreground component teacher image frame memory, 704 Covered background area background component teacher image frame memory, 705 Covered background area foreground component teacher image Frame memory, 706 foreground area teacher image frame memory, 707-1 to 707-6 weighted average unit, 708 background area student image frame memory, 709 uncovered background area background component student image frame memory, 710 uncovered background area foreground Component Student Image Frame Memory, 711 Covered Background Area Background Component Student Image Frame Memory, 712 Covered Background Area Area foreground component student image frame memory, 713 foreground area student image frame memory, 714-1 to 714-6 learning unit, 715 coefficient set memory, 731 class classification unit, 732 prediction tap acquisition unit, 733 corresponding pixel acquisition unit, 734 normal Equation generation unit, 735 coefficient calculation unit, 751 class tap acquisition unit, 752 waveform classification unit, 801 background region frame memory, 802 uncovered background region background component image frame memory, 803 uncovered background region foreground component image frame memory, 804 Covered background area background component image frame memory, 805 Covered background area foreground component image frame memory, 806 Foreground area frame memory, 807-1 to 807-6 Ping unit, 808 coefficient set memory, 809 synthesis unit, 831 mapping processing unit, 841 class classification unit, 842 prediction tap acquisition unit, 843 prediction calculation unit, 851 class tap acquisition unit, 852 waveform classification unit, 901 background area frame memory, 902 Uncovered background area background component image frame memory, 903 Uncovered background area foreground component image frame memory, 904 Covered background area background component image frame memory, 905 Covered background area foreground component image frame memory, 906 Foreground area frame Memory, 907-1 to 907-6 edge enhancement unit, 908 synthesis unit, 921 high-pass filter, 922 gain adjustment unit, 923 addition unit, 941 Ruta
Claims (5)
前記入力画像の画素ごとの、所定フレームと、前記所定フレームの1つ前のフレームとの間の動きの有無、および前記所定フレームと、前記所定フレームの1つ後のフレームとの間の動きの有無に基づいて、前記画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前記前景オブジェクト成分と前記背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定手段と、
前記領域情報により、前記入力画像の画素が前記混合領域であると特定されている場合、前記混合領域の前記画素における前記前景オブジェクト成分と前記背景オブジェクト成分の混合の割合を示す混合比を基に、前記混合領域を、前記前景オブジェクト成分からなる混合前景領域と、前記背景オブジェクト成分からなる混合背景領域とに分離する分離手段と、
前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に、クラス分類適応処理を実行することにより、出力画像を生成する処理手段と
を備え、
前記処理手段は、前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に、
前記入力画像の画素を、順次、注目画素とし、
前記入力画像から求められる高解像度の予測画像における、前記注目画素に対応する所定数の画素である予測タップを構成する画素と乗算される予測係数のセットを取得し、
前記入力画像から、前記注目画素を含む所定数の画素であるクラスタップを取得し、
前記クラスタップに基づいて、前記注目画素を複数のクラスのうちのいずれかに分類し、
分類された前記クラスを基に、前記注目画素に対応する前記予測タップを取得し、
前記予測タップを構成する画素と前記予測係数の線形結合演算を行うことで、前記予測画像における画素の画素値を求めるクラス分類適応処理を実行し、
前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に求められた前記画素値を合成することで、前記出力画像を生成する
画像処理装置。 In an image processing apparatus that processes input images of successive frames imaged by an imaging device having a predetermined number of pixels having a time integration effect,
Presence / absence of movement between a predetermined frame and a frame immediately before the predetermined frame, and movement between the predetermined frame and a frame immediately after the predetermined frame, for each pixel of the input image Based on the presence or absence, the foreground area consisting only of the foreground object component constituting the foreground object, the background area consisting only of the background object component constituting the background object, or the foreground object component and the background object An area specifying means for specifying which area of the mixed area is a mixture of components, and generating area information indicating the specifying result ; and
When the region information specifies that the pixel of the input image is the mixed region, based on a mixing ratio indicating a mixing ratio of the foreground object component and the background object component in the pixel of the mixed region. Separating means for separating the mixed area into a mixed foreground area composed of the foreground object component and a mixed background area composed of the background object component ;
The foreground area, the background area, the mixed foreground area, and the mixed background for each region, by performing classification adaptive processing, and processing means for generating an output image,
The processing means is provided for each of the foreground area, the background area, the mixed foreground area, and the mixed background area.
The pixels of the input image are sequentially set as target pixels,
Obtaining a set of prediction coefficients to be multiplied with pixels constituting a prediction tap, which is a predetermined number of pixels corresponding to the target pixel, in a high-resolution prediction image obtained from the input image;
From the input image, obtain a class tap that is a predetermined number of pixels including the pixel of interest,
Based on the class tap, classify the pixel of interest into one of a plurality of classes,
Based on the classified class, obtain the prediction tap corresponding to the pixel of interest,
By performing a linear combination operation of the pixels constituting the prediction tap and the prediction coefficient, a class classification adaptive process is performed to obtain a pixel value of the pixel in the prediction image,
The output image is generated by combining the pixel values obtained for each of the foreground area, the background area, the mixed foreground area, and the mixed background area.
Image processing device.
前記分離手段は、前記領域情報により、前記入力画像の画素が前記カバードバックグラウンド領域であると特定されている場合、前記カバードバックグラウンド領域の前記画素における前記前景オブジェクト成分と前記背景オブジェクト成分の混合の割合を示す混合比を基に、前記カバードバックグラウンド領域を、前記前景オブジェクト成分からなるカバードバックグラウンド前景領域と、前記背景オブジェクト成分からなるカバードバックグラウンド背景領域とに分離するとともに、前記入力画像の画素が前記アンカバードバックグラウンド領域であると特定されている場合、前記アンカバードバックグラウンド領域の前記画素における前記前景オブジェクト成分と前記背景オブジェクト成分の混合の割合を示す混合比を基に、前記アンカバードバックグラウンド領域を、前記前景オブジェクト成分からなるアンカバードバックグラウンド前景領域と、前記背景オブジェクト成分からなるアンカバードバックグラウンド背景領域とに分離し、
前記処理手段は、前記前景領域、前記背景領域、前記カバードバックグラウンド前景領域、前記カバードバックグラウンド背景領域、前記アンカバードバックグラウンド前景領域、および前記アンカバードバックグラウンド背景領域毎に、クラス分類適応処理を実行することにより、出力画像を生成する
ことを特徴とする請求項1に記載の画像処理装置。The region specifying means includes, for each pixel of the input image, presence / absence of movement between a predetermined frame and a frame immediately before the predetermined frame, and the predetermined frame and a frame immediately after the predetermined frame. In the mixed area, a covered background area formed on the front end side in the movement direction of the foreground object and an uncovered area formed on the rear end side in the movement direction of the foreground object in the mixed area. Identify the background area further , generate area information indicating the result of the identification,
When the pixel of the input image is specified as the covered background region by the region information, the separating unit is a mixture of the foreground object component and the background object component in the pixel of the covered background region. The covered background area is separated into a covered background foreground area composed of the foreground object component and a covered background background area composed of the background object component, and the input image Is determined to be the uncovered background area, based on a mixing ratio indicating a mixing ratio of the foreground object component and the background object component in the pixel of the uncovered background area, Ann Bird background area, separated and the uncovered background foreground area consisting of the foreground object components and on the uncovered background background area consisting of the background object components,
The processing means performs class classification adaptive processing for each of the foreground area, the background area, the covered background foreground area, the covered background background area, the uncovered background foreground area, and the uncovered background background area. The image processing apparatus according to claim 1 , wherein an output image is generated by executing
前記入力画像の画素ごとの、所定フレームと、前記所定フレームの1つ前のフレームとの間の動きの有無、および前記所定フレームと、前記所定フレームの1つ後のフレームとの間の動きの有無に基づいて、前記画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前記前景オブジェクト成分と前記背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定ステップと、
前記領域情報により、前記入力画像の画素が前記混合領域であると特定されている場合、前記混合領域の前記画素における前記前景オブジェクト成分と前記背景オブジェクト成分の混合の割合を示す混合比を基に、前記混合領域を、前記前景オブジェクト成分からなる混合前景領域と、前記背景オブジェクト成分からなる混合背景領域とに分離する分離ステップと、
前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に、クラス分類適応処理を実行することにより、出力画像を生成する処理ステップと
を含み、
前記処理ステップは、前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に、
前記入力画像の画素を、順次、注目画素とし、
前記入力画像から求められる高解像度の予測画像における、前記注目画素に対応する所定数の画素である予測タップを構成する画素と乗算される予測係数のセットを取得し、
前記入力画像から、前記注目画素を含む所定数の画素であるクラスタップを取得し、
前記クラスタップに基づいて、前記注目画素を複数のクラスのうちのいずれかに分類し、
分類された前記クラスを基に、前記注目画素に対応する前記予測タップを取得し、
前記予測タップを構成する画素と前記予測係数の線形結合演算を行うことで、前記予測画像における画素の画素値を求めるクラス分類適応処理を実行し、
前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に求められた前記画素値を合成することで、前記出力画像を生成する
画像処理方法。 In an image processing method for processing an input image of successive frames imaged by an imaging device having a predetermined number of pixels having a time integration effect,
Presence / absence of movement between a predetermined frame and a frame immediately before the predetermined frame, and movement between the predetermined frame and a frame immediately after the predetermined frame, for each pixel of the input image Based on the presence or absence, the foreground area consisting only of the foreground object component constituting the foreground object, the background area consisting only of the background object component constituting the background object, or the foreground object component and the background object An area specifying step for specifying which area of the mixed area is a mixture of components, and generating area information indicating the specified result ;
When the region information specifies that the pixel of the input image is the mixed region, based on a mixing ratio indicating a mixing ratio of the foreground object component and the background object component in the pixel of the mixed region. Separating the mixed area into a mixed foreground area composed of the foreground object component and a mixed background area composed of the background object component ;
The foreground area, the background area, the mixed foreground area, and the mixed background for each region, by performing classification adaptive processing, and a processing step of generating an output image,
The processing step is performed for each of the foreground area, the background area, the mixed foreground area, and the mixed background area.
The pixels of the input image are sequentially set as target pixels,
Obtaining a set of prediction coefficients to be multiplied with pixels constituting a prediction tap, which is a predetermined number of pixels corresponding to the target pixel, in a high-resolution prediction image obtained from the input image;
From the input image, obtain a class tap that is a predetermined number of pixels including the pixel of interest,
Based on the class tap, classify the pixel of interest into one of a plurality of classes,
Based on the classified class, obtain the prediction tap corresponding to the pixel of interest,
By performing a linear combination operation of the pixels constituting the prediction tap and the prediction coefficient, a class classification adaptive process is performed to obtain a pixel value of the pixel in the prediction image,
An image processing method for generating the output image by combining the pixel values obtained for each of the foreground region, the background region, the mixed foreground region, and the mixed background region .
前記入力画像の画素ごとの、所定フレームと、前記所定フレームの1つ前のフレームとの間の動きの有無、および前記所定フレームと、前記所定フレームの1つ後のフレームとの間の動きの有無に基づいて、前記画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前記前景オブジェクト成分と前記背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定ステップと、
前記領域情報により、前記入力画像の画素が前記混合領域であると特定されている場合、前記混合領域の前記画素における前記前景オブジェクト成分と前記背景オブジェクト成分の混合の割合を示す混合比を基に、前記混合領域を、前記前景オブジェクト成分からなる混合前景領域と、前記背景オブジェクト成分からなる混合背景領域とに分離する分離ステップと、
前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に、クラス分類適応処理を実行することにより、出力画像を生成する処理ステップと
を含む処理を実行させ、
前記処理ステップは、前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に、
前記入力画像の画素を、順次、注目画素とし、
前記入力画像から求められる高解像度の予測画像における、前記注目画素に対応する所定数の画素である予測タップを構成する画素と乗算される予測係数のセットを取得し、
前記入力画像から、前記注目画素を含む所定数の画素であるクラスタップを取得し、
前記クラスタップに基づいて、前記注目画素を複数のクラスのうちのいずれかに分類し、
分類された前記クラスを基に、前記注目画素に対応する前記予測タップを取得し、
前記予測タップを構成する画素と前記予測係数の線形結合演算を行うことで、前記予測画像における画素の画素値を求めるクラス分類適応処理を実行し、
前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に求められた前記画素値を合成することで、前記出力画像を生成する
プログラムを記録したコンピュータ読み取り可能な記録媒体。To a computer that processes an input image of consecutive frames imaged by an imaging device having a predetermined number of pixels having a time integration effect,
Presence / absence of movement between a predetermined frame and a frame immediately before the predetermined frame, and movement between the predetermined frame and a frame immediately after the predetermined frame, for each pixel of the input image Based on the presence or absence, the foreground area consisting only of the foreground object component constituting the foreground object, the background area consisting only of the background object component constituting the background object, or the foreground object component and the background object An area specifying step for specifying which area of the mixed area is a mixture of components, and generating area information indicating the specified result ;
When the region information specifies that the pixel of the input image is the mixed region, based on a mixing ratio indicating a mixing ratio of the foreground object component and the background object component in the pixel of the mixed region. Separating the mixed area into a mixed foreground area composed of the foreground object component and a mixed background area composed of the background object component ;
Executing a class classification adaptive process for each of the foreground area, the background area, the mixed foreground area, and the mixed background area, thereby executing a process including:
The processing step is performed for each of the foreground area, the background area, the mixed foreground area, and the mixed background area.
The pixels of the input image are sequentially set as target pixels,
Obtaining a set of prediction coefficients to be multiplied with pixels constituting a prediction tap, which is a predetermined number of pixels corresponding to the target pixel, in a high-resolution prediction image obtained from the input image;
From the input image, obtain a class tap that is a predetermined number of pixels including the pixel of interest,
Based on the class tap, classify the pixel of interest into one of a plurality of classes,
Based on the classified class, obtain the prediction tap corresponding to the pixel of interest,
By performing a linear combination operation of the pixels constituting the prediction tap and the prediction coefficient, a class classification adaptive process is performed to obtain a pixel value of the pixel in the prediction image,
The output image is generated by combining the pixel values obtained for each of the foreground area, the background area, the mixed foreground area, and the mixed background area.
A computer-readable recording medium on which a program is recorded .
前記入力画像の画素ごとの、所定フレームと、前記所定フレームの1つ前のフレームとの間の動きの有無、および前記所定フレームと、前記所定フレームの1つ後のフレームとの間の動きの有無に基づいて、前記画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前記前景オブジェクト成分と前記背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定ステップと、
前記領域情報により、前記入力画像の画素が前記混合領域であると特定されている場合、前記混合領域の前記画素における前記前景オブジェクト成分と前記背景オブジェクト成分の混合の割合を示す混合比を基に、前記混合領域を、前記前景オブジェクト成分からなる混合前景領域と、前記背景オブジェクト成分からなる混合背景領域とに分離する分離ステップと、
前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に、クラス分類適応処理を実行することにより、出力画像を生成する処理ステップと
を含む処理を実行させ、
前記処理ステップは、前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に、
前記入力画像の画素を、順次、注目画素とし、
前記入力画像から求められる高解像度の予測画像における、前記注目画素に対応する所定数の画素である予測タップを構成する画素と乗算される予測係数のセットを取得し、
前記入力画像から、前記注目画素を含む所定数の画素であるクラスタップを取得し、
前記クラスタップに基づいて、前記注目画素を複数のクラスのうちのいずれかに分類し、
分類された前記クラスを基に、前記注目画素に対応する前記予測タップを取得し、
前記予測タップを構成する画素と前記予測係数の線形結合演算を行うことで、前記予測画像における画素の画素値を求めるクラス分類適応処理を実行し、
前記前景領域、前記背景領域、前記混合前景領域、および前記混合背景領域毎に求められた前記画素値を合成することで、前記出力画像を生成する
プログラム。To a computer that processes an input image of successive frames imaged by an imaging device having a predetermined number of pixels having a time integration effect,
Presence / absence of movement between a predetermined frame and a frame immediately before the predetermined frame, and movement between the predetermined frame and a frame immediately after the predetermined frame, for each pixel of the input image Based on the presence or absence, the foreground area consisting only of the foreground object component constituting the foreground object, the background area consisting only of the background object component constituting the background object, or the foreground object component and the background object An area specifying step for specifying which area of the mixed area is a mixture of components, and generating area information indicating the specified result ;
When the region information specifies that the pixel of the input image is the mixed region, based on a mixing ratio indicating a mixing ratio of the foreground object component and the background object component in the pixel of the mixed region. Separating the mixed area into a mixed foreground area composed of the foreground object component and a mixed background area composed of the background object component ;
Executing a class classification adaptive process for each of the foreground area, the background area, the mixed foreground area, and the mixed background area, thereby executing a process including:
The processing step is performed for each of the foreground area, the background area, the mixed foreground area, and the mixed background area.
The pixels of the input image are sequentially set as target pixels,
Obtaining a set of prediction coefficients to be multiplied with pixels constituting a prediction tap, which is a predetermined number of pixels corresponding to the target pixel, in a high-resolution prediction image obtained from the input image;
From the input image, obtain a class tap that is a predetermined number of pixels including the pixel of interest,
Based on the class tap, classify the pixel of interest into one of a plurality of classes,
Based on the classified class, obtain the prediction tap corresponding to the pixel of interest,
By performing a linear combination operation of the pixels constituting the prediction tap and the prediction coefficient, a class classification adaptive process is performed to obtain a pixel value of the pixel in the prediction image,
The program which produces | generates the said output image by synthesize | combining the said pixel value calculated | required for the said foreground area | region, the said background area | region, the said mixing foreground area | region, and the said mixing background area | region .
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001181394A JP4596211B2 (en) | 2001-06-15 | 2001-06-15 | Image processing apparatus and method, recording medium, and program |
CA002419636A CA2419636A1 (en) | 2001-06-15 | 2002-06-13 | Image processing apparatus and method, and image pickup apparatus |
EP02738673A EP1396819A4 (en) | 2001-06-15 | 2002-06-13 | Image processing apparatus and method, and image pickup apparatus |
PCT/JP2002/005876 WO2002103636A1 (en) | 2001-06-15 | 2002-06-13 | Image processing apparatus and method, and image pickup apparatus |
US10/344,568 US7715643B2 (en) | 2001-06-15 | 2002-06-13 | Image processing apparatus and method, and image pickup apparatus |
CNB028028511A CN1248164C (en) | 2001-06-15 | 2002-06-13 | Image procesisng apparatus and method, and image pickup apparatus |
KR1020037002170A KR100859381B1 (en) | 2001-06-15 | 2002-06-13 | Image processing apparatus and method, and image pickup apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001181394A JP4596211B2 (en) | 2001-06-15 | 2001-06-15 | Image processing apparatus and method, recording medium, and program |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002373335A JP2002373335A (en) | 2002-12-26 |
JP2002373335A5 JP2002373335A5 (en) | 2008-04-24 |
JP4596211B2 true JP4596211B2 (en) | 2010-12-08 |
Family
ID=19021673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001181394A Expired - Fee Related JP4596211B2 (en) | 2001-06-15 | 2001-06-15 | Image processing apparatus and method, recording medium, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4596211B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4596218B2 (en) * | 2001-06-22 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
JP4596217B2 (en) * | 2001-06-22 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
JP4596215B2 (en) * | 2001-06-19 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
JP4596209B2 (en) * | 2001-06-05 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
JP4596216B2 (en) * | 2001-06-20 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
JP4596219B2 (en) * | 2001-06-25 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
KR101739025B1 (en) | 2012-03-13 | 2017-05-24 | 한화테크윈 주식회사 | Method for processing image |
JP6731360B2 (en) * | 2017-02-27 | 2020-07-29 | Kddi株式会社 | Face detection device and program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07336688A (en) * | 1994-06-06 | 1995-12-22 | Nippon Hoso Kyokai <Nhk> | Uncoveered area detecting method |
JPH10164436A (en) * | 1996-12-04 | 1998-06-19 | Sony Corp | Device and method for detecting contour and generating key signal |
JP2000030040A (en) * | 1998-07-14 | 2000-01-28 | Canon Inc | Image processor and computer readable recording medium |
JP4491965B2 (en) * | 1999-12-28 | 2010-06-30 | ソニー株式会社 | Signal processing apparatus and method, and recording medium |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4329195B2 (en) * | 1999-12-28 | 2009-09-09 | チッソ株式会社 | Polyorganosiloxane |
KR20010057579A (en) * | 1999-12-23 | 2001-07-04 | 맥켈러 로버트 루이스 | Silicone polyether copolymers useful for making polyurethane flexible molded foams |
JP2001181396A (en) * | 1999-12-24 | 2001-07-03 | Jsr Corp | Siloxane modified polymeric particle and manufacturing method |
JP4972247B2 (en) * | 1999-12-28 | 2012-07-11 | 日立化成工業株式会社 | Flame retardant thermosetting resin composition, prepreg using the same, and laminate for electric wiring board |
JP2001181398A (en) * | 1999-12-28 | 2001-07-03 | Dow Corning Toray Silicone Co Ltd | Silicon-containing polymer and manufacturing method |
-
2001
- 2001-06-15 JP JP2001181394A patent/JP4596211B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07336688A (en) * | 1994-06-06 | 1995-12-22 | Nippon Hoso Kyokai <Nhk> | Uncoveered area detecting method |
JPH10164436A (en) * | 1996-12-04 | 1998-06-19 | Sony Corp | Device and method for detecting contour and generating key signal |
JP2000030040A (en) * | 1998-07-14 | 2000-01-28 | Canon Inc | Image processor and computer readable recording medium |
JP4491965B2 (en) * | 1999-12-28 | 2010-06-30 | ソニー株式会社 | Signal processing apparatus and method, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP2002373335A (en) | 2002-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100859381B1 (en) | Image processing apparatus and method, and image pickup apparatus | |
JP4596212B2 (en) | Image processing apparatus and method, recording medium, and program | |
KR100846261B1 (en) | Image processing device, image processing method, recording medium and image pick up device | |
CA2418810C (en) | Image processing apparatus and method and image pickup apparatus | |
JP4596222B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4596220B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4596221B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4596224B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4106874B2 (en) | Image processing apparatus and method, and recording medium | |
JP4596203B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4596213B2 (en) | Image processing apparatus and method, recording medium, and program | |
KR100875780B1 (en) | Image processing apparatus and method, and imaging device | |
JP4596223B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4596214B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4660980B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4596211B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4596215B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4660979B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4150949B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4596225B2 (en) | Image processing apparatus and method, recording medium, and program | |
KR100895744B1 (en) | Image processing apparatus, method and recording medium, and image pickup apparatus | |
JP4333183B2 (en) | Image processing apparatus and method, recording medium, and program | |
JP4325252B2 (en) | Image processing apparatus and method, recording medium, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080307 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20100518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100826 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100908 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131001 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |