JP5577793B2 - 画像処理装置および方法、並びにプログラム - Google Patents

画像処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP5577793B2
JP5577793B2 JP2010079189A JP2010079189A JP5577793B2 JP 5577793 B2 JP5577793 B2 JP 5577793B2 JP 2010079189 A JP2010079189 A JP 2010079189A JP 2010079189 A JP2010079189 A JP 2010079189A JP 5577793 B2 JP5577793 B2 JP 5577793B2
Authority
JP
Japan
Prior art keywords
area
subject
image
frame
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010079189A
Other languages
English (en)
Other versions
JP2011211631A (ja
Inventor
雅也 木下
豊 米田
敬 亀谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010079189A priority Critical patent/JP5577793B2/ja
Priority to TW100107255A priority patent/TW201204024A/zh
Priority to PCT/JP2011/001547 priority patent/WO2011121917A1/en
Priority to CN201180015023.4A priority patent/CN102812699B/zh
Priority to EP11762170.6A priority patent/EP2553920B1/en
Priority to EP19156002.8A priority patent/EP3512191A1/en
Priority to KR1020127024675A priority patent/KR101677315B1/ko
Priority to BR112012023987A priority patent/BR112012023987A2/pt
Priority to US13/636,203 priority patent/US8964038B2/en
Priority to RU2012140422/08A priority patent/RU2012140422A/ru
Publication of JP2011211631A publication Critical patent/JP2011211631A/ja
Application granted granted Critical
Publication of JP5577793B2 publication Critical patent/JP5577793B2/ja
Priority to US14/558,027 priority patent/US9509903B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/37Determination of transform parameters for the alignment of images, i.e. image registration using transform domain methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/64Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B15/00Special procedures for taking photographs; Apparatus therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/155Segmentation; Edge detection involving morphological operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/269Analysis of motion using gradient-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/579Depth or shape recovery from multiple images from motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/635Region indicators; Field of view indicators

Description

本発明は、画像処理装置および方法、並びにプログラムに関し、特に、ベストショット画像を得るようにする画像処理装置および方法、並びにプログラムに関する。
近年、デジタルスチルカメラ等の撮像装置において、被写体である人の顔を検出し、その顔の表情を検出する表情検出機能を備えることにより、被写体の顔の表情が笑顔であることを検出したときに、自動的に撮像画像を記録する技術が提案されている(特許文献1参照)。
特許第4197019号公報
しかしながら、特許文献1においては、シャッタのトリガは顔の表情のみであり、顔以外の被写体の状態の変化、例えば、走っている人が転んだ瞬間や、動き回る子供が止まった瞬間等を、自動的に撮像画像として記録することはできなかった。また、特許文献1の技術は、人以外の、表情を持たない被写体には適用することができなかった。
本発明は、このような状況に鑑みてなされたものであり、特に、より確実にベストショット画像を得るようにするものである。
本発明の第1の側面の画像処理装置は、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段とを備え、前記判定手段は、注目する前記被写体としての人物の領域である人物領域の幅と、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比が、フレーム間で、所定の閾値より大きく変化したか否かを判定し、前記特定手段は、前記判定手段により前記人物領域の幅と前記顔領域の高さとの比が、フレーム間で、前記所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する
前記画像処理装置には、被写体を撮像する撮像手段をさらに設け、前記特定手段には、前記判定手段により前記被写体領域の形状の変化が判定された前記フレームの画像を特定し、前記撮像手段に、特定した前記フレームの画像の撮像を指示させることができる。
本発明の第1の側面の画像処理方法は、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段とを備える画像処理装置の画像処理方法であって、前記判定手段が、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定ステップと、前記特定手段が、前記判定ステップの処理により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定ステップとを含み、前記判定ステップの処理は、注目する前記被写体としての人物の領域である人物領域の幅と、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比が、フレーム間で、所定の閾値より大きく変化したか否かを判定し、前記特定ステップの処理は、前記判定ステップの処理により前記人物領域の幅と前記顔領域の高さとの比が、フレーム間で、前記所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する
本発明の第1の側面のプログラムは、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定ステップと、前記判定ステップの処理により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定ステップとを含む処理をコンピュータに実行させ、前記判定ステップの処理は、注目する前記被写体としての人物の領域である人物領域の幅と、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比が、フレーム間で、所定の閾値より大きく変化したか否かを判定し、前記特定ステップの処理は、前記判定ステップの処理により前記人物領域の幅と前記顔領域の高さとの比が、フレーム間で、前記所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する
本発明の第1の側面においては、注目する被写体としての人物の領域である人物領域の幅と、人物領域に含まれる、人物の顔の領域である顔領域の高さとの比が、フレーム間で、所定の閾値より大きく変化したか否かが判定され、人物領域の幅と顔領域の高さとの比が、フレーム間で、所定の閾値より大きく変化したと判定されたときのフレームの画像が特定される
本発明の第2の側面の画像処理装置は、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段とを備え、前記判定手段は、矩形領域としての前記被写体領域の縦横比が、所定数フレーム間変化していないか否かを判定し、前記特定手段は、前記判定手段により前記被写体領域の縦横比が、所定数フレーム間変化していないと判定されたときのフレームの画像を特定する。
前記画像処理装置には、被写体を撮像する撮像手段をさらに設け、前記特定手段には、前記判定手段により前記被写体領域の形状の変化が判定された前記フレームの画像を特定させ、前記撮像手段に、特定した前記フレームの画像の撮像を指示させることができる。
本発明の第2の側面の画像処理方法は、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段とを備える画像処理装置の画像処理方法において、前記判定手段が、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定ステップと、前記特定手段が、前記判定ステップの処理により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定ステップとを含み、前記判定ステップの処理は、矩形領域としての前記被写体領域の縦横比が、所定数フレーム間変化していないか否かを判定し、前記特定ステップの処理は、前記判定ステップの処理により前記被写体領域の縦横比が、所定数フレーム間変化していないと判定されたときのフレームの画像を特定する。
本発明の第2の側面においては、矩形領域としての被写体領域の縦横比が、所定数フレーム間変化していないか否かが判定され、被写体領域の縦横比が、所定数フレーム間変化していないと判定されたときのフレームの画像が特定される。
本発明の第3の側面においては、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段とを備え、前記判定手段は、矩形領域としての前記被写体領域の縦横比が、1フレーム毎のフレーム間で、所定の閾値より大きく変化したか否かを判定し、前記特定手段は、前記判定手段により前記被写体領域の縦横比が、1フレーム毎のフレーム間で、前記所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する。
前記画像処理装置には、被写体を撮像する撮像手段をさらに設け、前記特定手段には、前記判定手段により前記被写体領域の形状の変化が判定された前記フレームの画像を特定させ、前記撮像手段には、特定した前記フレームの画像の撮像を指示させることができる。
前記画像処理装置には、前記複数フレームの画像における前記被写体領域の位置を検出する検出手段をさらに設け、前記判定手段には、前記検出手段により、前記被写体領域の位置が所定の領域内にあることが検出された場合に、矩形領域としての前記被写体領域の縦横比が、1フレーム毎のフレーム間で、所定の閾値より大きく変化したか否かを判定させ、前記特定手段には、前記判定手段により前記被写体領域の縦横比が、1フレーム毎のフレーム間で、所定の閾値より大きく変化したと判定されたときのフレームの画像を特定させることができる。
本発明の第3の側面の画像処理方法は、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段とを備える画像処理装置の画像処理方法であって、前記判定手段が、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定ステップと、前記特定手段が、前記判定ステップの処理により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定ステップとを含み、前記判定ステップの処理は、矩形領域としての前記被写体領域の縦横比が、1フレーム毎のフレーム間で、所定の閾値より大きく変化したか否かを判定し、前記特定ステップの処理は、前記判定ステップの処理により前記被写体領域の縦横比が、1フレーム毎のフレーム間で、前記所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する。
本発明の第3の側面においては、矩形領域としての被写体領域の縦横比が、1フレーム毎のフレーム間で、所定の閾値より大きく変化したか否かが判定され、被写体領域の縦横比が、1フレーム毎のフレーム間で、所定の閾値より大きく変化したと判定されたときのフレームの画像が特定される。
本発明の第の側面の画像処理装置は、連続する複数フレームの画像において、注目する前記被写体としての人物の領域である人物領域の高さと、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比と、予め決められた目標値とを比較する比較手段と、前記比較手段による比較の結果、前記人物領域の高さと前記顔領域の高さとの比と、前記目標値との差が、所定の閾値より小さいとされたフレームの画像を特定する特定手段とを備える。
本発明の第の側面の画像処理方法は、連続する複数フレームの画像において、注目する前記被写体としての人物の領域である人物領域の高さと、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比と、予め決められた目標値とを比較する比較手段と、前記比較手段による比較の結果、前記人物領域の高さと前記顔領域の高さとの比と、前記目標値との差が、所定の閾値より小さいとされたフレームの画像を特定する特定手段とを備える画像処理装置の画像処理方法であって、前記比較手段が、連続する複数フレームの画像において、注目する前記被写体としての人物の領域である人物領域の高さと、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比と、予め決められた目標値とを比較する比較ステップと、前記特定手段が、前記比較ステップの処理による比較の結果、前記人物領域の高さと前記顔領域の高さとの比と、前記目標値との差が、所定の閾値より小さいとされたフレームの画像を特定する特定ステップとを含む画像処理方法。
本発明の第の側面においては、連続する複数フレームの画像において、注目する被写体としての人物の領域である人物領域の高さと、人物領域に含まれる、人物の顔の領域である顔領域の高さとの比と、予め決められた目標値とが比較され、比較の結果、人物領域の高さと顔領域の高さとの比と、目標値との差が、所定の閾値より小さいとされたフレームの画像が特定される。
本発明の一側面によれば、より確実にベストショット画像を得ることが可能となる。
本発明を適用した画像処理装置の一実施の形態の構成例を示すブロック図である。 被写体追尾部の構成例を示すブロック図である。 被写体マップ生成部の構成例を示すブロック図である。 被写体候補領域矩形化部の構成例を示すブロック図である。 被写体領域選択部の構成例を示すブロック図である。 被写体追尾処理について説明するフローチャートである。 被写体マップ生成処理について説明するフローチャートである。 被写体マップ生成処理の具体例を示す図である。 被写体候補領域矩形化処理について説明するフローチャートである。 被写体候補領域矩形化処理の具体例を示す図である。 被写体領域選択処理について説明するフローチャートである。 帯域特徴量マップの被写体領域特徴量和について説明する図である。 重み係数について説明する図である。 制御部の機能構成例を示すブロック図である。 自動シャッタ処理について説明するフローチャートである。 被写体領域の縦横比の変化について説明する図である。 制御部の他の機能構成例を示すブロック図である。 自動シャッタ処理について説明するフローチャートである。 制御部のさらに他の機能構成例を示すブロック図である。 自動シャッタ処理について説明するフローチャートである。 所定領域内における被写体領域の縦横比の変化について説明する図である。 画像処理装置の他の構成例を示すブロック図である。 図22の制御部の機能構成例を示すブロック図である。 自動シャッタ処理について説明するフローチャートである。 被写体領域と顔領域との比の変化について説明する図である。 制御部の他の機能構成例を示すブロック図である。 自動シャッタ処理について説明するフローチャートである。 被写体領域と顔領域との比の変化について説明する図である。 画像処理装置のさらに他の構成例を示すブロック図である。 図29の制御部の機能構成例を示すブロック図である。 フレーム特定処理について説明するフローチャートである。 コンピュータのハードウェアの構成例を示すブロック図である。
以下、本発明の実施の形態について図を参照して説明する。
[画像処理装置の構成例]
図1は、本発明を適用した画像処理装置の一実施の形態の構成例を示す図である。
画像処理装置11は、例えば、動きのある被写体を撮像するデジタルビデオカメラや、デジタルスチルカメラなどの撮像装置に備えられる。
画像処理装置11は、光学系31、イメージャ32、デジタル信号処理部33、表示部34、制御部35、レンズ駆動部36、インタフェース制御部37、およびユーザインタフェース38から構成される。
光学系31は、図示せぬ撮像レンズを含む光学系として構成される。光学系31に入射した光は、CCD(Charge Coupled Device)等の撮像素子で構成されるイメージャ32により光電変換される。イメージャ32により光電変換された電気信号(アナログ信号)は、図示せぬA/D(Analog to Digital)変換部によりデジタル信号の画像データに変換され、デジタル信号処理部33に供給される。
デジタル信号処理部33は、イメージャ32からの画像データに対して、所定の信号処理を施す。デジタル信号処理部33は、前処理部51、デモザイク処理部52、YC生成部53、解像度変換部54、被写体追尾部55、およびCODEC56を備えている。
前処理部51は、前処理として、イメージャ32からの画像データに対し、R,G,Bの黒レベルを所定のレベルにクランプするクランプ処理や、R,G,Bの色チャンネル間の補正処理等を施す。デモザイク処理部52は、前処理部51により前処理された画像データに対し、画像データの各画素がR,G,B全ての色成分を有するように、画素の色成分を補完するデモザイク処理を施す。
YC生成部53は、デモザイク処理部52によりデモザイク処理された、R,G,Bの画像データから、輝度(Y)信号および色(C)信号を生成(分離)する。解像度変換部54は、YC生成部53で処理された画像データに対して、解像度変換処理を実行する。
被写体追尾部55は、YC生成部53によって生成された輝度信号および色信号からなる画像データを基に、画像データに対応する入力画像における被写体を検出し、追尾する被写体追尾処理を実行する。
ここで、被写体の検出は、ユーザが入力画像を一瞥した場合に、ユーザが注目すると推
定される入力画像上の物体、つまりユーザが目を向けると推定される物体が被写体であるとして行われる。したがって、被写体は必ずしも人物に限られる訳ではない。
被写体追尾部55は、被写体追尾処理の結果得られた、入力画像における被写体が含まれる領域を表す被写体枠についてのデータを制御部35に供給する。なお、被写体追尾部55の詳細については、図2を参照して後述する。
CODEC56は、YC生成部53または解像度変換部54で生成された画像データや、DRAM40に記録された画像データを必要に応じて符号化し、図示せぬ記録メディアに記録させたり、符号化された画像データを復号したりする。CODEC56で復号された画像データ、または解像度変換部54で得られた画像データは、表示部34に供給されて表示される。表示部34は、例えば液晶ディスプレイなどからなり、制御部35の制御に従ってデジタル信号処理部33から供給された画像データに対応する入力画像を表示する。
制御部35は、インタフェース制御部37から供給される制御信号に応じて、画像処理装置11の各部を制御する。
例えば、制御部35は、デジタル信号処理部33に、各種の信号処理に用いられるパラメータ等を供給するとともに、デジタル信号処理部33からの、各種の信号処理の結果得られたデータを取得し、インタフェース制御部37に供給する。
また、制御部35は、被写体追尾部55からの、入力画像における被写体が含まれる領域を表す被写体枠についてのデータに基づいて、表示部34に表示されている入力画像上に、被写体枠を表示させる。
さらに、制御部35は、光学系31を構成する撮像レンズを駆動させたり、絞りなどを調節させたりするための制御信号をレンズ駆動部36に供給する。また、制御部35は、イメージャ32による入力画像の撮像を制御する。
ユーザインタフェース38は、ユーザが画像処理装置11に対する指示を入力するときに操作されるボタンやレバー、スイッチ、マイクロホン等の入力装置、ユーザに対して情報を提示するランプやスピーカ等の出力装置などから構成される。
例えば、ユーザインタフェース38は、ユーザインタフェース38としてのボタンが操作されると、その操作に応じた制御信号を、インタフェース制御部37を介して制御部35に供給する。
[被写体追尾部の構成例]
次に、図2を参照して、図1の被写体追尾部55の構成例について説明する。
図2の被写体追尾部55は、被写体マップ生成部71、被写体候補領域矩形化部72、被写体領域選択部73、および重み係数算出部74から構成される。
被写体マップ生成部71は、入力画像が有する輝度や色等の特徴毎に、入力画像の所定フレームの所定領域における特徴量を示す特徴量マップを生成し、重み係数算出部74に供給する。また、被写体マップ生成部71は、生成した特徴量マップと、重み係数算出部74から供給される特徴量毎の重み係数とに基づいて、入力画像における被写体の領域らしさを示す被写体マップを生成する。
より具体的には、被写体マップ生成部71は、特徴毎の特徴量マップの各領域の情報(特徴量)を、同じ位置にある領域毎に重み付き加算して被写体マップを生成する。被写体マップ生成部71は、生成した被写体マップを被写体候補領域矩形化部72に供給する。
なお、各特徴量マップにおいて、より情報量の多い領域、つまり特徴量の多い領域に対応する入力画像上の領域は、被写体が含まれる可能性のより高い領域となり、したがって、各特徴量マップにより入力画像における被写体の含まれる領域を特定することができる。
被写体候補領域矩形化部72は、被写体マップ生成部71からの被写体マップにおいて、被写体の候補となる領域、すなわち、被写体マップにおける情報量の多い領域を含む矩形領域を求め、その矩形領域の座標を表す座標情報を、被写体領域選択部73に供給する。また、被写体候補領域矩形化部72は、被写体マップ上で座標情報により表される矩形領域に関する情報(以下、領域情報という)を算出し、座標情報に対応付けて被写体領域選択部73に供給する。
被写体領域選択部73は、追尾対象となる、注目すべき被写体が含まれる矩形領域である被写体領域を、被写体候補領域矩形化部72からの領域情報に基づいて矩形領域の中から選択し、その被写体領域の座標情報を制御部35(図1)および重み係数算出部74に供給する。
重み係数算出部74は、被写体マップ生成部71からの所定フレームの各特徴量マップ上の、被写体領域に対応する領域における特徴量のうち、相対的に大きい特徴量に対応する次フレームの特徴量マップを重み付けする重み係数を算出し、被写体マップ生成部71に供給する。
このような構成により、被写体追尾部55は、入力画像のフレーム毎に、被写体領域を表す被写体枠を求めることができる。
[被写体マップ生成部の構成例]
次に、図3を参照して、図2の被写体マップ生成部71の構成例について説明する。
図3の被写体マップ生成部71は、特徴量マップ生成部111、帯域特徴量マップ生成部112、帯域特徴量マップ合成部113、および合成特徴量マップ合成部114から構成される。
特徴量マップ生成部111は、入力画像の所定フレームから、輝度や色といった特徴に関する情報(特徴量)を示す特徴量マップを特徴量毎に生成し、帯域特徴量マップ生成部112に供給する。
帯域特徴量マップ生成部112は、特徴量マップ生成部111からの各特徴量マップにおける特徴量から、所定の帯域成分の特徴量を所定の回数だけ抽出し、抽出したそれぞれの特徴量を示す帯域特徴量マップを生成し、重み係数算出部74および帯域特徴量マップ合成部113に供給する。
帯域特徴量マップ合成部113は、帯域特徴量マップ生成部112からの帯域特徴量マップを、重み係数算出部74からの重み係数に基づいて特徴量毎に合成することで、合成特徴量マップを生成し、重み係数算出部74および合成特徴量マップ合成部114に供給する。
合成特徴量マップ合成部114は、帯域特徴量マップ合成部113からの合成特徴量マップを、重み係数算出部74からの重み係数に基づいて合成することで、被写体マップを生成し、被写体候補領域矩形化部72(図2)に供給する。
ここで、以下においては、上述した帯域特徴量マップおよび合成特徴量マップを、単に、特徴量マップともいう。
[被写体候補領域矩形化部の構成例]
次に、図4を参照して、図2の被写体候補領域矩形化部72の構成例について説明する。
図4の被写体候補領域矩形化部72は、2値化処理部131、ラベリング処理部132、矩形領域座標算出部133、および領域情報算出部134から構成される。
2値化処理部131は、被写体マップ生成部71から供給された被写体マップにおける、入力画像の各画素に対応する情報を、所定の閾値に基づいて0または1のいずれかの値に2値化して、ラベリング処理部132に供給する。ここで、以下においては、被写体マップにおいて、入力画像の各画素に対応する情報を、単に、画素ともいう。
ラベリング処理部132は、2値化処理部131からの、2値化された被写体マップにおいて、1の値である画素が隣接する領域(以下、連結領域という)に対してラベリングし、矩形領域座標算出部133に供給する。
矩形領域座標算出部133は、ラベリング処理部132からの、連結領域がラベリングされた被写体マップにおいて、連結領域を含む(囲む)矩形領域の座標を算出し、その座標を表す座標情報を、被写体マップとともに領域情報算出部134に供給する。
領域情報算出部134は、矩形領域座標算出部133からの被写体マップ上で座標情報により表される矩形領域に関する情報である領域情報を算出し、座標情報に対応付けて被写体領域選択部73(図1)に供給する。
[被写体領域選択部の構成例]
次に、図5を参照して、被写体領域選択部73の構成例について説明する。
図5の被写体領域選択部73は、領域情報比較部151および被写体領域決定部152から構成される。
領域情報比較部151は、被写体候補領域矩形化部72からの各矩形領域の領域情報と、領域情報記憶部153に記憶されている1フレーム前の被写体領域の領域情報とを比較し、比較結果を被写体領域決定部252に供給する。
被写体領域決定部152は、領域情報比較部151からの比較結果に基づいて、1フレーム前の被写体領域の領域情報に最も近い領域情報に対応付けられている座標情報で表される矩形領域を被写体領域とする。被写体領域決定部152は、決定した被写体領域の座標情報を制御部35(図1)および重み係数算出部74(図2)に供給するとともに、被写体領域の領域情報を、領域情報記憶部153に供給する。
領域情報記憶部153は、被写体領域決定部152からの、被写体領域の領域情報を記憶する。領域情報記憶部153に記憶された被写体領域の領域情報は、1フレーム後に、領域情報比較部151に読み出される。
[被写体追尾処理]
以下においては、画像処理装置11の被写体追尾処理について説明する。
図6は、画像処理装置11の被写体追尾処理について説明するフローチャートである。被写体追尾処理は、例えば、ボタンとしてのユーザインタフェース38がユーザに操作されることで、画像処理装置11の動作モードが被写体追尾処理を実行する被写体追尾処理モードに遷移し、表示部34に表示されている入力画像において、追尾対象としての被写体の所定領域がユーザにより選択されたときに開始される。
ステップS11において、被写体追尾部55の被写体マップ生成部71は、被写体マップ生成処理を行い、被写体マップを生成して、被写体候補領域矩形化部72に供給する。
[被写体マップ生成処理]
ここで、図7および図8を参照して、被写体マップ生成処理の詳細について説明する。図7は、被写体マップ生成処理について説明するフローチャートであり、図8は、被写体マップ生成処理の具体例を示す図である。
図7のフローチャートのステップS31において、被写体マップ生成部71の特徴量マップ生成部111は、入力画像の所定フレームから、輝度や色等の特徴(特徴量毎)に特徴量マップを生成し、帯域特徴量マップ生成部112に供給する。
具体的には、図8に示されるように、入力画像200から、輝度に関する情報を示す輝度情報マップF、色に関する情報を示す色情報マップF乃至F、エッジに関する情報を示すエッジ情報マップF(K+1)乃至Fの、M種類の特徴量マップが生成される。
輝度情報マップFにおいては、入力画像の各画素から得られる輝度成分(輝度信号)Yが、入力画像の各画素に対応する情報となり、色情報マップF乃至Fにおいては、入力画像の各画素から得られる色成分(色信号)R,G,Bが、入力画像の各画素に対応する情報となる。また、エッジ情報マップF(K+1)乃至Fにおいては、例えば、入力画像の各画素における0度、45度、90度、および135度の方向のエッジ強度が、入力画像の各画素に対応する情報となる。
なお、上述した特徴量マップについて、画素のR,G,Bの各成分の値の平均値を輝度情報マップFの情報(特徴量)としてもよいし、色差成分Cr,Cbや、Lab色空間におけるa*座標成分およびb*座標成分を色情報マップF乃至Fの情報としてもよい。また、0度、45度、90度、および135度以外の方向のエッジ強度をエッジ情報マップF(K+1)乃至Fの情報としてもよい。
ステップS32において、帯域特徴量マップ生成部112は、各特徴量マップにおける特徴量から、所定の帯域成分の特徴量をN回抽出し、抽出したそれぞれの特徴量を示す帯域特徴量マップを生成して、重み係数算出部74および帯域特徴量マップ合成部113に供給する。
具体的には、図8に示されるように、輝度情報マップFにおける輝度情報から、所定の帯域1乃至帯域Nの輝度情報が抽出され、その帯域それぞれの輝度情報を示す帯域輝度情報マップR11乃至R1Nが生成される。また、色情報マップF乃至Fにおける色情報から、所定の帯域1乃至帯域Nの色情報が抽出され、その帯域それぞれの色情報を示す帯域色情報マップR21乃至R2N,…,RK1乃至RKNが生成される。さらに、エッジ情報マップF(K+1)乃至Fにおけるエッジ情報から、所定の帯域1乃至帯域Nのエッジ情報が抽出され、その帯域それぞれのエッジ情報を示す帯域エッジ情報マップR(K+1)1乃至R(K+1)N,…,RM1乃至RMNが生成される。このように、帯域特徴量マップ生成部112は、(M×N)種類の帯域特徴量マップを生成する。
ここで、帯域特徴量マップ生成部112の処理の一例について説明する。
例えば、帯域特徴量マップ生成部112は、各特徴量マップを用いて、互いに解像度の異なる複数の特徴量マップを生成し、それらの特徴量マップをその特徴量のピラミッド画像とする。例えば、レベルL1乃至レベルL8までの8つの解像度の階層のピラミッド画像が生成され、レベルL1のピラミッド画像が最も解像度が高く、レベルL1からレベルL8まで順番にピラミッド画像の解像度が低くなるものとする。
この場合、特徴量マップ生成部111により生成された特徴量マップが、レベルL1のピラミッド画像とされる。また、レベルLi(但し、1≦i≦7)のピラミッド画像における、互いに隣接する4つの画素の画素値の平均値が、それらの画素と対応するレベルL(i+1)のピラミッド画像の1つの画素の画素値とされる。したがって、レベルL(i+1)のピラミッド画像は、レベルLiのピラミッド画像に対して縦横半分(割り切れない場合は切り捨て)の画像となる。
また、帯域特徴量マップ生成部112は、複数のピラミッド画像のうち、互いに階層の異なる2つのピラミッド画像を選択し、選択したピラミッド画像の差分を求めて各特徴量の差分画像をN枚生成する。なお、各階層のピラミッド画像は、それぞれ大きさ(画素数)が異なるので、差分画像の生成時には、より小さい方のピラミッド画像が、より大きいピラミッド画像に合わせてアップコンバートされる。
例えば、帯域特徴量マップ生成部112は、各階層の特徴量のピラミッド画像のうち、レベルL6およびレベルL3、レベルL7およびレベルL3、レベルL7およびレベルL4、レベルL8およびレベルL4、並びにレベルL8およびレベルL5の各階層の組み合わせのピラミッド画像の差分を求める。これにより、合計5つの特徴量の差分画像が得られる。
具体的には、例えば、レベルL6およびレベルL3の組み合わせの差分画像が生成される場合、レベルL6のピラミッド画像が、レベルL3のピラミッド画像の大きさに合わせてアップコンバートされる。つまり、アップコンバート前のレベルL6のピラミッド画像の1つの画素の画素値が、その画素に対応する、アップコンバート後のレベルL6のピラミッド画像の互いに隣接するいくつかの画素の画素値とされる。そして、レベルL6のピラミッド画像の画素の画素値と、その画素と同じ位置にあるレベルL3のピラミッド画像の画素の画素値との差分が求められ、その差分が差分画像の画素の画素値とされる。
このように、差分画像を生成することで、特徴量マップにバンドパスフィルタを用いたフィルタ処理を施すように、特徴量マップから所定の帯域成分の特徴量を抽出することができる。
なお、以上の説明において、特徴量マップから抽出される帯域の幅は、差分画像を求める際の、ピラミッド画像の各階層の組み合わせによって決まるが、この組み合わせは任意に決定される。
また、所定の帯域成分の特徴量の抽出は、上述した差分画像による手法に限らず、他の手法を用いるようにしてもよい。
図7のフローチャートに戻り、ステップS33において、帯域特徴量マップ合成部113は、帯域特徴量マップ生成部112からの帯域特徴量マップを、重み係数算出部74からの重み係数群Wに基づいて特徴量毎に合成する。帯域特徴量マップ合成部113は、合成した帯域特徴量マップ(合成特徴量マップ)を、重み係数算出部74および合成特徴量マップ合成部114に供給する。
具体的には、図8に示されるように、帯域輝度情報マップR11乃至R1Nは、重み係数算出部74からの帯域輝度情報マップ毎の重みである重み係数w11乃至w1Nにより重み付き加算され、合成特徴量マップCが求められる。また、帯域色情報マップR21乃至R2N,…,RK1乃至RKNは、重み係数算出部74からの帯域色情報マップ毎の重みである重み係数w21乃至w2N,…,wK1乃至wKNにより重み付き加算され、合成特徴量マップC乃至Cが求められる。さらに、帯域エッジ情報マップR(K+1)1乃至R(K+1)N,…,RM1乃至RMNは、重み係数算出部74からの帯域エッジ情報マップ毎の重みである重み係数w(K+1)1乃至w(K+1)N,…,wM1乃至wMNにより重み付き加算され、合成特徴量マップCK+1乃至Cが求められる。このように、帯域特徴量マップ合成部113は、M種類の合成特徴量マップを生成する。なお、重み係数群Wの詳細については後述するが、重み係数群Wの各重み係数は、0乃至1の値を有する。但し、1回目の被写体マップ生成処理においては、重み係数群Wの各重み係数は全て1とされ、帯域特徴量マップは、重みなしで加算される。
ステップS34において、合成特徴量マップ合成部114は、帯域特徴量マップ合成部113からの合成特徴量マップを、重み係数算出部74からの重み係数群Wに基づいて合成することで、被写体マップを生成し、被写体候補領域矩形化部72に供給する。
具体的には、図8に示されるように、合成特徴量マップC乃至Cは、重み係数算出部74からの帯域輝度情報マップ毎の重みである重み係数w乃至wを用いて線形結合される。さらに、線形結合の結果得られたマップの画素値に、予め求められた重みである被写体重みが乗算され正規化されて、被写体マップ201を求める。なお、重み係数群Wの詳細については後述するが、重み係数群Wの各重み係数は、0乃至1の値を有する。但し、1回目の被写体マップ生成処理においては、重み係数群Wの各重み係数は全て1とされ、合成特徴量マップは、重みなしで線形結合される。
つまり、これから求めようとする被写体マップ上の注目する位置(画素)を注目位置とすると、各合成特徴量マップの注目位置と同じ位置(画素)の画素値に、合成特徴量マップごとの重み係数が乗算され、重み係数の乗算された画素値の総和が、注目位置の画素値とされる。さらに、このようにして求められた被写体マップの各位置の画素値に、被写体マップに対して予め求められた被写体重みが乗算されて正規化され、最終的な被写体マップとされる。例えば、正規化は、被写体マップの各画素の画素値が、0から255までの間の値となるようになされる。
以上のようにして、被写体マップ生成部71は、特徴量マップから、帯域特徴量マップおよび合成特徴量マップを生成することにより、被写体マップを生成する。
図6のフローチャートに戻り、ステップS12において、被写体候補領域矩形化部72は、被写体候補領域矩形化処理を行い、被写体マップ生成部71からの被写体マップにおいて、被写体の候補となる領域を含む矩形領域を求める。
[被写体候補領域矩形化処理]
ここで、図9および図10を参照して、被写体候補領域矩形化処理の詳細について説明する。図9は、被写体候補領域矩形化処理について説明するフローチャートであり、図10は、被写体候補領域矩形化処理の具体例を示す図である。
図9のフローチャートのステップS51において、被写体候補領域矩形化部72の2値化処理部131は、被写体マップ生成部71から供給された被写体マップにおける情報を、所定の閾値に基づいて0または1のいずれかの値に2値化し、ラベリング処理部132に供給する。
より具体的には、2値化処理部131は、図10の上から1番目に示される、0から255までの間の値である被写体マップ201の各画素の画素値に対して、例えば、閾値127より小さい値の画素値を0とし、127より大きい値の画素値を1とする。これによって、図10の上から2番目に示されるような2値化マップ202が得られる。図10で示される2値化マップ202においては、白で示される部分(画素)が1の画素値を有し、黒で示される部分(画素)が0の画素値を有している。なお、ここでは、閾値を127であるものとしたが、他の値であってもよい。
ステップS52において、ラベリング処理部132は、2値化処理部131から2値化マップ202(2値化された被写体マップ)において、例えば、モルフォロジー演算等によって得られる、1である画素値の画素が隣接する連結領域に対してラベリングし、矩形領域座標算出部133に供給する。
より具体的には、例えば、図10の上から3番目に示されるように、2値化マップ202においては、連結領域211が、ラベル「1」でラベリングされ、連結領域212が、ラベル「2」でラベリングされる。
ステップS53において、矩形領域座標算出部133は、ラベリング処理部132からの2値化マップ202において、連結領域を含む(囲む)矩形領域の座標を算出し、その座標を表す座標情報を、2値化マップ202とともに領域情報算出部134に供給する。
より具体的には、図10の上から4番目に示されるように、2値化マップ202において、ラベル「1」でラベリングされた連結領域211を外側から囲む矩形枠(外接枠)221が検出され、その矩形枠の、例えば図中左上および右下の頂点の座標が求められる。また、ラベル「2」でラベリングされた連結領域212を外側から囲む矩形枠222が検出され、その矩形枠の、例えば図中左上および右下の頂点の座標が求められる。
ステップS54において、領域情報算出部134は、矩形領域座標算出部133からの座標情報と、被写体マップ生成部71からの被写体マップに基づいて、被写体マップ上で矩形枠に囲まれる矩形領域についての領域情報を算出する。
より具体的には、領域情報算出部134は、2値化マップ202における矩形枠221,222を表す、矩形領域座標算出部133からの座標情報に基づいて、矩形枠のサイズおよび中心位置の座標を、矩形領域についての領域情報として算出する。領域情報算出部134は、算出した領域情報を、矩形領域座標算出部133からの座標情報に対応付けて被写体領域選択部73に供給する。
以上のようにして、被写体候補領域矩形化部72は、被写体マップにおいて、注目すべき被写体の候補となる各領域を囲む矩形枠、および、被写体マップ上でその矩形枠で囲まれる領域の特徴を表す領域情報を求める。
図6のフローチャートに戻り、ステップS13において、被写体領域選択部73は、被写体領域選択処理を行い、注目すべき被写体が含まれる矩形領域である被写体領域を、被写体領域選択部73からの領域情報に基づいて矩形領域の中から選択する。
[被写体領域選択処理]
ここで、図11のフローチャートを参照して、被写体領域選択処理の詳細について説明する。
ステップS71において、領域情報比較部151は、被写体候補領域矩形化部72からの各矩形領域の領域情報と、領域情報記憶部153に記憶されている1フレーム前の被写体領域の領域情報とを比較し、比較結果を被写体領域決定部152に供給する。
より具体的には、例えば、領域情報比較部151は、被写体候補領域矩形化部72からの、被写体マップ上での各矩形領域を囲む矩形枠のサイズと、領域情報記憶部153に記憶されている1フレーム前の被写体領域を囲む矩形枠(被写体枠)のサイズとを比較する。また、例えば、領域情報比較部151は、被写体候補領域矩形化部72からの、被写体マップ上での各矩形領域を囲む矩形枠の中心位置の座標と、領域情報記憶部153に記憶されている1フレーム前の被写体領域を囲む矩形枠(被写体枠)の中心位置の座標とを比較する。
ステップS72において、被写体領域決定部152は、領域情報比較部151からの比較結果に基づいて、1フレーム前の被写体領域を囲む矩形枠(被写体枠)のサイズまたは中心位置の座標に最も近い矩形枠のサイズまたは中心位置を有する矩形領域を被写体領域とする。被写体領域決定部152は、決定した被写体領域の座標情報を制御部35および重み係数算出部74に供給するとともに、被写体領域の領域情報(被写体枠のサイズまたは中心位置)を、領域情報記憶部153に供給する。
但し、1回目の被写体領域選択処理において、領域情報記憶部153には、1フレーム前の被写体領域の領域情報は記憶されていないので、被写体追尾処理の開始時にユーザによって選択された被写体の所定領域(以下、初期選択領域という)を含む矩形領域が被写体領域とされる。
以上のようにして、被写体領域選択部73は、被写体の候補となる矩形領域の中から、注目すべき被写体の被写体領域を選択する。
[重み係数の算出]
図6のフローチャートに戻り、ステップS14において、重み係数算出部74は、被写体マップ生成部71からの帯域特徴量マップおよび合成特徴量マップと、被写体領域選択部73からの被写体領域を表す座標情報とに基づいて、図8で示された重み係数群W,Wを算出する。
より具体的には、図12に示されるように、所定の帯域特徴量マップRmn(1≦m≦M,1≦n≦N)上の、被写体領域を表す被写体枠231に対応する矩形領域内の特徴量(情報量)の和を被写体領域特徴量和rmnとした場合、図13の上側に示されるような重み係数群Wが算出される。
図13の重み係数群Wにおける係数のそれぞれは、図8で示された重み係数w11乃至wMNのそれぞれに対応している。なお、図13において、Max[a,…,z]は、値a乃至zのうちの最大値を表すものとする。
例えば、図13の重み係数群Wにおける上から1番目の行の各係数は、図8で示された、「帯域1」である特徴量毎の帯域特徴量マップR11乃至RM1についての重み係数w11乃至wM1を示している。図13に示されるように、重み係数w11乃至wM1は、分母が帯域特徴量マップR11乃至RM1それぞれについての被写体領域特徴量和r11乃至rM1のうちの最大値とされ、分子が帯域特徴量マップR11乃至RM1それぞれについての被写体領域特徴量和r11乃至rM1とされる係数であり、0乃至1の値をとる。
同様に、図13の重み係数群Wにおける上からN番目の行の各係数は、図8で示された、「帯域N」である特徴量毎の帯域特徴量マップR1N乃至RMNについての重み係数w1N乃至wMNを示している。図13に示されるように、重み係数w1N乃至wMNは、分母が帯域特徴量マップR1N乃至RMNそれぞれについての被写体領域特徴量和r1N乃至rMNのうちの最大値とされ、分子が帯域特徴量マップR1N乃至RMNそれぞれについての被写体領域特徴量和r1N乃至rMNとされる係数であり、0乃至1の値をとる。
すなわち、重み係数w1n乃至wMnによれば、「帯域n」である特徴量毎の帯域特徴量マップR1n乃至RMnにおいて、被写体領域特徴量和が最大となる特徴量の帯域特徴量マップに最大値1となる重み付けがされ、その他の帯域特徴量マップには、被写体領域特徴量和に応じた重み付けがされる。
また、所定の合成特徴量マップC(1≦m≦M)上の、被写体領域を表す矩形枠221に対応する矩形領域内の特徴量(情報量)の和を被写体領域特徴量和cとした場合、図13の下側に示されるような重み係数群Wが算出される。
図13の重み係数群Wにおける係数のそれぞれは、図8で示された重み係数w乃至wのそれぞれに対応している。
つまり、図13の重み係数群Wにおける各係数は、図8で示された、特徴量毎の合成特徴量マップC乃至Cについての重み係数w乃至wを示している。図13に示されるように、重み係数w乃至wは、分母が合成特徴量マップC乃至Cそれぞれについての被写体領域特徴量和c乃至cのうちの最大値とされ、分子が合成特徴量マップC乃至Cそれぞれについての被写体領域特徴量和c乃至cとされる係数であり、0乃至1の値をとる。
すなわち、重み係数w乃至wによれば、特徴量毎の合成特徴量マップC乃至Cにおいて、被写体領域特徴量和が最大となる特徴量の合成特徴量マップに最大値1となる重み付けがされ、その他の帯域特徴量マップには、被写体領域特徴量和に応じた重み付けがされる。
重み係数算出部74は、算出した重み係数群Wを、被写体マップ生成部71の帯域特徴量マップ合成部113に供給するとともに、重み係数群Wを、被写体マップ生成部71の合成特徴量マップ合成部114に供給する。図6のフローチャートにおいては、ステップS14の後、次フレームについての被写体追尾処理が実行され、この処理が1フレーム毎に繰り返される。
以上の処理によれば、入力画像の所定のフレームについての特徴量毎の特徴量マップにおける、そのフレームで選択された被写体領域に対応する領域の特徴量の相対的な大きさに応じて、次フレームについての特徴量毎の特徴量マップに対する重み係数が決定される。したがって、フレーム間で特徴量が変動するような場合であっても、複数の特徴量のうちの被写体を最もよく表す特徴量の特徴量マップが最も大きく重み付けされた被写体マップが生成されるので、被写体の状態が変動するような環境下でも、被写体をより安定して追尾することが可能となる。
また、被写体領域は、被写体全体を含むように決定されるので、被写体の一部の領域の状態が変動するような環境下でも、被写体をより安定して追尾することができる。
特に、従来の被写体追尾の手法において、被写体領域内のいずれかの座標(またはその座標を含む一部領域)が同定されるような場合では、被写体全体を追尾することができず、AF(Auto Focus)やAE(Auto Exposure)、ACC(Auto Color Control)の検波枠を正しく設定することができなかった。また、被写体領域内で特徴量が同一である同一特徴量領域が同定されるような場合では、上述の場合よりは検波枠を設定する精度を上げることができるが、同一特徴量領域は、被写体領域のごく一部に過ぎないことが多く、十分な検波精度は得られなかった。
一方、上述した被写体追尾処理によれば、被写体全体を含む被写体領域を同定できるので、検波精度を上げることができ、ひいては、追尾結果を様々なアプリケーションに適用することが可能となる。
また、従来の被写体追尾の手法には、例えば、人間の全体像を学習により辞書に登録する等して、人間を検出・追尾するものもあるが、辞書に登録されていない人間以外の被写体を追尾することはできない。さらに、辞書に登録される情報(画像)の量は膨大な量となるため、装置規模が大きくなってしまう。
一方、上述した被写体追尾処理によれば、任意の被写体を検出・追尾することができる上に、辞書等に膨大な量の情報を登録する必要がないので、装置規模をコンパクトにすることができる。
以上においては、特徴量として、輝度成分、色成分、およびエッジ方向を用いるものとしたが、これに限らず、例えば、動き情報等を加えるようにしてもよい。また、用いられる特徴量は、例えば、輝度成分と色成分のような、相補的な関係にあるものが好適であり、適宜、選択されるようにしてもよい。
また、以上においては、M×(N+1)種類の特徴量マップに対応して、M×(N+1)種類の重み係数を算出するようにしたが、一部の特徴量マップに対応する重み係数のみを、適宜算出するようにすることで、画像処理装置11における演算量を抑えることができる。例えば、合成特徴量マップC乃至CのM種類の特徴量マップに対応する重み係数w乃至wのみを算出するようにしてもよい。
さらに、以上においては、領域情報算出部134は、矩形領域の領域情報として、矩形枠のサイズおよび中心位置の座標を算出するようにしたが、矩形領域内の画素値の積分値やピーク値(最大値)を算出するようにしてもよい。この場合、被写体領域選択処理(図11)においては、1フレーム前の被写体領域内の画素値の積分値またはピーク値に最も近い領域内の画素値の積分値またはピーク値を有する矩形領域が被写体領域とされる。
ところで、画像処理装置11が、静止画像を撮像するデジタルスチルカメラとして構成される場合、ユーザは、表示部34に表示されている動画像(ファインダ画像)を確認しながら、所望のタイミングでシャッタ操作を行うことで、静止画像を撮像する。
このように構成される画像処理装置11には、上述した被写体追尾処理の追尾結果を適用したアプリケーションの一例として、ユーザによるシャッタ操作でなく、追尾した被写体の状態の変化に応じて、静止画像を撮像する自動シャッタ処理を実行させることができる。
[制御部の機能構成例]
ここで、図14を参照して、上述した被写体追尾処理によって追尾した被写体の状態の変化に応じて、静止画像を撮像する自動シャッタ処理を実行する制御部35の機能構成例について説明する。
図14の制御部35は、座標情報取得部331、領域形状判定部332、撮像制御部333を備えている。
座標情報取得部331は、被写体追尾部55(図1)から、入力画像の1フレーム毎に供給されてくる被写体領域の座標情報を取得し、領域形状判定部332に供給する。
領域形状判定部332は、座標情報取得部331からの被写体領域の座標情報に基づいて、入力画像のフレーム間での被写体領域の形状の変化を判定する。具体的には、領域形状判定部332は、被写体領域の座標情報で表される、矩形領域としての被写体領域の縦横比の、フレーム間での変化を判定し、判定の結果に応じた情報を、撮像制御部333に供給する。
撮像制御部333は、領域形状判定部332からの情報に基づいて、イメージャ32、デジタル信号処理部33、およびレンズ駆動部36を制御することで、撮像レンズの駆動、絞りの調節、画像データに対する信号処理や図示せぬ記録メディアへの記録等を制御する。すなわち、撮像制御部333は、画像処理装置11による撮像を制御する。
[自動シャッタ処理]
次に、図15のフローチャートを参照して、画像処理装置11による自動シャッタ処理について説明する。
ステップS311において、被写体追尾部55は、図6のフローチャートで説明した被写体追尾処理を実行し、被写体領域の座標情報を制御部35に供給する。
ステップS312において、座標情報取得部331は、被写体追尾部55からの被写体領域の座標情報を取得し、領域形状判定部332に供給する。
ステップS313において、領域形状判定部332は、座標情報取得部331からの被写体領域の座標情報に基づいて、1フレーム毎に、入力画像における被写体領域の縦横比を監視し、フレーム間で、被写体領域の縦横比が所定の閾値より大きく変化したか否かを判定する。
ステップS313において、被写体領域の縦横比が所定の閾値より大きく変化していないと判定された場合、処理はステップS311に戻り、ステップS311乃至S313の処理が繰り返される。
一方、ステップS313において、被写体領域の縦横比が所定の閾値より大きく変化したと判定された場合、領域形状判定部332は、被写体領域の縦横比が所定の閾値より大きく変化した旨の情報を、撮像制御部333に供給する。
例えば、図16の左側に示されるように、(n−1)フレーム目の入力画像において、被写体である子供が駆けていたとする。ここで、(n−1)フレーム目の入力画像における被写体領域を表す被写体枠H(n−1)の高さをHh(n-1)とし、幅をHw(n-1)とすると、被写体領域の縦横比P(n-1)は、Hh(n-1)/Hw(n-1)で表される。
そして、図16の右側に示されるように、nフレーム目の入力画像において、被写体である子供が転倒した場合、nフレーム目の入力画像における被写体領域の縦横比P(n)=Hh(n)/Hw(n)は、(n−1)フレーム目の入力画像における被写体領域の縦横比P(n-1)と比較して変化する。
このとき、領域形状判定部332によって、(n−1)フレーム目の入力画像における被写体領域の縦横比P(n-1)と、nフレーム目の入力画像における被写体領域の縦横比P(n)との差|P(n)-P(n-1)|が、所定の閾値より大きいと判定されると、被写体領域の縦横比が所定の閾値より大きく変化した旨の情報が、撮像制御部333に供給される。
図15のフローチャートに戻り、ステップS314において、撮像制御部333は、領域形状判定部332から、被写体領域の縦横比が所定の閾値より大きく変化した旨の情報が供給されると、イメージャ32、デジタル信号処理部33、およびレンズ駆動部36に、撮像を指示する情報を供給する。これにより、デジタル信号処理部33においては、図16に示されたnフレーム目の入力画像に対応する画像データに対して所定の信号処理が施され、その結果得られた画像データが図示せぬ記録メディアに記録される。
以上の処理によれば、被写体が含まれる被写体領域の縦横比が大きく変化したときに、静止画像が撮像される。これにより、図16を参照して説明したような、子供が転倒した瞬間等の決定的瞬間を逃さずに撮像することができる。また、被写体追尾処理において、被写体として鳥が選択された場合には、その鳥を囲う被写体枠(被写体領域)の縦横比の変化によって、鳥が羽ばたく瞬間等を撮像することができる。このように、人以外の、表情を持たない被写体であっても、より確実にベストショット画像を得ることが可能となる。
なお、上述した説明においては、被写体領域の縦横比を、(被写体領域の高さ)/(被写体領域の幅)で表すようにしたが、(被写体領域の幅)/(被写体領域の高さ)で表わすようにしてもよい。
また、上述した説明においては、フレーム間での、被写体領域の縦横比の変化を判定するようにしたが、単に、フレーム間での、被写体領域の高さや幅の変化を判定するようにしてもよい。
以上においては、被写体の状態が変化したときに静止画像を撮像する構成について説明したが、被写体の状態の変化が停止したときに静止画像を撮像するようにしてもよい。
[制御部の他の機能構成例]
そこで、図17を参照して、被写体の状態の変化が停止したときに静止画像を撮像する画像処理装置11に設けられる制御部35の機能構成例について説明する。
なお、図17の制御部35において、図14の制御部35に設けられたものと同様の機能を備える構成については、同一名称および同一符号を付するものとし、その説明は、適宜省略するものとする。
すなわち、図17の制御部35において、図14の制御部35と異なるのは、領域形状判定部332に代えて、領域形状判定部431を設けた点である。
領域形状判定部431は、座標情報取得部331からの被写体領域の座標情報に基づいて、被写体領域の座標情報で表される、矩形領域としての被写体領域の縦横比の、所定数フレーム間の変化を判定し、判定の結果に応じた情報を、撮像制御部333に供給する。
[自動シャッタ処理]
次に、図18のフローチャートを参照して、図17の制御部35を備える画像処理装置11による自動シャッタ処理について説明する。
なお、図18のフローチャートのステップS411,S412,S414の処理は、図15のフローチャートのステップS311,S312,S314の処理と基本的に同様であるので、その説明は省略する。
すなわち、ステップS413において、領域形状判定部431は、座標情報取得部331からの被写体領域の座標情報に基づいて、1フレーム毎に、入力画像における被写体領域の縦横比を監視し、被写体領域の縦横比が、所定数フレーム間変化していないか否かを判定する。
ステップS413において、被写体領域の縦横比が、所定数フレーム間で変化したと判定された場合、処理はステップS411に戻り、ステップS411乃至S413の処理が繰り返される。
一方、ステップS413において、被写体領域の縦横比が、所定数フレーム間変化していないと判定された場合、領域形状判定部431は、被写体領域の縦横比が所定数フレーム間変化していない旨の情報を、撮像制御部333に供給する。
例えば、(n−q)フレーム目からnフレーム目までのqフレーム間で、被写体領域の縦横比P(n-q),・・・,P(n)の変化の幅がほとんどない場合、すなわち、被写体の状態の変化が停止したとき、被写体領域の縦横比が所定数フレーム間変化していない旨の情報が、撮像制御部333に供給される。これにより、撮像制御部333によってnフレーム目の入力画像の撮像が指示される。
以上の処理によれば、被写体が含まれる被写体領域の縦横比が所定数フレーム間変化していないときに、静止画像が撮像される。これにより、例えば、動き回って立ったりしゃがんだりを繰り返す子供の動作が止まった数秒間を逃さずに撮像することができる。また、被写体追尾処理において、被写体として鳥が選択された場合には、空中で鳥が羽ばたきを止めた数秒間を撮像することができる。このように、人以外の、表情を持たない被写体であっても、より確実にベストショット画像を得ることが可能となる。
以上においては、被写体の状態の変化に応じて静止画像を撮像する構成について説明したが、この構成では、入力画像上の被写体の位置に関わらず撮像されるので、被写体が端の方にいる画像が得られてしまう。このような画像は、決してよい構図の画像とは言えない可能性が高い。
[制御部のさらに他の機能構成例]
そこで、図19を参照して、被写体の位置と、被写体の状態の変化とに応じて静止画像を撮像する画像処理装置11に設けられる制御部35の機能構成例について説明する。
なお、図19の制御部35において、図14の制御部35に設けられたものと同様の機能を備える構成については、同一名称および同一符号を付するものとし、その説明は、適宜省略するものとする。
すなわち、図19の制御部35において、図14の制御部35と異なるのは、位置検出部531を新たに設けた点である。
位置検出部531は、座標情報取得部331からの被写体領域の座標情報に基づいて、入力画像の所定のフレームにおける被写体の位置を検出し、その位置に応じて、座標情報取得部331からの被写体領域の座標情報を、領域形状判定部332に供給する。
[自動シャッタ処理]
次に、図20のフローチャートを参照して、図19の制御部35を備える画像処理装置11による自動シャッタ処理について説明する。
なお、図20のフローチャートのステップS511,S512,S514,S515の処理は、図15のフローチャートのステップS311乃至S314の処理と基本的に同様であるので、その説明は省略する。
すなわち、ステップS513において、位置検出部531は、座標情報取得部331からの被写体領域の座標情報に基づいて、1フレーム毎に、入力画像における被写体領域の位置を監視し、被写体領域の位置が、入力画像における所定領域内にあるか否かを判定する。位置検出部531によって検出される被写体領域の位置は、例えば、矩形領域である被写体領域の4頂点の全ての座標であってもよいし、被写体領域の中心位置の座標であってもよい。また、所定領域は、入力画像において、入力画像の中心付近に設定されるものとする。
ステップS513において、被写体領域の位置が所定領域内にないと判定された場合、処理はステップS511に戻り、ステップS511乃至S513の処理が繰り返される。
一方、ステップS513において、被写体領域の位置が所定領域内にあると判定された場合、位置検出部531は、座標情報取得部331からの被写体領域の座標情報を、領域形状判定部332に供給する。
これにより、図21に示されるように、破線で示される領域A内に被写体領域がある場合に、領域形状判定部332によって、(n−1)フレーム目の入力画像における被写体領域の縦横比P(n-1)と、nフレーム目の入力画像における被写体領域の縦横比P(n)との差|P(n)-P(n-1)|が、所定の閾値より大きいと判定されると、被写体領域の縦横比が所定の閾値より大きく変化した旨の情報が、撮像制御部333に供給され、撮像制御部333によってnフレーム目の入力画像の撮像が指示される。
以上の処理によれば、入力画像上の所定領域内で、被写体が含まれる被写体領域の縦横比が大きく変化したときに、静止画像が撮像される。これにより、図21に示されるような、子供が転倒した瞬間等の決定的瞬間を逃さずに、より良い構図で撮像することができる。また、被写体追尾処理において、被写体として鳥が選択された場合には、その鳥を囲う被写体枠(被写体領域)の縦横比の変化によって、鳥が羽ばたく瞬間等をより良い構図で撮像することができる。このように、人以外の、表情を持たない被写体であっても、より良い構図で、より確実にベストショット画像を得ることが可能となる。
なお、以上においては、入力画像上の所定領域内で、被写体の状態が変化したときに静止画像を撮像する構成について説明したが、図19の制御部35において、領域形状判定部332に代えて、図17の領域形状判定部431を設けることで、入力画像上の所定領域内で、被写体の状態の変化が停止したときに静止画像を撮像するようにもできる。
また、以上においては、所定領域は、入力画像の中心付近に設定されるものとしたが、ユーザにより、入力画像上の任意の位置に設定されるようにもできる。これにより、ユーザの所望の構図の画像を撮像することができるようになる。
以上においては、人物に限られない被写体の状態の変化に応じて静止画像を撮像する構成について説明したが、被写体が人物である場合、人物の顔を検出し、被写体(人物)全体と顔との関係に応じて静止画像を撮像するようにしてもよい。
[画像処理装置の他の構成例]
図22は、被写体としての人物の顔を検出し、被写体(人物)全体と顔との関係に応じて静止画像を撮像するようにした画像処理装置の構成例を示している。
なお、図22の画像処理装置611において、図1の画像処理装置11に設けられたものと同様の機能を備える構成については、同一名称および同一符号を付するものとし、その説明は、適宜省略するものとする。
すなわち、図22の画像処理装置611において、図1の画像処理装置11と異なるのは、デジタル信号処理部33において顔検出部621を新たに設け、制御部35に代えて、制御部622を設けた点である。
顔検出部621は、YC生成部53によって生成された輝度信号および色信号からなる画像データに基づいて、画像データにより表示される入力画像において、被写体追尾部55によって検出された被写体としての人物の被写体領域から顔を検出し、顔の領域(以下、顔領域という)を表す座標情報を制御部622に供給する。
制御部622は、被写体追尾部55からの被写体領域および顔検出部621からの顔領域の座標情報に基づいて、静止画像を撮像する自動シャッタ処理を実行する。
[制御部の機能構成例]
ここで、図23を参照して、制御部622の機能構成例について説明する。
なお、図23の制御部622において、撮像制御部633は、図14の制御部35における撮像制御部333と基本的に同様の機能を有するので、その説明は省略する。
座標情報取得部631は、被写体追尾部55から、入力画像の1フレーム毎に供給されてくる被写体領域の座標情報を取得するとともに、顔検出部621から、入力画像の1フレーム毎に供給されてくる顔領域の座標情報を取得し、領域形状判定部632に供給する。
領域形状判定部632は、座標情報取得部631からの被写体領域および顔領域の座標情報に基づいて、被写体領域と顔領域との比の、フレーム間での変化を判定し、判定の結果に応じた情報を、撮像制御部633に供給する。
[自動シャッタ処理]
次に、図24のフローチャートを参照して、図23の制御部622を備える図22の画像処理装置611による自動シャッタ処理について説明する。
なお、図24のフローチャートのステップS611,S615の処理は、図15のフローチャートのステップS311,S314の処理と基本的に同様であるので、その説明は省略する。
すなわち、ステップS612において、顔検出部621は、入力画像において、被写体追尾部55による被写体追尾処理によって検出された被写体としての人物の被写体領域から顔を検出し、顔領域を表す座標情報を制御部622に供給する。
ステップS613において、座標情報取得部631は、被写体追尾部55および顔検出部621からの被写体領域および顔領域の座標情報を取得し、領域形状判定部632に供給する。
ステップS614において、領域形状判定部632は、座標情報取得部631からの被写体領域および顔領域の座標情報に基づいて、1フレーム毎に、入力画像における被写体領域と顔領域との比を監視し、フレーム間で、被写体領域と顔領域との比が所定の閾値より大きく変化したか否かを判定する。
より具体的には、領域形状判定部632は、座標情報取得部631からの被写体領域および顔領域の座標情報に基づいて、フレーム間で、被写体領域を表す被写体枠Hの幅Hwと顔領域を表す顔枠Fの高さFhとの比Fh/Hwが、所定の閾値より大きく変化したか否かを判定する。
ステップS614において、被写体領域と顔領域との比が所定の閾値より大きく変化していないと判定された場合、処理はステップS611に戻り、ステップS611乃至S614の処理が繰り返される。
一方、ステップS614において、被写体領域と顔領域との比が所定の閾値より大きく変化したと判定された場合、領域形状判定部632は、被写体領域と顔領域との比が所定の閾値より大きく変化した旨の情報を、撮像制御部633に供給する。
例えば、図25の左側に示されるように、(n−1)フレーム目の入力画像において、被写体である子供が駆けていた場合、被写体領域と顔領域との比Q(n-1)は、被写体領域を表す被写体枠H(n−1)の幅Hw(n-1)と、顔領域を表す顔枠F(n−1)の高さFh(n-1)を用いて、Fh(n-1)/Hw(n-1)で表される。
そして、図25の右側に示されるように、nフレーム目の入力画像において、被写体である子供が転倒した場合、nフレーム目の入力画像における被写体領域と顔領域との比Q(n)=Fh(n)/Hw(n)は、(n−1)フレーム目の入力画像における被写体領域と顔領域との比Q(n-1)と比較して変化する。
このとき、領域形状判定部632によって、(n−1)フレーム目の入力画像における被写体領域と顔領域との比Q(n-1)と、nフレーム目の入力画像における被写体領域と顔領域との比Q(n)との差|Q(n)-Q(n-1)|が、所定の閾値より大きいと判定されると、被写体領域と顔領域との比が所定の閾値より大きく変化した旨の情報が、撮像制御部633に供給される。これにより、撮像制御部633によってnフレーム目の入力画像の撮像が指示される。
以上の処理によれば、被写体領域と顔領域との比が大きく変化したときに、静止画像が撮像される。これにより、図25に示されるような、子供が転倒した瞬間等の決定的瞬間を逃さずに撮像することができ、より確実にベストショット画像を得ることが可能となる。
なお、図23の制御部622において、座標情報取得部631の後段に、図19の位置検出部531を設けることで、入力画像上の所定領域内で、被写体領域と顔領域との比が大きく変化したときに静止画像を撮像するようにもできる。
また、以上においては、人物である被写体の被写体領域と、人物の一部である顔の顔領域との比が変化したときに静止画像を撮像するようにしたが、被写体と、その被写体の一部とをそれぞれ検出することができれば、それぞれの領域の比の変化に応じて、人物以外の被写体を撮像するようにもできる。
以上においては、被写体領域と顔領域との比が変化したときに静止画像を撮像する構成について説明したが、被写体領域と顔領域との比が、予め決められた所定値になったときに静止画像を撮像するようにしてもよい。
[制御部の他の機能構成例]
そこで、図26を参照して、被写体領域と顔領域との比が、予め決められた所定値になったときに静止画像を撮像する画像処理装置611に設けられる制御部622の構成例について説明する。
なお、図26の制御部622において、図23の制御部622に設けられたものと同様の機能を備える構成については、同一名称および同一符号を付するものとし、その説明は、適宜省略するものとする。
すなわち、図26の制御部622において、図23の制御部622と異なるのは、領域形状判定部632に代えて、領域比比較部731を設けた点である。
領域比比較部731は、座標情報取得部631からの被写体領域の座標情報に基づいて、入力画像の所定のフレームにおける被写体領域と顔領域との比と、予め決められた目標値とを比較し、比較の結果に応じた情報を撮像制御部633に供給する。なお、目標値は、ユーザによって任意に設定されるようにできる。
[自動シャッタ処理]
次に、図27のフローチャートを参照して、図26の制御部622を備える図22の画像処理装置611による自動シャッタ処理について説明する。
なお、図27のフローチャートのステップS711乃至S713,S715の処理は、図24のフローチャートのステップS611乃至S613,S615の処理と基本的に同様であるので、その説明は省略する。
すなわち、ステップS714において、領域比比較部731は、座標情報取得部631からの被写体領域および顔領域の座標情報に基づいて、入力画像の所定のフレームにおける被写体領域と顔領域との比と、予め決められた目標値とを比較する。
より具体的には、領域比比較部731は、被写体領域および顔領域の座標情報に基づいて、被写体領域と顔領域との比と、目標値との差が所定の閾値より小さいか否かを判定する。
ステップS714において、被写体領域と顔領域との比と、目標値との差が所定の閾値より小さくないと判定された場合、処理はステップS711に戻り、ステップS711乃至S714の処理が繰り返される。
一方、ステップS714において、被写体領域と顔領域との比と、目標値との差が所定の閾値より小さいと判定された場合、すなわち、被写体領域と顔領域との比と目標値とが、同一または略同一になった場合、領域比比較部731は、被写体領域と顔領域との比と、目標値との差が所定の閾値より小さくなった旨の情報を、撮像制御部633に供給する。
例えば、図28の左側に示されるように、pフレーム目の入力画像において、被写体である子供が奥から手前へ駆けているとする。ここで、被写体領域と顔領域との比S(p)は、pフレーム目の入力画像における被写体領域を表す被写体枠H(p)の高さHh(p)と、顔領域を表す顔枠F(p)の高さFh(p)を用いて、Hh(p)/Fh(p)で表される。
そして、図28の右側に示されるように、被写体である子供が、画像処理装置611の至近距離に近づき、Nフレーム目の入力画像において、被写体領域と顔領域との比S(N)=Hh(N)/Fh(N)と目標値との差が、所定の閾値より小さいと判定されると、被写体領域と顔領域との比と、目標値との差が所定の閾値より小さくなった旨の情報が、撮像制御部633に供給される。これにより、撮像制御部633によってNフレーム目の入力画像の撮像が指示される。
以上の処理によれば、被写体領域と顔領域との比と目標値との差が所定の閾値より小さくなったときに、静止画像が撮像される。これにより、図28に示されるような、子供が近づいてきて、撮像範囲における人物の大きさ(いわゆるショット)が、上半身を撮像するバストショットとなった瞬間を撮像することができ、より確実にベストショット画像を得ることが可能となる。
また、目標値を調整することによって、全身像を撮像するフルショットや、顔を撮像するアップショット等、ユーザの好みのショットで、静止画像を撮像することができるようになる。
以上においては、画像処理装置が、静止画像を撮像するデジタルスチルカメラとして構成される場合の処理について説明してきたが、動画像を撮像するデジタルビデオカメラとして構成される場合、画像処理装置には、被写体追尾処理の追尾結果を適用したアプリケーションの一例として、追尾した被写体の状態の変化に応じて、動画像における所定のフレームを特定するフレーム特定処理を実行させることができる。
[画像処理装置のさらに他の構成例]
ここで、図29を参照して、上述した被写体追尾処理によって追尾した被写体の状態の変化に応じて、動画像における所定のフレームを特定するフレーム特定処理を実行する画像処理装置の構成例について説明する。
なお、図29の画像処理装置811において、図1の画像処理装置11に設けられたものと同様の機能を備える構成については、同一名称および同一符号を付するものとし、その説明は、適宜省略するものとする。
すなわち、図29の画像処理装置811において、図1の画像処理装置11と異なるのは、制御部35に代えて、制御部821を設けた点である。
制御部821は、被写体追尾部55からの被写体領域の座標情報に基づいて、動画像における所定のフレームを特定するフレーム特定処理を実行する。
[制御部の機能構成例]
ここで、図30を参照して、制御部821の機能構成例について説明する。
なお、図30の制御部821において、座標情報取得部831および領域形状判定部832は、図14の制御部35における座標情報取得部331および領域形状判定部332と基本的に同様の機能を有するので、その説明は省略する。
フレーム特定部833は、領域形状判定部832からの情報に基づいて、デジタル信号処理部33を制御して、デジタル信号処理部33において信号処理が施され、図示せぬ記録メディアへ記録される入力画像の所定のフレームを特定させる。
[フレーム特定処理]
次に、図31のフローチャートを参照して、図30の制御部821を備える図29の画像処理装置811によるフレーム特定処理について説明する。
なお、図31のフローチャートのステップS811乃至S813の処理は、図15のフローチャートのステップS311乃至S313の処理と基本的に同様であるので、その説明は省略する。
すなわち、ステップS814において、フレーム特定部833は、領域形状判定部832から、被写体領域の縦横比が所定の閾値より大きく変化した旨の情報が供給されると、デジタル信号処理部33を制御し、入力画像に対して、所定のフレームを特定するためのタグを付加させる。これにより、所定のフレームを特定するタグがメタデータとして付加された動画像が、図示せぬ記録メディアに記録される。
以上の処理によれば、被写体が含まれる被写体領域の縦横比が大きく変化したときに、動画像においてフレームを特定するタグが付加される。これにより、記録された動画像を編集する場合などにおいて、子供が転倒した瞬間等の決定的瞬間を、簡単に検索することが可能となる。
なお、以上においては、被写体領域の縦横比が大きく変化したときに、動画像においてフレームを特定する構成について説明したが、図30の制御部821において、領域形状判定部832に代えて、図17の領域形状判定部431を設けることで、入力画像上の所定領域内で、被写体の状態の変化が停止したときに動画像においてフレームを特定するようにもできる。
また、図30の制御部821において、座標情報取得部831の後段に、図19の位置検出部531を設けることで、入力画像上の所定領域内で、被写体の状態が変化したときに動画像においてフレームを特定するようにもできる。
さらに、画像処理装置811のデジタル信号処理部33に、図22の顔検出部621を設け、図30の制御部821において、領域形状判定部832に代えて、図23の領域形状判定部632を設けることで、被写体領域と顔領域との比が大きく変化したときに、動画像においてフレームを特定するようにもできる。
また、被写体領域と顔領域との比が大きく変化したときに、フレーム特定部833が、デジタル信号処理部33に対して、図示せぬ記録メディアへの動画像の記録を開始または終了させる指示を供給するようにしてもよい。
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等に、プログラム記録媒体からインストールされる。
図32は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)901,ROM(Read Only Memory)902,RAM(Random Access Memory)903は、バス904により相互に接続されている。
バス904には、さらに、入出力インタフェース905が接続されている。入出力インタフェース905には、キーボード、マウス、マイクロホン等よりなる入力部906、ディスプレイ、スピーカ等よりなる出力部907、ハードディスクや不揮発性のメモリ等よりなる記憶部908、ネットワークインタフェース等よりなる通信部909、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等のリムーバブルメディア911を駆動するドライブ910が接続されている。
以上のように構成されるコンピュータでは、CPU901が、例えば、記憶部908に記憶されているプログラムを、入出力インタフェース905およびバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU901)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリ等よりなるパッケージメディアであるリムーバブルメディア911に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア911をドライブ910に装着することにより、入出力インタフェース905を介して、記憶部908にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部909で受信し、記憶部908にインストールすることができる。その他、プログラムは、ROM902や記憶部908に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
11 画像処理装置, 34 表示部, 35 制御部, 55 被写体追尾部, 71 被写体マップ生成部, 72 被写体候補領域矩形化部, 73 被写体領域選択部, 74 重み係数算出部, 111 特徴量マップ生成部, 112 帯域特徴量マップ生成部, 113 帯域特徴量マップ合成部, 114 合成特徴量マップ合成部, 131 2値化処理部, 132 ラベリング処理部, 133 矩形領域座標算出部, 134 領域情報算出部, 151 領域情報比較部, 152 被写体領域決定部, 200 入力画像, 201 被写体マップ, 221,222 矩形領域, 231 被写体枠, 332 領域形状判定部, 333 撮像制御部, 431 領域形状判定部, 531 位置検出部, 632 領域形状判定部, 633 撮像制御部, 731 領域比比較部, 832 領域形状判定部, 833 フレーム特定部

Claims (13)

  1. 連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、
    前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段と
    を備え
    前記判定手段は、注目する前記被写体としての人物の領域である人物領域の幅と、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比が、フレーム間で、所定の閾値より大きく変化したか否かを判定し、
    前記特定手段は、前記判定手段により前記人物領域の幅と前記顔領域の高さとの比が、フレーム間で、前記所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する
    画像処理装置。
  2. 被写体を撮像する撮像手段をさらに備え、
    前記特定手段は、前記判定手段により前記被写体領域の形状の変化が判定された前記フレームの画像を特定し、前記撮像手段に、特定した前記フレームの画像の撮像を指示する
    請求項1に記載の画像処理装置。
  3. 連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、
    前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段とを備える画像処理装置の画像処理方法において、
    前記判定手段が、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定ステップと、
    前記特定手段が、前記判定ステップの処理により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定ステップと
    を含み、
    前記判定ステップの処理は、注目する前記被写体としての人物の領域である人物領域の幅と、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比が、フレーム間で、所定の閾値より大きく変化したか否かを判定し、
    前記特定ステップの処理は、前記判定ステップの処理により前記人物領域の幅と前記顔領域の高さとの比が、フレーム間で、前記所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する
    画像処理方法。
  4. 連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定ステップと、
    前記判定ステップの処理により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定ステップと
    を含む処理をコンピュータに実行させ
    前記判定ステップの処理は、注目する前記被写体としての人物の領域である人物領域の幅と、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比が、フレーム間で、所定の閾値より大きく変化したか否かを判定し、
    前記特定ステップの処理は、前記判定ステップの処理により前記人物領域の幅と前記顔領域の高さとの比が、フレーム間で、前記所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する
    プログラム。
  5. 連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、
    前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段と
    を備え、
    前記判定手段は、矩形領域としての前記被写体領域の縦横比が、所定数フレーム間変化していないか否かを判定し、
    前記特定手段は、前記判定手段により前記被写体領域の縦横比が、所定数フレーム間変化していないと判定されたときのフレームの画像を特定する
    画像処理装置。
  6. 被写体を撮像する撮像手段をさらに備え、
    前記特定手段は、前記判定手段により前記被写体領域の縦横比が、所定数フレーム間変化していないと判定された前記フレームの画像を特定し、前記撮像手段に、特定した前記フレームの画像の撮像を指示する
    請求項5に記載の画像処理装置。
  7. 連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、
    前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段とを備える画像処理装置の画像処理方法において、
    前記判定手段が、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定ステップと、
    前記特定手段が、前記判定ステップの処理により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定ステップと
    を含み、
    前記判定ステップの処理は、矩形領域としての前記被写体領域の縦横比が、所定数フレーム間変化していないか否かを判定し、
    前記特定ステップの処理は、前記判定ステップの処理により前記被写体領域の縦横比が、所定数フレーム間変化していないと判定されたときのフレームの画像を特定する
    画像処理方法。
  8. 連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、
    前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段と
    を備え、
    前記判定手段は、矩形領域としての前記被写体領域の縦横比が、1フレーム毎のフレーム間で、所定の閾値より大きく変化したか否かを判定し、
    前記特定手段は、前記判定手段により前記被写体領域の縦横比が、1フレーム毎のフレーム間で、前記所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する
    画像処理装置。
  9. 被写体を撮像する撮像手段をさらに備え、
    前記特定手段は、前記判定手段により前記被写体領域の形状の変化が判定された前記フレームの画像を特定し、前記撮像手段に、特定した前記フレームの画像の撮像を指示する
    請求項8に記載の画像処理装置。
  10. 前記複数フレームの画像における前記被写体領域の位置を検出する検出手段をさらに備え、
    前記判定手段は、前記検出手段により、前記被写体領域の位置が所定の領域内にあることが検出された場合に、矩形領域としての前記被写体領域の縦横比が、1フレーム毎のフレーム間で、所定の閾値より大きく変化したか否かを判定し、
    前記特定手段は、前記判定手段により前記被写体領域の縦横比が、1フレーム毎のフレーム間で、所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する
    請求項8に記載の画像処理装置。
  11. 連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定手段と、前記判定手段により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定手段とを備える画像処理装置の画像処理方法において、
    前記判定手段が、連続する複数フレームの画像において、注目する前記被写体の領域である被写体領域の形状の変化を判定する判定ステップと、
    前記特定手段が、前記判定ステップの処理により前記被写体領域の形状の変化が判定されたフレームの画像を特定する特定ステップと
    を含み、
    前記判定ステップの処理は、矩形領域としての前記被写体領域の縦横比が、1フレーム毎のフレーム間で、所定の閾値より大きく変化したか否かを判定し、
    前記特定ステップの処理は、前記判定ステップの処理により前記被写体領域の縦横比が、1フレーム毎のフレーム間で、前記所定の閾値より大きく変化したと判定されたときのフレームの画像を特定する
    画像処理方法。
  12. 連続する複数フレームの画像において、注目する前記被写体としての人物の領域である人物領域の高さと、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比と、予め決められた目標値とを比較する比較手段と、
    前記比較手段による比較の結果、前記人物領域の高さと前記顔領域の高さとの比と、前記目標値との差が、所定の閾値より小さいとされたフレームの画像を特定する特定手段と
    を備える画像処理装置。
  13. 連続する複数フレームの画像において、注目する前記被写体としての人物の領域である人物領域の高さと、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比と、予め決められた目標値とを比較する比較手段と、
    前記比較手段による比較の結果、前記人物領域の高さと前記顔領域の高さとの比と、前記目標値との差が、所定の閾値より小さいとされたフレームの画像を特定する特定手段とを備える画像処理装置の画像処理方法において、
    前記比較手段が、連続する複数フレームの画像において、注目する前記被写体としての人物の領域である人物領域の高さと、前記人物領域に含まれる、前記人物の顔の領域である顔領域の高さとの比と、予め決められた目標値とを比較する比較ステップと、
    前記特定手段が、前記比較ステップの処理による比較の結果、前記人物領域の高さと前記顔領域の高さとの比と、前記目標値との差が、所定の閾値より小さいとされたフレームの画像を特定する特定ステップと
    を含む画像処理方法。
JP2010079189A 2010-03-30 2010-03-30 画像処理装置および方法、並びにプログラム Active JP5577793B2 (ja)

Priority Applications (11)

Application Number Priority Date Filing Date Title
JP2010079189A JP5577793B2 (ja) 2010-03-30 2010-03-30 画像処理装置および方法、並びにプログラム
TW100107255A TW201204024A (en) 2010-03-30 2011-03-04 Image processing apparatus, method, and computer program storage device
RU2012140422/08A RU2012140422A (ru) 2010-03-30 2011-03-16 Устройство обработки изображений, способ и запоминающее устройство для компьютерных программ
EP11762170.6A EP2553920B1 (en) 2010-03-30 2011-03-16 Image processing apparatus, method, and computer program storage device
EP19156002.8A EP3512191A1 (en) 2010-03-30 2011-03-16 Image processing apparatus, method, and computer program storage device
KR1020127024675A KR101677315B1 (ko) 2010-03-30 2011-03-16 화상 처리 장치 및 방법과 컴퓨터 판독가능 기록 매체
PCT/JP2011/001547 WO2011121917A1 (en) 2010-03-30 2011-03-16 Image processing apparatus, method, and computer program storage device
US13/636,203 US8964038B2 (en) 2010-03-30 2011-03-16 Image processing apparatus, method, and computer program storage device
CN201180015023.4A CN102812699B (zh) 2010-03-30 2011-03-16 图像处理设备和方法
BR112012023987A BR112012023987A2 (pt) 2010-03-30 2011-03-16 aparelho e método de processamento de imagem, e, disopositivo de armazenamento legível de computador não transitório
US14/558,027 US9509903B2 (en) 2010-03-30 2014-12-02 Image processing apparatus, method, and computer program storage device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010079189A JP5577793B2 (ja) 2010-03-30 2010-03-30 画像処理装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2011211631A JP2011211631A (ja) 2011-10-20
JP5577793B2 true JP5577793B2 (ja) 2014-08-27

Family

ID=44711687

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010079189A Active JP5577793B2 (ja) 2010-03-30 2010-03-30 画像処理装置および方法、並びにプログラム

Country Status (9)

Country Link
US (2) US8964038B2 (ja)
EP (2) EP2553920B1 (ja)
JP (1) JP5577793B2 (ja)
KR (1) KR101677315B1 (ja)
CN (1) CN102812699B (ja)
BR (1) BR112012023987A2 (ja)
RU (1) RU2012140422A (ja)
TW (1) TW201204024A (ja)
WO (1) WO2011121917A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5577793B2 (ja) * 2010-03-30 2014-08-27 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP5978639B2 (ja) 2012-02-06 2016-08-24 ソニー株式会社 画像処理装置、画像処理方法、プログラム、及び記録媒体
WO2013145589A1 (ja) * 2012-03-26 2013-10-03 パナソニック株式会社 画像処理装置、撮像装置および画像処理方法
CN104364824A (zh) * 2012-06-13 2015-02-18 松下知识产权经营株式会社 物体检测装置
EP2862346A1 (en) * 2012-06-18 2015-04-22 Thomson Licensing A device and a method for color harmonization of an image
US10474921B2 (en) 2013-06-14 2019-11-12 Qualcomm Incorporated Tracker assisted image capture
FR3047597B1 (fr) * 2016-01-04 2018-01-19 Laoviland Experience Procede de traitement graphique d'images
JP2018037944A (ja) * 2016-09-01 2018-03-08 ソニーセミコンダクタソリューションズ株式会社 撮像制御装置、撮像装置および撮像制御方法
EP3518522B1 (en) * 2016-10-25 2022-01-26 Huawei Technologies Co., Ltd. Image capturing method and device
CN106488128B (zh) * 2016-10-27 2020-02-28 成都西纬科技有限公司 一种自动拍照的方法及装置
JP2020154828A (ja) * 2019-03-20 2020-09-24 富士通株式会社 データ補完プログラム、データ補完方法及びデータ補完装置
JP7089493B2 (ja) * 2019-08-14 2022-06-22 Kddi株式会社 人物検知装置、方法およびプログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04197019A (ja) 1990-11-28 1992-07-16 Hitachi Ltd ディジタル保護継電装置
JP3065838B2 (ja) * 1993-02-15 2000-07-17 沖電気工業株式会社 人物認識方法
JP4341936B2 (ja) * 1998-12-25 2009-10-14 カシオ計算機株式会社 撮像方法および撮像装置
US7102615B2 (en) * 2002-07-27 2006-09-05 Sony Computer Entertainment Inc. Man-machine interface using a deformable device
CA2568633C (en) * 2004-10-15 2008-04-01 Oren Halpern A system and a method for improving the captured images of digital still cameras
JP4096950B2 (ja) * 2005-02-24 2008-06-04 船井電機株式会社 撮像装置および自動撮影方法
JP2007123953A (ja) * 2005-10-24 2007-05-17 Sony Corp 撮像装置及び撮像方法
JP4197019B2 (ja) 2006-08-02 2008-12-17 ソニー株式会社 撮像装置および表情評価装置
JP4656331B2 (ja) * 2006-12-27 2011-03-23 富士フイルム株式会社 撮像装置および撮像方法
US20090009651A1 (en) 2007-07-04 2009-01-08 Sanyo Electric Co., Ltd. Imaging Apparatus And Automatic Focus Control Method
JP2009031760A (ja) * 2007-07-04 2009-02-12 Sanyo Electric Co Ltd 撮像装置及びオートフォーカス制御方法
JP2009124210A (ja) * 2007-11-12 2009-06-04 Olympus Imaging Corp 撮像装置、撮像方法、画像検索装置および画像検索方法
JP2009200713A (ja) 2008-02-20 2009-09-03 Sony Corp 画像処理装置、画像処理方法、プログラム
US8253812B2 (en) 2008-02-23 2012-08-28 Sanyo Electric Co., Ltd. Video camera which adopts a focal-plane electronic shutter system
JP5131586B2 (ja) * 2008-04-03 2013-01-30 カシオ計算機株式会社 撮影装置、画像記録方法、及びプログラム
JP4640456B2 (ja) 2008-06-25 2011-03-02 ソニー株式会社 画像記録装置、画像記録方法、画像処理装置、画像処理方法、プログラム
JP2010021943A (ja) * 2008-07-14 2010-01-28 Sanyo Electric Co Ltd 撮像装置
KR20100075167A (ko) * 2008-12-24 2010-07-02 삼성전자주식회사 얼굴인식 기능을 이용한 디지털 영상 촬영 장치 및 방법
JP5577793B2 (ja) * 2010-03-30 2014-08-27 ソニー株式会社 画像処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
EP3512191A1 (en) 2019-07-17
WO2011121917A1 (en) 2011-10-06
TW201204024A (en) 2012-01-16
US9509903B2 (en) 2016-11-29
KR20130009788A (ko) 2013-01-23
KR101677315B1 (ko) 2016-11-17
EP2553920A4 (en) 2014-06-18
US20150168811A1 (en) 2015-06-18
EP2553920A1 (en) 2013-02-06
US8964038B2 (en) 2015-02-24
US20130027579A1 (en) 2013-01-31
EP2553920B1 (en) 2019-05-08
CN102812699A (zh) 2012-12-05
JP2011211631A (ja) 2011-10-20
RU2012140422A (ru) 2014-03-27
CN102812699B (zh) 2016-03-30
BR112012023987A2 (pt) 2016-08-02

Similar Documents

Publication Publication Date Title
JP5577793B2 (ja) 画像処理装置および方法、並びにプログラム
JP5565041B2 (ja) 画像処理装置および方法、並びにプログラム
JP6639113B2 (ja) 画像認識装置、画像認識方法及びプログラム
US8594435B2 (en) Image processing device and method, and program therefor
KR101603791B1 (ko) 파노라마의 생성 방법
JP5201203B2 (ja) 画像処理装置、画像処理方法及びプログラム
US20070031032A1 (en) Method and apparatus for performing conversion of skin color into preference color by applying face detection and skin area detection
JP2010011223A (ja) 信号処理装置、信号処理方法、プログラム及び記録媒体
JP5803058B2 (ja) 画像処理装置および方法、並びにプログラム
US9020269B2 (en) Image processing device, image processing method, and recording medium
JP5210198B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP2011146826A (ja) 画像処理装置および方法、並びにプログラム
JP2011193125A (ja) 画像処理装置および方法、プログラム、並びに撮像装置
JP5429564B2 (ja) 画像処理装置および方法、並びにプログラム
JP2011146827A (ja) 画像処理装置および方法、並びにプログラム
US20230148125A1 (en) Image processing apparatus and method, and image capturing apparatus
JP2021040178A (ja) 画像処理装置、撮像装置、制御方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140610

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140623

R151 Written notification of patent or utility model registration

Ref document number: 5577793

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250