JP5720275B2 - 撮像装置および撮像方法 - Google Patents

撮像装置および撮像方法 Download PDF

Info

Publication number
JP5720275B2
JP5720275B2 JP2011021691A JP2011021691A JP5720275B2 JP 5720275 B2 JP5720275 B2 JP 5720275B2 JP 2011021691 A JP2011021691 A JP 2011021691A JP 2011021691 A JP2011021691 A JP 2011021691A JP 5720275 B2 JP5720275 B2 JP 5720275B2
Authority
JP
Japan
Prior art keywords
area
search
tracking
tracking target
target area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011021691A
Other languages
English (en)
Other versions
JP2012164002A (ja
Inventor
関 海克
海克 関
トン リュウ
トン リュウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2011021691A priority Critical patent/JP5720275B2/ja
Priority to CN201280007319.6A priority patent/CN103339655B/zh
Priority to PCT/JP2012/051898 priority patent/WO2012105460A1/en
Priority to KR1020137020090A priority patent/KR101455018B1/ko
Priority to EP12741727.7A priority patent/EP2671208B1/en
Priority to US13/980,627 priority patent/US9336606B2/en
Publication of JP2012164002A publication Critical patent/JP2012164002A/ja
Application granted granted Critical
Publication of JP5720275B2 publication Critical patent/JP5720275B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/248Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • H04N23/632Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters for displaying or modifying preview images prior to image capturing, e.g. variety of image resolutions or capturing parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/635Region indicators; Field of view indicators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0084Digital still camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/634Warning indications

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)

Description

本発明は、撮像装置および撮像方法に関する。
従来より、連続する時系列の画像フレームから、その画像フレームに写された物体を追尾し、追尾結果に応じたカメラの制御方法が提案されている。例えば、特許文献1では、画像フレーム中の物体を追尾し、追尾した結果の動きベクトルを用いて、カメラを制御するトルク量を調整する自動追尾撮影装置が提案されている。
また、特許文献2では、物体追尾を行うとき、画像のノイズや追尾対象物体の変形により、追尾誤差が生じるため、このような追尾の失敗に対する対処法が提案されている。具体的には、追尾結果に対して、この追尾結果を補正するための追尾点をユーザが入力することで、追尾を中断することなく続ける方法が提案されている。
一般的な追尾方法は、連続する画像フレームに写された物体に対し物体追尾を行うとき、図9に示すように画像フレームF0において初期追尾対象領域ABCDを決めた後、次の画像フレームに対して、物体に対する追尾処理を行う。図10(A)に示すF0フレーム(初期の画像フレーム)の初期追尾対象領域ABCDに対して、図10(B)に示すFMフレーム(M番目の画像フレーム)の追尾結果領域A’B’C’D’が得られると、FMフレームの追尾結果領域を新しい追尾対象領域として、次の画像フレームに対して、追尾処理を行う。
しかしながら、初期追尾対象領域が制限される場合などでは、図11(A)に示すように初期追尾対象領域ABCDを選定した場合、FMフレームでの追尾結果が本来追尾対象となる領域と異なる領域A’B’C’D’となってしまうことがある。図11の例では、初期追尾対象領域は物体の一部しか選択できず、初期追尾対象領域が適切に選択されないので、追尾結果領域は対象物体の他の部分を追尾する結果となってしまい、追尾結果は不安定になってしまう。
特許文献1等の従来技術では、図11に示すような初期追尾対象領域を選定してしまうと、追尾を失敗する可能性が高くなる。
また、特許文献2の技術では、追尾が失敗するとき、その修正が可能であるが、初期追尾対象領域が適切に選択されないと、やはり追尾結果が不安定になり、頻繁に人間の介入が必要となって、ユーザにとって大きな負担となる。
以上のようなことから、適切な初期追尾対象領域が自動的に選択され、追尾の失敗が少なくなるようにする物体追尾方法が望まれた。
本発明は、上記に鑑みてなされたものであって、時系列の画像フレーム中の物体の追尾について、安定な追尾結果が得られ、追尾の成功率を高めることができる物体追尾機能を有する撮像装置および撮像方法を提供するものである。
上述した課題を解決し、目的を達成するために、本発明の撮像装置は、画像入力する画像入力手段と、入力した時系列の画像フレームから初期追尾対象領域の指定を受け付ける指定手段と、前記画像フレーム内で対象とする領域における所定の特徴量を抽出する特徴量抽出手段と、前記初期追尾対象領域のサイズを変化させて、該変化させた領域から抽出された前記特徴量が追尾を成功させる所定の条件を満たす領域を新たな初期追尾対象領域として探索する第1の探索手段と、時系列の次の画像フレームにおいて、前記新たな初期追尾対象領域に類似する領域を追尾結果領域として探索する第2の探索手段とを備えることを特徴とする。
また、本発明は、撮像装置における撮像方法であって、画像入力手段により画像入力する工程と、指定手段により、入力した時系列の画像フレームから初期追尾対象領域の指定を受け付ける工程と、特徴量抽出手段により、前記画像フレーム内で対象とする領域における所定の特徴量を抽出する工程と、第1の探索手段により、前記初期追尾対象領域のサイズを変化させて、該変化させた領域から抽出された前記特徴量が追尾を成功させる所定の条件を満たす領域を新たな初期追尾対象領域として探索する工程と、第2の探索手段により、時系列の次の画像フレームにおいて、前記新たな初期追尾対象領域に類似する領域を追尾結果領域として探索する工程とを含むことを特徴とする。
本発明によれば、撮像装置で撮像された物体の追尾を行うとき、指定された初期追尾対象領域から自動的に適切な初期追尾対象領域を決定するので、物体追尾処理において安定な追尾結果が得られ、物体追尾の成功率を高められるという効果を奏する。
図1は、一実施の形態にかかる物体追尾装置の構成を示すブロック図である。 図2は、同実施形態における初期追尾対象領域算出処理および追尾処理を説明する図である。 図3は、同実施形態における追尾処理を説明する図である。 図4は、同実施形態の物体追尾装置における物体追尾にかかる一連の処理について説明するためのフローチャートである。 図5は、物体追尾機能を有する撮像装置の一例として、デジタルスチルカメラの外観を示す図である。 図6は、物体追尾機能を有する撮像装置の一例として、デジタルスチルカメラの外観を示す図である。 図7は、デジタルスチルカメラの内部構成を示すブロック図である。 図8は、タップ操作により初期追尾対象領域を指定する場合を例示した図である。 図9は、一般的な追尾方法を説明する図である。 図10は、一般的な追尾方法を説明する図である。 図11は、一般的な追尾方法での追尾の失敗を示す図である。
以下に添付図面を参照して、この発明にかかる撮像装置が有する物体追尾機能を実現する装置の一実施の形態としての物体追尾装置について詳細に説明する。
はじめに、一実施の形態にかかる物体追尾装置の構成について、図1を用いて説明する。図1は、一実施の形態にかかる物体追尾装置の構成を示すブロック図である。以下に説明する物体追尾装置の構成は、デジタルスチルカメラ等の撮像装置に備わる制御部や画像処理部等に適用することができる。
図1に示す物体追尾装置は、画像入力部101、初期追尾対象領域指定部102、追尾対象領域算出部103、追尾処理部104、追尾結果出力部105、および制御処理部106を備えている。
画像入力部101は、撮像装置もしくは画像処理装置により撮影された動画像、もしくは複数の静止画像から、連続する時系列の画像フレームのデータを順次入力する。図9に示すようにF0は最初の画像フレームであり、次にΔtの時間間隔経過後の画像フレームF1が入力される。このように、N枚の時系列画像フレームが順次入力される。これらの画像フレームからなる画像フレームのセットは追尾対象画像データとなる。
初期追尾対象領域指定部102は、最初の画像フレームF0に対する初期追尾対象領域A0B0C0D0の指定を受け付ける。図2(A)の例では、領域A0B0C0D0が初期追尾対象領域として指定されている。初期追尾対象領域A0B0C0D0の指定については、例えば、デジタルスチルカメラ等に備わるタッチパネルと一体となった液晶ディスプレイ等を用いて、ユーザが初期追尾対象領域A0B0C0D0の四隅をタップすることにより、直接追尾対象領域の座標値A0B0C0D0を入力することができる。あるいは、ユーザにより指定されたある点、例えば、領域A0B0C0D0付近の一点の座標値の入力を受け付け、入力された座標値を中心に自動的に予め決めた大きさで、初期追尾対象領域A0B0C0D0を自動的に算出するようにしてもよい。なお、初期追尾対象領域A0B0C0D0や下記の追尾対象領域ABCDの形状は、図2等に例示した四角形に限らず、楕円形、円形、多角形や、四角形の組み合わせなど、他の形としてもよい。
初期追尾対象領域算出部103は、初期追尾領域指定部102で指定された初期追尾対象領域A0B0C0D0に基づいて、下記の条件を満たす領域を新たな初期追尾対象領域ABCDとして算出する。具体的には、特徴量抽出部103aが、図2(A)に示す指定された初期追尾対象領域A0B0C0D0のカラー画像のNビンのカラーヒストグラムを計算する。次に、特徴量抽出部103aが、計算したカラーヒストグラムについて、下記の式(1)を用いて、エントロピーEを計算する。ここで、hはカラーヒストグラムのi番目のビンの値である。
Figure 0005720275
そして、第1の探索部103bが、初期追尾対象領域A0B0C0D0のサイズを変えながら(ここではサイズを拡大させながら)、カラーヒストグラムのエントロピーEを再計算する。そして、エントロピーEが最大になる領域ABCDを新たな初期追尾対象領域とする。このように初期追尾対象領域ABCDを決定することで、図11に示したような追尾失敗を防げ、正しく安定な追尾ができるようになる。なお、初期対象追尾領域A0B0C0D0のサイズを順次変化させて計算したエントロピーEが閾値Ethを超えることがない場合、すなわち、エントロピーEの最大値が閾値Ethを超えることがない場合、初期追尾対象領域算出不能の警告(例えば、図1にて図示しない液晶ディスプレイ等の表示装置を用いた警告表示やスピーカー等の音声出力装置を用いた警告音等)を出して、下記の追尾処理部104による追尾処理を終了させる。
追尾処理部104は、初期追尾対象領域算出部103で算出した初期追尾対象領域ABCDをテンプレートとして、図2(B)に示すように次の画像フレームFM上で初期追尾対象領域ABCDと最も類似度の高い領域A’B’C’D’を探索し抽出する。具体的には、類似度算出部104aが、後述のようにして類似度を算出し、第2の探索部104bが、初期追尾対象領域ABCDと最も類似度の高い領域A’B’C’D’を探索する(詳細は後述)。このA’B’C’D’の頂点座標で囲まれる領域が追尾結果領域となる。
追尾結果出力部105は、追尾処理部104による追尾結果として追尾結果領域の情報を出力する。
制御処理部106は、追尾結果出力部105から出力される追尾結果(追尾結果領域の情報)を受けて、この追尾結果に応じた制御を行う。例えば、追尾対象領域ABCDに焦点をフォーカスする場合、後続する各画像フレームの追尾結果領域A’B’C’D’に焦点を合わせ続ける制御を行う。
以上のように、本実施形態の物体追尾装置は、初期追尾対象領域算出部103により、指定された初期追尾対象領域の特徴量であるカラーヒストグラムのエントロピーEを評価し、初期追尾対象領域のエントロピーEが、追尾を成功させるための所定の閾値より大きくなるよう初期追尾対象領域の大きさを変更することにより、物体追尾を安定させることを特徴としている。
続いて、本実施形態の物体追尾装置による追尾処理の詳細を説明する。図3は、本追尾処理を説明する図である。
図3に示すように、追尾対象となる画像フレームFM内で、探索領域となるウィンドウA’B’C’D’を移動しながら、初期追尾対象領域ABCDと最も類似する領域A’B’C’D’(これが追尾結果領域となる)を探索する。具体的には、追尾結果領域の候補となる探索領域A’B’C’D’(この領域は、一番最初の探索の段階では、初期追尾対象領域算出部103により算出された初期追尾対象領域ABCDと同一形状・同一サイズの領域である)を、左上から画素ごとに移動させながら探索し、画像フレームF0の初期追尾対象領域ABCDと最も類似度の高い領域を探す。
画像フレームF0の初期追尾対象領域ABCDと画像フレームFMの探索領域A’B’C’D’の類似度を計算するとき、画像の特徴量を利用する。ここでは、初期追尾対象領域ABCDと探索領域A’B’C’D’のカラーヒストグラムを使う。ここで、q=[q,q,…,q]は、ABCD領域のカラーヒストグラムとする。q,q,…,qは各カラー成分の輝度レベル1から輝度レベルnでの画素数である。探索領域A’B’C’D’のカラーヒストグラムはp=[p,p,…,p]とする。カラーヒストグラムを求めるとき、対象領域の全画素で正規化を行い、面積変化の影響を最小にする。
初期追尾対象領域ABCDと探索領域A’B’C’D’の類似度Simは、以下の式(2)で計算する。
Figure 0005720275
類似度Simが最も大きくなる探索領域A’B’C’D’が追尾結果領域となる。
なお、フレーム間で被写体サイズの変倍がありうるので、実際の探索の際は、初期のサイズ(最初の探索領域A’B’C’D’のサイズ)のウィンドウで全画面探索した後、そのウィンドウサイズを変倍係数Mでサイズ変更しながら、さらに探索を行う。このようにして、すべてのサイズのウィンドウを用いてすべての位置で探索を行い、式(2)で計算した類似度Simが最大となる探索領域A’B’C’D’が追尾結果領域となる。
次に、物体追尾装置における物体追尾にかかる一連の処理について、図4のフローチャートを用いて説明する。
まず、撮像装置もしくは画像処理装置から画像入力する(ステップS101)。ここでは、撮像装置もしくは画像処理装置により撮影された動画像、もしくは複数の静止画から、時系列の画像フレームのデータが入力される。
次に、入力された時系列の画像フレームの最初の画像フレームに初期追尾対象領域の指定を受け付ける(ステップS102)。例えば、図2(A)に示すような初期追尾対象領域A0B0C0D0が指定される。
次いで、初期追尾対象領域A0B0C0D0の特徴量を計算する。ここではまず、初期追尾対象領域A0B0C0D0内の画素のカラーヒストグラムを求める(ステップS103)。追尾対象の画像がカラー画像の場合、R、G、Bそれぞれの色成分についてヒストグラムを求める。RGB各成分のヒストグラムを合わせて、Nビンのカラーヒストグラムを求めることができる。なお、RGBでなく、他の色成分、例えば、YCrCbや、Labにより、それぞれの成分のヒストグラムを求め、カラーヒストグラムを求めてもよい。また、入力画像が輝度画像のみの場合は、特徴量として輝度のヒストグラムを求めることとする。
そして、前述の式(1)によりカラーヒストグラムのエントロピーEを計算する(ステップS104)。エントロピーEの値は大きければ大きいほど追尾対象領域内の特徴量が多いことを示す。
上記カラーヒストグラムの計算およびエントロピーEの計算は、ステップS103〜ステップS106に示されるように、初期設定された領域の大きさの範囲内(width_min, width_max)で(範囲内にある場合ステップS105でYesと判定される)、図2(A)に示すように初期追尾対象領域A0B0C0D0のサイズを最初のサイズから順次変化させて(ステップS106)、繰り返し実行する。
初期設定された領域の大きさの範囲内(width_min, width_max)のすべてについてカラーヒストグラムの計算およびエントロピーEの計算が終了すると(この場合ステップS105でNoと判定される)、エントロピーEの最大値が閾値Eth(第1の閾値)より大きければ、このエントロピーEが最大となる領域を初期追尾対象領域ABCDとして決定する。つまり、初期追尾対象領域A0B0C0D0のサイズを順次変化させそのエントロピーEを求め、エントロピーが最大かつ閾値Eth以上となる図2(A)に示すような領域ABCDを、最終的に初期追尾対象領域とする。この初期追尾対象領域ABCDを用いて追尾処理を実行することとなる。
ここで、上記ステップS106での領域サイズ変更について詳細について説明する。エントロピーEの最大値を探すとき、初期設定した領域サイズから、まずサイズの小さい方向へ探し、初期設定したサイズの最小値width_minまで、領域を小さくしながら、エントロピーEの最大値E1を探す。さらに初期設定したサイズに戻し、サイズの大きい方向へ、設定したサイズの最大値width_maxまで、領域を大きくしながら、エントロピーEの最大値E2を探す。エントロピーE1とE2の大きいほうを全体の最大値とし、この全体の最大値が閾値Ethより大きければ、そのときのサイズの領域を最終的な初期追尾対象領域とする。なお、エントロピーEの最大値を探すとき、上記とは逆に、初期設定したサイズからサイズを大きくする方向に探し、次いで、初期サイズに戻し、初期設定したサイズからサイズを小さくする方向へ探すようにしてもよい。
図4に戻り、最初に指定された初期追尾対象領域A0B0C0D0のサイズを順次変化させ探索しても、カラーヒストグラムのエントロピーEの最大値が閾値Ethより小さい場合(ステップS107でNo)、ステップS108以降の追尾処理は中止して、ステップS117へ移行する。エントロピーEの最大値が閾値Ethより小さい場合は、探索範囲内の領域の特徴量が小さく、追尾失敗の可能性が高いので、警告を出すようにする(ステップS117)。これにより、失敗する可能性が高い追尾処理を省くことができるとともに、ユーザは、最初に指定した物体(被写体)の追尾ができないことを知ることができる。
一方、上記のようにして初期追尾対象領域ABCDを決定することができた場合、すなわちステップS107でYesと判定される場合、決定された初期追尾対象領域ABCDを用いて、追尾処理を行う。この追尾処理は、前述のとおりであるが、以下では図4のフローチャートに沿って説明する。
図3に示したように、追尾対象となる画像フレームFM内で、探索領域となるウィンドウA’B’C’D’を移動しながら、初期追尾対象領域ABCDと最も類似する領域である追尾結果領域を探索する。具体的には、まず初期追尾対象領域ABCDの特徴量(ここではカラーヒストグラム)を算出する(ステップS108)。ここで算出する初期追尾対象領域ABCDの特徴量は、先のステップS103〜ステップS106で算出された初期追尾対象領域ABCDの特徴量を保存しておき、それを利用するようにしてもよい。
次いで、ステップS109の追尾結果領域探索で、追尾結果領域の候補となる探索領域A’B’C’D’(この領域は、一番最初の探索の段階では、初期追尾対象領域算出部103により算出された初期追尾対象領域ABCDと同一形状・同一サイズの領域である)を、左上から画素ごとに移動させさらに次のラインの左端から画素ごとに移動させながら探索対象の画像フレームFM内の全位置について、各位置における探索領域A’B’C’D’のカラーヒストグラムを求める。
次いで、初期追尾対象領域ABCDのカラーヒストグラムと、追尾結果領域の候補である探索領域A’B’C’D’のカラーヒストグラムとから、初期追尾対象領域ABCDと追尾結果領域の候補である各探索領域A’B’C’D’との類似度を計算する(ステップS110)。初期追尾対象領域ABCDと探索領域A’B’C’D’の類似度Simは、前述の式(2)で計算する。
続いて、全サイズの探索領域について探索が完了しているか判定する(ステップS111)。これは、フレーム間で被写体サイズの変倍がありうるため、前述のように実際の探索処理の際、初期のサイズのウィンドウ(探索領域A’B’C’D’)で全画面探索した後、そのウィンドウサイズを変倍係数Mでサイズ変更しながら、さらにステップS109以降の探索処理をするための判断処理である。全サイズの探索領域について探索が完了していない場合(ステップS111でNo)、ステップS112へ移行し、探索領域A’B’C’Dのサイズを変更する。
一方、全サイズの探索領域について探索が完了している場合(ステップS111でYes)、ステップS113へ移行し、初期追尾対象領域ABCDと追尾結果領域の候補である各探索領域A’B’C’D’との類似度の最大値が所定の閾値(第2の閾値)より大きいか判定する(ステップS113)。
上記類似度の最大値が所定の閾値以下である場合(ステップS113でNo)、画像フレームFM内に初期追尾対象領域ABCDと類似する領域は存在しないことになり、ステップS116へ移行して、初期追尾対象領域ABCDと類似する領域が存在しないことを示す警告を出す。
一方、上記類似度の最大値が所定の閾値より大きい場合(ステップS113でYes)、類似度Simが最大となる探索領域A’B’C’D’を追尾結果領域として出力する(ステップS114)。
そして、制御処理部106は、追尾結果に応じた撮像装置の制御、例えば追尾している物体に対するオートフォーカス制御を行う(ステップS115)。以後、続く画像フレームに対して、ステップS109以降の追尾処理を繰り返す。なお、画像フレームFMの追尾結果領域を新たな初期追尾対象領域ABCDとして次の画像フレーム内での探索を行う場合には、ステップS114で得られる追尾結果領域のカラーヒストグラムを保持しておき、ステップS110での類似度計算に用いる。
以上、物体追尾装置における物体追尾にかかる一連の処理について説明した。
次に、上述した物体追尾処理を含む画像処理を実施する撮像装置の一実施例であるデジタルスチルカメラのハードウェア構成について説明する。
図5,6は、本実施例のデジタルスチルカメラの外観を示す図である。デジタルカメラ20本体の前面および上面には、一般的なデジタルカメラと同様に、POWER(電源)ボタン21、シャッターボタン22、フラッシュ発光部23、AF補助光/セルフタイマーランプ24、レンズカバー25、マイク26、スピーカー27、レンズ(撮像光学系)1が配置されている。
また、デジタルカメラ20の背面には、図6に示すように、液晶ディスプレイ16(以下、「LCD16」と略記する)、モード切替スイッチ31、再生ボタン32、ADJ.ボタン33、削除/セルフタイマーボタン34、↑/MODEボタン35、→/クイックレビューボタン36、MENU/OKボタン37、↓/マクロボタン38、←/フラッシュボタン39、DISP.ボタン40等、周知の各種ボタン、スイッチが配置されている。本デジタルスチルカメラの上面および背面に配置された各種ボタン、スイッチは、デジタルスチルカメラ20の操作部(後述の操作部15)を構成する。
レンズ1は、沈胴式のズームレンズで構成されており、POWER(電源)ボタン21によりカメラの電源が投入され、モード切替スイッチ31によりカメラのモードを撮影モードに設定することにより、デジタルカメラ20から繰り出される。
LCD16は、カラー表示が可能な液晶パネルと、タッチパネルとで構成されており、再生モード時には撮影済み画像を表示するための画像表示パネルとして利用されるとともに、各種設定操作を行なう際のユーザインターフェース表示パネルとして利用され、タッチパネルによりユーザによるタップ、ドラッグ操作等の入力を受け付けることができる。また、撮影モード時には、必要に応じてライブビューが表示されて、画角確認用のファインダとして利用される。
続いて、本実施例のデジタルスチルカメラ20の内部構成について図7を用いて説明する。図7は、デジタルスチルカメラ20の内部構成を示すブロック図である。
図7に示すように被写体光は、まず撮影光学系1を通してCCD(Charge Coupled Device)3に入射される。また、撮影光学系1とCCD3との間は、メカシャッタ2が配置されており、このメカシャッタ2によりCCD3への入射光を遮断することができる。なお、撮影光学系1及びメカシャッタ2は、モータドライバ6より駆動される。
CCD3は、その撮像面に結像された光学像を電気信号に変換して、アナログの画像信号として出力する。CCD3から出力された画像信号は、CDS(Correlated Double Sampling:相関2重サンプリング)回路4によりノイズ成分を除去され、A/D変換器5によりデジタル値(RGB)に変換された後、画像処理回路8に対して出力される。
画像処理回路8は、画像データを一時格納するSDRAM(SynchronousDRAM)12を用いて、YCrCb変換処理や、ホワイトバランス制御処理、コントラスト補正処理、エッジ強調処理、色変換処理などの各種画像処理を行う。なお、ホワイトバランス処理は、画像情報の色濃さを調整し、コントラスト補正処理は、画像情報のコントラストを調整する画像処理である。エッジ強調処理は、画像情報のシャープネスを調整し、色変換処理は、画像情報の色合いを調整する画像処理である。また、画像処理回路8は、各種信号処理や画像処理が施された画像情報を液晶ディスプレイ16(以下、「LCD16」と略記する)に表示する。
また、各種信号処理、画像処理が施された画像情報は、圧縮伸張回路13を介して、メモリカード14(図中、メモリと略記)に記録される。上記圧縮伸張回路13は、操作部15から取得した指示によって、画像処理回路8から出力される画像情報を圧縮してメモリカード14に出力し、またメモリカード14から読み出した画像情報を伸張して画像処理回路8に出力する回路である。
また、CCD3、CDS回路4及びA/D変換器5は、タイミング信号を発生するタイミング信号発生器7を介してCPU(Central Processing Unit)9によって、それらの動作タイミングが制御されている。さらに、画像処理回路8、圧縮伸張回路13、メモリカード14も、CPU9によって制御されている。
また、本デジタルスチルカメラは、制御プログラムなどを格納した読み出し専用メモリであるROM(Read Only Memory)11および各種の処理過程で利用するワークエリア、各種データ格納エリアなどを有する読み出し書き込み自在のメモリであるRAM(Random Access Memory)10などを内蔵し、これらがバスラインによって相互接続されている。CPU9は、画像処理プログラムを含む上記制御プログラムに従って各種演算処理を行うとともに、本デジタルスチルカメラの各部を制御する。
また、本実施例のデジタルスチルカメラで実行される画像処理プログラムは、上述した追尾機能を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)9が上記記憶媒体のROM11から画像処理プログラムを読み出して実行することにより図1に示した各部が主記憶装置となるRAM10上にロードされ、物体追尾を行う。得られた物体追尾結果を用いて、本デジタルスチルカメラを最適に制御し、画像撮影、画像処理を行い、画像を圧縮してメモリカード14に格納するようになっている。
続いて、本実施例のデジタルスチルカメラ20における物体追尾にかかる処理の概要を説明する。
まず、レンズ1、CCD3、CDS回路4およびA/D変換器5を介して画像処理回路8に入力されたモニタ表示用動画像の画像データから、Δtの時間間隔で、最新の2フレームの画像データをSDRAM12に保存する。この動画像から得られた画像フレームを用いて、物体追尾を行う。
初期追尾対象領域の指定は、ここでは、デジタルスチルカメラにおいて、ユーザが指定入力したある点の座標を受け付け、その点を含む図2の(A)に示したA0B0C0D0の矩形領域、もしくは楕円形、円形、多角形などの他の形の領域を初期追尾対象領域とする。本実施例のデジタルスチルカメラにおいては、例えば、図8に示すように、LCD16のタッチパネルを介して、ユーザがLCD16に表示された画像のある点を、マウスのクリック操作に相当するタップ操作をすることにより上記座標を指定することができる。
図2(A)に示すような初期追尾対象領域A0B0C0D0が入力されると、画像処理プログラムに従ってCPU9は、前述のように、この領域のカラーヒストグラムを計算し、さらに式(1)を用いてカラーヒストグラムのエントロピーEを計算し、エントロピーEが最大になる領域を探索して、その領域を初期追尾対象領域ABCDとする。
続いて、CPU9は,図6に示すように、追尾結果領域の候補となる探索領域A’B’C’D’のサイズと位置を変更しながら、初期追尾対象領域ABCDと探索領域A’B’C’D’のカラーヒストグラムの類似度を求める。そして、類似度の最も高い領域A’B’C’D’を追尾結果領域とする。
追尾結果領域A’B’C’D’が得られると、CPU9はこの追尾結果領域A’B’C’D’の情報を用いて、本実施例のデジタルスチルカメラ20の制御を行う。例えば、初期追尾対象領域ABCDに焦点をフォーカスする場合、後続する各画像フレームの追尾結果領域A’B’C’D’に焦点を合わせ続ける。
そして、ユーザがシャッター22を押した後入力された画像データは、画像処理回路8により所定の信号処理および画像処理が施され、これらの処理が施された画像情報は、圧縮伸張回路13を介して、メモリカード14に記録される。
以上、物体追尾処理を含む画像処理を実施する撮像装置の一実施例としてデジタルスチルカメラを例示し説明した。このように、前述の物体追尾装置における物体追尾の機能は、デジタルスチルカメラ等の撮像装置に適用し実施することができる。そして、この物体追尾機能をもたせたデジタルスチルカメラ等の撮像装置は、時系列の画像フレーム中の物体(被写体)の追尾に関して安定な追尾結果が得られ、追尾の成功率を高めることができるものとなる。
なお、以上において、発明を実施するための実施の形態について説明を行ったが、本発明は、上述した実施の形態に限定されるものではない。本発明の主旨を損なわない範囲で変更することが可能である。
1 レンズ(撮像光学系)
2 メカシャッタ
3 CCD
4 CDS回路
5 A/D変換器
6 モータ
7 タイミング信号発生器
8 画像処理回路
9 CPU
10 RAM
11 ROM
12 SDRAM
13 圧縮伸長回路
14 メモリカード
15 操作部
16 LCD(液晶ディスプレイ)
21 POWER(電源)ボタン
22 シャッターボタン
23 フラッシュ発光部
24 AF補助光/セルフタイマーランプ
25 レンズカバー
26 マイク
27 スピーカー
101 画像入力部
102 初期追尾対象領域指定部
103 初期追尾対象領域算出部
103a 特徴量抽出部
103b 第1の探索部
104 追尾処理部
104a 類似度算出部
104b 第2の探索部
105 追尾結果出力部
106 制御処理部
特開2008‐153879号公報 特開2009‐10453号公報

Claims (10)

  1. 画像入力する画像入力手段と、
    入力した時系列の画像フレームから初期追尾対象領域の指定を受け付ける指定手段と、
    前記画像フレーム内で対象とする領域における所定の特徴量を抽出する特徴量抽出手段と、
    前記初期追尾対象領域のサイズを変化させて、該変化させた領域から抽出された前記特徴量が追尾を成功させる所定の条件を満たす領域を新たな初期追尾対象領域として探索する第1の探索手段と、
    時系列の次の画像フレームにおいて、前記新たな初期追尾対象領域に類似する領域を追尾結果領域として探索する第2の探索手段と
    を備えることを特徴とする撮像装置。
  2. 前記第2の探索手段による探索結果である前記追尾結果領域の情報を基に、本撮像装置の制御をする制御手段をさらに備えることを特徴とする請求項1に記載の撮像装置。
  3. 前記特徴量は、画像フレームにおけるカラーヒストグラムのエントロピーであって、前記第1の探索手段は、前記エントロピーが最大となる領域を前記新たな初期追尾対象領域として探索することを特徴とする請求項1または請求項2に記載の撮像装置。
  4. 前記新たな初期追尾対象領域のカラーヒストグラムと探索される領域のカラーヒストグラムとから類似度を算出する類似度算出手段をさらに備え、
    前記第2の探索手段は、前記類似度算出手段により算出された類似度を基に前記追尾結果領域を探索する
    ことを特徴とする請求項3に記載の撮像装置。
  5. 前記エントロピーの最大値が初期設定された閾値以下の場合、前記第1の探索手段は、前記第2の探索手段による探索を中止させる
    ことを特徴とする請求項3または請求項4に記載の撮像装置。
  6. 撮像装置における撮像方法であって、
    画像入力手段により画像入力する工程と、
    指定手段により、入力した時系列の画像フレームから初期追尾対象領域の指定を受け付ける工程と、
    特徴量抽出手段により、前記画像フレーム内で対象とする領域における所定の特徴量を抽出する工程と、
    第1の探索手段により、前記初期追尾対象領域のサイズを変化させて、該変化させた領域から抽出された前記特徴量が追尾を成功させる所定の条件を満たす領域を新たな初期追尾対象領域として探索する工程と、
    第2の探索手段により、時系列の次の画像フレームにおいて、前記新たな初期追尾対象領域に類似する領域を追尾結果領域として探索する工程と
    を含むことを特徴とする撮像方法。
  7. 制御手段により、前記第2の探索手段による探索結果である前記追尾結果領域の情報を基に、撮像装置の制御をする工程をさらに含むことを特徴とする請求項6に記載の撮像方法。
  8. 前記特徴量は、画像フレームにおけるカラーヒストグラムのエントロピーであって、前記第1の探索手段により探索する工程は、前記エントロピーが最大となる領域を前記新たな初期追尾対象領域として探索する工程を含むことを特徴とする請求項6または請求項7に記載の撮像方法。
  9. 類似度算出手段により、前記新たな初期追尾対象領域のカラーヒストグラムと探索される領域のカラーヒストグラムとから類似度を算出する工程をさらに含み、
    前記第2の探索手段により探索する工程、前記類似度算出手段により算出された類似度を基に前記追尾結果領域を探索する工程を含む
    ことを特徴とする請求項8に記載の撮像方法。
  10. 前記第1の探索手段により探索する工程は、前記エントロピーの最大値が初期設定された第1の閾値以下の場合に、前記第2の探索手段による探索を中止させる工程を含む
    ことを特徴とする請求項8または請求項9に記載の撮像方法。
JP2011021691A 2011-02-03 2011-02-03 撮像装置および撮像方法 Expired - Fee Related JP5720275B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2011021691A JP5720275B2 (ja) 2011-02-03 2011-02-03 撮像装置および撮像方法
CN201280007319.6A CN103339655B (zh) 2011-02-03 2012-01-23 图像捕捉装置、图像捕捉方法及计算机程序产品
PCT/JP2012/051898 WO2012105460A1 (en) 2011-02-03 2012-01-23 Image capturing apparatus, image capturing method, and computer program product
KR1020137020090A KR101455018B1 (ko) 2011-02-03 2012-01-23 촬상 장치, 촬상 방법, 및 컴퓨터 판독 가능한 기록 매체
EP12741727.7A EP2671208B1 (en) 2011-02-03 2012-01-23 Image capturing apparatus, image capturing method, and computer program product
US13/980,627 US9336606B2 (en) 2011-02-03 2012-01-23 Image capturing apparatus, image capturing method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011021691A JP5720275B2 (ja) 2011-02-03 2011-02-03 撮像装置および撮像方法

Publications (2)

Publication Number Publication Date
JP2012164002A JP2012164002A (ja) 2012-08-30
JP5720275B2 true JP5720275B2 (ja) 2015-05-20

Family

ID=46602676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011021691A Expired - Fee Related JP5720275B2 (ja) 2011-02-03 2011-02-03 撮像装置および撮像方法

Country Status (6)

Country Link
US (1) US9336606B2 (ja)
EP (1) EP2671208B1 (ja)
JP (1) JP5720275B2 (ja)
KR (1) KR101455018B1 (ja)
CN (1) CN103339655B (ja)
WO (1) WO2012105460A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378417B2 (en) * 2014-05-30 2016-06-28 Rolta India Ltd Contrast for RGB images in a GIS application
JP6459443B2 (ja) 2014-11-28 2019-01-30 株式会社リコー 検知装置、検知システム、検知方法及びプログラム
JP2016140030A (ja) 2015-01-29 2016-08-04 株式会社リコー 画像処理装置、撮像装置、及び画像処理プログラム
CN106303195A (zh) * 2015-05-28 2017-01-04 中兴通讯股份有限公司 拍摄设备及跟踪拍摄方法和系统
JP6555940B2 (ja) * 2015-06-12 2019-08-07 キヤノン株式会社 被写体追跡装置、撮像装置、及び被写体追跡装置の制御方法
JP6728634B2 (ja) 2015-11-04 2020-07-22 株式会社リコー 検知装置、検知方法及びプログラム
CN106960211B (zh) * 2016-01-11 2020-04-14 北京陌上花科技有限公司 关键帧获取方法及装置
CN106327526B (zh) 2016-08-22 2020-07-07 杭州保新科技有限公司 图像目标跟踪方法与系统
KR102476897B1 (ko) * 2016-10-05 2022-12-12 삼성전자주식회사 객체 추적 방법 및 장치, 및 이를 이용한 3d 디스플레이 장치
CN106650630B (zh) * 2016-11-11 2019-08-23 纳恩博(北京)科技有限公司 一种目标跟踪方法及电子设备
WO2018222823A1 (en) * 2017-06-01 2018-12-06 Gooee Limited Monitoring system
JP7117872B2 (ja) * 2018-03-28 2022-08-15 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、及びプログラム
WO2021146952A1 (zh) * 2020-01-21 2021-07-29 深圳市大疆创新科技有限公司 跟随方法、可移动平台、装置和存储介质
CN113450390B (zh) * 2021-09-01 2021-12-10 智道网联科技(北京)有限公司 一种基于路侧摄像头的目标跟踪方法、装置及电子设备

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3480591B2 (ja) * 1993-02-25 2003-12-22 ソニー株式会社 物体追尾装置
US5473369A (en) 1993-02-25 1995-12-05 Sony Corporation Object tracking apparatus
US7532771B2 (en) 2004-11-12 2009-05-12 Microsoft Corporation Image processing system for digital collage
JP4866227B2 (ja) 2006-12-15 2012-02-01 日本放送協会 自動追尾撮影装置
CN101064837A (zh) 2007-05-29 2007-10-31 王海燕 视频图像中多目标的跟踪方法
JP2009010453A (ja) 2007-06-26 2009-01-15 Sony Corp 画像処理装置および方法、並びにプログラム
JP4872834B2 (ja) 2007-07-04 2012-02-08 株式会社ニコン 画像認識装置、焦点調節装置および撮像装置
US8170280B2 (en) * 2007-12-03 2012-05-01 Digital Smiths, Inc. Integrated systems and methods for video-based object modeling, recognition, and tracking
EP2242253B1 (en) 2008-02-06 2019-04-03 Panasonic Intellectual Property Corporation of America Electronic camera and image processing method
CN101324958A (zh) 2008-06-25 2008-12-17 北京中星微电子有限公司 一种目标跟踪方法及装置
JP5054063B2 (ja) * 2009-05-07 2012-10-24 パナソニック株式会社 電子カメラ、画像処理装置及び画像処理方法
JP4818430B2 (ja) * 2009-12-28 2011-11-16 富士通セミコンダクター株式会社 移動物体認識方法及び装置
JP2011193443A (ja) 2010-02-16 2011-09-29 Ricoh Co Ltd 物体追尾装置
JP2012073997A (ja) 2010-09-01 2012-04-12 Ricoh Co Ltd 物体追尾装置、物体追尾方法およびそのプログラム

Also Published As

Publication number Publication date
EP2671208A1 (en) 2013-12-11
US9336606B2 (en) 2016-05-10
CN103339655A (zh) 2013-10-02
EP2671208A4 (en) 2015-12-02
WO2012105460A1 (en) 2012-08-09
EP2671208B1 (en) 2017-04-12
US20130314548A1 (en) 2013-11-28
KR101455018B1 (ko) 2014-10-27
KR20130112059A (ko) 2013-10-11
JP2012164002A (ja) 2012-08-30
CN103339655B (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
JP5720275B2 (ja) 撮像装置および撮像方法
JP6106921B2 (ja) 撮像装置、撮像方法および撮像プログラム
JP6271990B2 (ja) 画像処理装置、画像処理方法
JP4582423B2 (ja) 撮像装置、画像処理装置、撮像方法、及び画像処理方法
US8411159B2 (en) Method of detecting specific object region and digital camera
JP5210843B2 (ja) 撮像装置
JP5453573B2 (ja) 撮像装置、撮像方法およびプログラム
JP5699432B2 (ja) 画像処理装置
JP2006222933A (ja) ブレ補正方法および撮像装置
US9055212B2 (en) Imaging system, image processing method, and image processing program recording medium using framing information to capture image actually intended by user
EP2537331B1 (en) Imaging device including target tracking function
JP2009111716A (ja) 撮像装置、プログラムおよびテンプレート生成方法
JP2010279054A (ja) 撮像装置、画像処理装置、撮像方法、及び画像処理方法
JP5407373B2 (ja) 撮影装置、及びプログラム
JP6172973B2 (ja) 画像処理装置
JP2008090059A (ja) 撮像装置およびそのオートフォーカス制御方法
JP4807623B2 (ja) 撮像装置、撮像方法及び撮像プログラム
JP6486453B2 (ja) 画像処理装置、画像処理方法、プログラム
JP2008005438A (ja) 撮像装置及び撮像方法
US20220215643A1 (en) Image processing device, imaging device, image processing method, and recording medium
JP5278483B2 (ja) 撮像装置、撮像方法及び撮像プログラム
JP2007336228A (ja) 撮像装置及びその制御方法及びプログラム及び記憶媒体
JP2020086216A (ja) 撮像制御装置、撮像装置及び撮像制御プログラム
JP7549453B2 (ja) 画像処理装置及びその制御方法、撮像装置、プログラム、記憶媒体
JP7020387B2 (ja) 撮像制御装置、撮像装置及び撮像制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150309

R151 Written notification of patent or utility model registration

Ref document number: 5720275

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees