JP5127692B2 - 撮像装置及びその追尾方法 - Google Patents

撮像装置及びその追尾方法 Download PDF

Info

Publication number
JP5127692B2
JP5127692B2 JP2008330759A JP2008330759A JP5127692B2 JP 5127692 B2 JP5127692 B2 JP 5127692B2 JP 2008330759 A JP2008330759 A JP 2008330759A JP 2008330759 A JP2008330759 A JP 2008330759A JP 5127692 B2 JP5127692 B2 JP 5127692B2
Authority
JP
Japan
Prior art keywords
subject
tracking
image
region
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008330759A
Other languages
English (en)
Other versions
JP2010154287A (ja
JP2010154287A5 (ja
Inventor
秀哉 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008330759A priority Critical patent/JP5127692B2/ja
Publication of JP2010154287A publication Critical patent/JP2010154287A/ja
Publication of JP2010154287A5 publication Critical patent/JP2010154287A5/ja
Application granted granted Critical
Publication of JP5127692B2 publication Critical patent/JP5127692B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ビデオカメラやデジタルカメラ等の撮像装置において、動画像における被写体を特定して追尾する技術に関するものである。
画像から特定の被写体を自動的に検出する画像処理方法は、非常に有用であり、例えば動画像における人間の顔領域の特定に利用することができる。このような方法は、通信会議、マンマシンインタフェース、セキュリティ、人間の顔を追跡するためのモニタシステム、画像圧縮などの多くの分野で使用することができる。
また、撮影画像から顔を検出する技術によって、その検出結果を制御対象として焦点や露出を最適化させるデジタルカメラやデジタルビデオカメラが既に商品化されている。このような画像中から特定の被写体を検出する技術として、様々な手法が提案されているが、それらのほとんどはパターンマッチングに基づく手法である。
例えば、画像上の複数の異なる位置で部分画像を切り出し、その部分画像が顔領域の画像であるか否かを判別することで、画像上の顔領域を検出する方法が挙げられる。また、部分画像が顔領域であるか否かを判別する方法として、テンプレートマッチングによる手法や、ニューラルネットワークなどの学習手法により顔の特徴を学習させた識別器を用いる手法などが考えられる。
いずれの手法においても、顔領域検出のために、部分画像の画像パターンに基づいて、その部分画像が顔領域の画像である確からしさを示す信頼度を算出し、その信頼度が所定の閾値を超えた場合、その部分画像を顔領域の画像として検出する手法が一般的である。
特許文献1には、画像内に複数の特定の被写体が存在する場合であっても、より正確な自動焦点を行うために、複数の被写体から主被写体となる被写体を選択する機能を備えた撮像装置が示されている。
また、動画像のフレーム間での画像の相関値の算出による被写体の追尾技術が知られている。
また、特許文献2では、撮像された画像の中から合焦における対象被写体の画像を検出するために記憶しておく基準画像(基準パターン)を逐次更新して、対象被写体を検出し、自動焦点エリアを対象被写体に追尾させる自動焦点装置が示されている。
特開2002−051255号公報(第14頁、図1) 特開2006−058431号公報(第10頁、図3)
しかしながら、上記従来例では、つぎのような問題があった。顔検出に代表される、前述した特定の被写体を検出する技術は、画像中に顔を含むことを、確実な信頼性を持って示すことはなく、確率論的な判断に基づいていた。すなわち、この技術は、画像中に少なくとも顔を含む可能性があるという画像の数学的解析に基づいて行われた。ここで、この確率的数値を、顔らしさの信頼度と呼ぶ。
一般的に、この信頼度に所定の閾値を設定し、この信頼度が所定の閾値に達した場合、顔であることが判断される。しかし、上記所定の閾値を厳しく設定した場合、実際に被写体が存在するのにも拘わらず、被写体の検出を見逃してしまうおそれがあった。一方、上記所定の閾値を緩く設定すると、特定の被写体とは異なる領域を特定の被写体として検出する、いわゆる誤検出が多発するおそれがあった。つまり、正しい検出と誤検出にはトレードオフの関係があり、特定の値に決定することは難しいという問題があった。
また、被写体が正面を向いている場合、パターンマッチングよる顔判別は比較的容易であるが、側面を向いたり背面を向いたりした場合、顔の判別が困難になるという問題もあった。
特に、動画の場合、自動焦点や自動露出の対象が頻繁に遷移すると、落ち着きの無い映像になるので、対象の顔が左右を向いたり、上下を向いたりしても、主被写体を保持して撮影し続けたい。しかし、従来の主被写体検出技術では、主被写体の顔を検出できなくなった場合、直ちに別の顔が主被写体として扱われる。
このため、特徴としての主被写体の顔を検出できなくなった場合、フレーム間での画像の相関による被写体追尾技術を用いて、主被写体の顔相当の領域に自動焦点や自動露出の対象を追尾させ続けることが望まれる。
しかし、フレーム間での画像の相関による被写体追尾技術では、基準画像内に背景などの追尾対象以外の領域が多く含まれている場合、連続するフレーム間において、基準画像内に含まれる追尾対象以外の領域の類似性に引っ張られ、誤追尾を招く可能性が高い。
このため、追尾対象被写体の前で他の被写体と交差すると、基準画像内へ徐々に交差した被写体の画像が多く含まれるようになり、交差した被写体を誤追尾してしまうという課題があった。そして、誤追尾が続いている間、より主被写体に相応しい他の被写体へ自動焦点や自動露出の対象が遷移しないという課題があった。
そこで、本発明は、主被写体の頻繁な遷移を防ぎつつ、かつ、被写体の交差が起きる場合、主被写体以外への誤追尾を軽減し、新しい主被写体の選定を行う作業に復帰させることができる撮像装置及びその追尾方法を提供することを目的とする。
上記目的を達成するために、本発明の請求項1記載の撮像装置は、画像を撮像する撮像装置であって、画像から被写体を検出し、前記被写体の被写体領域情報を出力する被写体検出手段と、前記被写体検出手段から出力される前記被写体領域情報を用いて、動画像における同一の被写体を追尾被写体として特定する追尾被写体特定手段と、動画像のフレーム間の相関性に基づき、前記追尾被写体特定手段によって特定された追尾被写体を追尾する被写体追尾手段と、前記被写体追尾手段により追尾された追尾被写体と所定の条件を満たす領域に、前記被写体検出手段によって他の被写体が検出され、前記被写体検出手段から当該他の被写体の前記被写体領域情報が出力される場合、前記追尾被写体の追尾を終了させる追尾終了判断手段とを備え、前記所定の条件を満たす領域として、前記追尾被写体特定手段により特定された追尾被写体と重なる領域に、前記被写体検出手段によって他の被写体が検出され、前記被写体検出手段から当該他の被写体の前記被写体領域情報が出力される場合、前記追尾終了判断手段は、前記追尾被写体の追尾を終了させることを特徴とする。
上記目的を達成するために、本発明の請求項2記載の撮像装置は、画像を撮像する撮像装置であって、画像から被写体を検出し、前記被写体の被写体領域情報を出力する被写体検出手段と、前記被写体検出手段から出力される前記被写体領域情報を用いて、動画像における同一の被写体を追尾被写体として特定する追尾被写体特定手段と、動画像のフレーム間の相関性に基づき、前記追尾被写体特定手段によって特定された追尾被写体を追尾する被写体追尾手段と、前記被写体追尾手段により追尾された追尾被写体と所定の条件を満たす領域に、前記被写体検出手段によって他の被写体が検出され、前記被写体検出手段から当該他の被写体の前記被写体領域情報が出力される場合、前記追尾被写体の追尾を終了させる追尾終了判断手段と、を備え、前記所定の条件を満たす領域として、前記被写体追尾手段により追尾された追尾被写体の領域に対して所定の距離内において、前記被写体検出手段から当該他の被写体の前記被写体領域情報が出力される場合、前記追尾終了判断手段は、前記追尾被写体の追尾を終了させることを特徴とする。
上記目的を達成するために、本発明の請求項7記載の撮像装置の追尾方法は、画像を撮像する撮像装置の追尾方法であって、画像から被写体を検出し、前記被写体の被写体領域情報を出力する被写体検出ステップと、前記被写体検出ステップで出力される前記被写体領域情報を用いて、動画像における同一の被写体を追尾被写体として特定する追尾被写体特定ステップと、動画像のフレーム間の相関性に基づき、前記追尾被写体特定ステップで特定された追尾被写体を追尾する被写体追尾ステップと、前記被写体追尾ステップで追尾された追尾被写体と所定の条件を満たす領域に、前記被写体検出ステップで他の被写体が検出され、前記被写体検出ステップで当該他の被写体の前記被写体領域情報が出力される場合、前記追尾被写体の追尾を終了させる追尾終了判断ステップと、を有し、前記所定の条件を満たす領域として、前記追尾被写体特定ステップにより特定された追尾被写体と重なる領域に、前記被写体検出ステップによって他の被写体が検出され、前記被写体検出ステップから当該他の被写体の前記被写体領域情報が出力される場合、前記追尾終了判断ステップは、前記追尾被写体の追尾を終了させることを特徴とする。
上記目的を達成するために、本発明の請求項8記載の撮像装置の追尾方法は、画像を撮像する撮像装置の追尾方法であって、画像から被写体を検出し、前記被写体の被写体領域情報を出力する被写体検出ステップと、前記被写体検出ステップで出力される前記被写体領域情報を用いて、動画像における同一の被写体を追尾被写体として特定する追尾被写体特定ステップと、動画像のフレーム間の相関性に基づき、前記追尾被写体特定ステップで特定された追尾被写体を追尾する被写体追尾ステップと、前記被写体追尾ステップで追尾された追尾被写体と所定の条件を満たす領域に、前記被写体検出ステップで他の被写体が検出され、前記被写体検出ステップで当該他の被写体の前記被写体領域情報が出力される場合、前記追尾被写体の追尾を終了させる追尾終了判断ステップと、を有し、前記所定の条件を満たす領域として、前記被写体追尾ステップにより追尾された追尾被写体の領域に対して所定の距離内において、前記被写体検出ステップから当該他の被写体の前記被写体領域情報が出力される場合、前記追尾終了判断ステップは、前記追尾被写体の追尾を終了させることを特徴とする。
本発明の請求項1に係る撮像装置は、追尾被写体と所定の近接条件を満たす領域に、他の被写体が検出された場合、追尾被写体の追尾を終了させる。これにより、主被写体の頻繁な遷移を防ぎつつ、かつ、被写体の交差が起きる場合、主被写体以外への誤追尾を軽減し、新しい主被写体の選定を行う作業に復帰させることができる。さらに、被写体の交差が起きる場合として、追尾被写体と重なる領域に、他の被写体が検出された場合、追尾を終了させるので、誤追尾を確実に軽減することができる。
本発明の請求項2に係る撮像装置によれば、追尾被写体の領域に対して所定の距離内で被写体検出手段から他の被写体の被写体領域情報が出力される場合に、追尾を終了させる。これにより、被写体の交差が予測される場合において、主被写体以外への誤追尾を軽減することができる。
請求項3に係る撮像装置によれば、他の被写体を検出する領域を動画像のフレーム間の相関性をとる距離内に設定することで、次回の被写体の交差を適切に予測することができる。
請求項4に係る撮像装置によれば、検出された他の被写体のサイズと追尾被写体のサイズとを比較することで、交差する可能性が高いか低いかを判断し、追尾の終了あるいは継続を適切に行うことができる。
請求項5に係る撮像装置によれば、追尾被写体のサイズを同一の被写体が検出された時点の当該被写体のサイズにするので、被写体のサイズの比較を正確に行うことができる。
請求項6に係る撮像装置によれば、検出された被写体の信頼度が低い場合、被写体領域情報を出力しないので、被写体の検出の信頼度を高めることができる。
本発明の撮像装置及びその追尾方法の実施の形態について図面を参照しながら説明する。
[第1の実施形態]
図1は第1の実施形態における撮像装置の構成を示すブロック図である。この撮像装置では、測距AF用瞳分割光学系101を通して、位相差検出センサ100に2つの被写体像が結像する。この位相差検出センサ100によって2つの像の位相差量を検出することで、三角測距法により被写体までの距離信号がフォーカス制御回路110に入力される。なお、測距AF用瞳分割光学系と位相差検出センサの組合せによる三角測距の原理は公知であるので、その詳細な説明を省略する。
ズームレンズ102は、光軸方向に移動して撮影光学系の焦点距離を変更可能である。ズームモータ103は、ズーム制御回路104の指令で駆動され、ズームレンズ102を移動させる。フォーカスレンズ105は、光軸方向に移動して撮影光学系の焦点調節を行う。フォーカスモータ106は、フォーカス制御回路110の指令で駆動され、フォーカスレンズ105を移動させる。
撮像素子107はCMOSセンサ等である。撮像素子107に結像した被写体像は、光電変換され、撮像信号処理回路108から撮像信号として出力される。撮像信号処理回路108から出力された撮像信号は、AF信号処理回路109に入力される。
AF信号処理回路109は、コントラスト検出方式のAF制御のためのFV信号(AF評価値)と合焦度を表すIFA信号を生成し、フォーカス制御回路110に出力する。
フォーカス制御回路110は、距離信号、AF評価値FVおよび合焦度IFAに基づき、フォーカスモータ106を駆動することで、フォーカスレンズ105を移動させ、自動焦点(AF)制御を行う。
撮像信号処理回路108から出力された画像信号は、メモリ113に一時的に蓄積される。メモリ113に蓄積された画像信号は、コーデック114によって圧縮処理され、記録媒体112に記録される。この圧縮・記録処理と並行して、メモリ113に蓄積された画像信号は、画像処理回路115によって最適なサイズにリサイズ処理されるとともに、顔枠等が重畳し、モニタ118に表示される。こうして、撮影画像はリアルタイムで撮影者にフィードバックされる。また、撮影直後、モニタ118に所定時間だけ撮影画像が表示されるので、撮影画像の確認を行うことも可能になる。
顔検出部116(被写体検出手段)は、撮像信号処理回路108からメモリ113に出力された画像信号による画像と、予めメモリ113の内部に記憶されたデータベース画像とをテンプレートマッチング等により比較する。この比較によって、複数の被写体における、顔の位置や大きさ、顔の数、顔の信頼度(確からしさ)等の情報がCPU111に出力される。
ここで、信頼度とは、検出結果の確からしさを示した値であり、顔検出の処理過程の中で決定される。また、信頼度の算出方法の一例として、予め記憶された被写体の画像の特徴と、顔検出部116により検出された領域の画像の特徴とを比較し、検出された顔領域の画像が被写体の画像である確率を求め、この確率から信頼度を算出する方法がある。その他、予め記憶された被写体の画像の特徴と、顔検出部116により検出された顔領域の画像の特徴との差を算出し、その差の大きさから信頼度を算出する方法などがある。
そして、出力された信頼度のレベルが高い場合、誤検出の可能性が低く、出力された信頼度のレベルが低い場合、誤検出の可能性が高い。なお、テンプレートマッチングの顔検出方式は単なる一例であり、本発明は他の方式で顔の検出を行ってもよい。
画像相関追尾部117は、メモリ113に蓄積された過去の画像(例えば1フレーム前)と現在の画像を比較することで、後述するように、被写体の位置を特定し、CPU111に出力する。これにより、被写体の追尾が可能になる。
CPU111は、顔検出部116からの顔の位置や大きさ、信頼度および画像相関追尾部117からの被写体位置情報に基づき、被写体位置を決定し、フォーカス/測光すべき画面内の位置を特定する。また、図1に示すように、CPU111および各ブロックは、バス119を介して接続されている。各ブロックは、CPU111がその内部のプログラムを実行することによって制御される。
次に、画像相関追尾部117の動作を、図2に基づいて説明する。画像相関追尾部117は、撮影画像(現在の撮影画像)P(201)と、過去の基準となる記憶画像Q(202)を比較することにより、追尾対象の被写体を抽出する。この場合、画像相関追尾部117は、基準となる記憶画像Qとしては、例えばメモリ113に一時記憶された1フレーム過去の画像を用いる。
例えば、同図(A)では、基準となる記憶画像Qにおいて、追尾対象である被写体が存在する基準エリア204がQ(I’,J’)、Q(I”,J’)、Q(I’,J”)およびQ(I”,J”)で囲まれたエリアに設定されている。
画像相関追尾部117は、現在の撮影画像Pに基準エリア204と同じサイズの比較エリア203を設定し、この比較エリア203と基準エリア204の間で、対応する位置の画素の画素値を比較し、その総和を相関値Lとして計算する。
この比較エリア203は、基準エリア204と同じ座標となる位置を基準位置として、それぞれ所定の画素数だけ正/負方向に2次元空間的にシフトされ、基準位置およびシフトされた位置のそれぞれにおいて、相関値Lが求められる。
ここで、基準エリア204内の画素の画素値をQ(i,j)、基準エリア204と同じ座標となる基準位置から水平方向にn、垂直方向にmだけシフトさせた比較エリア203内の画素の画素値をP(i+n,j+m)とする。この位置おける基準エリア204と比較エリア203の相関値L(n,m)を計算するための式は、下記(1)で表される。
Figure 0005127692

ただし、n=0,±1,±2、…±N
m=0,±1,±2、…±M
画像相関追尾部117は、例えば基準エリア204と同じ座標となる基準位置、すなわちn=0,m=0の場合の相関値を、L(0,0)として出力する。そして、画像相関追尾部117は、n,mを、それぞれ所定の画素数だけ正/負方向に2次元空間的にシフトしながら相関値L(n,m)を求める。現在の撮影画像P(201)上に点線で示した範囲205は、n,mをそれぞれ0〜±N、0〜±Mまで変化させたときに、比較エリアとなり得る範囲を示したものである。
次に、画像相関追尾部117は、範囲205内の全てのシフト位置における相関値L(n,m)の最大値と最小値の差を求め、この差を最大相関差TLVとして出力する。
同図(B)は、最大相関差TLVが大きい場合を例示し、同図(C)は最大相関差TLVが小さい場合を例示している。同図(B)、(C)では、1次元でのグラフになっているが、画像相関追尾部117は、実際には2次元の空間的に最大相関差TLVを計算する。
相関値Lは、2つの画像が一致すると小さくなり、2つの画像が一致しないと大きくなるため、一致する画像が比較エリアの中に存在する場合は、最大相関差TLVが大きくなり、一致する画像がはっきりしないときには、TLVが小さくなる可能性が高い。
最大相関差TLVを算出するのは、実際には、被写体の風や振動での揺れ等や、被写体の回転等があり、2つの画像がぴったり一致しないために、追尾被写体の確からしさを最大相関差TLVを用いて評価するためである。
そして、画像相関追尾部117は、最大相関差TLVが閾値以上であれば、相関値L(n,m)が最大であった比較エリアを新たな基準エリア204として更新し、追尾動作を行う。このように、動画像のフレーム間の相関性に基づき、最大相関差TLVとなる位置を繰り返し見つけることで、追尾動作を行う(被写体追尾手段)。
なお、2つの画像の相関の取り方には、さまざまな方式が考えられるので、本実施形態のように、画像比較による相関演算の方式は、単なる一例である。本発明はこの相関演算の方式にとらわれるものではない。
つぎに、顔検出部116から出力された顔検出データを用いて、顔のIDを決定した後、顔のIDを維持し続ける処理について説明する。まず、図3を用いて、顔のIDを決定し、顔のIDを保持する条件について説明する。図3はフレームnの被写体jおよび1フレーム前のフレームn−1の被写体iを示す図である。
顔検出部116から受け取ったNフレーム目の被写体の顔Aに対する顔検出データは、信頼度=RLV(A,N)、位置X=FXP(A,N)、位置Y=FYP(A,N)、サイズ=FW(A,N)である。また、検出された顔総数はFMAX(N)である。
n−1フレームの顔i(i=1〜FMAX(n−1))と、nフレームの顔j(j=1〜FMAX(n))とが、顔位置を基準にして、同一の顔であるか否かは、数式(2)に従って判断される。この数式(2)を条件式Aとする。
条件式A: (|FXP(j,n)−FXP(i,n−1)|+|FYP(j,n)−FYP(i,n−1)|)/FW(j,n) < PTH1 …… (2)
また、n−1フレームの顔i(i=1〜FMAX(n−1))と、nフレームの顔j(j=1〜FMAX(n))とが、顔の大きさを基準にして、同一の顔であるか否かは、数式(3)に従って判断される。この数式(3)を条件式Bとする。
条件式B: |FW(j,n)−FW(i,n−1)|/FW(j,n) < WTH1 …… (3)
また、nフレームにおいて検出された顔jの信頼度が所定値RTH1よりも高いか否かは、数式(4)に従って判断される。この数式(4)を条件式Cとする。
条件式C: RLV(j,n)>RTH1 …… (4)
また、n−1フレームにおいて検出された顔iの信頼度が所定値RTH1よりも高いか否かは、数式(5)に従って判断される。
条件式D: RLV(i,n−1)>RTH1 …… (5)
図4は顔のID検出処理手順を示すフローチャートである。この処理プログラムはCPU111内のROMに格納されており、CPU111によって実行される。ここでは、nフレーム目の処理を示す。
顔のID検出処理を開始すると、まず、CPU111は、顔検出部116からの顔検出データ(各顔の信頼度、位置X、位置Y、サイズ)を受け取る(ステップS1)。なお、位置X、位置Y、サイズは被写体領域情報の一例である。CPU111は、顔検出総数FMAX(n)を顔検出部116から受信する(ステップS2)。
CPU111は、被写体を表す変数FNOに値1を代入する(ステップS3)。CPU111は、j=FNOの被写体である顔について、条件式Cを満たすか否かを判別する(ステップS4)。条件式Cを満たさない場合、CPU111はステップS9の処理に進む。
一方、条件式Cを満たす場合、CPU111は、j=FNOの顔について、i=1〜FMAX(n−1)の全ての顔に対し、条件式A、条件式Bおよび条件式Dの評価を行い、これら全ての条件を満たす顔が存在するか否かを判別する(ステップS5)。
CPU111は、ステップS5の判別の結果、前フレームで検出された顔iと同一の顔が存在するか否かを判断する(ステップS6)。同一の顔が存在しない(N)場合、CPU111は、新規の顔であるとして、新規に顔のIDを割り当てるとともに、顔の位置や大きさ、信頼度等のデータを登録する(ステップS7)。
一方、同一の顔が存在する(Y)場合、CPU111は、従来と同じ顔であるので、従来のIDを引き継ぎ、従来のIDに対し、顔の位置や大きさ、信頼度等のデータを更新する(ステップS8)。
ステップS7、S8の処理後、CPU111は、変数FNOの値をインクリメントする(ステップS9)。CPU111は、変数FNOが最大値FMAX(n)を超えたか否かを判断する(ステップS10)。最大値FMAX(n)を超えていない場合(N)、CPU111はステップS4の処理に戻る。一方、最大値FMAX(n)を越えた場合(Y)、CPU111は本処理を終了する。
図5は顔のIDを検出する動作を繰り返した際の信頼度および顔のIDの遷移を示す図である。図中、(1)では、初めての顔を検出したので、ID=01のIDが検出される。(2)、(3)、(4)では、近傍に顔が存在するので、ID=01のIDが継続して検出される。(5)では、信頼度が所定値RTH1(ここでは、値2)以下であるので、顔は検出されないとみなされる。(6)、(7)でも、同様に顔は検出されないとみなされる。(8)では、信頼度が所定値RTH1より大きいので、新規に顔を検出し、ID=02が割り当てられる。(9)、(10)、(11)、(12)では、近傍に顔が存在するので、ID=02のIDが継続して検出される。
つぎに、画像相関追尾部117の追尾データと顔のIDデータを用いて行われる被写体追尾終了判断について説明する。図6および図7は相関追尾処理手順を示すフローチャートである。この処理プログラムはCPU111内のROMに格納されており、CPU111によって実行される。
CPU111は、被写体である顔のIDを表す変数IDNOに値1を代入する(ステップS21)。CPU111は、変数IDNOのIDが、以前のフレームの画像における顔検出部116の直近の処理で顔が検出されたIDであるか否かを判断する(ステップS22)。顔検出部116の直近の処理で顔が検出されたIDでない場合、CPU111は、前回の追尾結果から、追尾対象の位置、大きさ等を引き継ぐ(ステップS23)。
一方、CPU111は、顔検出部116の直近の処理で顔が検出されたIDである場合、顔検出部116から引き継いだ顔の位置や大きさから、追尾対象の位置や大きさを決定する(ステップS24)。このステップS24の処理は追尾被写体特定手段の一例である。
ステップS23、S24の処理後、CPU111は、変数IDNOの被写体である顔に対し、画像相関追尾部117により、新たに得られたフレームの画像(以下、着目画像という)において相関量が最大になる被写体位置を特定する(ステップS25)。
CPU111は、ステップS25の最大相関差TLVが所定の閾値TTHよりも小さいか否かを判定する(ステップS26)。閾値TTHより小さくない場合、CPU111は、顔検出部116でこの着目画像から検出された全ての顔のデータを取得する(ステップS27)。
そして、CPU111は、変数IDNOの被写体に対する追尾領域と重なる領域に、顔として検出されたIDがあるか否かを判断する(ステップS28)。この顔として検出されたIDは、被写体検出手段から出力される他の被写体の被写体領域情報の一例である。
追尾領域と重なる領域に、顔として検出されたIDがある場合、CPU111は、変数IDNOの被写体に対して追尾処理を終了する(ステップS30)。さらに、CPU111は、変数IDNOのIDを削除する(ステップS31)。
一方、ステップS26で閾値TTHよりも小さい場合、CPU111は、変数IDNOの被写体に対して追尾処理を終了する(ステップS32)。さらに、CPU111は、変数IDNOの被写体が顔検出部116で着目画像から検出された顔のIDか否かを調査する(ステップS33)。変数IDNOの被写体が検出された顔のIDでない場合、ステップS31の処理に進む。
一方、ステップS28で追尾領域と重なる領域に顔として検出されたIDが無い場合、CPU111は、変数IDNOの被写体の位置や大きさを、ステップS25で特定された位置や大きさにデータを更新する(ステップS29)。
ステップS29、S31の処理後、あるいはステップS33で変数IDNOの被写体が検出された顔のIDである場合、CPU111は、変数IDNOの値をインクリメントする(ステップS34)。
CPU111は、変数IDNOが最大値IDMAXよりも大きいか否かを判別する(ステップS35)。最大値IDMAXより大きい場合、CPU111は、削除されたID等を考慮し、IDの総数であるIDMAX値を最新の値に更新する(ステップS36)。この後、CPU111は相関追尾処理を終了する。一方、変数IDNOが最大値IDMAXよりも大きくない場合、CPU111はステップS22の処理に進む。
図8は追尾動作の遷移を示す図である。図中、(1)では、信頼度が高く、2つとも顔検出された被写体であるので、ID=01、02が特定されている。また、これと同時に、主被写体としたID=01に対し、以前のフレーム画像における直近の顔検出結果を基準エリアとして、画像相関による被写体追尾も行われている。
(2)では、近傍に顔が存在するので、ID=01、02が継続して検出されるとともに、画像相関による被写体追尾も、基準エリアを顔検出された位置で更新しつつ行われている。
(3)、(4)では、近傍に顔が存在するので、ID=02が継続して検出されるが、ID=01の信頼度が所定値RTH1(ここでは、値2)以下であるので、ID=01は顔検出されたとみなされない。しかし、画像相関追尾部117では、最大相関差TLVが所定閾値TTHよりも小さくないので、ID=01はそのまま引き継がれる。
(5)では、被写体の交差が起きたにもかかわらず、近傍に顔が存在するので、ID=02が継続して検出され、画像相関追尾部117では、最大相関差TLVが閾値TTHよりも小さくないので、ID=01のつもりでID=02を追尾しようとする。しかし、追尾領域と重なる領域に、顔として検出されたID=02があるので、前述した図6のステップS28の判断により、ステップS30で追尾が終了する。さらに、ステップS31でID=01が削除されるので、誤追尾を止めることができる。
(6)では、信頼度が高く、顔検出された被写体であるので、ID=02が特定されると同時に、再び新しい主被写体の選定を行う作業に復帰することが可能になる。
このように、第1の実施形態の撮像装置は、追尾被写体と所定の近接条件を満たす領域に、他の被写体が検出された場合、追尾被写体の追尾を終了させる。これにより、主被写体の頻繁な遷移を防ぎつつ、かつ、被写体の交差が起きた場合、主被写体以外への誤追尾を軽減し、新しい主被写体の選定を行う作業に復帰させることができる。
また、被写体の交差が起きる場合として、追尾被写体と重なる領域に、他の被写体が検出された場合、追尾を終了させるので、誤追尾を確実に軽減することができる。
また、検出された被写体の信頼度が低い場合、被写体領域情報(被写体の顔の位置や大きさ)を出力しないので、被写体の検出の信頼度を高めることができる。
[第2の実施形態]
第2の実施形態における撮像装置のハードウエア構成は、前記第1の実施形態と同じであるので、同一の符号を用いることで、その説明を省略する。また、画像相関追尾部117における、過去の記憶画像Qと現在の撮影画像Pとの画像比較は、前記第1の実施形態の図2で示したとおりである。過去の記憶画像Qとして、例えば、メモリ113に一時記憶された1フレーム過去の画像が挙げられる。また、顔のID検出処理は、前記第1の実施形態の図4で示したとおりである。
図9および図10は第2の実施形態における相関追尾処理手順を示すフローチャートである。この処理プログラムはCPU111内のROMに格納されており、CPU111によって実行される。前記第1の実施形態と同一のステップ処理については、同一のステップ番号を付すことにより、その説明を省略する。
CPU111は、ステップS26で最大相関差TLVが所定の閾値TTHよりも小さいか否かを判定する。閾値TTHより小さくない場合、CPU111は、ステップS27で顔検出部116により着目画像から検出された全ての顔のデータを取得する。
CPU111は、今回の画像相関のサーチ範囲(追尾被写体の領域に対して所定の距離)内に、顔として検出されたIDがあるか否かを判断する(ステップS28A)。顔として検出されたIDが無い場合、CPU111はステップS34の処理に進む。一方、今回の画像相関のサーチ範囲内に、顔として検出されたIDがある場合、CPU111は、顔として検出されたIDが前回も存在していたか、つまり複数回連続で検出されたか否かを判断する(ステップS28B)。顔として検出されたIDが前回存在していない場合、CPU111はステップS28Cの処理に進む。
一方、顔として検出されたIDが前回も存在していた場合、CPU111は、顔として検出されたIDが割り当てられている被写体の顔サイズが追尾中の被写体の顔サイズより大きいか否かを判断する(ステップS28D)。
顔として検出されたIDが割り当てられている被写体の顔サイズが、追尾中の被写体の顔サイズより大きい場合、近距離側にいることになる。この場合、CPU111は、手前を交差する可能性が高い、つまり、顔として検出されたIDが割り当てられている被写体と、変数IDNOの被写体が交差する可能性が高いと判断する(ステップS28E)。そして、CPU111は、前述したステップS30で追尾を終了させる。
このように、第2の実施形態では、前記第1の実施形態と異なる処理が行われる。すなわち、検出された顔の範囲と追尾領域自体とが重なっているわけではないが、前回離れていたのに、今回検出された顔が画像相関のサーチ範囲内に入ってきたということで、CPU111は、次回の交差を予測し、次回の誤追尾を防ぐために追尾を終了させる。
一方、ステップS28Dで追尾中の被写体の顔サイズより小さい場合、検出された被写体が遠距離側にいることになる。この場合、CPU111は、手前を交差する可能性が低い、つまり、顔として検出されたIDが割り当てられている被写体と変数IDNOの被写体とが交差する可能性がまだ低いと判断する(ステップS28C)。そして、CPU111は、前述したステップS29で追尾を継続し、変数IDNOの被写体の位置や大きさを、ステップS25で特定された位置や大きさにデータを更新する。
図11は追尾動作の遷移を示す図である。図中、(1)では、信頼度が高く、2つとも顔検出された被写体であるので、ID=01、02が特定されている。また、これと同時に、主被写体とした、番号の小さいID=01に対し、同じ位置を基準エリアとして画像相関による被写体追尾も行われている。(2)では、近傍に顔が存在するので、ID=01、02が継続して検出されるとともに、画像相関による被写体追尾も、基準エリアを顔検出された位置で更新しつつ行われている。
(3)、(4)、(5)では、近傍に顔が存在するので、ID=02が継続して検出されるが、ID=01は信頼度が所定値RTH1(ここでは、値2)以下であるので、顔は検出されたとみなされない。しかし、画像相関追尾部117では、最大相関差TLVが所定の閾値TTHよりも小さくなく、かつ、画像相関サーチ範囲に検出されたIDが無いので、ID=01はそのまま引き継がれる。
(6)では、近傍に顔が存在するので、ID=02が継続して検出され、画像相関追尾部117では、最大相関差TLVが所定閾値TTHよりも小さくないので、ID=01はそのまま引き継がれる。しかし、画像相関サーチ範囲内に、顔として検出され、かつ(2)時点でのID=01の顔サイズより小さくない顔サイズのID=02がある。従って、ステップS28A、S28B、S28DでYESの処理が行われ、ステップS30で次回の手前での交差が予測され、追尾が終了する。そして、ID=01が削除されるので、誤追尾を防ぐことができる。
(7)、(8)では、信頼度が高く、顔検出された被写体であるので、ID=02が特定されていると同時に、再び新しい主被写体の選定を行う作業に復帰することが可能になる。
このように、第2の実施形態の撮像装置は、追尾被写体の領域に対して所定の距離内に、同一の他の被写体が複数回連続で検出された場合、追尾を終了させる。これにより、主被写体の頻繁な遷移を防ぎつつ、かつ、被写体の交差を予測した場合、主被写体以外への誤追尾を軽減し、新しい主被写体の選定を行う作業に復帰させることができる。
また、他の被写体を検出する領域を画像相関サーチ範囲内に設定することで、次回の被写体の交差を適切に予測することができる。また、顔として検出されたIDが割り当てられている被写体のサイズと、変数IDNOの被写体(追尾被写体)のサイズとを比較することで、交差する可能性が高いか低いかを判断し、追尾の終了あるいは継続を適切に行うことができる。
また、追尾被写体のサイズを同一の被写体が検出された時点の当該被写体のサイズにするので、被写体のサイズの比較を正確に行うことができる。
なお、本発明は、上記実施形態の構成に限られるものではなく、特許請求の範囲で示した機能、または本実施形態の構成が持つ機能が達成できる構成であればどのようなものであっても適用可能である。
例えば、上記実施形態では、顔検出部および画像相関追尾部は専用のハードウエアで実現され、その他の動作はCPUが実行するソフトウエアの処理として実現された。しかし、全ての動作をCPUが実行するソフトウエアの処理として実現しても構わないし、ハードウエアで実現しても構わないことは言うまでもない。
また、本発明は、顔検出の方式や画像相関追尾の方式にとらわれるものではない。さらに、顔検出は単なる一例である。本発明の撮像装置は、被写体を検出するものである限り、顔に限らず、人間、動物、自動車等の被写体を検出するものでもよい。
また、本発明は、画像(静止画像、動画像)を撮像する撮像装置に適用されるものであり、例えばデジタルビデオカメラ、コンパクトタイプのデジタルカメラ、デジタルSLR(一眼レフカメラ)、監視カメラ等にも適用可能である。
第1の実施形態における撮像装置の構成を示すブロック図である。 画像相関追尾部117における、過去の記憶画像Qと現在の撮影画像Pとの画像比較を説明する図である。 フレームnの被写体jおよび1フレーム前のフレームn−1の被写体iを示す図である。 顔のID検出処理手順を示すフローチャートである。 顔のIDを検出する動作を繰り返した際の信頼度および顔のIDの遷移を示す図である。 相関追尾処理手順を示すフローチャートである。 図6につづく相関追尾処理手順を示すフローチャートである。 追尾動作の遷移を示す図である。 第2の実施形態における相関追尾処理手順を示すフローチャートである。 図9につづく相関追尾処理手順を示すフローチャートである。 追尾動作の遷移を示す図である。
符号の説明
111 CPU
116 顔検出部
117 画像相関追尾部
201 撮影画像P
202 記憶画像Q
203 比較エリア

Claims (8)

  1. 画像を撮像する撮像装置であって、
    画像から被写体を検出し、前記被写体の被写体領域情報を出力する被写体検出手段と、
    前記被写体検出手段から出力される前記被写体領域情報を用いて、動画像における同一の被写体を追尾被写体として特定する追尾被写体特定手段と、
    動画像のフレーム間の相関性に基づき、前記追尾被写体特定手段によって特定された追尾被写体を追尾する被写体追尾手段と、
    前記被写体追尾手段により追尾された追尾被写体と所定の条件を満たす領域に、前記被写体検出手段によって他の被写体が検出され、前記被写体検出手段から当該他の被写体の前記被写体領域情報が出力される場合、前記追尾被写体の追尾を終了させる追尾終了判断手段とを備え
    前記所定の条件を満たす領域として、前記追尾被写体特定手段により特定された追尾被写体と重なる領域に、前記被写体検出手段によって他の被写体が検出され、前記被写体検出手段から当該他の被写体の前記被写体領域情報が出力される場合、前記追尾終了判断手段は、前記追尾被写体の追尾を終了させることを特徴とする撮像装置。
  2. 画像を撮像する撮像装置であって、
    画像から被写体を検出し、前記被写体の被写体領域情報を出力する被写体検出手段と、
    前記被写体検出手段から出力される前記被写体領域情報を用いて、動画像における同一の被写体を追尾被写体として特定する追尾被写体特定手段と、
    動画像のフレーム間の相関性に基づき、前記追尾被写体特定手段によって特定された追尾被写体を追尾する被写体追尾手段と、
    前記被写体追尾手段により追尾された追尾被写体と所定の条件を満たす領域に、前記被写体検出手段によって他の被写体が検出され、前記被写体検出手段から当該他の被写体の前記被写体領域情報が出力される場合、前記追尾被写体の追尾を終了させる追尾終了判断手段とを備え
    前記所定の条件を満たす領域として、前記被写体追尾手段により追尾された追尾被写体の領域に対して所定の距離内において、前記被写体検出手段から当該他の被写体の前記被写体領域情報が出力される場合、前記追尾終了判断手段は、前記追尾被写体の追尾を終了させることを特徴とする撮像装置。
  3. 前記所定の距離は、前記被写体追尾手段において、前記動画像のフレーム間の相関性をとる距離であることを特徴とする請求項記載の撮像装置。
  4. 前記被写体検出手段によって検出される前記他の被写体のサイズが、前記追尾被写体特定手段によって特定された追尾被写体のサイズより大きい場合、前記追尾終了判断手段は、前記追尾被写体の追尾を終了させ、一方、当該追尾被写体のサイズより小さい場合、前記追尾終了判断手段は、前記追尾被写体の追尾を継続させることを特徴とする請求項記載の撮像装置。
  5. 前記追尾被写体のサイズは、前記被写体検出手段によって同一の被写体が検出された時点の当該被写体のサイズであることを特徴とする請求項記載の撮像装置。
  6. 前記被写体検出手段は、前記検出した被写体の信頼度が所定値より高くない場合、当該被写体の前記被写体領域情報を出力しないことを特徴とする請求項1記載の撮像装置。
  7. 画像を撮像する撮像装置の追尾方法であって、
    画像から被写体を検出し、前記被写体の被写体領域情報を出力する被写体検出ステップと、
    前記被写体検出ステップで出力される前記被写体領域情報を用いて、動画像における同一の被写体を追尾被写体として特定する追尾被写体特定ステップと、
    動画像のフレーム間の相関性に基づき、前記追尾被写体特定ステップで特定された追尾被写体を追尾する被写体追尾ステップと、
    前記被写体追尾ステップで追尾された追尾被写体と所定の条件を満たす領域に、前記被写体検出ステップで他の被写体が検出され、前記被写体検出ステップで当該他の被写体の前記被写体領域情報が出力される場合、前記追尾被写体の追尾を終了させる追尾終了判断ステップとを有し、
    前記所定の条件を満たす領域として、前記追尾被写体特定ステップにより特定された追尾被写体と重なる領域に、前記被写体検出ステップによって他の被写体が検出され、前記被写体検出ステップから当該他の被写体の前記被写体領域情報が出力される場合、前記追尾終了判断ステップは、前記追尾被写体の追尾を終了させることを特徴とする撮像装置の追尾方法。
  8. 画像を撮像する撮像装置の追尾方法であって、
    画像から被写体を検出し、前記被写体の被写体領域情報を出力する被写体検出ステップと、
    前記被写体検出ステップで出力される前記被写体領域情報を用いて、動画像における同一の被写体を追尾被写体として特定する追尾被写体特定ステップと、
    動画像のフレーム間の相関性に基づき、前記追尾被写体特定ステップで特定された追尾被写体を追尾する被写体追尾ステップと、
    前記被写体追尾ステップで追尾された追尾被写体と所定の条件を満たす領域に、前記被写体検出ステップで他の被写体が検出され、前記被写体検出ステップで当該他の被写体の前記被写体領域情報が出力される場合、前記追尾被写体の追尾を終了させる追尾終了判断ステップとを有し、
    前記所定の条件を満たす領域として、前記被写体追尾ステップにより追尾された追尾被写体の領域に対して所定の距離内において、前記被写体検出ステップから当該他の被写体の前記被写体領域情報が出力される場合、前記追尾終了判断ステップは、前記追尾被写体の追尾を終了させることを特徴とする撮像装置の追尾方法。
JP2008330759A 2008-12-25 2008-12-25 撮像装置及びその追尾方法 Active JP5127692B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008330759A JP5127692B2 (ja) 2008-12-25 2008-12-25 撮像装置及びその追尾方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008330759A JP5127692B2 (ja) 2008-12-25 2008-12-25 撮像装置及びその追尾方法

Publications (3)

Publication Number Publication Date
JP2010154287A JP2010154287A (ja) 2010-07-08
JP2010154287A5 JP2010154287A5 (ja) 2012-02-02
JP5127692B2 true JP5127692B2 (ja) 2013-01-23

Family

ID=42572827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008330759A Active JP5127692B2 (ja) 2008-12-25 2008-12-25 撮像装置及びその追尾方法

Country Status (1)

Country Link
JP (1) JP5127692B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103988227B (zh) * 2011-12-16 2017-08-04 诺基亚技术有限公司 用于图像捕获目标锁定的方法和装置
JP6025557B2 (ja) * 2012-12-27 2016-11-16 キヤノン株式会社 画像認識装置、その制御方法及びプログラム
JP6136504B2 (ja) * 2013-04-15 2017-05-31 オムロン株式会社 対象画像検出デバイス、その制御方法および制御プログラム、記録媒体、並びにデジタルカメラ
JP2015102602A (ja) * 2013-11-21 2015-06-04 キヤノン株式会社 立体撮像装置、立体撮像システム、立体撮像装置の制御方法、プログラム、および、記憶媒体
CN112836682A (zh) * 2021-03-04 2021-05-25 广东建邦计算机软件股份有限公司 视频中对象的识别方法、装置、计算机设备和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4339464B2 (ja) * 1999-10-07 2009-10-07 ダイコク電機株式会社 監視装置
JP3846553B2 (ja) * 2001-03-30 2006-11-15 三菱電機株式会社 画像処理装置
JP4650669B2 (ja) * 2004-11-04 2011-03-16 富士ゼロックス株式会社 動体認識装置
JP2006258944A (ja) * 2005-03-15 2006-09-28 Fujinon Corp オートフォーカスシステム

Also Published As

Publication number Publication date
JP2010154287A (ja) 2010-07-08

Similar Documents

Publication Publication Date Title
CN107438173B (zh) 视频处理装置、视频处理方法和存储介质
JP4241742B2 (ja) 自動追尾装置及び自動追尾方法
US8068639B2 (en) Image pickup apparatus, control method therefor, and computer program for detecting image blur according to movement speed and change in size of face area
US8682040B2 (en) Image processing apparatus, image processing method, and image capturing apparatus
US9501834B2 (en) Image capture for later refocusing or focus-manipulation
US9823331B2 (en) Object detecting apparatus, image capturing apparatus, method for controlling object detecting apparatus, and storage medium
CN108337429B (zh) 图像处理设备和图像处理方法
JP2009031760A (ja) 撮像装置及びオートフォーカス制御方法
KR20160020498A (ko) 트랙커 보조 이미지 캡쳐
US8237799B2 (en) Imaging apparatus
EP3205084A1 (en) Image processing method
CN105629628A (zh) 自动对焦方法及装置
JP5127692B2 (ja) 撮像装置及びその追尾方法
US20190379819A1 (en) Detection of main object for camera auto focus
JP5392198B2 (ja) 測距装置及び撮像装置
CN108702456A (zh) 一种对焦方法、设备及可读存储介质
JP2007067559A (ja) 画像処理方法、画像処理装置、及び撮像装置の制御方法
JP2005346425A (ja) 自動追尾装置及び自動追尾方法
US9357124B2 (en) Focusing control device and controlling method of the same
JP5454392B2 (ja) 測距装置及び撮像装置
US20100194972A1 (en) Focusing device and image pickup apparatus
JP2017195458A (ja) 動きベクトル検出装置、撮像装置、動きベクトル検出方法、プログラム、および、記憶媒体
CN106454066B (zh) 图像处理设备及其控制方法
US20230179867A1 (en) Control apparatus, control method, and non-transitory storage medium
JP6639151B2 (ja) 撮像制御装置、撮像装置および撮像制御プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120925

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121002

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121030

R151 Written notification of patent or utility model registration

Ref document number: 5127692

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151109

Year of fee payment: 3