JP5253227B2 - 画像入力装置及び被写体検出方法、プログラム - Google Patents

画像入力装置及び被写体検出方法、プログラム Download PDF

Info

Publication number
JP5253227B2
JP5253227B2 JP2009038485A JP2009038485A JP5253227B2 JP 5253227 B2 JP5253227 B2 JP 5253227B2 JP 2009038485 A JP2009038485 A JP 2009038485A JP 2009038485 A JP2009038485 A JP 2009038485A JP 5253227 B2 JP5253227 B2 JP 5253227B2
Authority
JP
Japan
Prior art keywords
face
tracking
image
subject
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009038485A
Other languages
English (en)
Other versions
JP2010193406A (ja
Inventor
正雄 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009038485A priority Critical patent/JP5253227B2/ja
Publication of JP2010193406A publication Critical patent/JP2010193406A/ja
Application granted granted Critical
Publication of JP5253227B2 publication Critical patent/JP5253227B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、撮影画像中の人物の顔を検出し追尾する技術に関する。
従来から、カメラの撮影画像から両目や口の形状を抽出することで人物の顔を検出し、これを追尾する追尾装置が提案されている。従来の追尾装置は、人物の顔の検出を複数のフレームにおいて連続的に行うことにより、人物の顔の移動を追尾するように構成されている。しかしながら、従来の追尾装置では、顔が横や後ろを向いてしまった場合や、顔が障害物の陰に隠れてしまった場合などには、両目や口の形状を抽出できないために顔検出ができなくなり、人物の追尾に失敗してしまう。
これを回避するために、直前に検出された顔の位置に基づいて現在の顔のおおまかな位置候補を推定するとともに、その位置候補それぞれに対応する複数の周囲情報を取得する。そして、直前に検出された顔の位置に関連づけられている周囲情報に最も類似する周囲情報が取得された位置候補を、現在の顔の位置として決定する技術がある(特許文献1参照)。これによると、画像中から顔の検出を行うことなく現在の顔の位置を推定することができる。このため、例えば追尾対象の顔が物陰に隠れてしまったり、後ろを向いてしまったときのように、顔の検出ができない場合であっても、追尾対象の顔を見失うことなく、追尾を継続することが可能となる。
特開2007−042072号公報
上記特許文献1では、障害物や顔の向きにより顔の検出ができなくなった場合に、直前の画像で検出された顔画像を顔追尾のテンプレートとして、現在の画像とのフレーム相関を行うことによって、現在の顔の位置を推定している。また、顔追尾のためのテンプレートの設定方法として、直前の画像で顔検出された場合はその顔画像を顔追尾のテンプレートとし、直前の画像で顔検出されなかった場合はフレーム相関によって推定された顔の位置を追尾画像に設定する。
ここで、障害物によって顔検出ができなくなった場合には、フレーム相関による顔追尾に切り替えられるが、顔追尾のテンプレートとして、直前の追尾画像を順次用いる方法では、障害物に追従してしまい誤追尾になり易くなる。また、顔追尾のテンプレートとして最後に検出できた顔画像を固定して用いると、障害物には追従し難くなるものの、追尾性能が低下して、顔の向きが横や後ろに変わった場合にはテンプレートとの差分が大きくなるため、顔追尾ができなくなる。
本発明は、上記課題に鑑みてなされ、誤追尾を低減し、高精度な追尾性能を実現する。
上述した課題を解決するために、本発明の画像入力装置は、画像を入力する画像入力手段と、1つの入力画像から特定の被写体を検出する被写体検出手段と、連続的に入力される画像から前記特定の被写体の位置を推定する追尾手段と、前記追尾手段による追尾に用いる追尾テンプレートを決定する決定手段と、を有し、前記決定手段は、連続的に入力される画像の1つから、前記被写体検出手段によって前記特定の被写体が検出され、かつ、該画像よりも後に入力される画像の1つから前記被写体検出手段によって前記特定の被写体が検出されずに前記追尾手段によって前記特定の被写体の位置が推定された場合に、前記被写体検出手段により検出された画像、および、前記追尾手段により位置が推定された画像のいずれかを選択し、前記追尾テンプレートとして設定する。
また、本発明の被写体検出方法は、画像を入力する画像入力装置における被写体検出方法であって、1つの入力画像から特定の被写体を検出する被写体検出工程と、連続的に入力される画像から前記特定の被写体の位置を推定する追尾工程と、前記追尾工程による追尾に用いる追尾テンプレートを決定する決定工程と、を有し、前記決定工程は、連続的に入力される画像の1つから、前記被写体検出工程によって前記特定の被写体が検出され、かつ、該画像よりも後に入力される画像の1つから前記被写体検出工程によって前記特定の被写体が検出されずに前記追尾工程によって前記特定の被写体の位置が推定された場合に、前記被写体検出工程により検出された画像、および、前記追尾工程により位置が推定された画像のいずれかを選択し、前記追尾テンプレートとして設定する。
本発明によれば、誤追尾を低減し、高精度な追尾性能を実現できる。
本発明に係る実施形態の画像入力装置の概略構成を示すブロック図である。 顔を検出してから顔追尾テンプレート記憶部に顔追尾テンプレート情報を記憶するまでの処理を示すフローチャートである。 顔追尾のテンプレートから特徴量を算出する処理を示す図である。 顔が移動すると推定される領域を例示する図である。 障害物で遮蔽されることで顔検出できなくなり、顔追尾に切り替える例を示す図である。 障害物で遮蔽されることで顔検出できなくなり、顔追尾に切り替える例を示す図である。 顔の向きが変化したことで顔検出ができなくなり、顔追尾に切り替える例を示す図である。 顔の向きが変化したことで顔検出ができなくなり、顔追尾に切り替える例を示す図である。
以下に、添付図面を参照して本発明を実施するための最良の形態について詳細に説明する。尚、以下に説明する実施の形態は、本発明を実現するための一例であり、本発明が適用される装置の構成や各種条件によって適宜修正又は変更されるべきものであり、本発明は以下の実施の形態に限定されるものではない。
図1は本発明に係る実施形態の画像入力装置の概略構成を示すブロック図である。図1において、画像入力装置1は、カメラ等により撮影された複数の画像を連続的に入力する画像入力部10を備える。また、画像入力装置1は、入力画像から特定の被写体を検出する被写体検出部として人物の顔を検出する顔検出部11と、顔検出部11で検出された顔の向きを検出する顔向き検出部12とを備える。また、画像入力装置1は、顔追尾のためのテンプレート情報を記憶する顔追尾テンプレート記憶部13と、顔追尾の対象画像における顔の位置候補それぞれにおける画像特徴情報を記憶する画像特徴情報記憶部14とを備える。更に、画像入力装置1は、顔追尾テンプレートと追尾対象画像中の顔位置候補の各画像特徴情報を比較して顔の位置を推定する位置推定部15と、顔検出部11又は位置推定部15にて求められた顔の位置を外部に出力する位置出力部16を備える。
画像入力部10は、デジタルカメラ等の撮像装置によって連続的に撮影して得られた複数の画像を順次入力し、顔検出部11に出力する。顔検出部11は、入力画像から人物の顔を検出し、検出された顔の位置や大きさ等を示す顔情報を特定する。また、顔検出部11は、検出された顔の特徴量として、検出された顔を含む領域における輝度分布や色ヒストグラム等を算出する。顔向き検出部12は、顔検出部11で検出された顔情報を用いて顔の向きを検出する。顔追尾テンプレート記憶部13は、顔検出部11で検出された顔情報と、顔向き検出部12で検出された顔の向きをもとに、顔追尾のための基準画像として顔追尾テンプレートを決定し記憶する。この画像入力装置1は、単体の装置で構成されても、複数の装置からなるシステムで構成されても構わない。例えば、デジタルカメラやデジタルビデオカメラ単体の内部に画像入力部10から位置出力部16の全ての構成を備えても良い。あるいは、画像入力部10のみをデジタルカメラやデジタルビデオカメラ内部に持たせ、それ以外をデジタルカメラやデジタルビデオカメラと通信可能な外部のコンピュータに持たせも良い。
図2は、顔を検出してから顔追尾テンプレート記憶部に顔追尾テンプレート情報を記憶するまでの処理を示すフローチャートである。図2において、先ず、ステップS20で、顔検出部11によって、画像入力部10を通じて入力された画像中から人物の顔を検出する。顔検出部11による顔検出の方法としては、例えば、特開平7−311833号公報に記載されたように、まず、画像中から目や口としての形状を満たす領域を抽出する。そして、その領域の組み合わせにより顔候補を決定し、この顔候補について予め記憶された顔標準パターンとの比較を行い、一致度が高ければその顔候補が顔であると判定する。本実施形態では、2つの目があり、その2つの目の中間を通過する延長線上に鼻と口が存在する領域を抽出する。そして、それらの両目、鼻、口を含む領域の中心を基準として、領域を順次拡大していき、領域境界部のコントラスト信号、色差信号、あるいは、輝度信号の変化が大きくなった時点で、そこが顔候補の境界であると判断する。あるいは、顔の輪郭形状を直接検出することで顔候補となる領域を決定しても良いし、両目、鼻、口を含み、かつ、肌色であると推定される領域を顔候補として決定してもよい。そして、この顔候補に対して顔標準パターンとの比較を行い、この顔候補が顔であるか否かの判定を行う。
ステップS21では、顔向き検出部12によって、検出された顔の向きを判別する。顔検出部11での顔検出結果から顔の向きも同時に検出される場合は、その結果を使用すれば良いし、そうでない場合は、例えば、顔領域における顔の構成要素(目、鼻、口など)の位置関係から顔の向きを推定するようにしても良い。例えば、目、鼻、口などの構成要素が、全体的に顔領域の右側によっていれば、その顔は向かって右側を向いていると推定でき、全体的に顔領域の上側によっていれば、その顔は上を見上げていると推定できる。さらに、それら構成要素の顔領域における位置から、その顔が、正面に対して何度傾いた方向を向いているのかを推定することもできる。
ステップS22では、顔の向きが予め設定された範囲内にあるか否か判定する。例えば、顔領域における顔の構成要素(目、鼻、口など)の位置関係から、顔の向きが上下左右いずれの方向においても、真正面の向きに対して45度傾いた範囲内にあると推定されるか否かを判定する。この範囲は45度に限定されるわけではなく、様々なシチュエーションにおける検証結果から実験的に求めればよい。顔の向きが予め設定された範囲内にある場合には、ステップS23に進み、次回以降の顔検出において顔が検出されなかった場合に使用する顔追尾のテンプレートとして、最後に検出された顔画像を設定する。また、予め設定された範囲内にない場合には、ステップS24に進み、次回以降の顔検出で顔が検出されなかった場合に使用する顔追尾テンプレートとして、顔追尾を行う直前に撮影された画像中から顔検出又は顔追尾により検出された顔画像を設定する。
本実施形態における顔追尾処理は、顔検出部11で顔が検出できない場合にのみ実行される。あるいは、顔追尾処理は顔検出部11の検出結果によらずに常に実行されるが、顔検出部11で顔が検出できた場合には、顔追尾処理による追尾結果よりも顔検出部11による顔検出結果が優先される。顔追尾における顔位置の推定は、顔検出部11によって検出される顔位置に比べて精度が劣ることが多い。このため、顔検出部11で顔が検出された場合には、その検出結果を優先して使用することにより、顔の位置をより精度良く検出することができる。
また、顔検出ができなくなり、顔追尾を実行しているときに、新たに顔が検出された場合には、顔追尾を中止して、再び図2のフローによる処理を行い、顔追尾のテンプレートを新たに設定する。このように常に最新の顔検出結果を用いて、顔追尾のためのテンプレートを設定することで、より高精度の顔追尾を行うことができる。
画像特徴情報記憶部14は、顔追尾テンプレート記憶部13に記憶された顔追尾テンプレートの特徴量を算出して記憶する。図3は、顔追尾のテンプレートから特徴量を算出する処理を示す図である。図3において、顔追尾テンプレート記憶部13に記憶された顔追尾テンプレートの中心座標を(x,y)、幅W、高さHとして、顔を囲む短形の領域を設定する。そして、この矩形領域の輝度分布や色ヒストグラム等を算出し、テンプレート顔画像の特徴量として記憶する。なお、顔を囲む短形の領域のサイズは顔の大きさ等に応じて任意に設定可能である。
また、画像特徴情報記憶部14は、顔追尾テンプレート記憶部13によって記憶された顔追尾テンプレートの位置情報を用いて、顔が移動すると推定される位置の画像特徴量も算出して記憶する。図4は、顔が移動すると推定される領域を例示する図である。ここでは、顔追尾テンプレートの中心座標を(x,y)とし、この中心座標(領域5)から水平・垂直方向にそれぞれ±5画素移動したときの、幅W、高さHの短形の領域を、それぞれ領域1〜4,領域6〜9とする。そして、領域1〜4,6〜9のそれぞれにおける輝度分布や色ヒストグラム等を算出し、顔移動推定位置候補の特徴量として記憶する。
なお、本例では顔移動推定位置候補として、中心座標から±5画素移動したときの8個の領域を例としたが、移動量や位置候補の数は、顔の大きさや動き等に応じて任意に設定可能である。
位置推定部15は、画像特徴情報記憶部14に記憶された顔追尾テンプレートの特徴量と、追尾対象画像における顔の位置候補である、図4の領域1〜領域9のそれぞれにおける画像特徴量とを比較する。そして、最も画像特徴情報が類似している領域を現在の顔位置として推定する。また、最も類似している画像特徴量と、顔追尾テンプレートの特徴量との差分が閾値よりも大きい場合には、顔追尾を停止するように設定することで、誤追尾を防止することができる。位置出力部16は、位置推定部15で推定された顔の位置情報を画像入力装置1から外部機器に出力する。
本例の顔追尾処理における具体例と効果について、図5〜図8を参照して説明する。図5及び図6は、当初は顔検出できていたが、障害物が顔の前を横切ったことにより、顔検出ができなくなって顔追尾に切り替える例を示している。図5に従来の顔追尾処理を適用したときの例を示す。この図5では、顔追尾テンプレートを用いた顔追尾が開始されると、顔検出部11にて検出された顔、および、顔追尾テンプレートを用いた顔追尾にて検出された顔のうち、最新の顔を顔追尾テンプレートに設定する構成となっている。フレーム(a)の画像においては、顔検出部11が顔の検出に成功しており、顔向き検出部12が検出された顔が真正面を向いているものと判別している。
次のフレーム(b)においては、被写体の片目の一部が障害物によって隠れてしまっているため、顔検出部11は顔の検出に失敗する。顔検出部11が顔の検出に失敗したため、このフレーム(b)において、顔追尾テンプレートを用いた顔追尾が開始される。顔追尾テンプレート記憶部13は、直前に顔検出部11によって顔が検出されているため、顔追尾テンプレートとしてこの顔(フレーム(a)で検出された顔)が設定される。画像特徴情報記憶部14は、この顔追尾テンプレートの輝度分布や色ヒストグラムを算出し、特徴量として記憶する。そして、位置推定部15がフレーム(b)の画像の中から、記憶した特徴量と最も類似している領域を抽出し、その差分が閾値以内であったため、抽出した領域をフレーム(b)の画像における顔と推定する。ここで、フレーム(b)の画像から新たな顔が推定されたので、顔追尾テンプレート記憶部13は、このフレーム(b)から推定された顔を顔追尾テンプレートとして更新し、画像特徴情報記憶部14は、そこから得られた特徴量を新たな特徴量として更新する。
フレーム(c)においては、被写体の顔の大部分が障害物に隠れてしまっているため、顔検出部11は顔の検出に失敗する。よって、位置推定部15がフレーム(c)の画像の中から、フレーム(b)の画像から得られた特徴量と最も類似している領域を抽出し、その特徴量の差分が閾値以内であれば、この領域を顔として推定する。フレーム(b)の画像から得られた特徴量には、被写体の顔と障害物から得られた特徴量が含まれているため、同じく被写体の顔と障害物が含まれた領域が、新たな顔として推定される。ここで、実際の被写体の顔の大部分が障害物に隠れてしまっているために、新たな顔として推定された領域には、被写体の顔よりも障害物が多く含まれてしまうことになる。
フレーム(d)においても、実際の被写体の顔の大部分が障害物に隠れてしまっているため、顔検出部11は顔の検出に失敗する。ここでもフレーム(c)と同様に、被写体の顔よりも障害物が多く含まれてしまっている領域が、新たな顔として推定される。
そして、フレーム(e)においても、実際の被写体の顔の半分程度が障害物に隠れてしまっているため、顔検出部11は顔の検出に失敗する。このフレーム(e)の画像では、実際の被写体の顔の半分程度が障害物の陰から現れたが、フレーム(d)にて顔として推定された領域には、障害物に大部分を占められているため、障害物が占める領域が新たな顔として推定されてしまう。
このように、従来の方法では、顔よりも手前に障害物が存在すると、その障害物に対して追尾が行われてしまうという問題があった。これに対し、図6に本実施形態の顔追尾処理を適用したときの例を示す。フレーム(a)の画像においては、顔検出部11が顔の検出に成功しており、顔向き検出部12が検出された顔が真正面を向いているものと判別している。
次のフレーム(b)においては、被写体の片目の一部が障害物によって隠れてしまっているため、顔検出部11は顔の検出に失敗する。顔検出部11が顔の検出に失敗したため、このフレーム(b)において、顔追尾テンプレートを用いた顔追尾が開始される。顔追尾テンプレート記憶部13は、直前に顔検出部11によって顔が検出された際に、その顔が真正面の向きに対して45度傾いた範囲内にあったため、顔追尾テンプレートとしてその顔(フレーム(a)で検出された顔)が設定される。画像特徴情報記憶部14は、この顔追尾テンプレートの輝度分布や色ヒストグラムを算出し、特徴量として記憶する。そして、位置推定部15がフレーム(b)の画像の中から、記憶した特徴量と最も類似している領域を抽出し、その差分が閾値以内であったため、抽出した領域をフレーム(b)の画像における顔と推定する。ここで、画像特徴情報記憶部14は、フレーム(b)の画像から新たな顔が推定されたが、顔検出部11によって最後に検出された顔の向きが予め設定された範囲内であったため、特徴量を更新せずにそのまま保持する。
フレーム(c)においては、実際の被写体の顔の大部分が障害物に隠れてしまっているため、顔検出部11は顔の検出に失敗する。よって、位置推定部15がフレーム(c)の画像の中から、保持した特徴量と最も類似している領域を抽出する。しかしながら、最も類似している領域と、フレーム(a)で検出された顔から得られた特徴量の差分が閾値よりも大きかったため、位置推定部15は顔追尾に失敗したと判断し、追尾を終了する。
フレーム(d)、(e)では既に追尾が終了されているため、顔検出部11によって新たに顔が検出されるまで、顔追尾が行われない。
このように、本実施形態の顔追尾処理では、直前に顔検出部11にて顔領域が検出された際に、その顔の向きが予め設定された範囲内にあったため、画像特徴情報記憶部14は、顔検出部11が検出した顔から得られた特徴量を保持している。顔検出部11にて検出された顔が正面向きであったにも関わらず、その後に顔検出部11によって顔が検出できなくなったのであれば、顔の手前に障害物が発生した可能性が高いと考えられる。そこで、本実施形態では、そのような場合には、顔追尾テンプレートを用いた顔追尾にて推定された顔の方が、顔検出部11にて検出された顔よりも新しい情報であっても、顔検出部11にて検出された顔を顔追尾テンプレートとして設定する。このようにすることで、誤追尾を抑制することが可能となる。
ここで、顔検出部11にて検出された顔の向きが予め設定された範囲内にあった場合にのみ、上述した処理を行う理由について説明する。本実施形態の構成と比較をするため、図7に、常に顔検出部11にて検出された顔を顔追尾テンプレートとして設定する顔追尾処理を適用したときの例を示す。フレーム(a)の画像においては、顔検出部11が顔の検出に成功しており、顔向き検出部12が検出された顔が真正面を向いていることを検出している。フレーム(b)の画像においては、顔検出部11が顔の検出に成功しており、顔向き検出部12が検出された顔が真正面に対して右に50度傾いた方向を向いていることを検出している。
フレーム(c)の画像においては、被写体の顔が大きく右を向くことで、片目の一部が見えなくしまっているため、顔検出部11は顔の検出に失敗する。顔検出部11が顔の検出に失敗したため、このフレーム(c)において、顔追尾テンプレートを用いた顔追尾が開始される。顔追尾テンプレート記憶部13は、直前に顔検出部11によって顔が検出されているため、顔追尾テンプレートとして、その顔(フレーム(b)で検出された顔)が設定される。画像特徴情報記憶部14は、この顔追尾テンプレートの輝度分布や色ヒストグラムを算出し、特徴量として記憶する。そして、位置推定部15がフレーム(c)の画像の中から、新たな顔を推定する。ここで、画像特徴情報記憶部14は、フレーム(c)の画像から新たな顔が推定されたが、顔検出部11によって新たな顔が検出されたのではないため、特徴量を更新せずにそのまま保持する。
フレーム(d)の画像においては、被写体の顔がさらに大きく右を向くことで、片目が見えなくしまっているため、顔検出部11は顔の検出に失敗する。顔検出部11が顔の検出に失敗したため、このフレーム(d)においても、引き続き顔追尾テンプレートを用いた顔追尾が行われる。しかしながら、画像特徴情報記憶部14が保持している特徴量は、フレーム(b)で検出された顔から得られた特徴量のままであるため、顔の向きが大きく異なるフレーム(d)の顔の特徴量は、保持された特徴量との差分が閾値よりも大きくなる。そのため、位置推定部15は顔追尾に失敗したと判断し、追尾を終了してしまう。
フレーム(e)の画像においても、画像特徴情報記憶部14が保持している特徴量との差分が閾値以内となる特徴量が得られる領域が見つからずに、顔追尾に失敗したと判断する。
このように、常に顔検出部11にて検出された顔を顔追尾テンプレートとして設定すると、顔の向きが変化していくような場合には、障害物がなくともその顔が追尾できなくなるという問題があった。これに対し、図8に本実施形態の顔追尾処理を適用したときの例を示す。この図8には、顔検出部11にて検出された顔の向きが予め設定された範囲内になければ、顔追尾テンプレートを用いた顔追尾にて推定された顔を、新たな顔追尾テンプレートとして更新する例を示す。
フレーム(a)、(b)の画像においては、図7と同様である。フレーム(c)の画像においては、被写体の顔が大きく右を向くことで、片目の一部が見えなくしまっているため、顔検出部11は顔の検出に失敗する。顔検出部11が顔の検出に失敗したため、このフレーム(c)において、顔追尾テンプレートを用いた顔追尾が開始される。顔追尾テンプレート記憶部13は、直前に顔検出部11によって顔が検出されているため、顔追尾テンプレートとして、この顔(フレーム(b)で検出された顔領域)が設定される。画像特徴情報記憶部14は、この顔追尾テンプレートの輝度分布や色ヒストグラムを算出し、特徴量として記憶する。そして、位置推定部15がフレーム(c)の画像の中から、新たな顔を推定する。ここで、フレーム(c)の画像から新たな顔が推定され、かつ、顔検出部11によって検出された最新の顔の向き(フレーム(b)の顔の向き)が予め設定された範囲内にない。そのため、顔追尾テンプレート記憶部13は、このフレーム(c)から推定された顔を顔追尾テンプレートとして更新し、画像特徴情報記憶部14は、そこから得られた特徴量を新たな特徴量として更新する。
フレーム(d)の画像においては、被写体の顔がさらに大きく右を向くことで、片目が見えなくしまっているため、顔検出部11は顔の検出に失敗する。顔検出部11が顔の検出に失敗したため、このフレーム(d)においても、引き続き顔追尾テンプレートを用いた顔追尾が行われる。画像特徴情報記憶部14が保持している特徴量は、フレーム(c)で検出された顔から得られた特徴量である。そのため、フレーム(c)の顔に対して、その向きの差が小さいフレーム(d)の顔は、保持された特徴量との差分が閾値以内となり、顔として推定されることになる。
このように、顔の向きが徐々に変化していくような場合には、顔追尾テンプレートを用いた顔追尾によって推定された顔領域を用いて、顔追尾テンプレートを更新することが望ましいと言える。
以上説明したように、本実施形態によれば、顔追尾テンプレートとして、最後に検出された顔画像と、顔追尾によって検出された直前の顔画像とを顔の向きに基づいて切り替えて設定する。これにより、障害物によって顔検出ができないと想定される場合には、最後に顔検出されたときの顔画像を顔追尾テンプレートとして設定することにより、図5のような誤追尾を防止し、図6のように顔追尾を停止することが可能になる。
また、顔の向きが大きく変化したことにより顔検出ができないと想定される場合には、直前に検出された顔追尾画像を顔追尾テンプレートに設定できるようにする。これにより、図8のように追尾が途中で停止されることなく、図7のように顔が横向きや後ろ向に変わった場合であっても、顔追尾を継続することができる。
上述した実施形態では、顔の向きを判別して、顔追尾テンプレートの設定方法を変えていたが、それ以外の条件によって、顔追尾テンプレートの設定方法を変更しても良い。例えば、時系列順の複数の画像から顔の周辺に物体が近づいていると判定された場合には、最後に顔検出されたときの顔画像を顔追尾テンプレートとして設定する。これに対し、顔の周辺に物体が近付いていないと判定された場合には、最後に顔追尾されたときの顔画像を顔追尾テンプレートとして設定する。こうすることにより、物体に追従して誤追尾することなく、追尾を停止することが可能になる。つまり、1つのフレーム画像から顔を検出する機能と、複数のフレーム画像の相関から顔が位置すると思われる領域を追尾する機能を備え、いずれかの処理の結果を顔追尾テンプレートとして選択する構成を備えていれば、本発明を適用することができる。さらに、追尾対象は必ずしも被写体の顔でなくとも構わない。被写体の特定の姿勢や、特定の動物など、色や形状といった複数の条件と比較することで、1つの画像中からその被写体を特定することができる対象であれば、上述した実施形態における顔と置き換えることが可能である。
[他の実施形態]
本発明の目的は、前述した実施形態の機能を実現するように各種デバイスを動作させるために、これらデバイスと接続された装置或いはシステムのコンピュータに対して、本実施形態の機能を実現するソフトウェアを供給しても達成できる。この場合、上記ソフトウェアのプログラムコードを記録した記憶媒体を、システム又は装置に供給し、そのコンピュータ(CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行して各種デバイスを動作させることで達成される。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性の半導体メモリカード、ROMなどを用いることができる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現される場合もある。しかし、さらにプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる場合も有得る。その後、プログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

Claims (5)

  1. 画像を入力する画像入力手段と、
    1つの入力画像から特定の被写体を検出する被写体検出手段と、
    連続的に入力される画像から前記特定の被写体の位置を推定する追尾手段と、
    前記追尾手段による追尾に用いる追尾テンプレートを決定する決定手段と、を有し、
    前記決定手段は、連続的に入力される画像の1つから、前記被写体検出手段によって前記特定の被写体が検出され、かつ、該画像よりも後に入力される画像の1つから前記被写体検出手段によって前記特定の被写体が検出されずに前記追尾手段によって前記特定の被写体の位置が推定された場合に、前記被写体検出手段により検出された画像、および、前記追尾手段により位置が推定された画像のいずれかを選択し、前記追尾テンプレートとして設定することを特徴とする画像入力装置。
  2. 前記特定の被写体の向きを検出する向き検出手段を更に有し、
    前記被写体検出手段は、前記特定の被写体の向きが予め設定された範囲内であれば、当該被写体検出手段により検出された画像を前記追尾テンプレートとして設定し、前記検出された被写体の向きが予め設定された範囲内になければ、前記追尾手段により位置が推定された画像を前記追尾テンプレートとして設定することを特徴とする請求項1に記載の画像入力装置。
  3. 前記特定の被写体は、人物の顔であることを特徴とする請求項1または2に記載の画像入力装置。
  4. 画像を入力する画像入力装置における被写体検出方法であって、
    1つの入力画像から特定の被写体を検出する被写体検出工程と、
    連続的に入力される画像から前記特定の被写体の位置を推定する追尾工程と、
    前記追尾工程による追尾に用いる追尾テンプレートを決定する決定工程と、を有し、
    前記決定工程は、連続的に入力される画像の1つから、前記被写体検出工程によって前記特定の被写体が検出され、かつ、該画像よりも後に入力される画像の1つから前記被写体検出工程によって前記特定の被写体が検出されずに前記追尾工程によって前記特定の被写体の位置が推定された場合に、前記被写体検出工程により検出された画像、および、前記追尾工程により位置が推定された画像のいずれかを選択し、前記追尾テンプレートとして設定することを特徴とする被写体検出方法。
  5. 請求項4に記載の被写体検出方法を画像入力装置のコンピュータに実行させるためのプログラム。
JP2009038485A 2009-02-20 2009-02-20 画像入力装置及び被写体検出方法、プログラム Active JP5253227B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009038485A JP5253227B2 (ja) 2009-02-20 2009-02-20 画像入力装置及び被写体検出方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009038485A JP5253227B2 (ja) 2009-02-20 2009-02-20 画像入力装置及び被写体検出方法、プログラム

Publications (2)

Publication Number Publication Date
JP2010193406A JP2010193406A (ja) 2010-09-02
JP5253227B2 true JP5253227B2 (ja) 2013-07-31

Family

ID=42818931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009038485A Active JP5253227B2 (ja) 2009-02-20 2009-02-20 画像入力装置及び被写体検出方法、プログラム

Country Status (1)

Country Link
JP (1) JP5253227B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012195812A (ja) * 2011-03-17 2012-10-11 Nec Saitama Ltd 顔検出装置、顔検出方法、及びプログラム
JP5879736B2 (ja) * 2011-04-21 2016-03-08 株式会社ニコン 画像追尾装置および撮像装置
JP5087163B1 (ja) * 2011-08-31 2012-11-28 株式会社東芝 立体画像表示装置
JP2014063280A (ja) * 2012-09-20 2014-04-10 Fujifilm Corp オブジェクト追跡方法及び装置、並びにプログラム
JP5789578B2 (ja) * 2012-09-20 2015-10-07 富士フイルム株式会社 眼の開閉判断方法及び装置、プログラム、並びに監視映像システム
JP6532317B2 (ja) * 2015-06-19 2019-06-19 キヤノン株式会社 物体追尾装置、物体追尾方法及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003346158A (ja) * 2002-05-28 2003-12-05 Toshiba Corp 顔画像による顔領域追跡方法

Also Published As

Publication number Publication date
JP2010193406A (ja) 2010-09-02

Similar Documents

Publication Publication Date Title
JP4830650B2 (ja) 追跡装置
JP4586709B2 (ja) 撮像装置
US8253819B2 (en) Electronic camera and image processing method
US8401251B2 (en) Face pose estimation device, face pose estimation method and face pose estimation program
US8432357B2 (en) Tracking object selection apparatus, method, program and circuit
KR100544677B1 (ko) 다시점 영상 및 깊이 정보를 이용한 3차원 객체 추적 장치및 그 방법
CN111339855B (zh) 基于视觉的目标跟踪方法、系统、设备及存储介质
CN104573623B (zh) 人脸检测装置、方法
JP4991595B2 (ja) パーティクルフィルタを使用する追跡システム
JP5253227B2 (ja) 画像入力装置及び被写体検出方法、プログラム
JP6007682B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2008146356A (ja) 視線方向推定装置及び視線方向推定方法
JP5001930B2 (ja) 動作認識装置及び方法
JP2008009849A (ja) 人物追跡装置
US11074713B2 (en) Recognition device, recognition system, recognition method, and non-transitory computer readable recording medium
JP5087037B2 (ja) 画像処理装置、方法及びプログラム
JP2018113021A (ja) 情報処理装置およびその制御方法、プログラム
US20170344858A1 (en) Control device, control method, and computer program product
CN110537207B (zh) 脸部朝向推定装置及脸部朝向推定方法
CN110490131B (zh) 一种拍摄设备的定位方法、装置、电子设备及存储介质
US11153479B2 (en) Image processing apparatus, capable of detecting an amount of motion between images by tracking a point across one or more images, image capturing apparatus, image processing method, and storage medium
JP6798609B2 (ja) 映像解析装置、映像解析方法およびプログラム
WO2020149149A1 (en) Information processing apparatus, information processing method, and program
JP6555940B2 (ja) 被写体追跡装置、撮像装置、及び被写体追跡装置の制御方法
JP3980341B2 (ja) 目の位置のトラッキング方法、目の位置のトラッキング装置およびそのためのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130416

R151 Written notification of patent or utility model registration

Ref document number: 5253227

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3