JP2014036429A

JP2014036429A - 被写体追尾装置、およびカメラ

Info

Publication number: JP2014036429A
Application number: JP2012178568A
Authority: JP
Inventors: Hiroshi Kinto; 浩史金藤
Original assignee: Nikon Corp
Current assignee: Nikon Corp
Priority date: 2012-08-10
Filing date: 2012-08-10
Publication date: 2014-02-24

Abstract

【課題】追尾被写体がロストした場合には自動で被写体追尾処理を停止し、追尾被写体が画面に戻ってきた場合には自動で被写体追尾処理を再開すること。
【解決手段】被写体追尾装置は、初期テンプレート画像と入力画像との類似度、および更新テンプレート画像と入力画像との類似度に基づいて、追尾被写体位置を特定する被写体追尾手段と、追尾被写体位置における初期テンプレート画像との類似度に基づいて、入力画像から追尾被写体が検出されるかを判定する第１の判定手段と、追尾被写体が検出されない場合には、初期テンプレート画像と第２の探索領域内の画像との類似度に基づいて、入力画像内に追尾被写体が戻ってきたかを判定する第２の判定手段と、を備え、被写体追尾手段は、追尾被写体が検出されない場合には、追尾被写体位置の特定を停止し、追尾被写体が戻ってきた場合には、追尾被写体位置の特定を再開する。
【選択図】図１

Description

本発明は、被写体追尾装置、およびカメラに関する。

次のような物体追跡装置が知られている。この物体追跡装置は、被写体の変化に対応するために、異なる複数のテンプレート画像を用いてテンプレートマッチングを行い、類似度が最も高いテンプレート画像を用いてテンプレート画像の更新を行う（例えば、特許文献１)。

特許第３７６８０７３号公報

従来技術では、追尾被写体がフレームアウトしたり遮蔽物により遮蔽されたりして画面内からいなくなった（すなわちロストした）場合でも、ロスト前と変わらずに被写体追尾処理を続けてしまうという問題があった。

（１）請求項１に記載の発明による被写体追尾装置は、入力画像内に第１の探索領域を設定し、画像内容の更新を行わない初期テンプレート画像と第１の探索領域内の画像との類似度、および画像内容の更新を行う更新テンプレート画像と第１の探索領域内の画像との類似度をそれぞれ演算し、これらの類似度に基づいて、入力画像内における追尾被写体位置を特定する被写体追尾手段と、更新テンプレート画像を更新するか否かを判定し、更新すると判定した場合には、入力画像における被写体追尾手段により特定された追尾被写体位置を含む画像に基づいて、更新テンプレート画像を更新する更新手段と、入力画像の被写体追尾手段により特定された追尾被写体位置における初期テンプレート画像との類似度に基づいて、入力画像から追尾被写体が検出されるか否かを判定する第１の判定手段と、第１の判定手段により入力画像から追尾被写体が検出されないと判定された場合には、入力画像内に第２の探索領域を設定し、初期テンプレート画像と第２の探索領域内の画像との類似度を演算し、この類似度に基づいて、入力画像内に追尾被写体が戻ってきたか否かを判定する第２の判定手段と、を備え、被写体追尾手段は、第１の判定手段により入力画像から追尾被写体が検出されないと判定された場合には、追尾被写体位置の特定を停止し、第２の判定手段により入力画像内に追尾被写体が戻ってきたと判定された場合には、追尾被写体位置の特定を再開することを特徴とする。
（２）請求項８に記載の発明によるカメラは、請求項１〜７のいずれか一項に記載の被写体追尾装置を備えることを特徴とする。

本発明によれば、追尾被写体がロストした場合には自動で被写体追尾処理を停止し、追尾被写体が画面に戻ってきた場合には自動で被写体追尾処理を再開することができる。

本発明の一実施の形態によるカメラの構成例を説明するブロック図である。被写体追尾処理の流れを示すフローチャートである。図２に続くフローチャートである。テンプレート画像生成処理の詳細を示すフローチャートである。図４に続くフローチャートである。２値画像およびアンド画像を説明する図である。初期テンプレート画像の生成を説明する図である。リサイズ判定用テンプレート画像の生成を説明する図である。リサイズ判定用テンプレート画像の生成を説明する図である。追尾被写体位置特定処理の詳細を示すフローチャートである。合成テンプレート画像更新処理の詳細を示すフローチャートである。テンプレートサイズ更新処理の詳細を示すフローチャートである。図１２に続くフローチャートである。リサイズ判定用テンプレート画像についてのマッチング位置と被写体の大きさとの関係を説明する図である。ロスト判定時用処理の詳細を示すフローチャートである。

以下、図面を参照して本発明を実施するための形態について説明する。図１は、本実施の形態におけるカメラの一実施の形態の構成を示すブロック図である。カメラ１００は、操作部材１０１と、レンズ１０２と、撮像素子１０３と、制御装置１０４と、メモリカードスロット１０５と、モニタ１０６とを備えている。操作部材１０１は、使用者によって操作される種々の入力部材、例えば電源ボタン、レリーズボタン、ズームボタン、十字キー、決定ボタン、再生ボタン、削除ボタンなどを含んでいる。

レンズ１０２は、複数の光学レンズから構成されるが、図１では代表して１枚のレンズで表している。撮像素子１０３は、例えばＣＭＯＳなどのイメージセンサであり、レンズ１０２により結像した被写体像を撮像する。そして、撮像によって得られた画像信号を制御装置１０４へ出力する。

制御装置１０４は、ＣＰＵ、メモリ、およびその他の周辺回路により構成され、カメラ１００を制御する。なお、制御装置１０４を構成するメモリには、ＳＤＲＡＭやフラッシュメモリが含まれる。ＳＤＲＡＭは、揮発性のメモリであって、ＣＰＵがプログラム実行時にプログラムを展開するためのワークメモリとして使用されたり、データを一時的に記録するためのバッファメモリとして使用されたりする。また、フラッシュメモリは、不揮発性のメモリであって、制御装置１０４が実行するプログラムのデータや、プログラム実行時に読み込まれる種々のパラメータなどが記録されている。

制御装置１０４は、撮像素子１０３から入力された画像信号に基づいて所定の画像形式、例えばＪＰＥＧ形式の画像データ（以下、「本画像データ」と呼ぶ）を生成する。また、制御装置１０４は、生成した画像データに基づいて、表示用画像データ、例えばサムネイル画像データを生成する。制御装置１０４は、生成した本画像データとサムネイル画像データとを含み、さらにヘッダ情報を付加した画像ファイルを生成してメモリカードスロット１０５へ出力する。本実施の形態では、本画像データとサムネイル画像データとは、いずれもＲＧＢ表色系で表された画像データであるものとする。

メモリカードスロット１０５は、記憶媒体としてのメモリカードを挿入するためのスロットである。制御装置１０４は、画像ファイルを上記メモリカードに書き込んで記録する。また制御装置１０４は、上記メモリカード内に記憶されている画像ファイルを読み込む。

モニタ１０６は、カメラ１００の背面に搭載された液晶モニタ（背面モニタ）であり、当該モニタ１０６には、メモリカードに記憶されている画像やカメラ１００を設定するための設定メニューなどが表示される。また、制御装置１０４は、使用者によってカメラ１００のモードが撮影モードに設定されると、撮像素子１０３から時系列で取得した画像の表示用画像データをモニタ１０６に出力する。これによってモニタ１０６にはスルー画が表示される。

図２および図３は、本実施の形態における被写体追尾処理の流れを示すフローチャートである。図２および図３に示す処理は、撮像素子１０３からスルー画の入力が開始されると起動するプログラムとして、制御装置１０４によって実行される。

図２のステップＳ１０において制御装置１０４は、撮像素子１０３から入力されるフレーム画像（１フレーム目の画像）を読み込んで、ステップＳ２０へ進む。読み込むフレーム画像のサイズは、例えば、３６０×２４０画素とする。また、制御装置１０４は、ＲＧＢ表色系で表されたフレーム画像を、ＹＣｂＣｒ色空間における輝度成分（Ｙ成分）からなる輝度画像と色差成分（Ｃｂ成分、Ｃｒ成分）とからなる色差画像とに変換する。なお、撮像素子１０３から入力されるフレーム画像がＹＣｂＣｒで表されている場合には、この変換処理は不要となる。

ステップＳ２０において制御装置１０４は、テンプレート画像生成処理を実行する。ここで、テンプレート画像生成処理の詳細について図４および図５を用いて説明する。図４のステップＳ２０１において制御装置１０４は、フレーム画像内における追尾対象の被写体（追尾被写体）の位置を特定し、ステップＳ２０２へ進む。本実施の形態では、使用者に対してフレーム画像内における追尾被写体位置の指定を促し、使用者が操作部材１０１を操作して入力した位置を追尾被写体位置として特定する。

ステップＳ２０２において制御装置１０４は、上記追尾被写体位置を中心とした３×３画素の領域において、Ｙ成分の平均値、Ｃｂ成分の平均値、Ｃｒ成分の平均値をそれぞれ算出する。また制御装置１０４は、フレーム画像全体において、Ｙ成分の標準偏差、Ｃｂ成分の標準偏差、Ｃｒ成分の標準偏差をそれぞれ算出する。尚、本実施の形態では、これらの標準偏差の算出には、フレーム画像全体の平均値ではなく、上記追尾被写体位置を中心とした３×３画素の領域において算出した平均値を用いる。

その後ステップＳ２０３へ進み、制御装置１０４は、フレーム画像の輝度画像(Ｙ画像)と色差画像(Ｃｂ画像およびＣｒ画像）の各画素の値から、ステップＳ２０２で算出したＹ成分、Ｃｂ成分、Ｃｒ成分各々の平均値を減算し、絶対値をとった差分画像をそれぞれ作成する。

また制御装置１０４は、上記追尾被写体位置を中心とした所定の大きさ（例えば３０×３０画素）の矩形からの距離に応じた距離重み付け係数を算出する。なお、距離重み付け係数は、当該矩形からの距離が長くなるほど（すなわち上記追尾被写体位置から離れるほど）大きくなるように算出される。そして制御装置１０４は、Ｙ成分、Ｃｂ成分、Ｃｒ成分の各差分画像の各画素の値に当該距離重み付け係数を乗算することにより、Ｙ成分、Ｃｂ成分、Ｃｒ成分の距離重みつき差分画像をそれぞれ作成する。この処理により、背景のノイズを除去することができる。その後、ステップＳ２０４へ進む。

ステップＳ２０４において制御装置１０４は、ステップＳ２０３で生成した距離重み付き差分画像に対して２値化処理を行い、図６に示すように、Ｙ成分、Ｃｂ成分、Ｃｒ成分の２値画像３ｂ〜３ｄをそれぞれ生成する。

具体的には、Ｙ成分の距離重み付き差分画像に対する２値化処理では、ステップＳ２０２で算出したＹ成分の標準偏差に所定係数（例えば０．６）をかけた値を閾値とする。そして、画素値が閾値よりも小さい画素を黒画素とし、それ以外の画素を白画素として２値画像を生成する。

Ｃｂ成分の距離重み付き差分画像に対する２値化処理は、Ｙ成分の場合と同様に行う。ただし、ステップＳ２０２で算出したＣｂ成分の平均値aveCbおよび標準偏差sigCbが次式（１）および（２）の両方を満たす場合には、２値化処理において、次式（３）により算出した閾値thCbを用いる。これは、無彩色シーンに対応するためである。
118 < aveCb < 138 ・・・（１）
sigCb < abs(aveCb-128)+3 ・・・（２）
thCb = α×sigCb×[{abs(aveCb−128)+3}/sigCb］^1/2×[10/{abs(aveCb-128)+0.1}]^1/2 ・・・（３）
なお、式（２）および（３）において、absは絶対値をとる関数である。また、式（３）において、αは例えば０．６とする。

また、Ｃｒ成分の距離重み付き差分画像に対する２値化処理は、Ｃｂ成分の場合と同様に行う。

その後、ステップＳ２０５へ進み、制御装置１０４は、ステップＳ２０４で生成したＹ成分、Ｃｂ成分、Ｃｒ成分の２値画像３ｂ〜３ｄのアンドをとって合成し、アンド画像（合成画像）３ｅを生成して、ステップＳ２０６へ進む。

ステップＳ２０６において、制御装置１０４は、上記アンド画像において、追尾被写体位置を中心とした所定範囲、例えば１８０×１８０画素の大きさの領域をクロップする。このクロップ処理によって得られたクロップ画像を対象として後の処理を行うことにより、処理を高速化することができる。そして制御装置１０４は、クロップした画像に対して８方向のラベリング処理を行うことによりラベリング画像を生成して、ステップＳ２０７へ進む。

ステップＳ２０７において、制御装置１０４は、上記ラベリング処理で作成されたラベリング画像内から白画素の塊をマスクとして抽出し、抽出したマスクの面積を算出して、ステップＳ２０８へ進む。

ステップＳ２０８において制御装置１０４は、上記マスクの面積に基づいて、追尾被写体である可能性が低いマスクを除外するための足切りを行う。具体的には、マスク面積を上記アンド画像の画面面積で割った値が、所定の下限値（例えば0.0001）より大きいマスクのみを残し、その他を以降の処理対象から除外する。これにより、追尾被写体である可能性が低いマスクを以降の処理対象から除外して、処理の高速化を図ることができる。

その後ステップＳ２０９へ進み、制御装置１０４は、ステップＳ２０８で除外されなかったマスク（すなわち残されたマスク）が１つ以上あるか否かを判定する。残されたマスクの数が０であることは、追尾被写体である可能性が高いマスクを検出できなかったことを意味する。この場合、制御装置１０４は、ステップＳ２０９を否定判定してステップＳ２０１へ戻り、再度、使用者に追尾被写体位置を入力させる。尚、この場合、追尾不能として被写体追尾処理を終了するようにしてもよい。一方、残されたマスクの数が１以上である場合には、制御装置１０４は、ステップＳ２０９を肯定判定してステップＳ２１０へ進む。

ステップＳ２１０において制御装置１０４は、残された各マスクの慣性モーメントＩＭを、それぞれ次式（４）により算出する。
ＩＭ＝ΣΣ｛（ｘ−ｘ_ｇ)^２＋（ｙ−ｙ_ｇ）^２）・・・(４)
なお、式（４）において、（ｘ，ｙ）は、マスクの画素の座標であり、（ｘ_ｇ，ｙ_ｇ）は、追尾被写体位置の座標である。

そして制御装置１０４は、上記慣性モーメントＩＭとステップＳ２０７で算出したマスク面積とに基づいて、残された各マスクの評価値を、それぞれ次式（５）により算出する。
評価値＝(マスク面積)^β／ＩＭ・・・(５)
なお、式（５）においては、βの値は１より大きな値が好ましく、例えば１．５とする。

その後、図５のステップＳ２１１へ進み、制御装置１０４は、上記評価値が最大であるマスクを、追尾被写体を示す可能性が高いマスクとして特定する。そして制御装置１０４は、図７（Ａ）に示す、この特定したマスクＭａを包絡する矩形の短辺Rectに基づいて、追尾被写体の大きさを示す値（以下、オブジェクトサイズ（Objectsize）と呼ぶ）を設定する。具体的に、Rect>240の場合はRect=240とし、Rect<9の場合は、Rect=6とする。そして次式（６）によりオブジェクトサイズを算出することにより、オブジェクトサイズを短辺Rectに近い３の倍数の値とする。これは、後述する処理において、オブジェクトサイズに基づいてサイズが設定されるリサイズ判定用テンプレート画像を３×３のブロックに分割するためである。
Objectsize＝floor(Rect/3)×3 ・・・（６）
なお、式（６）において、floorは小数点以下の切り捨てを行う関数である。

その後、ステップＳ２１２へ進み、制御装置１０４は、ステップＳ２１１で決定したオブジェクトサイズが所定値（本実施形態では２４画素）よりも大きいか否かを判定する。なお、この所定値は、テンプレートマッチング処理において扱えるテンプレート画像の大きさの最大値であり、例えば、制御装置１０４に関するハードウェアの制約などによって決められている。制御装置１０４は、オブジェクトサイズが所定値よりも大きい場合には、ステップＳ２１２を肯定判定してステップＳ２１８へ進む。一方、オブジェクトサイズが所定値以下の場合には、ステップＳ２１２を否定判定してステップＳ２１３へ進む。

ステップＳ２１３において制御装置１０４は、フレーム画像の縮小倍率Shukuを１倍に設定し、縮小倍率を不図示のメモリに記録した後、ステップＳ２１４へ進む。

ステップＳ２１４において制御装置１０４は、ステップＳ１０で読み込んだフレーム画像において、図７（Ｂ）に示すように、上記追尾被写体位置Ｐｔを中心としたObjectsize×Objectsizeの画像を、初期テンプレート画像Ｔｓとして生成し、不図示のメモリに記録した後、ステップＳ２１５へ進む。なお、初期テンプレート画像Ｔｓは、後述するようにサイズの変更は行うが、画像内容の更新は行わないテンプレート画像である。

ステップＳ２１５において制御装置１０４は、初期テンプレート画像Ｔｓと同一の画像を合成テンプレート画像Ｔｇとして生成し、ステップＳ２１６へ進む。なお、合成テンプレート画像Ｔｇは、初期テンプレート画像と異なり、画像内容の更新を行うテンプレート画像である。この更新については後述する。また、初期テンプレート画像および合成テンプレート画像は、追尾被写体位置を特定するための追尾用テンプレート画像である。

ステップＳ２１６において制御装置１０４は、テンプレート画像をリサイズするか否かを判定するためのリサイズ判定用テンプレート画像を生成する。具体的には、図８（Ａ）に示すように、ステップＳ２１５で生成した合成テンプレート画像Ｔｇを３×３のブロックＢ１〜Ｂ９に分割し、各ブロックＢ１〜Ｂ９の中心位置Ｐ１〜Ｐ９を算出する。そして制御装置１０４は、図９（Ａ）に示すように、ブロックＢ１の中心位置Ｐ１を中心とした、Objectsize×Objectsizeである画像を、第１リサイズ判定用テンプレート画像Ｔｒ１として生成する。ブロックＢ２〜Ｂ９の中心位置Ｐ２〜Ｐ９についても同様にして、図９（Ｂ）〜（Ｉ）に示すように第２〜第９リサイズ判定用テンプレート画像Ｔｒ２〜Ｔｒ９を生成する。なお、本実施形態では、分割した９つのブロックのうち、中央のブロックＢ５の中心位置（＝追尾被写体位置）Ｐ５を中心とする第５リサイズ判定用テンプレート画像Ｔｒ５は、合成テンプレート画像Ｔｇと同一の画像となる。

その後ステップＳ２１７へ進み、制御装置１０４は、図８（Ｂ）に示すように、第１〜第４、第６〜第９リサイズ判定用テンプレート画像Ｔｒ１〜Ｔｒ４、Ｔｒ６〜Ｔｒ９の中心位置Ｐ１〜Ｐ４、Ｐ６〜Ｐ９について、それぞれ、第５リサイズ判定用テンプレート画像Ｔｒ５の中心位置（＝追尾被写体位置）Ｐ５からの距離Ｌ１〜Ｌ４、Ｌ６〜Ｌ９を初期状態の距離（初期距離）として算出する。本実施の形態において、距離の算出には、例えばユークリッド距離を用いる。制御装置１０４は、算出した初期距離Ｌ１〜Ｌ４、Ｌ６〜Ｌ９を不図示のメモリに記録する。その後、制御装置１０４は、図５の処理を終了し、図２の処理に復帰する。

一方、上述したステップＳ２１２を肯定判定して進むステップＳ２１８において、制御装置１０４は、次式（７）によりフレーム画像の縮小倍率Shukuを算出し、不図示のメモリに記録する。
Shuku=24/ObjectSize ・・・（７）

そして制御装置１０４は、ステップＳ１０で読み込んだフレーム画像を、上記縮小倍率Shukuを用いてリサイズし、ステップＳ２１９へ進む。本実施の形態では、画像のリサイズ方法として、例えばバイリニア法を用いる。また、このリサイズに合わせて、追尾被写体位置の座標を変換する。

ステップＳ２１９において制御装置１０４は、上記リサイズしたフレーム画像において、上記追尾被写体位置を中心とした２４×２４画素の画像を初期テンプレート画像として生成し、不図示のメモリに記録した後、ステップＳ２２０へ進む。なお、上記リサイズ前のフレーム画像に対する初期テンプレート画像のサイズは、Objectsize×Objectsizeである。

ステップＳ２２０において制御装置１０４は、ステップＳ２１９で生成した初期テンプレート画像と同一の画像を合成テンプレート画像として生成し、ステップＳ２２１へ進む。

ステップ２２１において制御装置１０４は、ステップＳ２２０で生成した合成テンプレート画像を３×３のブロックに分割し、各ブロックの中心位置を算出する。そして制御装置１０４は、上述したステップＳ２１６の場合と同様に、各ブロックの中心位置を中心とした、サイズが２４×２４画素である画像を、第１〜第９リサイズ判定用テンプレート画像として生成する。なお、分割した９つのブロックのうち、中央のブロックの中心位置（すなわち追尾被写体位置）を中心とする第５リサイズ判定用テンプレート画像は、ステップＳ２２０で生成した合成テンプレート画像と同一の画像となる。

このように本実施の形態では、上記ステップＳ２１１で設定したオブジェクトサイズが２４画素よりも大きい場合には、リサイズしたフレーム画像において２４×２４画素のテンプレート画像（初期テンプレート画像、合成テンプレート画像および第１〜第９リサイズ判定用テンプレート画像）を生成する。尚、これら２４×２４画素のテンプレート画像が、元の（リサイズ前の）フレーム画像において、サイズがObjectsize×Objectsizeのテンプレート画像を生成した場合と同じ画像内容となるように、上記ステップＳ２１８においてフレーム画像の縮小倍率Shukuが算出される。そして後述する追尾被写体位置特定処理（図１０）では、リサイズしたフレーム画像に対して２４×２４画素のテンプレート画像を用いてテンプレートマッチング処理を行う。これにより、テンプレートマッチング処理において扱えるテンプレート画像のサイズが２４×２４画素までと限られていても、元のフレーム画像において２４×２４画素よりも大きいサイズの被写体を追尾することができる。

その後ステップＳ２２２へ進み、制御装置１０４は、第１〜第４、第６〜第９リサイズ判定用テンプレート画像の中心位置について、それぞれ第５リサイズ判定用テンプレート画像の中心位置からの距離を初期距離として算出する。制御装置１０４は、算出した距離を不図示のメモリに記録する。その後、制御装置１０４は、図５の処理を終了し、図２の処理に復帰する。

制御装置１０４は、上述したように図２のステップＳ２０のテンプレート画像生成処理を完了するとステップＳ３０へ進み、２フレーム目のテンプレートマッチング処理における探索エリアを設定する。ここで制御装置１０４は、上記追尾被写体位置を中心とし、テンプレート画像のサイズ（Tempsize）に基づいて定められるサイズのエリアを探索エリアとして設定する。具体的には、探索エリアの上端ｙ座標（TM_Ystart）、下端ｙ座標（TM_Yend）、左端ｘ座標（TM_Xstart）、右端ｙ座標（TM_Xend）を、次式（８）〜（１５）により算出する。なお次式（８）〜（１５）において、TM_ImageWidthはフレーム画像の横幅に上記縮小倍率をかけたもの、ObjectYは追尾被写体位置のｙ座標、ObjectXは追尾被写体位置のｘ座標、MinZansa=0.1、Keisu=0.5である。また、次式（１２）〜（１５）において、Objectsizeが２４画素以下の場合はTempsize=Objectsizeであり、Objectsizeが２４画素よりも大きい場合はTempsize=24である。さらに、次式（１２）〜（１５）において、Objectsizeが２４画素よりも大きい場合には、ObjectX、ObjectYについては、ステップＳ２１８でリサイズに合わせて変換した座標を用いる。
Search＝TM_ImageWidth×Keisu ・・・（８）
If(ObjectSize>=60) →Geta＝50
else Geta＝24 ・・・（９）
Geta1＝Geta×Shuku ・・・（１０）
SearchWidth＝Minzansa×Search＋Geta1 ・・・（１１）
TM_Ystart＝ObjectY−(SearchWidth＋1)−TempSize/2 ・・・（１２）
TM_Yend＝ObjectY＋SearchWidth＋TempSize/2 ・・・（１３）
TM_Xstart＝ObjectX−(SearchWidth＋1)−TempSize/2 ・・・（１４）
TM_Xend＝ObjectX＋SearchWidth＋TempSize/2 ・・・（１５）

その後ステップＳ４０へ進み、制御装置１０４は、追尾被写体を見失ったか否かを示すロスト判定用フラグを初期値であるＯＦＦに設定して、ステップＳ５０へ進む。ロスト判定用フラグは、「ＯＮ」の場合は追尾被写体がロストしたことを示し、「ＯＦＦ」の場合は追尾被写体がロストしていないことを示す。なお、追尾被写体がロストした状態とは、追尾被写体がフレームアウトしたり、遮蔽物に遮蔽されたりするなどして、フレーム画像内（画面内）からいなくなった状態であり、フレーム画像から追尾被写体が検出されない状態である。一方、追尾被写体がロストしていない状態とは、追尾被写体がフレーム画像内にいる状態である。

ステップＳ５０において、制御装置１０４は、撮像素子１０３から入力されるフレーム画像（２フレーム目以降の画像）を読み込み、上述したステップＳ１０と同様に、ＲＧＢ表色系で表されたフレーム画像を、輝度画像（Ｙ画像）と色差画像（Ｃｂ、Ｃｒ）とに変換する。そして制御装置１０４は、上記ステップＳ２１３もしくはＳ２１８、または後述するステップＳ８１０もしくはＳ８１５で設定した縮小倍率Shukuに基づいて、ステップＳ４０で読み込んだフレーム画像をリサイズし、ステップＳ６０へ進む。

ステップＳ６０において、制御装置１０４は、ロスト判定用フラグが「ＯＮ」に設定されているか否かを判定する。制御装置１０４は、ロスト判定用フラグが「ＯＮ」に設定されている場合、ステップＳ６０を肯定判定してステップＳ１５０（後述する）へ進み、「ＯＦＦ」に設定されている場合、ステップＳ６０を否定判定してステップＳ７０へ進む。

ステップＳ７０において制御装置１０４は、追尾被写体位置特定処理を実行する。ここで、追尾被写体位置特定処理の詳細について図１０を用いて説明する。図１０のステップＳ７０１において制御装置１０４は、ステップＳ５０でリサイズしたフレーム画像において、探索エリア内の画像と初期テンプレート画像との類似度、および探索エリア内の画像と合成テンプレート画像との類似度を、それぞれ演算する。ここで、類似度の演算方法としては、絶対差分和（SAD：Sum of Absolute Difference）を用いる。絶対差分和は、その値が小さいほど類似度が高いことを示し、その値が大きいほど類似度が低いことを示す。

具体的に制御装置１０４は、探索エリア内で、初期テンプレート画像と同一サイズの探索枠を１画素ずつ移動させながら、探索枠内の画像と初期テンプレート画像との絶対差分和を、Ｙ成分、Ｃｂ成分、Ｃｒ成分それぞれにおいて演算する。合成テンプレート画像についても同様に、探索枠を１画素ずつ移動させながら、探索枠内の画像と合成テンプレート画像との絶対差分和を演算する。そして、初期テンプレート画像および合成テンプレート画像のそれぞれについて、各探索枠位置における絶対差分和を２次元化して表した類似度マップを、Ｙ成分、Ｃｂ成分、Ｃｒ成分ごとに生成する。

その後ステップＳ７０２へ進み、制御装置１０４は、ステップＳ４０で読み込んだフレーム画像が２フレーム目であるか否かを判定する。制御装置１０４は、２フレーム目である場合にはステップＳ７０４へ進み、３フレーム目以降である場合にはステップＳ７０３へ進む。

ステップＳ７０３において制御装置１０４は、ステップＳ７０１で生成した類似度マップごとに、前フレームにおける追尾被写体位置特定処理で特定した追尾被写体位置からの距離に応じた係数Kyoriを乗算して、ステップＳ７０４へ進む。なお、この係数Kyoriは、次式（１６）により算出される。すなわち、この係数は、前フレームにおける追尾被写体位置から離れるほど大きくなるように算出される。
Kyori(x,y)＝Kyori_０＋K(|x−Mx×Shuku|＋|y−My×Shuku|) ・・・（１６）
なお、式（１６）において、(x,y)は、探索エリア内の各画素の座標であり、Mxは前フレームで特定された追尾被写体位置のｘ座標、Myは前フレームで特定された追尾被写体位置のｙ座標である。また、本実施形態では、Kyori_０＝1.0、K＝0.05とする。

ステップＳ７０４において制御装置１０４は、初期テンプレート画像および合成テンプレート画像のそれぞれについて、Ｙ成分、Ｃｂ成分、Ｃｒ成分の類似度マップSADY、SADCb、SADCrを次式（１７）により統合し、統合類似度マップSADallを生成する。
SADall＝1/N(GainY×SADY＋GainCb×SADCb＋GainCr×SADCb）・・・（１７）
なお、式（１７）において、本実施形態では、GainY＝0.1、GainCb＝1.5、GainCr＝1.5とする。また、NはSADの正規化係数であり、N＝Tempsize×Tempsize×255とする。

そして制御装置１０４は、初期テンプレート画像の統合類似度マップ、および合成テンプレート画像の統合類似度マップの中から、最大類似度（すなわち最小絶対差分和）が算出された探索枠位置を、マッチング位置として選出する。すなわち、初期テンプレート画像との最大類似度が合成テンプレート画像との最大類似度よりも高い場合には、初期テンプレート画像との最大類似度が算出された探索枠位置がマッチング位置となり、合成テンプレート画像との最大類似度が初期テンプレート画像との最大類似度よりも高い場合には、合成テンプレート画像との最大類似度が算出された探索枠位置がマッチング位置となる。制御装置１０４は、マッチング位置における探索枠内の領域をマッチング領域として特定し、マッチング領域の中心位置を追尾被写体位置として特定する。

具体的には、制御装置１０４は、次式（１８）および（１９）により、追尾被写体位置の座標（Objx,Objy）を算出する。
Objx＝Mx＋Tempsize/2 ・・・（１８）
Objy＝My＋Tempsize/2 ・・・（１９）

また制御装置１０４は、次式（２０）〜（２３）により、マッチング領域の４隅の座標（(x1, y1)、(x2, y2)、(x3, y3)、(x4, y4)）を算出する。そしてステップＳ７０５へ進む。
(x1, y1) = (Mx, My) ・・・（２０）
(x2, y2) = (Mx + TempSize - 1, My) ・・・（２１）
(x3, y3) = (Mx + TempSize - 1, My + TempSize - 1) ・・・（２２）
(x4, y4) = (Mx, My + TempSize - 1) ・・・（２３）

ステップＳ７０５において、制御装置１０４は、ステップＳ７０４で特定したマッチング位置と追尾被写体位置の座標を、縮小倍率Shukuでリサイズする前のフレーム画像サイズに合わせて変換する。そして、制御装置１０４は、次式（２４）〜（２７）により、追尾被写体エリアの上端ｙ座標（Obj_YStart）、下端ｙ座標（Obj_YEnd）、左端ｘ座標（Obj_XStart）、右端ｘ座標（Obj_XEnd）を算出する。
Obj_YStart＝My/Shuku ・・・（２４）
Obj_YEnd＝（My＋Tempsize−1）/Shuku ・・・（２５）
Obj_XStart＝Mx/Shuku ・・・（２６）
Obj_XEnd＝（Mx＋Tempsize−1）/Shuku ・・・（２７）

そして制御装置１０４は、モニタ１０６に表示されたフレーム画像上に、追尾被写体エリアおよび追尾被写体位置を表示して、図１０の処理を終了し、図２の処理に復帰する。

制御装置１０４は、上述したように図２のステップＳ７０の追尾被写体位置特定処理を完了するとステップＳ８０へ進む。ステップＳ８０において、制御装置１０４は、初期テンプレート画像と、ステップＳ７０４で特定したマッチング領域内の画像との類似度を、追尾被写体がロストしたか否かを判定するためのロスト判定用類似度として算出する。ロスト判定用類似度を算出するには、例えば、上述したステップＳ７０１、Ｓ７０３、Ｓ７０４と同様の方法を用いる。具体的に、制御装置１０４は、ステップＳ７０４で特定したマッチング領域内の画像と初期テンプレート画像との絶対差分和（SAD）を、Ｙ成分、Ｃｂ成分、Ｃｒ成分ごとに演算する。そして、演算した絶対差分和に対して、上記式（１６）により、前フレームにおける追尾被写体位置特定処理で特定した追尾被写体位置からの距離に応じた係数Kyoriを乗算する。そして、この係数Kyoriを乗算した後のＹ成分、Ｃｂ成分、Ｃｒ成分の絶対差分和を上記式（１７）により統合した値を、ロスト判定用類似度とする。

初期テンプレート画像のみを用いてロスト判定用類似度を算出する理由は以下の通りである。合成テンプレート画像には、前回までに追尾被写体エリアとして特定した画像の情報が含まれている。したがって追尾被写体を捉えられていない場合にも、合成テンプレート画像と今回特定したマッチング領域内の画像との類似度が高くなり、追尾被写体を見失ったことを判定できない可能性が高い。そこで確実に追尾被写体画像の情報が含まれている初期テンプレート画像を用いてロスト判定用類似度を算出することで、追尾被写体がロストしたか否かを精度よく判定することができる。

このようにロスト判定用類似度を算出すると、制御装置１０４は、ステップＳ９０へ進む。ステップＳ９０において、制御装置１０４は、連続してｎフレーム以上（本実施形態では、例えばｎ＝１０）、ロスト判定用類似度が次式（２８）により算出される閾値（LostThresh）以下であるか否かを判定する。
If(ObjectSize≧90) → LostThresh=1/Zansa1
elseif(ObjectSize≧30) → LostThresh=1/Zansa2
else →LostThresh=1/Zansa3 ・・・（２８）

なお、式（２８）において、Zansa1、Zansa2、Zansa3は、SADを使って類似度を算出する場合、１より小さい値が好ましく、また、ObjectSizeが大きい程、大きい値を設定するのが好ましい。本実施の形態では、例えば、Zansa1=0.20、Zansa2=0.10、Zansa3=0.08とする。なお、式（２８）では、３つの場合に分けて閾値を設定しているが、もっと細かくObjectSize毎に閾値を設定してもよいし、反対に、ObjectSizeによらず閾値を１つだけ設定してもよい。もちろん、９０や３０以外のObjectSizeを基準として閾値を設定しても良い。

制御装置１０４は、連続してｎフレーム以上ロスト判定用類似度が閾値（LostThresh）以下であった場合には、追尾被写体がロストしたと判定し、ステップＳ９０を肯定判定してステップＳ１４０へ進む。ステップＳ１４０において、制御装置１０４は、ロスト判定用フラグを「ＯＮ」に設定して、ステップＳ１７０（後述する）へ進む。

一方、連続してｎフレーム以上ロスト判定用類似度が閾値（LostThresh）以下である場合以外には、制御装置１０４は、追尾被写体がロストしていないと判定し、ステップＳ９０を否定判定してステップＳ１００へ進む。

ステップＳ１００において、制御装置１０４は、ステップＳ５０で読み込んだフレーム画像が最終フレームか否かを判定する。制御装置１０４は、最終フレームである場合、ステップＳ１００を肯定判定して図２の処理を終了し、最終フレームではない場合、ステップＳ１００を否定判定してステップＳ１１０（図３）へ進む。

図３のステップＳ１１０において制御装置１０４は、合成テンプレート画像更新処理を実行する。ここで、合成テンプレート画像更新処理の詳細について図１１を用いて説明する。図１１のステップＳ１１０１において制御装置１０４は、合成テンプレート画像を更新するか否かを判定する。このとき制御装置１０４は、以下の条件（１）および条件（２）を満たす場合に、合成テンプレート画像の更新条件を満たすと判断する。
条件（１）・・・上記最小絶対差分和があらかじめ設定されている判定閾値よりも小さい（すなわち最大類似度が所定以上の高さである）こと
条件（２）・・・所定の回数（例えば３回)以上連続して、同じテンプレート画像から生成された類似度マップから最大類似度が算出されたこと

そこで制御装置１０４は、上記更新条件を満たすと判断した場合にはステップＳ１１０１を肯定判定してステップＳ１１０２へ進む。一方、上記更新条件を満たさないと判断した場合にはステップＳ１１０１を否定判定し、合成テンプレート画像を更新せずに図１１の処理を終了して、図３の処理に復帰する。

ステップＳ１１０２において制御装置１０４は、最大類似度が算出されたのは、初期テンプレート画像による類似度マップであるか、合成テンプレート画像による類似度マップであるかを判定する。制御装置１０４は、合成テンプレート画像による類似度マップであると判定した場合にはステップＳ１１０３へ進み、初期テンプレート画像による類似度マップであると判定した場合にはステップＳ１１０４へ進む。

ステップＳ１１０３において制御装置１０４は、第１の重み係数を乗じたマッチング領域内の画像の画素情報と、第２の重み係数を乗じた初期テンプレート画像の画素情報とを加算、すなわち合成して新たな合成テンプレート画像を生成する。制御装置１０４は、この生成した画像を新たな合成テンプレート画像として更新して図１１の処理を終了し、図３の処理に復帰する。

ここで、マッチング領域内の画像と初期テンプレート画像とは、いずれも追尾すべき被写体から切り出されたデータであるため、全く異なる情報量を有するものではない。よって、これら２つの画像を合成すれば、追尾被写体に類似する画像が生成されることになる。このように合成した画像を新たな合成テンプレート画像として用いるメリットは、例えば、被写体の動きが激しい場合には、複数の被写体情報を含んだ合成テンプレート画像を用いることにより、多少の被写体変化でもロバストに追尾することが可能になる。なお、第１の重み係数と第２の重み係数は、その和が１になるように設定し、それぞれの重み係数の値は、例えば、第１の重み係数＝０．６、第２の重み係数＝０．４とする。すなわち、最大類似度が算出されたのが合成テンプレート画像である場合には、現在の被写体の形状は、初期テンプレート画像における被写体の形状から大きく変化している可能性が高いため、合成テンプレート画像の画素情報に乗じる第１の重み係数を大きく設定することによって、現在の被写体の形状を強く反映させた新たな合成テンプレート画像を生成することができる。また、この場合であっても、初期テンプレート画像の画素情報に、値を小さく設定した第２の重み係数を乗じて足し込むことにより、新たな合成テンプレート画像が初期テンプレート画像から大きく離れ過ぎないようにすることができる。

一方、ステップＳ１１０４において、制御装置１０４は、第３の重み係数を乗じたマッチング領域内の画像の画素情報と、第４の重み係数を乗じた初期テンプレート画像の画素情報とを加算、すなわち合成して新たな合成テンプレート画像を生成する。制御装置１０４は、この生成した画像を新たな合成テンプレート画像として更新して図１１の処理を終了し、図３の処理に復帰する。

この場合、第３の重み係数と第４の重み係数は、その和が１になるように設定し、それぞれの重み係数の値は、例えば、第３の重み係数＝０．４、第４の重み係数＝０．６とする。すなわち、最大類似度が算出されたのが初期テンプレート画像による類似度マップである場合、現在の被写体の形状は、初期テンプレート画像における被写体の形状からそれほど変化していない可能性が高いため、初期テンプレート画像の画素情報に乗じる第４の重み係数を大きく設定することにより、新たに生成する合成テンプレート画像を初期テンプレート画像に近づくようにする。また、この場合であっても、マッチング領域内の画像の画素情報に、値を小さく設定した第３の重み係数を乗じて足し込むことにより、時間経過に伴う被写体形状の変化の影響も加味した新たな合成テンプレート画像を生成することができる。

制御装置１０４は、上述したようにステップＳ１１０の合成テンプレート画像更新処理を完了するとステップＳ１２０へ進み、テンプレート画像サイズ変更処理を実行する。ここで、テンプレート画像サイズ変更処理の詳細について図１２および図１３を用いて説明する。図１２のステップＳ１２０１において制御装置１０４は、上記ステップＳ７０１において述べた初期テンプレート画像および合成テンプレート画像の場合と同様に、探索エリア内の画像と第１〜第９リサイズ判定用テンプレート画像との類似度をそれぞれ演算する。そして、第１〜第９リサイズ判定用テンプレート画像のそれぞれについて、Ｙ成分、Ｃｂ成分、Ｃｒ成分ごとに類似度マップを生成する。

その後ステップＳ１２０２へ進み、制御装置１０４は、ステップＳ５０で読み込んだフレーム画像が２フレーム目であるか否かを判定する。制御装置１０４は、２フレーム目である場合にはステップＳ１２０４へ進み、３フレーム目以降である場合にはステップＳ１２０３へ進む。

ステップＳ１２０３において制御装置１０４は、上記ステップＳ７０３と同様に、上記式（１６）を用いて係数Kyoriを算出する。なお、上記式（１６）におけるMxとMyは、前フレームにおけるステップＳ７０４またはＳ１５０４で特定したマッチング位置の座標を用いる。そして、制御装置１０４は、ステップＳ１２０１で生成した第５リサイズ判定用テンプレート画像における類似度マップに係数Kyoriを乗算して、ステップＳ１２０４へ進む。

ステップＳ１２０４において制御装置１０４は、第１〜第９リサイズ判定用テンプレート画像のそれぞれについて、上記ステップＳ７０４と同様に、Ｙ成分、Ｃｂ成分、Ｃｒ成分の類似度マップを上記式（１７）により統合し、統合類似度マップを生成する。そして制御装置１０４は、第１〜第９リサイズ判定用テンプレート画像の統合類似度マップのそれぞれにおいて、最大類似度である（すなわち最小絶対差分和である）探索枠位置をマッチング位置として特定して、ステップＳ１２０５へ進む。すなわち、第１〜第９リサイズ判定用テンプレート画像のそれぞれについて、マッチング位置を特定する。

ステップＳ１２０５において制御装置１０４は、第５リサイズ判定用テンプレート画像による統合類似度マップの最小絶対差分和が、あらかじめ設定されている判定閾値よりも小さい（すなわち最大類似度が所定以上の高さである）か否かを判定する。制御装置１０４は、上記最小絶対差分和が上記判定閾値よりも小さい場合には、ステップＳ１２０５を肯定判定してステップＳ１２０６へ進む。一方、制御装置１０４は、上記最小絶対差分和が上記判定閾値以上である場合（すなわち最大類似度が所定よりも低い場合）には、ステップＳ１２０５を否定判定し、テンプレート画像のサイズを変更せずに図１２の処理を終了して、図３の処理に復帰する。

ステップＳ１２０６において制御装置１０４は、第１〜第４および第６〜第９リサイズ判定用テンプレート画像において、最小絶対差分和があらかじめ設定されている判定閾値よりも小さい（すなわち最大類似度が所定以上の高さである）ものを選択する。そして制御装置１０４は、選択したリサイズ判定用テンプレート画像についてのマッチング位置と、第５リサイズ判定用テンプレート画像についてのマッチング位置（＝合成テンプレート画像についてのマッチング位置）との距離（現在距離）をそれぞれ算出し、ステップＳ１２０７へ進む。

ここで図１４を用いて、第１〜第９リサイズ判定用テンプレート画像についてのマッチング位置Ｍ１〜Ｍ９と、追尾被写体Ｈｓの大きさとの関係を説明する。図１４（Ｂ）は、初期距離、すなわち第１〜第４、第６〜第９リサイズ判定用テンプレート画像の中心位置Ｐ１〜Ｐ４、Ｐ６〜Ｐ９のそれぞれにおける、第５リサイズ判定用テンプレート画像の中心位置Ｐ５からの距離を説明する図である。

図１４（Ｂ）の状態から図１４（Ａ）の状態に変化した場合、すなわちフレーム画像上で追尾被写体Ｈｓが小さくなった場合には、第１〜第５リサイズ判定用テンプレート画像のマッチング位置Ｍ１〜Ｍ９の位置関係は、図１４（Ｂ）に示す場合と比較して密度が高くなる。すなわち、第１〜第４、第６〜第９リサイズ判定用テンプレート画像のマッチング位置Ｍ１〜Ｍ４、Ｍ６〜Ｍ９のそれぞれにおける、第５リサイズ判定用テンプレート画像のマッチング位置Ｍ５からの距離（現在距離）が、それぞれに対応する初期距離と比べて短くなる。また、追尾被写体Ｈｓが小さくなるほど、現在距離が初期距離と比べてより短くなる。

図１４（Ｂ）の状態から図１４（Ｃ）の状態に変化した場合、すなわちフレーム画像上で追尾被写体Ｈｓが大きくなった場合には、第１〜第５リサイズ判定用テンプレート画像のマッチング位置Ｍ１〜Ｍ９の位置関係は、図１４（Ｂ）に示す場合と比較して密度が低くなる（まばらになる）。すなわち、第１〜第４、第６〜第９リサイズ判定用テンプレート画像のマッチング位置Ｍ１〜Ｍ４、Ｍ６〜Ｍ９のそれぞれにおける、第５リサイズ判定用テンプレート画像のマッチング位置Ｍ５からの距離（現在距離）が、それぞれに対応する初期距離と比べて長くなる。また、追尾被写体Ｈｓが大きくなるほど、現在距離が初期距離と比べてより長くなる。

なお、追尾被写体Ｈｓのサイズが変わらない場合には、第１〜第４、第６〜第９リサイズ判定用テンプレート画像のマッチング位置Ｍ１〜Ｍ４、Ｍ６〜Ｍ９のそれぞれにおける、第５リサイズ判定用テンプレート画像のマッチング位置Ｍ５からの距離は、それぞれに対応する初期距離からあまり変化しない。

そこでステップＳ１２０７において、制御装置１０４は、ステップＳ１２０６で算出した距離（現在距離と呼ぶ）において、上記ステップＳ２１７もしくはステップＳ２２２、または後述するステップＳ１２１４もしくはステップＳ１２１９で算出した初期距離からの変化が大きいか否かを判定する。具体的には、ステップＳ１２０６で算出した現在距離のうち過半数以上において、現在距離／初期距離≧１．２、または、現在距離／初期距離≦０．７６となる場合に現在距離において初期距離からの変化が大きいと判断し、これ以外の場合は現在距離において初期距離からの変化が小さいと判断する。現在距離において初期距離からの変化が大きい場合には、追尾被写体のサイズが大きく変化した可能性が高い。したがって制御装置１０４は、当該変化が大きいと判断した場合にはステップＳ１２０７を肯定判定して、ステップＳ１２０８へ進む。一方、制御装置１０４は、当該変化が小さいと判断した場合にはステップＳ１２０７を否定判定し、テンプレート画像のサイズを変更せずに図１２の処理を終了して、図３の処理に復帰する。

図１３のステップＳ１２０８において、制御装置１０４は、現在距離が初期距離と比較して長くなった場合にはオブジェクトサイズを大きくし、現在距離が初期距離と比較して短くなった場合にはオブジェクトサイズを小さくする。また、制御装置１０４は、変更前のオブジェクトサイズが大きいほどサイズの変更量を大きくし、変更前のオブジェクトサイズが小さいほどサイズの変更量を小さくする。具体的には、現在距離／初期距離≧１．２の場合は次式（２９）を用いて、現在距離／初期距離≦０．７６の場合は次式（３０）を用いて、オブジェクトサイズ（Objectsize）を更新する。

(１)現在距離/初期距離≧１．２の場合
If(ObjectSize≧240) → ObjectSize＝240
elseif(ObjectSize≧120) → ObjectSize＝ObjectSize＋15
elseif(ObjectSize≧60) → ObjectSize＝ObjectSize＋12
elseif(ObjectSize≧48) → ObjectSize＝ObjectSize＋9
elseif(ObjectSize≧27) → ObjectSize＝ObjectSize＋6
else →ObjectSize＝ObjectSize＋3 ・・・（２９）

(２)現在距離／初期距離≦０．７６の場合
If(ObjectSize≧105) → ObjectSize＝ObjectSize−15
elseif(ObjectSize≧72) → ObjectSize＝ObjectSize−12
elseif(ObjectSize≧33) → ObjectSize＝ObjectSize−9
elseif(ObjectSize≧24) → ObjectSize＝ObjectSize−6
elseif(ObjectSize≦6) → ObjectSize＝6
else →ObjectSize＝ObjectSize−3 ・・・（３０）

その後、ステップＳ１２０９へ進み、制御装置１０４は、ステップＳ１２０８で更新したオブジェクトサイズが所定値（本実施形態では２４画素）よりも大きいか否かを判定する。制御装置１０４は、オブジェクトサイズが所定値よりも大きい場合には、ステップＳ１２０９を肯定判定してステップＳ１２１５へ進む。一方、オブジェクトサイズが所定値以下の場合には、ステップＳ１２０９を否定判定してステップＳ１２１０へ進む。

ステップＳ１２１０において制御装置１０４は、フレーム画像の縮小倍率Shukuを１倍に設定し、ステップＳ１２１１へ進む。

ステップＳ１２１１において制御装置１０４は、ステップＳ２１４またはＳ２１９で不図示のメモリに記録した初期テンプレート画像のサイズを、ステップＳ２１３またはＳ２１８で不図示のメモリに保存した縮小倍率Shukuの逆数を用いてリサイズする。そして制御装置１０４は、このリサイズした初期テンプレート画像を、ステップＳ１２０８で更新したオブジェクトサイズObjectsize×Objectsizeとなるようにリサイズして、ステップＳ１２１２へ進む。

ステップＳ１２１２において制御装置１０４は、ステップＳ５０で読み込んだフレーム画像において、ステップＳ７０で特定した追尾被写体位置を中心とし、サイズがステップＳ１２０８で更新したオブジェクトサイズObjectsize×Objectsizeである画像を、合成テンプレート画像として更新して、ステップＳ１２１３へ進む。

ステップＳ１２１３において制御装置１０４は、ステップＳ１２１３で生成した合成テンプレート画像を３×３のブロックに分割し、各ブロックの中心位置を算出する。そして制御装置１０４は、上述したステップＳ２１６の場合と同様に、各ブロックの中心位置を中心とし、ステップＳ１２０８で更新したオブジェクトサイズObjectsize×Objectsizeである画像を、第１〜第９リサイズ判定用テンプレート画像として更新する。

このように上記ステップＳ１２１１〜Ｓ１２１３において、制御装置１０４は、現在距離が初期距離と比較して長くなった場合には、テンプレート画像のサイズを大きくし、現在距離が初期距離と比較して短くなった場合にはテンプレート画像のサイズを小さくする。

その後ステップＳ１２１４へ進み、制御装置１０４は、ステップ１２１３で更新した第１〜第４、第６〜第９リサイズ判定用テンプレート画像の中心位置について、それぞれ第５リサイズ判定用テンプレート画像の中心位置からの距離を初期距離として算出する。制御装置１０４は、算出した距離を不図示のメモリに記録する。その後、制御装置１０４は、図１３の処理を終了し、図３の処理に復帰する。

一方、上述したステップＳ１２０９を肯定判定して進むステップＳ１２１５において、制御装置１０４は、上記ステップＳ１２０８で更新したオブジェクトサイズObjectsizeを用いて、上記式（７）によりフレーム画像の縮小倍率Shukuを算出する。そして制御装置１０４は、ステップＳ５０で読み込んだフレーム画像を当該算出した縮小倍率Shukuを用いてリサイズし、ステップＳ１２１６へ進む。なお、このリサイズに合わせて、ステップＳ７０で特定した追尾被写体位置の座標を変換する。

ステップＳ１２１６において制御装置１０４は、ステップＳ２１４またはＳ２１９で不図示のメモリに記録した初期テンプレート画像のサイズを、ステップＳ２１３またはＳ２１８で不図示のメモリに記録した縮小倍率Shukuの逆数を用いてリサイズする。そして制御装置１０４は、このリサイズした初期テンプレート画像を、ステップＳ１２０８で更新したオブジェクトサイズObjectsize×Objectsizeとなるようにリサイズする。さらに制御装置１０４は、このリサイズした初期テンプレート画像を、上記ステップＳ１２１５で算出した縮小倍率Shukuを用いてリサイズすることにより、初期テンプレート画像のサイズを２４×２４画素として、ステップＳ１２１７へ進む。

ステップＳ１２１７において制御装置１０４は、ステップＳ１２１５でリサイズしたフレーム画像において、上記追尾被写体位置を中心とし、サイズが２４×２４画素である画像を、合成テンプレート画像として更新して、ステップＳ１２１８へ進む。

ステップ１２１８において制御装置１０４は、ステップＳ１２１７で生成した合成テンプレート画像を３×３のブロックに分割し、各ブロックの中心位置を算出する。そして制御装置１０４は、上述したステップＳ２２１の場合と同様に、各ブロックの中心位置を中心とし、サイズが２４×２４画素である画像を、新たな第１〜第９リサイズ判定用テンプレート画像として更新する。

このように上記ステップＳ１２０９で更新したオブジェクトサイズが２４画素よりも大きい場合の上記ステップＳ１２１５〜Ｓ１２１８において、制御装置１０４は、現在距離が初期距離と比較して長くなった場合には、フレーム画像に対するテンプレート画像のサイズを大きくし、現在距離が初期距離と比較して短くなった場合にはフレーム画像に対するテンプレート画像のサイズを小さくする。なお、本説明において、テンプレート画像のサイズを変更するとは、フレーム画像のサイズに対するテンプレート画像のサイズの倍率を変更することを含むものとする。

その後ステップＳ１２１９へ進み、制御装置１０４は、ステップＳ１２１８で更新した第１〜第４、第６〜第９リサイズ判定用テンプレート画像の中心位置について、それぞれ第５リサイズ判定用テンプレート画像の中心位置からの距離を初期距離として算出する。制御装置１０４は、算出した距離を不図示のメモリに記録する。その後、制御装置１０４は、図１３の処理を終了し、図３の処理に復帰する。

制御装置１０４は、上述したように図３のステップＳ１２０のテンプレートサイズ変更処理を完了するとステップＳ１３０へ進み、次フレームのテンプレートマッチング処理における探索エリアを設定する。ここで制御装置１０４は、上記追尾被写体位置を中心とし、テンプレートサイズおよびステップＳ７０４で算出した最小絶対差分和（すなわち最大類似度）に基づいて定められるサイズのエリアを探索エリアとして設定する。具体的には、上記ステップＳ３０と同様に、探索エリアの上端ｙ座標（TM_Ystart）、下端ｙ座標（TM_Yend）、左端ｘ座標（TM_Xstart）、右端ｙ座標（TM_Xend）を、上記式（８）〜（１５）により算出する。なお上記式（１１）において、MinZansaは、ステップＳ７０４で算出した最小絶対差分和を用いる。

このようにして次フレームにおける探索エリアを設定すると、制御装置１０４は、ステップＳ５０（図２）に戻る。

一方、ロスト判定用フラグが「ＯＮ」に設定されている場合にステップＳ６０を肯定判定して進むステップＳ１５０において、制御装置１０４は、追尾被写体がロストしたと判定した時用の処理であるロスト判定時用処理を実行する。ここで、ロスト判定時用処理の詳細について図１５を用いて説明する。図１５のステップＳ１５０１において制御装置１０４は、探索エリアを設定する。ここで制御装置１０４は、ロスト判定フラグをＯＮに設定する直前にステップＳ７０で特定された追尾被写体位置を中心とし、テンプレート画像のサイズ（Tempsize）に基づいて定められるサイズのエリアを探索エリアとして設定する。

具体的には、上記ステップＳ３０と同様に、探索エリアの上端ｙ座標（TM_Ystart）、下端ｙ座標（TM_Yend）、左端ｘ座標（TM_Xstart）、右端ｙ座標（TM_Xend）を、上記式（８）〜（１５）により算出する。なお、上記式（１１）において、MinZansa＝0.1とする。また、上記式（８）のSearch = TM_ImageWidth×Keisuについては、Search = γ×TM_ImageWidth×Keisuに変更する。γは１より大きい値が好ましく、例えばγ＝３とする。この変更により、ロスト判定用フラグを「ＯＦＦ」に設定している場合と比較して、探索エリアを広く設定できるため、追尾被写体がフレームアウトした位置から離れた位置にフレームインしてくる場合も、追尾被写体を検出することができる。

このようにして探索エリアを設定するとステップＳ１５０２へ進み、制御装置１０４は、ステップＳ１５０１で設定した探索エリア内の画像と初期テンプレート画像および合成テンプレート画像との類似度をそれぞれ演算する。そして、初期テンプレート画像および合成テンプレート画像のそれぞれについて、Ｙ成分、Ｃｂ成分、Ｃｒ成分ごとに類似度マップを生成する。

その後ステップＳ１５０３へ進み、制御装置１０４は、上記ステップＳ７０３と同様に、上記式（１６）を用いて係数Kyoriを算出し、ステップＳ１５０１で生成した類似度マップごとに係数Kyoriを乗算する。なお、式（１６）におけるMxとMyは、ロスト判定フラグをＯＮに設定する直前にステップＳ７０で特定された追尾被写体位置の座標を用いる。また、Ｋは、ロスト判定用フラグを「ＯＦＦ」に設定している場合よりも、小さい値を設定することが望ましく、例えば、本実施の形態では、K＝0.01とする。これにより、ステップＳ１５０１で設定した探索エリア内に追尾被写体に類似した色の背景が存在する場合、擬似マッチングを抑制することができ、且つ、追尾被写体がフレームアウトした位置から離れた位置にフレームインしてくる場合にも、追尾被写体を検出することができる。

その後ステップＳ１５０４へ進み、制御装置１０４は、初期テンプレート画像について、上記ステップＳ７０４と同様に、Ｙ成分、Ｃｂ成分、Ｃｒ成分の類似度マップを上記式（１７）により統合し、統合類似度マップを生成する。そして制御装置１０４は、初期テンプレート画像の統合類似度マップにおいて、最大類似度である（すなわち最小絶対差分和である）探索枠位置をマッチング位置として特定して、ステップＳ１５０５へ進む。

ステップＳ１５０５において、制御装置１０４は、ステップＳ１５０４で算出した最大類似度が、次式（３１）により算出される閾値(ObjectThresh)以上であるか否かを判定する。
If (ObjectSize≧90) → ObjectThresh =1/Zansa4
elseif(ObjectSize≧30) → ObjectThresh =1/Zansa5
else →ObjectThresh =1/Zansa6 ・・・（３１）
なお、式（３１）において、Zansa4、Zansa5、Zansa6は、SADを使って類似度を算出する場合、１より小さい値が好ましく、また、ObjectSizeが大きい程、大きい値を設定するのが好ましい。本実施の形態では、例えば、Zansa4=0.15、Zansa5=0.069、Zansa3=0.060とする。なお、式（３１）では、３つの場合に分けて閾値を設定しているが、もっと細かくObjectSize毎に閾値を設定しても良いし、反対に、ObjectSizeによらず閾値を１つだけ設定しても良い。もちろん、９０や３０以外のObjectSizeを基準として閾値を設定しても良い。

制御装置１０４は、ステップＳ１５０４で算出した最大類似度が閾値(ObjectThresh)以上である場合には、追尾被写体がフレーム画像内に戻ってきたと判定し、ステップＳ１５０５を肯定判定して、ステップＳ１５０６へ進む。一方、制御装置１０４は、ステップＳ１５０４で算出した最大類似度が閾値(ObjectThresh)未満である場合には、追尾被写体がロスト状態であると判定し、ステップＳ１５０５を肯定判定して図１５の処理を終了し、図３の処理に復帰する。

ステップＳ１５０６において、制御装置１０４は、ステップＳ１５０４で特定したマッチング位置から、ステップＳ７０４と同様に式（１８）および（１９）を用いて追尾被写体位置を算出する。さらに制御装置１０４は、ステップＳ７０５と同様にマッチング位置と追尾被写体位置の座標を、縮小倍率Shukuでリサイズする前のフレーム画像サイズに合わせて変換し、式（２４）〜（２７）を用いて追尾被写体エリアを算出する。制御装置１０４は、モニタ１０６に表示されたフレーム画像上に、当該算出した追尾被写体位置および追尾被写体エリアを表示して、ステップＳ１５０７へ進む。

ステップＳ１５０７において、制御装置１０４は、ロスト判定用フラグを「ＯＦＦ」に設定して、図１５の処理を終了し、図３の処理に復帰する。

制御装置１０４は、上述したように図３のステップＳ１５０のロスト判定時用処理を完了するとステップＳ１６０へ進む。ステップＳ１６０において制御装置１０４は、初期テンプレート画像および合成テンプレート画像のそれぞれについて、上記ステップＳ７０４と同様に、Ｙ成分、Ｃｂ成分、Ｃｒ成分の類似度マップを上記式（１７）により統合し、統合類似度マップを生成する。そして制御装置１０４は、初期テンプレート画像の統合類似度マップ、および合成テンプレート画像の統合類似度マップの中から、最大類似度（すなわち最小絶対差分和）が算出された探索枠位置を、マッチング位置として選出する。

ステップＳ１７０において制御装置１０４は、ステップＳ１６０での処理結果を用いて、合成テンプレート画像更新処理を実行する。この合成テンプレート画像更新処理は、上述したステップＳ１１０の合成テンプレート画像更新処理と同一の処理であるため、説明を省略する。

その後ステップＳ１８０へ進み、制御装置１０４は、ステップＳ５０で読み込んだフレーム画像が最終フレームか否かを判定する。制御装置１０４は、最終フレームである場合、ステップＳ１８０を肯定判定して図３の処理を終了し、最終フレームではない場合、ステップＳ１８０を否定判定してステップＳ５０（図２）へ戻る。

このように、制御装置１０４は、ステップＳ５０〜Ｓ１８０の処理を繰り返すことにより、次々に読み込まれるフレーム画像において追尾被写体を追尾して、その位置をモニタ１０６に表示する。また、制御装置１０４は、追尾被写体がロストしたと判定した場合には、追尾被写体の追尾を停止して追尾被写体位置のモニタ１０６への表示を停止し、追尾被写体がフレーム画像内に戻ってきたか否かを判定するロスト判定時用処理を開始する。そして制御装置１０４は、追尾被写体がフレーム画像内に戻ってきたと判定した場合には、追尾被写体の追尾を再開する。

以上説明した実施形態によれば、次の作用効果が得られる。
（１）カメラ１００は、入力画像（フレーム画像）内に第１の探索領域を設定し、画像内容の更新を行わない初期テンプレート画像と第１の探索領域内の画像との類似度、および画像内容の更新を行う更新テンプレート画像（合成テンプレート画像）と第１の探索領域内の画像との類似度をそれぞれ演算し、これらの類似度に基づいて、入力画像内における追尾被写体位置を特定する制御装置１０４と、合成テンプレート画像を更新するか否かを判定し、更新すると判定した場合には、入力画像における追尾被写体位置を含む画像に基づいて、合成テンプレート画像を更新する制御装置１０４と、入力画像の追尾被写体位置における初期テンプレート画像との類似度に基づいて、入力画像から追尾被写体がロストしたか否か（検出されるか否か）を判定する制御装置１０４と、入力画像から追尾被写体がロストした（検出されない）と判定した場合には、入力画像内に第２の探索領域を設定し、初期テンプレート画像と第２の探索領域内の画像との類似度を演算し、この類似度に基づいて、入力画像内に追尾被写体が戻ってきたか否かを判定する制御装置１０４と、を備え、制御装置１０４は、入力画像から追尾被写体がロストした（検出されない）と判定した場合には、追尾被写体位置の特定を停止し、入力画像内に追尾被写体が戻ってきたと判定した場合には、追尾被写体位置の特定を再開する。これにより、追尾被写体がロストした場合には自動で被写体追尾処理を停止し、追尾被写体が画面に戻ってきた場合には自動で被写体追尾処理を再開することができる。また、初期テンプレート画像を用いて、追尾被写体がロストしたか否かの判定、および追尾被写体が画面内に戻ってきたか否かの判定を行うので、精度よくこれらの判定を行うことができる。

（２）上記（１）のカメラ１００において、制御装置１０４は、上記第２の探索領域を、上記第１の探索領域よりも広く設定するように構成した。このように被写体追尾処理における探索領域と比較して、追尾被写体が画面内に戻ってきたか否かの判定処理における探索領域を広く設定することで、追尾被写体がフレームアウトした位置から離れた位置にフレームインしてくる場合も、追尾被写体を検出することができる。

（３）上記（１）または（２）のカメラ１００において、制御装置１０４は、追尾被写体位置における初期テンプレート画像との類似度が所定閾値以下である入力画像が所定数（ｎフレーム）以上連続した場合に、入力画像から追尾被写体がロストしたと判定するように構成した。これにより、追尾被写体がロストしたか否かの判定を精度よく行うことができる。

（４）上記（１）〜（３）のカメラ１００において、制御装置１０４は、初期テンプレート画像と第２の探索領域内の画像との類似度における最大類似度が所定閾値以上である場合に、入力画像内に追尾被写体が戻ってきたと判定するように構成した。これにより、追尾被写体が画面内に戻ってきたか否かの判定を精度よく行うことができる。

（５）上記（１）〜（３）のカメラ１００において、制御装置１０４は、初期テンプレート画像と第１の探索領域内の画像との類似度、および合成テンプレート画像と第１の探索領域内の画像との類似度に、それぞれ、前フレームにおける追尾被写体位置からの距離に応じた第１の係数（Kyori）を乗算し、この乗算後の類似度に基づいて、入力画像内における追尾被写体位置を特定し、初期テンプレート画像と第２の探索領域内の画像との類似度に、入力画像から追尾被写体がロストしたと判定される直前に特定した追尾被写体位置からの距離に応じた第２の係数（Kyori）を乗算し、この乗算後の類似度に基づいて、入力画像内に追尾被写体が戻ってきたか否かを判定し、第２の係数は、第１の係数よりも小さいように構成した。このように、被写体追尾処理の際と比較して、追尾被写体が画面内に戻ってきたか否かの判定処理の際における、追尾被写体位置からの距離に応じた係数を小さくすることにより、追尾被写体が画面内に戻ってきたか否かの判定処理の際、擬似マッチングを抑制すると共に、追尾被写体がフレームアウトした位置から離れた位置にフレームインしてくる場合にも、追尾被写体を検出することができる。

（６）上記（４）のカメラ１００において、制御装置１０４は、初期テンプレート画像と第２の探索領域内の画像との類似度における最大類似度が所定閾値以上である場合、当該最大類似度が算出された位置を追尾被写体位置として特定するように構成した。これにより、追尾被写体が画面内に戻ってきた場合に、すぐに追尾被写体位置を特定することができる。

（７）上記（１）〜（６）のカメラ１００において、制御装置１０４は、入力画像から追尾被写体がロストしたと判定される直前に被写体追尾手段により特定された追尾被写体位置に基づいて第２の探索領域を設定するように構成した。これにより、追尾被写体の遮蔽によってロスト判定されたあと、追尾被写体の遮蔽がなくなった場合にすぐに追尾被写体が画面内に戻ってきたことを判定できる。

（変形例１）
上述した実施の形態では、リサイズ判定用テンプレート画像を用いてテンプレート画像サイズ変更処理を行う例について説明したが、この処理を行わなくてもよい。

（変形例２）
上述した実施の形態では、ステップＳ１１０において上記条件（１）および（２）を満たす場合に合成テンプレート画像の更新条件を満たすと判断する例について説明したが、合成テンプレート画像の更新条件はこれに限らなくてもよい。

（変形例３）
上述した実施の形態では、ステップＳ１１０においてマッチング領域内の画像と初期テンプレート画像とを重み付けして合成することにより合成テンプレート画像を更新する例について説明したが、合成テンプレート画像の更新方法は、これに限らなくてもよい。例えば、マッチング領域内の画像と初期テンプレート画像とを常に１対１で合成するようにしてもよい。

（変形例４）
上述した実施の形態では、追尾被写体の大きさを示すオブジェクトサイズが２４画素よりも大きい場合は、縮小倍率Shukuで縮小したフレーム画像において２４×２４画素のテンプレート画像を生成する例について説明した。しかしながら、テンプレートマッチング処理で扱えるテンプレート画像の大きさの最大値に制限がない場合には、オブジェクトサイズの大きさに係らず、Objectsize×Objectsizeのテンプレート画像を生成するようにしてもよい。

（変形例５）
上述した実施の形態では、制御装置１０４は、フレーム画像に対して行った２値化処理およびラベリング処理の結果を用いて、初期テンプレート画像を生成する例について説明した。しかしながら、他の方法によって初期テンプレート画像を生成してもよい。例えば、制御装置１０４は、使用者に対してフレーム画像内における追尾被写体エリアの指定を促し、使用者が操作部材１０１を操作して入力したエリア内の画像を切り出すことにより、初期テンプレート画像を生成してもよい。

（変形例６）
上述した実施の形態では、画像のリサイズ方法としてバイリニア法を用いる例について説明した。しかしながら、画像のリサイズ方法として、ニアリストネイバー法、またはバイキュービック法などを用いるようにしてもよい。

（変形例７）
上述した実施の形態では、制御装置１０４は、スルー画を対象として被写体追尾を行う例について説明した。しかしながら、カメラ１００が動画撮影機能を備えている場合には、制御装置１０４は、スルー画ではなく、撮影済みの動画のフレーム間で被写体追尾を行うようにしてもよい。

（変形例８）
上述した実施の形態では、カメラ１００が備える制御装置１０４が図２および図３に示す処理を実行して被写体追尾を行う例について説明した。しかしながら、図２および図３に示す処理を実行するためのプログラムをパソコンなどその他の端末に記録して、当該端末上で処理を実行することも可能である。この場合、カメラで撮影した動画像データを端末側に取り込んで、これを対象に処理を行うようにすれば、動画のフレーム間で被写体追尾を行うことが可能となる。また、本発明はカメラ付き携帯電話などに適用することも可能である。

以上の説明はあくまで一例であり、上記の実施形態の構成に何ら限定されるものではない。また、上記実施形態に各変形例の構成を適宜組み合わせてもかまわない。

１００…カメラ、１０１…操作部材、１０２…レンズ、１０３…撮像素子、１０４…制御装置、１０５…メモリカードスロット、１０６…モニタ

Claims

入力画像内に第１の探索領域を設定し、画像内容の更新を行わない初期テンプレート画像と前記第１の探索領域内の画像との類似度、および画像内容の更新を行う更新テンプレート画像と前記第１の探索領域内の画像との類似度をそれぞれ演算し、これらの類似度に基づいて、前記入力画像内における追尾被写体位置を特定する被写体追尾手段と、
前記更新テンプレート画像を更新するか否かを判定し、更新すると判定した場合には、前記入力画像における前記被写体追尾手段により特定された前記追尾被写体位置を含む画像に基づいて、前記更新テンプレート画像を更新する更新手段と、
前記入力画像の前記被写体追尾手段により特定された追尾被写体位置における前記初期テンプレート画像との類似度に基づいて、前記入力画像から追尾被写体が検出されるか否かを判定する第１の判定手段と、
前記第１の判定手段により前記入力画像から追尾被写体が検出されないと判定された場合には、入力画像内に第２の探索領域を設定し、前記初期テンプレート画像と前記第２の探索領域内の画像との類似度を演算し、この類似度に基づいて、前記入力画像内に追尾被写体が戻ってきたか否かを判定する第２の判定手段と、
を備え、
前記被写体追尾手段は、前記第１の判定手段により前記入力画像から追尾被写体が検出されないと判定された場合には、前記追尾被写体位置の特定を停止し、前記第２の判定手段により前記入力画像内に追尾被写体が戻ってきたと判定された場合には、前記追尾被写体位置の特定を再開することを特徴とする被写体追尾装置。
請求項１に記載の被写体追尾装置において、
前記第２の判定手段は、前記第２の探索領域を、前記第１の探索領域よりも広く設定することを特徴とする被写体追尾装置。
請求項１または２に記載の被写体追尾装置において、
前記第１の判定手段は、前記追尾被写体位置における前記初期テンプレート画像との類似度が所定閾値以下である入力画像が所定数以上連続した場合に、前記入力画像から追尾被写体が検出されないと判定することを特徴とする被写体追尾装置。
請求項１〜３のいずれか一項に記載の被写体追尾装置において、
前記第２の判定手段は、初期テンプレート画像と前記第２の探索領域内の画像との類似度における最大類似度が所定閾値以上である場合に、前記入力画像内に追尾被写体が戻ってきたと判定することを特徴とする被写体追尾装置。
請求項１〜４のいずれか一項に記載の被写体追尾装置において、
前記被写体追尾手段は、前記初期テンプレート画像と前記第１の探索領域内の画像との類似度、および前記更新テンプレート画像と前記第１の探索領域内の画像との類似度に、それぞれ、前フレームにおける追尾被写体位置からの距離に応じた第１の係数を乗算し、この乗算後の類似度に基づいて、前記入力画像内における追尾被写体位置を特定し、
前記第２の判定手段は、初期テンプレート画像と前記第２の探索領域内の画像との類似度に、前記第１の判定手段により前記入力画像から追尾被写体が検出されないと判定される直前に前記被写体追尾手段により特定された追尾被写体位置からの距離に応じた第２の係数を乗算し、この乗算後の類似度に基づいて、前記入力画像内に追尾被写体が戻ってきたか否かを判定し、
前記第２の係数は、前記第１の係数よりも小さいことを特徴とする被写体追尾装置。
請求項４に記載の被写体追尾装置において、
前記第２の判定手段は、初期テンプレート画像と前記第２の探索領域内の画像との類似度における最大類似度が所定閾値以上である場合、当該最大類似度が算出された位置を追尾被写体位置として特定することを特徴とする被写体追尾装置。
請求項１〜６のいずれか一項に記載の被写体追尾装置において、
前記第２の判定手段は、前記第１の判定手段により前記入力画像から追尾被写体が検出されないと判定される直前に前記被写体追尾手段により特定された追尾被写体位置に基づいて前記第２の探索領域を設定することを特徴とする被写体追尾装置。
請求項１〜７のいずれか一項に記載の被写体追尾装置を備えるカメラ。