JP4565273B2 - 被写体追跡装置、およびカメラ - Google Patents

被写体追跡装置、およびカメラ Download PDF

Info

Publication number
JP4565273B2
JP4565273B2 JP2009120739A JP2009120739A JP4565273B2 JP 4565273 B2 JP4565273 B2 JP 4565273B2 JP 2009120739 A JP2009120739 A JP 2009120739A JP 2009120739 A JP2009120739 A JP 2009120739A JP 4565273 B2 JP4565273 B2 JP 4565273B2
Authority
JP
Japan
Prior art keywords
image
component
value
template
average value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009120739A
Other languages
English (en)
Other versions
JP2010015548A (ja
Inventor
啓之 阿部
健一 大場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP2009120739A priority Critical patent/JP4565273B2/ja
Priority to US12/457,091 priority patent/US8131068B2/en
Publication of JP2010015548A publication Critical patent/JP2010015548A/ja
Application granted granted Critical
Publication of JP4565273B2 publication Critical patent/JP4565273B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、複数の画像間で被写体を追跡するための被写体追跡装置、および被写体追跡機能を備えたカメラに関する。
次のようなパターンマッチング方法が知られている。このパターンマッチング方法は、画像を複数の領域に分割し、各領域ごとにテンプレートマッチング処理を行って、最も類似度が高い領域をマッチング領域として抽出する(例えば、特許文献1)。
特開平5−81433号公報
しかしながら、従来の方法を用いてテンプレートマッチングにより画像内における被写体位置を特定し、被写体位置をフレーム間で追跡しようとしたとき、テンプレート画像とターゲット画像との間で画像の明るさが変化した場合には、その画像の明るさの変化が類似度の算出結果に影響を及ぼすため、テンプレートマッチングの精度が低下するという問題があった。
本発明による被写体追跡装置は、時系列で入力される各入力画像内に設定した探索対象領域内で探索枠を移動させながら、各探索枠位置における探索枠内のターゲット画像について、テンプレート画像を用いたテンプレートマッチング処理を行って、複数の入力画像間で被写体追跡を行う被写体追跡装置であって、テンプレート画像とターゲット画像とをそれぞれ複数の分割領域に分割する分割手段と、テンプレート画像とターゲット画像とのそれぞれについて、分割領域ごとに、各画素の輝度値の平均値または加算値と、色差値の平均値または加算値とを算出し、複数の分割領域のうちのいずれか1つの分割領域を基準領域として、複数の分割領域の輝度値の平均値または加算値から基準領域の輝度値の平均値または加算値を減算することによって、分割領域ごとの輝度値の平均値または加算値をそれぞれ正規化する正規化手段と、テンプレート画像における分割領域ごとの正規化後の輝度値の平均値または加算値と分割領域ごとの色差値の平均値または加算値、およびターゲット画像における分割領域ごとの正規化後の輝度値の平均値または加算値と分割領域ごとの色差値の平均値または加算値に基づいて、テンプレートマッチング処理を行うテンプレートマッチング手段と、テンプレートマッチング手段によるマッチング結果に基づいて、複数の入力画像間で被写体追跡を行う被写体追跡手段とを備えることを特徴とする
発明による被写体追跡装置はまた、時系列で入力されるYCbCr色空間で表される各入力画像内に設定した探索対象領域内で探索枠を移動させながら、各探索枠位置における探索枠内のターゲット画像についてテンプレート画像を用いたテンプレート画像を用いたテンプレートマッチング処理を行って、複数の入力画像間で被写体追跡を行う被写体追跡装置であって、テンプレート画像とターゲット画像とをそれぞれ複数の分割領域に分割する分割手段と、テンプレート画像とターゲット画像とのそれぞれについて、複数の分割領域のうちのいずれか1つの分割領域を基準領域として、複数の分割領域のY成分の値から基準領域のY成分の値を減算することによって、分割領域ごとに、Y成分の値を正規化する正規化手段と、テンプレート画像とターゲット画像とのそれぞれにおける、前記分割領域ごとのCb成分の値と、前記分割領域ごとのCr成分の値と、正規化手段によって分割領域ごとに正規化されたY成分の値とに基づいて、テンプレートマッチング処理を行うテンプレートマッチング手段とを備えることを特徴とする。
本発明による被写体追跡装置はまた、時系列で入力されるYCbCr色空間で表される各入力画像内に設定した探索対象領域内で探索枠を移動させながら、各探索枠位置における探索枠内のターゲット画像についてテンプレート画像を用いたテンプレート画像を用いたテンプレートマッチング処理を行って、複数の入力画像間で被写体追跡を行う被写体追跡装置であって、テンプレート画像とターゲット画像とをそれぞれ複数の分割領域に分割する分割手段と、テンプレート画像とターゲット画像とのそれぞれについて、分割領域ごとに、Y成分の値を正規化する正規化手段と、テンプレート画像とターゲット画像とのそれぞれにおける、前記分割領域ごとのY成分の値と、前記分割領域ごとのCb成分の値と、分割領域ごとのCr成分の値と、正規化手段によって分割領域ごとに正規化されたY成分の値とに基づいて、テンプレートマッチング処理を行うテンプレートマッチング手段とを備えることを特徴とする。
本発明では、正規化手段は、複数の分割領域のうちのいずれか1つの分割領域を基準領域として、複数の分割領域のY成分の値から基準領域のY成分の値を減算することによって、分割領域ごとにY成分を正規化することを特徴とするようにしてもよい。
本発明によるカメラは、被写体像を撮像して画像を取得する撮像手段と、上記被写体追跡装置とを備え、被写体追跡装置は、撮像手段によって時系列で取得される各画像をターゲット画像としてテンプレートマッチング処理を行い、複数の画像間で被写体追跡を行うことを特徴とする。
本発明によれば、テンプレート画像とターゲット画像との間で画像の明るさが変化した場合でも、テンプレートマッチング処理の精度が低下することを防ぐことができる。
カメラ100の一実施の形態の構成を示すブロック図である。 ターゲット画像I、テンプレート画像A、および探索枠Bの具体例を示す図である。 テンプレート画像とターゲット画像を9つのブロックに分割した場合の具体例、および各領域ごとに算出されるY成分の平均値、Cb成分の平均値、Cr成分の平均値の具体例を示す図である。 テンプレート画像とターゲット画像との明るさが異なる場合の各領域ごとの算出されるY成分の平均値、Cb成分の平均値、Cr成分の平均値の具体例を示す図である。 図4に示したY成分の平均値を正規化した後の例を示す図である。 人物の顔から少しずれた位置にターゲット枠Bがあるときに、Y成分の算出結果を正規化した場合と、正規化しない場合とでテンプレートマッチング結果の違いを説明するための図である。 白っぽい領域と黒っぽい領域についてのY成分の平均値、Cb成分の平均値、Cr成分の平均値、および正規化後のY成分の平均値の具体例を示す第1の図である。 白っぽい領域と黒っぽい領域についてのY成分の平均値、Cb成分の平均値、Cr成分の平均値、および正規化後のY成分の平均値の具体例を示す第2の図である。
図1は、本実施の形態におけるカメラの一実施の形態の構成を示すブロック図である。カメラ100は、操作部材101と、レンズ102と、撮像素子103と、制御装置104と、メモリカードスロット105と、モニタ106とを備えている。操作部材101は、使用者によって操作される種々の入力部材、例えば電源ボタン、レリーズボタン、ズームボタン、十字キー、決定ボタン、再生ボタン、削除ボタンなどを含んでいる。
レンズ102は、複数の光学レンズから構成されるが、図1では代表して1枚のレンズで表している。撮像素子103は、例えばCCDやCMOSなどのイメージセンサーであり、レンズ102により結像した被写体像を撮像する。そして、撮像によって得られた画像信号を制御装置104へ出力する。
制御装置104は、撮像素子103から入力された画像信号に基づいて所定の画像形式、例えばJPEG形式の画像データ(以下、「本画像データ」と呼ぶ)を生成する。また、制御装置104は、生成した画像データに基づいて、表示用画像データ、例えばサムネイル画像データを生成する。制御装置104は、生成した本画像データとサムネイル画像データとを含み、さらにヘッダ情報を付加した画像ファイルを生成してメモリカードスロット105へ出力する。
メモリカードスロット105は、記憶媒体としてのメモリカードを挿入するためのスロットであり、制御装置104から出力された画像ファイルをメモリカードに書き込んで記録する。また、メモリカードスロット105は、制御装置104からの指示に基づいて、メモリカード内に記憶されている画像ファイルを読み込む。
モニタ106は、カメラ100の背面に搭載された液晶モニタ(背面モニタ)であり、当該モニタ106には、メモリカードに記憶されている画像やカメラ100を設定するための設定メニューなどが表示される。また、制御装置104は、使用者によってカメラ100のモードが撮影モードに設定されると、撮像素子103から時系列で取得した画像の表示用画像データをモニタ106に出力する。これによってモニタ106にはスルー画が表示される。
制御装置104は、CPU、メモリ、およびその他の周辺回路により構成され、カメラ100を制御する。なお、制御装置104を構成するメモリには、SDRAMやフラッシュメモリが含まれる。SDRAMは、揮発性のメモリであって、CPUがプログラム実行時にプログラムを展開するためのワークメモリとして使用されたり、データを一時的に記録するためのバッファメモリとして使用される。また、フラッシュメモリは、不揮発性のメモリであって、制御装置104が実行するプログラムのデータや、プログラム実行時に読み込まれる種々のパラメータなどが記録されている。
本実施の形態では、制御装置104は、撮像素子103から入力されるスルー画の各フレームに対して、あらかじめ用意したテンプレート画像を用いたテンプレートマッチング処理を行うことによって、フレーム内からテンプレート画像と類似する画像領域を特定する。そして、制御装置104は、特定した領域をフレーム間で追跡することによって、被写体追跡処理を行う。
具体的には、制御装置104は、テンプレートマッチング処理の基準となるテンプレート画像と、撮像素子103から時系列で入力される各フレームとのマッチング演算を行う。例えば、制御装置104は、図2に示すように、テンプレート画像Aを用いて画像I内における被写体位置を特定する。ここで用いるテンプレート画像Aは、あらかじめ使用者からの指示に基づいて取得される。例えば、使用者は、スルー画の最初のフレームがモニタ106に表示されたときに、操作部材101を操作して、最初のフレーム内で、フレーム間で追跡したい被写体を含む範囲を指定する。制御装置104は、使用者によって指定された範囲内の画像をテンプレート画像Aとして抽出して、SDRAMに記憶する。
制御装置104は、撮像素子103からのスルー画の入力が開始されると、各フレーム(コマ)を対象として、この画像I内の所定の位置にテンプレート画像と同じ大きさのターゲット枠Bを設定する。制御装置104は、設定したターゲット枠Bを画像I内で移動させながら、各位置におけるターゲット枠B内の画像(ターゲット画像)Cと、テンプレート画像Aとのマッチング演算を行なう。マッチング演算の結果、テンプレート画像Aとターゲット画像Cとの類似度が最も高い合致領域の画像I内における座標値を被写体位置として特定する。
なお、制御装置104は、画像Iの全体ではなく、画像内からテンプレート画像Aを抽出した位置を含む所定範囲内(探索対象領域内)を対象としてテンプレートマッチングを行うようにしてもよい。これによって、テンプレートマッチングを行う範囲を画像I内の被写体が存在している可能性が高い範囲に限定することができ、処理を高速化することができる。本実施の形態では、制御装置104は、画像I内に設定した探索対象領域内を対象としてテンプレートマッチングを行う例について説明する。
テンプレートマッチングの手法としては、一般的に、公知の残差逐次検定法などが用いられる。この残差逐次検定法では、次式(1)に示す残差和により類似度を算出し、算出した類似度に基づいてテンプレートマッチングを行う。
Figure 0004565273
なお、式(1)により類似度を算出した場合は、算出されるrが小さいほどテンプレート画像Aとターゲット画像Cとの類似度が高くなり、算出されるrが大きいほどテンプレート画像Aとターゲット画像Cとの類似度は低くなる。ここで、式(1)において、mは探索対象領域内における横方向の位置を示し、nは縦方向の位置を示している。本実施の形態では、テンプレート画像Aとターゲット画像Cは、いずれも輝度Y、色差Cb・CrのYCbCr表色系で表される画像データであるものとし、制御装置104は、Y、Cb、Crの各成分について式(1)を用いて類似度rを算出し、Y成分の類似度、Cb成分の類似度、Cr成分の類似度の合計値をテンプレート画像Aとターゲット画像Cとの類似度として算出する。
このように、公知の残差逐次検定法を用いて類似度を算出してテンプレートマッチングを行う場合には、画像Iの明るさが変化してテンプレート画像Aの明るさと大きく異なるものになった場合には、テンプレート画像Aの各画素のY成分の値と、ターゲット画像Cの各画素のY成分の値とが異なることから、ターゲット画像C内にテンプレート画像A内の被写体と同じ被写体が存在する場合であっても類似度が低く算出されてしまう。このため、画像I内における被写体位置を正しく特定することができない。
本実施の形態では、制御装置104は、画像Iの明るさが変化した場合であっても正確に被写体位置を特定することができるようにするために、テンプレートマッチングを行う前に、テンプレート画像Aとターゲット画像Cとを正規化して、両画像間の明るさの差を減少させる。そして、制御装置104は、正規化を行った後のテンプレート画像Aを用いて、ターゲット画像Cを対象としたテンプレートマッチングを行う。以下、制御装置104による処理の具体例について説明する。
制御装置104は、図3(a)に示すように、テンプレート画像Aとターゲット画像Cとを1から9の9つのブロック(領域)に分割する。例えば、テンプレート画像Aの大きさとターゲット画像Cの大きさをそれぞれ9×9画素の大きさとし、1つのブロックの大きさが3×3画素となるようにテンプレート画像Aとターゲット画像Cとを9つのブロックに分割する。本実施の形態では、各ブロックを図3(a)に示す番号を用いて表すこととし、例えば、左上のブロックはブロック1と表記する。
制御装置104は、テンプレート画像Aの各ブロック、およびターゲット画像Cの各ブロックごとに、ブロック内のY成分の値の平均値,Cb成分の値の平均値、およびCr成分の値の平均値をそれぞれ算出する。すなわち、制御装置104は、テンプレート画像Aの各ブロック、およびターゲット画像Cの各ブロックごとに、各画素のY成分の値を合計した値を画素数で割った値をY成分の値の平均値として算出し、Cb成分の値の平均値とCr成分の値の平均値も、同様に各画素の合計値を画素数で割って算出する。
例えば、ターゲット画像Cを対象として、各ブロックごとのY、Cb、Crの各成分の平均値を算出した場合には、図3(b)に示す算出結果が得られる。図3(b)に示す例では、ターゲット画像Cのブロック1は、Y成分の平均値が76、Cb成分の平均値が113、Cr成分の平均値が143と算出されている。
このように、ターゲット画像Cの各ブロックごとにY、Cb、Crの各成分の平均値を算出する場合、ターゲット画像Cの明るさが変化すると、その影響はY成分の平均値の算出結果に最も影響を及ぼす。すなわち、ターゲット画像Cの明るさが変化した場合には、Y成分の平均値の変化量が、Cb、Crの各色成分の平均値の変化量よりも大きくなる。その具体例を図4を用いて説明する。
図4(a)に示す画像は、被写体に日が当たっていない状態で撮影されている画像である。一方、図4(b)に示す画像は、被写体に日が当たっている状態で撮影された画像である。よって、図4(b)に示す画像は、図4(a)に示す画像と比較して、明るい画像になっている。この場合、例えば、図4(a)に示す画像内からテンプレート画像Aが取得され、このテンプレート画像Aを用いて図4(b)に示す画像I内に設定されたターゲット画像Cとのテンプレートマッチングを行うと、テンプレート画像Aとターゲット画像Cとの明るさの違いにより、正しくマッチングさせることができない。
具体例を図4(c)と図4(d)を用いて説明する。図4(c)は、図4(a)に示すテンプレート画像Aを対象とした各ブロックごとのY、Cb、Crの各成分の平均値の算出結果を示す図であり、図4(d)は、図4(b)に示すターゲット画像Cを対象とした各ブロックごとのY、Cb、Crの各成分の平均値の算出結果を示す図である。図4(c)と図4(d)とを比較すると、いずれのブロックでもCb成分とCr成分についての算出結果に大きな差はないが、Y成分については、全てのブロックで算出結果に大きな差が生じている。
このため、図4(a)におけるテンプレート画像Aを用いて図4(b)におけるターゲット画像Cを対象として式(1)を用いたテンプレートマッチングを行うと、いずれも同じ人物の同じ表情を含んでいるにも関わらず、Y成分の大きさの違いによって、類似度が低く算出されてしまうことになる。
本実施の形態では、制御装置104は、このような問題を解決するために、画像の明るさに起因して生じる各ブロックごとのY成分の算出結果の差を小さくするために、テンプレート画像Aとターゲット画像Cとを正規化し、正規化後のテンプレート画像Aを用いてターゲット画像Cとのテンプレートマッチングを行うこととする。
以下、テンプレート画像Aとターゲット画像Cに対する正規化処理について説明する。制御装置104は、テンプレート画像A、およびターゲット画像Cのそれぞれについて、9つのブロックのそれぞれのY成分の平均値から、9つのブロックのうちのいずれか1つのブロックのY成分の平均値を減算することによって、テンプレート画像Aとターゲット画像Cを正規化する。例えば、制御装置104は、テンプレート画像A、およびターゲット画像Cのそれぞれについて、ブロック5を基準領域として設定し、ブロック1から9の全てのブロックのY成分の平均値から、ブロック5のY成分の平均値を減算することによって、テンプレート画像Aとターゲット画像Cとを正規化する。
図4(c)に示した算出結果を上記方法により正規化した場合の結果を図5(a)に、図4(d)に示した算出結果を上記方法により正規化した場合の結果を図5(b)にそれぞれ示す。図5(a)においては、全てのブロックのY成分の平均値から図4(c)におけるブロック5のY成分の平均値(106)を減算することによって正規化されている。このため、図5(a)において、例えば、ブロック1のY成分の平均値は、76−106=−30と正規化されている。また、ブロック2のY成分の平均値は、127−106=21と正規化されている。同様の方法でブロック3からブロック9についても正規化が行われている。
次に図5(b)についてみると、図5(b)においては、全てのブロックのY成分の平均値から図4(d)におけるブロック5のY成分の平均値(148)を減算することによって正規化されている。このため、図5(b)において、例えば、ブロック1のY成分の平均値は、121−148=−27と正規化されている。また、ブロック2のY成分の平均値は、170−148=22と正規化されている。同様の方法でブロック3からブロック9についても正規化が行われている。
このように、テンプレート画像Aとターゲット画像Cのそれぞれについて、各ブロックのY成分の平均値の算出結果を正規化することによって、両画像間での各ブロックのY成分の平均値の算出結果の差を小さくすることができる。このため、式(1)を用いてテンプレート画像Aとターゲット画像CとのY成分の類似度rを算出したときに、画像の明るさの違いの影響を排除して、精度高く類似度を算出することができる。
例えば、図4(c)と図4(d)に示すY成分の平均値の算出結果を用いて、式(1)によりY成分の類似度を算出すると、r=|76−121|+|127−170|+・・・+|107−159|=370となる。これに対して、図5(a)と図5(b)に示す正規化後のY成分の平均値の算出結果を用いて、式(1)によりY成分の類似度を算出すると、r=|−30−(−27)|+|21−22|+・・・+|1−11|=76となる。このように、式(1)を用いて算出したY成分の類似度rは、正規化前よりも正規化後の方が大幅に小さい値となり、Y成分の類似度は高く算出されることになる。
また、式(1)によりCb成分とCr成分の類似度を算出し、Y、Cb、Crの全成分の類似度を加算した類似度を算出すると、図4に示す例では類似度は538となり、図5に示す例では類似度は244となる。このように、各ブロックのY成分の平均値の算出結果を正規化した後のテンプレート画像Aを用いて、同じく各ブロックのY成分の平均値の算出結果を正規化した後のターゲット画像Cに対するテンプレートマッチングを行うことにより、画像の明るさの違いの影響を排除して、テンプレートマッチングの精度を向上させることができる。
なお、全成分を加味した類似度に占めるY成分の類似度の割合は、図4に示した正規化を行う前では370/538=0.69となり、Y成分の類似度が占める割合は70%と高い。これに対して、図5に示した正規化を行った後では76/244=0.31となり、Y成分の類似度が占める割合は30%程度と、妥当な数値となっている。
ここで、図6を用いて、テンプレート画像Aとターゲット画像Cとを正規化した場合と、正規化しない場合とでテンプレートマッチング結果にどのような違いが生じるかについて説明する。例えば、図4(a)に示したテンプレート画像Aを用いて、図4(b)に示した画像Iを対象としたテンプレートマッチングを行った場合には、図4(b)に示す人物の顔を含むターゲット画像Cとの類似度が最も高くなることが好ましく、図5を用いて説明したように、Y成分の平均値の算出結果を正規化した場合には、このような結果が得られる。
これに対して、Y成分の平均値の算出結果を正規化しない場合には、図6(a)に示す人物の顔から少しずれた位置にターゲット枠Bがあるときには、各ブロックごとのY、Cb、Crの各成分の平均値の算出結果は、図6(b)に示すようになる。この図6(b)に示す場合に、Y、Cb、Crの全成分の類似度を加算した類似度を算出すると526となり、上述した図4における類似度538より小さい値となる。すなわち、図4における類似度よりも図6(b)の類似度の方が高く算出されてしまう。
このため、本来であれば、図4(b)に示すように、テンプレート画像Aを用いて追跡したい人物の顔を含む位置にターゲット枠Bがある状態での類似度が最も高く算出される必要があるが、画像の明るさが変化したことにより、図6(a)に示すように、人物の顔から少しずれた位置にターゲット枠Bがあるときに類似度が最も高く算出されてしまうことになる。
一方、Y成分の平均値の算出結果を正規化した場合には、図6(a)に示す人物の顔から少しずれた位置にターゲット枠Bがあるときには、各ブロックごとのY、Cb、Crの各成分の平均値の算出結果は、図6(c)に示すようになる。この図6(c)に示す場合に、Y、Cb、Crの全成分の類似度を加算した類似度を算出すると524となり、上述した図5における類似度244より大きい値となる。すなわち、図6(b)の類似度が図5における類似度よりも高く算出されることはない。
このように、テンプレート画像Aとターゲット画像Cとを正規化することにより、画像の明るさが変化したことに起因して、本来であればテンプレート画像Aとの類似度が低く算出されるべきターゲット画像Cとの類似度が高く算出されることがなくなる。このため、テンプレート画像Aを抽出した画像と、テンプレートマッチングの対象となる画像Iとの間で画像の明るさが変化した場合であっても、高い精度でテンプレートマッチングを行うことができる。
以上説明した本実施の形態によれば、以下のような作用効果を得ることができる。
(1)制御装置104は、テンプレート画像Aとターゲット画像Cとをそれぞれ複数の分割領域(ブロック)に分割し、テンプレート画像Aとターゲット画像Cとのそれぞれについて、各ブロックごとに、各画素の輝度値(Y成分)の平均値と色差値(Cb成分、Cr成分)の平均値とを算出し、各ブロックごとのY成分の平均値をそれぞれ正規化した。そして、制御装置104は、テンプレート画像Aにおけるブロックごとの正規化後のY成分の平均値と、ブロックごとのCb,Cr成分の平均値、およびターゲット画像Cにおけるブロックごとの正規化後のY成分の平均値とブロックごとのCb,Cr成分の平均値に基づいて、テンプレートマッチング処理を行うようにした。これによって、テンプレート画像Aとターゲット画像Cの明るさが変化した場合であっても、精度高くテンプレートマッチング処理を行うことができる。
(2)制御装置104は、各ブロックのうちのいずれか1つのブロックを基準領域として、9つのブロックのY成分の平均値から基準領域のY成分の平均値を減算することによって、各ブロックごとにY成分の平均値を正規化するようにした。これによって、テンプレート画像Aとターゲット画像Cの明るさの違いをY成分の平均値の算出結果から排除することができる。
―変形例―
なお、上述した実施の形態のカメラは、以下のように変形することもできる。
(1)上述した実施の形態では、Y、Cb、Crの3成分の類似度を算出してテンプレートマッチングを行う例について説明した。しかしながら、この方法によると、例えば図7(a)に示す黒っぽい領域7aと白っぽい領域7bとについてのマッチングを行う際に以下のような問題が生じる。すなわち、この場合の領域7aにおける各ブロックごとのY成分、Cb成分、Cr成分の平均値を図7(b)に示し、領域7bにおける各ブロックごとのY成分、Cb成分、Cr成分の平均値を図7(c)に示す。この図7(b)および図7(c)に示すように領域7aと7bとにおいては、各ブロック間でのY成分の値に差がないため、上述した方法でY成分の平均値を正規化した場合には、図7(d)および(e)に示すように、正規化後のY成分の平均値(Y差分)はいずれも0に近い値となる。また、領域7aと領域7bはいずれも無彩色の画像であるため、いずれも各ブロックごとのCb成分の平均値とCr成分の平均値とは無彩色を表す128に近い値となる。
このため、図7(d)および(e)に示すように、領域7aと領域7bとは、画像の類似度は低いにもかかわらず、各ブロックごとの正規化後のY成分の平均値、Cb成分の平均値、およびCr成分の平均値とに差がないため、これらの値によっては領域7aと領域7bとの区別がつかず、両領域の類似度は高く算出されてしまう。
このような場合であっても、図7(b)、(c)に示したように、領域7aと領域7bとにおける各ブロック後とのY成分の平均値には差があるため、このY成分の平均値も加味してテンプレートマッチングを行えば、領域7aと領域7bのような無彩色の画像についても両者を区別することができる。すなわち、図8(a)に示すような領域7aについての各ブロックごとのY成分の平均値、正規化後のY成分の平均値、Cb成分の平均値、およびCr成分の平均値と、図8(b)に示すような領域7bについての各ブロックごとのY成分の平均値、正規化後のY成分の平均値、Cb成分の平均値、およびCr成分の平均値とに基づいてテンプレートマッチングを行えば、上記のような問題を解消することが可能となる。
(2)上述した実施の形態では、制御装置104は、テンプレート画像Aとターゲット画像Cとを正規化するために、テンプレート画像Aとターゲット画像Cとをそれぞれ9分割して、9つのブロックを対象としてY成分の平均値の算出結果を正規化する例について説明した。しかしながら、制御装置104は、テンプレート画像Aとターゲット画像Cとを分割するブロック数を9以外としてもよい。また、テンプレート画像Aとターゲット画像Cとはそれぞれ9×9画素であり、分割後の各ブロックは3×3画素である例について説明したが、テンプレート画像Aとターゲット画像Cの大きさ、および分割後の各ブロックの大きさも上記サイズに限定されない。
(3)上述した実施の形態では、制御装置104は、テンプレート画像Aとターゲット画像Cとをそれぞれ9つのブロックに分割し、テンプレート画像Aの各ブロック、およびターゲット画像Cの各ブロックごとに、各画素のY成分の値を合計した値を画素数で割った値をY成分の値の平均値として算出し、Cb成分の値の平均値とCr成分の値の平均値も、同様に各画素の合計値を画素数で割って算出する例について説明した。しかしながら、テンプレート画像Aとターゲット画像CのY成分の値の平均値、Cb成分の値の平均値、およびCr成分の値の平均値は、各成分の値の各画素の合計値を画素数とは異なる数値で割って算出してもよい。例えば、画素数が9である場合に、3や5などの9以外の数値で割ってもよい。
また、制御装置104は、各ブロックの画素数が9である場合に、ブロック内の全ての画素を平均値算出の対象としたが、ブロック内の全画素の一部のみの画素を平均値算出の対象としてもよい。例えば、制御装置104は、1ブロックが9画素である場合に、そのうちの過半数に相当する5画素のみを抽出して、その5画素を対象として各成分の値の平均値を算出するようにしてもよい。この場合の平均値の算出においても、各成分の値の5画素分の合計値を5で割って算出することに限定されず、例えば、2や3で割るようにしてもよい。
(4)上述した実施の形態では、制御装置104は、テンプレート画像Aの各ブロック、およびターゲット画像Cの各ブロックごとに、ブロック内のY成分の値の平均値,Cb成分の値の平均値、およびCr成分の値の平均値をそれぞれ算出する例について説明した。しかしながら、制御装置104は、上記平均値に代えて、加算値や中央値(メジアン)を算出するようにしてもよい。すなわち、制御装置104は、テンプレート画像Aの各ブロック、およびターゲット画像Cの各ブロックごとに、ブロック内の各画素のY成分の値を加算した加算値,Cb成分の値を加算した加算値、およびCr成分の値を加算した加算値をそれぞれ算出してもよい。また、制御装置104は、テンプレート画像Aの各ブロック、およびターゲット画像Cの各ブロックごとに、ブロック内の各画素のY成分の値の中央値,Cb成分の値の中央値、およびCr成分の値の中央値をそれぞれ算出してもよい。この場合、制御装置104は、上記平均値に代えて、Y成分の加算値や中央値の算出結果を正規化して、テンプレートマッチングを行うようにすればよい。
(5)上述した実施の形態では、カメラ100上でパターンマッチング処理を行って被写体追跡を行う例について説明したが、パーソナルコンピューター(パソコン)等を用いて上記処理を行ってもよい。例えば、動画再生が可能なパソコンにおいて、動画の各コマを上記ターゲット画像とし、あらかじめ用意されたテンプレート画像を用いてテンプレートマッチングを行う場合にも本発明は適用可能である。
なお、本発明の特徴的な機能を損なわない限り、本発明は、上述した実施の形態における構成に何ら限定されない。また、上述の実施の形態と複数の変形例を組み合わせた構成としてもよい。
100 カメラ、101 操作部材、102 レンズ、103 撮像素子、104 制御装置、105 メモリカードスロット、106 モニタ

Claims (5)

  1. 時系列で入力される各入力画像内に設定した探索対象領域内で探索枠を移動させながら、各探索枠位置における前記探索枠内のターゲット画像について、テンプレート画像を用いたテンプレートマッチング処理を行って、複数の入力画像間で被写体追跡を行う被写体追跡装置であって、
    前記テンプレート画像と前記ターゲット画像とをそれぞれ複数の分割領域に分割する分割手段と、
    前記テンプレート画像と前記ターゲット画像とのそれぞれについて、前記分割領域ごとに、各画素の輝度値の平均値または加算値と、色差値の平均値または加算値とを算出し、前記複数の分割領域のうちのいずれか1つの分割領域を基準領域として、前記複数の分割領域の前記輝度値の平均値または加算値から前記基準領域の前記輝度値の平均値または加算値を減算することによって、前記分割領域ごとの前記輝度値の平均値または加算値をそれぞれ正規化する正規化手段と、
    前記テンプレート画像における前記分割領域ごとの正規化後の前記輝度値の平均値または加算値と前記分割領域ごとの色差値の平均値または加算値、および前記ターゲット画像における前記分割領域ごとの正規化後の前記輝度値の平均値または加算値と前記分割領域ごとの色差値の平均値または加算値に基づいて、前記テンプレートマッチング処理を行うテンプレートマッチング手段と、
    前記テンプレートマッチング手段によるマッチング結果に基づいて、複数の入力画像間で被写体追跡を行う被写体追跡手段とを備えることを特徴とする被写体追跡装置。
  2. 時系列で入力されるYCbCr色空間で表される各入力画像内に設定した探索対象領域内で探索枠を移動させながら、各探索枠位置における前記探索枠内のターゲット画像についてテンプレート画像を用いたテンプレート画像を用いたテンプレートマッチング処理を行って、複数の入力画像間で被写体追跡を行う被写体追跡装置であって、
    前記テンプレート画像と前記ターゲット画像とをそれぞれ複数の分割領域に分割する分割手段と、
    前記テンプレート画像と前記ターゲット画像とのそれぞれについて、前記複数の分割領域のうちのいずれか1つの分割領域を基準領域として、前記複数の分割領域のY成分の値から前記基準領域のY成分の値を減算することによって、前記分割領域ごとに、Y成分の値を正規化する正規化手段と、
    前記テンプレート画像と前記ターゲット画像とのそれぞれにおける、前記分割領域ごとのCb成分の値と、前記分割領域ごとのCr成分の値と、前記正規化手段によって前記分割領域ごとに正規化されたY成分の値とに基づいて、前記テンプレートマッチング処理を行うテンプレートマッチング手段とを備えることを特徴とする被写体追跡装置。
  3. 時系列で入力されるYCbCr色空間で表される各入力画像内に設定した探索対象領域内で探索枠を移動させながら、各探索枠位置における前記探索枠内のターゲット画像についてテンプレート画像を用いたテンプレート画像を用いたテンプレートマッチング処理を行って、複数の入力画像間で被写体追跡を行う被写体追跡装置であって、
    前記テンプレート画像と前記ターゲット画像とをそれぞれ複数の分割領域に分割する分割手段と、
    前記テンプレート画像と前記ターゲット画像とのそれぞれについて、前記分割領域ごとに、Y成分の値を正規化する正規化手段と、
    前記テンプレート画像と前記ターゲット画像とのそれぞれにおける、前記分割領域ごとのY成分の値と、前記分割領域ごとのCb成分の値と、前記分割領域ごとのCr成分の値と、前記正規化手段によって前記分割領域ごとに正規化されたY成分の値とに基づいて、前記テンプレートマッチング処理を行うテンプレートマッチング手段とを備えることを特徴とする被写体追跡装置。
  4. 請求項3に記載の被写体追跡装置において、
    前記正規化手段は、前記複数の分割領域のうちのいずれか1つの分割領域を基準領域として、前記複数の分割領域のY成分の値から前記基準領域のY成分の値を減算することによって、前記分割領域ごとに前記Y成分を正規化することを特徴とする被写体追跡装置。
  5. 被写体像を撮像して画像を取得する撮像手段と、
    請求項1〜4のいずれか一項に記載の被写体追跡装置とを備え、
    前記被写体追跡装置は、前記撮像手段によって時系列で取得される各画像を前記ターゲット画像として前記テンプレートマッチング処理を行い、複数の画像間で被写体追跡を行うことを特徴とするカメラ。
JP2009120739A 2008-06-06 2009-05-19 被写体追跡装置、およびカメラ Active JP4565273B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009120739A JP4565273B2 (ja) 2008-06-06 2009-05-19 被写体追跡装置、およびカメラ
US12/457,091 US8131068B2 (en) 2008-06-06 2009-06-01 Image matching device and camera

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008149320 2008-06-06
JP2009120739A JP4565273B2 (ja) 2008-06-06 2009-05-19 被写体追跡装置、およびカメラ

Publications (2)

Publication Number Publication Date
JP2010015548A JP2010015548A (ja) 2010-01-21
JP4565273B2 true JP4565273B2 (ja) 2010-10-20

Family

ID=41701581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009120739A Active JP4565273B2 (ja) 2008-06-06 2009-05-19 被写体追跡装置、およびカメラ

Country Status (1)

Country Link
JP (1) JP4565273B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9768794B1 (en) 2016-03-14 2017-09-19 Kabushiki Kaisha Toshiba Analog-to-digital converter having a switched capacitor circuit
US10043081B2 (en) 2016-03-14 2018-08-07 Kabushiki Kaisha Toshiba Image processing device and image processing program

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4661957B2 (ja) * 2008-12-26 2011-03-30 株式会社ニコン 画像マッチング装置、およびカメラ
JP4770965B2 (ja) * 2009-04-17 2011-09-14 株式会社ニコン 画像マッチング装置、およびカメラ
JP6676256B2 (ja) * 2016-08-10 2020-04-08 株式会社東海理化電機製作所 画像処理装置及び画像処理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05292489A (ja) * 1992-04-10 1993-11-05 Nippon Telegr & Teleph Corp <Ntt> 動きベクトル推定方法
JPH06133300A (ja) * 1992-10-15 1994-05-13 Sharp Corp 画像領域検出装置、該画像領域検出装置を用いた画像符号化装置、及び画像復号化装置
JPH06231254A (ja) * 1993-02-03 1994-08-19 Kokusai Denshin Denwa Co Ltd <Kdd> 動画像の高速認識検索方法
JP2006345388A (ja) * 2005-06-10 2006-12-21 Ricoh Co Ltd 撮像装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05292489A (ja) * 1992-04-10 1993-11-05 Nippon Telegr & Teleph Corp <Ntt> 動きベクトル推定方法
JPH06133300A (ja) * 1992-10-15 1994-05-13 Sharp Corp 画像領域検出装置、該画像領域検出装置を用いた画像符号化装置、及び画像復号化装置
JPH06231254A (ja) * 1993-02-03 1994-08-19 Kokusai Denshin Denwa Co Ltd <Kdd> 動画像の高速認識検索方法
JP2006345388A (ja) * 2005-06-10 2006-12-21 Ricoh Co Ltd 撮像装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9768794B1 (en) 2016-03-14 2017-09-19 Kabushiki Kaisha Toshiba Analog-to-digital converter having a switched capacitor circuit
US10043081B2 (en) 2016-03-14 2018-08-07 Kabushiki Kaisha Toshiba Image processing device and image processing program

Also Published As

Publication number Publication date
JP2010015548A (ja) 2010-01-21

Similar Documents

Publication Publication Date Title
US8254630B2 (en) Subject extracting method and device by eliminating a background region using binary masks
JP5090474B2 (ja) 電子カメラおよび画像処理方法
JP4906034B2 (ja) 撮影装置および方法並びにプログラム
TWI425828B (zh) 攝影裝置、圖像區域之判定方法以及電腦可讀取之記錄媒體
KR101984496B1 (ko) 물체 영역에 근거하여 화상을 처리하는 장치 및 그 방법
US20050179780A1 (en) Face detecting apparatus and method
US7450756B2 (en) Method and apparatus for incorporating iris color in red-eye correction
US20170323465A1 (en) Image processing apparatus, image processing method, and storage medium
JP2010045770A (ja) 画像処理装置及び画像処理方法
US20200302582A1 (en) Image fusion architecture
JP5246078B2 (ja) 被写体位置特定用プログラム、およびカメラ
US8131068B2 (en) Image matching device and camera
US8774519B2 (en) Landmark detection in digital images
JP4565273B2 (ja) 被写体追跡装置、およびカメラ
KR20110089655A (ko) 촬영 구도를 유도하는 디지털 영상 촬영 장치 및 방법
US8830359B2 (en) Image processing apparatus, imaging apparatus, and computer readable medium
US20190246048A1 (en) Image processing apparatus, image processing method, and storage medium
JP5083080B2 (ja) 画像マッチング装置、およびカメラ
JP2016123044A (ja) 被写体追跡装置、その制御方法およびプログラム
WO2012014946A1 (ja) 画像処理装置、および画像処理プログラム
US8243154B2 (en) Image processing apparatus, digital camera, and recording medium
JP2011035891A (ja) 電子カメラ
JP4632417B2 (ja) 撮像装置、及びその制御方法
JP2016081095A (ja) 被写体追跡装置、その制御方法、撮像装置、表示装置及びプログラム
JP4770965B2 (ja) 画像マッチング装置、およびカメラ

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100706

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100719

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4565273

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130813

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130813

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250