JP2021190922A - 撮像装置及びその制御方法、並びにプログラム - Google Patents
撮像装置及びその制御方法、並びにプログラム Download PDFInfo
- Publication number
- JP2021190922A JP2021190922A JP2020096337A JP2020096337A JP2021190922A JP 2021190922 A JP2021190922 A JP 2021190922A JP 2020096337 A JP2020096337 A JP 2020096337A JP 2020096337 A JP2020096337 A JP 2020096337A JP 2021190922 A JP2021190922 A JP 2021190922A
- Authority
- JP
- Japan
- Prior art keywords
- image
- tracking
- subject
- motion vector
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Automatic Focus Adjustment (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Abstract
【課題】 被写体の局所領域の動きに応じて、特徴量抽出領域の変形を行うことで、被写体の形が画像間で変化している場合でも、高精度な被写体追尾を行う。【解決手段】 撮像部により得た撮像画像から被写体を追尾する撮像装置であって、撮像部により連続して撮像される撮像画像間で、画素単位の動きベクトルを算出する動きベクトル算出部と、前撮像画像から特定領域を決定する決定部と、動きベクトルを基に、特定領域を変形する変形部と、変形した特定領域と、現撮像画像との間の類似度を評価する評価部と、該評価部による評価の結果に基づき、現撮像画像における追尾対象の被写体を決定し、追尾する追尾部とを備える。【選択図】 図1
Description
本発明はビデオカメラ、デジタルスチルカメラに代表される撮像装置及びその制御方法、並びにプログラムに関するものである。
デジタルカメラにおいて、得られた画像データから画像の特定領域の特徴量をもとに、被写体を追尾し、その被写体に対してピント、明るさ、色を好適な状態に合わせて撮影することが一般的になっている。特許文献1は、特徴量の抽出領域の大きさを、追尾している被写体サイズの変化に合わせて変化させることで、追尾性能を向上させる技術を開示している。
しかし、特許文献1の手法では、被写体が走っている人のような画像間で形が変化している場合には、特徴量領域と評価対象の領域で差分が発生してしまい、追尾性能が低下してしまう。
この課題を解決するため、例えば本発明の撮像装置は以下の構成を備える。すなわち、
撮像手段により得た撮像画像から被写体を追尾する撮像装置であって、
前記撮像手段により連続して撮像される撮像画像間で、画素単位の動きベクトルを算出する動きベクトル算出手段と、
前撮像画像から特定領域を決定する決定手段と、
前記動きベクトルを基に、前記特定領域を変形する変形手段と、
前記変形した特定領域と、現撮像画像との間の類似度を評価する評価手段と、
該評価手段による評価の結果に基づき、前記現撮像画像における追尾対象の被写体を決定し、追尾する追尾手段とを備える。
撮像手段により得た撮像画像から被写体を追尾する撮像装置であって、
前記撮像手段により連続して撮像される撮像画像間で、画素単位の動きベクトルを算出する動きベクトル算出手段と、
前撮像画像から特定領域を決定する決定手段と、
前記動きベクトルを基に、前記特定領域を変形する変形手段と、
前記変形した特定領域と、現撮像画像との間の類似度を評価する評価手段と、
該評価手段による評価の結果に基づき、前記現撮像画像における追尾対象の被写体を決定し、追尾する追尾手段とを備える。
本発明によれば、被写体の局所領域の動きに応じて、特徴量抽出領域の変形を行うことで、被写体の形が画像間で変化している場合でも、高精度な被写体追尾を行うことが可能となる。
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
[撮像装置の構成]
図1は、本実施形態における撮像装置100のブロック構成図である。実施形態の撮像装置100は、動画および静止画の撮影ならびに記録が可能である。撮像装置100内の各機能ブロックは、バス160を介して互いに通信可能に接続されている。撮像装置100の動作は、主制御部151(中央演算処理装置)がプログラムを実行して各機能ブロックを制御することにより実現される。
図1は、本実施形態における撮像装置100のブロック構成図である。実施形態の撮像装置100は、動画および静止画の撮影ならびに記録が可能である。撮像装置100内の各機能ブロックは、バス160を介して互いに通信可能に接続されている。撮像装置100の動作は、主制御部151(中央演算処理装置)がプログラムを実行して各機能ブロックを制御することにより実現される。
本実施形態の撮像装置100は、被写体追尾部161を有する。この被写体追尾部16は、撮像した画像中の特定の被写体領域の検出、並びに、複数の画像に基づき、検出した被写体を継続して追尾を行う。このため、被写体追尾部161は、撮像対象の被写体の領域(被写体に外接する矩形領域の位置及びサイズ)を検出する被写体検出機能、検出された領域と類似した領域の探索を継続的に実行することにより追尾する被写体追尾機能、並びに、撮像画像間の画素単位の動きベクトルを求める動きベクトル検出機能を備える。被写体追尾部161の構成及び動作の詳細については後述する。
以下、実施形態における撮像装置100の構成要素を説明する。撮影レンズ101(レンズユニット)は、固定1群レンズ102、ズームレンズ111、絞り103、固定3群レンズ121、フォーカスレンズ131、ズームモータ112、絞りモータ104、およびフォーカスモータ132を有する。固定1群レンズ102、ズームレンズ111、絞り103、固定3群レンズ121、フォーカスレンズ131は撮影光学系を構成する。なお、便宜上レンズ102、111、121、131を1枚のレンズとして図示しているが、それぞれ複数のレンズで構成されてもよい。また、撮影レンズ101は着脱可能な交換レンズとして構成されてもよい。
絞り制御部105は、絞り103を駆動する絞りモータ104の動作を制御し、絞り103の開口径を変更する。ズーム制御部113は、ズームレンズ111を駆動するズームモータ112の動作を制御し、撮影レンズ101の焦点距離(画角)を変更する。
フォーカス制御部133は、撮像素子141から得られる1対の焦点検出用信号(A像およびB像)の位相差に基づいて撮影レンズ101のデフォーカス量およびデフォーカス方向を算出する。そしてフォーカス制御部133は、デフォーカス量およびデフォーカス方向をフォーカスモータ132の駆動量および駆動方向に変換する。この駆動量および駆動方向に基づいてフォーカス制御部133はフォーカスモータ132の動作を制御し、フォーカスレンズ131を駆動することにより、撮影レンズ101の焦点状態を制御する。このように、フォーカス制御部133は位相差検出方式の自動焦点検出(AF)を実施する。なお、フォーカス制御部133は撮像素子141から得られる画像信号から得られるコントラスト評価値に基づくコントラスト検出方式のAFを実行してもよい。
撮影レンズ101によって撮像素子141の結像面に形成される被写体像は、撮像素子141に配置された複数の画素のそれぞれが有する光電変換素子により電気信号(画像信号)に変換される。本実施形態における撮像素子141は、水平方向にm個、垂直方向にn個(n,mは複数)の画素が行列状に配置されており、各画素には2つの光電変換素子(光電変換領域)が設けられている。撮像素子141からの信号読み出しは、主制御部151からの指示に従って撮像制御部143が制御する。
撮像素子141から読み出された画像信号は信号処理部142に供給される。信号処理部142は、ノイズ低減処理、A/D変換処理、自動利得制御処理などの信号処理を画像信号に適用する。そして、信号処理部142は、これらの処理を適用して得た画像データを撮像制御部143に出力する。撮像制御部143は信号処理部142から受信した画像データをRAM(ランダム・アクセス・メモリ)154に蓄積する。なお、実施形態における撮像素子141は、30フレーム/秒のフレームレートで撮像するものとして説明する。
画像処理部152は、RAM154に蓄積された画像データに対して、予め定められた画像処理を適用する。画像処理部152が適用する画像処理には、ホワイトバランス調整処理、色補間(デモザイク)処理、ガンマ補正処理といった所謂現像処理のほか、信号形式変換処理、スケーリング処理などがあるが、これらに限定されない。また、自動露出制御(AE)に用いるための、被写体輝度に関する情報なども画像処理部152で生成することができる。特定の被写体領域に関する情報は、被写体追尾部161より供給され、例えばホワイトバランス調整処理に利用してもよい。なお、コントラスト検出方式のAFを行う場合、AF評価値を画像処理部152が生成してもよい。画像処理部152は、処理した画像データをRAM154に保存する。
主制御部151は、RAM154に保存された画像データを記録する場合には、画像処理データに例えば所定のヘッダを追加するなどして、記録形式に応じたデータファイルを生成する。この際、主制御部151は、必要に応じて圧縮解凍部153を用いて、画像データを符号化して情報量を圧縮する。そして、主制御部151は、生成したデータファイルを例えばメモリカードのような記録媒体157に記録する。
また、主制御部151は、RAM154に保存された画像データを表示する場合には、その画像データを、画像処理部152を用いて、表示部150での表示サイズに適合するようにスケーリングし、RAM154のうちビデオメモリとして用いる領域(VRAM領域)に書き込む。表示部150は、RAM154のVRAM領域から表示用の画像データを読み出し、例えばLCDや有機ELディスプレイなどの表示装置に表示する。
本実施形態の撮像装置100は、動画撮影時(撮影スタンバイ状態や動画記録中)に、撮影された動画を表示部150に即時表示することにより、表示部150を電子ビューファインダー(EVF)として機能させる。表示部150をEVFとして機能させる際に表示する動画像およびそのフレーム画像を、ライブビュー画像もしくはスルー画像と呼ぶ。また、撮像装置100は、静止画撮影を行った場合、撮影結果をユーザが確認できるように、直前に撮影した静止画を一定時間表示部150に表示する。これらの表示動作についても、主制御部151の制御によって実現される。
操作部156は、ユーザが撮像装置100に指示を入力するためのスイッチ、ボタン、キー、タッチパネルなどを含む。操作部156を通じた入力はバス160を通じて主制御部151が検知され、主制御部151は入力に応じた動作を実現するために各部を制御する。
主制御部151は、例えばCPUやMPUなどのプログラマブルプロセッサを1つ以上有し、例えば記憶部155に記憶されたプログラムをRAM154に読み込んで実行することにより各部を制御し、撮像装置100の機能を実現する。この記憶部155は、フラッシュメモリ等の電気的に書き込み可能な不揮発性メモリで構成される。主制御部151はまた、被写体輝度の情報に基づいて露出条件(シャッタースピードもしくは蓄積時間、絞り値、感度)を自動的に決定するAE処理を実行する。被写体輝度の情報は例えば画像処理部152から取得することができる。主制御部151は、例えば人物の顔など、特定被写体の領域を基準として露出条件を決定することもできる。
主制御部151は、動画撮影時には絞りを固定とし、電子シャッタスピード(蓄積時間)とゲインの大きさで露出を制御する。主制御部151は、決定した蓄積時感とゲインの大きさを撮像制御部143に通知する。撮像制御部143は通知された露出条件に従った撮影が行われるように撮像素子141の動作を制御する。
被写体追尾部161による被写体の追尾結果は、例えば焦点検出領域の自動設定に用いることができる。この結果、特定の被写体領域に対する追尾AF機能を実現できる。また、焦点検出領域の輝度情報に基づいてAE処理を行ったり、焦点検出領域の画素値に基づいて画像処理(例えばガンマ補正処理やホワイトバランス調整処理など)を行ったりすることもできる。なお、主制御部151は、現在の被写体領域の位置を表す指標(例えば領域を囲む矩形枠)を表示画像に重畳表示させてもよい。
バッテリ159は、電源管理部158により管理され、撮像装置100の全体に電力を供給する。記憶部155は、主制御部151が実行するプログラム、プログラムの実行に必要な設定値、GUIデータ、ユーザ設定値などを記憶する。例えば操作部156の操作により電源OFF状態から電源ON状態への移行が指示されると、記憶部155に格納されたプログラムがRAM154の一部に読み込まれ、主制御部151がプログラムを実行する。
[被写体追尾部]
図2は、被写体追尾部161の機能構成を示すブロック図である。被写体検出部201は、画像処理部152から、時系列に連続する画像を入力し、各画像に含まれる撮像対象の被写体を検出する。被写体追尾部161による被写体の検出結果には、画像内における被写体領域を特定する情報、信頼性などの情報が含まれる。
図2は、被写体追尾部161の機能構成を示すブロック図である。被写体検出部201は、画像処理部152から、時系列に連続する画像を入力し、各画像に含まれる撮像対象の被写体を検出する。被写体追尾部161による被写体の検出結果には、画像内における被写体領域を特定する情報、信頼性などの情報が含まれる。
追尾特徴量登録部202は、被写体検出部201によって検出された被写体領域に関する情報を追尾特徴量として登録する。動きベクトル算出部203は、逐次供給される画像から、連続する撮像画像間の画素単位の動きベクトルを算出する。
追尾特徴量更新部204は、動きベクトル算出部203によって算出された動きベクトルを元に、登録された追尾特徴量を変形し、領域毎に特徴量の更新を行う。
追尾部205では、逐次供給される画像(現画像)から、追尾特徴量制御部204によって更新された追尾特徴量との類似度の高い領域を被写体領域として探索する。探索結果は、画像内における被写体領域、信頼性、被写体の動きベクトルなどの情報を備え、主制御部151など各種処理ブロックで利用される。
[撮像装置の処理]
図3のフローチャートを参照して、本実施形態の撮像装置100による、被写体検出、被写体追尾、画像間の動きベクトルを検出する動きベクトル検出処理を伴う動画撮影動作に関して説明する。動画撮影動作は、撮影スタンバイ時や動画記録時に実行される。なお、撮影スタンバイ時と動画記録時とでは取り扱う画像(フレーム)の解像度など、細部において異なるが、被写体検出、被写体追尾、被写体及び背景の動きベクトルを検出する動きベクトル検出処理に係る処理の内容は基本的に同様であるため、以下では特に区別せずに説明する。
図3のフローチャートを参照して、本実施形態の撮像装置100による、被写体検出、被写体追尾、画像間の動きベクトルを検出する動きベクトル検出処理を伴う動画撮影動作に関して説明する。動画撮影動作は、撮影スタンバイ時や動画記録時に実行される。なお、撮影スタンバイ時と動画記録時とでは取り扱う画像(フレーム)の解像度など、細部において異なるが、被写体検出、被写体追尾、被写体及び背景の動きベクトルを検出する動きベクトル検出処理に係る処理の内容は基本的に同様であるため、以下では特に区別せずに説明する。
S301にて、主制御部151は撮像装置100の電源がONかどうか判定し、ONと判定されなければ処理を終了し、ONと判定されれば処理をS302に進める。
S302にて、主制御部151は各部を制御し、1フレーム分の撮像処理を実行し、処理をS303に進める。ここでは1対の視差画像と、1画面分の撮像画像が生成され、RAM154に格納される。先に説明したように、実施の形態における撮像素子141は、1つの画素に2つの光電変換素子(光電変換領域)が設けられている。この2つの光電変換素子の一方による画像と、他方による画像から、視差画像を得ることができる。
S303にて、主制御部151は、被写体追尾部161に被写体検出、被写体追尾、画像間の動きベクトルを検出する動きベクトル検出処理を実行させる。処理の詳細については後述する。被写体追尾部161から被写体領域の位置、大きさ、動きベクトルが主制御部151に通知され、これらの情報がRAM154に格納される。主制御部151は通知された被写体領域に基づいて焦点検出領域を設定する。
S304にて、主制御部151は、フォーカス制御部133に焦点検出処理を実行させる。フォーカス制御部133は、1対の視差画像のうち焦点検出領域に含まれる複数の画素のうち、同一行に配置された複数の画素から得られる複数のA信号をつなぎ合わせてA像、複数のB信号をつなぎ合わせてB像を生成する。そして、フォーカス制御部133は、A像とB像との相対的な位置をずらしながらA像とB像の相関量を演算し、A像とB像との類似度が最も高くなる相対位置をA像とB像との位相差(ずれ量)として求める。さらに、フォーカス制御部133は位相差をデフォーカス量およびデフォーカス方向に変換する。
S305にて、主制御部151の制御の下で、フォーカス制御部133はS304で求めたデフォーカス量およびデフォーカス方向に対応するレンズ駆動量および駆動方向に従ってフォーカスモータ132を駆動し、フォーカスレンズ131を移動させる。レンズ駆動処理が終了すると、処理をS301に戻す。
以後、S301で電源スイッチがONである限りに、S302〜S305の処理を繰り返し実行する。これにより、時系列的な複数の画像に対して被写体領域の探索が行われ、被写体追跡機能が実現される。なお、図3では被写体追跡処理を毎フレーム実行するものとしているが、処理負荷や消費電力の軽減を目的として数フレームごとに行うようにしてもよい。
[被写体追尾処理]
次に、図4のフローチャートを参照して被写体追尾部161の処理の流れについて説明する。
次に、図4のフローチャートを参照して被写体追尾部161の処理の流れについて説明する。
まずS401において、被写体追尾部161は、撮像制御部143から画像を入力する。
S402にて、被写体検出部201は、撮像制御部143から入力した画像に対して、中心位置とサイズが異なる複数の評価領域を設定し、各々の評価領域から被写体を検出する。被写体検出の手法は任意の公知の手法を用いてよく、例えば、CNN(Convolutional Neural Networks)による特定被写体の特徴抽出処理を用いて自動で検出しても良いし、操作部156からのタッチ操作の信号を入力とし、ユーザが指定しても良い。
S403にて、追尾特徴量登録部202は、被写体検出部201によって検出された被写体領域もしくは、後述する追尾部205によって検出され、RAM154に格納されている前フレームの被写体領域を、追尾特徴量として登録する。本実施形態では追尾特徴量の登録方法は、1フレーム目は被写体検出部201の結果を採用し、以降のフレームでは前フレームの追尾部205の結果を採用する。
S403にて、追尾特徴量登録部202は、被写体検出部201によって検出された被写体領域もしくは、後述する追尾部205によって検出され、RAM154に格納されている前フレームの被写体領域を、追尾特徴量として登録する。本実施形態では追尾特徴量の登録方法は、1フレーム目は被写体検出部201の結果を採用し、以降のフレームでは前フレームの追尾部205の結果を採用する。
S404において、動きベクトル算出部203は、S401によって逐次供給される画像から、現フレームと1フレーム前の画像を使用し、動きベクトルとして各画素の動きベクトルを算出する。動きベクトル算出方法は、任意の公知の手法を用いることができる。本実施形態では、動きベクトル算出方法としてLucasKanade法を用いる。時刻tのフレームにおける、座標(x、y)の輝度Y(x、y、t)とし、Δt後のフレームにおける、移動後の画素の輝度をY(x+Δx,y+Δy,t+Δt)とし、次式(1)を解くことで、(Δx,Δy)を各画素の動きベクトルとして算出する。
Y(x,y,t)=Y(x + Δx, y + Δy,t + Δt) …(1)
Y(x,y,t)=Y(x + Δx, y + Δy,t + Δt) …(1)
S405にて、追尾特徴量更新部204は、S404によって算出された動きベクトルから追尾特徴量の更新を行う。追尾特徴量の更新の詳細な処理については後述する。
S406にて、追尾部205は、逐次供給される画像から、S405によって更新された追尾特徴量を使用して被写体の追尾を行う。被写体追尾の詳細な処理については後述する。
[追尾特徴量の更新処理]
図5のフローチャート、図6、図7を参照して、図4のS405の追尾特徴量の更新処理について説明する。
図5のフローチャート、図6、図7を参照して、図4のS405の追尾特徴量の更新処理について説明する。
S501にて、追尾特徴量更新部204は、S403によって登録された追尾特徴量領域の位置ずれを予測する。位置ずれの予測方法は、各画素の動きベクトルを、画素における位置ずれ量とする。
S502にて、追尾特徴量更新部204は、S501で予測された位置ずれ量に基づき、座標変換情報を算出する。本実施形態では、座標変換情報を射影変換係数とし、射影変換係数は被写体像の変形を示す係数である。なお本実施形態において、座標変換情報として射影変換係数が用いられるが、これに限定されるわけではない。射影変換係数に代えて、アフィン変換係数など他の種類の座標変換情報を算出してもよい。
S503に、追尾特徴量更新部204は、S502において算出された座標変換情報を用いて、S403によって登録された追尾特徴量領域の四隅(四頂点)に対して次式(2)、(3)を用いて変形を行う。
[数式2]
x’=(ax+by+c)/(dx+ey+1) …(2)
y’=(fx+gy+h)/(dx+ey+1) …(3)
式(2)、(3)において、係数a、b、c、d、e、f、g、hは、S502において算出された射影変換係数である。x、yは、それぞれ、追尾特徴量領域の四隅(四頂点)のうちの1つの角のx座標およびy座標である。x’、y’は、それぞれ、変形後の追尾特徴量領域の四隅のうちの1つの角のx座標およびy座標であり、追尾特徴量領域の1つの角に対応する変形後の追尾特徴量領域の1つの角の位置である。
[数式2]
x’=(ax+by+c)/(dx+ey+1) …(2)
y’=(fx+gy+h)/(dx+ey+1) …(3)
式(2)、(3)において、係数a、b、c、d、e、f、g、hは、S502において算出された射影変換係数である。x、yは、それぞれ、追尾特徴量領域の四隅(四頂点)のうちの1つの角のx座標およびy座標である。x’、y’は、それぞれ、変形後の追尾特徴量領域の四隅のうちの1つの角のx座標およびy座標であり、追尾特徴量領域の1つの角に対応する変形後の追尾特徴量領域の1つの角の位置である。
図6に変形の概要図を示す。図示の参照符号601は追尾特徴量領域を示し、参照符号602は変形後の追尾特徴量領域を示している。図示の波線矢印は、追尾特徴量領域601の四隅が前述の方法により波線矢印で示される位置に座標変換されたことを表している。このように、追尾特徴量領域601の各頂点に対して座標変換情報を用いて得られた点を各頂点とする領域を、変形後の追尾特徴量領域602として設定する。
本実施形態では、変形の方法について四角形の領域で説明しているが、これに限定されるものではない。例えば、追尾特徴量領域601を多角形に設定し、多角形の頂点毎に座標変換を行ってもよい。
S504にて、追尾特徴量更新部204は、S503によって変形された追尾特徴量領域が、矩形領域でない場合、矩形領域を設定する。図7に矩形領域の設定の概要図を示す。変形後の追尾特徴量領域701の内部から、矩形領域702を設定する。矩形領域702の設定方法は、追尾特徴量領域701の内部の中で、面積が最大となる矩形領域を計算し設定しても良いし、追尾特徴量領域701の内部の中で、S402において検出された被写体面積が最大になる矩形を設定しても良く、その設定法は特に問わない。
S504にて、追尾特徴量更新部204は、設定された矩形領域をS405における更新された追尾特徴量として出力する。
図8に変形の具体例を示す。図8(a)が1フレーム前画像、図8(b)を現フレームとする。図8(c)が、上記のS403によって登録された追尾特徴量領域であるとき、図8(d)がS405において変形された追尾特徴量領域を示している。そして、図8(e)がS504において設定された矩形領域となる。
[被写体追尾処理]
次に、図9を参照して、図4のS406における追尾処理について説明する。
次に、図9を参照して、図4のS406における追尾処理について説明する。
追尾部205は、S405において更新した追尾特徴量を用いて被写体領域を探索し、その探索結果が追尾部205の出力情報となる。本実施形態では、追尾特徴量領域をテンプレートとした、テンプレートマッチングによる探索方法を適用するものとし、図9を用いて説明する。テンプレートマッチングは、画素パターンをテンプレートとして設定し、テンプレートとの類似度が最も高い領域を画像内で探索する技術である。テンプレートと画像領域との類似度として、対応画素間の差分絶対値和のような相関量を用いることができる。
図9(a)は、テンプレート901とその構成例902を模式的に示している。テンプレートマッチングを行う場合、テンプレートとして用いる画素パターンが追尾特徴量904として予め設定されている。ここでは、テンプレート901が水平画素数W、垂直画素数Hの大きさであり、テンプレート901に含まれる画素の輝度値を用いて、追尾部205がパターンマッチングを行う。
パターンマッチングに用いるテンプレート901の特徴量T(i,j)は、テンプレート901内の座標を図9(a)に示すような座標系で表すと、次式(4)に示すように表現できる。
T(i,j)={T(0,0)、T(1,0)、…、T(W−1,H−1)}…(4)
T(i,j)={T(0,0)、T(1,0)、…、T(W−1,H−1)}…(4)
図9(b)は、被写体領域の探索領域903とその構成905の例を示している。探索領域903は、画像内でパターンマッチングを行う範囲であり、画像の全体もしくは一部であってよい。探索領域903内の座標は、「(x,y)」と表すものとする。領域904はテンプレート901と同じ大きさ(水平画素数W、垂直画素数H)を有し、テンプレート901との類似度を算出する対象である。追尾部205は、領域904に含まれる画素の輝度値と、テンプレート901に含まれる輝度値との類似度を算出する。
従って、パターンマッチングに用いる領域904の特徴量S(i,j)は、テンプレート901内の座標を図9(b)に示すような座標系で表すと、次式(5)のように表現できる。
S(i,j)={S(0,0)、S(1,0)、…、S(W−1,H−1)}…(5)
S(i,j)={S(0,0)、S(1,0)、…、S(W−1,H−1)}…(5)
テンプレート901と領域904との類似性を表す評価値V(x, y)は、例えば次式(6に示す、差分絶対和(SAD: Sum of Absolute Difference)値である。
V(x,y)=ΣΣ|T(i,j)−S(i,j)| …(6)
ここで、一方のΣΣは、i=0、…、W−1、且つ、j=0、…、H−1における合算を表している。また、|a|は、実数aの絶対値を表している。
V(x,y)=ΣΣ|T(i,j)−S(i,j)| …(6)
ここで、一方のΣΣは、i=0、…、W−1、且つ、j=0、…、H−1における合算を表している。また、|a|は、実数aの絶対値を表している。
また、V(x, y)は、領域904の左上頂点の座標(x, y)における評価値を表す。ここで、探索領域903の水平方向のサイズを大文字X,垂直方向のサイズを大文字Yとして場合、追尾部205は、領域904を探索領域903の左上から右方向に1画素ずつ、またx=(X-1)-(W-1)に達すると、次にx=0として下方向に1画素ずつ、それぞれずらしながら、各位置で評価値V(x, y)を算出する。そして、「y≦(Y−1)−(H−1)」を満たす限り、この処理を行う。
算出された評価値V(x, y)が最小値を示す座標(x, y)が、テンプレート901と最も類似した画素パターンを有する領域904の位置を示すことになる。追尾部205は、評価値V(x, y)が最小値を示す領域904を、探索領域内に存在する被写体領域として検出する。なお、探索結果の信頼性が低い場合(例えば評価値V(x, y)の最小値が閾値を超える場合)には、被写体領域が見つからなかったと判定してもよい。
ここではパターンマッチングに輝度値の特徴量を用いる例を示したが、複数の値(例えば明度、色相、彩度)を有する特徴量を用いてもよい。また、類似度の評価値としてSADを用いる例を示したが、他の評価値、例えば正規化相互相関(NCC: Normalized Cross-Correlation)やZNCCなどを用いてもよい。
[効果]
以上説明したように本実施形態によれば、追尾特徴量領域を、動きベクトルを基に変形させることで、画像間で被写体の形が変化するような場合でも、被写体追尾の性能を向上させることができる。
以上説明したように本実施形態によれば、追尾特徴量領域を、動きベクトルを基に変形させることで、画像間で被写体の形が変化するような場合でも、被写体追尾の性能を向上させることができる。
[第2の実施形態]
第2の実施形態を説明する。本第2の実施形態の装置構成は、上記第1の実施形態と同じである。以下、図10のフローチャート、及び、図10を参照して、図4のS405における、追尾特徴量更新部204の処理を説明する。
第2の実施形態を説明する。本第2の実施形態の装置構成は、上記第1の実施形態と同じである。以下、図10のフローチャート、及び、図10を参照して、図4のS405における、追尾特徴量更新部204の処理を説明する。
S1001にて、追尾特徴量更新部204は、S403によって登録された追尾特徴量領域を分割する。例えば、追尾特徴量更新部204は、S404によって算出した動きベクトルをクラスタリングし、クラスタリング結果に従い領域を分割しても良い。動きベクトルクラスタリングの手法は任意の公知の手法を用いて良く、例えば、K-meansを使用し、動きベクトルを任意のクラスタ数でクラスタリングを行う。
ここでは動きベクトルクラスタリングに基づく領域分割を例にあげたが、追尾特徴量領域を分割できれば手法は問わない。例えば追尾特徴量領域からエッジの交点である特徴点を算出し、各特徴点の動きベクトルを比較し、類似の動きベクトルを持つ特徴点を頂点とした領域を複数作成することで領域分割としても良い。
S1002にて、追尾特徴量更新部204は、S1001で分割した領域毎の位置ずれを予測する。位置ずれの予測方法は、各画素の動きベクトルを、画素における位置ずれ量とする。
S1003にて、追尾特徴量更新部204は、S1002で予測された領域毎の位置ずれ量に基づき、座標変換情報を領域毎に算出する。本実施形態では、座標変換情報を射影変換係数とし、射影変換係数は被写体像の変形を示す係数である。なお本実施形態において、座標変換情報として射影変換係数が用いられるが、これに限定されるわけではない。射影変換係数に代えて、アフィン変換係数など他の種類の座標変換情報を算出してもよい。
S1004にて、追尾特徴量更新部204は、S1003において算出された領域ごとの座標変換情報を用いて、S1001によって分割された領域毎の四隅(四頂点)に対して式(2)、(3)を用いて変形を行う。図11に変形の概要図を示す。図11(a)は動きベクトルによって分割された特徴量領域1101、参照符号1102は分割された各領域を示す。図11(b)が領域毎に変形した追尾特徴量領域1103を示し、参照符号1104が分割された各領域をそれぞれ変形した領域を示す。図11(b)に示される波線矢印は、領域1102の各領域の四隅が前述の方法により波線矢印で示される位置に座標変換されたことを表している。このように、領域1102の各領域の各頂点に対して座標変換情報を用いて得られた点を各頂点とする領域1103を含む、追尾特徴量領域1103を、領域毎の追尾特徴量を変形した領域として設定する。図11(b)において斜線領域は、領域毎の追尾特徴量を変形した結果、追尾特徴量領域1103に穴が開いた領域となる。S406のテンプレートマッチングにおいて、穴領域を使用して計算してしまうと、評価値V(x, y)の結果が悪くなってしまう。したがって、式(6)において穴領域の座標を(i’,j’)としたとき、追尾特徴量更新部204は、次式(7)のようにすて、穴領域はテンプレートマッチングの結果に影響がでないようにする。
T(i’,j’)−S(i’,j’)=0 …(7)
T(i’,j’)−S(i’,j’)=0 …(7)
S1004にて、追尾特徴量更新部204は、変形された追尾特徴量領域をS405における更新された追尾特徴量として出力する。
図12(a)乃至(b)を参照して、本第2の実施形態における変形の具体例を説明する。図12(a)が1フレーム前の画像(前撮像画像)、図12(b)を現フレームの画像(現撮像画像)とする。図12(c)がS403によって登録された追尾特徴量領域であるとき、図12(d)がS1001において分割された領域を示している。そして、図12(e)がS1004において、変形された追尾特徴量領域となり、黒で塗りつぶされた領域が穴領域となる。
[効果]
以上説明したように本第2の実施形態によれば、追尾特徴量領域を、動きベクトルを基に分割し、分割領域毎に変形させることで、画像間で局所的に被写体の形が変化するような場合に追尾の性能を第1の実施形態よりも向上させることができる。
以上説明したように本第2の実施形態によれば、追尾特徴量領域を、動きベクトルを基に分割し、分割領域毎に変形させることで、画像間で局所的に被写体の形が変化するような場合に追尾の性能を第1の実施形態よりも向上させることができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
100…撮像装置、101…撮影レンズ、141…撮像素子、142…撮像信号処理部、143…撮像制御部、151…主制御部、152…画像処理部、153…圧縮解凍部、154…RAM、161…被写体追尾部、201…被写体検出部、202…追尾特徴量登録部、203…動き算出部、204…追尾特徴更新部、205…追尾部
Claims (7)
- 撮像手段により得た撮像画像から被写体を追尾する撮像装置であって、
前記撮像手段により連続して撮像される撮像画像間で、画素単位の動きベクトルを算出する動きベクトル算出手段と、
前撮像画像から特定領域を決定する決定手段と、
前記動きベクトルを基に、前記特定領域を変形する変形手段と、
前記変形した特定領域と、現撮像画像との間の類似度を評価する評価手段と、
該評価手段による評価の結果に基づき、前記現撮像画像における追尾対象の被写体を決定し、追尾する追尾手段と、
を備えることを特徴とする撮像装置。 - 前記動きベクトルから座標変換情報を算出する算出手段と、
前記変形手段は、前記座標変換情報に基づき、前記特定領域を変形する
ことを特徴とする請求項1に記載の撮像装置。 - 前記座標変換情報は、被写体像の変形を示す変換係数である
ことを特徴とする請求項2に記載の撮像装置。 - 前記変形手段は、前記特定領域を少なくとも2つの領域に分割する分割手段を含み、
前記算出手段は、前記分割領域毎に前記座標変換情報を算出し、
前記変換手段は、前記分割領域毎に前記特定領域を変形させる
ことを特徴とする請求項2又は3に記載の撮像装置。 - 前記分割手段は、
前記画像間の動きベクトルを、動きの大きさ、向きを元に、クラスタリングを行う動きベクトルクラスタリング手段を含み、
該動きベクトルクラスタリング手段によってクラスタリングされた動きベクトルに合わせて、前記特定領域を分割する
ことを特徴とする請求項4に記載の撮像装置。 - 撮像手段により得た撮像画像から被写体を追尾する撮像装置の制御方法であって、
前記撮像手段により連続して撮像される撮像画像間で、画素単位の動きベクトルを算出する動きベクトル算出工程と、
前撮像画像から特定領域を決定する決定工程と、
前記動きベクトルを基に、前記特定領域を変形する変形工程と、
前記変形した特定領域と、現撮像画像との間の類似度を評価する評価工程と、
該評価工程による評価の結果に基づき、前記現撮像画像における追尾対象の被写体を決定し、追尾する追尾工程と、
を備えることを特徴とする撮像装置の制御方法。 - コンピュータが読み取り実行することで、前記コンピュータに、請求項6に記載の方法の各工程を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020096337A JP2021190922A (ja) | 2020-06-02 | 2020-06-02 | 撮像装置及びその制御方法、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020096337A JP2021190922A (ja) | 2020-06-02 | 2020-06-02 | 撮像装置及びその制御方法、並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021190922A true JP2021190922A (ja) | 2021-12-13 |
Family
ID=78847669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020096337A Pending JP2021190922A (ja) | 2020-06-02 | 2020-06-02 | 撮像装置及びその制御方法、並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021190922A (ja) |
-
2020
- 2020-06-02 JP JP2020096337A patent/JP2021190922A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4755490B2 (ja) | ブレ補正方法および撮像装置 | |
US8089515B2 (en) | Method and device for controlling auto focusing of a video camera by tracking a region-of-interest | |
US8144207B2 (en) | Computer program product for photographic subject tracking, photographic subject tracking device, and camera | |
US11070729B2 (en) | Image processing apparatus capable of detecting moving objects, control method thereof, and image capture apparatus | |
JP7223079B2 (ja) | 画像処理装置およびその制御方法、ならびに撮像装置 | |
JP2010114752A (ja) | 撮像装置及び撮像方法及びプログラム | |
US20210256713A1 (en) | Image processing apparatus and image processing method | |
JP2012073997A (ja) | 物体追尾装置、物体追尾方法およびそのプログラム | |
JP2016140030A (ja) | 画像処理装置、撮像装置、及び画像処理プログラム | |
JP2019175112A (ja) | 画像処理装置、撮像装置、画像処理方法、及びプログラム | |
JP2017098843A (ja) | 撮像装置、物体追尾方法、及びプログラム | |
US20200267319A1 (en) | Image processing apparatus that detects motion vectors, method of controlling the same, and storage medium | |
US10880457B2 (en) | Image processing apparatus, image capturing apparatus, image processing method, and storage medium | |
US12008773B2 (en) | Object tracking apparatus and control method thereof using weight map based on motion vectors | |
JP2021190922A (ja) | 撮像装置及びその制御方法、並びにプログラム | |
US11206344B2 (en) | Image pickup apparatus and storage medium | |
JP2023165555A (ja) | 画像処理装置、撮像装置、制御方法及びプログラム | |
JP5441737B2 (ja) | 画像処理装置、画像処理方法及び画像処理用プログラム | |
JP7077115B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP7324066B2 (ja) | 画像処理装置およびその制御方法、ならびに撮像装置 | |
US20230065506A1 (en) | Image processing apparatus, control method thereof, and image capturing apparatus | |
JP7278737B2 (ja) | 撮像装置及びその制御方法、並びにプログラム | |
JP2005267005A (ja) | 画像データ処理装置及びプログラム | |
JP2021121067A (ja) | 画像処理装置、撮像装置、画像処理方法、プログラムおよび記録媒体 | |
JP6525693B2 (ja) | 画像処理装置及び画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |