JP2019022186A - 画像処理装置、撮像装置、画像処理方法およびプログラム - Google Patents

画像処理装置、撮像装置、画像処理方法およびプログラム Download PDF

Info

Publication number
JP2019022186A
JP2019022186A JP2017142006A JP2017142006A JP2019022186A JP 2019022186 A JP2019022186 A JP 2019022186A JP 2017142006 A JP2017142006 A JP 2017142006A JP 2017142006 A JP2017142006 A JP 2017142006A JP 2019022186 A JP2019022186 A JP 2019022186A
Authority
JP
Japan
Prior art keywords
main subject
tracking information
frame
designation
tracking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017142006A
Other languages
English (en)
Inventor
千明 三河
Chiaki Mikawa
千明 三河
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017142006A priority Critical patent/JP2019022186A/ja
Publication of JP2019022186A publication Critical patent/JP2019022186A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Indication In Cameras, And Counting Of Exposures (AREA)

Abstract

【課題】 ユーザが主被写体を見失ったことに気づいて主被写体を再選択したとしても、再選択するまでの間は、ユーザが意図しない別の被写体を示す情報が、主被写体情報として動画データデータに付帯されてしまう。【解決手段】 ユーザによる主被写体の指定に応じて設定された主被写体の追尾情報が付帯された動画データを取得する取得手段と、ユーザによる第1の主被写体の指定が行われてから第2の主被写体の指定が行われるまでの少なくとも一部のフレーム画像における追尾情報を、第2の主被写体の指定に応じて設定された主被写体の追尾情報に基づいて補正する補正手段を有する画像装置を提供する。【選択図】 図5

Description

本発明は、動画データに付帯された主被写体情報を扱う技術に関するものである。
撮影時に検出された主被写体情報が付帯された動画データを再生する際に、この付帯された主被写体情報に基づいて、動画データに対して編集を行う技術がある(例えば、特許文献1)。この編集のための処理としては、例えば、動画データの再生開始フレームの選択や、トリミング処理、あるいは、主被写体であることを示す顔枠を表示する処理など、がある。
特開2014−220724
主被写体となる被写体が画角の外に一時的に移動したり、あるいは、主被写体の手前側を別の被写体が横切ったりすると、主被写体を見失ってしまうことがある。カメラやビデオカメラなどの撮像装置は、主被写体を見失うと、その主被写体は画角の外に出て行ったと判断し、別の被写体を主被写体として選択し直す。ここで、ユーザが主被写体を見失ったことに気づいて主被写体を再選択したとしても、再選択するまでの間は、ユーザが意図しない別の被写体を示す情報が、主被写体情報として動画データに付帯されてしまう。そのため、動画データを再生する際に、ユーザの意図に反して、この別の被写体を主被写体として動画データに対する編集処理が行われてしまうことがある。
上記課題を解決するため、本発明に係る画像処理装置は、ユーザによる主被写体の指定に応じて設定された主被写体の追尾情報が付帯された動画データを取得する取得手段と、ユーザによる第1の主被写体の指定が行われてから第2の主被写体の指定が行われるまでの少なくとも一部のフレーム画像における前記追尾情報を、前記第2の主被写体の指定に応じて設定された主被写体の追尾情報に基づいて補正する補正手段と、を有することを特徴とする。
動画データに付帯された主被写体を示す主被写体情報を、ユーザの意図に合わせることができる画像処理装置を提供することが可能になる。
本発明の第1の実施形態に係る画像処理装置として動作するデジタルカメラを示すブロック図である。 本発明の第1の実施形態に係る撮像装置として動作するデジタルカメラを背面から見た様子を示す図である。 本発明の第1の実施形態に係る動画撮影処理の工程を示すフローチャート図である。 本発明の第1の実施形態に係る追尾情報を説明するための図である。 本発明の第1の実施形態に係る追尾補正処理の工程を示すフローチャート図である。 本発明の第1の実施形態に係る追尾補正処理の効果を説明するための図である。 本発明の第1の実施形態に係る再生処理の工程を示すフローチャート図である。 本発明の第2の実施形態に係る画像処理装置として動作するパーソナルコンピュータを示すブロック図である。 本発明の第2の実施形態に係る動画撮影処理の工程を示すフローチャート図である。 本発明の第2の実施形態に係る追尾情報を説明するための図である。 本発明の第2の実施形態に係る画像処理装置のユーザーインターフェイスの一例である。 本発明の第2の実施形態に係る追尾補正処理の工程を示すフローチャート図である。
以下、添付の図面を参照して本発明の好適な実施形態を詳細に説明する。
(第1の実施形態)
図1は、本発明の一実施形態に係る画像処理装置として動作するデジタルカメラを示すブロック図である。デジタルカメラが所定の制御プログラムを実行することにより、以下に説明する画像処理を実現する。
図1において、撮像部100は、固体撮像素子を用いて光学像を電気的な画像データに変換して画像データを生成するCCDやCMOSセンサなどのイメージセンサである。撮像部100は、CPU101からの指示に応じてレンズ位置や絞りといった光学部材を駆動する。CPU101は、デジタルカメラ全体の制御を司る。ROM102は、CPU101の動作処理手順(例えばデジタルカメラの電源をONした時の処理や基本入出力処理等のプログラム)を記憶している。RAM103は、CPU101のメインメモリとして機能する。RAM103には、後述の処理を実現するための制御プログラムを含む各種プログラムが、ROM102からロードされる。また、RAM103は、CPU101が各種処理を実行する際のワークエリアを提供する。
ディスプレイ104は、液晶ディスプレイや有機ELディスプレイで構成され、RAM103に保持された画像データや記憶媒体に記憶された画像データの表示を行う。入力装置105は各種操作を行うためのボタンやスイッチ等で構成され、たとえば、デジタルカメラの上部に位置するレリーズボタンを含む。
メディアドライブ106は、着脱可能な記憶媒体を装着し、データを記憶したり、記憶されたデータを読み出したりする。ネットワーク用のインターフェイス(I/F)107は、通信回線109を介してコンピュータネットワーク110と接続される。このI/F107を介して、サーバコンピュータやパーソナルコンピュータとの間のデータの送受信を行う。システムバス108は、アドレスバス、データバスおよび制御バスからなり、上述した各ユニット間を接続する。
図2は、本発明の一実施形態に係る撮像装置として動作するデジタルカメラを背面から見た様子を示す図である。図2を用いて、撮影操作と再生操作について説明すると共に、主被写体の指定操作と動画の拡大再生操作について説明する。
本実施形態による画像処理装置として動作するデジタルカメラの各種ボタンとユーザーインターフェイスの詳細について、図2を用いて説明する。本実施形態で説明するデジタルカメラには3種類のモードがあり、各モードに応じた動作をする。第一に撮影を行う「撮影モード」、第二に記憶媒体内の画像データを表示する「再生モード」、第三に各種設定を行う「設定モード」である。
ユーザがレリーズボタン200を押下すると、CPU101は撮像指示があったと判定し、撮像部100にて撮影した画像データを、メディアドライブ106を介して記憶媒体に記録する。
ディスプレイ201は、図1のディスプレイ104と同一のものである。このディスプレイ201は、表示機能と共にタッチパネル機能を持ち、入力装置105の機能の一部を果たす。ユーザが指で画面上の任意の点をタッチすると、CPU101はユーザからの入力指示があったと判定して、タッチされた位置から操作の内容を判定して、各種処理を行う。
電源ボタン202は、電源のON/OFFを切り替えるためのボタンである。デジタルカメラの電源が入っていない状態で、ユーザが押下するとCPU101はユーザから電源入力の指示があったと判定し、電源を入れる。電源が入っている状態で、ユーザが押下するとCPU101はユーザから電源を切るための指示があったと判定し、電源を切る。
撮影モードボタン203をユーザが押下すると、CPU101がユーザから撮影モードへの切り替え指示があったと判定する。CPU101は、撮影モードへと切り替え、撮像部100による撮影の準備をすると共に、結像した画像を図2に示すようにディスプレイ201に表示する。撮影モードにおいて、ユーザがディスプレイ201をタッチするとCPU101はユーザから主被写体の指定操作があったと判定し、タッチした位置の被写体に対して追尾枠を描画し、追尾処理を開始する。追尾処理に関しては、図3において後述する。撮影モードで、ユーザが追尾対象以外の被写体を指定した場合には、CPU101は異なる被写体が主被写体として指定されたと判定し、新たに指定された被写体に追尾枠を描画し、追尾処理を開始する。前述の主被写体の指定操作のことを、以降はタッチ指定と記す。なお、タッチ指定は1つの例であって、入力装置105に含まれる他のボタンやスイッチを用いて、追尾枠の位置を設定する構成であっても構わない。
再生ボタン204をユーザが押下すると、CPU101がユーザから再生モードへの切り替え指示があったと判定し、記憶媒体から画像データを読み込み、ディスプレイ201に画像を表示する。画像データが動画データの場合には、動画を先頭フレームから再生する。
撮影モードにおいて、RECボタン205をユーザが押下すると、CPU101は動画撮影の開始指示があったと判定し、撮像部100にて結像した像を継続的に画像データに変換し、動画ファイルとして記憶媒体に記録する。動画撮影中にユーザがRECボタン205を押下するとCPU101は動画撮影の終了指示があったと判定し、動画ファイルの記録を終了する。動画撮影中の処理については図3にて説明する。
撮影モードにおいて、ユーザが拡大縮小レバー206を上方向に動かした場合には、CPU101はズーム操作があったと判定し、撮像部100で光学部材を駆動して、ズーム動作を行う。ユーザが拡大縮小レバー206を下方向に動かした場合には、CPU101はズームアウト操作があったと判定し、撮像部100で光学部材を駆動して、ズームアウトする。再生モードにおいて、ユーザが拡大縮小レバー206を上方向に動かした場合には、CPU101は拡大操作があったと判定する。静止画データを再生している場合には、中心座標を基準にして拡大する。動画データを再生している場合には、図6に説明する動画再生処理に従って、再生する。再生モードにおいて、ユーザが拡大縮小レバー206を下方向に動かした場合には、CPU101は縮小操作があったと判定する。そして、静止画データを再生している場合には、拡大中の表示範囲の中心座標を基準にして縮小する。中心座標を維持すると、画像の範囲外を表示することになってしまう場合には、画像の範囲外を表示しないように位置を変更する。そして、画像を構成するいずれかの辺がディスプレイ201を構成する辺と一致するところまで、縮小する。拡大縮小レバー206にて指定された倍率は、RAM103に記憶する。
設定ボタン207をユーザが押下すると、CPU101がユーザから設定モードへの切り替え指示があったと判定し、設定画面をディスプレイ201に表示する。
CPU101は、結像した画像において追尾枠208が示された被写体から撮像素子までの距離を測り、追尾枠内の被写体に合焦するように撮像部100を制御する。図2は、追尾枠208を結像した画像に重畳して表示している状態を示す。
図3は、本発明の第1の実施形態に係る動画撮影処理の工程を示すフローチャート図である。なお、本処理は、CPU101がRAM103に格納された制御プログラムを実行することにより実行される。本処理は、撮影モードにおいてRECボタン205をユーザが押下し、CPU101が動画撮影を開始し、再びRECボタン205をユーザが押下して、動画撮影を終了するまでの処理に該当する。動画撮影中は、撮像部100にて生成された画像データが継続的にディスプレイ201に表示されているものとする。
図4は、本発明の第1の実施形態に係る追尾情報を説明するための図である。図3と図4を用いて、動画撮影処理および追尾情報記録処理について、説明を行う。
図3のステップS300にて、CPU101は、動画ファイルの何番目のフレームに対する処理をするか特定するためのカウンタiに0を代入する。
ステップS301にて、CPU101は、動画撮影終了指示があったか否かを判定する。動画撮影終了指示とは、動画撮影開始後にユーザがRECボタン205を押下する操作である。ステップS301にて、動画撮影終了指示があったと判定した場合には、一連の動画撮影処理を終了する。ステップS301にて、動画撮影終了指示がないと判定した場合には、ステップS302へと進む。
ステップS302にて、CPU101は、撮像部100にて生成された画像データから人物の顔を検出する。人物の顔検出は、画像を解析し、顔を構成する器官の配置と似ている箇所を顔として検出する。顔検出処理において、顔の中心座標、顔のサイズ、顔の角度、顔の向き、顔特徴量を算出する。顔特徴量とは、顔における器官の配置や大きさを数値化したものである。
ステップS303にて、CPU101は、検出した顔を識別するための顔IDを関連付ける。なお、異なる人物の顔については、異なる顔IDが割り振られるものとする。その際、人物認証を行い前フレームで検出済みの人物の顔と対象フレームで検出した顔が同一人物であると判定した場合には、前フレームの顔IDを引き継いで使用するものとする。人物認証とは、顔特徴量の類似度により同一人物であるか否かを判定する処理である。また、人物認証できた顔を途中で見失い、その後に、同じ人物の顔を再び検出できたとしても、見失う前とは別の顔IDが割り振られるものとする。また、双子のようにそっくりな顔が同一フレーム内の異なる座標に複数検出されたとしても、同一人物が同一フレーム内に存在することはないものとして、違う顔IDを割り振る。前フレームで検出した顔と同一人物であると判定した顔が複数見つかった場合には、前フレームの顔座標と近い座標の顔に同じ顔IDを割り振る。
ステップS304にて、CPU101は、ユーザがステップS303にて顔を検出した位置でタッチ指定したか否かを判定する。タッチ指定したと判定した場合には、ステップS305へと進む。タッチ指定していないと判定した場合には、ステップS312へと進む。
ステップS305にて、CPU101は、タッチ指定で選択された顔に該当する顔IDをRAM103に記憶する。
ステップS306にて、CPU101は、主被写体検出結果の信頼度を示す信頼度の値を1とし、RAM103に記憶する。
ステップS307にて、CPU101は、像面上の主被写体の検出位置に存在する被写体と撮像素子までの距離を測る。主被写体は、ステップS304でタッチ指定された顔もしくは、後述のステップS313で主被写体として検出した顔である。
ステップS308にて、CPU101は、ステップS306で算出した距離に合焦するように、撮像部100を駆動する。
ステップS309にて、CPU101は、撮像部100にて結像した画像データについて、動画データを構成する1フレームとして、記憶媒体に記録する。
ステップS310にて、CPU101は、記憶媒体に動画データに付帯する付帯情報として、追尾情報を記録する。
ここで、ステップS310にて記録する追尾情報について図4を用いて説明する。DataNo401は、図5で後述する追尾情報補正処理において、検出結果の各顔の情報を一意に特定するために用いる。Frame(フレーム番号)402は、何番目のフレームに対する処理をするか特定するためのカウンタiの値を記憶したものである。顔ID403は、ステップS303で各顔に関連付けられて記憶される。顔座標x404と顔座標y405は、顔ID403に対応する顔の画像データ上の中心座標であり、顔座標x404は水平方向の座標、顔座標y405は垂直方向の座標を記憶する。顔の中心座標は、ステップS302で検出した結果を使用する。顔サイズ406は、顔ID403に対応しており、顔中心座標を中心とした、正方形の一辺の画素数を示す。検出した顔がこの正方形内にちょうど収まる大きさであるものとする。主被写体判定結果407は、ステップS304でタッチ指定された顔もしくは、後述のステップS313で仮の主被写体として検出した顔であるか否かを示す値を記憶する。CPU101が主被写体と判定した顔の場合には1、主被写体ではないと判定した顔の場合には、0を記憶する。タッチ指定408は、タッチ指定操作の有無を示す値である。フレーム番号402に該当するフレームにおいて、CPU101が、タッチ指定操作があったと判定した場合には1を記憶し、タッチ指定操作が無かったと判定した場合には、0を記憶する。信頼度409は、主被写体検出結果の信頼度である。CPU101が、ステップS306もしくはステップS314で決定した値を記憶する。
図3に戻り、ステップS311にて、CPU101は、カウンタiの値をインクリメントする。
ステップS312にて、CPU101は、RAM103内に主被写体の顔IDを記憶しているか否かを判定する。記憶していると判定した場合には、ステップS313へと進む。記憶していないと判定した場合には、ステップS314へと進む。
ステップS313にて、CPU101は、主被写体検出が成功したか否かを判定する。主被写体検出が成功したか否かは、ステップS312における顔IDに対応する顔の有無で判定を行う。主被写体の検出に成功したと判定した場合には、ステップS306へと進む。主被写体の検出に失敗したと判定した場合には、ステップS314へと進む。
ステップS314にて、CPU101は、主被写体検出結果の信頼度を示す信頼度の値を0とし、RAM103に記憶する。
ステップS315にて、CPU101は、RAM103に記憶された主被写体の顔IDを消去する。
ステップS316にて、CPU101は、画像データ内に内在する顔の中から、それぞれの顔のサイズや位置などに基づいて主被写体を選択する。顔のサイズが大きいほど、顔の位置が画像の中心部に近いほど評価値を大きく割り当て、評価値の最も大きな顔を主被写体として選択する。前フレームで主被写体として選択された顔が含まれている場合には、その顔の評価値に対して1より大きな係数を掛けて、再び主被写体として選択されやすくしてもよい。そして、前記顔に対応する顔IDをRAM103に記憶する。
図5は、本発明の一実施形態に係る追尾補正処理の工程を示すフローチャート図である。なお、本処理は、CPU101がRAM103に格納された制御プログラムを実行することにより実行される。本処理は、動画撮影処理終了後に実行されるものとする。
ステップS500にて、CPU101は、処理対象とする動画データに付帯された追尾情報をRAM103に読み込む。
ステップS501にて、CPU101は、何番目の主被写体情報かを特定するためのカウンタTgtObjと、何番目のフレームに対する処理かを特定するためのカウンタFrameNoに、共に0を代入する。
ステップS502にて、CPU101は、RAM103内の追尾情報から、FrameNoが0のフレームにおいて主被写体と判定した顔の顔ID403を、ID[TgtObj]として記憶する。図4の例では、FrameNoが0であり、かつ、主被写体判定結果407が1である顔IDの値「2」が、ID[0]として記憶される。
ステップS503にて、CPU101は、TgtObj番目の主被写体を指定したフレームの情報として、FrameNoの値を、FNo[TgtObj]として記憶する。ここでは、0番目の主被写体を指定したフレームの情報として、FrameNoの値「0」が、FNo[0]として記憶される。
ステップS504にて、CPU101は、TgtObjとFrameNoに、共に1を代入する。
ステップS505にて、CPU101は、FrameNoが対象の動画データを構成するフレーム数未満か否かを判定する。FrameNoが動画を構成するフレーム未満で有る場合には、全てのフレームにおける追尾情報を補正していないものと判定し、ステップS506へと進む。FrameNoが動画を構成するフレームに達した場合には、全てのフレームにおける追尾情報の補正が完了したものと判定し、一連の処理を終了する。
ステップS506にて、CPU101は、RAM103内の追尾情報からFrameNoのフレームにおいてタッチ指定の操作があったか否かを判定する。図4に示す追尾情報のうち、タッチ指定408の値が1の場合には、対象フレームでタッチ指定の操作があったと判定する。タッチ指定408の値が0の場合には、対象フレームでタッチ指定の操作がなかったと判定する。タッチ指定の操作があったと判定した場合には、ステップS507へと進む。タッチ指定操作がなかったと判定した場合には、ステップS519へと進む。
ステップS507にて、CPU101は、TgtObjの値をインクリメントする。これは、タッチ指定の操作によって、主被写体が更新されたことを意味する。
ステップS508にて、CPU101は、RAM103内の追尾情報から、タッチ指定されたフレーム番号の主被写体の顔IDを読み込み、ID[TgtObj]として記憶する。
ステップS509にて、CPU101は、タッチ指定されたフレーム番号を読み込み、FNo[TgtObj]として記憶する。
ステップS510にて、CPU101は、RAM103内の追尾情報からタッチ指定をした直前のフレームで主被写体として選択された顔IDを読み込む。例えば、FrameNoが8のフレームに対してタッチ指定がされたのであれば、FrameNoが7のフレームにおいて主被写体として選択された顔IDを読み込む。
ステップS511にて、CPU101は、前回のタッチ指定で主被写体として指定された顔IDの値と、ステップS510で読み込んだ直前のフレームで主被写体として選択された顔IDの値が一致しているか否かを判定する。前回タッチ指定で主被写体として指定された顔の顔IDとは、ID[TgtObj−1]の値である。一致している場合には、前回タッチ指定してから、同一の顔を主被写体として選択し続けることができていたとして、ステップS519へと進む。一致しなかった場合には、前回タッチ指定してから、今回タッチ指定するまでの間において、主被写体として選択された顔が変化しており、追尾が失敗していた期間があると判定して、ステップS512へと進む。なお、初めてタッチ指定が行われた場合には、前回タッチ指定で主被写体として指定された顔の顔IDの値として、ステップS502でID[0]として記憶された顔IDの値が用いられることになる。
ステップS512にて、CPU101は、追尾情報を補正する対象のフレームの番号を記憶するため、TgtFrameに、タッチ指定をしたフレーム番号FNo[TgtObj]より1つ小さいフレーム番号を代入する。
ステップS513にて、CPU101は、追尾情報補正を終了するフレーム番号ChFinalFrameとして、前回タッチ指定をしたフレーム番号FNo[TgtObj−1]を代入する。
ステップS514にて、CPU101は、TgtFrameの値がChFinalFrameの値以上か否かを判定する。TgtFrameの値がChFinalFrameの値以上と判定した場合には、前回タッチ指定をしてから今回タッチ指定をするまでの間のフレームに、まだ追尾情報を補正の要否を判定できていないフレームが含まれていることになる。そのため、ステップS515と進む。TgtFrameの値がChFinalFrameの値未満と判定した場合には、前回タッチ指定をしてから今回タッチ指定をするまでの間の全てのフレームに対して、追尾情報を補正の要否を判定できたことになる。そのため、ステップS519へと進む。
ステップS515にて、CPU101は、RAM103内の追尾情報からTgtFrame番目のフレームの主被写体検出結果の信頼度409の値が1であるか否かを判定する。1である場合には、対象フレームにおいて、前回タッチ指定された顔に対する追尾が成功していたと判定し、ステップS518へと進む。1でない場合には、対象フレームにおける追尾が失敗していたと判定し、ステップS516へと進む。
ステップS516にて、CPU101は、RAM103内の追尾情報から、今回タッチ指定されたフレームにおいて指定された顔の顔IDがTgtFrame番目のフレームに存在するか否かを判定する。存在する場合には、ユーザが今回タッチ指定で指定した顔が、タッチ指定以前のフレームでも見つかったと判定し、ステップS517へと進む。存在しない場合には、ユーザがタッチ指定で指定した顔がタッチ指定以前のフレームで見つからなかったと判定し、ステップS518へと進む。
ステップS517にて、CPU101は、RAM103内のTgtFrame番目のフレームの追尾情報を補正する。TgtFrame番目のフレームの主被写体検出結果の信頼度409の値を1に変更する。そして、今回タッチ指定で指定した顔の顔IDに対応するデータの主被写体判定結果407の値を1に変更し、加えて、元々は主被写体判定結果407の値が1であった顔ID403に対応する主被写体判定結果407の値を、0に変更する。
ステップS518にて、CPU101は、TgtFrameの値をデクリメントする。つまり、追尾情報を補正の要否を判定する対象のフレームを、1つ前のフレームに設定する。そして、ステップS513へと戻る。
ステップS519にて、CPU101は、FrameNoの値をインクリメントとし、次のフレームをステップS505以降の処理対象とする。そして、ステップS505へと戻る。
この図5に示した追尾補正処理の工程を示すフローチャートによって得られる効果について、図6を用いて説明を行う。図6(a)、(b)の表において、FrameNoのラインはフレーム番号を示す。被写体Aの顔ID、被写体Bの顔ID、および、被写体Cの顔IDの各ラインは、フレームごとに、被写体が検出できた場合に顔IDが記載され、検出できなかった場合にマイナス符号が記載されている。信頼度のラインは、図4に示す信頼度409と同じものであり、タッチ指定された顔IDに対応する顔が検出できている間は1となる。主被写体判定のラインは、図4に示す主被写体判定結果407と同じものであり、各フレームにおいてどの顔IDが主被写体として判定されたかを示している。Tgt_Obj、ID[Tgt_Obj]、および、FNo[Tgt_Obj]のラインは、各フレームにおいて、図5で説明した内容に基づいてそれぞれに対して入力された値を示す。
図6(a)は動画撮影処理によって生成された追尾情報に基づいて生成された表である。FrameNoが0および1のフレームではタッチ指定が行われておらず、顔IDの値が2である被写体Cが主被写体として選択される。FrameNoが2のフレームでタッチ指定が行われ、顔IDの値が1である被写体Bが主被写体として選択され、顔IDがRAM103に記憶される。FrameNoが3および4のフレームでは、引き続きRAM103に記憶された顔IDの値が1である被写体Bが、主被写体として選択され、信頼度が1に設定される。FrameNoが5および6のフレームでは、被写体Bを見失ったため、信頼度が0に変更され、RAM103に記憶された顔IDが消去される。そして、代わって、顔IDの値が0である被写体Aが主被写体として新たに選択される。FrameNoが7および8のフレームでは、被写体Bが再度検出されるが、被写体Aが引き続き主被写体として選択される。なお、被写体Bは一度見失っているので、再度検出された際には新たな顔IDとして3が設定される。ユーザが、主被写体が変更されていることに気づき、FrameNoが9のフレームで、タッチ指定を行い、顔IDの値が3である被写体Bが再び主被写体として選択され、信頼度が再び1に設定される。FrameNoが10および11のフレームでは、引き続き顔IDの値が3である被写体Bが主被写体として選択される。ユーザは主被写体の変更を希望し、FrameNoが12のフレームで、タッチ指定を行い、顔IDの値が0である被写体Aが主被写体として選択され、信頼度が1に設定される。
図6(a)に示す例では、FrameNoが1以降のフレームにおいては、タッチ指定が行われた場合にのみ、Tgt_Objの値が1増え、タッチ指定された顔IDがID[Tgt_Obj]に記憶され、タッチ指定されたFrameNoがFNo[Tgt_Obj]に記憶される。つまり、ユーザが何回目のタッチ指定を、どのフレームで、どの顔IDに対して行ったのかが明確になる。そのため、デジタルカメラが途中で主被写体を見失い、他の被写体を主被写体としてみなした場合には、ID[Tgt_Obj]と実際に選択された主被写体との間で相違が生じる。
図6(b)は、図6(a)に示す追尾情報の表に対して補正処理を行ったものである。図6(b)では、FrameNoが9のフレームにおいて2回目のタッチ指定が行われているため、直前のフレームであるFrameNoが8のフレームにおいて主被写体として選択されている顔ID「0」を読み出す。そして、これと、1回目のタッチ指定が行われたFrameNoが2のフレームにおいてタッチ指定された顔ID「1」を比較する。これらの顔IDが一致していないので、主被写体が、途中で意図しない被写体に変更された可能性が高いと考えられる。そこで、直前のフレームであるFrameNoが8のフレームから順に遡り、信頼度が1でないフレームに対しては、2回目のタッチ指定によって指定された顔ID「3」が主被写体となるように、それぞれのフレームの主被写体の情報を書き換える。そして、これとともに、信頼度を1に置き換える。その結果、FrameNoが7および8のフレームにおいて、顔IDの値が3である被写体Bが主被写体に変更される。なお、FrameNoが5および6のフレームにおいては、顔ID「1」である被写体Bを検出できなかったため、主被写体の変更を行わない。また、FrameNoが5および6のフレームにおいては、信頼度が1であり、その前にタッチ指定によって選択された被写体を追尾できていることが明らかであるため、主被写体の変更を行わない。
なお、主被写体を見失った時点から、再びタッチ指定されるまでの間は、信頼度が0に設定されるのだから、図5のステップS511の判定を省略し、ステップS515の信頼度のみに基づいて追尾情報を補正するか否かを判定するようにしてもよい。ただし、追尾に成功していた場合においてもステップS512乃至S518の処理を繰り返すことになるので、処理負荷は増加することになる。
図7は、本発明の一実施形態に係る再生処理の工程を示すフローチャート図である。なお、本処理は、CPU101がRAM103に格納された制御プログラムを実行することにより実行される。本処理は、再生モードにおいて動画データが選択されて、再生操作があった場合に、追尾補正処理が施された追尾情報を用いて実行される。
ステップS700において、CPU101は、何番目のフレームを処理対象にするか特定するためのカウンタiに0を代入する。
ステップS701において、CPU101は、処理対象とする動画データに付帯された追尾情報をRAM103に読み込む。
ステップS702において、CPU101は、動画再生終了操作があったか否かを判定する。動画の再生終了操作とは、電源ボタン202押下による電源OFFの操作および撮影モードボタン203の押下による撮影モードへの切り替え操作である。動画再生終了操作があったと判定した場合には、一連の処理を終了する。動画再生処理操作がないと判定した場合には、ステップS703へ進む。
ステップS703において、CPU101は、iが動画データのフレーム数未満か否かを判定する。iが動画データのフレーム数未満の場合には、動画データの最後まで再生していないと判定し、ステップS704へと進む。iが動画データのフレーム数に達した場合には、動画データの最後まで再生したと判定し、一連の処理を終了する。
ステップS704において、CPU101は拡大表示の指示がされているかを判定する。拡大表示の指示とは、再生モードにおいて、拡大縮小レバー206による操作のことである。拡大表示の指示があると判定した場合には、ステップS705へと進み、そうでない場合には、ステップS708へと進む。
ステップS705において、CPU101はRAM103内の追尾情報から、処理対象とするフレームにおける主被写体検出の信頼度409の値が1か否かを判定する。信頼度が1であれば、該当フレームの追尾結果は拡大表示の範囲を決める情報として適切あると判定し、ステップS706へと進む。信頼度が0の場合、該当フレームの追尾結果は拡大表示の範囲を決める情報として不適切であると判定し、ステップS708へと進む。
ステップS706において、CPU101は、RAM103内の追尾情報から該当フレームにおける主被写体の顔座標x404、顔座標y405、および、顔サイズ406の値をRAM103に読み込む。
ステップS707にて、CPU101は、顔座標x404、顔座標y405、および、顔サイズ406に基づいて、該当フレームから、主被写体を含む表示範囲を設定する。
ステップS708において、CPU101は、該当フレーム全体を表示範囲として設定する。
ステップS709において、CPU101は、ステップS707またはS708で設定された表示範囲がディスプレイ201のサイズに一致するように、該当フレームの画像データの拡大あるいは縮小処理を行う。
ステップS710にておいて、CPU101は、ステップS709で作成された画像データを読み込みディスプレイ201へ表示する。
ステップS711において、CPU101は、カウンタiをインクリメントし、次のフレームへ処理を進める。
なお、図7では、信頼度が0であるフレームについてのみフレーム全体を表示するように動画を再生する構成としたが、動画の途中の短い期間だけフレーム全体が表示されると、かえって違和感を与える場合もある。そこで、信頼度が0のフレームについては、その前後に位置する信頼度が1のフレームの表示範囲に基づいて表示範囲を補間したり、あるいは、その前に位置する信頼度が1のフレームの表示範囲をそのまま引き継ぐようしたりしてもよい。
(第2の実施形態)
第1の実施形態においては、人物の顔を追尾対象としたが、本実施形態においては、人物以外の任意の物や動物を追尾対象とする場合の構成について説明する。
図8は、本発明の一実施形態に係る画像処理装置として動作するパーソナルコンピュータを示すブロック図である。
図8において、CPU801は、パーソナルコンピュータ全体の制御を司る。ROM802は、CPU801の動作処理手順(例えばコンピュータの立ち上げ処理や基本入出力処理等のプログラム)を記憶している。RAM803は、CPU801のメインメモリとして機能する。RAM803には、後述の処理を実現するための制御プログラムを含む各種プログラムが、ハードディスクドライブ(HDD)800からロードされる。また、RAM803は、CPU101が各種処理を実行する際のワークエリアを提供する。
ディスプレイ804は、液晶ディスプレイや有機ELディスプレイで構成される。HDD800は、アプリケーションプログラムやデータ、ライブラリなどの保存及び読み込み用に用いられる。入力装置805はポインティングデバイスやキーボード等で構成される。
メディアドライブ806は、着脱可能な記憶媒体を装着し、データを記憶したり、記憶されたデータを読み出したりする。ネットワーク用のインターフェイス(I/F)807は、通信回線809を介してコンピュータネットワーク810と接続される。このI/F807を介して、通信可能な機器に対してデータの送受信を行う。システムバス808は、アドレスバス、データバスおよび制御バスからなり、上述した各ユニット間を接続する。本実施形態の画像再生装置において、処理対象とする動画データは、HDD800に保存されているものとする。
図9は、図1に示すデジタルカメラによる動画撮影処理の工程を示すフローチャート図である。
図10は、本発明の第2の実施形態に係る追尾情報の説明するための図である。図9と図10を用いて、動画撮影処理および追尾情報記録処理について、説明を行う。
図9のステップS900にて、デジタルカメラのCPU801は、動画ファイルの何番目のフレームに対する処理をするかを特定するためのカウンタiに0を代入する。
ステップS901にて、CPU801は、動画撮影終了指示があったか否かを判定し、動画撮影終了指示があったと判定した場合には、一連の動画撮影処理を終了する。CPU801は、ステップS901にて、動画撮影終了指示がないと判定した場合には、ステップS902へと進む。
ステップS902にて、CPU801は、ユーザがポインティングデバイスなどの入力装置805を用いて主被写体指定をしたか否かを判定する。主被写体指定をしたと判定した場合には、ステップS903へと進む。被写体指定していないと判定した場合には、ステップS910へと進む。
ステップ903にて、CPU801は、ユーザが指定した位置を中心として、所定サイズの領域を設定し、この領域に含まれる画素における色相のヒストグラムを生成する。そして、色相ヒストグラムのうち、頻度の高い色相が含まれる割合が高くなるように、領域のサイズを一定範囲内で調整する。そして、調整後の領域内の画素に基づいて再度生成された色相ヒストグラムを、特徴量を示す色分布情報としてRAM803に記憶する。なお、ここでは色相ヒストグラムを例に挙げて説明を行ったが、輝度ヒストグラムや、各画素のR、G、B成分の分布情報を特徴量としてもよい。
ステップS904にて、CPU801は、主被写体検出結果の信頼度を示す信頼度の値を1とし、RAM803に記憶する。
ステップS905にて、CPU801は、像面上の主被写体の検出位置に存在する被写体と撮像素子までの距離を測る。主被写体の検出位置は、ステップS903で主被写体指定された位置もしくは、後述のステップS911で主被写体領域を検出した位置である。
ステップS906にて、CPU801は、ステップS306で算出した距離に合焦するように、撮像部100を駆動する。
ステップS907にて、CPU801は、撮像部100にて結像した画像データについて、動画データを構成する1フレームとして、記憶媒体に記録する。
ステップS908にて、CPU801は、記憶媒体に動画データに付帯する付帯情報として、追尾情報を記録する。
ここで、ステップS908にて記録する追尾情報について図10を用いて説明する。Frame(フレーム番号)1001は、何番目のフレームに対する処理をするか特定するためのカウンタiの値を記憶したものである。顔座標x404と顔座標y405は、主被写体として検出された領域の中心座標であり、座標x1002は水平方向の座標、座標y1003は垂直方向の座標を記憶する。サイズ1004は、主被写体として設定された領域の正方形の一辺の画素数を示す。主被写体指定判定結果1005は、主被写体指定の操作の有無を示す値である。主被写体指定の操作があったと判定した場合には1を記憶し、主被写体指定の操作が無かったと判定した場合には、0を記憶する。信頼度1006は、主被写体の検出結果の信頼度である。色分布情報1007は主被写体として検出された領域の色分布情報である。
図9に戻り、ステップS909にて、CPU801は、カウンタiの値をインクリメントする。
ステップS910にて、CPU801は、RAM803内に主被写体の色分布情報を記憶しているか否かを判定する。記憶していると判定した場合には、ステップS911へと進む。記憶していないと判定した場合には、ステップS913へと進む。
ステップS911にて、CPU801は、入力されたフレーム画像から、ステップS903で記憶した色分布との類似度が閾値以上となる領域を抽出し、主被写体の領域とする。例えば、入力されたフレーム画像の部分領域から得られた色相ヒストグラムと、ステップS903で記憶した色相ヒストグラムを用いて、バタチャリヤ距離を求めることで、類似度を得ることができる。1つのフレーム画像から類似度が閾値以上となる領域が複数検出された場合には、それぞれの類似度に対して、前フレームにおける主被写体の位置からの距離が短くなるほど大きく係数を掛けて評価値を求める。そして、最も大きな評価値となる領域を、主被写体の領域として選択すればよい。
ステップS912にて、CPU801は、ステップS911において主被写体の領域が検出できていればステップS904に進み、検出できていなければステップS913に進む。
ステップS913にて、CPU801は、主被写体検出結果の信頼度を示す信頼度の値を0とし、RAM803に記憶する。
ステップS914にて、CPU801は、フレーム画像から主被写体の領域を決定する。例えば、コントラストAFによって至近距離にいると判断された領域を主被写体の領域として設定する。あるいは、フレーム画像を色相に応じて複数のグループに分割し、各グループの大きさや画像の中心位置から距離に基づく評価値に従って、主被写体の領域を設定するようにしてもよい。
ステップS915にて、CPU801は、ステップS914で設定された主被写体の領域から色相ヒストグラムを生成し、特徴量を示す色分布情報としてRAM103に記憶する。そして、ステップS905に進む。
図11は、本発明の一実施形態に係る画像処理装置のユーザーインターフェイスの一例である。
図11を用いて、CPU801が追尾再生をする方法について、説明する。
ユーザがポインティングデバイス等の入力装置805を用いてファイル読み込みメニュー1101を選択すると、CPU801はファイル読み込み指示があったと判定して、ファイルオープンダイアログを表示する。そして、ユーザがファイルオープンダイアログで画像ファイルを選択した場合、CPU801はHDD800から動画ファイルをRAM803に読み込み、動画データの先頭フレームをディスプレイ804に表示する。
前述のファイルオープンダイアログでユーザが選択した画動画データは、動画データ再生領域1102で再生される。
先頭フレーム選択ボタンであり、ユーザが入力装置805を用いて先頭フレーム選択ボタン1103を操作すると、動画データの再生位置に関わらず、先頭フレームに戻り、一時停止状態となる。
ユーザが入力装置805を用いて再生/一時停止トグルボタン1104を操作すると、動画データ再生領域1102内で動画データの再生を開始し、一時停止のマークへとボタンの表示を切り替える。動画データ再生中に再生/一時停止トグルボタン1104を操作すると、動画データの再生を一時停止し、押下した位置のフレームを動画データ再生領域1102に表示する。
再生位置のつまみ1105の一番左端は、動画データの先頭位置のフレームを示し、一番右端は動画データの最後尾位置のフレームを示す。ユーザが入力装置805で水平方向にドラッグすると、動画データの再生位置を変更する。
ユーザが入力装置805で最後尾フレーム選択ボタン1106を操作すると、動画データの再生位置に関わらず、最後尾フレームに進み一時停止状態となる。
追尾再生チェックボックス1107がオンの状態のときに、ユーザが入力装置805で追尾再生チェックボックス1107を操作すると、追尾再生を解除する操作があったものとCPU801が判定し、チェックボックスをオフの状態に変更する。追尾再生チェックボックス1107がオフの状態のときに、ユーザが入力装置805で追尾再生チェックボックス1107を操作すると、追尾再生する操作があったものとCPU801が判定し、チェックボックスをオンの状態に変更する。
ユーザが入力装置805で表示倍率指定リストボックス1108を操作すると、WindowFit、100%、200%、400%と表示倍率の候補をリスト表示する。そして、リストの中からユーザが所望の倍率を指定すると、CPU801は表示倍率変更操作があったものと判定し、ユーザが指定した倍率で動画データ再生領域1102における動画データの表示を拡大縮小する。
ユーザが入力装置805で終了ボタン1109を操作すると、CPU801は終了指示があったと判定し、追尾再生の処理を終了する。
図12は、本発明の一実施形態に係る追尾補正処理の工程を示すフローチャート図である。なお、本処理は、CPU801がRAM803に格納された制御プログラムを実行することにより実行される。本処理は、RAM803から動画データを読み込み、動画を再生する前に実行するものとする。
ステップS1200にて、CPU801は、処理対象とする動画データに付帯された追尾情報をRAM803に読み込む。
ステップS1201にて、CPU801は、何番目の主被写体情報かを特定するためのカウンタTgtObjと、何番目のフレームに対する処理かを特定するためのカウンタFrameNoに、共に0を代入する。
ステップS1202にて、CPU801は、FrameNoが0のフレームにおいて主被写体と判定した領域の色分布情報を、Color[TgtObj]として記憶する。
ステップS1203にて、CPU801は、TgtObj番目の主被写体を指定したフレームの情報として、FrameNoの値を、FNo[TgtObj]として記憶する。ここでは、0番目の主被写体を指定したフレームの情報として、FrameNoの値「0」が、FNo[0]として記憶される。
ステップS1204にて、CPU801は、TgtObjとFrameNoに、共に1を代入する。
ステップS1205にて、CPU801は、主被写体指定がされたフレームの直前のフレーム番号を示すbefFrameNoに初期値として−1を代入する。
ステップS1206にて、CPU801は、FrameNoが対象の動画データを構成するフレーム数未満か否かを判定する。FrameNoが動画を構成するフレーム未満で有る場合には、全てのフレームにおける追尾情報を補正していないものと判定し、ステップS1207へと進む。FrameNoが動画を構成するフレームに達した場合には、全てのフレームにおける追尾情報の補正が完了したものと判定し、一連の処理を終了する。
ステップS1207にて、CPU801は、RAM803内の追尾情報からFrameNoのフレームにおいて主被写体指定の操作があったか否かを判定する。主被写体指定の操作があったと判定した場合には、ステップS1208へと進む。主被写体指定の操作がなかったと判定した場合には、ステップS1224へと進む。
ステップS1208にて、CPU801は、befFrameNoが初期値の−1であるか否かを判定する。befFrameNoが−1であると判定した場合は、ステップS1209へ進み、そうでなければステップS1210へ進む。
ステップS1209にて、CPU801は、befFrameNoにFrameNo−1の値を記憶する。
ステップS1210にて、CPU801は、RAM803内の追尾情報からFrameNo以降のフレームにおいて、所定時間内に主被写体指定の操作があったか否かを判定する。本実施例では所定時間とは1秒とする。1秒間で30フレームの動画データの場合には、主被写体指定の操作がされたフレームのFrameNoを基準として、FrameNo+30までのいずれかのフレームで、主被写体判定結果の値に1があるか否かで判定する。主被写体指定の操作があったと判定した場合には、ステップS1224へと進む。これは、現在のフレームにおける主被写体指定の操作はなかったものとすることを意味する。主被写体指定の操作がなかったと判定した場合には、ステップS1211へと進む。
ステップS1211にて、CPU801は、RAM803内の追尾情報から、主被写体指定されたフレーム番号の色分布情報を読み込み、Color[TgtObj]として記憶する。
ステップS1212にて、CPU101は、主被写体指定の操作があったフレーム番号を読み込み、FNo[TgtObj]として記憶する。
ステップS1213にて、CPU801は、RAM803内の追尾情報からFrameNoがbefFrameNoのフレームの色分布情報1007の値を記憶する。
ステップS1214にて、CPU801は、前回主被写体指定の操作によって指定された主被写体の色分布情報とステップS1213にて記憶した色分布情報を比較し、被写体が一致しているか否かを判定する。被写体が一致しているか否かの判定は、色分布情報の類似度を算出し、類似度が所定の閾値以上である場合に、被写体が一致しているものと判定する。一致している場合には、前回主被写体指定の操作をしたフレームからFrameNoがbefFrameのフレームまでの間、追尾が成功していたと判定して、ステップS1222へと進む。反対に、一致しなかった場合には、前回主被写体指定の操作をしたフレームからFrameNoがbefFrameのフレームまでの間、追尾が失敗していた期間があると判定して、ステップS1215へと進む。
ステップS1215にて、CPU801は、追尾情報を補正する対象のフレームの番号を記憶するため、TgtFrameに、タッチ指定をしたフレーム番号FNo[TgtObj]より1つ小さいフレーム番号を代入する。
ステップS1216にて、CPU801は、追尾情報補正を終了するフレーム番号ChFinalFrameとして、前回タッチ指定をしたフレーム番号FNo[TgtObj−1]を代入する。
ステップS1217にて、CPU801は、TgtFrameの値がChFinalFrameの値以上か否かを判定する。TgtFrameの値がChFinalFrameの値以上と判定した場合には、前回主被写体指定の操作をしてから今回主被写体指定の操作をするまでの間のフレームに、まだ追尾情報を補正の要否を判定できていないフレームが含まれていることになる。そのため、ステップS1218と進む。TgtFrameの値がChFinalFrameの値未満と判定した場合には、前回主被写体指定の操作をしてから今回主被写体指定の操作をするまでの間の全てのフレームに対して、追尾情報を補正の要否を判定できたことになる。そのため、ステップS1222へと進む。
ステップS1218にて、CPU801は、RAM803内の追尾情報からTgtFrame番目のフレームの主被写体検出結果の信頼度1006の値が1であるか否かを判定する。1である場合には、対象フレームにおいて、前回主被写体指定の操作がされた顔に対する追尾が成功していたと判定し、ステップS1222へと進む。1でない場合には、対象フレームにおける追尾が失敗していたと判定し、ステップS1219へと進む。
ステップS1219にて、CPU801は、RAM803内の追尾情報から、今回主被写体指定の選択がなされたフレームにおいて指定された被写体と同一の被写体の領域が、TgtFrame番目のフレームに存在するか否かを判定する。具体的には、CPU801は、色分布情報の類似度が閾値以上である色分布を有する領域があれば、それを同一の被写体の領域であると判定する。そして、同一の被写体の領域が存在する場合には、ステップS1220へと進み、存在しない場合には、ステップS1221へと進む。
ステップS1220にて、CPU801は、RAM803内のTgtFrame番目のフレームの追尾情報を補正する。TgtFrame番目のフレームの主被写体検出結果の信頼度1006の値を1に変更する。そして、ステップS1219にて検出した領域の位置に応じて座標x1002、座標71003、サイズ1004、および、色分布情報1007を更新する。
ステップS1221にて、CPU801は、TgtFrameの値をデクリメントする。つまり、追尾情報を補正の要否を判定する対象のフレームを、1つ前のフレームに設定する。そして、ステップS1217へと戻る。
ステップS1222にて、CPU801は、befFrameNoに初期値として−1を代入する。この処理をすることで、新たな主被写体指定の処理があった場合に、ステップS1208からステップS1209に進み、befFrameNoにFrameNo−1の値を記録することができる。
ステップS1223にて、CPU801は、TgtObjの値をインクリメントする。
ステップS1223にて、CPU801は、FrameNoの値をインクリメントとし、次のフレームをステップS1206以降の処理対象とする。そして、ステップS1206へと戻る。
このように、図12に示すフローチャートによれば、ユーザが所定時間内に複数回にわたって主被写体を指定する操作を繰り返した場合には、最後に指定された主被写体の情報を基準に、追尾が成功していなか否かを判定することができる。
なお、補正された追尾情報を用いて動画データを再生する方法については、第1の実施形態で説明した図7と同様であるため、説明を省略する。
以上説明した通り、本実施形態の画像処理装置によれば、途中で異なる被写体を主被写体として追尾してしまった場合であっても、遡って主被写体の情報を修正することができる。そのため、ユーザの意図しない被写体を主被写体として、動画データに対する編集処理を行うことを抑制することが可能となる。
なお、図7を用いて説明した再生処理は編集処理の1つの例であって、これに限られるものではない。例えば、信頼度が1であって、かつ、特定の顔IDが主被写体として選択されているフレームをのみを抽出するようにしてもよいし、このようなフレームのいずれか1つを動画の再生を開始するフレームとして決定するようにしてもよい。
なお、上記実施形態においては、追尾情報が動画データに付帯されている場合を説明したが、動画データと追尾情報が関連付けられており、両方を読み込み可能な状態であれば、動画データと追尾情報は別々に記憶されていても構わない。
以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。また、上述の実施形態の一部を適宜組み合わせてもよい。
また、本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100 撮像部
101、801 CPU
102、802 ROM
103、803 RAM
104、804 ディスプレイ
105、805 入力装置
106、806 メディアドライブ
107、807 インターフェイス(I/F)
108、808 システムバス
109、809 通信回線
110、810 ネットワーク
811 ハードディスクドライブ(HDD)

Claims (16)

  1. ユーザによる主被写体の指定に応じて設定された主被写体の追尾情報が付帯された動画データに対して、ユーザによる第1の主被写体の指定が行われてから第2の主被写体の指定が行われるまでの少なくとも一部のフレーム画像における前記追尾情報を、前記第2の主被写体の指定に応じて設定された主被写体の追尾情報に基づいて補正する補正手段を、有することを特徴とする画像処理装置。
  2. 前記補正手段は、前記第1の主被写体の指定が行われてから前記第2の主被写体の指定が行われるまでの間に、主被写体の追尾に失敗したと判断した場合に、前記第1の主被写体の指定が行われてから前記第2の主被写体の指定が行われるまでの少なくとも一部のフレーム画像における前記追尾情報を補正することを特徴とする請求項1記載の画像処理装置。
  3. 前記補正手段は、前記第2の主被写体指定が行われたフレーム画像の直前のフレーム画像における前記追尾情報が示す主被写体と、前記第2の主被写体指定が行われたフレーム画像における前記追尾情報が示す主被写体が異なる場合に、前記第1の主被写体指定が行われてから前記第2の主被写体指定が行われるまでの少なくとも一部のフレーム画像における前記追尾情報を補正することを特徴とする請求項1に記載の画像処理装置。
  4. 前記補正手段は、前記第1の主被写体指定が行われてから前記第2の主被写体指定が行われるまでの間に主被写体を見失っている場合に、見失った後のフレーム画像における前記追尾情報を補正することを特徴とする請求項1に記載の画像処理装置。
  5. 前記補正手段は、所定時間内にユーザによる複数回の主被写体指定が行われた場合には、前記所定時間内に行われた主被写体指定のうちの最後の主被写体指定を、前記第2の主被写体指定とすることを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。
  6. 前記補正手段は、補正の対象となるそれぞれのフレーム画像における前記追尾情報を、前記第2の主被写体指定に応じて設定された主被写体と同じ主被写体を示すように補正することを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  7. 前記補正手段は、補正の対象となるそれぞれのフレーム画像における前記追尾情報を、前記第2の主被写体指定に応じて設定された主被写体としての顔と同じ顔を示すように補正することを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  8. 前記追尾情報は、それぞれのフレーム画像における主被写体の座標およびサイズを示す情報を含むことを特徴とする請求項1乃至7のいずれか1項に記載の画像処理装置。
  9. 前記追尾情報は、それぞれのフレーム画像における主被写体の追尾に成功しているか否かを示す情報を含むことを特徴とする請求項1乃至8のいずれか1項に記載の画像処理装置。
  10. 前記補正手段は、補正の対象となるそれぞれのフレーム画像における前記追尾情報を、主被写体の追尾に成功していることを示す情報に補正することを特徴とする請求項9に記載の画像処理装置。
  11. 前記補正手段によって補正された前記追尾情報に応じて、前記動画データの再生処理を行う再生手段を有することを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
  12. 前記再生手段は、前記補正手段によって補正された前記追尾情報に応じて、前記動画データの表示を行うことを特徴とする請求項11に記載の画像処理装置。
  13. 前記再生手段は、前記補正手段によって補正された前記追尾情報に応じて、主被写体を含む領域を拡大して前記動画データの表示を行うことを特徴とする請求項12に記載の画像処理装置。
  14. 撮像手段と、
    前記撮像手段によって生成された動画データを表示する表示手段と、
    ユーザによる主被写体の指定に応じて、前記表示手段に表示された動画データにおける主被写体を設定する設定手段と、
    前記設定手段によって設定された主被写体を前記動画データにおいて追尾する追尾手段と、
    前記追尾手段による追尾の結果を示す追尾情報を前記動画データに付帯して記憶する記憶手段と、
    前記動画データに対して、ユーザによる第1の主被写体の指定が行われてから第2の主被写体の指定が行われるまでの少なくとも一部のフレーム画像における前記追尾情報を、前記第2の主被写体の指定に応じて設定された主被写体の追尾情報に基づいて補正する補正手段と、
    を有することを特徴とする撮像装置。
  15. ユーザによる主被写体の指定に応じて設定された主被写体の追尾情報が付帯された動画データに対して、ユーザによる第1の主被写体の指定が行われてから第2の主被写体の指定が行われるまでの少なくとも一部のフレーム画像における前記追尾情報を、前記第2の主被写体の指定に応じて設定された主被写体の追尾情報に基づいて補正する補正工程を、有することを特徴とする画像処理方法。
  16. 画像処理装置が有するコンピュータを、請求項1乃至13のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
JP2017142006A 2017-07-21 2017-07-21 画像処理装置、撮像装置、画像処理方法およびプログラム Pending JP2019022186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017142006A JP2019022186A (ja) 2017-07-21 2017-07-21 画像処理装置、撮像装置、画像処理方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017142006A JP2019022186A (ja) 2017-07-21 2017-07-21 画像処理装置、撮像装置、画像処理方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2019022186A true JP2019022186A (ja) 2019-02-07

Family

ID=65355840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017142006A Pending JP2019022186A (ja) 2017-07-21 2017-07-21 画像処理装置、撮像装置、画像処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2019022186A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021010079A (ja) * 2019-06-28 2021-01-28 キヤノン株式会社 画像提供システム、画像提供装置、制御方法及びプログラム
JP2021132286A (ja) * 2020-02-19 2021-09-09 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、コンピュータプログラム及び記憶媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021010079A (ja) * 2019-06-28 2021-01-28 キヤノン株式会社 画像提供システム、画像提供装置、制御方法及びプログラム
JP7366606B2 (ja) 2019-06-28 2023-10-23 キヤノン株式会社 画像提供システム、画像提供装置、制御方法及びプログラム
JP2021132286A (ja) * 2020-02-19 2021-09-09 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、コンピュータプログラム及び記憶媒体
JP7095002B2 (ja) 2020-02-19 2022-07-04 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、コンピュータプログラム及び記憶媒体
US11533425B2 (en) 2020-02-19 2022-12-20 Canon Kabushiki Kaisha Image processing apparatus and method for changing a priority category for objection detection
US12015847B2 (en) 2020-02-19 2024-06-18 Canon Kabushiki Kaisha Image processing apparatus for changing a priority category for object detection, image pickup apparatus, image processing method, and storage medium

Similar Documents

Publication Publication Date Title
US8253794B2 (en) Image processing apparatus and image display method
JP3773670B2 (ja) 情報呈示方法および情報呈示装置および記録媒体
JP2007072564A (ja) マルチメディア再生装置、メニュー操作受付方法およびコンピュータプログラム
JP6532361B2 (ja) 情報処理装置、制御方法及びプログラム
JP5550305B2 (ja) 撮像装置
CN111312133A (zh) 显示控制装置及其控制方法
JP5764005B2 (ja) 再生装置および再生方法
JP5312505B2 (ja) ゲーム装置、ゲーム装置の制御方法、及びプログラム
JP2019022186A (ja) 画像処理装置、撮像装置、画像処理方法およびプログラム
JP5317710B2 (ja) 画像処理装置、その制御方法、プログラム及び記録媒体
US7898566B2 (en) Video processing apparatus and object identifying method
JP5534857B2 (ja) 表示制御装置及び表示制御装置の制御方法
JP5733956B2 (ja) 撮像装置及びその制御方法、動画記録装置並びにその制御方法、プログラム、並びに記憶媒体
JP2018007082A (ja) 画像再生装置およびその制御方法およびプログラム
JP6355333B2 (ja) 撮像装置、画像処理装置、画像処理方法、プログラム
JP5856436B2 (ja) コンテンツ管理システム、記録装置、操作装置、およびそれらの制御方法、記憶媒体、プログラム
JP4363153B2 (ja) 撮影装置、その画像処理方法及びプログラム
JP6579925B2 (ja) 画像再生装置およびその制御方法ならびにプログラムならびに記録媒体
CN113261302B (zh) 电子装置
JP2012133459A (ja) 画像評価装置、及び方法、並びにプログラム、そのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2014109662A (ja) 表示制御装置及びその制御方法
CN114363521B (zh) 图像处理方法、装置及电子设备
JP7150590B2 (ja) 電子機器
JP7150591B2 (ja) 電子機器
US20200294552A1 (en) Recording device, recording method, reproducing device, reproducing method, and recording/reproducing device