JP2019185541A - Image processing apparatus, image processing method, and program - Google Patents
Image processing apparatus, image processing method, and program Download PDFInfo
- Publication number
- JP2019185541A JP2019185541A JP2018077730A JP2018077730A JP2019185541A JP 2019185541 A JP2019185541 A JP 2019185541A JP 2018077730 A JP2018077730 A JP 2018077730A JP 2018077730 A JP2018077730 A JP 2018077730A JP 2019185541 A JP2019185541 A JP 2019185541A
- Authority
- JP
- Japan
- Prior art keywords
- subject
- feature information
- image
- image processing
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、撮像された画像から被写体を検出、識別する技術に関する。 The present invention relates to a technique for detecting and identifying a subject from a captured image.
近年のデジタルカメラは、撮像素子から得られた画像データから被写体の検出及び追尾を行い、その被写体に対してピント、明るさ、色を好適な状態に合わせて撮影する機能を備えていることが一般的になっている。また、検出した被写体の中から個体を特定する方法として認識技術がある。特定の固体の認識は、検出した被写体各々が有する特徴情報を抽出し、その抽出した特徴情報と、予め用意された参照用の特徴情報とを比較し、それらが一致するかどうかの照合を行うことによって行われる。参照用の特徴情報は、一例として、認識対象として想定される被写体を事前にカメラにより撮影して特徴情報を抽出し、その特徴情報を不揮発性メモリ等に記憶(つまり登録)しておくことなどによって用意される。しかしながらこの場合、参照用の特徴情報を事前に用意して登録しておくという煩雑な作業が必要になる。また、認識対象として想定される被写体自体、あるいはその特徴情報を事前に用意できないというケースもある。 Recent digital cameras have a function of detecting and tracking a subject from image data obtained from an image sensor and photographing the subject according to a suitable state of focus, brightness, and color. It has become common. In addition, there is a recognition technique as a method for specifying an individual from detected objects. In recognition of a specific object, feature information of each detected subject is extracted, and the extracted feature information is compared with reference feature information prepared in advance to check whether or not they match. Is done by. For reference feature information, for example, a subject assumed as a recognition target is photographed in advance by a camera, feature information is extracted, and the feature information is stored (that is, registered) in a nonvolatile memory or the like. Prepared by. However, in this case, a complicated work of preparing and registering reference feature information in advance is required. There are also cases where the subject itself assumed as a recognition target or its characteristic information cannot be prepared in advance.
これに対し、特許文献1には、事前の登録作業を略々不要にする技術が開示されている。特許文献1に記載の技術では、撮影画像から検出した被写体の特徴情報を辞書データと比較した結果、未登録被写体かつ重要被写体条件を満たしていれば、一旦、仮辞書データとして記憶する。重要被写体と判定される条件としては、被写体を追跡した時間長や、主要な被写体として選択した回数などが用いられている。そして、その後の撮影行為で取得した撮影画像から検出した被写体の特徴情報が仮辞書データに記憶した特徴情報と一致した場合、その被写体の特徴情報が辞書データに本登録される。
On the other hand,
前述したように、特許文献1に記載の技術では、被写体を追跡した時間長や主要な被写体の選択回数が、重要被写体か否かを判定する条件となされている。しかしながら、撮影画像内に例えば複数の被写体が存在するケースや、画像内から重要被写体が消失したり他の被写体等により遮られたりするケースでは、そもそも撮影者の意図した被写体が重要被写体として判定されなくなる場合が多い。このため、特許文献1の技術は、追跡時間長や主要な被写体として選択された回数に基づいた重要被写体判定が成功する頻度が低いという問題がある。
As described above, in the technique described in
そこで、本発明は、撮像された画像から短時間かつ正確に被写体を抽出して認識可能にすることを目的とする。 Therefore, an object of the present invention is to make it possible to extract a subject accurately from a captured image in a short time and recognize it.
本発明の画像処理装置は、撮影された画像から被写体を検出する検出手段と、前記検出された被写体から特徴情報を抽出する抽出手段と、前記特徴情報を基に前記被写体の個体を認識する認識手段と、前記特徴情報をデータベースに登録する登録手段と、前記特徴情報を一次記憶する記憶手段と、を有し、前記認識手段は、前記被写体が画像から消失した後に検出された被写体から抽出された特徴情報と、前記一次記憶されている特徴情報とを照合して、前記画像から消失した後に検出された被写体が前記一次記憶された特徴情報の被写体かどうかの確認を行い、前記登録手段は、前記画像から消失した後に検出された被写体が前記一次記憶された特徴情報の被写体であると前記認識手段により確認され、前記一次記憶された特徴情報の被写体が撮影された際の画角と、前記画像から消失した後に検出された被写体が撮影された際の画角とが異なる場合に、前記被写体の特徴情報を前記データベースに登録することを特徴とする。 An image processing apparatus according to the present invention includes a detection unit that detects a subject from a captured image, an extraction unit that extracts feature information from the detected subject, and recognition that recognizes an individual of the subject based on the feature information. Means for registering the feature information in a database, and storage means for temporarily storing the feature information. The recognition means is extracted from a subject detected after the subject disappears from the image. The registered feature information is compared with the primary stored feature information to confirm whether the subject detected after disappearing from the image is the subject of the primary stored feature information. The recognition means confirms that the subject detected after disappearing from the image is the subject of the feature information stored primarily, and the subject of the feature information stored primarily is copied. The feature information of the subject is registered in the database when the angle of view when the image is taken differs from the angle of view when the subject detected after disappearing from the image is taken. .
本発明によれば、撮像された画像から短時間かつ正確に被写体を抽出して認識可能となる。 According to the present invention, a subject can be accurately extracted in a short time from a captured image.
以下に、本発明の好ましい実施形態を、添付の図面に基づいて詳細に説明する。
図1は、本実施形態の画像処理装置の一適用例である撮像装置(デジタルカメラ、以下、カメラ100とする。)の概略的な構成を示した図である。
レンズ10は外光を集光して光学像を撮像部20に結像させる。
メカ駆動回路16は、レンズ10を光軸方向に沿って駆動することで焦点調節や画角調節(ズーム動作)を行う。またメカ駆動回路16は、カメラブレに応じてレンズを光軸方向以外にも駆動することで手ぶれ補正を行うことも可能である。なお、手ぶれ補正は撮像部20を動かすことでも同様に実現可能である。手ぶれ補正を行う場合、システム制御部42は、例えば図示しない加速度センサや角速度センサ等の検出出力を基にカメラ100のぶれを検出し、そのカメラ100のぶれを相殺するような公知の補正制御を行う。
Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.
FIG. 1 is a diagram illustrating a schematic configuration of an imaging apparatus (digital camera, hereinafter referred to as a camera 100) which is an application example of the image processing apparatus of the present embodiment.
The
The
絞り13は口径を変化させる。NDフィルター14は光透過量を調節する。メカシャッター12は全閉により遮光する。これら絞り13、NDフィルター14、メカシャッター12は光量調節機構として設けられており、用途に応じて使い分けられ、レンズ10を通過した光の光量を調節する。
発光制御回路32は、システム制御部42による制御の下、ストロボユニット30の発光駆動および発光の制御を行う。
The
The light
レンズ10、光量調節機構(12,13,14)を通過した光は、撮像部20により受光される。撮像部20は、撮像駆動回路22からの駆動指示により動作し、受光素子への露光、露光時間の調節、露光した撮像信号の読み出し、読み出した撮像信号の増幅または減衰、撮像信号のA/D変換などを行う。撮像部20から出力された画像データは、画像処理回路40に入力されるか、あるいはRAM46に一時的に記憶される。
The light that has passed through the
画像処理回路40は、撮像部20から直接入力された画像データ、あるいはRAM46を経由して入力された画像データに対し、画像処理や画像解析など様々な処理を行う。撮影時の露出合わせ(AE:Auto Exposure)やピント合わせ(AF:Auto Focus)の際には、画像処理回路40は、撮像部20から順次出力される画像データから輝度成分や周波数成分を抽出してシステム制御部42に出力する。システム制御部42は、画像処理回路40からの輝度成分や周波数成分を評価値として用い、メカ駆動回路16や撮像駆動回路22を介してAE,AF動作を制御する。
The
また画像処理回路40は、撮像部20から取得した画像データを現像処理して画質を調節することができ、色合い、階調、明るさ、などを適切に設定して鑑賞に適した写真の画像データを生成する。画像処理回路40は、入力された画像の一部の切り出しや、画像の回転、画像の合成などの、各種画像処理を行うこともできる。また画像処理回路40では、入力された画像内から人物の顔などの被写体領域を検出することができ、画像内における人物の顔の位置、大きさ、傾き、顔の確からしさ情報などを得ることができる。さらに画像処理回路40は、検出した人物の顔の特徴情報を抽出し、特定の個人であるかどうか認識することができる。このような認識を行う場合、画像処理回路40は、予めROM48に記憶されている個人の特徴情報を読み出し、画像から抽出した人物の顔の特徴情報と比較することで、登録済みの個人と一致するか否かの一致判定処理を行う。また、画像処理回路40は、人物の顔の特徴の詳細な解析を行うことができ、例えばその人物の眼の特徴を解析して、その視線方向を検出するような視線検出処理も行うことができる。
The
表示装置50は、液晶デバイス(LCD)などからなり、例えば画像処理回路40で現像処理された画像を表示したり、文字やアイコンを表示したりすることができる。文字やアイコンの表示により、カメラ100のユーザ(使用者)に対して、各種情報の伝達が可能となる。
操作部44は、カメラ100のユーザにより操作され、このユーザ操作情報がシステム制御部42に入力される。システム制御部42は、操作部44からのユーザ操作情報に基づいて、例えばカメラ100の各部への電源投入、撮影モード切り替え、各種設定、撮影の実行、画像の再生など、カメラ100の各部の動作や信号処理を制御する。
The
The
外部メモリI/F52は、不図示のメモリソケット等を介して外部メモリ90が挿入され、その外部メモリ90とカメラ100とを接続する。カメラ100は、外部メモリI/F52を介して外部メモリ90と接続することにより、画像の授受やプログラムの取得等を行うことができる。
外部機器I/F54は、不図示の接続コネクタや無線通信等を介して外部機器92とカメラ100とを接続する。カメラ100は、外部機器I/F54を介して外部機器92と接続することにより、画像の授受や互いの機器を動作させるコマンド情報などのやり取り、プログラムの取得等を行うことができる。
The external memory I /
The external device I /
ROM48は書き換え可能な不揮発性メモリであり、カメラ100の各種設定値やプログラムを格納している。RAM46は、撮像部20にて撮像された画像データ、画像処理回路40による処理途中や処理後の画像データの一時記憶等を行う。また、RAM46には、ROM48から読み出されたプログラムが展開される。
システム制御部42は、ROM48から読み出されてRAM46に展開されたプログラムを実行し、カメラ100の前述した各部の制御や各種演算等を行う。
The
The
図2(a)と図2(b)は、本実施形態のカメラ100の概略的な外観図である。図2(a)はカメラ前面側を示し、図2(b)はカメラ背面側を示している。図2(a)に示すように、カメラ前面側にはレンズ10が配置されており、これによりカメラ100は被写体像を撮像することができる。またカメラ前面側にはストロボユニット30が配置されており、カメラ100は、主被写体が暗い場合にストロボユニット30を発光させることで十分な光量を得ることができ、暗い中でも速いシャッター速度を保ち、好適な画像を得ることができる。またカメラ100には、図1に示した操作部44における各操作部材200,202,210,220,222,224,226,228が配されている。個々の説明は省略するが、各操作部材は、操作ボタンや操作スイッチ、操作レバー等からなり、例えばカメラの電源投入、撮影モード切り替え、各種設定、撮影の実行、画像の再生などのユーザ操作時に使用される。一例として、操作部材200は電源ボタン、操作部材202はシャッターボタンである。その他、操作部材には、表示装置50のLCD画面上に配されたタッチパネルが含まれていてもよい。
2A and 2B are schematic external views of the
ここで、本実施形態のカメラ100は、撮像部20から得られた画像データを基に被写体を検出して追尾等を行い、その被写体に対してピント、明るさ、色を好適な状態に合わせて撮影する機能を有している。検出対象の被写体としては、一例として、人物の顔や人体、犬猫などの特定の動物などを挙げることができる。また、本実施形態のカメラ100は、それら検出した被写体の中から個体を認識して特定可能となされている。すなわち、本実施形態のカメラ100では、検出した被写体が有する特徴情報を抽出し、辞書データベースに登録されている特徴情報と比較・照合することにより個体の識別を行うことができる。
Here, the
認識対象となる被写体の特徴情報を用意しておく手法としては、一例として、図3に示すような手法が知られている。図3には、人物Aを認識対象である重要被写体として想定した例を挙げている。この例の場合、カメラ313の撮影画像から人物Aの被写体領域315を検出し、その被写体領域315から特徴情報を抽出し、その特徴情報を人物Aと関連付けて辞書データベース330に登録するような登録処理310が行われる。その後、例えばカメラ353によって、人物A、人物B、人物C等が撮影された場合、その撮影画像からそれぞれ人物Aの被写体領域355、人物Bの被写体領域357、人物Cの被写体領域359を検出してそれぞれ特徴情報を抽出する。そして、被写体領域355,357,359からそれぞれ抽出された特徴情報と、辞書データベース330の登録済みの特徴情報との一致判定を行うことにより、重要被写体である人物Aが写っているかどうかの認識処理350が行われる。なお、登録処理310に用いられるカメラ313とその後の認識処理350とで用いられるカメラ353とは同じカメラであってもよいし、それぞれ別のカメラであってもよい。また、撮影画像から被写体を検出して特徴情報を抽出し、その特徴情報を辞書データベース330に登録するまでの処理は、カメラ以外の画像処理装置等により行われてもよい。また、カメラ353が認識処理350に用いる辞書データベース330は、例えば着脱可能な記憶媒体を経由、あるいはネットワーク等を経由して取得されてもよい。また、辞書データベース330は、カメラのROM48内に設定されていても良いし、外部メモリ90内に設定されていても、あるいは、外部機器としての外部記憶装置に設定されていてもよい。
As an example of a method for preparing feature information of a subject to be recognized, a method as shown in FIG. 3 is known. FIG. 3 shows an example in which person A is assumed as an important subject to be recognized. In this example, the
このように、認識対象となる被写体の特徴情報をどのように用意しておくかについては様々な方式があるが、本実施形態では、カメラ100が撮影画像から被写体を検出して特徴情報を抽出し、辞書データベースに登録する場合を例に挙げて説明する。
詳細は後述するが、本実施形態のカメラ100は、撮影画像から被写体を検出し、その検出被写体が撮影者にとって重要な被写体である場合に、その重要被写体から抽出した特徴情報を辞書データベースに自動的に登録する機能を備えている。
As described above, there are various methods for preparing the feature information of the subject to be recognized. In this embodiment, the
Although details will be described later, the
以下、図4(a)および図4(b)と図5(a)および図5(b)とを用いて、被写体が撮影者にとって重要な被写体であるか否かの判定と、重要であると判定された被写体の特徴情報を辞書データベースに自動登録する処理の概要を説明する。
図4(a)と図4(b)は、撮影者によるカメラ100の画角操作の一例として、カメラ100をパンニングして画角を移動させるような画角操作が行われたケースを挙げた説明図である。
Hereinafter, it is important to determine whether or not the subject is an important subject for the photographer by using FIGS. 4 (a) and 4 (b) and FIGS. 5 (a) and 5 (b). The outline of the process of automatically registering the feature information of the subject determined to be in the dictionary database will be described.
FIG. 4A and FIG. 4B show a case where an angle-of-view operation that pans the
図4(a)は、カメラ100による撮影時の画角401の中に、ある人物が被写体403として写っている例を示している。被写体403は、例えば画角401の中央付近に位置しており、また画角401内において顔が占める大きさが一定以上となっていて、その顔がカメラ100に対して正面を向いているとする。この場合、被写体403の人物は、撮影者(ユーザ)が撮影対象として決めている人物である可能性が高く、したがってその被写体403は重要被写体である可能性が高いと考えられる。なお、人物の被写体403が画角401の中央付近に位置し、また画角401内において顔が占める大きさが一定以上で、かつ顔がカメラ100に対して正面を向いているかどうかの度合いは、公知の顔検出および認識技術等により算出可能である。
FIG. 4A shows an example in which a certain person is shown as a subject 403 in an angle of
辞書データベース415は、大容量の記憶媒体を有し、認識対象となる個人の特徴情報群、つまり撮影者にとって重要な被写体の複数の特徴情報を登録可能となされている。なお、辞書データベース415には、認識対象となる一人の人物の特徴情報群だけでなく、それぞれが認識対象となる複数の個人の特徴情報群が記憶されていてもよい。本実施形態の場合、例えば被写体403が撮影者にとって重要な被写体であれば、辞書データベース415には、その被写体403の特徴情報が、被写体403に関連した情報と紐付けられて登録される。
The
ここで本実施形態の場合、同じ被写体403の同じ特徴情報が重複登録されるのを避けるために、カメラ100は、先ず、被写体403の特徴情報と辞書データベース415に登録済みの特徴情報とを用い、重複確認のための認識処理413を行う。認識処理413において認識非成立であった場合、つまり辞書データベース415に登録されていないことが確認された場合、カメラ100は、被写体403の特徴情報を一次記憶メモリ419(例えばRAM46)に一次記憶させる仮登録処理を行う。また、カメラ100は、被写体403の特徴情報の仮登録と共に、その被写体403を撮影した時の画角情報についても一次記憶メモリ419に記憶させる。このように、仮登録処理の目的には、後述する本登録の自動化実現と共に、被写体403が重要被写体であるか否かが未だ判らない状況において、重複登録によって辞書データベース415の有限な容量が無駄に消費されてしまうのを避けることも含まれる。
Here, in this embodiment, in order to avoid the same feature information of the
図4(b)は、被写体403が画角401から消失する方向(フレームアウト方向405とする)に移動した場合に、撮影者がカメラ100を水平方向にパンニング操作409して画角を移動させて被写体を再び画角内に収めるようにした様子を示している。図4(b)に示した被写体407は、被写体403がフレームアウト方向405に移動した後の被写体を表している。ここで、移動した被写体407が撮影者にとって重要な被写体であった場合、撮影者は、被写体407を画角内に収めるようにカメラ100の向きを変えることで画角を移動させるような画角操作を行うことが想定される。
In FIG. 4B, when the subject 403 moves in a direction in which the subject 403 disappears from the angle of view 401 (referred to as a frame-out direction 405), the photographer moves the angle of view by performing a
図4(b)に示した画角411は、撮影者がカメラ100を水平方向にパンニング操作409するような画角操作を行うことにより、被写体407を再び画角内に収めた様子を表している。図4(b)のように、被写体407が画角401内から一時的に消失した後、パンニング操作409により画角を移動させる画角操作が行われた後に再び検出された被写体407は、撮影者にとって重要な被写体である可能性がさらに高まったと考えられる。たたしこの時点でも、被写体407が重要被写体であるかどうかは未だ確定していない。
An angle of
このため、カメラ100は、撮影者による画角移動の操作が行われた後の画角411で取得された撮影画像から被写体407が再検出された場合、その被写体407が撮影者にとって重要な被写体かどうかを確認するための認識処理433を行う。カメラ100は、認識処理433において、先ず、再検出された被写体407の撮影時の画角情報と、一次記憶メモリ439(RAM46)に仮登録されている被写体403の撮影時の画角情報とから、画角を移動させる操作が行われたか否か判定する。また、カメラ100は、画角を移動させる画角操作が行われたと判定し、その画角移動後に被写体407を検出した場合、その被写体407の特徴情報を抽出する。さらに、カメラ100は、画角移動後に検出された被写体407から抽出した特徴情報と、一次記憶メモリ439に仮登録されている被写体403の特徴情報とを比較し、それら被写体407と被写体403が同一かどうかを確認する認識処理433を行う。そして、認識処理433で認識成立となった場合、つまり再検出された被写体407が一次記憶メモリ439に仮登録されていた場合、カメラ100は、その被写体407を重要被写体と判定する。その後、カメラ100は、被写体407の特徴情報もしくは被写体403の一次記憶されている特徴情報と、それら被写体407もしくは403の関連情報とを紐付けて、辞書データベース435に本登録する。詳細については後述するが、本実施形態の場合、特徴情報が有する信頼度に基づいて、それら被写体407の特徴情報と被写体403の特徴情報のいずれを辞書データベース435に本登録するかを決定する。
Therefore, when the subject 407 is re-detected from the photographed image acquired at the angle of
このように、本実施形態のカメラ100は、仮登録された被写体が消失等した後、被写体が再検出された際に、被写体の特徴情報と共に画角情報をも合わせた認識処理を行うことにより、重要被写体かどうかの確認を行う。これにより、本実施形態のカメラ100は、撮影者が意図して被写体を写そうとしていることを高い確率で推測でき、その重要な被写体の特徴情報を辞書データベースに自動登録することができる。
As described above, the
なお、画角移動の操作による画角の移動量や移動速度が非常に大きい場合には、被写体407が重要な被写体である可能性が低いと考えることもでき、この場合には確認のための認識処理433を行わないようにしてもよい。また、ここでは画角を移動させる画角操作の例として、カメラ100の向きを水平方向(左右方向)に動かすパンニング操作に挙げたが、画角移動の操作はこの例には限定されない。画角移動の操作は、例えばカメラ100の向きを垂直方向(上下方向)に動かすチルティング操作であってもよい。また、画角移動の操作は、カメラ100をレンズ10光軸に対して回転させるロール方向等の操作であってもよい。またそれらパンニング、チルティング、ロールが組み合わされた操作であってもよい。カメラ100に対してパンニング、チルティング、ロール等の操作が行われたかどうかについては、例えば公知の加速度センサや角速度センサ、方位センサ等の出力に基づく検出技術により判定可能である。すなわちカメラ100は、加速度センサや角速度センサ、方位センサ等の出力を基に、撮影前後のカメラの移動方向と移動量を算出し、それらの情報を基に、画角を移動させる操作が行われたかどうかを判定できる。その他にも、撮影画像から公知の動きベクトル検出を行う技術を用いても判定可能である。
Note that when the amount of movement and the movement speed of the angle of view by the operation of moving the angle of view are very large, it can be considered that the subject 407 is unlikely to be an important subject. In this case, for confirmation The
図5(a)と図5(b)は、撮影者によるカメラ100の画角操作の一例として、カメラのズーム操作により画角を変更する操作、あるいはカメラを被写体に対して遠近方向に移動させることにより画角を変更する操作が行われた場合を挙げた説明図である。
FIGS. 5A and 5B show an example of an angle of view operation of the
図5(a)は、図4(a)と同様に示した図であり、撮影時の画角501の中に、人物が被写体503として写っている例を示している。被写体503は、前述の被写体403と同様に、画面中央付近に位置し、画角内で顔が占める大きさが一定以上で、顔がカメラ100に対して正面を向いているとする。この図5(a)の例の場合も図4(a)と同様に、被写体503は重要被写体である可能性が高いと考えられる。この場合も前述同様に、カメラ100は、被写体503の特徴情報と辞書データベース515に登録済みの特徴情報とを用いて重複確認のための認識処理513を行い、重複しない場合には被写体503の特徴情報を一次記憶メモリ519に記憶する仮登録を行う。また、カメラ100は、被写体503の特徴情報の仮登録と共に、その被写体503を撮影した時の画角情報についても一次記憶メモリ519に記憶させる。
FIG. 5A is a view similar to FIG. 4A, and shows an example in which a person is shown as a subject 503 in an angle of
図5(b)は、図4(b)の例と同様に、被写体503の人物が画角501から消失するフレームアウト方向505に移動した様子を表しており、被写体507はフレームアウト方向505に移動した後の被写体を表している。また画角511は、被写体507のフレームアウト後に、ワイド(Wide)方向にズーム操作がなされて広くなされた画角、あるいは撮影者がカメラを被写体から遠ざけることで、被写体507が収まるようになされた画角を表している。言い換えると、画角511は、画角501に対してより広い範囲を写すことができる画角である。図5(b)に示すように、被写体507がフレームアウトした後、ズーム操作やカメラの移動などで画角を変更する操作がなされた後に、再び検出された被写体507は、撮影者にとって重要な被写体である可能性がさらに高まったと考えられる。ただしこの時点でも、被写体503が重要被写体であるかどうかは未だ確定していない。
FIG. 5B shows a state in which the person of the subject 503 moves in the frame-out
このため、カメラ100は、撮影者により画角を変更する画角操作が行われた後の画角511で取得された撮影画像から被写体507が再検出された場合、それが撮影者にとって重要な被写体かどうかを確認するための認識処理533を行う。この認識処理533において、カメラ100は、先ず、再検出された被写体507の撮影時の画角情報と、一次記憶メモリ539に仮登録されている被写体503の撮影時の画角情報とから、画角を変更する操作が行われたか否か判定する。また、カメラ100は、画角を変更する画角操作が行われたと判定し、その画角変更後に被写体507を検出した場合、その被写体507の特徴情報を抽出する。さらに、カメラ100は、画角変更後に検出された被写体507から抽出した特徴情報と、一次記憶メモリ539に仮登録されている被写体503の特徴情報とを比較し、それら被写体507と被写体503が同一かどうかを確認する認識処理533を行う。そして、認識処理533で認識成立となった場合、つまり再検出された被写体507が一次記憶メモリ539に仮登録されていた場合、カメラ100は、その被写体507を重要被写体と判定する。その後、カメラ100は、被写体507もしくは被写体503の特徴情報と、当該被写体507もしくは被写体503の関連情報とを紐付けて、辞書データベース535に本登録する。この例の場合も、後述するように、特徴情報が有する信頼度に基づいて、それら被写体507の特徴情報と被写体503の特徴情報のいずれを辞書データベース535に本登録するかを決定する。
For this reason, the
図5(a)および図5(b)の例も前述同様に、カメラ100は、仮登録された被写体の消失等の後、再検出され被写体の特徴情報と共に画角情報をも用いた認識処理を行うことにより、重要被写体かどうかの確認を行う。これにより、カメラ100は、撮影者が意図して被写体を写そうとしていることを高い確率で推測でき、その被写体の特徴情報を辞書データベースに自動登録することができる。
In the example of FIG. 5A and FIG. 5B as well, the
なお、画角変更の操作による画角の変更量や変更の速度が非常に大きい場合には、被写体507が重要な被写体である可能性が低いと考えることもでき、この場合には確認のための認識処理533を行わないようにしてもよい。また、ズーム操作によって画角を変更するような画角操作が行われたかどうかは、レンズ10を駆動するメカ駆動回路16の制御情報を基に判定可能である。すなわちカメラ100は、例えばシステム制御部42がメカ駆動回路16を制御してレンズ10の焦点距離(ズーム倍率)を変化させた際の制御値を基に、撮影者がカメラ100の画角を意図的に変化させる画角操作を行ったかどうかを判定できる。また、カメラを被写体に対して遠近方向に移動させることで画角を変更する操作が行われたかどうかは、例えば公知の加速度センサや角速度センサ、方位センサ等の出力に基づく検出技術により判定可能である。すなわちカメラ100は、例えば加速度センサや角速度センサ、方位センサ等の出力を基に、撮影前後のカメラの移動方向と移動量を算出し、それら移動方向と移動量を基にカメラを遠近方向に移動させる画角変更の操作が行われたかどうかを判定できる。その他にも、撮影画像から公知の動きベクトル検出を行う技術を用いても判定可能である。
Note that if the amount of change in the angle of view and the speed of change due to the operation of changing the angle of view are very large, it can be considered that the subject 507 is unlikely to be an important subject. The
また、前述の例では、画角を移動させる画角操作の例と、画角によって写る範囲を変更する画角操作の例を別々に説明したが、これら画角移動と画角変更の各画角操作が組み合わされて略々同時に行われた場合にも本実施形態は適用可能である。 In the above example, the example of the angle of view operation for moving the angle of view and the example of the angle of view operation for changing the range captured by the angle of view are described separately. The present embodiment can also be applied when corner operations are combined and performed substantially simultaneously.
ここで、前述の図4(a)および図4(b)、図5(a)および図5(b)で説明したような処理を実現するためには被写体の特徴情報の抽出および認識処理が必要であるが、その前に、先ず撮影画像内から被写体を検出する必要がある。また、撮影画像内には複数の被写体が存在するケース、被写体同士が交差するケース、被写体が消失/復帰するケースなど、多くのケースが生ずることが想定されるため、効率的に認識処理の実施とその認識処理結果の管理を行う必要がある。 Here, in order to realize the processing described with reference to FIGS. 4A, 4B, 5A, and 5B, subject feature information is extracted and recognized. Before that, it is necessary to first detect the subject from the captured image. In addition, since it is assumed that there are many cases such as a case where a plurality of subjects exist in a captured image, a case where subjects cross each other, and a case where subjects disappear / return, it is possible to efficiently perform recognition processing. It is necessary to manage the recognition processing result.
図6(a)〜図6(c)は、撮影により取得された画像内から検出した被写体に識別情報(顔IDとする)を割り振る発番処理を行うことで、複数の被写体を管理している様子を示している。各画像には時系列順にフレーム番号n,n+1,n+2,・・・が付けられているとする。
図6(a)は、フレーム番号nの画像600から3人の被写体が検出できているケースを表しており、カメラ100は、これら3人の被写体に対してそれぞれ顔ID(ID0,ID1,ID2)を発番(割り振り)し、それら顔IDによって各被写体を管理する。また、図6(a)の例ではフレーム番号n+1の画像601とフレーム番号n+2の画像602の間で被写体の移動があったとする。この場合、カメラ100は、前フレームと現フレーム間で各被写体の相対的な位置関係の変化や各被写体のサイズ関係の変化に基づいて、移動前後の被写体が同一の被写体(同一人物)であるかの判定を行い、同一の被写体である場合には同じ顔IDを発番する。例えば、フレーム番号n+1の時点において、顔ID2の人物の特徴情報が辞書データベースに格納してある特徴情報と一致した場合、カメラ100は、顔ID2の人物を登録済みの特定の個人として認識する。その後、顔ID2の人物が特定の個人でありつづける状態を保つには、継続的に認識処理を行い続ける必要があるが、顔IDを発番して管理しておくことでその必要性はなくなる。このようにフレーム番号n+1の画像602の時点で確定した認識結果と顔ID2を紐づけて管理していれば、フレーム番号n+3の画像603の時点であっても、顔ID2の人物は過去に認識された人物であることが分かる。
6 (a) to 6 (c) manage a plurality of subjects by performing a numbering process for assigning identification information (referred to as face ID) to subjects detected from within an image acquired by photographing. It shows how it is. Assume that frame numbers n, n + 1, n + 2,.
FIG. 6A shows a case where three subjects can be detected from the
図6(b)は、フレーム番号nの画像630から2人の人物(顔ID3と顔ID4)が検出できている状態を表しており、その後、フレーム番号n+1の画像631からフレーム番号n+2の画像632の間に2人の人物が交差したケースを示している。顔ID3と顔ID4の人物が互いに近寄り交差した瞬間、手前側の被写体は継続して検出できるが、後ろ側の被写体は手前側の被写体により遮られることになる。図6(b)の例では、顔ID3の人物が手前側であり、顔ID4の人物が後ろ側であるとする。この場合、手前側の顔ID3の人物は遮られずに検出できるため、顔ID3を保つことができるが、後ろ側の顔ID4の人物は遮られたことでIDの連続性が失わるため、遮られた後に検出された人物には別の顔ID5を発番する。なお、遮られる時間が短くかつ、遮られた後に再出現した場所が近いなど、所定の条件が満たされる場合には顔ID4を継続することも可能ではあるが、フレーム番号n+2の画像632のように別の顔IDを発番するケースもある。この場合、同一人物であっても別の顔IDを発番するため、別の人物として扱われる。
FIG. 6B shows a state in which two persons (
図6(c)は、フレーム番号nの画像650から1人の人物(顔ID6)が検出できている状態を表しておる。そして、その後、フレーム番号n+1の画像651で顔ID6の人物が画角内からフレームアウトし、さらにその後のフレーム番号n+2の画像652で再出現したケースを示している。フレーム番号n+1の画像651で顔ID6が発番された人物は、その後、フレーム番号n+2の画像652でフレームインしてきた際には顔ID7が発番される。この図6(c)のようにフレームアウト後にフレームインとなった場合、顔ID6の人物が再出現したケースと、別の人物が出現したケースの両方が考えられため、新しい顔ID7の発番は正しい場合と誤りの場合がある。
FIG. 6C shows a state in which one person (face ID 6) can be detected from the
図6(a)〜図6(c)に示したように顔IDを発番することで、各個人の情報管理を実現しやすくなると言うメリットがある。
しかしながら、図6(a)、図6(b)、図6(c)のいずれのケースにおいても、顔IDの発番は万能では無く、同一人物であっても異なる顔IDを発番するケースが発生し得る。
As shown in FIGS. 6A to 6C, there is an advantage that it becomes easy to realize information management of each individual by issuing the face ID.
However, in any of the cases shown in FIGS. 6 (a), 6 (b), and 6 (c), the face ID is not universal, and different face IDs are issued even for the same person. Can occur.
図7は、画像内から検出した被写体における関連情報の管理テーブルを示しており、カメラ100は、この管理テーブルを内部で保持している。管理テーブルには、被写体の関連情報を格納する領域として、顔ID情報欄703、サイズ情報欄705、位置情報欄707、個人認識情報欄709、優先順情報欄701が用意されている。顔ID情報欄703には前述した顔IDが格納される。サイズ情報欄705には、それぞれの被写体の大きさをピクセル数で表すサイズ情報が格納される。位置情報欄707には、画像内における各被写体の位置を表す座標情報が格納される。個人認識情報欄709には被写体の人物の各個人の認識情報が格納される。優先順情報欄701には、それぞれ顔IDの被写体の重要度を表す情報が格納される。管理テーブルでは、優先順情報欄701における重要度の順にソートすることで、重要度の順の行730,731,732,733,・・・に分けて、顔IDに対応した被写体のサイズ情報、位置情報、個人認識情報を管理可能となされている。重要度は、例えば撮影者の意図と一致していることが最も望ましく高い重要度となされ、その撮影者の意図については、被写体のサイズ、位置、個人認識の成否などの要素に基づいて設定することができる。なお、管理テーブルで管理される情報のうち、顔ID、サイズ情報、位置情報は、画像内における被写体の存在を表す情報であり、例えばAF時のピント合わせやAE時の露出合わせの制御に用いられる。また、個人認識情報は、辞書データベースの情報を用いた認識処理を行った結果、認識が成立して特定できた個人を示す情報であり、顔IDと共に管理テーブルにより管理される。このため、管理テーブル上で、どの被写体が、認識が成立したのか、あるいは認識が成立していないのかを、容易に知ることが可能となる。
FIG. 7 shows a management table of related information on the subject detected from the image, and the
図8は、辞書データベース内の構造例を示した概念図である。
図8において、辞書データベース801は、例えば電源供給が停止されても記憶を続ける不揮発性メモリが記憶媒体として用いられ、図1のカメラ100の例ではROM48内に辞書データベース用の領域が用意されている。なお、辞書データベース801は、外部メモリ90内に実体を持つ構成であってもよい。
FIG. 8 is a conceptual diagram showing an example of the structure in the dictionary database.
In FIG. 8, the
辞書データベース801には、管理情報803が格納されている。管理情報803には、登録されている被写体の数(人数)やそれらの格納場所、被写体ごとに登録された特徴情報の数やそれらの格納場所など、全体の構成を示す情報が格納されている。また、管理情報803には、概念として、その下にツリー状に各個人情報811,821,831,・・・が格納され、さらにその下に各特徴情報813,815,817,・・・,823,825,・・・,833,835,・・・が格納されている。
これらの個人情報には、それぞれの個人情報の内容情報861として、名前情報863、誕生日情報865、グループ情報867、その他情報869等の任意の情報を格納可能となっている。個人情報の用途としては、例えば、辞書データベースに登録されている人物を優先的にAFの対象としたり、その個人に最適な撮影パラメータを適用したり、例えば個人Aと個人BでAF対象とする優先度に差を付けたりすることなどが挙げられる。その他にも、個人情報の用途としては、例えば、個人情報に基づいて様々な撮影アプリケーションを作成したり、撮影画像を閲覧する際に個人の名前を検索キーとして画像を絞り込んだりする再生機能のアプリケーションを作成したりすることなども挙げられる。
In these personal information, arbitrary information such as name information 863,
また各特徴情報には、特徴情報の内容情報881として、被写体の実際の特徴情報833、特徴情報の生成に使用した画像情報885、特徴情報が生成された画像の撮影時刻等の情報887、その他情報889等の任意の情報を格納可能となっている。個人認識の照合アルゴリズムによっては、同一人物を異なる条件で撮影して登録したほうが認識の性能が向上するものがあるため、1人当たり複数の特徴情報の登録が可能な構成となっている。また、特徴情報を生成した際に使用した画像情報885を格納しておくことで、登録した特徴情報をユーザが視覚的に確認することが可能となる。また、人物の特徴情報は、該当人物の成長、加齢などによって変化していくため、定期的に更新される。このため、特徴情報生成に用いた画像がいつ得られたのかを表す情報887を格納しておくことにより、更新の目安とすることができる。
Each feature information includes, as
図9は、前述した一次記憶メモリ内の構造の一例を示した概念図である。一次記憶メモリ901は、例えば装置への電源供給に依存する揮発性メモリを媒体としており、本実施形態の場合は図1のRAM46に相当する。
図9に示すように、一次記憶メモリ901には、管理情報903が格納される。一次記憶メモリ901における管理情報903には、一次記憶されている特徴情報の数とそれらの格納場所の情報が格納されており、概念として、その下にツリー状に各特徴情報911,913,915,917,・・・が格納される。
FIG. 9 is a conceptual diagram showing an example of the structure in the primary storage memory described above. The
As shown in FIG. 9,
一次記憶メモリ901の特徴情報には、特徴情報の内容情報931として、実際の特徴情報933、顔ID932、特徴情報の生成時に使用した画像情報935、特徴情報の生成に用いた画像の撮影時点の画角情報937と時刻情報939などが格納される。画角情報としては、レンズ10のズーム位置のようにメカ機構から得られる情報、電子ズームやアスペクト設定のように電子的な切り出しにより得られる情報、加速度センサなどの出力を基にパンニングの変化を相対的に表現した情報などを格納可能となっている。
The feature information in the
図10、図11、図12、図13には、本実施形態のカメラ100のシステム起動、撮影画像からの被写体の検出、認識状況の判定、認識処理から登録までの各処理のフローチャートを示す。これら各フローチャートの処理は、ハードウェア構成により実行されてもよいし、CPU等が実行するプログラムに基づくソフトウェア構成により実現されてもよく、一部がハードウェア構成で残りがソフトウェア構成により実現されてもよい。CPU等が実行するプログラムは、例えばROM48等に格納されていてもよいし、外部メモリ90等の記録媒体から取得されてもよく、或いは不図示のネットワーク等を介して取得されてもよい。以下の説明では、各処理のステップS101〜ステップS465をS101〜S465と略記する。
10, 11, 12, and 13 are flowcharts of each process from system activation of the
図10は、本実施形態のカメラ100におけるシステム起動後の全体の処理の流れを示したフローチャートである。
カメラ100は、電源ボタン(200)が押下されて主電源がオンされると、S101において図10のフローチャートの処理を開始する。そして、S103において、カメラ100ではシステム起動処理が行われる。ここでは、カメラシステムが動作するに必要なCPUやLSI等への電源供給、クロック供給をはじめ、メモリやOSの初期化など、基本システムの起動が行われる。
FIG. 10 is a flowchart showing the overall processing flow after system startup in the
When the power button (200) is pressed and the main power is turned on, the
次にS105において、システム制御部42は、撮像部20内のCCDやCMOS等の撮像素子の起動、メカ駆動回路16を介してレンズ10のフォーカスレンズやズームレンズ等の鏡筒系デバイスの起動を行う。これにより、メカシャッター12や絞り13が動作し、撮像部20の撮像素子に外光が導かれる。また、システム制御部42は、撮像駆動回路22を介して撮像部20の撮像素子や増幅器、A/D変換器等の撮像系デバイスの駆動を開始する。
Next, in S105, the
そしてこの状態で、システム制御部42は、S113においてAE駆動を開始し、S111においてAF駆動を開始して、撮影対象に対して適切な明るさ、ピントになるように制御し続けていく。このときS201において、システム制御部42は、画像処理回路40による被写体の検出および認識処理も合わせて開始させる。また、システム制御部42は、画像処理回路40にて検出された被写体情報をAFやAEに利用することで、被写体のピントや明るさをより適切になるように調節することができる。またこれと同時期に、画像処理回路40では、表示装置50に出力するライブ画像の現像処理も開始され、これにより撮影者はライブビュー映像を表示装置50の画面上で確認することが可能となる。これはすなわちファインダー用途としての要件を満たした状態であり、撮影者は撮影対象を捕えて画角調節などのフレーミング作業を行うことができる。
In this state, the
次にS121において、システム制御部42は、撮影者によって操作部44のシャッターボタン(202)のいわゆる半押し操作(SW1がオン)がなされたか否かを判定する。システム制御部42は、SW1がオンされていない(オフ)の場合にはS111、S113、S201に処理を戻し、SW1がオンされた場合にはS123においてAFに適した露出にするためのAF用のAE制御を行う。そして、システム制御部42は、AFに適した露出になされた後に、S125において、例えば静止画用のいわゆるワンショットAF(One Shot AF)制御を行う。
In step S121, the
次に、SW1のオンによる撮影準備が終わった後、システム制御部42は、S131において、シャッターボタンのいわゆる全押し(SW2がオン)がなされたか否かを判定する。システム制御部42は、SW2がオンされず、SW1もオフである場合にはS111、S113、S201に処理を戻し、SW2がオンされた場合にはS151において、カメラ100による静止画撮影を実行させる。
Next, after completion of shooting preparation by turning on SW1, the
図11、図12、図13は、図10のS201における被写体の検出および認識処理の動作の詳細を示すフローチャートである。
図11は、図6(a)〜図6(c)で説明した顔IDの発番処理の流れを示したフローチャートである。システム制御部42は、カメラにおける顔検出および顔認識機能が有効に設定されている状態で画像が撮影されると、S201において、画像処理回路40に対し図11のフローチャートに示す顔ID発番処理を開始させる。
11, FIG. 12, and FIG. 13 are flowcharts showing the details of the operation of subject detection and recognition processing in S201 of FIG.
FIG. 11 is a flowchart showing the flow of the face ID numbering process described with reference to FIGS. 6 (a) to 6 (c). When an image is captured in a state where the face detection and face recognition functions of the camera are set to be effective, the
顔ID発番処理を開始すると、画像処理回路40は、先ずS203において、撮像素子の駆動周期で生成された画像を入力として顔検出を行う。画像処理回路40は、一度の顔検出処理により画像内から複数の顔を検出することが可能となっている。そして、画像処理回路40は、以降の顔ID発番処理を、S203で検出した顔数の回数だけ繰り返す。このため、S205において、画像処理回路40は、検出した顔数と発番した顔IDの数countとを比較し、発番した顔IDの数countが検出した顔数未満であるか否かを判定する。そして、画像処理回路40は、発番した顔IDの数countが検出した顔数未満である場合にはS207に処理を進め、発番した顔IDの数countが検出した顔数以上になった場合にはS215に処理を進める。
When the face ID numbering process is started, the
S207に進むと、画像処理回路40は、前回の顔検出結果oldと今回の顔検出結果の対象顔とを比較し、前回の顔位置及び顔サイズ情報を用いて、それらの連続性の評価を行う。そして、画像処理回路40は、S209において、今回の顔検出結果の対象顔が前回の顔検出結果oldにおける顔であるか、あるいは、今回新たに見つかった顔であるかを判定する。画像処理回路40は、S209において新たに見つかった新規顔であると判定した場合にはS211に処理を進め、新規顔でない既知顔が引き続き見つかったと判定した場合にはS213に処理を進める。
In step S207, the
S211に進むと、画像処理回路40は、新規顔に対して新しい顔IDを発番した後、数countの値をインクリメントしてS203に処理を戻す。ここで発番した顔IDは、図7に示した管理テーブルの顔ID情報欄703に格納される。一方、S213に進んだ場合、画像処理回路40は、前回の顔検出で発番された顔IDを継続させて、数countの値をインクリメントしてS203に処理を戻す。
前述の処理が各検出顔について繰り返され、発番した顔IDの値countが検出した顔数以上になったことでS203からS215に進むと、画像処理回路40は、次の顔検出のために、顔検出結果oldに今回の顔検出結果を保存する。その後、顔ID発番処理は一旦終了し、次の撮影画像について顔検出と顔ID発番が行われる際には再び図11のフローチャートの処理が開始される。
In step S211, the
The above processing is repeated for each detected face, and when the issued face ID value count exceeds the number of detected faces, the process proceeds from S203 to S215, where the
図12は、検出された顔に対して認識処理を行うべきか否かを判定する認識状況判定処理の流れを示したフローチャートである。システム制御部42は、カメラにおける顔検出および顔認識機能が有効に設定されている状態で画像が撮影されると、S301において、画像処理回路40に対し図12のフローチャートに示す認識状況判定処理を開始させる。
FIG. 12 is a flowchart showing the flow of recognition status determination processing for determining whether or not recognition processing should be performed on a detected face. When an image is shot with the face detection and face recognition functions set to effective in the camera, the
前述の顔ID発番処理と同様に、認識状況判定処理においても、複数の顔が検出されている場合には、それら検出された顔数の回数だけ処理が繰り返される。このため、認識状況判定処理を開始すると、画像処理回路40は、先ずS303において、前述のS205と同様に、検出した顔数と発番した顔IDの数countとを比較し、発番した顔IDの数countが検出した顔数未満であるか否かを判定する。そして、画像処理回路40は、発番した顔IDの数countが検出した顔数未満である場合にはS305に処理を進める。
Similarly to the face ID numbering process described above, in the recognition status determination process, if a plurality of faces are detected, the process is repeated as many times as the number of detected faces. For this reason, when the recognition state determination process is started, first, in S303, the
S305に進むと、画像処理回路40は、図7に示した管理テーブルと顔IDとを基に、検出された顔が、新規に見つかった顔であるか、または既に見つかっている既知の顔であるかどうかを判定する。そして、新規顔と判定した場合、画像処理回路40は、S307において、その新規顔に関しては認識処理が未だ行われていないものとして扱い、後述する図13の認識処理の対象とした後、数countの値をインクリメントしてS303に処理を戻す。一方、既知の顔と判定した場合、画像処理回路40は、S309において、既知の顔に関しては認識処理が既に実施されているものとして扱うようにし、S311に処理を進める。
In step S305, the
ここで、既知の顔の場合、認識処理をやり直したほうが良い場合があるため、S311に進むと、画像処理回路40は、既知の顔について認識処理をやり直したほうが良いかどうかを判定する再実施判定処理を行う。例えば、前述した図6(b)のケースのように、人物同士が接近して交差した場合など、発番した顔IDに誤りが生じる懸念があり、顔IDに誤りがあると、それに関連して管理されている認識情報も誤りを持つこととなる。このため、画像処理回路40は、人物同士の接近や交差が発生した場合、S311において、顔IDとしては既知の人物であっても、その既知の顔について認識処理をやり直したほうが良いと判定し、S313に処理を進める。
Here, in the case of a known face, it may be better to repeat the recognition process. Therefore, when the process proceeds to S <b> 311, the
S313に進むと、画像処理回路40は、その既知の顔について、後述する図13の認識処理を再実施する対象とし、その後、数countの値をインクリメントしてS303に処理を戻す。
一方、S311において、認識処理を再実施する対象としないと判定した場合、画像処理回路40は、数countの値をインクリメントしてS303に処理を戻す。
そして、発番した顔IDの数countが検出した顔数以上になった場合、画像処理回路40は図12の認識状況判定処理を一旦終了させ、次の撮影画像について認識状況判定が行われる際には再び図12のフローチャートの処理が開始される。
In step S313, the
On the other hand, if it is determined in S311 that the recognition process is not to be performed again, the
When the number of issued face IDs count is equal to or greater than the detected number of faces, the
図13は、図12のフローチャートにおいて認識処理の対象となされた顔に対する認識処理と、一次記憶メモリに仮登録された情報を用いた重要被写体登録処理の流れを示すフローチャートである。システム制御部42は、カメラにおける顔検出および顔認識機能が有効に設定されていて、認識処理の対象が存在する場合、S401とS451において、画像処理回路40に対し図13のフローチャートに示す認識処理と重要被写体登録処理を開始させる。これら認識処理と重要被写体登録処理は並行して行われる。
FIG. 13 is a flowchart showing the flow of the recognition process for the face that is the target of the recognition process in the flowchart of FIG. 12 and the important subject registration process using the information temporarily registered in the primary storage memory. When the face detection and face recognition functions in the camera are set to be effective and there is a recognition process target, the
認識処理のフローチャートから説明する。
S403において、画像処理回路40は、検出した顔ごとに特徴情報の生成を行う。特徴情報の生成処理は、顔検出、目鼻口といった器官の検出、器官に基づいた特徴情報の生成というステップで行われる。たたし、途中の検出精度が低い場合には特徴情報が生成できないか、精度の低い特徴情報しか生成できないことになる。また、重複登録によって辞書データベースの容量が無駄に消費されてしまうのを避けることが望ましい。
The flowchart of the recognition process will be described.
In S403, the
このため、S405において、画像処理回路40は、生成した特徴情報について、辞書データベースに登録済みの特徴情報と比較することによる照合を行う。例えば前述の図8に示したように、辞書データベースには複数人、かつ1人当たり複数の特徴情報が格納可能であるため、画像処理回路40は、S405において、それら複数の情報との照合を順次行う。
For this reason, in S405, the
画像処理回路40は、照合した結果を類似度として数値で表し、S407において、その類似度が所定の閾値を超える場合には認識成立と判定する。そして、S407において認識成立と判定した場合、画像処理回路40は、S409において、認識結果を確定する。また、画像処理回路40は、認識成立した人物が複数存在する場合には最も類似度の高い人物を採用する。
The
一方、S407において類似度が閾値以下と判定した場合、すなわち辞書データベースに登録されている何れの情報とも照合が成立しなかった場合、画像処理回路40は、認識非成立と判定して、S411に処理を進める。そして、S411において、画像処理回路40は、認識対象となった顔の特徴情報を、一次記憶メモリ(RAM46)に仮登録する。またこのとき、画像処理回路40は、特徴情報と共に、顔ID、特徴情報を生成した元画像を撮影した際の画角情報、及び時刻情報とについても仮登録しておく。
そして、これらS409、S413の後、画像処理回路40は図13の認識処理を一旦終了させ、次の撮影画像について認識処理が行われる際には再び図13の認識処理が開始される。
On the other hand, if it is determined in S407 that the degree of similarity is equal to or less than the threshold value, that is, if any information registered in the dictionary database is not verified, the
Then, after these S409 and S413, the
次に重要被写体登録処理のフローチャートについて説明する。重要被写体登録処理は、一次記憶メモリに仮登録された特徴情報が重要被写体の特徴情報であるかどうかを判定し、重要被写体である場合には辞書データベースに本登録を行う処理である。
画像処理回路40は、先ずS453において被写体から特徴情報を生成する。S453では、特徴情報と共に、顔IDの発番、特徴情報を生成した元画像を撮影した際の画角情報、及び時刻情報の取得も行われる。
Next, a flowchart of important subject registration processing will be described. The important subject registration process is a process for determining whether or not the feature information provisionally registered in the primary storage memory is the feature information of the important subject and, if it is an important subject, performing the main registration in the dictionary database.
In step S453, the
次に、画像処理回路40は、S453で生成した各情報と、前述した認識処理で生成して一次記憶メモリに仮登録している各情報とを用いて、S455、S457,S459,S461,S463の各比較処理に基づく判定処理を順次行う。
Next, the
S455において、画像処理回路40は、S453で発番した顔IDと、仮登録された顔IDを比較する。例えば図6(b)、図6(c)に示したように遮りやフレームアウトによって一旦顔が消失し、再び出現した場合、消失する前後で別の顔IDが発番されていることになる。したがって、この顔IDの発番の仕組みを利用し、顔IDが同一であれば同一人物として、この重要被写体判定から除外する。すなわち画像処理回路40は、顔IDが異なる場合にはS457に処理を進め、顔IDが同一である場合には重要被写体登録処理を終了する。
In S455, the
S457に進むと、画像処理回路40は、S453で取得した画角情報と、仮登録されている画角情報とを比較し、それら画角情報の差を用いた判定処理を行う。ここで、画角情報の差が所定差未満である場合、S453で特徴情報を生成した顔の人物は、前述した画角の移動や画角の変更等の画角操作が行われていないのに、画角内に侵入してきた新たな人物であると推測される。このため、画像処理回路40は、S457において画角情報の差が所定差未満であると判定した場合には、重要被写体判定から除外する。一方、S455で異なる顔IDと判定され、かつS457で画角情報の差が所定差以上で、かつ所定の範囲内であると判定された場合には、画角操作を行うことで対象の人物を画角内に収めようとした可能性が高いと判断できる。このため、画像処理回路40は、S457において、画角情報の差が所定差以上でかつ所定の範囲内であると判定した場合には、次の時間差判定処理に進む。すなわち画像処理回路40は、S457で画角情報に差がないと判定した場合には重要被写体登録処理を終了し、一方、画角情報に差がある場合にはS459に処理を進める。
In step S457, the
S459に進むと、画像処理回路40は、S453で取得した時刻情報と、仮登録されている時刻情報とを比較し、それら時刻情報の差を用いた判定処理を行う。S455の判定処理とS457の判定処理を通過してS459に進んだ場合であっても、一次記憶メモリに仮登録してから長時間が経過している場合には、撮影者が被写体を探そうとする行為を行っていない可能性が高いと考えられる。このため、画像処理回路40は、S459において、それら時刻情報の時間差が所定時間範囲外であると判定した場合には重要被写体登録処理を終了する。一方、画像処理回路40は、S459において、時刻情報の時間差が所定時間範囲内であると判定した場合にはS461に処理を進める。
In step S459, the
S461に進むと、画像処理回路40は、S453で生成した特徴情報と、仮登録されている特徴情報との照合を行い、認識が成立するかどうかを判定する。そして、画像処理回路40は、認識が成立しない場合には重要被写体登録処理を終了し、一方、認識が成立した場合にS463に処理を進める。
In step S461, the
S463に進むと、画像処理回路40は、特徴情報に対する信頼度判定を行い、その判定結果を基に辞書データベースへの本登録処理を行う。すなわち、登録可能な特徴情報は、最新のものと、過去に一次記憶メモリに仮登録したものとがあるため、画像処理回路40は、それら両者を比較してより信頼度が高いものを本登録する。
In step S463, the
図14(a)〜図14(c)は、条件によって信頼度に差が出る傾向について説明するための図である。図14(a)は、画像内において被写体Aと被写体Bの顔の大きさが異なっている例を示しており、顔の大きさが大きいほど信頼度(信頼性)が高く、小さいほど信頼性が低いことを示している。図14(b)は、画像内において被写体Aと被写体Bの顔の向きが異なる例を示しており、被写体の顔が正面を向く度合いが高いほど信頼性が高く、横を向くほど信頼性が低いことを示している。図14(c)は、画像内において被写体Aと被写体Bの顔の目鼻口の器官が遮られているかどかの例を示しており、目鼻口の器官が遮られていないほど信頼性が高く、目鼻口のいずれかの器官が遮られているほど信頼性が低いことを示している。例えば前述の図4に示したパンニングのケースでは、パンニングの前後で被写体自体には大きな差が無いため、より新しい被写体であるパンニング後に生成できた特徴情報を登録に用いたほうがよいことが想定される。また例えば前述の図5に示したズーム操作のケースでは、ズーム操作の前後で被写体の大きさに差があり、より被写体が大きいズーム操作前の方が、特徴情報の信頼性が高く登録に適している。本実施形態の画像処理回路40では、これらのようにして信頼度を決定し、その信頼度の高い被写体の特徴情報を辞書データベースに本登録する。
FIG. 14A to FIG. 14C are diagrams for explaining a tendency that the reliability varies depending on conditions. FIG. 14A shows an example in which the sizes of the faces of the subject A and the subject B are different in the image. The larger the face size, the higher the reliability (reliability), and the smaller the reliability. Is low. FIG. 14B shows an example in which the orientations of the faces of the subject A and the subject B are different in the image. The higher the degree that the subject's face is facing the front, the higher the reliability is; It is low. FIG. 14 (c) shows an example of whether the eyes, nose and mouth organs of the faces of the subject A and the subject B are blocked in the image, and the reliability is so high that the eyes and nose are not blocked. The obstruction of any organ of the eyes and nose mouth indicates that the reliability is low. For example, in the case of the panning shown in FIG. 4 described above, there is no great difference in the subject itself before and after panning, so it is assumed that it is better to use feature information generated after panning that is a newer subject for registration. The Further, for example, in the case of the zoom operation shown in FIG. 5 described above, there is a difference in the size of the subject before and after the zoom operation, and before the zoom operation with a larger subject, the feature information is more reliable and suitable for registration. ing. In the
以上説明したように、本実施形態においては、撮影者が被写体を画角内に捕え続けようとする操作に基づいて重要被写体の判定を行うようになされている。このため、本実施形態によれば、画面内に複数の被写体が存在しているケースや、被写体の遮りや消失が発生するケースのような厳しい条件下においても、短時間かつ確実性の高い重要被写体抽出を行うことができる。すなわち、本実施形態によれば、被写体が重要であるか否かを、撮影者による画角操作に基づいて判定することにより、的確に重要被写体を抽出して、自動的に登録することが可能となる。 As described above, in the present embodiment, an important subject is determined based on an operation in which the photographer tries to keep the subject within the angle of view. For this reason, according to the present embodiment, even under severe conditions such as a case where there are a plurality of subjects in the screen or a case where the subject is blocked or disappeared, it is important that the time is short and highly reliable. Subject extraction can be performed. That is, according to the present embodiment, it is possible to accurately extract an important subject and automatically register it by determining whether the subject is important based on a view angle operation by the photographer. It becomes.
なお前述の説明では、画像処理回路40において被写体の検出および認識処理が行われる例を挙げたが、これらの処理はシステム制御部42が本実施形態に係るプログラムを実行することにより実現されてもよい。また、一部が画像処理回路40により実行され、残りがプログラムを基にシステム制御部42により実行されてもよい。
In the above description, an example in which subject detection and recognition processing is performed in the
また前述した実施形態では、画像処理装置の適用例としてデジタルカメラ等を挙げたが、この例には限定されず他の撮像装置にも適用可能である。例えば、デジタルカメラだけでなく、カメラ機能を備えたスマートフォンやタブレット端末などの各種携帯端末、各種の監視カメラ、工業用カメラ、車載カメラ、医療用カメラなどにも本実施形態は適用可能である。 In the embodiment described above, a digital camera or the like has been described as an application example of the image processing apparatus. However, the present invention is not limited to this example, and can be applied to other imaging apparatuses. For example, this embodiment can be applied not only to digital cameras but also to various portable terminals such as smartphones and tablet terminals having camera functions, various monitoring cameras, industrial cameras, in-vehicle cameras, medical cameras, and the like.
以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。上述の実施形態の一部を適宜組み合わせてもよい。また、上述の実施形態の機能を実現するソフトウェアのプログラムを、記録媒体から直接、或いは有線/無線通信を用いてプログラムを実行可能なコンピュータを有するシステム又は装置に供給し、そのプログラムを実行する場合も本発明に含む。従って、本発明の機能処理をコンピュータで実現するために、該コンピュータに供給、インストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明の機能処理を実現するためのコンピュータプログラム自体も本発明に含まれる。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。プログラムを供給するための記録媒体としては、例えば、ハードディスク、磁気テープ等の磁気記録媒体、光/光磁気記憶媒体、不揮発性の半導体メモリでもよい。また、プログラムの供給方法としては、コンピュータネットワーク上のサーバに本発明を形成するコンピュータプログラムを記憶し、接続のあったクライアントコンピュータはがコンピュータプログラムをダウンロードしてプログラムするような方法も考えられる。 Although the present invention has been described in detail based on preferred embodiments thereof, the present invention is not limited to these specific embodiments, and various forms within the scope of the present invention are also included in the present invention. included. A part of the above-described embodiments may be appropriately combined. Also, when a software program that realizes the functions of the above-described embodiments is supplied from a recording medium directly to a system or apparatus having a computer that can execute the program using wired / wireless communication, and the program is executed Are also included in the present invention. Accordingly, the program code itself supplied and installed in the computer in order to implement the functional processing of the present invention by the computer also realizes the present invention. That is, the computer program itself for realizing the functional processing of the present invention is also included in the present invention. In this case, the program may be in any form as long as it has a program function, such as an object code, a program executed by an interpreter, or script data supplied to the OS. As a recording medium for supplying the program, for example, a magnetic recording medium such as a hard disk or a magnetic tape, an optical / magneto-optical storage medium, or a nonvolatile semiconductor memory may be used. As a program supply method, a computer program that forms the present invention is stored in a server on a computer network, and a connected client computer downloads and programs the computer program.
10:レンズ、20:撮像部、40:画像処理部、42:システム制御部、44:操作部、46:RAM、48:ROM、50:表示装置 10: Lens, 20: Imaging unit, 40: Image processing unit, 42: System control unit, 44: Operation unit, 46: RAM, 48: ROM, 50: Display device
Claims (14)
前記検出された被写体から特徴情報を抽出する抽出手段と、
前記特徴情報を基に前記被写体の個体を認識する認識手段と、
前記特徴情報をデータベースに登録する登録手段と、
前記特徴情報を一次記憶する記憶手段と、を有し、
前記認識手段は、前記被写体が画像から消失した後に検出された被写体から抽出された特徴情報と、前記一次記憶されている特徴情報とを照合して、前記画像から消失した後に検出された被写体が前記一次記憶された特徴情報の被写体かどうかの確認を行い、
前記登録手段は、前記画像から消失した後に検出された被写体が前記一次記憶された特徴情報の被写体であると前記認識手段により確認され、前記一次記憶された特徴情報の被写体が撮影された際の画角と、前記画像から消失した後に検出された被写体が撮影された際の画角とが異なる場合に、前記被写体の特徴情報を前記データベースに登録する
ことを特徴とする画像処理装置。 Detection means for detecting a subject from the captured image;
Extracting means for extracting feature information from the detected subject;
Recognition means for recognizing an individual of the subject based on the feature information;
Registration means for registering the feature information in a database;
Storage means for primarily storing the feature information,
The recognizing unit compares the feature information extracted from the subject detected after the subject disappears from the image with the feature information stored in the primary storage, and detects the subject detected after disappearing from the image. Confirm whether or not the subject of the primary stored feature information,
The registration unit confirms that the subject detected after disappearing from the image is the subject of the feature information stored in the primary storage by the recognition unit, and the subject of the feature information stored in the primary storage is captured. An image processing apparatus, wherein when the angle of view is different from the angle of view when a subject detected after disappearing from the image is photographed, the feature information of the subject is registered in the database.
前記認識手段は、前記画像から消失する前の前記被写体の識別情報と、前記画像から消失した後に検出された被写体の識別情報とが異なる場合に、前記照合と前記確認を行うことを特徴とする請求項1または2に記載の画像処理装置。 The detection means attaches identification information to the detected subject,
The recognizing unit performs the matching and the confirmation when the identification information of the subject before disappearing from the image is different from the identification information of the subject detected after disappearing from the image. The image processing apparatus according to claim 1.
撮影された画像から被写体を検出する検出工程と、
前記検出された被写体から特徴情報を抽出する抽出工程と、
前記特徴情報を基に前記被写体の個体を認識する認識工程と、
前記特徴情報をデータベースに登録する登録工程と、
前記特徴情報を一次記憶する記憶工程と、を有し、
前記認識工程では、前記被写体が画像から消失した後に検出された被写体から抽出された特徴情報と、前記一次記憶されている特徴情報とを照合して、前記画像から消失した後に検出された被写体が前記一次記憶された特徴情報の被写体かどうかの確認を行い、
前記登録工程は、前記画像から消失した後に検出された被写体が前記一次記憶された特徴情報の被写体であると前記認識工程により確認され、前記一次記憶された特徴情報の被写体が撮影された際の画角と、前記画像から消失した後に検出された被写体が撮影された際の画角とが異なる場合に、前記被写体の特徴情報を前記データベースに登録する
ことを特徴とする画像処理方法。 An image processing method executed by an image processing apparatus,
A detection step of detecting a subject from the captured image;
An extraction step of extracting feature information from the detected subject;
A recognition step of recognizing an individual of the subject based on the feature information;
A registration step of registering the feature information in a database;
A storage step of temporarily storing the feature information,
In the recognition step, the feature information extracted from the subject detected after the subject disappears from the image is compared with the feature information stored in the primary storage, and the subject detected after disappearing from the image is detected. Confirm whether or not the subject of the primary stored feature information,
In the registration step, the recognition step confirms that the subject detected after disappearing from the image is the subject of the feature information stored in the primary storage, and the subject of the feature information stored in the primary storage is photographed. An image processing method comprising: registering feature information of the subject in the database when the angle of view is different from the angle of view when the subject detected after disappearing from the image is captured.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018077730A JP2019185541A (en) | 2018-04-13 | 2018-04-13 | Image processing apparatus, image processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018077730A JP2019185541A (en) | 2018-04-13 | 2018-04-13 | Image processing apparatus, image processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019185541A true JP2019185541A (en) | 2019-10-24 |
Family
ID=68341428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018077730A Pending JP2019185541A (en) | 2018-04-13 | 2018-04-13 | Image processing apparatus, image processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019185541A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023512135A (en) * | 2020-12-28 | 2023-03-24 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Object recommendation method and device, computer equipment and medium |
-
2018
- 2018-04-13 JP JP2018077730A patent/JP2019185541A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023512135A (en) * | 2020-12-28 | 2023-03-24 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Object recommendation method and device, computer equipment and medium |
JP7316453B2 (en) | 2020-12-28 | 2023-07-27 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Object recommendation method and device, computer equipment and medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8284257B2 (en) | Image pick-up apparatus and tracking method therefor | |
US7672580B2 (en) | Imaging apparatus and method for controlling display device | |
JP5159515B2 (en) | Image processing apparatus and control method thereof | |
JP4640456B2 (en) | Image recording apparatus, image recording method, image processing apparatus, image processing method, and program | |
EP2757771B1 (en) | Image pickup apparatus, remote control apparatus, and methods of controlling image pickup apparatus and remote control apparatus | |
US11812132B2 (en) | Imaging device, control method therefor, and recording medium | |
US8411159B2 (en) | Method of detecting specific object region and digital camera | |
JP5279635B2 (en) | Image processing apparatus, image processing method, and program | |
CN108141525A (en) | Smart image sensors with integrated memory and processor | |
US10163222B2 (en) | Image capturing apparatus, tracking device, control method, and storage medium | |
US7466356B2 (en) | Method and apparatus for setting a marker on an object and tracking the position of the object | |
CN109451240B (en) | Focusing method, focusing device, computer equipment and readable storage medium | |
WO2019104569A1 (en) | Focusing method and device, and readable storage medium | |
JP2020053774A (en) | Imaging apparatus and image recording method | |
JP2019185541A (en) | Image processing apparatus, image processing method, and program | |
TWI485505B (en) | Digital camera and image capturing method thereof | |
JP2003348428A (en) | Photographing system, photographing method, photographing program, and computer-readable recording medium having the photographing program recorded thereon | |
CN105467741A (en) | Panoramic shooting method and terminal | |
CN112995503B (en) | Gesture control panoramic image acquisition method and device, electronic equipment and storage medium | |
JP7342883B2 (en) | Imaging control device, imaging device, imaging control method | |
JP2019197295A (en) | Image processing device, image processing method, and program | |
CN111464734A (en) | Method and device for processing image data | |
JP2019041414A (en) | Electronic apparatus, imaging apparatus, and program | |
JP2018014659A (en) | Imaging apparatus | |
JP2023074369A (en) | Image processor, imaging apparatus, control method and program |