JP6362085B2

JP6362085B2 - 画像認識システム、画像認識方法およびプログラム

Info

Publication number: JP6362085B2
Application number: JP2014105506A
Authority: JP
Inventors: 祐一常松
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2014-05-21
Filing date: 2014-05-21
Publication date: 2018-07-25
Anticipated expiration: 2034-05-21
Also published as: US9721153B2; US10146992B2; CN105095853A; US20150339523A1; CN105095853B; US20170286758A1; JP2015219879A

Description

本発明は、画像認識システム、画像認識方法およびプログラムに関し、特に、過去に得られた画像に対する画像認識処理を行うために用いて好適なものである。

近年、ネットワークカメラで録画した画像を認識し、認識した結果から得られる付加情報をシステム・サービスに活用しようというニーズが増大している。例えば、特定の人物の検索や、被写体の属性（性別・年齢など）の推定や、人体が移動した軌跡の表示等のユースケースが存在する。こうしたシステムを実現するために必要な画像処理、特徴検出、認識等の公知の技術は、非特許文献１で網羅的にまとめられている。また、特許文献１では、動きベクトルから物体を検出し、その検出の結果から、次の画像での探索位置を推定し、テンプレートマッチングにより物体の追尾を行う手法が開示されている。

リアルタイムで取得する画像に対しての画像認識だけではなく、録画済みの過去の画像に対する再度の認識処理を行いたいケースも発生する。特許文献２では、新規に登録された人物を、過去に録画された画像から検索することをバッチ処理で行う技術が記載されている。過去に録画された画像の数は、撮影する画像のフレームレートやサイズ、並びに、処理をかける期間に応じて大きく膨れ上がってしまう。そこで、特許文献２では、リアルタイム処理時に画像間の変化量をあらかじめ計算しておき、再処理時には所定以上の変化が認められた領域にのみ認識処理を行う。

また、人の顔を検索するシステムだけに限らず、他の画像認識システムでも、録画された画像に対する再処理はよく行われる。例えば、人物の検索・同定を身長・性別・服装等の属性情報を使って行うシステムの場合、１つの撮影対象から抽出すべき属性情報は多岐にわたる。抽出する属性の数分の画像認識処理を、１つの領域に対して行うことになるため、全ての被写体に対して全ての属性情報を漏れなくリアルタイムで抽出することができないケースが発生する。このような場合には、必要に応じて過去に録画された画像に対して必要な属性を都度検出することになる。
画像認識システムを構築した場合、死角ができないように複数台のネットワークカメラを配置することが一般的である。ＰＣを使って画像認識処理を行うのであれば、少ない機器でより多くのネットワークカメラに対応できることが望ましい。

特開２００２−３７３３３２号公報特許第５１９３９４４号公報

Richard Szeliski著、コンピュータビジョン -アルゴリズムと応用-、共立出版、２０１３年３月

画像認識処理のスピードがどれだけ高速であっても、過去に録画された画像に対して再処理を行う場合には、処理量・処理時間が非常に大きくなることを避けることが容易ではない。例えば１秒間に１０枚の画像を録画する場合、１分間で６００枚、１時間で３６０００枚の画像が取得される。ネットワークカメラが１０台あれば過去１時間の画像に対する再処理を行うだけでも、３６０万枚の画像を処理しなければならない。

また、身長・性別・服装といった属性のように、求めたい画像認識結果が複数存在する場合、処理時間が長くなってしまう。例えば、１人に対して２０の属性を検出する場合、１つの属性の検出に５０ｍｓｅｃ要すると仮定すると、１人の認識処理を終えるのに１秒を要する。

そこで、本発明は、画像の再認識処理に要する処理量および処理時間を削減することを目的とする。

本発明の画像認識システムは、画像を取得する画像取得手段と、前記画像に写し出されている物体の検出の結果に対する信頼度を前記物体ごとに導出する導出手段と、複数の画像における同一の物体に対する前記信頼度を比較し、比較した結果に基づいて、画像の再認識処理に用いる画像を登録する登録手段と、を有することを特徴とする。

本発明によれば、画像の再認識処理に要する処理量および処理時間を削減することができる。

ネットワークシステムの構成を示す図である。ネットワークシステムの機能的な構成を示す図である。画像認識前提条件算出部の処理を説明するフローチャートである。画像認識前提条件算出部における算出結果を示す図である。再処理推奨領域算出部の処理を説明するフローチャートである。更新前の再処理推奨領域算出部における算出結果を示す図である。過去の画像における物体の写り方、スコア、及び領域を示す図である。更新後の再処理推奨領域算出部における算出結果を示す図である。認識対象と、当該認識対象である際の考慮事項との関係を示す図である。

以下、図面を参照して、本発明の一実施形態を詳細に説明する。尚、以下の実施形態において示す構成は一例に過ぎず、図示された構成に限定されるものではない。
図１は、ネットワークシステム（画像認識システム）の構成の一例を示す図である。
図１において、ネットワークカメラ１００、ネットワークストレージ装置２００、画像認識サーバ装置３００、および画像表示装置４００は、ネットワーク回線の一例であるＬＡＮ５００を介して相互に接続される。

ネットワークカメラ１００は、撮像装置の一例である。ネットワークカメラ１００は、撮影対象を撮影すると同時に、撮影した画像に対して、物体検知、追尾、および顔認識等の画像認識処理を行う機能を有する。
ネットワークストレージ装置２００は、記録装置の一例である。ネットワークストレージ装置２００は、ネットワークカメラ１００で撮影された画像データや、ネットワークカメラ１００内で行われた画像認識処理の結果を、ＬＡＮ５００を介して受信して記録する。

画像認識サーバ装置３００は、ネットワークストレージ装置２００に記録された過去の画像データに対して画像認識処理を行う。画像表示装置４００は、ネットワークストレージ装置２００に記録された画像データに、画像認識処理の結果を重畳して、ネットワークストレージ装置２００に記録された画像データの再生を行う。また、画像表示装置４００は、人物の検索等の諸操作を行うための入力手段を提供する機能も有する。

図２は、ネットワークシステム（ネットワークカメラ１００および画像認識サーバ装置３００）の機能的な構成の一例を示すブロック図である。具体的に図２では、ネットワークカメラ１００で第１の画像認識処理を行うための機能的な構成と、画像認識サーバ装置３００で第２の画像認識処理を行うための機能的な構成の一例を示す。

第１の画像取得部１１０は、ＣＭＯＳ等の撮像素子から得られたデジタル電気信号に対して、所定の画素補間処理や色変換処理を行い、ＲＧＢやＹＵＶ等のデジタル画像を現像・生成する。また、第１の画像取得部１１０は、現像を施した後のデジタル画像に対してホワイトバランス、シャープネス、コントラスト、色変換等の画像補正処理を行う。

物体追尾部１２０は、第１の画像取得部１１０から取得されるデジタル画像を処理し、時間軸方向の複数の画像にまたがって登場する同一の物体に対して一意なＩＤを付与する。物体は人体、動体、または車でもよい。同一の物体に対して一意なＩＤを付与する詳細な処理手順は、例えば、特許文献１の手法を適用することができる。

画像認識前提条件算出部１３０は、物体追尾部１２０で検出された物体（同一のＩＤが付与された物体）ごとに、画像認識の前提条件を満たすか否かを算出する。図３は、画像認識前提条件算出部１３０の処理の一例を説明するフローチャートである。尚、以下に説明する画像認識処理の詳細は、例えば、非特許文献１の第１４章認識の内容を適用することができる。

ステップＳ３０１において、画像認識前提条件算出部１３０は、未処理のＩＤが割り振られた物体があるか否かを判定する。この判定の結果、未処理のＩＤが割り振られた物体が存在する場合、図３のフローチャートによる処理を終了し、物体の写り具合を以降の処理で算出する。未処理のＩＤが割り振られた物体が存在する場合、画像認識前提条件算出部１３０は、未処理のＩＤのうちの１つを選択し、当該ＩＤが割り振られた物体についてステップＳ３０２〜Ｓ３０８の処理を行う。
本実施形態では、具体的には、顔が映っているか、上半身が写っているか、全身が写っているか、といった物体の撮像範囲を確認することにより物体の写り具合を判定する。
そこで、画像認識前提条件算出部１３０は、ステップＳ３０２において足元の検出を行い、ステップＳ３０４において人体の検出を行い、ステップＳ３０５において顔の検出を行う。顔が写っているかどうかは、例えば、顔の検出ができたか否かにより判断される。上半身が写っているかどうかは、例えば、顔の検出と人体の検出とができたか否かにより判断される。全身が写っているかどうかは、例えば、顔の検出と、人体の検出と、足元の検出とができたか否かにより判断される。そこで、図３に示す例では、ステップＳ３０８において、画像認識前提条件算出部１３０は、物体の写っている領域を検出する。

画像認識処理の結果には、認識対象の方向に依存するものもある。このため、画像認識前提条件算出部１３０は、顔・上半身・全身のそれぞれについて各画像で向いている方向を検出する。図３に示す例では、画像認識前提条件算出部１３０は、ステップＳ３０３において人体が向いている方向の検出を行い、ステップＳ３０７において顔が向いている方向の検出を行う。尚、画像認識前提条件算出部１３０は、先に行っている物体の追尾の結果を参照し、前の画像と現在の画像とを比較して、顔や人体がどの方向に移動しているかを求め、当該方向を顔、人体が向いている方向として代用してもよい。

画像認識前提条件算出部１３０は、それぞれの検出の際に、検出時のスコアを同時に得る。そこで、本実施形態では、このスコアを持って、望ましい映り方をしているか否かを数値化する。顔にまつわる属性情報の検出では、目・鼻・口といった顔を構成する器官の検出に成功していることを条件とするものがある（以下の説明では、顔を構成する器官を必要に応じて顔器官と称する）。このため、図３に示す例では、画像認識前提条件算出部１３０は、ステップＳ３０６において、顔に対してだけ顔検出処理を行って、顔の各顔器官の検出を行い、各顔器官の検出結果のスコアを算出する。

また、画像認識前提条件算出部１３０は、顔認識を行って、顔認識の結果のスコアを算出することもできる。顔認識を行う場合、画像認識前提条件算出部１３０は、例えば、顔器官の検出結果から特徴点を導出する。
尚、スコアは、物体の各部位または全体の検出結果や認識結果の信頼度の一例である。具体的に説明すると、例えば、予め登録されている物体の各部位または全体の情報（ライブラリ）と、検出結果・認識結果との類似度をスコアとすることができる。ライブラリとの比較をせずに、既に検出・認識されている内容と、今回の検出・認識した結果との比較を行い、これらの類似度をスコアとして算出してもよい。

スコアとして、この他に、画像に写っている物体の検出領域の面積（画素数）を使う方法がある。面積が大きい方が、より大きく写っていると考えられ、大きく写っている方が認識に適していると考えられる。そこで、図４に示すように、本実施形態では、画像認識前提条件算出部１３０は、顔の外接矩形領域のサイズである被写体顔サイズと、全身の外接矩形領域のサイズである被写体全身サイズとを算出する。

また、画像認識前提条件算出部１３０は、これらの値に所定の係数をかけて足し合わせる等、これらの値を組み合わせてスコアを導出してもよい。以上の処理を各画像に対して実施すると、各ＩＤに対して図４に示すような結果が得られる。図４は、１つの画像の１つの物体に対する画像認識前提条件算出部１３０における算出結果の一例を表形式で示す図である。図４において、顔撮像スコアは、顔を検出したときに得られるスコアである。人体撮像スコアは、人体を検出したときに得られるスコアである。

また、図４に示すように、本実施形態では、画像認識前提条件算出部１３０は、顔の外接矩形領域の座標である被写体顔座標と、全身の外接矩形領域の座標である被写体全身座標とを算出する。尚、以下の説明では、被写体顔座標と被写体全身座標を総称する場合には、これら被写体顔座標と被写体全身座標を必要に応じて被写体座標と称する。
以上の処理により、第１の画像取得部１１０で取得された画像に写し出される各物体（各ＩＤ）の属性が得られる。

再処理推奨領域算出部１４０は、画像認識前提条件算出部１３０の処理が終わると、現在最も再処理に適しているとされている画像を、最後に処理した画像と比較して、再処理推奨領域の更新を行う。図５は、再処理推奨領域算出部１４０の処理の一例を説明するフローチャートである。図６は、１つの物体に対する再処理推奨領域算出部１４０における算出結果の一例を表形式で示す図である。図５のフローチャートは、同一のＩＤの物体ごとに個別に行われる。

ステップＳ５０１において、再処理推奨領域算出部１４０は、未比較の認識前提条件の項目があるか否かを判定する。認識前提条件は、物体の属性を認識するために必要な前提条件であり、画像認識前提条件算出部１３０の算出結果から得られるものである。物体が人体である場合、図６に示す例では、認識前提条件の複数の項目として、図６の認識前提条件の欄に示される項目（例えば「体の向き−正面」、「顔の向き−正面」等）が予め設定される。尚、図６に示すように、認識前提条件を構成する各項目は、画像における物体の写り方により定められる。

この判定の結果、未比較の認識前提条件の項目がない場合には、図５のフローチャートによる処理を終了する。
一方、未比較の認識前提条件の項目がある場合には、ステップＳ５０２に進む。ステップＳ５０２に進むと、再処理推奨領域算出部１４０は、未選択の認識前提条件の１つを選択する。

次に、ステップＳ５０３において、再処理推奨領域算出部１４０は、現在最も再処理に適しているとされている画像との比較に用いるスコアであって、ステップＳ５０２選択した認識前提条件に対応するスコアを算出する。このスコアは、例えば、画像認識前提条件算出部１３０の算出結果を用いて算出される。ステップＳ５０３で算出されるスコアは、物体の各部位または全体の確からしさを評価する評価値の一例である。

図６に示す例では、再処理推奨領域算出部１４０は、体の向きのスコアを、図３のフローチャートにおいて人体を検出した時のスコアとして導出する。また、再処理推奨領域算出部１４０は、顔の向きおよび顔の写り具合のスコアを、図３のフローチャートにおいて顔を検出したときのスコアとして導出する。また、再処理推奨領域算出部１４０は、写っている領域のスコアを、図３のフローチャートにおいて当該写っている領域を検出したときのスコアとして導出する。例えば、写っている領域が、全身、上半身以上、顔である場合には、それぞれ、人体、人体、顔を検出したときのスコアが採用される。尚、図３のフローチャートで算出されたスコアを、そのまま利用する場合には、ステップＳ５０３で改めてスコアを算出しなくてもよい。

図６において、推奨画像の欄には、再処理の際に使用する画像として推奨される画像の画像番号が格納される。また、推奨処理領域には、認識前提条件の項目に対応する被写体座標が格納される。図６に示す例では、認識前提条件の項目が、体の向きである場合と、写っている領域−全身・上半身以上である場合、推奨処理領域には、被写体全身座標が格納される。一方、認識前提条件の項目が、顔の向きである場合と、顔の写り具合である場合と、写っている領域−顔である場合と全身・上半身以上である場合には、推奨処理領域には、被写体顔座標が格納される。

次に、ステップＳ５０４において、再処理推奨領域算出部１４０は、ステップＳ５０３で算出したスコアと、現在最も再処理に適しているとされている画像のスコアであって、ステップＳ５０２で選択した認識前提条件に対応するスコアとを比較する。ここでは、ステップＳ５０３で算出したスコアが、現在最も再処理に適しているとされている画像のスコアであって、ステップＳ５０２で選択した認識前提条件に対応するスコアよりも大きいか否かを判定する。この判定の結果、ステップＳ５０３で算出したスコアが、現在最も再処理に適しているとされている画像のスコアであって、ステップＳ５０２で選択した認識前提条件に対応するスコアよりも大きくない場合には、ステップＳ５０１の処理に戻る。

一方、ステップＳ５０３で算出したスコアが、現在最も再処理に適しているとされている画像のスコアであって、ステップＳ５０２で選択した認識前提条件に対応するスコアよりも大きい場合には、ステップＳ５０５に進む。
ステップＳ５０５に進むと、再処理推奨領域算出部１４０は、ステップＳ５０２で選択した認識前提条件の項目の内容を、今回第１の画像取得部１１０で取得された画像の内容に変更して更新する。そして、ステップＳ５０１の処理に戻る。
以上の処理により、各ＩＤにおける認識前提条件の項目の内容が得られる。

図７は、過去の画像に写し出されている物体の写り方、スコア、及び領域（被写体座標）の一例を示す図である。尚、図７では、図４における被写体顔サイズおよび被写体全身サイズの図示を省略する。また、図７では、被写体座標として、顔と人体のうち検出に成功した領域の被写体座標のみを示す。

過去の画像認識処理において、図７に示す４つの画像が、再処理に適した画像であると判断されているとする。また、これら４つの画像に対する再処理推奨領域算出部１４０における算出の結果が図６に示すものであるとする。この場合、再処理推奨領域算出部１４０は、図４と図６とを比較することにより、認識前提条件の各項目の内容を、図６に示す内容から図８に示す内容に更新する。図８において、背景がグレーのセルが更新された項目であり、下線の値が更新された値である。再処理に適した画像（推奨画像）は、スコアが最も良いもの１つを残してもよいし、スコアが所定の差に収まる場合は、複数の画像を再処理に適した画像として残してもよい。また、スコアが良い順に所定の数の画像を再処理に適した画像として残してもよい。図８では、スコアが最も良い（高い）ものを全て推奨画像とする場合を例に挙げて示す。

図２の説明に戻り、記録部１５０は、配信・保存を行うために、取得した画像データに対して圧縮・符号化を施す。配信用の圧縮方式は、例えば、MPEG4、H.264、MJPEGまたはJPEG等の規格に基づく。さらに、記録部１５０は、mp4やmov等のファイル形式で画像データのファイル化を行う。各物体の再処理推奨領域、およびファイル化された画像圧縮データは、ＬＡＮ５００を介してネットワークストレージ装置２００、または画像認識サーバ装置３００へ送信される。これらの装置は、例えば、NFSやCIFS等のネットワークファイルシステム上に画像データの記録を行う。

次に、過去の画像に対する再認識処理の一例を説明する。ユーザは、画像表示装置４００に接続されているユーザインターフェースを操作して、特定の物体（例えば人物）を、過去の画像から検索する処理の実行を指示する。ここでは、検索条件の例としてメガネをかけている、身長１７０ｃｍ前後の男性を過去の画像から検索する場合を例に挙げて説明する。また、認識前提条件の各項目の最新の内容は図８に示す内容であるものとする。
前記指示が行われると、画像認識サーバ装置３００は、過去の画像に対する再認識処理を実行する。

図２に示す再処理推奨領域参照部３１０は、ユーザにより指示された認識対象と、当該認識対象である際の考慮事項との関係から、当該認識対象に対応する画像認識前提条件の項目を選択する。図９は、認識対象と、当該認識対象である際の考慮事項との関係の一例を示す図である。この関係は、予め設定されている。

ここでは、メガネをかけている人物および男性を検索するので、図３に示すように、顔が正面から映っている画像を探す必要がある。また、身長が指定されているので、図３に示すように、全身が写っている画像を探す必要がある。

次に、第２の画像取得部３２０は、該当する画像の取得と当該画像における推奨処理領域の取得を行う。ここでは、現在の再処理推奨領域が図８に示す内容であるものとしている。図９に示すように、メガネを検出する場合には、顔が正面から映っている画像を処理する必要がある。このため、画像番号１００、５００の(x, y, width, height) ＝ (25, 500, 150, 150)、(125, 200, 75, 75)をそれぞれ処理する必要がある。また、図９に示すように、身長を推定する場合には、全身が映っている画像を処理する必要がある。このため、画像番号５００の (x, y, width, height) = (120, 200, 100, 300)を処理する必要がある。また、図９に示すように、年齢の推定する場合には、顔が正面から映っている画像を処理する必要がある。このため、画像番号１００、５００の(x, y, width, height) ＝ (25, 500, 150, 150)、(125, 200, 75, 75)をそれぞれ処理する必要がある。したがって、第２の画像取得部３２０は、これらの画像番号１００、５００の推奨処理領域を取得する。

次に、認識処理部３３０は、第２の画像取得部３２０で取得された画像の推奨処理領域に対して、実際の画像認識処理を行う。
再処理推奨領域参照部３１０、第２の画像取得部３２０、および認識処理部３３０は、物体追尾部１２０で付与されたＩＤ毎に繰り返し行うことで過去の画像に対する再認識処理を効率よく行うことができる。

再認識処理を行う対象となる過去の画像はどれでもよいわけではなく、被写体の写り方に大きく依存する。顔に対して認識処理を行うのであれば目・鼻・口といった顔器官をきちんと検出でき、且つ、顔器官が大きく、くっきりと写っている画像に対して画像認識処理を行うことが望ましい。身長を推定する場合には、頭からつま先まで全身が写っている画像に対して画像認識処理を行うことが望ましい。さらに、高精度に且つ短時間で再認識処理を終えるには、過去の画像の中から適した画像を選択する必要がある。

そこで本実施形態では、認識前提条件の複数の項目のそれぞれについて、画像に写し出されている物体のスコアを導出することを、画像に写し出されている物体のそれぞれについて行う。そして、過去に得られた画像と新たに得られた画像の同一の物体の同一の項目における評価値を比較し、比較した結果から、当該物体の当該項目に対応する画像と当該画像における推奨処理領域を導出し、当該画像と当該推奨処理領域とを特定する情報を登録する。このように、過去の画像に対する再認識処理に適した画像を選別し、当該画像における推奨処理領域を求めておく。
その後、過去の画像に対する再認識処理を行う場合には、ユーザにより指定された認識対象に対応する項目（考慮事項）を導出し、導出した項目に対応する画像と当該画像における推奨処理領域とを抽出する。そして、抽出した画像の推奨処理領域に対して画像認識処理を行う。このように、再認識処理では、認識対象に見合う画像の推奨処理領域を抽出し、当該推奨処理領域に対して画像認識処理を行う。

したがって、画像の再認識処理時に不適切な画像を処理することで生じる認識精度の低下や処理時間の増大を引き起こすことなく、認識に適した画像を処理することで再認識処理の量および時間を大幅に短縮することができる。

尚、前述した実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。

（その他の実施例）
本発明は、前述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

１００：ネットワークカメラ、３００：画像認識サーバ装置、４００：画像表示装置

Claims

画像を取得する画像取得手段と、
前記画像に写し出されている物体の検出の結果に対する信頼度を前記物体ごとに導出する導出手段と、
複数の画像における同一の物体に対する前記信頼度を比較し、比較した結果に基づいて、画像の再認識処理に用いる画像を登録する登録手段と、
を有することを特徴とする画像認識システム。
前記導出手段は、画像における物体の写り方により定められる複数の項目ごとに、前記画像に写し出されている物体の、当該項目に応じた検出の結果に対する信頼度を導出し、
前記登録手段は、複数の画像における同一の物体の同一の項目に対する前記信頼度を比較し、比較した結果に基づいて、画像の再認識処理に用いる画像を示す情報と、当該画像における処理領域を示す情報とを、前記項目ごとに登録することを特徴とする請求項１に記載の画像認識システム。
画像の再認識処理の実行を受け付ける受け付け手段と、
前記受け付け手段により受け付けられた再認識処理の内容に応じた前記項目から、前記再認識処理に用いる画像の処理領域を抽出する抽出手段と、
前記処理領域に対して、前記再認識処理を行う再認識処理手段と、
を更に有することを特徴とする請求項２に記載の画像認識システム。
前記項目は、物体の向きを特定する少なくとも１つの方向と、物体の写っている領域を特定する少なくとも１つの領域とを含むことを特徴とする請求項２または３に記載の画像認識システム。
物体が移動する方向の検出、人体の足元の検出、人体が向いている方向の検出、人体の検出、顔の検出、顔を構成する器官の検出、および顔が向いている方向の検出のうち、少なくとも１つを行う検出手段を更に有し、
前記導出手段は、前記検出手段により検出された結果に基づいて、前記信頼度を導出することを特徴とする請求項１〜４の何れか１項に記載の画像認識システム。
前記導出手段は、人体の検出の結果に基づく前記信頼度、顔の検出の結果に基づく前記信頼度、顔を構成する器官の検出の結果に基づく前記信頼度、顔認識の結果に基づく前記信頼度、人体の検出領域の画素数に基づく前記信頼度、および顔の検出領域の画素数に基づく前記信頼度のうち、少なくとも１つを導出することを特徴とする請求項１〜５の何れか１項に記載の画像認識システム。
画像を取得する画像取得工程と、
前記画像に写し出されている物体の検出の結果に対する信頼度を前記物体ごとに導出する導出工程と、
複数の画像における同一の物体に対する前記信頼度を比較し、比較した結果に基づいて、画像の再認識処理に用いる画像を登録する登録工程と、
を有することを特徴とする画像認識方法。
請求項１〜６の何れか１項に記載の画像認識システムの各手段としてコンピュータを機能させることを特徴とするプログラム。