JP2023062785A

JP2023062785A - 情報処理装置、情報処理装置の制御方法およびプログラム

Info

Publication number: JP2023062785A
Application number: JP2021172887A
Authority: JP
Inventors: 律子大竹; Ritsuko Otake; 英俊井澤; Hidetoshi Izawa; 智也本條; Tomoya Honjo
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2021-10-22
Filing date: 2021-10-22
Publication date: 2023-05-09

Abstract

【課題】１つの物体に対して複数の異なる属性の検出結果が得られた場合であっても、検出枠を１つに統合し、その統合結果に対して適切な属性を選択できるようにする。【解決手段】入力画像から、物体が存在する検出枠を取得するとともに、物体が存在する可能性を示す信頼度およびクラス確率を取得する。そして、任意の２つの検出結果を組みとして、検出枠の重複率を算出し、その重複率が閾値以上の重複検出群を出力する。続いて、重複検出群に含まれる各検出結果の中から信頼度の最も高い検出枠を代表枠に決定し、代表枠との重複率に基づき、各クラス指数を算出して最も高いクラス指数のクラスを代表枠のクラスに決定する。【選択図】図２

Description

本発明は、特に、画像から物体を検出する技術に関する。

近年、監視カメラ等の撮像装置により撮影された画像を用いて物体を検出して追尾したり、その物体の属性を推定したりする画像解析や、そのような画像解析の結果を用いた物体数の推定が様々なシーンで行われている。

特開２０１８－１８０９４５号公報

J.Redmon, A.Farhadi,"YOLO9000:Better Faster Stronger", Computer Vision and Pattern Recognition (CVPR) 2016.

特許文献１に開示された技術では、検出処理枠に含まれる検出対象物体の種類に応じて調整された閾値を利用することで異なる種類（属性）の物体検出枠が統合されてしまうことを回避する。このため、ある１つの物体に対して複数の異なる種類の検出結果が出力された場合には物体検出枠を１つに統合できない。

本発明は前述の問題点に鑑み、１つの物体に対して複数の異なる属性の検出結果が得られた場合であっても、検出枠を１つに統合し、その統合結果に対して適切な属性を選択できるようにすることを目的としている。

本発明に係る情報処理装置は、入力画像を取得する入力手段と、前記取得した入力画像から、物体が存在する候補領域を検出するとともに、前記物体の属性の候補を取得する検出手段と、前記候補領域が複数の場合に、前記複数の候補領域の間の重複率を取得する重複率取得手段と、前記候補領域の組み合わせごとに、候補領域に物体が含まれる可能性を示す信頼度が最大である候補領域を代表領域に設定し、前記代表領域との重複率が閾値以上である候補領域を削除する統合手段と、前記候補領域に含まれる物体の属性の確率と、前記代表領域との重複率とに基づいて、前記代表領域における物体の属性を決定する決定手段と、を有することを特徴とする。

本発明によれば、１つの物体に対して複数の異なる属性の検出結果が得られた場合であっても、検出枠を１つに統合し、その統合結果に対して適切な属性を選択することができる。

情報処理装置のハードウェア構成例を示すブロック図である。情報処理装置の機能構成例を示すブロック図である。第１の実施形態による物体検出処理の手順の一例を示すフローチャートである。第１の実施形態による物体検出処理を説明するための図である。第２の実施形態による物体検出処理の手順の一例を示すフローチャートである。第２の実施形態による物体検出処理を説明するための図である。検出領域と検出枠とが接するパターンを説明するための図である。第３の実施形態による物体検出処理の手順の一例を示すフローチャートである。第３の実施形態による枠統合処理の詳細な手順の一例を示すフローチャートである。第３の実施形態による物体検出処理を説明するための図である。

（第１の実施形態）
物体の検出では、例えば、検出対象の物体の位置及び大きさ、物体の属性、物体が存在する信頼度等を出力する。物体の検出においては、１つの物体に対して複数の検出結果が生じる場合がある。それにより、検出結果の信頼性が低下したり統計データの信頼性が低下したりするなどの問題につながる課題がある。本実施形態は、１つの物体に対して複数の検出結果が生じる場合に、最適な検出結果を決定する方法を説明する。以下、本発明の第１の実施形態について、図面を参照しながら説明する。
図１は、本実施形態に係る情報処理装置１００のハードウェア構成例を示すブロック図である。本実施形態における情報処理装置１００は、監視カメラ等の撮像装置によって撮影された画像から、検出対象の物体を検出する物体検出機能を有する。以下では、一例として人物の顔を検出する場合について説明するが、これに限定されるものではなく、画像を解析して所定の物体を検出する任意のシステムに適用することができる。

本実施形態による情報処理装置１００は、ＣＰＵ（Central Processing Unit）１０１、メモリ１０２、通信インターフェース（Ｉ／Ｆ）部１０３、表示部１０４、入力部１０５、及び記憶部１０６を有する。また、これらの構成はシステムバス１０７を介して通信可能に接続されている。なお、本実施形態による情報処理装置１００は、これ以外の構成をさらに有していてもよい。

ＣＰＵ１０１は、情報処理装置１００の全体の制御を司る。ＣＰＵ１０１は、例えばシステムバス１０７を介して接続される各機能部の動作を制御する。メモリ１０２は、ＣＰＵ１０１が処理に利用するデータ、プログラム等を記憶する。また、メモリ１０２は、ＣＰＵ１０１の主メモリ、ワークエリア等としての機能を有する。ＣＰＵ１０１がメモリ１０２に記憶されたプログラムに基づき処理を実行することにより、後述する図２に示す情報処理装置１００の機能構成及び後述する図３に示すフローチャートの処理が実現される。

通信Ｉ／Ｆ部１０３は、情報処理装置１００をネットワークに接続するインターフェースである。表示部１０４は、液晶ディスプレイ等の表示部材を有し、ＣＰＵ１０１による処理の結果等を表示する。入力部１０５は、マウス又はボタン等の操作部材を有し、ユーザーの操作を情報処理装置１００に入力する。記憶部１０６は、例えば、ＣＰＵ１０１がプログラムに係る処理を行う際に必要な各種データ等を記憶する。また、記憶部１０６は、例えば、ＣＰＵ１０１がプログラムに係る処理を行うことにより得られた各種データ等を記憶する。なお、ＣＰＵ１０１が処理に利用するデータ、プログラム等を記憶部１０６に記憶するようにしてもよい。

図２は、本実施形態に係る情報処理装置１００の機能構成例を示すブロック図である。情報処理装置１００は、画像取得部２０１、物体検出部２０２、重なり判定部２０３、代表枠決定部２０４、クラス決定部２０５、結果修正部２０６、結果出力部２０７、及び記憶部２０８を有する。

画像取得部２０１は、物体検出を行う対象となる画像を取得する。本実施形態では、物体検出を行う対象となる画像は、通信Ｉ／Ｆ部１０３を通じて外部から取得する。これ以降は、画像取得部２０１が取得した、物体検出を行う対象となる画像のデータを単に「入力画像」とも呼ぶ。また、以下の説明では、入力画像は、一例として水平方向（横方向）の幅が１０８０ピクセルであり、垂直方向（縦方向）の高さが７２０ピクセルである、１０８０×７２０ピクセルのＲＧＢ画像とする。なお、入力画像は、１０８０×７２０ピクセルのＲＧＢ画像に限定されるものではなく、任意の画像を入力画像とすることができ、例えば水平方向の幅や垂直方向の高さが異なっていてもよい。

物体検出部２０２は、画像から複数の属性（クラス）に係る物体検出を行う。本実施形態では、物体検出部２０２は、画像取得部２０１によって取得された入力画像から人物の顔を検出する。また、物体検出部２０２は、画像に含まれる「メガネ着用の顔」と「メガネ非着用の顔」とを検出できるように学習が行われた機械学習モデル（学習済みモデル）を用いて、検出結果を出力する。「メガネ着用の顔」及び「メガネ非着用の顔」の検出は、例えば非特許文献１に記載の技術を適用することで実現できる。

ここで、物体検出部２０２が出力する検出結果は、検出した顔（候補領域）の位置及び大きさ、検出の信頼度（confidence score）、及び顔のどの属性（クラス）に属するかを示す確率であるクラス確率（class probabilities）および検出の信頼度を含む。顔の位置及び大きさは、例えば顔を囲む矩形枠（候補領域）を規定する座標（例えば、矩形の左上座標（ｘ₁，ｙ₁）及び右下座標（ｘ₂，ｙ₂））により出力される。検出の信頼度は、例えば、上述の矩形枠（候補領域）において顔が含まれる可能性である信頼度を表し、信頼度取得の際に信頼度が最も低い場合を０とし、信頼度が最も高い場合を１として、０～１の実数で出力される。顔のクラス確率は、メガネ着用の顔である確率及びメガネ非着用の顔である確率を示し、これら確率の和は１（１００％）である。これ以降、顔を囲む矩形枠、検出の信頼度、及び顔のクラス確率のそれぞれを、単に、「検出枠」、「信頼度」、「クラス確率」とも呼ぶこととする。なお、検出結果の出力方法は、前述した例に限定されるものではなく、検出した顔の位置及び範囲、検出の信頼度、及び顔のクラス確率がそれぞれ認識できればよい。

重なり判定部２０３は、物体検出部２０２によって得られた検出結果（特に候補領域の位置と大きさ）に基づいて、検出結果の重なりを判定する。重なり判定部２０３は、物体検出部２０２によって得られた全検出結果のうち、任意の２つの検出枠を組として、組毎に検出枠の重複率を算出する。重なり判定部２０３は、算出した重複率が閾値以上である、すなわち検出枠の領域が所定の割合以上重なった検出枠の組があれば重なりありと判定し、その検出結果の組を「重複検出群」として出力する。本実施形態では、重複率取得の際に、ＩｏＵ（Intersection over Union）で重複率を算出するものとし、閾値は一例として０．５とする。つまり、２つの検出枠の領域の共通部分の面積を２つの領域の面積の和集合で割った値が０．５以上であれば重なり判定部２０３は重なりありと判定する。閾値以上重なった検出枠の組が無い場合には、重なり判定部２０３は、重なりなしと判定する。

代表枠決定部２０４は、物体検出部２０２によって得られた検出結果（特に候補領域の信頼度）に基づいて、重なり判定部２０３で出力した重複検出群それぞれの代表領域となる１つの検出枠を決定する。代表枠決定部２０４は、重複検出群ごとにそこに含まれる検出結果のうち信頼度が最大となる検出結果に対応する検出枠を、その重複検出群の代表枠（代表領域）と決定する。なお、信頼度が最大の検出結果が複数ある場合は、例えば、それらに対応する検出枠内の面積が最大の検出枠を代表枠と決定する。なお、１つの重複検出群において信頼度が最大の検出結果が複数ある場合の代表枠の決定指標は、検出枠内の面積以外を適用しても構わない。なお、すべての物体検出結果（候補領域）における信頼度を大きい順にソートし、上位Ｎ個または信頼度が閾値以上である候補領域を代表領域として決定してもよい。この場合の処理の具体例は実施形態３で説明する。

クラス決定部２０５は、重複検出群に含まれる各検出結果のクラス確率を利用して代表枠決定部２０４によって決定された代表枠のクラスを決定する。クラス決定部２０５によるクラス決定処理の詳細は後述する。本実施形態は、代表領域における物体のクラス確率だけではなく、代表領域と重複する候補領域における物体のクラス確率を用いることによって、物体の検出精度を向上できる。

結果修正部２０６は、物体検出部２０２によって得られた検出結果を、重なり判定部２０３、代表枠決定部２０４、クラス決定部２０５の出力によって修正を行う。結果修正部２０６は、重なり判定部２０３が出力した重複検出群それぞれについて代表枠決定部２０４で決定した代表枠に対応する検出結果以外の検出結果を削除する。また、結果修正部２０６は、他のどの枠とも重複率が閾値未満であった検出結果について、クラス確率が最大のクラスをその検出結果のクラスと決定する。以上の結果修正処理により、重複検出群ごとに代表枠に対応する検出結果１つのみを残し、そのクラスはクラス決定部２０５で決定したクラスとし、その他の重複が無かった各検出結果のクラスも決定する。

結果出力部２０７は、結果修正部２０６による処理の結果を出力する。その形式は、検出枠の座標とクラスのデータでもよいし、入力画像に検出結果を重畳した画像を出力してもよい。
記憶部２０８は、情報処理装置１００の画像取得部２０１～結果出力部２０７での処理に用いるデータや処理結果として得られるデータ等を記憶する。

次に、図３及び図４を参照して、情報処理装置１００が行う処理について説明する。図３は、本実施形態による物体検出処理の手順の一例を示すフローチャートである。図４は、本実施形態による物体検出処理を説明するための図である。
ステップＳ３０１において、画像取得部２０１は、入力画像（物体検出を行う対象となる画像）を取得する。図４（ａ）に、本実施形態における入力画像４１０の一例を示す。本実施形態では、入力画像４１０は、前述したように１０８０×７２０ピクセルの画像であるものとする。

ステップＳ３０２において、物体検出部２０２は、入力画像に対して検出対象である人物の顔を検出する顔検出処理を行う。そして、検出された顔それぞれについて信頼度及びクラス確率（「メガネ着用」クラスである確率と「メガネ非着用」クラスである確率）を出力する。入力画像に対する顔検出処理の検出結果の例を図４（ｂ）に示し、検出結果を入力画像に重畳した画像の例を図４（ｃ）に示す。図４（ｂ）に示した例では、３つの検出結果Ａ～Ｃが得られ、それぞれ矩形の検出枠の左上座標（ｘ₁，ｙ₁）及び右下座標（ｘ₂，ｙ₂）と、信頼度と、クラス確率（候補として「メガネ着用」と「メガネ非着用」）とが出力される。図４（ｃ）に示した例では、検出結果Ａ～Ｃに対応する矩形の検出枠４１１～４１３が入力画像４１０に重畳して表示部１０４に表示される。

ステップＳ３０３において、重なり判定部２０３は、入力画像に対する検出結果の内の任意の２つの検出結果を組として、検出枠の重複率を計算する。図４（ｂ）の例では、検出結果Ａの検出枠４１１の左上座標が（１４３，１６５）、右下座標が（４１７，４１８）である。また、検出結果Ｂの検出枠４１２の左上座標が（１６６，１９０）、右下座標が（４５０，４４６）である。したがって、検出結果Ａと検出結果Ｂの検出枠の重複率は、
ＩｏＵ（Ａ，Ｂ）＝（（４１７－１６６）×（４１８－１９０））÷（（４１７－１４３）×（４１８－１６５）＋（４５０－１６６）×（４４６－１９０）－（４１７－１６６）×（４１８－１９０））≒０．６７
となる。その他の組み合わせでは検出枠の重複率は０となる。

ステップＳ３０４において、重なり判定部２０３は、ステップＳ３０３で算出した重複率が閾値以上となった検出結果の組み合わせがあるか否かを判定する。重なり判定部２０３は、検出枠の重複率が閾値以上となった検出結果の組み合わせがあると判定した場合（ステップＳ３０４でＹＥＳ）、重複率が閾値以上となった検出結果の組み合わせ（重複検出群）を出力し、ステップＳ３０５に移行する。一方、重なり判定部２０３は、検出枠の重複率が閾値以上となった検出結果の組み合わせが無いと判定した場合（ステップＳ３０４でＮＯ）、ステップＳ３０９に移行する。本実施形態では、前述したように重複率の閾値を０．５とする。ここでは検出結果Ａと検出結果Ｂの検出枠の重複率が０．６７と算出されていて閾値０．５以上であるので、重なり判定部２０３は、重複率が０．５以上となった組み合わせを重複検出群（Ａ，Ｂ）として出力し、ステップＳ３０５に移行する。

ステップＳ３０５において、代表枠決定部２０４は、ステップＳ３０４で出力した重複検出群に含まれる各検出結果の信頼度を比較し、信頼度が最大となる検出結果に対応する検出枠をその重複検出群の代表枠として決定する。本例での重複検出群（Ａ，Ｂ）について、図４（ｂ）によれば検出結果Ａの信頼度が０．８０、検出結果Ｂの信頼度が０．７５であるため、代表枠は、信頼度が最大である検出結果Ａに対応する検出枠に決定する。

ステップＳ３０６において、クラス決定部２０５は、ステップＳ３０５で決定した代表枠のクラスを、ステップＳ３０３で出力した重複検出群に含まれる各検出結果のクラス確率及び重複率を利用して決定する。本例での重複検出群（Ａ，Ｂ）の場合、この重複検出群のクラス指数を、図４（ｂ）に示されている各検出枠のクラス確率を前述の重複率（代表枠との重複率に限る）で重み付けした加重和として以下のように算出する。
メガネ着用クラス指数＝１×０．５５＋０．６７×０．１５≒０．６５
メガネ非着用クラス指数＝１×０．４５＋０．６７×０．８５≒１．０２
なお、自分自身との重複率は１であるために上式右第１項には１が乗算されている。

ここで算出したクラス指数のうち最大となるクラスを対象の代表枠クラスと決定する。本例では、メガネ非着用クラス指数が最大であるため、この代表枠のクラスはメガネ非着用クラスとなる。なお、算出したクラス指数が同値で最大となる複数のクラスが存在する場合には、代表枠の元のクラス確率の高いクラスを採用することとする。例えば本例での代表枠となった検出枠の元の情報は検出結果Ａであるため、もしも上記の両クラス指数が同値であった場合には、検出結果Ａのクラス確率が大きいほうのクラス、すなわちメガネ着用クラスを代表枠クラスと決定する。
クラス決定部２０５は、以上のように決定されたクラスのクラス確率を１、それ以外のクラスを０として、ステップＳ３０５で決定した代表枠に対応する検出結果の各クラス確率に上書きして更新する。

ステップＳ３０７において、結果修正部２０６は、重複検出群のうち代表枠に対応する検出結果以外の検出結果を削除する。

ステップＳ３０８において、結果修正部２０６は、検出枠の重複率が閾値以上となった検出結果のすべての組み合わせについて処理を完了したか否かを判定する。結果修正部２０６は、重複率が閾値以上となった検出結果のすべての組み合わせについて処理が完了したと判定した場合（ステップＳ３０８でＹＥＳ）、ステップＳ３０９に移行する。一方、結果修正部２０６は、重複率が閾値以上となった検出結果の組み合わせにおいて未処理の組み合わせがあると判定した場合（ステップＳ３０８でＮＯ）、ステップＳ３０５に移行し、未処理の組み合わせについてステップＳ３０５以降の処理を実行する。

ステップＳ３０９において、結果修正部２０６は、各検出結果のクラスを決定する。ステップＳ３０５～Ｓ３０８の処理を経て重複検出群の代表となった検出結果については、ステップＳ３０６で決定したクラスに決定する。ステップＳ３０５～Ｓ３０８の処理を経ずにステップＳ３０２の出力がそのまま残っている検出結果についてはクラス確率のうち最大のクラスをその検出結果のクラスに決定する。この処理により図４（ｄ）に示すように、各検出結果（検出枠）に対してクラスが１つ決定される。

ステップＳ３１０において、結果出力部２０７は、図４（ｄ）に示したような修正された検出結果データを出力して処理を終了し、次の入力画像の処理に移行する。この出力データは例えば図４（ｅ）に示すように入力画像４１０に対して矩形で表される検出枠を重畳した形式で利用することができる。図４（ｅ）では、左側の人物の顔には検出結果Ａの検出枠としてメガネ非着用クラスを表す破線の矩形枠４１４が、右側の人物の顔には検出結果Ｃの検出枠としてメガネ着用クラスを表す点線の矩形枠４１５が重畳表示されている。

以上のように本実施形態によれば、入力画像に対する物体検出において、検出結果が複数重なった場合、最も適した検出枠１つに統合することができる。さらに、統合した検出枠の属性（クラス）を、統合前の複数の検出結果のクラス確率および検出枠の重複率に基づいて算出することで、最も適した属性（クラス）を選択することができる。これにより、入力画像に対する物体検出の検出結果として、最終的により適切な検出結果を出力することができる。

なお、物体検出部２０２における物体検出処理は、検出したい物体を検出することができる技術であれば、非特許文献１に開示されている技術に限らず、様々な技術を適用可能である。また、代表枠決定部２０４において決定する代表枠は、検出物体が含まれる領域であれば任意でよい。例えば、重複検出群に含まれる検出枠の和集合に対する外接矩形を代表枠として定義してもよい。また、重複検出群に含まれる検出枠のうち信頼度または重複率が上位にある検出枠の和集合に対する外接矩形を代表枠として定義してもよい。

また、本実施形態においては、２つの検出枠が重なった例について説明したが、３つ以上の検出する場合もありうる。例えば３つの検出結果Ｍ，Ｎ，Ｏが重なり、検出結果Ｍ，Ｎと、検出結果Ｎ，Ｏと、検出結果Ｍ，Ｏとでそれぞれ重複率がいずれも０．５以上であった場合は、重なり判定部２０３は、重複検出群（Ｍ，Ｎ，Ｏ）として出力する。そして、例えば検出結果Ｍの信頼度が最も大きい場合は、クラス決定部２０５は、重複検出群（Ｍ，Ｎ）、（Ｍ，Ｏ）での重複率を用いて各クラス指数を算出し、重複検出群（Ｎ，Ｏでの重複率は用いないようにする。

（第２の実施形態）
第１の実施形態では検出結果が複数重なった場合に、検出結果を適切に１つに統合する処理を説明した。第２の実施形態では、検出対象の画像上に複数の検出領域が設定された場合の検出結果の統合について説明する。以下の説明において、第１の実施形態と共通の構成については同一の符号を用い、説明を省略する。

図５は、本実施形態で情報処理装置１００が行う物体検出処理の手順の一例を示すフローチャートであり、図３に示したフローチャートとの共通部分については図３と同一の符号を付している。図６は、本実施形態による物体検出処理を説明するための図である。
ステップＳ３０１において、画像取得部２０１は、入力画像（物体検出を行う対象となる画像）を取得する。図６（ａ）に、本実施形態における入力画像６１０の一例を示す。本実施形態においても第１の実施形態と同様に入力画像６１０は１０８０×７２０ピクセルの画像であるものとする。

ステップＳ５０１において、物体検出部２０２は入力画像の中で検出処理対象とする領域（検出領域）を設定する。図６（ｂ）には、検出領域ａ（６１１）、ｂ（６１２）が設定された様子を示す。検出領域ａの左上座標は（９９，１２７）、右下座標は（７１９，７４７）、検出領域ｂの左上座標は（５４６，１０）、右下座標は（１０７６，５４０）である。なお、設定可能な検出領域数は限定しないが、ここでは説明のために前述の２領域が設定されているものとする。また、本実施形態では、入力画像に映る場面等の特徴により、図６（ｂ）のように複数の検出領域が重なり合うように検出領域を設定する。

ステップＳ５０２において、物体検出部２０２はステップＳ５０１で設定された検出領域別に顔検出処理を行う。それぞれの検出領域で行う顔検出処理は第１の実施形態のステップＳ３０２で行う処理と同様である。入力画像の中で設定された検出領域別に顔検出処理をした検出結果の例を図６（ｃ）に示し、検出結果を入力画像に重畳した画像の例を図６（ｄ）に示す。検出領域ｂ（６１２）には左端に人物が一部含まれているため、検出結果Ｂ、Ｃのように顔の一部が不完全な形で検出される。一方で、同じ人物の顔が検出領域ａ（６１１）では完全な形で検出されているため、これらの検出結果を正しく統合する処理を行う。これ以降の処理は、全検出領域での検出結果を同時に扱うこととする。本例では、３つの検出結果Ａ～Ｃが得られ、図６（ｄ）に示した例では、検出結果Ａ～Ｃに対応する矩形の検出枠６１３～６１５が入力画像６１０に重畳して表示部１０４に表示される。

ステップＳ５０３において、重なり判定部２０３は、複数の検出結果の内の任意の２つの検出結果を組として、検出枠の重複率を計算する。第１の実施形態ではここでの重複率をＩｏＵで定義し、次のステップＳ３０４でのＩｏＵの閾値を０．５としていた。しかし、前述のように検出領域の端部に人物の顔の一部があることなどが原因で不完全な検出結果が出力される場合、重複率をＩｏＵで定義すると同一の顔の検出結果であっても重複率が低く算出される。例えば図６（ｃ）の検出結果Ａと検出結果Ｂの検出枠のＩｏＵは、
ＩｏＵ（Ａ，Ｂ）＝（（６８５－５４６）×（４１４－１４５））÷（（６８５－４１０）×（４１４－１４５）＋（７０５－５４６）×（４４０－１１３）－（６８５－５４６）×（４１４－１４５））≒０．４２
検出結果Ａと検出結果Ｃの検出枠のＩｏＵは、
ＩｏＵ（Ａ，Ｃ）＝（（６６０－５６７）×（３８４－１８６））÷（（６８５－４１０）×（４１４－１４５））≒０．２５
検出結果Ｂと検出結果Ｃの検出枠のＩｏＵは、
ＩｏＵ（Ｂ，Ｃ）＝（（６６０－５６７）×（３８４－１８６））÷（（７０５－５４６）×（４４０－１１３））≒０．２０
となる。したがって、閾値を第１の実施形態と同様の０．５とした場合、閾値未満であるため、検出結果Ａ～Ｃにおいて、いずれの組み合わせでも統合されないことになってしまう。

そこで本実施形態では、重複率を算出する際、一方がもう一方の一部により多く含まれる場合にも重複率が充分高く表現されるＳｉｍｐｓｏｎ係数を導入する。Ｓｉｍｐｓｏｎ係数による重複率は、２つの検出枠の領域の共通部分の面積を２つの検出枠のうち面積の小さいほうの検出枠領域の面積で割った値で定義される。
検出結果Ａと検出結果Ｂの検出枠のＳｉｍｐｓｏｎ係数は、
Ｓｉｍｐｓｏｎ（Ａ，Ｂ）＝（（６８５－５４６）×（４１４－１４５））÷（（７０５－５４６）×（４４０－１１３））≒０．７２
検出結果Ａと検出結果Ｃの検出枠のＳｉｍｐｓｏｎ係数は、
Ｓｉｍｐｓｏｎ（Ａ，Ｃ）＝１
検出結果Ｂと検出結果Ｃの検出枠のＳｉｍｐｓｏｎ係数は、
Ｓｉｍｐｓｏｎ（Ｂ，Ｃ）＝１
であり、いずれも閾値０．５以上であるためこの後の統合処理に移行できる。

以上のことから、ステップＳ５０３において重なり判定部２０３は、検出枠の重複率として、ＩｏＵとＳｉｍｐｓｏｎ係数との双方を算出する。ここで算出したＳｉｍｐｓｏｎ係数は、ステップＳ３０４～Ｓ３０８にて実行される検出枠の統合処理対象とするか否かを決定するための重複率として、ステップＳ３０４で使用される。一方、ここで算出したＩｏＵは、複数の枠が統合された代表枠のクラスを決定する際の重複率として、ステップＳ３０６で使用される。

ステップＳ３０４において、重なり判定部２０３は、ステップＳ５０３で算出したＳｉｍｐｓｏｎ係数による重複率が閾値以上となった検出結果の組み合わせがあるか否かを判定する。重なり判定部２０３は、検出枠の重複率が閾値以上となった検出結果の組み合わせがあると判定した場合（ステップＳ３０４でＹＥＳ）、重複率が閾値以上となった検出結果の組み合わせ（重複検出群）を出力し、ステップＳ５０４に移行する。一方、重なり判定部２０３は、検出枠の重複率が閾値以上となった検出結果の組み合わせが無いと判定した場合（ステップＳ３０４でＮＯ）、ステップＳ３０９に移行する。本実施形態では、前述したように重複率の閾値を０．５とする。本例では検出結果Ａと検出結果Ｂの検出枠の重複率（Ｓｉｍｐｓｏｎ係数）が０．７２で、検出結果Ａと検出結果Ｃ及び検出結果Ｂと検出結果Ｃの検出枠の重複率（Ｓｉｍｐｓｏｎ係数）が１であり、いずれも閾値０．５以上である。この場合、重複率が０．５以上となった組み合わせが重複検出群（Ａ，Ｂ）、（Ａ，Ｃ）、（Ｂ，Ｃ）となり、互いに重なる組み合わせとなる。そこで、重なり判定部２０３は、重複率が０．５以上となった組み合わせを重複検出群（Ａ，Ｂ，Ｃ）として出力し、ステップＳ５０４に移行する。

ステップＳ５０４において、物体検出部２０２は、ステップＳ３０４で出力した重複検出群に含まれる各検出結果の検出枠のうち、検出領域の境界に接する検出枠があるか否かを判定する。ここで検出枠が検出領域の境界に接するか否かの判定は、各検出結果の検出枠４辺のうちいずれかと、その結果が得られた検出領域４辺のうちいずれかに接しているか否かで判定する。図６（ｃ）及び図６（ｄ）の例では、検出結果Ｂの検出枠６１４の左端ｘ座標とその結果を得た検出領域である検出領域ｂの左端ｘ座標が５４６と一致しているため、検出結果Ｂの検出枠６１４が検出領域ｂの境界に接していると判定される。なお、検出結果Ａの検出枠６１３はその検出領域ａの境界とは接しておらず、同様に検出結果Ｃの検出枠６１５もその検出領域ｂの境界とは接していない。検出領域の境界に接する検出枠があると判定した場合（ステップＳ５０４でＹＥＳ）、検出領域の境界に接する検出枠に関する情報を出力し、ステップＳ５０５に移行する。一方、検出領域の境界に接する検出枠は無いと判定した場合（ステップＳ５０４でＮＯ）はステップＳ３０５へ移行する。

ステップＳ５０５において、物体検出部２０２は、ステップＳ５０４で出力した検出領域の境界に接する検出枠に対応する検出結果の信頼度を調整する処理を行う。検出領域の境界に接する検出枠は、すなわち顔の一部分に対する検出結果である可能性があると解釈できるため、顔の検出情報としては不完全である可能性がある。そこで、複数の検出結果を統合する際の代表枠や代表クラス確率への寄与率を抑制するために信頼度の調整を行う。ここでの信頼度の調整は、例えば既定係数を信頼度に乗算することで行う。本実施形態では既定係数を０．８とする。前述のように検出結果Ｂの検出枠６１４が検出領域ｂの境界に接しているため、図６（ｃ）に示されている検出結果Ｂの信頼度０．８５に既定係数０．８を乗算して調整後の信頼度０．６８が得られる。図６（ｅ）は、この結果を反映した後の検出結果を示しており、検出結果Ｂの信頼度は０．６８に低減されている。

ここまでの処理に続いて情報処理装置１００は、ステップＳ３０５以降を第１の実施形態と同様の処理を実行する。図６（ｅ）に示した例では、ステップＳ３０５において、代表枠決定部２０４は、信頼度が０．８０である検出結果Ａの検出枠６１３を代表枠に決定する。

次のステップＳ３０６においては、クラス決定部２０５は、代表枠に関連する２つの重複検出群（Ａ，Ｂ）、（Ａ，Ｃ）の重複率を用いて各クラス指数を算出し、代表枠クラスを決定する。なお、ステップＳ３０６におけるクラス指数の算出に用いる重複率は前述したように、第１の実施形態と同様にＩｏＵを適用する。本実施形態のように検出結果Ａの検出枠６１３に完全に包含される検出枠６１５の検出結果Ｃの寄与率がＳｉｍｐｓｏｎ係数に比べて適切な値となるためである。図６（ｅ）に示した例では、各クラス指数は以下のように重複率で重み付けした総和で算出される。
メガネ着用クラス指数＝１×０．１５＋０．４２×０．３０＋０．２５×０．６０≒０．４２６
メガネ非着用クラス指数＝１×０．８５＋０．４２×０．７０＋０．２５×０．４０≒１．２４４
この結果、クラス決定部２０５は、メガネ非着用クラスを代表枠クラスと決定する。なお、代表枠に関連しない重複検出群（Ｂ，Ｃ）の重複率は、代表枠との重複率ではないため、クラス指数の算出には用いられない。

ステップＳ３１０において結果出力部２０７が出力する検出結果データは、例えば図６（ｆ）に示すような結果となる。この検出結果を入力画像６１０に対して矩形で表される検出枠を重畳した形式で利用することができる。図６（ｇ）では、メガネ非着用クラスを表す破線の矩形６１６が人物の顔に重畳表示されている。

以上のように本実施形態によれば、入力画像に対して複数の検出領域が設定された場合、検出領域の境界付近の検出対象に対する複数の検出結果を適切に統合することが可能となる。

なお、ステップＳ５０５において、物体検出部２０２によって検出結果の信頼度に乗算する既定係数は、前述のような一定値とは限らず、例えば、検出領域と検出枠との位置関係に応じて既定係数を決定してもよい。例えば、図７（ａ）～図７（ｃ）に示す概念図のように、点線で示す検出領域と実線で示す検出枠とが接する辺の数によって既定係数を変更するようにしてもよい。例えば、図７（ａ）の場合は検出領域と検出枠とが接する辺の数が０であるため既定係数＝１とし、図７（ｂ）の場合は接する辺の数が１であるため既定係数＝０．８とし、図７（ｃ）の場合は接する辺の数が２であるため既定係数＝０．６とする。

また、図７（ｄ）～図７（ｇ）に示す例のように区分けし、検出枠内の外周長に対して検出領域境界と接する検出枠の辺の長さに応じて既定係数を以下のように算出してもよい。例えば、既定係数＝１－（接する辺の長さ÷外周の長さ）で算出するようにしてもよい。この場合、図７（ｄ）の場合の既定係数＝１、図７（ｅ）の場合の既定係数＝０．８８、図７（ｆ）の場合の既定係数＝０．６３、図７（ｇ）の場合の既定係数＝０．５と算出される。また、その他の幾何特性に応じて既定係数を決定してもよい。

（第３の実施形態）
本実施形態では、複数の検出結果を統合する順序を変更し、検出結果の信頼度を基に統合処理を行う方法を説明する。以下の説明において、第１及び第２の実施形態と共通の構成については同一の符号を用い、説明を省略する。

図８（ａ）は、本実施形態で情報処理装置１００が行う物体検出処理の一例を示すフローチャートであり、図３及び図５に示したフローチャートとの共通部分については図３及び図５と同一の符号を付している。また、図１０は、本実施形態による物体検出処理を説明するための図である。
ステップＳ３０１において、画像取得部２０１は、入力画像を取得する。図１０（ａ）に、本実施形態における入力画像１０１０の一例を示す。本実施形態においても第１の実施形態と同様に入力画像１０１０は１０８０×７２０ピクセルの画像であるものとする。

そして、ステップＳ３０２において、物体検出部２０２は、入力画像に対して検出対象である人物の顔を検出する顔検出処理を行い、検出された顔それぞれについて信頼度及びクラス確率を出力する。なお、ここで第２の実施形態のように検出領域を複数設定する場合にはステップＳ３０２の代わりに図５のステップＳ５０１、Ｓ５０２の処理を行う。なお、図１０では、図５のステップＳ５０１、Ｓ５０２の処理を行ったものとして説明する。入力画像の中で設定された検出領域別に顔検出処理をした検出結果の例を図１０（ｂ）に示し、検出結果を入力画像に重畳した画像の例を図１０（ｃ）に示す。図１０（ｃ）に示すように、２つの検出領域ａ（１０１１）、ｂ（１０１２）が設定され、４つの検出結果Ａ～Ｄが得られている。このように図１０（ｃ）に示した例では、検出結果Ａ～Ｄに対応する矩形の検出枠１０１３、１０１４、１０１６、１０１７が入力画像１０１０に重畳して表示部１０４に表示される。

ステップＳ８１０において、物体検出部２０２は、信頼度調整処理を行う。詳細は図８（ｂ）を用いて後述する。なお、第１の実施形態のように検出領域が複数設定されていない場合は、この処理を省略してもよい。
ステップＳ８２０において、代表枠決定部２０４が処理順リスト作成処理を行う。詳細は図８（ｃ）を用いて後述する。
ステップＳ９００において、重なり判定部２０３、代表枠決定部２０４、クラス決定部２０５が枠統合処理を行う。詳細は図９を用いて後述する。
ステップＳ３１０において、結果出力部２０７が検出結果データを出力する。

図８（ｂ）は、ステップＳ８１０の信頼度調整処理の詳細な手順の一例を示すフローチャートである。
ステップＳ８１１において、物体検出部２０２は、信頼度調整処理が全検出結果に対して実施されたか否かを判定する。物体検出部２０２は、全検出結果に対して信頼度調整処理を実施済みであると判定した場合（ステップＳ８１１でＹＥＳ）は、図８（ｂ）の信頼度調整処理を終了する。一方、物体検出部２０２は、信頼度調整処理を実施していない検出結果が残っていると判定した場合（ステップＳ８１１でＮＯ）は、処理対象を次の検出結果に移してステップＳ８１２へ移行する。

ステップＳ８１２において、物体検出部２０２は、処理対象の検出結果に含まれる検出枠と、その検出を行った検出領域との位置関係を定義する。この位置関係とは第２の実施形態で図７を用いて説明したように、検出枠の外周と検出領域の外周とが接する辺の数や長さの割合等で定義するものである。

ステップＳ８１３において、物体検出部２０２は、ステップＳ８１２において定義された位置関係に応じて、処理対象の検出結果の信頼度を調整する。この調整についても、第２の実施形態で図７を用いて説明した通りである。その後、ステップＳ８１１へ戻り、次の処理対象の検出結果が残っていればステップＳ８１２、ステップＳ８１３を繰り返して全検出結果についての信頼度調整処理が行われる。

図１０（ｄ）は、図１０（ｂ）の検出結果の例に対して信頼度調整処理を実施後の検出結果の例であり、検出領域ｂに検出枠の一辺が重なる検出結果Ｂの信頼度が０．８５から０．６８に低減されている。

図８（ｃ）は、ステップＳ８２０の処理順リスト作成処理の詳細な手順の一例を示すフローチャートである。
ステップＳ８２１において、代表枠決定部２０４は、全検出結果の信頼度を大きい順にソートする。図１０（ｄ）に示す検出結果Ａ～Ｄがあった場合、それぞれの信頼度は、０．８０，０．６８，０．８５，０．７５であることから、ソート結果は信頼度の大きいほうからＣ，Ａ，Ｄ，Ｂである。

ステップＳ８２２において、代表枠決定部２０４は、ステップＳ８２１でソートした結果をリスト化し、処理順リストとして記憶部２０８に記憶する。図１０（ｅ）は記憶される処理順リストの例を示している。なお、ここには順位と検出結果の対応のみをリスト情報としているが、検出結果に含まれる検出枠の座標情報、信頼度、クラス確率をリスト情報に含めることもできる。

図９は、ステップＳ９００の枠統合処理の詳細な手順の一例を示すフローチャートである。
ステップＳ９０１において、代表枠決定部２０４は、ステップＳ８２２で作成された処理順リストに処理すべき検出結果が入っているか否かを判定する。代表枠決定部２０４は、処理順リストに処理すべき検出結果が入っておらず空と判定した場合（ステップＳ９０１でＹＥＳ）は、枠統合処理は終了する。一方、代表枠決定部２０４は、処理順リストに処理すべき検出結果が入っていると判定した場合（ステップＳ９０１でＮＯ）は、ステップＳ９０２へ移行する。

ステップＳ９０２において、代表枠決定部２０４は処理順リストの最上位にある処理結果に対応する検出枠を代表枠として設定する。例えば、この時点で処理順リストが図１０（ｅ）で示す情報である場合、処理順で１位が検出結果Ｃであるため、代表枠として検出結果Ｃの検出枠１０１６が設定される。これ以降のステップＳ９０３からＳ９０９は、ここで設定した代表枠に統合すべき検出枠を決定して統合する処理である。

ステップＳ９０３において、代表枠決定部２０４はステップＳ９０２で設定した代表枠に対する各クラス指数の初期値に、代表枠の各クラス確率を設定する。例えば、代表枠となった検出結果Ｃの検出枠１０１６に対応するクラス確率は図１０（ｄ）を参照すると、メガネ着用クラスが０．５５、メガネ非着用クラスが０．４５である。このため、代表枠の各クラス指数の初期値はメガネ着用クラスが０．５５、メガネ非着用クラスが０．４５である。

ステップＳ９０４において、重なり判定部２０３は、処理順リスト内に代表枠との重複率が未算出の検出結果があるか否かを判定する。重なり判定部２０３は、処理順リスト内の検出結果すべてで代表枠との重複率を算出済みであると判定した場合（ステップＳ９０４でＹＥＳ）は、ステップＳ９０８へ移行する。一方、重なり判定部２０３は、処理順リスト内に代表枠との重複率が未算出の検出結果があると判定した場合（ステップＳ９０４でＮＯ）は、ステップＳ９０５へ移行する。

ステップＳ９０５において、重なり判定部２０３は、処理順リスト内の代表枠より下位の検出結果のうちの１つに相当する検出枠と代表枠との重複率を算出する。処理順リスト内の代表枠より下位の検出結果のうちの１つは、重複率未算出のもののうち上位から順に選択すればよい。図１０（ｅ）に示す処理順リストによれば、代表枠（検出結果Ｃの検出枠１０１６）に対してまず検出結果Ａの検出枠１０１３との重複率を算出することになる。図１０（ｃ）からわかるように、この２枠の重複率は０である。なお、図１０の例のように、検出領域が複数設定されている場合には、第２の実施形態と同様に、ＩｏＵとＳｉｍｐｓｏｎ係数との双方で重複率を算出し、第１の実施形態のように検出領域が複数設定されていない場合には、ＩｏＵで重複率を算出する。

ステップＳ９０６において、重なり判定部２０３は、ステップＳ９０５で算出した重複率が既定の閾値以上であるか否かを判定する。図１０の例のように、検出領域が複数設定されている場合には、第２の実施形態と同様に、Ｓｉｍｐｓｏｎ係数による重複率で閾値と比較し、第１の実施形態のように検出領域が複数設定されていない場合には、ＩｏＵによる重複率で閾値と比較する。重なり判定部２０３は、重複率が閾値未満であると判定した場合（ステップＳ９０６でＮＯ）は、この組み合わせでは枠統合対象外であることから次の処理順リスト内の検出結果に処理対象を移すためにステップＳ９０４へ戻る。一方、重なり判定部２０３は、重複率が閾値以上であると判定した場合（ステップＳ９０６でＹＥＳ）は、この組み合わせは枠統合対象となるためステップＳ９０７へ移行する。図１０の代表枠（検出枠１０１６）と検出結果Ａの検出枠１０１３との重複率は０であるため、ステップＳ９０６の判定結果はＮＯである。なお、次の処理順となる検出結果Ｄの検出枠１０１７と代表枠とのは重複率が閾値以上となることから、ステップＳ９０６の判定結果はＹＥＳである。

ステップＳ９０７において、代表枠決定部２０４およびクラス決定部２０５は、枠統合対象である検出枠の代表枠への統合処理を行う。代表枠への統合処理では、クラス決定部２０５が、代表枠の各クラス指数に、統合される検出枠の各クラス確率に重複率（ＩｏＵ）を乗算した数値を加算する。また、代表枠決定部２０４が、処理順リストから統合される処理枠に相当する検出結果を削除するとともに、検出結果自体を削除する。図１０の例では、代表枠に検出結果Ｄの検出枠１０１７を統合することになる。そのため、検出結果Ｄの各クラス確率に代表枠との重複率を乗算した数値を代表枠の各クラス指数に加算し、処理順リストから検出結果Ｄを削除する。そのときの処理順リストは図１０（ｆ）となる。また、図１０（ｄ）から検出結果Ｄの情報が削除される。代表枠への統合処理が終わると、次の処理順リスト内の検出結果に処理対象を移すためにステップＳ９０４へ戻る。

その後、図１０の例では検出結果Ｃの代表枠に対して処理順リスト下位の検出結果Ｂに相当する検出枠１０１４についても重複率が算出されるが、重複率は０となるため、検出結果Ｂの検出枠１０１４は代表枠に統合されない。

以上のように１つの代表枠に対して他の検出枠の重複率を算出し、必要に応じて枠統合処理がすべて終了すると、ステップＳ９０４からステップＳ９０８へ移行する。ステップＳ９０８において、クラス決定部２０５は、ステップＳ９０３またはＳ９０７で算出した各クラス指数のうち最大値となるクラスをその代表枠のクラスと決定する。図１０の例では、検出結果Ｃの代表枠のクラスは「メガネ着用」と決定される。

次にステップＳ９０９において、代表枠決定部２０４は、ここまでの処理が終わった代表枠に相当する検出結果を処理順リストから削除する。図１０の例ではここまでの処理では、代表枠は検出結果Ｃの検出枠１０１６であったため、検出結果Ｃが処理順リストから削除される。その結果、処理順リストは図１０（ｇ）に示すようなリストになる。そして、次の代表枠に対する処理に移行するため、ステップＳ９０１へ戻る。その後の処理では、処理順リストの最上位である検出結果Ａの検出枠１０１３が代表枠に設定され、検出結果Ｂに対して枠統合処理が行われ、処理順リストが図１０（ｈ）に示すようなリストになる。そして、ステップＳ９０８では、検出結果Ａの代表枠のクラスは「メガネ非着用」と決定され、ステップＳ９０８で検出結果Ａが処理順リストから削除される。その結果、ステップＳ９０１では処理順リストが空と判断され、図９に示す処理が終了する。

そして、図８のステップＳ３１０では、結果出力部２０７が検出結果データを出力する。図１０（ｉ）は検出結果データの例である。図１０（ａ）が入力画像で、図１０（ｉ）の検出結果が出力された際、それら検出結果を入力画像に重畳した画像の例が図１０（ｊ）である。なお、図１０（ｊ）では、メガネ非着用クラスを破線の矩形１０１８、メガネ着用クラスを長破線の矩形１０１９で表現されている。

以上のように本実施形態によれば、複数の検出結果を統合する順序を、信頼度を基に決定し、重複率の算出を常に１対１で実施しその都度枠統合処理を実行するため、統合対象となる枠が多数である場合でも処理が単純になり計算効率がより向上する。

（その他の実施形態）
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

２０１画像取得部、２０２物体検出部、２０３重なり判定部、２０４代表枠決定部、２０５クラス決定部、２０６結果修正部

Claims

入力画像を取得する入力手段と、
前記取得した入力画像から、物体が存在する候補領域を検出するとともに、前記物体の属性の候補を取得する検出手段と、
前記候補領域が複数の場合に、前記複数の候補領域の間の重複率を取得する重複率取得手段と、
前記候補領域の組み合わせごとに、候補領域に物体が含まれる可能性を示す信頼度が最大である候補領域を代表領域に設定し、前記代表領域との重複率が閾値以上である候補領域を削除する統合手段と、
前記候補領域に含まれる物体の属性の確率と、前記代表領域との重複率とに基づいて、前記代表領域における物体の属性を決定する決定手段と、
を有することを特徴とする情報処理装置。
前記決定手段は、前記候補領域の各組み合わせにおいて、候補領域における物体の属性の確率を、前記代表領域との重複率で重み付けした総和が最大となる属性を、前記代表領域における物体の属性とすることを特徴とする請求項１に記載の情報処理装置。
前記重複率取得手段によって取得された重複率が閾値以上である候補領域の組み合わせを取得する組み合わせ取得手段をさらに有し、
前記統合手段は、前記組み合わせ取得手段によって取得された、重複率が閾値以上である候補領域の組み合わせごとに、前記代表領域を設定することを特徴とする請求項１又は２に記載の情報処理装置。
前記重複率取得手段は、前記複数の候補領域のうち、前記統合手段によって設定された代表領域との間の重複率を取得することを特徴とする請求項１又は２に記載の情報処理装置。
前記重複率取得手段は、２つの候補領域の共通部分の面積を２つの候補領域の面積の和集合で割った値である重複率を取得することを特徴とする請求項１～４の何れか１項に記載の情報処理装置。
入力画像から、物体が存在する候補領域を検出するとともに、前記物体の属性の候補を取得する検出手段と、
前記候補領域が複数の場合に、前記複数の候補領域の間の重複率を取得する重複率取得手段と、
前記候補領域の組み合わせごとに、候補領域に物体が含まれる可能性を示す信頼度に基づいて代表領域を設定し、前記代表領域との重複率が閾値以上である候補領域を削除する統合手段と、
前記候補領域に含まれる物体の属性の確率と、前記代表領域との重複率とに基づいて、前記代表領域における物体の属性を決定する決定手段と、
を有することを特徴とする情報処理装置。
入力画像から、物体が存在する候補領域を検出するとともに、前記物体の属性の候補を取得する検出手段と、
前記候補領域に物体が含まれる可能性を示す信頼度に基づいて代表領域を設定する設定手段と、
前記代表領域との重複率が閾値以上となる前記候補領域を選択する選択手段と、
前記選択された候補領域における前記物体の属性の候補と、前記代表領域における前記物体の属性の候補と、に基づいて、前記代表領域における前記物体の属性を決定する決定手段と、を有することを特徴とする情報処理装置。
前記選択された候補領域を削除することによって、前記入力画像における物体の検出結果を前記代表領域に統合する統合手段と、
前記代表領域の位置と、前記代表領域における前記物体の属性とを、出力する出力手段と、を更に有することを特徴とする請求項７に記載の情報処理装置。
前記決定手段は、前記代表領域との重複率と、前記代表領域における前記物体の属性の候補と、に基づいて、前記代表領域における前記物体の属性を決定することを特徴とする請求項７又は８に記載の情報処理装置。
入力画像を取得する入力工程と、
前記取得した入力画像から、物体が存在する候補領域を検出するとともに、前記物体の属性の候補を取得する検出工程と、
前記候補領域が複数の場合に、前記複数の候補領域の間の重複率を取得する重複率取得工程と、
前記候補領域の組み合わせごとに、候補領域に物体が含まれる可能性を示す信頼度が最大である候補領域を代表領域に設定し、前記代表領域との重複率が閾値以上である候補領域を削除する統合工程と、
前記候補領域に含まれる物体の属性の確率と、前記代表領域との重複率とに基づいて、前記代表領域における物体の属性を決定する決定工程と、
を有することを特徴とする情報処理装置の制御方法。
入力画像から、物体が存在する候補領域を検出するとともに、前記物体の属性の候補を取得する検出工程と、
前記候補領域が複数の場合に、前記複数の候補領域の間の重複率を取得する重複率取得工程と、
前記候補領域の組み合わせごとに、候補領域に物体が含まれる可能性を示す信頼度に基づいて代表領域を設定し、前記代表領域との重複率が閾値以上である候補領域を削除する統合工程と、
前記候補領域に含まれる物体の属性の確率と、前記代表領域との重複率とに基づいて、前記代表領域における物体の属性を決定する決定工程と、
を有することを特徴とする情報処理装置の制御方法。
コンピュータを、請求項１～９の何れか１項に記載の情報処理装置が有する各手段として機能させるためのプログラム。