JP2020086994A - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2020086994A
JP2020086994A JP2018221201A JP2018221201A JP2020086994A JP 2020086994 A JP2020086994 A JP 2020086994A JP 2018221201 A JP2018221201 A JP 2018221201A JP 2018221201 A JP2018221201 A JP 2018221201A JP 2020086994 A JP2020086994 A JP 2020086994A
Authority
JP
Japan
Prior art keywords
attribute
unit
persons
objects
attribute value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018221201A
Other languages
English (en)
Inventor
一郎 梅田
Ichiro Umeda
一郎 梅田
矢野 光太郎
Kotaro Yano
光太郎 矢野
睦凌 郭
Muling Guo
睦凌 郭
内山 寛之
Hiroyuki Uchiyama
寛之 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018221201A priority Critical patent/JP2020086994A/ja
Publication of JP2020086994A publication Critical patent/JP2020086994A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)

Abstract

【課題】より高い精度で物体を計数する監視システムを提供する。【解決手段】監視システムは、監視カメラ301を用いて監視を行い、監視カメラ301の映像から予め定められた人物311、312、313の数を計数するシステムである。演算装置303は監視カメラ301から得た画像から人物を検出する検出手段と、予め定められた補正係数に基づいて、検出手段により検出された人物の数を補正することで、画像に含まれる人物の実際の数を推定する推定手段と、を有する。【選択図】図1

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。
カメラで取得した画像から物体を検出することで、物体を計数する装置や手法が提案されている。画像からの物体検出処理においては、画像に含まれる物体を全て正確に検出できる訳ではない。そこで、特許文献1には、動体検知により推定される混雑状況に応じて物体検出器を上半身か全身かの何れかに切り替え、それによる検出精度向上を以て人数計数精度を向上させる手法が開示されている。
特許第5121508号公報
特許文献1等の従来技術のように混雑状況に応じて物体検出器を上半身か全身かの何れかに切り替えても、精度良い物体の計数ができない場合がある。
本発明は、より高い精度での物体の計数の実現を支援することを目的とする。
本発明の情報処理装置は、画像から物体を検出する検出手段と、予め定められた補正係数に基づいて、前記検出手段により検出された前記物体の数を補正することで、前記画像に含まれる前記物体の実際の数を推定する推定手段と、を有する。
本発明によれば、より高い精度での物体の計数の実現を支援することができる。
監視システムのシステム構成等の一例を示す図である。 演算装置のハードウェア構成の一例を示す図である。 撮影された画像の一例を示す図である。 演算装置の機能構成の一例を示す図である。 演算装置の処理の一例を示すフローチャートである。 人物の属性の識別結果の一例を示す図である。 演算装置の処理の一例を説明する図である。 演算装置の処理の一例を説明する図である。
以下に、本発明の実施の形態を、図面に基づいて詳細に説明する。
<実施形態1>
図1は、本実施形態の監視システムのシステム構成等の一例を示す図である。監視システムは、監視カメラを用いて監視を行い、監視カメラの映像から予め定められた物体を計数するシステムである。本実施形態では、監視システムは、計数対象の物体として、人物の数を計数する。監視システムは、監視カメラ301、演算装置303を含む。監視カメラ301と演算装置303とは、ネットワーク304を介して、相互に通信可能に接続されている。本実施形態では、監視システムは、監視カメラ301を1つ含むこととする。但し、監視システムは、監視カメラ301を複数含むこととしてもよい。
監視カメラ301は、ネットワークに接続可能な監視用のネットワークカメラ等の撮像装置である。ただし、監視カメラ301は、中継用のカメラ等の監視用のカメラ以外の撮像装置であってもよい。本実施形態では、監視カメラ301は、図1に示すように、通路に配置されている。監視カメラ301は、点線302で表される範囲の撮影を行う。監視カメラ301は、この通路を歩行する人物を撮影する。図1の例では、監視カメラ301は、人物311〜313を撮影している。
監視システムは、監視カメラ301が撮影した画像にイメージ解析を施して、画像に撮影された人物を検出し、画像内の人物を計数することで、一定の期間内に、この通路を通過する人物を計数する。
演算装置303は、監視カメラ301により撮影された画像内の人物を計数するパーソナルコンピュータ(PC)、サーバ装置、タブレット装置等の情報処理装置である。
図2は、演算装置303のハードウェア構成の一例を示す図である。演算装置303は、通信部201、Central Processing Unit(CPU)202、Random Access Memory(RAM)203、ユーザインターフェース204、ストレージ装置205を含む。
通信部201は、ネットワーク304を介して、監視カメラ301との間の情報(例えば、監視カメラ301に対するコマンド、監視カメラ301により撮影された画像等)の送受信に用いられる通信装置である。CPU202は、RAM203に展開された制御プログラムを実行し、演算装置303装置全体を制御する中央演算装置である。RAM203は、制御プログラム、各種パラメータデータ、画像や各種情報が展開され、CPU202のワークエリアとして機能する記憶装置である。
ユーザインターフェース204は、キーボード、マウス、ディスプレイ、タッチパネル等のユーザーに対する情報の表示やユーザーからの情報の入力に用いられる入出力装置である。CPU202は、監視カメラ301から受信した画像を、ユーザインターフェース204のディスプレイに表示する。ストレージ装置205は、各種プログラム、各種設定情報、監視カメラ301により撮影された画像等の情報を記憶するハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)等の記憶装置である。
CPU202が、ストレージ装置205に記憶されたプログラムにしたがって処理を実行することで、図1で後述する演算装置303の機能、及び、演算装置303の処理が実現される。
図3は、演算装置303がユーザインターフェース204に表示する、監視カメラ301により撮影された画像の一例を示す図である。図3の画像は、図1に示される状況で監視カメラ301により撮影された画像である。図3の画像には、人物311〜人物313が映っていることが分かる。
本実施形態では、監視システムは、監視カメラ301により予め定められた期間の間に撮影された動画像である画像から人物を検出し、計数する。より具体的には、監視システムは、画像中に仮想的に線分401を設け、イメージ解析を用いて、ある期間内に、監視カメラ301の視野奥行方向から手前方向に向かって線分401を通過した人物を検出し、検出した人物を計数する。そして、監視システムは、人物の検出に失敗が生じることを前提として予め定められた補正係数を、計数した数に乗じることで、その期間内に、実際に線分401を通過した人物の数を推定する。
図4は、演算装置303の機能構成の一例を示す図である。演算装置303は、検出部101、識別部102、計数部103、不明数分配部104、補正部105、属性別演算部106、属性間調整部107、属性別分配部108を含む。
検出部101は、監視カメラ301から得た画像内の人物を検出する。識別部102は、検出部101により検出された人物の予め定められた属性についての属性値を識別する。人物の属性とは、人物の有する性質であり、例えば、性別、年齢、身長等である。例えば、性別は、「男」と「女」の2つの属性値を取り得る。計数部103は、属性値ごとに、その属性値に対応する人数を計数する。不明数分配部104は、属性値が不明とされた物体の数を、それ以外の属性値それぞれに対応する数として分配する。
補正部105は、属性値ごとに計数された人物の数を、属性値ごとに予め定められた補正係数を用いて補正する。属性別演算部106は、補正部105により得られた補正後の人物の数に基づいて、人物の実際の数を推定する。属性間調整部107は、属性別演算部106により推定された人物の数に基づいて、実際の人物の数の最終的な推定値を求める。属性別分配部108は、属性間調整部107により求められた推定値を、属性値ごとに分配する。各部の処理については、後に詳述する。
図5は、演算装置303の処理の一例を示すフローチャートである。
S501において、検出部101は、監視カメラ301から受信された画像から人物を検出して、その画像における人物領域を求め、求めた人物領域に外接する矩形をその画像内に設定する。検出部101は、以上の処理を、人体の計測を行う期間の間、監視カメラ301から動画像のフレーム画像を受信する度に実行する。検出部101は、以下の参考文献1に開示される手法を用いて、画像から物体を検出する。参考文献1には、事前に大量の人物の画像から人物の形状の近似を統計的に求めておき、その人物形状に類似する領域を入力画像内から探索する手法が開示されている。本実施形態では、検出部101は、顔形状、上半身形状、全身形状等の人物の形状のうちの1つの形状に基づいて、人物を検出する。
参考文献1:Chengbin Zeng、 Huadong Ma、 Robust Head−shoulder Detection by PCA−Based Multilevel HOG−LBP Detector for People Counting、 ICPR2010
物体の検出には、画像から物体の形状の近似に類似する領域を探索する手法が用いられる。ただし、このような物体の探索は、時折失敗し、結果として未検出や誤検出が発生する場合がある。
図3の例では、人物312、313には、検出結果を示す矩形が外接されており、人物312、313が検出されたことが示されている。また、人物311には、矩形が外接されておらず、人物311の検出が失敗したことが示されている。未検出数と誤検出数とは、トレードオフの関係である。しかし、本実施形態では、未検出数が誤検出数の数倍から数百倍程度多いと仮定する。即ち、誤検出数は、未検出数に比して無視できる程度に小さいと仮定する。
S502において、識別部102は、検出部101により検出された人体の領域から属性値を識別する。本実施形態においては、識別部102は、図6に示す性別属性、年齢属性、身長属性、髪色属性、髪型属性、メガネ着用の有無属性、マスク着用の有無属性の6つの属性それぞれについての属性値を識別する。識別部102が識別した属性値の一例を、図6に示す。属性値には、例えば、性別属性についての「男」及び「女」、年齢属性についての「31」、「42」等、メガネ着用の有無属性についての「有り(真)」及び「無し(偽)」等がある。本実施形態では、演算装置303においては、人物が属性に係る複数の属性値のうち何れかの属性値を取り得るように、識別対象の各属性に対する属性値を定めておくものとする。
本実施形態では、演算装置303は、以下のS503〜S506の処理において、予め定められた複数の属性に属する人物の数に基づいて、監視カメラ301により撮影された画像内の人物の実際の数を推定する。
本実施形態では、識別部102は、複数の属性それぞれについて、人物の属性値を識別する。識別部102は、人物の個々の属性値として、ある範囲内の実数値、又は、列挙型集合のうちのある値の何れかを出力する。図6の例では、性別属性の属性値は、列挙集合(「男」、「女」)の何れかの値となる。また、年齢属性や身長属性の属性値は、実数値の値となる。また、メガネ着用の有無属性やマスク着用の有無属性の属性値は、列挙集合(「真」、「偽」)の何れかの値となる。
本実施形態では、識別部102は、以下の参考文献2に開示された手法を用いて、人物の属性値を識別する。参考文献2には、属性値が既知である大量の人体画像を収集して、その属性値に対応する外見の傾向を統計的に求め、その統計的傾向に基づき人体の外見から属性値を識別する手法が開示されている。このような属性値識別手法は、統計に基づく為、必ずしも正しく属性値を識別できる訳ではなく、誤って識別したり、識別できなかったりする事態が生じうる。これに対応すべく、識別部102は、人物の属性値の識別ができなかったり、識別結果の確からしさが閾値未満であったりする場合、その人物の属性を、「不明」という仮の属性値とする。
参考文献2:Neeraj Kumar, Alexander C. Berg, Peter N. Belhumeur, Shree K. Nayar, Attribute and Simile Classifiers for Face Verification, ICCV2009
ただし、識別部102は、他の手法で、人物の属性値を識別してもよい。例えば、識別部102は、以下の参考文献3に記載の手法を用いて、身長属性の属性値を識別してもよい。参考文献3には、視差が既知のステレオカメラ画像での顔検出結果から身長を求める手法が開示されている。参考文献3の手法では、属性値の誤認識は無視できる程に小さいと仮定される。しかし、識別部102は、属性値の識別が何らかの理由によって不可能な場合等、属性値の値を「不明」とする。
参考文献3:特許第5170130号公報
なお、本実施形態では、識別部102は、ある人物が線分401を通過した場合にのみ、その人物の属性値を識別する。識別部102は、検出部101により設定されたその人物の領域に外接する矩形における予め定められた位置(例えば、矩形の上辺の中点、矩形の中点等)が線分401を通過した場合に、その人物が線分401を通過したと判断する。ただし、識別部102は、ある人物が線分401を通過した場合以外にも、その人物の属性値を識別してもよい。例えば、識別部102は、ある人物が画面上に存在する期間中ずっと属性値の識別処理の実行を繰り返して、識別処理の結果から統計的に物体の属性値を求めてもよい。この場合、識別部102は、物体の属性が列挙集合であれば、多数決で決定し、実数値であれば、平均を取ることで、属性値の最終的な値を求める。
また、本実施形態では、識別部102は、年齢属性や身長属性の属性値のように実数値で表される属性値について、以下のようにして疑似的に列挙集合型の属性値として扱う。即ち、識別部102は、属性値の実数値が取りうる範囲が分割された複数の区分それぞれをこの属性において取り得る属性値として扱う。識別部102は、実数型の属性値が属する区分を特定し、特定した区分をその属性値の値として扱う。
本実施形態では、年齢属性の属性値が取り得る値は、「10歳未満の区分」、「10歳以上20歳未満の区分」、「20歳以上40歳未満の区分」、「40歳以上60歳未満の区分」、「60歳以上の区分」であるとする。そのため、識別部102は、ある人物の年齢属性の属性値として、「17」と識別した場合、10歳以上20歳未満の範囲であるため、その人物の年齢属性の属性値を、「10歳以上20歳未満の区分」とすることとなる。
また、本実施形態では、身長属性の属性値が取り得る値は、「140cm未満の区分」、「140cm以上160cm未満の区分」、「160cm以上180cm未満の区分」、「180cm以上200cm未満の区分」、「200cm以上の区分」であるとする。そのため、識別部102は、ある人物の身長属性の属性値として、「170cm」と識別した場合、160cm以上180cm未満の範囲であるため、その人物の身長属性の属性値を、「160cm以上180cm未満の区分」とすることとなる。
S503において、計数部103は、各属性値を処理対象の属性値として、処理対象の属性値に対応する人物の人数を計数する。RAM203には、予め定められた複数の属性それぞれに属する各属性値に対応する人物の係数に用いられる変数である計数用変数が、全て0に初期化された上で記憶されているとする。そして、計数部103は、識別部102により、線分401を通過した人物について、予め定められた複数の属性それぞれについての属性値が求められた場合、以下のようにする。計数部103は、識別部102により求められたその人物の属性値それぞれに対応する係数用変数の値に1を追加する。
前述の通り、演算装置303においては、いずれの属性についても、人物がその属性に係る複数の属性値のうちいずれかに属するように属性に係る属性値が設定されている。そのため、最終的には、ある属性に係る複数の属性値それぞれに対応する計数用変数の値を合計すると、検出部101により検出された人物の数の合計となる。
図7を用いて、演算装置303の処理の一例について説明する。図7の表A〜Cは、演算装置303の処理の結果を示す表である。表Aは、性別属性を基準とした処理の結果を示す表である。表Bは、年齢属性を基準とした処理の結果を示す表である。表Cは、身長属性を基準とした処理の結果を示す表である。
表A〜表Cは、行の項目として、対応する属性に属する各属性値を示す項目と、列毎の合計を示す「計」の項目と、を含む。
表A〜表Cは、列の項目として、計数部103による処理の結果を示す「人数」の項目と、不明の属性値の人物の数の分配の比率を示す「不明分配比率」の項目と、不明数分配部104による処理の結果を示す「不明分配済み人数」の項目と、を含む。また、表A〜表Cは、列の項目として、対応する属性値を有する人物についての検出部101による検出率を示す「検出率」の項目と、補正部105と属性別演算部106との処理の結果を示す「補正後人数」の項目と、を含む。また、表A〜表Cは、属性ごとに補正された人物の総数に対する各属性値を有する人物の数の割合を示す「補正後割合」の項目と、属性間調整部107と属性別分配部108との処理の結果を示す「再分配」の項目と、を含む。
図7の例では、表A〜Cそれぞれの「人数」の項目が示すように、検出部101により計47147人の人物が検出されている。また、表Aの「人数」の項目が示すように、検出された人物のうち24044人が、識別部102により性別属性の属性値が「男」であると識別されている。
また、検出された人物のうち22159人が、識別部102により性別属性の属性値が「女」であると識別されている。また、検出された人物のうち944人について、識別部102による性別属性の属性値の識別が失敗しており、「不明」となっている。
図5に戻り、S504において、不明数分配部104は、属性ごとに、属性値が「不明」に対応する人数を、その属性に属する各属性値に対応する人数として分配する。
不明数分配部104は、「不明」に対応する人数の分配の比率である不明分配比率にしたがって、「不明」に対応する人数を、各属性値に対応する人数として分配する。本実施形態では、性別属性と年齢属性とについての各属性値の不明分配比率は、予め定められているとする。
本実施形態では、性別属性の各属性値についての不明分配比率は、男性と女性とは均等に出現するとの仮定に基づいて、「男」についての不明分配比率と「女」についての不明分配比率とが等しくなるように予め定められている。表Aの不明分配比率の項目が示すように、「男」についての不明分配比率と「女」についての不明分配比率とは、共に0.5である。
また、本実施形態では、年齢属性の各属性値についての不明分配比率は、予め取得された出現する人物の年齢分布に基づいて予め定められている。表Bの不明分配比率の項目が示すように、「10歳未満の区分」についての不明分配比率は、0.1である。また、「10歳以上20歳未満の区分」についての不明分配比率は、0.2である。また、「20歳以上40歳未満の区分」についての不明分配比率は、0.4である。また、「40歳以上60歳未満の区分」についての不明分配比率は、0.2である。また、「60歳以上の区分」についての不明分配比率は、0.1である。
不明数分配部104は、以下の式1を用いて、各属性について、「不明」に対応する人数を、各属性値に対応する人数に分配する。式1における不明分配済み人数は、「不明」に対応する人数が分配された後の、各属性値に対応する人数である。
不明分配済み人数 = その属性値の人数 + 「不明」に対応する人数 × その属性値の不明分配比率 (式1)
表Aの例では、不明数分配部104は、「男」に対応する人数(24044)に、「不明」に対応する人数(944)に「男」に対応する不明分配比率(0.5)を乗じた値(477)を加える。このようにして、不明数分配部104は、「不明」に対応する人数を、「男」に対応する人数として分配する。同様に、不明数分配部104は、「不明」に対応する人数を、「女」に対応する人数として分配する。表Aの「不明分配済み人数」に示されるように、「不明」に対応する人数が各属性値に対応する人数に分配された結果、「男」に対応する人数は、24516となる。また、「女」に対応する人数は、22631となる。
また、本実施形態では、不明数分配部104は、身長属性については、属性値の誤認識は無視できるとの仮定の上で、「不明」に対応する人数を、認識に成功した身長の分布に従って分配する。より具体的には、不明数分配部104は、以下の式2を用いて、身長属性の各属性値について、不明分配比率を決定する。
不明分配比率 = その属性値の人数 / (属性値不明以外の人数) (式2)
表Cの不明分配比率の項目には、式2を用いて決定された不明分配比率が示されている。
S505において、補正部105は、不明数分配部104により各属性値について求められた不明分配済み人数を、予め定められた補正係数を用いて補正する。本実施形態では、この補正係数は、検出部101による各属性値を有する人物の検出率である。検出率とは、検出部101がある属性値を有する人物のうちどれだけの割合の人物を検出できるかを示す指標である。本実施形態では、この検出率は、予め用意された多数の画像に対する検出部101による人物の検出結果に基づいて、予め定められている。補正部105は、検出率に基づいて、各属性値に対応する人数を、補正することで、検出部101による検出失敗の影響をより低減した上での人物の計数に寄与できる。
より具体的には、補正部105は、以下の式3を用いて、不明分配済み人数を補正する。式3の補正後人数は、不明分配済み人数が補正された値を示す。
補正後人数 = 不明分配済み人数 × (1/その属性値に対応する検出率) (式3)
表A〜Cの「検出率」の項目には、各属性値について予め定められた検出率が示されている。表Aの例では、「検出率」の項目に示されるように、「男」の人物についての検出部101の検出率は、0.9である。また、「女」の人物についての検出部101の検出率は、0.7である。
表A〜Cの「補正後人数」の項目には、補正部105により求められた補正後人数の値が示されている。表Aの例では、「男」に対応する不明分配済み人数が24516人であり、「男」に対応する検出率が0.9であるので、補正後人数は、24516 × (1/0.9)=27240となる。
S505で属性値ごとに求められる補正後人数は、監視カメラ301により撮影された画像内にその属性値に対応する人物の実際の数の推定値である。
S506において、属性別演算部106は、属性のそれぞれについて、各属性値に対応する補正後人数の総和を求めることで、属性ごとに人物の実際の数を推定する。
表A〜表Cの「補正後人数」の列の「計」の項目には、属性別演算部106により推定された属性ごとの人物の数の推定値が示される。表A〜表Cから分かるように、属性ごとに、属性別演算部106により推定された人物の数は異なる。
S507において、属性間調整部107は、属性別演算部106により属性ごとに求められた人物の数の推定値の平均値を求める。そして、属性間調整部107は、求めた平均値を、検出部101により検出失敗を考慮した人物の数の最終的な推定値として決定する。本実施形態では、属性間調整部107は、以下の式4に示すように、属性別演算部106により属性ごとに求められた人物の数の推定値の算術平均を取ることとする。しかし、属性間調整部107は、算術平均ではなく、幾何平均や調和平均を取ることとしてもよい。
最終的な推定人数 = (性別属性についての補正後人数 + 年齢属性についての補正後人数 + 身長属性についての補正後人数) ÷ 3 (式4)
図7の例では、式4の結果は、(59570+56578.6489+52132.6184)/3=56093.75578となる。
属性間調整部107は、求めた最終的な人物の数の推定値を、ユーザインターフェース204の表示部に表示したり、ストレージ装置205に記憶したりすることで出力する。
また、属性別分配部108は、属性ごとに、属性間調整部107により求められた最終的な推定人数を、各属性値に対応する人数として分配する。属性別分配部108は、属性に属する各属性値に対応する補正後人数のその属性における補正後人数の合計に対する割合(以下では、補正後割合とする)に応じて、補正後の人数を分配する。
属性別分配部108は、以下の式5を用いて、各属性値についての補正後割合を求める。
補正後割合 = その属性値の補正後人数 ÷ その属性の補正後人数の総和 (式5)
表A〜Cの「補正後割合」の項目に式(6)で求められた補正後割合が示される。
そして、属性別分配部108は、以下の式6を用いて各属性値について、属性間調整部107により求められた最終的な推定人数を分配する。
再分配人数 = 物体検出の精度低下を補正した人数 × その属性値の補正後割合 (式6)
表A〜Cの「再分配」の項目には、式6の結果が示される。
以上、本実施形態では、監視システムは、監視カメラ301により撮影された画像から検出された人物の数を、予め定められた検出率に基づいて、補正することで、その画像内の人物の実際の数を推定した。これにより、監視システムは、混雑以外の理由で人物の検出率の低下が生じるような場合でも、より精度よくその画像内の人物の実際の数を推定できる。結果として、監視システムは、より高い精度での物体の計数の実現を支援することができる。
更に、監視システムは、予め定められた属性それぞれを基準として、画像内の人物の実際の数を推定し、推定した数の平均値を最終的な推定値とした。監視システムは、より多くの属性を基準として、画像内の人物の実際の数を推定し、平均を取ることで、より精度よく画像内の人物の実際の数を推定することが期待できる。
更に、監視システムは、属性値ごとに人数を補正しているため、検出率の低下と属性値との相関に応じたより適切な補正を行うことが期待できる。
第1の変形例について説明する。本実施形態では、監視システムは、複数の属性それぞれを基準として、監視カメラ301により撮影された画像内の人物の数の推定値を求めて、求めた推定値の平均を最終的な推定値として求めることとした。
ただし、監視システムは、1つの属性を基準として、監視カメラ301により撮影された画像内の人物の数の推定値を求めて、求めた推定値を、最終的な推定値としてもよい。その場合、属性別演算部106は、S506で、その属性の各属性値に対応する補正後人数の総和を、最終的な人物の数の推定値として求める。そして、属性別演算部106は、求めた推定値を出力する。
また、監視システムは、S505で属性値ごとに求められた人物の数を、その属性値に対応する人物の数の推定値として出力してもよい。
第2の変形例について説明する。監視システムは、検出された物体の数を、物体の数に対して予め定められた補正計数に基づいて補正することで実際の数を推定すればよく、そのための具体的な処理は実施形態に限定されるものではない。例えば、ある監視領域における過去の検出結果から検出率が予めわかっているとする。この場合には、監視システムは、検出された人物の数を、予めわかっている検出率に基づいて補正してもよい。このように、監視システムの処理は、属性に係る各属性値の物体の数を補正するものに限定されるものではない。
第3の変形例について説明する。本実施形態では、監視システムは、監視カメラ301により撮影された画像内から検出された人物の属性値を識別し、属性値ごとに人物の数を計数し、計数した数を属性値ごとの補正係数を用いて補正した。しかし、監視システムは、他の方法で、属性値ごとの人物の数を求めてもよい。例えば、男性と女性の出現率が等分であることが予めわかっているとする。この場合には、監視システムは、監視カメラ301により撮影された画像内から検出された人物の数を、半々に振分けることで、「男」に対応する人物の数と、「女」に対応する人物の数と、を特定してもよい。このように、監視システムは、属性に係る複数の属性値の比に基づいて、属性値毎の人物の数を求めてもよい。
第4の変形例について説明する。本実施形態では、検出部101による人物の検出率は、予め定められているものとした。ただし、演算装置303は、検出部101による人物の検出率を動的に求めてもよい。例えば、演算装置303は、監視カメラ301により撮影された一定期間の動画像から検出部101により検出された人物の数と、その動画像内に存在する人物の数として演算装置303の入力部を介して指定された数と、の比を検出率としても求めてもよい。
第5の変形例について説明する。本実施形態では、監視システムは、人物が取り得る属性値の区分である属性として、性別属性、年齢属性、身長属性を用いた。しかし、監視システムは、他の属性を用いることとしてもよい。例えば、監視システムは、人物がどの方向を向いているかを示す属性である向き属性を用いてもよい。監視カメラ301が広場等の人物の歩行方向を限定できない場所に設置されているとする。
この場合、識別部102は、人物の撮影された際の向きを、向き属性の属性値として識別してもよい。そして、監視システムは、向きごとに人物を計数し、向きごとに計数した人数を、向きごとに予め定められた検出率に基づいて補正し、合計をとる。このようにして、監視システムは、向き属性を基準として、監視カメラ301により撮影された画像内の人物の実際の数を推定する。画像からの物体検出技術では撮影角度に応じて、検出率が異なる場合があり、このような処理により、監視システムは、より精度よく、人物の数を推定できる。
第6の変形例について説明する。本実施形態では、検出部101は、顔形状、上半身形状、全身形状等の人物の形状のうちの1つの形状に基づいて、人物を検出することとした。ただし、検出部101は、顔形状、上半身形状、全身形状等の人物の形状のうちの複数の形状それぞれに基づいて、人物を検出することとしてもよい。
その場合、検出部101は、監視カメラ301に向かって歩行する人物についてはその顔形状に基づきより高精度に検出できる。また、検出部101は、監視カメラ301に背を向ける人物については上半身形状や全身形状に基づく検出により検出精度が、顔形状を用いる場合よりも低下する場合がある。この場合、監視システムは、検出部101が検出に用いた人物の形状の種類ごとに、属性を別途設けることとしてもよい。そして監視システムは、それらの属性それぞれを基準として、人物の数を推定し、推定した人物の数の平均を最終的な推定値としてもよい。
第7の変形例について説明する。本実施形態では、監視システムは、監視カメラ301により予め定められた期間の間に撮影された動画像である画像から人物を検出し、計数することとした。ただし、監視システムは、動画像ではなく静止画像である画像内の人物の数を計数することとしてもよい。
<実施形態2>
本実施形態では、異なる属性同士を組み合わせた属性を基準とした処理について説明する。
本実施形態の監視システムのシステム構成は、実施形態1と同様である。また、演算装置303のハードウェア構成及び機能構成についても、実施形態1と同様である。
属性同士で検出率に相関がある場合があるとする。この場合、属性を集合、属性に属する属性値を元として見た時の直積集合を新たな属性と解釈する。以下では、複数の属性同士の直積で表される属性を結合属性とする。
図6に示す属性のうち、メガネ着用の有無属性とマスク着用の有無属性との検出率には、相関がある。なぜならば、顔検出では目や口を強く参照して検出し一方が失敗しても他方が補う様な関係になり、眼と口の双方が隠れる場合の検出率の低下は、何れか一方が隠れる場合の検出率の低下の和や積よりもずっと大きくなるからである。本実施形態の監視システムは、メガネ着用の有無属性とマスク着用の有無属性との組み合わせ(直積)で表される結合属性を、1つの属性(以下では、メガネ・マスク属性)として、S501〜S507と同様の処理を行う。
このメガネ・マスク属性において人物の取り得る属性値は、「(メガネなし、マスクなし)偽、偽」、「(メガネあり、マスクなし)真、偽」、「(メガネなし、マスクあり)偽、真」、「(メガネあり、マスクあり)真、真」の4つとなる。
本実施形態では、監視システムは、性別属性、年齢属性、身長属性、メガネ・マスク属性それぞれを基準として、実施形態1と同様の処理で、監視カメラ301により撮影された画像内の人物の数を計数し、人物の実際の数を推定する。
識別部102は、検出部101により検出された人体に対して、メガネ・マスク属性について、図6の領域511に示される様に属性値を識別する。ただし、識別部102は、「不明」の属性値を識別していないとする。そのため、本実施形態では、不明数分配部104は、メガネ・マスク属性については、S504の処理を実行しない。
図8の表Dは、本実施形態の演算装置303のメガネ・マスク属性を基準とした処理の結果を示す表である。表Dは、行の項目として、メガネ・マスク属性に属する各属性値を示す項目と、列毎の合計を示す「計」の項目と、を含む。
表Dは、列の項目として、計数部103による処理の結果を示す「人数」の項目と、対応する属性値を有する人物についての検出部101による検出率を示す「検出率」の項目と、を含む。また、表Dは、列の項目として、補正部105と属性別演算部106との処理の結果を示す「補正後人数」の項目と、属性ごとに補正された人物の総数に対する各属性値を有する人物の数の割合を示す「補正後割合」の項目を含む。また、表Dは、列の項目として、属性間調整部107と属性別分配部108との処理の結果を示す「再分配」の項目と、を含む。
表Dの「検出率」の項目を見ると、属性値「偽、偽(メガネ・マスクともに無し)」に対応する検出率は、0.9である。また、属性値「真、偽(メガネ有り・マスク無し)」に対応する検出率は、0.8である。また、属性値「偽、真(メガネ無し・マスク有り)」に対応する検出率は、0.7である。
「真、偽」に対応する検出率の、「偽、偽」に対応する検出率に対する低下の割合は、1−(8/10)÷(9/10)=1/9となる。即ち、人物がメガネを着用することで、メガネもマスクも着用していない状態に比べて、検出率が1/9低下する。また、「偽、真」に対応する検出率の、「偽、偽」に対応する検出率に対する低下の割合は、1−(7/10)÷(9/10)=2/9となる。即ち、人物がマスクを着用することで、メガネもマスクも着用していない状態に比べて、検出率が2/9低下する。
仮に、メガネ着用の有無属性と、マスク着用の有無属性と、が互いに独立であり、相関がないとする。その場合、「真、真」に対応する検出率は、(9/10* (1−(1/9+2/9))=0.6となるはずである。しかし、表Dに示されるように、「真、真」に対応する検出率は、0.3となっており、理論値よりも低い値となっている。そのため、メガネ着用の有無属性と、マスク着用の有無属性と、は相関があることが示されている。
本実施形態では、属性間調整部107は、性別属性、年齢属性、身長属性、メガネ・マスク属性それぞれを基準として、S506までの処理で求まった人物の数の推定値を平均して、最終的な推定値を求める。図8に示されるように、メガネ・マスク属性について、S506までの処理で求まった人物の数の推定値は、55382.123である。また、性別属性、年齢属性、身長属性、それぞれについて求まった人物の数の推定値は、実施形態1と同様に、59570、56578.6498、52132.6184である。そのため、属性間調整部107は、最終的な推定値を、(59570+56578.6489+52132.6184+55382.123)÷4=55915.84759と求める。
そのため、属性別分配部108は、55915.84759を属性値ごとに分配する。
以上、本実施形態では、監視システムは、複数の相関する属性を組み合わせて新たに1つの属性として扱うこととした。監視システムは、相関のある複数の属性を1つの属性として、人物の数を推定することで、これらの属性を独立した別個の属性として扱う場合よりも、精度よく画像内の人物の数を推定できる。
本実施形態では、2つの属性値を取り得る2つの相関する属性同士の組合せを1つの属性として扱うこととした。但し、監視システムは、3以上の属性値を取り得る3以上の相関する属性同士の組合せを、1つの属性として扱うこととしてもよい。
<実施形態3>
実施形態1では、監視システムは、計数対象である人物が取り得る各属性値について予め定められた検出率に基づいて、検出部101により検出された人物の数を補正した。
本実施形態では、監視システムは、監視カメラ301により撮影された画像自体の属性値について予め定められた検出率に基づいて、その画像に含まれる人物の実際の数を推定する。
本実施形態の監視システムのシステム構成は、実施形態1と同様である。また、演算装置303のハードウェア構成及び機能構成についても、実施形態1と同様である。
本実施形態の演算装置303の処理を説明する。
検出部101は、実施形態1と同様に、監視カメラ301により撮影された画像から人物を検出する。
本実施形態では、識別部102は、検出部101により検出された人物それぞれについては、属性値を識別しない。識別部102は、検出部101により検出された人物の総数を、その画像に対応する環境における人物の混雑の度合を示す属性値である混雑度として決定する。このとき混雑度が上がればある人物が他人を隠す頻度が上がり検出部101の検出率は下がる。このため、混雑度が上がれば補正部105の検出精度補正係数は大きくなり、これを補正することができる。
本実施形態では、混雑度の値に応じた検出部101による人物の検出率が予め定められている。
続いて、補正部105は、検出部101により検出された人物の数を、識別部102により決定された混雑度に応じた検出率に基づいて、補正し、補正した値を、監視カメラ301により撮影された画像内の人物の実際の数の推定値とする。
また、属性間調整部107は、この推定値と、実施形態1におけるS501〜S506の処理により属性ごとに求められた監視カメラ301により撮影された画像内の人物の実際の数の推定値と、の平均をとり、最終的な推定値としてもよい。
<実施形態4>
実施形態1では、補正部105は、検出部101による人物の検出率に基づいて、監視カメラ301により撮影された画像から検出された人物の数を補正することとした。本実施形態では、補正部105は、検出部101による人物の検出率以外の補正係数を用いて、人物の数を補正する処理を説明する。
本実施形態の監視システムのシステム構成は、実施形態1と同様である。また、演算装置303のハードウェア構成及び機能構成についても、実施形態1と同様である。
本実施形態では、監視システムは、人物の検出率以外の検出部101の特性に基づいて定められた補正係数を用いて、検出部101により検出された人物の数を補正する。
検出部101が検出できる物体が、人物の顔のみであるとする。すなわち、検出部101は、図3に示した通路で監視カメラ301に向かっている人物しか検出しないという特性を持つとする。この場合、監視カメラ301に背を向ける人物と監視カメラ301に向かっている人物との比率が、予め補正係数として定められているとする。補正部105は、この補正係数を求めることで、監視カメラ301により撮影された画像内における検出された人物(監視カメラ301に向かっている人物)と、監視カメラ301に背を向けている人物と、の合計の数を推定できる。
例えば、ある画像から検出部101により監視カメラ301に向かっている人物が10人検出されたとする。そして、監視カメラ301に背を向ける人物と監視カメラ301に向かっている人物との比率(監視カメラ301に背を向ける人物の数/監視カメラ301に向かっている人物の数)である補正係数が、2であるとする。補正部105は、以下の式を用いて、監視カメラ301に向かっている人物の数(10人)を補正する。
監視カメラ301に向かっている人物の数(10)+監視カメラ301に向かっている人物の数(10)×補正係数(2)=30
検出部101が、100分の計数期間のうち10分間だけ人物の検出を行うという特性持つとする。この場合、計数期間と検出部101により検出が行われる期間との比率(計数期間(100分)/検出部101により検出が行われる期間(10分))が、予め補正係数(10)として定められているとする。補正部105は、この補正係数を求めることで、計数期間全体を通しての監視カメラ301により撮影された画像内における人物の数を推定できる。
例えば、ある画像から検出部101により監視カメラ301に向かっている人物が10人検出されたとする。補正部105は、以下の式を用いて、監視カメラ301に向かっている人物の数(10人)を補正する。
監視カメラ301に向かっている人物の数(10)×補正係数(10)=100
以上、本実施形態の処理により、監視システムは、検出部101の特性に応じた補正係数で、検出された人数を補正することで、より適切に補正できる。
<その他の実施形態>
実施形態1〜4では、監視システムは、人物を計数することとした。ただし、監視システムは、車両や動物等の人物以外の物体を計数することとしてもよい。
例えば、車両を計数することとする場合、検出部101は、大量の車画像に基づいて参考文献1に基づき車を検出することができる。また、車種、車高、車色、等ごとに収集された画像に基づいて学習された識別部102を用いることで、車量の属性値を識別できる。属性値ごとの検出部101による車両の検出率を求めておくことで補正部105による処理を実現できる。このように、監視システムは、車両を計数できる。
また、実施形態1〜4では、演算装置303が、物体の計数処理を実行することとした。ただし、監視カメラ301が、物体の計数処理を実行することとしてもよい。
その場合、監視カメラ301は、図2で説明した演算装置303のハードウェア構成と同様のハードウェア構成要素を含む情報処理装置となる。そして、監視カメラ301のCPUが、監視カメラ301のストレージ装置に記憶されたプログラムにしたがって処理を実行することで、図4を用いて説明した機能と同様の機能、図5で説明した処理と同様の処理等が実現される。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
例えば、上述した監視システムの機能構成の一部又は全てをハードウェアとして演算装置303に実装してもよい。以上、本発明の実施形態の一例について詳述したが、本発明は係る特定の実施形態に限定されるものではない。例えば、上述した各実施形態を任意に組み合わせる等してもよい。
301 監視カメラ
303 演算装置
202 CPU

Claims (7)

  1. 画像から物体を検出する検出手段と、
    予め定められた補正係数に基づいて、前記検出手段により検出された前記物体の数を補正することで、前記画像に含まれる前記物体の実際の数を推定する推定手段と、
    を有する情報処理装置。
  2. 前記検出手段により検出された前記物体の、予め定められた属性に係る属性値のうち、処理対象の属性値に対応する物体の数を計数する計数手段と
    をさらに有し、
    前記推定手段は、前記処理対象の属性値に対して予め定められた前記補正係数に基づいて、前記計数手段により計数された前記物体の数を補正することで、前記画像に含まれる前記処理対象の属性値に対応する前記物体の実際の数を推定する請求項1記載の情報処理装置。
  3. 前記計数手段は、前記属性が取り得る複数の属性値それぞれに対応する物体の数を計数し、
    前記推定手段は、前記複数の属性値それぞれに対して予め定められた前記補正係数に基づいて、各属性値に対して計数された物体の数を補正し、補正した各属性値に対する物体の数に基づいて、前記物体の実際の数を推定する請求項2記載の情報処理装置。
  4. 前記計数手段は、複数の属性それぞれに対し、前記属性が取り得る複数の属性値それぞれに対応する物体の数を計数し、
    前記推定手段は、複数の属性それぞれについて推定した前記物体の実際の数に基づいて、前記物体の実際の数の最終的な値を推定する請求項3記載の情報処理装置。
  5. 前記推定手段は、前記検出手段の特性に基づいて決定された前記補正係数に基づいて、前記検出手段により検出された前記物体の数を補正する請求項1乃至4何れか1項記載の情報処理装置。
  6. 情報処理装置が実行する情報処理方法であって、
    画像から物体を検出する検出ステップと、
    予め定められた補正係数に基づいて、前記検出ステップで検出された前記物体の数を補正することで、前記画像に含まれる前記物体の実際の数を推定する推定ステップと、
    を含む情報処理方法。
  7. コンピュータを、請求項1乃至5何れか1項記載の情報処理装置の各手段として、機能させるためのプログラム。
JP2018221201A 2018-11-27 2018-11-27 情報処理装置、情報処理方法及びプログラム Pending JP2020086994A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018221201A JP2020086994A (ja) 2018-11-27 2018-11-27 情報処理装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018221201A JP2020086994A (ja) 2018-11-27 2018-11-27 情報処理装置、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2020086994A true JP2020086994A (ja) 2020-06-04

Family

ID=70908328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018221201A Pending JP2020086994A (ja) 2018-11-27 2018-11-27 情報処理装置、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2020086994A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022050217A1 (ja) * 2020-09-01 2022-03-10 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム
JP2022185634A (ja) * 2021-06-03 2022-12-15 ソフトバンク株式会社 端末装置、情報処理装置、情報処理方法、情報処理プログラムおよび情報処理システム
EP4336464A1 (en) 2022-07-05 2024-03-13 NEC Corporation Image analysis apparatus, image analysis method, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022050217A1 (ja) * 2020-09-01 2022-03-10 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム
JP2022185634A (ja) * 2021-06-03 2022-12-15 ソフトバンク株式会社 端末装置、情報処理装置、情報処理方法、情報処理プログラムおよび情報処理システム
JP7387677B2 (ja) 2021-06-03 2023-11-28 ソフトバンク株式会社 端末装置、情報処理装置、情報処理方法、情報処理プログラムおよび情報処理システム
EP4336464A1 (en) 2022-07-05 2024-03-13 NEC Corporation Image analysis apparatus, image analysis method, and program

Similar Documents

Publication Publication Date Title
US11320904B2 (en) Interactive motion-based eye tracking calibration
CN109477951B (zh) 在保护隐私的同时识别人及/或识别并量化疼痛、疲劳、情绪及意图的系统及方法
US11747898B2 (en) Method and apparatus with gaze estimation
US8724845B2 (en) Content determination program and content determination device
US9848170B2 (en) System and method for improving communication productivity
JP2020086994A (ja) 情報処理装置、情報処理方法及びプログラム
JP6822482B2 (ja) 視線推定装置、視線推定方法及びプログラム記録媒体
Cao et al. Predicting gender and weight from human metrology using a copula model
Poonsri et al. Fall detection using Gaussian mixture model and principle component analysis
US20200242800A1 (en) Determination apparatus and method for gaze angle
JP2007102482A (ja) 自動計数装置、プログラムおよび方法
JP6349448B1 (ja) 情報処理装置、情報処理プログラム、及び、情報処理方法
JP2019040592A (ja) 情報処理装置、情報処理プログラム、及び、情報処理方法
JP2020154808A (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
US20220309704A1 (en) Image processing apparatus, image processing method and recording medium
JP7439932B2 (ja) 情報処理システム、データ蓄積装置、データ生成装置、情報処理方法、データ蓄積方法、データ生成方法及び記録媒体、並びに、データベース
JP2014191479A (ja) 顔認識装置、撮像装置、制御方法、及びプログラム
CN114694235A (zh) 眼睛注视跟踪系统、相关方法和计算机程序
WO2023152841A1 (ja) 画像処理システム、画像処理方法及び非一時的なコンピュータ可読媒体
Choi et al. Gmm-based saliency aggregation for calibration-free gaze estimation
WO2023209809A1 (ja) 情報処理装置、情報処理方法、情報処理システム及び記録媒体
JP7103443B2 (ja) 情報処理装置、情報処理方法、およびプログラム
Kao et al. Gender Classification with Jointing Multiple Models for Occlusion Images.
CN112434671B (zh) 一种行人快照优选方法、装置、计算机设备及存储介质
Nandakumar et al. A comparative analysis of a neural-based remote eye gaze tracker