JP2020197847A - 画像処理装置、画像処理方法、およびプログラム - Google Patents

画像処理装置、画像処理方法、およびプログラム Download PDF

Info

Publication number
JP2020197847A
JP2020197847A JP2019102875A JP2019102875A JP2020197847A JP 2020197847 A JP2020197847 A JP 2020197847A JP 2019102875 A JP2019102875 A JP 2019102875A JP 2019102875 A JP2019102875 A JP 2019102875A JP 2020197847 A JP2020197847 A JP 2020197847A
Authority
JP
Japan
Prior art keywords
image
target
image processing
specific objects
estimation process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019102875A
Other languages
English (en)
Inventor
大貴 平賀
Daiki Hiraga
大貴 平賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019102875A priority Critical patent/JP2020197847A/ja
Publication of JP2020197847A publication Critical patent/JP2020197847A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】 撮像された画像に含まれる特定の物体の数を推定する処理負荷の増大を抑制することを目的とする。【解決手段】 第1推定手段は、撮像手段により撮像された第1画像における複数の分割領域に対し特定の物体の数を推定する推定処理を実行する。第2推定手段は、第1画像よりも後に撮像された第2画像における複数の分割領域のうち、推定処理の対象とする対象領域に対して推定処理を実行する。決定手段は、第2画像における複数の分割領域のうち対象領域以外の非対象領域における特定の物体の数を、非対象領域に対応する第1画像における分割領域に対し推定処理により推定された特定の物体の数に基づき決定する。【選択図】 図3

Description

本発明は、画像処理技術に関する。
従来技術として、撮像装置により撮像された画像を解析することによって画像中の人物の数を推定する技術がある。このような技術を活用することで、スタジアムやショッピングモール等の空間における混雑状態の把握が可能となり、混雑状態に応じた従業員の配置や災害時の適切な避難誘導などの応用に期待できる。
画像に含まれる人数を推定する方法として、機械学習によって得た認識モデルを用いる技術が提案されている。非特許文献1では、固定サイズの小画像を入力とし、小画像中の人数を出力する回帰器を機械学習により学習する。そして、画像を小領域に分割した後、各小領域を固定サイズにリサイズして小画像とし、各小画像中の人数を回帰器で求め、その和をとることで人数を推定している。
池田浩雄,大網亮磨,宮野博義.CNNを用いた群衆パッチ学習に基づく人数推定の高精度化.FIT2014 第13回情報科学技術フォーラム,2014
しかしながら、非特許文献1の技術では、画像を複数に分割して得られた小領域の各々について機械学習を用いた人数の推定をしているため、処理負荷が大きいことがある。
そこで、本発明は、画像に含まれる物体の数の推定にかかる処理負荷の増大を抑制することを目的としている。
上記課題を解決するために、例えば、本発明に係る画像処理装置は、以下の構成を備える。すなわち、撮像手段により撮像された画像を分割した複数の分割領域における特定の物体の数を推定する画像処理装置であって、前記撮像手段により撮像された第1画像における前記複数の分割領域に対し前記特定の物体の数を推定する推定処理を実行する第1推定手段と、前記第1画像よりも後に撮像された第2画像における前記複数の分割領域のうち、前記推定処理の対象とする対象領域に対して前記推定処理を実行する第2推定手段と、前記第2画像における前記複数の分割領域のうち前記対象領域以外の非対象領域における前記特定の物体の数を、前記非対象領域に対応する前記第1画像における分割領域に対し前記推定処理により推定された前記特定の物体の数に基づき決定する決定手段とを有する。
本発明によれば、画像に含まれる物体の数の推定にかかる処理負荷の増大を抑制することができる。
システム構成の一例を示す図である。 画像処理装置の機能ブロックを示す図である。 人数の推定処理の流れを示すフローチャートである。 設定された複数の分割領域について説明するための図である。 推定処理の結果について説明するための図である。 対象領域および候補領域について説明するための図である。 対象領域に対する推定処理について説明するための図である。 設定画面を説明するための図である。 各装置のハードウェア構成を示す図である。
以下、添付図面を参照しながら、本発明に係る実施形態について説明する。なお、以下の実施形態において示す構成は一例に過ぎず、図示された構成に限定されるものではない。
(実施形態1)
図1は、本実施形態におけるシステム構成を示す図である。本実施形態におけるシステムは、画像処理装置100、撮像装置110、記録装置120、およびディスプレイ130を有している。
画像処理装置100、撮像装置110、および記録装置120は、ネットワーク140を介して相互に接続されている。ネットワーク140は、例えばETHERNET(登録商標)等の通信規格に準拠する複数のルータ、スイッチ、ケーブル等から実現される。
なお、ネットワーク140は、インターネットや有線LAN(Local Area Network)、無線LAN(Wireless Lan)、WAN(Wide Area Network)等により実現されてもよい。
画像処理装置100は、例えば、後述する画像処理の機能を実現するためのプログラムがインストールされたパーソナルコンピュータ等によって実現される。撮像装置110は、画像を撮像する装置である。撮像装置110は、撮像した画像の画像データと、画像を撮像した撮像時刻の情報と、撮像装置110を識別する情報である識別情報とを関連付けて、ネットワーク140を介し、画像処理装置100や記録装置120等の外部装置へ送信する。なお、本実施形態に係るシステムにおいて、撮像装置110は1つとするが、複数であってもよい。
記録装置120は、撮像装置110が撮像した画像の画像データと、画像を撮像した撮像時刻の情報と、撮像装置110を識別する識別情報とを関連付けて記録する。そして、画像処理装置100からの要求に従って、記録装置120は、記録したデータ(画像、識別情報など)を画像処理装置100へ送信する。
ディスプレイ130は、LCD(Liquid Crystal Display)等により構成されており、画像処理装置100の画像処理の結果や、撮像装置110が撮像した画像などを表示する。ディスプレイ130は、HDMI(登録商標)(High Definition Multimedia Interface)等の通信規格に準拠したディスプレイケーブルを介して画像処理装置100と接続されている。
また、ディスプレイ130は、表示手段として機能し、撮像装置110が撮像した画像や、後述する画像処理による結果等を表示する。なお、ディスプレイ130、画像処理装置100、および記録装置120の少なくともいずれか2つ又は全ては、単一の筐体に設けられてもよい。
なお、画像処理装置100の画像処理の結果や、撮像装置110により撮像された画像は、画像処理装置100にディスプレイケーブルを介して接続されたディスプレイ130に限らず、例えば、次のような外部装置が有するディスプレイに表示されてもよい。すなわち、ネットワーク140を介して接続されたスマートフォン、タブレット端末などのモバイルデバイスが有するディスプレイに表示されていてもよい。
次に、図2に示す本実施形態に係る画像処理装置100の機能ブロックを参照して、本実施形態に係る画像処理装置100の画像処理について説明する。なお、図2に示す各機能は、本実施形態の場合、図9を参照して後述するROM(Read Only Memory)920とCPU(Central Processing Unit)900とを用いて、次のようにして実現されるものとする。図2に示す各機能は、画像処理装置100のROM920に格納されたコンピュータプログラムを画像処理装置100のCPU900が実行することにより実現される。
通信部200は、図9を参照して後述するI/F(Interface)940によって実現でき、ネットワーク140を介して、撮像装置110や記録装置120と通信を行う。通信部200は、例えば、撮像装置110が撮像した画像の画像データを受信したり、撮像装置110を制御するための制御コマンドを撮像装置110へ送信したりする。なお、制御コマンドは、例えば、撮像装置110に対して画像を撮像するよう指示を行うコマンドなどを含む。
記憶部201は、図9を参照して後述するRAM(Random Access Memory)910やHDD(Hard Disk Drive)930等によって実現でき、画像処理装置100による画像処理に関わる情報やデータを記憶する。例えば、記憶部201は、画像から検出された特定の物体の位置に関する情報を記憶する。
出力制御部202は、撮像装置110が撮像した画像、本実施形態に係る画像処理に関する設定を行う設定画面、または、画像処理の結果を示す情報などを外部装置に出力したり、ディスプレイ130に表示させたりする。なお、出力制御部202による情報の出力先である外部装置は、例えば、他の画像処理装置(不図示)や記録装置120を含む。操作受付部203は、キーボードやマウス等の入力装置(不図示)を介して、ユーザが行った操作を受け付ける。
設定部204は、撮像装置110により撮像された画像を分割することで複数の分割領域を設定する。なお、設定部204は、例えば、操作受付部203が受け付けた分割領域を指定する操作に基づき、画像に対し複数の分割領域を設定する。
また、設定部204は、分割領域のサイズと人物のサイズとの比率が略一定となる制約を加えることで、後述する分割領域に対する推定処理の精度向上を図ることもできる。設定部204は、画像上の任意の位置における人物のサイズの情報を取得し、分割領域における人物のサイズの平均値と当該分割領域のサイズとの比率が略一定となるよう画像に対し複数の分割領域を設定する。
推定部205は、設定部204により設定された画像における複数の分割領域の各々に対し、特定の物体の数を推定する推定処理を実行する。本実施形態における推定部205は、ある固定サイズSの小画像を入力とし、その小画像に写っている特定の物体の数を出力とする回帰器を用いることで分割領域における特定の物体の数を推定する。推定部205による特定の物体の数を推定する推定処理の詳細な説明については後述する。
推定部205は、撮像装置110により撮像された画像である第1画像における設定部204により設定された複数の分割領域に対し特定の物体の数を推定する推定処理を実行する。また、推定部205は、上記第1画像より後に撮像された第2画像における設定部204により設定された複数の分割領域のうち、特定の物体の数を推定する推定処理の対象とする対象領域に対して推定処理を実行する。対象領域を決定する方法についての詳細な説明は後述する。
決定部206は、全ての分割領域について推定処理が実行されてない第2画像における複数の分割領域のうち対象領域以外の非対象領域の各々における特定の物体の数を次のようにして決定する。すなわち、決定部206は、第2画像における非対象領域の各々における特定の物体の数を、非対象領域に対応する第1画像における領域に対し推定処理により推定された特定の物体の数に基づき決定する。例えば、決定部206は、第2画像における非対象領域の各々における特定の物体の数を、非対象領域に対応する第1画像における領域に対し推定処理により推定された特定の物体の数として決定する。また、決定部206は、第2画像における非対象領域の各々における特定の物体の数を、非対象領域に対応する第1画像における領域に対し推定処理により推定された特定の物体の数を補正した数として決定してもよい。
検出部207は、通信部200が取得した画像に含まれる特定の物体を検出する処理を実行する。例えば、検出部207は、パターンマッチング処理により、画像に含まれる人物を検出する処理を実行する。また、検出部207は、例えば、背景差分法やフレーム間差分等の処理により画像から動体を検出してもよい。
次に、図3を参照して、画像に含まれる特定の物体の数を推定する処理について説明する。なお、以降の説明において特定の物体を人物として説明するが、車や動物など他の物体であってもよい。
S301にて、通信部200は、I/F940を介して撮像装置110が撮像した第1画像を取得する。なお、通信部200は、記録装置120が記録した画像を第1画像として取得してもよい。
次に、S302にて、設定部204は、撮像装置110により撮像された画像を分割することで複数の分割領域を設定する。設定部204は、画像上の任意の位置における人物のサイズの情報を取得し、分割領域における人物のサイズの平均値と当該分割領域のサイズとの比率が略一定となるよう画像に対し複数の分割領域を設定する。
このとき、設定部204は、画像上の任意の位置における人物のサイズを次のように取得する。操作受付部203は、画像上の複数の地点における人物の平均的なサイズを指定するユーザ操作を受け付ける。そして設定部204は、操作受付部203が受け付けた当該複数の地点における人物の平均的なサイズに基づき、画像上の任意の地点における人物の平均的なサイズを補間により推定することで、画像上の任意の位置における人物のサイズを取得する。
また、設定部204は、画像上の任意の位置における人物のサイズを、統計処理により推定してもよい。例えば、検出部207は、所定の学習画像群に対して画像全体にパターンマッチング等の処理により人物を検出する検出処理を行い、人物の位置およびサイズを示す人物枠の集合を取得する。画像左上の端点を原点とした画像上の座標(x,y)における人体枠のサイズをsとしたとき、sは、x、y及び未知の1個以上のパラメータによって表せると仮定する。例えば、s=ax+by+cと仮定する。この例では、未知のパラメータはa、b及びcである。設定部204は、所定の学習画像群から検出部207により取得された人体枠の集合を用いて、未知のパラメータを、例えば最小二乗法等の統計処理により求めることで、画像上の任意の位置における人物のサイズを推定する。
図4は、撮像装置110により撮像された複数の人物を含む画像に対して設定部204により複数の分割領域が設定された様子を示す一例である。撮像装置110により近い位置である画像の下方における人物のサイズは、撮像装置110により遠い位置である画像の上方における人物のサイズに比べて大きい。そのため、設定部204により設定される分割領域のサイズは、画像の下方において大きく、画像の上方において小さくなる。
図3に示すフローの説明に戻り、S303にて、推定部205は、第1画像に対して設定部205により設定された複数の分割領域の各々に対し人数を推定する推定処理を実行する。ここで、本実施形態における推定部205による人数を推定する推定処理について説明する。推定部205は、予め、頭部など人物の位置が既知である大量の小画像を学習データとして、サポートベクターマシンや深層学習等の既知の機械学習手法に基づいて回帰器を学習しておく。このとき、回帰器の精度向上を図るため、学習データである小画像として、小画像に映る人物のサイズと当該小画像のサイズとの比率が略一定であることが望ましい。そして、推定部205は、学習済みの回帰器を用いて、設定部204により設定された複数の分割領域の各々について、次のような処理を実行する。すなわち、推定部205は、分割領域の画像を固定サイズSにリサイズしたものを小画像とし、該小画像を学習した回帰器に入力することで「該分割領域における人物の位置」を回帰器からの出力として求める。回帰器からの出力結果の精度を向上させるためには、分割領域のサイズと当該分割領域に映る人物のサイズとの比率は、学習データとして用いた小画像のサイズと当該小画像に映る人物のサイズとの比率と略同一であることが望ましい。なお、推定部205による分割領域に対する人数の推定処理の出力結果である数値は、当該分割領域における人物の位置の個数を示す。なお、推定部205による分割領域に対する人数の推定処理の出力結果である数値は必ずしも整数とは限らず、実数を取ることもありえる。推定部205は、出力結果である実数を四捨五入により整数に丸めて扱ってもよいし、実数のまま扱ってもよい。
次に、S304にて、出力制御部202は、S303で実行された推定処理の結果を示す情報を出力する。例えば、出力制御部202は、複数の分割領域の各々に対しS303にて推定された人数の合計値を示す情報をディスプレイ130に表示させてもよい。また、出力制御部202は、推定処理の結果として図5に示すような情報をディスプレイ130に表示させてもよい。図5に示す表示500は、図4に示す第1画像に対する複数の分割領域の各々に対して推定された人数の結果を示す情報である。図5に示すように、設定部204により設定された分割領域の各々について、推定処理により推定された分割領域に含まれる人数を示す数値が示されている。S304にて、出力制御部202は、表示500を第1画像に重畳させてディスプレイ130に表示させてもよい。なお、推定処理の結果として出力された数値は必ずしも整数とは限らず、実数や丸め情報を用いてもよい。なお、図8に示す設定画面800は、本実施形態に係る画像処理に関する設定を行うための画面を示し、表示制御部202によりディスプレイ130に表示される。分割領域に対する推定処理の結果として出力される数値を実数とするか、小数点以下第N位(Nは自然数)で四捨五入した値とするか、または、小数点を切り捨てた整数とするか等を、プルダウンメニュー801により選択できる。
次に、S305にて、決定部206は、各分割領域に対応する最大人数(閾値)を取得し、記憶部201に格納する。このとき、各分割領域に対応する最大人数は、各分割領域に存在し得る人物の最大数である。例えば、分割領域のサイズを、当該分割領域における人物のサイズの平均値で割って算出された数値を、当該分割領域に存在可能な最大人数とする。なお、図8に示す設定画面800において、ユーザがラジオボタン802の「自動」を選択すると上述の計算方法により自動で分割領域に対する最大人数を設定し、ユーザが「手動」を選択すると、ユーザによる指定により最大人数を設定できる。
次に、S306において、通信部200は、撮像装置110が撮像した画像であって第1画像より後に撮像された画像である第2画像を取得する。第2画像は、例えば、第1画像の次に撮像されたフレームの画像である。
次に、S307にて、決定部206は、S302にて設定した複数の分割領域のうち、推定処理を実行する対象領域、および、推定処理を実行しない非対象領域の候補となる候補領域を決定する。図6は、S307にて推定部205により決定された対象領域および候補領域の一例を示す。図6において、グレーで塗りつぶされていない分割領域(分割領域601等)は、推定部205により推定処理が実行される対象領域を示す。一方、グレーで塗りつぶされた分割領域(分割領域602等)は、推定部205により推定処理が実行されない非対象領域の候補となる候補領域を示す。なお、S307における対象領域および候補領域の決定方法は、図6に示す例に限らない。図6に示すように格子状に設定された複数の分割領域において水平方向に交互に対象領域および候補領域を決定してもよいし、少なくとも2つの分割領域を結合させた対象領域や候補領域を決定してもよい。また、設定部204により設定された複数の分割領域のうち、当該複数の分割領域の外縁にあたる分割領域、すなわち最も外側の分割領域を少なくとも対象領域として決定するようにしてもよい。そのうえで、決定部206は、例えば、複数の分割領域のうち、最も外側にあたる分割領域より内側の複数の分割領域を対し、対象領域および候補領域を格子状に決定してもよい。図8に示す設定画面800において、ユーザがスライドバー803を操作することで、設定部204により設定された複数の分割領域における候補領域の割合を変更することができる。なおこの場合、記憶部201は、複数の分割領域における候補領域の割合と、候補領域および対象領域の配置とを関連付けたテーブルを予め記憶している。そして、図8に示すスライドバー803の操作によりユーザが候補領域の割合を指定した場合に、決定部206は、記憶部201が記憶するテーブルを参照して、ユーザが指定した候補領域の割合に対応する候補領域および対象領域の配置を設定する。
次に、S308にて、推定部205は、S307にて決定部206により決定された対象領域の各々に対して人数の推定処理を実行する。図7は、決定部206により決定された対象領域の各々に対し人数の推定処理が実行された様子を示している。図7に示すように、対象領域の各々には推定処理の結果である数値が表示されている。
次に、S309にて、決定部206は、S307にて決定された候補領域のうち注目対象とする候補領域を決定する。なおこのとき、決定部206は、S307にて決定された候補領域のうち注目対象としていない候補領域のいずれか1つを注目対象として決定する。図7に示す例において、例えば、決定部206は、複数の候補領域のうち、まだ注目対象としていない候補領域701を注目対象として決定する。
次に、S310にて、決定部206は、S309で注目対象とした候補領域の周辺の対象領域における推定された人数を取得し、取得した人数が最大人数以上(閾値以上)かを判定する。この場合、例えば、決定部206は、注目対象としている候補領域に隣接する対象領域の各々が最大人数以上かを判定する。ここで、図7を参照して、S310における決定部206の処理について説明する。なお、以降の説明において、S305にて決定部206が取得した各分割領域に対応する最大人数は“8.0人”であるものとする。なお、本実施形態において各分割領域に対し設定された最大人数は一律同じ値とするが、これに限らない。例えば、各分割領域に対し設定された最大人数は、分割領域のサイズや位置に応じて分割領域ごとに異なる値であってもよい。
図7に示す例において候補領域701を注目対象としている場合、S310にて、決定部206は、注目対象とした候補領域701に隣接する対象領域における推定された人数を取得し、取得した人数が最大人数以上かを判定する。この場合、図7に示されるように、決定部206は、候補領域701に隣接する対象領域701a、対象領域701b、対象領域701cの人数をそれぞれ0.1人、10.1人、2.2人として取得する。なお、候補領域701は画像の上端なので、候補領域701の上側の推定人数は取得されていない。候補領域701に隣接する対象領域701a〜701cの全てが最大人数(8.0人)以上ではないため(S310にてNo)、決定部206は候補領域701を推定処理が実行される対象領域として決定し、S313の処理に遷移する。そして、S313にて、推定部205は、注目対象としている候補領域に対し、人数を推定する処理を実行する。候補領域701を注目対象としている場合、推定部205は、候補領域701に対し人数を推定する処理を実行する。S313にて注目対象に対し人数の推定処理が実行されたのち、S314に遷移する。そして、全ての候補領域を注目対象としていなければ(S314にてNo)、S309へ遷移し、決定部206は、まだ注目対象としていない候補領域のいずれか1つを注目対象として決定する。S314にて、全ての候補領域を注目対象としていれば(S314にてYes)、S315へ遷移する。
次に、図7に示す例において候補領域702を注目対象としている場合について説明する。この場合、S310にて、決定部206は、注目対象とした候補領域702に隣接する対象領域702a〜702dにおける推定された人数を取得し、取得した人数が最大人数以上かを判定する。図7に示されるように、決定部206は、候補領域702に隣接する対象領域702aの人数は8.5人、対象領域702bの人数は8.5人、対象領域702cの人数は8.2人、対象領域702dの人数は9.6人として取得する。候補領域702に隣接する対象領域702a〜702dの全てが最大人数(8.0人)以上であるため(S310にてYes)、S311の処理に遷移する。
S311にて、決定部206は、注目対象としている候補領域と、当該候補領域の周辺の分割領域に対する前回推定処理により推定された人数(以下、前回値)が最大人数以上かを判定する。ここで、第2画像における候補領域702を注目対象としている場合について説明する。第1画像に対する人数の推定処理の結果を示す図5において、分割領域502は候補領域702と同位置である。よって、候補領域702に対する前回値は、候補領域702に対応する分割領域502の推定処理の結果である8.2人である。また、注目対象としている候補領域702の周辺の対象領域702a〜702dに対する前回値は、当該周辺の対象領域に対応する第1画像における分割領域502a〜502dに対し推定された人数である。図5に示す例において、決定部206は、対象領域702aの前回値として分割領域502aの人数(8.5人)、対象領域702bの前回値として分割領域502bの人数(8.5人)を取得する。さらに、決定部206は、対象領域702cの前回値として分割領域502cの人数(8.0人)、対象領域702dの前回値として分割領域502dの人数(9.6人)を取得する。
以上より、決定部206は、候補領域702に対する前回値(8.2人)および候補領域の周辺の対象領域702a〜702dに対する前回値(8.5人、8.5人、8.0人、9.6人)がそれぞれ最大人数以上であると判定する(S311にてYes)。なお、このとき、決定部206は、候補領域702を推定処理が実行されない非対象領域として決定する。そして、S312にて、決定部206は、第2画像の非対象領域における人数を、当該非対象領域に対する前回値であるとして決定する。すなわち、決定部206は、第2画像の非対象領域における人数を、当該非対象領域に対応する第1画像における分割領域に対し推定処理により推定された人数として決定する。候補領域702が非対象領域として決定された場合において、決定部206は、非対象領域(候補領域702)に対する前回値(8.2人)を非対象領域(候補領域702)の人数として決定する。
なお、S311にて、注目対象としている候補領域、および、当該候補領域の周辺の対象領域に対する前回値が最大人数以上ではなかった場合(S311にてNo)、S313へ遷移する。このとき、決定部206は、注目対象としている候補領域を対象領域として決定し、S313にて推定部205は、当該対象領域に対し人数を推定する推定処理を実行する。
第2画像において注目している候補領域の周辺の分割領域に対する推定された人数が最大人数以上、かつ、当該候補領域および当該周辺の分割領域に対する前回値が最大人数以上という条件を満たす場合、当該候補領域における人数の変動はしていないと判定する。これは、分割領域に対する最大人数が、当該分割領域に存在可能な人数によって定められていることに起因する。よって、上記条件を満たす場合、第2画像において注目している候補領域の人数を、当該候補領域に対応する第1画像における人数として決定することで、推定処理を実行する回数を削減することが可能となる。
ここで、S309にて、図7に示す第2画像における候補領域703を注目対象する場合について説明する。なおこの場合、候補領域703は候補領域704と連結しているため、決定部206は、候補領域703および候補領域704を同時に注目対象として決定するものとする。本実施形態において、図7に示されるように候補領域703に隣接する対象領域703aの人数は8.4人、対象領域703cの人数は10.3人、対象領域703dの人数は10.2人である。また、候補領域704に隣接する対象領域704aの人数は9.9人、対象領域704bの人数は8.8人、対象領域704cの人数は10.3人である。よって、S310にて、注目対象である候補領域703および候補領域704の周辺の分割領域における推定された人数は最大人数(8.0人)以上であるとして、S311の処理へ進む。
S310にて、決定部206は、注目対象としている候補領域、および、当該候補領域の周辺の対象領域に対する前回値が最大人数以上かを判定する。第2画像における候補領域703に対する前回値は、第1画像において候補領域703と同じ位置である候補領域503に対する推定処理による推定された人数となる。同様に、第2画像における候補領域704に対する前回値は、第1画像において候補領域704と同じ位置である候補領域504に対する推定処理による推定された人数となる。以上より、候補領域703および候補領域704に対する前回値は、9.0人および9.8人となる。
また、候補領域703の周辺の対象領域703a,703c,703dに対する前回値は、分割領域503aの人数(8.2人),分割領域503cの人数(10.0人)、分割領域503dの人数(10.2人)である。同様に、候補領域704の周辺の対象領域704a〜704cに対する前回値は、分割領域504aの人数(9.4人),分割領域504bの人数(8.4人)、分割領域504cの人数(9.8人)である。以上より、S311にて、決定部206は、注目対象としている候補領域703および704に対する前回値、および、当該候補領域の周辺の分割領域に対する前回値のそれぞれが最大人数以上であるとして、S312へ遷移する。このとき、決定部206は、候補領域703および候補領域704を非対象領域として決定する。S312にて、決定部206は、非対象領域(候補領域703、704)に対する前回値(9.0人、9,8人)を非対象領域(候補領域703、704)の人数として決定する。
次に、S314にて、第2画像において全ての候補領域を注目対象とした場合、S315へ遷移し、S315にて、出力制御部202は、第2画像に対し推定された人数の結果を示す情報を出力する。例えば、出力制御部202は、第2画像における対象領域および非対象領域における人数の合計値を示す情報をディスプレイ130に表示させる。S315の処理を実行したのち、S301へ遷移し、S301にて、通信部200は、次のフレームの第1画像を取得する。そして、S301〜315の処理を繰り返す。
ここで、S301〜S304までの処理を全分割領域に対し推定処理を実行する全体処理とし、S305〜S315までの処理を一部の分割領域に対し推定処理を実行する間引き処理とする。この場合、本実施形態では、順次通信部200が取得するフレームの画像に対し、全体処理と間引き処理とを交互に実行するが、例えば、次のような処理を実行してもよい。すなわち、間引き処理をNフレーム(Nは自然数)に対し実行し、次のフレームに対し全体処理を実行し、その後新たなNフレームに対し間引き処理を実行する。このように、間引き処理を実行するフレーム数を変更させてもよい。図8に示す設定画面800において、ユーザはスライドバー804を操作し、間引き処理を連続で実行するフレーム数Nを任意に変更することができる。
以上説明したように、本実施形態における画像処理装置100は、第2画像における複数の分割領域のうち対象領域以外の非対象領域における特定の物体の数として、非対象領域に対する前回値を流用する。このようにすることで、特定の物体の数を推定する推定処理の負荷の増大を抑制することができる。
(その他の実施形態)
次に図9を参照して、各実施形態の各機能を実現するための画像処理装置100のハードウェア構成を説明する。なお、以降の説明において画像処理装置100のハードウェア構成について説明するが、記録装置120および撮像装置110も同様のハードウェア構成によって実現されるものとする。
本実施形態における画像処理装置100は、CPU900と、RAM910と、ROM920、HDD930と、I/F940と、を有している。
CPU900は画像処理装置100を統括制御する中央処理装置である。RAM910は、CPU900が実行するコンピュータプログラムを一時的に記憶する。また、RAM910は、CPU900が処理を実行する際に用いるワークエリアを提供する。また、RAM910は、例えば、フレームメモリとして機能したり、バッファメモリとして機能したりする。
ROM920は、CPU900が画像処理装置100を制御するためのプログラムなどを記憶する。HDD930は、画像データ等を記録する記憶装置である。
I/F940は、ネットワーク140を介して、TCP/IPやHTTPなどに従って、外部装置との通信を行う。
なお、上述した各実施形態の説明では、CPU900が処理を実行する例について説明するが、CPU900の処理のうち少なくとも一部を専用のハードウェアによって行うようにしてもよい。例えば、ディスプレイ130にGUI(GRAPHICAL USER INTERFACE)や画像データを表示する処理は、GPU(GRAPHICS PROCESSING UNIT)で実行してもよい。また、ROM920からプログラムコードを読み出してRAM910に展開する処理は、転送装置として機能するDMA(DIRECT MEMORY ACCESS)によって実行してもよい。
なお、本発明は、上述の実施形態の1以上の機能を実現するプログラムを1つ以上のプロセッサが読出して実行する処理でも実現可能である。プログラムは、ネットワーク又は記憶媒体を介して、プロセッサを有するシステム又は装置に供給するようにしてもよい。また、本発明は、上述の実施形態の1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。また、画像処理装置100の各部は、図9に示すハードウェアにより実現してもよいし、ソフトウェアにより実現することもできる。
なお、上述した各実施形態に係る画像処理装置100の1以上の機能を他の装置が有していてもよい。例えば、各実施形態に係る画像処理装置100の1以上の機能を撮像装置110が有していてもよい。なお、上述した各実施形態を組み合わせて、例えば、上述した実施形態を任意に組み合わせて実施してもよい。
以上、本発明を実施形態と共に説明したが、上記実施形態は本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲は限定的に解釈されるものではない。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱しない範囲において、様々な形で実施することができる。例えば、各実施形態を組み合わせたものも本明細書の開示内容に含まれる。
100 画像処理装置
110 撮像装置
200 通信部
201 記憶部
202 出力制御部
203 操作受付部
204 設定部
205 推定部
206 決定部

Claims (15)

  1. 撮像手段により撮像された画像を分割した複数の分割領域における特定の物体の数を推定する画像処理装置であって、
    前記撮像手段により撮像された第1画像における前記複数の分割領域に対し前記特定の物体の数を推定する推定処理を実行する第1推定手段と、
    前記第1画像よりも後に撮像された第2画像における前記複数の分割領域のうち、前記推定処理の対象とする対象領域に対して前記推定処理を実行する第2推定手段と、
    前記第2画像における前記複数の分割領域のうち前記対象領域以外の非対象領域における前記特定の物体の数を、前記非対象領域に対応する前記第1画像における分割領域に対し前記推定処理により推定された前記特定の物体の数に基づき決定する決定手段とを有することを特徴とする画像処理装置。
  2. 前記非対象領域に隣接する対象領域において前記推定処理により推定された前記特定の物体の数が閾値以上であることを特徴とする請求項1に記載の画像処理装置。
  3. 前記非対象領域に隣接する対象領域において前記推定処理により推定された前記特定の物体の数が閾値以上であり、かつ、前記第1画像における当該非対象領域および当該隣接する対象領域に対応する分割領域において前記推定処理により推定された前記特定の物体の数が前記閾値以上であることを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記決定手段は、前記第2画像における前記複数の分割領域のうち前記対象領域以外の非対象領域における前記特定の物体の数を、前記非対象領域に対応する前記第1画像における領域に対し前記推定処理により推定された前記特定の物体の数として決定することを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
  5. 前記撮像手段により撮像された画像を複数の分割領域に分割する分割手段を更に有することを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。
  6. パターンマッチングを用いて、前記撮像手段により撮像された画像に含まれる特定の物体を検出する検出手段を更に有し、
    前記分割手段は、前記検出手段により検出された特定の物体のサイズに基づいて、前記撮像手段により撮像された画像を複数の分割領域に分割することを特徴とする請求項5に記載の画像処理装置。
  7. 前記特定の物体は人物であることを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。
  8. 撮像手段により撮像された画像を分割した複数の分割領域における特定の物体の数を推定する画像処理方法であって、
    前記撮像手段により撮像された第1画像における前記複数の分割領域に対し前記特定の物体の数を推定する推定処理を実行する第1推定工程と、
    前記第1画像よりも後に撮像された第2画像における前記複数の分割領域のうち、前記推定処理の対象とする対象領域に対して前記推定処理を実行する第2推定工程と、
    前記第2画像における前記複数の分割領域のうち前記対象領域以外の非対象領域における前記特定の物体の数を、前記非対象領域に対応する前記第1画像における分割領域に対し前記推定処理により推定された前記特定の物体の数に基づき決定する決定工程とを有することを特徴とする画像処理方法。
  9. 前記非対象領域に隣接する対象領域において前記推定処理により推定された前記特定の物体の数が閾値以上であることを特徴とする請求項8に記載の画像処理方法。
  10. 前記非対象領域に隣接する対象領域において前記推定処理により推定された前記特定の物体の数が閾値以上であり、かつ、前記第1画像における当該非対象領域および当該隣接する対象領域に対応する分割領域において前記推定処理により推定された前記特定の物体の数が前記閾値以上であることを特徴とする請求項8または9に記載の画像処理方法。
  11. 前記決定工程において、前記第2画像における前記複数の分割領域のうち前記対象領域以外の非対象領域における前記特定の物体の数を、前記非対象領域に対応する前記第1画像における分割領域に対し前記推定処理により推定された前記特定の物体の数として決定することを特徴とする請求項8乃至10のいずれか1項に記載の画像処理方法。
  12. 前記撮像手段により撮像された画像を複数の分割領域に分割する分割工程を更に有することを特徴とする請求項8乃至11のいずれか1項に記載の画像処理方法。
  13. パターンマッチングを用いて、前記撮像手段により撮像された画像に含まれる特定の物体を検出する検出工程を更に有し、
    前記分割工程において、前記検出工程において検出された特定の物体のサイズに基づいて、前記撮像手段により撮像された画像を複数の分割領域に分割することを特徴とする請求項12に記載の画像処理方法。
  14. 前記特定の物体は人物であることを特徴とする請求項8乃至13のいずれか1項に記載の画像処理方法。
  15. コンピュータを、請求項1乃至7のいずれか1項に記載された情報処理装置の各手段として機能させるためのプログラム。
JP2019102875A 2019-05-31 2019-05-31 画像処理装置、画像処理方法、およびプログラム Pending JP2020197847A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019102875A JP2020197847A (ja) 2019-05-31 2019-05-31 画像処理装置、画像処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019102875A JP2020197847A (ja) 2019-05-31 2019-05-31 画像処理装置、画像処理方法、およびプログラム

Publications (1)

Publication Number Publication Date
JP2020197847A true JP2020197847A (ja) 2020-12-10

Family

ID=73649167

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019102875A Pending JP2020197847A (ja) 2019-05-31 2019-05-31 画像処理装置、画像処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP2020197847A (ja)

Similar Documents

Publication Publication Date Title
US20200167554A1 (en) Gesture Recognition Method, Apparatus, And Device
CN110430443B (zh) 视频镜头剪切的方法、装置、计算机设备及存储介质
JP6939111B2 (ja) 画像認識装置および画像認識方法
CN108197618B (zh) 用于生成人脸检测模型的方法和装置
JP2012059196A (ja) 表示制御装置及び表示制御方法
JP2018077637A (ja) 情報処理装置、情報処理システム、情報処理方法およびプログラム
US11363241B2 (en) Surveillance apparatus, surveillance method, and storage medium
JP2015022351A (ja) 画像処理プログラム及び画像処理装置
US10187610B2 (en) Controlling display based on an object position in an imaging space
JP2020197847A (ja) 画像処理装置、画像処理方法、およびプログラム
US20160203617A1 (en) Image generation device and display device
JP7406878B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2021056899A (ja) 画像処理装置、画像処理方法およびプログラム
JP7385416B2 (ja) 画像処理装置、画像処理システム、画像処理方法及び画像処理プログラム
JP2021118522A (ja) 画像処理装置、画像処理方法、監視システム
JP4449483B2 (ja) 画像解析装置、および画像解析方法、並びにコンピュータ・プログラム
JP2021086392A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2021125137A (ja) 画像処理装置および画像処理方法
JP2020149565A (ja) 画像処理装置、画像処理方法およびプログラム
US20230177705A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2020201674A (ja) 映像解析装置及びその制御方法及びプログラム
US20170337719A1 (en) Image processing device, image processing method and program
JP2012169735A (ja) 画像処理装置、画像処理方法及びプログラム
JP2022011926A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2021071907A (ja) 画像処理装置、画像処理方法、およびプログラム