JP2022011926A - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP2022011926A
JP2022011926A JP2020113353A JP2020113353A JP2022011926A JP 2022011926 A JP2022011926 A JP 2022011926A JP 2020113353 A JP2020113353 A JP 2020113353A JP 2020113353 A JP2020113353 A JP 2020113353A JP 2022011926 A JP2022011926 A JP 2022011926A
Authority
JP
Japan
Prior art keywords
image
processing time
processing
information
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020113353A
Other languages
English (en)
Inventor
茉莉 山▲崎▼
Mari Yamazaki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2020113353A priority Critical patent/JP2022011926A/ja
Publication of JP2022011926A publication Critical patent/JP2022011926A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】 本発明は、画像に対する特定物体の数の推定処理の処理時間を算出することにかかる時間の増大を抑制することを目的としている。【解決手段】 撮像手段により撮像された画像に対し、特定物体の数を推定する推定処理の対象である複数の部分領域を設定する設定手段と、複数の異なるサイズについて、当該サイズと、当該サイズの部分領域に対する前記推定処理の処理時間とを関連付けた処理時間情報に基づき、前記画像において前記設定手段により設定された前記複数の部分領域に対する前記推定処理の処理時間である全体処理時間を算出する算出手段とを有する。【選択図】 図5

Description

本発明は、情報処理技術に関する。
近年、撮像装置で所定のエリアを撮像し、撮像した画像を解析することによって画像中の人物の数を推定するシステムが提案されている。このようなシステムを用いて、公共の空間での混雑の検知を行い、イベント時の混雑解消や災害時の避難誘導への活用が期待されている。
画像中の人数を推定する方法として、機械学習によって得た学習モデルを用いて、画像内の部分領域に映る人数を推定する方法が提案されている。特許文献1では、機械学習によって得た学習モデルを用いて、画像の部分領域に映る人数を直接推定する方法が開示されている。以下、この方法を回帰ベース推定法とする。
特開2018-22340号公報
画像に対して設定された複数の部分領域に対する回帰ベース推定法を用いた特定物体の数を推定する推定処理に要する処理時間をユーザは把握したいことがある。画像上の複数の部分領域に対する推定処理の処理時間をユーザに提示する場合を想定すると、実際に当該画像上の複数の部分領域の全てに対して推定処理を実行して要した時間を処理時間として算出する方法が考えられる。しかしながら、この場合、実際に複数の部分領域全てに対して推定処理を実行しているため、画像に対する推定処理の処理時間を算出することに時間がかかることがある。
そこで本発明は、画像に対する特定物体の数の推定処理の処理時間を算出することにかかる時間の増大を抑制することを目的としている。
上記課題を解決するために、本発明の情報処理装置は、以下の構成を備える。すなわち、撮像手段により撮像された画像に対し、特定物体の数を推定する推定処理の対象である複数の部分領域を設定する設定手段と、複数の異なるサイズについて、当該サイズと、当該サイズの部分領域に対する前記推定処理の処理時間とを関連付けた処理時間情報に基づき、前記画像において前記設定手段により設定された前記複数の部分領域に対する前記推定処理の処理時間である全体処理時間を算出する算出手段とを有する。
本発明によれば、画像に対する特定物体の数の推定処理の処理時間を算出することにかかる時間の増大を抑制することができる。
システム構成の一例を示す図である。 機能ブロックの一例を示す図である。 画像に対し設定される複数の部分領域の一例を示す図である。 処理時間情報の一例を示す図である。 全体処理時間および総フレーム処理時間を算出する処理のフローチャートである。 全体処理時間および総フレーム処理時間を算出する処理を説明するための図である。 処理時間情報を更新する処理のフローチャートである。 ライブ映像の設定されたフレーム間隔に対する推定処理が実行可能かを判定する処理を説明するための図である。 表示されるGUIの一例を示す図である。 各装置のハードウェア構成を示す図である。
以下、添付図面を参照しながら、本発明に係る実施形態について説明する。なお、以下の実施形態において示す構成は一例に過ぎず、図示された構成に限定されるものではない。
(実施形態1)
図1は、本実施形態におけるシステム構成を示す図である。本実施形態におけるシステムは、情報処理装置100、撮像装置110、記録装置120、およびディスプレイ130を有している。
情報処理装置100、撮像装置110、および記録装置120は、ネットワーク140を介して相互に接続されている。ネットワーク140は、例えばETHERNET(登録商標)等の通信規格に準拠する複数のルータ、スイッチ、ケーブル等から実現される。
なお、ネットワーク140は、インターネットや有線LAN(Local Area Network)、無線LAN(Wireless Lan)、WAN(Wide Area Network)等により実現されてもよい。
情報処理装置100は、例えば、後述する情報処理の機能を実現するためのプログラムがインストールされたパーソナルコンピュータ等によって実現される。
撮像装置110は、画像を撮像する装置であり、撮像手段として機能する。撮像装置110は、撮像した画像の画像データと、画像を撮像した撮像日時の情報と、撮像装置110を識別する情報である識別情報とを関連付けて、ネットワーク140を介し、情報処理装置100や記録装置120等の外部装置へ送信する。なお、本実施形態に係るシステムにおいて、撮像装置110は1つとするが、複数であってもよい。すなわち、複数の撮像装置110が、ネットワーク140を介して、情報処理装置100や記録装置120と接続されてもよい。この場合、情報処理装置100および記録装置120は、例えば、送信された画像と関連付けられた識別情報を用いて、送信された当該画像は、複数の撮像装置110のうちどの撮像装置110により撮像されたかを判断する。
記録装置120は、撮像装置110が撮像した画像の画像データと、画像を撮像した撮像日時の情報と、撮像装置110を識別する識別情報とを関連付けて記録する。そして、情報処理装置100からの要求に従って、記録装置120は、記録したデータ(画像、識別情報など)を情報処理装置100へ送信する。
ディスプレイ130は、LCD(Liquid Crystal Display)等により構成されており、情報処理装置100の情報処理の結果や、撮像装置110が撮像した画像などを表示する。ディスプレイ130は、HDMI(登録商標)(High Definition Multimedia Interface)等の通信規格に準拠したディスプレイケーブルを介して情報処理装置100と接続されている。なお、ディスプレイ130、情報処理装置100、および記録装置120の少なくともいずれか2つ又は全ては、単一の筐体に設けられてもよい。
なお、情報処理装置100による情報処理の結果や、撮像装置110により撮像された画像は、情報処理装置100にディスプレイケーブルを介して接続されたディスプレイ130に限らず、例えば、次のような外部装置が有するディスプレイに表示されてもよい。すなわち、ネットワーク140を介して接続されたスマートフォン、タブレット端末などのモバイルデバイスが有するディスプレイに表示されていてもよい。
次に、図2に示す本実施形態に係る情報処理装置100の機能ブロックを参照して、本実施形態に係る情報処理装置100の情報処理について説明する。なお、図2に示す各機能は、本実施形態の場合、図10を参照して後述するROM(Read Only Memory)1020とCPU(Central Processing Unit)1000とを用いて、次のようにして実現されるものとする。すなわち、図2に示す各機能は、情報処理装置100のROM1020に格納されたコンピュータプログラムを情報処理装置100のCPU1000が実行することにより実現される。
通信部200は、I/F1040を介して、撮像装置110や記録装置120と通信を行う。通信部200は、例えば、撮像装置110が撮像した動画像や静止画などの画像データを受信する。なお、動画像は、時間的な連続性(あるいは、関連性)を有する複数のフレームの画像により構成される。本実施形態における通信部200は、撮像装置110により撮像された動画像を構成する複数フレームの画像のうち少なくとも1つの画像を処理対象の画像として取得したり、撮像装置110により撮像された静止画を処理対象の画像として取得したりする。また、通信部200は、撮像装置110を制御するための制御コマンドを撮像装置110へ送信したりする。なお、制御コマンドは、例えば、撮像装置110に対して画像を撮像するよう指示を行うコマンドなどを含む。
出力制御部201は、撮像装置110が撮像した画像、本実施形態に係る情報処理に関する設定を行う設定画面、または、情報処理の結果を示す情報などを外部装置に出力したり、ディスプレイ130に表示させたりする。なお、出力制御部201による情報の出力先である外部装置は、例えば、他の情報処理装置(不図示)や記録装置120を含む。操作受付部202は、キーボードやマウス等の入力装置(不図示)を介して、ユーザが行った操作を受け付ける。
設定部203は、撮像装置110により撮像された画像における所定領域に対し、特定物体の数を推定する推定処理の対象である複数の部分領域を設定する。なお、所定領域とは、推定された特定物体の数の合算が計数される対象の領域を示し、例えば、ユーザによる画像上の位置の指定に従って、設定部203により設定される。そして、本実施形態における設定部203は、画像における所定領域を覆うように、当該所定領域に対し複数の部分領域の各々を並べて設定する。なお、以降の説明において、本実施形態における所定領域は、画像全体の領域である場合を想定する。また、本実施形態における設定部203は、例えば、画像300上の複数の異なる地点各々において映る特定物体のサイズと位置の情報に基づき、当該画像に対し複数の部分領域を設定する。なお、設定部203は、例えば、操作受付部203が受け付けた部分領域を指定するユーザの操作に基づき、画像に対し複数の部分領域を設定するようにしてもよい。なお、設定部203による部分領域を設定する処理の詳細な説明については後述する。
推定部204は、回帰ベース推定法により、設定部203により設定された画像における複数の部分領域の各々に対し、特定物体の数を推定する推定処理を実行する。回帰ベース推定法では、ある固定サイズSの小画像を入力とし、当該小画像に写っている特定物体の数を出力とする回帰器(学習済み認識モデル)を用いることで、撮像装置110により撮像された画像上の部分領域における特定物体の数を推定する。回帰器を学習させるにあたって、特定物体の位置が既知である固定サイズSの小画像を大量に用意し、当該対象の小画像を学習データとして、機械学習手法に基づいて回帰器を学習しておく。このとき、特定物体の数の推定精度を向上させるため、学習データである小画像のサイズ(固定サイズS)と当該小画像に映る特定物体のサイズとの比率が略一定であることが望ましい。そして推定部204は、画像に設定された複数の部分領域の各々について、当該部分領域の画像を固定サイズSにリサイズしたものを小画像とし、当該小画像を回帰器に入力することで「当該部分領域内の特定物体の位置」を回帰器からの出力として求める。このとき、当該部分領域内の特定物体の位置の数が、当該部分領域内における特定物体の数となる。
なお、設定部203が画像に対し複数の部分領域を設定するにあたって、部分領域のサイズと当該部分領域内で映る特定物体のサイズとの比率が、学習データである小画像のサイズと当該小画像に映る特定物体のサイズとの比率rと略同一になることが望ましい。このように、学習データの環境に近づくよう画像に対し部分領域を設定することで、部分領域に含まれる特定物体の数の推定精度をより高めることができる。なお、以降の説明において、人物を特定物体して説明するが、これに限らない。例えば、人物の頭部、上半身、腕、足など人物の一部の部位を特定物体としてもよいし、車やナンバープレートなど他の物体を特定物体としてもよい。
記録部205は、情報処理装置100による情報処理に関わる情報やデータを記憶する。例えば、記録部205は、画像に対し設定部203により設定された複数の部分領域各々に対する推定処理により推定された人物の数を記録する。また、本実施形態における記録部205は、複数の異なるサイズ各々について、当該サイズと、当該サイズの部分領域に対する推定処理に要する処理時間とを関連付けた情報である処理時間情報を記録する。なお、本実施形態において、処理時間情報は、情報処理装置100の記録部205が保持するものとしたが、これに限らない。例えば、情報処理装置100とネットワーク140を介して接続される外部装置(例えば記録装置120)が処理時間情報を保持していてもよい。この場合、情報処理装置100の通信部200は、処理時間情報を要求するコマンドを当該外部装置へ送信し、当該コマンドに従って当該外部装置から送信された処理時間情報を取得するようにしてもよい。
算出部206は、処理時間情報に基づき、画像において設定部204により画像に対し設定された複数の部分領域に対する推定処理の処理時間である全体処理時間を算出する。なお、全体処理時間とは、1つのフレームの画像における設定された複数の部分領域各々に対する推定処理に要した処理時間を合算した時間である。言い換えれば、全体処理時間とは、1つのフレームの画像に対する推定処理に要する処理時間である。また、算出部206は、複数の画像(複数フレームからなる動画像など)に対する推定処理の処理時間である総フレーム処理時間を算出する。総フレーム処理時間を算出する場合、算出部206は、例えば、次のような処理を実行する。すなわち、算出部206は、複数の画像のうち1つの画像について全体処理時間を算出し、当該全体処理時間と、当該複数フレームの画像の数とに基づき、当該複数の画像に対する総フレーム処理時間を算出する。例えば、算出部206は、複数の画像のうち1つの画像について算出した全体処理時間と、当該複数の画像のフレームの数とを乗じて得られる値を総フレーム処理時間として算出する。なお、算出部206により算出された1つの画像に対する全体処理時間を示す情報や、複数の画像に対する総フレーム処理時間を示す情報は、出力制御部202により外部装置に出力される。例えば、出力制御部202は、算出部206により算出された全体処理時間を示す情報や、総フレーム処理時間を示す情報などをディスプレイ130に表示させる。
更新部207は、画像における或る部分領域に対して推定処理が推定部204に実行された場合、当該或る部分領域に対する推定処理に実際に要した処理時間である実処理時間に基づき、処理時間情報における当該部分領域のサイズに対応する処理時間を更新する。例えば、更新部207は、画像に対し設定された複数の部分領域のうちの1つである或る部分領域に対する推定処理の実処理時間と、記録部205に記録される処理時間情報における当該或る部分領域のサイズに関連付けられた処理時間との差分を算出する。そして、更新部207は、算出した差分値が所定値未満である場合、処理時間情報の更新は行わない。一方、算出した差分値が所定値以上である場合、処理時間情報における当該或る部分領域のサイズに関連付けられた処理時間を、当該或る部分領域に対する推定処理の実処理時間に変更(更新)する。
次に図3を参照して、画像に対し複数の部分領域を設定する場合について説明する。図3は、本実施形態において撮像装置110に撮像された画像に対し設定された複数の部分領域を示す図である。
本実施形態における設定部203は、図3に示すように、撮像装置110により撮像された画像300に対して複数の部分領域を設定する。なお、本実施形態における設定部203は、画像300上の複数の異なる地点各々において映る人物のサイズと位置の情報に基づき、当該画像に対して複数の部分領域を設定するものとする。複数の異なる地点各々において映る人物のサイズと位置の情報は、予めユーザにより指定されてもよい。例えば、操作受付部203は、表示された画像における上部、中部、下部各々において映る人物の平均的なサイズを指定するユーザ操作を受け付ける。そして、記憶部205は、ユーザ操作に従って指定された上部、中部、下部各々について、人物の位置と、当該位置において映る平均的なサイズの情報を記憶する。そして、設定部203は、記憶部205により記憶された、画像の上部、中部、下部各々について、人物の位置と、当該位置における平均的なサイズ情報を取得する。なお、複数の異なる地点各々において映る人物のサイズと位置の情報は、次のように取得されてもよい。すなわち、撮像装置110により予め撮像された画像に対しパターンマッチングなどを用いて人物を検出する処理を実行し、当該画像から検出された人物の位置と、当該位置における当該人物のサイズとを関連付けた情報を記録部205は記憶する。そして、設定部203は、記憶部205により記憶された、画像から検された複数の異なる地点各々における人物の位置とサイズの情報として、画像から検出された人物の位置とサイズの情報を記憶部205から取得する。
そして、設定部204は、画像上の複数の異なる地点各々に対応する、人物の位置と、当該位置において映る人物のサイズの情報に基づき、画像上の任意の位置で映る人物のサイズ情報f(x,y)を推定する。画像上の任意の位置における人物のサイズ情報f(x,y)は、画像上の任意の位置座標(x、y)において映る人物の平均的なサイズを示している。サイズ情報f(x,y)は、例えば、画像上のx座標を示すx、画像上のy座標を示すy及び1個以上のパラメータによって表せると仮定する。例えば、f(x,y)=ax+by+cと仮定する。この例では、未知のパラメータはa、b及びcである。このとき設定部204は、記憶部205により記憶された画像上の複数の異なる地点各々における人物の位置とサイズの情報を用いて、未知のパラメータを、例えば最小二乗法等の統計処理により求めることができる。
そして、本実施形態における設定部204は、画像上の任意の位置における人物のサイズであるサイズ情報f(x,y)に基づき、画像に対して複数の部分領域を設定する。図3に示す例では、画像300上の任意の位置における人物のサイズとして、画像300の水平方向において人物のサイズは略同一であり、画像300の垂直方向における下部から上部に向かうにつれ人物のサイズは小さくなるものとする。まず、本実施形態における設定部203は、画像300の下端に沿って複数の部分領域301aを設定する。このとき部分領域301aのサイズ(サイズaとする)と、該部分領域301a内の下端の座標においてサイズ情報f(x,y)が示す人物のサイズとの比率が学習データに対応する比率rと略同一になるように、設定部203は部分領域301aを設定する。次に、設定部203は、複数の部分領域301aの上端に沿って、複数の部分領域301bを設定する。このとき部分領域301bのサイズ(サイズbとする)と、当該部分領域301b内の下端の座標においてサイズ情報f(x,y)が示す人物のサイズとの比率が学習データに対応する比率rと略同一になるように、設定部203は部分領域301bを設定する。次に、設定部203は、複数の部分領域301bの上端に沿って、複数の部分領域301cを設定する。このとき部分領域301cのサイズ(サイズcとする)と、該部分領域301c内の下端の座標においてサイズ情報f(x、y)が示す人物のサイズとの比率が学習データに対応する比率rと略同一になるように、設定部203は部分領域301cを設定する。このように、本実施形態における設定部203は、部分領域のサイズと該部分領域における特定物体のサイズとの比率が、学習データである小画像のサイズと当該小画像に映る特定物体のサイズとの比率rと略同一になるよう、画像に対し部分領域を設定する。このように、学習データの環境に近づくよう画像に対し部分領域を設定することで、部分領域に含まれる特定物体の数の推定精度をより高めることができる。なお図3を参照した上述の説明において画像の下端から上端に向かう順番で部分領域を設定したが、これに限らず、他の位置から部分領域を設定してもよい。
続いて、図4に示すテーブルを参照して、本実施形態における記録部205により記録される処理時間情報について説明する。図4に示す処理時間情報400は、複数の異なる部分領域のサイズ各々について、当該サイズ401と、当該サイズの部分領域に対する推定処理の処理時間402とを関連付けたテーブルの情報である。なお、図4に示すように、部分領域のサイズ401は、矩形である部分領域の幅と高さそれぞれがピクセル(px)の単位で示され、1つの部分領域に対する推定処理の処理時間は(ms)の単位で示される。なお、図4に示す処理時間情報400の初期値は、ユーザにより予め設定された値でもいいし、使用するコンピュータの性能に応じて定めてもよい。なお、処理時間情報400の初期値は、例えば、次のような処理を実行して得られる。すなわち、予め推定部204が部分領域に対して推定処理を実行し、記録部205は、当該部分領域に対する推定処理に要した処理時間と、当該部分領域のサイズとを関連付けて処理時間情報として保持する。なおこのとき、推定部204は、或るサイズの部分領域に対して複数回の推定処理を実行し、記録部205は、当該部分領域に対する当該複数回の推定処理各々に要した処理時間の平均値と、当該或るサイズとを関連付けて処理時間情報として保持してもよい。
続いて、図5のフローを参照して、本実施形態における情報処理装置100により実行される情報処理を説明する。図5に示すフローの処理を実行することで、撮像装置110により撮像された画像における複数の部分領域に対し推定処理を実行するのに先立ち、全体処理時間および総フレーム処理時間を算出してユーザに提示することができる。なお、図5に示すフローは、例えば、撮像装置110により撮像された画像に対して複数の部分領域が設定される設定モードにおいてユーザ指示に従って実行されるようにしてもよい。また、図5に示すフローは、例えば、撮像装置110により撮像された画像に対して複数の部分領域の設定が完了したことに伴い、自動的に実行されるようにしてもよい。なお、図5に示すフローの処理は、情報処理装置100のROM1020に格納されたコンピュータプログラムを情報処理装置100のCPU1000が実行して実現される図2に示す機能ブロックにより実行されるものとする。
まず、S501において、画像に対する複数の部分領域の設定が完了していると判定された場合(S501にてYes)、S502へ遷移する。一方、画像に対する複数の部分領域の設定が完了していないと判定された場合(S501にてNo)、図5に示すフローの処理を終了する。
次に、S502にて、算出部206は、画像に対し設定された複数の部分領域の情報を取得する。ここで、算出部206は、複数の部分領域の情報として、例えば、画像に対し設定された当該複数の部分領域各々の位置およびサイズの情報を取得する。次に、S503にて、算出部206は、画像に対し設定された部分領域のサイズのうち、注目対象のサイズを決定する。図3に示すように、画像300に対して、“サイズa”の部分領域301a、“サイズb”の部分領域301b、または、“サイズc”の部分領域301cが設定されている場合を想定する。このとき、S503において算出部206は、例えば、画像に対し設定された部分領域のサイズのうち、最もサイズの大きい“サイズa”を注目対象として決定する。
次に、S504にて、算出部206は、現在注目対象としているサイズの部分領域の数Nをカウントする。図3に示す例において、現在注目対象としているサイズが“サイズa”の場合、算出部206は、現在注目対象としているサイズの部分領域の数Nとして“4”を算出する。次に、S505にて、算出部206は、記録部206により記録された処理時間情報400に基づき、現在注目対象のサイズに対応する処理時間atを取得する。ここで、図3に示す例において、現在注目対象としているサイズが“サイズa”であり、当該“サイズa”が“200(px)×200(px)”である場合を想定する。このとき、算出部206は、記録部205により記録された処理時間情報400から、“サイズa(200×200)”に対応する処理時間として“50”の情報を取得する。このように、算出部206は、処理時間情報400における“サイズa”が示す数値と最も近いサイズ401を特定し、特定したサイズ401に対応する処理時間402を取得する。次に、S506にて、算出部206は、1フレームの画像当たりの全体処理時間Sを求めるために、“注目対象のサイズの部分領域の数N”と“注目対象のサイズに対応する処理時間at”との積を全体処理時間Sに加算する。なお、全体処理時間Sは、図5に示すフローが開始された時点では“ゼロ”に初期化されているものとする。次に、S507にて、算出部206は、画像に対し設定された部分領域のサイズのうち、全てのサイズについて注目対象として決定したかを判定する。図3に示す例では、算出部206は、サイズa、サイズb、サイズcの3つのサイズ全てを注目対象として決定したかを判定する。画像に対し設定された部分領域のサイズのうち、全てのサイズについて注目対象として決定したと算出部206により判定された場合(S507にてYes)、S508へ遷移する。一方、画像に対し設定された部分領域のサイズのうち、全てのサイズについて注目対象として決定していないと算出部206により判定された場合(S507にてNo)、算出部206は、注目対象としていないサイズのうち、次に注目対象とするサイズを決定する。例えば、図3に示す例において、“サイズa”、“サイズb”、“サイズc”のうち、“サイズa”だけを注目対象として決定している場合を想定する。このとき、S507にてNoとなりS503へ遷移し、S503にて、算出部206は、例えば“サイズa”の次にサイズが大きい“サイズb”を注目対象として決定する。そして、注目対象として決定された“サイズb”についてS504~S506の処理が実行される。すなわち、図5に示すフローにおいて、画像に対し設定された部分領域の異なるサイズ各々についてS503~S507の処理が繰り返される。その結果、算出部206は、1つのフレームの画像に対して設定された複数の部分領域に対する全体処理時間が算出される。
次に、S508にて、算出部206は、推定処理の対象となる画像のフレームの数xを取得する。ここで、推定処理の対象となる画像のフレームの数xは、次のような処理を経て取得される。すなわち、本実施形態における操作受付部202は、例えば、推定処理の対象となる画像を指定するユーザ操作を受け付ける。このとき、ユーザは、例えば、撮像装置110が撮像した動画像のうち推定処理が実行される画像の撮像日時の範囲と、推定処理が実行されるフレームの間隔であるフレーム間隔とを指定する操作を行う。ここで、推定処理が実行される画像の撮像日時の範囲として“2020/〇/△/13:00~2020/〇/△/18:00”が指定され、フレーム間隔として“10”が指定された場合を想定する。このとき算出部206は、推定処理の対象となる画像のフレームの数として、“2020/〇/△/13:00~2020/〇/△/18:00”の間に撮像装置110に撮像された画像のフレームの数を、フレーム間隔“10”で割った数を取得する。ここで、“2020/〇/△/13:00~2020/〇/△/18:00”の間に撮像装置110に撮像された画像のフレームの数が“1000”の場合、算出部206は、推定処理の対象となる画像のフレームの数xとして、“100”の数を取得する。
次に、S509にて、算出部206は、S503~S506の処理を経て算出された1つのフレームの画像に対する全体処理時間Sと、S508にて取得された推定処理の対象となる画像のフレームの数xとに基づき、総フレーム処理時間S’を算出する。本実施形態において、算出部206は、1つのフレームの画像に対する全体処理時間Sと、推定処理の対象となる画像のフレームの数xとを乗じることで、推定処理の対象となる全ての画像に対する総フレーム処理時間S’を算出する。なお、本実施形態において、推定処理の対象となる画像のフレームの数xが複数である場合、推定処理の対象である複数の画像各々に対し設定される複数の部分領域の位置とサイズは略同一であるものとする。言い換えれば、本実施形態において、推定処理の対象となる複数の画像に対して、複数の部分領域の設定として同じ設定がなされているものとする。
次に、S510にて、出力制御部201は、算出部206により算出された全体処理時間および総フレーム処理時間の少なくともいずれか一方を外部装置に出力する。本実施形態における出力制御部201は、例えば、算出部206により算出された1つのフレームの画像に対する全体処理時間と、推定処理の対象となる画像全体に対する総フレーム処理時間とをディスプレイ130に表示させる。なお、このとき、出力制御部201は、全体処理時間と、総フレーム処理時間と、設定部203により設定された複数の部分領域が重畳された画像と、解析設定の情報とを同時にディスプレイ130に表示させてもよい。なお、解析設定の情報とは、推定処理の対象となる画像のフレーム数xと、推定処理が実行される画像の撮像日時の範囲と、推定処理が実行されるフレーム間隔の少なくともいずれか1つを含むものとする。このように、推定処理に要する処理時間の予測とともに、現状の解析設定の情報をユーザに提示することで、ユーザが意図していた以上に予測された処理時間が長いような場合、ユーザは処理時間をおさえるよう解析設定を変更することが可能となる。
ここで、図6を参照して、本実施形態における全体処理時間および総フレーム処理時間を算出する処理の具体例について説明する。図6(a)では、撮像された画像600aに対する部分領域の設定のパターンである部分領域設定610aと、撮像された画像600bに対する部分領域の設定のパターンである部分領域設定610bとが示されている。なお、図6(a)に示すように、部分領域設定610aと部分領域設定610bとでは、設定される部分領域の個数やサイズが異なっている。なお図6(a)に示す例では、画像600a、600bの各々は、図3と同様、任意の位置における人物のサイズは、画像の水平方向にて人物のサイズは略同一であり、画像の垂直方向における下部から上部に向かうにつれ人物のサイズは小さくなるものとする。したがって、画像600a,600b各々は、画像の水平方向に設定される複数の部分領域のサイズは同じであり、画像の鉛直方向において下から上へ向かうにつれて部分領域のサイズは小さくなる。図6(b)のテーブル620では、画像600aにおける部分領域設定610a、および、画像600bにおける部分領域設定610b、それぞれの場合の全体処理時間と総フレーム処理時間を示している。なお、図6(b)に示す例では、推定処理の対象である画像のフレームの数は“1000”であるものとする。本実施形態における出力制御部201は、算出部206による全体処理時間と総フレーム処理時間とを含むテーブル620の情報をディスプレイ130に表示させるようにしてもよい。
次に、図7に示すフローを参照して、画像に対して設定された複数の部分領域に対して推定処理を実行するモードである運用モードについて説明する。図7に示すフローの処理を実行することで、画像上の複数の部分領域に対して特定物体の数の推定処理を実行することができ、更に処理時間情報を更新することができる。なお、図7に示すフローの処理は、情報処理装置100のROM1020に格納されたコンピュータプログラムを情報処理装置100のCPU1000が実行して実現される図2に示す機能ブロックにより実行されるものとする。
S701にて、通信部200は、撮像装置110により撮像された動画における1つのフレームの画像を処理対象の画像として取得する。なお、通信部200は、ネットワーク140を介して撮像装置110や記憶装置120から処理対象の画像を取得してもよいし、情報処理装置100の記憶部205から処理対象の画像を取得してもよい。また、通信部200は、撮像装置110により撮像された静止画を処理対象の画像として取得してもよい。次に、S702にて、算出部206は、画像に対し設定された複数の部分領域の情報を取得する。ここで、算出部206は、複数の部分領域の情報として、例えば、画像に対し設定された当該複数の部分領域各々の位置およびサイズの情報を取得する。次に、S703にて、推定部204は、S702にて取得した情報に基づく画像上の複数の部分領域の各々に対し人物の数を推定する推定処理を実行する。次に、S704にて、算出部206は、現在処理対象としている画像に対し設定された複数の部分領域の各々に対する推定処理に推定された人物の数を合算することで人物の計数結果を取得する。次に、S705にて、出力制御部201は、部分領域の各々に対して推定された人物の数を合算した計数結果を示す情報を外部装置(ディスプレイ130等)へ出力する。推定処理の対象である全ての画像に対して推定処理が実行されてない場合(S706にてNo)、S701へ遷移し、通信部200は、次のフレームの画像を処理対象の画像として取得する。推定処理の対象である全ての画像に対して推定処理を実行した場合(S706にてYes)、S707へ遷移する。S707にて、更新部207は、処理時間情報の更新処理を実行する。
ここで、図7(b)に示すフローを参照して、S707の処理時間情報の更新処理について説明する。図7(b)に示すフローを実行することにより、処理時間情報を適応的に更新することができる。なお、図7(b)に示すフローの処理は、情報処理装置100のROM1020に格納されたコンピュータプログラムを情報処理装置100のCPU1000が実行して実現される図2に示す機能ブロックにより実行されるものとする。
S771にて、更新部206は、現状設定されている部分領域のサイズのうち、注目対象のサイズを決定する。ここで、図3に示すように、画像300に対して、“サイズa”の部分領域301a、“サイズb”の部分領域301b、または、“サイズc”の部分領域301cが設定されている場合を想定する。このとき、S771において更新部206は、例えば、画像に対し設定された部分領域のサイズのうち、最もサイズの大きい“サイズa”を注目対象として決定する。
次に、S772にて、更新部206は、注目対象のサイズの部分領域に対し、複数のフレームの画像にわたってS703にて実行された推定処理に要した実際の処理時間である実処理時間の平均値を取得する。ここで、図3に示す例において、注目対象のサイズとして“サイズa”が注目対象である場合を想定する。このとき、更新部206は、S701~S706の処理を経て、複数の画像に対して注目対象である“サイズa”の部分領域に対して実行された複数回の推定処理各々に要した処理時間の平均値を取得する。次に、S773にて、更新部206は、注目対象のサイズの部分領域について取得した実処理時間の平均値と、記録部205により記録された処理時間情報における注目対象のサイズに対応する処理時間との差分値を算出する。ここで、図3に示す例において、注目対象のサイズとして“サイズa”が注目対象である場合を想定する。このとき、更新部206は、S772において“サイズa”の部分領域について取得した実処理時間の平均値と、処理時間情報400において“サイズa”に対応する処理時間との差分値を算出する。次に、S773にて算出された差分値が所定値以上である場合(S774にてYes)、S775へ遷移する。そしてS775にて、更新部207は、S772で取得した注目対象のサイズの部分領域について取得した実処理時間の平均値を用いて、処理時間情報400における当該注目対象のサイズに対応する処理時間を更新する。例えば、図3に示す例において、注目対象のサイズとして“サイズa”が注目対象である場合を想定する。このとき、更新部207は、処理時間情報400の“サイズa”に最も近いサイズ401を特定し、特定したサイズ401に関連付けられた処理時間402を、“サイズa”の部分領域についてS772で取得された実処理時間の平均値に置き換える。次に、S776にて、更新部207は、画像に対し設定された部分領域のサイズのうち、全てのサイズについて注目対象として決定したかを判定する。図3に示す例では、更新部206は、“サイズa”、“サイズb”、“サイズc”の3つのサイズ全てを注目対象として決定したかを判定する。画像に対し設定された部分領域のサイズのうち、全てのサイズについて注目対象として決定したと更新部207により判定された場合(S776にてYes)、図7(b)に示すフローの処理を終了する。一方、画像に対し設定された部分領域のサイズのうち、全てのサイズについて注目対象として決定していないと判定された場合(S776にてNo)、S771に遷移し、更新部206は、注目対象としていないサイズのうち次に注目対象とするサイズを決定する。例えば、図3に示す例において、“サイズa”、“サイズb”、“サイズc”のうち、“サイズa”だけを注目対象として決定している場合を想定する。このとき、S776にてNoとなりS771へ遷移し、S771にて更新部207は、“サイズa”の次にサイズが大きい“サイズb”を注目対象として決定する。そして、注目対象として決定された“サイズb”についてS771~S776の処理が実行される。すなわち、図7(b)に示すフローにおいて、画像に対し設定された部分領域の異なる全てのサイズについてS771~S776の処理が繰り返される。その結果、更新部207は、画像に対して設定された部分領域の異なる複数のサイズ各々に対応する処理時間情報400を更新することができる。
ここでライブ映像に対して推定処理が実行される場合を想定し、ここで図8、9を参照して、ライブ映像に対する推定処理に先立ち、当該ライブ映像に対する推定処理が追いつくか否かについて判定する処理について説明する。
図8は、ライブ映像に対する推定処理が追いつくか否かを判定する処理を説明するための図である。図8に示す例において、横軸が時間を示している。また、図8では、ライブ映像の各フレームのうち、推定処理が実行されるフレーム間隔に従って得られる推定処理の対象である画像が取得される時間と、推定処理が実際に実行されたフレームの画像について推定処理に要した処理時間とが示されている。図8において、ライブ映像を構成する時間的に連続した各フレームのうち、推定処理が実行されるフレーム間隔としてユーザは“3フレーム”を指定した場合を想定する。このとき、図8に示すように、“フレーム1”から3フレームごとに順次新たなフレームの画像が取得される様子が示される。また、3フレームごとに画像が取得されることと並行し、取得された各フレームに対し推定処理が実行される様子が示される。しかしながら、ライブ映像におけるユーザに指定されたフレーム間隔のフレーム全てについて推定処理を行いたい場合であっても、設定された部分領域の数が多いなど解析設定の内容によって、次のような問題が生じることがある。すなわち、図8に示すように、1つのフレームの画像に対する全体処理時間が長くなり、“フレーム7”や“フレーム13”のようにユーザが予期せず解析できないフレームが発生してしまうことがある。
そこで、本実施形態における算出部206は、ライブ映像におけるユーザに指定されたフレーム間隔の画像に対する推定処理の実行に先立ち、次のような処理を実行する。すなわち、算出部206は、フレーム間隔の時間(以下、フレーム間隔時間)と、図5に示すフローの処理により算出される1つの画像に対する全体処理時間とを比較する。なお、フレーム間隔時間とは、前フレームの画像がライブ映像にて取得される時刻と、当該前フレームの画像からフレーム間隔後の次フレームの画像がライブ映像にて取得される時刻との間の時間間隔を示している。図8に示す例では、フレーム間隔が“3フレーム”として指定されているため、フレーム間隔時間は、例えば“フレーム1”が取得される時刻と、“フレーム4”が取得される時刻との差分である。そして、算出部206によるフレーム間隔時間と全体処理時間との比較の結果、フレーム間隔時間の方が大きい場合、算出部206は、ライブ映像におけるフレーム間隔の画像に対する推定処理は追いつくと判定する。一方、当該比較の結果、全体処理時間の方が大きい場合、算出部206は、ライブ映像におけるフレーム間隔の画像に対する推定処理は追いつかないと判定する。出力制御部201は、ライブ映像におけるフレーム間隔に対する推定処理が追いつくか否かの算出部206による判定結果を示す情報を出力する。例えば、ライブ映像のフレーム間隔の画像に対する推定処理が追いつかないと算出部206により判定された場合、出力制御部201は、ユーザに通知を行う。図9に示す表示画面は、ライブ映像のフレーム間隔の画像に対する推定処理が追いつかないと算出部206により判定された場合、出力制御部201により表示されるGUIの一例を示す図である。図9に示す例において、出力制御部201は、「ライブ映像のフレーム間隔の画像に推定処理が追いつかない可能性があります」といった所定のエラーメッセージを表示する。また、表示画面900上のチェックボックス901を選択しOKボタン904をユーザが押下した場合、出力制御部201は、ライブ映像の推定処理が実行されるフレーム間隔の変更を行うための設定画面をディスプレイ130に表示させることができる。また、表示画面900上のチェックボックス902を選択しOKボタン904をユーザが押下した場合、出力制御部201は、現在設定されている部分領域の設定を変更するための設定画面をディスプレイ130に表示させることができる。また、表示画面900上のチェックボックス903を選択しOKボタン904をユーザが押下した場合、フレーム間隔や部分領域の設定の変更を行わず、ライブ映像に対する推定処理が実行される。このように、ライブ映像におけるユーザ指定のフレーム間隔に対する推定処理に先立ち、当該ライブ映像に対する推定処理が追いつくか否かについて判定し、当該判定の結果をユーザに提示するようにしてもよい。
以上説明したように本実施形態の情報処理装置100は、複数の異なるサイズ各々について当該サイズと当該サイズの部分領域に対する処理時間とを関連付けた処理時間情報に基づき、画像に対し設定された複数の部分領域に対する全体処理時間を算出する。また本実施形態における情報処理装置100は、推定処理の対象である画像のフレームの数と、1つのフレームの画像に対する全体処理時間とに基づき、総フレーム処理時間を算出する。このように、撮像装置110により撮像された画像における複数の部分領域に対し推定処理を実行するのに先立ち、1つの画像に対する全体処理時間や、推定処理の対象である画像全体に対する総フレーム処理時間を算出してユーザに提示することができる。このように、推定処理に要する処理時間の予測をユーザに提示することで、ユーザが意図していた以上に予測された処理時間が長いような場合、ユーザは処理時間をおさえるよう解析設定を変更することが可能となる。また、本実施形態における情報処理装置100は、画像に対し設定された複数の部分領域の全てに対し推定処理を実行せず、処理時間情報に基づき、画像に対する全体処理時間を算出している。このようにすることで、画像に対する特定物体の数の推定処理の処理時間を算出することにかかる時間の増大を抑制することができる。
また、本実施形態における情報処理装置100は、画像に対し設定された部分領域に対し実際に実行された推定処理に要した処理時間に基づき、記録部205に記録された処理時間情報を更新することができる。これより、記録部205により保持される処理時間情報における異なるサイズ各々に対する処理時間の精度を向上させることができる。
(その他の実施形態)
次に図10を参照して、各実施形態の各機能を実現するための情報処理装置100のハードウェア構成を説明する。なお、以降の説明において情報処理装置100のハードウェア構成について説明するが、記録装置120および撮像装置110も同様のハードウェア構成によって実現されるものとする。
本実施形態における情報処理装置100は、CPU1000と、RAM1010と、ROM1020、HDD1030と、I/F1040と、を有している。CPU1000は情報処理装置100を統括制御する中央処理装置である。RAM1010は、CPU1000が実行するコンピュータプログラムを一時的に記憶する。また、RAM1010は、CPU800が処理を実行する際に用いるワークエリアを提供する。また、RAM1010は、例えば、フレームメモリとして機能したり、バッファメモリとして機能したりする。
ROM1020は、CPU1000が情報処理装置100を制御するためのプログラムなどを記憶する。HDD1030は、画像データ等を記録する記憶装置であるI/F1040は、ネットワーク140を介して、TCP/IPやHTTPなどに従って、外部装置との通信を行う。
なお、上述した各実施形態の説明では、CPU1000が処理を実行する例について説明するが、CPU1000の処理のうち少なくとも一部を専用のハードウェアによって行うようにしてもよい。例えば、ディスプレイ130にGUI(GRAPHICAL USER INTERFACE)や画像データを表示する処理は、GPU(GRAPHICS PROCESSING UNIT)で実行してもよい。また、ROM1020からプログラムコードを読み出してRAM1010に展開する処理は、転送装置として機能するDMA(DIRECT MEMORY ACCESS)によって実行してもよい。
なお、本発明は、上述の実施形態の1以上の機能を実現するプログラムを1つ以上のプロセッサが読出して実行する処理でも実現可能である。プログラムは、ネットワーク又は記憶媒体を介して、プロセッサを有するシステム又は装置に供給するようにしてもよい。また、本発明は、上述の実施形態の1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。また、情報処理装置100の各部は、図10に示すハードウェアにより実現してもよいし、ソフトウェアにより実現することもできる。
なお、上述した各実施形態に係る情報処理装置100の1以上の機能を他の装置が有していてもよい。例えば、各実施形態に係る情報処理装置100の1以上の機能を撮像装置110が有していてもよい。なお、上述した各実施形態を組み合わせて、例えば、上述した実施形態を任意に組み合わせて実施してもよい。
以上、本発明を実施形態と共に説明したが、上記実施形態は本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲は限定的に解釈されるものではない。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱しない範囲において、様々な形で実施することができる。例えば、各実施形態を組み合わせたものも本明細書の開示内容に含まれる。
100 情報処理装置
110 撮像装置
120 記録装置
130 ディスプレイ
200 通信部
201 出力制御部
202 操作受付部
203 設定部
204 推定部
205 記録部
206 算出部
207 更新部

Claims (10)

  1. 撮像手段により撮像された画像に対し、特定物体の数を推定する推定処理の対象である複数の部分領域を設定する設定手段と、
    複数の異なるサイズについて、当該サイズと、当該サイズの部分領域に対する処理時間とを関連付けた処理時間情報に基づき、前記画像において前記設定手段により設定された前記複数の部分領域に対する前記推定処理の処理時間である全体処理時間を算出する算出手段とを有することを特徴とする情報処理装置。
  2. 前記算出手段は、前記画像に対する前記全体処理時間と、前記推定処理の対象である複数の画像を構成するフレームの数とに基づき、前記推定処理の対象である前記複数の画像に対する処理時間である総フレーム処理時間を算出することを特徴とする請求項1に記載の情報処理装置。
  3. 前記算出手段は、前記画像に対し設定された部分領域の異なるサイズ各々について前記処理時間情報に基づき取得した当該サイズに対応する処理時間と、前記画像上に設定された部分領域の異なるサイズ各々の数とに基づき、前記画像に対する前記全体処理時間を算出することを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記画像に対し設定された複数の部分領域に対し前記推定処理を実行する推定手段を更に有することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記画像に対し設定せれた複数の部分領域に対し実行された前記推定処理の処理時間に基づき、前記処理時間情報を更新する更新手段を更に有することを特徴とする請求項4に記載の情報処理装置。
  6. 前記処理時間情報を保持する保持手段を有することを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 前記算出手段により算出された前記画像に対する前記処理時間を示す情報を出力する出力手段を更に有することを特徴とする請求項1乃至6のいずれか1項に記載の情報処理装置。
  8. 前記出力手段は、前記撮像手段により撮像された前記推定処理が実行される第1の画像と第2の画像とが取得される時間間隔と、前記第1の画像または前記第2の画像のいずれかに対する前記全体処理時間とを比較した結果を示す情報を表示手段に表示させる請求項7に記載の情報処理装置。
  9. 撮像手段により撮像された画像に対し、特定物体の数を推定する推定処理の対象である複数の部分領域を設定する設定工程と、
    複数の異なるサイズについて、当該サイズと、当該サイズの部分領域に対する処理時間とを関連付けた処理時間情報に基づき、前記画像において前記設定工程において設定された前記複数の部分領域に対する前記推定処理の処理時間である全体処理時間を算出する算出工程とを有することを特徴とする情報処理方法。
  10. コンピュータを、請求項1乃至8のいずれか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
JP2020113353A 2020-06-30 2020-06-30 情報処理装置、情報処理方法、およびプログラム Pending JP2022011926A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020113353A JP2022011926A (ja) 2020-06-30 2020-06-30 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020113353A JP2022011926A (ja) 2020-06-30 2020-06-30 情報処理装置、情報処理方法、およびプログラム

Publications (1)

Publication Number Publication Date
JP2022011926A true JP2022011926A (ja) 2022-01-17

Family

ID=80147617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020113353A Pending JP2022011926A (ja) 2020-06-30 2020-06-30 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP2022011926A (ja)

Similar Documents

Publication Publication Date Title
US9600898B2 (en) Method and apparatus for separating foreground image, and computer-readable recording medium
US20180359415A1 (en) Panoramic video processing method and device and non-transitory computer-readable medium
JP5178797B2 (ja) 表示制御装置及び表示制御方法
CN104811660A (zh) 控制装置及控制方法
US20130271667A1 (en) Video processing apparatus and video processing method
CN107402757B (zh) 页面渲染方法及装置
JP2018124441A (ja) システム、情報処理装置、情報処理方法及びプログラム
JP2020170252A (ja) 画像処理装置、情報処理方法及びプログラム
JP2022011926A (ja) 情報処理装置、情報処理方法、およびプログラム
JP5795916B2 (ja) 画像処理装置、画像処理方法
JP2008009938A (ja) 動画像データ処理装置、動画像データ処理方法、動画像データ処理プログラム、およびこれを記録した記録媒体
JP2020113202A (ja) パラメータ選定装置、パラメータ選定方法、およびパラメータ選定プログラム
JP2021086392A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2022011928A (ja) 情報処理装置、情報処理方法、およびプログラム
JP7309392B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP7406878B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2022026849A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2022123391A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2021056899A (ja) 画像処理装置、画像処理方法およびプログラム
JP2020201674A (ja) 映像解析装置及びその制御方法及びプログラム
JP2021071907A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2019086912A (ja) 関心度計測システムおよび方法
JP2021092918A (ja) 画像処理装置、画像処理方法、コンピュータプログラム及び記憶媒体
JP2022038374A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2020197847A (ja) 画像処理装置、画像処理方法、およびプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20200713