JP7036208B2 - 物体検出方法および物体検出装置 - Google Patents
物体検出方法および物体検出装置 Download PDFInfo
- Publication number
- JP7036208B2 JP7036208B2 JP2020523539A JP2020523539A JP7036208B2 JP 7036208 B2 JP7036208 B2 JP 7036208B2 JP 2020523539 A JP2020523539 A JP 2020523539A JP 2020523539 A JP2020523539 A JP 2020523539A JP 7036208 B2 JP7036208 B2 JP 7036208B2
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- relationship
- score
- objects
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Description
図1は、本実施形態の物体検出装置1の概略の構成を示すブロック図である。物体検出装置1は、例えば、パーソナルコンピュータなどの端末装置で構成されており、店舗内に設置される少なくとも1台の監視カメラ10と通信回線(有線、無線を問わない)を介して接続されている。監視カメラ10での撮影によって取得された画像(動画または静止画)のデータが物体検出装置1に入力されると、物体検出装置1では、後述する物体検出方法による処理を実行し、これによって、画像上の複数の物体と、各物体の間の関係とが検出される。
次に、本実施形態の物体検出方法について説明する。図3は、図1の物体検出装置1による物体検出方法の処理の流れを示すフローチャートである。本実施形態の物体検出方法は、候補検出ステップ(S1)と、関係スコア検出ステップ(S2)と、物体決定ステップ(S3)と、関係決定ステップ(S4)とを含む。以下、より詳細に説明する。
S1では、検出処理部7の候補/関係スコア検出部7aが、所定のアルゴリズムに基づくニューロ演算(CNN)により、複数の物体が画像上で占める領域の候補を検出する。より詳しくは、以下の通りである。
S2では、候補/関係スコア検出部7aが、所定のアルゴリズムに基づくニューロ演算(CNN)により、各候補間の関係の尤度を表す関係スコアを検出する。このS2の関係スコア検出ステップは、上述したS1の候補検出ステップと並列に実行される。ここでは、S1の候補検出ステップと、S2の関係スコア検出ステップとをまとめて、候補/関係スコア検出ステップS10と呼ぶ。以下、S2の関係スコア検出ステップの詳細について説明する。
S3では、物体決定部7bが、所定のアルゴリズムに基づいて、S1で検出した複数の物体の候補Bから、複数の物体の領域を決定する。ここで、上記所定のアルゴリズムは、Non-Maximum Suppression(NMS)である。NMSは、同じクラスとして認識され、重なっている領域(候補B)のうち、スコア(S1で求めた検出スコアまたはクラススコア)の低いほうの領域(または候補)を除去し、スコアの高いほうの領域(または候補)を残すことで、重複を抑制するアルゴリズムである。なお、2つの領域(または候補)の「重なり」は、IoU(Intersection over Union)値と閾値とに基づいて判断することができる。IoU値は、例えば2つの候補p、qに着目した場合、{(候補pと候補qの両方に含まれる領域の面積)/(候補p、qの少なくとも一方に含まれる領域の面積)}の値(割合)を指し、このIoU値が閾値以上の場合に、2つの候補pおよびqが「重なっている」と判断することができる。
S4では、関係決定部7cが、S3で決定した領域に対応する候補の組(ペア)について、S2で検出された関係スコアPに基づいて、複数の物体の関係を決定する。より具体的には、以下の通りである。
以上のように、本実施形態の物体検出方法は、候補/関係スコア検出部7aが、複数の物体が画像上で占める領域の候補Bを検出し(S1)、検出した各候補Bごとに、上記候補を一の候補B(k,i)として、予め設定されたH’×W’の範囲内の他の候補B(k,j)に対する関係スコアPを検出する(S2)。そして、物体決定部7bが、所定のアルゴリズム(例えばNMS)に基づいて、複数の候補Bから複数の物体の領域を決定し(S3)、関係決定部7cが、関係スコアPに基づいて、複数の物体の関係を決定する(S4)。候補Bの検出および関係スコアPの検出は、候補/関係スコア検出部7aを構成するCNN、つまり、単一のCNNによってまとめて(同時に、並列に、非段階的に、Single-shotで)行うことができるため、複数のCNNを用いて人物等の候補の抽出、抽出した候補の統合および再度の畳み込みを行う従来技術のような、候補選択のための中間処理(統合、畳み込み)は不要であり、畳み込みの処理も冗長とならない。これにより、上記関係スコアに基づいて、画像から複数の物体およびそれらの関係を高速で検出することが可能となる。その結果、本実施形態の物体検出方法および物体検出装置1は、そのような高速な検出が必要とされるアプリケーションにも容易に適用可能となる。
図14は、物体検出装置1の他の構成を示すブロック図である。図14の物体検出装置1は、検出処理部7がさらに説明文作成部7dを有している点以外は、図1の構成と全く同様である。また、図15は、図14の物体検出装置1による物体検出方法の処理の流れを示すフローチャートであり、関係決定ステップ(S4)の後に、説明文作成工程(S5)が加わった以外は、図3のフローチャートと全く同様である。以下、図1および図3と異なる部分について説明する。
本実施形態で説明した物体検出装置1は、例えば、所定のプログラム(アプリケーションソフトウェア)をインストールしたコンピュータ(PC)で構成することができる。上記プログラムをコンピュータ(例えばCPUとしての制御部2)が読み取って実行することにより、物体検出装置1の各部を動作させて上述した各処理(各工程)を実行させることができる。このようなプログラムは、例えばネットワークを介して外部からダウンロードすることによって取得されて記憶部3に記憶される。また、上記プログラムは、例えばCD-ROM(Compact Disk-Read Only Memory)などのコンピュータ読取可能な記録媒体に記録され、この記録媒体から上記プログラムをコンピュータが読み取って記憶部3に記憶される形態であってもよい。
以上で説明した本実施形態の物体検出方法および物体検出装置は、以下のように表現されてもよい。また、本実施形態で説明した内容は、以下のように表現されるプログラムおよび記録媒体も含む。
7a 候補/関係スコア検出部
7b 物体決定部
7c 関係決定部
7d 説明文作成部
Claims (20)
- 画像から複数の物体と前記複数の物体の関係とを検出する物体検出方法であって、
前記複数の物体が前記画像上で占める領域の候補を検出する候補検出ステップと、
検出した前記候補ごとに、前記候補を一の候補として、前記一の候補の周囲の予め設定された範囲内の他の候補を参照して、前記一の候補の前記他の候補に対する所定の関係の尤度を表す関係スコアを検出する関係スコア検出ステップと、
所定のアルゴリズムに基づいて、検出した前記候補から前記複数の物体の前記領域を決定する物体決定ステップと、
決定した前記領域に対応する候補のペアについて検出された前記関係スコアに基づいて、前記複数の物体の前記関係を決定する関係決定ステップとを含む、物体検出方法。 - 前記候補検出ステップおよび前記関係スコア検出ステップは、ニューロ演算によって並列に実行される、請求項1に記載の物体検出方法。
- 前記ニューロ演算は、CNNによる演算である、請求項2に記載の物体検出方法。
- 前記候補検出ステップでは、前記画像上に設定された複数のグリッドのそれぞれに対する前記候補の相対位置、前記画像に対する前記候補の相対的なサイズ、前記物体に対する前記候補の尤度を表す検出スコア、前記グリッドにおける前記物体のクラスの尤度を表すクラススコアの少なくともいずれかのパラメータをさらに検出する、請求項1から3のいずれかに記載の物体検出方法。
- 前記物体決定ステップにおける前記所定のアルゴリズムは、Non-Maximum Suppressionである、請求項4に記載の物体検出方法。
- 前記関係決定ステップでは、前記関係スコアが複数存在するときに、閾値未満の関係スコアを除外する、請求項1から5のいずれかに記載の物体検出方法。
- 前記関係決定ステップでは、2つの前記候補からなるペアについて得られる前記関係スコアとして、前記ペアの一方の候補から他方の候補に対して得られる関係スコアと、前記ペアの前記他方の候補から前記一方の候補に対して得られる関係スコアとが存在するときに、より小さいほうの関係スコアを除外する、請求項1から6のいずれかに記載の物体検出方法。
- 決定した前記複数の物体の前記領域と、前記複数の物体の前記関係とに基づいて、前記画像の説明文を作成する説明文作成ステップをさらに含む、請求項1から7のいずれかに記載の物体検出方法。
- 前記説明文作成ステップでは、ニューロ演算によって前記説明文を作成する、請求項8に記載の物体検出方法。
- 前記複数の物体の前記関係は、前記複数の物体間のかかわりまたは状態、一方の物体の他方の物体に対する作用または動作、の少なくともいずれかを含む、請求項1から9のいずれかに記載の物体検出方法。
- 画像から複数の物体と前記複数の物体の関係とを検出する物体検出装置であって、
前記複数の物体が前記画像上で占める領域の候補を検出するとともに、検出した前記候補ごとに、前記候補を一の候補として、前記一の候補の周囲の予め設定された範囲内の他の候補を参照して、前記一の候補の前記他の候補に対する所定の関係の尤度を表す関係スコアを検出する候補/関係スコア検出部と、
所定のアルゴリズムに基づいて、検出した前記候補から前記複数の物体の前記領域を決定する物体決定部と、
決定した前記領域に対応する候補のペアについて検出された前記関係スコアに基づいて、前記複数の物体の前記関係を決定する関係決定部とを含む、物体検出装置。 - 前記候補/関係スコア検出部は、前記候補の検出と前記関係スコアの検出とをニューロ演算によって並列して行う、請求項11に記載の物体検出装置。
- 前記ニューロ演算は、CNNによる演算である、請求項12に記載の物体検出装置。
- 前記候補/関係スコア検出部は、前記画像上に設定された複数のグリッドのそれぞれに対する前記候補の相対位置、前記画像に対する前記候補の相対的なサイズ、前記物体に対する前記候補の尤度を表す検出スコア、前記グリッドにおける前記物体のクラスの尤度を表すクラススコアの少なくともいずれかのパラメータをさらに検出する、請求項11から13のいずれかに記載の物体検出装置。
- 前記物体決定部が前記領域を決定する際に用いる前記所定のアルゴリズムは、Non-Maximum Suppressionである、請求項14に記載の物体検出装置。
- 前記関係決定部は、前記関係スコアが複数存在するときに、閾値未満の関係スコアを除外する、請求項11から15のいずれかに記載の物体検出装置。
- 前記関係決定部は、2つの前記候補からなるペアについて得られる前記関係スコアとして、前記ペアの一方の候補から他方の候補に対して得られる関係スコアと、前記ペアの前記他方の候補から前記一方の候補に対して得られる関係スコアとが存在するときに、より小さいほうの関係スコアを除外する、請求項11から16のいずれかに記載の物体検出装置。
- 決定した前記複数の物体の前記領域と、前記複数の物体の前記関係とに基づいて、前記画像の説明文を作成する説明文作成部をさらに含む、請求項11から17のいずれかに記載の物体検出装置。
- 前記説明文作成部は、ニューロ演算によって前記説明文を作成する、請求項18に記載の物体検出装置。
- 前記複数の物体の前記関係は、前記複数の物体間のかかわりまたは状態、一方の物体の他方の物体に対する作用または動作、の少なくともいずれかを含む、請求項11から19のいずれかに記載の物体検出装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018107499 | 2018-06-05 | ||
JP2018107499 | 2018-06-05 | ||
PCT/JP2019/014766 WO2019235050A1 (ja) | 2018-06-05 | 2019-04-03 | 物体検出方法および物体検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019235050A1 JPWO2019235050A1 (ja) | 2021-06-17 |
JP7036208B2 true JP7036208B2 (ja) | 2022-03-15 |
Family
ID=68770269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020523539A Active JP7036208B2 (ja) | 2018-06-05 | 2019-04-03 | 物体検出方法および物体検出装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7036208B2 (ja) |
WO (1) | WO2019235050A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013232080A (ja) | 2012-04-27 | 2013-11-14 | Denso Corp | 対象物識別装置 |
-
2019
- 2019-04-03 JP JP2020523539A patent/JP7036208B2/ja active Active
- 2019-04-03 WO PCT/JP2019/014766 patent/WO2019235050A1/ja active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013232080A (ja) | 2012-04-27 | 2013-11-14 | Denso Corp | 対象物識別装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2019235050A1 (ja) | 2019-12-12 |
JPWO2019235050A1 (ja) | 2021-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6608981B2 (ja) | 異常セッション感知方法 | |
US11210513B2 (en) | Detection method and detection device | |
CN105912990B (zh) | 人脸检测的方法及装置 | |
JP6159489B2 (ja) | 顔認証方法およびシステム | |
AU2018368279A1 (en) | Meta-learning for multi-task learning for neural networks | |
US11622098B2 (en) | Electronic device, and method for displaying three-dimensional image thereof | |
KR102548732B1 (ko) | 신경망 학습 방법 및 이를 적용한 장치 | |
US20210407090A1 (en) | Visual object instance segmentation using foreground-specialized model imitation | |
JP5227629B2 (ja) | オブジェクト検出方法、オブジェクト検出装置、およびオブジェクト検出プログラム | |
KR20230129964A (ko) | 전자 장치, 그의 제어 방법 | |
JP2016503220A (ja) | ジェスチャ認識のためのパーツ及び状態検出 | |
KR102474246B1 (ko) | 복수 개의 전자 디바이스를 이용하여 신경망 모델을 처리하는 방법 및 시스템 | |
US20210049890A1 (en) | Electronic device and control method therefor | |
WO2021185330A1 (zh) | 数据增强方法和数据增强装置 | |
JP2019152964A (ja) | 学習方法および学習装置 | |
CN113724128A (zh) | 一种训练样本的扩充方法 | |
US11430137B2 (en) | Electronic device and control method therefor | |
WO2021005898A1 (ja) | 物体検出装置、物体検出方法およびプログラム | |
JP7036208B2 (ja) | 物体検出方法および物体検出装置 | |
WO2020235269A1 (ja) | 物体検出装置、物体検出方法、プログラムおよび記録媒体 | |
CN113553893A (zh) | 基于深度神经网络的人体跌倒检测方法、装置和电子设备 | |
CN112819151A (zh) | 用于识别图像的方法和设备以及训练方法 | |
US11868440B1 (en) | Statistical model training systems | |
US10997947B2 (en) | Electronic device and control method thereof | |
Hassan et al. | Istaqim: An Assistant Application to Correct Prayer for Arab Muslims |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211224 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20211224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7036208 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |