JP7156511B2 - 物体検出装置、物体検出システム、物体検出方法及びプログラム - Google Patents
物体検出装置、物体検出システム、物体検出方法及びプログラム Download PDFInfo
- Publication number
- JP7156511B2 JP7156511B2 JP2021515330A JP2021515330A JP7156511B2 JP 7156511 B2 JP7156511 B2 JP 7156511B2 JP 2021515330 A JP2021515330 A JP 2021515330A JP 2021515330 A JP2021515330 A JP 2021515330A JP 7156511 B2 JP7156511 B2 JP 7156511B2
- Authority
- JP
- Japan
- Prior art keywords
- detection
- images
- perturbation
- image
- perturbed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/174—Segmentation; Edge detection involving the use of two or more images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10048—Infrared image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Description
本開示の実施形態の説明に先立って、本開示にかかる実施の形態の概要について説明する。図1は、本開示の実施の形態にかかる物体検出装置1の概要を示す図である。物体検出装置1は、例えば、コンピュータである。
以下、実施形態について、図面を参照しながら説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。また、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
後述するように、この統合パラメータは、学習段階において、パラメータ算出部160によって算出される。そして、スコア調整部122は、複数の摂動画像42について取得された検出位置(矩形座標)及び確信度に基づいて、統合パラメータを用いて、複数の摂動画像42それぞれについて調整された確信度を算出する(ステップS108)。以後、調整された確信度(調整確信度)を算出すること、つまり確信度を調整することを、リスコアと称することがある。スコア調整部122の具体的な処理については後述する。
以下、統合パラメータの算出(S160)及びリスコア(S108)の具体例について説明する。上述したように、リスコアの目的は、入力画像40Bを摂動させて得られた複数の摂動画像のいずれかで入力画像40Aと検出対象画像90の位置が合っているときに、その摂動画像に関する検出結果を最も信頼するようすることである。したがって、リスコアによって、この摂動画像(図6の例では摂動画像42-2)における調整確信度が最も高くなるようにする。なお、以下の説明において、摂動画像42と摂動学習用画像52とを区別しないで、単に「摂動パターン」と称する。また、以下のアルゴリズムは、クラスごとに行われ得る。
なお、上述した説明では、複数のモーダル画像(入力画像)を2つとし、そのうちの一方を摂動させるとしたが、複数のモーダル画像は3つ以上であってもよい。この場合、3つ以上のモーダル画像を用いて、物体検出が行われる。また、この場合、摂動させるモーダル画像は複数でもよい。この場合のアルゴリズムについて以下に説明する。なお、以下の説明では、入力画像A、入力画像B1及び入力画像B2を複数のモーダル画像とし、入力画像B1及び入力画像B2を摂動させるとする。この場合、S106の処理において、入力画像Aと、摂動させた入力画像B1と、摂動させた入力画像B2とを用いて、物体検出が行われる(S156の処理においても同様)。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、図4及び図8に示したフローチャートの各処理の順序は、適宜、変更可能である。また、図4及び図8に示したフローチャートの処理の1つ以上は、なくてもよい。
(付記1)
特定の検出対象が異なる複数のモーダルによって撮影された複数の入力画像を取得する入力画像取得手段と、
前記複数の入力画像のうちの少なくとも1つを摂動させた複数の摂動画像を取得する摂動画像取得手段と、
前記複数の摂動画像それぞれと、前記複数の入力画像のうち摂動させなかった前記入力画像とを用いて前記入力画像に含まれる前記検出対象を検出して、前記複数の摂動画像それぞれについて、検出結果として前記検出対象の検出位置及び検出の確信度を取得する検出処理手段と、
前記複数の摂動画像について取得された前記検出位置及び前記確信度に基づいて、前記摂動させなかった前記入力画像と前記摂動画像とで前記検出対象の位置が互いに合っている組についての確信度が相対的に高くなるように調整するためのパラメータを用いて、前記複数の摂動画像それぞれについて調整された確信度を算出する調整手段と、
前記調整された前記確信度に基づいた前記検出対象の検出結果を出力する出力手段と
を有する物体検出装置。
(付記2)
前記調整された確信度に基づいて複数の摂動画像による検出結果を絞り込んで適切な検出結果を決定する決定手段
をさらに有し、
前記出力手段は、前記決定された検出結果を出力する
付記1に記載の物体検出装置。
(付記3)
前記調整手段は、第1の摂動画像について前記確信度を調整する場合、当該第1の摂動画像に関する検出位置との距離が近い検出位置に関する第2の摂動画像に関する重みを重くするように重み付けして、前記複数の摂動画像の前記確信度を累積する
付記1又は2に記載の物体検出装置。
(付記4)
前記パラメータは、
前記第1の摂動画像の摂動量と前記第2の摂動画像の摂動量との差に応じて前記距離を補正する第1のパラメータと、
前記距離に対する重みを定義する第2のパラメータと
を含む
付記3に記載の物体検出装置。
(付記5)
前記検出対象に対応する検出位置に関する前記摂動画像についての前記調整された確信度が最も高くなるような前記パラメータを算出するパラメータ算出手段
をさらに有する付記1~4のいずれか1項に記載の物体検出装置。
(付記6)
前記パラメータ算出手段は、前記検出対象の正解位置が予め付され前記検出対象の位置が互いに合っている複数の学習用画像のうちの少なくとも1つを摂動させて得られた複数の摂動学習用画像それぞれと、前記複数の学習用画像のうち摂動させなかった前記学習用画像とを用いて得られた検出結果を用いて、前記パラメータを算出する
付記5に記載の物体検出装置。
(付記7)
少なくとも1つの撮像装置と、
付記1~6のいずれか1項に記載の物体検出装置と
を有し、
前記入力画像取得手段は、前記撮像装置によって撮影された前記複数の入力画像を取得する
物体検出システム。
(付記8)
特定の検出対象が異なる複数のモーダルによって撮影された複数の入力画像を取得し、
前記複数の入力画像のうちの少なくとも1つを摂動させた複数の摂動画像を取得し、
前記複数の摂動画像それぞれと、前記複数の入力画像のうち摂動させなかった前記入力画像とを用いて前記入力画像に含まれる前記検出対象を検出して、前記複数の摂動画像それぞれについて、検出結果として前記検出対象の検出位置及び検出の確信度を取得し、
前記複数の摂動画像について取得された前記検出位置及び前記確信度に基づいて、前記摂動させなかった前記入力画像と前記摂動画像とで前記検出対象の位置が互いに合っている組についての確信度が相対的に高くなるように調整するためのパラメータを用いて、前記複数の摂動画像それぞれについて調整された確信度を算出し、
前記調整された前記確信度に基づいた前記検出対象の検出結果を出力する
物体検出方法。
(付記9)
前記調整された確信度に基づいて複数の摂動画像による検出結果を絞り込んで適切な検出結果を決定し、
前記決定された検出結果を出力する
付記8に記載の物体検出方法。
(付記10)
第1の摂動画像について前記確信度を調整する場合、当該第1の摂動画像に関する検出位置との距離が近い検出位置に関する第2の摂動画像に関する重みを重くするように重み付けして、前記複数の摂動画像の前記確信度を累積する
付記8又は9に記載の物体検出方法。
(付記11)
前記パラメータは、
前記第1の摂動画像の摂動量と前記第2の摂動画像の摂動量との差に応じて前記距離を補正する第1のパラメータと、
前記距離に対する重みを定義する第2のパラメータと
を含む
付記10に記載の物体検出方法。
(付記12)
前記検出対象に対応する検出位置に関する前記摂動画像についての前記調整された確信度が最も高くなるような前記パラメータを算出する
付記8~11のいずれか1項に記載の物体検出方法。
(付記13)
前記検出対象の正解位置が予め付され前記検出対象の位置が互いに合っている複数の学習用画像のうちの少なくとも1つを摂動させて得られた複数の摂動学習用画像それぞれと、前記複数の学習用画像のうち摂動させなかった前記学習用画像とを用いて得られた検出結果を用いて、前記パラメータを算出する
付記12に記載の物体検出方法。
(付記14)
特定の検出対象が異なる複数のモーダルによって撮影された複数の入力画像を取得するステップと、
前記複数の入力画像のうちの少なくとも1つを摂動させた複数の摂動画像を取得するステップと、
前記複数の摂動画像それぞれと、前記複数の入力画像のうち摂動させなかった前記入力画像とを用いて前記入力画像に含まれる前記検出対象を検出して、前記複数の摂動画像それぞれについて、検出結果として前記検出対象の検出位置及び検出の確信度を取得するステップと、
前記複数の摂動画像について取得された前記検出位置及び前記確信度に基づいて、前記摂動させなかった前記入力画像と前記摂動画像とで前記検出対象の位置が互いに合っている組についての確信度が相対的に高くなるように調整するためのパラメータを用いて、前記複数の摂動画像それぞれについて調整された確信度を算出するステップと、
前記調整された前記確信度に基づいた前記検出対象の検出結果を出力するステップと
をコンピュータに実行させるプログラムが格納された非一時的なコンピュータ可読媒体。
2 入力画像取得部
4 摂動画像取得部
6 検出処理部
8 調整部
10 出力部
20 物体検出システム
30 カメラ
100 物体検出装置
110 入力画像取得部
112 摂動画像取得部
114 検出処理部
116 検出モデル格納部
120 検出結果統合部
122 スコア調整部
124 検出結果決定部
130 パラメータ格納部
140 検出結果出力部
150 学習データ格納部
152 摂動画像取得部
154 検出処理部
160 パラメータ算出部
Claims (9)
- 特定の検出対象が異なる複数のモーダルによって撮影された複数の入力画像を取得する入力画像取得手段と、
前記複数の入力画像のうちの少なくとも1つを摂動させた複数の摂動画像を取得する摂動画像取得手段と、
前記複数の摂動画像それぞれと、前記複数の入力画像のうち摂動させなかった前記入力画像とを用いて前記入力画像に含まれる前記検出対象を検出して、前記複数の摂動画像それぞれについて、検出結果として前記検出対象の検出位置及び検出の確信度を取得する検出処理手段と、
前記複数の摂動画像について取得された前記検出位置及び前記確信度に基づいて、前記摂動させなかった前記入力画像と前記摂動画像とで前記検出対象の位置が互いに合っている組についての確信度が相対的に高くなるように調整するためのパラメータを用いて、前記複数の摂動画像それぞれについて調整された確信度を算出する調整手段と、
前記調整された前記確信度に基づいた前記検出対象の検出結果を出力する出力手段と
を有する物体検出装置。 - 前記調整された確信度に基づいて複数の摂動画像による検出結果を絞り込んで適切な検出結果を決定する決定手段
をさらに有し、
前記出力手段は、前記決定された検出結果を出力する
請求項1に記載の物体検出装置。 - 前記調整手段は、第1の摂動画像について前記確信度を調整する場合、当該第1の摂動画像に関する検出位置との距離が近い検出位置に関する第2の摂動画像に関する重みを重くするように重み付けして、前記複数の摂動画像の前記確信度を累積する
請求項1又は2に記載の物体検出装置。 - 前記パラメータは、
前記第1の摂動画像の摂動量と前記第2の摂動画像の摂動量との差に応じて前記距離を補正する第1のパラメータと、
前記距離に対する重みを定義する第2のパラメータと
を含む
請求項3に記載の物体検出装置。 - 前記検出対象に対応する検出位置に関する前記摂動画像についての前記調整された確信度が最も高くなるような前記パラメータを算出するパラメータ算出手段
をさらに有する請求項1~4のいずれか1項に記載の物体検出装置。 - 前記パラメータ算出手段は、前記検出対象の正解位置が予め付され前記検出対象の位置が互いに合っている複数の学習用画像のうちの少なくとも1つを摂動させて得られた複数の摂動学習用画像それぞれと、前記複数の学習用画像のうち摂動させなかった前記学習用画像とを用いて得られた検出結果を用いて、前記パラメータを算出する
請求項5に記載の物体検出装置。 - 少なくとも1つの撮像装置と、
請求項1~6のいずれか1項に記載の物体検出装置と
を有し、
前記入力画像取得手段は、前記撮像装置によって撮影された前記複数の入力画像を取得する
物体検出システム。 - 特定の検出対象が異なる複数のモーダルによって撮影された複数の入力画像を取得し、
前記複数の入力画像のうちの少なくとも1つを摂動させた複数の摂動画像を取得し、
前記複数の摂動画像それぞれと、前記複数の入力画像のうち摂動させなかった前記入力画像とを用いて前記入力画像に含まれる前記検出対象を検出して、前記複数の摂動画像それぞれについて、検出結果として前記検出対象の検出位置及び検出の確信度を取得し、
前記複数の摂動画像について取得された前記検出位置及び前記確信度に基づいて、前記摂動させなかった前記入力画像と前記摂動画像とで前記検出対象の位置が互いに合っている組についての確信度が相対的に高くなるように調整するためのパラメータを用いて、前記複数の摂動画像それぞれについて調整された確信度を算出し、
前記調整された前記確信度に基づいた前記検出対象の検出結果を出力する
物体検出方法。 - 特定の検出対象が異なる複数のモーダルによって撮影された複数の入力画像を取得するステップと、
前記複数の入力画像のうちの少なくとも1つを摂動させた複数の摂動画像を取得するステップと、
前記複数の摂動画像それぞれと、前記複数の入力画像のうち摂動させなかった前記入力画像とを用いて前記入力画像に含まれる前記検出対象を検出して、前記複数の摂動画像それぞれについて、検出結果として前記検出対象の検出位置及び検出の確信度を取得するステップと、
前記複数の摂動画像について取得された前記検出位置及び前記確信度に基づいて、前記摂動させなかった前記入力画像と前記摂動画像とで前記検出対象の位置が互いに合っている組についての確信度が相対的に高くなるように調整するためのパラメータを用いて、前記複数の摂動画像それぞれについて調整された確信度を算出するステップと、
前記調整された前記確信度に基づいた前記検出対象の検出結果を出力するステップと
をコンピュータに実行させるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/017072 WO2020217283A1 (ja) | 2019-04-22 | 2019-04-22 | 物体検出装置、物体検出システム、物体検出方法及びプログラムが格納された非一時的なコンピュータ可読媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2020217283A1 JPWO2020217283A1 (ja) | 2020-10-29 |
JPWO2020217283A5 JPWO2020217283A5 (ja) | 2022-01-14 |
JP7156511B2 true JP7156511B2 (ja) | 2022-10-19 |
Family
ID=72941615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021515330A Active JP7156511B2 (ja) | 2019-04-22 | 2019-04-22 | 物体検出装置、物体検出システム、物体検出方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US12094160B2 (ja) |
JP (1) | JP7156511B2 (ja) |
WO (1) | WO2020217283A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113033483B (zh) * | 2021-04-20 | 2024-02-02 | 北京百度网讯科技有限公司 | 检测目标对象的方法、装置、电子设备和存储介质 |
CN113313720B (zh) * | 2021-06-30 | 2024-03-29 | 上海商汤科技开发有限公司 | 对象分割方法和装置 |
WO2024154270A1 (ja) * | 2023-01-18 | 2024-07-25 | 富士通株式会社 | 摂動領域推定プログラム、装置、及び方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017146957A (ja) | 2016-02-19 | 2017-08-24 | トヨタ自動車株式会社 | 深層畳み込みニューラルネットワークによるレイヤベースの物体検出の強化 |
WO2018147059A1 (ja) | 2017-02-07 | 2018-08-16 | ソニー株式会社 | 画像処理装置、および画像処理方法、並びにプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3422255B1 (en) * | 2017-06-30 | 2023-03-15 | Axis AB | Method and system for training a neural network to classify objects or events |
-
2019
- 2019-04-22 WO PCT/JP2019/017072 patent/WO2020217283A1/ja active Application Filing
- 2019-04-22 US US17/604,494 patent/US12094160B2/en active Active
- 2019-04-22 JP JP2021515330A patent/JP7156511B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017146957A (ja) | 2016-02-19 | 2017-08-24 | トヨタ自動車株式会社 | 深層畳み込みニューラルネットワークによるレイヤベースの物体検出の強化 |
WO2018147059A1 (ja) | 2017-02-07 | 2018-08-16 | ソニー株式会社 | 画像処理装置、および画像処理方法、並びにプログラム |
Non-Patent Citations (1)
Title |
---|
LIU, Jingjing et al.,Multispectral Deep Neural Networks for Pedestrian Detection,Proceedings of the British Machine Vision Conference [online],英国,2016年09月,pages.73.1-73.13,http://www.bmva.org/bmvc/2016/papers/paper073/paper073.pdf |
Also Published As
Publication number | Publication date |
---|---|
WO2020217283A1 (ja) | 2020-10-29 |
JPWO2020217283A1 (ja) | 2020-10-29 |
US12094160B2 (en) | 2024-09-17 |
US20220215579A1 (en) | 2022-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7156511B2 (ja) | 物体検出装置、物体検出システム、物体検出方法及びプログラム | |
US8848095B2 (en) | Focus detector, and lens apparatus and image pickup apparatus including the same | |
US20140037212A1 (en) | Image processing method and device | |
US11054659B2 (en) | Head mounted display apparatus and distance measurement device thereof | |
US9444993B2 (en) | Focus detecting apparatus, lens apparatus including the same, image pickup apparatus, and method of detecting defocus amount | |
US10594939B2 (en) | Control device, apparatus, and control method for tracking correction based on multiple calculated control gains | |
US20220067961A1 (en) | Position and attitude estimation device, position and attitude estimation method, and storage medium | |
JP7439980B2 (ja) | 生体認証装置、生体認証方法、および生体認証用プログラム | |
JP6967464B2 (ja) | 画像処理装置 | |
KR101494395B1 (ko) | 스테레오 비전을 이용한 탐색장치를 포함하는 유도 비행체 및 이의 표적 추적 방법 | |
JP2014182248A (ja) | 合焦位置検出装置、合焦位置検出方法及び合焦位置検出用コンピュータプログラム | |
JP2015207090A (ja) | 画像処理装置、及びその制御方法 | |
JP6799325B2 (ja) | 画像補正装置、画像補正方法、注目点認識装置、注目点認識方法及び異常検知システム | |
KR101200560B1 (ko) | 광각 감시 카메라의 영상 분석 장치, 시스템 및 방법 | |
JP6702736B2 (ja) | 撮像制御装置および撮像装置の制御方法、プログラム | |
KR101047150B1 (ko) | 레이저스캐너와 비디오카메라간 물리적 편의 보정장치 및 방법과, 물리적편의보정치 측정장치 및 방법 | |
US12087015B2 (en) | Photographing system, calibration method, and non-transitory computer-readable medium storing program | |
WO2024057508A1 (ja) | 情報処理装置、情報処理システム、情報処理方法及び記録媒体 | |
US11143504B2 (en) | Image capture device and image capture system | |
KR20150133459A (ko) | 템플릿매칭을 이용한 입체영상의 수직오류 검출 및 보정 방법 | |
CN118533134A (zh) | 距离测量装置、可移动设备和控制方法 | |
CN117294924A (zh) | 一种用于改善眩光的光孔调节系统、方法及电子设备 | |
JP2018200722A (ja) | 画像処理装置及びその制御方法、並びにプログラム及び記憶媒体 | |
KR20040078197A (ko) | 동공영역 추출을 위한 움직임 추정방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211008 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211008 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220919 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7156511 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |