JP2019515376A - 直列畳み込みニューラルネットワーク - Google Patents
直列畳み込みニューラルネットワーク Download PDFInfo
- Publication number
- JP2019515376A JP2019515376A JP2018554684A JP2018554684A JP2019515376A JP 2019515376 A JP2019515376 A JP 2019515376A JP 2018554684 A JP2018554684 A JP 2018554684A JP 2018554684 A JP2018554684 A JP 2018554684A JP 2019515376 A JP2019515376 A JP 2019515376A
- Authority
- JP
- Japan
- Prior art keywords
- image
- convolutional neural
- neural network
- detector
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
上記説明されたように、開示される技術に従ったCNNは、複数のスケール検出器を含む。各々のスケール検出器は、複数のオブジェクト検出器を含む。各々のオブジェクト検出器は、それぞれのCNNを含む。スケール検出器の各々がオブジェクト検出器及びダウンサンプラの同一の構成を示すとき、並びにオブジェクト検出器におけるCNNが同様の特性を有する層のグループを示すとき(すなわち、同一のフィルタサイズ、ストライド、及び活性化関数を示し、同一に順序付けられる)、オブジェクト検出器のCNNは次いで、共通層を有するように訓練される。
概して、CNNは、入力画像内のオブジェクトを定義するように訓練され、CNNが検出するように訓練されたオブジェクトが入力画像内の様々な位置に存在する確率に関連する情報を作成する。CNNは、各々が予め定められた分類ベクトルと関連付けられた、サンプル(画像又はいずれかの他のデータ)を含む訓練セットを使用して訓練される。訓練するために採用されたサンプルは典型的には、画像から切り取られた画像ウインドウである。各々のサンプルは、画像内のオブジェクトを有する画像ウインドウの重複に従って分類される(すなわち、クラスはサンプルについて判定される)。サンプルが画像内のいずれかのオブジェクトと重複しないとき、そのサンプルは、背景として分類される。上記言及されたように、訓練工程は、CNNの出力値と採用されるサンプルと関連付けられた値との間の誤差を削減するように(例えば、差異の二乗和、ログ損失、softmaxlog損失)CNNパラメータを修正する。
複数のダウンサンプルされた画像を作成するために、複数のダウンサンプリング比に従って画像をダウンサンプリングし、各々のダウンサンプルされた画像は、それぞれのダウンサンプリング比と関連付けられ、
ダウンサンプルされた画像ごとに、対応するCNNによって、画像に対する予め定められた画像ウインドウサイズにおいてオブジェクトを検出し、
画像内のオブジェクトを分類する。それぞれのダウンサンプルされた画像内のオブジェクトを検出し、同一のそれぞれのダウンサンプリング比と関連付けられたCNNは、CNNの少なくとも1つのグループを定義する。畳み込みネットワークのグループにおけるCNNは、共通畳み込み層と関連付けられる。
Claims (14)
- 少なくとも1つの画像内の少なくとも1つのオブジェクトを検出する畳み込みニューラルネットワークシステムであって、前記システムは、
複数のオブジェクト検出器を備え、各々のオブジェクト検出器は、前記少なくとも1つの画像内の予め定められた画像ウインドウサイズに対応し、各々のオブジェクト検出器は、前記少なくとも1つの画像に対するそれぞれのダウンサンプリング比と関連付けられ、各々のオブジェクト検出器は、
それぞれの畳み込みニューラルネットワークであって、前記畳み込みニューラルネットワークは、複数の畳み込み層を含む、前記それぞれの畳み込みニューラルネットワークと、
前記畳み込みニューラルネットワークからの結果に従って前記画像内のオブジェクトを分類する、前記畳み込みニューラルネットワークと結合されたオブジェクト分類器と
を含み、
同一のそれぞれのダウンサンプリング比と関連付けられたオブジェクト検出器は、オブジェクト検出器の少なくとも1つのグループを定義し、オブジェクト検出器のグループにおけるオブジェクト検出器は、共通畳み込み層と関連付けられる、
畳み込みニューラルネットワークシステム。 - 各々がそれぞれのダウンサンプリング比と関連付けられた複数のダウンサンプラを更に含み、前記ダウンサンプラは、前記画像の前記縮尺化されたバージョンを作成するように構成され、各々の縮尺化されたバージョンは、それぞれのダウンサンプリング比と関連付けられる、請求項1に記載の畳み込みニューラルネットワークシステム。
- ダウンサンプラ、及び前記画像に対する同一のそれぞれの画像ウインドウサイズと関連付けられたオブジェクト検出器は、スケール検出器を定義し、各々のスケール検出器は、前記画像のそれぞれの縮尺化されたバージョンと関連付けられる、請求項2に記載の畳み込みニューラルネットワークシステム。
- 前記オブジェクト分類器は、畳み込み分類器であり、前記それぞれの畳み込みニューラルネットワークによって提供された特徴マップにより少なくとも1つの分類フィルタを畳み込む、請求項1に記載の畳み込みニューラルネットワークシステム。
- 前記それぞれの畳み込みニューラルネットワークは複数の特徴を含む特徴マップを作成し、各々のエントリは、前記エントリと関連付けられた画像ウインドウ内で特徴強度を表し、前記画像ウインドウは、前記それぞれの画像ウインドウサイズを示す、請求項4に記載の畳み込みニューラルネットワークシステム。
- 前記オブジェクト分類器は、前記オブジェクトが前記特徴と関連付けられた画像ウインドウの各々に位置する確率を提供する、請求項5に記載の畳み込みニューラルネットワークシステム。
- 前記分類ベクトルは更に、前記特徴マップと関連付けられた画像ウインドウごとの画像ウインドウ補正係数を含み、前記画像ウインドウ補正係数は、各々の画像ウインドウの幅及び高さへの補正、各々の画像ウインドウの位置への補正、並びに各々の画像ウインドウの方位への補正を含む、請求項6に記載の畳み込みニューラルネットワークシステム。
- 単一の訓練スケール検出器は、スケール検出器がオブジェクト検出器の同一の構成を示すとき、及びオブジェクト検出器におけるCNNが同様の特性を有するグループの層を示すときに訓練される、請求項3に記載の畳み込みニューラルネットワークシステム。
- 前記訓練スケール検出器を訓練する前に、訓練セットにおける訓練サンプルの数は、
それぞれの訓練サンプルの境界ボックス内の各々のオブジェクトのキーポイントの位置を判定し、
オブジェクトのキーポイントタイプについて、同一のタイプのオブジェクトのキーポイントの平均位置に従って、それぞれの特徴参照位置を判定し、平均値は、初期訓練セットにおける全てのオブジェクトのオブジェクトのキーポイント位置に従って判定され、
初期訓練セットにおける全ての訓練サンプルを特徴参照位置に登録し、
この参照位置からの位置合わせされた訓練サンプルの各々をランダムに摂動させる
ことによって訓練サンプルの初期数を上回って増加する、請求項8に記載の畳み込みニューラルネットワークシステム。 - 複数のダウンサンプルされた画像を作成するために、複数のダウンサンプリング比に従って画像をダウンサンプリングする手順であって、各々のダウンサンプルされた画像は、それぞれのダウンサンプリング比と関連付けられる、前記ダウンサンプリングする手順と、
ダウンサンプルされた画像ごとに、対応する畳み込みニューラルネットワークによって、少なくとも1つの画像に対する予め定められた画像ウインドウサイズにおいてオブジェクトを検出する手順と、
前記画像内のオブジェクト分類する手順と、
を含み、
同一のそれぞれのダウンサンプリング比と関連付けられたそれぞれのダウンサンプルされた画像内のオブジェクトを検出する畳み込みニューラルネットワークは、畳み込みニューラルネットワークの少なくとも1つのグループを定義し、畳み込みニューラルネットワークのグループにおける畳み込みニューラルネットワークは、共通畳み込み層と関連付けられる、
畳み込みニューラルネットワーク方法。 - 前記画像をダウンサンプリングする前記手順の前に、
初期訓練セットから増強された訓練サンプルを作成する手順と、
共通層を有するように前記畳み込みニューラルネットワークを訓練する手順と
を更に含む、請求項10に記載の畳み込みニューラルネットワーク方法。 - 共通層を有するように前記畳み込みニューラルネットワークを訓練することは、オブジェクト検出器の同様の特性を有する層の全てのグループの重み及びパラメータを平均化することを含む、請求項11に記載の畳み込みニューラルネットワーク方法。
- 共通層を有するための前記畳み込みニューラルネットワークは、前記増強された訓練サンプルを採用し、前記訓練スケール検出器の複製を配置することによって単一の訓練スケール検出器を訓練することを含み、各々の複製は、前記少なくとも1つの画像のそれぞれの縮尺化されたバージョンと関連付けられ、前記訓練スケール検出器の前記複製は、畳み込みニューラルネットワークシステムを定義する、請求項11に記載の畳み込みニューラルネットワーク方法。
- 増強された訓練サンプルを作成する前記手順は、
それぞれの訓練サンプルの境界ボックス内の各々のオブジェクトのキーポイントの位置を判定するサブ手順と、
オブジェクトのキーポイントタイプについて、同一のタイプの前記オブジェクトのキーポイントの平均位置に従って、それぞれのキーポイントの参照位置を判定するサブ手順であって、平均値は、前記初期訓練セットにおける全てのオブジェクトの前記オブジェクトキーポイントの位置に従って判定される、前記判定するサブ手順と、
前記初期訓練セットにおける全ての訓練サンプルを特徴参照位置に登録するサブ手順と、
この参照位置から位置合わせされた訓練サンプルの各々をランダムに摂動させるサブ手順と
を含む、請求項11に記載の畳み込みニューラルネットワーク方法。
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662325551P | 2016-04-21 | 2016-04-21 | |
US201662325553P | 2016-04-21 | 2016-04-21 | |
US201662325562P | 2016-04-21 | 2016-04-21 | |
US62/325,553 | 2016-04-21 | ||
US62/325,551 | 2016-04-21 | ||
US62/325,562 | 2016-04-21 | ||
GB1614009.7 | 2016-08-16 | ||
GB1614009.7A GB2549554A (en) | 2016-04-21 | 2016-08-16 | Method and system for detecting an object in an image |
US201762486997P | 2017-04-19 | 2017-04-19 | |
US62/486,997 | 2017-04-19 | ||
PCT/IL2017/050461 WO2017183034A1 (en) | 2016-04-21 | 2017-04-20 | Cascaded convolutional neural network |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019515376A true JP2019515376A (ja) | 2019-06-06 |
JP7041427B2 JP7041427B2 (ja) | 2022-03-24 |
Family
ID=66763634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018554684A Active JP7041427B2 (ja) | 2016-04-21 | 2017-04-20 | 直列畳み込みニューラルネットワーク |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7041427B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114995131A (zh) * | 2022-05-25 | 2022-09-02 | 福建德尔科技股份有限公司 | 用于电子级三氟甲烷制备的精馏控制系统及其控制方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08305855A (ja) * | 1995-05-01 | 1996-11-22 | Nippon Telegr & Teleph Corp <Ntt> | 画像のパターン認識方法及び装置 |
JP2007011572A (ja) * | 2005-06-29 | 2007-01-18 | Canon Inc | パターン識別方法及びその装置、そのプログラム |
JP2011113168A (ja) * | 2009-11-25 | 2011-06-09 | Fujifilm Corp | オブジェクト検出装置および方法並びにプログラム |
JP2011170890A (ja) * | 2011-06-06 | 2011-09-01 | Fujifilm Corp | 顔検出方法および装置並びにプログラム |
JP2016006626A (ja) * | 2014-05-28 | 2016-01-14 | 株式会社デンソーアイティーラボラトリ | 検知装置、検知プログラム、検知方法、車両、パラメータ算出装置、パラメータ算出プログラムおよびパラメータ算出方法 |
-
2017
- 2017-04-20 JP JP2018554684A patent/JP7041427B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08305855A (ja) * | 1995-05-01 | 1996-11-22 | Nippon Telegr & Teleph Corp <Ntt> | 画像のパターン認識方法及び装置 |
JP2007011572A (ja) * | 2005-06-29 | 2007-01-18 | Canon Inc | パターン識別方法及びその装置、そのプログラム |
JP2011113168A (ja) * | 2009-11-25 | 2011-06-09 | Fujifilm Corp | オブジェクト検出装置および方法並びにプログラム |
JP2011170890A (ja) * | 2011-06-06 | 2011-09-01 | Fujifilm Corp | 顔検出方法および装置並びにプログラム |
JP2016006626A (ja) * | 2014-05-28 | 2016-01-14 | 株式会社デンソーアイティーラボラトリ | 検知装置、検知プログラム、検知方法、車両、パラメータ算出装置、パラメータ算出プログラムおよびパラメータ算出方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114995131A (zh) * | 2022-05-25 | 2022-09-02 | 福建德尔科技股份有限公司 | 用于电子级三氟甲烷制备的精馏控制系统及其控制方法 |
CN114995131B (zh) * | 2022-05-25 | 2023-02-03 | 福建德尔科技股份有限公司 | 用于电子级三氟甲烷制备的精馏控制系统及其控制方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7041427B2 (ja) | 2022-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109154988B (zh) | 级联卷积神经网络 | |
US10970543B2 (en) | Distributed and self-validating computer vision for dense object detection in digital images | |
CN109816012B (zh) | 一种融合上下文信息的多尺度目标检测方法 | |
CN107169421B (zh) | 一种基于深度卷积神经网络的汽车驾驶场景目标检测方法 | |
CN109086668B (zh) | 基于多尺度生成对抗网络的无人机遥感影像道路信息提取方法 | |
CN108776772B (zh) | 一种跨时间建筑物变化检测建模方法以及检测装置、方法及存储介质 | |
US10509987B1 (en) | Learning method and learning device for object detector based on reconfigurable network for optimizing customers' requirements such as key performance index using target object estimating network and target object merging network, and testing method and testing device using the same | |
CN113627228B (zh) | 一种基于关键点回归与多尺度特征融合的车道线检测方法 | |
CN108416292B (zh) | 一种基于深度学习的无人机航拍图像道路提取方法 | |
JP6846069B2 (ja) | 遠距離検出または軍事目的のために、イメージコンカチネーションを利用したcnn基盤のハードウェア最適化が可能な物体検出器を学習する方法及び学習装置、それを利用したテスト方法及びテスト装置{learning method and learning device for object detector with hardware optimization based on cnn for detection at distance or military purpose using image concatenation, and testing method and testing device using the same} | |
US10402692B1 (en) | Learning method and learning device for fluctuation-robust object detector based on CNN using target object estimating network adaptable to customers' requirements such as key performance index, and testing device using the same | |
CN111368600A (zh) | 遥感图像目标检测识别方法、装置、可读存储介质及设备 | |
CN111401455B (zh) | 一种基于Capsules-Unet模型的遥感图像深度学习分类方法和系统 | |
CN110033009B (zh) | 在连接网络中处理图像数据的方法 | |
CN113850129A (zh) | 一种旋转等变的空间局部注意力遥感图像目标检测方法 | |
CN112837320A (zh) | 一种基于并行空洞卷积的遥感影像语义分割方法 | |
CN111488783A (zh) | 基于cnn检测伪3d边界框的方法及其装置 | |
JP2019515376A (ja) | 直列畳み込みニューラルネットワーク | |
CN113160117A (zh) | 一种自动驾驶场景下的三维点云目标检测方法 | |
CN111275616A (zh) | 低空航拍图像拼接方法和装置 | |
US11461919B2 (en) | Cascaded neural network | |
CN110991305B (zh) | 一种遥感图像下的飞机检测方法及存储介质 | |
CN106897968B (zh) | 一种遥感图像地物的图像拼接方法及系统 | |
CN114937145B (zh) | 基于地学信息的遥感影像特征点匹配方法 | |
EP4318439A1 (en) | Information processing device and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210330 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210406 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210901 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220301 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7041427 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |