JP2020527812A - セマンティック・インスタンス・セグメンテーションに使用されるニューラルネットワークを訓練するための方法およびシステム - Google Patents
セマンティック・インスタンス・セグメンテーションに使用されるニューラルネットワークを訓練するための方法およびシステム Download PDFInfo
- Publication number
- JP2020527812A JP2020527812A JP2020502990A JP2020502990A JP2020527812A JP 2020527812 A JP2020527812 A JP 2020527812A JP 2020502990 A JP2020502990 A JP 2020502990A JP 2020502990 A JP2020502990 A JP 2020502990A JP 2020527812 A JP2020527812 A JP 2020527812A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- neural network
- distance
- loss function
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000011218 segmentation Effects 0.000 title claims abstract description 52
- 238000012549 training Methods 0.000 title claims abstract description 38
- 239000013598 vector Substances 0.000 claims abstract description 146
- 230000007423 decrease Effects 0.000 claims abstract description 20
- 238000012805 post-processing Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 47
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000004106 carminic acid Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
Description
− 要素のベクトルはすべて、ベクトルのクラスタ内で近接したままになる、
− 異なる要素に関連付けられたベクトルのクラスタは、間隔をあけて配置する必要がある、
場合に、適切なセマンティック・インスタンス・セグメンテーションが取得されることが観察されている。
Claims (13)
- セマンティック・インスタンス・セグメンテーションに使用される、ニューラルネットワークを反復して訓練する方法であって、
反復ごとに、前記ニューラルネットワークは、テンプレート画像の各ピクセルに対してベクトル(10、20、30)を出力し、
前記テンプレート画像は、定義済みの要素を含み、それぞれが前記テンプレート画像のピクセルと対応するベクトルに関連付けられ、
前記ニューラルネットワークの訓練は、損失関数(L)を使用して実行され、
要素に属する各ベクトルについて、ベクトルとこの要素のベクトルの中心の間の距離(11、12、13)が計算され、
各要素の前記ベクトルのすべての前記中心の間の距離が、少なくとも、
− 要素に属する各ベクトルについて、該ベクトルとこの要素のベクトルの中心との間の距離が減少し、および、−各要素のベクトルのすべての中心との間の距離が増加する場合、目標値に達するまで前記損失関数が減少するように計算される
ことを特徴とする方法。 - 少なくとも、要素に属する各ベクトルについては、該ベクトルとこの要素のベクトルの中心との間の距離が、この距離が、あらかじめ定義された第1の距離しきい値(δv)以下となるまで、減少するとき、前記損失関数は、前記目標値に達するまで減少する、請求項1に記載の方法。
- 前記損失関数は、少なくとも、各要素の前記ベクトルのすべての中心間の距離がそれぞれの距離が、第2の事前定義された距離しきい値(δd)以上となるまで、増加したとき、前記目標値に達するまで減少する、請求項1または2に記載の方法。
- 前記損失関数は、
- 前記損失関数は、各要素のベクトルの各中心間と前記ベクトルの空間の原点との距離が減少するとき、少なくとも前記目標値に達するまで減少するように、さらに定義される、請求項1ないし4のいずれか1項に記載の方法。
- 前記損失関数は、追加の項、
- 画像の各ピクセルの座標が、前記ニューラルネットワークに入力され、このピクセルの座標は前記ニューラルネットワークに入力される、請求項1ないし6のいずれか1項に記載の方法。
- 前記訓練されたニューラルネットワークを使用して、画像に対して請求項1ないし7のいずれか1項に記載の方法を使用するステップを含む、セマンティック・インスタンス・セグメンテーションの方法。
- 平均シフトアルゴリズムまたはk平均アルゴリズムが、前記ニューラルネットワークによって出力された前記ベクトルに適用される、後処理ステップをさらに含む、請求項7に記載の方法。
- セマンティック・インスタンス・セグメンテーションに使用されるニューラルネットワークを反復して訓練するためのシステムであって、
反復ごとに、前記ニューラルネットワーク(NN)は、テンプレート画像(TIMG)の各ピクセルのベクトルを出力するように構成され、
該テンプレート画像は、それぞれがテンプレート画像のピクセルと対応するベクトルに関連付けられた定義済みの要素を備え、
前記システムが、要素に属する各ベクトルについて、該ベクトルとこの要素のベクトルの中心との間の距離が、計算され、
各要素のベクトルのすべての中心間の距離が、少なくとも、−要素に属する各ベクトルについて、該ベクトルとこの要素のベクトルの中心との間の距離が減少し、−各要素のベクトルのすべての中心との間の距離が増加する場合、目標値に達するまで損失関数は減少するように計算される、損失関数を使用して損失を計算するためのモジュール(PR1、INS(登録商標)T1)を含むことを特徴とする、
システム。 - 請求項1から7のいずれか1項に記載の方法を使用して訓練された前記ニューラルネットワークを含む画像セマンティック・インスタンス・セグメンテーションのためのシステム。
- コンピュータプログラムがコンピュータによって実行されるとき、請求項1から9のいずれか1項に記載の方法のステップを実行するための命令指示を含むコンピュータプログラム。
- 請求項1から9のいずれか1項に記載の方法のステップを実行するための命令を含むコンピュータプログラムを記録している、コンピュータが読み取り可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2017/068550 WO2019015785A1 (en) | 2017-07-21 | 2017-07-21 | METHOD AND SYSTEM FOR LEARNING A NEURAL NETWORK TO BE USED FOR SEMANTIC INSTANCE SEGMENTATION |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020527812A true JP2020527812A (ja) | 2020-09-10 |
JP2020527812A5 JP2020527812A5 (ja) | 2021-10-21 |
JP6989688B2 JP6989688B2 (ja) | 2022-01-05 |
Family
ID=59581854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020502990A Active JP6989688B2 (ja) | 2017-07-21 | 2017-07-21 | セマンティック・インスタンス・セグメンテーションに使用されるニューラルネットワークを訓練するための方法およびシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6989688B2 (ja) |
WO (1) | WO2019015785A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021182430A (ja) * | 2020-12-09 | 2021-11-25 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 意味解析モデルのトレーニング方法及び装置、電子機器並びに記憶媒体 |
WO2022070574A1 (ja) * | 2020-09-29 | 2022-04-07 | 富士フイルム株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10884131B1 (en) * | 2018-08-03 | 2021-01-05 | GM Global Technology Operations LLC | Conflict resolver for a lidar data segmentation system of an autonomous vehicle |
US11562171B2 (en) | 2018-12-21 | 2023-01-24 | Osaro | Instance segmentation by instance label factorization |
CN111507343B (zh) * | 2019-01-30 | 2021-05-18 | 广州市百果园信息技术有限公司 | 语义分割网络的训练及其图像处理方法、装置 |
CN109886272B (zh) * | 2019-02-25 | 2020-10-30 | 腾讯科技(深圳)有限公司 | 点云分割方法、装置、计算机可读存储介质和计算机设备 |
CN110766281B (zh) * | 2019-09-20 | 2022-04-26 | 国网宁夏电力有限公司电力科学研究院 | 一种基于深度学习的输电导线风害预警方法及终端 |
CN110751659B (zh) * | 2019-09-27 | 2022-06-10 | 北京小米移动软件有限公司 | 图像分割方法及装置、终端、存储介质 |
CN110765916B (zh) * | 2019-10-17 | 2022-08-30 | 北京中科原动力科技有限公司 | 一种基于语义和实例分割的农田苗垄识别方法及系统 |
CN111028195B (zh) * | 2019-10-24 | 2023-03-24 | 西安电子科技大学 | 一种基于实例分割的重定向图像质量信息处理方法及系统 |
CN111210452B (zh) * | 2019-12-30 | 2023-04-07 | 西南交通大学 | 一种基于图割和均值偏移的证件照人像分割方法 |
CN111709293B (zh) * | 2020-05-18 | 2023-10-03 | 杭州电子科技大学 | 一种基于ResUNet神经网络的化学结构式分割方法 |
CN111967373B (zh) * | 2020-08-14 | 2021-03-30 | 东南大学 | 一种基于摄像头和激光雷达的自适应强化融合实时实例分割方法 |
CN113673505A (zh) * | 2021-06-29 | 2021-11-19 | 北京旷视科技有限公司 | 实例分割模型的训练方法、装置、系统及存储介质 |
CN114529191B (zh) * | 2022-02-16 | 2024-10-22 | 支付宝(杭州)信息技术有限公司 | 用于风险识别的方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002092611A (ja) * | 2000-09-13 | 2002-03-29 | Toshiba Corp | 画像処理装置及び画像処理方法並びに記録媒体 |
JP2007087346A (ja) * | 2005-09-26 | 2007-04-05 | Canon Inc | 情報処理装置及びその制御方法、コンピュータプログラム、記憶媒体 |
JP2017515189A (ja) * | 2014-03-07 | 2017-06-08 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 写真管理 |
JP2018535491A (ja) * | 2016-03-25 | 2018-11-29 | 三菱電機株式会社 | 画像のセマンティックセグメンテーションのためのシステム及びコンピューター実施方法、並びに非一時的コンピューター可読媒体 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006114003A1 (en) * | 2005-04-27 | 2006-11-02 | The Governors Of The University Of Alberta | A method and system for automatic detection and segmentation of tumors and associated edema (swelling) in magnetic resonance (mri) images |
CN106897390B (zh) * | 2017-01-24 | 2019-10-15 | 北京大学 | 基于深度度量学习的目标精确检索方法 |
-
2017
- 2017-07-21 JP JP2020502990A patent/JP6989688B2/ja active Active
- 2017-07-21 WO PCT/EP2017/068550 patent/WO2019015785A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002092611A (ja) * | 2000-09-13 | 2002-03-29 | Toshiba Corp | 画像処理装置及び画像処理方法並びに記録媒体 |
JP2007087346A (ja) * | 2005-09-26 | 2007-04-05 | Canon Inc | 情報処理装置及びその制御方法、コンピュータプログラム、記憶媒体 |
JP2017515189A (ja) * | 2014-03-07 | 2017-06-08 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 写真管理 |
JP2018535491A (ja) * | 2016-03-25 | 2018-11-29 | 三菱電機株式会社 | 画像のセマンティックセグメンテーションのためのシステム及びコンピューター実施方法、並びに非一時的コンピューター可読媒体 |
Non-Patent Citations (4)
Title |
---|
FATHI, A. ET AL., SEMANTIC INSTANCE SEGMENTATION VIA DEEP METRIC LEARNING [ONLINE], JPN6021020632, 30 March 2017 (2017-03-30), ISSN: 0004520082 * |
WANG, L. ET AL.: "Unsupervised image segmentation based on multidimensional particle swarm optimization", 6TH INTERNATIONAL CONFERENCE ON WIRELESS, MOBILE AND MULTI-MEDIA (ICWMMN 2015) [ONLINE], JPN7021001953, 2015, ISSN: 0004520083 * |
WEINBERGER, K.Q. ET AL., DISTANCE METRIC LEARNING FOR LARGE MARGIN NEAREST NEIGHBOR CLASSIFICATION (2006) [ONLINE], JPN6021020633, 2006, ISSN: 0004520084 * |
新井康平 外1名: "追跡アルゴリズムを考慮した強化学習・競合学習オンラインクラスタリングによる大規模画像の部位検索", 画像電子学会誌, vol. 第39巻,第3号, JPN6021020631, 25 May 2010 (2010-05-25), pages 301 - 309, ISSN: 0004520085 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022070574A1 (ja) * | 2020-09-29 | 2022-04-07 | 富士フイルム株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2021182430A (ja) * | 2020-12-09 | 2021-11-25 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 意味解析モデルのトレーニング方法及び装置、電子機器並びに記憶媒体 |
JP7253593B2 (ja) | 2020-12-09 | 2023-04-06 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 意味解析モデルのトレーニング方法及び装置、電子機器並びに記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP6989688B2 (ja) | 2022-01-05 |
WO2019015785A1 (en) | 2019-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6989688B2 (ja) | セマンティック・インスタンス・セグメンテーションに使用されるニューラルネットワークを訓練するための方法およびシステム | |
Rathi et al. | Underwater fish species classification using convolutional neural network and deep learning | |
CN109800824B (zh) | 一种基于计算机视觉与机器学习的管道缺陷识别方法 | |
JP6192271B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
EP3333768A1 (en) | Method and apparatus for detecting target | |
EP3564869A1 (en) | Training of deep neural networks on the basis of distributions of paired similarity measures | |
US20210264144A1 (en) | Human pose analysis system and method | |
US12002259B2 (en) | Image processing apparatus, training apparatus, image processing method, training method, and storage medium | |
CN111652317B (zh) | 基于贝叶斯深度学习的超参数图像分割方法 | |
JP6341650B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN109978848B (zh) | 基于多光源颜色恒常模型检测眼底图像中硬性渗出的方法 | |
US11189015B2 (en) | Method and apparatus for acquiring feature data from low-bit image | |
JP6107531B2 (ja) | 特徴抽出プログラム及び情報処理装置 | |
JP7299658B2 (ja) | ニューラルネットワーク及び非局所的ブロックを用いてセグメンテーションを行う疾病診断システム及び方法 | |
Gurrala et al. | A new segmentation method for plant disease diagnosis | |
CN117542067B (zh) | 一种基于视觉识别的区域标注表单识别方法 | |
US20210319269A1 (en) | Apparatus for determining a classifier for identifying objects in an image, an apparatus for identifying objects in an image and corresponding methods | |
CN113762005B (zh) | 特征选择模型的训练、对象分类方法、装置、设备及介质 | |
WO2024078112A1 (zh) | 一种舾装件智能识别方法、计算机设备 | |
JP2016224821A (ja) | 学習装置、学習装置の制御方法及びプログラム | |
Oncevay-Marcos et al. | Leaf-based plant identification through morphological characterization in digital images | |
Kurlin et al. | A persistence-based approach to automatic detection of line segments in images | |
Lyasheva et al. | Application of image weight models to increase canny contour detector resilience to interference | |
JP2019211914A (ja) | 物体らしさ推定装置、方法、およびプログラム | |
CN112801950B (zh) | 一种基于几何失真度量的图像适配质量评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200323 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A801 Effective date: 20200417 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20200417 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210601 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20210901 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211102 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6989688 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |