JP7476345B2 - 輪郭精度評価を用いた画像セグメンテーション訓練 - Google Patents
輪郭精度評価を用いた画像セグメンテーション訓練 Download PDFInfo
- Publication number
- JP7476345B2 JP7476345B2 JP2022560283A JP2022560283A JP7476345B2 JP 7476345 B2 JP7476345 B2 JP 7476345B2 JP 2022560283 A JP2022560283 A JP 2022560283A JP 2022560283 A JP2022560283 A JP 2022560283A JP 7476345 B2 JP7476345 B2 JP 7476345B2
- Authority
- JP
- Japan
- Prior art keywords
- contour
- ground truth
- binary
- rgb image
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Description
本出願は、2020年7月2日に出願された「輪郭精度評価を用いた機械学習ベースの画像セグメンテーション訓練(Machine Learning based Image Segmentation Training with Contour Accuracy Evaluation)」という名称の同時継続米国仮特許出願第63/047,750号の米国特許法第119条に基づく優先権の利益を主張するものであり、上記出願の開示は引用により本明細書に組み入れられる。
120 二値輪郭をオリジナルRGB画像内に交差させることによって新たなグラウンドトゥルース画像セットを生成
130 セグメンテーション訓練のための交差画像コンテナからグラウンドトゥルースRGB画像バッファを抽出
140 予測セグメンテーションマスクに基づいて、アルゴリズムを使用して新たな二値輪郭を取得
150 手動でセグメント化されたマスクと予測セグメンテーションマスクとの間のセグメンテーション損失を計算
160 二値輪郭と新たな二値輪郭との間の損失関数の形態の差分を計算
170 誤差逆伝播のためにセグメンテーション損失に輪郭損失を加算
Claims (16)
- 予測セグメンテーションマスクの精度を高める方法であって、
セグメンテーション訓練のためのグラウンドトゥルース赤色-緑色-青色(RGB)画像コンテナから、グラウンドトゥルースRGB画像バッファ及び二値輪郭画像バッファを抽出することと、
前記グラウンドトゥルースRGB画像バッファから予測セグメンテーションマスクを生成することと、
特定のアルゴリズムを使用して、前記予測セグメンテーションマスクから第2の二値輪郭を生成することと、
前記グラウンドトゥルースRGB画像バッファの手動でセグメント化されたマスクと前記予測セグメンテーションマスクとの間のセグメンテーション損失を計算することと、
前記二値輪郭画像バッファの輪郭と前記予測セグメンテーションマスクの前記二値輪郭との間の輪郭精度損失を計算することと、
前記セグメンテーション損失及び前記輪郭精度損失の加重平均としての総損失を計算することと、
予測セグメンテーションマスクの精度を高めるために、前記総損失を使用して前記二値輪郭画像バッファの損失を補償して改善された二値輪郭を生成し、前記改善された二値輪郭を使用してセグメンテーションネットワークを支援すること、
を含むことを特徴とする方法。 - 前記特定のアルゴリズムを使用して、グラウンドトゥルースRGB画像の前記手動でセグメント化されたマスクに基づいて第1の二値輪郭を生成することと、
前記第1の二値輪郭を前記グラウンドトゥルースRGB画像内に交差させて前記グラウンドトゥルースRGB画像コンテナを生成することと、
をさらに含む請求項1に記載の方法。 - 前記第1の二値輪郭を前記グラウンドトゥルースRGB画像内に交差させることは、
前記グラウンドトゥルースRGB画像の各行を前記グラウンドトゥルースRGB画像コンテナの第1の1行おきの行内に配置することと、
前記第1の二値輪郭の各行を前記グラウンドトゥルースRGB画像コンテナの第2の1行おきの行内に配置することと、
を含む、請求項2に記載の方法。 - 前記第1の1行おきの行は偶数行であり、前記第2の1行おきの行は奇数行である、
請求項3に記載の方法。 - 前記手動でセグメント化されたマスクは、グラウンドトゥルースRGB画像を手動でセグメント化することによって生成される、
請求項1に記載の方法。 - 前記総損失を計算することは、
第1の定数に前記セグメンテーション損失を乗じたものと第2の定数に前記輪郭精度損失を乗じたものとの加算として前記総損失を計算することを含み、
前記第1の定数と前記第2の定数との和は1に等しい、
請求項1に記載の方法。 - 予測セグメンテーションマスクの精度を高めるシステムであって、
交差画像コンテナからグラウンドトゥルースRGB画像バッファ及び二値輪郭画像バッファを抽出するバッファ抽出器と、
前記グラウンドトゥルースRGB画像バッファを受け取って予測セグメンテーションマスクを生成するセグメンテーションネットワークと、
前記予測セグメンテーションマスクを受け取り、前記予測セグメンテーションマスクに基づいて予測輪郭を生成し、手動でセグメント化されたマスクと前記予測セグメンテーションマスクとの間のセグメンテーション損失を計算し、前記予測輪郭と前記二値輪郭画像バッファとの間の輪郭精度損失も計算するプロセッサと、
前記セグメンテーション損失及び前記輪郭精度損失の加重平均としての総損失を計算するエンハンサであって、前記総損失を使用して前記二値輪郭画像バッファの損失を補償して改善された二値輪郭を生成し、前記改善された二値輪郭を使用してセグメンテーションネットワークを支援することによって予測セグメンテーションマスクの精度を高めるエンハンサと、
を備えることを特徴とするシステム。 - 前記プロセッサは、特定のアルゴリズムを使用して、前記予測セグメンテーションマスクに基づいて前記予測輪郭を生成する、
請求項7に記載のシステム。 - 前記交差画像コンテナは、前記特定のアルゴリズムを使用して、前記グラウンドトゥルースRGB画像バッファ内のグラウンドトゥルースRGB画像の前記手動でセグメント化されたマスクに基づいて二値輪郭を生成し、前記二値輪郭画像バッファ内の二値輪郭を前記グラウンドトゥルースRGB画像内に交差させることによって構築される、
請求項8に記載のシステム。 - 前記手動でセグメント化されたマスクは、前記グラウンドトゥルースRGB画像を手動でセグメント化することによって生成される、
請求項9に記載のシステム。 - 予測セグメンテーションマスクの精度を高めるためのコンピュータプログラムを記憶した非一時的コンピュータ可読記憶媒体であって、前記コンピュータプログラムは、
セグメンテーション訓練のためのグラウンドトゥルース赤色-緑色-青色(RGB)画像コンテナから、グラウンドトゥルースRGB画像バッファ及び二値輪郭画像バッファを抽出することと、
前記グラウンドトゥルースRGB画像バッファから予測セグメンテーションマスクを生成することと、
特定のアルゴリズムを使用して、前記予測セグメンテーションマスクから第2の二値輪郭を生成することと、
前記グラウンドトゥルースRGB画像バッファの手動でセグメント化されたマスクと前記予測セグメンテーションマスクとの間のセグメンテーション損失を計算することと、
前記二値輪郭画像バッファの輪郭と前記予測セグメンテーションマスクの前記二値輪郭との間の輪郭精度損失を計算することと、
前記セグメンテーション損失及び前記輪郭精度損失の加重平均としての総損失を計算することと、
予測セグメンテーションマスクの精度を高めるために、前記総損失を使用して前記二値輪郭画像バッファの損失を補償して改善された二値輪郭を生成し、前記改善された二値輪郭を使用してセグメンテーションネットワークを支援すること、
をコンピュータに行わせる実行可能命令を含む、ことを特徴とする非一時的コンピュータ可読記憶媒体。 - 前記コンピュータプログラムは、
前記特定のアルゴリズムを使用して、グラウンドトゥルースRGB画像の前記手動でセグメント化されたマスクに基づいて第1の二値輪郭を生成することと、
前記第1の二値輪郭を前記グラウンドトゥルースRGB画像内に交差させて前記グラウンドトゥルースRGB画像コンテナを生成することと、
を前記コンピュータに行わせる実行可能命令をさらに含む、請求項11に記載の非一時的コンピュータ可読記憶媒体。 - 前記第1の二値輪郭を前記グラウンドトゥルースRGB画像内に交差させることを前記コンピュータにさせる前記実行可能命令は、
前記グラウンドトゥルースRGB画像の各行を前記グラウンドトゥルースRGB画像コンテナの第1の1行おきの行内に配置することと、
前記第1の二値輪郭の各行を前記グラウンドトゥルースRGB画像コンテナの第2の1行おきの行内に配置することと、
を前記コンピュータに行わせる実行可能命令を含む、請求項12に記載の非一時的コンピュータ可読記憶媒体。 - 前記第1の1行おきの行は偶数行であり、前記第2の1行おきの行は奇数行である、
請求項13に記載の非一時的コンピュータ可読記憶媒体。 - 前記手動でセグメント化されたマスクは、グラウンドトゥルースRGB画像を手動でセグメント化することによって生成される、
請求項11に記載の非一時的コンピュータ可読記憶媒体。 - 前記総損失を計算することを前記コンピュータに行わせる実行可能命令は、
第1の定数に前記セグメンテーション損失を乗じたものと第2の定数に前記輪郭精度損失を乗じたものとの加算として前記総損失を計算することを前記コンピュータに行わせる実行可能命令を含み、
前記第1の定数と前記第2の定数との和は1に等しい、
請求項11に記載の非一時的コンピュータ可読記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063047750P | 2020-07-02 | 2020-07-02 | |
US63/047,750 | 2020-07-02 | ||
US17/179,061 US11790533B2 (en) | 2020-07-02 | 2021-02-18 | Machine learning based image segmentation training with contour accuracy evaluation |
US17/179,061 | 2021-02-18 | ||
PCT/US2021/035026 WO2022005670A1 (en) | 2020-07-02 | 2021-05-28 | Image segmentation training with contour accuracy evaluation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023520528A JP2023520528A (ja) | 2023-05-17 |
JP7476345B2 true JP7476345B2 (ja) | 2024-04-30 |
Family
ID=79167561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022560283A Active JP7476345B2 (ja) | 2020-07-02 | 2021-05-28 | 輪郭精度評価を用いた画像セグメンテーション訓練 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11790533B2 (ja) |
EP (1) | EP4154197A4 (ja) |
JP (1) | JP7476345B2 (ja) |
CN (1) | CN115280361A (ja) |
WO (1) | WO2022005670A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115019050A (zh) * | 2021-03-05 | 2022-09-06 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备及存储介质 |
US20240153099A1 (en) * | 2022-11-01 | 2024-05-09 | Black Sesame Technologies Inc. | Strip decoder and inside-outside loss for high quality image segmentation |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015145643A1 (ja) | 2014-03-27 | 2015-10-01 | コニカミノルタ株式会社 | 画像処理装置および画像処理プログラム |
US20170287137A1 (en) | 2016-03-31 | 2017-10-05 | Adobe Systems Incorporated | Utilizing deep learning for boundary-aware image segmentation |
CN108846841A (zh) | 2018-07-02 | 2018-11-20 | 北京百度网讯科技有限公司 | 显示屏质量检测方法、装置、电子设备及存储介质 |
WO2019066794A1 (en) | 2017-09-27 | 2019-04-04 | Google Llc | END-TO-END NETWORK MODEL FOR HIGH-RESOLUTION IMAGE SEGMENTATION |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7328349B2 (en) | 2001-12-14 | 2008-02-05 | Bbn Technologies Corp. | Hash-based systems and methods for detecting, preventing, and tracing network worms and viruses |
US8392709B1 (en) | 2009-04-28 | 2013-03-05 | Adobe Systems Incorporated | System and method for a single request—single response protocol with mutual replay attack protection |
US8391594B1 (en) * | 2009-05-28 | 2013-03-05 | Adobe Systems Incorporated | Method and apparatus for generating variable-width border masks |
US9113130B2 (en) | 2012-02-06 | 2015-08-18 | Legend3D, Inc. | Multi-stage production pipeline system |
CN104737542B (zh) | 2013-01-30 | 2018-09-25 | 英特尔公司 | 用于下一代视频的内容自适应熵编码 |
EP3007411A1 (en) | 2014-10-06 | 2016-04-13 | Verisign, Inc. | System and method for adding a whitelist entry via dns |
US10509954B2 (en) * | 2016-02-10 | 2019-12-17 | Intel Corporation | Method and system of image segmentation refinement for image processing |
US10601859B2 (en) | 2016-02-25 | 2020-03-24 | Trusona, Inc. | Anti-replay systems and methods |
US9680951B1 (en) * | 2016-09-06 | 2017-06-13 | Cloudflare, Inc. | Method and apparatus for causing delay in processing requests for internet resources received from client devices |
US10929987B2 (en) | 2017-08-16 | 2021-02-23 | Nvidia Corporation | Learning rigidity of dynamic scenes for three-dimensional scene flow estimation |
EP3625765B1 (en) | 2017-12-29 | 2024-03-20 | Leica Biosystems Imaging, Inc. | Processing of histology images with a convolutional neural network to identify tumors |
CN110517278B (zh) * | 2019-08-07 | 2022-04-29 | 北京旷视科技有限公司 | 图像分割和图像分割网络的训练方法、装置和计算机设备 |
CN110660066B (zh) * | 2019-09-29 | 2023-08-04 | Oppo广东移动通信有限公司 | 网络的训练方法、图像处理方法、网络、终端设备及介质 |
-
2021
- 2021-02-18 US US17/179,061 patent/US11790533B2/en active Active
- 2021-05-28 WO PCT/US2021/035026 patent/WO2022005670A1/en unknown
- 2021-05-28 JP JP2022560283A patent/JP7476345B2/ja active Active
- 2021-05-28 EP EP21833815.0A patent/EP4154197A4/en active Pending
- 2021-05-28 CN CN202180021373.5A patent/CN115280361A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015145643A1 (ja) | 2014-03-27 | 2015-10-01 | コニカミノルタ株式会社 | 画像処理装置および画像処理プログラム |
US20170287137A1 (en) | 2016-03-31 | 2017-10-05 | Adobe Systems Incorporated | Utilizing deep learning for boundary-aware image segmentation |
WO2019066794A1 (en) | 2017-09-27 | 2019-04-04 | Google Llc | END-TO-END NETWORK MODEL FOR HIGH-RESOLUTION IMAGE SEGMENTATION |
CN108846841A (zh) | 2018-07-02 | 2018-11-20 | 北京百度网讯科技有限公司 | 显示屏质量检测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2023520528A (ja) | 2023-05-17 |
US20220005200A1 (en) | 2022-01-06 |
EP4154197A4 (en) | 2023-12-06 |
US11790533B2 (en) | 2023-10-17 |
EP4154197A1 (en) | 2023-03-29 |
CN115280361A (zh) | 2022-11-01 |
WO2022005670A1 (en) | 2022-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112308095A (zh) | 图片预处理及模型训练方法、装置、服务器及存储介质 | |
CN108664981B (zh) | 显著图像提取方法及装置 | |
JP6213745B2 (ja) | 画像処理方法及び装置 | |
KR102084343B1 (ko) | 배경 제거 | |
JP7476345B2 (ja) | 輪郭精度評価を用いた画像セグメンテーション訓練 | |
JP2015232869A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
WO2022194079A1 (zh) | 天空区域分割方法、装置、计算机设备和存储介质 | |
CN113301409A (zh) | 视频合成方法、装置、电子设备和可读存储介质 | |
CN114299101A (zh) | 图像的目标区域获取方法、装置、设备、介质和程序产品 | |
WO2020166596A1 (ja) | 画像処理システム及びプログラム | |
CN116320334A (zh) | 投影画面颜色校正方法、装置、投影设备和存储介质 | |
CN114511041A (zh) | 模型训练方法、图像处理方法、装置、设备和存储介质 | |
CN107564085B (zh) | 图像扭曲处理方法、装置、计算设备及计算机存储介质 | |
CN114240804A (zh) | 一种抠图数据生成方法、装置、计算机设备及存储介质 | |
JP2014230283A (ja) | ピクチャーを処理する方法および装置 | |
JP4568692B2 (ja) | 画像補正システム、画像補正方法およびこの方法のプログラム | |
CN114565633A (zh) | 基于概念结构元素和矩阵范数的彩色图像边缘提取方法 | |
CN115713464A (zh) | 一种基于文本感知损失的注意力文本超分辨率方法 | |
CN108629350B (zh) | 一种识别图片之间相似关系的方法及装置 | |
CN114140488A (zh) | 视频目标分割方法及装置、视频目标分割模型的训练方法 | |
JP7432766B2 (ja) | オプティカルフローによって支援される、動いている物体のためのハイブリッドビデオセグメンテーション | |
Cao et al. | TranStable: Towards Robust Pixel-level Online Video Stabilization by Jointing Transformer and CNN | |
CN104394300B (zh) | 一种视频缩放方法及其系统 | |
CN111462148B (zh) | 提取前景图像的方法、系统、电子设备及存储介质 | |
CN108108794A (zh) | 一种基于二维码图像隐藏的可视化信息增强方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231002 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240417 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7476345 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |