CN112085747B - 一种基于局部关系指导的图像分割方法 - Google Patents
一种基于局部关系指导的图像分割方法 Download PDFInfo
- Publication number
- CN112085747B CN112085747B CN202010937149.8A CN202010937149A CN112085747B CN 112085747 B CN112085747 B CN 112085747B CN 202010937149 A CN202010937149 A CN 202010937149A CN 112085747 B CN112085747 B CN 112085747B
- Authority
- CN
- China
- Prior art keywords
- segmentation
- image
- local relation
- pixel
- different
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
- G06T2207/20104—Interactive definition of region of interest [ROI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于局部关系指导的图像分割方法,包括如下步骤:S1、在卷积神经网络模型中设计两个分支,第一分支为异同判断模块,第二分支保留原有的分割模块;S2、异同判断模块输出得到待分割图像的局部关系图r,并通过已有分割标注信息的变换进行监督;S3、分割模块输出初步分割结果S4、将局部关系图r与初步分割结果融合,通过定义的引导公式进行引导,调整初步分割结果生成最终分割结果p。本发明将像素局部关系信息作用到初步分割结果中,使得像素点的输出能显式利用周围像素点的分类信息和周围像素点与中心像素点的关系信息,克服了现有技术无法有效利用边界信息的缺陷,提高图像分割的准确性,同时有效降低了学习的难度。
Description
技术领域
本发明涉及图像分割技术领域,特别涉及一种基于局部关系指导的图像分割方法。
背景技术
图像分割是由图像处理到图像分析的关键步骤,将场景中的各元素各物体的边界准确分割出来,一直是图像分割任务的一大挑战。由于场景分割结果中包含了各个元素的形状信息,这些信息反映了图像的结构信息,因此结构信息在场景分割中相当重要。现有的利用结构信息进行图像分割的策略主要有:1、直接利用注意力机制来保留结构信息;2、通过计算某一个像素点与全图每个像素点的相似度得到相似图,再利用注意力机制找到感兴趣区域。然而,有工作表明,注意力机制激活的区域近乎全图,并没有关注同类别区域,进而无法实现结构保留的目的,并且空间注意力机制还存在计算量大的缺点。
发明内容
为解决上述问题,本发明提供了一种基于局部关系指导的图像分割方法。
本发明采用以下技术方案:
一种基于局部关系指导的图像分割方法,包括如下步骤:
S1、在卷积神经网络模型中设计两个分支,第一分支为异同判断模块,用于产生局部关系图,第二分支保留原有的分割模块,用于获得初步分割结果,所述第一分支和所述第二分支共享所述卷积神经网络的骨干网络;
S2、所述异同判断模块输出得到待分割图像的局部关系图r,所述局部关系图r∈RH*W*k*k,其中,r是一个H*W*k*k的矩阵,H、W分别表示待分割图像的高与宽,该矩阵表示每个像素点与以自己为中心、k*k窗口内其他像素点的异同类别关系,所述异同判断模块的输出结果通过已有分割标注信息的变换进行监督;
S3、所述分割模块输出初步分割结果所述初步分割结果/>其中,C表示待分割图像中的分割对象的类别数,H、W分别表示待分割图像的高与宽;
S4、将所述局部关系图r与所述初步分割结果融合,通过引导公式进行引导,调整所述初步分割结果/>生成最终分割结果p。
进一步地,所述步骤S2中的所述异同类别关系用概率表示,/>表示像素i与像素j的异同类别的概率,反映了i与j的异同关系。
进一步地,所述步骤S3中的分割结果得到的每个像素点的分类概率值记为 表示像素点i分类为第c类的概率值。
进一步地,所述步骤S4中的所述引导公式为:
其中,pi,j为经引导后的概率值,为初步分割结果的每个像素点的分类概率值,γ∈[0,1),是人为设定的超参数,即认定异同性概率输出大于γ即认为是同类别,/>为指示函数,即当x为真时,/>否则为0;ω为以i,j为中心的一个小邻域(如3*3),δ为遍历该邻域的变量;
该引导公式以像素i为中心,将像素i周围ω范围内的与之相同类别的像素点的概率值汇聚到中心,与之不同类别的像素点,则不予考虑。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
1、本发明利用异同判断模块预测的像素局部关系信息,将其作用到分割模块输出的粗糙的分割结果中,使得像素点的输出能显式利用周围像素点的分类信息和周围像素点与中心像素点的关系信息,克服了现有技术无法有效利用边界信息的缺陷;
2、充分利用已有的标注信息,对异同判断模块的预测进行监督,而不附加额外的训练数据,就能捕获更好的边界信息,提高图像分割的准确性;
3、异同判断模块仅区分像素是否同类别,不区分具体是哪一类,有效降低了学习的难度,大大减少了计算量。
附图说明
图1为本发明的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
如图1所示,一种基于局部关系指导的图像分割方法,本实施例的卷积神经网络采用DeepLabv2模型,包括如下步骤:
S1、在卷积神经网络模型(CNN模型)中设计两个分支,第一分支为异同判断模块,用于产生局部关系图,第二分支保留原有的分割模块,用于获得初步分割结果,所述第一分支和所述第二分支共享所述卷积神经网络的骨干网络;
S2、所述异同判断模块输出得到待分割图像的局部关系图r,所述局部关系图r∈RH*W*k*k,其中,r是一个H*W*k*k的矩阵,H、W分别表示待分割图像的高与宽,该矩阵表示每个像素点与以自己为中心、k*k窗口内其他像素点的异同类别关系,所述异同判断模块的输出结果通过已有分割标注信息的变换进行监督;
这里对异同类别关系的判定是一个二分类的问题,仅需回答相同或不同,该矩阵对应的标签通过分割标注信息即可生成。
S3、所述分割模块输出初步分割结果所述初步分割结果/>其中,C表示待分割图像中的分割对象的类别数,H、W分别表示待分割图像的高与宽;
S4、将所述局部关系图r与所述初步分割结果融合,通过引导公式进行引导,调整所述初步分割结果/>生成最终分割结果p。
所述步骤S2中的所述异同类别关系用概率表示,/>表示像素i与像素j的异同类别的概率,反映了i与j的异同关系。这种异同关系具有可传递性:/>和反身性/>
所述步骤S3中的分割结果得到的每个像素点的分类概率值记为/> 表示像素点i分类为第c类的概率值。
所述步骤S4中的所述引导公式为:
其中,pi,j为经引导后的概率值,为初步分割结果的每个像素点的分类概率值,γ∈[0,1),是人为设定的超参数,即认定异同性概率输出大于γ即认为是同类别,/>为指示函数,即当x为真时,/>否则为0;ω为以i,j为中心的一个小邻域(如3*3),δ为遍历该邻域的变量;
该引导公式以像素i为中心,将像素i周围ω范围内的与之相同类别的像素点的概率值汇聚到中心,与之不同类别的像素点,则不予考虑。
这里将获得的局部关系图r作用于所述初步分割结果的概率掩膜上,这可以看做是卷积操作,但是每个局部的参数又是不同的,同时又是分组卷积,因此总的来说是一个局部分组卷积操作。
本实施例的使用异同类别关系以指导分割结果可形式化为:
该公式表示,异同类别关系呈现的梯度应与分割结果的梯度成正比。经引导公式引导后的概率满足上式的要求。
图像结构信息尤其是边界信息对场景分割十分重要,为了让模型保留结构信息的有效部分,即边界信息,因此本实施例利用模型预测的像素局部关系,将其作用到粗糙的分割结果中,使得像素的输出能显式利用周围像素点的分类信息,克服了现有技术无法有效利用边界信息的缺陷;充分利用已有的标注信息,对异同判断模块的预测进行监督,而不附加额外的训练数据,就能捕获更好的边界信息,从而提高图像分割的准确性;异同判断模块仅区分像素是否同类别,不区分具体是哪一类,有效降低了学习的难度。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (4)
1.一种基于局部关系指导的图像分割方法,其特征在于:包括如下步骤:
S1、在卷积神经网络模型中设计两个分支,第一分支为异同判断模块,用于产生局部关系图,第二分支保留原有的分割模块,用于获得初步分割结果,所述第一分支和所述第二分支共享所述卷积神经网络的骨干网络;
S2、所述异同判断模块输出得到待分割图像的局部关系图r,所述局部关系图r∈RH *W*k*k,其中,r是一个H*W*k*k的矩阵,H、W分别表示待分割图像的高与宽,该矩阵表示每个像素点与以自己为中心、k*k窗口内其他像素点的异同类别关系,所述异同判断模块的输出结果通过已有分割标注信息的变换进行监督;
S3、所述分割模块输出初步分割结果所述初步分割结果/>其中,C表示待分割图像中的分割对象的类别数,H、W分别表示待分割图像的高与宽;
S4、将所述局部关系图r与所述初步分割结果融合,通过引导公式进行引导,调整所述初步分割结果/>生成最终分割结果p。
2.如权利要求1所述的一种基于局部关系指导的图像分割方法,其特征在于:所述步骤S2中的所述异同类别关系用概率表示,/>表示像素i与像素j的异同类别的概率,反映了i与j的异同关系。
3.如权利要求1所述的一种基于局部关系指导的图像分割方法,其特征在于:所述步骤S3中的分割结果得到的每个像素点的分类概率值记为/> 表示像素点i分类为第c类的概率值。
4.如权利要求1所述的一种基于局部关系指导的图像分割方法,其特征在于:所述步骤S4中的所述引导公式为:
其中,pi,j为经引导后的概率值,为初步分割结果的每个像素点的分类概率值,γ∈[0,1),是人为设定的超参数,即认定异同性概率输出大于γ即认为是同类别,/>为指示函数,即当x为真时,/>否则为0;ω为以i,j为中心的一个小邻域,δ为遍历该邻域的变量;
该引导公式以像素i为中心,将像素i周围ω范围内的与之相同类别的像素点的概率值汇聚到中心,与之不同类别的像素点,则不予考虑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010937149.8A CN112085747B (zh) | 2020-09-08 | 2020-09-08 | 一种基于局部关系指导的图像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010937149.8A CN112085747B (zh) | 2020-09-08 | 2020-09-08 | 一种基于局部关系指导的图像分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112085747A CN112085747A (zh) | 2020-12-15 |
CN112085747B true CN112085747B (zh) | 2023-07-21 |
Family
ID=73732483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010937149.8A Active CN112085747B (zh) | 2020-09-08 | 2020-09-08 | 一种基于局部关系指导的图像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112085747B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116229277B (zh) * | 2023-05-08 | 2023-08-08 | 中国海洋大学 | 基于语义相关性的强抗干扰海洋遥感图像语义分割方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0638189A (ja) * | 1992-07-15 | 1994-02-10 | Matsushita Electric Ind Co Ltd | 画像符号化方法 |
CN106650744A (zh) * | 2016-09-16 | 2017-05-10 | 北京航空航天大学 | 局部形状迁移指导的图像对象共分割方法 |
WO2018076212A1 (zh) * | 2016-10-26 | 2018-05-03 | 中国科学院自动化研究所 | 基于反卷积神经网络的场景语义分割方法 |
CN109272522A (zh) * | 2018-10-19 | 2019-01-25 | 山东大学 | 一种基于局部特征的图像细化分割方法 |
-
2020
- 2020-09-08 CN CN202010937149.8A patent/CN112085747B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0638189A (ja) * | 1992-07-15 | 1994-02-10 | Matsushita Electric Ind Co Ltd | 画像符号化方法 |
CN106650744A (zh) * | 2016-09-16 | 2017-05-10 | 北京航空航天大学 | 局部形状迁移指导的图像对象共分割方法 |
WO2018076212A1 (zh) * | 2016-10-26 | 2018-05-03 | 中国科学院自动化研究所 | 基于反卷积神经网络的场景语义分割方法 |
CN109272522A (zh) * | 2018-10-19 | 2019-01-25 | 山东大学 | 一种基于局部特征的图像细化分割方法 |
Non-Patent Citations (1)
Title |
---|
深度卷积神经网络图像语义分割研究进展;青晨;禹晶;肖创柏;段娟;;中国图象图形学报(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112085747A (zh) | 2020-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112884064B (zh) | 一种基于神经网络的目标检测与识别方法 | |
US11586913B2 (en) | Power equipment fault detecting and positioning method of artificial intelligence inference fusion | |
US20210020360A1 (en) | Internal thermal fault diagnosis method of oil-immersed transformer based on deep convolutional neural network and image segmentation | |
Gerdzhev et al. | Tornado-net: multiview total variation semantic segmentation with diamond inception module | |
He et al. | Multi-scale multi-task fcn for semantic page segmentation and table detection | |
US10753881B2 (en) | Methods and systems for crack detection | |
CN109740676B (zh) | 基于相似目标的物体检测迁移方法 | |
US10262214B1 (en) | Learning method, learning device for detecting lane by using CNN and testing method, testing device using the same | |
EP2672396A1 (en) | Method for annotating images | |
US11640714B2 (en) | Video panoptic segmentation | |
Hou et al. | Distilling knowledge from object classification to aesthetics assessment | |
CN110458022B (zh) | 一种基于域适应的可自主学习目标检测方法 | |
CN112561960B (zh) | 一种基于轨迹相似性度量学习的多目标跟踪重定位方法 | |
CN114580515A (zh) | 用于半导体脱焊智能检测的神经网络训练方法 | |
CN113240623A (zh) | 一种路面病害检测方法及装置 | |
CN112085747B (zh) | 一种基于局部关系指导的图像分割方法 | |
CN114998595A (zh) | 弱监督语义分割方法、语义分割方法及可读存储介质 | |
CN113989604A (zh) | 基于端到端深度学习的轮胎dot信息识别方法 | |
CN116229112A (zh) | 一种基于多重注意力的孪生网络目标跟踪方法 | |
Tian et al. | Unsupervised road anomaly detection with language anchors | |
CN113936034B (zh) | 一种结合帧间光流的表观运动联合弱小运动目标检测方法 | |
Chen et al. | An interactive semantic video mining and retrieval platform--application in transportation surveillance video for incident detection | |
CN113628252A (zh) | 一种基于热成像视频的泄漏气体云团检测方法 | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
CN113313128A (zh) | 一种基于改进YOLOv3网络的SAR图像目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: No. 208-3, Fengqi Road, phase III, software park, Xiamen City, Fujian Province, 361000 Applicant after: Zhongke (Xiamen) data Intelligence Research Institute Address before: No. 208-3, Fengqi Road, phase III, software park, Xiamen City, Fujian Province, 361000 Applicant before: Xiamen Institute of data intelligence, Institute of computing technology, Chinese Academy of Sciences |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |