CN114463187B - 基于聚合边缘特征的图像语义分割方法及系统 - Google Patents

基于聚合边缘特征的图像语义分割方法及系统 Download PDF

Info

Publication number
CN114463187B
CN114463187B CN202210387576.2A CN202210387576A CN114463187B CN 114463187 B CN114463187 B CN 114463187B CN 202210387576 A CN202210387576 A CN 202210387576A CN 114463187 B CN114463187 B CN 114463187B
Authority
CN
China
Prior art keywords
network
image
edge
feature
map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210387576.2A
Other languages
English (en)
Other versions
CN114463187A (zh
Inventor
田辉
刘其开
徐飞
郭玉刚
张志翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei High Dimensional Data Technology Co ltd
Original Assignee
Hefei High Dimensional Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei High Dimensional Data Technology Co ltd filed Critical Hefei High Dimensional Data Technology Co ltd
Priority to CN202210387576.2A priority Critical patent/CN114463187B/zh
Publication of CN114463187A publication Critical patent/CN114463187A/zh
Application granted granted Critical
Publication of CN114463187B publication Critical patent/CN114463187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明特别涉及一种基于聚合边缘特征的图像分割方法,包括:特征提取模块,用于提取图像的浅层特征;特征融合模块,用于对浅层特征进行特征融合;上采样模块,用于对融合后的特征进行卷积降维操作,并对降维后的特征图进行上采样双线性插值处理得到与输入图尺寸相同的特征图;显著目标边缘图生成模块,用于对上采样模块输出的特征图进行相加,并对相加后的特征图进行可视化处理得到预测的显著目标边缘图。通过此网络可以有效的提取显著目标,以PC屏幕为例,我们的显著目标就是屏幕的边缘,而非所有线段,建立该网络并完成训练后,训练好的网络就能可靠的提取出显著目标边缘,提取结果中噪点少,保证后续对屏幕的识别更加准确。

Description

基于聚合边缘特征的图像语义分割方法及系统
技术领域
本发明涉及图像处理技术领域,特别涉及一种基于聚合边缘特征的图像语义分割方法及系统。
背景技术
目前计算机视觉技术应用于多个场景,包括图像分类、目标检测、三维重建以及语义分割等领域。随着互联网通信快速发展,智能化产品的竞争力需要更高级语义场景理解的技术突破。因此,语义分割作为计算机视觉的核心问题,能够帮助越来越多的产品自动高效地理解图像或影像中相关的知识或语义,从而达到智能化目标,减小人为的交互操作并提升客户的舒适感。当前这些产品已广泛应用于自动驾驶、人机交互、计算摄影学、图像搜索引擎、增强现实等领域。
计算机视觉中语义分割问题本质上是从粗糙推理逐渐到精细化推理的过程。刚开始要追溯到分类问题,即粗略地预测输入样本中的物体类别,之后就是目标物体的定位与检测,这不仅预测物体的类别,并且给出关于各类别空间位置的额外信息,比如中心点或物体区域的边框。在此基础上,语义分割可以理解为在检测领域上的细粒度预测,将测试图像输入分割网络,使预测的热图大小和输入图像保持一致,通道数等于类别数,分别代表了各空间位置属于各类别的概率,即可以逐像素地进行分类。
深度学习算法已成为语义分割技术的主流方向,且取得了重要突破和进展。全卷积网络FCN成为了深度学习技术应用于语义分割问题的基石,它可以接受任意尺寸的输入图像,通过若干个反卷积层对编码网络的最后一个卷积的特征图(feature map)进行上采样解码,使它恢复到输入图像相同的尺寸,从而可以对每一个像素都产生一个预测,同时保留了原始输入图像中的空间信息。随后在FCN网络的基础上,第一阶段衍生了多种语义分割模型,如编解码之间具有跳跃连接的对称网络U-Net,引入扩张卷积和使用条件随机场CRF进行后处理优化的DeepLab系列网络以及结合上下文信息进行特征融合的ParseNet。第二阶段随着Transformer模型结构应用于视觉领域,提升了关键区域和感兴趣对象的特征辨识能力,在诸多视觉任务中取得较好的表现。
虽然现有的语义分割在几个常见的应用和数据场景的技术突破越来越大,但在特定场景或应用下,单目标语义分割的效果和实用性有待提高,比如对于电脑PC屏幕的分割场景受部分遮挡以及光照等复杂因素的影响,其分割效果并不是很理想,并且在现有的模型结构下提升有限。
为了解决现有技术中屏幕分割效果不佳的情况,东北大学于2021年7月29日提交的专利申请《基于自适应特征融合的边缘感知图像语义分割方法》(申请号:2021108646799),其公开了一种基于自适应特征融合的边缘感知图像语义分割方法,是一种以残差网络为基础的新的语义分割方法,是一个双分支网络结构模型,包括边缘分支和语义分支,其中,边缘分支从语义分支的浅层部分被引出,语义分支采用了编码解码结构。在边缘分支中,加入的多尺度交叉融合操作通过叠加空洞率不同的空洞卷积获取图像多尺度特征,同时各个分支之间的交叉融合可以进一步提升多尺度特征的鲁棒性,在语义分支中基于空间注意力机制对深层特征和浅层特征进行融合,可以在获得浅层特征中含有的丰富空间信息的同时,过滤其含有的大量噪声;最后对语义分支特征和边缘分支特征进行融合,进一步优化分割效果。此方案中,通过引入双分支网络,分别对图像中目标边缘特征和目标区域特征进行提取,最后再取交集,这样可以得到更加准确的分割效果。此案中,所采用的的边缘分支特征提取方案噪声很多,比如对PC屏幕进行边缘提取时,由于屏幕边缘多为直线,而图像中其他物体也常出现直线边缘,故而导致边缘分支特征提取的不准确,进一步影响最终的目标提取。
中国地质大学(武汉)申请的专利《基于双流深度网络的农田识别方法、装置及存储介质》(申请号:2021114441870)中,同样采用了边缘检测网络和语义分割网络对目标进行识别,该方案中采用的是基于DexiNed的农田边缘检测网络,同样会存在上述不足。
发明内容
本发明的首要目的在于提供一种基于聚合边缘特征的图像分割方法,能够准确的提取出显著目标边缘特征。
为实现以上目的,本发明采用的技术方案为:一种基于聚合边缘特征的图像分割方法,包括:特征提取模块,用于提取图像的浅层特征得到不同尺度的浅层特征图
Figure 601005DEST_PATH_IMAGE001
;特征融合模块,用于对特征图
Figure 894583DEST_PATH_IMAGE001
进行特征融合得到特征图
Figure 734888DEST_PATH_IMAGE002
;上采样模块,用于对特征图
Figure 455719DEST_PATH_IMAGE003
进行卷积降维操作得到单通道特征图
Figure 886700DEST_PATH_IMAGE004
,并对单通道特征图
Figure 593756DEST_PATH_IMAGE004
进行上采样双线性插值处理得到与输入图尺寸相同的特征图
Figure 895425DEST_PATH_IMAGE005
,其中
Figure 787157DEST_PATH_IMAGE006
;显著目标边缘图生成模块,用于对特征图
Figure 174276DEST_PATH_IMAGE007
进行相加,并对相加后的特征图进行可视化处理得到预测的显著目标边缘图。
本发明的第二个目的在于提供一种基于聚合边缘特征的图像分割方法,提高识别出的显著目标边缘的精确性。
为实现以上目的,本发明采用的技术方案为:一种基于聚合边缘特征的图像分割方法,包括如下步骤:获取第一训练集;按照前述的方法构建第一网络;利用所述的第一训练集对所述的第一网络进行训练,训练完成后得到训练好的第一网络;将待检测图像输入训练好的第一网络得到预测的显著目标边缘图,该图中显著目标边框轮廓与背景区域相异。
与现有技术相比,上述分割网络和分割方法存在以下技术效果:通过提取浅层特征,并进行特征融合,再利用上采样双线性插值处理,可以有效的提取显著目标,比如对于PC屏幕来说,我们的显著目标就是屏幕的边缘,而非所有线段,建立该网络后,我们只需要利用标记好显著目标的图像集对其进行训练,训练好的网络就能可靠的提取出显著目标边缘,提取结果中噪点少,保证后续对屏幕的识别更加准确。
本发明的第三个目的在于提供一种基于聚合边缘特征的图像语义分割方法,能够更加准确的分割出所需目标。
为实现以上目的,本发明采用的技术方案为:一种基于聚合边缘特征的PC屏幕语义分割方法,包括如下步骤:获取第一训练集和第二训练集;按照前述的方法构建第一网络,构建基于语义分割的第二网络;利用所述的第一训练集对所述的第一网络进行训练,训练完成后得到训练好的第一网络;利用所述的第二训练集对所述的第二网络进行训练,训练完成后得到训练好的第二网络;将待检测图像分别输入训练好的第一网络、第二网络,得到预测的显著目标边缘图、预测热图,预测的显著目标边缘图中显著目标边框轮廓与背景区域相异,预测热图中目标区域与背景区域相异;计算预测的显著目标边缘图中显著目标边框轮廓内的区域和预测热图中目标区域的交集,并将此交集作为待检测图像的目标区域输出。
本发明的第四个目的在于提供一种基于聚合边缘特征的图像语义分割系统,能够更加准确的分割出所需目标。
为实现以上目的,本发明采用的技术方案为:一种基于聚合边缘特征的图像语义分割系统,包括第一网络模块、第二网络模块以及图像处理模块;所述的第一网络模块中存储有训练好的第一网络用于对待检测图像进行处理得到预测的显著目标边缘图,该图中显著目标边框轮廓与背景区域相异,第一网络按照前述的方法构建;所述的第二网络模块中存储有训练好的第二网络用于对待检测图像进行处理得到预测热图,该图中目标区域与背景区域相异;图像处理模块用于计算预测的显著目标边缘图中显著目标边框轮廓内的区域和预测热图中目标区域的交集并将此交集作为待检测图像的目标区域输出。
与现有技术相比,本发明存在以下技术效果:通过由前述网络结构构成的第一网络来提取显著目标边缘,能够准确的提取出目标的显著边缘特征;再通过基于语义分割的第二网络来提取目标区域,最后对两者进行融合,得到更准确的分割效果;由于边缘特征提取更加准确,再后面进行融合时得到的最终分割效果也更加精确。
附图说明
图1是本发明中基于聚合边缘特征的图像分割网络结构图;
图2是本发明中基于聚合边缘特征的图像分割方法流程图;
图3是本发明中基于聚合边缘特征的图像语义分割方法流程图;
图4是本发明中基于聚合边缘特征的图像语义分割网络结构图;
图5是本发明中基于聚合边缘特征的图像语义分割系统框图。
具体实施方式
下面结合图1至图5,对本发明做进一步详细叙述。
参阅图1,本发明公开了一种基于聚合边缘特征的图像分割方法,包括:特征提取模块,用于提取图像的浅层特征得到不同尺度的浅层特征图
Figure 199870DEST_PATH_IMAGE001
;特征融合模块,用于对特征图
Figure 621624DEST_PATH_IMAGE001
进行特征融合得到特征图
Figure 825203DEST_PATH_IMAGE002
;上采样模块,用于对特征图
Figure 699618DEST_PATH_IMAGE003
进行卷积降维操作得到单通道特征图
Figure 138690DEST_PATH_IMAGE004
,并对单通道特征图
Figure 539584DEST_PATH_IMAGE004
进行上采样双线性插值处理得到与输入图尺寸相同的特征图
Figure 773120DEST_PATH_IMAGE005
,其中
Figure 400410DEST_PATH_IMAGE006
;显著目标边缘图生成模块,用于对特征图
Figure 252959DEST_PATH_IMAGE007
进行相加,并对相加后的特征图进行可视化处理得到预测的显著目标边缘图。通过提取浅层特征,并进行特征融合,再利用上采样双线性插值处理,可以有效的提取显著目标,比如对于PC屏幕来说,我们的显著目标就是屏幕的边缘,而非所有线段,建立该网络后,我们只需要利用标记好显著目标的图像集对其进行训练,训练好的网络就能可靠的提取出显著目标边缘,提取结果中噪点少,保证后续对屏幕的识别更加准确。
特征融合的方案有很多,本发明中优选地,所述的特征融合模块按如下步骤对特征图
Figure 649306DEST_PATH_IMAGE001
进行特征融合得到特征图
Figure 319322DEST_PATH_IMAGE002
包括:对特征图
Figure 27383DEST_PATH_IMAGE008
进行卷积处理得到特征图
Figure 808258DEST_PATH_IMAGE009
,特征图
Figure 324690DEST_PATH_IMAGE009
与特征图
Figure 775394DEST_PATH_IMAGE008
相比通道数减少但尺寸不变;对特征图
Figure 846118DEST_PATH_IMAGE009
进行上采样双线性插值处理得到特征图
Figure 165104DEST_PATH_IMAGE010
,特征图
Figure 270463DEST_PATH_IMAGE010
与特征图
Figure 403985DEST_PATH_IMAGE009
相比通道数不变且尺寸与特征图
Figure 227585DEST_PATH_IMAGE011
相同;取特征图
Figure 84682DEST_PATH_IMAGE011
的部分通道与特征图
Figure 185494DEST_PATH_IMAGE010
进行叠加得到特征图
Figure 102634DEST_PATH_IMAGE012
,特征图
Figure 147950DEST_PATH_IMAGE012
和特征图
Figure 198952DEST_PATH_IMAGE011
通道数不变且尺寸相同;对特征图
Figure 278903DEST_PATH_IMAGE012
进行卷积处理得到特征图
Figure 366945DEST_PATH_IMAGE013
,特征图
Figure 899558DEST_PATH_IMAGE013
与特征图
Figure 239403DEST_PATH_IMAGE011
相比通道数减少但尺寸不变;以此类推,得到特征图
Figure 173861DEST_PATH_IMAGE014
。以图1为例,这里的N等于3,我们先得到特征图
Figure 698383DEST_PATH_IMAGE015
,再通过特征图
Figure 842926DEST_PATH_IMAGE015
和特征图
Figure 111096DEST_PATH_IMAGE016
的融合得到特征图
Figure 900061DEST_PATH_IMAGE017
,再通过特征图
Figure 329905DEST_PATH_IMAGE017
和特征图
Figure 712476DEST_PATH_IMAGE018
的融合得到特征图
Figure 518758DEST_PATH_IMAGE019
,通过上述步骤,我们可以更加精准地实现显著目标边缘的提取,噪点非常少。
进一步地,所述的单通道特征图
Figure 427808DEST_PATH_IMAGE004
和特征图
Figure 418767DEST_PATH_IMAGE003
的尺寸相同,特征图
Figure 147688DEST_PATH_IMAGE005
通道数为1;对特征图
Figure 757661DEST_PATH_IMAGE007
进行相加即将N个特征图中相同位置的特征值相加,可视化处理包括:对相加后的特征图进行归一化操作得到概率分布矩阵;按照设定阈值对概率分布矩阵进行二值化处理即得到预测的显著目标边缘图。通过该步骤,可以方便的从不同尺度的浅层特征图中提取出特征图
Figure 255639DEST_PATH_IMAGE005
,进而实现显著目标边框轮廓与背景区域的分类。
本发明还公开了一种基于聚合边缘特征的图像分割方法,包括如下步骤:获取第一训练集,收集多张图像并对每张图像进行像素级的分类标注,若目标为屏幕,则标注的即为屏幕边缘轮廓;按照前述的方法构建第一网络;利用所述的第一训练集对所述的第一网络进行训练,训练完成后得到训练好的第一网络;将待检测图像输入训练好的第一网络得到预测的显著目标边缘图,该图中显著目标边框轮廓与背景区域相异。需要注意的是,对不同的目标进行识别时,尽量建立各自对应的第一网络,比如,我们常用的对PC屏幕进行分割,那么我们第一训练集中多为包括屏幕的图像,训练得到的第一网络也仅用于提取PC屏幕的显著边缘特征,而不能用于提取其他目标的边缘特征。
参阅图3和图4,本发明还公开了一种基于聚合边缘特征的图像语义分割方法,包括如下步骤:获取第一训练集和第二训练集;按照前述的方法构建第一网络,构建基于语义分割的第二网络;利用所述的第一训练集对所述的第一网络进行训练,训练完成后得到训练好的第一网络;利用所述的第二训练集对所述的第二网络进行训练,训练完成后得到训练好的第二网络;将待检测图像分别输入训练好的第一网络、第二网络,得到预测的显著目标边缘图、预测热图,预测的显著目标边缘图中显著目标边框轮廓与背景区域相异,预测热图中目标区域与背景区域相异;计算预测的显著目标边缘图中显著目标边框轮廓内的区域和预测热图中目标区域的交集,并将此交集作为待检测图像的目标区域输出。通过由前述网络结构构成的第一网络来提取显著目标边缘,能够准确的提取出目标的显著边缘特征;再通过基于语义分割的第二网络来提取目标区域,最后对两者进行融合,得到更准确的分割效果;由于边缘特征提取更加准确,再后面进行融合时得到的最终分割效果也更加精确。此处的思路与背景技术中提及的两篇专利文献中的方案类似,不同的是,这里采用的是我们前面述及的第一网络进行显著目标边缘轮廓的提取。
参阅图4,进一步地,为了进一步优化第一网络和第二网络,尽可能的增加这两个网络模型的关联性且减少网络模型的复杂程度,本发明中将第一网络和第二网络融合在一起,具体地,所述第二网络为U-Net网络,其包括编码器和解码器;编码器包括M个卷积池化层,其前N层构成第一网络的特征提取模块,且N<M,这个N一般取值为2-3,并且与编码器的层数成正比;第二网络训练时编码器前N层参数固定,这样可以更加快速的完成融合后网络模型的训练。
在训练时,第一数据集是人工标记的显著目标边缘轮廓图,并采用交叉熵损失来作为损失函数对第一网络进行优化。第二数据集是人工标记的屏幕热图,并采用focalloss损失来作为损失函数对第二网络进行优化微调,focal loss损失就是在交叉熵损失的基础上加一个权重系数来度量难分类和易分类样本对总损失的贡献。交叉熵损失和focalloss损失常用于分类问题中,是深度学习中应用最广泛的损失函数,因此这里不再对这两种损失函数的具体公式或计算细节做更多阐述。
参阅图5,本发明还公开了一种基于聚合边缘特征的图像语义分割系统,包括第一网络模块、第二网络模块以及图像处理模块;所述的第一网络模块中存储有训练好的第一网络用于对待检测图像进行处理得到预测的显著目标边缘图,该图中显著目标边框轮廓与背景区域相异;所述的第二网络模块中存储有训练好的第二网络用于对待检测图像进行处理得到预测热图,该图中目标区域与背景区域相异,第一网络按照前述的方法构建;图像处理模块用于计算预测的显著目标边缘图中显著目标边框轮廓内的区域和预测热图中目标区域的交集并将此交集作为待检测图像的目标区域输出。第一网络模块和第二网络模块分别用于实现第一网络和第二网络的处理功能,图像处理模块用于对两个网络模块输出的图像进行综合判断,从而可以得到更准确的目标区域。
本发明还公开了一种计算机可读存储介质和一种电子设备。其中,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前所述的基于聚合边缘特征的图像分割方法或基于聚合边缘特征的图像语义分割方法。一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时,实现如前所述的基于聚合边缘特征的图像分割方法或基于聚合边缘特征的图像语义分割方法。

Claims (9)

1.一种基于聚合边缘特征的图像分割方法,其特征在于:包括:
特征提取模块,用于提取图像的浅层特征得到不同尺度的浅层特征图
Figure DEST_PATH_IMAGE001
特征融合模块,用于对特征图
Figure 189732DEST_PATH_IMAGE001
进行特征融合得到特征图
Figure 124190DEST_PATH_IMAGE002
上采样模块,用于对特征图
Figure DEST_PATH_IMAGE003
进行卷积降维操作得到单通道特征图
Figure 304505DEST_PATH_IMAGE004
,并对单通道特征图
Figure 58834DEST_PATH_IMAGE004
进行上采样双线性插值处理得到与输入图尺寸相同的特征图
Figure DEST_PATH_IMAGE005
,其中
Figure 733529DEST_PATH_IMAGE006
显著目标边缘图生成模块,用于对特征图
Figure DEST_PATH_IMAGE007
进行相加,并对相加后的特征图进行可视化处理得到预测的显著目标边缘图;
所述的特征融合模块按如下步骤对特征图
Figure 788073DEST_PATH_IMAGE001
进行特征融合得到特征图
Figure 217917DEST_PATH_IMAGE002
包括:
对特征图
Figure 112405DEST_PATH_IMAGE008
进行卷积处理得到特征图
Figure DEST_PATH_IMAGE009
,特征图
Figure 325212DEST_PATH_IMAGE009
与特征图
Figure 968682DEST_PATH_IMAGE008
相比通道数减少但尺寸不变;
对特征图
Figure 835007DEST_PATH_IMAGE009
进行上采样双线性插值处理得到特征图
Figure 563929DEST_PATH_IMAGE010
,特征图
Figure 298536DEST_PATH_IMAGE010
与特征图
Figure 62092DEST_PATH_IMAGE009
相比通道数不变且尺寸与特征图
Figure DEST_PATH_IMAGE011
相同;
取特征图
Figure 240264DEST_PATH_IMAGE011
的部分通道与特征图
Figure 722061DEST_PATH_IMAGE010
进行叠加得到特征图
Figure 870145DEST_PATH_IMAGE012
,特征图
Figure 488208DEST_PATH_IMAGE012
和特征图
Figure 555390DEST_PATH_IMAGE011
通道数不变且尺寸相同;
对特征图
Figure 258904DEST_PATH_IMAGE012
进行卷积处理得到特征图
Figure DEST_PATH_IMAGE013
,特征图
Figure 617204DEST_PATH_IMAGE013
与特征图
Figure 89774DEST_PATH_IMAGE011
相比通道数减少但尺寸不变;
以此类推,得到特征图
Figure 468803DEST_PATH_IMAGE014
2.如权利要求1所述的基于聚合边缘特征的图像分割方法,其特征在于:所述的单通道特征图
Figure 49826DEST_PATH_IMAGE004
和特征图
Figure 539713DEST_PATH_IMAGE003
的尺寸相同,特征图
Figure 132368DEST_PATH_IMAGE005
通道数为1;对特征图
Figure 682298DEST_PATH_IMAGE007
进行相加即将N个特征图中相同位置的特征值相加,可视化处理包括:
对相加后的特征图进行归一化操作得到概率分布矩阵;
按照设定阈值对概率分布矩阵进行二值化处理即得到预测的显著目标边缘图。
3.一种基于聚合边缘特征的图像分割方法,其特征在于:包括如下步骤:
获取第一训练集;
按照权利要求1中的方法构建第一网络;
利用所述的第一训练集对所述的第一网络进行训练,训练完成后得到训练好的第一网络;
将待检测图像输入训练好的第一网络得到预测的显著目标边缘图,该图中显著目标边框轮廓与背景区域相异。
4.一种基于聚合边缘特征的图像语义分割方法,其特征在于:包括如下步骤:
获取第一训练集和第二训练集;
按照权利要求1中的方法构建第一网络,构建基于语义分割的第二网络;
利用所述的第一训练集对所述的第一网络进行训练,训练完成后得到训练好的第一网络;
利用所述的第二训练集对所述的第二网络进行训练,训练完成后得到训练好的第二网络;
将待检测图像分别输入训练好的第一网络、第二网络,得到预测的显著目标边缘图、预测热图,预测的显著目标边缘图中显著目标边框轮廓与背景区域相异,预测热图中目标区域与背景区域相异;
计算预测的显著目标边缘图中显著目标边框轮廓内的区域和预测热图中目标区域的交集,并将此交集作为待检测图像的目标区域输出。
5.如权利要求4所述的基于聚合边缘特征的图像语义分割方法,其特征在于:所述第二网络为U-Net网络,其包括编码器和解码器;编码器包括M个卷积池化层,其前N层构成第一网络的特征提取模块,且N<M;第二网络训练时编码器前N层参数固定。
6.如权利要求5所述的基于聚合边缘特征的图像语义分割方法,其特征在于:所述的第一网络训练时使用交叉熵损失进行优化,第二网络训练时使用focal loss损失进行优化微调。
7.一种基于聚合边缘特征的图像语义分割系统,其特征在于:包括第一网络模块、第二网络模块以及图像处理模块;所述的第一网络模块中存储有训练好的第一网络用于对待检测图像进行处理得到预测的显著目标边缘图,该图中显著目标边框轮廓与背景区域相异,第一网络按照权利要求1中的方法构建;所述的第二网络模块中存储有训练好的第二网络用于对待检测图像进行处理得到预测热图,该图中目标区域与背景区域相异;图像处理模块用于计算预测的显著目标边缘图中显著目标边框轮廓内的区域和预测热图中目标区域的交集并将此交集作为待检测图像的目标区域输出。
8.一种计算机可读存储介质,其特征在于:其上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-3中任一项所述的基于聚合边缘特征的图像分割方法或4-6中任一项所述的基于聚合边缘特征的图像语义分割方法。
9.一种电子设备,其特征在于:包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-3中任一项所述的基于聚合边缘特征的图像分割方法或4-6中任一项所述的基于聚合边缘特征的图像语义分割方法。
CN202210387576.2A 2022-04-14 2022-04-14 基于聚合边缘特征的图像语义分割方法及系统 Active CN114463187B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210387576.2A CN114463187B (zh) 2022-04-14 2022-04-14 基于聚合边缘特征的图像语义分割方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210387576.2A CN114463187B (zh) 2022-04-14 2022-04-14 基于聚合边缘特征的图像语义分割方法及系统

Publications (2)

Publication Number Publication Date
CN114463187A CN114463187A (zh) 2022-05-10
CN114463187B true CN114463187B (zh) 2022-06-17

Family

ID=81418488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210387576.2A Active CN114463187B (zh) 2022-04-14 2022-04-14 基于聚合边缘特征的图像语义分割方法及系统

Country Status (1)

Country Link
CN (1) CN114463187B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118657945A (zh) * 2024-08-19 2024-09-17 杭州汇萃智能科技有限公司 一种融合边缘特征细节的实时语义分割系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10402977B1 (en) * 2019-01-25 2019-09-03 StradVision, Inc. Learning method and learning device for improving segmentation performance in road obstacle detection required to satisfy level 4 and level 5 of autonomous vehicles using laplacian pyramid network and testing method and testing device using the same
CN112508973A (zh) * 2020-10-19 2021-03-16 杭州电子科技大学 一种基于深度学习的mri图像分割方法
CN112837218A (zh) * 2021-01-14 2021-05-25 中国科学院自动化研究所 基于双流边界感知的动脉瘤图像分析系统、方法和设备
CN113012150A (zh) * 2021-04-14 2021-06-22 南京农业大学 一种特征融合的高密度稻田无人机图像稻穗计数方法
CN113592894A (zh) * 2021-08-29 2021-11-02 浙江工业大学 一种基于边界框和同现特征预测的图像分割方法
CN113658200A (zh) * 2021-07-29 2021-11-16 东北大学 基于自适应特征融合的边缘感知图像语义分割方法
CN113869396A (zh) * 2021-09-26 2021-12-31 合肥高维数据技术有限公司 基于高效注意力机制的pc屏幕语义分割方法
CN114120125A (zh) * 2021-11-30 2022-03-01 中国地质大学(武汉) 基于双流深度网络的农田识别方法、装置及存储介质
CN114155375A (zh) * 2021-09-28 2022-03-08 中国科学院自动化研究所 机场道面病害检测的方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292330A (zh) * 2020-02-07 2020-06-16 北京工业大学 基于编解码器的图像语义分割方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10402977B1 (en) * 2019-01-25 2019-09-03 StradVision, Inc. Learning method and learning device for improving segmentation performance in road obstacle detection required to satisfy level 4 and level 5 of autonomous vehicles using laplacian pyramid network and testing method and testing device using the same
CN112508973A (zh) * 2020-10-19 2021-03-16 杭州电子科技大学 一种基于深度学习的mri图像分割方法
CN112837218A (zh) * 2021-01-14 2021-05-25 中国科学院自动化研究所 基于双流边界感知的动脉瘤图像分析系统、方法和设备
CN113012150A (zh) * 2021-04-14 2021-06-22 南京农业大学 一种特征融合的高密度稻田无人机图像稻穗计数方法
CN113658200A (zh) * 2021-07-29 2021-11-16 东北大学 基于自适应特征融合的边缘感知图像语义分割方法
CN113592894A (zh) * 2021-08-29 2021-11-02 浙江工业大学 一种基于边界框和同现特征预测的图像分割方法
CN113869396A (zh) * 2021-09-26 2021-12-31 合肥高维数据技术有限公司 基于高效注意力机制的pc屏幕语义分割方法
CN114155375A (zh) * 2021-09-28 2022-03-08 中国科学院自动化研究所 机场道面病害检测的方法、装置、电子设备及存储介质
CN114120125A (zh) * 2021-11-30 2022-03-01 中国地质大学(武汉) 基于双流深度网络的农田识别方法、装置及存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
MDCC-Net: Multiscale double-channel convolution U-Net framework for colorectal tumor segmentation;Suichang Zheng等;《Computers in Biology and Medicine》;20211231;第1-8页 *
Region-to-boundary deep learning model with multi-scale feature fusion for medical image segmentation;xiaowei Liu;《Biomedical Signal Processing and Control》;20210917;第1-10页 *
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Scene Segmentation;Vijay Badrinarayanan等;《IEEE Transactions on Pattern Analysis and Machine Intelligence》;20171231;第1-14页 *
UCTransNet: Rethinking the Skip Connections in U-Net from a Channel-wise Perspective with Transformer;HaonanWang;《arXiv:2109.04335v3》;20220125;第1-9页 *
U-Net: Convolutional Networks for Biomedical Image Segmentation;Olaf Ronneberger,等;《arXiv:1505.04597v1》;20150518;第1-8页 *
基于深度学习的语义分割综述;杨洁洁等;《长江信息通信》;20220228;第69-72页 *

Also Published As

Publication number Publication date
CN114463187A (zh) 2022-05-10

Similar Documents

Publication Publication Date Title
CN111325751B (zh) 基于注意力卷积神经网络的ct图像分割系统
CN111050219B (zh) 用于利用空间-时间记忆网络处理视频内容的方法和系统
CN109190752B (zh) 基于深度学习的全局特征和局部特征的图像语义分割方法
CN111768415A (zh) 一种无量化池化的图像实例分割方法
CN110866938A (zh) 一种全自动视频运动目标分割方法
Wang et al. TF-SOD: a novel transformer framework for salient object detection
Yu et al. Progressive refined redistribution pyramid network for defect detection in complex scenarios
CN118096799B (zh) 一种混合弱监督的晶圆sem缺陷分割方法和系统
CN115035172B (zh) 基于置信度分级及级间融合增强的深度估计方法及系统
Liu et al. Asflow: Unsupervised optical flow learning with adaptive pyramid sampling
CN114463187B (zh) 基于聚合边缘特征的图像语义分割方法及系统
CN117557779A (zh) 一种基于yolo的多尺度目标检测方法
Ning et al. Trap attention: Monocular depth estimation with manual traps
Wang et al. Global contextual guided residual attention network for salient object detection
CN113657225B (zh) 一种目标检测方法
CN114494272A (zh) 一种基于深度学习的金属零件快速分割方法
CN117437423A (zh) 基于sam协同学习和跨层特征聚合增强的弱监督医学图像分割方法及装置
CN110942463B (zh) 一种基于生成对抗网络的视频目标分割方法
Huang et al. DeeptransMap: a considerably deep transmission estimation network for single image dehazing
Xiu et al. Double discriminative face super-resolution network with facial landmark heatmaps
Li et al. A review of advances in image inpainting research
CN112052863B (zh) 一种图像检测方法及装置、计算机存储介质、电子设备
Kim et al. Tackling Structural Hallucination in Image Translation with Local Diffusion
Zhao et al. Defocus blur detection via adaptive cross-level feature fusion and refinement
CN112529081A (zh) 基于高效注意力校准的实时语义分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant