CN108062756B - 基于深度全卷积网络和条件随机场的图像语义分割方法 - Google Patents

基于深度全卷积网络和条件随机场的图像语义分割方法 Download PDF

Info

Publication number
CN108062756B
CN108062756B CN201810085381.6A CN201810085381A CN108062756B CN 108062756 B CN108062756 B CN 108062756B CN 201810085381 A CN201810085381 A CN 201810085381A CN 108062756 B CN108062756 B CN 108062756B
Authority
CN
China
Prior art keywords
convolution
pixel
layer
semantic segmentation
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810085381.6A
Other languages
English (en)
Other versions
CN108062756A (zh
Inventor
崔少国
王勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Technology
Original Assignee
Chongqing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Technology filed Critical Chongqing University of Technology
Priority to CN201810085381.6A priority Critical patent/CN108062756B/zh
Publication of CN108062756A publication Critical patent/CN108062756A/zh
Application granted granted Critical
Publication of CN108062756B publication Critical patent/CN108062756B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Abstract

本发明提供一种基于深度全卷积网络和条件随机场的图像语义分割方法,包括步骤:深度全卷积语义分割网络模型搭建,基于全连接条件随机场的像素标签结构化预测,模型训练与参数学习和图像语义分割。本申请在深度全卷积网络中引入膨胀卷积和空间金字塔池化模块,并对深度全卷积网络输出的标签预测图使用条件随机场进一步修正,膨胀卷积扩大感受野的同时确保特征图分辨率不变,空间金字塔池化模块从卷积局部特征图提取不同尺度区域上下文特征,为标签预测提供不同对象之间相互关系及对象与不同尺度区域特征之间联系,全连接条件随机场根据像素强度和位置的特征相似性对像素标签进一步优化,从而产生分辨率高、边界精确、空间连续性好的语义分割图。

Description

基于深度全卷积网络和条件随机场的图像语义分割方法
技术领域
本发明涉及图像理解技术领域,具体涉及一种基于深度全卷积网络和条件随机场的图像语义分割方法。
背景技术
图像语义分割是根据像素的语义对图像像素进行标注形成不同分割区域。语义分割是图像理解的基石性技术,在自动驾驶系统的街景识别与理解、无人机着陆点判断、医学图像的病灶识别与定位中具有举足轻重的作用。
深度学习技术的出现,使图像语义分割性能较之传统方法有了显著提升。使用深度卷积神经网络在大数据集上进行有监督学习是当前图像语义分割的主流方法。输入待分割图像,采用连续的卷积和下采样操作来逐级提取图像特征,然后利用最后特征对图像像素进行分类。然而,基于深度学习技术的图像语义分割方法中连续的卷积和下采样操作将使特征图不断减小,位置细节信息不断丢失,从而导致分割图分辨率较低,分割边界定位困难,分割图粗糙。另外,在基于深度卷积网络的像素分类方法中,各像素类别标签的预测是独立进行,缺少先验知识和结构约束,不鼓励特征相似像素产生相同的分类标签,易产生孤立的误分类区域。另外,当语义分割的类别较多时,由于对象与对像之间、对象与背景之间缺少上下文关系,外观相似的对象在分类时极易产生混淆,当对象尺寸较小时很难发现,对象尺寸较大时可能超出感受野导致预测不连续。
发明内容
针对现有方法存在的问题,本发明提供一种基于深度全卷积网络和条件随机场的图像语义分割方法,该方法在深度全卷积网络中引入膨胀卷积和空间金字塔池化模块,并对深度全卷积网络输出的标签预测图使用条件随机场进一步修正;膨胀卷积扩大感受野的同时确保特征图分辨率不变;空间金字塔池化模块从卷积局部特征图提取不同尺度区域上下文特征,为标签预测提供不同对象之间相互关系及对象与不同尺度区域特征之间联系;全连接条件随机场根据像素强度和位置的特征相似性对像素标签进一步优化,从而产生分辨率高、边界精确、空间连续性好的语义分割图。
为了解决上述技术问题,本发明采用了如下的技术方案:
一种基于深度全卷积网络和条件随机场的图像语义分割方法,包括以下步骤:
S1、深度全卷积语义分割网络模型搭建:
S11、深度全卷积语义分割网络模型包括特征提取模块、金字塔池化模块和像素标签预测模块,所述特征提取模块通过对输入图像进行卷积、最大池化和膨胀卷积操作,提取图像局部特征;所述金字塔池化模块对卷积局部特征进行不同尺度空间池化,提取不同尺度区域上下文特征;所述像素标签预测模块利用卷积局部特征,结合不同尺度区域上下文特征来对像素类别进行预测;
S12、所述特征提取模块包括第一至第五卷积层组、第一至第三最大池化层、第一膨胀卷积层和第二膨胀卷积层,所述第一最大池化层位于第一卷积层组之后,所述第二最大池化层位于第二卷积层组之后,所述第三最大池化层位于第三卷积层组之后,所述第一膨胀卷积层位于第四卷积层组之后,所述第二膨胀卷积层位于第五卷积层组之后;所述金字塔池化模块先对第二膨胀卷积层输出的卷积局部特征采用N种不同容器尺寸进行N级平均池化,得到N种不同尺度低分辨率区域上下文特征,再对这N种不同尺度区域上下文特征分别进行卷积,输出通道数为原始特征通道的1/N,然后将N种不同尺度低分辨率区域上下文特征进行上采样到原始特征图尺寸大小;所述像素标签预测模块包括顺序设置的第一特征投影层、第二特征投影层、类别预测层和Softmax概率转换层,所述像素标签预测模块先将卷积局部特征和上采样后的N种不同尺度区域上下文特征进行连接融合,使用融合后特征对像素类别标签进行预测,再使用Softmax概率转换层将像素类别标签预测分值转换成像素类别标签预测概率分布;
S2、基于全连接条件随机场的像素标签结构化预测:采用全连接条件随机场对深度全卷积语义分割网络输出的像素类别标签进行后处理,移除误分类的孤立像素点或区域,优化复杂对象边界附近像素标签,使输出的分割图具有好的空间一致性和精确边界,其具体包括:
S21、使用全连接条件随机场来建模任意两像素标签变量概率之间的相互关系;
S22、全连接条件随机场模型采用以下吉布斯能量函数:
Figure GDA0002243423490000031
其中,x是像素类别标签变量,xi和xj分别是第i和第j个像素对应的标签,ψu是一元势函数,ψp是成对势函数;
S23、采用平均场近似概率迭代推理算法计算像素类别标签概率,输出优化后的像素类别标签预测概率分布图;
S3、模型训练与参数学习:
S31、采用Xavier方法对分割网络模型参数进行初始化;
S32、将训练数据进行扩充后按5:1:1分成训练集、验证集和测试集,采用六折交叉验证法来训练分割网络模型;
S33、将待分割图像的RGB作为3个通道输入深度全卷积语义分割网络,产生像素类别标签预测概率分布,利用标签预测概率和分割标签计算预测损失,具体采用分类交叉熵损失函数作为目标函数,定义如下:
Figure GDA0002243423490000041
其中,Y'是分割标签概率向量,Y是标签预测概率向量,C是像素类别数,S是图像像素的个数,log(.)是求自然对数,B是批大小;
S34、采用随机梯度下降算法优化目标函数,运用误差反向传播算法更新深度全卷积语义分割网络模型参数,具体优化过程如下:
Figure GDA0002243423490000042
mt1=μ*mt1-1t1gt1
θt1=θt1-1+mt1
其中,下标t1是迭代次数,θ是网络模型参数,L(θt1-1)是当使用θt1-1为网络参数时的损失函数,gt1、mt1、μ分别是梯度、动量和动量系数,η是学习率;
S4、图像语义分割:
S41、将待分割图像的RGB作为3个通道输入深度全卷积语义分割网络,进行前向计算;
S42、特征提取模块通过卷积、最大池化和膨胀卷积操作,输出图像的卷积局部特征图;
S43、将卷积局部特征图输入金字塔池化模块,产生不同尺度区域上下文特征图;
S44、将卷积局部特征图和不同尺度区域上下文特征图进行连接,输入像素标签预测模块;
S45、像素标签预测模块先对卷积局部特征和不同尺度区域上下文特征进行卷积融合,然后利用融合特征对像素类别进行预测,输出像素类别标签预测概率分布图;
S46、将深度全卷积语义分割网络输出的像素类别标签预测概率分布图输入全连接条件随机场,根据像素间强度和位置特征相似性对像素类别标签预测概率分布进行优化,输出结构化后的像素类别标签预测概率分布图;
S47、取每个像素概率分布向量中最大概率所在分量的下标作为像素类别标签,得到图像最终语义分割图。
进一步,所述步骤S12中,每个卷积层组由两个卷积层组成,每个卷积层的卷积核大小为3×3、步长为1,所述第一至第五卷积层组的卷积核个数依次为64、128、256、512、1024;每个最大池化层的池化核大小为2×2、步长为2;每个膨胀卷积层的卷积核大小为3×3、步长为1,所述第一膨胀卷积层和第二膨胀卷积层的膨胀因子分别为2和4;所述金字塔池化模块中金字塔池化级数为4,4级平均池化的容器尺寸分别为1×1、2×2、4×4、8×8,每级的卷积核大小为1×1、步长为1,每级的卷积核个数均为256;每个特征投影层的卷积核大小为1×1、步长为1,所述第一特征投影层和第二特征投影层的卷积核个数分别为1024和512;所述类别预测层的卷积核大小为1×1、步长为1,卷积核个数为32。
进一步,所述步骤S12中,第一膨胀卷积层和第二膨胀卷积层的膨胀卷积采用如下公式计算:
Figure GDA0002243423490000051
其中,(i,j)是第i行j列,W是卷积核,X是输入通道,Z是卷积输出图像,(M,N)是卷积核维数,
Figure GDA0002243423490000052
是卷积操作,r是膨胀因子。
进一步,所述膨胀卷积中任意一个膨胀卷积核所对应的输出特征图Zt2采用下式进行计算:
Figure GDA0002243423490000053
其中,t2是膨胀卷积核序号,K是输入通道数。
进一步,所述步骤S12中,还包括将卷积层、膨胀卷积层和特征投影层产生的输出特征图进行批标准化操作。
进一步,所述深度全卷积语义分割网络中采用LReLU函数作为激活函数,用于将批标准化后特征图中的每个值进行非线性转化,所述LReLU函数定义如下:
f(z)=max(0,z)+αmin(0,z)
其中,f(z)是非线性激励单元函数,max(.)函数是求最大值,min(.)函数是求最小值,z是一个输入值,α是Leaky参数。
进一步,所述步骤S12中,Softmax函数定义如下:
Figure GDA0002243423490000061
其中,Oi是某个像素在第i类上的预测分值,Yi是某个像素在第i类上的预测概率,C是像素类别个数,exp(.)是以自然常数e为底的指数函数。
进一步,所述步骤S22中,一元势函数ψu定义如下:
ψu(xi)=-logP(xi)
其中,P(xi)是深度全卷积语义分割网络输出的第i个像素的类别标签预测概率,log(.)是求自然对数;
成对势函数ψp定义如下:
Figure GDA0002243423490000062
其中,
Figure GDA0002243423490000063
是外观高斯核,
Figure GDA0002243423490000064
是平滑高斯核,μ(xi,xj)是标签兼容性函数,μ(xi,xj)=[xi≠xj],pi和pj是第i和第j个像素对应的位置,Ii和Ij是第i和第j个像素对应的强度,σα、σβ和σγ是高斯核参数,ω1和ω2是两个高斯核的相对强度。
进一步,所述步骤S33中,在损失函数中加入有L1和L2正则化项,得最终目标函数如下:
Figure GDA0002243423490000065
其中,λ1和λ2分别是L1和L2正则化因子,θi是分割网络参数,Q是θi的参数个数。
进一步,所述步骤S34中引入有学习率线性衰减,且学习率按如下规律进行衰减:
Figure GDA0002243423490000071
其中,ηt1是第t1次迭代使用的学习率,η0是开始学习率,ητ是最终学习率,τ是总迭代次数。
与现有技术相比,本发明提供的基于深度全卷积网络和条件随机场的图像语义分割方法具有以下优点:
1、采用膨胀卷积,在扩大神经元感受野的同时不会降低特征图的维数,提高了特征图分辨率,从而使最终分割图有高的分辨率;
2、金字塔池化模块从卷积局部特征图中提取不同尺度区域上下文特征,这些特征作为先验知识与深度全卷积网络产生的局部特征一起共同对像素类别进行预测,相当于在像素预测时充分考虑了不同对象之间的关系及对象和背景之间的相互联系,可显著降低像素类别预测错误率;
3、全连接条件随机场利用像素强度和像素位置特征,鼓励位置相近、特征相似的像素分配相同标签,可移除孤立分割区域,使分割图具有好的外观和空间一致性;
4、多级金字塔池化技术和全连接条件随机场相结合,可分割出复杂对象的细粒度边界,使语义分割图区域边界更加精确;
5、可实现较小尺寸对象的分割,当大尺寸对象超过感受野时也可产生连续的标签预测。
附图说明
图1是本发明提供的基于深度全卷积网络和条件随机场的图像语义分割方法流程示意图。
图2是本发明提供的特征提取网络结构示意图。
图3是本发明提供的基于多级金字塔池化的多尺度区域特征提取模块示意图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示和较佳实施例,进一步阐述本发明。
请参考图1至图3所示,本发明提供一种基于深度全卷积网络和条件随机场的图像语义分割方法,包括以下步骤:
S1、深度全卷积语义分割网络模型搭建:
S11、深度全卷积语义分割网络模型包括特征提取模块、金字塔池化模块和像素标签预测模块,所述特征提取模块通过对输入图像进行卷积、最大池化和膨胀卷积操作,提取图像局部特征;所述金字塔池化模块对卷积局部特征进行不同尺度空间池化,提取不同尺度区域上下文特征;所述像素标签预测模块利用卷积局部特征,结合不同尺度区域上下文特征来对像素类别进行预测;
S12、所述特征提取模块包括第一至第五卷积层组、第一至第三最大池化层、第一膨胀卷积层和第二膨胀卷积层,所述第一最大池化层位于第一卷积层组之后,所述第二最大池化层位于第二卷积层组之后,所述第三最大池化层位于第三卷积层组之后,所述第一膨胀卷积层位于第四卷积层组之后,所述第二膨胀卷积层位于第五卷积层组之后,即在每个卷积层组之后跟一个最大池化层或膨胀卷积层,且为了保证卷积后特征图大小与卷积前相同,在卷积过程中设置Padding=1,即卷积时用0值填充图像周围;所述金字塔池化模块先对第二膨胀卷积层输出的卷积局部特征采用N种不同容器尺寸(bin size)进行N级平均池化,得到N种不同尺度低分辨率区域上下文特征,再对这N种不同尺度区域上下文特征分别进行卷积,输出通道数为原始特征通道的1/N,然后将N种不同尺度区域上下文特征进行上采样到原始特征图尺寸大小;所述像素标签预测模块包括顺序设置的第一特征投影层、第二特征投影层、类别预测层和Softmax概率转换层,所述像素标签预测模块先将卷积局部特征和上采样后的N种不同尺度区域上下文特征进行连接融合,使用融合后特征对像素类别标签进行预测,再使用Softmax概率转换层将像素类别标签预测分值转换成像素类别标签预测概率分布。
作为具体实施例,所述深度全卷积语义分割网络模型的详细结构见下表1,表1中是以480×480的输入图像为例进行说明,当然输入图像的尺寸也可以是其他任意大小:
表1深度全卷积语义分割网络模型参数表(Padding=1)
Figure GDA0002243423490000091
从表1可以得出,所述步骤S12中,每个卷积层组由两个卷积层组成,每个卷积层的卷积核大小为3×3、步长为1,所述第一至第五卷积层组的卷积核个数依次为64、128、256、512、1024;每个最大池化层的池化核大小为2×2、步长为2;每个膨胀卷积层的卷积核大小为3×3、步长为1,所述第一膨胀卷积层和第二膨胀卷积层的膨胀因子分别为2和4;所述金字塔池化模块中金字塔池化级数为4,4级平均池化的容器尺寸分别为1×1、2×2、4×4、8×8,通过4级平均池化即可将原始特征图平均进行1、4、16和64等份,在每等份中求取平均值代替原始特征值,得到4种区域上下文特征,对每级使用大小为1×1、步长为1、个数均为256的卷积核进行卷积,然后上采样到原始特征图尺寸大小,最后通过像素标签预测模块将卷积局部特征和上采样后的4种不同尺度区域上下文特征进行连接(Concatenation)融合;每个特征投影层的卷积核大小为1×1、步长为1,所述第一特征投影层和第二特征投影层的卷积核个数分别为1024和512;所述类别预测层的卷积核大小为1×1、步长为1,卷积核个数为32,32表示像素语义标签输出的类别数。当然,所述金字塔池化级数、各级容器尺寸及像素语义标签输出的类别数并不局限于前述参数设置,也可以根据实际情况进行确定。
作为具体实施例,所述深度全卷积语义分割网络模型的计算操作包括:
(1)膨胀卷积:
膨胀卷积(Dilated Convolution),就是将卷积核进行上采样(膨胀),卷积核原位置权值不变而中间位置补0,膨胀卷积可通过采用不同膨胀因子来提高感受野,获取不同尺度的区域上下文特征,但不会增加网络参数和计算量,与最大池化操作相比,则不会导致特征图分辨率下降。具体地,所述步骤S12中,第一膨胀卷积层和第二膨胀卷积层的膨胀卷积采用如下公式计算:
Figure GDA0002243423490000101
其中,(i,j)是第i行j列,W是卷积核,X是输入通道,Z是卷积输出图像,(M,N)是卷积核维数,
Figure GDA0002243423490000102
是卷积操作,r是膨胀因子,r=1时相当于普通卷积。
其中,所述膨胀卷积中任意一个膨胀卷积核所对应的输出特征图Zt2采用下式进行计算:
Figure GDA0002243423490000111
其中,t2是膨胀卷积核序号,K是输入通道数。
(2)批标准化:
为了让每一层输入有一个稳定的分布,使激活函数分布在线性区间,产生更大的梯度来加速收敛,所述步骤S12中,还包括将卷积层、膨胀卷积层和特征投影层产生的输出特征图进行批标准化(Batch Normalization,BN)操作,即将卷积和膨胀卷积产生的输出图像进行规范化,减去平均值,再除以标准差。
(3)非线性激励LReLU:
所述深度全卷积语义分割网络中采用LReLU(Leaky Rectifier Linear Units)函数作为激活函数,用于将批标准化后特征图中的每个值进行非线性转化,所述LReLU函数定义如下:
f(z)=max(0,z)+αmin(0,z) (3)
其中,f(z)是非线性激励单元函数,max(.)函数是求最大值,min(.)函数是求最小值,z是一个输入值,α是Leaky参数,α=0.3。
(4)分类函数Softmax:
Softmax函数用于将分割网络输出的像素类别标签预测分值转换成像素类别标签预测概率分布,所用Softmax函数定义如下:
Figure GDA0002243423490000112
其中,Oi是某个像素在第i类上的预测分值,Yi是某个像素在第i类上的预测概率,C是像素类别个数,C=32,exp(.)是以自然常数e为底的指数函数。
S2、基于全连接条件随机场的像素标签结构化预测:采用全连接条件随机场对深度全卷积语义分割网络输出的像素类别标签进行后处理,移除误分类的孤立像素点或区域,优化复杂对象边界附近像素标签,使输出的分割图具有好的空间一致性和精确边界,其具体包括:
S21、使用全连接条件随机场来建模任意两像素标签变量概率之间的相互关系,具体可使用本领域熟知的概率无向图模型建模像素类别标签预测概率;
S22、全连接条件随机场模型采用以下吉布斯(Gibbs)能量函数:
Figure GDA0002243423490000121
其中,x是像素类别标签变量,xi和xj分别是第i和第j个像素对应的标签,ψu是一元势函数,ψp是成对势函数;
在吉布斯能量函数中,ψu是一元势函数,定义如下:
ψu(xi)=-logP(xi) (6)
其中,P(xi)是深度全卷积语义分割网络输出的第i个像素的类别标签预测概率,log(.)是求自然对数;
在吉布斯能量函数中,ψp是成对势函数,定义如下:
Figure GDA0002243423490000122
其中,
Figure GDA0002243423490000123
是外观高斯核,
Figure GDA0002243423490000124
是平滑高斯核,μ(xi,xj)是标签兼容性函数,μ(xi,xj)=[xi≠xj],pi和pj是第i和第j个像素对应的位置,Ii和Ij是第i和第j个像素对应的强度(或RGB颜色值),σα、σβ和σγ是高斯核参数,ω1和ω2是两个高斯核的相对强度;外观高斯核与像素位置及强度有关,迫使位置相近和强度相似的像素分配相同的标签;平滑高斯核仅与像素位置有关,平滑局部像素边界并移除异常分类点或区域;标签兼容性函数的作用是仅对第i和第j个像素取不同标签时进行惩罚;具体可采用本领域熟知的网格搜索法来获取ω1、σα和σβ三个参数,取ω2=1,σγ=1;
S23、采用本领域熟知的平均场近似概率迭代推理算法计算像素类别标签概率,输出优化后的像素类别标签预测概率分布图。
S3、模型训练与参数学习:
S31、采用Xavier方法对分割网络模型参数进行初始化;
S32、获取训练数据样本,使用水平翻转、垂直翻转、放大后裁减、旋转45°、旋转90°、旋转135°、旋转180°、旋转225°、旋转270°、旋转315°数据增强技术来扩充训练数据样本,使训练数据样本增加为初始的10倍,然后将这些训练数据按5:1:1分成训练集、验证集和测试集,采用六折交叉验证法来训练分割网络模型;
S33、将待分割图像的RGB作为3个通道输入深度全卷积语义分割网络,产生像素类别标签预测概率分布,利用标签预测概率和分割标签计算预测损失,具体采用分类交叉熵损失函数作为目标函数,定义如下:
Figure GDA0002243423490000131
其中,Y'是分割标签概率向量,Y是标签预测概率向量,C是像素类别数,S是图像像素的个数,log(.)是求自然对数,B是批大小(Batch Size)即随机梯度下降迭代时每次迭代使用的样本数,设C=32,S=480×480=230400,B=16;
为了防止过拟合,在式(8)所示的损失函数中加入有L1和L2正则化项,得最终目标函数如下:
Figure GDA0002243423490000132
其中,λ1和λ2分别是L1和L2正则化因子,均设为0.1,θi是分割网络参数,Q是θi的参数个数;
S34、采用随机梯度下降算法优化目标函数,运用误差反向传播算法更新深度全卷积语义分割网络模型参数,具体优化过程如下:
Figure GDA0002243423490000133
mt1=μ*mt1-1t1gt1 (11)
θt1=θt1-1+mt1 (12)
其中,下标t1是迭代次数,θ是网络模型参数,L(θt1-1)是当使用θt1-1为网络参数时的损失函数,gt1、mt1、μ分别是梯度、动量和动量系数,η是学习率;设μ=0.9,初始学习率设为1e-3
为了抑制随机梯度下降带来的梯度噪声,确保模型收敛,所述步骤S34中引入有学习率线性衰减,且学习率按如下规律进行衰减:
Figure GDA0002243423490000141
其中,ηt1是第t1次迭代使用的学习率,η0是开始学习率,ητ是最终学习率,τ是总迭代次数,设ητ=η0/1000,τ=100000。
S4、图像语义分割:
S41、将待分割图像的RGB作为3个通道输入深度全卷积语义分割网络,进行前向计算;
S42、特征提取模块通过卷积、最大池化和膨胀卷积操作,输出图像的卷积局部特征图;
S43、将卷积局部特征图输入金字塔池化模块,产生不同尺度区域上下文特征图;
S44、将卷积局部特征图和不同尺度区域上下文特征图进行连接,输入像素标签预测模块;
S45、像素标签预测模块先对卷积局部特征和不同尺度区域上下文特征进行卷积融合,然后利用融合特征对像素类别进行预测,输出像素类别标签预测概率分布图;
S46、将深度全卷积语义分割网络输出的像素类别标签预测概率分布图输入全连接条件随机场,根据像素间强度和位置特征相似性对像素类别标签预测概率分布进行优化,输出结构化后的像素类别标签预测概率分布图;
S47、取每个像素概率分布向量中最大概率所在分量的下标作为像素类别标签,得到图像最终语义分割图。
与现有技术相比,本发明提供的基于深度全卷积网络和条件随机场的图像语义分割方法具有以下优点:
1、采用膨胀卷积,在扩大神经元感受野的同时不会降低特征图的维数,提高了特征图分辨率,从而使最终分割图有高的分辨率;
2、金字塔池化模块从卷积局部特征图中提取不同尺度区域上下文特征,这些特征作为先验知识与深度全卷积网络产生的局部特征一起共同对像素类别进行预测,相当于在像素预测时充分考虑了不同对象之间的关系及对象和背景之间的相互联系,可显著降低像素类别预测错误率;
3、全连接条件随机场利用像素强度和像素位置特征,鼓励位置相近、特征相似的像素分配相同标签,可移除孤立分割区域,使分割图具有好的外观和空间一致性;
4、多级金字塔池化技术和全连接条件随机场相结合,可分割出复杂对象的细粒度边界,使语义分割图区域边界更加精确;
5、可实现较小尺寸对象的分割,当大尺寸对象超过感受野时也可产生连续的标签预测。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.基于深度全卷积网络和条件随机场的图像语义分割方法,其特征在于,包括以下步骤:
S1、深度全卷积语义分割网络模型搭建:
S11、深度全卷积语义分割网络模型包括特征提取模块、金字塔池化模块和像素标签预测模块,所述特征提取模块通过对输入图像进行卷积、最大池化和膨胀卷积操作,提取图像局部特征;所述金字塔池化模块对卷积局部特征进行不同尺度空间池化,提取不同尺度区域上下文特征;所述像素标签预测模块利用卷积局部特征,结合不同尺度区域上下文特征来对像素类别进行预测;
S12、所述特征提取模块包括第一至第五卷积层组、第一至第三最大池化层、第一膨胀卷积层和第二膨胀卷积层,所述第一最大池化层位于第一卷积层组之后,所述第二最大池化层位于第二卷积层组之后,所述第三最大池化层位于第三卷积层组之后,所述第一膨胀卷积层位于第四卷积层组之后,所述第二膨胀卷积层位于第五卷积层组之后;所述金字塔池化模块先对第二膨胀卷积层输出的卷积局部特征采用N种不同容器尺寸进行N级平均池化,得到N种不同尺度低分辨率区域上下文特征,再对这N种不同尺度区域上下文特征分别进行卷积,输出通道数为原始特征通道的1/N,然后将N种不同尺度低分辨率区域上下文特征进行上采样到原始特征图尺寸大小;所述像素标签预测模块包括顺序设置的第一特征投影层、第二特征投影层、类别预测层和Softmax概率转换层,所述像素标签预测模块先将卷积局部特征和上采样后的N种不同尺度区域上下文特征进行连接融合,使用融合后特征对像素类别标签进行预测,再使用Softmax概率转换层将像素类别标签预测分值转换成像素类别标签预测概率分布;
S2、基于全连接条件随机场的像素标签结构化预测:采用全连接条件随机场对深度全卷积语义分割网络输出的像素类别标签进行后处理,移除误分类的孤立像素点或区域,优化复杂对象边界附近像素标签,使输出的分割图具有好的空间一致性和精确边界,其具体包括:
S21、使用全连接条件随机场来建模任意两像素标签变量概率之间的相互关系;
S22、全连接条件随机场模型采用以下吉布斯能量函数:
Figure FDA0002243423480000021
其中,x是像素类别标签变量,xi和xj分别是第i和第j个像素对应的标签,ψu是一元势函数,ψp是成对势函数;
S23、采用平均场近似概率迭代推理算法计算像素类别标签概率,输出优化后的像素类别标签预测概率分布图;
S3、模型训练与参数学习:
S31、采用Xavier方法对分割网络模型参数进行初始化;
S32、将训练数据进行扩充后按5:1:1分成训练集、验证集和测试集,采用六折交叉验证法来训练分割网络模型;
S33、将待分割图像的RGB作为3个通道输入深度全卷积语义分割网络,产生像素类别标签预测概率分布,利用标签预测概率和分割标签计算预测损失,具体采用分类交叉熵损失函数作为目标函数,定义如下:
Figure FDA0002243423480000022
其中,Y'是分割标签概率向量,Y是标签预测概率向量,C是像素类别数,S是图像像素的个数,log(.)是求自然对数,B是批大小;
S34、采用随机梯度下降算法优化目标函数,运用误差反向传播算法更新深度全卷积语义分割网络模型参数,具体优化过程如下:
Figure FDA0002243423480000023
mt1=μ*mt1-1t1gt1
θt1=θt1-1+mt1
其中,下标t1是迭代次数,θ是网络模型参数,L(θt1-1)是当使用θt1-1为网络参数时的损失函数,gt1、mt1、μ分别是梯度、动量和动量系数,η是学习率;
S4、图像语义分割:
S41、将待分割图像的RGB作为3个通道输入深度全卷积语义分割网络,进行前向计算;
S42、特征提取模块通过卷积、最大池化和膨胀卷积操作,输出图像的卷积局部特征图;
S43、将卷积局部特征图输入金字塔池化模块,产生不同尺度区域上下文特征图;
S44、将卷积局部特征图和不同尺度区域上下文特征图进行连接,输入像素标签预测模块;
S45、像素标签预测模块先对卷积局部特征和不同尺度区域上下文特征进行卷积融合,然后利用融合特征对像素类别进行预测,输出像素类别标签预测概率分布图;
S46、将深度全卷积语义分割网络输出的像素类别标签预测概率分布图输入全连接条件随机场,根据像素间强度和位置特征相似性对像素类别标签预测概率分布进行优化,输出结构化后的像素类别标签预测概率分布图;
S47、取每个像素概率分布向量中最大概率所在分量的下标作为像素类别标签,得到图像最终语义分割图。
2.根据权利要求1所述的基于深度全卷积网络和条件随机场的图像语义分割方法,其特征在于,所述步骤S12中,每个卷积层组由两个卷积层组成,每个卷积层的卷积核大小为3×3、步长为1,所述第一至第五卷积层组的卷积核个数依次为64、128、256、512、1024;每个最大池化层的池化核大小为2×2、步长为2;每个膨胀卷积层的卷积核大小为3×3、步长为1,所述第一膨胀卷积层和第二膨胀卷积层的膨胀因子分别为2和4;所述金字塔池化模块中金字塔池化级数为4,4级平均池化的容器尺寸分别为1×1、2×2、4×4、8×8,每级的卷积核大小为1×1、步长为1,每级的卷积核个数均为256;每个特征投影层的卷积核大小为1×1、步长为1,所述第一特征投影层和第二特征投影层的卷积核个数分别为1024和512;所述类别预测层的卷积核大小为1×1、步长为1,卷积核个数为32。
3.根据权利要求1所述的基于深度全卷积网络和条件随机场的图像语义分割方法,其特征在于,所述步骤S12中,第一膨胀卷积层和第二膨胀卷积层的膨胀卷积采用如下公式计算:
Figure FDA0002243423480000041
其中,(i,j)是第i行j列,W是卷积核,X是输入通道,Z是卷积输出图像,(M,N)是卷积核维数,
Figure FDA0002243423480000042
是卷积操作,r是膨胀因子。
4.根据权利要求3所述的基于深度全卷积网络和条件随机场的图像语义分割方法,其特征在于,所述膨胀卷积中任意一个膨胀卷积核所对应的输出特征图Zt2采用下式进行计算:
Figure FDA0002243423480000043
其中,t2是膨胀卷积核序号,K是输入通道数。
5.根据权利要求1所述的基于深度全卷积网络和条件随机场的图像语义分割方法,其特征在于,所述步骤S12中,还包括将卷积层、膨胀卷积层和特征投影层产生的输出特征图进行批标准化操作。
6.根据权利要求5所述的基于深度全卷积网络和条件随机场的图像语义分割方法,其特征在于,所述深度全卷积语义分割网络中采用LReLU函数作为激活函数,用于将批标准化后特征图中的每个值进行非线性转化,所述LReLU函数定义如下:
f(z)=max(0,z)+αmin(0,z)
其中,f(z)是非线性激励单元函数,max(.)函数是求最大值,min(.)函数是求最小值,z是一个输入值,α是Leaky参数。
7.根据权利要求1所述的基于深度全卷积网络和条件随机场的图像语义分割方法,其特征在于,所述步骤S12中,Softmax函数定义如下:
Figure FDA0002243423480000051
其中,Oi是某个像素在第i类上的预测分值,Yi是某个像素在第i类上的预测概率,C是像素类别个数,exp(.)是以自然常数e为底的指数函数。
8.根据权利要求1所述的基于深度全卷积网络和条件随机场的图像语义分割方法,其特征在于,所述步骤S22中,一元势函数ψu定义如下:
ψu(xi)=-logP(xi)
其中,P(xi)是深度全卷积语义分割网络输出的第i个像素的类别标签预测概率,log(.)是求自然对数;
成对势函数ψp定义如下:
Figure FDA0002243423480000052
其中,
Figure FDA0002243423480000053
是外观高斯核,
Figure FDA0002243423480000054
是平滑高斯核,μ(xi,xj)是标签兼容性函数,μ(xi,xj)=[xi≠xj],pi和pj是第i和第j个像素对应的位置,Ii和Ij是第i和第j个像素对应的强度,σα、σβ和σγ是高斯核参数,ω1和ω2是两个高斯核的相对强度。
9.根据权利要求1所述的基于深度全卷积网络和条件随机场的图像语义分割方法,其特征在于,所述步骤S33中,在损失函数中加入有L1和L2正则化项,得最终目标函数如下:
Figure FDA0002243423480000055
其中,λ1和λ2分别是L1和L2正则化因子,θi是分割网络参数,Q是θi的参数个数。
10.根据权利要求1所述的基于深度全卷积网络和条件随机场的图像语义分割方法,其特征在于,所述步骤S34中引入有学习率线性衰减,且学习率按如下规律进行衰减:
Figure FDA0002243423480000061
其中,ηt1是第t1次迭代使用的学习率,η0是开始学习率,ητ是最终学习率,τ是总迭代次数。
CN201810085381.6A 2018-01-29 2018-01-29 基于深度全卷积网络和条件随机场的图像语义分割方法 Expired - Fee Related CN108062756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810085381.6A CN108062756B (zh) 2018-01-29 2018-01-29 基于深度全卷积网络和条件随机场的图像语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810085381.6A CN108062756B (zh) 2018-01-29 2018-01-29 基于深度全卷积网络和条件随机场的图像语义分割方法

Publications (2)

Publication Number Publication Date
CN108062756A CN108062756A (zh) 2018-05-22
CN108062756B true CN108062756B (zh) 2020-04-14

Family

ID=62134281

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810085381.6A Expired - Fee Related CN108062756B (zh) 2018-01-29 2018-01-29 基于深度全卷积网络和条件随机场的图像语义分割方法

Country Status (1)

Country Link
CN (1) CN108062756B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283428A (zh) * 2021-07-20 2021-08-20 南京信息工程大学 一种基于fce-ssd方法的图像目标检测方法

Families Citing this family (132)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492297B (zh) * 2017-12-25 2021-11-19 重庆师范大学 基于深度级联卷积网络的mri脑肿瘤定位与瘤内分割方法
CN112368711A (zh) * 2018-05-24 2021-02-12 诺基亚技术有限公司 用于计算机视觉的方法和装置
CN108710863A (zh) * 2018-05-24 2018-10-26 东北大学 基于深度学习的无人机航拍场景语义分割方法及系统
CN108898140A (zh) * 2018-06-08 2018-11-27 天津大学 基于改进的全卷积神经网络的脑肿瘤图像分割算法
CN108876796A (zh) * 2018-06-08 2018-11-23 长安大学 一种基于全卷积神经网络和条件随机场的道路分割系统及方法
CN108765422A (zh) * 2018-06-13 2018-11-06 云南大学 一种视网膜图像血管自动分割方法
CN108961253A (zh) * 2018-06-19 2018-12-07 深动科技(北京)有限公司 一种图像分割方法和装置
CN108921066B (zh) * 2018-06-22 2021-12-17 西安电子科技大学 基于特征融合卷积网络的光学遥感图像舰船检测方法
CN109034198B (zh) * 2018-06-25 2020-12-11 中国科学院计算技术研究所 基于特征图恢复的场景分割方法和系统
CN109086768B (zh) * 2018-07-13 2021-10-29 南京邮电大学 卷积神经网络的语义图像分割方法
CN109034162B (zh) * 2018-07-13 2022-07-26 南京邮电大学 一种图像语义分割方法
CN110738212B (zh) * 2018-07-19 2022-11-08 北京四维图新科技股份有限公司 一种卷积网络模型的获取方法、装置及处理设备
CN109145769A (zh) * 2018-08-01 2019-01-04 辽宁工业大学 融合图像分割特征的目标检测网络设计方法
CN108960212A (zh) * 2018-08-13 2018-12-07 电子科技大学 基于端到端的人体关节点检测与分类方法
CN109087303B (zh) * 2018-08-15 2022-04-01 中山大学 基于迁移学习提升语义分割模型效果的框架
CN108985269B (zh) * 2018-08-16 2022-06-10 东南大学 基于卷积和空洞卷积结构的融合网络驾驶环境感知模型
CN109101975B (zh) * 2018-08-20 2022-01-25 电子科技大学 基于全卷积神经网络的图像语义分割方法
CN110866526A (zh) * 2018-08-28 2020-03-06 北京三星通信技术研究有限公司 图像分割方法、电子设备及计算机可读存储介质
CN109285162A (zh) * 2018-08-30 2019-01-29 杭州电子科技大学 一种基于局部区域条件随机场模型的图像语义分割方法
CN109146872B (zh) * 2018-09-03 2021-12-17 北京邮电大学 基于深度学习和光流法的心脏冠状动脉影像分割识别方法
CN109344833B (zh) * 2018-09-04 2020-12-18 中国科学院深圳先进技术研究院 医学图像分割方法、分割系统及计算机可读存储介质
US10229346B1 (en) * 2018-09-04 2019-03-12 StradVision, Inc. Learning method, learning device for detecting object using edge image and testing method, testing device using the same
CN109359655B (zh) * 2018-09-18 2021-07-16 河南大学 基于上下文正则化循环深度学习的图像分割方法
CN109343692B (zh) * 2018-09-18 2021-07-23 河南大学 基于图像分割的移动设备显示器省电方法
CN110929744B (zh) * 2018-09-20 2023-04-28 成都图必优科技有限公司 一种基于层次联合卷积网络特征弱监督图像语义分割方法
CN109325534B (zh) * 2018-09-22 2020-03-17 天津大学 一种基于双向多尺度金字塔的语义分割方法
CN109389057B (zh) * 2018-09-22 2021-08-06 天津大学 一种基于多尺度高级语义融合网络的物体检测方法
CN109559315B (zh) * 2018-09-28 2023-06-02 天津大学 一种基于多路径深度神经网络的水面分割方法
US10304009B1 (en) * 2018-10-08 2019-05-28 StradVision, Inc. Learning method and testing method for object detector based on R-CNN, and learning device and testing device using the same
CN111091524A (zh) * 2018-10-08 2020-05-01 天津工业大学 基于深度卷积神经网络的前列腺经直肠超声图像分割方法
CN109543672B (zh) * 2018-10-15 2023-08-11 天津大学 基于稠密特征金字塔网络的物体检测方法
CN109509192B (zh) * 2018-10-18 2023-05-30 天津大学 融合多尺度特征空间与语义空间的语义分割网络
CN109461157B (zh) * 2018-10-19 2021-07-09 苏州大学 基于多级特征融合及高斯条件随机场的图像语义分割方法
CN111178495B (zh) * 2018-11-10 2023-06-30 杭州凝眸智能科技有限公司 用于检测图像中极小物体的轻量卷积神经网络
US11188799B2 (en) 2018-11-12 2021-11-30 Sony Corporation Semantic segmentation with soft cross-entropy loss
CN109598269A (zh) * 2018-11-14 2019-04-09 天津大学 一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法
CN109493359A (zh) * 2018-11-21 2019-03-19 中山大学 一种基于深度网络的皮肤损伤图片分割方法
CN109712207B (zh) * 2018-11-24 2023-04-07 天津大学 V-Net深度成像方法
CN111259686B (zh) 2018-11-30 2024-04-09 华为终端有限公司 一种图像解析方法以及装置
CN109636905B (zh) * 2018-12-07 2023-01-24 东北大学 基于深度卷积神经网络的环境语义建图方法
CN111310535B (zh) * 2018-12-11 2023-07-14 财团法人工业技术研究院 使用卷积神经网络模型的对象检测方法及对象检测设备
CN109801307A (zh) * 2018-12-17 2019-05-24 中国科学院深圳先进技术研究院 一种全景分割方法、装置及设备
CN109711449A (zh) * 2018-12-20 2019-05-03 北京以萨技术股份有限公司 一种基于全卷积网络的图像分类算法
CN109741331B (zh) * 2018-12-24 2021-10-26 北京航空航天大学 一种图像前景物体分割方法
CN109784209B (zh) * 2018-12-26 2021-06-01 中交第二公路勘察设计研究院有限公司 利用高分辨率遥感影像的高寒山区积雪提取方法
CN111369567B (zh) * 2018-12-26 2022-12-16 腾讯科技(深圳)有限公司 三维图像中目标对象的分割方法、装置及电子设备
CN109685813B (zh) * 2018-12-27 2020-10-13 江西理工大学 一种自适应尺度信息的u型视网膜血管分割方法
CN109829929A (zh) * 2018-12-30 2019-05-31 中国第一汽车股份有限公司 一种基于深度边缘检测的层次场景语义分割模型
CN109840528A (zh) * 2019-01-31 2019-06-04 北京字节跳动网络技术有限公司 提取图像的特征图的方法和装置
CN111582004A (zh) * 2019-02-15 2020-08-25 阿里巴巴集团控股有限公司 一种地面图像中的目标区域分割方法及装置
CN111582278B (zh) * 2019-02-19 2023-12-08 北京嘀嘀无限科技发展有限公司 人像分割方法、装置及电子设备
CN110110578B (zh) * 2019-02-21 2023-09-29 北京工业大学 一种室内场景语义标注方法
CN109919948A (zh) * 2019-02-26 2019-06-21 华南理工大学 基于深度学习的鼻咽癌病灶分割模型训练方法及分割方法
CN109949276B (zh) * 2019-02-28 2021-06-11 华中科技大学 一种于改进SegNet分割网络的淋巴结检测方法
CN110009095B (zh) * 2019-03-04 2022-07-29 东南大学 基于深度特征压缩卷积网络的道路行驶区域高效分割方法
CN109902748A (zh) * 2019-03-04 2019-06-18 中国计量大学 一种基于多层信息融合全卷积神经网络的图像语义分割方法
CN109977793B (zh) * 2019-03-04 2022-03-04 东南大学 基于变尺度多特征融合卷积网络的路侧图像行人分割方法
CN111669492A (zh) * 2019-03-06 2020-09-15 青岛海信移动通信技术股份有限公司 一种终端对拍摄的数字图像进行处理的方法及终端
CN110084817B (zh) * 2019-03-21 2021-06-25 西安电子科技大学 基于深度学习的数字高程模型生产方法
CN110008861A (zh) * 2019-03-21 2019-07-12 华南理工大学 一种基于全局和局部特征学习的行人再识别方法
CN111738036B (zh) * 2019-03-25 2023-09-29 北京四维图新科技股份有限公司 图像处理方法、装置、设备及存储介质
CN110147714B (zh) * 2019-03-28 2023-06-23 煤炭科学研究总院 基于无人机的煤矿采空区裂缝识别方法及检测系统
CN110148136A (zh) * 2019-04-10 2019-08-20 南方电网科学研究院有限责任公司 一种绝缘子图像分割方法、装置与计算机可读存储介质
CN110070022A (zh) * 2019-04-16 2019-07-30 西北工业大学 一种基于图像的自然场景材料识别方法
WO2020215236A1 (zh) * 2019-04-24 2020-10-29 哈尔滨工业大学(深圳) 图像语义分割方法和系统
CN110044964A (zh) * 2019-04-25 2019-07-23 湖南科技大学 基于无人飞机热成像视频的建筑饰面层脱粘缺陷识别方法
CN110110723B (zh) * 2019-05-07 2021-06-29 艾瑞迈迪科技石家庄有限公司 一种图像中目标区域自动提取的方法及装置
CN110135379A (zh) * 2019-05-21 2019-08-16 中电健康云科技有限公司 舌象分割方法及装置
CN110288603B (zh) * 2019-05-22 2020-07-21 杭州电子科技大学 基于高效卷积网络和卷积条件随机场的语义分割方法
CN110263694A (zh) * 2019-06-13 2019-09-20 泰康保险集团股份有限公司 一种票据识别方法及装置
CN110470315A (zh) * 2019-06-27 2019-11-19 安徽四创电子股份有限公司 一种景点游客导航方法
CN110363201B (zh) * 2019-07-10 2021-06-01 上海交通大学 基于协同学习的弱监督语义分割方法及系统
CN110633640A (zh) * 2019-08-13 2019-12-31 杭州电子科技大学 优化PointNet对于复杂场景的识别方法
CN110659653A (zh) * 2019-09-12 2020-01-07 复旦大学 一种可充分保留图像特征的特征提取模型及特征提取方法
CN110706239B (zh) * 2019-09-26 2022-11-11 哈尔滨工程大学 融合全卷积神经网络与改进aspp模块的场景分割方法
CN110717921B (zh) * 2019-09-26 2022-11-15 哈尔滨工程大学 改进型编码解码结构的全卷积神经网络语义分割方法
CN110796147B (zh) * 2019-10-21 2022-05-06 Oppo广东移动通信有限公司 图像分割方法及相关产品
CN111126127B (zh) * 2019-10-23 2022-02-01 武汉大学 一种多级空间上下文特征指导的高分辨率遥感影像分类方法
CN110853052A (zh) * 2019-10-25 2020-02-28 湖北民族大学 一种基于深度学习的土家织锦图案图元的分割方法
CN111414882B (zh) * 2019-11-07 2023-04-28 天津大学 一种基于多级分辨率平衡网络的红外目标检测方法
CN110910390B (zh) * 2019-11-11 2022-10-21 大连理工大学 一种基于深度畸变卷积的全景三维彩色点云语义分割方法
CN110837811B (zh) * 2019-11-12 2021-01-05 腾讯科技(深圳)有限公司 语义分割网络结构的生成方法、装置、设备及存储介质
CN110930385A (zh) * 2019-11-20 2020-03-27 北京推想科技有限公司 乳房肿块检测定位方法和装置
CN110930421B (zh) * 2019-11-22 2022-03-29 电子科技大学 一种用于cbct牙齿图像的分割方法
CN111160109B (zh) * 2019-12-06 2023-08-18 北京联合大学 一种基于深度神经网络的道路分割方法及系统
CN111161277B (zh) * 2019-12-12 2023-04-18 中山大学 一种基于深度学习的自然图像抠图方法
CN111080551B (zh) * 2019-12-13 2023-05-05 太原科技大学 基于深度卷积特征和语义近邻的多标签图像补全方法
CN111144255B (zh) * 2019-12-18 2024-04-19 华中科技大学鄂州工业技术研究院 一种教师的非语言行为的分析方法及装置
CN111143567B (zh) * 2019-12-30 2023-04-07 成都数之联科技股份有限公司 一种基于改进神经网络的评论情感分析方法
CN111259898B (zh) * 2020-01-08 2023-03-24 西安电子科技大学 基于无人机航拍图像的农作物分割方法
CN111275732B (zh) * 2020-01-16 2023-05-02 北京师范大学珠海分校 一种基于深度卷积神经网络的前景对象图像分割方法
CN113361530A (zh) * 2020-03-06 2021-09-07 上海交通大学 使用交互手段的图像语义精准分割及优化方法
CN111401421A (zh) * 2020-03-06 2020-07-10 上海眼控科技股份有限公司 基于深度学习的图像类别判定方法、电子设备以及介质
CN111598095B (zh) * 2020-03-09 2023-04-07 浙江工业大学 一种基于深度学习的城市道路场景语义分割方法
CN111401384B (zh) * 2020-03-12 2021-02-02 安徽南瑞继远电网技术有限公司 一种变电设备缺陷图像匹配方法
CN111401380B (zh) * 2020-03-24 2023-06-20 北京工业大学 一种基于深度特征增强和边缘优化的rgb-d图像语义分割方法
CN111461129B (zh) * 2020-04-02 2022-08-02 华中科技大学 一种基于上下文先验的场景分割方法和系统
CN111539983B (zh) * 2020-04-15 2023-10-20 上海交通大学 基于深度图像的运动物体分割方法及系统
CN111222499B (zh) * 2020-04-22 2020-08-14 成都索贝数码科技股份有限公司 新闻自动拆条的条件随机场算法预测结果回流训练方法
CN111429510B (zh) * 2020-05-07 2024-04-02 北京工业大学 基于自适应特征金字塔的花粉检测方法
CN111738012B (zh) * 2020-05-14 2023-08-18 平安国际智慧城市科技股份有限公司 提取语义对齐特征的方法、装置、计算机设备和存储介质
CN111680702B (zh) * 2020-05-28 2022-04-01 杭州电子科技大学 一种使用检测框实现弱监督图像显著性检测的方法
CN111681183A (zh) * 2020-06-05 2020-09-18 兰州理工大学 一种壁画图像色彩还原方法及装置
CN111738338B (zh) * 2020-06-23 2021-06-18 征图新视(江苏)科技股份有限公司 基于级联膨胀fcn网络应用于马达线圈的缺陷检测方法
CN111723815B (zh) * 2020-06-23 2023-06-30 中国工商银行股份有限公司 模型训练方法、图像处理方法、装置、计算机系统和介质
CN111631688B (zh) * 2020-06-24 2021-10-29 电子科技大学 睡眠自动分期的算法
CN111784564B (zh) * 2020-06-30 2022-05-10 稿定(厦门)科技有限公司 自动抠图方法及系统
CN111968135B (zh) * 2020-08-15 2022-03-08 中南大学 一种基于全卷积网络的三维腹部ct图像多器官配准方法
CN112070100A (zh) * 2020-09-11 2020-12-11 深圳力维智联技术有限公司 基于深度学习模型的图像特征识别方法、装置及存储介质
CN112132137A (zh) * 2020-09-16 2020-12-25 山西大学 一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法
CN112164065B (zh) * 2020-09-27 2023-10-13 华南理工大学 一种基于轻量化卷积神经网络的实时图像语义分割方法
CN112233129B (zh) * 2020-10-20 2023-06-27 湘潭大学 基于深度学习的并行多尺度注意力机制语义分割方法及装置
CN112215848B (zh) * 2020-10-22 2022-03-11 合肥工业大学 一种基于空间信息引导的实时语义分割方法
CN112383496A (zh) * 2020-11-09 2021-02-19 西安科技大学 基于深度接收机的矿井通信方法、系统、计算机设备及介质
CN112580649B (zh) * 2020-12-15 2022-08-02 重庆邮电大学 一种基于区域上下文关系模块的语义分割方法
CN113159038B (zh) * 2020-12-30 2022-05-27 太原理工大学 一种基于多模态融合的煤岩分割方法
CN112837320B (zh) * 2021-01-29 2023-10-27 华中科技大学 一种基于并行空洞卷积的遥感影像语义分割方法
CN113011305B (zh) * 2021-03-12 2022-09-09 中国人民解放军国防科技大学 基于语义分割和条件随机场的sar图像道路提取方法和装置
CN112950645B (zh) * 2021-03-24 2023-05-12 中国人民解放军国防科技大学 一种基于多任务深度学习的图像语义分割方法
CN113128510A (zh) * 2021-03-26 2021-07-16 武汉光谷信息技术股份有限公司 一种语义分割方法及系统
CN113177965A (zh) * 2021-04-09 2021-07-27 上海工程技术大学 基于改进U-net网络的煤岩全组分提取方法及其应用
CN112926692B (zh) * 2021-04-09 2023-05-09 四川翼飞视科技有限公司 基于非均匀混合卷积的目标检测装置、方法和存储介质
CN113223011B (zh) * 2021-04-25 2022-10-04 山东师范大学 基于引导网络和全连接条件随机场的小样本图像分割方法
CN113269794A (zh) * 2021-05-27 2021-08-17 中山大学孙逸仙纪念医院 一种图像区域分割方法、装置、终端设备及存储介质
CN113627437B (zh) * 2021-08-06 2024-03-29 河南大学 一种快速识别石墨电极标签的方法
CN113643305B (zh) * 2021-08-10 2023-08-25 珠海复旦创新研究院 一种基于深度网络上下文提升的人像检测与分割方法
CN113920172B (zh) * 2021-12-14 2022-03-01 成都睿沿芯创科技有限公司 一种目标跟踪方法、装置、设备以及存储介质
CN116468940B (zh) * 2023-04-07 2023-09-19 安徽工程大学 一种基于深度学习的感知增强与运动判断算法、存储介质及设备
CN116079749B (zh) * 2023-04-10 2023-06-20 南京师范大学 基于聚类分离条件随机场的机器人视觉避障方法及机器人
CN116385455B (zh) * 2023-05-22 2024-01-26 北京科技大学 基于梯度场标签的浮选泡沫图像实例分割方法和装置
CN116740650B (zh) * 2023-08-10 2023-10-20 青岛农业大学 一种基于深度学习的作物育种监测方法及系统
CN117475357B (zh) * 2023-12-27 2024-03-26 北京智汇云舟科技有限公司 基于深度学习的监控视频图像遮挡检测方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095862B (zh) * 2015-07-10 2018-05-29 南开大学 一种基于深度卷积条件随机场的人体动作识别方法
EP3430525A4 (en) * 2016-03-17 2019-11-06 Imagia Cybernetics Inc. METHOD AND SYSTEM FOR TREATING A ROBUSTNESS TASK WITH MISSING INPUT INFORMATION
CN107122735B (zh) * 2017-04-26 2020-07-14 中山大学 一种基于深度学习和条件随机场的多目标跟踪方法
CN107424159B (zh) * 2017-07-28 2020-02-07 西安电子科技大学 基于超像素边缘和全卷积网络的图像语义分割方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283428A (zh) * 2021-07-20 2021-08-20 南京信息工程大学 一种基于fce-ssd方法的图像目标检测方法
CN113283428B (zh) * 2021-07-20 2021-10-08 南京信息工程大学 一种基于fce-ssd方法的图像目标检测方法

Also Published As

Publication number Publication date
CN108062756A (zh) 2018-05-22

Similar Documents

Publication Publication Date Title
CN108062756B (zh) 基于深度全卷积网络和条件随机场的图像语义分割方法
AU2020103901A4 (en) Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field
CN109299274B (zh) 一种基于全卷积神经网络的自然场景文本检测方法
CN110335290B (zh) 基于注意力机制的孪生候选区域生成网络目标跟踪方法
CN111489358B (zh) 一种基于深度学习的三维点云语义分割方法
CN107526785B (zh) 文本分类方法及装置
CN107122809B (zh) 基于图像自编码的神经网络特征学习方法
CN108388651B (zh) 一种基于图核和卷积神经网络的文本分类方法
Yin et al. FD-SSD: An improved SSD object detection algorithm based on feature fusion and dilated convolution
CN113657560B (zh) 基于节点分类的弱监督图像语义分割方法及系统
CN112200266B (zh) 基于图结构数据的网络训练方法、装置以及节点分类方法
CN111401380B (zh) 一种基于深度特征增强和边缘优化的rgb-d图像语义分割方法
CN110245620B (zh) 一种基于注意力的非最大化抑制方法
CN109948575B (zh) 超声图像中眼球区域分割方法
CN112101364A (zh) 基于参数重要性增量学习的语义分割方法
CN111899203A (zh) 基于标注图在无监督训练下的真实图像生成方法及存储介质
CN114359631A (zh) 基于编码-译码弱监督网络模型的目标分类与定位方法
CN113673482A (zh) 基于动态标签分配的细胞抗核抗体荧光识别方法及系统
CN110111365B (zh) 基于深度学习的训练方法和装置以及目标跟踪方法和装置
CN114882278A (zh) 一种基于注意力机制和迁移学习的轮胎花纹分类方法和装置
CN113538472B (zh) 一种基于编码-解码网络的向量场引导精细化分割方法
CN114565628A (zh) 一种基于边界感知注意的图像分割方法及系统
CN112967296B (zh) 一种点云动态区域图卷积方法、分类方法及分割方法
CN116075820A (zh) 用于搜索图像数据库的方法、非暂时性计算机可读存储介质和设备
WO2024060839A1 (zh) 对象操作方法、装置、计算机设备以及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200414

Termination date: 20210129