CN109741331B - 一种图像前景物体分割方法 - Google Patents

一种图像前景物体分割方法 Download PDF

Info

Publication number
CN109741331B
CN109741331B CN201811578893.2A CN201811578893A CN109741331B CN 109741331 B CN109741331 B CN 109741331B CN 201811578893 A CN201811578893 A CN 201811578893A CN 109741331 B CN109741331 B CN 109741331B
Authority
CN
China
Prior art keywords
foreground object
image
boundary
feature
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811578893.2A
Other languages
English (en)
Other versions
CN109741331A (zh
Inventor
李甲
苏金明
夏长群
赵一凡
赵沁平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201811578893.2A priority Critical patent/CN109741331B/zh
Publication of CN109741331A publication Critical patent/CN109741331A/zh
Application granted granted Critical
Publication of CN109741331B publication Critical patent/CN109741331B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种图像前景物体分割方法,针对图像前景物体不同区域的特征,构建基于边界关注的图像前景物体分割卷积神经网络,该网络首先利用特征提取骨干网络进行图像特征提取,然后利用边界定位子网络得到边界特征和选择性置信图,同时利用内部感知子网络得到内部特征及不变性置信图,利用过渡补充子网络得到前景物体边界和内部之间的过渡补充特征,三路子网络的输出通过边界关注的特征马赛克选择方式得到前景物体分割结果;接下来,对基于边界关注的图像前景物体分割卷积神经网络进行训练,将图像输入已训练的上述卷积神经网络中,实现图像前景物体分割。本发明能够有效将前景物体分割为一个整体,同时对边缘细节处理得很好,且处理图像速度快。

Description

一种图像前景物体分割方法
技术领域
本发明涉及计算机视觉和图像内容理解领域,具体涉及一种图像前景物体分割方法。
背景技术
图像前景物体分割是计算机视觉的重要基础问题,对物体识别、目标跟踪以及图像解析等任务具有重要意义。
已有的图像前景物体分割方法有很多,传统的方法主要考虑利用全局和局部的视觉特征对比来突出前景物体。2009年,Achanta等在CVPR上提出利用像素的颜色对比来突出前景物体;2011年,Cheng等在CVPR上提出利用局部区域的颜色直方图对比来突出前景物体;2012年,
Figure BDA0001917323550000011
等在CVPR上提出一种方法在CIELAB空间进行图像超像素分割,然后利用颜色和空间构建两个衡量指标对不同像素的前景概率的进行加权融合得到最终的前景物体。传统的方法通过手工设计的特征来提取前景物体,这些手工设计的特征往往只考虑到前景物体特征的一部分,因此往往效果并不是很好。
基于深度学习的方法主要利用深度神经网络提取特征并利用神经网络进行特征映射和解析从而分割出前景物体。目前基于深度学习的图像前景物体分割方法主要有两类,一类是充分利用特征集成来增强神经网络的特征表示能力,2017年,Wang等在ICCV上提出利用金字塔池化模块集成多尺度上下文信息和逐阶段优化机制融合多阶段结果提升前景物体分割的性能,2018年,Zhang等在CVPR上提出一种注意力机制引导的逐步利用选择集成多尺度上下文信息的方法提升前景物体分割的性能,这类方法往往针对神经网络结构存在的问题进行网络性能的提升,并没有考虑前景物体分割主要的问题所在。另一类方法主要考虑利用别的任务或者别的线索来提高前景物体分割的性能,2017年,Chen等在ICCV上提出利用人类注视信息和图像语义信息来模拟人类对前景物体的手工标注过程,2018年,Chen等在ECCV上提出模拟人类认知过程的反馈机制设计反向注意力监督模型来进行前景物体分割,这类方法通常主要关注前景物体所在的位置而忽略了前景物体的细节信息。
发明内容
本发明技术解决问题:克服现有技术的不足,提供一种图像前景物体分割方法,既能准确地将前景物体分割为一个整体,同时对前景物体的边缘细节处理得很好。
本发明技术解决方案:一种图像前景物体分割方法,步骤如下:
步骤(1):针对前景物体边界特征选择性、内部特征不变性以及过渡特征补偿能力,基于特征提取骨干网络提取的特征图分别构建边界定位、内部感知和过渡补充三路子网络,然后构造一种边界关注的特征马赛克选择方式对三路子网络的特征图进行融合,构成基于边界关注的图像前景物体分割卷积神经网络;
步骤(2):针对步骤(1)构建的基于边界关注的图像前景物体分割卷积神经网络,利用已有的带有标注的图像前景物体分割的公开数据集进行监督训练,将图像输入已训练的上述卷积神经网络中,实现图像前景物体分割。
所述步骤(1)具体实现如下:
(11)特征提取骨干网络中,对ResNet-50的第四层池化层和第五层池化层设置池化步长为1,以保持特征提取骨干网络提取的特征图的分辨率;同时对ResNet-50的第三层池化层到第四层池化层之间的所有卷积层设置卷积扩张率为2,第四层池化层和第五层池化层之间的所有卷积层设置卷积扩张率为4,以扩大后层的卷积层对前层特征图的感知区域;特征提取骨干网络提取的特征图是后述三路子网络的基础;
(12)针对图像前景物体边界区域的特征具有选择性构建边界定位子网络,边界定位子网络基于特征提取骨干网络提取特征图的过程,在特征提取骨干网络的五个下采样阶段分别提取不同等级不同尺度的五个特征图,然后进行特征映射和上采样操作,再对五个特征图进行拼接和特征映射操作,得到图像前景物体边界特征图,对图像前景物体边界特征图进行Sigmoid函数操作得到边界存在性的概率图,由于边界特征需要选择性,故边界存在性的概率图是一种选择性置信图;
(13)同时,针对图像前景物体内部区域的特征具有不变性构建内部感知子网络,内部感知子网络构建集成相继扩张卷积模块依次对特征提取骨干网络提取的特征图进行不同卷积扩张率的卷积操作,得到多个捕获了不同上下文信息的特征图,并对得到的捕获了不同上下文信息的特征图进行相加集成,得到图像前景物体内部特征图,对图像前景物体内部特征图进行Sigmoid函数操作得到内部存在性的概率图,由于内部特征需要不变性,内部存在性的概率图是一种不变性置信图;
(14)同时,针对图像前景物体边界和内部区域间的过渡区域需要兼顾选择性和不变性构建过渡补充子网络,过渡补充子网络利用集成相继扩张卷积模块对特征提取骨干网络提取的特征图进行不同卷积扩张率的卷积操作及集成,得到过渡区域的图像前景物体过渡特征;
(15)最后,构造一种边界关注的特征马赛克选择方式对上述三路边界定位、内部感知和过渡补充进行特征图的融合,利用选择性置信图、不变性置信图对图像前景物体边界区域特征、图像前景物体内部区域特征和图像前景物体过渡补偿特征进行选择组合,对特征马赛克选择方式选择组合结果利用Sigmoid函数操作后得到图像前景物体分割结果,步骤(11)-(15)组合起来构成基于边界关注的图像前景物体分割卷积神经网络。
所述步骤(2)体实现如下:
(21)针对步骤(1)构建的基于边界关注的图像前景物体分割卷积神经网络在监督训练的过程中,首先进行参数初始化,初始化过程中,基于边界关注的图像前景物体分割卷积神经网络的特征提取骨干网络利用在ImageNet大规模分类数据集上预训练的ResNet-50进行初始化,除特征提取骨干网络外的其他所有卷积神经网络层使用Xavier方法进行随机初始化;
(22)监督训练过程中,使用交叉熵损失函数作为模型优化的损失函数,使用随机梯度下降算法作为参数更新的方法,网络参数的学习率变化采用“Poly”方式,该网络通过前向传播得到网络相对于训练样本的损失,之后通过反向传播更新每一层的权值,通过多次重复前向传播和反向传播,对基于边界关注的图像前景物体分割卷积神经网络进行训练;训练完成后,将图像输入基于边界关注的图像前景物体分割卷积神经网络中,实现最终的前景物体分割。
所述步骤(13)及步骤(14)中,构建的集成相继扩张卷积模块由多个分支网路组成,每个分支对输入特征图先使用卷积核大小为1×1的卷积进行通道压缩,然后使用卷积核大小为3×3的扩张卷积对前层特征图获取更大的感知区域,之后再利用卷积核大小为1×1的卷积进行通道映射和通道选择;同时,在每个分支内和不同分支间添加跳跃层使特征图具有更多的学习路径,同时保证后边分支的学习直接基于前边分支提取的特征,在最终的融合阶段相当于许多不同卷积扩张率的分支进行融合;不同分支扩张卷积的卷积扩张率需要服从以下规律:第一个分支的扩张率为1,之后每个分支是前一个分支的2倍,以此保证后边分支融合对前层特征图获取的感知区域越来越大;在(13)所述的内部感知子网络中,根据特征提取骨干网络提取的特征图的分辨率大小,使用不同数量分支的集成相继扩张卷积模块来充分集成上下文信息;分支数量的选择规则服从以下规律:集成相继扩张卷积模块对前层特征图获取的最大感知区域不小于前层特征图,根据图像分辨率的大小设置不同的分支个数;在过渡补充子网络中,所使用的集成相继扩张卷积模块的分支数量应该为内部感知子网络所使用的集成相继扩张卷积模块的分支数量的一半。
所述步骤(21)中,已有的带有标注的图像前景物体分割的公开数据集可以采用现有的任何带有前景物体的像素级标注的数据集。
所述步骤(22)中,监督训练的数据输入定义专用的数据输入层,该专用数据输入层只对待输入图片进行随机水平翻转和尺寸变化操作,然后直接将处理后的图像数据输入至步骤(15)构建的基于边界关注的图像前景物体分割卷积神经网络中进行训练,保证图像在训练过程中保持不变形;在使用阶段,将图像直接输入至已训练的基于边界关注的图像前景物体分割卷积神经网络中,得到图像前景物体分割结果。
所述步骤(22)中训练好的基于边界关注的图像前景物体分割卷积神经网络,能够快速地对图像进行前景物体分割,在单块GTX 1080Ti GPU上处理分辨率为400×300的图像达到13FPS。
本发明与现有图像前景性能评价指标相比的优点是:本发明在4个公开数据集(ECSSD、DUT-OMRON、PASCAL-S和HKUIS)的2个评价指标上(平均绝对误差和加权F得分)超过了目前所有的方法的性能;同时本发明能够快速地对图像进行前景物体分割,在单块GTX1080Ti GPU上处理分辨率为400×300的图像可以达到13FPS。已存在的方法往往没有考虑前景物体分割存在的主要问题,或者忽略了前景物体的细节信息,本发明开创性分析了前景物体分割存在的主要问题——即选择性-不变性问题,这个是几乎现在所有的方法未能解决的问题,针对以上问题构建的图像前景物体方法考虑了前景物体不同区域的特性,既能准确地将前景物体分割为一个整体,同时对前景物体的边缘细节处理得很好(如图5所示)。同时,本发明提出的集成相继扩张卷积模块简单有效地提升了神经网络的性能。(如图6所示)
附图说明
图1是本发明提出的图像前景物体分割方法流程图;
图2是本发明提出的基于边界关注的图像前景物体分割卷积神经网络示意图;
图3是本发明提出的集成相继扩张卷积模块示意图;
图4是本发明提出的图像前景物体分割方法与已有的方法的性能比较;
图5是本发明提出的图像前景物体分割方法与已有的方法的定性比较;
图6是本发明提出的集成相继扩张卷积模块的性能验证;
具体实施方式
针对前景物体分割已有方法存在的问题,本发明开创性从特征选择性和不变性的角度出发,考虑前景物体分割存在的主要是:前景物体内部在颜色、纹理和位置等方面变化很大导致前景物体本身很难被分割为一个整体;前景物体的边界很难从背景中区分出来导致边界不清晰。
如何更好设计图像前景物体分割方法对以上两个问题进行解决,对前景物体分割方法的设计和提升前景物体分割的性能具有重要意义。
本发明考虑前景物体分割方法在边界区域提取的特征对于轻微变化应该具有选择性,同时前景物体分割方法在内部区域提取的特征对于各种外观变化应该具有不变性。本发明从以上视角出发,提出一种图像前景物体分割方法。该方法包括如下步骤:
步骤(1):针对前景物体边界特征选择性、内部特征不变性以及过渡特征补偿能力,基于特征提取骨干网络提取的特征图分别构建边界定位、内部感知和过渡补充三路子网络,然后构造一种边界关注的特征马赛克选择方式对三路子网络的特征图进行融合,构成基于边界关注的图像前景物体分割卷积神经网络;
步骤(2):针对步骤(1)构建的基于边界关注的图像前景物体分割卷积神经网络,利用已有的带有标注的图像前景物体分割的公开数据集进行监督训练,将图像输入已训练的上述卷积神经网络中,实现图像前景物体分割。
首先,基于边界关注的图像前景物体分割卷积神经网络利用特征提取骨干网络提取特征图,特征提取骨干网络对ResNet-50的第四层池化层和第五层池化层设置池化步长为1,以保持特征提取骨干网络提取的特征图的分辨率;同时对ResNet-50的第三层池化层到第四层池化层之间的所有卷积层设置卷积扩张率为2,第四层池化层和第五层池化层之间的所有卷积层设置卷积扩张率为4,以扩大后层的卷积层对前层特征图的感知区域;
其次,基于边界关注的图像前景物体分割卷积神经网络在特征提取骨干网络的基础上利用三个子网络针对前景物体不同区域进行处理。由于图像前景物体边界区域的特征需要具有选择性,构建边界定位子网络进行边界区域的处理。边界定位子网络基于特征提取骨干网络提取特征图的过程,在特征提取骨干网络的五个下采样阶段分别提取不同等级不同尺度的五个特征图,然后对每个特征图进行特征映射和上采样操作,再对每个特征图进行拼接和特征映射操作,得到图像前景物体边界特征图,对图像前景物体边界特征图进行Sigmoid函数操作得到边界存在性的概率图,由于边界特征需要选择性,故边界存在性的概率图是一种选择性置信图;同时,由于图像前景物体内部区域的特征需要具有不变性,构建内部感知子网络进行内部区域的处理。内部感知子网络构建集成相继扩张卷积模块依次对特征提取骨干网络提取的特征图进行不同卷积扩张率的卷积操作,得到多个捕获了不同上下文信息的特征图,并对得到的捕获了不同上下文信息的特征图进行相加集成,得到图像前景物体内部特征图,对图像前景物体内部特征图进行Sigmoid函数操作得到内部存在性的概率图,由于内部特征需要不变性,内部存在性的概率图是一种不变性置信图;同时,由于前景物体边界和内部区域可能存在一些错误,尤其是在边界和内部区域之间的过渡区域,该区域需要平衡特征选择能力和特征不变能力,更易出现一些错误,故过渡区域的特征需要兼顾选择性和不变性,构建过渡补充子网络进行过度区域的处理。过渡补充子网络利用集成相继扩张卷积模块对特征提取骨干网络提取的特征图进行不同卷积扩张率的卷积操作及集成,得到过渡区域的图像前景物体过渡特征图,修复边界和内部区域存在的错误以及对两类特征进行增强。
接下来,基于边界关注的图像前景物体分割卷积神经网络构造一种边界关注的特征马赛克选择方式对上述三路边界定位、内部感知和过渡补充进行特征图的融合,利用选择性置信图、不变性置信图对图像前景物体边界区域特征、图像前景物体内部区域特征和图像前景物体过渡补偿特征进行选择组合,对特征马赛克选择方式选择组合结果利用Sigmoid函数操作后得到图像前景物体分割结果。
进一步地,基于边界关注的图像前景物体分割卷积神经网络在监督训练可以采用现有的任何带有前景物体的像素级标注的数据集;监督训练中,首先进行参数初始化,初始化过程中,基于边界关注的图像前景物体分割卷积神经网络的特征提取骨干网络利用在ImageNet大规模分类数据集上预训练的ResNet-50进行初始化,除特征提取骨干网络外的其他所有卷积神经网络层使用Xavier方法进行随机初始化;监督训练的数据输入定义专用的数据输入层,该专用数据输入层只对待输入图片进行随机水平翻转和尺寸变化操作,然后直接将处理后的图像数据输入至基于边界关注的图像前景物体分割卷积神经网络中进行训练,保证图像在训练过程中保持不变形;使用交叉熵损失函数作为模型优化的损失函数,使用随机梯度下降算法作为参数更新的方法,网络参数的学习率变化采用“Poly”方式,该网络通过前向传播得到网络相对于训练样本的损失,之后通过反向传播更新每一层的权值,通过多次重复前向传播和反向传播,对基于边界关注的图像前景物体分割卷积神经网络进行训练;训练完成后,将图像输入训练好的基于边界关注的图像前景物体分割卷积神经网络中,实现最终的前景物体分割。
下面结合附图对本发明作详细说明。
如图1所示,本发明提出的图像前景物分割方法主要通过构建一种基于边界关注的图像前景物体分割卷积神经网络,然后利用已有的带有标注的图像前景物体分割的公开数据集对基于边界关注的图像前景物体分割卷积神经网络进行训练实现。
如图2所示,本发明从选择性-不变性角度考虑前景物体分割问题,考虑前景物体分割方法在边界区域提取的特征对于轻微变化应该具有选择性,同时前景物体分割方法在内部区域提取的特征对于各种外观变化应该具有不变性的特性,提出了图1所示的基于边界关注的图像前景物体分割卷积神经网络。
在基于边界关注的图像前景物体分割卷积神经网络中,首先利用特征提取骨干网络提取特征图,该特征提取骨干网络基于ResNet-50网络,主要由五个卷积层块组成,每个卷积层块都包含多层卷积层。同时,对ResNet-50的第四层池化层和第五层池化层设置池化步长为1,以保持特征提取骨干网络提取的特征图的分辨率;同时对ResNet-50的第三层池化层到第四层池化层之间的所有卷积层设置卷积扩张率为2,第四层池化层和第五层池化层之间的所有卷积层设置卷积扩张率为4,以扩大后层的卷积层对前层特征图的感知区域。接着,主要利用三个子网络针对前景物体不同区域进行处理。针对前景物体边界区域,边界定位子网络将特征提取骨干网络的五个下采样阶段分别提取不同等级不同尺度的特征,然后进行特征映射和上采样,最后进行五个特征图的拼接和特征映射得到边界特征图φBB),对图像前景物体边界特征图进行Sigmoid函数操作得到选择性置信图Sig(φBB)),其中πB表示边界定位子网路的参数;针对前景物体内部区域,内部感知子网络基于本发明构建的集成相继扩张卷积模块依次将不同扩张率的卷积得到的特征图进行相加集成,得到内部特征图φII),对图像前景物体内部特征图进行Sigmoid函数操作得到不变性置信图Sig(φII)),其中πI表示边界定位子网路的参数;过渡补充子网络进行过渡特征的学习,过渡补充子网络与内部感知子网络类似,基于本发明提出的集成相继扩张卷积模块得到过渡区域的过渡补充特征φTT),其中πT表示边界定位子网路的参数,修复边界和内部区域存在的错误以及对两类特征进行增强。最后,构造一种边界关注的特征马赛克选择方式将三路不同功能的子网络进行特征的选择,主要是利用选择性置信图MB=Sig(φBB))、不变性置信图MI=Sig(φII))、边界区域特征φBB)、内部区域特征φII)和过渡区域补偿特征进行选择组合,在这个过程中前景物体边界区域特征需要具有弱的不变性和强的选择性,因此可以表示为
Figure BDA0001917323550000071
其中
Figure BDA0001917323550000072
表示逐元素相乘,前景物体边界内部特征需要具有强的不变性和弱的选择性,因此可以表示为
Figure BDA0001917323550000073
同时前景物体过渡内部特征需要具有弱的不变性和弱的选择性,因此可以表示为
Figure BDA0001917323550000074
三个区域的信息进行相加得到特征马赛克图M,利用Sigmoid函数操作后得到前景物体分割结果。具体的特征马赛克选择方式为:
Figure BDA0001917323550000075
接着,在模型的训练中,采用监督学习的方式,共利用三个监督信息:一个是物体边界信息的监督,一个是物体内部信息的监督,一个是真实前景物体的监督。详细地,在边界定位子网络,真实的前景物体边界掩码用GB表示,该部分的损失表示为:
LB=E(Sig(φBB)),GB), (2)
真实的前景物体内部掩码用GI表示,物体内部信息的损失表示为:
LI=E(Sig(φII)),GI), (3)
真实的前景物体掩码用G表示,前景物体的损失表示为:
L0=E(Sig(M),G), (4)
整个网络总的损失表示为:
L=L0+LB+LI。 (5)
网络的训练使用交叉熵损失函数作为模型优化的损失函数,使用随机梯度下降算法作为参数更新的方法。对于特征提取骨干网络,利用在ImageNet大规模分类数据集上预训练的ResNet-50进行初始化,除特征提取骨干网络外的其他所有卷积神经网络层使用Xavier方法进行随机初始化。
如图3所示,本发明提出的集成相继扩张卷积模块,图中以五个分支为例。该模块主要用于内部感知分支和过渡补充分支。该模块每个分支对输入特征图先使用卷积核大小为1×1的卷积进行通道压缩,然后使用卷积核大小为3×3的扩张卷积对前层特征图获取更大的感知区域,然后利用卷积核大小为1×1的卷积进行通道映射和通道选择;同时,在每个分支内和不同分支间添加跳跃层使特征图具有更多的学习路径,分支内的跳跃层用于扩张卷积层的跳跃连接,分支间的跳跃层保证后边分支的学习直接基于前边分支提取的特征,在最终的融合阶段相当于许多不同卷积扩张率的分支进行融合;不同分支扩张卷积的卷积扩张率需要服从以下规律:第一个分支的扩张率为1,之后每个分支是前一个分支的2倍,以此保证后边分支融合对前层特征图获取的感知区域越来越大;在(13)所述的内部感知子网络中,根据特征提取骨干网络提取的特征图的分辨率大小,使用不同数量分支的集成相继扩张卷积模块来充分集成上下文信息;分支数量的选择规则服从以下规律:集成相继扩张卷积模块对前层特征图获取的最大感知区域不小于前层特征图,根据图像分辨率的大小设置不同的分支个数;在过渡补充子网络中,所使用的集成相继扩张卷积模块的分支数量应该为内部感知子网络所使用的集成相继扩张卷积模块的分支数量的一半。在本发明的一个实现中,利用Cheng等在2015年PAMI期刊上发布的前景物体分割数据集MSRA10K作为训练集,在内部感知子网络使用五个分支的集成相继扩张卷积模块,在过渡补充子网络中使用三个分支的集成相继扩张卷积模块。
如图4所示,本发明提出的图像前景物体分割方法在4个公开数据集(ECSSD、DUT-OMRON、PASCAL-S和HKUIS)的2个评价指标上(平均绝对误差和加权F得分)超过了目前所有主流方法的性能。其中平均绝对误差越小越好,加权F得分越大越好。在本图中,本发明提出的图像前景物体分割方法是在MSRA10K公开数据集上训练得到的。
如图5所示,本发明提出的图像前景物体分割方法,既能准确地将前景物体分割为一个整体,同时对前景物体的边缘细节处理得很好。在与目前最好的方法C2SNet和PAGRN相比,本发明提出的方法能够取得更好的图像前景物体分割效果。在本图中,本发明提出的图像前景物体分割方法是在MSRA10K公开数据集上训练得到的。
如图6所示,本发明提出的方法使用集成相继扩张卷积模块相比于不使用集成相继扩张卷积模块在4个公开数据集(ECSSD、DUT-OMRON、PASCAL-S和HKUIS)的2个评价指标上(平均绝对误差和加权F得分)都有显著的性能提升。其中平均绝对误差越小越好,加权F得分越大越好。在图6中,本发明提出的图像前景物体分割方法是在MSRA10K公开数据集上训练得到的。

Claims (5)

1.一种图像前景物体分割方法,其特征在于,步骤如下:
步骤(1):针对前景物体边界特征选择性、内部特征不变性以及过渡特征补偿能力,基于特征提取骨干网络提取的特征图分别构建边界定位、内部感知和过渡补充三路子网络,然后构造一种边界关注的特征马赛克选择方式对三路子网络的特征图进行融合,构成基于边界关注的图像前景物体分割卷积神经网络;
步骤(2):针对步骤(1)构建的基于边界关注的图像前景物体分割卷积神经网络,利用已有的带有标注的图像前景物体分割的公开数据集进行监督训练,将图像输入已训练的上述卷积神经网络中,实现图像前景物体分割;
所述步骤(1)具体实现如下:
(11)特征提取骨干网络中,对ResNet-50的第四层池化层和第五层池化层设置池化步长为1,以保持特征提取骨干网络提取的特征图的分辨率;同时对ResNet-50的第三层池化层到第四层池化层之间的所有卷积层设置卷积扩张率为2,第四层池化层和第五层池化层之间的所有卷积层设置卷积扩张率为4,以扩大后层的卷积层对前层特征图的感知区域;特征提取骨干网络提取的特征图是三路子网络的基础;
(12)针对图像前景物体边界区域的特征具有选择性构建边界定位子网络,边界定位子网络基于特征提取骨干网络提取特征图的过程,在特征提取骨干网络的五个下采样阶段分别提取不同等级不同尺度的五个特征图,然后进行特征映射和上采样操作,再对五个特征图进行拼接和特征映射操作,得到图像前景物体边界特征图,对图像前景物体边界特征图进行Sigmoid函数操作得到边界存在性的概率图,由于边界特征需要选择性,故边界存在性的概率图是一种选择性置信图;
(13)针对图像前景物体内部区域的特征具有不变性构建内部感知子网络,内部感知子网络构建集成相继扩张卷积模块依次对特征提取骨干网络提取的特征图进行不同卷积扩张率的卷积操作,得到多个捕获了不同上下文信息的特征图,并对得到的捕获了不同上下文信息的特征图进行相加集成,得到图像前景物体内部特征图,对图像前景物体内部特征图进行Sigmoid函数操作得到内部存在性的概率图,由于内部特征需要不变性,内部存在性的概率图是一种不变性置信图;
(14)针对图像前景物体边界和内部区域间的过渡区域需要兼顾选择性和不变性构建过渡补充子网络,过渡补充子网络利用集成相继扩张卷积模块对特征提取骨干网络提取的特征图进行不同卷积扩张率的卷积操作及集成,得到过渡区域的图像前景物体过渡特征;
(15)构造一种边界关注的特征马赛克选择方式对上述三路边界定位、内部感知和过渡补充进行特征图的融合,利用选择性置信图、不变性置信图对图像前景物体边界区域特征、图像前景物体内部区域特征和图像前景物体过渡补偿特征进行选择组合,对特征马赛克选择方式选择组合结果利用Sigmoid函数操作后得到图像前景物体分割结果,步骤(11)-(15)组合起来构成基于边界关注的图像前景物体分割卷积神经网络;
步骤(13)及步骤(14)中,构建的集成相继扩张卷积模块由多个分支网路组成,每个分支对输入特征图先使用卷积核大小为1×1的卷积进行通道压缩,然后使用卷积核大小为3×3的扩张卷积对前层特征图获取更大的感知区域,之后再利用卷积核大小为1×1的卷积进行通道映射和通道选择;同时,在每个分支内和不同分支间添加跳跃层使特征图具有更多的学习路径,同时保证后边分支的学习直接基于前边分支提取的特征,在最终的融合阶段对许多不同卷积扩张率的分支进行融合;不同分支扩张卷积的卷积扩张率需要服从以下规律:第一个分支的扩张率为1,之后每个分支是前一个分支的2倍,以此保证后边分支融合对前层特征图获取的感知区域越来越大;在步骤(13)所述的内部感知子网络中,根据特征提取骨干网络提取的特征图的分辨率大小,使用不同数量分支的集成相继扩张卷积模块来充分集成上下文信息;分支数量的选择规则服从以下规律:集成相继扩张卷积模块对前层特征图获取的最大感知区域不小于前层特征图,根据图像分辨率的大小设置不同的分支个数;在过渡补充子网络中,所使用的集成相继扩张卷积模块的分支数量为内部感知子网络所使用的集成相继扩张卷积模块的分支数量的一半。
2.根据权利要求1所述的一种图像前景物体分割方法,其特征在于:所述步骤(2)具体实现如下:
(21)针对步骤(1)构建的基于边界关注的图像前景物体分割卷积神经网络在监督训练的过程中,首先进行参数初始化,初始化过程中,基于边界关注的图像前景物体分割卷积神经网络的特征提取骨干网络,利用在ImageNet大规模分类数据集上预训练的ResNet-50进行初始化,除特征提取骨干网络外的其他所有卷积神经网络层使用Xavier方法进行随机初始化;
(22)监督训练过程中,使用交叉熵损失函数作为模型优化的损失函数,使用随机梯度下降算法作为参数更新的方法,网络参数的学习率变化采用“Poly”方式,该网络通过前向传播得到网络相对于训练样本的损失,之后通过反向传播更新每一层的权值,通过多次重复前向传播和反向传播,对基于边界关注的图像前景物体分割卷积神经网络进行训练;训练完成后,将图像输入基于边界关注的图像前景物体分割卷积神经网络中,实现最终的前景物体分割。
3.根据权利要求2所述的一种图像前景物体分割方法,其特征在于:步骤(21)中,已有的带有标注的图像前景物体分割的公开数据集采用带有前景物体的像素级标注的数据集。
4.根据权利要求2所述的一种图像前景物体分割方法,其特征在于:步骤(22)中,监督训练的数据输入定义专用的数据输入层,该专用数据输入层只对待输入图片进行随机水平翻转和尺寸变化操作,然后直接将处理后的图像数据输入至步骤(15)构建的基于边界关注的图像前景物体分割卷积神经网络中进行训练,保证图像在训练过程中保持不变形;在使用阶段,将图像直接输入至已训练的基于边界关注的图像前景物体分割卷积神经网络中得到图像前景物体分割结果。
5.根据权利要求2所述的一种图像前景物体分割方法,其特征在于:步骤(22)中训练好的基于边界关注的图像前景物体分割卷积神经网络,能够快速地对图像进行前景物体分割,在单块GTX 1080Ti GPU上处理分辨率为400×300的图像达到13FPS。
CN201811578893.2A 2018-12-24 2018-12-24 一种图像前景物体分割方法 Active CN109741331B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811578893.2A CN109741331B (zh) 2018-12-24 2018-12-24 一种图像前景物体分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811578893.2A CN109741331B (zh) 2018-12-24 2018-12-24 一种图像前景物体分割方法

Publications (2)

Publication Number Publication Date
CN109741331A CN109741331A (zh) 2019-05-10
CN109741331B true CN109741331B (zh) 2021-10-26

Family

ID=66361173

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811578893.2A Active CN109741331B (zh) 2018-12-24 2018-12-24 一种图像前景物体分割方法

Country Status (1)

Country Link
CN (1) CN109741331B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163876B (zh) * 2019-05-24 2021-08-17 山东师范大学 基于多特征融合的左心室分割方法、系统、设备及介质
CN110222636B (zh) * 2019-05-31 2023-04-07 中国民航大学 基于背景抑制的行人属性识别方法
CN110321808B (zh) * 2019-06-13 2021-09-14 浙江大华技术股份有限公司 遗留物与盗移物检测方法、设备和存储介质
CN110309832A (zh) * 2019-06-19 2019-10-08 创新奇智(成都)科技有限公司 一种基于图像的物体分类方法、系统及电子设备
CN110503651A (zh) * 2019-08-09 2019-11-26 北京航空航天大学 一种图像显著对象分割方法及装置
CN110910304B (zh) * 2019-11-08 2023-12-22 北京达佳互联信息技术有限公司 图像处理方法、装置、电子设备及介质
CN111783514A (zh) * 2019-11-18 2020-10-16 北京京东尚科信息技术有限公司 面部解析方法、装置及计算机可读存储介质
CN111047602A (zh) * 2019-11-26 2020-04-21 中国科学院深圳先进技术研究院 图像分割方法、装置及终端设备
CN111862140B (zh) * 2020-06-11 2023-08-18 中山大学 一种基于协同模块级搜索的全景分割网络及方法
CN111860518B (zh) * 2020-06-30 2022-10-04 北京航空航天大学 用于分割图像的方法、装置、设备和计算机可读介质
CN113076902B (zh) * 2021-04-12 2023-07-18 华南理工大学 一种多任务融合的人物细粒度分割系统和方法
CN113065569B (zh) * 2021-04-13 2023-11-24 广东省科学院智能制造研究所 基于神经网络的鱼质量估计方法及系统、装置与存储介质
CN113516670B (zh) * 2021-06-29 2024-06-25 清华大学 一种反馈注意力增强的非模式图像分割方法及装置
CN113554655B (zh) * 2021-07-13 2021-12-31 中国科学院空间应用工程与技术中心 基于多特征增强的光学遥感图像分割方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062756A (zh) * 2018-01-29 2018-05-22 重庆理工大学 基于深度全卷积网络和条件随机场的图像语义分割方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2395102B1 (es) * 2010-10-01 2013-10-18 Telefónica, S.A. Metodo y sistema para segmentacion de primer plano de imagenes en tiempo real

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062756A (zh) * 2018-01-29 2018-05-22 重庆理工大学 基于深度全卷积网络和条件随机场的图像语义分割方法

Also Published As

Publication number Publication date
CN109741331A (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
CN109741331B (zh) 一种图像前景物体分割方法
CN111210443B (zh) 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
CN109299274B (zh) 一种基于全卷积神经网络的自然场景文本检测方法
CN111582316B (zh) 一种rgb-d显著性目标检测方法
CN107506761B (zh) 基于显著性学习卷积神经网络的脑部图像分割方法及系统
CN111401384B (zh) 一种变电设备缺陷图像匹配方法
CN111915592B (zh) 基于深度学习的遥感图像云检测方法
CN108062525B (zh) 一种基于手部区域预测的深度学习手部检测方法
Wang et al. Automatic salient object extraction with contextual cue
CN104463250B (zh) 一种基于达芬奇技术的手语识别翻译方法
CN106897673B (zh) 一种基于retinex算法和卷积神经网络的行人再识别方法
CN107239730B (zh) 智能汽车交通标志识别的四元数深度神经网络模型方法
CN112163498B (zh) 前景引导和纹理聚焦的行人重识别模型建立方法及其应用
CN110796026A (zh) 一种基于全局特征拼接的行人重识别方法
CN105205475A (zh) 一种动态手势识别方法
CN113673510B (zh) 一种结合特征点和锚框共同预测和回归的目标检测方法
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN109657551B (zh) 一种基于上下文信息增强的人脸检测方法
CN113408594B (zh) 一种基于注意力网络尺度特征融合的遥感场景分类方法
CN113642390A (zh) 一种基于局部注意力网络的街景图像语义分割方法
CN114187450A (zh) 一种基于深度学习的遥感图像语义分割方法
CN108921850B (zh) 一种基于图像分割技术的图像局部特征的提取方法
CN111401380A (zh) 一种基于深度特征增强和边缘优化的rgb-d图像语义分割方法
CN113361466B (zh) 一种基于多模态交叉指导学习的多光谱目标检测方法
CN114359297A (zh) 基于注意力金字塔的多分辨率语义分割方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant