CN112598043A

CN112598043A - 一种基于弱监督学习的协同显著性检测方法

Info

Publication number: CN112598043A
Application number: CN202011495029.3A
Authority: CN
Inventors: 周晓飞; 贺熠凡; 张继勇; 孙垚棋; 颜成钢
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2020-12-17
Filing date: 2020-12-17
Publication date: 2021-04-02
Anticipated expiration: 2040-12-17
Also published as: CN112598043B

Abstract

本发明公开了一种基于弱监督学习的协同显著性检测方法。本发明包括以下步骤：步骤(1)深度神经网络的构建和预训练；步骤(2)弱监督数据集的划分；步骤(3)显著性图像样本增强；步骤(4)协同显著性图的预测。使用弱监督的方式隐式地抓取图像间的协同特征，使用样本图像增强的方式增加神经网络的鲁棒性。协同显著性检测中，如何利用好图像间的协同特征是关键的，本发明使用约50％的样本输入到神经网络中进行训练微调隐式获取图像间的协同特征。同时存在图像样本中显著性目标在像素层面所占的比例较小的情况，不利于神经网络的训练和微调，本发明使用一种图像样本增强的手段来克服这一点，来实现对一组图像中显著性目标的预测。

Description

一种基于弱监督学习的协同显著性检测方法

技术领域

本发明属于计算机视觉领域，具体涉及一种基于弱监督学习的协同显著性检测方法。

背景技术

显著性检测是计算机视觉领域的一个研究热点，在相关研究方向中有着广泛的应用，如行人重识别、基于内容的视频压缩、图像质量评估以及目标检测和分割等，它已引起越来越多的关注。

协同显著性是在视觉显著性发展过程中的另一个新兴的研究分支。在近几年来逐步成为计算机视觉领域的热点问题。许多成像设备，例如数码相机和智能手机，都能够采集大量的图像或视频数据。尤其照片共享网站例如Flickr和Facebook，增加了此类数据的访问量。因此，如今人们更有可能面对大量的图像，这些图像通常尺寸巨大并且共享共同的对象或事件。与单个图像相比，一组图像包含更丰富，更有用的信息。在图像组内，可以使用频繁出现的图案或主要前景来表示图像组的主要内容。因此，需要建立有效的计算系统为机器赋予此类功能，促进协同显著性任务的发展。

协同显著性所研究的内容是多幅图像之间显著物体的协同检测。一方面，协同显著性需要借助传统的视觉显著性检测方法对单一图像进行显著区域提取；另一方面，协同显著性需要考虑多幅图像之间的协同相关性，尤其是多幅图像中显著区域之间的协同相关性。在一些复杂情况下单幅图像显著性检测受到制约或瓶颈时，通过引入其他相关图像或参考源、分析相互间关系、构建全局的关联性约束，则可以探索基于全局关联性的显著性模式(也就是协同显著性)并挖掘该图像组中的共性感兴趣物体。

近年来，鉴于深度神经网络(DNNs)的强大学习能力，研究者们已经研制出了多个深度(卷积)模型。这些模型通常情况下可以出色地完成视觉显著性检测任务，因为他们能够从大量标注数据中学习到许多有意义的特征表征和隐层模式。例如最初是用卷积神经网络(CNN) 在局部图像中为每一个像素预测出一个显著性得分，然后从全局的角度调整每一个超像素的得分。类似的，还有学者提出了一个多“语境”的深度学习框架，它在一个统一的框架中联合了全局和局部的上下文信息。还有首先从图片的全局结构中生成一个粗糙的全局显著预测，然后通过分层的递归卷积神经网络来逐步生成显著图的局部细节的方法。目前协同显著性检测是通过全监督学习或无监督学习的方式，利用深度神经网络强大的能力，取得了不错的效果。使用弱监督学习的策略较为缺少。

发明内容

针对现有技术存在的不足，本发明提供了一种基于弱监督学习的协同显著性检测方法。

本发明方法包括以下步骤：

步骤(1)深度神经网络的构建和预训练。

所述的深度神经网络即BASNet(边缘感知显著性目标检测网络)。所述的预训练是在基于BASNet的原有参数下，再使用协同显著性检测数据集进行训练实现模型微调。本发明使用的数据集为协同显著性检测领域中较常见的三个数据集CoSal2015、Coseg-Rep、PASCAL，合并后作为网络预训练的输入，然后使用BASNet的公开训练参数进行训练得到BASNet的网络内部参数A。

步骤(2)弱监督数据集的划分。

选取的测试数据集是协同显著性检测常见的三个，iCoseg、MSRC、 CoSOD3k，具体划分步骤如下：

对于一个协同显著性检测数据集D，图像有N个类别，即 D＝{C₁,C₂,...,C_N}，其中每个类别有数量不等的样本图片。C_i中有M个图像样本，即

其中

表示具有m_p个像素点的图像样本，

表示具有m_p个像素点的二进制真值图；

表示显著目标像素，

表示背景像素。

每个类别随机选取floor(M/2)个图像样本作为训练集，剩余的 M-floor(M/2)个图像样本作为测试集。floor(*)表示向下取整的操作。得到：

其中

和

两者表示同一图像样本类别对应的训练集和测试集。 D_train表示弱监督中的训练集，用于网络的训练微调；D_test表示弱监督中的测试集，用于最终计算显著性图，进行算法评估。

步骤(3)显著性图像样本增强。具体方法如下：

由于存在图像样本中显著性目标在像素层面所占的比例较小，不利于神经网络的训练和微调，故对D_train进行增强，得到新训练集：

其中

cF_m和cY_m是增强后的图像样本和对应的真值图，θ即判定是否执行样本增强操作的阈值，本实施例中推荐使用0.05。

所述的样本增强操作即将

的部分随机在对应的真值图和图像样本中复制，重复k，具体操作可表示为：

获得显著性目标在对应真值图和图像样本中的位置索引组idx₀：

其中显著性目标的索引

满足条件

将位置索引组进行随机平移，得到

其中

R_k为随机数，且R_k＜|m_p|。最终得到的样本图像对应的增强图像和真值图为

其中

步骤(4)协同显著性图的预测。

将D_ctrain输入到本实施例步骤(1)构建的并预训练好的深度神经网络BASNet中，对步骤(2)中划分得到的D_test的每一类单独预测。具体操作如下：

给定每一个协同显著类

对BASNet加载步骤(1)中参数A，再将协同显著类

输入，计算网络的损失函数并反向传播进行网络的训练微调，迭代指定次数后得到网络的内部参数B_i。将D_test中的F_m和网络的内部参数B_i输入到BASNet中即可得到目标协同显著性图。

本发明有益效果如下：

本发明方法主要优势在于两个方面，使用弱监督的方式隐式地抓取图像间的协同特征，使用样本图像增强的方式增加神经网络的鲁棒性。协同显著性检测中，如何利用好图像间的协同特征是关键的，本发明使用约50％的样本输入到神经网络中进行训练微调隐式获取图像间的协同特征。同时存在图像样本中显著性目标在像素层面所占的比例较小的情况，不利于神经网络的训练和微调，本发明使用一种图像样本增强的手段来克服这一点，来实现对一组图像中显著性目标的预测。在领域常用的评价指标上，MAE(平均绝对误差)相比于未使用此改进方法的BASNet提升约14.8％，F值(F-measure)提升约4.9％，均有较明显的提升。

附图说明

图1为本发明方法的框架图。

图2为本发明所使用的神经网络模型图。

图3为本发明方法的结果图与真实图的对比。

具体实施方式

下面结合附图对本发明作进一步说明。

如图1所示，本发明方法具体如下

步骤(1)深度神经网络的构建和预训练。

步骤(2)弱监督数据集的划分。

其中

表示具有m_p个像素点的图像样本，

表示具有m_p个像素点的二进制真值图；

表示显著目标像素，

表示背景像素。

其中

和

步骤(3)显著性图像样本增强。具体方法如下：

其中

所述的样本增强操作即将

其中显著性目标的索引

满足条件

将位置索引组进行随机平移，得到

其中

其中

步骤(4)协同显著性图的预测。

给定每一个协同显著类

对BASNet加载步骤(1)中参数A，再将协同显著类

图2为本发明所使用的神经网络模型图；图3为本发明方法的结果图与真实图的对比。

Claims

1.一种基于弱监督学习的协同显著性检测方法，其特征在于包括以下步骤：

步骤(1)深度神经网络的构建和预训练；

步骤(2)弱监督数据集的划分；

步骤(3)显著性图像样本增强；

步骤(4)协同显著性图的预测。

2.根据权利要求书1所述的一种基于弱监督学习的协同显著性检测方法，其特征在于所述的步骤(1)具体实现如下：

所述的深度神经网络即边缘感知显著性目标检测网络BASNet；所述的预训练是在基于BASNet的原有参数下，再使用协同显著性检测数据集进行训练实现模型微调；所述的的数据集为协同显著性检测领域中较常见的三个数据集CoSal2015、Coseg-Rep、PASCAL，合并后作为网络预训练的输入，然后使用BASNet的公开训练参数进行训练得到BASNet的网络内部参数A。

3.根据权利要求书2所述的一种基于弱监督学习的协同显著性检测方法，其特征在于所述的步骤(2)具体实现如下：

选取的测试数据集是协同显著性检测常见的三个：iCoseg、MSRC、CoSOD3k，具体划分步骤如下：

对于一个协同显著性检测数据集D，图像有N个类别，即D＝{C₁,C₂,...,C_N}，其中每个类别有数量不等的样本图片；C_i中有M个图像样本，即