CN115131549A

CN115131549A - 一种基于自提升学习的显著性目标检测训练方法

Info

Publication number: CN115131549A
Application number: CN202210677715.5A
Authority: CN
Inventors: 李玺; 曾浩; 王环宇
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2022-06-15
Filing date: 2022-06-15
Publication date: 2022-09-30

Abstract

本发明公开了一种基于自提升学习的显著性目标检测训练方法。该方法包括如下步骤：使用显著性目标检测模型，预测出训练图像中的显著性物体；构建渐进式提升模块，用于预测一致连续的显著性标签，指导显著性模型的学习，并以动量更新的方式更新渐进式提升模块的网络参数；利用样本自适应模块评估生成的连续标签的质量，从而动态调节模型连续标签对于显著性模型优化过程的影响；通过数据增强的对输入图像增广变换，通过多层次一致性正则化操作，提升显著性模型的泛化能力。本发明提出的训练方法，充分利用自提升学习和一致性学习范式，能够更好地帮助显著性检测模型的训练，增强模型的准确性和泛化性。

Description

一种基于自提升学习的显著性目标检测训练方法

技术领域

本发明涉及计算机视觉领域，特别地涉及一种基于自提升学习的显著性目标检测训练方法。

背景技术

显著性目标检测作为一种从图像中检测出视觉特征上最为显著目标的技术，常作为一些其他视觉研究的预处理任务，如物体追踪、图像描述生成、图像检索等。显著性目标检测的目标是给定一张图像，区分出图像中每个像素在视觉上是否是显著的。现有的基于深度学习的方法大多将显著性目标检测问题建模成一个端到端的密集像素预测问题，整个训练过程直接利用数据集提供的二值离散标签作为监督信号，训练模型识别出显著性物体。这种训练方法存在两个主要问题：首先这种训练方法忽视了显著性二值离散标签自身的标注不一致和显著同质性对于训练过程的影响。其次这种训练方法没有对场景中的干扰因素进行建模，模型的泛化能力较弱。

针对第一个问题，本发明提出了一个渐进式提升模块，用于生成一致连续标签，引导模型渐进式的学习，降低训练过程的难度。针对第二个问题，本发明显式建模场景中的干扰因素，通过多层次一致性正则化方法提升模型的泛化能力。

发明内容

针对以上问题，本发明提供了一种基于自提升学习的显著性目标检测训练方法。

本发明具体采用的技术方案如下：

一种基于自提升学习的显著性目标检测训练方法，其包括以下步骤：

S1、获取用于显著性目标检测的带有数据集标签的训练数据集；

S2、使用显著性目标检测模型，预测出所述训练数据集内每张训练图像中的显著性物体；

S3、构建渐进式提升模块，利用渐进式提升模块预测一致连续的显著性标签，用于指导显著性模型的学习，并利用显著性模型的参数来动态更新渐进式提升模块的网络参数；

S4、利用样本自适应模块评估生成的连续标签的质量，从而动态调节模型连续标签对于显著性模型优化过程的影响；

S5、通过数据增强对输入图像进行增广变换，通过多层次一致性正则化操作，提升显著性模型的泛化能力；

S6、在显著性目标检测模型训练过程中使用由S1～S5建立的自提升训练框架，指导模型学习过程，帮助模型更好地预测出图像中的显著性物体。

基于上述方案，各步骤可以通过如下方式实现：

进一步的，步骤S1中，训练数据集包括若干训练图像I_train和对应显著性物体二值标签Y_train。

进一步的，步骤S2中，使用显著性目标检测模型，预测出训练图像中的显著性物体，具体包括以下子步骤：

S21、获取一个显著性目标检测模型

模型的网络参数为θ_SOD；所述的目标显著性模型包括编码器模块ε_SOD和解码器模块

S22、对于训练数据集中每张训练图像I_train，其输入显著性目标检测模型

后，先通过编码器模块ε_SOD得到相应的图像特征图f，再利用解码器模块

得到显著性物体预测结果P：

f＝ε_SoD(I_train,θ_SOD)

进一步的，步骤S3中，构建渐进式提升模块，利用渐进式提升模块预测一致连续的显著性标签，用于指导显著性模型更加平滑稳定地学习，并利用显著性模型的参数来动态更新渐进式提升模块的网络参数，具体包括以下子步骤：

S31、初始化渐进式提升模块

该模块的网络结构与S1中的显著性目标检测模型

保持一致，渐进式提升模块

的网络参数为θ_PUM；

S32、利用渐进式提升模块

生成一致连续的显著性标签，后续用于指导显著性模型更加平滑稳定地学习：

其中：Z表示渐进式提升模块生成的一致连续的显著性标签；

S33、采用动量更新的方式，将训练过程中不同阶段的显著性模型的参数整合到渐进式提升模块

的网络中，实现对渐进式提升模块网络参数的动态更新：

其中：

和

分别表示在第t次和第t-1次训练迭代过程中的渐进式提升模块

的网络参数θ_PUM，

表示在第t次训练迭代过程中的显著性目标检测模型

的网络参数θ_SOD，η是控制模型动量更新速度的超参数。

进一步的，所述超参数η设置为0.99。

进一步的，步骤S4中，利用样本自适应模块评估生成的连续标签的质量，从而动态调节模型连续标签对于显著性模型优化过程的影响，具体包括以下子步骤：

S41、样本自适应模块通过评估生成的连续标签的质量，获取样本自适应权重λ：

λ＝exp(-ζ·∑(Y·log(Z)+(1-Y)·log(1-Z)))

其中：Z表示S32中由渐进式提升模块生成的一致连续的显著性标签，Y表示S1中由训练数据集提供的与Z对应的真实显著性物体二值标签，ζ是调节λ取值范围的一个超参数；

S42、样本自适应权重λ被用于动态调节二值标签和连续标签对于模型优化过程的影响，并最终得到自提升训练范式的损失函数

其中：H,W分别表示输入训练图像的长和宽，Y_i,j、Z_i,j、P_i,j分别为二值标签Y、显著性标签Z、显著性物体预测结果P中(i,j)位置的元素值，

为预测结果与一致连续标签计算的损失函数，

为预测结果与二值离散计算的损失函数。

进一步的，所述超参数ζ设置为70。

进一步的，步骤S5中，通过数据增强对输入图像进行增广变换，通过多层次一致性正则化操作，提升显著性模型的泛化能力，具体包括以下子步骤：

S51、通过对原始输入的原始样本I_train进行增加高斯噪声和随机裁剪的数据增广，构建扩充样本

用于模拟受到干扰因素影响的样本：

S52、将扩充样本

输入到显著性目标检测模型

中，获取对应的显著性预测结果

S53、对原始样本和扩充样本之间施加预测一致性的正则化约束：

其中：

表示显著性预测结果

中(i,j)位置的元素值；

S54、利用显著性目标检测模型的编码器模块ε_SOD分别从原始样本和扩充样本中抽取出中间图像特征，并对其施加多尺度特征一致性的正则化约束：

其中：

表示矩阵的F-范数(Frobenius Norm)。

进一步的，步骤S6中，在显著性目标检测模型训练过程中使用由S1～S5建立的自提升训练框架，指导模型学习过程，帮助模型更好地预测出图像中的显著性物体，具体包括以下子步骤：

S61、设置显著性目标检测模型

的总损失函数为：

S62、使用SGD优化方法和反向传播算法通过损失函数

来训练显著性目标检测模型

直至损失函数收敛。

另一方面，本发明提供了一种显著性目标检测方法，其利用前述任一方案所述的基于自提升学习的显著性目标检测训练方法得到经过训练后的显著性目标检测模型

利用训练后的显著性目标检测模型

对目标图像进行检测，获得目标图像中的显著性物体区域。

本发明的基于自提升学习的显著性目标检测训练方法，相比于现有的显著性目标检测训练方法，具有以下有益效果：

首先，本发明设计的渐进式提升模块，可以生成一致连续标签用以引导模型训练过程，使得模型优化过程更加平滑稳定，提升了模型的准确性。

其次，本发明采用的多层次一致性正则化约束，通过在训练过程中显式建模场景中的干扰因素，提升了模型的泛化性。

最后，提出的训练方法均无需修改网络结构，就可以方便地整合到不同的显著性模型中，并在主流的测评数据集上都取得了稳定的性能提升，是一种便于推广的插件式方法。

附图说明

图1为本发明中基于自提升学习的显著性目标检测训练方法的流程示意图；

图2为训练方法示意图。

图3为本发明方法在DUTS数据集上的实施效果。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

相反，本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步，为了使公众对本发明有更好地了解，在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。

参考图1，为本发明中一种基于自提升学习的显著性目标检测训练方法的流程图，其中的训练方法示意图如图2所示。下面对该方法的具体实现步骤进行详细展开描述，该方法具体包括以下步骤：

S1、获取用于显著性目标检测的带有数据集标签的训练数据集。

在本实施例中，上述步骤S1中的训练数据集包括若干训练图像I_train和对应显著性物体二值标签Y_train。

定义显著性目标检测模型中的算法目标为：预测图像内的显著性物体区域P，使其尽可能与标签信息接近。需注意的是，本发明仅仅提供了一种显著性目标检测模型的训练方法，但其中的显著性目标检测模型可以是任意的显著性目标检测模型，例如PoolNet、F3Net和GateNet等，并不限制具体的模型形式。

S2、使用显著性目标检测模型，预测出所述训练数据集内每张训练图像中的显著性物体。

在本实施例中，上述步骤S2中，使用显著性目标检测模型，预测出训练图像中的显著性物体，具体包括以下子步骤：

S21、获取一个显著性目标检测模型

得到显著性物体预测结果P：

f＝ε_SOD(I_train,θ_SOD)

S3、构建渐进式提升模块，利用渐进式提升模块预测一致连续的显著性标签，用于指导显著性模型的学习，并利用显著性模型的参数来动态更新渐进式提升模块的网络参数。

在本实施例中，上述步骤S3中，构建渐进式提升模块，利用渐进式提升模块预测一致连续的显著性标签，用于指导显著性模型更加平滑稳定地学习，并利用显著性模型的参数来动态更新渐进式提升模块的网络参数，具体包括以下子步骤：

S31、初始化渐进式提升模块

该模块的网络结构与S1中的显著性目标检测模型

保持一致，渐进式提升模块

的网络参数为θ_PUM；

S32、利用渐进式提升模块

其中：Z表示渐进式提升模块生成的一致连续的显著性标签；

的网络中，实现对渐进式提升模块网络参数的动态更新：

其中：

和

分别表示在第t次和第t-1次训练迭代过程中的渐进式提升模块

的网络参数θ_PUM，

表示在第t次训练迭代过程中的显著性目标检测模型

的网络参数θ_SOD，η是控制模型动量更新速度的超参数。在本实施例中，上述超参数η优选设置为0.99。

S4、利用样本自适应模块评估生成的连续标签的质量，从而动态调节模型连续标签对于显著性模型优化过程的影响。

在本实施例中，上述步骤S4中，利用样本自适应模块评估生成的连续标签的质量，从而动态调节模型连续标签对于显著性模型优化过程的影响，具体包括以下子步骤：

λ＝exp(-ζ·∑(Y·log(Z)+(1-Y)·log(1-Z)))

其中：Z表示S32中由渐进式提升模块生成的一致连续的显著性标签，Y表示S1中由训练数据集提供的与Z对应的真实显著性物体二值标签(即Y_train)，ζ是调节λ取值范围的一个超参数；本实施例中，超参数ζ可设置为70。

为预测结果与一致连续标签计算的损失函数，

为预测结果与二值离散计算的损失函数。

S5、通过数据增强对输入图像进行增广变换，通过多层次一致性正则化操作，提升显著性模型的泛化能力。

在本实施例中，上述步骤S5中，通过数据增强对输入图像进行增广变换，通过多层次一致性正则化操作，提升显著性模型的泛化能力，具体包括以下子步骤：

用于模拟受到干扰因素影响的样本：

S52、将扩充样本

输入到显著性目标检测模型

中，获取对应的显著性预测结果

其中：

表示显著性预测结果

中(i,j)位置的元素值；

其中：

表示矩阵的F-范数(Frobenius Norm)。

上述步骤S1～S5构成了一个自提升训练框架，下面基于该自提升训练框架即可对显著性目标检测模型进行训练。

在本实施例中，上述步骤S6中，在显著性目标检测模型训练过程中使用由S1～S5建立的自提升训练框架，指导模型学习过程，帮助模型更好地预测出图像中的显著性物体，具体包括以下子步骤：

S61、设置显著性目标检测模型

的总损失函数为：

其中，

是子步骤S42中得到的自提升训练范式的损失函数，

是子步骤S53中得到的预测一致性损失函数，

是子步骤S54中得到的特征一致性损失函数；

S62、使用SGD优化方法和反向传播算法通过损失函数

来训练显著性目标检测模型

直至损失函数收敛。

最终，在执行具体的显著性目标检测任务时，利用训练后的显著性目标检测模型

对目标图像进行检测，即可获得目标图像中的显著性物体区域。

下面将上述基于自提升学习的显著性目标检测训练方法应用至具体的数据集实例中，以展示其所能实现的技术效果。

实施例

本实施例的实现方法如前S1～S6所述，不再详细阐述具体的步骤，下面仅针对案例数据展示其效果。本发明在一个具有真值标注的数据集上实施，分别为：

DUTS数据集：该数据集包含10533张训练图像，5019张测试图像。

本实例在该数据集包含1000张训练图像，500张测试图像。

数据集的训练集上训练，测试集上测试，具体流程如图1所示。图中，PUM是渐进式提升模块，SAM是样本自适应模块，ObjDet是目标检测器，label是离散二值标签，prediction是显著性预测结果。

为综合比较本方法的有效性，我们将本发明提出的训练方法整合到三个目前较好的显著性模型中，包括PoolNet、F3Net和GateNet，之后通过对比采用原始训练方法和本发明训练得到的模型性能来验证有效性。

本实施例检测结果的检测精度如下表所示，主要采用平均绝对误差(MAE)、F-measure和S-measure三个指标。MAE衡量的是预测和标签之间的绝对像素差异，F-measure指标可以更加全面地评估模型的准确率与召回率，S-measure指标同时考虑了模型检测结果的区域感知相似性和物体感知相似性。其中MAE指标数值越小表示性能越好，其余两个指标越大表示性能越好。

方法	MAE	F-measure	S-measure
				PoolNet	4.00	80.90	83.60
PoolNet+OursTrain	3.90(-0.10)	81.40(+0.50)	84.10(+0.50)
				F3Net	3.50	84.00	88.80
F3Net+OursTrain	3.40(-0.10)	84.60(+0.60)	89.10(+0.30)
				GateNet	3.70	82.80	88.40
GateNet+OursTrain	3.60(-0.10)	83.40(+0.60)	88.80(+0.40)

如上三张表，本实例中分别测试了三种不同的显著性目标检测模型PoolNet、F3Net和GateNet，带有+OursTrain的结果是结合本发明提出训练方法后的最终结果，可以看到，所有显著性检测模型使用本发明提出的训练方法后，在所有指标上性能都能够得到明显的提升。

通过以上技术方案，本发明实施例基于深度学习技术发展了一种基于自提升学习的显著性目标检测训练方法。本发明提出的训练方法，充分利用自提升学习和一致性学习范式，能够更好地帮助显著性检测模型的训练，增强模型的准确性和泛化性。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。