CN113591579B

CN113591579B - 基于注意机制卷积神经网络的显著性目标检测方法

Info

Publication number: CN113591579B
Application number: CN202110737734.8A
Authority: CN
Inventors: 霍丽娜; 张晓伟; 曹志义; 刘金生; 王张钰; 周小力
Original assignee: Hebei Normal University
Current assignee: Hebei Normal University
Priority date: 2021-06-28
Filing date: 2021-06-28
Publication date: 2024-02-13
Anticipated expiration: 2041-06-28
Also published as: CN113591579A

Abstract

本发明公开了一种基于注意机制卷积神经网络的显著性目标检测方法，包括卷积神经网络训练和显著性检测步骤。本发明通过引入通道注意机制，解决了NLDF方法中深层语义信息过度削弱的问题，通过引入空间注意机制，解决了NLDF方法中低层边界信息不清晰的问题，通过引入双线性插值法提取全局特征，解决了NLDF方法中全局特征的目标丢失问题。

Description

基于注意机制卷积神经网络的显著性目标检测方法

技术领域

本发明涉及一种显著性目标检测方法，尤其涉及一种基于注意机制卷积神经网络的显著性目标检测方法，属于计算机视觉技术领域。

背景技术

近年来，随着新媒体行业的快速发展，一些短视频、图像推文等数字信息完全融入到老百姓的生活中，每天都有数以万计的图像、视频信息传入到互联网中，极大丰富了人们的生活、工作和娱乐。要想快速从海量的数字图像中选出有价值的内容，单靠人类自身感官将难以实现，这便对计算机视觉方面的研究提出更大的挑战。数字图像信息，能够非常直观地反映出人们要表达的内容，在网络资源传送中被广泛使用，但是大量的数据信息难以被人们有效识别。在人类的视觉系统中，他们能够集中注视到图像的重要区域上，而不去关注背景区域的无用信息，这对快速处理图像有着重要作用。因此，如何将这种注视图像关键区域的能力应用到计算机中，以帮助人们完成更加复杂的图像处理任务，便是当下计算机视觉研究者所关注的重点内容。

深度学习，尤其是卷积神经网络能够有效提取图像的深层语义内容和浅层空间信息，从而更加清晰地检测出视觉场景中的重要区域内容。就目前而言，基于深度学习的显著性目标检测算法主要从三个角度来增强检测效果，分别是边界和深层语义信息的增强，全局和局部特征结合增强以及其他领域网络的辅助增强。这些方案虽然相比传统方法有着很好的检测效果，但是仍然存在一些问题。其中，存在的一些主流问题便是边界信息不完整问题。自卷积神经网络被提出后，图像的深层语义内容能够被很好的提取，外加一些辅助网络等处理算法，可以很好地优化目标区域信息。但是，因为搭建的模型不能有效利用边界信息和语义信息的互补性，以及局部特征和全局特征的关联性，造成边界信息不清晰、不连贯以及边缘内容缺失等问题，仍然是目前深度学习算法中常见的问题。

发明内容

本发明要解决的技术问题是提供一种基于注意机制卷积神经网络的显著性目标检测方法。

为解决上述技术问题，本发明所采取的技术方案是：

一种基于注意机制卷积神经网络的显著性目标检测方法，包括以下步骤：

步骤1：卷积神经网络训练：所述卷积神经网络包括输入层、多维特征提取层MFE1至MFE5、全局特征提取层global、卷积层CON-1至CON-5、空间注意模块SA、通道注意模块CA、对比信息提取层CT-1至CT-5、特征融合层Dcon-2至Dcon-5、局部特征提取层、分类预测层和输出层；所述输入层将输入图像转换为预设维度的张量后依次经多维特征提取层MFE1至MFE5、全局特征提取层global处理后得到全局特征张量U_G；所述多维特征提取层MFE1至MFE5分别提取第一至第五尺度特征张量f₁-f₅；所述第一至第五尺度特征张量f₁-f₅分别经所述卷积层CON-1至CON-5处理得到第一至第五尺度高层特征x₁-x₅；所述第四尺度高层特征x₄经空间注意模块CA处理后得到通道注意特征X′₄，所述第二尺度高层特征x₂和通道注意特征X′₄经空间注意模块SA处理后得到空间注意特征X′₂，所述第一尺度高层特征x₁、空间注意特征X′₂、第三尺度高层特征x₃、通道注意特征X′₄、第五尺度高层特征x₅分别经过对比信息提取层CT-1至CT-5处理得到第一至第五对比特征第五尺度高层特征x₅和第五对比特征/>经特征融合层Dcon-5处理后得到第五特征张量U₅，第四尺度高层特征x₄和第四对比特征/>和第五特征张量U₅经特征融合层Dcon-4处理后得到第四特征张量U₄，第三尺度高层特征x₃和第三对比特征/>和第四特征张量U₄经特征融合层Dcon-3处理后得到第三特征张量U₃，第二尺度高层特征x₂和第二对比特征/>和第三特征张量U₃经特征融合层Dcon-2处理后得到第二特征张量U₂，第一尺度高层特征x₁和第一对比特征/>和第二特征张量U₂经局部特征提取层处理后得到局部特征张量U_L，局部特征张量U_L和全局特征张量U_G经分类预测层Softmax处理后得到显著性特征，显著性特征经过输出层输出显著性图；训练集的已标注训练图像输入输入层，进行网络训练；

步骤2：显著性检测：将待预测图象输入输入层，预测显著性图。

进一步，所述输入层采用超分辨率方法将输入图像转换为预设维度的张量。

进一步，所述全局特征提取层global采用两次双线性插值法及一次卷积操作提取全局特征张量U_G，所述卷积操作的卷积核大小为1×1，padding值为VALID，通道数为2。

进一步，所述卷积层CON-1至CON-5结构相同，卷积核大小为3×3，步长为1，padding值为SAME，通道数为128。

进一步，所述通道注意模块CA首先对第四尺度高层特征x₄进行全局平均池化处理，得到各通道下的特征图向量v^h，然后采用两个全连接层对特征向量v^h进行显著性映射，获得基于通道方向特征之间的依赖关系，再将两个全连接层设置在非线性函数的两端，并通过Sigmoid归一化处理，将通道方向的特征向量映射到[0,1]，其计算公式为：

CA＝σ₁(fc₂(δ(fc₁(v^h,W₁)),W₂))

其中W₁、W₂表示通道方向注意模块的参数，σ₁表示Sigmoid运算，fc₁和fc₂分别表示两个全连接层，δ表示Relu非线性激活函数；通道注意模块输出为：

X′₄＝CA·X₄

进一步，所述空间注意模块分别采用卷积核为1×k和k×1的卷积层对通道注意模块输出X′₄进行卷积操作：

其中代表空间注意模块中的参数，conv₁和conv₂分别代表1×K×C和K×1×1的卷积操作；

然后将卷积后的结果C₁和C₂进行结合，并用Sigmoid运算进行归一化处理：

SA＝F(X′₄,w)＝σ₂(C₁+C₂)

其中，σ₂代表Sigmoid激活函数，SA表示归一化后的特征，空间注意模型的最后输出X′₂为：

X′₂＝SA·X₂

进一步，所述对比信息提取层CT-1至CT-5处理方法均为：

其中，AvgPool(X_i)表示平均池化处理。

进一步，所述分类预测层用Softmax函数进行分类预测：

其中，y(v)＝c表示显著图中像素划分为正确类，为显著性特征。

进一步，特征融合层Dcon-1的卷积核为1×1，步长为1，padding值为VALID，通道数为2；特征融合层Dcon-2的卷积核为5×5，步长为2，padding值为SAME，通道数为512；特征融合层Dcon-3的卷积核为5×5，步长为2，padding值为SAME，通道数为384；特征融合层Dcon-4的卷积核为5×5，步长为2，padding值为SAME，通道数为256；特征融合层Dcon-5的卷积核为5×5，步长为2，padding值为SAME，通道数为128。

进一步，所述卷积神经网络训练融合交叉熵损失和IOU边界损失的混合损失函数进行联合训练：

交叉熵损失函数定义为：

其中，表示预测结果，y(v)表示真值结果。

IOU边界损失函数定义为：

其中，表示基于真值图的边界像素，C_j表示模型预测图的边界像素，IOU loss的范围是[0,1]；

模型最终混合损失函数定义为：

其中，交叉熵损失函数中的加权常量λ_j＝1，IOU边界损失函数中的调整项γ_j＝1。

采用上述技术方案所产生的有益效果在于：

本发明通过引入通道注意机制，解决了NLDF方法中深层语义信息过度削弱的问题，通过引入空间注意机制，解决了NLDF方法中低层边界信息不清晰的问题，通过引入双线性插值法提取全局特征，解决了NLDF方法中全局特征的目标丢失问题。

附图说明

图1是本发明的卷积神经网络的示意图。

具体实施方式

一种基于注意机制卷积神经网络的显著性目标检测方法，其特征在于：所述卷积神经网络包括输入层、多维特征提取层MFE1至MFE5、全局特征提取层global、卷积层CON-1至CON-5、空间注意模块SA、通道注意模块CA、对比信息提取层CT-1至CT-5、特征融合层Dcon-2至Dcon-5、局部特征提取层、分类预测层和输出层；所述输入层将输入图像转换为预设维度的张量后依次经多维特征提取层MFE1至MFE5、全局特征提取层global处理后得到全局特征张量U_G；所述多维特征提取层MFE1至MFE5分别提取第一至第五尺度特征张量f₁-f₅；所述第一至第五尺度特征张量f₁-f₅分别经所述卷积层CON-1至CON-5处理得到第一至第五尺度高层特征x₁-x₅；所述第四尺度高层特征x₄经空间注意模块CA处理后得到通道注意特征X′₄，所述第二尺度高层特征x₂和通道注意特征X′₄经空间注意模块SA处理后得到空间注意特征X′₂，所述第一尺度高层特征x₁、空间注意特征X′₂、第三尺度高层特征x₃、通道注意特征X′₄、第五尺度高层特征x₅分别经过对比信息提取层CT-1至CT-5处理得到第一至第五对比特征第五尺度高层特征x₅和第五对比特征/>经特征融合层Dcon-5处理后得到第五特征张量U₅，第四尺度高层特征x₄和第四对比特征/>和第五特征张量U₅经特征融合层Dcon-4处理后得到第四特征张量U₄，第三尺度高层特征x₃和第三对比特征/>和第四特征张量U₄经特征融合层Dcon-3处理后得到第三特征张量U₃，第二尺度高层特征x₂和第二对比特征/>和第三特征张量U₃经特征融合层Dcon-2处理后得到第二特征张量U₂，第一尺度高层特征x₁和第一对比特征/>和第二特征张量U₂经局部特征提取层处理后得到局部特征张量U_L，局部特征张量U_L和全局特征张量U_G经分类预测层Softmax处理后得到显著性特征，显著性特征经过输出层输出显著性图；训练集的已标注训练图像输入输入层，进行网络训练；

参照图1，对本发明做进一步的详细描述。预测包括以下步骤：

步骤1：针对任意输入图像，将其强制转换成(1×352×352×3)的张量X。

步骤2：将张量X作为输入，放到VGG16的前五层网络中进行卷积和最大池化处理，得到五种不同尺度不同维度的特征张量{1×176×176×64、1×88×88×128、1×44×44×256、1×22×22×512、1×11×11×512}。

步骤3：针对第五尺度的特征张量1×11×11×512，采用两次双线性插值法及一次卷积操作提取全局特征，其中卷积核大小为1×1，padding值为VALID，通道数为2，得到特征张量X_G为1×176×176×2。

步骤4：设计五个相同设置的卷积块处理步骤2中五种尺度的特征图，其中卷积核大小为3×3，步长为1，padding值为SAME，通道数为128，得到五种特征张量为{1×176×176×128、1×88×88×128、1×44×44×128、1×22×22×128、1×11×11×128}，记为X_i(i＝1,2,3,4,5)。

步骤5：针对第四尺度的特征张量1×22×22×128，加入通道注意机制，优化深层目标区域信息，输出张量仍为1×22×22×128。

通道注意模块处理过程：

第一步，对上层传播的第四尺度特征进行全局平均池化处理，得到不同通道下的特征图向量v^h。

第二步，采用两个全连接层对特征向量v^h进行显著性映射，以获得基于通道方向特征之间的依赖关系。

第三步，将两个全连接层设置在非线性函数的两端，并通过Sigmoid归一化处理，将通道方向的特征向量映射到[0,1]。其计算公式如下：

CA＝F(v^h,W)＝σ₁(fc₂(δ(fc₁(v^h,W₁)),W₂))

其中，W表示通道方向注意模块的参数，σ₁表示Sigmoid运算，fc₁和fc₂分别表示两个全连接层，δ表示Relu非线性激活函数。该模块的输出X′₄是通过第四尺度高层特征X₄和CA加权所得。

X′₄＝CA·X₄

步骤6：针对第二尺度特征向量1×88×88×128，加入空间注意模块，优化浅层目标的边界信息，输出张量仍为1×88×88×128。

空间注意模块的处理过程：

第一步，分别采用卷积核为1×k和k×1的卷积层对通道注意模块输出X′₄进行卷积操作。

其中，W代表空间注意模块中的参数，conv₁和conv₂分别代表1×K×C和K×1×1的卷积层，本发明中设置K＝9。

第二步，将卷积后的结果C₁和C₂进行结合，并用Sigmoid运算进行归一化处理。

SA＝F(X′₄,w)＝σ₂(C₁+C₂)

其中，σ2代表Sigmoid激活函数，SA表示归一化后的特征，模型最后输出X′₂由第二尺度特征X₂与SA相乘所得。

X′₂＝SA·X₂

为方便计算，步骤5和步骤6中的X′₄和X′₂仍采用X₄和X₂代替。

步骤7：对比信息提取。采用平均池化层分别处理以上五种不同尺度相同维度的特征，五种输出张量的形式保持不变，记为。

其中，表示对比信息提取后的特征图，X_i表示上一层提取的多尺度特征，AvgPool(X_i)表示平均池化处理。

步骤8：融合五种尺度的特征，得到最终的局部特征图，张量为1×176×176×2。

8a)在第五尺度下，本发明结合张量X₅和张量进行CONCAT融合，得到特征张量1×11×11×256，再对其进行反卷积操作，卷积核为5×5，步长为2，padding值为SAME，通道数为128，得到特征张量U₅为1×22×22×128。

8b)在第四尺度下，本发明结合张量X₄、及U₅，进行CONCAT融合，得到特征张量1×22×22×384，再对其进行反卷积操作，卷积核为5×5，步长为2，padding值为SAME，通道数为256，得到特征张量U₄为1×44×44×256。

8c)在第三尺度下，本发明结合张量X₃、及U₄，进行CONCAT融合，得到特征张量1×44×44×512，再对其进行反卷积操作，卷积核为5×5，步长为2，padding值为SAME，通道数为384，得到特征张量U₃为1×88×88×384。

8d)在第二尺度下，本发明结合张量X₂、及U₃，进行CONCAT融合，得到特征张量1×88×88×640，再对其进行反卷积操作，卷积核为5×5，步长为2，padding值为SAME，通道数为512，得到特征张量U₂为1×176×176×512。

8e)在第一尺度下，本发明结合张量X₁、及U₂，进行CONCAT融合，得到特征张量1×176×176×768，再对其进行卷积处理，卷积核为1×1，步长为1，padding值为VALID，通道数为2，得到特征张量X_L为1×176×176×2。

步骤9：融合特征X_G和X_L。本发明采用两个线性算子(W_L，b_L)和(W_G，b_G)来分别表示局部特征X_L和全局特征X_G，将两者结合得到一个最终的线性组合，并用Softmax函数进行分类预测。

其中，y(v)＝c表示显著图中像素划分为正确类，为本发明最终输出结果。

步骤10：模型训练。本发明采用一种融合交叉熵损失和IOU边界损失的混合损失函数进行联合训练。

交叉熵损失函数定义：

其中，表示预测结果，y(v)表示真值结果。

IOU边界损失函数定义：

其中，C_j表示基于真值图的边界像素，C_j表示模型预测图的边界像素，IOU loss的范围是[0,1]。

模型最终混合损失函数定义为：

Claims

1.一种基于注意机制卷积神经网络的显著性目标检测方法，其特征在于：包括以下步骤：

步骤1：卷积神经网络训练

所述卷积神经网络包括输入层、多维特征提取层MFE1至MFE5、全局特征提取层global、卷积层CON-1至CON-5、空间注意模块SA、通道注意模块CA、对比信息提取层CT-1至CT-5、特征融合层Dcon-2至Dcon-5、局部特征提取层、分类预测层和输出层；所述输入层将输入图像转换为预设维度的张量后依次经多维特征提取层MFE1至MFE5、全局特征提取层global处理后得到全局特征张量U_G；所述多维特征提取层MFE1至MFE5分别提取第一至第五尺度特征张量f₁-f₅；所述第一至第五尺度特征张量f₁-f₅分别经所述卷积层CON-1至CON-5处理得到第一至第五尺度高层特征x₁-x₅；所述第四尺度高层特征x₄经空间注意模块CA处理后得到通道注意特征X'₄，所述第二尺度高层特征x₂和通道注意特征X'₄经空间注意模块SA处理后得到空间注意特征X′₂，所述第一尺度高层特征x₁、空间注意特征X′₂、第三尺度高层特征x₃、通道注意特征X'₄、第五尺度高层特征x₅分别经过对比信息提取层CT-1至CT-5处理得到第一至第五对比特征第五尺度高层特征x₅和第五对比特征/>经特征融合层Dcon-5处理后得到第五特征张量U₅，第四尺度高层特征x₄和第四对比特征/>和第五特征张量U₅经特征融合层Dcon-4处理后得到第四特征张量U₄，第三尺度高层特征x₃和第三对比特征/>和第四特征张量U₄经特征融合层Dcon-3处理后得到第三特征张量U₃，第二尺度高层特征x₂和第二对比特征/>和第三特征张量U₃经特征融合层Dcon-2处理后得到第二特征张量U₂，第一尺度高层特征x₁和第一对比特征/>和第二特征张量U₂经局部特征提取层处理后得到局部特征张量U_L，局部特征张量U_L和全局特征张量U_G经分类预测层Softmax处理后得到显著性特征，显著性特征经过输出层输出显著性图；训练集的已标注训练图像输入输入层，进行网络训练；

步骤2：显著性检测

将待预测图像输入输入层，预测显著性图；

所述通道注意模块CA首先对第四尺度高层特征x₄进行全局平均池化处理，得到各通道下的特征向量v^h，然后采用两个全连接层对特征向量v^h进行显著性映射，获得基于通道方向特征之间的依赖关系，再将两个全连接层设置在非线性函数的两端，并通过Sigmoid归一化处理，将通道方向的特征向量映射到[0,1]，其计算公式为：

CA＝σ₁(fc₂(δ(fc₁(v^h,W₁)),W₂))

X′₄＝CA·X₄。

2.根据权利要求1所述的基于注意机制卷积神经网络的显著性目标检测方法，其特征在于：所述输入层采用超分辨率方法将输入图像转换为预设维度的张量。

3.根据权利要求1所述的基于注意机制卷积神经网络的显著性目标检测方法，其特征在于：所述全局特征提取层global采用两次双线性插值法及一次卷积操作提取全局特征张量U_G，所述卷积操作的卷积核大小为1×1，padding值为VALID，通道数为2。

4.根据权利要求1所述的基于注意机制卷积神经网络的显著性目标检测方法，其特征在于：所述卷积层CON-1至CON-5结构相同，卷积核大小为3×3，步长为1，padding值为SAME，通道数为128。

5.根据权利要求1所述的基于注意机制卷积神经网络的显著性目标检测方法，其特征在于：所述空间注意模块分别采用卷积核为1×k和k×1的卷积层对通道注意模块输出X′₄进行卷积操作：

SA＝F(X′₄,w)＝σ₂(C₁+C₂)

X′₂＝SA·X₂。

6.根据权利要求1所述的基于注意机制卷积神经网络的显著性目标检测方法，其特征在于：特征融合层Dcon-1的卷积核为1×1，步长为1，padding值为VALID，通道数为2；特征融合层Dcon-2的卷积核为5×5，步长为2，padding值为SAME，通道数为512；特征融合层Dcon-3的卷积核为5×5，步长为2，padding值为SAME，通道数为384；特征融合层Dcon-4的卷积核为5×5，步长为2，padding值为SAME，通道数为256；特征融合层Dcon-5的卷积核为5×5，步长为2，padding值为SAME，通道数为128。