CN113469335B

CN113469335B - 一种利用不同卷积层特征间关系为特征分配权重的方法

Info

Publication number: CN113469335B
Application number: CN202110726926.9A
Authority: CN
Inventors: 陈永刚; 张一峰; 李章维
Original assignee: Hangzhou Zhongwei Digital Technology Co ltd
Current assignee: Hangzhou Zhongwei Digital Technology Co ltd
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2024-05-10
Anticipated expiration: 2041-06-29
Also published as: CN113469335A

Abstract

一种利用不同卷积层特征间关系为特征分配权重的方法，首先，确定要关注的特征层A，取出A对应的前一层特征A'，A和A'通道数需相同，其次利用全局平均池化获得它们的通道特征，利用RELU‑Dot‑Product函数计算通道间的关系，然后将关系矩阵输入到第一个全连接层进行权重学习，该全连接的输出维度为A通道数的1/16以控制网络的参数量，第一个全连接层的输出输入到第二个全连接层，再次进行权重学习，该层的输出维度和A的通道数目相同，最后对此输出进行填充，填充到和A一样的维度做Hadamar积，为A的每个通道分配权重。本发明可以更加突出卷积层中重要的特征，抑制不重要的特征，提升网络的检测效果。

Description

一种利用不同卷积层特征间关系为特征分配权重的方法

技术领域

本发明涉及计算机视觉、模式识别与计算机应用领域，具体而言涉及一种利用不同卷积层特征间关系为特征分配权重的方法。

背景技术

注意力机制可以大幅度提升网络的检测效果而只需要增加较少参数和计算量，因此它在神经网络中的地位越来越重要，是提升网络检测效果的核心手段之一。常用的注意力机制有通道注意力机制、空间注意力机制、通道-空间注意力机制。SENet是一种广泛使用的通道注意力机制，它通过将某一层的特征用平均池化进行特征变换，再利用全连接层让网络自己学习该层特征的权重，是一种直接由特征获取权重的方式。大多数的注意力机制采用和SENnet类似的模式，不同点在于输入全连接层前的特征变换不一样。

调研文献发现，有许多根据特征学习权重的注意力模块被提出。如：scSENet(Abhijit R,Nassir N,Christian W.Concurrent Spatial and Channel‘Squeeze&Excitation’in Fully Convolutional Networks[J].Medical Image Computing andComputer Assisted Intervention-MICCAI,2018,1107:2011-2023.即：Abhijit R等.应用在全卷机网络中的并行空间和通道‘挤压&激发’网络[J].医学图像计算和计算机辅助干预-MICCAL，2018,1107:2011-2023)、CBAM(S.Woo,J.Park,J.Y.Lee,I.S.Kweon.CBAM:Convolutional Block Attention Module[C].Proceedings of the EuropeanConference on Computer Vision and Pattern Recognition,2018:3-19.即S.Woo等CBAM：卷积阻塞注意力模块[C].计算机视觉和模式识别欧洲会议记录，2018:3-19.)、BAM(Park J,Woo S,Lee J,Kweon I.BAM:Bottleneck Attention Module[C].ComputerVision and Patten Recognition(CVPR)(2018)arXiv:1807.06514v2.即Park J等.瓶颈注意力模块[C].计算机视觉会议，2018，arXiv:1807.06514v2)、DANet(J.Fu,J.Liu,H.Tian,Y.Li,Y.Bao,Z.Fang,H.Lu.Dual Attention Network for Scene Segmentation[C].Proceedings of the IEEE Conference on Computer Vision and PatternRecognition,2019:3141-3149.即J.Fu等，用于场景分割的双重注意力网络[C].IEEE国际计算机视觉与模式识别会议，2019:3141-3149.)。上述注意力模块，均是直接对某一层的特征进行操作，或是直接对通道特征进行变换或是直接对空间特征进行变换，然后利用全连接层得到该层特征的权重。直接通过特征来学习该层特征的权重没有有效的利用特征之间的关系，利用特征之间的关系来学习某个特征的权重可以进一步提取出重要的特征，提升网络的检测效果。

综上所述，挖掘特征间的关系并采用注意力模块中直接由特征学习权重的方式对挖掘出的关系进行学习，学习到的权重可以更加突出重要特征，抑制不重要特征，进一步提升网络检测效果。

发明内容

为了克服已有的注意力模块学习到的权重没有利用特征间关系的不足，本发明提出一种挖掘前一层通道与当前层通道的关系，通过网络对这种关系的学习为当前层特征分配权重的方法。

本发明解决其技术问题所采用的技术方案是：

一种利用不同卷积层特征间关系为特征分配权重的方法，所述方法包括以下步骤：

1)输入当前层卷积层与前一层卷积层的输出A、A'，A与A'的通道数需相同，利用全局平均池化分别获得A和A'的通道信息X、X'；

2)对X'做转置操作，并对X和X'的转置做矩阵乘法，得到X和X'的特征关系矩阵M；

3)使用RELU函数，滤除M中小于0的元素；

4)将M输入第一个全连接层，该全连接的输出L₁(M)维度为原始输入A的通道数的1/16；

5)将L₁(M)输入第二个全连接层，该全连接层的输出L₂(M)维度和原始输入A的通道数目相同；

6)L₂(M)中的元素即是A的各个通道应该被赋予的权重值，对L₂(M)进行填充，将其扩充到与A一样的维度；

7)填充后的L₂(M)中各个元素与A中的各个元素对应相乘，给A中的各个通道分配权重。

本发明的技术构思为：计算当前卷积层的输出与前一层卷积层的输出间的通道关系，让网络对计算出的关系进行学习，得到当前层特征的权重矩阵，根据权重矩阵为当前层特征分配权重。首先要确定需要分配权重的卷积层的特征A，然后取出与之对应的前一层卷积层的特征A'(A和A'的通道数目要一致)，用全局平均池化分别获得A和A’的通道特征X、X'。X和X'的转置做矩阵乘法，得到X和X'各通道之间的关系，得到关系矩阵M。将M输入到第一个全连接层L₁进行权重学习，L₁的输出维度是输入A的通道数的1/16以控制参数量，L₁的输出作为第二个全连接层L₂的输入近一步进行权重学习，L₂输出的维度与原始输入A的通道数目一致，L₂的输出即是A的通道特征的权重，对L₂的输出进行填充，将其填充到与A一样的维度，将填充后的结果中的各个元素与A中的各个元素对应位置相乘，给A分配权重。

本发明的有益效果表现在：以层与层特征间的关系为基础，让网络通过对该关系学习获得当前层特征的权重，与直接通过特征来学习权重的方法相比，学习出的权重可以进一步提取出该层比较重要特征，抑制不重要的特征；在特征学习时，本发明采用与SENet类似的结构，因此本发明不仅具有计算量小、使用方便的优点，而且在对网络的效果提升方面，本发明也胜过SENet。

附图说明

图1为一种利用不同卷积层特征间关系为特征分配权重方法的结构示意图。

图2为一种利用不同卷积层特征间关系为特征分配权重方法嵌入ResNet的结构示意图

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1和图2，一种利用不同卷积层特征间关系为特征分配权重的方法，包括以下步骤：

1)输入当前卷积层的输出A以及前一层卷积层的输出A'，利用全局平均池化(Avgpool)获得A和A'的通道信息X和X'；

2)对X'进行转置，X与X'的转置做矩阵乘法，学习权重矩阵M；

3)使用RELU函数滤除M中小于0的元素；

4)将M输入第一个全连接层L1进行权值学习，L1的输出维度为A的通道数1/16；

本实施例以嵌入ResNet并应用于图像分类任务为例，一种利用特征间关系为特征分配权重的方法包括以下步骤：

1)确定输入：当前层的卷积输出A的维度是B×C×H×W(B、C、H、W分别为batch_size,通道数，特征图的高，特征图的宽)，前一层的卷积输出A'的维度为B×C×H×W；

2)利用全局平均池化(Avgpool)获得A和A'的通道信息X、X':X维度是B×C

×1×1；X'维度是B×C×1×1

3)将X和X'进行维度压缩：X的维度是B×C×1，X'的维度是B×C×1

4)对X'进行转置，X'的维度是B×1×C

5)X与X'的转置做矩阵乘法学习权值矩阵M：M的维度是B×C×C；

6)使用RELU函数滤除M中小于0的元素；

7)将M输入第一个全连接层L1，输出的维度是B×C/16

8)将L1的输出输入第二个全连接层L2，输出的维度是B×C

9)对L2的输出进行填充，维度变成B×C×H×W

10)将扩充后的输出与A中对应位置元素相乘，为A分配权重。

11)ResNet的每个basic_block中均按上述步骤为每个basic_block的输出分配权重，

最后一个basic_block的输出输入全连接层进行类别预测。

以上说明是本发明以嵌入ResNet并应用于图像分类任务为例进行的说明，并非限定本发明的实施范围，在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进，不应排除在本发明的保护范围之外。

Claims

1.一种利用特征间关系为特征分配权重的方法，其特征在于，该方法应用于图像分类任务，所述方法包括以下步骤：

1)确定输入：当前层的卷积输出A的维度是B×C×H×W，B、C、H、W分别为batch_size、通道数、特征图的高和特征图的宽，前一层的卷积输出A'的维度为B×C×H×W；

2)利用全局平均池化获得A和A'的通道信息X、X':X维度是B×C×1×1；X'维度是B×C×1×1；

3)将X和X'进行维度压缩：X的维度是B×C×1，X'的维度是B×C×1；

4)对X'进行转置，X'的维度是B×1×C；

5)X与X'的转置做矩阵乘法学习权值矩阵M：M的维度是B×C×C；

6)使用RELU函数滤除M中小于0的元素；

7)将M输入第一个全连接层L1，输出的维度是B×C/16；

8)将L1的输出输入第二个全连接层L2，输出的维度是B×C；

9)对L2的输出进行填充，维度变成B×C×H×W；

10)将扩充后的输出与A中对应位置元素相乘，为A分配权重；

11)ResNet的每个basic_block中均按上述步骤为每个basic_block的输出分配权重，最后一个basic_block的输出输入全连接层进行类别预测。