CN114723049A

CN114723049A - 一种基于梯度优化的类激活映射方法及装置

Info

Publication number: CN114723049A
Application number: CN202210450329.2A
Authority: CN
Inventors: 曾春艳; 严康; 王志锋; 万相奎; 冯世雄; 孔帅; 余琰; 夏诗言; 崔浩
Original assignee: Hubei University of Technology
Current assignee: Hubei University of Technology
Priority date: 2022-04-26
Filing date: 2022-04-26
Publication date: 2022-07-08

Abstract

本发明涉及一种基于梯度优化的类激活映射方法及装置。首先将电气设备图像输入至已训练好的卷积神经网络提取目标卷积层的特征图，同时网络输出能预测该图像类别的分数，利用反向传播计算特征图相对于分数的梯度；对得到的梯度进行优化处理，并使所有梯度都转换为正梯度后得到正相关梯度，将正相关梯度进行全局平均池化操作得到权重，最后将权重与特征图线性结合，并进行上采样和归一化操作得到初始类激活图；将得到的初始类激活图与输入图像点乘后再送入卷积神经网络，经过softmax操作后得到分数；将的分数与初始类激活图相乘，ReLU操作后得到最后的类激活图。本发明通过优化梯度使类激活图中显著性区域更加集中。

Description

一种基于梯度优化的类激活映射方法及装置

技术领域

本发明涉及计算机视觉、深度学习可解释性领域，主要涉及一种基于梯度优化的类激活映射方法及装置。

背景技术

近几年，深度学习的可解释性成为当前人工智能领域研究的新课题，引起了学术界和企业界的高度关注。深度学习可解释性是指模型决策结果以可理解的方式向人类呈现，它有助于人们理解复杂模型的内部工作机制、做出特定决策的依据、以及系统的可靠性。为了提高模型透明度，诸多可解释性方法被提出，主要包括基于梯度方法、基于类激活映射方法、基于扰动解释方法。基于类激活映射方法是目前最先进的可视化显著图技术，根据权重获取方式的不同，该方法又分为基于梯度(Gradient-based)、无梯度(Gradient-free)两大类。基于梯度的类激活映射方法使用反向传播中获取的通道梯度均值作为通道权重，再与激活图线性结合生成类激活图来可视化CNN的关注区域。该方法生成的类激活图具有较好的类别区分性，但其类激活图也存在较粗糙、具有一定噪声、会定位到与决策无关的特征等缺点。

通过对几种典型的基于类激活方法的原理分析可知，它们生成类激活图的方式大致相同，都是由权重和最高层特征图加权求和得到的，不同点在于权重的获取方式以及对应的数值。CAM的权重

来自于softmax层某个类别神经元的连接权值。Grad-CAM的权重

来自于反向传播获取的通道梯度均值。Score-CAM的权重

来自于特征图的CIC分数。因此当选定的CNN模型、目标卷积层、特征图都相同时，类激活图的质量主要取决于权重的获取方式以及对应的数值。为了获得视觉效果更好的类激活图，基于类激活映射方法的研究重点在于合适权重的获取。其中Gradient-based CAM方法均使用反向传播获取的通道梯度均值作为通道权重，对应的显著图会存在一定的噪音，而且数值为负的梯度会影响类激活图显著性区域的集中性，正梯度可以增强输出神经元激活的视觉特征。为解决Gradient-based CAM方法的缺点，本发明提出一种新的CAM变体方法—Abs-CAM(Absolute valueClass Activation Mapping-based)。该方法在Grad-CAM的基础上，对反向传播求导得到的梯度进行优化，通过取绝对值的策略将梯度全部变成正梯度，使类激活图中显著性区域更加集中。受RISE、Score-CAM框架结构的启发，将其整体结构分为生成初始类激活图和生成最终类激活图两大部分。第一部分通过优化梯度使类激活图中显著性区域更加集中，第二部分将初始类激活图与原图叠加，增强类激活图的语义信息。

发明内容

本发明主要是解决现有Gradient-based CAM方法生成的类激活图存在较粗糙、具有一定噪声、会定位到与决策无关的特征等问题。如附图1所示，本发明提出一种基于梯度优化的类激活映射方法—Abs-CAM，生成的类激活图类激活图中显著性区域更加集中，区域边缘只有少量的冗余信息。

本发明的上述技术问题主要是通过下述技术方案得以解决的：

一种基于梯度优化的类激活映射方法，其特征在于，包括：

将电气设备图像输入至已训练好的卷积神经网络提取目标卷积层的特征图，同时网络输出能预测该图像类别的分数，利用反向传播计算特征图相对于分数的梯度；

对得到的梯度进行优化处理，并使所有梯度都转换为正梯度后得到正相关梯度，将正相关梯度进行全局平均池化操作得到权重，最后将权重与特征图线性结合，并进行上采样和归一化操作得到初始类激活图；

将得到的初始类激活图与输入图像点乘后再送入卷积神经网络，经过softmax操作后得到分数；

将的分数与初始类激活图相乘，ReLU操作后得到最后的类激活图

在上述的一种基于梯度优化的类激活映射方法，提取目标卷积层的特征图、输出目标类别分数、计算反向传播梯度；具体包括：

步骤1.1、提取目标卷积层的特征图：对于一张给定的电气设备图像X₀送入模型Y，提取Y中目标卷积层l的特征图A，A的第k个特征图表示为

步骤1.2、输出目标类别分数：经过softmax操作后，模型Y输出预测该图像类别的分数Y_c'(X₀)；

步骤1.3、计算反向传播梯度：通过反向传播计算A的第k个特征图

中空间位置(i,j)相对于Y_c'(X₀)分数的梯度

在上述的一种基于梯度优化的类激活映射方法，优化处理得到初始类激活图具体包括：

步骤2.1、优化梯度：通过取绝对值的处理策略优化梯度

加上绝对值将所有梯度都变为正梯度，得到正相关梯度

步骤2.2、全局平均池化得到权重：将正相关梯度

进行全局平均池化操作，得到权重

其中Z表示特征图

的像素数目；

步骤2.3、得到初始类激活图：将权重

与特征图

线性结合，并进行上采样和归一化操作得到初始类激活图M₀；

其中U表示上采样操作，S表示归一化操作。

在上述的一种基于梯度优化的类激活映射方法，点乘初始类激活图和输入图像获取得分具体包括：

步骤3.1、点乘初始类激活图和输入图像：将初始类激活图M₀与输入图像X₀点乘得到M₁；

M₁＝M₀·X (5)

步骤3.2、获取分数：然后将M₁送入模型，经过softmax后得到Y_c(M₁)。

在上述的一种基于梯度优化的类激活映射方法，最终类激活图的获取具体包括：

步骤4.1、将Y_c(M₁)与初始显著图M₀相乘，ReLU操作后得到最后的类激活图

一种基于梯度优化的类激活映射装置，其特征在于，包括：

第一模块：将电气设备图像输入至已训练好的卷积神经网络提取目标卷积层的特征图，同时网络输出能预测该图像类别的分数，利用反向传播计算特征图相对于分数的梯度；

第二模块：对得到的梯度进行优化处理，并使所有梯度都转换为正梯度后得到正相关梯度，将正相关梯度进行全局平均池化操作得到权重，最后将权重与特征图线性结合，并进行上采样和归一化操作得到初始类激活图；

第三模块：将得到的初始类激活图与输入图像点乘后再送入卷积神经网络，经过softmax操作后得到分数；

第四模块：将的分数与初始类激活图相乘，ReLU操作后得到最后的类激活图

因此，本发明具有如下优点：

1.对反向传播求导得到的梯度进行优化，通过取绝对值的策略将梯度全部变成正梯度，使类激活图中显著性区域更加集中。

2.受RISE、Score-CAM框架结构的启发，将其整体结构分为生成初始类激活图和生成最终类激活图两大部分。第一部分通过优化梯度使类激活图中显著性区域更加集中，第二部分将初始类激活图与原图叠加，增强类激活图的语义信息。

附图说明

附图1是本发明的基于梯度优化的类激活映射方法框架图。

具体实施方式

下面通过实施例，并结合附图，对本发明的技术方案作进一步具体的说明。

实施例：

本发明为一种基于梯度优化的类激活映射方法，本发明的算法流程图如图1所示，可以分为四部分：1)提取目标卷积层的特征图、输出目标类别分数、计算反向传播梯度；2)优化梯度、全局平均池化得到权重、得到初始类激活图；3)点乘初始类激活图和输入图像、获取得分；4)得到最终类激活图。

步骤一：提取目标卷积层的特征图、输出目标类别分数、计算反向传播梯度，步骤如下：

A、提取目标卷积层的特征图：对于一张给定的电气设备图像X₀送入模型Y，提取Y中目标卷积层l的特征图A，A的第k个特征图表示为

B、输出目标类别分数：经过softmax操作后，模型Y输出预测该图像类别的分数Y_c'(X₀)；

C、计算反向传播梯度：通过反向传播计算A的第k个特征图

中空间位置(i,j)相对于Y_c'(X₀)分数的梯度

步骤二：优化梯度、全局平均池化得到权重、得到初始类激活图，步骤如下：

A、优化梯度：通过取绝对值的处理策略优化梯度

加上绝对值将所有梯度都变为正梯度，得到正相关梯度

B、全局平均池化得到权重：将正相关梯度

进行全局平均池化操作，得到权重

其中Z表示特征图

的像素数目。

C、得到初始类激活图：将权重

与特征图

线性结合，并进行上采样和归一化操作得到初始类激活图M₀。

其中U表示上采样操作，S表示归一化操作

步骤三：点乘初始类激活图和输入图像、获取得分，步骤如下：

A、点乘初始类激活图和输入图像：将初始类激活图M₀与输入图像X₀点乘得到M₁。

M₁＝M₀·X (11)

B、获取分数：然后将M₁送入模型，经过softmax后得到Y_c(M₁)；

步骤四：得到最终类激活图，步骤如下：

A、将Y_c(M₁)与初始显著图M₀相乘，ReLU操作后得到最后的类激活图

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种基于梯度优化的类激活映射方法，其特征在于，包括：

2.根据权利要求1所述的一种基于梯度优化的类激活映射方法，其特征在于，提取目标卷积层的特征图、输出目标类别分数、计算反向传播梯度；具体包括：

中空间位置(i,j)相对于Y_c'(X₀)分数的梯度

3.根据权利要求1所述的一种基于梯度优化的类激活映射方法，其特征在于，优化处理得到初始类激活图具体包括：

步骤2.1、优化梯度：通过取绝对值的处理策略优化梯度

加上绝对值将所有梯度都变为正梯度，得到正相关梯度

步骤2.2、全局平均池化得到权重：将正相关梯度

进行全局平均池化操作，得到权重

其中Z表示特征图

的像素数目；

步骤2.3、得到初始类激活图：将权重

与特征图

其中U表示上采样操作，S表示归一化操作。

4.根据权利要求1所述的一种基于梯度优化的类激活映射方法，其特征在于，点乘初始类激活图和输入图像获取得分具体包括：

M₁＝M₀.X (5)

5.根据权利要求1所述的一种基于梯度优化的类激活映射方法，其特征在于，最终类激活图的获取具体包括：

6.一种基于梯度优化的类激活映射装置，采用权利要求1至5任意一项所述方法，其特征在于，包括：