CN111401473A

CN111401473A - 基于注意力机制卷积神经网络的红外目标分类方法

Info

Publication number: CN111401473A
Application number: CN202010272490.6A
Authority: CN
Inventors: 邓秋群; 肖山竹; 陶华敏; 卢焕章; 张焱; 胡谋法; 赵菲; 张路平; 杨卫平; 石志广; 沈杏林
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2020-04-09
Filing date: 2020-04-09
Publication date: 2020-07-10
Anticipated expiration: 2040-04-09
Also published as: CN111401473B

Abstract

本申请涉及一种基于注意力机制卷积神经网络的红外目标分类方法。所述方法包括：根据红外目标数据构建目标数据库，建立用于模型训练的训练集和测试集，将红外目标数据输入预先设置的卷积神经网络，通过卷积层得到红外目标数据对应的卷积特征，根据训练集，对卷积特征进行训练，得到每个卷积特征对应的归一化权值，将卷积特征和对应的归一化权值进行点乘之后输入卷积神经网络的第一全连接层中，对第一全连接层的网络权重进行反向训练，根据测试集确定卷积神经网络训练完成，得到分类模型，将待分类红外目标数据输入分类模型，得到待分类红外目标数据的所属分类。采用本方法能够有效提高网络的泛化能力和分类的准确性。

Description

基于注意力机制卷积神经网络的红外目标分类方法

技术领域

本申请涉及红外目标识别技术领域，特别是涉及一种基于注意力机制卷积神经网络的红外目标分类方法。

背景技术

目标识别在红外成像探测系统中发挥着重要作用。在进行远距离红外探测时，目标在成像平面通常呈现为点目标，能够利用的信息十分有限，给识别带来极大的挑战。通过多帧图像的能量累积，获取目标的灰度时间序列，为点目标的识别提供一种有效的解决思路。

传统的方法依赖于人工特征提取和分类器的设计，需要对目标特性具有全面深入的分析和理解，存在费时耗力以及对目标和环境的适应性较差的问题，因此，目前的红外目标识别中分类器的泛化能力弱以及分类准确率低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够解决分类器的泛化能力弱以及分类准确率低问题的基于注意力机制卷积神经网络的红外目标分类方法、装置、计算机设备和存储介质。

一种基于注意力机制卷积神经网络的红外目标分类方法，所述方法包括：

根据红外目标数据构建目标数据库，根据所述目标数据库建立用于模型训练的训练集和测试集；

从所述训练集中获取红外目标数据，将所述红外目标数据输入预先设置的卷积神经网络，通过卷积层得到所述红外目标数据对应的卷积特征；

根据所述训练集，对所述卷积特征进行训练，得到每个所述卷积特征对应的归一化权值；

将所述卷积特征和对应的归一化权值进行点乘之后输入卷积神经网络的第一全连接层中对所述第一全连接层的网络权重进行反向训练；

根据所述测试集确定所述卷积神经网络训练完成，得到分类模型；

将待分类红外目标数据输入所述分类模型，得到待分类红外目标数据的所属分类。

在其中一个实施例中，还包括：根据点源红外辐射理论，仿真生成目标对应的红外辐射强度序列；根据所述红外辐射强度序列构建目标数据库。

在其中一个实施例中，还包括：将所述卷积特征进行全局平均池化，得到池化特征如下：

其中，F_global(·)表示池化特征，L表示卷积特征的特征长度，v_M(i)表示卷积特征v_M中第i个特征。

在其中一个实施例中，还包括：根据所述训练集，得到所述卷积层输出的卷积特征向量为V＝[v₁,v₂,…,v_M]；其中，M表示卷积特征的数量；根据第二全连接层对所述卷积特征向量进行非线性变换，通过softmax对非线性变换结果进行归一化，得到每个卷积特征对应的归一化权值。

在其中一个实施例中，还包括：将所述卷积特征和对应的归一化权值进行点乘，得到第一全连接层的输入特征为：

y_M＝F_scale(v_M,s_M)＝s_M·v_M

其中，y_M表示输入特征，s_M表示归一化权值，v_M表示卷积特征；将所述输入特征输入卷积神经网络的全连接层中，输出所述输入特征对应的标签；根据预先设置的损失函数对网络权重进行反向训练。

一种基于注意力机制卷积神经网络的红外目标分类装置，所述装置包括：

数据库模块，用于根据红外目标数据构建目标数据库，根据所述目标数据库建立用于模型训练的训练集和测试集；

卷积模块，用于从所述训练集中获取红外目标数据，将所述红外目标数据输入预先设置的卷积神经网络，通过卷积层得到所述红外目标数据对应的卷积特征；

注意力模块，用于根据所述训练集，对所述卷积特征进行训练，得到每个所述卷积特征对应的归一化权值；

训练模块，用于将所述卷积特征和对应的归一化权值进行点乘之后输入卷积神经网络的第一全连接层中对所述第一全连接层的网络权重进行反向训练；根据所述测试集确定所述卷积神经网络训练完成，得到分类模型；

分类模块，用于将待分类红外目标数据输入所述分类模型，得到待分类红外目标数据的所属分类。

在其中一个实施例中，所述数据库模块还用于根据点源红外辐射理论，仿真生成目标对应的红外辐射强度序列；根据所述红外辐射强度序列构建目标数据库。

在其中一个实施例中，注意力模块还用于根据所述训练集，得到所述卷积层输出的卷积特征向量为V＝[v₁,v₂,…,v_M]；其中，M表示卷积特征的数量；根据第二全连接层对所述卷积特征向量进行非线性变换，通过softmax对非线性变换结果进行归一化，得到每个卷积特征对应的归一化权值。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

上述基于注意力机制卷积神经网络的红外目标分类方法、装置、计算机设备和存储介质，通过引入卷积神经网络，提高对红外目标分类的准确性，另一方面，引入注意力机制，通过归一化权值，获得不同卷积特征之间的关系，增强分类中的重要信息，抑制不重要的信息，从而提高网络的泛化能力，本发明实施例实现了准确的红外目标分类以及提高了网络的泛化能力。

附图说明

图1为一个实施例中卷积神经网络的结构示意图；

图2为一个实施例中基于注意力机制卷积神经网络的红外目标分类方法的流程示意图；

图3为一个实施例中构建目标数据库步骤的流程示意图；

图4为一个实施例中基于注意力机制卷积神经网络的红外目标分类装置的结构框图；

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的基于注意力机制卷积神经网络的红外目标分类方法，可以应用在终端中，在终端中，预先构建卷积神经网络，卷积神经网络的结构如图1所示，特征提取层和分类层组成，特征提取层包括三个卷积模块、两个最大池化模块、全局平均池化模块以及注意力模块，旨在学习具有泛化能力的特征表达。分类层采用全连接模块实现，其中卷积模块由一维卷积、实例归一化、PReLU激活函数和Dropout层组成。值得说明的是，对卷积模块的输出进行最大池化模块，可以减少网络的数据计算量，因此设置最大池化模块和卷积模块的数量可以根据需求设置，本发明的卷积神经网络最少需要一个卷积模块和一个最大池化模块。

在终端中构建好卷积神经网络之后，可以获取预先标注的红外目标数据，从而构建目标数据库，以得到用于模型训练的训练集和测试集，卷积神经网络训练完成之后，终端可以接收待分类红外目标数据，从而完成待分类数据的分类。

在一个实施例中，如图2所示，提供了一种基于注意力机制卷积神经网络的红外目标分类方法，以该方法应用于终端为例进行说明，包括以下步骤：

步骤202，根据红外目标数据构建目标数据库，根据目标数据库建立用于模型训练的训练集和测试集。

本申请的红外目标数据为基于理论计算和计算机仿真生成，红外目标数据为进行远距离红外探测时，生成的点目标，由于点目标信息有限，经过多帧能量累积，检测到的目标数据为灰度时间序列，灰度时间序列反映的是目标红外辐射强度的变化规律，因此可将目标分类问题转化为目标红外辐射强度序列的分类。待分类的4类目标为：平底锥目标、球底锥目标、柱底锥目标和弧形碎片。

目标数据库即为已标注数据的数据库，从而可以根据目标数据库建立用于模型训练的训练集和测试集，训练集中的数据用于进行网络参数的反向训练，测试集用于测试网络的可行性。

步骤204，从训练集中获取红外目标数据，将红外目标数据输入预先设置的卷积神经网络，通过卷积层得到红外目标数据对应的卷积特征。

卷积神经网络是通过卷积层提取特征，本步骤中可以通过卷积处理将红外目标数据处理为一维卷积特征。

在具体处理时，提取卷积特征时还需要对卷积处理的一维卷积特征进行实例归一化、激活函数处理以及Dropout处理，再进行最大池化，防止数据过拟合。

步骤206，根据训练集，对卷积特征进行训练，得到每个卷积特征对应的归一化权值。

获取红外目标数据的卷积特征之后，还需要为每个卷积特征分配权值，此时，需要采用归一化的方式获取全局信息，从而得到每个卷积特征的归一化权值。

步骤208，将卷积特征和对应的归一化权值进行点乘之后输入卷积神经网络的第一全连接层中对第一全连接层的网络权重进行反向训练。

点乘即为两个向量做内积。

步骤210，根据测试集确定所述卷积神经网络训练完成，得到分类模型。

步骤212，将待分类红外目标数据输入分类模型，得到待分类红外目标数据的所属分类。

上述基于注意力机制卷积神经网络的红外目标分类方法中，通过引入卷积神经网络，通过卷积神经网络在自动特征提取上的突出性能，提高对红外目标识别的准确性，另一方面，引入注意力机制，通过建模不同卷积特征之间的关系，以及归一化权值来增强分类中的重要信息，抑制不重要的信息，从而提高网络的泛化能力，本发明实施例实现了准确的红外目标数据准确分类以及提高了网络的泛化能力。

在其中一个实施例中，对于点目标信息过少，无法获取到大量的红外目标数据进行模型训练，因此，采用如下方式可以解决点目标信息过少的问题，具体步骤如下：

步骤302，根据点源红外辐射理论，仿真生成目标对应的红外辐射强度序列。

具体的，待分类的四类目标为：平底锥目标、球底锥目标、柱底锥目标和弧形碎片，四类红外目标的仿真参数和探测器参数如表1所示：

表1四类红外目标的仿真参数和探测器参数

根据上述仿真参数和探测器参数可以生成红外目标的红外辐射强度序列。

步骤304，根据红外辐射强度序列构建目标数据库。

本实施例，可以解决红外点目标信息过少的问题，利用红外辐射强度序列可以实现对目标的分类。

在其中一个实施例中，在得到归一化权值之前，还需要同过多次的全局平均池化，具体步骤为：将所述卷积特征进行全局平均池化，得到池化特征如下：

本实施例中，特征在输入全连接层之前，若不经过池化，则计算量巨大，同过全局平均池化可以对模型训练进行简化，因此，同过本实施例可以减少全连接层的数据计算量。

在其中一个实施例中，提出一种注意力机制，即将每个卷积特征通过全局信息进行增强或者抑制，对于重要的信息，即目标数据库中出现数量多的数据，其计算得到归一化权值较大，目标数据库中出现数量少的数据，其计算得到的归一化权值较小，采用点乘的方式，可以增强重要的数据，以及抑制不重要的数据，具体步骤为：根据训练集，得到卷积层输出的卷积特征向量为V＝[v₁,v₂,…,v_M]；其中，M表示卷积特征的数量，根据第二全连接层对卷积特征向量进行非线性变换，通过softmax对非线性变换结果进行归一化，得到每个卷积特征对应的归一化权值。

归一化权值的表达式如下：

s＝σ(F_fc(g,W′))＝σ(δ(W′g))

其中，δ表示sigmoid激活函数，对不同的特征向量进行选择性的输出，σ表示softmax归一化。

本实施例中，通过计算归一化权值，然后通过归一化权值对卷积特征进行加权，从而引入注意力机制，增强重要的信息，抑制不重要的信息。

在其中一个实施例中，在特征提取完成之后，利用输入特征进行模型的训练，具体步骤为：将卷积特征和对应的归一化权值进行点乘，得到第一全连接层的输入特征为：

y_M＝F_scale(v_M,s_M)＝s_M·v_M

其中，y_M表示输入特征，s_M表示归一化权值，v_M表示卷积特征；将输入特征输入卷积神经网络的全连接层中，输出输入特征对应的标签，根据预先设置的损失函数对网络权重进行反向训练。

本实施例中，采用损失函数反向训练的方式，可以对网络权重进行调整，直至满足预先设置的训练参数之后，停止训练，得到分类模型。

具体的，训练参数的可以按照如下设置：训练批次大小100，训练600次，采用Adam优化器，初始学习率为0.01，β₁＝0.9，β₂＝0.999，ε＝10e-8，并采用学习率自适应对优化过程进行调节，当网络的评价指标验证集损失连续10次不再变化时，降低学习率，降低因子为0.1，当学习率低于0.0001时停止训练。

应该理解的是，虽然图2和3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2和3中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图4所示，提供了一种基于注意力机制卷积神经网络的红外目标分类装置，包括：数据库模块402、卷积模块404、注意力模块406、训练模块408和分类模块410，其中：

数据库模块402，用于根据红外目标数据构建目标数据库，根据所述目标数据库建立用于模型训练的训练集和测试集；

卷积模块404，用于从所述训练集中获取红外目标数据，将所述红外目标数据输入预先设置的卷积神经网络，通过卷积层得到所述红外目标数据对应的卷积特征；

注意力模块406，用于根据所述训练集，对所述卷积特征进行训练，得到每个所述卷积特征对应的归一化权值；

训练模块408，用于将所述卷积特征和对应的归一化权值进行点乘之后输入卷积神经网络的第一全连接层中，对所述第一全连接层的网络权重进行反向训练；根据所述测试集确定所述卷积神经网络训练完成，得到分类模型；

分类模块410，用于将待分类红外目标数据输入所述分类模型，得到待分类红外目标数据的所属分类。

在其中一个实施例中，数据库模块402还用于根据点源红外辐射理论，仿真生成目标对应的红外辐射强度序列；根据所述红外辐射强度序列构建目标数据库。

在其中一个实施例中，池化模块，用于将所述卷积特征进行全局平均池化，得到池化特征如下：

其中，Fglobal(·)表示池化特征，L表示卷积特征的特征长度，v_M(i)表示卷积特征v_M中第i个特征。

在其中一个实施例中，注意力模块406还用于根据所述训练集，得到所述卷积层输出的卷积特征向量为V＝[v₁,v₂,…,v_M]；其中，M表示卷积特征的数量；根据第二全连接层对所述卷积特征向量进行非线性变换，通过softmax对非线性变换结果进行归一化，得到每个卷积特征对应的归一化权值。

在其中一个实施例中，训练模块408还用于将所述卷积特征和对应的归一化权值进行点乘，得到第一全连接层的输入特征为：

y_M＝F_scale(v_M,s_M)＝s_M·v_M

关于基于注意力机制卷积神经网络的红外目标分类装置的具体限定可以参见上文中对于基于注意力机制卷积神经网络的红外目标分类方法的限定，在此不再赘述。上述基于注意力机制卷积神经网络的红外目标分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于注意力机制卷积神经网络的红外目标分类方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现上述实施例中方法的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于注意力机制卷积神经网络的红外目标分类方法，所述方法包括：

将所述卷积特征和对应的归一化权值进行点乘之后输入卷积神经网络的第一全连接层中，对所述第一全连接层的网络权重进行反向训练；

2.根据权利要求1所述的方法，其特征在于，所述根据红外目标数据构建目标数据库，包括：

根据点源红外辐射理论，仿真生成目标对应的红外辐射强度序列；

根据所述红外辐射强度序列构建目标数据库。

3.根据权利要求1所述的方法，其特征在于，在根据所述训练集，对所述卷积特征进行训练，得到每个所述卷积特征对应的归一化权值之前，所述方法还包括：

将所述卷积特征进行全局平均池化，得到池化特征如下：

4.根据权利要求1所述的方法，其特征在于，根据所述训练集，对所述卷积特征进行训练，得到每个所述卷积特征对应的归一化权值，包括：

根据所述训练集，得到所述卷积层输出的卷积特征向量为V＝[v₁,v₂,…,v_M]；其中，M表示卷积特征的数量；

根据第二全连接层对所述卷积特征向量进行非线性变换，通过softmax对非线性变换结果进行归一化，得到每个卷积特征对应的归一化权值。

5.根据权利要求1至4任一项所述的方法，其特征在于，将所述卷积特征和对应的归一化权值进行点乘之后输入卷积神经网络的全连接层中对所述全连接层的网络权重进行反向训练，包括：

将所述卷积特征和对应的归一化权值进行点乘，得到第一全连接层的输入特征为：

y_M＝F_scale(v_M,s_M)＝s_M·v_M

其中，y_M表示输入特征，s_M表示归一化权值，v_M表示卷积特征；

将所述输入特征输入卷积神经网络的全连接层中，输出所述输入特征对应的标签；

根据预先设置的损失函数对网络权重进行反向训练。

6.一种基于注意力机制卷积神经网络的红外目标分类装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，数据库模块还用于根据点源红外辐射理论，仿真生成目标对应的红外辐射强度序列；根据所述红外辐射强度序列构建目标数据库。

8.根据权利要求6所述的装置，其特征在于，注意力模块还用于根据所述训练集，得到所述卷积层输出的卷积特征向量为V＝[v₁,v₂,…,v_M]；其中，M表示卷积特征的数量；根据第二全连接层对所述卷积特征向量进行非线性变换，通过softmax对非线性变换结果进行归一化，得到每个卷积特征对应的归一化权值。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。