CN110533107B

CN110533107B - 梯度增强型Softmax分类器系统、训练信号产生方法及其应用

Info

Publication number: CN110533107B
Application number: CN201910821917.0A
Authority: CN
Inventors: 孙琳钧; 李卫军; 宁欣; 张丽萍; 董肖莉
Original assignee: Institute of Semiconductors of CAS
Current assignee: Institute of Semiconductors of CAS
Priority date: 2019-08-30
Filing date: 2019-08-30
Publication date: 2020-11-13
Anticipated expiration: 2039-08-30
Also published as: CN110533107A

Abstract

一种梯度增强型Softmax分类器系统、训练信号产生方法及其应用，该分类器系统包括：得分计算模块，用于：将特征提取器提取的图像样本的特征向量与各个类别代理向量进行点积运算且进行归一化操作，并乘以一常数进行放缩之后得到图像样本对应各个类别的得分；以及损失计算模块，用于：通过所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值；将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数；以及将损失计算函数作为目标函数，进行最优化求解。在样本正确分类后也可以产生较强的监督信号，使得同类样本在特征空间中继续往类别中心聚集，其学习到的特征分布类别更加紧致，可区分性更强。

Description

梯度增强型Softmax分类器系统、训练信号产生方法及其应用

技术领域

本公开属于计算机视觉技术领域，涉及一种梯度增强型Softmax(软最大值)分类器系统、训练信号产生方法及其应用。

背景技术

近几年，图像分类问题是机器视觉领域中的研究热点，深度卷积神经网络的发展极大推动了图像分类技术的进步。通过对图像特征的分层抽象与数据驱动的训练方式，深度卷积神经网络可以学习到对类别变化鲁棒的图像特征。

现阶段，基于深度卷积神经网络的图像分类模型通常由两个部分构成：特征提取器和监督器。特征提取器将原始图像映射到特征空间，监督器使用提取的特征与图像的类别标签产生训练信号驱动特征提取器的学习，因此，监督器的特性直接影响特征提取器的特征提取能力进而影响分类性能。

发明内容

(一)要解决的技术问题

本公开提供了一种梯度增强型Softmax分类器系统、训练信号产生方法及其应用，以至少部分解决以上所提出的技术问题。

(二)技术方案

根据本公开的一个方面，提供了一种梯度增强型Softmax分类器系统，用作基于深度卷积神经网络的图像分类模型中训练特征提取器的监督器，包括：得分计算模块，用于：将特征提取器提取的图像样本的特征向量与各个类别代理向量进行点积运算且进行归一化操作，并乘以一常数进行放缩之后得到图像样本对应各个类别的得分；以及损失计算模块，用于：通过得分计算模块中所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值(softmax)；将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数；以及将损失计算函数作为目标函数，进行最优化求解，该目标函数的最优解满足：最大化类内得分且最小化类间得分。

在本公开的一实施例中，该分类器系统中，所述图像样本对应各个类别的得分的表达式如下：

其中，s_i表示图像样本在第i个类别上的得分，

表示w_i的转置，w_i为各个类别代理向量，其中i取值为1，2，…，C，C为类别的总个数；x表示图像样本的特征向量；α为一常数，用于对得分区间进行放缩；

表示

与x的点积运算；||*||表示二范数。

在本公开的一实施例中，该分类器系统中，所述通过得分计算模块中所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值的方法为：

基于图像样本的类别标签t，由得分计算模块得到该类别标签对应的类别的得分即为类内得分s_t；

基于图像样本的类别标签，将除去该类别标签对应的类别之外的其余类别计算软最大值，计算公式如下：

其中，s_s为类间得分的软最大值；log表示取对数运算；∑表示求和运算，e^*表示e指数运算。

在本公开的一实施例中，所述损失计算模块得到最优解对应的损失值后，还会基于误差反传与梯度下降法更新该梯度增强型Sofimax分类器系统中的类别代理向量并将误差信号反传给深度卷积神经网络用以监督特征提取器的训练。

在本公开的一实施例中，随着训练迭代次数的增加，该梯度增强型Softmax分类器系统的损失值关于所述各个类别的得分的梯度呈分层趋势。

根据本公开的另一个方面，提供了一种训练信号产生方法，基于本公开的梯度增强型Softmax分类器系统作为深度卷积神经网络的图像分类模型中训练特征提取器的监督器，来产生所述训练信号，该方法包括：

将特征提取器提取的图像样本的特征向量与各个类别代理向量进行点积运算且进行归一化操作，并乘以一常数进行放缩之后得到图像样本对应各个类别的得分；

通过所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值(softmax)；将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数；以及将损失计算函数作为目标函数，进行最优化求解，该目标函数的最优解满足：最大化类内得分且最小化类间得分。

在本公开的一实施例中，该训练信号产生方法还包括：得到最优解对应的损失值后，还会基于误差反传与梯度下降法更新该梯度增强型Softmax分类器系统中的类别代理向量并将误差信号反传给深度卷积神经网络用以监督特征提取器的训练。

在本公开的一实施例中，该随着训练迭代次数的增加，该梯度增强型Softmax分类器系统的损失值对所述各个类别的得分的梯度呈分层趋势。

在本公开的一实施例中，该方法中，所述图像样本对应各个类别的得分的表达式如下：

其中，s_i表示图像样本在第i个类别上的得分，

表示

与x的点积运算；||*||表示二范数。

在本公开的一实施例中，该方法中，通过所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值的方法为：

根据本公开的又一个方面，提供了一种梯度增强型Softmax分类器系统或者训练信号产生方法在图像分类中的应用。

(三)有益效果

从上述技术方案可以看出，本公开提供的梯度增强型Softmax分类器系统、训练信号产生方法及其应用，具有以下有益效果：

(1)与普通的Softmax分类器系统相比，梯度增强型Softmax分类器系统的区别点体现在两个模块：得分计算模块和损失计算模块，现有的Softmax分类器系统在样本正确分类后，其产生的监督信号急剧减弱，导致训练过程无法继续，所学习到的特征区分性不强，而本公开的梯度增强型Softmax分类器系统通过得分计算模块和损失计算模块的设置，最大化类内得分且最小化类间得分，在样本正确分类后也可以产生较强的监督信号，使得同类样本在特征空间中继续往类别中心聚集，其学习到的特征分布类别更加紧致，可区分性更强；改进了普通Softmax分类器系统中的得分计算方式并设计了新型的损失计算方法，缓解了普通Softmax分类中存在的梯度衰减问题，其产生的训练信号可以使特征提取器学习到区分性更强的特征。

(2)在得分计算模块中，采用点积的形式计算出图像样本对应各个类别的得分，即采用图像样本的特征向量与类别代理向量的余弦的形式作为图像样本在该类别的得分，使得图像的相似程度可直接使用特征的余弦进行度量；

(3)所述损失计算模块得到最优解对应的损失值后，还会基于误差反传与梯度下降法更新该梯度增强型Softmax分类器系统中的类别代理向量并将误差信号反传给深度卷积神经网络用以监督特征提取器的训练，即使训练样本在特征空间已经正确分类，本公开设置新型的损失计算模块还是会产生强度充足的梯度信号来训练特征提取器，进一步实现特征的类内距离最小化类间距离最大化的目的；反传给深度卷积神经网络的监督信号强，基于深度卷积神经网络的图像分类模型收敛快。

附图说明

图1为根据本公开一实施例所示的梯度增强型Softmax分类器系统的结构示意图。

图2为根据现有技术中的普通Softmax分类器系统在进行手写体数字分类任务的训练过程中，其损失值关于各个类别的得分的梯度变化曲线。

图3为根据现有技术中的进行手写体数字分类实验时普通Softmax分类器系统训练的深度卷积神经网络提取的特征在特征空间的分布情况。

图4为根据本公开一实施例所示的梯度增强型Softmax分类器系统在进行手写体数字分类任务的训练过程中，其损失值关于各个类别的得分的梯度变化曲线。

图5为根据本公开一实施例所示的进行手写体数字分类实验时梯度增强型Softmax分类器系统训练的深度卷积神经网络提取的特征在特征空间的分布情况。

具体实施方式

在现有的主流方法中，Softmax分类器系统是一种最为常用且有效的监督器。然而通过观察发现，在特征提取器(例如深度卷积神经网络作为特征提取器)的训练过程中，普通的Softmax分类器系统存在梯度消失的问题，进而导致特征的类内分布不够紧致以及类间分界不够清晰等问题。针对上述发现的技术问题，本申请提供了一种梯度增强型Softmax分类器系统、训练信号产生方法及其应用，该梯度增强型Softmax分类器系统在样本正确分类后也可以产生较强的监督信号，使得同类样本在特征空间中继续往类别中心聚集，其学习到的特征分布类别更加紧致，可区分性更强，可大幅提升深度卷积神经网络在图像分类任务中的分类性能。

为使本公开的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本公开进一步详细说明。

第一实施例

在本公开的第一个示例性实施例中，提供了一种梯度增强型Softmax分类器系统。

图1为根据本公开一实施例所示的梯度增强型Softmax分类器系统的结构示意图。图1中以点划线形成的框表示与该梯度增强型Softmax分类器系统相关联的其它结构，以实线框表示该梯度增强型Softmax分类器系统中的各个模块及对应实现的功能。

参照图1所示，本公开的梯度增强型Softmax分类器系统，用作基于深度卷积神经网络的图像分类模型中训练特征提取器的监督器，包括：

得分计算模块，用于：将特征提取器提取的图像样本的特征向量与各个类别代理向量进行点积运算且进行归一化操作，并乘以一常数进行放缩之后得到图像样本对应各个类别的得分；以及

损失计算模块，用于：通过得分计算模块中所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值(softmax)；将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数；以及将损失计算函数作为目标函数，进行最优化求解，该目标函数的最优解满足：最大化类内得分且最小化类间得分。

基于深度卷积神经网络的图像分类模型通常由两个部分构成：特征提取器和监督器特征提取器将原始图像映射到特征空间，监督器使用提取的特征与图像的类别标签产生训练信号驱动特征提取器的学习。

在得分计算模块中，采用点积的形式计算出图像样本对应各个类别的得分，即采用图像样本的特征向量与类别代理向量的余弦的形式作为图像样本在该类别的得分，使得图像的相似程度可直接使用特征的余弦进行度量。

在本公开的一实施例中，如图1所示，所述损失计算模块得到最优解对应的损失值后，还会基于误差反传与梯度下降法更新该梯度增强型Softmax分类器系统中的类别代理向量并将误差信号反传给深度卷积神经网络用以监督特征提取器的训练。

反传给深度卷积神经网络的监督信号强，基于深度卷积神经网络的图像分类模型收敛快。

本实施例中，该梯度增强型Softmax分类器系统中，所述图像样本对应各个类别的得分的表达式如下：

其中，s_i表示图像样本在第i个类别上的得分，

表示

与x的点积运算；||*||表示二范数。

本实施例中，所述通过得分计算模块中所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值的方法为：

基于图像样本的类别标签t，由得分计算模块得到该类别标签对应的类别的得分即为类内得分s_t；该类内得分s_t满足公式(1)；

本实施例中，将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数。

具体的，图像样本的损失值，即损失计算函数的表达式如下：

其中，

表示图像样本的损失值；λ∈(0，1)，用于控制类内最小化与类间最大化监督信号的比例。

得到损失计算函数的表达式之后，将损失计算函数作为目标函数，进行最优化求解，该目标函数的最优解满足：最大化类内得分且最小化类间得分。

普通Softmax分类器系统在计算损失时，通常先是计算所有的类别的软最大值，然后得到损失值，在样本正确分类后，其产生的监督信号急剧减弱，导致训练过程无法继续，所学习到的特征区分性不强。本公开的梯度增强型Softmax分类器系统与普通Softmax分类器系统相比，通过设置得分计算模块和损失计算模块，最大化类内得分且最小化类间得分，从而产生梯度增强的效果，在样本正确分类后也可以产生较强的监督信号，使得同类样本在特征空间中继续往类别中心聚集，其学习到的特征分布类别更加紧致，可区分性更强，而避免了现有技术中梯度消失的情形。

在本公开的一实施例中，基于损失计算模块得到最优解对应的损失值后，还会基于误差反传与梯度下降法更新该梯度增强型Softmax分类器系统中的类别代理向量并将误差信号反传给深度卷积神经网络用以监督特征提取器的训练。

下面在一实例中基于现有技术中普通Softmax分类器系统和基于本公开的梯度增强型Softmax分类器系统进行了手写体数字分类的对比实验。

图2中，

表示采用普通Softmax分类器系统计算得到的图像样本的损失值，s₀-s₉表示采用普通Softmax分类器系统计算的图像样本在各个类别的得分，图例中9个图形分别对应9个类别，参照图2所示，普通Softmax分类器系统在监督深度卷积网络进行手写体数字分类任务中存在梯度消失现象，该手写体数字识别实验说明，随着训练迭代次数的增加，损失关于类别得分的梯度快速衰减到0附近，因此，Softmax分类器系统无法继续为前方的深度卷积神经网络(特征提取器)提供有效的监督信号。

图3中，该手写体数字分类实验对应的特征空间的维度为3，图例中9个图形分别对应9个类别，由图3可以看出，各个类别之间的分界面较为模糊，由此可知，采用普通Softmax分类器系统作为监督器训练深度卷积神经网络(特征提取器)提取的特征在特征空间中各个类别分界不明显，所学习到的特征区分性不强。

图4中，

表示采用梯度增强型Softmax分类器系统计算得到的图像样本的损失值，s₀-s₉表示采用梯度增强型Softmax分类器系统计算的图像样本在各个类别的得分(这里为了图例表示的简化，采用了相同的字母s₀-s₉在图2和图4中分别表示不同的含义，具体以说明书的解释为准)，图例中9个图形分别对应9个类别，参照图4所示，随着训练迭代次数(训练周期)的增加，该梯度增强型Softmax分类器系统的损失值关于所述各个类别的得分的梯度呈分层趋势，不同类别下的损失值关于类别得分的梯度(导数)值具有较大差异，呈现分层状态，相较于现有技术来说梯度消失问题得到了很好的缓解。

图5中，该手写体数字分类实验对应的特征空间的维度为3，图例中9个图形分别对应9个类别，由图5可以看出，各个类别之间的界限清晰，说明基于梯度增强型Softmax分类器系统作为监督器训练的深度卷积神经网络(特征提取器)学习到的特征在类内分布更加紧致、类间界限更加清晰。

第二实施例

在本公开的第二个示例性实施例中，提供了一种训练信号产生方法，基于本公开的梯度增强型Softmax分类器系统作为深度卷积神经网络的图像分类模型中训练特征提取器的监督器，来产生所述训练信号，该方法包括：

步骤S21：将特征提取器提取的图像样本的特征向量与各个类别代理向量进行点积运算且进行归一化操作，并乘以一常数进行放缩之后得到图像样本对应各个类别的得分；

本实施例中，该步骤S21由得分计算模块执行。

步骤S22：通过所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值(softmax)；将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数；以及将损失计算函数作为目标函数，进行最优化求解，该目标函数的最优解满足：最大化类内得分且最小化类间得分。

本实施例中，该步骤S22由损失计算模块执行。

在一实施例中，还包括如下步骤：

步骤S23：得到最优解对应的损失值后，还会基于误差反传与梯度下降法更新该梯度增强型Softmax分类器系统中的类别代理向量并将误差信号反传给深度卷积神经网络用以监督特征提取器的训练。

该步骤S23由损失计算模块执行。

当然，步骤S23以及后续过程与现有技术中分类器系统的实施过程类似，这里不再详细介绍。

其中，随着训练迭代次数的增加，该梯度增强型Softmax分类器系统的损失值对所述各个类别的得分的梯度呈分层趋势，有效克服了现有技术中存在梯度衰减为零对应产生的监督信号急剧减弱，导致训练过程无法继续，所学习到的特征区分性不强的问题，该训练信号产生方法在样本正确分类后也可以产生较强的监督信号，使得同类样本在特征空间中继续往类别中心聚集，其学习到的特征分布类别更加紧致，可区分性更强。

该方法中，所述图像样本对应各个类别的得分的表达式如下：

其中，s_i表示图像样本在第i个类别上的得分，

表示

与x的点积运算；||*||表示二范数。

该方法中，通过所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值的方法为：

将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数。具体的，图像样本的损失值，即损失计算函数的表达式如下：

其中，

第三实施例

在本公开的第三个示例性实施例中，提供了一种梯度增强型Softmax分类器系统或者训练信号产生方法在图像分类中的应用。

基于该梯度增强型Softmax分类器系统作为图像分类中用于训练特征提取器(例如深度卷积神经网络作为特征提取器)的监督器，或者利用该训练信号产生方法在图像分类中响应于特征提取器提取的特征向量并反馈给出误差信号以及更新内部的类别代理向量，从而在样本正确分类后也可以产生较强的监督信号，使得同类样本在特征空间中继续往类别中心聚集，其学习到的特征分布类别更加紧致，可区分性更强。

综上所述，本公开提供了一种梯度增强型Softmax分类器系统、训练信号产生方法及其应用，与普通的Softmax分类器系统相比，梯度增强型Softmax分类器系统的区别点体现在两个模块：得分计算模块和损失计算模块，现有的Softmax分类器系统在样本正确分类后，其产生的监督信号急剧减弱，导致训练过程无法继续，所学习到的特征区分性不强，而本公开的梯度增强型Softmax分类器系统通过得分计算模块和损失计算模块的设置，最大化类内得分且最小化类间得分，在样本正确分类后也可以产生较强的监督信号，使得同类样本在特征空间中继续往类别中心聚集，其学习到的特征分布类别更加紧致，可区分性更强；在得分计算模块中，采用点积的形式计算出图像样本对应各个类别的得分，即采用图像样本的特征向量与类别代理向量的余弦的形式作为图像样本在该类别的得分，使得图像的相似程度可直接使用特征的余弦进行度量；反传给深度卷积神经网络的监督信号强，基于深度卷积神经网络的图像分类模型收敛快。

本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。本公开的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的相关设备中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

以上所述的具体实施例，对本公开的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本公开的具体实施例而已，并不用于限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种梯度增强型Softmax分类器系统，其特征在于，用作基于深度卷积神经网络的图像分类模型中训练特征提取器的监督器，包括：

损失计算模块，用于：通过得分计算模块中所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值；将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数；以及将损失计算函数作为目标函数，进行最优化求解，该目标函数的最优解满足：最大化类内得分且最小化类间得分。

2.根据权利要求1所述的梯度增强型Softmax分类器系统，其特征在于，所述图像样本对应各个类别的得分的表达式如下：

其中，s_i表示图像样本在第i个类别上的得分，

表示

与x的点积运算；||*||表示二范数。

3.根据权利要求2所述的梯度增强型Softmax分类器系统，其特征在于，

所述通过得分计算模块中所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值的方法为：

4.根据权利要求1所述的梯度增强型Softmax分类器系统，其特征在于，所述损失计算模块得到最优解对应的损失值后，还会基于误差反传与梯度下降法更新该梯度增强型Softmax分类器系统中的类别代理向量并将误差信号反传给深度卷积神经网络用以监督特征提取器的训练。

5.根据权利要求4所述的梯度增强型Softmax分类器系统，其特征在于，随着训练迭代次数的增加，该梯度增强型Softmax分类器系统的损失值关于所述各个类别的得分的梯度呈分层趋势。

6.一种训练信号产生方法，其特征在于，基于如权利要求1-5中任一项所述的梯度增强型Softmax分类器系统作为深度卷积神经网络的图像分类模型中训练特征提取器的监督器，来产生所述训练信号，该方法包括：

通过所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值；将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数；以及将损失计算函数作为目标函数，进行最优化求解，该目标函数的最优解满足：最大化类内得分且最小化类间得分。

7.根据权利要求6所述的训练信号产生方法，其特征在于，还包括：

得到最优解对应的损失值后，还会基于误差反传与梯度下降法更新该梯度增强型Softmax分类器系统中的类别代理向量并将误差信号反传给深度卷积神经网络用以监督特征提取器的训练。

8.根据权利要求7所述的训练信号产生方法，其特征在于，随着训练迭代次数的增加，该梯度增强型Softmax分类器系统的损失值对所述各个类别的得分的梯度呈分层趋势。

9.根据权利要求6所述的训练信号产生方法，其特征在于，

所述图像样本对应各个类别的得分的表达式如下：

其中，s_i表示图像样本在第i个类别上的得分，

表示

与x的点积运算；||*||表示二范数。

10.根据权利要求9所述的训练信号产生方法，其特征在于，通过所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值的方法为：

11.一种如权利要求1-5中任一项所述的梯度增强型Softmax分类器系统或者如权利要求6-10中任一项所述的训练信号产生方法在图像分类中的应用。