CN114611694A

CN114611694A - 提升图像分类网络模型鲁棒性的损失函数方法及系统

Info

Publication number: CN114611694A
Application number: CN202210259849.5A
Authority: CN
Inventors: 赵洪田; 郑世宝; 王玉
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2022-03-16
Filing date: 2022-03-16
Publication date: 2022-06-10
Anticipated expiration: 2042-03-16
Also published as: CN114611694B

Abstract

本发明提供了一种提升图像分类网络模型鲁棒性的损失函数方法及系统，在进行图像分类时，用以引导映射特征的类间辨别性及类内紧凑性，进而学习到更本质和具有区分性的参数配置。利用本发明方法训练的模型，能有效提升对不同类型图像分类的性能，尤其在受到对抗样本攻击时，本发明所涉及模型仍能保持更好的稳定性，更适合真实世界中图像分类的实际情况。

Description

提升图像分类网络模型鲁棒性的损失函数方法及系统

技术领域

本发明涉及深度学习安全和图像识别的技术领域，具体地，涉及提升图像分类网络模型鲁棒性的损失函数方法及系统。

背景技术

随着计算架构、深度学习、移动智能终端的飞速发展，图像分类在现实世界中获得广泛应用。作为计算机视觉基础任务之一，图像分类是利用计算机根据图像信息中反映的不同特征，把不同类别目标划分开以进行图像理解和分析的方法。由于图像分类任务的基础性，它在物体检测，语义分割和文字识别等相关计算机视觉领域发挥着重要作用。

但是在现阶段广泛存在的基于深度学习的图像分类领域，研究者大都过多关注算法有效性(即在同种干净样本上的准确度评价指标)而忽略了鲁棒性这一衡量指标。据我们所知，AI算法非常脆弱，一些在实验室训练数据集上表现优秀的模型当迁移到陌生现实应用场景时，往往会面临安全性问题；另一方面，AI技术已经对人们的生活造成冲击，尤其在人脸支付和智能安防等对信息安全要求较高领域必须确保AI技术安全可控。为此，AI安全及对抗样本相应成为一个研究课题，例如当我们仅仅替换一点点图像像素，基于深度学习的系统就很有可能将灰蝶分类成草蛉。针对深度学习模型结构(线性映射层)进行物理攻击及其防御具有广泛的应用前景，如自动驾驶，物品的自动识别和鉴定等，研究如何保证深度学习模型的鲁棒性具有重要现实意义。

现在很多神经网络或者模型存在学到的特征并不是本质特征(换句话说，和人的认知还有很大区别)，主要是因为它们一般只过分追求类别的可分性而忽视了中间本质特征的学习。通常在实验室训练时，喂给模型的数据都是经过清洗的干净样本，而现实世界中的数据通常含有大量噪声或其他扰动，尤其在未定义环境下样本一个很小的变化量就可以导致模型判定结果的改变。为了提升样本分类网络的鲁棒性，引入新的特征学习准则用以减弱对抗样本因部分特征差异而严重干扰深度学习模型的决策对现实应用具有重要意义。与此同时，基于深度度量学习的方法针对特征和分类的权值向量做归一化并引入largemargin，让学到的特征更具有区分性，也为我们设计鲁棒深度学习分类模型提供新的启发。

在公开号为CN111950628A的专利文献中公开了一种人工智能图像分类模型的鲁棒性评估与增强系统，包括：白盒评估模块、黑盒评估模块和防御增强模块，白盒评估模块从用户处获得待评估模型及所选的评估指标，根据多个不同指标从各方面评估模型抵抗攻击的能力，并计算出所有指标的分数以及鲁棒性总分；黑盒评估模块从用户处获得待评估模型的输出结果，与正确标签相比较得到评估结果。提供了多种黑盒评估手段，从黑盒的角度评估模型的鲁棒性；防御增强模块内置多种鲁棒性提升手段。从用户处获得待增强的模型及所选的防御增强方法信息，使用相应的防御增强方法对使用者上传的模型进行鲁棒性增强。

因此，需要提出一种新的技术方案。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种提升图像分类网络模型鲁棒性的损失函数方法及系统。

根据本发明提供的一种提升图像分类网络模型鲁棒性的损失函数方法，所述方法包括如下步骤：

步骤S1：对Softmax损失函数和Modified Softmax的等值面做分析，最初的Softmax损失函数

p_i＝W_iy_i+b_i，整体的线性变换表示为p＝Wy+b，y＝N(x)∈R^L,其中L为类别数，N(·)为主干网络非线性特征提取函数变换,x为神经网络学习到的特征向量，y＝[y₁,y₂,…,y_L]^T为一个非线性变换后的特征向量，p为将特征向量y作为输入，将线性层网络参数W,b分别作为线性变换的权重和偏置的线性变换的结果；将上式L_i中中间变量p_i使用向量模长和角度表示形式为

Softmax等价表示为

其中

为待求概率值的特征向量与权重向量之间的夹角，

对L_i参数向量的模长和偏差加入约束，即使权重矩阵W模长为1，偏置向量b为0，令损失函数值为一常数C，则关于角度化模型参数方程表示为：

步骤S2：将步骤S1中方程进行简化得到

属于Log-Sum-Exp函数范畴，它的值为对最大函数的逼近，

令

获得

步骤S3：对

做分析和验证，在做识别或分类时，在使用线性映射函数推理时，当类内角度间距大于类间角度间距时，说明模型对样本做出正确预测，反之，模型不能对样本做出正确预测；

步骤S4：通过上述分析，得出通过提升样本在特征空间的密度，不同类别特征的可区分性，由步骤S3中

对类内角间距和类间角间距定义不同阙值函数分别进行逆向求解，将类内角间距和类间角间距函数统一为关于等值面的优化目标，并分别定义为L_I,L_O,由步骤S3衍生出的方程为

步骤S5：对步骤S4中方程组进行求解，得到

设计训练神经网络的损失函数为L＝L_a+k₁L_I+k₂L_O，其中L_a设置为常规损失设计，k₁,k₂分别为超参数；

步骤S6：利用主干深度神经网络及训练图片获得预测标签，将预测标签和输入样本标签计算通过步骤S5获得的损失函数计算损失并通过链式法则计算梯度值，根据梯度值更新神经网络参数，主干深度神经网络选择ResNet34,ResNet50,ResNet101,ResNet150；

步骤S7：循环步骤S6中模型，以及利用步骤S5中损失函数诱导更新参数，根据loss，accuracy，recall，F1指标值训练直至模型收敛,即获得鲁棒的图像分类网络模型。

优选地，所述步骤S1依次对Softmax损失函数和Softmax变种损失函数的提取特征做分析，使用MINIST手写字体识别数据集作为训练和测试数据集，针对不同分类任务使用对应类型的数据集完成模型训练和部署，依次使用Softmax and Cross-Entropy和SphereFace Loss作为损失函数和潜在变换层，使用经典卷积神经网络作为主干网络，得到分类训练和测试可视化网络。

优选地，所述步骤S4中的方程组中的‖y‖为样本向量模，

为样本特征向量与同类样本权重向量的角度距离，

为样本特征向量与其他类样本权重向量的最小角度距离，L_I为待优化的类内角度距离目标损失，L_O为待优化的类间角度距离目标损失。

优选地，所述步骤S6中深度神经网络对输入图像提取特征后，经特征映射函数将图像映射到潜在的特征空间，潜在特征空间中的特征经过线性映射层对图像获取图像预测值，通过损失函数与输入图像标签结合，经梯度反向传播更新模型参数。

本发明还提供一种提升图像分类网络模型鲁棒性的损失函数系统，所述系统包括如下模块：

模块M1：对Softmax损失函数和Modified Softmax的等值面做分析，最初的Softmax损失函数

Softmax等价表示为

其中

为待求概率值的特征向量与权重向量之间的夹角，

模块M2：将模块M1中方程进行简化得到

属于Log-Sum-Exp函数范畴，它的值为对最大函数的逼近，

令

获得

模块M3：对

模块M4：通过上述分析，得出通过提升样本在特征空间的密度，不同类别特征的可区分性，由模块M3中

对类内角间距和类间角间距定义不同阙值函数分别进行逆向求解，将类内角间距和类间角间距函数统一为关于等值面的优化目标，并分别定义为L_I,L_O,由模块M3衍生出的方程为

模块M5：对模块M4中方程组进行求解，得到

模块M6：利用主干深度神经网络及训练图片获得预测标签，将预测标签和输入样本标签计算通过模块M5获得的损失函数计算损失并通过链式法则计算梯度值，根据梯度值更新神经网络参数，主干深度神经网络选择ResNet34,ResNet50,ResNet101,ResNet150；

模块M7：循环模块M6中模型，以及利用模块M5中损失函数诱导更新参数，根据loss，accuracy，recall，F1指标值训练直至模型收敛,即获得鲁棒的图像分类网络模型。

优选地，所述模块M1依次对Softmax损失函数和Softmax变种损失函数的提取特征做分析，使用MINIST手写字体识别数据集作为训练和测试数据集，针对不同分类任务使用对应类型的数据集完成模型训练和部署，依次使用Softmax and Cross-Entropy和SphereFace Loss作为损失函数和潜在变换层，使用经典卷积神经网络作为主干网络，得到分类训练和测试可视化网络。

优选地，所述模块M4中的方程组中的‖y‖为样本向量模，

为样本特征向量与同类样本权重向量的角度距离，

优选地，所述模块M6中深度神经网络对输入图像提取特征后，经特征映射函数将图像映射到潜在的特征空间，潜在特征空间中的特征经过线性映射层对图像获取图像预测值，通过损失函数与输入图像标签结合，经梯度反向传播更新模型参数。

与现有技术相比，本发明具有如下的有益效果：

1、本发明提出了一种用于训练高效鲁棒图像分类网络的损失函数，相比较过去通用的Softmax and Cross-Entropy损失函数能够得到更为可靠的图像分类神经网络；

2、相较于通过对抗训练获取鲁棒神经网络的方式，本发明所提方法及系统具有计算复杂度小，且在训练模型时仅需要干净样本，而不需要对抗样本的参与(生成对抗样本通常需要更多的计算资源)，使用本发明得到的模型做推理时在干净样本上不会损失预测精度，而用对抗训练获得的模型通常会以损失干净样本预测精度为代价来提升在对抗样本上的预测精度；

3、相对于对抗训练获取鲁棒性的方法，本发明提供的方法从本质上提升了网络模型的鲁棒性，通常对大多数对抗样本具有更好的防御能力，而非通过对抗训练方法只针对特定对抗样本具有防御能力；

4、利用本发明方法开发的系统，具有稳定性高，操作简单等优点，更适合现实世界中图像分类的实际情况。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明实施例的神经网络学习过程示意图；

图2本发明实施例的训练样本特征可视化示意图，使用Softmax and Cross-Entropy(SCE)做损失函数，使用MINIST数据集作为测试数据；

图3本发明实施例的测试样本特征可视化示意图，使用Softmax and Cross-Entropy(SCE)做损失函数，使用MINIST数据集作为测试数据；

图4本发明实施例的训练样本特征可视化示意图，使用SphereFace Loss做损失函数，使用MINIST数据集作为测试数据；

图5本发明实施例的测试样本特征可视化示意图，使用SphereFace Loss做损失函数，使用MINIST数据集作为测试数据；

图6为本发明使用不同损失函数(Softmax Loss,Modified Softmax Loss,CenterLoss,SphereFace Loss,Our Loss)提取的特征可视化示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

针对现有深度神经网络的脆弱性，易受对抗样本攻击的缺陷，本发明发现主要由于现有评估准则以及线性映射层没有能力将投影特征划分的具有可区分性导致的。为了提升映射特征的可判别性，本发明目的是提供一种评估准则，用于诱导神经网络在训练过程中使图像分类学习到的特征在特定度量空间，满足同一类的最大类内距离小于不同类的最小类间距离，从而提升分类网络的鲁棒性，以适应不同类型的输入图像。

深度学习作为一种非常复杂的软件系统，易受对抗样本攻击，即在原始数据上叠加一定的扰动，这些扰动近似一些随机噪声。虽然通过训练数据扩充等途径能够提升得到模型的鲁棒性，但是通常情况下难以穷尽所有的攻击样本。不同于以往对抗训练的方法，本发明从学习表征层面出发，提出一种训练鲁棒深度神经网络的损失函数及其系统，旨在通过特征凝结提升网络模型的鲁棒性，用以增强深度学习在现实世界中图像分类任务的通用性。

本发明提供一种提升图像分类网络模型鲁棒性的损失函数方法，为实现上述解决方案依次使用以下操作步骤：

Softmax等价表示为

其中

为待求概率值的特征向量与权重向量之间的夹角，

依次对Softmax损失函数和Softmax变种损失函数的提取特征做分析，使用MINIST手写字体识别数据集作为训练和测试数据集，当然针对不同分类任务可以使用对应类型的数据集完成模型训练和部署，依次使用Softmax and Cross-Entropy和SphereFace Loss作为损失函数和潜在变换层，使用经典卷积神经网络作为主干网络，如LeNet-5,AlexNet，得到分类训练和测试可视化网络，分别如图2和图3以及图4和图5所示，可以看出相较于SphereFace Loss，由Softmax及潜在层映射得到的特征分布更加稀疏，尤其不同类特征间的角间距相比较更小，不同类别的特征可区分性较弱，通过该损失函数训练出的模型更容易受到对抗样本攻击，同时对损失函数等值面函数进行变换。

步骤S2：将步骤S1中方程进行简化得到

属于Log-Sum-Exp函数范畴，它的值为对最大函数的逼近，根据论文(F.Nielsen and K.Sun,″Guaranteed Bounds on the Kullback–Leibler Divergence of Univariate Mixtures,″in IEEE Signal Processing Letters,vol.23,no.11,pp.1543-1546,Nov.2016,doi:10.1109/LSP.2016.2606661.和NesterovY.Smooth minimization of non-smooth functions[J].Mathematical Programming,2005,103(1):127-152.)，可知，

令

获得

步骤S3：当将Softmax角度化获得

通常情况下特征向量模长为正后，由文献(H.Wang et al.,″CosFace:Large Margin CosineLoss for Deep Face Recognition,″2018IEEE/CVF Conference on Computer Visionand Pattern Recognition,2018,pp.5265-5274,doi:10.1109/CVPR.2018.00552.)知，在对应识别任务中特征向量的模长对损失函数影响不大，尤其在测试阶段，‖y‖值大小并不会对决策过程产生影响。在使用线性映射函数推理时，当类内角度间距大于类间角度间距时说明模型可以对样本做出正确预测，反之，模型不能对样本做出正确预测。

上式中，‖y‖为样本向量模，

为样本特征向量与同类样本权重向量的角度距离，

步骤S5：对步骤S4中方程组进行求解，得到

设计训练神经网络的损失函数为L＝L_a+k₁L_I+k₂L_O，其中L_a设置为常规损失设计，k₁,k₂分别为超参数。

步骤S6：利用主干深度神经网络及训练图片获得预测标签，将预测标签和输入样本标签计算通过步骤S5获得的损失函数计算损失并通过链式法则计算梯度值，然后根据梯度值更新神经网络参数，主干深度神经网络可以选择ResNet34，ResNet50，ResNet101，ResNet150。具体地，深度神经网络非线性层对输入图像提取特征后，经特征映射函数将图像映射到潜在的特征空间。潜在特征空间中的特征经过线性映射层对图像获取图像预测值，通过损失函数与输入图像标签结合，经梯度反向传播更新模型参数。

将所提出的方法在MINIST数据集上进行实验，获取鲁棒手写字体识别的分类网络，我们使用经典卷积神经网络提取三维特征，如AlexNet网络。为了展示我们方法的有效性，我们将所提取得到特征进行可视化，并同同类别损失函数(如Softmax and Cross-Entropy(SCE),Modified Softmax，Center loss,SphereFace loss)训练出同类别的神经网络进行比较，结果如图6所示，在图6中第一行为在干净样本上测试集的结果，第二行和第三行为在对抗样本上的测试结果(第二，三行对抗样本分别为通过PGD(Aleksander Madry,Aleksandar Makelov,Ludwig Schmidt,Dimitris Tsipras,and Adrian Vladu.Towardsdeep learning models resistant to adversarial attacks.arXiv preprintarXiv:1706.06083,2017.)攻击，扰动参数分别设置为

)，由图可以看出通过本发明提出的损失函数训练出的神经网络，在推理过程中，所产生中间特征更紧凑，不同类别的特征更具区分性，能有效抵御对抗样本的攻击，验证了所生成网络模型的鲁棒性。

Softmax等价表示为

其中

为待求概率值的特征向量与权重向量之间的夹角，

依次对Softmax损失函数和Softmax变种损失函数的提取特征做分析，使用MINIST手写字体识别数据集作为训练和测试数据集，针对不同分类任务使用对应类型的数据集完成模型训练和部署，依次使用Softmax and Cross-Entropy和SphereFace Loss作为损失函数和潜在变换层，使用经典卷积神经网络作为主干网络，得到分类训练和测试可视化网络。

模块M2：将模块M1中方程进行简化得到

属于Log-Sum-Exp函数范畴，它的值为对最大函数的逼近，

令

获得

模块M3：对

做分析和验证，在做识别或分类时，在使用线性映射函数推理时，当类内角度间距大于类间角度间距时，说明模型对样本做出正确预测，反之，模型不能对样本做出正确预测。

‖y‖为样本向量模，

为样本特征向量与同类样本权重向量的角度距离，

模块M5：对模块M4中方程组进行求解，得到

模块M6：利用主干深度神经网络及训练图片获得预测标签，将预测标签和输入样本标签计算通过模块M5获得的损失函数计算损失并通过链式法则计算梯度值，根据梯度值更新神经网络参数，主干深度神经网络选择ResNet34,ResNet50,ResNet101,ResNet150。

深度神经网络对输入图像提取特征后，经特征映射函数将图像映射到潜在的特征空间，潜在特征空间中的特征经过线性映射层对图像获取图像预测值，通过损失函数与输入图像标签结合，经梯度反向传播更新模型参数。

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以，本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构；也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种提升图像分类网络模型鲁棒性的损失函数方法，其特征在于，所述方法包括如下步骤：

整体的线性变换表示为p＝Wy+b，y＝N(x)∈R^L,其中L为类别数，N(·)为主干网络非线性特征提取函数变换,x为神经网络学习到的特征向量，y＝[y₁,y₂,…,y_L]^T为一个非线性变换后的特征向量，p为将特征向量y作为输入，将线性层网络参数W,b分别作为线性变换的权重和偏置的线性变换的结果；将上式L_i中中间变量p_i使用向量模长和角度表示形式为

Softmax等价表示为

其中

为待求概率值的特征向量与权重向量之间的夹角，

步骤S2：将步骤S1中方程进行简化得到

属于Log-Sum-Exp函数范畴，它的值为对最大函数的逼近，

令

获得

步骤S3：对

步骤S5：对步骤S4中方程组进行求解，得到

2.根据权利要求1所述的提升图像分类网络模型鲁棒性的损失函数方法，其特征在于，所述步骤S1依次对Softmax损失函数和Softmax变种损失函数的提取特征做分析，使用MINIST手写字体识别数据集作为训练和测试数据集，针对不同分类任务使用对应类型的数据集完成模型训练和部署，依次使用Softmax and Cross-Entropy和SphereFace Loss作为损失函数和潜在变换层，使用经典卷积神经网络作为主干网络，得到分类训练和测试可视化网络。

3.根据权利要求1所述的提升图像分类网络模型鲁棒性的损失函数方法，其特征在于，所述步骤S4中的方程组中的‖y‖为样本向量模，

为样本特征向量与同类样本权重向量的角度距离，

4.根据权利要求1所述的提升图像分类网络模型鲁棒性的损失函数方法，其特征在于，所述步骤S6中深度神经网络对输入图像提取特征后，经特征映射函数将图像映射到潜在的特征空间，潜在特征空间中的特征经过线性映射层对图像获取图像预测值，通过损失函数与输入图像标签结合，经梯度反向传播更新模型参数。

5.一种提升图像分类网络模型鲁棒性的损失函数系统，其特征在于，所述系统包括如下模块：

Softmax等价表示为

其中

为待求概率值的特征向量与权重向量之间的夹角，

对K_i参数向量的模长和偏差加入约束，即使权重矩阵W模长为1，偏置向量b为0，令损失函数值为一常数C，则关于角度化模型参数方程表示为：

模块M2：将模块M1中方程进行简化得到

属于Log-Sum-Exp函数范畴，它的值为对最大函数的逼近，

令

获得

模块M3：对

模块M5：对模块M4中方程组进行求解，得到

6.根据权利要求5所述的提升图像分类网络模型鲁棒性的损失函数系统，其特征在于，所述模块M1依次对Softmax损失函数和Softmax变种损失函数的提取特征做分析，使用MINIST手写字体识别数据集作为训练和测试数据集，针对不同分类任务使用对应类型的数据集完成模型训练和部署，依次使用Softmax and Cross-Entropy和SphereFace Loss作为损失函数和潜在变换层，使用经典卷积神经网络作为主干网络，得到分类训练和测试可视化网络。

7.根据权利要求5所述的提升图像分类网络模型鲁棒性的损失函数系统，其特征在于，所述模块M4中的方程组中的‖y‖为样本向量模，

为样本特征向量与同类样本

权重向量的角度距离，

8.根据权利要求5所述的提升图像分类网络模型鲁棒性的损失函数系统，其特征在于，所述模块M6中深度神经网络对输入图像提取特征后，经特征映射函数将图像映射到潜在的特征空间，潜在特征空间中的特征经过线性映射层对图像获取图像预测值，通过损失函数与输入图像标签结合，经梯度反向传播更新模型参数。