CN115374931A

CN115374931A - 一种基于元对抗训练的深度神经网络鲁棒性增强方法

Info

Publication number: CN115374931A
Application number: CN202111496687.9A
Authority: CN
Inventors: 常有康; 赵宏; 韩立毅; 田伟权; 李文改; 党育; 赵凡; 韩泽宇; 倪志敏; 王伟杰
Original assignee: Lanzhou University of Technology
Current assignee: Lanzhou University of Technology
Priority date: 2021-12-09
Filing date: 2021-12-09
Publication date: 2022-11-22

Abstract

本发明公开了一种基于元对抗训练的深度神经网络鲁棒性增强方法，包括步骤：使用多种对抗攻击算法生成对抗样本，验证元对抗训练防御方法的鲁棒性；将对抗样本与干净样本按照不同的比例进行融合构造训练集；使用卷积神经网络的卷积操作对所述训练集中的数据进行特征提取；元学习阶段，变换特征提取器的参数，使得深度神经网络快速适应小样本任务；输出对抗样本的类别，计算准确率。与现有技术相比，在对抗训练过程中加入元学习方法，利用元学习在面对新出现的样本时具有较强的泛化性、较高的识别准确率的特点，解决对抗训练泛化性较差的问题。

Description

一种基于元对抗训练的深度神经网络鲁棒性增强方法

技术领域

本发明涉及深度神经网络领域，尤其涉及一种基于元对抗训练的深度神经网络鲁棒性增强方法。

背景技术

随着人工智能的快速发展，深度神经网络(Deep Neural Network,DNN)正在引领人工智能走向新一轮的高潮，其在许多领域都取得了瞩目的成就。如：在自动驾驶中，利用摄像头和激光雷达等传感器采集道路环境数据，将其输入深度神经网络中进行识别预测，在没有人工干预的情况下实现自动驾驶；在医学影像分析中，深度神经网络可以识别、分类和量化医学图像，辅助医生进行疾病的快速诊断；在图像识别中，由于深度神经网络强大的数据学习能力，可以大幅度提升图像识别的准确率；在网络分析中，深度神经网络通过分析并识别数据流量中的异常信息，实现快速的网络入侵检测；在智能制造中，设备以及传感器通过深度神经网络实现系统的自我感知、学习和维护功能，加快信息数据的分析和处理，保证生产的有序进行；利用智能系统中的自我预测和感知能力，能够及时了解运行中存在的故障问题，并在第一时间内进行故障报警，降低故障威胁。

深度神经网络在各个领域都扮演着重要的角色，因此针对深度神经网络鲁棒性的研究至关重要。对抗训练防御方法作为目前最有希望提高深度神经网络鲁棒性的防御方法之一，当其在面对未曾出现过的对抗样本时，需要将新出现的对抗样本加入到训练集中，这种通过暴力的训练方式提升深度神经网络鲁棒性的方法存在训练时间长，泛化能力差的问题。

发明内容

为克服现有技术的不足，本发明提出一种基于元对抗训练的深度神经网络鲁棒性增强方法。本发明的技术方案是这样实现的：

一种基于元对抗训练的深度神经网络鲁棒性增强方法，包括步骤

S1：使用多种对抗攻击算法生成对抗样本，验证元对抗训练防御方法的鲁棒性；

S2：将对抗样本与干净样本按照不同的比例进行融合构造训练集；

S3：使用卷积神经网络的卷积操作对所述训练集中的数据进行特征提取；

S4：元学习阶段，变换特征提取器的参数，使得深度神经网络快速适应小样本任务；

S5：输出对抗样本的类别，计算准确率。

进一步地，步骤S1包括步骤：分别使用BIM、C&W、DeepFool、DI²FGSM、 MDI²FGSM、RGF、P-RGF和Parsimonious对抗攻击算法生成对抗样本。

进一步地，步骤S2包括：根据步骤S1生成的多种对抗样本按照不同的比例与干净样本进行融合，构造训练集。

进一步地，步骤S3所述的使用卷积神经网络的卷积操作对训练集中的数据进行特征提取，包括步骤：

首先初始化特征提取器Θ和分类器θ的参数，然后将miniImageNet训练集中的部分干净样本替换为生成的对抗样本，使用ResNet网络模型通过梯度下降方法学习特征提取器Θ和分类器θ的参数，如公式(1)所示：

其中，α表示学习率，Λ_Δ表示交叉熵损失函数，

如公式(2)所示：

进一步地，步骤S4所述的变换特征提取器的参数，使得深度神经网络快速适应小样本任务，包括步骤

S41：特征提取阶段学习的特征提取器参数Θ在小样本学习过程中保持固定，在元学习阶段对其进行伸缩和平移变换以快速适应未曾见过的数据样本；分类器参数θ重新初始化与更新，如公式(3)所示：

其中，

表示伸缩变换，初始化为1，

表示平移变换，初始化为0，

表示伸缩与平移变换，T^(tr)表示训练数据，β表示学习率，θ′表示当前分类任务的参数；

S42：在测试过程中，通过使用测试数据T^(te)计算损失值，对伸缩和平移操作进行参数优化，同时更新参数θ，如公式(4)、(5)所示：

对于给定的Θ，特征提取器Θ的第i层包含K个神经元，即包含K个参数对，{(W_i,k,b_i,k)}分别表示权重和偏差，若输入为X，则将{Φ_S{1,2}}应用于(W,b)的公式如(6)所示：

S43：利用已经优化的伸缩和平移操作将在大规模数据集上训练的权重迁移到元学习任务中。

进一步地，步骤S5所述的输出对抗样本的类别，计算准确率，包括步骤：将对抗样本输入经过元对抗训练之后的深度神经网络，计算准确率，验证网络模型面对对抗样本时的鲁棒性。

本发明的有益效果在于，与现有技术相比，在对抗训练过程中加入元学习方法，利用元学习在面对新出现的样本时具有较强的泛化性、较高的识别准确率的特点，解决对抗训练泛化性较差的问题。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提出一种基于元对抗训练的深度神经网络鲁棒性增强方法。本发明的技术方案是这样实现的：

S5：输出对抗样本的类别，计算准确率。

其中，α表示学习率，Λ_Δ表示交叉熵损失函数，

如公式(2)所示：

S41：特征提取阶段学习的特征提取器参数Θ在小样本学习过程中保持固定，在元学习阶段对其进行伸缩和平移变换以快速适应未曾见过的数据样本；然而，由于特征提取阶段与元学习阶段类别数不一致，因此分类器参数θ需要重新初始化与更新，如公式(3)所示：

其中，

表示伸缩变换，初始化为1，

表示平移变换，初始化为0，

表示伸缩与平移变换，T^(tr)表示训练数据，β表示学习率，与公式(2)中的θ不同，公式(4)中的θ关注于元学习训练任务中少量的几个类，在小样本数据中进行分类，θ′表示当前分类任务的参数；

S43：利用已经优化的伸缩和平移操作将在大规模数据集上训练的权重迁移到元学习任务中，该操作确保深度神经网络在面对小样本数据时快速收敛，并且有效地减少过拟合现象。

步骤S5所述的输出对抗样本的类别，计算准确率，包括步骤：将对抗样本输入经过元对抗训练之后的深度神经网络，计算准确率，验证网络模型面对对抗样本时的鲁棒性。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种基于元对抗训练的深度神经网络鲁棒性增强方法，其特征在于，包括步骤

S5：输出对抗样本的类别，计算准确率。

2.如权利要求1所述的基于元对抗训练的深度神经网络鲁棒性增强方法，其特征在于，步骤S1包括步骤：分别使用BIM、C&W、DeepFool、DI²FGSM、MDI²FGSM、RGF、P-RGF和Parsimonious对抗攻击算法生成对抗样本。

3.如权利要求2所述的基于元对抗训练的深度神经网络鲁棒性增强方法，其特征在于步骤S2包括：根据步骤S1生成的多种对抗样本按照不同的比例与干净样本进行融合，构造训练集。

4.如权利要求1所述的基于元对抗训练的深度神经网络鲁棒性增强方法，其特征在于步骤S3所述的使用卷积神经网络的卷积操作对训练集中的数据进行特征提取，包括步骤：

其中，α表示学习率，Λ_Δ表示交叉熵损失函数，

如公式(2)所示：

5.如权利要求1所述的基于元对抗训练的深度神经网络鲁棒性增强方法，其特征在于步骤S4所述的变换特征提取器的参数，使得深度神经网络快速适应小样本任务，包括步骤

其中，

表示伸缩变换，初始化为1，

表示平移变换，初始化为0，

表示伸缩与平移变换，Τ^(tr)表示训练数据，β表示学习率，θ′表示当前分类任务的参数；

S42：在测试过程中，通过使用测试数据Τ^(te)计算损失值，对伸缩和平移操作进行参数优化，同时更新参数θ，如公式(4)、(5)所示：

6.如权利要求1所述的基于元对抗训练的深度神经网络鲁棒性增强方法，其特征在于，步骤S5所述的输出对抗样本的类别，计算准确率，包括步骤：将对抗样本输入经过元对抗训练之后的深度神经网络，计算准确率，验证网络模型面对对抗样本时的鲁棒性。