CN113392905A

CN113392905A - 一种基于梯度修正的图像对抗攻击方法

Info

Publication number: CN113392905A
Application number: CN202110665964.8A
Authority: CN
Inventors: 宋井宽; 程娅娅; 高联丽
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-06-16
Filing date: 2021-06-16
Publication date: 2021-09-14
Anticipated expiration: 2041-06-16
Also published as: CN113392905B

Abstract

本发明公开了一种基于梯度修正的图像对抗攻击方法，包括以下步骤：S1、将原始图像输入分类器中，基于损失函数，得到当前迭代的梯度；S2、计算当前迭代的缩放因子；S3、对当前迭代的梯度进行线性缩放，将噪声添加到当前的原始图像中，得到当前迭代的对抗样本；S4、对当前迭代的对抗样本进行标准化处理；S5、将当前迭代的标准化对抗样本作为新的原始图像，重复步骤S1至步骤S4，直到迭代次数达到设定次数，将当前迭代的标准化对抗样本输入分类器中，得到分类器输出的错误分类结果，完成对抗攻击。本发明解决了传统基于梯度的攻击技术中由于符号函数的使用，而带来的扰动与真实梯度在方向上存在的较大差异，并进而造成有偏攻击的问题。

Description

一种基于梯度修正的图像对抗攻击方法

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于梯度修正的图像对抗攻击方法。

背景技术

近年来，深度神经网络因为性能优越被广泛应用于各个领域，但与此同时，对抗攻击(adversarial attack)给现代深度神经网络带来的安全威胁也愈发严重，并对网络的鲁棒性提出了新的挑战。具体来说，将人眼难以察觉的恶意扰动添加到网络输入中生成对抗样本，便足以误导网络对其以高置信度给出不符合常理的输出结果，鲁棒性低的网络会深受其影响，进而性能崩溃。评估并提高网络鲁棒性是一个极其重要的课题，对抗样本便是评估方法之一。

现如今，许多研究者提出了多种对抗攻击方法，基于梯度的对抗攻击方法便是主流的对抗性扰动生成方法之一，例如FGSM、I-FGSM、MI-FGSM、TI-FGSM。在无穷范数的限制下，基于线性假设，为了提高对抗样本迁移性并以尽可能小的计算开销生成成功的对抗样本，将符号函数施加到梯度上通常是一个生成扰动的不错的选择，并因此被广泛应用于基于梯度的攻击方法中。

尽管符号函数的使用带来了优秀的攻击性能，但由于符号函数简单地将梯度量化为{-1，0，+1}三个值并根据量化过后的梯度生成扰动，扰动与真实梯度在方向上存在较大差异。在欧式空间中，梯度被看作损失函数增长最快的方向，由于当前基于梯度的攻击方法实际上使用了量化过后的梯度来生成对抗样本，这种方向上的差异将导致有偏且效用低的攻击。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于梯度修正的图像对抗攻击方法在无穷范数限制下，解决了传统基于梯度的攻击技术中由于符号函数的使用，而带来的扰动与真实梯度在方向上存在的较大差异，并进而造成有偏攻击的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种基于梯度修正的图像对抗攻击方法，包括以下步骤：

S1、将原始图像输入分类器中，并基于分类器的损失函数，得到当前迭代的梯度；

S2、根据当前迭代的梯度，计算当前迭代的缩放因子；

S3、根据当前迭代的缩放因子，对当前迭代的梯度进行线性缩放，并基于缩放梯度计算噪声，将噪声添加到当前的原始图像中，得到当前迭代的对抗样本；

S4、为了使梯度计算更加稳定，对当前迭代的对抗样本进行标准化处理，得到当前迭代的标准化对抗样本；

S5、将当前迭代的标准化对抗样本作为新的原始图像，重复步骤S1至步骤S4，直到迭代次数达到设定次数，输出当前迭代的标准化对抗样本，将当前迭代的标准化对抗样本输入分类器中，得到分类器输出的错误分类结果，完成对抗攻击。

进一步地，步骤S1中当前迭代的梯度的公式为：

其中，g_t为第t次迭代的梯度，

为根据

对

求梯度，

为第t-1次迭代的对抗样本，

为首次输入的原始图像，首次输入的原始图像为原始干净的图像，y为真实标签，J(·，·)为任意输入为logits，输出为分类置信度的损失函数。

进一步地，步骤S2中计算当前迭代的缩放因子的公式一为：

其中，ζ_t为第t次迭代的缩放因子，g_t为第t次迭代的梯度，||·||为二范数运算，sign(·)为符号函数。

进一步地，步骤S2中计算当前迭代的缩放因子的公式二为：

ζ_t＝scales[K]

其中，ζ_t为第t次迭代的缩放因子，|·|为绝对值运算，

为g_t的第k个值，g_t为第t次迭代的梯度，Sort(·)为降序排序，scales[K]为选取scales排序的第K位。

进一步地，步骤S3中得到当前迭代的对抗样本的公式为：

α＝θ/T

其中，

为第t次迭代的对抗样本，α为步长，θ为扰动无穷范数阈值，t为最大迭代步数，1≤t≤T，ζ_t为第t次迭代的缩放因子，g_t为第t次迭代的梯度，x为首次输入的原始图像

进一步地，步骤S4中得到当前迭代的标准化对抗样本的公式为：

其中，

为第t次迭代的标准化对抗样本，

为第t次迭代的对抗样本。

综上，本发明的有益效果为：

(1)、本发明全面地考虑了扰动与真实梯度之间在方向上的差异，是一种基于梯度修正的对抗攻击技术。本发明通过减小扰动与梯度的方向差异，进一步提高了对抗样本的迁移性，完成更为有效的攻击。本发明是新颖且普适的。可将传统技术中的符号函数无缝替换且不引入额外的计算复杂度。

(2)、现有基于提高迁移性的攻击中，往往以FGSM做为基线，基于线性假设，现有传统技术普遍选择符号函数作为处理梯度的步骤之一，因为这能在有限的迭代步数下更容易地达到设定的无穷范数阈值，并进一步提高对抗样本迁移性。然而，由于符号函数只对梯度进行简单量化，这种操作不可避免地带来了扰动与梯度在方向上的较大差异，造成了有偏且低效的攻击。本发明通过考虑这种方向差异，引入缩放因子以对梯度进行修正，进一步地提高了对抗样本迁移性，达到更好的攻击效果。

附图说明

图1为一种基于梯度修正的图像对抗攻击方法的流程图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，一种基于梯度修正的图像对抗攻击方法，包括以下步骤：

步骤S1中当前迭代的梯度的公式为：

其中，g_t为第t次迭代的梯度，

为根据

对

求梯度，

为第t-1次迭代的对抗样本，

S2、根据当前迭代的梯度，计算当前迭代的缩放因子；

在本实施例中，公开两种缩放因子的计算方法：

第1种：

第2种：

ζ_t＝scales[K]

其中，ζ_t为第t次迭代的缩放因子，|·|为绝对值运算，

当选用第1种计算方式时，为了将本发明与传统技术生成的噪声大小控制在同一个量级上，第t次迭代的缩放因子ζ_t由当前迭代的量化梯度以及真实梯度的二范数(||sign(g_t)||、||g_t||)计算而得；当选用第2种缩放因子时，缩放因子考虑了噪声量级与方向准确性之间的平衡。

步骤S3中得到当前迭代的对抗样本的公式为：

α＝θ/T

其中，

具体而言，在步骤S4中对更新后的对抗样本进行标准化处理是将超出图像像素阈值的对抗样本像素值裁剪到合理范围[-1，1]。

步骤S4中得到当前迭代的标准化对抗样本的公式为：

其中，

为第t次迭代的标准化对抗样本，

为第t次迭代的对抗样本。

S5、将当前迭代的标准化对抗样本作为新的原始图像，重复步骤S1至步骤S4，直到迭代次数达到设定次数，输出当前迭代的标准化对抗样本(即最新的标准化对抗样本)，将当前迭代的标准化对抗样本(即最新的标准化对抗样本)输入分类器中，得到分类器输出的错误分类结果，完成对抗攻击。