CN111881034A

CN111881034A - 一种基于距离的对抗样本生成方法

Info

Publication number: CN111881034A
Application number: CN202010714696.XA
Authority: CN
Inventors: 房春荣; 李珍鸿; 顾逸飞; 刘佳玮
Original assignee: Shenzhen Muzhi Technology Co ltd
Current assignee: Shenzhen Muzhi Technology Co ltd
Priority date: 2020-07-23
Filing date: 2020-07-23
Publication date: 2020-11-03

Abstract

一种基于距离的对抗样本生成方法，包含数据集与神经网络模型处理模块、对抗样本生成模块和距离评估模块。在数据集与神经网络模型处理模块，获取用户输入的数据集和神经网络模型文件，对神经网络模型进行还原，在本地生成一个用户的神经网络模型。在对抗样本生成模块，对于数据集中的每一个数据，采用筛选后的对抗样本生成方法去生成对抗样本，通过计算每次迭代的梯度，每次迭代都会进行有效的的对抗扰动。在距离评估模块，通过采用L_∞、L_2和L_1三种范数对扰动大小进行评估，通过计算生成的对抗样本与原样本的距离。

Description

一种基于距离的对抗样本生成方法

技术领域

本发明属于软件测试领域，特别是涉及到对抗样本生成，基于生成的对抗样本与原样本的距离，评估生成对抗样本的质量。

背景技术

近年来，深度学习与深度神经网络发展迅猛，深度学习模型已经关系到社会生活的方方面面。因此，保障深度学习模型质量的测试技术也随之有着越发重要的地位。传统的软件测试技术已然无法满足深度学习模型复杂多样，难以理解等特点。因此，针对深度学习模型的新的测试技术成为当前学术界和工业界的重要热点问题。事实证明，在某些领域，对抗样本可以有效的找出深度学习模型的bug，提升深度学习模型的质量。对抗样本[1]为对输入样本故意添加一些人无法察觉的细微的干扰，导致模型以高置信度给出一个错误的输出。对抗样本只需要对原数据进行计算，不需要人工标注，节省了大量的人力成本。

在深度学习模型测试中，对抗样本生成测试已成为主流方法，这是因为深度学习数据的碎片化，深度学习模型的的不可解释性，以及测试场景的多样性。但是，对抗样本生成的开放性也容易导致质量差的结果。质量控制是对抗样本生成的重大挑战，尤其是对于多次迭代的对抗样本生成方法，如up。对抗样本生成中的质量控制策略主要分为对抗样本攻击能力，对抗样本扰动大小等。对于大多数数据(甚至是普通的应用用户)来说，很容易在迭代计算中得到对抗样本。但未经限制的对抗样本很难保持原有性质，这导致了对抗样本通常包含一些新的性质，从而导致对抗样本质量低下。这些问题对于深度学习模型的缺陷定位与修复工作造成了很大的不便与负担。现阶段对于对抗样本的质量管理是缺乏有效手段的，因此，我们希望研究一种辅助手段来帮助评估对抗样本性质，从而达到对抗样本质量管理的目的。

在对抗样本方面，已经有一些研究者做了一些初步的工作，但是现有工作局限于对抗样本的生成，对对抗样本质量评估支持较弱。

基于上述工作，本发明深度挖掘了在深度学习模型的对抗样本与原数据的距离信息。这些信息对于人员来说是简单而可理解的。但对于机器来说，想要自动化地识别这些信息并将其归纳为失败的对抗样本是需要进一步技术处理工作的。因此，本发明基于这些已有的研究成果，将相应的对抗样本生成技术进行总结，修改，并添加新的技术方法，将其应用于深度学习模型中的对抗样本的生成与评估，加强对生成对抗样本的质量筛选，从而自动化地生成对抗样本。

发明内容

本发明要解决的问题是：深度学习模型测试中对抗样本生成方法生成的对抗样本质量地下，难以形成有效缺陷修复作用的问题。我们的发明能够评估其与原数据之间的关系，并由此自动化生成高质量的对抗样本，解决对抗样本质量低下的问题。

本发明的技术方案为：一种基于距离评估的对抗样本生成的方法，其特征是能够根据一张深度学习原数据生成一份可靠的对抗样本。该生成方法包含以下三个模块：

1)数据集与神经网络模型处理模块：首先，获取用户输入的数据集和神经网络模型文件，获取神经网络模型的结构信息，神经元数量，每个神经元权重，激活函数，对神经网络模型进行还原，在本地生成一个用户的神经网络模型。将输入的数据集进行解码等操作，将数据集转化成本项目中用于数值计算的python的numpy数据。

2)对抗样本生成模块。系统首先先针对此数据集，先随机筛选出一部分的数据，用不同的对抗样本生成方法生成对抗样本，并评估每个生成方法生成单个对抗样本的平均时间。根据生成的平均时间，排除时间耗时超过阈值的对抗样本生成方法，因为此方法对于此数据集可能花费太大，会影响后面生成对抗样本整体流程的花费。对于数据集中的每一个数据，采用筛选后的对抗样本生成方法去生成对抗样本，通过计算每次迭代的梯度，每次迭代都会进行有效的的对抗扰动。在迭代周期结束之后每一个对抗样本生成方法默认都会生成一个对抗样本，当然用户也可以设置生成对抗样本的数量。所以每一个数据都会有几个不同方法生成的对抗样本。

3)距离评估模块：首先将生成的对抗样本与原数据都提取特征，转换成向量表示。通过采用L_∞、L_2和L_1三种范数对扰动大小进行评估，通过计算生成的对抗样本与原样本的距离。经过大量的实验与计算，评估出距离的合理阈值。去掉扰动大小超出阈值的对抗样本，进而保证生成对抗样本的性质与原数据保持一致。

本发明的特点在于：

1.在对抗样本生成领域首次提出利用基于时间评估对抗样本生成技术。

2.首次将距离评估应用于对抗样本的生成。

附图说明

图1为本发明实施总流程图。

图2为关键步骤1流程图。

图3为关键步骤2流程图。

图4为关键步骤3流程图。

具体实施方式

以下通过特定的具体的实例说明本发明的实施方式，本领域的技术人员可由本说明书揭露的内容轻易地了解到本发明的其他优点和功效。

本专利实施基于距离评估的对抗样本自动生成，主要采用了对抗样本生成技术，涉及到的具体关键技术有深度卷积神经网络(CNN)、梯度下降技术、距离评估技术。

1.特征提取

在本发明中，我们采用卷积神经网络的方法对用户上传的数据文件进行特征提取，将一张图片转化为一个特征向量。卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络。卷积神经网络具有表征学习能力，能够按其阶层结构对输入信息进行平移不变分类。卷积神经网络仿造生物的视知觉机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征。

2.深度神经网络还原

本发明中，我们面向的网络是深度神经网络，深度神经网络主要有卷积、池化、激活函数组成，由于深度神经网络具有不可解释性，故难以从白盒测试的角度来度量原始数据集的充分性。但是神经元几乎是代表深度神经网络的一个通用特征，神经元的结构和权重代表了深度神经网络的认知行为，神经元的输出最终决定了神经网络的输出。故在导入深度神经网络时，会对神经元进行插桩，进而计算出数据输入以后神经元的输出的变化，从而计算数据扰动后的梯度方向。

3.对抗样本方法时间评估

本发明中，需要通过对抗样本生成方法，计算原数据，迭代的扰动，从而生成对抗样本。而时间成本是对抗生成的重要成本，因此要度量不同对抗样本所需要花费的时间长度，从而排除时间成本不可承受的方法。本发明中采用数据集抽样来代替整个数据集的方法，计算不同对抗样本生成方法对于抽样的数据的平均生成时间，从而得出该方法对这个数据集的大概时间成本。

4.对抗样本生成

本发明中，我们采用梯度计算，将卷积神经网络所生成的图像特征向量扰动成为对抗样本。在机器学习算法中，在最小化损失函数时，可以通过梯度法来一步步的迭代求解，得到最小化的损失函数，和模型参数值。在生成对抗样本时，通过对数据在沿着梯度的方向加上扰动，可以使得扰动是最有效的，可以有效的找到使得神经网络出错的数据。

5.距离评估

本发明中，我们采用L范式距离计算，将扰动所生成的对抗样本与原数据相比较，得到他们的距离关系。L范式是一系列的计算距离的函数，常用的有L0，L2，L∞范式，他们可以有效的计算两个数据之间的距离。

在本实例中，数据特征提取部分的深度神经网络计算，将输入的图片转化成数据向量。在神经网络模型还原部分我们采用了公开可用的的神经网络模型还原方法以生成计算对抗样本生成的神经网络。对抗样本过滤时使用的对抗样本列表是由我们自动地从我们的数据集中扰动生成而成的，共有五种生成方法，每种方法都会生成若干个对抗样本。最后的对抗样本评估部分，我们采用的是L范式距离评估方法，有效的计算生成的对抗样本与原样本的性质差异，排除性质可能改变的对抗样本。

Claims

1.一种基于距离的对抗样本生成方法，其特征是对生成的对抗样本与原数据都提取特征，转换成向量表示；通过计算生成的对抗样本与原样本的距离，评估出距离的合理阈值；通过对神经元进行插桩，计算数据扰动后的梯度方向。

2.根据权利要求1所描述的对生成的对抗样本与原数据都提取特征，转换成向量表示，其特征是：采用卷积神经网络的方法对用户上传的数据文件进行特征提取，将一张图片转化为一个特征向量。进行监督学习和非监督学习，使用隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征。

3.根据权利要求1所描述的通过计算生成的对抗样本与原样本的距离，评估出距离的合理阈值，其特征是：采用L范式距离计算，将扰动所生成的对抗样本与原数据相比较，得到他们的距离关系。

4.根据权利要求1所描述的通过对神经元进行插桩，计算数据扰动后的梯度方向。其特征是：在导入深度神经网络时，会对神经元进行插桩，进而计算出数据输入以后神经元的输出的变化，从而计算数据扰动后的梯度方向。