CN116522341A

CN116522341A - 一种基于像素注意力机制的恶意软件对抗样本生成方法

Info

Publication number: CN116522341A
Application number: CN202310507631.1A
Authority: CN
Inventors: 赵运弢; 冯永新; 马翔宇
Original assignee: Shenyang Ligong University
Current assignee: Shenyang Ligong University
Priority date: 2023-05-08
Filing date: 2023-05-08
Publication date: 2023-08-01

Abstract

本发明设计一种基于像素注意力机制的恶意软件对抗样本生成方法，针对目前所存在的生成方法所产生的样本具有质量不高、生成模型不稳定等问题；首先分析了恶意代码与生成对抗网络结合的相关技术，在理论上基本掌握了恶意软件可视化表征方法；在像素注意力机制的基础上，结合深度卷积生成对抗网络DCGAN的特点，构建一种基于像素注意力机制的深度卷积生成对抗网络模型；并完成了恶意软件对抗样本的生成；能够有效的保证恶意软件对抗样本的质量，并且所提出的对抗网络模型具有更强的稳定性；本发明不仅可以促进深度学习方法在恶意软件检测领域的发展，而且还可以提高恶意软件检测器抵御对抗样本的能力，提高检测模型的鲁棒性。

Description

一种基于像素注意力机制的恶意软件对抗样本生成方法

技术领域

本发明涉及网络安全和人工智能领域，尤其涉及到一种基于像素注意力机制的恶意软件对抗样本生成方法。

背景技术

目前，随着物联网、云计算和5G等技术的不断普及和发展，网络信息交互越来越多，一些恶意软件制造者会编写隐藏性更好、攻击范围更广和攻击效率更高的恶意软件来攻击网络，以达到窃取个人隐私、信息以及破坏网络等非法目的，因此导致变种恶意软件的数量逐年攀升。据Trellix于2021年第二季度所做的数据调查显示，针对国家的网络安全攻击事件较2021年第一季度相比增加了52％；其中新增的变种恶意软件、恶意脚本攻击事件较第一季度分别增加47％和125％。以上数据结果表明，变种恶意软件已成为威胁网络空间安全性的最重要因素之一，这给网络安全领域带来前所未有的压力。

面对不断出现的变种恶意软件，传统的恶意软件检测算法显得力不从心。因此，网络安全厂商开始使用深度学习来检测恶意软件。基于深度学习的检测器可以有效的检测出大量的恶意软件并且可以达到较高的准确率，因此大多数的网络安全研究人员将研究重点放在了恶意软件检测算法和分类上，从而忽略了深度学习算法极易受到对抗样本的攻击。所谓的对抗样本攻击就是在原始样本的基础上添加轻微的扰动，生成的对抗样本就能以较高的概率逃避模型的检测，使模型产生错误的分类。

现有的恶意软件对抗样本的生成方法主要有5种：1、Fast Gradient Sign Method(FGSM)：FGSM是一种基于梯度的对抗样本生成方法，它利用输入样本的梯度信息来生成对抗样本。该方法通过将输入数据的梯度方向与损失函数的符号相乘，生成一些小的扰动，从而使模型产生错误的预测结果。2、Projected Gradient Descent(PGD)：PGD是FGSM的扩展版本，它对FGSM进行了改进，加入了投影操作。该方法通过对输入样本进行多次扰动，每次都将扰动投影到一定的范围内，从而生成更难以攻击的对抗样本。3、DeepFool：DeepFool是一种线性攻击方法，它基于一个简单的想法：让输入数据尽可能靠近决策边界，以便最小化扰动的大小。该方法计算决策边界和输入数据之间的距离，然后在距离最小的方向上生成扰动。4、Carlini-Wagner Attack(C&W Attack)：C&W Attack是一种基于优化的对抗样本生成方法，它通过最小化扰动的大小和分类器的置信度之间的平衡来生成对抗样本。该方法可用于不同的模型和数据集，并且可以生成很小的扰动，以欺骗模型。5、Boundary Attack：Boundary Attack是一种基于随机搜索的对抗样本生成方法，它通过在输入数据的边界上进行搜索来生成对抗样本。该方法通过计算模型分类器在输入数据周围的梯度和模型中的决策边界来进行搜索。但是目前所存在的对抗样本生成方法所产生的样本具有质量不高、模型不稳定等问题，导致难以逃避恶意软件检测器。

发明内容

针对现有技术的不足，本发明提供一种基于像素注意力机制的恶意软件对抗样本生成方法，从恶意软件可视化表征以及恶意软件对抗样本生成角度出发，将恶意软件API序列词向量化，并将词向量转化为十进制整数作为灰度图的像素点，利用转化后的灰度图有利于提高灰度图的纹理特征；恶意代码对抗样本生成采用的是深度卷积生成对抗网络(DCGAN)框架，在原始的DCGAN框架中进行研究与改进，提高生成对抗样本的质量以及生成模型的稳定性，能够有效的保证恶意软件对抗样本的逃逸率，促进深度学习方法在恶意软件检测领域的发展，另一方面可以提高恶意软件检测器抵御对抗样本的能力，提高检测模型的鲁棒性。

一种基于像素注意力机制的恶意软件对抗样本生成方法，包括以下内容：

步骤1：建立恶意软件数据集，并定义其序列和名称模块；

所述恶意软件数据集以CSV文件形式存在；该数据集是在沙箱环境下分析的，其中每一行都是恶意软件API调用的有序序列；

步骤1.1：准备沙箱环境；首先在分析机上安装操作系统以及沙箱应用程序；关闭操作系统的防火墙以及系统更新功能；

步骤1.2：提取恶意软件API调用序列；恶意软件被依次运行在沙箱中；沙箱将每个恶意软件的分析信息写入数据库；通过分析这些信息，获取恶意软件在分析机上的行为数据，这些行为数据中包含所有恶意软件API调用序列；

步骤1.3：处理恶意软件API调用序列；将所有恶意软件API调用序列使用编号进行处理，筛选出不同类型的恶意软件API调用序列；

步骤1.4:分析恶意软件API调用序列；使用Virus Total网站提供的API分析服务；每个恶意软件都会经过防病毒应用程序的扫描，从而获得更加全面的恶意软件分析结果；

步骤1.5：根据分析结果，确定每个恶意软件API调用序列所属的恶意软件家族名称；

步骤1.6：基于步骤1.3和步骤1.5，建立恶意软件数据集，数据集包含恶意软件API调用序列以及恶意软件家族名称；

步骤2：将恶意软件数据集的API调用序列进行可视化表征，生成具有纹理特征的图像；

步骤2.1：将恶意软件API调用序列使用FastText模型进行词向量化处理形成词向量矩阵，词向量矩阵是一种用于表示自然语言中单词的向量空间模型，通常由一个大型的矩阵组成；每行对应一个单词，在该行中的每个元素表示该单词在某个向量维度上的取值，其中v表示词汇表的大小，n表示每个单词向量的维度，词向量化处理的结果如下所示；

步骤2.2：将词向量转化为整数数组；首先，需要确定灰度级数，然后将所有的整数存储在一个数组中；

步骤2.3：生成灰度图；为将整数数组转化为灰度图，使用编程库进行处理；将整数数组中的每个值作为每个像素点的灰度值，并将其与图像中的相应像素点进行对应，最终通过将词向量矩阵转化为整数矩阵，并利用Python库中的Image.fromarray()方法，将整数矩阵转化为灰度图；

步骤3：基于步骤2，构建基于像素注意力机制的生成对抗网络模型PixGAN；

所述对抗网络模型PixGAN采用DCGAN网络模型，在其网络架构的基础上进行了改进，引入了对比敏感性强的像素注意力机制；

步骤3.1：基于DCGAN模型构建像素注意力机制模块，该模块由特征提取、通道压缩、像素注意力机制权重计算和特征重组四部分构成；首先，输入的灰度图像通过卷积神经网络进行特征提取，得到一个特征图；然后，对该特征图进行通道压缩，通过比较输入的灰度图和DCGAN模型生成的对抗样本(灰度图)的梯度差值，来衡量每个像素点的关键程度，差值越大则该像素点越关键，利用激活函数将差值转换为注意力权重，对图像进行加权，使DCGAN模型的生成器更加关注重要的特征，从而生成质量更高的对抗样本(灰度图)；

步骤3.2：构建PixGAN网络模型；

步骤3.2.1：构建PixGAN的生成器，PixGAN的生成器是在DCGAN生成器的基础上引入了步骤3.1构建的像素注意力机制模块，该生成器包含了三个部分：main1、main2、main3，每个部分都由多个转置卷积层，批量归一化层和激活函数层组成；生成器的输入为灰度图和随机噪声，通过像素注意力机制模块和转置卷积层进行特征处理和加权处理，再通过批量归一化层和激活函数层进行特征重组，最终通过Tanh函数进行激活，将像素值限制在[-1,1]之间生成对抗样本(灰度图)；

步骤3.2.2：构建PixGAN的判别器，PixGAN的判别器是在DCGAN判别器的基础上引入了步骤3.1构建的像素注意力机制模块，该判别器包含了三个部分：main1、main2、main3，每个部分都由多个卷积层，批量归一化层和激活函数层组成；首先将PixGAN模型的生成器生成的灰度图作为卷积层的输入，得到一个特征图，这个特征图被传递给像素注意力机制模块，该模块会对特征图进行加权以强调重要区域并抑制无用区域；经过像素注意力机制处理后特征图被传递到main2中进行卷积、批量归一化和激活函数层处理，最终通过main3输出表示真实概率的特征图；

步骤4：训练PixGAN模型，生成恶意软件对抗样本；

PixGAN通过判别器网络D和生成器网络G相互靠拢；D用于区分真实数据和G生成的数据，而G的目标是学习实际数据的分布；为能够学习生成器在数据x的分布P_g，定义了输入噪音z的先验变量P_z(z)，其中，E表示关于下标中指定分布的期望，D(x)表示真实数据的概率分布，G(z)表示生成器生成的假数据的概率分布，训练D从而最大化分配给训练样本以及生成新样本的正确标签的概率，训练G使log(1-D(G(z)))最小化，则D和G的训练均为有关值函数V(D,G)的极小化极大化的博弈过程，表示为：

GAN包含两个网络部分，需要进行交替训练，即P_data(x)＝P_g(x)，因此在训练过程中，先固定生成器G，最优判别器D表示为：

在给定生成器G的情况下，判别器D的最大化目标函数表示为：

步骤5:为了评估恶意软件对抗样本的质量，使用得到的对抗样本对检测模型进行攻击，观察攻击效果，根据逃逸率来评估恶意软件对抗样本的质量。

本发明有益技术效果：

本发明首先仔细研读和分析了恶意软件可视化表征和恶意软件对抗样本生成的相关的文档，在理论上基本掌握了不同恶意软件可视化表征的方法；实现了一种基于模型的恶意软件可视化表征方法。其次，分析和比较现存的恶意软件对抗样本生成方面的相关研究，提出了一种深度卷积生成对抗网络模型；在该模型的基础上，结合对比敏感度较强的像素注意力机制，提出基于像素注意力机制的深度卷积生成对抗网络模型，并完成了基于像素注意力机制的恶意软件对抗样本的生成方法设计与实现，所产生的恶意软件对抗样本质量较高，所设计的基于像素注意力机制的生成对抗网络具有较强的稳定性。

附图说明

图1本发明实施例恶意软件可视化表征示意图；

图2本发明实施例像素注意力机制框架示意图；

图3本发明实施例基于像素注意力机制的生成对抗网络模型示意图；

图4本发明实施例基于像素注意力机制的恶意软件对抗样本生成方法的流程图；

图5本发明实施例恶意软件数据集建立示意图。

具体实施方式

下面结合附图和实施例对本发明做进一步说明；

一种基于像素注意力机制的恶意软件对抗样本生成方法，整体流程图如图4所示，包括以下内容：

步骤1：建立Windows恶意软件数据集，并定义其序列和名称模块；如附图5所示；

所述恶意软件数据集以CSV文件形式存在，提高互操作性，而且不需要特定的软件和库来读取；该数据集是在沙箱环境下分析的，其中每一行都是恶意软件API调用的有序序列；

步骤1.1：准备Cuckoo沙箱环境；首先在分析机上安装Ubuntu操作系统，随后安装Cuckoo沙箱应用程序；该分析机作为虚拟服务器，用于运行和分析恶意软件；并且在该服务器上安装Windows操作系统，关闭防火墙以及操作系统更新功能，以防止在恶意软件操作期间出现任何干扰或限制；

步骤1.2：提取恶意软件API调用序列；恶意软件被依次运行在Cuckoo沙箱中；沙箱将每个恶意软件的分析信息写入MongoDB数据库；通过分析这些信息，可以获取恶意软件在分析机上的行为数据，这些行为数据中包含所有Windows恶意软件API调用序列；

步骤1.3：处理Windows恶意软件API调用序列；将所有Windows恶意软件API调用序列使用编号进行处理，筛选出不同类型的恶意软件API调用序列；

步骤1.4:分析恶意软件API调用序列；使用Virus Total网站提供的API分析服务；通过这种方式，每个恶意软件都会经过防病毒应用程序的扫描，从而获得更加全面的恶意软件分析结果；

步骤1.5：根据分析结果，确定每个Windows恶意软件API调用序列所属的恶意软件家族名称；

步骤1.6：基于步骤1.3和步骤1.5，建立Windows恶意软件数据集，数据集包含恶意软件API调用序列以及恶意软件家族名称；

步骤2：将Windows恶意软件数据集API调用序列进行可视化表征，生成具有纹理特征的灰度图，如图1所示；

步骤2.1：将Windows API调用序列使用FastText模型进行词向量化处理形成词向量矩阵，词向量化处理的结果如下所示；

步骤2.2：词向量转化为整数数组；首先，需要确定灰度级数，通常情况下灰度级数为256，它可以表示所有可能的8位二进制数值，对于每个词向量，将其标准化到0～255的范围内，将所有的整数存储在一个数组中，作为步骤2.3的输入数据；

步骤2.3：生成灰度图；为将整数数组转化为灰度图，通常需要使用编程库进行处理，在此过程中，将整数数组中的每个值作为每个像素点的灰度值，并将其与图像中的相应像素点进行对应，从而确保生成的灰度图像能够准确地呈现所表示的词向量内容，最终，通过将词向量矩阵转化为整数矩阵，并利用Python库中的Image.fromarray()方法，可将整数矩阵转化为灰度图；

所述对抗网络模型PixGAN采用DCGAN网络模型，在其网络架构的基础上进行了改进，引入了对比敏感性强的像素注意力机制；像素注意力机制可以帮助对抗网络更加关注输入灰度图中的关键纹理特征，使对抗网络生成质量更高、迁移性更好的对抗样本(灰度图)；

步骤3.1：基于DCGAN模型构建像素注意力机制模块，如附图2所示，目的是提高DCGAN模型生成对抗样本(灰度图)的质量，该模块主要由特征提取、通道压缩、像素注意力机制权重计算、特征重组四部分构成，首先，输入的灰度图像通过卷积神经网络进行特征提取，得到一个特征图，然后，对该特征图进行通道压缩，以降低计算复杂度，同时保留关键信息，接下来，通过比较输入的灰度图和DCGAN模型生成的对抗样本(灰度图)的梯度差值，来衡量每个像素点的关键程度，差值越大则该像素点越关键，利用激活函数将差值转换为注意力权重，对图像进行加权，使DCGAN模型的生成器更加关注重要的特征，从而生成质量更高的对抗样本(灰度图)；基于像素注意力机制的生成对抗网络模型示意图如附图3所示；

步骤3.2：构建PixGAN网络模型；

步骤3.2.1：构建PixGAN的生成器，PixGAN的生成器是在DCGAN生成器的基础上引入了步骤3.1构建的像素注意力机制模块，该生成器包含了三个部分：main1、main2、main3，每个部分都由多个转置卷积层，批量归一化层和激活函数层组成；生成器的输入为灰度图和随机噪声，通过像素注意力机制模块和转置卷积层进行特征处理和加权处理，再通过批量归一化层和激活函数层进行特征重组，最终通过Tanh函数进行激活，将像素值限制在[-1,1]之间生成对抗样本(灰度图)；设计生成器的目的在于通过向图像添加噪声扰动来产生高质量的对抗样本，从而使判别器产生错误分类；由于损失函数的非平滑性质，生成对抗网络的训练往往是一个上下波动的过程；随着迭代次数的增加，生成器逐渐得到优化，生成的对抗样本逐渐欺骗判别器，同时损失函数值逐渐减小，最终趋于平稳。损失函数图像呈现由低到高，再从高到低的趋势；

这是因为在模型训练初期，对抗样本与原始样本差异较大，判别器的性能逐渐增强，对抗样本难以迷惑判别器，使得生成器的损失函数值逐渐增大；当迭代到4000-6000次之后，生成器逐渐优化，使得生成器的损失函数值逐渐下降，最终达到相对平稳的状态，产生高质量的对抗样本；

在数据集相同的情况下，引入了MalGAN、DCGAN两种不同的生成对抗网络进行对比，通过对比发现PixGAN的生成器损失函数值随着迭代次数的增加最终收敛并稳定在0.0～0.2之间；DCGAN和MalGAN的生成器损失函数值随着迭代次数的增加最终收敛并稳定在0.2～0.4之间，通过比较损失函数值收敛速度，在相同的迭代次数下，PixGAN模型的收敛速度要优于MalGAN和DCGAN，在生成器收敛稳定的状态下，PixGAN的损失函数值小于MalGAN和DCGAN。由此可知，PixGAN模型的生成器性能优于MalGAN和DCGAN；

步骤3.2.2：构建PixGAN的判别器，PixGAN的判别器是在DCGAN判别器的基础上引入了步骤3.1构建的像素注意力机制模块，该生成器包含了三个部分：main1、main2、main3，每个部分都由多个卷积层，批量归一化层和激活函数层组成；，首先将PixGAN模型的生成器生成的灰度图作为卷积层的输入，得到一个特征图，这个特征图被传递给像素注意力机制模块，该模块会对特征图进行加权以强调重要区域并抑制无用区域；经过像素注意力机制处理后特征图被传递到main2中进行卷积、批量归一化和激活函数层处理，最终通过main3输出表示真实概率的特征图；设计判别器的目的在于区分真实样本与对抗样本，随着迭代次数的增加，判别器的损失函数值呈现出由大到小的变化趋势，这是由于模型训练初期，判别器具有较强的区分能力，随着迭代次数的增加，高质量对抗样本的产生使得判别器的损失函数逐渐下降，最终达到稳定状态；

在数据集相同的情况下，PixGAN判别器的损失函数值随着迭代次数的增加最终收敛并稳定在0～2之间；DCGAN判别器的损失函数值随着迭代次数的增加最终收敛并稳定在2～2.4之间；MalGAN判别器的损失函数值随着迭代次数的增加最终收敛并稳定在2.5～4之间，通过比较损失函数值收敛速度，在相同的迭代次数下，PixGAN模型的收敛速度要优于MalGAN和DCGAN，在判别器收敛稳定的状态下，PixGAN的损失函数值小于MalGAN和DCGAN，由此可知，PixGAN模型的判别器性能优于MalGAN和DCGAN；

步骤4：训练PixGAN模型，生成恶意软件对抗样本；

GAN包含两个网络部分，所以需要进行交替训练，使生成器获得真实数据的分布，即P_data(x)＝P_g(x),因此在训练过程中，通常先固定生成器G，最优判别器D可表示为：

在给定生成器G的情况下，判别器D的最大化目标函数可以表示为：

步骤5:为了评估恶意软件对抗样本的质量，使用对抗样本对基于SVM、RF、CNN等检测模型进行攻击，均获得了良好的效果，逃逸率用来评估恶意软件对抗样本的质量。将生成的对抗样本输入到CNN+LSTM模型中检测，其逃逸率达到了43％；在逃逸的对抗样本中Trojan所占比例最大，DownLoader所占的比例最小；随后，分别将对抗样本送入基于CNN+RNN、CNN、RF、SVM四种检测算法的检测器中进行预测，验证对抗样本逃逸效果以及迁移性；

从对抗样本在不同检测器的逃逸效果分析可知，随着迭代次数的增加，对抗样本在CNN+LSTM模型检测器上的逃逸率达到了43％；对抗样本在CNN+RNN模型检测器上的逃逸率达到了39％；对抗样本在CNN模型检测器上的逃逸率达到了35％；对抗样本在RF模型检测器上的逃逸率达到了89％；对抗样本在SVM模型检测器的逃逸率达到了96％；

通过分析，PixGAN模型具有更强的训练稳定性，并且生成的对抗样本质量更高、迁移性更好。

Claims

1.一种基于像素注意力机制的恶意软件对抗样本生成方法，其特征在于，包括以下内容：

步骤1：建立恶意软件数据集，并定义其序列和名称模块；

步骤4：训练PixGAN模型，生成恶意软件对抗样本；

2.根据权利要求1所述的一种基于像素注意力机制的恶意软件对抗样本生成方法，其特征在于，步骤1具体为：

步骤1.6：基于步骤1.3和步骤1.5，建立恶意软件数据集，数据集包含恶意软件API调用序列以及恶意软件家族名称。

3.根据权利要求1所述的一种基于像素注意力机制的恶意软件对抗样本生成方法，其特征在于，步骤2具体为：

步骤2.1：将恶意软件API调用序列使用FastText模型进行词向量化处理形成词向量矩阵，每行对应一个单词，在该行中的每个元素表示该单词在某个向量维度上的取值，其中v表示词汇表的大小，n表示每个单词向量的维度，词向量化处理的结果如下所示；

步骤2.3：生成灰度图；将整数数组中的每个值作为每个像素点的灰度值，并将其与图像中的相应像素点进行对应，最终通过将词向量矩阵转化为整数矩阵，并利用Python库中的Image.fromarray()方法，将整数矩阵转化为灰度图。

4.根据权利要求1所述的一种基于像素注意力机制的恶意软件对抗样本生成方法，其特征在于，步骤3具体为：

步骤3.1：基于DCGAN模型构建像素注意力机制模块，该模块由特征提取、通道压缩、像素注意力机制权重计算和特征重组四部分构成；

首先，输入的灰度图像通过卷积神经网络进行特征提取，得到一个特征图；然后，对该特征图进行通道压缩，通过比较输入的灰度图和DCGAN模型生成的对抗样本即灰度图的梯度差值，来衡量每个像素点的关键程度，差值越大则该像素点越关键，利用激活函数将差值转换为注意力权重，对图像进行加权，使DCGAN模型的生成器更加关注重要的特征，从而生成质量更高的对抗样本即灰度图；

步骤3.2：构建PixGAN网络模型。

5.根据权利要求4所述的一种基于像素注意力机制的恶意软件对抗样本生成方法，其特征在于，步骤3.2具体为：

步骤3.2.2：构建PixGAN的判别器，PixGAN的判别器是在DCGAN判别器的基础上引入了步骤3.1构建的像素注意力机制模块，该判别器包含了三个部分：main1、main2、main3，每个部分都由多个卷积层，批量归一化层和激活函数层组成；首先将PixGAN模型的生成器生成的灰度图作为卷积层的输入，得到一个特征图，这个特征图被传递给像素注意力机制模块，该模块会对特征图进行加权以强调重要区域并抑制无用区域；经过像素注意力机制处理后特征图被传递到main2中进行卷积、批量归一化和激活函数层处理，最终通过main3输出表示真实概率的特征图。