CN110990835A

CN110990835A - 一种基于样本判定误差的神经网络木马检测方法

Info

Publication number: CN110990835A
Application number: CN201911154504.8A
Authority: CN
Inventors: 张伟; 高晖; 陈云芳; 王继平
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2019-11-22
Filing date: 2019-11-22
Publication date: 2020-04-10
Anticipated expiration: 2039-11-22
Also published as: CN110990835B

Abstract

本发明公开了一种基于样本判定误差的神经网络木马检测方法，主要包含两大步骤，首先利用测试数据集对模型执行一次正向传播和一次反向传播，计算出每层网络对应的节点敏感度分布；其次对每层节点敏感度分布动态设定的阈值，利用异常值挖掘算法挖掘其中的异常点，这些异常点即为待检测网络中的木马节点。本发明可以快速、有效地检测出神将网络中的木马节点，轻松应对神经网络木马攻击的威胁。

Description

一种基于样本判定误差的神经网络木马检测方法

技术领域

本发明属于人工智能领域，具体涉及一种基于样本判定误差的神经网络木马检测方法，主要用于检测不可信神经网络中是否含有恶意木马节点。

背景技术

人类正在迎来人工智能(AI)时代，神经网络(NN)作为应用最广泛的AI方法之一，已在诸多现实场景中得到应用，如人脸识别、语音识别、车辆自动驾驶、控制系统、基于机器的自然语言交流和游戏等。

虽然神经网络在模式识别中表现出很强的能力，但随着网络规模的日益庞大，计算成本变得越来越高昂。对于小型公司，大量训练样本和计算资源的机器学习任务总是给自己构建的解决方案提出了很大的技术挑战。为了满足这种需求，一个功能齐全且直接可用的机器学习即服务平台将成为下一步的发展趋势。因此，随着技术的发展，神经网络等深度学习技术不再是一个封闭的自我训练和自我使用的过程，将演变成可以部分模型按需安装/卸载、多端协作的技术。训练有素的模型将像人们的日常商品一样成为消费品，它们由专业公司或个人培训、制作，由不同供应商分发，最终由用户消费，人们可以进一步共享，再训练或转售这些模型。

新技术的出现往往会伴随着新的安全问题，神经网络从根本上只是一组与特定结构相关的矩阵运算，其内部结构的意义是完全隐含的，推理或解释神经网络的结构信息是非常困难的。因此我们难以判断机器学习即服务模式中是否存在潜在的安全威胁：神经网络供应商(攻击者)可能会嵌入恶意功能，即神经网络木马。攻击者往往可以操纵原始模型，使用攻击者制作的其他数据对模型进行重新训练，从而在网络中设置一个或多个木马节点以及关联的木马触发器，称之为木马模型。木马触发器是一些特殊的输入，通常只是整体输入样本的一小部分(例如，图像中增加的一个徽标)。攻击者的目标是使木马模型在正常样本输入情况下表现与原始模型一样，而在带有木马触发器样本输入时，触发异常行为。

为了应对神经网络木马的安全威胁，本发明提出一种直接针对神经网络的检测方法。首先利用测试数据集判定的总体误差计算神经网络每层节点的敏感度分布，接着利用异常值挖掘算法，检测出其中木马节点。

发明内容

发明目的：本发明的目的在于提供一种基于样本判定误差的神经网络木马检测方法，通过检测不可信神经网络是否含有恶意木马节点，实现对神经网络木马攻击的防御。

发明内容：本发明所述的一种基于样本判定误差的神经网络木马检测方法，包括以下步骤：

(1)针对不可信神经网络F，使用测试数据集D_test执行一次模型的正向传播，使用交叉熵用作代价函数,从而获得与此数据集相对应的整体误差C；

(2)定义在不可信神经网络F中，其网络层数为L，则在第l层的第i^th个神经元上的节点敏感度为

(3)根据节点敏感度的定义，可以得到第l层中节点敏感度的分布

其中n是l层上的神经元数量；

(4)将不可信神经网络F视为两种分布的叠加，即对应于正常节点的敏感度分布

和对应于木马节点的敏感度分布

将普通节点和木马节点的敏感度分为三种值；

(5)根据链式法则计算

并计算最后一个完全连接层的节点敏感度分布

(6)根据步骤(5)的结果，利用样本i，使用第l+1层的节点敏感度分布

来计算第l层的节点敏感度分布

(7)对于步骤(6)中得到的节点敏感度分布S^l，分别计算出其对应的下四分位数Q₁，上四分位数Q₃的所在位置，并根据Q₃与Q₁计算出四分距IQR＝Q₃-Q₁；

(8)分别计算弱上下限U和L与强上下限SU和SL；

(9)统计有无异常值点，如果有，则认为该异常点即为本层中的木马节点，反之则本层无木马节点；

(10)令l＝l-1，对下一层进行检测；

(11)重复步骤(6)—(10)，直至检测完每层神经网络对应的节点敏感度分布。

进一步地，所述步骤(1)通过以下公式实现：

C＝-∑_ky_k log a_k

其中，a_k代表第k^tg个神经元的值，y_k表示第k^th个神经元的真实值，值为0或1，为标签的one-hot编码。

进一步地，所述步骤(2)通过以下公式实现：

其中，C是步骤(1)中得到的整体误差，

为不可信神经网络F中第l层的第i^th个神经元。

进一步地，步骤(4)所述的普通节点和木马节点的敏感度分为的三种值为：

正常值：对于一个正常节点

其敏感度

因此其敏感度

通常很小，均匀地分散在中值M的两侧

其中k是较小的阈值；

离群值：对于个别正常节点x_j，虽然

但其节点敏感度

稍大，所以

其中sk是较大的阈值；

异常值：关于木马节点

其敏感度

因此其节点敏感度

通常较大，并且与总体中位数M的差值较大，因此

进一步地，所述步骤(6)通过以下公式实现：

其中，(w^l+1)^T是(l+1)层权重的转置矩阵，而σ'(z^l)表示当前层激活函数的导数。

进一步地，所述步骤(8)通过以下公式实现：

U＝Q₃+k*IQR

L＝Q₁-k*IQR

SU＝Q₃+sk*IQR

SL＝Q₃-sk*IQR

其中，k和sk分别为较小的阈值和较大的阈值。

有益效果：与现有技术相比，本发明的有益效果：1、本发明是一种直接针对模型的检测方法，只需要少量可信测试数据，大大降低筹备数据的开销；2、本发明的检测过程只需要对模型执行一次正向传播和一次反向传播，检测方法简单，检测更快，准确率更高；3、本发明可以直接确定被感染的节点，有利于后续对感染节点的修复。

附图说明

图1为本发明的流程图；

图2为本发明针对木马模型第Fc8层检测结果图；

图3为本发明针对正常模型第Fc8层检测结果图；

其中，实线为上下四分数Q₁和Q₃；虚点线为弱上下限U和L；虚划线为强上下限SU和SL；圈出的点为木马节点(异常节点)。

具体实施方式

下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。

本发明首先利用测试数据集对模型执行一次正向传播和一次反向传播，计算出每层网络对应的节点敏感度分布；其次对每层节点敏感度分布动态设定的阈值，利用异常值挖掘算法挖掘其中的异常点，这些异常点即为待检测网络中的木马节点。如图1所示，具体包括以下步骤：

步骤1：针对不可信神经网络F，使用测试数据集D_test执行一次模型的正向传播，使用交叉熵用作代价函数,从而获得与此数据集相对应的整体误差C：

C＝-∑_ky_k log a_k

其中，a_k代表第k^th个神经元的值，也就是softmax函数的输出，还是我们最终预测的结果。y_k表示第k^th个神经元的真实值，值为0或1，它是标签的one-hot编码。

步骤2：针对不可信神经网络F，其网络层数为L，首先定义在第l层的第i^th个神经元

上的节点敏感度

为：

其中，C是步骤1中利用测试数据集得到的整体误差，

为不可信神经网络F中第l层的第i^th个神经元。

步骤3：根据节点敏感度的定义，可以得到第l层中节点敏感度的分布

其中n是l层上的神经元数量，如图2和图3分别为被感染神经网络和正常神经网络第Fc8层对应的节点敏感度分布。

步骤4：本发明将一个不可信神经网络F视为两种分布的叠加，即对应于正常节点的敏感度分布

和对应于木马节点的敏感度分布

基于此，将普通节点和木马节点的敏感度分为三种值。

正常值：对于一个正常节点

其敏感度

因此其敏感度

通常很小，均匀地分散在中值M的两侧

其中k是较小的阈值。

离群值：对于个别正常节点x_j，虽然

但其节点敏感度

稍大，所以

其中sk是较大的阈值。

异常值：关于木马节点

其敏感度

因此其节点敏感度

通常较大，并且与总体中位数M的差值较大，因此

步骤5：根据链式法则计算

并计算最后一个完全连接层的分布

步骤6：根据步骤5的结果，利用样本i，使用第l+1层的节点敏感度分布

来计算第l层的节点敏感度分布

其中，(w^l+1)^T是(l+1)层权重的转置矩阵，而σ'(z^l)表示当前层激活函数的导数。然后进行Hadamard乘积运算，这会让节点敏感度通过l层的激活函数反向传递回来并给出在第l层的带权输入的

步骤7：对于步骤6中得到的节点敏感度分布S^l，分别计算出其对应的下四分位数Q₁，上四分位数Q₃的所在位置，如图2和图3中实线位置，并根据Q₃与Q₁计算出四分距IQR：

IQR＝Q₃-Q₁。

步骤8：分别计算弱上下限U和L与强上下限SU和SL：

U＝Q₃+k*IQR

L＝Q₁-k*IQR

SU＝Q₃+sk*IQR

SL＝Q₃-sk*IQR

其中k和sk为两种阈值，如图2和图3中虚点线为k＝1.5时的弱上下限U和L；而图2和图3中虚划线为sk＝5时的强上下限SU和SL。即定义落在1.5倍四分距以内的点都是正常值，1.5倍四分距到5倍四分距之间的点称之为离群值，而大于5倍四分距的点称之为异常值。

步骤9：统计有无异常值点，如果有，则认为该异常点即为本层中的木马节点，如图2中圈出的节点，反之则本层无木马节点，如图3所示。

步骤10：令l＝l-1，对下一层进行检测。

步骤11：重复步骤6～10，直至检测完每层神经网络对应的节点敏感度分布。

利用本专利检测方法，可以有效区分出被感染的神经网络与正常的神经网络。

Claims

1.一种基于样本判定误差的神经网络木马检测方法，其特征在于，包括以下步骤：

(1)针对不可信神经网络F，使用测试数据集D_test执行一次模型的正向传播，使用交叉熵用作代价函数，从而获得与此数据集相对应的整体误差C；

其中n是l层上的神经元数量；

和对应于木马节点的敏感度分布

将普通节点和木马节点的敏感度分为三种值；

(5)根据链式法则计算

并计算最后一个完全连接层的节点敏感度分布

来计算第l层的节点敏感度分布

(7)对于步骤(6)中得到的节点敏感度分布S^l，分别计算出其对应的下四分位数Q₁，中位数Q₂，上四分位数Q₃的所在位置，并根据Q₃与Q₁计算出四分距IQR＝Q₃-Q₁；

(8)分别计算弱上下限U和L与强上下限SU和SL；

(10)令l＝l-1，对下一层进行检测；

(11)重复步骤(6)-(10)，直至检测完每层神经网络对应的节点敏感度分布。

2.根据权利要求1所述的一种基于样本判定误差的神经网络木马检测方法，其特征在于，所述步骤(1)通过以下公式实现：

C＝-∑_ky_klog a_k

其中，a_k代表第k^th个神经元的值，y_k表示第k^th个神经元的真实值，值为0或1，为标签的one-hot编码。

3.根据权利要求1所述的一种基于样本判定误差的神经网络木马检测方法，其特征在于，所述步骤(2)通过以下公式实现：

其中，C是步骤(1)中得到的整体误差，

为不可信神经网络F中第l层的第i^th个神经元。

4.根据权利要求1所述的一种基于样本判定误差的神经网络木马检测方法，其特征在于，步骤(4)所述的普通节点和木马节点的敏感度分为的三种值为：

正常值：对于一个正常节点

其敏感度

因此其敏感度

通常很小，均匀地分散在中值M的两侧

其中k是较小的阈值；

离群值：对于个别正常节点x_j，虽然

但其节点敏感度

稍大，所以

其中sk是较大的阈值；

异常值：关于木马节点

其敏感度

因此其节点敏感度

通常较大，并且与总体中位数M的差值较大，因此

5.根据权利要求1所述的一种基于样本判定误差的神经网络木马检测方法，其特征在于，所述步骤(6)通过以下公式实现：

其中，(w^l+1)^T是(l+1)层权重的转置矩阵，而σ′(z^l)表示当前层激活函数的导数。

6.根据权利要求1所述的一种基于样本判定误差的神经网络木马检测方法，其特征在于，所述步骤(8)通过以下公式实现：

U＝Q₃+k*IQR

L＝Q₁-k*IQR

SU＝Q₃+sk*IQR

SL＝Q₃-sk*IQR

其中，k和sk分别为较小的阈值和较大的阈值。