CN114826776A

CN114826776A - 一种用于加密恶意流量的弱监督检测方法及系统

Info

Publication number: CN114826776A
Application number: CN202210628110.7A
Authority: CN
Inventors: 齐法制; 刘珺怡; 王佳荣; 颜田; 陈刚
Original assignee: Institute of High Energy Physics of CAS
Current assignee: Institute of High Energy Physics of CAS
Priority date: 2022-06-06
Filing date: 2022-06-06
Publication date: 2022-07-29
Anticipated expiration: 2042-06-06
Also published as: CN114826776B

Abstract

本发明涉及一种用于加密恶意流量的弱监督检测方法及系统，其方法包括：S1：将采集的数据流包转化成图片，构建训练集X_i，对X_i中部分样本进行标记，得到标记样本(X_labeled,Y)和未标记样本X_unlabeled；S2：构建和训练半监督生成对抗网络，包括：生成器G、判别器D和分类器C；其中，生成器G基于随机噪声n得到生成样本X_generated＝G(n)；将生成样本X_generated、标记样本(X_labeled,Y)和未标记样本X_unlabeled一起输入判别器D，预测每类样本的分布概率，经过分类器C得到X_i的包级分类结果；S3：将带有包级分类标签的X_i进行多示例分割，并输入基于多示例学习的卷积神经网络，预测得到X_i的示例级分类结果。本发明提供的方法可有效地进行加密恶意流量的细粒度检测。

Description

一种用于加密恶意流量的弱监督检测方法及系统

技术领域

本发明涉及信息安全技术领域，具体涉及一种用于加密恶意流量的弱监督检测方法及系统。

背景技术

当前世界网络安全形势复杂多变，恶意流量的检测在抵御和防范攻击行为，在保障网络空间安全方面起着重要作用。流量加密传输方式的广泛应用，在保护通信安全和隐私的同时许多恶意软件也借此技术隐藏攻击信息，使得传统的基于端口和基于DPI的恶意流量检测方法失效。为了应对加密恶意流量检测，研究者们提出了基于机器学习的检测方法。基于机器学习的加密恶意流量检测方法通常构建统计特征，训练加密流量分类模型进行恶意流量识别，一方面，特征选择建立在丰富的经验、专业知识的基础上，需要耗费大量时间和人力。另一方面，大部分流量分类方案都采用有监督的学习方法训练模型，然而，获取大型细粒度标记流量训练集同样是一项繁琐的工作。

因此，如何利用少量粗标记样本和大量未标记样本实现加密恶意流量的细粒度分类成为一个亟待解决的问题。

发明内容

为了解决上述技术问题，本发明提供一种用于加密恶意流量的弱监督检测方法及系统。

本发明技术解决方案为：一种用于加密恶意流量的弱监督检测方法，包括：

步骤S1：采集网络数据流，对所述数据流分割成数据包并进行预处理后，转化成单通道灰度图片，以此构建训练集X_i，i∈[1,M]，M为数据包个数，并对X_i中部分样本进行标记，得到标记样本(X_labeled,Y)和未标记样本X_unlabeled；

步骤S2：构建和训练半监督生成对抗网络，包括：生成器G、判别器D和分类器C；其中，所述生成器G接收随机噪声矢量n，得到生成样本X_generated＝G(n)；将所述生成样本X_generated、所述训练集中的标记样本(X_labeled,Y)和未标记样本X_unlabeled一起输入所述判别器D，预测每类样本的分布概率，经过所述分类器C得到粗分类的X_i的包级分类结果；

步骤S3：构建基于多示例学习的卷积神经网络，包括：多示例学习标注模块、卷积神经网络模块、多示例池化模块和Ladder Network模块；将带有粗分类标签的X_i经过所述多示例学习标注模块，得到X_i的示例分割以及包级标签，再经过卷积神经网络模块，计算X_i中示例的得分，通过多示例池化模块赋予所述得分不同的权重，最后通过Ladder Network模块，预测得到细分类的X_i的示例级分类结果。

本发明与现有技术相比，具有以下优点：

1、本发明公开了一种用于加密恶意流量的弱监督检测方法，采用深度学习方法，运用图像分类技术解决流量分类问题，能够直接从原始数据中学习特征，有效地进行加密恶意流量的细粒度检测。

2、本发明针对弱标记样本问题，提出了一种新的基于生成对抗网络和多示例的弱监督学习框架，可用少量粗标记样本和大量未标记样本进行模型训练，减少了样本标记的工作量。

3、本发明利用Ladder Network作为分类网络，提高了在少量标记样本情况下加密恶意流量检测的准确率。

附图说明

图1为本发明实施例中一种用于加密恶意流量的弱监督检测方法的流程图；

图2为本发明实施例中从原始流量数据转换为单通道灰度图的流程示意图；

图3为本发明实施例中半监督生成对抗网络的结构示意图；

图4为本发明实施例中基于多示例学习的卷积神经网络的结构示意图；

图5为本发明实施例中一种用于加密恶意流量的弱监督检测系统的结构框图。

具体实施方式

本发明提供了一种用于加密恶意流量的弱监督检测方法，采用深度学习方法，运用图像分类技术解决流量分类问题，能够直接从原始数据中学习特征，有效地进行加密恶意流量的细粒度检测。

为了使本发明的目的、技术方案及优点更加清楚，以下通过具体实施，并结合附图，对本发明进一步详细说明。

实施例一

如图1所示，本发明实施例提供的一种用于加密恶意流量的弱监督检测方法，包括下述步骤：

步骤S1：采集网络数据流，对数据流分割成数据包并进行预处理后，转化成单通道灰度图片，以此构建训练集X_i，i∈[1,M]，M为数据包个数，并对X_i中部分样本进行标记，得到标记样本(X_labeled,Y)和未标记样本X_unlabeled；

步骤S2：构建和训练半监督生成对抗网络，包括：生成器G、判别器D和分类器C；其中，生成器G接收随机噪声矢量n，得到生成样本X_generated＝G(n)；将生成样本X_generated、训练集中的标记样本(X_labeled,Y)和未标记样本X_unlabeled一起输入判别器D,预测每类样本的分布概率，经过分类器C得到粗分类的X_i的包级分类结果；

步骤S3：构建基于多示例学习的卷积神经网络，包括：多示例学习标注模块、卷积神经网络模块、多示例池化模块和LadderNetwork模块；将带有粗分类标签的X_i经过多示例学习标注模块，得到X_i的示例分割以及包级标签，再经过卷积神经网络模块，计算X_i中示例的得分，通过多示例池化模块赋予得分不同的权重，最后通过LadderNetwork模块，预测得到细分类的X_i的示例级分类结果。

在一个实施例中，上述步骤S1：采集网络数据流，对数据流分割成数据包并进行预处理后，转化成单通道灰度图片，以此构建训练集X_i，i∈[1,M]，M为数据包个数，并对X_i中部分样本进行标记，得到标记样本(X_labeled,Y)和未标记样本X_unlabeled，具体包括：

步骤S11：对采集到的网络数据流进行分割，得到小型pcap数据包；对pcap数据包进行数据清洗，删除冗余数据，得到清洗后的pcap数据包；

首先，采集网络上的会话，包括双向流中的所有数据包，将所有具有相同五元组(源IP、目标IP、源端口、目标端口、传输协议)的一组数据包定义为属于同一数据流。利用开源工具SplitCap根据TCP和UDP会话分割原始数据流，拆分出多个小型pcap数据包。

其次，进行数据清洗。为获得pcap数据包中的有效负载，需要删除较小的会话，剔除pcap文件中的Global Header和Packet Header等非数据内容的字段，并对重复的数据包进行删除合并减少冗余。

步骤S12：对清洗后的pcap数据包进行裁剪，转化成单通道灰度图片X_i，其中，i∈[1,M]，M为数据包个数；对X_i中部分样本进行标注，得到标记样本(X_labeled,Y)和未标记样本X_unlabeled，其中，Y为标记样本的标签，具体包括：

对数据清洗后的每个pcap数据包进行裁剪，本发明实施例以784(28*28)字节为一组，长度不够时在末尾填充0x00。以每个字节表示为一个像素，从而将每个数据包转化成大小为28*28的单通道灰度图片。将得到的所有图片构建训练集X_i，i∈[1,M]，M为数据包个数，并选择X_i中部分样本进行标记，得到标记样本(X_labeled,Y)，X_i中其余样本作为未标记样本X_unlabeled。例如，按照数据包的类别，将数据包标记为FTP或者木马程序。

图2展示了从原始的流量数据转换为单通道灰度图的流程示意图。

在一个实施例中，步骤S2：构建和训练半监督生成对抗网络，包括：生成器G、判别器D和分类器C；其中，生成器G接收随机噪声矢量n，得到生成样本X_generated＝G(n)；将生成样本X_generated、训练集中的标记样本(X_labeled,Y)和未标记样本X_unlabeled一起输入判别器D,预测每类样本的分布概率，经过分类器C得到粗分类的X_i的包级分类结果，具体包括：

步骤S21：生成器G接收随机噪声矢量n，得到生成样本X_generated＝G(n)；

本步骤中，生成器的目标是使得生成样本尽可能接近真实样本，使得判别器无法区分生成样本和真实样本；

步骤S22：将生成样本X_generated、标记样本(X_labeled,Y)和未标记样本X_unlabeled输入判别器D，利用判别器D得到每类样本的分布概率，再经过分类器C，得到每个X_i对应的包级标签Y_i，其中Y_i包括N+1个类别，其中前N类为标记样本(X_labeled,Y)中Y所包含的类别，第N+1类为生成样本；

本步骤中，将生成样本X_generated、真实样本中的标记样本(X_labeled,Y)和未标记样本X_unlabeled一起输入判别器,判别器能够学习每标签类别的分布概率；联合训练生成器G和判别器/分类器D/C，利用下述损失函数作为优化目标函数，不断迭代更新和优化半监督生成对抗网络的参数，直到达到纳什均衡则网络收敛；

步骤S23：分别构建有标签样本损失函数L_labeled、无标签样本损失函数L_unlabeled和生成样本损失函数L_generated，如公式(1)～(3)所示，用于优化半监督生成对抗网络的参数：

其中，p_data为真实样本分布，p_G为生成样本分布，p_model为预测分类的概率；

步骤S24：半监督生成对抗网络的优化目标函数，如公式(4)所示：

其中，G为生成器，D为判别器。

如图3所示，为半监督生成对抗网络的结构示意图。

本发明实施例改进了半监督生成对抗网络，通过极大极小博弈来寻找生成器和判别器的纳什均衡。生成器根据输入的随机噪声训练网络，产生尽可能接近真实数据的样本。判别器联合带标签的少量真实样本、不带标签的大量真实样本以及不带标签的生成样本训练网络，生成粗粒度的分类标签。

由于训练集中只对少量pcap数据包标注了标签，且该标签是粗粒度的，经过半监督生成对抗网络基于pcap数据包进行分类，得到的包级分类标签也是粗粒度的，即标记为正常的pcap包均为正常流量，而标记为恶意的pcap包中可能也包含部分正常流量，故需要进行细粒度检测，对于pcap包中恶意流量的具体位置进行标注。为了实现此目的，本发明实施例引入了多示例学习的方法，以示例instance作为最小训练单位，定义一个pcap包为一组示例的集合，利用步骤S2得到pcap数据包的包级粗粒度标签进行下述步骤S3的示例级细粒度标签的预测。

在一个实施例中，上述步骤S3：构建基于多示例学习的卷积神经网络，包括：多示例学习标注模块、卷积神经网络模块、多示例池化模块和Ladder Network模块；将带有粗分类标签的X_i经过多示例学习标注模块，得到X_i的示例分割以及包级标签，再经过卷积神经网络模块，计算X_i中示例的得分，通过多示例池化模块赋予得分不同的权重，最后通过LadderNetwork模块，预测得到细分类的X_i的示例级分类结果，具体包括：

步骤S31：将带有包级标签Y_i的X_i输入多示例学习标注模块，将包级标签Y_i映射到标签域

即X_i被标记为正常0或可疑1：

令图片

其中，m为X_i中示例个数；如果X_i对应的pcap数据包中包含至少一条恶意流量，表明X_i中包含至少一个正示例，则

即X_i被标记为1，表示X_i为可疑数据包；如果X_i对应的pcap数据包中全部为正常流量，则

即X_i被标记为0，表示X_i正常数据包，标签域

与示例级标签

间的关系表示如公式(5)所示：

其中，

为X_i的示例级标签，

表示正示例，但在网络训练过程中

是未知的隐藏变量；

步骤S32：将被标记为可疑的X_i中的每个示例

输入卷积神经网络的卷积层进行特征提取，并使用池化层将提取的特征转换为N维特征向量

计算特征向量

在每个维度的得分

其中，k＝1,2,...,N；如公式(6)所示；基于所有示例的得分，共同构成score map：

其中，变换函数f_φ(·)将输入的

转换为特征向量

函数g_ψ(·)用于计算特征向量得分；φ、ψ均为卷积神经网络的参数；

在本步骤中，只将步骤S31中X_i被标记为1，即可疑的数据包输入卷积神经网络的卷积层进行特征提取，并转换为N维特征向量，其中N对应于前述标记样本(X_labeled,Y)中Y所包含的类别数，计算X_i中各个示例被分为对应类别的得分，构建score map。

步骤S33：将

输入多示例池化模块，利用注意力机制将score map中的得分赋予不同权重进行聚合后得到聚合向量θ，θ及每个示例的注意力权重

如公式(7)～(8)所示：

其中，W是基于多示例学习的卷积神经网络的参数；b是多示例池化模块的参数，ω_i是卷积层的中间特征向量；

本步骤中多示例池化模块(MILPooling)中通过加入注意力机制将score map中的得分赋予不同权重进行聚合，赋予关键示例更高的权重，以便更好地关注关键示例。

步骤S34：将聚合向量θ输入基于Ladder Network的分类器，输出两个预测标签：有噪声的输出标签

用于计算损失函数，无噪声的输出标签

用于分类：

分类器输出预测类别的概率分布如公式(9)所示：

其中，

为Ladder Network第l层与的第l-1层之间的权值，

为非加噪编码器第l层的隐变量，T为转置；

为

的无噪声标签；其中，i∈[1,M]，j∈[1,m]，i∈[1,M]，L是Ladder network的层数；

如图4展示的基于多示例学习的卷积神经网络的结构示意图，其中，LadderNetwork是一个L层的编码器-解码器结构，由一个加噪编码器、一个非加噪编码器以及一个解码器构成。加噪编码器添加高斯噪声N(0,σ²)到

得到有噪声的输出标签

用于计算损失函数。解码器对加噪编码器的每层输出进行重构，提高分类器的抗噪性能。非加噪编码器的输出标签

用于得到分类结果；

步骤S35：构建总损失函数L_total：

构建监督损失函数L_supervised卷积神经网络产生的交叉熵损失，如公式(10)所示：

其中，

表示第，i个数据包的第，j个示例的有噪声的输出标签；

构建非监督损失L_unsupervised由LadderNetwork每层的重构误差产生，如公式(11)所示：

其中，λ_l为LadderNetwork中解码器第l层的损失函数权重，

分别为非加噪编码器和解码器第l层的中间层输出；q_l为第l层的节点数量；

构建总损失函数，如公式(12)所示：

L_total＝L_supervised+L_unsupervised(12)

根据总体损失函数更新基于多示例学习的卷积神经网络参数如公式(13)所示：

其中，超参数λ为常数。

本发明公开了一种用于加密恶意流量的弱监督检测方法，采用深度学习方法，运用图像分类技术解决流量分类问题，能够直接从原始数据中学习特征，有效地进行加密恶意流量的细粒度检测。本发明针对弱标记样本问题，提出了一种新的基于生成对抗网络和多示例学习的弱监督学习框架，可用少量粗标记样本和大量未标记样本进行模型训练，减少了样本标记的工作量。本发明利用Ladder Network作为分类网络，提高了在少量标记样本情况下加密恶意流量检测的准确率。

实施例二

如图5所示，本发明实施例提供了一种用于加密恶意流量的弱监督检测系统，包括下述模块：

构建样本集模块41，用于采集网络数据流，对数据流分割成数据包并进行预处理后，转化成单通道灰度图片，以此构建训练集X_i，i∈[1,M]，M为数据包个数，并对X_i中部分样本进行标记，得到标记样本(X_labeled,Y)和未标记样本X_unlabeled；

粗粒度分类模块42，用于构建和训练半监督生成对抗网络，包括：生成器G、判别器D和分类器C；其中，生成器G接收随机噪声矢量n，得到生成样本X_generated＝G(n)；将生成样本X_generated、训练集中的标记样本(X_labeled,Y)和未标记样本X_unlabeled一起输入判别器D，预测每类样本的分布概率，经过分类器C得到粗分类的X_i的包级分类结果；

细粒度分类模块43，用于构建基于多示例学习的卷积神经网络，包括：多示例学习标注模块、卷积神经网络模块、多示例池化模块和Ladder Network模块；将带有粗分类标签的X_i经过多示例学习标注模块，得到X_i的示例分割以及包级标签，再经过卷积神经网络模块，计算X_i中示例的得分，通过多示例池化模块赋予得分不同的权重，最后通过LadderNetwork模块，预测得到细分类的X_i的示例级分类结果。

提供以上实施例仅仅是为了描述本发明的目的，而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改，均应涵盖在本发明的范围之内。

Claims

1.一种用于加密恶意流量的弱监督检测方法，其特征在于，包括：

步骤S2：构建和训练半监督生成对抗网络，包括：生成器G、判别器D和分类器C；其中，所述生成器G接收随机噪声矢量n，得到生成样本X_generated＝G(n)；将所述生成样本X_generated、所述训练集中的标记样本(X_labeled,Y)和未标记样本X_unlabeled一起输入所述判别器D,预测每类样本的分布概率，经过所述分类器C得到粗分类的X_i的包级分类结果；

步骤S3：构建基于多示例学习的卷积神经网络，包括：多示例学习标注模块、卷积神经网络模块、多示例池化模块和LadderNetwork模块；将带有粗分类标签的X_i经过所述多示例学习标注模块，得到X_i的示例分割以及包级标签，再经过卷积神经网络模块，计算X_i中示例的得分，通过多示例池化模块赋予所述得分不同的权重，最后通过Ladder Network模块，预测得到细分类的X_i的示例级分类结果。

2.根据权利要求1所述的用于加密恶意流量的弱监督检测方法，其特征在于，所述步骤S1：采集网络数据流，对所述数据流分割成数据包并进行预处理后，转化成单通道灰度图片，以此构建训练集X_i，i∈[1,M]，M为数据包个数，并对X_i中部分样本进行标记，得到标记样本(X_labeled,Y)和未标记样本X_unlabeled，具体包括：

步骤S11：对采集到的网络数据流进行分割，得到M个pcap数据包；对所述pcap数据包进行数据清洗，删除冗余数据，得到清洗后pcap数据包；

步骤S12：对所述清洗后的pcap数据包进行裁剪，转化成单通道灰度图片，以此构建训练集X_i，其中，i∈[1,M]，M为数据包个数；对X_i中部分样本进行标注，得到标记样本(X_labeled,Y)和未标记样本X_unlabeled，其中，Y为所述标记样本的标签。

3.根据权利要求2所述的用于加密恶意流量的弱监督检测方法，其特征在于，所述步骤S2：构建和训练半监督生成对抗网络，包括：生成器G、判别器D和分类器C；其中，所述生成器G接收随机噪声矢量n，得到生成样本X_generated＝G(n)；将所述生成样本X_generated、所述训练集中的标记样本(X_labeled,Y)和未标记样本X_unlabeled一起输入所述判别器D，预测每类样本的分布概率，经过所述分类器C得到粗分类的X_i的包级分类结果，具体包括：

步骤S22：将所述生成样本X_generated、所述标记样本(X_labeled,Y)和所述未标记样本X_unlabeled输入判别器D，利用所述判别器D得到每类样本的分布概率，再经过分类器C，得到每个X_i对应的包级标签Y_i，其中Y_i包括N+1个类别，其中前N类为所述标记样本(X_labeled,Y)中Y所包含的类别，第N+1类为生成样本；

步骤S23：分别构建有标签样本损失函数L_labeled、无标签样本损失函数L_unlabeled和生成样本损失函数L_generated，如公式(1)～(3)所示，用于优化所述半监督生成对抗网络的参数：

步骤S24：所述半监督生成对抗网络的优化目标函数，如公式(4)所示：

其中，G为生成器，D为判别器。

4.根据权利要求3所述的用于加密恶意流量的弱监督检测方法，其特征在于，所述步骤S3：构建基于多示例学习的卷积神经网络，包括：多示例学习标注模块、卷积神经网络模块、多示例池化模块和Ladder Network模块；将带有粗分类标签的X_i经过所述多示例学习标注模块，得到X_i的示例分割以及包级标签，再经过卷积神经网络模块，计算X_i中示例的得分，通过多示例池化模块赋予所述得分不同的权重，最后通过Ladder Network模块，预测得到细分类的X_i的示例级分类结果，具体包括：

即X_i被标记为正常0或可疑1：

令图片

即X_i被标记为0，表示X_i正常数据包，标签域

与示例级标签

间的关系表示如公式(5)所示：

其中，

为X_i的示例级标签，

表示正示例；

步骤S32：将被标记为可疑的X_i中的每个示例

输入所述卷积神经网络的卷积层进行特征提取，并使用池化层将提取的特征转换为N维特征向量

计算所述特征向量

在每个维度的得分

其中，变换函数f_φ(·)将输入的

转换为特征向量

函数g_ψ(·)用于计算所述特征向量得分；φ、ψ均为所述卷积神经网络的参数；

步骤S33：将

如公式(7)～(8)所示：

其中，W是基于多示例学习的卷积神经网络的参数；b是所述多示例池化模块的参数，ω_i是所述卷积层的中间特征向量；

步骤S34：将所述聚合向量θ输入基于Ladder Network的分类器，输出两个预测标签：有噪声的输出标签

用于计算损失函数，无噪声的输出标签

用于分类：

分类器输出预测类别的概率分布如公式(9)所示：

其中，

为Ladder Network第l层与的第l-1层之间的权值，

为非加噪编码器第l层的隐变量，T为转置；

为

的无噪声标签；其中，i∈[1,M]，j∈[1,m]，i∈[1,M]，L为Laddernetwork的层数；

步骤S35：构建总损失函数L_total：

构建监督损失函数L_supervised所述卷积神经网络产生的交叉熵损失，如公式(10)所示：

其中，

表示第i个数据包的第j个示例的有噪声的输出标签；

其中，λ_l为LadderNetwork中解码器第l层的损失函数权重，

构建总损失函数，如公式(12)所示：

L_total＝L_supervised+L_unsupervised(12)

根据所述总体损失函数更新所述基于多示例学习的卷积神经网络参数如公式(13)所示：

其中，超参数λ为常数。

5.一种用于加密恶意流量的弱监督检测系统，其特征在于，包括下述模块：

构建样本集模块，用于采集网络数据流，对所述数据流分割成数据包并进行预处理后，转化成单通道灰度图片，以此构建训练集X_i，i∈[1,M]，M为数据包个数，并对X_i中部分样本进行标记，得到标记样本(X_labeled,Y)和未标记样本X_unlabeled；

粗粒度分类模块，用于构建和训练半监督生成对抗网络，包括：生成器G、判别器D和分类器C；其中，所述生成器G接收随机噪声矢量n，得到生成样本X_generated＝G(n)；将所述生成样本X_generated、所述训练集中的标记样本(X_labeled,Y)和未标记样本X_unlabeled一起输入所述判别器D,预测每类样本的分布概率，经过所述分类器C得到粗分类的X_i的包级分类结果；

细粒度分类模块，用于构建基于多示例学习的卷积神经网络，包括：多示例学习标注模块、卷积神经网络模块、多示例池化模块和Ladder Network模块；将带有粗分类标签的X_i经过所述多示例学习标注模块，得到X_i的示例分割以及包级标签，再经过卷积神经网络模块，计算X_i中示例的得分，通过多示例池化模块赋予所述得分不同的权重，最后通过LadderNetwork模块，预测得到细分类的X_i的示例级分类结果。