CN113612767B

CN113612767B - 基于多任务学习增强的加密恶意流量检测方法及系统

Info

Publication number: CN113612767B
Application number: CN202110876302.5A
Authority: CN
Inventors: 金舒原; 张笑天
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2021-07-31
Filing date: 2021-07-31
Publication date: 2022-09-20
Anticipated expiration: 2041-07-31
Also published as: CN113612767A

Abstract

本发明为克服加密恶意流量检测模型的泛化能力弱、检测精度低的缺陷，提出一种基于多任务学习增强的加密恶意流量检测方法及系统，其中包括：设置辅助子任务，并对每类辅助子任务设置辅助子任务类别标签；采集加密恶意流量数据作为训练样本，对每条加密恶意流量数据根据其类别设置加密恶意流量类别标签，以及设置多个辅助子任务类别标签；构建深度学习网络模型；将训练样本输入所述深度学习网络模型中，根据输入的训练样本的加密恶意流量类别标签及辅助子任务类别标签进行多任务训练；屏蔽所述深度学习网络模型中辅助子任务对应的输出，得到加密恶意流量检测模型；将实时网络流量数据输入所述加密恶意流量检测模型中，得到加密恶意流量检测结果。

Description

基于多任务学习增强的加密恶意流量检测方法及系统

技术领域

本发明涉及计算机网络安全技术领域，更具体地，涉及一种基于多任务学习增强的加密恶意流量检测方法及系统。

背景技术

近年来网络技术不断发展，人们通过互联网应用提升工作与休闲生活质量的同时，恶意软件也在互联网中悄然流行。不法分子可以利用恶意软件在互联网环境中窃取个人或企业机密信息，甚至夺取恶意软件宿主主机控制权并实施勒索。通过恶意软件在网络通信过程中产生的流量追踪到恶意软件是保证网络空间安全的重要途径。因此，在日益复杂的网络环境中，如何准确并且低误报的检测恶意软件通信流量，是当今网络环境下的重要挑战。

面对加密恶意流量，目前主要采用端到端的深度学习方法执行加密恶意流量检测任务，具体可分为两类主流的模式：第一类是将加密流量的有效载荷映射成为加密流图，然后用一维或二维CNN网络提取握手包中明文特征或加密流量包中的字节分布特征，最后用全连接网络作为检测加密恶意流量的分类层；第二类是将加密流中的包长序列或包到达时间序列作为输入，通过LSTM或GRU网络提取序列整体特征，输入到全连接网络检测加密恶意流量。上述两种基于深度学习的方法都是通过设计出端到端模型，利用带标签的加密恶意流量数据集训练，使用反向传播算法训练模型学习分类加密流量的特征向量，并同时学习分类参数。然而上述两类加密恶意流量检测技术中，由于缺乏约束网络模型学习流量特征的手段，不能确保深度学习模型所捕获的流量特征不是训练数据集上的专有偏差，导致加密恶意流量检测模型存在泛化能力弱的缺陷。此外，由于恶意加密流量和非恶意流量在SSL/TLS加密套件的使用、握手数据包扩展项提供和证书签名方式等方面具有显著的差异，而深度学习网络在训练过程中无法利用恶意流量先验知识，这对加密恶意流量检测的检测精度造成了一定影响。

发明内容

本发明为克服上述现有技术所述的泛化能力弱、检测精度低的缺陷，提供一种基于多任务学习增强的加密恶意流量检测方法，以及基于多任务学习增强的加密恶意流量检测系统。

为解决上述技术问题，本发明的技术方案如下：

基于多任务学习增强的加密恶意流量检测方法，包括以下步骤：

S1、设置辅助子任务，并对每类辅助子任务设置辅助子任务类别标签；

S2、采集加密恶意流量数据作为训练样本，对每条加密恶意流量数据根据其类别设置加密恶意流量类别标签，以及设置多个辅助子任务类别标签；

S3、构建深度学习网络模型；

S4、将训练样本输入所述深度学习网络模型中，根据输入的训练样本的加密恶意流量类别标签及辅助子任务类别标签进行多任务训练；

S5、屏蔽所述深度学习网络模型中辅助子任务对应的输出，得到加密恶意流量检测模型；将实时网络流量数据输入所述加密恶意流量检测模型中，得到加密恶意流量检测结果。

作为优选方案，所述辅助子任务包括SSL/TLS握手信息识别任务、流统计特征识别任务和证书特征识别任务。

作为优选方案，所述SSL/TLS握手信息识别任务包括：识别加密流所用SSL/TLS协议版本类别、SSL/TLS握手阶段提供的扩展项类别、所用的SSL/TLS加密套件类别、客户端提供的SSL/TLS加密套件类别中的一种或多种；

所述流统计特征识别任务包括：识别加密流中数据包长度大小集合中的最大值、最小值、均值、方差中的一种或多种；识别加密流中数据包到达间隔时间集合中的最大值最大值、最小值、均值、方差中的一种或多种；

所述证书特征识别任务包括：识别加密流服务端提供的证书版本、证书序列号长度、证书的签名算法、证书的公钥长度、证书的有效期时长、证书是否为自签名证书中的一种或多种。

作为优选方案，所述流统计特征识别任务还包括对加密流内客户端方向上数据包中的最大值、最小值、均值、方差中的一种或多种进行识别，对加密流内服务端方向上数据包中的最大值、最小值、均值、方差中的一种或多种进行识别。

作为优选方案，所述S4步骤中，所述深度学习网络模型进行多任务训练的步骤包括：

S4.1、将深度学习网络模型中所有参数采用随机数初始化；

S4.2、将训练样本输入深度学习网络模型中，深度学习网络模型对输入的训练样本实施正向传播，得到训练样本的预测加密恶意流量分类标签与预测的辅助子任务标签；

S4.3、根据输入的训练样本的加密恶意流量类别标签与所述深度学习网络模型对应输出的预测向量计算第一损失值，并根据输入的训练样本的辅助子任务类别标签与所述深度学习网络模型对应输出的预测向量计算第二损失值，再将所述第一损失值和第二损失进行加和得到此次正向传播的总损失；

S4.4、通过反向传播算法计算总损失相对于所有权重的梯度，通过梯度下降算法更新所有参数，使得输出与实际标签误差最小；通过多次迭代，得到最优的深度学习网络模型，保存得到训练完成的深度学习网络模型。

作为优选方案，所述S4.2步骤中，其具体步骤包括：

S4.2.1、从输入的训练样本中获得其加密流量在SSL/TLS协议握手阶段的报文原始流量字节序列映射而成的数字序列，以及加密流量的数据包长序列与数据包到达间隔序列；

S4.2.2、将所述数字序列以及加密流量的数据包长序列与数据包到达间隔序列中每个数字映射作为数字二维矩阵中的一行，得到数字二维矩阵；

S4.2.3、将所述数字二维矩阵进行一维卷积变换，得到一维特征图，并对其进行特征降维处理；

S4.2.4、将经过特征降维处理的一维特征图进行非线性映射，得到整体特征向量；其中所述整体特征向量的维数等于预设的加密恶意流量分类中类别数目与辅助子任务标签的维度之和；

S4.2.5、根据所述整体特征向量，获得加密恶意流量类别概率，以及辅助子任务中所有任务各自的类别概率，并依据所获得的概率输出预测加密恶意流量分类标签和预测辅助子任务标签。

进一步的，本发明还提出了一种基于多任务学习增强的加密恶意流量检测系统，应用于上述任一技术方案提出的基于多任务学习增强的加密恶意流量检测方法，其具体包括：

辅助子任务设置模块，用于设置SSL/TLS握手信息识别任务、流统计特征识别任务和证书特征识别任务，且每类辅助子任务设置有相应的辅助子任务类别标签；

样本采集模块，用于采集加密恶意流量数据作为训练样本；

标签设置模块，用于对每条加密恶意流量数据根据其类别设置加密恶意流量类别标签，以及设置多个辅助子任务类别标签；

加密恶意流量检测模块，用于对输入的实时网络流量数据进行加密恶意流量检测模块，输出得到加密恶意流量检测结果；

其中，所述加密恶意流量检测模块包括深度学习网络模型，所述深度学习网络模型根据输入的训练样本的辅助子任务类别标签对所述深度学习网络模型进行多任务训练得到，且所述深度学习网络模型中对辅助子任务对应的输出进行屏蔽。

作为优选方案，所述深度学习网络模型包括输入层、嵌入层、神经网络层、池化层、全连接层、输出层，其中：

所述输入层用于获得加密流量在SSL/TLS协议握手阶段的报文原始流量字节序列映射而成的数字序列，以及加密流量的数据包长序列与数据包到达间隔序列，并将所获得的序列数据传输至所述嵌入层；

所述嵌入层用于将输入的序列数据中每个数字映射作为数字二维矩阵中的一行，并将完成构建的数字二维矩阵传输至所述神经网络层；

所述神经网络层用于将输入的数字二维矩阵通过一维卷积核进行一维卷积变换，得到一维特征图，再将一维特征图传输至所述池化层；

所述池化层用于将输入的一维特征图进行特征降维处理，并且将降维处理后的一维特征图传输至所述全连接层；

所述全连接层用于将输入的一维特征图进行非线性映射，得到整体特征向量，其中所述整体特征向量的维数等于预设的加密恶意流量分类中类别数目与辅助子任务标签的维度之和，最后将所述特征向量传输至所述输出层；

所述输出层，用于根据所述整体特征向量，获得加密恶意流量类别概率与辅助子任务中所有任务各自的类别概率，并依据所获得的概率输出加密恶意流量分类结果和辅助子任务的识别结果。

作为优选方案，所述神经网络层包括LSTM、GRU或1DCNN网络中的一种；其中，当采用LSTM或GRU网络时，去除所述深度学习网络模型中的池化层。

作为优选方案，所述神经网络层采用1DCNN网络，且所述神经网络层与所述池化层堆叠设置。

与现有技术相比，本发明技术方案的有益效果是：本发明引入除加密恶意流量检测分类任务外的辅助子任务，通过多个任务训练深度学习网络模型的参数，能够在加密恶意流量检测的强相关任务中同时达到良好效果，进而反向促进加密流量的特征提取与表示，有效增强加密恶意流量检测任务上的泛化能力与检测精度。

附图说明

图1为实施例1的基于多任务学习增强的加密恶意流量检测方法的流程图。

图2为实施例2的基于多任务学习增强的加密恶意流量检测系统的架构图。

图3为实施例2的深度学习网络模型的架构图。

图4为实施例2的深度学习网络模型的架构图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

本实施例提出一种基于多任务学习增强的加密恶意流量检测方法，如图1所示，为本实施例的基于多任务学习增强的加密恶意流量检测方法的流程图。

本实施例提出的基于多任务学习增强的加密恶意流量检测方法中，包括以下步骤：

步骤1：设置辅助子任务，并对每类辅助子任务设置辅助子任务类别标签。

本步骤用于对多任务训练中采取的辅助子训练任务进行确定。

由于多任务训练的技术本质上是一种迁移学习的深度学习技术，因此为了增强模型在加密恶意流量检测的主任务上的泛化能力和识别精度，辅助子任务的选取直接决定了模型的增强效果。

本实施例中的辅助子任务包括SSL/TLS握手信息识别任务、流统计特征识别任务和证书特征识别任务。

其中，SSL/TLS握手信息识别任务包括：

1)识别加密流所用SSL/TLS协议版本类别；

2)识别加密流SSL/TLS握手阶段提供的扩展项类别；

3)识别加密流所用的SSL/TLS加密套件类别；

4)识别加密流中客户端提供的SSL/TLS加密套件类别。

流统计特征识别任务包括：

1)识别加密流中数据包长度大小集合中的最大值；

2)识别加密流中数据包长度大小集合中的最小值；

3)识别加密流中数据包长度大小集合的均值；

4)识别加密流中数据包长度大小集合的方差；

5)识别加密流中数据包到达间隔时间集合中的最大值；

6)识别加密流中数据包到达间隔时间集合中的最小值；

7)识别加密流中数据包到达间隔时间集合的均值；

8)识别加密流中数据包到达间隔时间集合的方差。

进一步的，上述八种流特征识别任务可以扩展为对应的加密流内客户端方向上数据包的八种流特征识别任务，以及对应的加密流内服务端方向上数据包的八种流特征识别任务。即对加密流内客户端方向及服务端方向上，其数据包中的长度大小集合及包到达间隔时间集合的最大值、最小值、均值、方差进行识别，总计24种流特征识别任务可以任意组合。

证书特征识别任务包括：

1)识别加密流服务端提供证书版本；

2)识别加密流服务端提供证书序列号长度；

3)识别加密流服务端提供证书的签名算法；

4)识别加密流服务端提供证书的公钥长度；

5)识别加密流服务端提供证书的有效期时长；

6)识别加密流服务端提供证书是否为自签名证书。

针对上述辅助子任务的各个类别，分别设置有辅助子任务类别标签。在后续步骤中，对于设置有辅助子任务类别标签的训练样本，当其输入深度学习网络模型时，深度学习网络模型根据训练样本设置的辅助子任务类别标签执行相应的辅助子任务，实现通过多个任务训练模型网络参数。

步骤2：采集加密恶意流量数据作为训练样本，对每条加密恶意流量数据根据其类别设置加密恶意流量类别标签，以及设置多个辅助子任务类别标签。

本实施例中，通过蜜罐技术捕获恶意软件运行时产生的流量作为训练样本，或直接采用现有公开的加密恶意流量数据集作为训练样本。

进一步的，所采集的训练样本还包括非恶意软件产生的正常互联网用户通信过程中的正常加密流量。

此外，对每条加密恶意流量数据设置的辅助子任务类别标签，根据任务类别设置数据格式。同任务不同类别若存在全序关系应采用一维向量作为标签，比如加密流内数据包大小的最大值识别、数据包大小的最小值识别等任务的标签数据。同任务不同类别若不存在全序关系，是离散的不可比较的类别，应采用独热编码后的多维向量作为标签，比如SSL/TLS协议扩展项识别、SSL加密套件识别等任务的标签数据。

步骤3：构建深度学习网络模型。

由于加密流量是互联网通信过程中产生的序列数据，所以在深度学习网络的选择上应选择提取序列特征的LSTM、GRU或1DCNN网络。

考虑到在加密恶意流量检测任务和辅助子任务的完成中，需要对加密流量的局部特征做特征提取，并且1DCNN网络对特征提取具有平移不变性和局部性的特点，因此用基于1DCNN构建的端到端的深度学习网络模型。

步骤4、将训练样本输入所述深度学习网络模型中，根据输入的训练样本的加密恶意流量类别标签及辅助子任务类别标签进行多任务训练。

其中，对深度学习网络模型进行多任务训练的步骤包括：

S4.1、将深度学习网络模型中所有参数采用随机数初始化；

本步骤中，利用设置有加密恶意流量类别标签与多个辅助子任务标签的训练样本，对完成构建的端到端的深度学习网络模型，通过反向传播算法进行训练。

在上述模型训练过程中，反向传播算法需要在每一轮的正向传播过程结束后通过标签数据计算损失。其中，由于采用多训练学习技术增强端到端深度学习网络模型的参数学习，所以训练中的损失，由加密恶意流量类别标签与模型对应预测的加密恶意流量类别概率计算出的损失，和其余辅助子任务标签与模型预测的任务所属类别概率计算出的损失加和得出。

本实施例中对各任务的损失选用交叉熵误差计算。

进一步的，在S4.2步骤中，其具体步骤包括：

上述步骤可根据深度学习模型的结构作适应性调整设置。

步骤5：屏蔽所述深度学习网络模型中辅助子任务对应的输出，得到加密恶意流量检测模型；将实时网络流量数据输入所述加密恶意流量检测模型中，得到加密恶意流量检测结果。

本步骤中，可通过去除输出层中用于生成辅助子任务结果的神经元实现辅助子任务对应输出的屏蔽。

本实施例中，利用多任务学习技术，在用于加密恶意流量检测的深度学习网络模型的训练过程中，引入除加密恶意流量检测分类任务外的辅助子任务，通过多个任务训练深度学习网络模型的参数，能够在加密恶意流量检测的强相关任务中同时达到良好效果，进而反向促进加密流量的特征提取与表示，增强加密恶意流量检测任务上的泛化能力与检测精度。

此外，本实施例在对辅助子任务的设置，利用以往加密恶意流量识别工作中得到的先验知识设计与加密恶意流量任务强相关的辅助子任务，确保本发明提出的多任务学习增强技术在加密恶意流量检测任务上达到有效的泛化能力与识别精度的提升。

实施例2

本实施例提出一种基于多任务学习增强的加密恶意流量检测系统，如图2所示，为本实施例的基于多任务学习增强的加密恶意流量检测系统的架构图。

本实施例提出的基于多任务学习增强的加密恶意流量检测系统应用实施例1提出的加密恶意流量检测方法中，其具体包括：

辅助子任务设置模块1，用于设置SSL/TLS握手信息识别任务、流统计特征识别任务和证书特征识别任务，且每类辅助子任务设置有相应的辅助子任务类别标签；

样本采集模块2，用于采集加密恶意流量数据作为训练样本；

标签设置模块3，用于对每条加密恶意流量数据根据其类别设置加密恶意流量类别标签，以及设置多个辅助子任务类别标签；

加密恶意流量检测模块4，用于对输入的实时网络流量数据进行加密恶意流量检测模块4，输出得到加密恶意流量检测结果。

其中，所述加密恶意流量检测模块4包括深度学习网络模型，所述深度学习网络模型根据输入的训练样本的辅助子任务类别标签对所述深度学习网络模型进行多任务训练得到，且所述深度学习网络模型中对辅助子任务对应的输出进行屏蔽。

本实施例中，所述深度学习网络模型包括输入层、嵌入层、神经网络层、池化层、全连接层、输出层，其中：

所述输入层用于获得加密流量在SSL/TLS协议握手阶段的ClientHello报文、ServerHello报文与Certificate报文原始流量字节序列映射而成的数字序列，以及加密流量的数据包长序列与数据包到达间隔序列，并将所获得的序列数据传输至所述嵌入层；

如图3所示，为本实施例的深度学习网络模型的架构图。其中包括依次连接的输入层101、嵌入层102、1DCNN层103、池化层104、全连接层105、输出层106，且每层构造皆满足本实施例的深度学习网络模型中对应的要求。

进一步的，上述神经网络层可采用LSTM、GRU或1DCNN网络中的一种。其中，当采用LSTM或GRU作为神经网络层时，将深度学习网络模型中的池化层去除。

本实施例中，采用1DCNN网络提取加密流量握手数据包信息特征与流统计信息特征。本实施例利用1DCNN对序列数据局部信息特征提取的良好效果和识别特征时的平移不变性，对加密流量实施细粒度的特征提取，为模型训练中使用多任务学习技术创造模型结构设计上的可能性。

在另一实施例中，进一步的，神经网络层采用1DCNN网络，且1DCNN神经网络层与池化层多层堆叠设置，能够得到不同细粒度的一维特征图，其架构图如图4所示。其中包括依次连接的输入层101、嵌入层102、第一1DCNN层201、第一池化层202、第二1DCNN层203、第二池化层204、全连接层107、输出层108，且每层构造皆满足本实施例的深度学习网络模型中对应的要求。

在具体实施过程中，先通过辅助子任务设置模块1对应用于深度学习网络模型多任务训练的辅助子任务进行设置，并分别设置其类别标签。

采用样本采集模块2采集加密恶意流量数据作为训练样本，然后输入标签设置模块3中，通过标签设置模块3对每条加密恶意流量数据根据其类别设置加密恶意流量类别标签，以及设置多个辅助子任务类别标签。

标签设置模块3将完成标签设置的训练样本输入加密恶意流量检测模块4中对其深度学习网络模型进行多任务训练。其中，深度学习网络模型对输入的训练样本实施正向传播，得到训练样本的预测加密恶意流量分类标签与预测的辅助子任务标签。进一步的，深度学习网络模型根据输入的训练样本的加密恶意流量类别标签与所述深度学习网络模型对应输出的预测向量计算第一损失值，并根据输入的训练样本的辅助子任务类别标签与所述深度学习网络模型对应输出的预测向量计算第二损失值，再将所述第一损失值和第二损失进行加和得到此次正向传播的总损失，然后通过反向传播算法计算总损失相对于所有权重的梯度，通过梯度下降算法更新所有参数，使得输出与实际标签误差最小；经过多次迭代，得到最优的深度学习网络模型，加密恶意流量检测模块4将训练完成的深度学习网络模型进行保存，包括模型结构、训练配置、优化器状态和模型参数，并去除输出层中用于生成辅助子任务结果的神经元实现辅助子任务对应输出的屏蔽。

经过上述过程，对本实施例的加密恶意流量检测系统完成构建及训练。在进行加密恶意流量检测时，将实时网络流量数据输入加密恶意流量检测模块4中，加密恶意流量检测模块4输出得到加密恶意流量检测结果。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.基于多任务学习增强的加密恶意流量检测方法，其特征在于，包括以下步骤：

S3、构建深度学习网络模型；

S4、将训练样本输入所述深度学习网络模型中，根据输入的训练样本的加密恶意流量类别标签及辅助子任务类别标签进行多任务训练；其中：

S4.1、将深度学习网络模型中所有参数采用随机数初始化；

S4.2、将训练样本输入深度学习网络模型中，深度学习网络模型对输入的训练样本实施正向传播，得到训练样本的预测加密恶意流量分类标签与预测的辅助子任务标签；其中：

S4.2.5、根据所述整体特征向量，获得加密恶意流量类别概率，以及辅助子任务中所有任务各自的类别概率，并依据所获得的概率输出预测加密恶意流量分类标签和预测辅助子任务标签；

S4.4、通过反向传播算法计算总损失相对于所有权重的梯度，通过梯度下降算法更新所有参数，使得输出与实际标签误差最小；通过多次迭代，得到最优的深度学习网络模型，保存得到训练完成的深度学习网络模型

2.根据权利要求1所述的加密恶意流量检测方法，其特征在于，所述辅助子任务包括SSL/TLS握手信息识别任务、流统计特征识别任务和证书特征识别任务。

3.根据权利要求2所述的加密恶意流量检测方法，其特征在于，所述SSL/TLS握手信息识别任务包括：识别加密流所用SSL/TLS协议版本类别、SSL/TLS握手阶段提供的扩展项类别、所用的SSL/TLS加密套件类别、客户端提供的SSL/TLS加密套件类别中的一种或多种；

所述流统计特征识别任务包括：识别加密流中数据包长度大小集合中的最大值、最小值、均值、方差中的一种或多种；识别加密流中数据包到达间隔时间集合中的最大值、最小值、均值、方差中的一种或多种；

4.根据权利要求3所述的加密恶意流量检测方法，其特征在于，所述流统计特征识别任务还包括对加密流内客户端方向和/或服务端方向上，其数据包中的长度大小集合及包到达间隔时间集合的最大值、最小值、均值、方差中的一种或多种进行识别。

5.基于多任务学习增强的加密恶意流量检测系统，应用于权利要求1～4任一项所述的基于多任务学习增强的加密恶意流量检测方法，其特征在于，包括：

样本采集模块，用于采集加密恶意流量数据作为训练样本；

6.根据权利要求5所述的加密恶意流量检测系统，其特征在于，所述深度学习网络模型包括输入层、嵌入层、神经网络层、池化层、全连接层、输出层，其中：

所述输出层，用于根据所述整体特征向量，获得加密恶意流量类别概率，以及当前辅助子任务所属类别概率，并依据所获得的概率输出加密恶意流量分类结果和辅助子任务的识别结果。

7.根据权利要求6所述的加密恶意流量检测系统，其特征在于，所述神经网络层包括LSTM、GRU或1DCNN网络中的一种；其中，当采用LSTM或GRU网络时，去除所述深度学习网络模型中的池化层。

8.根据权利要求6所述的加密恶意流量检测系统，其特征在于，所述神经网络层包括1DCNN网络，且所述神经网络层与所述池化层堆叠设置。