CN112261063A

CN112261063A - 结合深度分层网络的网络恶意流量检测方法

Info

Publication number: CN112261063A
Application number: CN202011251386.5A
Authority: CN
Inventors: 潘丽敏; 王琛; 罗森林
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2020-11-09
Filing date: 2020-11-09
Publication date: 2021-01-22

Abstract

本发明涉及结合深度分层网络的网络恶意流量检测方法，属于计算机与信息科学技术领域。本发明首先对原始流量包进行特征提取，生成字节表示的向量特征，然后将新生成的特征输入深度分层网络的Text‑CNN网络进行空间特征提取，将输出的空间特征重塑为特征图，输入Bi‑LSTM网络中提取时间特征，最后对深度分层网络进行迭代训练，根据时空特征输出流量的分类结果。本发明使用了深度学习方法，大大提高了流量信息的特征提取效率，而且可以对网络用户产生的原始流量数据进行分析检测，解决了流量数据特征工程丢失信息造成的分类精度和效率降低的问题，简化了通信系统对流量信息的分析过程，满足了大数据环境下的恶意流量检测需求，提高了网络恶意流量的检测效率。

Description

结合深度分层网络的网络恶意流量检测方法

技术领域

本发明涉及结合深度分层网络的网络恶意流量检测方法，属于计算机与信息科学技术领域。

背景技术

互联网的快速发展为我们的生活带来了便利，但与此同时各种网络攻击也频繁出现。网络入侵检测是保护计算机网络安全的重要手段，基于流量统计特征提取的恶意流量检测和分析是网络入侵检测领域的主要分析方法。

到目前为止，现有的恶意流量检测方法大都试图通过复杂的特征工程从流量数据中提取信息。这些特征工程可以提取流量数据的时间特征和空间特征，但特征工程会丢失一些信息或改变流量数据包原有的时间和空间特征，算法通过提取的流量特征，只能利用缺失的流量数据信息进行分类，导致分类精度等指标已经达到瓶颈，难以继续提高。因此，本发明将提供结合深度分层网络的网络恶意流量检测方法，来提高恶意流量的精度和检测效率。

结合深度分层网络的网络恶意流量检测方法需要解决的基本问题是：提高流量数据的特征提取质量和效率，增强算法对流量特征的分析能力和分类精度。综合现有的网络恶意流量检测方法，通常使用方法可归为三类：

1.基于端口的恶意流量检测方法

基于端口的恶意流量检测方法是根据端口号来检测恶意流量。在互联网的早期阶段，用于网络流量的网络协议相对简单，具体的应用程序基本上使用固定的端口号。因此，当一个应用程序受到其他应用程序攻击时，可以根据端口号有效地检测到异常流量包。

然而，随着动态端口分配技术的出现，端口可以很容易地重定向。因此，基于端口的流量检测方法不能充分表达网络的流量属性，流量检测效果往往较差。

2.基于负载的恶意流量检测方法

基于负载的恶意流量检测方法利用应用层协议的信息来表达流量的特征，其中最具代表性的是深度数据包检测(DPI)技术。深度数据包检测技术需要对传输的流量数据进行解密和加密，通过对传输的数据信息进行建模和分析，可以非常有效地检测出恶意流量包。

3.基于统计特征的恶意流量检测方法

基于统计特征的恶意流量检测方法一般采用数据包到达时间、数据包大小以及流量分组字段的统计特征(如平均、最大、最小)来表示流量的属性。利用这些人为设计的特征和机器学习算法来分析和检测恶意流量已经成为相对可靠的方法。

综上所述，现有的恶意流量检测方法大都试图通过复杂的特征工程从流量数据中提取信息，然后对这些时间和空间特征进行分析判别是否为恶意流量。但特征提取会丢失或改变流量数据包原有的时间和空间特征。算法通过提取的流量特征，只能利用缺失的流量数据信息进行分类，因此分类精度等指标已经达到瓶颈，难以继续提高。所以本发明提出结合深度分层网络的网络恶意流量检测方法。

发明内容

本发明的目的是为了解决流量数据特征工程丢失信息造成的分类精度和效率降低的问题，所以提出了结合深度分层网络的网络恶意流量检测方法。

本发明的设计原理为：本发明首先对网络用户产生的原始流量数据包信息进行提取，将数据包信息生成字节表示的向量特征，然后将新生成的特征输入深度分层网络的Text-CNN网络进行空间特征提取，再将输出的特征重塑为特征图，输入Bi-LSTM网络中提取时间特征，最后对深度分层网络进行迭代训练，根据特征输出流量的分类结果。

本发明的技术方案是通过如下步骤实现的：

步骤1，根据原始流量包信息进行特征抽取。

步骤1.1，将具有相同五元组信息的流量包拆分为一个流。

步骤1.2，从每个流中的流量包中提取字节特征。

步骤2，构建深度分层网络的Text-CNN网络提取空间特征。

步骤2.1，将字节特征转化为灰度图像。

步骤2.2，为Text-CNN模型的隐藏层添加卷积层，执行最大池化操作。

步骤2.3，添加全连接层，然后进行dropout操作，得到流量包信息的空间特征。

步骤3，构建深度分层网络的Bi-LSTM网络提取时间特征。

步骤3.1，将Text-CNN模型提取的时间特征重塑为特征图。

步骤3.2，为Bi-LSTM模型的cell添加神经元。

步骤3.3，添加全连接层进行dropout操作输出流量包信息的时间特征。

步骤3.4，添加softmax层输出流量属于每个类的概率。

步骤4，训练深度分层网络。

步骤4.1，添加均方误差损失函数。

步骤4.2，对混合模型进行训练迭代，使用梯度下降优化算法更新权重和偏差。

有益效果

相比于基于端口、负载以及统计特征的任意一种恶意流量检测方法，本发明使用了深度学习方法，大大提高了流量信息的特征提取效率，而且可以对网络用户产生的原始流量数据进行分析检测，解决了流量数据特征工程丢失信息造成的分类精度和效率降低的问题，简化了通信系统对流量信息的分析过程，满足了大数据环境下的恶意流量检测需求，提高了网络恶意流量的检测效率。

附图说明

图1为本发明结合深度分层网络的网络恶意流量检测方法的原理图。

具体实施方式

为了更好的说明本发明的目的和优点，下面结合实例对本发明方法的实施方式做进一步详细说明。

具体流程为：

步骤1，根据原始流量包信息进行特征提取。

步骤1.1，从原始流量包中将具有相同协议类型、源IP、源端口、目的IP、目的端口属性的流量包拆分为一个流。

步骤1.2，从每个流中提取10个流量包，对于每个流量包，从网络层取前20字节,传输层取前20字节，应用层取前120个字节作为流量包特征，如果每层字节数少于要提取的数目，缺少的字节使用0填充；若某个流中流量包数目不足10个，用第一个流的特征填充；共从每个流中提取1600维特征的原始数据。

步骤2，构建深度分层网络的Text-CNN网络提取空间特征。

步骤2.1，将1600维特征转换为40*40的灰度图像作为Text-CNN网络输入层的输入。

步骤2.2，为Text-CNN网络的隐藏层添加卷积层，执行最大池化操作，具体参数如下：隐藏层使用两个卷积层和两个最大池化层，其中，第一个卷积层使用16个4*4的卷积核，然后执行最大池化，第二层卷积层使用32个3*3的卷积核，然后执行最大池化，隐藏层使用relu激活函数进行变换，然后进行最大池化，将原来40*40的灰度图像变成了4*4大小并具有16通道的图像，然后对每张4*4*16的图像进行平化操作，得到一个256维的向量，发送到CNN网络的输出层。

步骤2.3，为Text-CNN网络添加全连接层，全连接层使用1600个神经元，然后进行dropout操作，随机失活部分神经元，得到流量包信息的空间特征。

步骤3，构建深度分层网络的Bi-LSTM网络提取时间特征。

步骤3.1，将Text-CNN模型提取的1600维空间特征重塑为40*40的特征图。

步骤3.2，为Bi-LSTM网络的cell添加神经元，Bi-LSTM网络使用两层单元进行时间特征提取，每个cell使用256个隐藏层单元，每层的cell激活功能使用Sigmoid函数进行非线性运算。

步骤3.3，为Bi-LSTM网络添加全连接层，全连接层中的神经元数量为11个，与流量分类的类别数量相同，在全连接层进行dropout操作输出流量包信息的时间特征。

步骤3.4，为Bi-LSTM网络添加softmax层输出流量属于每个类的概率。

步骤4，训练分层网络混合模型。

步骤4.1，添加均方误差损失函数

y_k是网络的输出，t_k是监督数据。

测试结果：实验结合深度分层网络的网络恶意流量检测方法，本发明在对网络用户产生的原始流量数据进行了分析与检测，数据集采用CICID2017和CTU数据集，采用Text-CNN网络和Bi-LSTM网络组成的深度分层网络对流量包进行了时空特征提取并分类，提高了流量数据的特征提取效率，有效的实现了网络恶意流量的自适应检测。

以上所述的具体描述，对发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.结合深度分层网络的网络恶意流量检测方法，其特征在于所述方法包括如下步骤：

步骤1，对用户产生的原始流量包进行数据提取，从原始流量包中将具有相同协议类型、源IP、源端口、目的IP、目的端口属性的流量包拆分为一个流，在每个流中提取10个流量包，每个流量包中提取160个字节作为流量包特征，共从每个流中提取1600维特征的原始数据；

步骤2，构建深度分层网络，深度分层网络由Text-CNN网络和Bi-LSTM网络两层网络组成，第一层Text-CNN网络首先将步骤1中提取的流的1600维字节特征转换为40*40灰度图像作为Text-CNN网络输入层的输入，提取流的空间特征，第二层Bi-LSTM网络将Text-CNN模型提取的空间特征重塑为40*40的特征图，提取流的时间特征；

步骤3，将步骤2中的两个网络同时训练成混合网络，添加均方误差损失函数，对混合网络进行训练迭代，使用梯度下降优化算法更新权重和偏差，完成迭代后网络能够自动提取流的时空特征并对流进行分类。

2.根据权利要求1所述的结合深度分层网络的网络恶意流量检测方法，其特征在于：步骤1中对原始流量包进行特征提取，对于每个流量包，从网络层取前20字节,传输层取前20字节，应用层取前120个字节作为流量包特征，如果每层字节数少于要提取的数目，缺少的字节用0填充；若某个流中流量包数目不足10个，用第一个流的特征填充；从每个流中一共提取1600维特征的原始数据。

3.根据权利要求1所述的结合深度分层网络的网络恶意流量检测方法，其特征在于：步骤2中构建的深度分层网络由两层网络构成，第一层Text-CNN网络输出的是1*1600维的空间特征，第二层Bi-LSTM网络将Text-CNN网络输出的1600维空间特征重塑为40*40的特征图，将特征图作为第二层Bi-LSTM网络的输入，提取流的时间特征，Bi-LSTM网络的最后一层全连接层中的神经元数量为11个，与流量分类的类别数量相同，最终深度分层网络输出流量属于每个类的概率。