CN113328986A

CN113328986A - 基于卷积神经网络与lstm结合的网络流量异常检测方法

Info

Publication number: CN113328986A
Application number: CN202110380372.1A
Authority: CN
Inventors: 黄银强; 金学奇; 蒋正威; 刘栋; 孔飘红; 李振华; 张静; 杜浩良; 肖艳炜; 朱英伟; 吴涛; 陈培东; 张晖; 凌开元; 费林渊; 吕育青
Original assignee: State Grid Zhejiang Electric Power Co Ltd; Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Current assignee: State Grid Zhejiang Electric Power Co Ltd; Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date: 2021-04-09
Filing date: 2021-04-09
Publication date: 2021-08-31

Abstract

本申请提出了基于卷积神经网络与LSTM结合的网络流量异常检测方法，所述方法包括：利用SCADA系统采集的网络数据，并对数据进行预处理，筛选得到符合实验要求的数据；将预处理的数据转化为对应灰度图像；建立CNN‑LSTM模型，通过交叉熵最小化的方式确定模型最优化参数；以准确率、真阳性率、假阳性率和F1‑score为指标对CNN‑LSTM模型进行训练，基于训练后的模型对检测分类效果进行评估。将两种方法结合在一起，成功的进行了检测，并且相较于传统的机器学习方法，取得了更优的检测效果。

Description

基于卷积神经网络与LSTM结合的网络流量异常检测方法

技术领域

本发明涉及网络安全技术领域，尤其涉及基于卷积神经网络与LSTM结合的网络流量异常检测方法。

背景技术

在智能电网转变的数字化过程中，为实现变电站之间以及和远程调度中心之间的协同和信息共享引入先进的通信技术，使得智能网络以及智能变电站面临网络入侵等传统的网络目前正在面临的信息安全威胁。电网采用监控和数据采集系统(SCADA)进行控制和管理。集中控制器通过远程终端单元收集信息，并向电网中的执行器发出控制命令。电网组件的互联引入了网络攻击的风险。神经网络被广泛用于异常检测，以识别和分类网络层面的网络攻击。

传统的异常检测方法包括签名分析方法，统计分析方法和阈值分析方法。通过对以发现的恶意流量行为的总结设定参数，难以实现量化。

基于机器学习的异常检测方法主要分为两个步骤：特征的提取和选择以及分类。特征的提取和选择的方法主要有：主成分分析(PCA)、基于相关性的特征选择方法(CFS)等。而传统的分类模型有支持向量机(SVM)、神经网络、朴素贝叶斯和决策树等应用于网络攻击的分类。在KDD99、DARPA等其他数据集中取得良好的效果，但数据集包含的攻击数据已经过时，难以用来模拟现在复杂的网络环境。Eesa等人直接从流量原始数据中学习特征，利用改进的流量特征可以获得较高的检测率和较低的虚警率。

但上述现有技术并没有对于异常检测上起到明显精准预测的有益效果，为了能防范于未然，面对目前复杂的网络环境，亟需提供一种有效的进行异常检测的方法。

发明内容

为了克服现有的异常检测方法的检测精度较低的不足，本发明提出基于卷积神经网络与LSTM结合的网络流量异常检测方法，具体包括以下步骤：

利用SCADA系统采集的网络数据，并对数据进行预处理，筛选得到符合实验要求的数据；

将预处理的数据转化为对应灰度图像；

建立CNN-LSTM模型，通过交叉熵最小化的方式确定模型最优化参数；

以准确率、真阳性率、假阳性率和F1-score为指标对CNN-LSTM模型进行训练，基于训练后的模型对检测分类效果进行评估。

可选的，所述数据预处理包括以下过程：

步骤101，从原始PCAP文件中截取相应周期的PCAP文件；

步骤102，根据每个时间段对应的攻击主机和受害者主机的IP进行流量划分；

步骤103，使用pickle工具将流量保存为KPL文件，生产矩阵数据；

步骤104，为了有效地学习和分类模型，通过one_hot编码对数据进行处理，将定性特征转换为定量特征。

可选的，所述将预处理的数据转化为对应灰度图像包括以下过程：

步骤201，在对数据集特征进行数据预处理扩展后，进行降维操作以得到处理成n×n图像数据格式作为模型的输入，采用方差系数作为降维筛选依据，函数定义为

其中σ为标准差，μ为均值，方差系数越大，特征分布越集中，比较后去除方差系数较小的维度；

步骤202，将其组合成N*N的矩阵，转换成一个N*N像素大小的灰度图，每个数字分别代表对应的像素灰度值，数字越大所对应的像素点越接近白色。

可选的，所述构建最优化CNN-LSTM模型包括：

步骤301，CNN部分前一个卷积层和池化层中使用具有小卷积核的卷积层来提取流量图像中的局部特征如IP和端口，在池化层中可以获得清晰的特征，后一个卷积层和池化层中使用大卷积核分析相距较远的特征之间的关系；

步骤302，将整个流量图像提取成一个较小的特征块，表示整个流量包的特征信息，再将块作为LSTM层的输入到LSTM系统中；

步骤303，LSTM以单个连接的数据为一个组，并判断该组中所有数据包的特性以及它们之间的关系作为判断流量性质的基础。

可选的，所述对模型预测效果进行评估包括以下过程：

采用准确率、真阳性率、假阳性率和F1-score四个指标构建模型预测效果评价体系，四个评价方式公式如下，

准确率：

真阳性率：

假阳性率：

F1-score：

其中TP是正确分类为此类型的样本数量，TN是正确分类为非此类型的样本数量，FP是错误分类为此类型的样本数量，FN是错误分类为非此类型的样本数量。

有益效果：将两种方法结合在一起，成功的进行了检测，并且相较于传统的机器学习方法，取得了更优的检测效果。

附图说明

图1是基于卷积神经网络与LSTM结合的网络流量异常检测方法的流程图。

具体实施方式

下面结合附图对本发明做进一步说明，

参照图1，本发明提出基于卷积神经网络与LSTM结合的网络流量异常检测方法，具体包括以下步骤：

11，利用SCADA系统采集的网络数据，并对数据进行预处理，筛选得到符合实验要求的数据；

12，将预处理的数据转化为对应灰度图像；

13，建立CNN-LSTM模型，通过交叉熵最小化的方式确定模型最优化参数；

14，以准确率、真阳性率、假阳性率和F1-score为指标对CNN-LSTM模型进行训练，基于训练后的模型对检测分类效果进行评估。

在实施中，本发明提出了将LSTM算法与卷积神经网络相结合，利用SCADA系统采集到的网络流量数据，进行数据预处理，然后采用CNN算法对数据图像进行预分类，进一步利用LSTM的方法对数据进行检测。

可选的，所述数据预处理包括以下过程：

步骤101，从原始PCAP文件中截取相应周期的PCAP文件；

可选的，所述构建最优化CNN-LSTM模型包括：

可选的，所述对模型预测效果进行评估包括以下过程：

准确率：

真阳性率：

假阳性率：

F1-score：

以上所述仅为本申请的实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.基于卷积神经网络与LSTM结合的网络流量异常检测方法，其特征在于所述方法包括：

将预处理的数据转化为对应灰度图像；

2.如权利要求1所述的基于卷积神经网络与LSTM结合的网络流量异常检测方法，其特征在于，所述数据预处理包括以下过程：

步骤101，从原始PCAP文件中截取相应周期的PCAP文件；

3.如权利要求2所述的基于卷积网络与LSTM相结合的异常检测方法，其特征在于，所述将预处理的数据转化为对应灰度图像：

4.如权利要求3所述的基于卷积神经网络与LSTM结合的网络流量异常检测方法，其特征在于，所述构建最优化CNN-LSTM模型包括：

5.如权利要求1或2所述的基于卷积神经网络与LSTM结合的网络流量异常检测方法，其特征在于，所述对模型预测效果进行评估包括以下过程：

准确率：

真阳性率：

假阳性率：

F1-score：