CN113328987A

CN113328987A - 基于深度学习的增量学习流量异常检测方法

Info

Publication number: CN113328987A
Application number: CN202110380396.7A
Authority: CN
Inventors: 肖艳炜; 金学奇; 蒋正威; 刘栋; 孔飘红; 黄银强; 李振华; 张静; 杜浩良; 朱英伟; 张锋明; 吴炳超; 吴涛; 张晖; 张立群; 江杰; 潘仲达
Original assignee: State Grid Zhejiang Electric Power Co Ltd; Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Current assignee: State Grid Zhejiang Electric Power Co Ltd; Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date: 2021-04-09
Filing date: 2021-04-09
Publication date: 2021-08-31

Abstract

本申请实施例提出了基于深度学习的增量学习流量异常检测方法，包括收集网络流量数据，并对网络流量数据进行预处理，得到处理后的网络流量数据；利用LSTM模型对处理后的网络流量数据进行特征预提取；建立决策树改进支持向量机模型，通过折交叉验证算法选取最优化参数，构建最优化模型；训练得到改进后的向量机模型，用于对提取到的网络流量数据特征进行分类，对分类效果进行评估。提出了用决策树和SVM结合的方法，针对网络流量数据特点，采用LSTM提取流量信息特征，在利用模型进行异常流量的分类检测。基于改进的模型成功的进行了分类检测，并且相较于传统的流量异常检测方法，取得了更优的分类效果。

Description

基于深度学习的增量学习流量异常检测方法

技术领域

本申请涉及流量异常检测方向，尤其涉及基于深度学习的增量学习流量异常检测方法。

背景技术

随着云计算、移动互联网、物联网等现代信息技术的迅速发展和推广应用，大数据逐渐参与到经济、社会、科技等方方面面。大数据具有海量、高增长率和多样化的特点，无法在有限时间范围内用一般的软件工具进行挖掘、分析和处理。处理大数据时采用了新的模式，使得大数据能够支持超强的决策力、洞察力和处理能力，给社会和生活等方面带来各种应用便利服务，但是新的风险和挑战也随即而来。如何在利用大数据带来的便利的同时，还能有效避免风险和挑战，从而维护信息网络领域的安全，成为一个新的信息技术领域命题。

在互联网飞速发展的同时，也给网络安全分析工作带来了更大的困扰与压力。首先是网络安全分析工作所面临的处理数据的工作强度呈指数型上升，并且数据的规模是海量的，类型也是多种多样的，所以需要通过多个维度的分析才能够得到有效结果。同时面对着海量的、多种结构的数据在分析处理上的空间复杂度与时间复杂度也越来越大，处理时间越来越长，存储成本越来越高，传输质量越来越低，甚至丢失数据。为了解决上述诸多麻烦，将大数据分析技术融入网络安全分析。现有的网络安全平台已经基本完成了基本数据的采集，例如网络流量，日志数据的收集，但基于历史数据的智能入侵检测、溯源分析、攻击反制以及主动防御的应用和研究仍在探索阶段。

为提升信息安全和异常流量的快速检测和分析能力，国内外很多研究者利用大数据技术，挖掘其中蕴含的有效信息，帮助相关工作者快速准确的解决问题，作出了很多努力。曹磊等人提出了一种基于双层注意力神经网络的入侵检测方法，直接提取原始网络流量的有效载荷数据作为样本，在长短期记忆网络网络的基础上，引入双层注意力机制，提取关键字节信息和数据包信息；罗军等人提出了一种基于支持向量机的CAN-FD网络异常入侵检测模型，利用支持向量机算法的二分类特性，实现对入侵报文数据的识别；Rabeb等人提出了一种基于递归神经网络和深度神经网络的入侵检测方法，所提出的三层LSTM确实会有较高的性能，但模型变得复杂耗时。Yang A等人基于物联网的本质出发，提出了一种LM-BP入侵检测算法，实现了对物联网入侵检测系统的性能优化，该算法在一定程度上提高了检测率并且降低了误报率，但作者是基于KDD999数据集进行的验证，所得结果具有一定的局限性。Hassan等人提出了一种卷积神经网络和权值下降的混合深度学习模型，经作者实验，该模型具有较短耗时，从结果来看也具有较高精确率，但误报率也较高。

发明内容

为了提高系统中网络流量中的异常流量检测能力，本申请提出基于深度学习的增量学习流量异常检测方法。

本申请提出的基于深度学习的增量学习流量异常检测方法，包括：

收集网络流量数据，并对网络流量数据进行预处理，得到处理后的网络流量数据；

利用LSTM模型对处理后的网络流量数据进行特征预提取；

建立决策树改进支持向量机模型，通过k折交叉验证算法选取最优化参数，构建最优化模型；

训练得到改进后的向量机模型，用于对提取到的网络流量数据特征进行分类，对分类效果进行评估。

可选的，所述预处理包括：

步骤101，提取网络流量数据的包头信息作为输入特征；

步骤102，由于不同的参数基本单位相差较大，对数据进行标准化处理，采用如公式一所述的离差标准化的方式进行线性变换缩小到[0,1]区间；

其中x_min为样本最小值，x_max为样本最大值，x为样本值，x*为标准化后的样本值；

步骤104，在正常流量的基础上随机生成异常流量。

步骤104，将样本数据集划分为训练集和测试集。

可选的，所述利用LSTM模型对处理后的网络流量数据进行特征预提取包括：

步骤201，向LSTM模型中输入训练样本，进行训练；

步骤202，在LSTM模型中加入BN层和全连接层，将修改后的LSTM模型作为特征提取器。

可选的，所述建立决策树改进支持向量机模型包括：

步骤301，首先将网络数据集分为k个集合，每个集合都会轮流作为测试集，剩余集合则作为训练集；

步骤302，计算并比较k次训练的平均交叉验证正确率，选取交叉验证正确率最高的一组参数，参数(C,g)作为k折交叉验证的最优值应用到支持向量机回归预测中，其中惩罚参数C控制了模型结构风险与经验风险的相对比重；

预测模型选取g为高斯核函数，如公式二所示，

步骤303，将参数应用到模型中，对网络流量进行异常检测。

可选的，所述训练得到改进后的向量机模型，用于对提取到的网络流量数据特征进行分类，对分类效果进行评估，包括：

步骤401，采用分类准确率作为评价指标；

步骤402，进行多组实验取平均值。

有益效果：

基于改进的模型成功的进行了分类检测，并且相较于传统的流量异常检测方法，取得了更优的分类效果。

附图说明

图1是基于深度学习的增量学习流量异常检测方法的流程图。

具体实施方式

本申请提出一种基于决策树改进的支持向量机模型，利用LSTM网络进行特征提取，在对样本不是很大的情况下，对异常流量进行较高准确率的判断。

下面结合附图对本申请做进一步说明，

参照图1，基于深度学习的增量学习流量异常检测方法，包括以下步骤：

11、收集网络流量数据，并对网络流量数据进行预处理，得到处理后的网络流量数据；

12、利用LSTM模型对处理后的网络流量数据进行特征预提取；

13、建立决策树改进支持向量机模型，通过k折交叉验证算法选取最优化参数，构建最优化模型；

14、训练得到改进后的向量机模型，用于对提取到的网络流量数据特征进行分类，对分类效果进行评估。

在实施中，本申请的技术构思是，提出了用决策树和SVM结合的方法，针对网络流量数据特点，采用LSTM提取流量信息特征，在利用模型进行异常流量的分类检测。

进一步，所述预处理包括：

步骤101，提取网络流量数据的包头信息作为输入特征；

其中x_min为样本最小值，x_max为样本最大值，x为样本值，x^*为标准化后的样本值；

步骤104，在正常流量的基础上随机生成异常流量。

步骤104，将样本数据集划分为训练集和测试集。

再进一步，所述利用LSTM模型对处理后的网络流量数据进行特征预提取包括：

步骤201，向LSTM模型中输入训练样本，进行训练；

可选的，所述建立决策树改进支持向量机模型包括：

预测模型选取g为高斯核函数，如公式二所示，

步骤303，将参数应用到模型中，对网络流量进行异常检测。

步骤401，采用分类准确率作为评价指标；

步骤402，进行多组实验取平均值。

以上所述仅为本申请的实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.基于深度学习的增量学习流量异常检测方法，其特征在于，所述方法包括以下步骤：

利用LSTM模型对处理后的网络流量数据进行特征预提取；

2.如权利要求1所述的基于深度学习的增量学习流量异常检测方法，其特征在于，所述预处理包括：

步骤101，提取网络流量数据的包头信息作为输入特征；

步骤104，在正常流量的基础上随机生成异常流量；

步骤104，将样本数据集划分为训练集和测试集。

3.如权利要求1所述的基于深度学习的增量学习流量异常检测方法，其特征在于，所述利用LSTM模型对处理后的网络流量数据进行特征预提取包括：

步骤201，向LSTM模型中输入训练样本，进行训练；

4.如权利要求1所述的基于深度学习的增量学习流量异常检测方法，其特征在于，所述建立决策树改进支持向量机模型包括：

预测模型选取g为高斯核函数，如公式二所示，

步骤303，将参数应用到模型中，对网络流量进行异常检测。

5.如权利要求1所述的基于深度学习的增量学习流量异常检测方法，其特征在于，所述训练得到改进后的向量机模型，用于对提取到的网络流量数据特征进行分类，对分类效果进行评估，包括：

步骤401，采用分类准确率作为评价指标；

步骤402，进行多组实验取平均值。