CN115396143A

CN115396143A - 一种基于bilstm-crf工业入侵检测方法

Info

Publication number: CN115396143A
Application number: CN202210856731.0A
Authority: CN
Inventors: 何戡; 寇文松; 宗学军
Original assignee: Shenyang University of Chemical Technology
Current assignee: Shenyang University of Chemical Technology
Priority date: 2022-07-21
Filing date: 2022-07-21
Publication date: 2022-11-25

Abstract

一种基于BILSTM‑CRF工业入侵检测方法，涉及一种网络工业入侵检测方法，本发明根据网络入侵的时序性特点提出了一种由双向长短时记忆网络（Bi‑LSTM）和条件随机场（CRF）组成的网络入侵检测模型—BILSTM‑CRF模型。针对原始攻击数据具有离散性且分布较广的问题,对数据进行数值化及归一化的预处理操作，将模型应用在CIC‑IDS2017数据集上进行实验测试，本发明模型对网络入侵检测的多种攻击类别的精确率P和F1值都有提高，而且模型最终准确率更高（99.81%）远高于其他模型，符合网络入侵检测的要求。证明了该模型在工业控制系统实时入侵检测应用中的性能的优越性。

Description

一种基于BILSTM-CRF工业入侵检测方法

技术领域

本发明涉及工业控制网络入侵检测方法，特别是涉及一种基于BILSTM-CRF工业入侵检测方法。

背景技术

互联网服务已经成为商业交易和个人生活中不可缺少的一部分。随着对网络服务的日益依赖，关键信息的机密性和完整性越来越多地受到远程入侵的损害。企业被迫加强网络防范恶意活动和网络威胁。因此，网络系统必须使用一种或多种安全工具，例如防火墙、杀毒软件或入侵检测系统，以保护重要的数据、服务免受黑客或入侵者的攻击。

因为防火墙无法抵御网络服务所需的开放端口上的入侵企图，所以仅依靠防火墙系统是不足以防止公司网络受到所有类型的网络攻击的。因此，通常需要安装入侵检测系统(IDS)来补充防火墙，入侵检测系统从网络或计算机系统收集信息，并分析这些信息以发现系统入侵的情况。

网络入侵检测一直都是网络安全中亟待解决的问题，传统入侵检测算法存在的检测率低和高误报率问题。

发明内容

本发明的目的在于提供一种基于BILSTM-CRF工业入侵检测方法，本发明解决工控网络入侵传统单一深度学习算法分类模型的分类准确率低的问题，使用BILSTM和CRF相结合的BILSTM-CRF提高分类的准确率。

本发明的目的是通过以下技术方案实现的：

一种基于BILSTM-CRF工业入侵检测方法，所述方法包括以下步骤：

步骤1：对入侵检测数据集进行数据预处理，将其划分为训练集与测试集；

步骤2：对网络中采集到的原始数据流量进行预处理；

步骤3：搭建BILSTM-CRF网络模型，将训练集传入BILSTM-CRF网络模型，输出层输出样本在不同类别上的预测值；

步骤4：利用MLP分类器就可以实现入侵检测的分类任务；处理好的数据分别通过两个全连接层和一个Dropout层，最后通过Softmax函数输出。

所述的一种基于BILSTM-CRF工业入侵检测方法，所述方法使用双向(前向、后向)LSTM耦合CRF作为输出层的神经网络的配置。

所述的一种基于BILSTM-CRF工业入侵检测方法，所述方法每个时间步的输入是一个数据，它被数据嵌入层转换为数据向量，除了数据向量之外，输入层还可以有选择地采用额外的基于数据的特征来利用特征表示。

所述的一种基于BILSTM-CRF工业入侵检测方法，所述在LSTM的前向和后向两层中分别放置表面的拼接嵌入向量和附加特征；对于每个时间步，前向LSTM和后向LSTM的输出被连接并发送到隐藏层；与隐藏层完全连通的输出给出了标签对应的多类概率信息；最后，将网元标签在整个数据序列上的概率信息放入CRF层，以估计整个文本序列上的最优网元标签序列。

所述的一种基于BILSTM-CRF工业入侵检测方法，所述CRF层估计每个数据位置的标签，通过Viterbi算法共同最大化标签序列；连接BILSTM层和CRF层形成完整的BILSTM-CRF模型。

本发明的优点与效果是：

本发明相较于其他工业异常入侵检测方法，具体的提升之处在于，针对日益严重的工业信息安全问题，本发明根据网络入侵的时序性特点提出了一种由双向长短时记忆网络（Bi-LSTM）和条件随机场（CRF）组成的网络入侵检测模型—BILSTM-CRF模型。使用新布伦瑞克大学(UNB)加拿大网络安全研究所(CIC)的公共数据集CICIDS2017进行实验，实验结果证明，本发明模型相对于传统机器学习模型，对网络入侵检测的多种攻击类别的精确率P和F1值都有提高，而且模型最终准确率更高（99.81%）远高于其他模型，符合网络入侵检测的要求。证明了该模型在工业控制系统实时入侵检测应用中的性能的优越性。

附图说明

图1为本发明方法步骤示意图；

图2为BILSTM网络结构原理图；

图3为 BILSTM-CRF网络模型原理图。

具体实施方式

下面结合附图所示实施例对本发明进行详细说明。

递归神经网络(RNN)可以基于历史信息的时序性处理，这使它们在有时序性数据时有其天然的优势。但是由于梯度消失和梯度爆炸问题，RNN会产生长期依赖等问题。LSTM是专门设计用来解决长期依赖问题的内存单元。它主要由三种类型的门结构组成，控制在细胞状态下要忘记和存储的信息的比例。对于时序性数据的提取任务，如果访问给定时间的过去和未来的数据信息，我们可以利用更多级别的信息做出更好的预测。但是LSTM无法编码从后到前的信息。而BILSTM则能够将信息正序和倒序结合之后进行编码良好的解决了无法从前到后编码的问题。具体结构如图2。CRF的主要优点是它可以包含丰富的、重叠的特性。它融合了观测间的依赖关系，旨在解决远距离依赖问题。在CRF中，基于丰富的输入和输出向量之间的关系的特征很容易被合并。因此，它不需要在观察上花费建模的精力，而观察在测试时是固定的。此外，标签序列的条件概率可以依赖于观察序列的任意、非独立特征，而无需强迫模型考虑这些特征依赖。

BILSTM-CRF层

BiLSTM层的输入是输入数据标记的表示(向量)序列，表示为

。BiLSTM层的输出是每个输入数据向量的隐藏状态序列如下：

最后的输出向量是前向输入每个隐藏状态

和后向隐藏状态

结合的向量如公式下：

CRF层

CRF是最常用的控制结构预测的方法，其基本思想是在给定输入序列的情况下，用一系列势函数近似输出标签序列的条件概率^[10]。形式上，我们取上述隐藏状态序列h=

作为我们到CRF层的输入，它的输出是我们最终的预测标签序列y =

，

在所有可能标签的集合中。我们将

表示为所有可能的标签序列的集合。然后在给定输入隐状态序列为的条件下，推导出输出序列的条件概率为：

其中W和b是两个权重矩阵，表示我们提取了给定标签对

的权重向量。为了训练CRF层，我们使用经典的最大条件似然估计来训练我们的模型。权重矩阵的最终对数似然是：

BILSTM-CRF模型

在LSTM的前向和后向两层中分别放置表面的拼接嵌入向量和附加特征。对于每个时间步，前向LSTM和后向LSTM的输出被连接并发送到隐藏层。与隐藏层完全连通的输出给出了标签对应的多类概率信息。最后，将网元标签在整个数据序列上的概率信息放入CRF层，以估计整个文本序列上的最优网元标签序列。CRF层估计每个数据位置的标签，通过Viterbi算法共同最大化标签序列。连接BILSTM层和CRF层形成完整BILSTM-CRF模型，具体结构如图2。

MLP分类器

MLP分类器是一种全连接神经网络，主要有两部分组成，分别是输入层和输出层。通过BILSTM-CRF混合网络对样本数据进行高级的特征提取，只需要MLP这一简单的分类器就可以实现入侵检测的分类任务。首先，处理好的数据分别通过两个全连接层和一个Dropout层，最后通过Softmax函数输出。BILSTM-CRF混合网络的输出结果为P，MLP分计算公式如下：

一种基于BISTM-CRF工业入侵检测方法，其具体步骤如下：

步骤2：对网络中采集到的原始数据流量进行预处理；

步骤4：利用MLP分类器就可以实现入侵检测的分类任务。处理好的数据分别通过两个全连接层和一个Dropout层，最后通过Softmax函数输出；

实施例1：

实验所使用的操作系统为windows10 64位系统，CPU为Intel I7-10700，运行内存8g，深度学习框架为tensorflow2.7。

实验数据来源

使用的是新布伦瑞克大学(UNB)加拿大网络安全研究所(CIC)的公共数据集进行入侵检测(IDS)任务。CICIDS2017数据集包含310万条流量记录。在去掉不完整的记录之后，仍有大约290万笔流动数据。新布伦瑞克大学加拿大网络安全研究所还提供了CICIDS2017的完整数据包捕获，但这些数据并没有用于本论文。对84个连续型特征进行min-max归一化，对数据集样本标签进行One-Hot编码，预处理后数据集描述如表1所示。

表1 数据集描述

评价指标

为了客观的评价D-IDS模型的性能，采用入侵检测领域中常用的准确率(Accuracy,ACC)、精确率(Precision,P)、检出率(Recall,R)和综合评价指标(F1-Measure,F)来评价分类结果。

其中，TP 表示正确识别的攻击类别数目，FN 表示漏报即未正确识别攻击类别的数目，FP 表示误报即错误识别正常类别的数目，TN 表示正确识别的正常类别数目。

参数设置

为了得到更好的实验结果，BILSTM-CRF模型的一次迭代输入模型样本适量BATCH-SIZE=500，抛出率Dropout-rate=0.5，全部样本训练次数EPOCHS=20，初始化学习率LR=0.001，优化函数使用Adam。

对比算法

在入侵检测模型中，比较常用的机器学习算法包括人工神经网络（ArtificialNeural Network , ANN ）、决策树(Decision Tree , DT)、K最近邻(K-Nearest Neighbor, KNN)、朴素贝叶斯（Naive Bayes , NB）、随机森林(Random Forest , RF)、支持向量机(Support vector machine , SVM)、k均值聚类算法（k-means clustering algorithm , K-MEANS）、最大期望算法（Expectation-Maximization algorithm , EM）、自组织映射(Self-organizing Maps , SOM)。使用这些常用算法建立入侵检测模型，对CICIDS2017数据集进行检测，不同机器学习模型检测结果对比如图表2所示

表2 不同模型检测对比

。

Claims

1.一种基于BILSTM-CRF工业入侵检测方法，其特征在于，所述方法包括以下步骤：

步骤2：对网络中采集到的原始数据流量进行预处理；

2.根据权利要求1所述的一种基于BILSTM-CRF工业入侵检测方法，其特征在于，所述方法使用双向(前向、后向)LSTM耦合CRF作为输出层的神经网络的配置。

3.根据权利要求1所述的一种基于BILSTM-CRF工业入侵检测方法，其特征在于，所述方法每个时间步的输入是一个数据，它被数据嵌入层转换为数据向量，除了数据向量之外，输入层还可以有选择地采用额外的基于数据的特征来利用特征表示。

4.根据权利要求1所述的一种基于BILSTM-CRF工业入侵检测方法，其特征在于，所述在LSTM的前向和后向两层中分别放置表面的拼接嵌入向量和附加特征；对于每个时间步，前向LSTM和后向LSTM的输出被连接并发送到隐藏层；与隐藏层完全连通的输出给出了标签对应的多类概率信息；最后，将网元标签在整个数据序列上的概率信息放入CRF层，以估计整个文本序列上的最优网元标签序列。

5.根据权利要求1所述的一种基于BILSTM-CRF工业入侵检测方法，其特征在于，所述CRF层估计每个数据位置的标签，通过Viterbi算法共同最大化标签序列；连接BILSTM层和CRF层形成完整的BILSTM-CRF模型。