CN113657520A

CN113657520A - 一种基于深度置信网络和长短时记忆网络的入侵检测方法

Info

Publication number: CN113657520A
Application number: CN202110965845.4A
Authority: CN
Inventors: 王家宝; 缪祥华
Original assignee: Kunming University of Science and Technology
Current assignee: Kunming University of Science and Technology
Priority date: 2021-08-23
Filing date: 2021-08-23
Publication date: 2021-11-16

Abstract

本发明涉及一种基于深度置信网络和长短时记忆网络的入侵检测方法，属于网络中的入侵检测技术领域。本发明首先对数据集进行字符型数据转换成数值型数据、数据标准化、数据归一化操作；然后将数据集放入深度置信网络中进行降维处理，并将降维后的数据集分为训练集和测试集；最后将训练集放入长短时记忆网络中进行训练，再将测试集放入训练好的网络模型中得到分类结果。当出现入侵行为时，利用训练好的模型就可以区分出正常数据和攻击数据。该发明利用深度置信网络对数据做降维处理解决了长短时记忆网络梯度爆炸的问题，提高了入侵检测的效率。

Description

一种基于深度置信网络和长短时记忆网络的入侵检测方法

技术领域

本发明涉及一种基于深度置信网络和长短时记忆网络的入侵检测方法，属于网络中的入侵检测技术领域。

背景技术

近年来，随着网络技术的不断更迭和网络规模的不断扩大，国内外的网络安全事件频发，网络安全问题得到了更多的重视。在面对海量的复杂数据时，传统的机器学习方法在特征学习时容易受到时间复杂度和空间复杂度的制约，导致准确率低，误报率高。

发明内容

为了弥补现有技术的不足，本发明提供了一种基于深度置信网络和长短时记忆网络的入侵检测方法，深度学习在面对海量数据分析时有突出的表现，可用于复杂网络环境下的入侵检测问题。深度置信网络(Deep Belief Network,DBN)是深度学习中的一个经典模型，既可以用于非监督学习，也可以用于监督学习。深度置信网络在特征提取方面有较高的性能。

受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)是一种随机神经网络，由一层可见层和一层隐藏层构成，一般可见层为输入层，隐藏层为输出层。受限玻尔兹曼机同一网络层内的神经单元无连接，相邻的网络层间的神经单元全连接。由数个受限玻尔兹曼机堆叠构成的神经网络就称为深度置信网络，深度置信网络中下一层的隐藏层就是上一层的可见层。深度置信网络在特征提取方面的性能较高，通过顶层反向传播神经网络的有监督训练可以对已知攻击类型的网络流量特征进行学习，对于未知的攻击类型也可以通过其在特征提取方面的优势提高检测率，适合用于需要处理大量网络数据的入侵检测中。

长短时记忆神经网络(Long Short Term Memory Networks,LSTM)是一种循环神经网络的特殊类型，是为了解决一般的循环神经网络(RNN)存在的长期依赖问题而专门设计出来的，长短时记忆网络可以在训练过程中对时序数据赋予一种记忆功能，可以更好的拟合网络中的数据，可以学习长期依赖信息。长短时记忆网络记忆单元具有遗忘门、输入门和输出门，记忆单元拥有长短时记忆机制。长短时记忆网络具有可处理时间序列数据，网络精度高等优点。

长短时记忆网络在面对高维度数据时，容易出现梯度爆炸等问题，利用深度置信网络对网络数据进行特征降维可以解决此问题。本发明先对网络数据进行预处理，利用深度置信网络进行特征降维，然后将处理后的数据放入长短时记忆网络模型中进行训练，从而区分出网络中正常类型的流量以及攻击类型的流量。

本发明采用的技术方案是：一种基于深度置信网络和长短时记忆网络的入侵检测方法，具体步骤如下：

第一步：对入侵检测数据集进行数据预处理；

第二步：将数据集用深度置信网络进行特征降维处理，得到低维数据；

第三步：将特征降维后的训练集传入长短时记忆网络模型进行训练，得到训练好的网络模型；

第四步：将特征降维后的测试集传入训练好的网络模型得到分类结果。

具体地，所述第一步对入侵检测数据集进行数据预处理具体过程如下：

(1)字符型数据转换成数值型数据；

(2)数据标准化；

首先计算各个特征数值的平均值和平均绝对误差，公式如下：

其中，

表示第k个属性的均值，S_k表示第k个特征的平均绝对误差，x_ik表示第i条记录的第k个属性，n表示特征的数量，然后对每条数据记录进行标准化度量，公式如下：

其中，Z_ik表示标准化后的第i条数据记录的第k个属性值；

(3)数据归一化：

对标准化处理后的数据再进行归一化处理，使数据的数值大小处于[0,1]区间内，以减小模型的计算量，归一化处理公式如下：

其中x为原始数据，x^*为归一化处理后的数据，min为样本数据最小值，max为样本数据最大值。

具体地，所述第三步将特征降维后的训练集传入长短时记忆网络模型进行训练，得到训练好的网络模型具体过程如下：

(1)前向计算每个神经元的输出值；

(2)确定优化目标函数；

(3)根据损失函数的梯度指引，更新网络权值参数；

(4)重复以上三个步骤，直至网络误差小于给定值。

附图说明

图1是本发明中的方法流程图。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解，现对照附图说明本发明的具体实施方式。

实施例1：如图1所示，一种基于深度置信网络和长短时记忆网络的入侵检测方法具体步骤如下：

步骤一：对入侵检测数据集进行数据预处理；

数据预处理又分为3个步骤：

1)字符型数据转换为数值型数据

由于入侵检测数据集中的某些特征是字符型数据，而深度置信网络只能处理数值型数据，因此先将该数据集中的字符型数据转换成数值型数据。

2)数据标准化

为了减小特征中数据分散度高以及数值大小对深度置信网络的影响，对转换后成数值型的数据进行标准化处理，首先计算各个特征数值的平均值和平均绝对误差，公式如下：

其中，

其中，Z_ik表示标准化后的第i条数据记录的第k个属性值。

3)数据归一化

步骤二：将数据集用深度置信网络进行特征降维处理，得到低维数据；

步骤三：将特征降维后的训练集传入长短时记忆网络模型进行训练，得到训练好的网络模型；

长短时记忆网络的训练又分为3个步骤：

1)前向计算每个神经元的输出值；

2)确定优化目标函数；

3)根据损失函数的梯度指引，更新网络权值参数；

4)重复以上三个步骤，直至网络误差小于给定值。

步骤四：将特征降维后的测试集传入训练好的网络模型得到分类结果。

本发明通过深度置信网络对网络数据进行降维处理，再将数据传入长短时记忆网络进行分类，解决了长短时记忆网络易发生梯度爆炸的问题，提高了入侵检测的效率。

以上结合附图对本发明的具体实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。