CN111553386A

CN111553386A - 一种基于AdaBoost和CNN的入侵检测方法

Info

Publication number: CN111553386A
Application number: CN202010264319.0A
Authority: CN
Inventors: 李静梅; 茹晨广; 王洪涛
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2020-04-07
Filing date: 2020-04-07
Publication date: 2020-08-18
Anticipated expiration: 2040-04-07
Also published as: CN111553386B

Abstract

本发明属于信息安全技术领域，具体涉及一种基于AdaBoost和CNN的入侵检测方法。本发明对AdaBoost算法进行了改进，首先把入侵检测特征向量转换为随机特征矩阵作为卷积神经网络的输入，通过矩阵化提取入侵检测数据的2D轮廓；然后将卷积神经网络CNN作为基分类器提取入侵检测数据的高级特征图并完成分类；最后选取分类误差最小的候选分类器作为强分类器，并将强分类器的矩阵化方法取代基矩阵化方法。本发明有效解决了基分类器难以提取样本高级特征的问题，并得到了一种寻找最佳矩阵化的方法，提高了入侵检测成功率。

Description

一种基于AdaBoost和CNN的入侵检测方法

技术领域

本发明属于信息安全技术领域，具体涉及一种基于AdaBoost和CNN的入侵检测方法。

背景技术

随着因特网的迅速发展，网络已经渗透到了人们日常生活的方方面面，在为人们生活提供便利的同时，网络也存在着各种安全问题，因此网络安全技术的重要性也日益凸显。当前网络中出现了越来越多的系统漏洞攻击、病毒攻击和黑客攻击。其中，在各种网络攻击行为中识别攻击类型是一种保护网络安全的重要技术手段。入侵检测技术可以在各种网络攻击造成破坏前检测到网络异常行为，对用户发出警告或阻止入侵行为。入侵检测技术在目前的网络安全领域中的得到了广泛的应用，它不仅弥补了防火墙的不足而且可以有效地检测各类攻击行为并阻止各类攻击行为危害计算机安全。但是随着入侵检测系统中数据量越来越大，数据维度越来越高，未知攻击类型越来越多，传统的入侵检测系统显然不能有效识别如今的各类网络入侵行为。

AdaBoost算法是Yoav Freund和Robert Schapire提出的机器学习算法，该算法可以通过迭代多个弱分类器获得一个分类效果更好的强分类器。通过将AdaBoost算法应用在入侵检测算法中，入侵检测识别率获得了显著提升，但是AdaBoost算法也存在着一定的问题，AdaBoost算法中的弱分类器一般使用的是支持向量机SVM或单层决策树，提取高级特征时具有一定的局限性，导致算法效果不够高。为了解决当前入侵检测系统中存在的问题，需要研究一种提高入侵检测效果的入侵检测算法。

发明内容

本发明的目的在于提供一种基于AdaBoost和CNN的入侵检测方法。

本发明的目的通过如下技术方案来实现：包括以下步骤：

步骤1：输入待检测的样本数据集，取部分样本数据构建训练集，对训练集中的样本数据进行人工标记；

步骤2：将训练集中的样本转换为统一大小的矩阵；

样本通过随机的方式填充进矩阵中，矩阵其余位置补上0；矩阵的大小为

或

Q为样本中的特征数量；

步骤3：初始化样本权值w＝[w₁,w₂,...，w_n]并归一化，n为样本个数；

步骤4：选择一个矩阵化后的入侵检测样本，初始化m个基于卷积神经网络CNN的基分类器，每个基分类器的卷积神经网络包含5个卷积层、5个最大池化层和3个全连接层；

步骤5：将矩阵化后的入侵检测样本输入到一个基于卷积神经网络CNN的基分类器中，得到第t个基分类器对第j个样本的分类预测h_t(x_j)和误差ε_t；

其中，t＝1,2,...,m,j＝1,2,...,n；m为基分类器的个数，

为样本的真实值；

步骤6：计算基分类器的权值并更新样本权值；

分类器权值为：

更新后的样本权值为：

其中，i＝1,2,...,n；B为归一化因子；

步骤7：判断是否完成所有基分类器的训练；若未完成，则将更新权值后的入侵检测样本返回至步骤5中；

步骤8：将每个基分类器乘以权值累加得到候选分类器；

步骤9：判断是否得到训练集中所有样本的候选分类器；若未得到，则返回至步骤4；

步骤10：选取分类误差最小的候选分类器作为强分类器；

步骤11：将待检测的样本数据集中其余数据输入到强分类器中，得到入侵检测结果。

本发明的有益效果在于：

本发明对AdaBoost算法进行了改进，首先把入侵检测特征向量转换为随机特征矩阵作为卷积神经网络的输入，通过矩阵化提取入侵检测数据的2D轮廓；然后将卷积神经网络CNN作为基分类器提取入侵检测数据的高级特征图并完成分类；最后选取分类误差最小的候选分类器作为强分类器，并将强分类器的矩阵化方法取代基矩阵化方法。本发明有效解决了基分类器难以提取样本高级特征的问题，并得到了一种寻找最佳矩阵化的方法，提高了入侵检测成功率。

附图说明

图1是本发明方法的卷积神经网络过程示意图；

图2是本发明的流程图。

图3是本发明的方法结构图。

具体实施方式

下面结合附图对本发明做进一步描述。

本发明提供一种基于AdaBoost和CNN的入侵检测方法AdaBoost-CNN。传统的AdaBoost算法通常采用支持向量机SVM或单层决策树作为基分类器，这会导致基分类器仅仅只能应用于二分类场景，且算法不能够提取足够的高级特征，使得最后得到的分类器分类效果不理想。针对这些问题，本发明对AdaBoost算法进行了改进，首先把入侵检测特征向量转换为随机特征矩阵作为卷积神经网络的输入，通过矩阵化提取入侵检测数据的2D轮廓；然后将卷积神经网络CNN作为基分类器提取入侵检测数据的高级特征图并完成分类；最后选取分类误差最小的候选分类器作为强分类器，并将强分类器的矩阵化方法取代基矩阵化方法。本方法有效解决了基分类器难以提取样本高级特征的问题，并得到了一种寻找最佳矩阵化的方法，该方法提高了入侵检测成功率。

一种基于AdaBoost和CNN的入侵检测方法，包括以下步骤：

步骤2：将训练集中的样本转换为统一大小的矩阵；

或

Q为样本中的特征数量；

其中，t＝1,2,...,m,j＝1,2,...,n；m为基分类器的个数，

为样本的真实值；

步骤6：计算基分类器的权值并更新样本权值；

分类器权值为：

更新后的样本权值为：

其中，i＝1,2,...,n；B为归一化因子；

步骤8：将每个基分类器乘以权值累加得到候选分类器；

步骤10：选取分类误差最小的候选分类器作为强分类器；

可以将训练集输入到候选分类器中，比较各候选分类器的结果，选取分类误差最小的候选分类器作为强分类器。

一种基于AdaBoost和CNN的入侵检测方法，给定大量已经标记的原始入侵检测样本数据集，对于数据集中的每个样本随机转换为固定大小的矩阵；将转换过后的矩阵输入基于卷积神经网络CNN的基分类器中，完成高级特征的提取以及入侵检测的分类识别；每训练一个分类器，计算该分类器上的误差并更新样本权值，更新权值的样本进入下一轮分类器迭代，直至所有分类器迭代完成，并把每个基分类器乘以权值累加得到候选分类器；最后选取分类误差最小的候选分类器作为强分类器。

将入侵检测样本转换为统一大小的矩阵，矩阵的大小由样本特征数量Q决定，其中Q∈N矩阵大小为

或

样本通过随机的方式填充进矩阵中，矩阵其余位置补上0，通过比较不同随机矩阵化方法的候选分类器分类效果获取强分类器。

将矩阵化后的入侵检测样本输入到卷积神经网络中，每个卷积神经网络包含5个卷积层，5个最大池化层，3个全连接层。每一个卷积单元由一个卷积层和一个最大池化层，随着卷积层数的增加，每个卷积层中的卷积核数量也相应增加，样本矩阵通过卷积单元后再通过3层全连接层输出。

本方法的执行过程分为以下几个步骤：

1.入侵检测数据的矩阵化：入侵检测数据一般为含有Q个特征的向量，其中Q∈N，为了让卷积神经网络的效率更高，本方法把入侵检测样本统一为大小相等的矩阵，矩阵的大小通常为

或

初始的入侵检测按照随机的方式填充进矩阵中，当矩阵中有未填入的空余位时，需要在空余位补0。

2.样本权值和卷积神经网络初始化：初始化样本权值w＝[w₁,w₂,...，w_n]并归一化，其中n为样本个数；初始化卷积神经网络的卷积层数、每层卷积核个数、全连接层数、每层网络上的权值w和偏置b。

3.将样本输入卷积神经网络中得到基分类器h_t和误差ε_t：

其中h_t(x_j)为第t个基分类器对第j个样本的分类预测，其中t＝1,2,...,m,j＝1,2,...,n，m为基分类器的个数，

为样本的真实值。

4.设置分类器权值并更新样本权值：分类器权值为

更新后的样本权值为

其中i＝1,2,...,n，B为归一化因子。

5.将更新权值后的入侵检测样本返回第3步直到所有基分类器训练完成。

6.得到候选分类器

7.随机化初始样本矩阵，返回第2步直到所有候选分类器训练完成。

8.选取分类误差最小的候选分类器作为强分类器。

经过上述8个步骤之后，形成了一种基于AdaBoost和CNN的入侵检测方法AdaBoost-CNN。本方法有效地解决了传统分类器难以提取样本高级特征的问题，并提高入侵检测成功率。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。