CN111553386A - 一种基于AdaBoost和CNN的入侵检测方法 - Google Patents

一种基于AdaBoost和CNN的入侵检测方法 Download PDF

Info

Publication number
CN111553386A
CN111553386A CN202010264319.0A CN202010264319A CN111553386A CN 111553386 A CN111553386 A CN 111553386A CN 202010264319 A CN202010264319 A CN 202010264319A CN 111553386 A CN111553386 A CN 111553386A
Authority
CN
China
Prior art keywords
classifier
sample
intrusion detection
base
cnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010264319.0A
Other languages
English (en)
Other versions
CN111553386B (zh
Inventor
李静梅
茹晨广
王洪涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202010264319.0A priority Critical patent/CN111553386B/zh
Publication of CN111553386A publication Critical patent/CN111553386A/zh
Application granted granted Critical
Publication of CN111553386B publication Critical patent/CN111553386B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于信息安全技术领域,具体涉及一种基于AdaBoost和CNN的入侵检测方法。本发明对AdaBoost算法进行了改进,首先把入侵检测特征向量转换为随机特征矩阵作为卷积神经网络的输入,通过矩阵化提取入侵检测数据的2D轮廓;然后将卷积神经网络CNN作为基分类器提取入侵检测数据的高级特征图并完成分类;最后选取分类误差最小的候选分类器作为强分类器,并将强分类器的矩阵化方法取代基矩阵化方法。本发明有效解决了基分类器难以提取样本高级特征的问题,并得到了一种寻找最佳矩阵化的方法,提高了入侵检测成功率。

Description

一种基于AdaBoost和CNN的入侵检测方法
技术领域
本发明属于信息安全技术领域,具体涉及一种基于AdaBoost和CNN的入侵检测方法。
背景技术
随着因特网的迅速发展,网络已经渗透到了人们日常生活的方方面面,在为人们生活提供便利的同时,网络也存在着各种安全问题,因此网络安全技术的重要性也日益凸显。当前网络中出现了越来越多的系统漏洞攻击、病毒攻击和黑客攻击。其中,在各种网络攻击行为中识别攻击类型是一种保护网络安全的重要技术手段。入侵检测技术可以在各种网络攻击造成破坏前检测到网络异常行为,对用户发出警告或阻止入侵行为。入侵检测技术在目前的网络安全领域中的得到了广泛的应用,它不仅弥补了防火墙的不足而且可以有效地检测各类攻击行为并阻止各类攻击行为危害计算机安全。但是随着入侵检测系统中数据量越来越大,数据维度越来越高,未知攻击类型越来越多,传统的入侵检测系统显然不能有效识别如今的各类网络入侵行为。
AdaBoost算法是Yoav Freund和Robert Schapire提出的机器学习算法,该算法可以通过迭代多个弱分类器获得一个分类效果更好的强分类器。通过将AdaBoost算法应用在入侵检测算法中,入侵检测识别率获得了显著提升,但是AdaBoost算法也存在着一定的问题,AdaBoost算法中的弱分类器一般使用的是支持向量机SVM或单层决策树,提取高级特征时具有一定的局限性,导致算法效果不够高。为了解决当前入侵检测系统中存在的问题,需要研究一种提高入侵检测效果的入侵检测算法。
发明内容
本发明的目的在于提供一种基于AdaBoost和CNN的入侵检测方法。
本发明的目的通过如下技术方案来实现:包括以下步骤:
步骤1:输入待检测的样本数据集,取部分样本数据构建训练集,对训练集中的样本数据进行人工标记;
步骤2:将训练集中的样本转换为统一大小的矩阵;
样本通过随机的方式填充进矩阵中,矩阵其余位置补上0;矩阵的大小为
Figure BDA0002440659640000011
Figure BDA0002440659640000012
Q为样本中的特征数量;
步骤3:初始化样本权值w=[w1,w2,...,wn]并归一化,n为样本个数;
步骤4:选择一个矩阵化后的入侵检测样本,初始化m个基于卷积神经网络CNN的基分类器,每个基分类器的卷积神经网络包含5个卷积层、5个最大池化层和3个全连接层;
步骤5:将矩阵化后的入侵检测样本输入到一个基于卷积神经网络CNN的基分类器中,得到第t个基分类器对第j个样本的分类预测ht(xj)和误差εt
Figure BDA0002440659640000021
其中,t=1,2,...,m,j=1,2,...,n;m为基分类器的个数,
Figure BDA0002440659640000022
为样本的真实值;
步骤6:计算基分类器的权值并更新样本权值;
分类器权值为:
Figure BDA0002440659640000023
更新后的样本权值为:
Figure BDA0002440659640000024
其中,i=1,2,...,n;B为归一化因子;
步骤7:判断是否完成所有基分类器的训练;若未完成,则将更新权值后的入侵检测样本返回至步骤5中;
步骤8:将每个基分类器乘以权值累加得到候选分类器;
Figure BDA0002440659640000025
步骤9:判断是否得到训练集中所有样本的候选分类器;若未得到,则返回至步骤4;
步骤10:选取分类误差最小的候选分类器作为强分类器;
步骤11:将待检测的样本数据集中其余数据输入到强分类器中,得到入侵检测结果。
本发明的有益效果在于:
本发明对AdaBoost算法进行了改进,首先把入侵检测特征向量转换为随机特征矩阵作为卷积神经网络的输入,通过矩阵化提取入侵检测数据的2D轮廓;然后将卷积神经网络CNN作为基分类器提取入侵检测数据的高级特征图并完成分类;最后选取分类误差最小的候选分类器作为强分类器,并将强分类器的矩阵化方法取代基矩阵化方法。本发明有效解决了基分类器难以提取样本高级特征的问题,并得到了一种寻找最佳矩阵化的方法,提高了入侵检测成功率。
附图说明
图1是本发明方法的卷积神经网络过程示意图;
图2是本发明的流程图。
图3是本发明的方法结构图。
具体实施方式
下面结合附图对本发明做进一步描述。
本发明提供一种基于AdaBoost和CNN的入侵检测方法AdaBoost-CNN。传统的AdaBoost算法通常采用支持向量机SVM或单层决策树作为基分类器,这会导致基分类器仅仅只能应用于二分类场景,且算法不能够提取足够的高级特征,使得最后得到的分类器分类效果不理想。针对这些问题,本发明对AdaBoost算法进行了改进,首先把入侵检测特征向量转换为随机特征矩阵作为卷积神经网络的输入,通过矩阵化提取入侵检测数据的2D轮廓;然后将卷积神经网络CNN作为基分类器提取入侵检测数据的高级特征图并完成分类;最后选取分类误差最小的候选分类器作为强分类器,并将强分类器的矩阵化方法取代基矩阵化方法。本方法有效解决了基分类器难以提取样本高级特征的问题,并得到了一种寻找最佳矩阵化的方法,该方法提高了入侵检测成功率。
一种基于AdaBoost和CNN的入侵检测方法,包括以下步骤:
步骤1:输入待检测的样本数据集,取部分样本数据构建训练集,对训练集中的样本数据进行人工标记;
步骤2:将训练集中的样本转换为统一大小的矩阵;
样本通过随机的方式填充进矩阵中,矩阵其余位置补上0;矩阵的大小为
Figure BDA0002440659640000031
Figure BDA0002440659640000032
Q为样本中的特征数量;
步骤3:初始化样本权值w=[w1,w2,...,wn]并归一化,n为样本个数;
步骤4:选择一个矩阵化后的入侵检测样本,初始化m个基于卷积神经网络CNN的基分类器,每个基分类器的卷积神经网络包含5个卷积层、5个最大池化层和3个全连接层;
步骤5:将矩阵化后的入侵检测样本输入到一个基于卷积神经网络CNN的基分类器中,得到第t个基分类器对第j个样本的分类预测ht(xj)和误差εt
Figure BDA0002440659640000033
其中,t=1,2,...,m,j=1,2,...,n;m为基分类器的个数,
Figure BDA0002440659640000034
为样本的真实值;
步骤6:计算基分类器的权值并更新样本权值;
分类器权值为:
Figure BDA0002440659640000041
更新后的样本权值为:
Figure BDA0002440659640000042
其中,i=1,2,...,n;B为归一化因子;
步骤7:判断是否完成所有基分类器的训练;若未完成,则将更新权值后的入侵检测样本返回至步骤5中;
步骤8:将每个基分类器乘以权值累加得到候选分类器;
Figure BDA0002440659640000043
步骤9:判断是否得到训练集中所有样本的候选分类器;若未得到,则返回至步骤4;
步骤10:选取分类误差最小的候选分类器作为强分类器;
可以将训练集输入到候选分类器中,比较各候选分类器的结果,选取分类误差最小的候选分类器作为强分类器。
步骤11:将待检测的样本数据集中其余数据输入到强分类器中,得到入侵检测结果。
一种基于AdaBoost和CNN的入侵检测方法,给定大量已经标记的原始入侵检测样本数据集,对于数据集中的每个样本随机转换为固定大小的矩阵;将转换过后的矩阵输入基于卷积神经网络CNN的基分类器中,完成高级特征的提取以及入侵检测的分类识别;每训练一个分类器,计算该分类器上的误差并更新样本权值,更新权值的样本进入下一轮分类器迭代,直至所有分类器迭代完成,并把每个基分类器乘以权值累加得到候选分类器;最后选取分类误差最小的候选分类器作为强分类器。
将入侵检测样本转换为统一大小的矩阵,矩阵的大小由样本特征数量Q决定,其中Q∈N矩阵大小为
Figure BDA0002440659640000044
Figure BDA0002440659640000045
样本通过随机的方式填充进矩阵中,矩阵其余位置补上0,通过比较不同随机矩阵化方法的候选分类器分类效果获取强分类器。
将矩阵化后的入侵检测样本输入到卷积神经网络中,每个卷积神经网络包含5个卷积层,5个最大池化层,3个全连接层。每一个卷积单元由一个卷积层和一个最大池化层,随着卷积层数的增加,每个卷积层中的卷积核数量也相应增加,样本矩阵通过卷积单元后再通过3层全连接层输出。
本方法的执行过程分为以下几个步骤:
1.入侵检测数据的矩阵化:入侵检测数据一般为含有Q个特征的向量,其中Q∈N,为了让卷积神经网络的效率更高,本方法把入侵检测样本统一为大小相等的矩阵,矩阵的大小通常为
Figure BDA0002440659640000051
Figure BDA0002440659640000052
初始的入侵检测按照随机的方式填充进矩阵中,当矩阵中有未填入的空余位时,需要在空余位补0。
2.样本权值和卷积神经网络初始化:初始化样本权值w=[w1,w2,...,wn]并归一化,其中n为样本个数;初始化卷积神经网络的卷积层数、每层卷积核个数、全连接层数、每层网络上的权值w和偏置b。
3.将样本输入卷积神经网络中得到基分类器ht和误差εt
Figure BDA0002440659640000053
其中ht(xj)为第t个基分类器对第j个样本的分类预测,其中t=1,2,...,m,j=1,2,...,n,m为基分类器的个数,
Figure BDA0002440659640000054
为样本的真实值。
4.设置分类器权值并更新样本权值:分类器权值为
Figure BDA0002440659640000055
更新后的样本权值为
Figure BDA0002440659640000056
其中i=1,2,...,n,B为归一化因子。
5.将更新权值后的入侵检测样本返回第3步直到所有基分类器训练完成。
6.得到候选分类器
Figure BDA0002440659640000057
7.随机化初始样本矩阵,返回第2步直到所有候选分类器训练完成。
8.选取分类误差最小的候选分类器作为强分类器。
经过上述8个步骤之后,形成了一种基于AdaBoost和CNN的入侵检测方法AdaBoost-CNN。本方法有效地解决了传统分类器难以提取样本高级特征的问题,并提高入侵检测成功率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于AdaBoost和CNN的入侵检测方法,其特征在于,包括以下步骤:
步骤1:输入待检测的样本数据集,取部分样本数据构建训练集,对训练集中的样本数据进行人工标记;
步骤2:将训练集中的样本转换为统一大小的矩阵;
样本通过随机的方式填充进矩阵中,矩阵其余位置补上0;矩阵的大小为
Figure FDA0002440659630000011
Figure FDA0002440659630000012
Q为样本中的特征数量;
步骤3:初始化样本权值w=[w1,w2,...,wn]并归一化,n为样本个数;
步骤4:选择一个矩阵化后的入侵检测样本,初始化m个基于卷积神经网络CNN的基分类器,每个基分类器的卷积神经网络包含5个卷积层、5个最大池化层和3个全连接层;
步骤5:将矩阵化后的入侵检测样本输入到一个基于卷积神经网络CNN的基分类器中,得到第t个基分类器对第j个样本的分类预测ht(xj)和误差εt
Figure FDA0002440659630000013
其中,t=1,2,...,m,j=1,2,...,n;m为基分类器的个数,
Figure FDA0002440659630000014
为样本的真实值;
步骤6:计算基分类器的权值并更新样本权值;
分类器权值为:
Figure FDA0002440659630000015
更新后的样本权值为:
Figure FDA0002440659630000016
其中,i=1,2,...,n;B为归一化因子;
步骤7:判断是否完成所有基分类器的训练;若未完成,则将更新权值后的入侵检测样本返回至步骤5中;
步骤8:将每个基分类器乘以权值累加得到候选分类器;
Figure FDA0002440659630000017
步骤9:判断是否得到训练集中所有样本的候选分类器;若未得到,则返回至步骤4;
步骤10:选取分类误差最小的候选分类器作为强分类器;
步骤11:将待检测的样本数据集中其余数据输入到强分类器中,得到入侵检测结果。
CN202010264319.0A 2020-04-07 2020-04-07 一种基于AdaBoost和CNN的入侵检测方法 Expired - Fee Related CN111553386B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010264319.0A CN111553386B (zh) 2020-04-07 2020-04-07 一种基于AdaBoost和CNN的入侵检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010264319.0A CN111553386B (zh) 2020-04-07 2020-04-07 一种基于AdaBoost和CNN的入侵检测方法

Publications (2)

Publication Number Publication Date
CN111553386A true CN111553386A (zh) 2020-08-18
CN111553386B CN111553386B (zh) 2022-05-20

Family

ID=72000257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010264319.0A Expired - Fee Related CN111553386B (zh) 2020-04-07 2020-04-07 一种基于AdaBoost和CNN的入侵检测方法

Country Status (1)

Country Link
CN (1) CN111553386B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111931175A (zh) * 2020-09-23 2020-11-13 四川大学 一种基于小样本学习的工业控制系统入侵检测方法
CN113569913A (zh) * 2021-06-29 2021-10-29 西北大学 基于分层选择性Adaboost-DNNs的图像分类模型建立、分类方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102163281A (zh) * 2011-04-26 2011-08-24 哈尔滨工程大学 基于AdaBoost框架和头部颜色的实时人体检测方法
CN103716204A (zh) * 2013-12-20 2014-04-09 中国科学院信息工程研究所 一种基于维纳过程的异常入侵检测集成学习方法及装置
CN103839346A (zh) * 2013-03-11 2014-06-04 成都百威讯科技有限责任公司 一种智能门窗防入侵装置以及系统、智能门禁系统
CN107563402A (zh) * 2017-07-07 2018-01-09 中国科学院信息工程研究所 一种社交关系推断方法及系统
US20190156159A1 (en) * 2017-11-20 2019-05-23 Kavya Venkata Kota Sai KOPPARAPU System and method for automatic assessment of cancer
CN109871809A (zh) * 2019-02-22 2019-06-11 福州大学 一种基于语义网的机器学习流程智能组装方法
CN110224990A (zh) * 2019-07-17 2019-09-10 浙江大学 一种基于软件定义安全架构的入侵检测系统
CN110728252A (zh) * 2019-10-22 2020-01-24 山西省信息产业技术研究院有限公司 一种应用于区域人员运动轨迹监控的人脸检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102163281A (zh) * 2011-04-26 2011-08-24 哈尔滨工程大学 基于AdaBoost框架和头部颜色的实时人体检测方法
CN103839346A (zh) * 2013-03-11 2014-06-04 成都百威讯科技有限责任公司 一种智能门窗防入侵装置以及系统、智能门禁系统
CN103716204A (zh) * 2013-12-20 2014-04-09 中国科学院信息工程研究所 一种基于维纳过程的异常入侵检测集成学习方法及装置
CN107563402A (zh) * 2017-07-07 2018-01-09 中国科学院信息工程研究所 一种社交关系推断方法及系统
US20190156159A1 (en) * 2017-11-20 2019-05-23 Kavya Venkata Kota Sai KOPPARAPU System and method for automatic assessment of cancer
CN109871809A (zh) * 2019-02-22 2019-06-11 福州大学 一种基于语义网的机器学习流程智能组装方法
CN110224990A (zh) * 2019-07-17 2019-09-10 浙江大学 一种基于软件定义安全架构的入侵检测系统
CN110728252A (zh) * 2019-10-22 2020-01-24 山西省信息产业技术研究院有限公司 一种应用于区域人员运动轨迹监控的人脸检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEIMINGHU 等: "AdaBoost-Based Algorithm for Network Intrusion Detection", 《IEEE TRANSACTIONS ON SYSTEMS,MAN,AND CYBERNETICS》 *
王洪涛: "混合脑机接口实现及其应用研究", 《中国博士学位论文全文数据库 (医药卫生科技辑)》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111931175A (zh) * 2020-09-23 2020-11-13 四川大学 一种基于小样本学习的工业控制系统入侵检测方法
US11218502B1 (en) 2020-09-23 2022-01-04 Sichuan University Few-shot learning based intrusion detection method of industrial control system
CN113569913A (zh) * 2021-06-29 2021-10-29 西北大学 基于分层选择性Adaboost-DNNs的图像分类模型建立、分类方法及系统
CN113569913B (zh) * 2021-06-29 2023-04-25 西北大学 基于分层选择性Adaboost-DNNs的图像分类模型建立、分类方法及系统

Also Published As

Publication number Publication date
CN111553386B (zh) 2022-05-20

Similar Documents

Publication Publication Date Title
CN111753881B (zh) 一种基于概念敏感性量化识别对抗攻击的防御方法
CN109005145B (zh) 一种基于自动特征抽取的恶意url检测系统及其方法
WO2019096099A1 (zh) Dga域名实时检测方法和装置
CN109815801A (zh) 基于深度学习的人脸识别方法及装置
Ibrahim et al. Cluster representation of the structural description of images for effective classification
CN113139536B (zh) 一种基于跨域元学习的文本验证码识别方法、设备及存储介质
CN107908642B (zh) 基于分布式平台的行业文本实体提取方法
CN111651762A (zh) 一种基于卷积神经网络的pe恶意软件检测方法
CN113806746A (zh) 基于改进cnn网络的恶意代码检测方法
CN111553386B (zh) 一种基于AdaBoost和CNN的入侵检测方法
CN106446011B (zh) 数据处理的方法及装置
CN111062036A (zh) 恶意软件识别模型构建、识别方法及介质和设备
CN110602120B (zh) 一种面向网络的入侵数据检测方法
CN111753290A (zh) 软件类型的检测方法及相关设备
CN112434553A (zh) 一种基于深度字典学习的视频鉴别方法及系统
CN115577357A (zh) 一种基于堆叠集成技术的Android恶意软件检测方法
CN115795065A (zh) 基于带权哈希码的多媒体数据跨模态检索方法及系统
CN108921186A (zh) 一种基于孪生支持向量机的指纹图像分类系统与方法
Ansari et al. An optimized feature selection technique in diversified natural scene text for classification using genetic algorithm
CN118013032A (zh) 一种sql注入语句识别的方法
CN111737688B (zh) 基于用户画像的攻击防御系统
CN110071845B (zh) 一种对未知应用进行分类的方法及装置
CN115730312A (zh) 一种基于深度哈希的家族恶意软件检测方法
CN115713669A (zh) 一种基于类间关系的图像分类方法、装置、存储介质及终端
CN109543571A (zh) 一种面向复杂产品异形加工特征的智能识别与检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220520