CN111553386A - 一种基于AdaBoost和CNN的入侵检测方法 - Google Patents
一种基于AdaBoost和CNN的入侵检测方法 Download PDFInfo
- Publication number
- CN111553386A CN111553386A CN202010264319.0A CN202010264319A CN111553386A CN 111553386 A CN111553386 A CN 111553386A CN 202010264319 A CN202010264319 A CN 202010264319A CN 111553386 A CN111553386 A CN 111553386A
- Authority
- CN
- China
- Prior art keywords
- classifier
- sample
- intrusion detection
- base
- cnn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 52
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 43
- 239000011159 matrix material Substances 0.000 claims abstract description 25
- 238000011176 pooling Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 230000001502 supplementing effect Effects 0.000 claims description 4
- 238000000034 method Methods 0.000 abstract description 21
- 239000013598 vector Substances 0.000 abstract description 4
- 239000010410 layer Substances 0.000 description 19
- 230000006399 behavior Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明属于信息安全技术领域,具体涉及一种基于AdaBoost和CNN的入侵检测方法。本发明对AdaBoost算法进行了改进,首先把入侵检测特征向量转换为随机特征矩阵作为卷积神经网络的输入,通过矩阵化提取入侵检测数据的2D轮廓;然后将卷积神经网络CNN作为基分类器提取入侵检测数据的高级特征图并完成分类;最后选取分类误差最小的候选分类器作为强分类器,并将强分类器的矩阵化方法取代基矩阵化方法。本发明有效解决了基分类器难以提取样本高级特征的问题,并得到了一种寻找最佳矩阵化的方法,提高了入侵检测成功率。
Description
技术领域
本发明属于信息安全技术领域,具体涉及一种基于AdaBoost和CNN的入侵检测方法。
背景技术
随着因特网的迅速发展,网络已经渗透到了人们日常生活的方方面面,在为人们生活提供便利的同时,网络也存在着各种安全问题,因此网络安全技术的重要性也日益凸显。当前网络中出现了越来越多的系统漏洞攻击、病毒攻击和黑客攻击。其中,在各种网络攻击行为中识别攻击类型是一种保护网络安全的重要技术手段。入侵检测技术可以在各种网络攻击造成破坏前检测到网络异常行为,对用户发出警告或阻止入侵行为。入侵检测技术在目前的网络安全领域中的得到了广泛的应用,它不仅弥补了防火墙的不足而且可以有效地检测各类攻击行为并阻止各类攻击行为危害计算机安全。但是随着入侵检测系统中数据量越来越大,数据维度越来越高,未知攻击类型越来越多,传统的入侵检测系统显然不能有效识别如今的各类网络入侵行为。
AdaBoost算法是Yoav Freund和Robert Schapire提出的机器学习算法,该算法可以通过迭代多个弱分类器获得一个分类效果更好的强分类器。通过将AdaBoost算法应用在入侵检测算法中,入侵检测识别率获得了显著提升,但是AdaBoost算法也存在着一定的问题,AdaBoost算法中的弱分类器一般使用的是支持向量机SVM或单层决策树,提取高级特征时具有一定的局限性,导致算法效果不够高。为了解决当前入侵检测系统中存在的问题,需要研究一种提高入侵检测效果的入侵检测算法。
发明内容
本发明的目的在于提供一种基于AdaBoost和CNN的入侵检测方法。
本发明的目的通过如下技术方案来实现:包括以下步骤:
步骤1:输入待检测的样本数据集,取部分样本数据构建训练集,对训练集中的样本数据进行人工标记;
步骤2:将训练集中的样本转换为统一大小的矩阵;
步骤3:初始化样本权值w=[w1,w2,...,wn]并归一化,n为样本个数;
步骤4:选择一个矩阵化后的入侵检测样本,初始化m个基于卷积神经网络CNN的基分类器,每个基分类器的卷积神经网络包含5个卷积层、5个最大池化层和3个全连接层;
步骤5:将矩阵化后的入侵检测样本输入到一个基于卷积神经网络CNN的基分类器中,得到第t个基分类器对第j个样本的分类预测ht(xj)和误差εt;
步骤6:计算基分类器的权值并更新样本权值;
分类器权值为:
更新后的样本权值为:
其中,i=1,2,...,n;B为归一化因子;
步骤7:判断是否完成所有基分类器的训练;若未完成,则将更新权值后的入侵检测样本返回至步骤5中;
步骤8:将每个基分类器乘以权值累加得到候选分类器;
步骤9:判断是否得到训练集中所有样本的候选分类器;若未得到,则返回至步骤4;
步骤10:选取分类误差最小的候选分类器作为强分类器;
步骤11:将待检测的样本数据集中其余数据输入到强分类器中,得到入侵检测结果。
本发明的有益效果在于:
本发明对AdaBoost算法进行了改进,首先把入侵检测特征向量转换为随机特征矩阵作为卷积神经网络的输入,通过矩阵化提取入侵检测数据的2D轮廓;然后将卷积神经网络CNN作为基分类器提取入侵检测数据的高级特征图并完成分类;最后选取分类误差最小的候选分类器作为强分类器,并将强分类器的矩阵化方法取代基矩阵化方法。本发明有效解决了基分类器难以提取样本高级特征的问题,并得到了一种寻找最佳矩阵化的方法,提高了入侵检测成功率。
附图说明
图1是本发明方法的卷积神经网络过程示意图;
图2是本发明的流程图。
图3是本发明的方法结构图。
具体实施方式
下面结合附图对本发明做进一步描述。
本发明提供一种基于AdaBoost和CNN的入侵检测方法AdaBoost-CNN。传统的AdaBoost算法通常采用支持向量机SVM或单层决策树作为基分类器,这会导致基分类器仅仅只能应用于二分类场景,且算法不能够提取足够的高级特征,使得最后得到的分类器分类效果不理想。针对这些问题,本发明对AdaBoost算法进行了改进,首先把入侵检测特征向量转换为随机特征矩阵作为卷积神经网络的输入,通过矩阵化提取入侵检测数据的2D轮廓;然后将卷积神经网络CNN作为基分类器提取入侵检测数据的高级特征图并完成分类;最后选取分类误差最小的候选分类器作为强分类器,并将强分类器的矩阵化方法取代基矩阵化方法。本方法有效解决了基分类器难以提取样本高级特征的问题,并得到了一种寻找最佳矩阵化的方法,该方法提高了入侵检测成功率。
一种基于AdaBoost和CNN的入侵检测方法,包括以下步骤:
步骤1:输入待检测的样本数据集,取部分样本数据构建训练集,对训练集中的样本数据进行人工标记;
步骤2:将训练集中的样本转换为统一大小的矩阵;
步骤3:初始化样本权值w=[w1,w2,...,wn]并归一化,n为样本个数;
步骤4:选择一个矩阵化后的入侵检测样本,初始化m个基于卷积神经网络CNN的基分类器,每个基分类器的卷积神经网络包含5个卷积层、5个最大池化层和3个全连接层;
步骤5:将矩阵化后的入侵检测样本输入到一个基于卷积神经网络CNN的基分类器中,得到第t个基分类器对第j个样本的分类预测ht(xj)和误差εt;
步骤6:计算基分类器的权值并更新样本权值;
分类器权值为:
更新后的样本权值为:
其中,i=1,2,...,n;B为归一化因子;
步骤7:判断是否完成所有基分类器的训练;若未完成,则将更新权值后的入侵检测样本返回至步骤5中;
步骤8:将每个基分类器乘以权值累加得到候选分类器;
步骤9:判断是否得到训练集中所有样本的候选分类器;若未得到,则返回至步骤4;
步骤10:选取分类误差最小的候选分类器作为强分类器;
可以将训练集输入到候选分类器中,比较各候选分类器的结果,选取分类误差最小的候选分类器作为强分类器。
步骤11:将待检测的样本数据集中其余数据输入到强分类器中,得到入侵检测结果。
一种基于AdaBoost和CNN的入侵检测方法,给定大量已经标记的原始入侵检测样本数据集,对于数据集中的每个样本随机转换为固定大小的矩阵;将转换过后的矩阵输入基于卷积神经网络CNN的基分类器中,完成高级特征的提取以及入侵检测的分类识别;每训练一个分类器,计算该分类器上的误差并更新样本权值,更新权值的样本进入下一轮分类器迭代,直至所有分类器迭代完成,并把每个基分类器乘以权值累加得到候选分类器;最后选取分类误差最小的候选分类器作为强分类器。
将入侵检测样本转换为统一大小的矩阵,矩阵的大小由样本特征数量Q决定,其中Q∈N矩阵大小为或样本通过随机的方式填充进矩阵中,矩阵其余位置补上0,通过比较不同随机矩阵化方法的候选分类器分类效果获取强分类器。
将矩阵化后的入侵检测样本输入到卷积神经网络中,每个卷积神经网络包含5个卷积层,5个最大池化层,3个全连接层。每一个卷积单元由一个卷积层和一个最大池化层,随着卷积层数的增加,每个卷积层中的卷积核数量也相应增加,样本矩阵通过卷积单元后再通过3层全连接层输出。
本方法的执行过程分为以下几个步骤:
1.入侵检测数据的矩阵化:入侵检测数据一般为含有Q个特征的向量,其中Q∈N,为了让卷积神经网络的效率更高,本方法把入侵检测样本统一为大小相等的矩阵,矩阵的大小通常为或初始的入侵检测按照随机的方式填充进矩阵中,当矩阵中有未填入的空余位时,需要在空余位补0。
2.样本权值和卷积神经网络初始化:初始化样本权值w=[w1,w2,...,wn]并归一化,其中n为样本个数;初始化卷积神经网络的卷积层数、每层卷积核个数、全连接层数、每层网络上的权值w和偏置b。
3.将样本输入卷积神经网络中得到基分类器ht和误差εt:其中ht(xj)为第t个基分类器对第j个样本的分类预测,其中t=1,2,...,m,j=1,2,...,n,m为基分类器的个数,为样本的真实值。
5.将更新权值后的入侵检测样本返回第3步直到所有基分类器训练完成。
7.随机化初始样本矩阵,返回第2步直到所有候选分类器训练完成。
8.选取分类误差最小的候选分类器作为强分类器。
经过上述8个步骤之后,形成了一种基于AdaBoost和CNN的入侵检测方法AdaBoost-CNN。本方法有效地解决了传统分类器难以提取样本高级特征的问题,并提高入侵检测成功率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种基于AdaBoost和CNN的入侵检测方法,其特征在于,包括以下步骤:
步骤1:输入待检测的样本数据集,取部分样本数据构建训练集,对训练集中的样本数据进行人工标记;
步骤2:将训练集中的样本转换为统一大小的矩阵;
步骤3:初始化样本权值w=[w1,w2,...,wn]并归一化,n为样本个数;
步骤4:选择一个矩阵化后的入侵检测样本,初始化m个基于卷积神经网络CNN的基分类器,每个基分类器的卷积神经网络包含5个卷积层、5个最大池化层和3个全连接层;
步骤5:将矩阵化后的入侵检测样本输入到一个基于卷积神经网络CNN的基分类器中,得到第t个基分类器对第j个样本的分类预测ht(xj)和误差εt;
步骤6:计算基分类器的权值并更新样本权值;
分类器权值为:
更新后的样本权值为:
其中,i=1,2,...,n;B为归一化因子;
步骤7:判断是否完成所有基分类器的训练;若未完成,则将更新权值后的入侵检测样本返回至步骤5中;
步骤8:将每个基分类器乘以权值累加得到候选分类器;
步骤9:判断是否得到训练集中所有样本的候选分类器;若未得到,则返回至步骤4;
步骤10:选取分类误差最小的候选分类器作为强分类器;
步骤11:将待检测的样本数据集中其余数据输入到强分类器中,得到入侵检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010264319.0A CN111553386B (zh) | 2020-04-07 | 2020-04-07 | 一种基于AdaBoost和CNN的入侵检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010264319.0A CN111553386B (zh) | 2020-04-07 | 2020-04-07 | 一种基于AdaBoost和CNN的入侵检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111553386A true CN111553386A (zh) | 2020-08-18 |
CN111553386B CN111553386B (zh) | 2022-05-20 |
Family
ID=72000257
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010264319.0A Expired - Fee Related CN111553386B (zh) | 2020-04-07 | 2020-04-07 | 一种基于AdaBoost和CNN的入侵检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111553386B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931175A (zh) * | 2020-09-23 | 2020-11-13 | 四川大学 | 一种基于小样本学习的工业控制系统入侵检测方法 |
CN113569913A (zh) * | 2021-06-29 | 2021-10-29 | 西北大学 | 基于分层选择性Adaboost-DNNs的图像分类模型建立、分类方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163281A (zh) * | 2011-04-26 | 2011-08-24 | 哈尔滨工程大学 | 基于AdaBoost框架和头部颜色的实时人体检测方法 |
CN103716204A (zh) * | 2013-12-20 | 2014-04-09 | 中国科学院信息工程研究所 | 一种基于维纳过程的异常入侵检测集成学习方法及装置 |
CN103839346A (zh) * | 2013-03-11 | 2014-06-04 | 成都百威讯科技有限责任公司 | 一种智能门窗防入侵装置以及系统、智能门禁系统 |
CN107563402A (zh) * | 2017-07-07 | 2018-01-09 | 中国科学院信息工程研究所 | 一种社交关系推断方法及系统 |
US20190156159A1 (en) * | 2017-11-20 | 2019-05-23 | Kavya Venkata Kota Sai KOPPARAPU | System and method for automatic assessment of cancer |
CN109871809A (zh) * | 2019-02-22 | 2019-06-11 | 福州大学 | 一种基于语义网的机器学习流程智能组装方法 |
CN110224990A (zh) * | 2019-07-17 | 2019-09-10 | 浙江大学 | 一种基于软件定义安全架构的入侵检测系统 |
CN110728252A (zh) * | 2019-10-22 | 2020-01-24 | 山西省信息产业技术研究院有限公司 | 一种应用于区域人员运动轨迹监控的人脸检测方法 |
-
2020
- 2020-04-07 CN CN202010264319.0A patent/CN111553386B/zh not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163281A (zh) * | 2011-04-26 | 2011-08-24 | 哈尔滨工程大学 | 基于AdaBoost框架和头部颜色的实时人体检测方法 |
CN103839346A (zh) * | 2013-03-11 | 2014-06-04 | 成都百威讯科技有限责任公司 | 一种智能门窗防入侵装置以及系统、智能门禁系统 |
CN103716204A (zh) * | 2013-12-20 | 2014-04-09 | 中国科学院信息工程研究所 | 一种基于维纳过程的异常入侵检测集成学习方法及装置 |
CN107563402A (zh) * | 2017-07-07 | 2018-01-09 | 中国科学院信息工程研究所 | 一种社交关系推断方法及系统 |
US20190156159A1 (en) * | 2017-11-20 | 2019-05-23 | Kavya Venkata Kota Sai KOPPARAPU | System and method for automatic assessment of cancer |
CN109871809A (zh) * | 2019-02-22 | 2019-06-11 | 福州大学 | 一种基于语义网的机器学习流程智能组装方法 |
CN110224990A (zh) * | 2019-07-17 | 2019-09-10 | 浙江大学 | 一种基于软件定义安全架构的入侵检测系统 |
CN110728252A (zh) * | 2019-10-22 | 2020-01-24 | 山西省信息产业技术研究院有限公司 | 一种应用于区域人员运动轨迹监控的人脸检测方法 |
Non-Patent Citations (2)
Title |
---|
WEIMINGHU 等: "AdaBoost-Based Algorithm for Network Intrusion Detection", 《IEEE TRANSACTIONS ON SYSTEMS,MAN,AND CYBERNETICS》 * |
王洪涛: "混合脑机接口实现及其应用研究", 《中国博士学位论文全文数据库 (医药卫生科技辑)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931175A (zh) * | 2020-09-23 | 2020-11-13 | 四川大学 | 一种基于小样本学习的工业控制系统入侵检测方法 |
US11218502B1 (en) | 2020-09-23 | 2022-01-04 | Sichuan University | Few-shot learning based intrusion detection method of industrial control system |
CN113569913A (zh) * | 2021-06-29 | 2021-10-29 | 西北大学 | 基于分层选择性Adaboost-DNNs的图像分类模型建立、分类方法及系统 |
CN113569913B (zh) * | 2021-06-29 | 2023-04-25 | 西北大学 | 基于分层选择性Adaboost-DNNs的图像分类模型建立、分类方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111553386B (zh) | 2022-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753881B (zh) | 一种基于概念敏感性量化识别对抗攻击的防御方法 | |
CN109005145B (zh) | 一种基于自动特征抽取的恶意url检测系统及其方法 | |
WO2019096099A1 (zh) | Dga域名实时检测方法和装置 | |
CN109815801A (zh) | 基于深度学习的人脸识别方法及装置 | |
Ibrahim et al. | Cluster representation of the structural description of images for effective classification | |
CN113139536B (zh) | 一种基于跨域元学习的文本验证码识别方法、设备及存储介质 | |
CN107908642B (zh) | 基于分布式平台的行业文本实体提取方法 | |
CN111651762A (zh) | 一种基于卷积神经网络的pe恶意软件检测方法 | |
CN113806746A (zh) | 基于改进cnn网络的恶意代码检测方法 | |
CN111553386B (zh) | 一种基于AdaBoost和CNN的入侵检测方法 | |
CN106446011B (zh) | 数据处理的方法及装置 | |
CN111062036A (zh) | 恶意软件识别模型构建、识别方法及介质和设备 | |
CN110602120B (zh) | 一种面向网络的入侵数据检测方法 | |
CN111753290A (zh) | 软件类型的检测方法及相关设备 | |
CN112434553A (zh) | 一种基于深度字典学习的视频鉴别方法及系统 | |
CN115577357A (zh) | 一种基于堆叠集成技术的Android恶意软件检测方法 | |
CN115795065A (zh) | 基于带权哈希码的多媒体数据跨模态检索方法及系统 | |
CN108921186A (zh) | 一种基于孪生支持向量机的指纹图像分类系统与方法 | |
Ansari et al. | An optimized feature selection technique in diversified natural scene text for classification using genetic algorithm | |
CN118013032A (zh) | 一种sql注入语句识别的方法 | |
CN111737688B (zh) | 基于用户画像的攻击防御系统 | |
CN110071845B (zh) | 一种对未知应用进行分类的方法及装置 | |
CN115730312A (zh) | 一种基于深度哈希的家族恶意软件检测方法 | |
CN115713669A (zh) | 一种基于类间关系的图像分类方法、装置、存储介质及终端 | |
CN109543571A (zh) | 一种面向复杂产品异形加工特征的智能识别与检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220520 |