CN108768946A - 一种基于随机森林算法的网络入侵检测模型 - Google Patents

一种基于随机森林算法的网络入侵检测模型 Download PDF

Info

Publication number
CN108768946A
CN108768946A CN201810391178.1A CN201810391178A CN108768946A CN 108768946 A CN108768946 A CN 108768946A CN 201810391178 A CN201810391178 A CN 201810391178A CN 108768946 A CN108768946 A CN 108768946A
Authority
CN
China
Prior art keywords
data
data set
feature
sample point
indicate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810391178.1A
Other languages
English (en)
Other versions
CN108768946B (zh
Inventor
周杰英
杨诗珺
邱荣发
刘映淋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201810391178.1A priority Critical patent/CN108768946B/zh
Publication of CN108768946A publication Critical patent/CN108768946A/zh
Application granted granted Critical
Publication of CN108768946B publication Critical patent/CN108768946B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Complex Calculations (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提出一种基于随机森林算法的网络入侵检测模型,包括:输入训练数据,读取到训练数据之后首先对数据进行预处理;再应用随机森林算法训练数据,建立入侵检测模型。数据预处理由五步构成,第一步:删除数据冗余部分,将数据中重复的数据删除;第二步,进行特征选择,通过对信息增益进行从大到小排序,选择前70%的特征;第三步:人工合成新的数据集,由于数据分布不平衡,使用合成少数类过采样技术(SMOTE)算法人工合成新的数据集;第四步:数据清洗,使用修剪的最近邻算法(ENN)对数据进行清洗操作;第五步:正则化处理,对数据进行正则化处理,使得每个特征的范围集中在一个特定的范围内。

Description

一种基于随机森林算法的网络入侵检测模型
技术领域
本发明涉及入侵检测网络安全领域,特别涉及一种基于随机森林算法的网络入侵检测模型。
背景技术
入侵检测指的是从计算机网络中的关键点收集信息,并且分析这些信息,查看网络中是否存在违反安全策略的行为。入侵检测可以说是防火墙的合理补充和延伸;如果说防火墙是第一道安全闸门,入侵检测可以说是第二道安全闸门。入侵检测在不影响网络性能的前提下,实时、动态地保护来自内部和外部的各种攻击,同时有效地弥补了防火墙所能达到的防护极限。
传统的入侵检测技术是应用规则集方法的技术,用于检测计算机网络中违反安全策略的行为,这说明只有匹配了预先定义的规则,才能检测出流量是否异常。这种做法最大的局限性在于无法检测出规则集之外的异常类型,若网络中出现了新型攻击类型,传统的规则匹配方法将不可行。此外,规则集的制定也将耗费网络监控人员大量的时间与精力,并且需要不时地更新规则集。
针对传统入侵检测技术的局限性,人们将机器学习应用到入侵检测上,可以有效地解决人工繁琐的操作过程,降低误检率,并且具有实时性的特点。一般情况下攻击类型的流量数据非常少,数据集分布不平衡,而且网络流量中有许多不干净的数据,即噪音数据,不利于一个好的模型的建立。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷,提出了一种基于随机森林算法的网络入侵检测模型,此模型应用合成少数类过采样技术(SMOTE)算法人工合成新的数据样本,使用修剪的最近邻算法(ENN)清除噪音数据,然后将数据进行正则化之后传入随机森林分类器进行训练,比仅使用随机森林分类器分类来判别异常样本的方法来说,具有更高的精确率,召回率和F-1值,有效地降低了误检率。
为达到上述目的,本发明的技术方案具体为:
一种基于随机森林算法的网络入侵检测模型,包括:
步骤1,读取数据集及预处理:读取数据集,删除数据集里重复的冗余数据,进行特征选择,用每一个特征对数据集进行划分,计算划分之后数据子集的信息熵,从而得到信息增益,对信息增益从大到小排序,选择前M%的特征;
步骤2,人工合成新的数据集:对少数类(少数类指的是数据集中数据数量很少的类别)的样本进行人工合成新的数据集;考虑到现实中异常的数据数目肯定很少,而步骤1中输入的数据集的数据分布不平衡,所以步骤2针对少数类(数据数量少的类别)进行平衡数据样本分布;
步骤3,数据清洗:使用修剪的最近邻算法(ENN)对由步骤2合成新的数据集中的数据进行清洗操作;
步骤4,正则化处理:对由步骤3清洗操作后的数据集进行正则化处理,使每个特征的值都集中在0-1之间;
步骤5,划分训练数据集与测试数据集:将由步骤1-4预处理过的数据集划分为训练数据集与测试数据集,训练数据集用于模型的训练,测试训练集用于模型的测试;
步骤6,建立模型:将训练数据集传入随机森林模型中进行训练,建立网络入侵检测模型。
优选的,所述步骤1的过程具体为:
将数据集读取进来,删除数据集中重复的冗余数据,然后进行特征选择,特征选择是对信息增益从大到小进行排序,选择前M%的特征,信息增益的计算首先计算信息熵:
上式中,H(D)表示数据集D的信息熵,n表示数据集D中类别的个数,pi表示第i类数据所占的比例,接着计算信息增益为:
上式中,Gain(D,a)表示用特征a对数据集D进行划分所获得的信息增益,m表示特征a有m个可能的取值{a1,a2,...,am},Dk表示数据集D中所有在特征a上取值为ak的数据子集;用所有特征对数据集D进行划分获得一系列信息增益,选择前M%的特征,舍弃后(1-M)%的特征。
优选的,所述步骤2的合成新的数据集的过程为:生成新数据集的公式为:
xnew=xi+|x′i-xi|×δ (4)
上式中,xnew表示生成的新的数据集,xi表示少数类的样本点,xi'表示xi样本的k近邻样本点的其中一个,δ∈[0,1]。
优选的,所述步骤3的数据清洗的过程为:使用修剪的最近邻算法(ENN)对由步骤2合成新的数据集中的数据进行清洗操作,采用式(5)计算数据集中样本与其他所有样本的欧氏距离:
上式中,dij(xi,xj)表示第i个样本点与第j个样本点的欧氏距离,xi表示第i个样本点,m表示特征的个数,xif表示第i个样本的第f个特征的值,其中i≠j;然后对所有获得的欧氏距离进行从小到大排序,选取前k个样本点,判断它们类别的众数(出现次数最多的类别);若样本点xi的类别和k近邻样本点类别的众数不一致,则删除样本点xi,若样本点xi的类别和k近邻样本点类别的众数一致,则留下样本点xi
优选的,所述步骤4的正则化的过程为:采用式(6)由步骤3清洗操作后的数据集进行正则化处理,得到均值为0,方差为1的分布:
xi'是第i个特征正则化之后的值,xi是第i个特征的值,μ是第i个特征的期望,δ是第i个特征的方差。
优选的,所述步骤5的划分训练数据集与测试数据集的过程为:将由步骤1-4预处理之后的数据集划分为训练数据子集与测试数据子集,随机选取M%的数据作为训练数据子集,剩下的(1-M)%数据作为测试数子集。
本发明提出的一种基于随机森林算法的网络入侵检测模型,是将应用合成少数类过采样技术(SMOTE)算法人工合成新的数据样本,使用修剪的最近邻算法(ENN)清除噪音数据,然后将数据进行正则化之后传入随机森林模型训练得到入侵检测模型,采用这种方法获得的入侵检测模型,其检测结果具有更高的精确率,召回率和F-1值。
相对于现有技术,本发明具有如下优点和有益效果:
针对网络中流量的特征数目众多,表现为模型建立需要更多的时间的情况,本发明提出了一种基于随机森林算法的网络入侵检测模型,其数据预处理阶段是采用基于信息增益的特征选择方法。该方法遍历所有特征来划分数据集,对每次使用一个特征来划分数据集之后得到的数据子集进行信息熵的计算,从而得到信息增益,选择信息增益比较大的特征作为模型建立的特征,这样使得模型的建立更加高效,表现为建立模型的时间更少,建立的模型效果更优。
附图说明
图1为所提出的一种基于随机森林算法的网络入侵检测模型的流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本发明的技术方案做进一步的说明。
一种基于随机森林算法的网络入侵检测模型,包括以下步骤:
第一步:将数据集读取进来,删除数据集中重复的冗余数据,然后进行特征选择,用每一个特征对数据集进行划分,计算划分之后数据子集的信息熵,从而得到信息增益,对信息增益从大到小排序,选择前M%的特征;特征选择是对信息增益从大到小进行排序,在本实施例中选择前70%的特征,信息增益的计算首先计算信息熵:
上式中,H(D)表示数据集D的信息熵,n表示数据集D中类别的个数,pi表示第i类数据所占的比例,接着计算信息增益为:
上式中,Gain(D,a)表示用特征a对数据集D进行划分所获得的信息增益,m表示特征a有m个可能的取值{a1,a2,...,am},Dk表示数据集D中所有在特征a上取值为ak的数据子集。用所有特征对数据集D进行划分获得一系列信息增益,选择前70%的特征,舍弃后30%的特征。
第二步:对于少数类样本数据,通过人工生成新的数据集,来平衡样本分布,生成新数据集的公式为:
xnew=xi+|x′i-xi|×δ (4)
上式中,xnew表示生成的新的数据集,xi表示少数类的样本点,xi'表示xi样本的k近邻样本点的其中一个,δ∈[0,1]。
第三步:数据集存在大量噪声数据,使用修剪的最近邻算法(ENN)对由第二步合成新的数据集中的数据进行清洗操作,采用式(5)计算数据集中样本与其他所有样本的欧氏距离:
上式中,dij(xi,xj)表示第i个样本点与第j个样本点的欧氏距离,xi表示第i个样本点,m表示特征的个数,xif表示第i个样本的第f个特征的值,其中i≠j;然后对所有获得的欧氏距离进行从小到大排序,选取前k个样本点,判断它们类别的众数;若样本点xi的类别和k近邻样本点类别的众数不一致,则删除样本点xi,若样本点xi的类别和k近邻样本点类别的众数一致,则留下样本点xi
第四步:数据中各个特征值的取值范围不一,采用式(6)进行正则化处理,统一特征值的取值范围,得到均值为0,方差为1的分布:
xi'是第i个特征正则化之后的值,xi是第i个特征的值,μ是第i个特征的期望,δ是第i个特征的方差。
第五步:将由第一步至第四步预处理之后的数据集划分为训练数据子集与测试数据子集,随机选取70%的数据作为训练数据子集,剩下的30%数据作为测试数子集。
第六步:将训练数据集传入随机森林模型中进行训练得到入侵检测模型,然后传入测试数据至入侵检测模型进行模型效果的检测,获得精确率,召回率和F-1值。
本实施例提出的一种基于随机森林算法的网络入侵检测模型,包括:输入训练数据,读取到训练数据之后首先对数据进行预处理,清除数据中重复的冗余数据;针对样本分布不平衡的情况,使用上采样技术人工合成新的数据,在少数类样本点与k近邻样本点之间随机生成k个样本,平衡样本分布;针对样本重叠和存在噪声数据的情况,使用数据清洗技术,若一个样本的类别有k近邻样本点的类别众数一致,则保留该样本点,若样本点的类别与k近邻样本点的类别众数不一致,则该样本点为噪声数据,清除该样本点;然后应用正则化处理数据,将每个特征的值缩小到0到1的范围内;再应用随机森林算法训练数据,建立模型,输入测试数据检测模型效果,获得精确率,召回率和F-1值。
相对于现有技术,本发明具有如下优点和有益效果:
针对网络中攻击类型的流量数量少,样本分布不平衡,表现为正常类型的数据样本多,异常类型的数据样本少的情况,本发明提出了一种人工合成样本与数据清洗技术相结合的方法。该方法不仅能人工合成新的数据,解决数据样本分布不平衡的问题,还能使用数据清洗技术将数据中的噪声数据清除,这里的噪声数据也包括人工合成数据过程中生成的一些重叠数据,防止噪声数据对模型建立的干扰,提高模型的精确率,召回率和F1-值。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (6)

1.一种基于随机森林算法的网络入侵检测模型,其特征在于,包括:
步骤1,读取数据集及预处理:读取数据集,删除数据集里重复的冗余数据,进行特征选择,用每一个特征对数据集进行划分,计算划分之后数据子集的信息熵,从而得到信息增益,对信息增益从大到小排序,选择前M%的特征;
步骤2,人工合成新的数据集:对少数类的样本进行人工合成新的数据集;
步骤3,数据清洗:使用修剪的最近邻算法(ENN)对由步骤2合成新的数据集中的数据进行清洗操作;
步骤4,正则化处理:对由步骤3清洗操作后的数据集进行正则化处理,使每个特征的值都集中在0-1之间;
步骤5,划分训练数据集与测试数据集:将由步骤1-4预处理过的数据集划分为训练数据集与测试数据集,训练数据集用于模型的训练,测试训练集用于模型的测试;
步骤6,建立模型:将训练数据集传入随机森林模型中进行训练,建立网络入侵检测模型。
2.根据权利要求1所述的方法,其特征在于,所述步骤1的过程具体为:
将数据集读取进来,删除数据集中重复的冗余数据,然后进行特征选择,特征选择是对信息增益从大到小进行排序,选择前M%的特征,信息增益的计算首先计算信息熵:
上式中,H(D)表示数据集D的信息熵,n表示数据集D中类别的个数,pi表示第i类数据所占的比例,接着计算信息增益为:
上式中,Gain(D,a)表示用特征a对数据集D进行划分所获得的信息增益,m表示特征a有m个可能的取值{a1,a2,...,am},Dk表示数据集D中所有在特征a上取值为ak的数据子集;用所有特征对数据集D进行划分获得一系列信息增益,选择前M%的特征,舍弃后(1-M)%的特征。
3.根据权利要求2所述的方法,其特征在于,所述步骤2的合成新的数据集的过程为:生成新数据集的公式为:
xnew=xi+|x'i-xi|×δ (4)
上式中,xnew表示生成的新的数据集,xi表示少数类的样本点,x'i表示xi样本的k近邻样本点的其中一个,δ∈[0,1]。
4.根据权利要求3所述的方法,其特征在于,所述步骤3的数据清洗的过程为:使用修剪的最近邻算法(ENN)对由步骤2合成新的数据集中的数据进行清洗操作,采用式(5)计算数据集中样本与其他所有样本的欧氏距离:
上式中,dij(xi,xj)表示第i个样本点与第j个样本点的欧氏距离,xi表示第i个样本点,m表示特征的个数,xif表示第i个样本的第f个特征的值,其中i≠j;然后对所有获得的欧氏距离进行从小到大排序,选取前k个样本点,判断它们类别的众数;若样本点xi的类别和k近邻样本点类别的众数不一致,则删除样本点xi,若样本点xi的类别和k近邻样本点类别的众数一致,则留下样本点xi
5.根据权利要求4所述的方法,其特征在于,所述步骤4的正则化的过程为:采用式(6)由步骤3清洗操作后的数据集进行正则化处理,得到均值为0,方差为1的分布:
x'i是第i个特征正则化之后的值,xi是第i个特征的值,μ是第i个特征的期望,δ是第i个特征的方差。
6.根据权利要求5所述的方法,其特征在于,所述步骤5的划分训练数据集与测试数据集的过程为:将由步骤1-4预处理之后的数据集划分为训练数据子集与测试数据子集,随机选取M%的数据作为训练数据子集,剩下的(1-M)%数据作为测试数子集。
CN201810391178.1A 2018-04-27 2018-04-27 一种基于随机森林算法的网络入侵检测方法 Active CN108768946B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810391178.1A CN108768946B (zh) 2018-04-27 2018-04-27 一种基于随机森林算法的网络入侵检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810391178.1A CN108768946B (zh) 2018-04-27 2018-04-27 一种基于随机森林算法的网络入侵检测方法

Publications (2)

Publication Number Publication Date
CN108768946A true CN108768946A (zh) 2018-11-06
CN108768946B CN108768946B (zh) 2020-12-22

Family

ID=64012168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810391178.1A Active CN108768946B (zh) 2018-04-27 2018-04-27 一种基于随机森林算法的网络入侵检测方法

Country Status (1)

Country Link
CN (1) CN108768946B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635839A (zh) * 2018-11-12 2019-04-16 国家电网有限公司 一种基于机器学习的非平衡数据集的处理方法和装置
CN109981624A (zh) * 2019-03-18 2019-07-05 中国科学院计算机网络信息中心 入侵检测方法、装置及存储介质
CN110138766A (zh) * 2019-05-10 2019-08-16 福州大学 天牛须结合随机森林的网络入侵检测方法
CN110266672A (zh) * 2019-06-06 2019-09-20 华东理工大学 基于信息熵和置信度下采样的网络入侵检测方法
CN110502432A (zh) * 2019-07-23 2019-11-26 平安科技(深圳)有限公司 智能测试方法、装置、设备及可读存储介质
CN111310176A (zh) * 2020-01-19 2020-06-19 苏州浪潮智能科技有限公司 一种基于特征选择的入侵检测方法和装置
CN111556016A (zh) * 2020-03-25 2020-08-18 中国科学院信息工程研究所 一种基于自动编码器的网络流量异常行为识别方法
CN111967343A (zh) * 2020-07-27 2020-11-20 广东工业大学 基于简单神经网络和极端梯度提升模型融合的检测方法
CN113852612A (zh) * 2021-09-15 2021-12-28 桂林理工大学 一种基于随机森林的网络入侵检测方法
CN113922985A (zh) * 2021-09-03 2022-01-11 西南科技大学 一种基于集成学习的网络入侵检测方法及系统
CN114500387A (zh) * 2022-02-14 2022-05-13 重庆邮电大学 基于机器学习的移动应用流量识别方法及系统
CN114844677A (zh) * 2022-03-31 2022-08-02 北京工业大学 一种集成式的smote算法
CN115600194A (zh) * 2022-11-08 2023-01-13 广东技术师范大学(Cn) 一种基于XGBoost和LGBM的入侵检测方法、存储介质及设备
CN117997652A (zh) * 2024-04-03 2024-05-07 江西师范大学 一种基于集成学习的车辆入侵检测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106060043A (zh) * 2016-05-31 2016-10-26 北京邮电大学 一种异常流量的检测方法及装置
CN107395590A (zh) * 2017-07-19 2017-11-24 福州大学 一种基于pca和随机森林分类的入侵检测方法
WO2018004580A1 (en) * 2016-06-30 2018-01-04 Intel Corporation Device-based anomaly detection using random forest models

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106060043A (zh) * 2016-05-31 2016-10-26 北京邮电大学 一种异常流量的检测方法及装置
WO2018004580A1 (en) * 2016-06-30 2018-01-04 Intel Corporation Device-based anomaly detection using random forest models
CN107395590A (zh) * 2017-07-19 2017-11-24 福州大学 一种基于pca和随机森林分类的入侵检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ABEBE TESFAHUN: ""Intrusion Detection using Random Forests Classifier with SMOTE and Feature Reduction"", 《IEEE》 *
BINGHAO YAN: ""A Novel Region Adaptive SMOTE Algorithm for Intrusion Detection on Imbalanced Problem"", 《IEEE》 *
林伟宁: ""一种基于PCA和随机森林分类的入侵检测算法研究"", 《技术研究》 *
逯玉婧: ""基于深度信念网络的入侵检测算法研究"", 《万方》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635839A (zh) * 2018-11-12 2019-04-16 国家电网有限公司 一种基于机器学习的非平衡数据集的处理方法和装置
CN109635839B (zh) * 2018-11-12 2020-07-14 国家电网有限公司 一种基于机器学习的非平衡数据集的处理方法和装置
CN109981624B (zh) * 2019-03-18 2021-07-16 中国科学院计算机网络信息中心 入侵检测方法、装置及存储介质
CN109981624A (zh) * 2019-03-18 2019-07-05 中国科学院计算机网络信息中心 入侵检测方法、装置及存储介质
CN110138766A (zh) * 2019-05-10 2019-08-16 福州大学 天牛须结合随机森林的网络入侵检测方法
CN110266672A (zh) * 2019-06-06 2019-09-20 华东理工大学 基于信息熵和置信度下采样的网络入侵检测方法
CN110266672B (zh) * 2019-06-06 2021-09-28 华东理工大学 基于信息熵和置信度下采样的网络入侵检测方法
CN110502432A (zh) * 2019-07-23 2019-11-26 平安科技(深圳)有限公司 智能测试方法、装置、设备及可读存储介质
CN110502432B (zh) * 2019-07-23 2023-11-28 平安科技(深圳)有限公司 智能测试方法、装置、设备及可读存储介质
CN111310176A (zh) * 2020-01-19 2020-06-19 苏州浪潮智能科技有限公司 一种基于特征选择的入侵检测方法和装置
CN111310176B (zh) * 2020-01-19 2022-05-27 苏州浪潮智能科技有限公司 一种基于特征选择的入侵检测方法和装置
CN111556016A (zh) * 2020-03-25 2020-08-18 中国科学院信息工程研究所 一种基于自动编码器的网络流量异常行为识别方法
CN111967343A (zh) * 2020-07-27 2020-11-20 广东工业大学 基于简单神经网络和极端梯度提升模型融合的检测方法
CN113922985A (zh) * 2021-09-03 2022-01-11 西南科技大学 一种基于集成学习的网络入侵检测方法及系统
CN113922985B (zh) * 2021-09-03 2023-10-31 西南科技大学 一种基于集成学习的网络入侵检测方法及系统
CN113852612B (zh) * 2021-09-15 2023-06-27 桂林理工大学 一种基于随机森林的网络入侵检测方法
CN113852612A (zh) * 2021-09-15 2021-12-28 桂林理工大学 一种基于随机森林的网络入侵检测方法
CN114500387A (zh) * 2022-02-14 2022-05-13 重庆邮电大学 基于机器学习的移动应用流量识别方法及系统
CN114844677A (zh) * 2022-03-31 2022-08-02 北京工业大学 一种集成式的smote算法
CN114844677B (zh) * 2022-03-31 2024-05-28 北京工业大学 一种集成式的smote方法
CN115600194A (zh) * 2022-11-08 2023-01-13 广东技术师范大学(Cn) 一种基于XGBoost和LGBM的入侵检测方法、存储介质及设备
CN117997652A (zh) * 2024-04-03 2024-05-07 江西师范大学 一种基于集成学习的车辆入侵检测方法及装置
CN117997652B (zh) * 2024-04-03 2024-06-07 江西师范大学 一种基于集成学习的车辆入侵检测方法及装置

Also Published As

Publication number Publication date
CN108768946B (zh) 2020-12-22

Similar Documents

Publication Publication Date Title
CN108768946A (zh) 一种基于随机森林算法的网络入侵检测模型
CN107395590B (zh) 一种基于pca和随机森林分类的入侵检测方法
Qi et al. Exploiting multi-domain visual information for fake news detection
CN104794192B (zh) 基于指数平滑、集成学习模型的多级异常检测方法
Ektefa et al. Intrusion detection using data mining techniques
CN110287439A (zh) 一种基于lstm的网络行为异常检测方法
CN107846392A (zh) 一种基于改进协同训练‑adbn的入侵检测算法
CN104933428B (zh) 一种基于张量描述的人脸识别方法及装置
CN106776842A (zh) 多媒体数据检测方法及装置
CN110213222A (zh) 基于机器学习的网络入侵检测方法
CN108108622A (zh) 基于深度卷积网络和控制流图的漏洞检测系统
CN109934354A (zh) 基于主动学习的异常数据检测方法
CN103886344A (zh) 一种图像型火灾火焰识别方法
CN107025420A (zh) 视频中人体行为识别的方法和装置
CN107688786A (zh) 一种基于级联卷积神经网络的人脸检测方法
CN107506786A (zh) 一种基于深度学习的属性分类识别方法
CN108805002A (zh) 基于深度学习和动态聚类的监控视频异常事件检测方法
CN108764943B (zh) 基于资金交易网络的可疑用户监测分析方法
CN104809393B (zh) 一种基于流行度分类特征的托攻击检测算法
CN101763502A (zh) 一种高效的敏感图像检测方法及其系统
CN105959270A (zh) 一种基于谱聚类算法的网络攻击检测方法
CN107092884A (zh) 一种快速粗精级联行人检测方法
CN110414483A (zh) 一种基于深度神经网络和随机森林的人脸识别方法及系统
CN107679135A (zh) 面向网络文本大数据的话题检测与跟踪方法、装置
WO2019200739A1 (zh) 数据欺诈识别方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant