CN115221949A - 一种基于集成的多过滤式特征选择的网络流量分类方法 - Google Patents

一种基于集成的多过滤式特征选择的网络流量分类方法 Download PDF

Info

Publication number
CN115221949A
CN115221949A CN202210747566.5A CN202210747566A CN115221949A CN 115221949 A CN115221949 A CN 115221949A CN 202210747566 A CN202210747566 A CN 202210747566A CN 115221949 A CN115221949 A CN 115221949A
Authority
CN
China
Prior art keywords
feature
feature selection
network traffic
subset
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210747566.5A
Other languages
English (en)
Inventor
陈雪娇
韩倩倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Vocational College Of Information Technology
Original Assignee
Nanjing Vocational College Of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Vocational College Of Information Technology filed Critical Nanjing Vocational College Of Information Technology
Priority to CN202210747566.5A priority Critical patent/CN115221949A/zh
Publication of CN115221949A publication Critical patent/CN115221949A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种基于集成的多过滤式特征选择的网络流量分类方法,包括:对实时流量进行特征提取并进行预处理;采用基于集成的多过滤式特征选择算法获取最优特征子集,该方法结合卡方特征选择法、增益比特征选择法、relief特征选择法和信息增益特征选择法等四种单一的过滤式特征选择算法获取特征子集,使用简单多数投票的方法选取在四个特征子集中重复出现的特征作为最优特征子集;将最优特征子集划分为训练集和测试集,在CNN模型中基于训练集进行训练;再将测试集数据输入训练好的模型中,实现网络流量分类。本发明的方法可以完成对流量特征进行全面选择,避免重要特征的遗漏,并且保留较少的特征数目,从而提高分类模型的综合性能。

Description

一种基于集成的多过滤式特征选择的网络流量分类方法
技术领域
本发明涉及网络流量分类技术领域,具体但不限于涉及一种基于集成的多过滤式特征选择的网络流量分类方法。
背景技术
随着互联网的迅速发展,爆炸式增长的网络流量给网络流量分类带来了巨大的挑战,这使得网络流量分类需要处理的数据量越来越大。
近年来,研究人员从网络流量原始数据中提取特征,并将深度学习应用于网络流量分类,尽管已经取得了巨大的进展,但还存在一些亟待解决的问题,尤其是流量特征选择问题。流量特征选择作为分类模型的先决条件,一方面会影响模型训练的复杂度,比如特征数量过多;另一方面也会影响模型的准确性,比如特征过少,或缺失关键特征等。
通常,为了最大程度的准确表达流量样本,通常会采集尽可能多的特征,其中可能包括一些不相关或冗余特征,特征之间也可能存在依赖关系。这会导致特征分析和预处理、模型训练、推理所需的时间延长,进而加大训练复杂度问题,甚至降低分类模型的准确率。
另外,仅使用单一的过滤式特征选择算法,选择后的流量特征仍然较多,且存在稳定性差的问题。即使使用深度学习中像CNN这种高效的神经网络模型,对特征选择过程并没有较大的贡献。而且将神经网络应用到特征选择时很少考虑使用神经网络得到特征的最佳表示。
网络流量分类中特征选择算法发展至今,解决了不少问题,但单一的过滤式特征选择算法还是存在选择特征数目较多、分类精度较低和稳定性差的问题。有鉴于此,需要提供一种新的方法,以期解决上述至少部分问题。
发明内容
针对现有技术中的一个或多个问题,本发明提出了一种基于集成的多过滤式特征选择的网络流量分类方法,实现对流量特征进行全面选择,避免重要特征的遗漏,并且保留较少的特征数目,从而提高分类模型的综合性能。
实现本发明目的的技术解决方案为:
一种基于集成的多过滤式特征选择的网络流量分类方法,包括:
步骤1:获取真实应用的网络流量数据,并提取出流量特征,进行数据预处理后存放在新的csv文件中;
步骤2:采用基于集成的多过滤式特征选择算法,删除不相关特征及冗余特征,得到最优特征子集;其中,集成的多过滤式特征选择算法集成了信息增益特征选择算法、增益比特征选择算法、relief特征选择算法和卡方检验特征选择算法,所述4种算法在特征选择时分别考虑增益量、增益比、特征权重和CHI值;
步骤3:将最优特征子集分为训练集和测试集,将训练集数据输入卷积神经网络CNN模型中进行训练,得到网络流量分类模型;
步骤4:将待检测的流量样本经预处理后输入网络流量分类模型中,输出网络流量分类结果。
进一步的,本发明的基于集成的多过滤式特征选择的网络流量分类方法,步骤1中使用流量特征提取工具CICflowmeter提取网络流量数据的流量特征。
进一步的,本发明的基于集成的多过滤式特征选择的网络流量分类方法,步骤1中数据预处理包括去除样本中存在空值或缺失值的实例以及非数值型数据。
进一步的,本发明的基于集成的多过滤式特征选择的网络流量分类方法,步骤2具体包括:
步骤2-1:采用信息增益特征选择算法对流量样本进行特征选择,根据信息增益量排序得到第一特征子集S1;
步骤2-2:采用增益比特征选择算法对流量样本进行特征选择,根据信息增益比得分排序得到第二特征子集S2;
步骤2-3:采用relief特征选择算法对流量样本进行特征选择,根据特征权重向量得到第三特征子集S3;
步骤2-4:采用卡方检验特征选择算法对流量样本进行特征选择,根据CHI值排序得到第四特征子集S4;
步骤2-5:使用简单多数投票的方法在四个特征子集S1、S2、S3和S4中找到四种过滤式特征选择方法中频繁出现的特征,得到最优特征子集S。
进一步的,本发明的基于集成的多过滤式特征选择的网络流量分类方法,步骤2-1具体包括:
设网络流量样本集合S,根据特征不同取值将样本集S划分为个k子集C1,C2,...,Ck,计算特征A对样本集S进行划分的信息增益量fG(S,A):
fG(S,A)=H(S)-H(S|A)
其中,H(S)是指网络流样本集S对分类的平均信息量,H(S|A)是指样本集S对分类的评价信息量。
进一步的,本发明的基于集成的多过滤式特征选择的网络流量分类方法,步骤2-2具体包括:
计算信息增益比fGR为:
fGR(A)=fG(S,A)|H(A)
其中,H(A)是指特征A对分类的平均信息量。
进一步的,本发明的基于集成的多过滤式特征选择的网络流量分类方法,步骤2-3具体包括:
从网络流量样本集中随机选择一个样本Si,选择距离样本Si距离最近的同类样本Hit和异类样本Miss,计算特征A的权重W(A):
W(A)=W(A)-diff(A,Si,Hit)/r+diff(A,Si,Miss)/r
其中,diff(A,Si,Hit)和diff(A,Si,Miss)分别表示样本Si与同类样本Hit、异类样本Miss在特征A上的差,r表示重复上述步骤的次数。
进一步的,本发明的基于集成的多过滤式特征选择的网络流量分类方法,步骤2-4具体包括:
设特征A和类别之间符合具有一阶自由度的CHI分布,A对类别的CHI值x2(A)为:
Figure BDA0003717374490000031
其中,n表示总样本的个数,a表示有特征A且属于该类的样本个数,b表示有特征A但不属于该类的样本个数,c表示属于该类但是没有特征A的样本个数,d表示既不属于该类且没有特征A的样本个数。
进一步的,本发明的基于集成的多过滤式特征选择的网络流量分类方法,步骤2-5具体包括:
步骤2-5-1:确定特征计数阈值T,设过滤式特征子集数量为N,则T=N-1;
步骤2-5-2:计算由四种单一过滤式算法计算得到的特征子集中每个特征出现频率;
步骤2-5-3:将各特征子集中的所有特征与计数阈值T进行比较,若该特征的出现频率小于计数阈值T,则删除该特征,反之选择该特征,满足阈值条件的所有特征构成最优特征子集。
进一步的,本发明的基于集成的多过滤式特征选择的网络流量分类方法,卷积神经网络包括四个卷积层、两个最大池化层、一个扁平层和两个全连接层,卷积层的激活函数为ReLU,全连接层的激活函数为Softmax。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明的基于集成的多过滤式特征选择的网络流量分类方法,基于集成的多过滤式特征选择方法,将四种计算特征权重的算法考虑在内,并找到公共子集;避免了重要的特征不能被选择,去除了不相关以及冗余的特征,使得最终的特征子集具有更高的代表性、可识别性,从而提高分类精度和模型的综合性能;特征的约减也大大降低了模型大小、系统计算量以及提高cpu利用率等。
附图说明
附图用来提供对本发明的进一步理解,与说明描述一起用于解释本发明的实施例,并不构成对本发明的限制。在附图中:
图1为本发明的基于集成的多过滤式特征选择的网络流量分类方法的流程图。
图2为本发明的基于集成的多过滤式特征选择的网络流量分类方法的卷积神经网络模型结构图。
图3是本发明的基于集成的多过滤式特征选择的网络流量分类方法的真实数据训练出的分类模型上的真实数据的分类情况。
具体实施方式
为了进一步理解本发明,下面结合实施例对本发明优选实施方案进行描述,但是应当理解,这些描述只是为进一步说明本发明的特征和优点,而不是对本发明权利要求的限制。
该部分的描述只针对典型的实施例,本发明并不仅局限于实施例描述的范围。不同实施例的组合、不同实施例中的一些技术特征进行相互替换,相同或相近的现有技术手段与实施例中的一些技术特征进行相互替换也在本发明描述和保护的范围内。
一种基于集成的多过滤式特征选择的网络流量分类方法,如图1所示,包括如下步骤:
步骤1:获取真实应用的网络流量数据,并使用流量特征提取工具CICflowmeter提取出流量特征,去除样本中存在空值或缺失值的实例以及非数值型数据,存放在新的csv文件中。
步骤2:采用基于集成的多过滤式特征选择算法,删除不相关特征及冗余特征,得到最优特征子集。
所述集成的多过滤式特征选择算法集成了四种过滤式特征选择算法,实现全面特征选择,包括信息增益特征选择算法、增益比特征选择算法、relief特征选择算法以及卡方特征选择算法,这四种算法在特征选择时分别考虑增益量、增益比、特征权重以及CHI值,实现过程如下:
步骤2-1:采用信息增益算法对流量样本进行特征选择,根据信息增益量排序得到第一特征子集S1。具体包括:
设网络流量样本集合S,根据特征不同取值将样本集S划分为个k子集,表示为C1,C2,...,Ck,计算特征A对样本集S进行划分的信息增益量fG(S,A),计算公式如式(Ⅰ)所示:
fG(S,A)=H(S)-H(S|A) (Ⅰ)
其中,H(S)是指网络流样本集S对分类的平均信息量,H(S|A)是指样本集S对分类的评价信息量。H(S)、H(S|A)的定义如式(Ⅱ)、(Ⅲ)所示:
Figure BDA0003717374490000051
Figure BDA0003717374490000052
其中,P(·)表示在对应子集上的概率。
步骤2-2:采用增益比算法对流量样本进行特征选择,根据信息增益比得分排序得到第二特征子集S2。具体包括:
信息增益比fGR计算公式如式(Ⅳ)所示:
fGR(A)=fG(S,A)|H(A) (Ⅳ)
其中,fG(S,A)根据式(Ⅰ)计算,H(A)是根据式(Ⅱ)计算。
步骤2-3:采用relief算法对流量样本进行特征选择,根据特征权重向量得到第三特征子集S3。具体包括:
从网络流量样本集中随机选择一个样本Si,选择距离样本Si距离最近的同类样本Hit和异类样本Miss,计算特征A的权重W(A),计算公式如式(Ⅴ)所示:
W(A)=W(A)-diff(A,Si,Hit)/r+diff(A,Si,Miss)/r (Ⅴ)
其中,diff(A,Si,Hit)和diff(A,Si,Miss)表示样本Si和同类样本Hit和异类样本Miss在特征A上的差。
步骤2-4:采用卡方检验算法对流量样本进行特征选择,根据CHI值排序得到第四特征子集S4。具体包括:
设特征A和类别之间符合具有一阶自由度的CHI分布,A对类别的CHI值由式(Ⅵ)计算:
Figure BDA0003717374490000053
其中:n表示总样本的个数,a表示有特征A且属于该类的样本个数,b表示有特征A但不属于该类的样本个数,c表示属于该类但是没有特征A的样本个数,d表示既不属于该类且没有特征A的样本个数。
步骤2-5:使用简单多数投票的方法在四个特征子集S1、S2、S3和S4中找到四种过滤式特征选择方法中频繁出现的特征,得到最优特征子集S,最优特征子集能大幅度降低特征条数,且包括最具代表性的网络流量特征。具体包括:
步骤2-5-1:确定特征计数阈值T,设过滤式特征子集数量为N,则T=N-1。
步骤2-5-2:计算由四种单一过滤式方法得到的特征子集中每个特征出现频率。
步骤2-5-3:如果某个特征出现频率小于计数阈值T,则删除该特征,反之选择该特征,并对各个特征子集中的所有特征重复该步骤。满足阈值条件的特征将被选择并用作分类的最终特征子集。
针对以上四方面进行特征选择,最终保留下的特征数目较少,且满足各方面优点,选择出的特征具有较高识别性。
步骤3:将特征子集分为训练集和测试集,将训练集输入卷积神经网络中进行训练,得到网络流量分类模型。
卷积神经网络如图2所示,包括四个卷积层、两个最大池化层、一个扁平层和两个全连接层,卷积层的激活函数为ReLU,全连接层的激活函数为Softmax用于分类。
步骤4:将待检测的流量样本经预处理后输入训练好的网络流量分类模型中,输出网络流量分类结果。
本发明通过集成了四种过滤式特征选择算法的结果,在四个特征子集中找到四种过滤式特征选择方法中频繁出现的特征,大幅度减少特征,提高分类精度和分类模型的综合性能。
为了证明该方法生成的数据是具有真实应用特征的,本实施例中以CICIDS2017数据集为例进行说明,对CICIDS2017数据集进行预处理,形成一个包含9种流量类型(DDoS、PortScan、FTP-Patator、SSH-Patator、DoS slowloris、DoS Slowhttptest、DoS Hulk、DoSGoldenEye、others)的数据集。对新的数据集进行基于集成的多过滤式特征选择,得到最优特征子集。在卷积神经网络上使用最优特征子集进行分类实验,图3是使用CICIDS2017数据集训练出的分类模型上的真实数据的分类情况(9种流量类型为例)。如图3所示,该方法能够在大幅度减少特征的同时具有较高的识别率。
本发明基于集成的多过滤式特征选择的网络流量分类方法,该方法使用基于集成的多过滤式特征选择方法,将四种计算特征权重的算法考虑在内,并找到公共子集。该方法避免了重要的特征不能被选择,去除了不相关以及冗余的特征,使得最终的特征子集具有更高的代表性、可识别性,从而提高分类精度和模型的综合性能。本方法适用于所有基于深度学习的网络流量分类场景中不相关或冗余特征过多导致识别率低、效率不高的场景。
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。说明书中所涉及的效果或优点等相关描述可因具体条件参数的不确定或其它因素影响而可能在实际实验例中不能体现,效果或优点等相关描述不用于对发明范围进行限制。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

Claims (10)

1.一种基于集成的多过滤式特征选择的网络流量分类方法,其特征在于,包括:
步骤1:获取真实应用的网络流量数据,并提取出流量特征,进行数据预处理后存放在新的csv文件中;
步骤2:采用基于集成的多过滤式特征选择算法,删除不相关特征及冗余特征,得到最优特征子集;其中,集成的多过滤式特征选择算法集成了信息增益特征选择算法、增益比特征选择算法、relief特征选择算法和卡方检验特征选择算法,所述4种算法在特征选择时分别考虑增益量、增益比、特征权重和CHI值;
步骤3:将最优特征子集分为训练集和测试集,将训练集数据输入卷积神经网络CNN模型中进行训练,得到网络流量分类模型;
步骤4:将待检测的流量样本经预处理后输入网络流量分类模型中,输出网络流量分类结果。
2.根据权利要求1所述的基于集成的多过滤式特征选择的网络流量分类方法,其特征在于,步骤1中使用流量特征提取工具CICflowmeter提取网络流量数据的流量特征。
3.根据权利要求1所述的基于集成的多过滤式特征选择的网络流量分类方法,其特征在于,步骤1中数据预处理包括去除样本中存在空值或缺失值的实例以及非数值型数据。
4.根据权利要求1所述的基于集成的多过滤式特征选择的网络流量分类方法,其特征在于,步骤2具体包括:
步骤2-1:采用信息增益特征选择算法对流量样本进行特征选择,根据信息增益量排序得到第一特征子集S1;
步骤2-2:采用增益比特征选择算法对流量样本进行特征选择,根据信息增益比得分排序得到第二特征子集S2;
步骤2-3:采用relief特征选择算法对流量样本进行特征选择,根据特征权重向量得到第三特征子集S3;
步骤2-4:采用卡方检验特征选择算法对流量样本进行特征选择,根据CHI值排序得到第四特征子集S4;
步骤2-5:使用简单多数投票的方法在四个特征子集S1、S2、S3和S4中找到四种过滤式特征选择方法中频繁出现的特征,得到最优特征子集S。
5.根据权利要求1所述的基于集成的多过滤式特征选择的网络流量分类方法,其特征在于,步骤2-1具体包括:
设网络流量样本集合S,根据特征不同取值将样本集S划分为个k子集C1,C2,...,Ck,计算特征A对样本集S进行划分的信息增益量fG(S,A):
fG(S,A)=H(S)-H(S|A)
其中,H(S)是指网络流样本集S对分类的平均信息量,H(S|A)是指样本集S对分类的评价信息量。
6.根据权利要求1所述的基于集成的多过滤式特征选择的网络流量分类方法,其特征在于,步骤2-2具体包括:
计算信息增益比fGR为:
fGR(A)=fG(S,A)|H(A)
其中,H(A)是指特征A对分类的平均信息量。
7.根据权利要求1所述的基于集成的多过滤式特征选择的网络流量分类方法,其特征在于,步骤2-3具体包括:
从网络流量样本集中随机选择一个样本Si,选择距离样本Si距离最近的同类样本Hit和异类样本Miss,计算特征A的权重W(A):
W(A)=W(A)-diff(A,Si,Hit)/r+diff(A,Si,Miss)/r
其中,diff(A,Si,Hit)和diff(A,Si,Miss)分别表示样本Si与同类样本Hit、异类样本Miss在特征A上的差,r表示重复上述步骤的次数。
8.根据权利要求1所述的基于集成的多过滤式特征选择的网络流量分类方法,其特征在于,步骤2-4具体包括:
设特征A和类别之间符合具有一阶自由度的CHI分布,A对类别的CHI值x2(A)为:
Figure FDA0003717374480000021
其中,n表示总样本的个数,a表示有特征A且属于该类的样本个数,b表示有特征A但不属于该类的样本个数,c表示属于该类但是没有特征A的样本个数,d表示既不属于该类且没有特征A的样本个数。
9.根据权利要求1所述的基于集成的多过滤式特征选择的网络流量分类方法,其特征在于,步骤2-5具体包括:
步骤2-5-1:确定特征计数阈值T,设过滤式特征子集数量为N,则T=N-1;
步骤2-5-2:计算由四种单一过滤式算法计算得到的特征子集中每个特征出现频率;
步骤2-5-3:将各特征子集中的所有特征与计数阈值T进行比较,若该特征的出现频率小于计数阈值T,则删除该特征,反之选择该特征,满足阈值条件的所有特征构成最优特征子集。
10.根据权利要求1所述的基于集成的多过滤式特征选择的网络流量分类方法,其特征在于,卷积神经网络包括四个卷积层、两个最大池化层、一个扁平层和两个全连接层,卷积层的激活函数为ReLU,全连接层的激活函数为Softmax。
CN202210747566.5A 2022-06-28 2022-06-28 一种基于集成的多过滤式特征选择的网络流量分类方法 Withdrawn CN115221949A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210747566.5A CN115221949A (zh) 2022-06-28 2022-06-28 一种基于集成的多过滤式特征选择的网络流量分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210747566.5A CN115221949A (zh) 2022-06-28 2022-06-28 一种基于集成的多过滤式特征选择的网络流量分类方法

Publications (1)

Publication Number Publication Date
CN115221949A true CN115221949A (zh) 2022-10-21

Family

ID=83610833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210747566.5A Withdrawn CN115221949A (zh) 2022-06-28 2022-06-28 一种基于集成的多过滤式特征选择的网络流量分类方法

Country Status (1)

Country Link
CN (1) CN115221949A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116579842A (zh) * 2023-07-13 2023-08-11 南开大学 基于用户行为数据的信用数据分析方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116579842A (zh) * 2023-07-13 2023-08-11 南开大学 基于用户行为数据的信用数据分析方法及系统
CN116579842B (zh) * 2023-07-13 2023-10-03 南开大学 基于用户行为数据的信用数据分析方法及系统

Similar Documents

Publication Publication Date Title
CN112308158B (zh) 一种基于部分特征对齐的多源领域自适应模型及方法
US7362892B2 (en) Self-optimizing classifier
CN109522926A (zh) 基于信息熵聚类的异常检测方法
Jian et al. Densely connected convolutional network optimized by genetic algorithm for fingerprint liveness detection
CN111556016B (zh) 一种基于自动编码器的网络流量异常行为识别方法
CN111860576A (zh) 一种基于随机森林的子宫内膜肿瘤分类标记方法
Katz et al. Generating image filters for target recognition by genetic learning
CN108509996A (zh) 基于Filter和Wrapper选择算法的特征选择方法
CN108280236A (zh) 一种基于LargeVis的随机森林可视化数据分析方法
CN113364751B (zh) 网络攻击预测方法、计算机可读存储介质及电子设备
CN111104398A (zh) 针对智能船舶近似重复记录的检测方法、消除方法
CN114359632A (zh) 一种基于改进PointNet++神经网络的点云目标分类方法
WO2020024444A1 (zh) 人群绩效等级识别方法、装置、存储介质及计算机设备
CN101604394A (zh) 一种有限存贮资源下的增量学习分类方法
CN115221949A (zh) 一种基于集成的多过滤式特征选择的网络流量分类方法
CN116340746A (zh) 一种基于随机森林改进的特征选择方法
CN109583519A (zh) 一种基于p-Laplacian图卷积神经网络的半监督分类方法
CN114091661A (zh) 一种基于生成对抗网络和k-近邻算法提高入侵检测性能的过采样方法
Castellano et al. Generation of interpretable fuzzy granules by a double-clustering technique
CN109286622B (zh) 一种基于学习规则集的网络入侵检测方法
CN111428064B (zh) 小面积指纹图像快速索引方法、装置、设备及存储介质
CN117633597A (zh) 基于自适应谱聚类的居民峰谷用电特性分类方法及系统
CN114547601A (zh) 一种基于多层分类策略的随机森林入侵检测方法
CN115982722A (zh) 一种基于决策树的漏洞分类检测方法
CN115344846B (zh) 一种指纹检索模型及验证方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20221021

WW01 Invention patent application withdrawn after publication