CN112598036A - 一种网络流量分类方法和系统 - Google Patents

一种网络流量分类方法和系统 Download PDF

Info

Publication number
CN112598036A
CN112598036A CN202011471373.9A CN202011471373A CN112598036A CN 112598036 A CN112598036 A CN 112598036A CN 202011471373 A CN202011471373 A CN 202011471373A CN 112598036 A CN112598036 A CN 112598036A
Authority
CN
China
Prior art keywords
population
network traffic
whale
classification model
support vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011471373.9A
Other languages
English (en)
Inventor
王春枝
马森
刘爱军
刘锦行
严灵毓
魏明
张逸诚
王若曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Fiberhome Telecommunication Technologies Co Ltd
Wuhan Fiberhome Technical Services Co Ltd
Original Assignee
Hubei University of Technology
Fiberhome Telecommunication Technologies Co Ltd
Wuhan Fiberhome Technical Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology, Fiberhome Telecommunication Technologies Co Ltd, Wuhan Fiberhome Technical Services Co Ltd filed Critical Hubei University of Technology
Priority to CN202011471373.9A priority Critical patent/CN112598036A/zh
Publication of CN112598036A publication Critical patent/CN112598036A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种网络流量分类方法和系统。其中,网络流量分类方法包括:获取待分类网络流量数据;获取网络流量分类模型;以待分类网络流量数据为输入,采用网络流量分类模型得到待分类网络流量数据的网络流量分类。本发明提供的网络流量分类方法和系统,通过采用以网络流量数据为输入,以网络流量分类为输出的优化训练后的支持向量机分类模型(即网络流量分类模型)对待分类网络流量数据进行分类,能够在提高网络流量分类精度的同时,提高分类速度,进而提高整体分类效率。

Description

一种网络流量分类方法和系统
技术领域
本发明涉及计算机网络技术领域,特别是涉及一种网络流量分类方法和系统。
背景技术
随着云计算与大数据时代的到来,各种快捷的网络设备在不断推出,依赖网络流量的应用也成为了人民生活中娱乐、社交、休闲、购物等行为活动中不可或缺的一部分,由此产生的网络流量数据也在剧增,日益实惠的网络流量成本更加剧了这一过程。而为了进一步提高网络空间安全性以及提升对网络设施的监管,网络管理者需要对海量的网络流量进行分类。
现有的网络流量分类方法有很多种,其中包括基于端口号的流量分类方法、基于有效负载的流量分类方法、基于主机行为的流量分类方法、基于协议解析的流量分类方法、基于机器学习的流量分类方法、基于深度学习的流量分类方法等分类方法。基于机器学习的流量分类方法近年来随着机器学习技术的发展而变得越来越流行,对比传统的分类方法,其有着更高的分类准确率、拓展性以及更多的适用场景,但其在分类精度以及时间效率尚有较大的发展空间。
因此,提供一种能够提高网络流量分类精度以及分类速度的方法或系统是本领域亟待解决的一个技术难题。
发明内容
本发明的目的是提供一种网络流量分类方法和系统,以提高网络流量的分类精度和分类速度。
为实现上述目的,本发明提供了如下方案:
一种网络流量分类方法,包括:
获取待分类网络流量数据;
获取网络流量分类模型;所述网络流量分类模型为以网络流量数据为输入,以网络流量分类为输出的优化训练后的支持向量机分类模型;
以所述待分类网络流量数据为输入,采用所述网络流量分类模型得到所述待分类网络流量数据的网络流量分类。
优选地,所述获取网络流量分类模型,之前还包括:
获取支持向量机分类模型;
采用改进后的二进制鲸鱼优化算法对所述支持向量机分类模型进行优化,得到优化后的支持向量机分类模型;
获取网络流量数据样本集;所述网络流量数据样本集包括多个训练样本对;每一所述训练样本对包括网络流量数据及其对应的网络流量分类;
对所述网络流量数据样本集进行初始化处理;
采用初始化后的所述网络流量数据样本集对所述优化后的支持向量机分类模型进行训练,得到所述网络流量分类模型。
优选地,所述采用改进后的二进制鲸鱼优化算法对所述支持向量机分类模型进行优化,得到优化后的支持向量机分类模型,具体包括:
获取鲸鱼种群的预设数量、预设迭代次数、支持向量机分类模型的参数取值范围;所述参数取值范围包括惩罚参数的取值范围和核参数的取值范围;
以支持向量机分类模型的参数组合为鲸鱼个体,采用反向学习算法根据所述鲸鱼种群的预设数量进行鲸鱼种群位置初始化,得到初始种群;所述支持向量机分类模型的参数组合包括惩罚参数和核参数;
采用K折交叉验证法根据所述初始种群确定每个所述鲸鱼个体的适应度,记为第一适应度;
采用遗传变异策略根据所述初始种群更新每个所述鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息;
采用K折交叉验证法根据所述第一种群信息确定每个所述鲸鱼个体的适应度,记为第二适应度;
根据所述第一适应度和所述第二适应度间的关系确定最优解,并更新所述第一种群信息,得到第二种群信息;所述最优解包括鲸鱼个体的最优解和种群最优解;
以所述第二种群信息替代所述第一种群信息后,返回“采用遗传变异策略根据所述初始种群更新每个所述鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息”,直至迭代次数达到所述预设迭代次数时,输出所述鲸鱼个体的最优解;
将所述鲸鱼个体的最优解带入所述支持向量机分类模型,得到优化后的支持向量机分类模型。
优选地,所述以支持向量机分类模型的参数组合为鲸鱼个体,采用反向学习算法根据所述鲸鱼种群的预设数量进行鲸鱼种群位置初始化,得到初始种群,具体包括:
根据所述鲸鱼种群的预设数量确定初始化种群;
采用反向学习算法确定所述初始化种群的反向种群;
根据所述初始化种群和所述反向种群得到组合种群;
确定所述组合种群中每一鲸鱼个体的适应度值,记为第三适应度;
按照所述第三适应度的值升序排列所述组合种群中的鲸鱼个体,得到个体序列;
在所述个体序列中选择与所述鲸鱼种群的预设数量相等的鲸鱼个体作为初始种群。
优选地,所述获取待分类网络流量数据,之后还包括:
对所述待分类网络流量数据进行初始化处理;所述初始化处理包括:数值化处理、归一化处理和降维处理。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的网络流量分类方法,通过采用以网络流量数据为输入,以网络流量分类为输出的优化训练后的支持向量机分类模型(即网络流量分类模型)对待分类网络流量数据进行分类,能够在提高网络流量分类精度的同时,提高分类速度,进而提高整体分类效率。
对应于上述提供的网络流量分类方法,本发明还提供了以下技术方案:
一种网络流量分类系统,包括:
待分类网络流量数据获取模块,用于获取待分类网络流量数据;
网络流量分类模型获取模块,用于获取网络流量分类模型;所述网络流量分类模型为以网络流量数据为输入,以网络流量分类为输出的优化训练后的支持向量机分类模型;
网络流量分类模块,用于以所述待分类网络流量数据为输入,采用所述网络流量分类模型得到所述待分类网络流量数据的网络流量分类。
优选地,还包括:
支持向量机分类模型获取模块,用于获取支持向量机分类模型;
支持向量机分类模型优化模块,用于采用改进后的二进制鲸鱼优化算法对所述支持向量机分类模型进行优化,得到优化后的支持向量机分类模型;
网络流量数据样本集获取模块,用于获取网络流量数据样本集;所述网络流量数据样本集包括多个训练样本对;每一所述训练样本对包括网络流量数据及其对应的网络流量分类;
初始化处理模块,用于对所述网络流量数据样本集进行初始化处理;
支持向量机分类模型训练模块,用于采用初始化后的所述网络流量数据样本集对所述优化后的支持向量机分类模型进行训练,得到所述网络流量分类模型。
优选地,所述支持向量机分类模型优化模块具体包括:
预设值获取单元,用于获取鲸鱼种群的预设数量、预设迭代次数、支持向量机分类模型的参数取值范围;所述参数取值范围包括惩罚参数的取值范围和核参数的取值范围;
初始种群确定单元,用于以支持向量机分类模型的参数组合为鲸鱼个体,采用反向学习算法根据所述鲸鱼种群的预设数量进行鲸鱼种群位置初始化,得到初始种群;所述支持向量机分类模型的参数组合包括惩罚参数和核参数;
第一适应度确定单元,用于采用K折交叉验证法根据所述初始种群确定每个所述鲸鱼个体的适应度,记为第一适应度;
第一种群信息确定单元,用于采用遗传变异策略根据所述初始种群更新每个所述鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息;
第二适应度确定单元,用于采用K折交叉验证法根据所述第一种群信息确定每个所述鲸鱼个体的适应度,记为第二适应度;
第二种群信息确定单元,用于根据所述第一适应度和所述第二适应度间的关系确定最优解,并更新所述第一种群信息,得到第二种群信息;所述最优解包括鲸鱼个体的最优解和种群最优解;
迭代单元,用于以所述第二种群信息替代所述第一种群信息后,返回“采用遗传变异策略根据所述初始种群更新每个所述鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息”,直至迭代次数达到所述预设迭代次数时,输出所述鲸鱼个体的最优解;
支持向量机分类模型优化单元,用于将所述鲸鱼个体的最优解带入所述支持向量机分类模型,得到优化后的支持向量机分类模型。
优选地,所述初始种群确定单元具体包括:
初始化种群确定子单元,用于根据所述鲸鱼种群的预设数量确定初始化种群;
反向种群确定子单元,用于采用反向学习算法确定所述初始化种群的反向种群;
组合种群确定子单元,用于根据所述初始化种群和所述反向种群得到组合种群;
第三适应度确定子单元,用于确定所述组合种群中每一鲸鱼个体的适应度值,记为第三适应度;
个体序列确定子单元,用于按照所述第三适应度的值升序排列所述组合种群中的鲸鱼个体,得到个体序列;
初始种群确定子单元,用于在所述个体序列中选择与所述鲸鱼种群的预设数量相等的鲸鱼个体作为初始种群。
因本发明提供的网络流量分类系统所实现的技术效果与上述网络流量分类方法所实现的技术效果相同,在此不再进行赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的网络流量分类方法的流程图;
图2为本发明提供的采用改进后的二进制鲸鱼优化算法对支持向量机分类模型进行优化的流程图;
图3为本发明提供的对优化后的支持向量机分类模型进行训练的整体架构图;
图4为本发明提供的网络流量分类系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种网络流量分类方法和系统,以提高网络流量的分类精度和分类速度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明提供的网络流量分类方法的流程图,如图1所示,一种网络流量分类方法,包括:
步骤100:获取待分类网络流量数据。
步骤101:获取网络流量分类模型。网络流量分类模型为以网络流量数据为输入,以网络流量分类为输出的优化训练后的支持向量机分类模型。
步骤102:以待分类网络流量数据为输入,采用网络流量分类模型得到待分类网络流量数据的网络流量分类。
为了快速高效地得到更高准确率的网络流量分类结果,如图3所示,本发明上述步骤101获取得到的网络流量分类模型的具体构建过程为:
获取支持向量机分类模型。
采用改进后的二进制鲸鱼优化算法对支持向量机分类模型进行优化,得到优化后的支持向量机分类模型。
获取网络流量数据样本集。网络流量数据样本集包括多个训练样本对。每一训练样本对包括网络流量数据及其对应的网络流量分类。
对网络流量数据样本集进行初始化处理。
采用初始化后的网络流量数据样本集对优化后的支持向量机分类模型进行训练,得到网络流量分类模型。
其中,如图2所示,采用改进后的二进制鲸鱼优化算法对支持向量机分类模型进行优化,得到优化后的支持向量机分类模型,具体包括:
获取鲸鱼种群的预设数量N、预设迭代次数(即最大迭代次数MAX_T)、支持向量机分类模型的参数取值范围(即参数(C,g)的取值范围)。参数取值范围包括惩罚参数的取值范围和核参数的取值范围。在该步骤中获取的各个预设值均是根据实际需要人为进行设定。
以支持向量机分类模型的参数组合为鲸鱼个体,采用反向学习算法根据鲸鱼种群的预设数量进行鲸鱼种群位置初始化,得到初始种群。支持向量机分类模型的参数组合包括惩罚参数和核参数。
采用K折交叉验证法根据初始种群确定每个鲸鱼个体的适应度,记为第一适应度。记录第一适应度并更新鲸鱼种群的当前最优值。
采用遗传变异策略根据初始种群更新每个鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息。之后,还优选通过非线性收敛因子来增强鲸鱼全局更新位置的能力。本发明区别与传统鲸鱼优化算法收敛因子线性变化的特征,提出了基于以下公式的非线性收敛因子:
Figure BDA0002833866190000081
其中,a为非线性收敛因子,e为自然对数。
并在更新个体时,提出了基于以下公式的遗传变异策略:
Figure BDA0002833866190000082
式中,ω为速度惯性权重,v(t)为第t次迭代时个体的速度,r1、r2、c1、c2为个体学习因子,X*(t)为标记个体,X(t)为t次迭代时的个体描述,Xg(t)为最优个体位置。
遗传变异策略的采用使得种群能快速跳出局部最优,保持种群的多样性。
采用K折交叉验证法根据第一种群信息确定每个鲸鱼个体的适应度,记为第二适应度。
根据第一适应度和第二适应度间的关系确定最优解,并更新第一种群信息,得到第二种群信息。最优解包括鲸鱼个体的最优解和种群最优解。
以第二种群信息替代第一种群信息后,返回“采用遗传变异策略根据初始种群更新每个鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息”,直至迭代次数达到预设迭代次数时,输出鲸鱼个体的最优解,即输出参数(C,g)的最优组合。
将鲸鱼个体的最优解带入支持向量机分类模型,得到优化后的支持向量机分类模型。
优选地,上述以支持向量机分类模型的参数组合为鲸鱼个体,采用反向学习算法根据鲸鱼种群的预设数量进行鲸鱼种群位置初始化,得到初始种群,具体包括:
根据鲸鱼种群的预设数量确定初始化种群。该初始化种群为随机初始化种群,其表示为P(t=0)={xm,n},m=1,2,…,N,N=1,2,…,D。其中,N表示鲸鱼种群的预设数量,D表示可行解的维数,t表示当前迭代次数。
采用反向学习算法确定初始化种群的反向种群。反向种群为P’(t=0)={x’m,n},x’m,n=x’min,n+x’max,n+xm,n其中,xmin,n和xmax,n分别表示种群xm第n维元素的最大值和最小值。
根据初始化种群和反向种群得到组合种群。其中组合种群为{P(t=0)}U{P’(t=0)}。
确定组合种群中每一鲸鱼个体的适应度值,记为第三适应度。
按照第三适应度的值升序排列组合种群中的鲸鱼个体,得到个体序列。
在个体序列中选择与鲸鱼种群的预设数量相等的鲸鱼个体作为初始种群。
进一步,为了提高分类的准确度,获取待分类网络流量数据之后还需要对待分类网络流量数据进行初始化处理。初始化处理包括:数值化处理、归一化处理和降维处理。
下面以图2和图3所示的流程图和整体架构图为例对本发明提供的上述技术方案的具体实施过程进行细化说明。
步骤1:对待检测的网络流量数据集进行初始化处理,将初试数据字符型变量数值化,对数据进行归一化及降维操作,并将初始化后并处理好的数据分为训练集和测试集。
步骤2:设置鲸鱼种群的种群数量N、最大迭代次数MAX_T,设定支持向量机(Support Vector Machine,SVM)分类模型两个重要参数(C,g)的取值范围。
步骤3:将SVM的参数(C,g)设置为单独的鲸鱼个体,并通过反向学习算法进行种群位置初始化,基于反向学习算法的种群初始化过程具体参见上述内容。
步骤4:用K折交叉验证法计算种群中每个鲸鱼个体的适应度,记录鲸鱼个体的适应值并更新鲸鱼种群的当前最优值。
步骤5:运用遗传变异的策略来更新鲸鱼个体的位置,并通过非线性收敛因子来增强鲸鱼全局更新位置的能力。
步骤6:再次计算种群中每个鲸鱼个体的适应度,并通过适应度的比较,更新当前个体最优解以及种群最优解,并更新种群信息
步骤7:判断当前的迭代次数是否达到最大迭代次数:若达到,输出当前种群最优解作为SVM参数(C,g)最优组合。若未达到,则返回步骤5继续进行迭代。
请见图2,本发明提供的改进二进制鲸鱼优化算法结合SVM的网络流分类方法能够优化SVM的重要参数(C,g)组合。SVM的分类性能关键在于参数的设置,只有选择合适的SVM参数,才能得到最优分类模型。本发明提出的基于改进的二进制鲸鱼优化算法优化SVM的两个重要参数(惩罚参数C和核参数g),能够得到性能好的(C,g)组合,进而训练出高效的SVM模型,从而提高SVM网络流量分类的准确率和速度。
基于该分类方法,起实施模型主要包括三个模块,如图3所示,各模块描述如下:
数据预处理模块的作用是将原始的网络流量数据集进行初步的处理,然后再用于下一个算法模块的处理。其过程包括网络流量数据集的再分类(训练集和测试集)、数值化、归一化和降维处理。
算法模块的作用是通过本发明提供的改进二进制鲸鱼优化算法来获得最优的SVM参数(C,g)组合。其过程包括种群的初始化、适应度计算、种群个体更新以及对应的迭代过程。
SVM模块的作用是将应用了算法模块输出的最优参数代入到SVM模型中进行训练,并将训练好的模型用于测试集的测试,从而得出网络流量数据的分类结果。其过程包括最优参数的代入、模型的训练、测试输出结果。
本发明中改进二进制鲸鱼优化算法具有收敛快、跳出局部最优解能力强的特征,其在SVM参数优化上能很好地解决最优(C,g)的选择问题,从而能够训练出分类速度快、正确率高的SVM模型,然后应用在网络流量分类数据集上,能较快得到正确率高的分类结果。
此外,对应于上述提供的网络流量分类方法,本发明还提供了一种网络流量分类系统,如图4所示,该分类系统包括:待分类网络流量数据获取模块1、网络流量分类模型获取模块2和网络流量分类模块3。
其中,待分类网络流量数据获取模块1用于获取待分类网络流量数据。
网络流量分类模型获取模块2用于获取网络流量分类模型。网络流量分类模型为以网络流量数据为输入,以网络流量分类为输出的优化训练后的支持向量机分类模型。
网络流量分类模块3用于以待分类网络流量数据为输入,采用网络流量分类模型得到待分类网络流量数据的网络流量分类。
作为本发明的一优选实施例,上述分类系统还包括:支持向量机分类模型获取模块、支持向量机分类模型优化模块、网络流量数据样本集获取模块、初始化处理模块和支持向量机分类模型训练模块。
其中,支持向量机分类模型获取模块用于获取支持向量机分类模型。
支持向量机分类模型优化模块用于采用改进后的二进制鲸鱼优化算法对支持向量机分类模型进行优化,得到优化后的支持向量机分类模型。
网络流量数据样本集获取模块用于获取网络流量数据样本集。网络流量数据样本集包括多个训练样本对。每一训练样本对包括网络流量数据及其对应的网络流量分类。
初始化处理模块用于对网络流量数据样本集进行初始化处理。
支持向量机分类模型训练模块用于采用初始化后的网络流量数据样本集对优化后的支持向量机分类模型进行训练,得到网络流量分类模型。
作为本发明的另一优选实施例,上述支持向量机分类模型优化模块具体包括:预设值获取单元、初始种群确定单元、第一适应度确定单元、第一种群信息确定单元、第二适应度确定单元、第二种群信息确定单元、迭代单元和支持向量机分类模型优化单元。
其中,预设值获取单元用于获取鲸鱼种群的预设数量、预设迭代次数、支持向量机分类模型的参数取值范围。参数取值范围包括惩罚参数的取值范围和核参数的取值范围。
初始种群确定单元用于以支持向量机分类模型的参数组合为鲸鱼个体,采用反向学习算法根据鲸鱼种群的预设数量进行鲸鱼种群位置初始化,得到初始种群。支持向量机分类模型的参数组合包括惩罚参数和核参数。
第一适应度确定单元用于采用K折交叉验证法根据初始种群确定每个鲸鱼个体的适应度,记为第一适应度。
第一种群信息确定单元用于采用遗传变异策略根据初始种群更新每个鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息。
第二适应度确定单元用于采用K折交叉验证法根据第一种群信息确定每个鲸鱼个体的适应度,记为第二适应度。
第二种群信息确定单元用于根据第一适应度和第二适应度间的关系确定最优解,并更新第一种群信息,得到第二种群信息。最优解包括鲸鱼个体的最优解和种群最优解。
迭代单元用于以第二种群信息替代第一种群信息后,返回“采用遗传变异策略根据初始种群更新每个鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息”,直至迭代次数达到预设迭代次数时,输出鲸鱼个体的最优解。
支持向量机分类模型优化单元用于将鲸鱼个体的最优解带入支持向量机分类模型,得到优化后的支持向量机分类模型。
作为本发明的又一优选实施例,上述初始种群确定单元具体包括:初始化种群确定子单元、反向种群确定子单元、组合种群确定子单元、第三适应度确定子单元、个体序列确定子单元和初始种群确定子单元。
其中,初始化种群确定子单元用于根据鲸鱼种群的预设数量确定初始化种群。
反向种群确定子单元用于采用反向学习算法确定初始化种群的反向种群。
组合种群确定子单元用于根据初始化种群和反向种群得到组合种群。
第三适应度确定子单元用于确定组合种群中每一鲸鱼个体的适应度值,记为第三适应度。
个体序列确定子单元用于按照第三适应度的值升序排列组合种群中的鲸鱼个体,得到个体序列。
初始种群确定子单元用于在个体序列中选择与鲸鱼种群的预设数量相等的鲸鱼个体作为初始种群。
综上,本发明提供的网络流量分类方法和系统相较于现有技术具有以下优点:
1、本发明在初始化种群时,采用了基于反向学习算法的种群初始化机制,从而降低了初始种群分布的随机性。
2、本发明在种群更新过程中融合了遗传变异机制,在相对稳定的前提下,保证了种群的多样性,并采用非线性收敛因子来改善鲸鱼在更新位置时的全局搜索能力,避免陷入局部最优解。
3、本发明采用改进的二进制鲸鱼优化算法对支持向量机模型(SVM)的重要参数组合(C,g)进行优化,能高效地得到最优参数组合(C,g),并将得到的最优参数组合(C,g)代入到SVM模型后,采用训练集进行训练建模,最后采用训练好的模型来对测试集进行测试,从而快速高效地得到更高准确率的网络流量分类结果。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种网络流量分类方法,其特征在于,包括:
获取待分类网络流量数据;
获取网络流量分类模型;所述网络流量分类模型为以网络流量数据为输入,以网络流量分类为输出的优化训练后的支持向量机分类模型;
以所述待分类网络流量数据为输入,采用所述网络流量分类模型得到所述待分类网络流量数据的网络流量分类。
2.根据权利要求1所述的网络流量分类方法,其特征在于,所述获取网络流量分类模型,之前还包括:
获取支持向量机分类模型;
采用改进后的二进制鲸鱼优化算法对所述支持向量机分类模型进行优化,得到优化后的支持向量机分类模型;
获取网络流量数据样本集;所述网络流量数据样本集包括多个训练样本对;每一所述训练样本对包括网络流量数据及其对应的网络流量分类;
对所述网络流量数据样本集进行初始化处理;
采用初始化后的所述网络流量数据样本集对所述优化后的支持向量机分类模型进行训练,得到所述网络流量分类模型。
3.根据权利要求2所述的网络流量分类方法,其特征在于,所述采用改进后的二进制鲸鱼优化算法对所述支持向量机分类模型进行优化,得到优化后的支持向量机分类模型,具体包括:
获取鲸鱼种群的预设数量、预设迭代次数、支持向量机分类模型的参数取值范围;所述参数取值范围包括惩罚参数的取值范围和核参数的取值范围;
以支持向量机分类模型的参数组合为鲸鱼个体,采用反向学习算法根据所述鲸鱼种群的预设数量进行鲸鱼种群位置初始化,得到初始种群;所述支持向量机分类模型的参数组合包括惩罚参数和核参数;
采用K折交叉验证法根据所述初始种群确定每个所述鲸鱼个体的适应度,记为第一适应度;
采用遗传变异策略根据所述初始种群更新每个所述鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息;
采用K折交叉验证法根据所述第一种群信息确定每个所述鲸鱼个体的适应度,记为第二适应度;
根据所述第一适应度和所述第二适应度间的关系确定最优解,并更新所述第一种群信息,得到第二种群信息;所述最优解包括鲸鱼个体的最优解和种群最优解;
以所述第二种群信息替代所述第一种群信息后,返回“采用遗传变异策略根据所述初始种群更新每个所述鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息”,直至迭代次数达到所述预设迭代次数时,输出所述鲸鱼个体的最优解;
将所述鲸鱼个体的最优解带入所述支持向量机分类模型,得到优化后的支持向量机分类模型。
4.根据权利要求3所述的网络流量分类方法,其特征在于,所述以支持向量机分类模型的参数组合为鲸鱼个体,采用反向学习算法根据所述鲸鱼种群的预设数量进行鲸鱼种群位置初始化,得到初始种群,具体包括:
根据所述鲸鱼种群的预设数量确定初始化种群;
采用反向学习算法确定所述初始化种群的反向种群;
根据所述初始化种群和所述反向种群得到组合种群;
确定所述组合种群中每一鲸鱼个体的适应度值,记为第三适应度;
按照所述第三适应度的值升序排列所述组合种群中的鲸鱼个体,得到个体序列;
在所述个体序列中选择与所述鲸鱼种群的预设数量相等的鲸鱼个体作为初始种群。
5.根据权利要求1所述的网络流量分类方法,其特征在于,所述获取待分类网络流量数据,之后还包括:
对所述待分类网络流量数据进行初始化处理;所述初始化处理包括:数值化处理、归一化处理和降维处理。
6.一种网络流量分类系统,其特征在于,包括:
待分类网络流量数据获取模块,用于获取待分类网络流量数据;
网络流量分类模型获取模块,用于获取网络流量分类模型;所述网络流量分类模型为以网络流量数据为输入,以网络流量分类为输出的优化训练后的支持向量机分类模型;
网络流量分类模块,用于以所述待分类网络流量数据为输入,采用所述网络流量分类模型得到所述待分类网络流量数据的网络流量分类。
7.根据权利要求6所述的网络流量分类系统,其特征在于,还包括:
支持向量机分类模型获取模块,用于获取支持向量机分类模型;
支持向量机分类模型优化模块,用于采用改进后的二进制鲸鱼优化算法对所述支持向量机分类模型进行优化,得到优化后的支持向量机分类模型;
网络流量数据样本集获取模块,用于获取网络流量数据样本集;所述网络流量数据样本集包括多个训练样本对;每一所述训练样本对包括网络流量数据及其对应的网络流量分类;
初始化处理模块,用于对所述网络流量数据样本集进行初始化处理;
支持向量机分类模型训练模块,用于采用初始化后的所述网络流量数据样本集对所述优化后的支持向量机分类模型进行训练,得到所述网络流量分类模型。
8.根据权利要求7所述的网络流量分类系统,其特征在于,所述支持向量机分类模型优化模块具体包括:
预设值获取单元,用于获取鲸鱼种群的预设数量、预设迭代次数、支持向量机分类模型的参数取值范围;所述参数取值范围包括惩罚参数的取值范围和核参数的取值范围;
初始种群确定单元,用于以支持向量机分类模型的参数组合为鲸鱼个体,采用反向学习算法根据所述鲸鱼种群的预设数量进行鲸鱼种群位置初始化,得到初始种群;所述支持向量机分类模型的参数组合包括惩罚参数和核参数;
第一适应度确定单元,用于采用K折交叉验证法根据所述初始种群确定每个所述鲸鱼个体的适应度,记为第一适应度;
第一种群信息确定单元,用于采用遗传变异策略根据所述初始种群更新每个所述鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息;
第二适应度确定单元,用于采用K折交叉验证法根据所述第一种群信息确定每个所述鲸鱼个体的适应度,记为第二适应度;
第二种群信息确定单元,用于根据所述第一适应度和所述第二适应度间的关系确定最优解,并更新所述第一种群信息,得到第二种群信息;所述最优解包括鲸鱼个体的最优解和种群最优解;
迭代单元,用于以所述第二种群信息替代所述第一种群信息后,返回“采用遗传变异策略根据所述初始种群更新每个所述鲸鱼个体的位置,得到更新后的种群信息,记为第一种群信息”,直至迭代次数达到所述预设迭代次数时,输出所述鲸鱼个体的最优解;
支持向量机分类模型优化单元,用于将所述鲸鱼个体的最优解带入所述支持向量机分类模型,得到优化后的支持向量机分类模型。
9.根据权利要求8所述的网络流量分类系统,其特征在于,所述初始种群确定单元具体包括:
初始化种群确定子单元,用于根据所述鲸鱼种群的预设数量确定初始化种群;
反向种群确定子单元,用于采用反向学习算法确定所述初始化种群的反向种群;
组合种群确定子单元,用于根据所述初始化种群和所述反向种群得到组合种群;
第三适应度确定子单元,用于确定所述组合种群中每一鲸鱼个体的适应度值,记为第三适应度;
个体序列确定子单元,用于按照所述第三适应度的值升序排列所述组合种群中的鲸鱼个体,得到个体序列;
初始种群确定子单元,用于在所述个体序列中选择与所述鲸鱼种群的预设数量相等的鲸鱼个体作为初始种群。
CN202011471373.9A 2020-12-14 2020-12-14 一种网络流量分类方法和系统 Pending CN112598036A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011471373.9A CN112598036A (zh) 2020-12-14 2020-12-14 一种网络流量分类方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011471373.9A CN112598036A (zh) 2020-12-14 2020-12-14 一种网络流量分类方法和系统

Publications (1)

Publication Number Publication Date
CN112598036A true CN112598036A (zh) 2021-04-02

Family

ID=75195332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011471373.9A Pending CN112598036A (zh) 2020-12-14 2020-12-14 一种网络流量分类方法和系统

Country Status (1)

Country Link
CN (1) CN112598036A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140085329A1 (en) * 2012-09-24 2014-03-27 International Business Machines Corporation Social Media Event Detection and Content-Based Retrieval
CN104966106A (zh) * 2015-07-13 2015-10-07 哈尔滨工业大学 一种基于支持向量机的生物年龄分步预测方法
CN106897703A (zh) * 2017-02-27 2017-06-27 辽宁工程技术大学 基于aga‑pkf‑svm的遥感影像分类方法
CN109101738A (zh) * 2018-08-24 2018-12-28 河北工业大学 一种igbt模块老化程度评估方法
CN110082136A (zh) * 2019-04-19 2019-08-02 电子科技大学 基于云遗传算法优化支持向量机的旋转机械故障诊断方法
CN110147611A (zh) * 2019-05-20 2019-08-20 福州大学 一种基于iwoa的结构损伤识别方法
CN110363214A (zh) * 2019-05-31 2019-10-22 浙江工业大学 一种基于gwa-svm的机器人装配的接触状态识别方法
CN110378490A (zh) * 2019-07-24 2019-10-25 江苏壹度科技股份有限公司 基于改进鲸鱼算法优化支持向量机的半导体良率预测方法
CN110766237A (zh) * 2019-10-31 2020-02-07 内蒙古工业大学 基于spgapso-svm算法的公交客流量预测方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140085329A1 (en) * 2012-09-24 2014-03-27 International Business Machines Corporation Social Media Event Detection and Content-Based Retrieval
CN104966106A (zh) * 2015-07-13 2015-10-07 哈尔滨工业大学 一种基于支持向量机的生物年龄分步预测方法
CN106897703A (zh) * 2017-02-27 2017-06-27 辽宁工程技术大学 基于aga‑pkf‑svm的遥感影像分类方法
CN109101738A (zh) * 2018-08-24 2018-12-28 河北工业大学 一种igbt模块老化程度评估方法
CN110082136A (zh) * 2019-04-19 2019-08-02 电子科技大学 基于云遗传算法优化支持向量机的旋转机械故障诊断方法
CN110147611A (zh) * 2019-05-20 2019-08-20 福州大学 一种基于iwoa的结构损伤识别方法
CN110363214A (zh) * 2019-05-31 2019-10-22 浙江工业大学 一种基于gwa-svm的机器人装配的接触状态识别方法
CN110378490A (zh) * 2019-07-24 2019-10-25 江苏壹度科技股份有限公司 基于改进鲸鱼算法优化支持向量机的半导体良率预测方法
CN110766237A (zh) * 2019-10-31 2020-02-07 内蒙古工业大学 基于spgapso-svm算法的公交客流量预测方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ALA’ M.AL-ZOUBI, ET AL: "Evolving Support Vector Machines using Whale Optimization Algorithm for spam profiles detection on online social networks in different lingual contexts", 《KNOWLEDGE-BASED SYSTEMS》 *
HUI XU: "An Improved Binary Whale Optimization Algorithm for Feature Selection of Network Intrusion Detection", 《2018 IEEE 4TH INTERNATIONAL SYMPOSIUM ON WIRELESS SYSTEMS WITHIN THE INTERNATIONAL CONFERENCES ON INTELLIGENT DATA ACQUISITION AND ADVANCED COMPUTING SYSTEMS (IDAACS-SWS)》 *
QUOC-VIET PHAM: "Whale Optimization Algorithm With Applications to Resource Allocation in Wireless Networks", 《IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY》 *
朱悦;吴建华;方颖;: "SVM在冠心病分类预测中的应用研究", 生物医学工程学杂志 *

Similar Documents

Publication Publication Date Title
Imani et al. Bric: Locality-based encoding for energy-efficient brain-inspired hyperdimensional computing
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN109284406B (zh) 基于差异循环神经网络的意图识别方法
KR20190117713A (ko) 신경망 아키텍처 최적화
CN112800292B (zh) 一种基于模态特定和共享特征学习的跨模态检索方法
CN111177569A (zh) 基于人工智能的推荐处理方法、装置及设备
CN110232373A (zh) 人脸聚类方法、装置、设备和存储介质
CN111241287A (zh) 用于生成对抗文本的生成模型的训练方法及装置
CN111126488A (zh) 一种基于双重注意力的图像识别方法
WO2021042857A1 (zh) 图像分割模型的处理方法和处理装置
CN110909230A (zh) 一种网络热点分析方法及系统
CN113409157B (zh) 一种跨社交网络用户对齐方法以及装置
CN115130536A (zh) 特征提取模型的训练方法、数据处理方法、装置及设备
CN111667018B (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备
CN109902273A (zh) 关键词生成模型的建模方法和装置
CN112364198A (zh) 一种跨模态哈希检索方法、终端设备及存储介质
CN114332550A (zh) 一种模型训练方法、系统及存储介质和终端设备
CN111259975B (zh) 分类器的生成方法及装置、文本的分类方法及装置
WO2020252925A1 (zh) 用户特征群中用户特征寻优方法、装置、电子设备及计算机非易失性可读存储介质
CN112598036A (zh) 一种网络流量分类方法和系统
WO2020075462A1 (ja) 学習器推定装置、学習器推定方法、リスク評価装置、リスク評価方法、プログラム
Chen et al. Hierarchical sequence representation with graph network
CN112132367A (zh) 一种用于企业经营管理风险识别的建模方法及装置
CN113254597B (zh) 模型训练方法、查询处理方法及相关设备
CN109359462A (zh) 虚假设备识别方法、设备、存储介质及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210402

RJ01 Rejection of invention patent application after publication