CN116805926B - 网络业务类型识别模型训练方法、网络业务类型识别方法 - Google Patents
网络业务类型识别模型训练方法、网络业务类型识别方法 Download PDFInfo
- Publication number
- CN116805926B CN116805926B CN202311048160.9A CN202311048160A CN116805926B CN 116805926 B CN116805926 B CN 116805926B CN 202311048160 A CN202311048160 A CN 202311048160A CN 116805926 B CN116805926 B CN 116805926B
- Authority
- CN
- China
- Prior art keywords
- service
- feature set
- network service
- network
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 238000012549 training Methods 0.000 title claims abstract description 63
- 238000012545 processing Methods 0.000 claims abstract description 70
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 67
- 230000009467 reduction Effects 0.000 claims abstract description 49
- 230000006870 function Effects 0.000 claims description 36
- 238000011156 evaluation Methods 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 18
- 238000010219 correlation analysis Methods 0.000 claims description 12
- 238000005520 cutting process Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 241000287196 Asthenes Species 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 13
- 238000012360 testing method Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 3
- 238000011946 reduction process Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/40—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/06—Testing, supervising or monitoring using simulated traffic
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种网络业务类型识别模型训练方法、网络业务类型识别方法。该方法包括:获取网络业务数据样本,所述网络业务数据样本包括所述网络业务数据的类型;从所述网络业务数据样本中提取所述网络业务数据样本的初始业务特征集合;确定所述初始业务特征集合是否需要进行特征降维处理,所述特征降维处理用于去除所述初始业务特征集合中的冗余特征;若需要进行所述特征降维处理,则获取所述初始业务特征集合特征降维处理后的目标业务特征集合;将所述目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型。本申请的方法,提高了网络业务类型识别模型的识别准确率。
Description
技术领域
本申请涉及通信网络技术领域,尤其涉及一种网络业务类型识别模型训练方法、网络业务类型识别方法。
背景技术
随着移动通信网络的广泛应用,5G/6G技术的飞速发展使得各类网络业务趋于复杂化和多样化,但大规模网络业务的涌现也带来了网络带宽资源利用率低,网络性能不稳定等严重影响用户体验的问题,利用先进技术实现复杂网络业务的动态管理、分配和调度,具有重要意义。对于不同网络下的大规模业务流量,基于软件定义网络(Software DefinedNetwork,SDN)架构对不同业务类型进行精准识别,有利于网络带宽资源的合理分配,实时感知和评估网络性能,满足用户对服务质量(Quality of Service,QoS)的切实需求。
然而,目前在SDN架构下存在识别网络业务数据的业务类型的准确率较低的问题。
发明内容
本申请提供一种网络业务类型识别模型训练方法、网络业务类型识别方法,用以解决现有技术中SDN架构下存在识别网络业务数据的业务类型的准确率较低的问题。
第一方面,本申请提供一种网络业务类型识别模型训练方法,包括:
获取网络业务数据样本,所述网络业务数据样本包括所述网络业务数据的类型;
从所述网络业务数据样本中提取所述网络业务数据样本的初始业务特征集合;
确定所述初始业务特征集合是否需要进行特征降维处理,所述特征降维处理用于去除所述初始业务特征集合中的冗余特征;
若需要进行所述特征降维处理,则获取所述初始业务特征集合特征降维处理后的目标业务特征集合;
将所述目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型。
可选地,所述确定所述初始业务特征集合是否需要进行特征降维处理,包括:
根据斯皮尔曼等级相关性分析算法,确定所述初始业务特征集合中的第一业务特征与业务类型的相关性;
若与所述第一业务特征存在相关性的所述业务类型的数量小于或等于预设阈值,则需要对所述初始业务特征集合中进行特征降维处理;
若与所述第一业务特征存在相关性的所述业务类型的数量大于所述预设阈值,则不需要对所述初始业务特征集合中进行特征降维处理。
可选地,所述获取所述初始业务特征集合特征降维处理后的目标业务特征集合,包括:
从所述初始业务特征集合获取第一业务特征集合,所述第一特征集合中的业务特征数量小于或等于所述初始业务特征集合中的特征数量;
获取所述第一业务特征集合的第一评价函数,以及,第二业务特征集合的第二评价函数,所述第二业务特征集合中为所述第一业务特征集合的子集,且所述第二业务特征集合中的业务特征数量比所述第一业务特征集合中的业务特征数量少1;
确定与所述第一评价函数的函数值差异最小的第二评价函数对应的目标第二业务特征集合;
将所述目标第二业务特征集合作为新的第一业务特征集合,并迭代上述步骤至所述第一业务特征集合中的业务特征数量小于或等于预设数量,生成所述目标业务特征集合。
可选地,在所述将所述目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型之前,还包括:
根据误差关联算子,确定所述Adaboost算法中的冗余弱分类器;
去除所述Adaboost算法中的冗余弱分类器,获取所述基于误差关联算子改进的Adaboost算法。
可选地,所述从所述网络业务数据样本中提取所述网络业务数据样本的初始业务特征集合,包括:
获取所述网络业务数据样本的采集时间;
根据所述采集时间,将所述网络业务数据样本切割为至少两个时间连续的数据包集合;
从所述数据包集合包括的数据包中提取每个数据包的初始业务特征;
根据所述初始业务特征,生成所述网络业务数据样本的初始业务特征集合。
可选地,在根据所述采集时间,将所述网络业务数据样本切割为至少两个时间连续的数据包集合之前,还包括:
对所述网络业务数据样本进行数据清洗操作。
第二方面,本申请提供一种网络业务类型识别方法,应用于SDN控制平面,包括:
获取网络业务数据;
将所述网络业务数据输入至网络业务类型识别模型中,获得所述网络业务数据的业务类型;所述网络业务类型识别模型为权利要求1-6中任一项所述的网络业务类型识别模型;
根据所述业务类型,对网络资源进行管理。
第三方面,本申请提供一种网络业务类型识别模型装置,包括:
获取模块,用于获取网络业务数据样本,所述网络业务数据样本包括所述网络业务数据的类型;
处理模块,用于从所述网络业务数据样本中提取所述网络业务数据样本的初始业务特征集合;确定所述初始业务特征集合是否需要进行特征降维处理,所述特征降维处理用于去除所述初始业务特征集合中的冗余特征;若需要进行所述特征降维处理,则获取所述初始业务特征集合特征降维处理后的目标业务特征集合;
训练模块,用于将所述目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型。
第四方面,本申请提供一种电子设备,包括:处理器、通信接口,以及存储器;所述处理器分别与所述通信接口和所述存储器通信连接;
所述存储器存储计算机执行指令;
所述通信接口与外部设备进行通信交互;
所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面或第二方面中任一项所述的方法。
第五方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面或第二方面中任一项所述的方法。
第六方面,本申请提供一种计算机程序产品,所述计算机程序产品被处理器执行时用于实现如第一方面或第二方面中任一项所述的方法。
本申请提供的网络业务类型识别模型训练方法、网络业务类型识别方法,通过网络业务数据样本的业务特征进行冗余特征识别,通过特征降维处理去除网络业务数据样本中的冗余特征,并通过基于误差关联算子改进的Adaboost算法训练,获得网络业务类型识别模型。该方法通过去除冗余特征,以及,基于误差关联算子改进的Adaboost算法,降低了网络业务数据样本中冗余特征对网络业务类型识别模型训练过程的影响,从而提高了网络业务类型识别模型的识别准确率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的一种网络业务类型识别模型的训练方法的流程示意图;
图2为本申请实施例提供的另一种网络业务类型识别模型的训练方法的流程示意图;
图3为本申请实施例提供的又一种网络业务类型识别模型的训练方法的流程示意图;
图4为本申请实施例提供的再一种网络业务类型识别模型的训练方法的流程示意图;
图5为本申请实施例提供的再一种网络业务类型识别模型的训练方法的流程示意图;
图6为本申请实施例提供的一种SDN架构的业务类型识别过程的结构示意图;
图7为本申请实施例提供的一种网络业务类型识别方法的流程示意图;
图8为本申请实施例提供的一种网络业务类型识别模型的训练装置的结构示意图;
图9为本申请实施例提供的一种电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
为了便于理解,首先对本申请涉及的专业术语进行解释。
Adaboost算法:指一种集成学习算法,其原理是通过迭代训练多个弱分类器并将它们组合成强分类器以提高分类精度,具体来说,在每轮迭代中提高那些被上一轮迭代训练的弱分类器错误分类样本的权重,而降低那些被正确分类的样本权重,使没有被正确分类的样本在新一轮迭代训练中受到更大的关注,最终各个弱分类器以投票的方式决定分类结果,其中误差率小的弱分类器在投票中有较大的话语权,反之,误差率大的弱分类器在投票中只有较小的话语权。
传统的网络业务类型的识别方法包括基于端口的网络业务识别、基于深度包检测技术(Deep packet inspection,DPI)的网络业务识别、基于OpenFlow协议的网络业务识别和基于行为模式的网络业务识别等。上述方法普遍存在识别过程繁琐、耗时长,识别准确度低,可扩展性差等问题。
为了克服上述问题,目前,常使用机器学习的方法,构建网络业务分类器,通过训练好的网络业务分类器对获取的网络业务进行网络业务类型识别,能够不间断快速识别网络业务的类型,以缩短识别耗时、增强识别准确性。然而,目前构建网络业务分类器的机器学习方法,在应用于大规模的复杂网络业务的网络业务类型识别时,容易受到相关性较差的业务特征的干扰,从而导致存在识别准确率较低的问题。
有鉴于此,本申请提供了一种网络业务类型识别模型的训练方法,通过对网络业务数据样本的业务特征进行冗余特征识别,通过特征降维处理去除网络业务数据样本中的冗余特征,并通过基于误差关联算子改进的Adaboost算法训练,获得网络业务类型识别模型。该方法通过去除冗余特征,以及,基于误差关联算子改进的Adaboost算法,降低了网络业务数据样本中冗余特征对网络业务类型识别模型训练过程的影响,从而提高了网络业务类型识别模型的识别准确率。
本申请提供的网络业务类型识别模型的训练方法的执行主体可以是具备数据处理功能的终端设备,或者是该终端设备的处理芯片,还可以是实现该网络业务类型识别模型的训练方法的软件或程序代码。当执行主体为具备数据处理功能的终端设备时,该终端设备例如可以是具备计算功能的电脑、手机等计算设备,该计算设备上可以部署有运行该网络业务类型识别模型的训练方法的软件或程序代码,通过该软件或程序代码对网络业务类型识别模型进行训练。该方法的执行主体还可以是具备数据处理功能云平台,当执行主体为云平台时,可以在云端执行该方法中对网络业务类型识别模型的训练,该云平台可以根据实际需求在逻辑上分成多个部分,每个部分具有不同的功能。数据处理平台中的各部分可以分别部署在电子设备(位于用户侧)、边缘环境和云环境中的任意两个或三个中。边缘环境为包括距离电子设备较近的边缘电子设备集合的环境,边缘电子设备包括:边缘服务器、拥有计算力的边缘小站等。部署在不同环境或设备的数据处理平台的各个部分协同实现数据处理平台的功能。应理解,本申请不对数据处理平台的哪些部分部署具体部署在什么环境进行限制性的划分,实际应用时可根据电子设备的计算能力、边缘环境和云环境的资源占有情况或具体应用需求进行适应性的部署。
下面以执行主体为实现该方法的终端设备为例,通过具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1为本申请实施例提供的一种网络业务类型识别模型的训练方法的流程示意图。如图1所示,该方法可以包括:
S101、获取网络业务数据样本。
其中,该网络业务数据样本包括该网络业务数据的类型。该网络业务数据的类型例如可以包括网页浏览、电子邮件、文字聊天、音频传输、视频传输、文件传输、语音聊天、点对点(peer-to-peer,P2P)等类型。该网络业务数据的类型可以是从该网络业务数据样本中包含的业务类型标记获取的。
该网络业务数据样本可以是该终端设备从网络中的网络业务数据传输过程中采集的,也可以是从预设的网络业务数据数据库中获取的,本申请对于该网络业务数据样本的采集方式不作限制,可以是现有的任一种网络业务数据样本采集方式。
S102、从网络业务数据样本中提取该网络业务数据样本的初始业务特征集合。
该初始业务特征集合中包括的业务特征可以包括该网络业务数据样本的数据包中的特征,还可以包括根据该数据包中的特征解析获得的隐含特征。
该数据包中的特征例如可以包括该网络业务数据样本的采集时间、该数据包的长度、该网络数据样本使用的传输协议、该网络数据样本的源端口号和/或目的端口号、该网络数据样本的源网际互连协议(Internet Protocol,IP)地址和/或目的IP地址等。该隐含特征例如可以包括流数据包转发速率、流比特速率、数据包到达时间间隔、数据包最大到达时间间隔、数据包最小到达时间间隔等。
其中,该网络业务数据样本的数据包中的特征可以直接从该数据包中包括的信息中提取。该隐含特征可以基于该数据包中的特征进行计算获取。或者,该初始业务特征集合中的业务特征(包括数据包中的特征和隐含特征)可以通过特征提取算法处理该网络业务数据样本获取,该特征提取算法例如可以是用于特征提取的神经网络模型等。
S103、确定初始业务特征集合是否需要进行特征降维处理。
其中,该特征降维处理用于去除该初始业务特征集合中的冗余特征。该冗余特征可以为与该网络业务数据样本的业务类别相关性低于预设阈值的业务特征,也可以为与其他业务特征相关性低于预设阈值的业务特征。
当该冗余特征为与该网络业务数据样本的业务类别相关性低于预设阈值的业务特征时,该冗余特征的判定取决于该网络业务数据样本的业务类别,不同的业务类别对应的冗余特征可以是相同的,也可以是不同的,需要根据实际需求进行判断。
当该冗余特征为与其他业务特征相关性低于预设阈值的业务特征时,可以通过判断每个业务特征与其他业务特征之间的相关性确定。通过相关性分析的算法,获取每个业务特征与其他业务特征之间的相关性。一种可能的实现方式,若存在业务特征与其他任意一个业务特征之间的相关性低于预设相关性阈值时,可以将该业务特征作为冗余特征;另一种可能的实现方式,若存在业务特征与其他业务特征之间的相关性低于预设相关性阈值的数量大于或等于预设阈值时,可以将该业务特征作为冗余特征。
S104、若需要进行特征降维处理,则获取初始业务特征集合特征降维处理后的目标业务特征集合。
一种可能的实现方式,通过基于样本的学习算法(Instance-Based Learning。IBL)或者基于聚类的学习算法进行降维处理,从而去除该初始业务特征集合中的冗余特征。该基于样本的学习算法例如可以包括稠密最近邻算法(condensed nearest neighbor,CNN)等;该基于聚类的学习算法例如可以包括k-means聚类算法,模糊c-means聚类算法等。
另一种可能的实现方式,通过特征选择的算法,选择并剔除该初始业务特征集合中的冗余特征,以获得提高业务类型识别精准度的目标业务特征集合。该特征选择的算法例如可以是定向搜索(Beam Search)、序列向前选择(Sequential Forward Selection,SFS)、序列向后选择(Sequential Backward Selection,SBS)等。
S105、将目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型。
将目标业务特征集合划分为训练集和测试集,并将该训练集输入至基于误差关联算子改进的Adaboost算法中进行训练,通过该测试集对该训练后的基于误差关联算子改进的Adaboost算法进行测试,已验证该基于误差关联算子改进的Adaboost算法的业务类型识别效果。当测试结果通过时,将该基于误差关联算子改进的Adaboost算法作为训练后的网络业务类型识别模型。
本申请提供的网络业务类型识别模型的训练方法,通过对网络业务数据样本的业务特征进行冗余特征识别,通过特征降维处理去除网络业务数据样本中的冗余特征,并通过基于误差关联算子改进的Adaboost算法训练,获得网络业务类型识别模型。该方法通过去除冗余特征,以及,基于误差关联算子改进的Adaboost算法,降低了网络业务数据样本中冗余特征对网络业务类型识别模型训练过程的影响,从而提高了网络业务类型识别模型的识别准确率。
下面,对于前述步骤S103中如何确定所述初始业务特征集合是否需要进行特征降维处理进行详细介绍。
图2为本申请实施例提供的另一种网络业务类型识别模型的训练方法的流程示意图。如图2所示,前述步骤S103可以包括:
S201、根据斯皮尔曼等级相关性分析算法,确定初始业务特征集合中的第一业务特征与第二业务特征的相关性。
其中,该第一业务特征为该初始业务特征集合中的任意一个特征,该第二业务特征为该初始业务特征集合中与该第一业务特征不同的任意一个特征。
由于斯皮尔曼等级相关性分析算法只可以处理数字变量,而部分业务特征为文本形式,故首先对于初始业务特征集合中的业务特征进行one-hot编码,将这些业务特征转化为斯皮尔曼等级相关性分析算法能够处理的数字变量形式。
将该第一业务特征作为第一变量、该第二业务特征作为第二变量,并对该第一业务特征和该第二业务特征进行秩变换,获得该第一业务特征和该第二业务特征的秩次。通过该第一业务特征的秩次和该第二业务特征的秩次,获得斯皮尔曼等级相关系数。根据该斯皮尔曼等级相关系数,利用假设检验的方式计算该假设检验的统计量和自由度。根据该统计量和自由度,以及,统计量界值表,确定该假设检验的概率值。根据该概率值和预设的假设检验水准,确定该第一业务特征与第二业务特征的相关性。
S202、若与第一业务特征存在相关性的第二业务特征的数量小于或等于预设阈值,则需要对该初始业务特征集合中进行特征降维处理。
其中,该预设阈值可以是根据实际需求设定的,例如可以小于该业务特征数量减一的任意数量。若与第一业务特征存在相关性的第二业务特征的数量小于或等于预设阈值,表征该第一业务特征与其他业务特征的相关性较低,属于业务类型识别时的冗余特征,会影响到业务特征识别的准确性和效率,需要对该初始业务特征集合中进行前述步骤S104中的特征降维处理。
若与第一业务特征存在相关性的所述第二业务特征的数量大于预设阈值,则不需要对该初始业务特征集合中进行特征降维处理。若与第一业务特征存在相关性的第二业务特征的数量大于预设阈值,表征该第一业务特征与其他业务特征的相关性较高,不属于业务类型识别时的冗余特征,是实现高准确性的业务特征识别所需的必要业务特征。
对于前述步骤S103中如何确定所述初始业务特征集合是否需要进行特征降维处理,一种可能的实现方式,还可以通过设置用于判断该第一业务特征是否为强相关性特征的第一预设阈值,该第一预设阈值大于图2涉及的方法中所说的预设阈值。
若与第一业务特征存在相关性的第二业务特征的数量大于该第一预设阈值时,表征与该第一业务特征相关度较高的第二业务特征的数量较大,则该第一业务特征为强相关性业务特征,必须保留该特征用于后续的业务类型识别的训练。
若与第一业务特征存在相关性的第二业务特征的数量大于该预设阈值且小于该第一预设阈值时,表征与该第一业务特征相关度较高的第二业务特征的数量不多也不少,则该第一业务特征为相关性一般的业务特征,可以根据实际需求选择是否保留该特征用于后续的业务类型识别的训练。
可选的,在另一种可能的实现方式中,还可以根据斯皮尔曼等级相关性分析算法,确定初始业务特征集合中的第一业务特征与业务类型的相关性,根据该相关性确定该初始业务特征集合是否需要进行特征降维处理。
其中,该第一业务特征为该初始业务特征集合中的任意一个特征,该业务类型为该初始业务特征集合中包括的所有业务类型,例如可以是前述所说的网页浏览、电子邮件、文字聊天、音频传输、视频传输、文件传输、语音聊天、P2P等类型。
对于初始业务特征集合中的由文本表征的业务类型进行one-hot编码,将这些业务类型转化为斯皮尔曼等级相关性分析算法能够处理的数字变量形式。将该第一业务特征作为第一变量、每个业务类型作为第二变量,并分别对第一变量和多个第二变量按照顺序进行排序后执行秩变换,该排序顺序例如可以是按照从小到大的顺序进行排序。
根据秩变换的执行结果,获得该第一变量和每个第二变量的秩次。通过该第一业务特征的秩次和该业务类型的秩次,获得斯皮尔曼等级相关系数。根据该斯皮尔曼等级相关系数,利用假设检验的方式计算该假设检验的统计量和自由度。根据该统计量和自由度,以及,统计量界值表,确定该假设检验的概率值。根据该概率值和预设的假设检验水准,确定该第一业务特征与业务类型的相关性。
在该实现方式下,若与第一业务特征存在相关性的业务类型的数量小于或等于预设阈值,则需要对该初始业务特征集合中进行特征降维处理;若与第一业务特征存在相关性的业务类型的数量大于预设阈值,则不需要对该初始业务特征集合中进行特征降维处理。
本申请实施例提供的方法,通过斯皮尔曼等级相关性分析算法,确定初始业务特征集合中的第一业务特征与业务类型的相关性,并根据该相关性确定该第一业务特征是否为冗余特征。相较于其他相关性分析,利用该斯皮尔曼等级相关性分析算法,能够进一步提高确定冗余特征的准确性。
下面,以SBS方法为例,对于具体如何获取初始业务特征集合特征降维处理后的目标业务特征集合进行详细说明。
图3为本申请实施例提供的又一种网络业务类型识别模型的训练方法的流程示意图。如图3所示,该方法可以包括:
S301、从初始业务特征集合获取第一业务特征集合。
其中,该第一特征集合中的业务特征数量小于或等于该初始业务特征集合中的特征数量。
根据该初始业务特征集合中业务特征的相关性,对这些业务特征进行排序,在该实现方式下,将这些业务特征按照相关性从高到低的顺序进行排列。可以根据实际需求确定需要保留的相关性较高的业务特征的数量,并根据该数量对应的相关性较高的业务特征生成该第一业务特征集合,从而预先剔除一部分相关性较低的业务特征,以提升降维处理的效率。
S302、获取所述第一业务特征集合的第一评价函数,以及,第二业务特征集合的第二评价函数。
其中,该第二业务特征集合为该第一业务特征集合的子集,且该第二业务特征集合中的业务特征数量比该第一业务特征集合中的业务特征数量少1,即该第二业务特征集合可以看作该第一业务特征集合中去除一个业务特征后生成的集合。
该第一评价函数可以根据该第一业务特征集合中包括的业务特征确定,该第二评价函数可以根据该第二业务特征集合中包括的业务特征确定。该评价函数例如可以是标准性能评估函数,该评价函数的生成方式可以参照现有技术,本申请对此不再赘述。
S303、确定与第一评价函数的函数值差异最小的第二评价函数对应的目标第二业务特征集合,以及,目标第二业务特征集合与第一业务特征集合的目标差异特征。
其中,该第一评价函数的函数值与该第二评价函数的函数值的差异最小表征该第二业务特征集合与该第一业务特征集合的效用最接近,即可以使用该业务特征数量更少的第二业务特征集合代替该第一业务特征集合,从而实现减少了业务特征的功能。
S304、将目标第二业务特征集合作为新的第一业务特征集合,并迭代上述步骤至第一业务特征集合中的业务特征数量小于或等于预设数量,并生成目标业务特征集合。
将目标第二业务特征集合作为新的第一业务特征集合,即新的第一业务特征集合与该目标第二业务特征集合相同,比原第一业务特征集合中缺少一个业务特征,该缺少的业务特征为目标第二业务特征集合与原第一业务特征集合之间的差异业务特征。
在将目标第二业务特征集合作为新的第一业务特征集合后,迭代上述步骤S302-S303,从而逐渐减少第一业务特征集合中的业务特征数量,直至第一业务特征集合中的业务特征数量小于或等于预设数量时,将此时的第一业务特征集合作为目标业务特征集合。从而获取初始业务特征集合特征降维处理后的目标业务特征集合,减少了该初始业务特征集合中的冗余特征。
此外,由于在进行网络业务类型识别的过程中,由于迭代过程具有一定的随机性,Adaboost算法在迭代训练过程中所产生的多个弱分类器并不都会在最终产生的强分类器中起作用,因此迭代过程中可能会产生两个甚至多个性能相同的冗余弱分类器。这种冗余弱分类器不仅不会提升最终的强分类器的准确率,反而会产生更多的计算开销,导致分类效率低下。当存在过多冗余弱分类器的Adaboost模型用于大规模复杂网络业务类型识别时,无法给予SDN控制器快速的识别结果反馈,导致SDN控制器无法根据不同网络业务类型快速实时分配网络节点资源,难以保障用户的服务质量需求。
因此,在将目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型之前,还可以包括基于误差关联算子改进的Adaboost算法的方法。图4为本申请实施例提供的再一种网络业务类型识别模型的训练方法的流程示意图。如图4所示,该方法还可以包括:
S401、根据误差关联算子,确定Adaboost算法中的冗余弱分类器。
在基于Adaboost分类器的业务类型识别训练过程中,Adaboost算法会产生多个弱分类器,对于模型的每一次迭代,这些弱分类器会对输入的业务流数据进行训练并输出业务类型识别结果。
其中,假设总迭代次数为,弱分类器的个数为/>,则/>表示弱分类器/>对第/>个网络业务数据样本的业务类型识别结果,若业务类型识别结果正确,则该弱分类器/>的业务类型识别效果矩阵中最后一行最后一列的值/>为1,若业务类型识别结果错误,则该值为0。
定义误差关联算子为,则
其中,误差关联算子表示两个弱分类器对相同数据样本错误识别的关联度,即/>值越接近于1,表明这两个弱分类器对相同数据样本错误识别的概率越高。当/>时,认为两个弱分类器在最终组合而成的强分类器中的作用权重也是相同的,因此可将其中一个弱分类器判定为冗余弱分类器。
S402、去除Adaboost算法中的冗余弱分类器,获取基于误差关联算子改进的Adaboost算法。
本申请实施例提供的方法,通过定义误差关联算子,确定Adaboost算法中的冗余弱分类器,去除Adaboost算法中的冗余弱分类器,获取基于误差关联算子改进的Adaboost算法,从而使Adaboost模型用于大规模复杂网络业务类型识别时,能够给予SDN控制器快速的识别结果反馈,使SDN控制器可以根据不同网络业务类型快速实时分配网络节点资源,保障用户的服务质量需求。
下面,对于前述步骤S102中如何从所述网络业务数据样本中提取所述网络业务数据样本的初始业务特征集合进行详细说明。
图5为本申请实施例提供的再一种网络业务类型识别模型的训练方法的流程示意图。如图5所示,该步骤S102可以包括:
S501、获取网络业务数据样本的采集时间。
其中,该网络业务数据样本的采集时间可以是从该网络业务数据样本的数据包中获取的。
S502、根据采集时间,将网络业务数据样本切割为至少两个时间连续的数据包集合。
可以利用流量切割工具SplitCap将网络业务数据样本切割成多个时间连续的数据包集合。其中,在某一时间段内采集到的网络业务数据样本包括多个样本。每个样本均带有记录采集时间的时间戳,每个样本又由多个数据包组成,默认同一个样本中的不同数据包的时间戳是连续的时间段,因此可以对网络业务数据样本进行切割,获得时间连续的切片,这些切片组成该数据包集合。
可选的,在根据采集时间,将网络业务数据样本切割为至少两个时间连续的数据包集合之前,还可以对网络业务数据样本进行数据清洗操作。该数据清洗操作例如可以包括处理网络业务数据样本中的缺失值,删除0值、重复值等无效数据,进行一致性检查等至少一种数据清洗操作。
S503、从数据包集合包括的数据包中提取每个数据包的初始业务特征。
其中,该初始业务特征包括该数据包中的特征,例如前述所说的该网络业务数据样本的采集时间、该数据包的长度、该网络数据样本使用的传输协议、该网络数据样本的源端口号和/或目的端口号、该网络数据样本的源IP地址和/或目的IP地址等,该初始业务特征可以定义为包括上述特征的元组数据包。
该从数据包集合包括的数据包中提取每个数据包的初始业务特征的方式可以是直接从该数据包中包括的信息中提取,或者通过特征提取算法处理该网络业务数据样本获取。
S504、根据初始业务特征,生成网络业务数据样本的初始业务特征集合。
一种可能的实现方式,将该初始业务特征作为该网络业务数据样本的初始业务特征集合。
另一种可能的实现方式,根据该数据包中的特征解析获得的隐含特征,根据该数据包中的特征和该隐含特征生成网络业务数据样本的初始业务特征集合,该网络业务数据样本的初始业务特征集合中包括该数据包中的特征和该隐含特征。
下面,对于上述图1至图5描述的网络业务类型识别模型的训练方法获得的训练好的网络业务类型识别模型的使用方法进行介绍。
其中,该网络业务类型识别模型应用于SDN控制平面。图6为本申请实施例提供的一种SDN架构的业务类型识别过程的结构示意图。如图6所示,该SDN架构中包括:应用平面、SDN控制平面、数据平面,该应用平面与该SDN控制平面通过该SDN控制平面的北向接口连接,该数据平面与该SDN控制平面通过该SDN控制平面的南向接口连接。在该SDN控制平面中包括SDN控制器,以及,该网络业务类型识别模型,该SDN控制器与该网络业务类型识别模型相连。
图7为本申请实施例提供的一种网络业务类型识别方法的流程示意图。参照图6可知,该方法的执行主体为图6中所示的SDN控制器。如图7所示,该方法可以包括:
S701、获取网络业务数据。
其中,该网络业务数据为该SDN控制器根据该SDN控制平面的南向接口,从数据平面中获取的,例如是通过南向接口,根据OpenFlow协议从该数据平面中的数据转发模块中获取的,该数据转发模块例如可以是交换机。该交换机可以采集复杂网络中包含多种网络业务类型的大规模真实网络业务数据。
S702、将网络业务数据输入至网络业务类型识别模型中,获得该网络业务数据的业务类型。
其中,该网络业务类型识别模型为前述图1至图5中任一项提供的方法获得的训练好的网络业务类型识别模型。将该将网络业务数据输入至网络业务类型识别模型中,通过该网络业务类型识别模型识别该网络业务数据的类型,从而获得该网络业务数据的业务类型。
S703、根据业务类型,对网络资源进行管理。
SDN控制器根据业务类型识别结果对捕获的网络业务数据进行分析,并做出合理的决策和资源调度,通过北向接口与应用平面完成交互。
本申请实施例提供的方法,通过获取网络业务数据,将网络业务数据输入至前述图1至图5的方法实施例训练好的网络业务类型识别模型中,获得该网络业务数据的业务类型,并根据业务类型,对网络资源进行管理,从而提高了SDN控制器对网络资源调度的效率和准确性。
图8为本申请实施例提供的一种网络业务类型识别模型的训练装置的结构示意图。如图8所示,该网络业务类型识别模型的训练装置可以包括:获取模块11,处理模块12,训练模块13。
获取模块11,用于获取网络业务数据样本,该网络业务数据样本包括该网络业务数据的类型。
处理模块12,用于从该网络业务数据样本中提取该网络业务数据样本的初始业务特征集合。确定该初始业务特征集合是否需要进行特征降维处理,该特征降维处理用于去除该初始业务特征集合中的冗余特征。若需要进行该特征降维处理,则获取该初始业务特征集合特征降维处理后的目标业务特征集合。
训练模块13,用于将该目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型。
可选的,处理模块12,具体用于根据斯皮尔曼等级相关性分析算法,确定该初始业务特征集合中的第一业务特征与业务类型的相关性。若与该第一业务特征存在相关性的业务类型的数量小于或等于预设阈值,则需要对该初始业务特征集合中进行特征降维处理。若与该第一业务特征存在相关性的业务类型的数量大于该预设阈值,则不需要对该初始业务特征集合中进行特征降维处理。
可选的,处理模块12,具体用于从该初始业务特征集合获取第一业务特征集合。获取该第一业务特征集合的第一评价函数,以及,第二业务特征集合的第二评价函数。确定与该第一评价函数的函数值差异最小的第二评价函数对应的目标第二业务特征集合。将该目标第二业务特征集合作为新的第一业务特征集合,并迭代上述步骤至该第一业务特征集合中的业务特征数量小于或等于预设数量,并生成该目标业务特征集合。其中,该第一特征集合中的业务特征数量小于或等于该初始业务特征集合中的特征数量,该第二业务特征集合中为该第一业务特征集合的子集,且该第二业务特征集合中的业务特征数量比该第一业务特征集合中的业务特征数量少1。
在上述任意一种实现方式下,处理模块12,在训练模块13将该目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型之前,还用于根据误差关联算子,确定该Adaboost算法中的冗余弱分类器。去除该Adaboost算法中的冗余弱分类器,获取该基于误差关联算子改进的Adaboost算法。
在上述任意一种实现方式下,处理模块12,具体用于获取该网络业务数据样本的采集时间。根据该采集时间,将该网络业务数据样本切割为至少两个时间连续的数据包集合。从该数据包集合包括的数据包中提取每个数据包的初始业务特征。根据该初始业务特征,生成该网络业务数据样本的初始业务特征集合。
其中,可选的,处理模块12,在根据该采集时间,将该网络业务数据样本切割为至少两个时间连续的数据包集合之前,还用于对该网络业务数据样本进行数据清洗操作。
本申请实施例提供的网络业务类型识别模型的训练装置,可以执行上述方法实施例中的网络业务类型识别模型的训练方法,其实现原理和技术效果类似,在此不再赘述。
图9为本申请实施例提供的一种电子设备的结构示意图。其中,该电子设备用于执行前述所说的网络业务类型识别模型的训练方法,或者,网络业务类型识别方法,例如可以是前述所说的具备数据处理功能的终端设备,或者,SDN控制平面中的设备等。如图9所示,该电子设备900可以包括:至少一个处理器901、存储器902、通信接口903。
存储器902,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器902可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器901用于执行存储器902存储的计算机执行指令,以实现前述方法实施例所描述的方法。其中,处理器901可能是一个CPU,或者是特定集成电路(ApplicationSpecific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
处理器901通过通信接口903可以与外部设备进行通信交互,外部设备例如可以是前述所说的网络设备,或者,交换机等。在具体实现上,如果通信接口903、存储器902以及处理器901独立实现,则通信接口903、存储器902以及处理器901可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果通信接口903、存储器902和处理器901集成在一块芯片上实现,则通信接口903、存储器902和处理器901可以通过内部接口完成通信。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或者光盘等各种可以存储程序代码的介质,具体的,该计算机可读存储介质中存储有程序指令,程序指令用于上述实施例中的方法。
本申请还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。计算设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得计算设备实施上述方法。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (9)
1.一种网络业务类型识别模型的训练方法,其特征在于,包括:
获取网络业务数据样本,所述网络业务数据样本包括所述网络业务数据的类型;
从所述网络业务数据样本中提取所述网络业务数据样本的初始业务特征集合;
确定所述初始业务特征集合是否需要进行特征降维处理,所述特征降维处理用于去除所述初始业务特征集合中的冗余特征;
若需要进行所述特征降维处理,则获取所述初始业务特征集合特征降维处理后的目标业务特征集合;
将所述目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型;
在所述将所述目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型之前,还包括:
根据误差关联算子,确定所述Adaboost算法中的冗余弱分类器;
去除所述Adaboost算法中的冗余弱分类器,获取所述基于误差关联算子改进的Adaboost算法;
其中,假设总迭代次数为,弱分类器的个数为/>,则/>表示弱分类器对第/>个网络业务数据样本的业务类型识别结果,若业务类型识别结果正确,则该弱分类器的业务类型识别效果矩阵中最后一行最后一列的值/>为1,若业务类型识别结果错误,则该值/>为0;
定义误差关联算子为,则
其中,误差关联算子表示两个弱分类器对相同数据样本错误识别的关联度,即/>值越接近于1,表明这两个弱分类器对相同数据样本错误识别的概率越高,当/>时,表示两个弱分类器在最终组合而成的强分类器中的作用权重是相同的,将其中一个弱分类器判定为冗余弱分类器。
2.根据权利要求1所述的方法,其特征在于,所述确定所述初始业务特征集合是否需要进行特征降维处理,包括:
根据斯皮尔曼等级相关性分析算法,确定所述初始业务特征集合中的第一业务特征与业务类别的相关性;
若与所述第一业务特征存在相关性的所述业务类别的数量小于或等于预设阈值,则需要对所述初始业务特征集合中进行特征降维处理;
若与所述第一业务特征存在相关性的所述业务类别的数量大于所述预设阈值,则不需要对所述初始业务特征集合中进行特征降维处理。
3.根据权利要求2所述的方法,其特征在于,所述获取所述初始业务特征集合特征降维处理后的目标业务特征集合,包括:
从所述初始业务特征集合获取第一业务特征集合,所述第一业务特征集合中的业务特征数量小于或等于所述初始业务特征集合中的特征数量;
获取所述第一业务特征集合的第一评价函数,以及,第二业务特征集合的第二评价函数,所述第二业务特征集合中为所述第一业务特征集合的子集,且所述第二业务特征集合中的业务特征数量比所述第一业务特征集合中的业务特征数量少1;
确定与所述第一评价函数的函数值差异最小的第二评价函数对应的目标第二业务特征集合;
将所述目标第二业务特征集合作为新的第一业务特征集合,并迭代上述步骤至所述第一业务特征集合中的业务特征数量小于或等于预设数量,生成所述目标业务特征集合。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述从所述网络业务数据样本中提取所述网络业务数据样本的初始业务特征集合,包括:
获取所述网络业务数据样本的采集时间;
根据所述采集时间,将所述网络业务数据样本切割为至少两个时间连续的数据包集合;
从所述数据包集合包括的数据包中提取每个数据包的初始业务特征;
根据所述初始业务特征,生成所述网络业务数据样本的初始业务特征集合。
5.根据权利要求4所述的方法,其特征在于,在根据所述采集时间,将所述网络业务数据样本切割为至少两个时间连续的数据包集合之前,还包括:
对所述网络业务数据样本进行数据清洗操作。
6.一种网络业务类型识别方法,其特征在于,应用于SDN控制平面,包括:
获取网络业务数据;
将所述网络业务数据输入至网络业务类型识别模型中,获得所述网络业务数据的业务类型;所述网络业务类型识别模型为权利要求1-5中任一项所述的网络业务类型识别模型;
根据所述业务类型,对网络资源进行管理。
7.一种网络业务类型识别模型的训练装置,其特征在于,包括:
获取模块,用于获取网络业务数据样本,所述网络业务数据样本包括所述网络业务数据的类型;
处理模块,用于从所述网络业务数据样本中提取所述网络业务数据样本的初始业务特征集合;确定所述初始业务特征集合是否需要进行特征降维处理,所述特征降维处理用于去除所述初始业务特征集合中的冗余特征;若需要进行所述特征降维处理,则获取所述初始业务特征集合特征降维处理后的目标业务特征集合;
训练模块,用于将所述目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型;
在所述将所述目标业务特征集合输入基于误差关联算子改进的Adaboost算法中进行训练,得到训练后的网络业务类型识别模型之前,所述训练模块还用于:
根据误差关联算子,确定所述Adaboost算法中的冗余弱分类器;
去除所述Adaboost算法中的冗余弱分类器,获取所述基于误差关联算子改进的Adaboost算法;
其中,假设总迭代次数为,弱分类器的个数为/>,则/>表示弱分类器对第/>个网络业务数据样本的业务类型识别结果,若业务类型识别结果正确,则该弱分类器的业务类型识别效果矩阵中最后一行最后一列的值/>为1,若业务类型识别结果错误,则该值/>为0;
定义误差关联算子为,则
其中,误差关联算子表示两个弱分类器对相同数据样本错误识别的关联度,即/>值越接近于1,表明这两个弱分类器对相同数据样本错误识别的概率越高,当/>时,表示两个弱分类器在最终组合而成的强分类器中的作用权重是相同的,将其中一个弱分类器判定为冗余弱分类器。
8.一种电子设备,其特征在于,包括:处理器,通信接口以及存储器,所述处理器分别与所述通信接口和所述存储器通信连接;
所述存储器存储计算机执行指令;
所述通信接口与外部设备进行通信交互;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311048160.9A CN116805926B (zh) | 2023-08-21 | 2023-08-21 | 网络业务类型识别模型训练方法、网络业务类型识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311048160.9A CN116805926B (zh) | 2023-08-21 | 2023-08-21 | 网络业务类型识别模型训练方法、网络业务类型识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116805926A CN116805926A (zh) | 2023-09-26 |
CN116805926B true CN116805926B (zh) | 2023-11-17 |
Family
ID=88080837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311048160.9A Active CN116805926B (zh) | 2023-08-21 | 2023-08-21 | 网络业务类型识别模型训练方法、网络业务类型识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116805926B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102129565A (zh) * | 2011-03-01 | 2011-07-20 | 北京航空航天大学 | 基于冗余特征消减AdaBoost分类器的物体检测方法 |
CN104052612A (zh) * | 2013-03-13 | 2014-09-17 | 中国移动通信集团广东有限公司 | 一种电信业务的故障识别与定位的方法及系统 |
CN107194433A (zh) * | 2017-06-14 | 2017-09-22 | 电子科技大学 | 一种基于深度自编码网络的雷达一维距离像目标识别方法 |
CN107480696A (zh) * | 2017-07-12 | 2017-12-15 | 深圳信息职业技术学院 | 一种分类模型构建方法、装置及终端设备 |
CN109978073A (zh) * | 2019-04-03 | 2019-07-05 | 大连大学 | 一种空间信息网络任务智能识别方法 |
CN111245667A (zh) * | 2018-11-28 | 2020-06-05 | 中国移动通信集团浙江有限公司 | 网络业务识别方法及装置 |
CN111835707A (zh) * | 2020-05-27 | 2020-10-27 | 江苏大学 | 一种基于改进后的支持向量机的恶意程序识别方法 |
CN112398779A (zh) * | 2019-08-12 | 2021-02-23 | 中国科学院国家空间科学中心 | 一种网络流量数据分析方法及系统 |
WO2022066725A1 (en) * | 2020-09-23 | 2022-03-31 | Proscia Inc. | Training end-to-end weakly supervised networks in a multi-task fashion at the specimen (supra-image) level |
WO2022116957A1 (zh) * | 2020-12-02 | 2022-06-09 | 中兴通讯股份有限公司 | 算法模型及路径的确定方法、电子设备、sdn控制器和介质 |
CN115051864A (zh) * | 2022-06-21 | 2022-09-13 | 郑州轻工业大学 | 基于pca-mf-wnn的网络安全态势要素提取方法及系统 |
CN116340006A (zh) * | 2023-05-26 | 2023-06-27 | 江苏网进科技股份有限公司 | 一种基于深度学习的算力资源空闲预测方法和存储介质 |
CN116366453A (zh) * | 2023-04-18 | 2023-06-30 | 中国电子科技集团公司第三十八研究所 | 异构网元业务需求表征与虚拟网元的自适应动态部署方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8331655B2 (en) * | 2008-06-30 | 2012-12-11 | Canon Kabushiki Kaisha | Learning apparatus for pattern detector, learning method and computer-readable storage medium |
US10536357B2 (en) * | 2015-06-05 | 2020-01-14 | Cisco Technology, Inc. | Late data detection in data center |
-
2023
- 2023-08-21 CN CN202311048160.9A patent/CN116805926B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102129565A (zh) * | 2011-03-01 | 2011-07-20 | 北京航空航天大学 | 基于冗余特征消减AdaBoost分类器的物体检测方法 |
CN104052612A (zh) * | 2013-03-13 | 2014-09-17 | 中国移动通信集团广东有限公司 | 一种电信业务的故障识别与定位的方法及系统 |
CN107194433A (zh) * | 2017-06-14 | 2017-09-22 | 电子科技大学 | 一种基于深度自编码网络的雷达一维距离像目标识别方法 |
CN107480696A (zh) * | 2017-07-12 | 2017-12-15 | 深圳信息职业技术学院 | 一种分类模型构建方法、装置及终端设备 |
CN111245667A (zh) * | 2018-11-28 | 2020-06-05 | 中国移动通信集团浙江有限公司 | 网络业务识别方法及装置 |
CN109978073A (zh) * | 2019-04-03 | 2019-07-05 | 大连大学 | 一种空间信息网络任务智能识别方法 |
CN112398779A (zh) * | 2019-08-12 | 2021-02-23 | 中国科学院国家空间科学中心 | 一种网络流量数据分析方法及系统 |
CN111835707A (zh) * | 2020-05-27 | 2020-10-27 | 江苏大学 | 一种基于改进后的支持向量机的恶意程序识别方法 |
WO2022066725A1 (en) * | 2020-09-23 | 2022-03-31 | Proscia Inc. | Training end-to-end weakly supervised networks in a multi-task fashion at the specimen (supra-image) level |
WO2022116957A1 (zh) * | 2020-12-02 | 2022-06-09 | 中兴通讯股份有限公司 | 算法模型及路径的确定方法、电子设备、sdn控制器和介质 |
CN115051864A (zh) * | 2022-06-21 | 2022-09-13 | 郑州轻工业大学 | 基于pca-mf-wnn的网络安全态势要素提取方法及系统 |
CN116366453A (zh) * | 2023-04-18 | 2023-06-30 | 中国电子科技集团公司第三十八研究所 | 异构网元业务需求表征与虚拟网元的自适应动态部署方法 |
CN116340006A (zh) * | 2023-05-26 | 2023-06-27 | 江苏网进科技股份有限公司 | 一种基于深度学习的算力资源空闲预测方法和存储介质 |
Non-Patent Citations (2)
Title |
---|
SDN架构下的空间信息网络业务识别技术;潘成胜;刘勇;石怀峰;杨力;;计算机工程(04);全文 * |
李雄飞 ; 李军 ; 董元方 ; 屈成伟 ; .一种新的不平衡数据学习算法PCBoost.计算机学报.全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN116805926A (zh) | 2023-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110445653B (zh) | 网络状态预测方法、装置、设备及介质 | |
CN110311829B (zh) | 一种基于机器学习加速的网络流量分类方法 | |
WO2022257436A1 (zh) | 基于无线通信网络数据仓库构建方法、系统、设备及介质 | |
CN111177360B (zh) | 一种基于云上用户日志的自适应过滤方法及装置 | |
CN106850338B (zh) | 一种基于语义分析的r+1类应用层协议识别方法与装置 | |
KR101965277B1 (ko) | 하이퍼그래프 데이터 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 | |
CN111431819A (zh) | 一种基于序列化的协议流特征的网络流量分类方法和装置 | |
CN110046297B (zh) | 运维违规操作的识别方法、装置和存储介质 | |
CN113762377B (zh) | 网络流量识别方法、装置、设备及存储介质 | |
CN112765324B (zh) | 一种概念漂移检测方法及装置 | |
CN110659436A (zh) | 网络舆情监控方法、装置和设备 | |
CN108234452B (zh) | 一种网络数据包多层协议识别的系统和方法 | |
CN115830649A (zh) | 一种网络资产指纹特征的识别方法、装置及电子设备 | |
CN116032741A (zh) | 一种设备识别方法、装置、电子设备和计算机存储介质 | |
CN116805926B (zh) | 网络业务类型识别模型训练方法、网络业务类型识别方法 | |
CN112925964A (zh) | 基于云计算服务的大数据采集方法及大数据采集服务系统 | |
CN112199388A (zh) | 陌电识别方法、装置、电子设备及存储介质 | |
CN112688897A (zh) | 一种流量识别的方法、装置、存储介质及电子设备 | |
Lu et al. | TCFOM: a robust traffic classification framework based on OC-SVM combined with MC-SVM | |
CN113472654B (zh) | 一种网络流量数据转发方法、装置、设备及介质 | |
CN116932228B (zh) | 一种基于志愿者计算的边缘ai任务调度和资源管理系统 | |
CN114666391B (zh) | 访问轨迹确定方法、装置、设备及存储介质 | |
CN113139593B (zh) | 一种基于对话分析的工控协议报文分类方法和系统 | |
CN116405330B (zh) | 基于迁移学习的网络异常流量识别方法、装置和设备 | |
CN116915719A (zh) | 业务识别方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |