CN113762421B - 分类模型的训练方法、流量分析方法、装置及设备 - Google Patents
分类模型的训练方法、流量分析方法、装置及设备 Download PDFInfo
- Publication number
- CN113762421B CN113762421B CN202111231479.6A CN202111231479A CN113762421B CN 113762421 B CN113762421 B CN 113762421B CN 202111231479 A CN202111231479 A CN 202111231479A CN 113762421 B CN113762421 B CN 113762421B
- Authority
- CN
- China
- Prior art keywords
- flow analysis
- classification model
- training
- data
- analysis data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005206 flow analysis Methods 0.000 title claims abstract description 234
- 238000012549 training Methods 0.000 title claims abstract description 155
- 238000013145 classification model Methods 0.000 title claims abstract description 139
- 238000000034 method Methods 0.000 title claims abstract description 99
- 238000012360 testing method Methods 0.000 claims abstract description 50
- 238000012795 verification Methods 0.000 claims abstract description 38
- 238000004458 analytical method Methods 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 31
- 239000011159 matrix material Substances 0.000 claims description 22
- 238000010200 validation analysis Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 125000004122 cyclic group Chemical group 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 208000025174 PANDAS Diseases 0.000 description 3
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 3
- 240000004718 Panda Species 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请提供的一种分类模型的训练方法、流量分析方法、装置及设备,首先确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征,随后,将流量分析数据划分为训练集、验证集和测试集,并根据流量分析特征的重要性评分,确定训练集的目标特征组合,然后根据目标特征组合,使用训练集对分类模型进行训练,最后,使用验证集和测试集,对训练后的分类模型进行参数调节。通过该方式,可以确定用于预测目标专线是否需要扩容的分类模型,后期通过获取目标专线的每日流量数据,处理并输入分类模型,可以得出目标专线是否需要扩容的预测结果,从而可以对专线现有宽带是否需要扩容进行高效地分析判断。
Description
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种分类模型的训练方法、流量分析方法、装置及设备。
背景技术
互联网专线业务是运营商面向企业等客户的数据接入或互联业务,是运营商的重要业务之一。在专线业务开通交付之后,由于业务量增长等原因,专线现有带宽的容量可能不能再满足客户的需要。在此情况下,专线的网络性能将受到严重影响,例如,用户在使用网络时感受到卡顿或无法上网。因此,需要对专线现有宽带进行及时地扩容分析,以避免产生因宽带容量不足而影响网络质量的问题。
现有的专线宽带扩容分析方法主要依靠人工进行分析。在收到客户的排障需求后,运维人员通过采集与专线网络性能有关的数据,然后根据经验对数据进行处理、分析,进而确定专线现有宽带是否需要扩容。
然而,现有技术中,由于需要排障的专线涉及到的数据量庞大,需要处理、分析的专线性能指标较多,从而使得运维人员的任务量繁重、排障效率低,难以对专线现有宽带是否需要扩容进行高效地分析判断。
发明内容
本申请提供一种分类模型的训练方法、流量分析方法、装置及设备,以解决现有技术中难以对专线现有宽带是否需要扩容进行高效地分析判断的技术问题。
第一方面,本申请提供一种分类模型的训练方法,所述方法包括:
确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征;
将所述流量分析数据划分为训练集、验证集和测试集;
根据所述流量分析特征的重要性评分,确定所述训练集的目标特征组合;
根据所述目标特征组合,使用所述训练集对分类模型进行训练,所述分类模型用于通过循环迭代输出二分类的预测结果,所述预测结果用于指示所述目标专线是否扩容;
使用所述验证集和所述测试集,对训练后的分类模型进行参数调节。
一种可选的实施方式中,从所述训练集中的流量分析数据中确定出样本数据对分类模型进行训练,包括:
从所述训练集中的每条流量分析数据中,确定出所述目标特征组合对应的流量分析特征,作为输入样本集中的输入向量;
根据所述输入样本集和预设的输出样本集,构建输入输出矩阵,所述预设的输出样本集中的输出向量用于表征所述输出向量对应的流量分析数据的预测结果;
使用所述输入输出矩阵,对所述分类模型进行训练。
一种可选的实施方式中,在所述确定所述训练集的目标特征组合之前,所述方法还包括:
计算所述训练集中的流量分析数据的流量分析特征的重要性变量;
根据所述重要性变量,绘制所述流量分析特征的重要性排序图;
根据所述重要性排序图,确定所述流量分析特征的重要性评分。
一种可选的实施方式中,所述将所述流量分析数据划分为训练集、验证集和测试集,包括:
使用时间滑窗算法,将所述流量分析数据划分为训练集、验证集和测试集;
其中,所述训练集、所述验证集和所述测试集中包括的流量分析数据的时间跨度相等。
一种可选的实施方式中,所述确定目标专线的流量分析数据,包括:
获取所述目标专线的每日流量数据;
对所述目标专线的每日流量数据进行预处理;
根据预设的时间间隔,对预处理后的目标专线的每日流量数据进行分析,确定所述目标专线的至少一个流量分析特征;
将所述至少一个流量分析特征组合确定为所述目标专线的流量分析数据。
一种可选的实施方式中,所述预处理包括数据清洗和数据修正。
一种可选的实施方式中,所述流量分析特征,包括:流量峰值速率、流量平均速率、峰值带宽利用率、平均带宽利用率以及流量与峰值的比值超过阈值的时间。
第二方面,本申请提供一种流量分析方法,所述方法包括:
获取第一时间段内目标专线的每日流量数据;
根据所述第一时间段内目标专线的每日流量数据,生成所述第一时间段内的流量分析数据,所述流量分析数据包含至少一个流量分析特征;
将所述第一时间段内的流量分析数据输入训练后的分类模型中,并获取所述分类模型输出的预测结果;
其中,所述分类模型用于通过循环迭代输出二分类的预测结果,所述预测结果用于指示所述目标专线是否扩容。
第三方面,本申请提供一种分类模型的训练装置,所述装置包括:
数据确定模块,用于确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征;
数据划分模块,用于将所述流量分析数据划分为训练集、验证集和测试集;
特征组合确定模块,用于根据所述流量分析特征的重要性评分,确定所述训练集的目标特征组合;
训练模块,用于根据所述目标特征组合,使用所述训练集对分类模型进行训练,所述分类模型用于通过循环迭代输出二分类的预测结果,所述预测结果用于指示所述目标专线是否扩容;
参数调节模块,用于使用所述验证集和所述测试集,对训练后的分类模型进行参数调节。
一种可选的实施方式中,所述训练模块,具体用于从所述训练集中的每条流量分析数据中,确定出所述目标特征组合对应的流量分析特征,作为输入样本集中的输入向量;根据所述输入样本集和预设的输出样本集,构建输入输出矩阵,所述预设的输出样本集中的输出向量用于表征所述输出向量对应的流量分析数据的预测结果;使用所述输入输出矩阵,对所述分类模型进行训练。
一种可选的实施方式中,所述特征组合确定模块,还用于计算所述训练集中的流量分析数据的流量分析特征的重要性变量;根据所述重要性变量,绘制所述流量分析特征的重要性排序图;根据所述重要性排序图,确定所述流量分析特征的重要性评分。
一种可选的实施方式中,所述数据划分模块,具体用于使用时间滑窗算法,将所述流量分析数据划分为训练集、验证集和测试集;其中,所述训练集、所述验证集和所述测试集中包括的流量分析数据的时间跨度相等。
一种可选的实施方式中,所述数据确定模块,具体用于获取所述目标专线的每日流量数据;对所述目标专线的每日流量数据进行预处理;根据预设的时间间隔,对预处理后的目标专线的每日流量数据进行分析,确定所述目标专线的至少一个流量分析特征;将所述至少一个流量分析特征组合确定为所述目标专线的流量分析数据。
第四方面,本申请提供一种流量分析装置,所述装置包括:
获取模块,用于获取第一时间段内目标专线的每日流量数据;
处理模块,用于根据所述第一时间段内目标专线的每日流量数据,生成所述第一时间段内的流量分析数据,所述流量分析数据包含至少一个流量分析特征;将所述第一时间段内的流量分析数据输入训练后的分类模型中,并获取所述分类模型输出的预测结果;其中,所述分类模型用于通过循环迭代输出二分类的预测结果,所述预测结果用于指示所述目标专线是否扩容。
第五方面,本申请还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面任意一项所述的方法。
第六方面,本申请还提供另一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第二方面所述的方法。
第七方面,本发明还提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如第一方面任意一项所述的方法。
第八方面,本发明还提供另一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如第二方面所述的方法。
第九方面,本申请还提供一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如第一方面任意一项所述的方法。
第十方面,本申请还提供另一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如第二方面所述的方法。
本申请提供的一种分类模型的训练方法、流量分析方法、装置及设备,首先确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征,随后,将流量分析数据划分为训练集、验证集和测试集,并根据流量分析特征的重要性评分,确定训练集的目标特征组合,然后根据目标特征组合,使用训练集对分类模型进行训练,最后,使用验证集和测试集,对训练后的分类模型进行参数调节。通过该方式,可以确定用于预测目标专线是否需要扩容的分类模型,后期通过获取目标专线的每日流量数据,处理并输入分类模型,可以得出目标专线是否需要扩容的预测结果,从而可以对专线现有宽带是否需要扩容进行高效地分析判断。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种分类模型的训练方法和流量分析方法的应用场景示意图;
图2为本申请实施例提供的一种分类模型的训练方法的流程示意图;
图3为本申请实施例提供的一种基于时间滑窗法划分流量分析数据的示意图;
图4为本申请实施例提供的一种流量分析方法的流程示意图;
图5为本申请实施例提供的另一种分类模型的训练方法的流程示意图;
图6为本申请实施例提供的再一种分类模型的训练方法的流程示意图;
图7为本申请实施例提供的一种分类模型的训练装置的结构示意图;
图8为本申请实施例提供的一种流量分析装置的结构示意图;
图9为本申请实施例提供的一种电子设备的结构示意图;
图10为本申请实施例提供的另一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
互联网专线业务是运营商面向企业等客户的数据接入或互联业务,是运营商的重要业务之一。在专线业务开通交付之后,由于业务量增长等原因,专线现有带宽的容量可能不能再满足客户的需要。在此情况下,专线的网络性能将受到严重影响,例如,用户在使用网络时感受到卡顿或无法上网。因此,需要对专线现有宽带进行及时地扩容分析,以避免产生因宽带容量不足而影响网络质量的问题。
现有的专线宽带扩容分析方法主要依靠人工进行分析。在收到客户的排障需求后,运维人员通过采集与专线网络性能有关的数据,然后根据经验对数据进行处理、分析,进而确定专线现有宽带是否需要扩容。
然而,现有技术中,由于需要排障的专线涉及到的数据量庞大,需要处理、分析的专线性能指标较多,从而使得运维人员的任务量繁重、排障效率低,难以对专线现有宽带是否需要扩容进行高效地分析判断。
为解决上述技术问题,本申请实施例提供一种分类模型的训练方法、流量分析方法、装置及设备。本申请实施例中,通过建立分类模型,然后将流量分析数据输入到分类模型中,得出目标专线是否需要扩容的预测结果,无需通过人工方法进行宽带扩容分析,从而可以高效地分析判断专线现有宽带是否需要扩容。
下面对于本申请涉及的一种分类模型的训练方法和流量分析方法的应用场景进行说明。
图1为本申请实施例提供的一种分类模型的训练方法和流量分析方法的应用场景示意图。如图1所示,包括有服务器101及终端设备102。首先,服务器101可以确定目标专线的流量分析数据,然后根据流量分析数据对分类模型进行训练,得到训练后的分类模型。当需要对目标专线进行扩容分析时,服务器101可以获取目标专线的每日流量数据,并将处理后的数据输入至分类模型中,得出目标专线是否需要扩容的预测结果。若目标专线需要扩容,则服务器101可以将需要扩容的目标专线的相关信息发送给终端设备102,以通知工作人员及时对目标专线的现有宽带进行扩容或提速。
需要说明的是,本申请实施例对于需要扩容的目标专线的相关信息的获取方法不做限制。在一些实施例中,服务器101可以将需要扩容的目标专线的相关信息发送给终端设备102,以通知工作人员获取相关信息。在另一些实施例中,工作人员也可以直接通过服务器101获取需要扩容的目标专线的相关信息。
其中,上述服务器可以是但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云。
终端设备可以为手机(mobile phone)、平板电脑(pad)、带无线收发功能的电脑、虚拟现实(virtual reality,VR)终端设备、增强现实(augmented reality,AR)终端设备、无人驾驶(self driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、智慧家庭(smart home)中的无线终端等。本申请实施例中,用于实现终端的功能的装置可以是终端,也可以是能够支持终端实现该功能的装置,例如芯片系统,该装置可以被安装在终端中。本申请实施例中,芯片系统可以由芯片构成,也可以包括芯片和其它分立器件。
应理解,本申请技术方案的应用场景可以是图1中的分类模型的训练和流量分析场景,但不限于此,还可以应用于其它需要对分类模型进行训练或对流量进行分析的场景中。
可以理解,上述分类模型的训练方法、流量分析方法可以通过本申请实施例提供的分类模型训练装置、流量分析装置实现,分类模型训练装置、流量分析装置可以是某个设备的部分或全部,例如服务器。
下面以集成或安装有相关执行代码的服务器为例,以具体的实施例对本申请实施例的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本申请实施例提供的一种分类模型的训练方法的流程示意图,本实施例涉及的是分类模型的训练过程。训练完成后的分类模型可以用于预测目标专线是否需要扩容,如图2所示,该方法包括:
S201、确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征。
在本申请实施例中,服务器可以首先确定目标专线的流量分析数据,然后根据流量分析数据,对分类模型进行训练。
其中,目标专线可以为任意一条或多条专线业务。在一些实施例中,目标专线可以为运营商在某一区域的全部专线业务,本申请实施例对此不做限制。
流量分析特征用于指示目标专线在某一时间段内的流量使用状况。在一些实施例中,流量分析特征可以包括流量峰值速率、流量平均速率、峰值带宽利用率、平均带宽利用率以及流量与峰值的比值超过阈值的时间等。示例性地,可以包括各条专线的月度峰值流出带宽利用率、平均流出带宽利用率、专线峰值带宽利用率超过85%天数、平均流出带宽利用率超过40%的天数等,本申请实施例对此不做限制。
在一些实施例中,每条流量分析数据可以包括对应专线的客户信息及至少一个流量分析特征。示例性地,每条流量分析数据可以包括专线对应的客户名称、设备端口、月度峰值流出带宽利用率、平均流出带宽利用率、专线峰值带宽利用率超过85%天数、平均流出带宽利用率超过40%的天数等信息,本申请实施例对此也不做限制。
本申请实施例对于分类模型的建立方法不做限制。在一些实施例中,可以通过机器学习模型建立所需分类模型。示例性地,可以通过极端梯度提升(eXtreme GradientBoosting,XGBoost)算法建立所需分类模型。
本申请实施例对于流量分析数据的确定方法不做限制。在一些实施例中,服务器可以首先获取目标专线的每日流量数据,随后对目标专线的每日流量数据进行预处理,再根据预设的时间间隔,对预处理后的目标专线的每日流量数据进行分析,确定目标专线的至少一个流量分析特征,最后,将至少一个流量分析特征组合确定为目标专线的流量分析数据。
在一些实施例中,每日流量数据可以为与目标专线的网络性能相关的任意数据,本申请实施例对此不做限制。示例性地,每日流量数据可以为在最近6个月内生成的、与目标专线相关的每日端口流量表数据、客户台账数据等。其中,每日端口流量表可以包含与目标专线有关的各个端口的流量数据等信息,示例性地,可以包括各个端口名及对应的平均流入或流出速率、峰值流入或流出速率、峰值流入或流出带宽利用率等信息。客户台账可以包括客户名称、接入端口名、物理带宽、配置带宽等信息,本申请实施例对此不做限制。
本申请实施例对于每日端口流量表、客户台账的获取方式也不做限制。在一些实施例中,可以通过部署爬虫框架(python scrapy),并定制包含所需数据的网管web站点及互联网专线客户服务网站的调度器,自动获取每日端口流量表及客户台账。
本申请实施例对于如何对每日流量数据进行预处理不做限制,在一些实施例中,预处理可以包括数据清洗和数据修正等操作。示例性地,在获取到每日端口流量表数据及客户台账数据之后,服务器可以将所需客户名称、端口名、流量信息等数据进行匹配,生成互联网专线客户的每日业务流量表。然后可以通过统一数据格式及填充缺失值等操作,对每日业务流量表中的数据进行清洗。之后,可以对每日业务流量表中的数据进行修正,例如对计算方式不合理的专线性能指标作修正,得到预处理后的数据。
本申请实施例对于每日端口流量表数据和客户台账数据的匹配方法不做限制。在一些实施例中,可以通过专门的数据分析函数对数据进行匹配。示例性地,可以通过python程序中的pandas库函数,根据客户信息、专线信息、日期、端口信息、设备信息等对数据进行初步匹配。然后按日期读取初步匹配后的数据文件,调用数据透视表(pandas pivot_table)函数,进一步地匹配专线流量数据及客户信息,生成互联网专线客户的每日业务流量表。其中,每日业务流量表中可以包括客户名称及对应专线的端口名、流量信息等数据,本申请实施例对此不做限制。
进一步地,本申请实施例对计算方式不合理的专线性能指标进行修正不做限制。,示例性地,通过每日端口流量表得到的的峰值流出带宽利用率,其值为峰值流出速率与物理带宽的比值,而对于互联网专线业务,峰值流出带宽利用率采用峰值流出速率与配置带宽的比值进行计算才更加准确。即峰值流出带宽利用率的计算方法应修正如公式(1)所示。
考虑到客户、业务、设备等差异对专线性能数据的影响比较明显,可以对获取到的数据,如端口速率等进行标准化修正,如公式(2)所示。
其中,Xstandard表示标准化后的速率,Xori表示原始速率,表示原始数据平均值,σ表示原始数据的标准差,即使用零均值标准化的方法提高数据的可靠性及机器学习的速度和精度。
在一些实施例中,可以根据预设的时间间隔,对预处理后的目标专线的每日流量数据进行分析。其中,预设时间间隔可以为任意的时间间隔,示例性地,可以为两周或一个月等,本申请实施例对此不做限制。
本申请实施例对于流量分析特征的确定方法不做限制。在一些实施例中,可以通过对预设时间间隔内的数据进行统计计算,确定目标专线的流量分析特征。示例性地,服务器可以通过python程序中的pandas库函数,读取预处理后的每日业务流量表中的数据,统计得到各条专线的月度峰值流出带宽利用率、平均流出带宽利用率、专线峰值带宽利用率超过85%天数、平均流出带宽利用率超过40%的天数等流量分析特征。
本申请实施例对于流量分析特征组合的确定方法不做限制,可以根据实际情况具体设置。在一些实施例中,流量分析特征组合可以包括任意一个或多个流量分析特征。示例性地,可以将月度峰值流出带宽利用率超过85%的天数、月度平均流出带宽利用率超过40%的天数、标准化的峰值流出带宽利用率、标准化的峰值流入带宽利用率、平均流入带宽利用率、平均流出带宽利用率、客户历史报障次数,这七个流量分析特征确定为一个流量分析特征组合。并根据这一个流量分析特征组合确定目标专线的流量分析数据。目标专线的流量分析数据中至少包括各条专线的客户信息及对应流量分析特征组合中的数据。
S202、将流量分析数据划分为训练集、验证集和测试集。
在本步骤中,当确定目标专线的流量分析数据后,服务器可以将流量分析数据划分为训练集、验证集和测试集。
本申请实施例对于如何划分流量分析数据不做限制。在一些实施例中,服务器可以使用时间滑窗算法,将流量分析数据划分为训练集、验证集和测试集。其中,训练集、验证集和测试集中包括的流量分析数据的时间跨度相等。
示例性地,图3为本申请实施例提供的一种基于时间滑窗法划分流量分析数据的示意图。如图3所示,共有3月1日至8月31日这六个月内的流量分析数据,可以划分为训练集301、验证集302及测试集303。训练集301可以包括3月至6月的数据,其中,3月至5月的数据用于特征建立及模型训练,6月的数据用于模拟实际应用,以便评估模型的预测效果。例如,可以将基于6月数据得出的模型预测结果,与当月经人工检查后确定宽带扩容的客户清单做对比,从而模拟实际应用场景。验证集302可以包括4月至7月的数据,其中,4月至6月的数据用于特征建立及模型训练,7月的数据用于模拟实际应用,以便与根据训练集数据得出的效果做对比,从而对模型的预测效果进行验证。测试集303可以包括5月至8月的数据,其中,5月至7月的数据用于特征建立及模型训练,8月的数据用于模拟实际应用,以便进一步地评估模型的预测准确度,作为模型效果。
S203、根据流量分析特征的重要性评分,确定训练集的目标特征组合。
在本步骤中,在将流量分析数据进行划分后,服务器可以根据流量分析特征的重要性评分,确定训练集的目标特征组合。
需要说明的是,流量分析特征的重要性评分用于指示某一流量分析特征对预测结果的准确性的重要程度。本申请实施例对于如何获得流量分析特征的重要性评分不做限制。在一些实施例中,可以先将训练集中的所有流量分析数据输入至模型中,得到初步训练后的分类模型。然后,可以通过初步训练后的分类模型,计算流量分析特征的重要性变量,并根据重要性变量,绘制流量分析特征的重要性排序图,然后根据重要性排序图,确定流量分析特征的重要性评分。示例性地,在python环境下,服务器可以调用初步训练后的XGBoost模型,自动计算流量分析特征中的重要性变量(feature_importances),然后使用内置的“绘制重要性”函数(plot_importance)绘制流量分析特征的重要性排序图,并在python提供的机器学习库(scikit-learn)中,通过特征选择函数(SlectFromModel)对流量分析特征进行重要性评分。
本申请实施例对于如何确定目标特征组合不做限制,在一些实施例中,可以根据分类模型的复杂度、准确度及特征的重要性评分等,确定目标特征组合。示例性地,根据分类模型的复杂度及特征的重要性评分,可以选择月度峰值流出带宽利用率超过85%的天数、平均流出带宽利用率超过40%的天数、标准化的峰值流出带宽利用率、标准化的峰值流入带宽利用率、客户历史报障次数,这五个流量分析特征作为目标特征组合,且根据这一目标特征组合建立的分类模型的准确度可以达到95%。
S204、根据目标特征组合,使用训练集对分类模型进行训练,分类模型用于通过循环迭代输出二分类的预测结果,预测结果用于指示目标专线是否扩容。
在本步骤中,在确定训练集的目标特征组合后,服务器可以根据目标特征组合,使用训练集对分类模型进行训练。
本申请实施例对于如何使用训练集对分类模型进行训练不做限制。在一些实施例中,可以首先从训练集中的所有流量分析数据中确定出样本数据,然后对分类模型进行训练。示例性地,首先从训练集中的每条流量分析数据中,确定出目标特征组合对应的流量分析特征数据,作为输入样本集中的输入向量。然后根据输入样本集和预设的输出样本集,构建输入输出矩阵,最后使用输入输出矩阵,对分类模型进行训练。
其中,样本数据可以包括输入样本集数据和输出样本集数据等,输入样本集和输出样本集中的数据样本可以以向量的形式呈现。输入样本集中的输入向量用于表征目标特征组合对应的流量分析特征数据,预设的输出样本集中的输出向量用于表征输出向量对应的流量分析数据的预测结果,本申请实施例对此不作限制。
示例性地,若目标特征组合中包含五个流量分析特征,则可将训练集中各条专线与这五个流量分析特征对应的数据筛选出来,作为输入样本集。其中,每条专线的输入数据可以用一个1*5的输入向量表示,如公式(3)所示。输入样本集中的所有输入向量可以构成一个输入矩阵,如公式(4)所示。在将输入矩阵输入至分类模型后,得到预测结果的输出向量,如公式(5)所示。
公式(3)中,Hi代表某条专线的输入向量,代表不同的流量分析特征数据。
公式(4)中,H代表输入矩阵,每一行对应一条专线的样本,每一列对应一个特征数据。若目标专线共包括N条专线,每条专线的样本数为Ks,则输入样本的样本容量K=N*Ks。
公式(5)中,Y代表模型预测结果的输出矩阵,Y0...Yi代表预测结果的输出向量,0代表“专线不需要扩容”,1代表“专线需要扩容”。在另一些实施例中,0也可以代表“不是潜在提速客户”,1也可以代表“是潜在提速客户”,本申请实施例对此不作限制。
S205、使用验证集和测试集,对训练后的分类模型进行参数调节。
在本步骤中,在使用训练集对分类模型进行训练后,可以使用验证集和测试集,对训练后的分类模型进行参数调节。
应理解,在本申请实施例中,使用验证集和测试集构建输入矩阵输入模型中,并得到模型预测结果的输出矩阵的过程可参照S204理解,对于重复的内容,在此不再累述。本申请实施例对于如何使用验证集和测试集,对分类模型进行参数调节不做限制,可以根据实际情况具体设置。
本申请提供的一种分类模型的训练方法,首先确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征,随后,将流量分析数据划分为训练集、验证集和测试集,并根据流量分析特征的重要性评分,确定训练集的目标特征组合,然后根据目标特征组合,使用训练集对分类模型进行训练,最后,使用验证集和测试集,对训练后的分类模型进行参数调节。通过该方式,可以确定用于预测目标专线是否需要扩容的分类模型,后期通过获取目标专线的每日流量数据,处理并输入分类模型,可以得出目标专线是否需要扩容的预测结果,从而可以对专线现有宽带是否需要扩容进行高效地分析判断。
在上述实施例的基础上,下面对于如何根据分类模型预测目标专线是否需要扩容进行说明。图4为本申请实施例提供的一种流量分析方法的流程示意图,如图4所示,该方法包括:
S401、获取第一时间段内目标专线的每日流量数据。
在本申请实施例中,在需要对目标专线进行扩容分析时,服务器可以获取第一时间段内目标专线的每日流量数据。
其中,第一时间段可以为过去的任意一个时间段,本申请实施例对此不做限制。示例性地,第一时间段可以为最近3个月等。
S402、根据第一时间段内目标专线的每日流量数据,生成第一时间段内的流量分析数据,流量分析数据包含至少一个流量分析特征。
S403、将第一时间段内的流量分析数据输入训练后的分类模型中,并获取分类模型输出的预测结果。
其中,分类模型用于通过循环迭代输出二分类的预测结果,预测结果用于指示目标专线是否扩容。
S401-S403的技术名词、技术效果、技术特征,以及可选实施方式,可参照图2所示的S201-S205理解,对于重复的内容,在此不再累述。
在上述实施例的基础上,下面对于如何确定目标专线的流量分析数据进行说明。图5为本申请实施例提供的另一种分类模型的训练方法的流程示意图,如图5所示,该方法包括:
S501、获取目标专线的每日流量数据。
S502、对目标专线的每日流量数据进行预处理。
S503、根据预设的时间间隔,对预处理后的目标专线的每日流量数据进行分析,确定目标专线的至少一个流量分析特征。
S504、将至少一个流量分析特征组合确定为目标专线的流量分析数据。
S505、将流量分析数据划分为训练集、验证集和测试集。
S506、根据流量分析特征的重要性评分,确定训练集的目标特征组合。
S507、根据目标特征组合,使用训练集对分类模型进行训练。
S508、使用验证集和测试集,对训练后的分类模型进行参数调节。
S501-S508的技术名词、技术效果、技术特征,以及可选实施方式,可参照图2所示的S201-S205理解,对于重复的内容,在此不再累述。
在上述实施例的基础上,下面对于如何确定目标特征组合进行说明。图6为本申请实施例提供的再一种分类模型的训练方法的流程示意图,如图6所示,该方法包括:
S601、确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征。
S602、将流量分析数据划分为训练集、验证集和测试集。
S603、计算训练集中的流量分析数据的流量分析特征的重要性变量。
S604、根据重要性变量,绘制流量分析特征的重要性排序图。
S605、根据重要性排序图,确定流量分析特征的重要性评分。
S606、根据流量分析特征的重要性评分,确定训练集的目标特征组合。
S607、根据目标特征组合,使用训练集对分类模型进行训练。
S608、使用验证集和测试集,对训练后的分类模型进行参数调节。
S601-S608的技术名词、技术效果、技术特征,以及可选实施方式,可参照图2所示的S201-S205理解,对于重复的内容,在此不再累述。
本申请提供的一种分类模型的训练方法和流量分析方法,首先确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征,随后,将流量分析数据划分为训练集、验证集和测试集,并根据流量分析特征的重要性评分,确定训练集的目标特征组合,然后根据目标特征组合,使用训练集对分类模型进行训练,最后,使用验证集和测试集,对训练后的分类模型进行参数调节。通过该方式,可以确定用于预测目标专线是否需要扩容的分类模型,后期通过获取目标专线的每日流量数据,处理并输入分类模型,可以得出目标专线是否需要扩容的预测结果,从而可以对专线现有宽带是否需要扩容进行高效地分析判断。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图7为本申请实施例提供的一种分类模型的训练装置的结构示意图。该分类模型的训练装置可以通过软件、硬件或者两者的结合实现,可例如上述实施例中的服务器,以执行上述实施例中的分类模型的训练方法。如图7所示,该分类模型的训练装置700包括:
数据确定模块701,用于确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征;
数据划分模块702,用于将流量分析数据划分为训练集、验证集和测试集;
特征组合确定模块703,用于根据流量分析特征的重要性评分,确定训练集的目标特征组合;
训练模块704,用于根据目标特征组合,使用训练集对分类模型进行训练,分类模型用于通过循环迭代输出二分类的预测结果,预测结果用于指示目标专线是否扩容;
参数调节模块705,用于使用验证集和测试集,对训练后的分类模型进行参数调节。
一种可选的实施方式中,训练模块704,具体用于从训练集中的每条流量分析数据中,确定出目标特征组合对应的流量分析特征,作为输入样本集中的输入向量;根据输入样本集和预设的输出样本集,构建输入输出矩阵,预设的输出样本集中的输出向量用于表征输出向量对应的流量分析数据的预测结果;使用输入输出矩阵,对分类模型进行训练。
一种可选的实施方式中,特征组合确定模块703,还用于计算训练集中的流量分析数据的流量分析特征的重要性变量;根据重要性变量,绘制流量分析特征的重要性排序图;根据重要性排序图,确定流量分析特征的重要性评分。
一种可选的实施方式中,数据划分模块702,具体用于使用时间滑窗算法,将流量分析数据划分为训练集、验证集和测试集;其中,训练集、验证集和测试集中包括的流量分析数据的时间跨度相等。
一种可选的实施方式中,数据确定模块701,具体用于获取目标专线的每日流量数据;对目标专线的每日流量数据进行预处理;根据预设的时间间隔,对预处理后的目标专线的每日流量数据进行分析,确定目标专线的至少一个流量分析特征;将至少一个流量分析特征组合确定为目标专线的流量分析数据。
需要说明的,图7所示实施例提供的分类模型的训练装置,可用于执行上述实施例所提供的分类模型的训练方法,具体实现方式和技术效果类似,这里不再进行赘述。
图8为本申请实施例提供的一种流量分析装置的结构示意图。该流量分析装置可以通过软件、硬件或者两者的结合实现,可例如上述实施例中的服务器,以执行上述实施例中的流量分析方法。如图8所示,该流量分析装置800包括:
获取模块801,用于获取第一时间段内目标专线的每日流量数据;
处理模块802,用于根据第一时间段内目标专线的每日流量数据,生成第一时间段内的流量分析数据,流量分析数据包含至少一个流量分析特征;将第一时间段内的流量分析数据输入训练后的分类模型中,并获取分类模型输出的预测结果;其中,分类模型用于通过循环迭代输出二分类的预测结果,预测结果用于指示目标专线是否扩容。
需要说明的,图8所示实施例提供的流量分析装置,可用于执行上述实施例所提供的流量分析方法,具体实现方式和技术效果类似,这里不再进行赘述。
图9为本申请实施例提供的一种电子设备的结构示意图。如图9所示,该电子设备900可以包括:至少一个处理器901和存储器902。图9示出的是以一个处理器为例的电子设备。
存储器902,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器902可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器901用于执行存储器902存储的计算机执行指令,以实现上述分类模型的训练方法;
其中,处理器601可能是一个中央处理器(Central Processing Unit,CPU),或者是特定集成电路(Application Specific Integrated Circuit,ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选的,在具体实现上,如果通信接口、存储器902和处理器901独立实现,则通信接口、存储器902和处理器901可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果通信接口、存储器902和处理器901集成在一块芯片上实现,则通信接口、存储器902和处理器901可以通过内部接口完成通信。
图10为本申请实施例提供的另一种电子设备的结构示意图。如图10所示,该电子设备1000可以包括:至少一个处理器1001和存储器1002。图10示出的是以一个处理器为例的电子设备,处理器1001用于执行存储器1002存储的计算机执行指令,以实现上述流量分析方法。图10所示的电子设备的各部分结构、功能等可参照图9所示的电子设备理解,对于重复的内容,在此不再累述。
本申请实施例还提供了一种芯片,包括处理器和接口。其中接口用于输入输出处理器所处理的数据或指令。处理器用于执行以上方法实施例中提供的方法。该芯片可以应用于分类模型的训练装置中。
本申请实施例还提供了另一种芯片,包括处理器和接口。其中接口用于输入输出处理器所处理的数据或指令。处理器用于执行以上方法实施例中提供的方法。该芯片可以应用于流量分析装置中。
本申请实施例还提供一种程序,该程序在被处理器执行时用于执行以上方法实施例提供的分类模型的训练方法。
本申请实施例还提供另一种程序,该程序在被处理器执行时用于执行以上方法实施例提供的流量分析方法。
本申请实施例还提供一种程序产品,例如计算机可读存储介质,该程序产品中存储有指令,当其在计算机上运行时,使得计算机执行上述方法实施例提供的分类模型的训练方法。
本申请实施例还提供另一种程序产品,例如计算机可读存储介质,该程序产品中存储有指令,当其在计算机上运行时,使得计算机执行上述方法实施例提供的流量分析方法。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、磁盘或者光盘等各种可以存储程序代码的介质。具体地,该计算机可读存储介质中存储有程序信息,程序信息用于上述分类模型的训练方法。
本申请还提供了另一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、磁盘或者光盘等各种可以存储程序代码的介质。具体地,该计算机可读存储介质中存储有程序信息,程序信息用于上述流量分析方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如,固态硬盘(Solid State Disk,SSD))等。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (12)
1.一种分类模型的训练方法,其特征在于,所述方法包括:
确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征;
将所述流量分析数据划分为训练集、验证集和测试集;
根据所述流量分析特征的重要性评分,确定所述训练集的目标特征组合;
根据所述目标特征组合,使用所述训练集对分类模型进行训练,所述分类模型用于通过循环迭代输出二分类的预测结果,所述预测结果用于指示所述目标专线是否扩容;
使用所述验证集和所述测试集,对训练后的分类模型进行参数调节;
从所述训练集中的流量分析数据中确定出样本数据对分类模型进行训练,包括:
从所述训练集中的每条流量分析数据中,确定出所述目标特征组合对应的流量分析特征,作为输入样本集中的输入向量;
根据所述输入样本集和预设的输出样本集,构建输入输出矩阵,所述预设的输出样本集中的输出向量用于表征所述输出向量对应的流量分析数据的预测结果;
使用所述输入输出矩阵,对所述分类模型进行训练;
所述将所述流量分析数据划分为训练集、验证集和测试集,包括:
使用时间滑窗算法,将所述流量分析数据划分为训练集、验证集和测试集;
其中,所述训练集、所述验证集和所述测试集中包括的流量分析数据的时间跨度相等。
2.根据权利要求1所述的方法,其特征在于,在所述确定所述训练集的目标特征组合之前,所述方法还包括:
计算所述训练集中的流量分析数据的流量分析特征的重要性变量;
根据所述重要性变量,绘制所述流量分析特征的重要性排序图;
根据所述重要性排序图,确定所述流量分析特征的重要性评分。
3.根据权利要求1或2所述的方法,其特征在于,所述确定目标专线的流量分析数据,包括:
获取所述目标专线的每日流量数据;
对所述目标专线的每日流量数据进行预处理;
根据预设的时间间隔,对预处理后的目标专线的每日流量数据进行分析,确定所述目标专线的至少一个流量分析特征;
将所述至少一个流量分析特征组合确定为所述目标专线的流量分析数据。
4.根据权利要求3所述的方法,其特征在于,所述预处理包括数据清洗和数据修正。
5.根据权利要求1或2所述的方法,其特征在于,所述流量分析特征,包括:流量峰值速率、流量平均速率、峰值带宽利用率、平均带宽利用率以及流量与峰值的比值超过阈值的时间。
6.一种流量分析方法,其特征在于,所述方法包括:
获取第一时间段内目标专线的每日流量数据;
根据所述第一时间段内目标专线的每日流量数据,生成所述第一时间段内的流量分析数据,所述流量分析数据包含至少一个流量分析特征;
将所述第一时间段内的流量分析数据输入训练后的分类模型中,并获取所述分类模型输出的预测结果;
其中,所述分类模型用于通过循环迭代输出二分类的预测结果,所述预测结果用于指示所述目标专线是否扩容;
所述分类模型是使用时间滑窗算法,将所述流量分析数据划分为训练集、验证集和测试集;其中,所述训练集、所述验证集和所述测试集中包括的流量分析数据的时间跨度相等;并从所述训练集中的每条流量分析数据中,确定出目标特征组合对应的流量分析特征,作为输入样本集中的输入向量;根据所述输入样本集和预设的输出样本集,构建输入输出矩阵,所述预设的输出样本集中的输出向量用于表征所述输出向量对应的流量分析数据的预测结果;使用所述输入输出矩阵,对所述分类模型进行训练,获得所述训练后的分类模型;使用所述验证集和所述测试集,对训练后的分类模型进行参数调节得到的分类模型。
7.一种分类模型的训练装置,其特征在于,所述装置包括:
数据确定模块,用于确定目标专线的流量分析数据,每条流量分析数据包含至少一个流量分析特征;
划分模块,用于将所述流量分析数据划分为训练集、验证集和测试集;
特征组合确定模块,用于根据所述流量分析特征的重要性评分,确定所述训练集的目标特征组合;
训练模块,用于根据所述目标特征组合,使用所述训练集对分类模型进行训练,所述分类模型用于通过循环迭代输出二分类的预测结果,所述预测结果用于指示所述目标专线是否扩容;
调节模块,用于使用所述验证集和所述测试集,对训练后的分类模型进行参数调节;
所述训练模块,具体用于从所述训练集中的每条流量分析数据中,确定出所述目标特征组合对应的流量分析特征,作为输入样本集中的输入向量;
根据所述输入样本集和预设的输出样本集,构建输入输出矩阵,所述预设的输出样本集中的输出向量用于表征所述输出向量对应的流量分析数据的预测结果;
使用所述输入输出矩阵,对所述分类模型进行训练;
所述划分模块,具体用于使用时间滑窗算法,将所述流量分析数据划分为训练集、验证集和测试集;
其中,所述训练集、所述验证集和所述测试集中包括的流量分析数据的时间跨度相等。
8.一种流量分析装置,其特征在于,所述装置包括:
获取模块,用于获取第一时间段内目标专线的每日流量数据;
处理模块,用于根据所述第一时间段内目标专线的每日流量数据,生成所述第一时间段内的流量分析数据,所述流量分析数据包含至少一个流量分析特征;将所述第一时间段内的流量分析数据输入训练后的分类模型中,并获取所述分类模型输出的预测结果;其中,所述分类模型用于通过循环迭代输出二分类的预测结果,所述预测结果用于指示所述目标专线是否扩容;
所述分类模型是使用时间滑窗算法,将所述流量分析数据划分为训练集、验证集和测试集;其中,所述训练集、所述验证集和所述测试集中包括的流量分析数据的时间跨度相等;并从训练集中的每条流量分析数据中,确定出目标特征组合对应的流量分析特征,作为输入样本集中的输入向量;根据所述输入样本集和预设的输出样本集,构建输入输出矩阵,所述预设的输出样本集中的输出向量用于表征所述输出向量对应的流量分析数据的预测结果;使用所述输入输出矩阵,对所述分类模型进行训练,获得所述训练后的分类模型;使用所述验证集和所述测试集,对训练后的分类模型进行参数调节得到的分类模型。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至5任意一项所述的分类模型的训练方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求6所述的流量分析方法。
11.一种电子设备,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1-5任意一项所述的分类模型的训练方法。
12.一种电子设备,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求6所述的流量分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111231479.6A CN113762421B (zh) | 2021-10-22 | 2021-10-22 | 分类模型的训练方法、流量分析方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111231479.6A CN113762421B (zh) | 2021-10-22 | 2021-10-22 | 分类模型的训练方法、流量分析方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113762421A CN113762421A (zh) | 2021-12-07 |
CN113762421B true CN113762421B (zh) | 2024-03-15 |
Family
ID=78784267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111231479.6A Active CN113762421B (zh) | 2021-10-22 | 2021-10-22 | 分类模型的训练方法、流量分析方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113762421B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114615701A (zh) * | 2022-03-14 | 2022-06-10 | 叶晓斌 | 一种流量健康度评价的方法 |
CN115494526A (zh) * | 2022-08-29 | 2022-12-20 | 中山大学 | 一种gnss欺骗干扰检测方法、装置、电子设备及存储介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9245538B1 (en) * | 2010-05-20 | 2016-01-26 | Audience, Inc. | Bandwidth enhancement of speech signals assisted by noise reduction |
WO2016061957A1 (zh) * | 2014-10-22 | 2016-04-28 | 中兴通讯股份有限公司 | 一种lte网络业务流量评估方法及装置 |
CN108259225A (zh) * | 2017-12-20 | 2018-07-06 | 中国联合网络通信集团有限公司 | 一种网络扩容评估方法、装置和服务器 |
CN109257758A (zh) * | 2018-10-19 | 2019-01-22 | 中国联合网络通信集团有限公司 | 一种网络扩容方法及装置 |
CN109525995A (zh) * | 2017-09-20 | 2019-03-26 | 中国移动通信有限公司研究院 | 一种小区识别方法、装置及计算机可读存储介质 |
CN109995583A (zh) * | 2019-03-15 | 2019-07-09 | 清华大学深圳研究生院 | 一种延迟保证的nfv云平台动态扩缩容方法及系统 |
CN110380881A (zh) * | 2018-04-13 | 2019-10-25 | 中国移动通信有限公司研究院 | 一种网络扩容预测方法及装置 |
CN111130908A (zh) * | 2019-12-31 | 2020-05-08 | 中信百信银行股份有限公司 | 基于调用流量分析预测的微服务动态聚合拆分系统 |
CN111294812A (zh) * | 2018-12-10 | 2020-06-16 | 中兴通讯股份有限公司 | 一种资源扩容规划的方法及系统 |
CN111355603A (zh) * | 2018-12-20 | 2020-06-30 | 福建雷盾信息安全有限公司 | 一种计算机流量分析方法 |
CN111711957A (zh) * | 2020-05-27 | 2020-09-25 | 中国联合网络通信集团有限公司 | 基于流量的站点扩容预测方法、装置及系统 |
CN112085282A (zh) * | 2020-09-11 | 2020-12-15 | 中国联合网络通信集团有限公司 | 小区流量预测方法及服务器 |
CN112825576A (zh) * | 2019-11-20 | 2021-05-21 | 中国电信股份有限公司 | 小区扩容的确定方法、装置以及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10367746B2 (en) * | 2017-12-30 | 2019-07-30 | Hughes Network Systems, Llc | Statistical traffic classification with adaptive boundaries in a broadband data communications network |
-
2021
- 2021-10-22 CN CN202111231479.6A patent/CN113762421B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9245538B1 (en) * | 2010-05-20 | 2016-01-26 | Audience, Inc. | Bandwidth enhancement of speech signals assisted by noise reduction |
WO2016061957A1 (zh) * | 2014-10-22 | 2016-04-28 | 中兴通讯股份有限公司 | 一种lte网络业务流量评估方法及装置 |
CN109525995A (zh) * | 2017-09-20 | 2019-03-26 | 中国移动通信有限公司研究院 | 一种小区识别方法、装置及计算机可读存储介质 |
CN108259225A (zh) * | 2017-12-20 | 2018-07-06 | 中国联合网络通信集团有限公司 | 一种网络扩容评估方法、装置和服务器 |
CN110380881A (zh) * | 2018-04-13 | 2019-10-25 | 中国移动通信有限公司研究院 | 一种网络扩容预测方法及装置 |
CN109257758A (zh) * | 2018-10-19 | 2019-01-22 | 中国联合网络通信集团有限公司 | 一种网络扩容方法及装置 |
CN111294812A (zh) * | 2018-12-10 | 2020-06-16 | 中兴通讯股份有限公司 | 一种资源扩容规划的方法及系统 |
CN111355603A (zh) * | 2018-12-20 | 2020-06-30 | 福建雷盾信息安全有限公司 | 一种计算机流量分析方法 |
CN109995583A (zh) * | 2019-03-15 | 2019-07-09 | 清华大学深圳研究生院 | 一种延迟保证的nfv云平台动态扩缩容方法及系统 |
CN112825576A (zh) * | 2019-11-20 | 2021-05-21 | 中国电信股份有限公司 | 小区扩容的确定方法、装置以及存储介质 |
CN111130908A (zh) * | 2019-12-31 | 2020-05-08 | 中信百信银行股份有限公司 | 基于调用流量分析预测的微服务动态聚合拆分系统 |
CN111711957A (zh) * | 2020-05-27 | 2020-09-25 | 中国联合网络通信集团有限公司 | 基于流量的站点扩容预测方法、装置及系统 |
CN112085282A (zh) * | 2020-09-11 | 2020-12-15 | 中国联合网络通信集团有限公司 | 小区流量预测方法及服务器 |
Non-Patent Citations (3)
Title |
---|
Leveraging Broadband Access Expansion for PSTN Migration: A Case Study for Converged Fixed Access;Joseph, JP等;《BELL LABS TECHNICAL JOURNAL》;20120630;第17卷(第01期);141-162 * |
基于云平台的弹性Web集群扩缩容机制的研究;王晓钰 等;《软件》;20171115(第11期);32-36 * |
李银 等.基于负载均衡和自动软扩容的LTE资源调度方法.《电信技术》.2018,(第05期),77-85. * |
Also Published As
Publication number | Publication date |
---|---|
CN113762421A (zh) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240185130A1 (en) | Normalizing text attributes for machine learning models | |
CN113762421B (zh) | 分类模型的训练方法、流量分析方法、装置及设备 | |
CN113570064A (zh) | 利用复合机器学习模型来执行预测的方法及系统 | |
CN108491267B (zh) | 用于生成信息的方法和装置 | |
CN109684047A (zh) | 事件处理方法、装置、设备和计算机存储介质 | |
US20180336368A1 (en) | Anonymity assessment system | |
CN107273979B (zh) | 基于服务级别来执行机器学习预测的方法及系统 | |
WO2019019649A1 (zh) | 投资组合产品的生成方法、装置、存储介质和计算机设备 | |
CN115237802A (zh) | 基于人工智能的模拟测试方法及相关设备 | |
US11645049B2 (en) | Automated software application generation | |
CN111815169A (zh) | 业务审批参数配置方法及装置 | |
CN114004700A (zh) | 业务数据处理方法、装置、电子设备及存储介质 | |
CN114462532A (zh) | 模型训练方法、预测交易风险的方法、装置、设备及介质 | |
CN113268403A (zh) | 时间序列的分析预测方法、装置、设备及存储介质 | |
CN114491093B (zh) | 多媒体资源推荐、对象表征网络的生成方法及装置 | |
CN116739107A (zh) | 基于联邦学习的梯度量化方法、装置、设备及存储介质 | |
CN110035126A (zh) | 一种文件处理方法、装置、计算设备及存储介质 | |
CN115545088B (zh) | 模型构建方法、分类方法、装置和电子设备 | |
CN111859985B (zh) | Ai客服模型测试方法、装置、电子设备及存储介质 | |
CN113495498B (zh) | 用于硬件设备的模拟方法、模拟器、设备和介质 | |
CN113887495A (zh) | 基于迁移学习的视频标注方法及装置 | |
CN107609401A (zh) | 自动测试方法及装置 | |
CN113936677A (zh) | 音色转换方法、装置、计算机设备及存储介质 | |
CN108804640B (zh) | 基于最大化iv的数据分组方法、装置、储存介质及设备 | |
CN114021739B (zh) | 业务处理、业务处理模型训练方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |