CN115934490A - 服务器性能预测模型训练方法、装置、设备及存储介质 - Google Patents

服务器性能预测模型训练方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115934490A
CN115934490A CN202211726681.0A CN202211726681A CN115934490A CN 115934490 A CN115934490 A CN 115934490A CN 202211726681 A CN202211726681 A CN 202211726681A CN 115934490 A CN115934490 A CN 115934490A
Authority
CN
China
Prior art keywords
preset
result
sample
prediction model
server performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211726681.0A
Other languages
English (en)
Inventor
李亮
方鲁杰
张宇
李安昊
徐志亮
袁泉
李锁在
胡春玲
麻双宇
李博
党立军
陈茹萍
姜冰
卢向锋
王江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Clp Hainan United Innovation Research Institute Co ltd
Original Assignee
Clp Hainan United Innovation Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clp Hainan United Innovation Research Institute Co ltd filed Critical Clp Hainan United Innovation Research Institute Co ltd
Priority to CN202211726681.0A priority Critical patent/CN115934490A/zh
Publication of CN115934490A publication Critical patent/CN115934490A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种服务器性能预测模型训练方法、装置、设备及存储介质,涉及模型训练领域,包括:基于预设性能指标数据构造样本标签和样本特征;将样本标签和样本特征输入至预设基学习器进行处理,以得到当前数据预测结果;判断当前数据预测结果是否满足预设结果相关性条件;如果当前数据预测结果满足所述预设结果相关性条件,则将利用当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果;判断目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。这样一来,可以增强服务器性能预测模型的稳定性和泛化能力,提高服务器性能预测结果的准确性。

Description

服务器性能预测模型训练方法、装置、设备及存储介质
技术领域
本发明涉及模型训练领域,特别涉及一种服务器性能预测模型训练方法、装置、设备及存储介质。
背景技术
服务器性能是服务器能否正常工作的重要指标,当服务器性能数据过高时,服务器会无法正常工作,进而对工作与生活造成极大的影响。因此精确地对服务器性能进行预测可以对服务器是否会出现故障进行预警,以便准备好相应的解决方案,将服务器故障所带来的不利影响降到最低。
但目前常用的服务器性能预测方案只能通过少量指标进行线性拟合,当指标较多的时候,很难建立一个稳定的线性模型,并且现有的模型无法处理非线性数据,从而导致目前的服务器性能预测方案难以精确预测服务器的性能,预测结果的准确性较低。
发明内容
有鉴于此,本发明的目的在于提供一种服务器性能预测模型训练方法、装置、设备及存储介质,可以增强服务器性能预测模型的稳定性、鲁棒性和泛化能力,并提高服务器性能预测结果的准确性。其具体方案如下:
第一方面,本申请提供了一种服务器性能预测模型训练方法,包括:
基于预设性能指标数据构造样本标签和样本特征;
将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果;
判断所述当前数据预测结果是否满足预设结果相关性条件;
如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果;
判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。
可选的,所述基于预设性能指标数据构造样本标签和样本特征,包括:
获取预设性能指标数据;
对所述预设性能指标数据进行数据预处理,并根据预处理后的性能指标数据构造样本标签和样本特征。
可选的,所述对所述预设性能指标数据进行数据预处理,并根据预处理后的性能指标数据构造样本标签和样本特征,包括:
针对所述预设性能指标数据进行数据异常值与空值删除操作和/或采用最近邻填补方法进行数据补正操作,以得到预处理后数据;
根据所述预处理后数据以时序性的方式构造样本标签和样本特征。
可选的,所述将所述样本标签和所述样本特征输入至预设基学习器进行处理,包括:
将所述样本标签和所述样本特征以交叉验证的方式输入至预设基学习器进行处理。
可选的,所述判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,包括:
利用预设性能评价指标方法判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件;所述预设性能评价指标方法包括平均相对误差法、相对均方误差法和最大误差法的其中一种或任意种的组合。
可选的,所述判断所述当前数据预测结果是否满足预设结果相关性条件,包括:
利用预设相关性算法对根据所述当前数据预测结果确定出的预测结果误差进行分析,以得到相关性分析结果值;
判断所述相关性分析结果值是否大于预设相关性阈值;
如果所述相关性分析结果值大于所述预设相关性阈值,则判定所述当前数据预测结果满足预设结果相关性条件。
可选的,所述判断所述相关性分析结果值是否大于预设相关性阈值之后,还包括:
如果所述相关性分析结果值不大于所述预设相关性阈值,则重新跳转至将所述样本标签和所述样本特征输入至预设基学习器进行处理的步骤,直到所述当前数据预测结果对应的所述相关性分析结果值大于所述预设相关性阈值。
第二方面,本申请提供了一种服务器性能预测模型训练装置,包括:
样本构造模块,用于基于预设性能指标数据构造样本标签和样本特征;
基学习器处理模块,用于将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果;
第一条件判断模块,用于判断所述当前数据预测结果是否满足预设结果相关性条件;
元学习器处理模块,用于如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果;
第二条件判断模块,用于判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。
第三方面,本申请提供了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现前述的服务器性能预测模型训练方法。
第四方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的服务器性能预测模型训练方法。
本申请中,基于预设性能指标数据构造样本标签和样本特征;将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果;判断所述当前数据预测结果是否满足预设结果相关性条件;如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果;判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。通过上述方案,本申请将基于预设性能指标数据构造的样本标签和样本特征输入至预设基学习器进行处理,根据处理后得到的满足预设结果相关性条件的当前数据预测结果确定出目标数据集,并将所述目标数据集输入至预设元学习器进行处理得到目标学习后结果,判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。这样一来,相比于现有技术,本申请利用集成学习模型的基学习器和元学习器对服务器性能预测模型进行训练,在训练过程中分别对是否满足预设结果相关性条件和是否满足预设服务器性能预测模型训练完成条件进行判断,提高了学习结果的准确性,增强了服务器性能预测模型的稳定性、鲁棒性和泛化能力,从而提高了服务器性能预测结果的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种服务器性能预测模型训练方法流程图;
图2为本申请提供的一种KSSA算法的实现流程示意图;
图3为本申请提供的一种服务器性能预测模型的训练过程示意图;
图4为本申请提供的一种具体的服务器性能预测模型训练方法流程图;
图5为本申请提供的一种服务器性能预测模型训练装置结构示意图;
图6为本申请提供的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前常用的服务器性能预测方案只能通过少量指标进行线性拟合,并且现有的模型无法处理非线性数据,从而导致目前的服务器性能预测方案难以精确预测服务器的性能,预测结果的准确性较低。因此,本申请提出了一种服务器性能预测模型训练方法,可以增强服务器性能预测模型的稳定性、鲁棒性和泛化能力,从而提高服务器性能预测结果的准确性。
参见图1所示,本发明实施例公开了一种服务器性能预测模型训练方法,包括:
步骤S11、基于预设性能指标数据构造样本标签和样本特征。
本实施例中,基于预设性能指标数据构造样本标签和样本特征,其中,所述预设性能指标数据为服务器的历史性能数据。可以理解的是,可以预先获取服务器的工作日志,所述工作日志具体可以包括CPU(central processing unit,中央处理器)运行日志、内存日志、磁盘读写日志、文件系统读写日志、虚拟机性能日志、进程通信性能日志、网络性能日志等日志信息,然后从上述工作日志中筛选出需要的性能指标数据,所述性能指标数据具体可以包括CPU利用率、内存利用率、无线网卡流量、有线网卡流量、线程个数、堆栈大小、缓存个数、JVM(Java Virtual Machine,Java虚拟机)当前堆栈利用率、Server(服务器)请求队列大小、应用当前Session(会话控制对象)个数、表空间使用率、阻塞会话数、当前打开线程数、用户连接数、并发最大连接数、当锁总数、服务器响应时间等数据,然后基于上述性能指标数据构造样本标签和样本特征。其中,所述从上述工作日志中筛选出需要的性能指标数据的过程中,数据筛选可以使用KSSA(K-means Multi-group Sparrow Search Algorithm,基于K-means聚类的多种群麻雀搜索算法)-Apriori关联算法,可以对服务器的影响因素即各指标项和服务器响应时间进行相关性分析操作,以便筛去相关性较小的指标因素。
可以理解的是,KSSA-Apriori关联算法的流程图如图2所示,主要包括使用Kmeans算法优化麻雀搜索算法,在使用Kmeans算法进行聚类前,考虑到此时未开始判断循环也即未开始进行迭代,因此在计算种群位置的各角色位置时与SSA(Sparrow SearchAlgorithm,麻雀搜索算法)一致,并保存此次计算的最佳适应度、初始最优解位置。当使用K-means算法开始聚类时,将上述保存的初始最优解确定为簇中心,并产生以所述簇中心为中心而进行聚拢的新种群个体,从而跳过随机产生初始种群的步骤,直接计算并更新加入者位置,位置计算公式如下所示:
Figure BDA0004030316360000061
其中,Xworst表示最差位置,XP表示最优位置,A表示单元值为1或-1的随机矩阵,且A+=AT(AAT),Xi,j为麻雀i在j维空间的位置,i表示迭代数,t为此刻迭代次数,其他计算依然按照传统的SSA算法进行。
Apriori关联算法是一种采用逐层搜索进行迭代的经典数据挖掘算法,主要用来挖掘频繁项集和关联规则,所述频繁项集指的是满足最小支持度的项集,表征经常一起出现的事物集合,所述关联规则由所述频繁项集生成,表征两种事物间可能存在很强的关系,其中将同时满足最小支持度条件和最小置信度条件的关联规则确定为强规则,也即最终生成的最佳规则,其中支持度的计算公式为:
Figure BDA0004030316360000062
其中,X,Y分别表示某个维度内的两个事务属性,σ(D)表示事务集D的总数目;σ(X∪Y)表示包含X∪Y的事务数目;
置信度的计算公式如下所示:
Figure BDA0004030316360000063
也即计算包含X∪Y事务的条数占含有项集X的事务总数目的比例。
可以预先设置Apriori关联算法中的最小支持度和最小置信度的区间,通过KSSA算法中的适应度值函数来计算最小支持度和最小置信度的最优解空间,其中适应度的函数为:
f(s,c)=α×s+β×c
f(s,c)即为适应度值;s表示最小支持度;c表示最小置信度;α和β分别表示最小支持度和最小置信度所占的权重,权重值越大,则对结果的影响也越大。
将KSSA-Apriori关联算法计算出的关联程度进行排序,然后对与低的关联程度对应的指标进行剔除,从而完成从上述工作日志中筛选出需要的性能指标数据的过程。
需要指出的是,所述基于预设性能指标数据构造样本标签和样本特征,具体可以包括:获取预设性能指标数据;对所述预设性能指标数据进行数据预处理,并根据预处理后的性能指标数据构造样本标签和样本特征。可以理解的是,所述对所述预设性能指标数据进行数据预处理,并根据预处理后的性能指标数据构造样本标签和样本特征,具体可以包括:针对所述预设性能指标数据进行数据异常值与空值删除操作和/或采用最近邻填补方法进行数据补正操作,以得到预处理后数据;根据所述预处理后数据以时序性的方式构造样本标签和样本特征,其中,所述时序性的方式为根据历史数据的欠采样时间间隔进行构造,所述欠采样时间间隔可以根据实际数据处理与模型训练的耗时确定,最后生成服务器性能历史数据表,从而构造样本标签与样本特征。这样一来,对预设性能指标数据进行预处理,并将预处理后的数据以时序性的方式构造出样本标签和样本特征,可以提升模型对样本的学习效果。
步骤S12、将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果。
本实施例中,可以理解的是,所述将所述样本标签和所述样本特征输入至预设基学习器进行处理,具体可以包括:将所述样本标签和所述样本特征以交叉验证的方式输入至预设基学习器进行处理。也即,将所述样本标签和所述样本特征构成的数据进行分组,按照顺序可以随机分成n个部分,其中n的数目与预设基学习器的数目相同,在每个预设基学习器的学习过程中,将用n分之一的数据确定为测试集,其它数据确定为训练集,其中所述训练集用于学习和训练,所述测试集用于在训练完成后进行测试。这样一来,可以在一定程度上减小过拟合,还可以从有限的数据中获取尽可能多的有效信息。
需要指出的是,所述预设基学习器包括极端梯度提升树(extreme gradientboosting,XGBoost)、支持向量机(support vector machine,SVM)、BP(back propagation)神经网络、自适应增强算法(Adaptive Boosting,AdaBoost)、K最邻近算法(K-nearestneighbor,KNN)。
步骤S13、判断所述当前数据预测结果是否满足预设结果相关性条件。
本实施例中,预先设定结果相关性条件,判断利用预设基学习器进行处理之后得到的当前数据预测结果是否满足预设结果相关性条件。
步骤S14、如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果。
本实施例中,如果所述当前数据预测结果满足所述预设结果相关性条件,则利用所述当前数据预测结果确定出目标数据集,并将所述目标数据集输入至预设元学习器进行处理,以得到目标学习后结果。考虑到LSTM(Long Short-Term Memory,长短期记忆)网络的抗干扰与泛化能力较强,可以应用于处理时变非线性问题,因此可以根据LSTM设计预设元学习器,本实施例训练服务器性能预测模型的过程可以如图3所示。
步骤S15、判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。
本实施例中,判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。所述预设服务器性能预测模型训练完成条件可以由用户根据需求进行设定,例如,可以根据所述目标学习后结果和原始数据进行预测评价指标分析,当符合性能评价指标时,判定可以完成服务器性能预测模型训练,并可以使用完成训练的服务器性能预测模型预测未来指定时段预设服务器的性能数据。
可以理解的是,所述判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,具体可以包括:利用预设性能评价指标方法判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件;所述预设性能评价指标方法包括平均相对误差法、相对均方误差法和最大误差法的其中一种或任意种的组合。其中,当采用平均相对误差(mean absolute percentage error,MAPE),相对均方误差(relative mean squareerror,RMSE)和最大误差(max error,ME)三种评价指标进行预测效果评价时,平均相对误差的具体公式如下所示:
Figure BDA0004030316360000081
相对均方误差的具体公式如下所示:
Figure BDA0004030316360000082
最大误差的具体公式如下所示:
ME=max[X(i)-Y(i)]
三个公式中,X(i)与Y(i)分别表示在i时刻的实际值和预测值,n为样本数量。预测性能评价指标中,三者越小代表预测结果越准确。
本实施例中,基于预设性能指标数据构造样本标签和样本特征;将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果;判断所述当前数据预测结果是否满足预设结果相关性条件;如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果;判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。通过上述方案,本申请将基于预设性能指标数据构造的样本标签和样本特征输入至预设基学习器进行处理,根据处理后得到的满足预设结果相关性条件的当前数据预测结果确定出目标数据集,并将所述目标数据集输入至预设元学习器进行处理得到目标学习后结果,判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。这样一来,相比于现有技术,本申请利用集成学习模型的基学习器和元学习器对服务器性能预测模型进行训练,在训练过程中分别对是否满足预设结果相关性条件和是否满足预设服务器性能预测模型训练完成条件进行判断,提高了学习结果的准确性,增强了服务器性能预测模型的稳定性、鲁棒性和泛化能力,从而提高了服务器性能预测结果的准确性。
参见图4所示,本发明实施例公开了一种具体的服务器性能预测模型训练方法,包括:
步骤S21、基于预设性能指标数据构造样本标签和样本特征。
步骤S22、将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果。
步骤S23、利用预设相关性算法对根据所述当前数据预测结果确定出的预测结果误差进行分析,以得到相关性分析结果值。
本实施例中,可以理解的是,所述预设相关性算法包括斯皮尔曼相关性算法,斯皮尔曼相关性分析的计算公式如下所示:
Figure BDA0004030316360000101
其中,x,y分别表示不同向量元素,
Figure BDA0004030316360000102
Figure BDA0004030316360000103
代表各向量元素的平均值。根据上述斯皮尔曼相关性计算公式对每个预设基学习器输出的预测结果和原数据的误差进行斯皮尔曼相关性分析,进行所述预设基学习器之间的相关性的判断,并得到相关性分析结果值。
步骤S24、判断所述相关性分析结果值是否大于预设相关性阈值。
本实施例中,判断所述相关性分析结果值是否大于预设相关性阈值,所述预设相关性阈值可以由用户根据自身需求进行设定,例如可以将所述预设相关性阈值设定为0.8,则本申请会判断所述相关性分析结果值是否大于0.8。
可以理解的是,所述判断所述相关性分析结果值是否大于预设相关性阈值之后,具体还可以包括:如果所述相关性分析结果值不大于所述预设相关性阈值,则重新跳转至将所述样本标签和所述样本特征输入至预设基学习器进行处理的步骤,直到所述当前数据预测结果对应的所述相关性分析结果值大于所述预设相关性阈值。也即,若所述相关性分析结果值不大于所述预设相关性阈值,则表征当前数据预测结果的相关性较低,此时重新跳转至将所述样本标签和所述样本特征输入至预设基学习器进行处理的步骤,得到新的当前数据预测结果,直到所述当前数据预测结果对应的所述相关性分析结果值大于所述预设相关性阈值。
步骤S25、如果所述相关性分析结果值大于所述预设相关性阈值,则判定所述当前数据预测结果满足预设结果相关性条件。
步骤S26、如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果。
步骤S27、判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。
关于步骤S21、步骤S22、步骤S26和步骤S27的具体实施方式可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本实施例中,基于预设性能指标数据构造样本标签和样本特征;将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果;利用预设相关性算法对根据所述当前数据预测结果确定出的预测结果误差进行分析,以得到相关性分析结果值;判断所述相关性分析结果值是否大于预设相关性阈值;如果所述相关性分析结果值大于所述预设相关性阈值,则判定所述当前数据预测结果满足预设结果相关性条件;如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果;判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。这样一来,本申请利用预设相关性算法对预设基学习器输出的当前数据预测结果进行分析,当相关性分析结果值大于预设相关性阈值时判定所述当前数据预测结果满足预设结果相关性条件,提高了学习结果的准确性,从而提高了服务器性能预测结果的准确性。
参见图5所示,本申请公开了一种服务器性能预测模型训练装置,包括:
样本构造模块11,用于基于预设性能指标数据构造样本标签和样本特征;
基学习器处理模块12,用于将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果;
第一条件判断模块13,用于判断所述当前数据预测结果是否满足预设结果相关性条件;
元学习器处理模块14,用于如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果;
第二条件判断模块15,用于判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。
本申请中,基于预设性能指标数据构造样本标签和样本特征;将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果;判断所述当前数据预测结果是否满足预设结果相关性条件;如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果;判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。通过上述方案,本申请将基于预设性能指标数据构造的样本标签和样本特征输入至预设基学习器进行处理,根据处理后得到的满足预设结果相关性条件的当前数据预测结果确定出目标数据集,并将所述目标数据集输入至预设元学习器进行处理得到目标学习后结果,判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。这样一来,相比于现有技术,本申请利用集成学习模型的基学习器和元学习器对服务器性能预测模型进行训练,在训练过程中分别对是否满足预设结果相关性条件和是否满足预设服务器性能预测模型训练完成条件进行判断,提高了学习结果的准确性,增强了服务器性能预测模型的稳定性、鲁棒性和泛化能力,从而提高了服务器性能预测结果的准确性。
在一些具体实施例中,所述样本构造模块11,具体可以包括:
性能指标数据获取单元,用于获取预设性能指标数据;
预处理数据构造子模块,用于对所述预设性能指标数据进行数据预处理,并根据预处理后的性能指标数据构造样本标签和样本特征。
在一些具体实施例中,所述数据预处理子模块,具体可以包括:
数据预处理单元,用于针对所述预设性能指标数据进行数据异常值与空值删除操作和/或采用最近邻填补方法进行数据补正操作,以得到预处理后数据;
构造样本单元,用于根据所述预处理后数据以时序性的方式构造样本标签和样本特征。
在一些具体实施例中,所述基学习器处理模块12,具体可以包括:
数据交叉输入单元,用于将所述样本标签和所述样本特征以交叉验证的方式输入至预设基学习器进行处理。
在一些具体实施例中,所述第二条件判断模块15,具体可以包括:
性能评价单元,用于利用预设性能评价指标方法判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件;所述预设性能评价指标方法包括平均相对误差法、相对均方误差法和最大误差法的其中一种或任意种的组合。
在一些具体实施例中,所述第一条件判断模块13,具体可以包括:
相关性分析单元,用于利用预设相关性算法对根据所述当前数据预测结果确定出的预测结果误差进行分析,以得到相关性分析结果值;
相关性结果值判断单元,用于判断所述相关性分析结果值是否大于预设相关性阈值;
第一判断结果判定单元,用于如果所述相关性分析结果值大于所述预设相关性阈值,则判定所述当前数据预测结果满足预设结果相关性条件。
在一些具体实施例中,所述服务器性能预测模型训练装置,具体还可以包括:
步骤跳转单元,用于如果所述相关性分析结果值不大于所述预设相关性阈值,则重新跳转至将所述样本标签和所述样本特征输入至预设基学习器进行处理的步骤,直到所述当前数据预测结果对应的所述相关性分析结果值大于所述预设相关性阈值。
进一步的,本申请实施例还公开了一种电子设备,图6是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图6为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的服务器性能预测模型训练方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的服务器性能预测模型训练方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的服务器性能预测模型训练方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种服务器性能预测模型训练方法,其特征在于,包括:
基于预设性能指标数据构造样本标签和样本特征;
将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果;
判断所述当前数据预测结果是否满足预设结果相关性条件;
如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果;
判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。
2.根据权利要求1所述的服务器性能预测模型训练方法,其特征在于,所述基于预设性能指标数据构造样本标签和样本特征,包括:
获取预设性能指标数据;
对所述预设性能指标数据进行数据预处理,并根据预处理后的性能指标数据构造样本标签和样本特征。
3.根据权利要求2所述的服务器性能预测模型训练方法,其特征在于,所述对所述预设性能指标数据进行数据预处理,并根据预处理后的性能指标数据构造样本标签和样本特征,包括:
针对所述预设性能指标数据进行数据异常值与空值删除操作和/或采用最近邻填补方法进行数据补正操作,以得到预处理后数据;
根据所述预处理后数据以时序性的方式构造样本标签和样本特征。
4.根据权利要求1所述的服务器性能预测模型训练方法,其特征在于,所述将所述样本标签和所述样本特征输入至预设基学习器进行处理,包括:
将所述样本标签和所述样本特征以交叉验证的方式输入至预设基学习器进行处理。
5.根据权利要求1所述的服务器性能预测模型训练方法,其特征在于,所述判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,包括:
利用预设性能评价指标方法判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件;所述预设性能评价指标方法包括平均相对误差法、相对均方误差法和最大误差法的其中一种或任意种的组合。
6.根据权利要求1至5任一项所述的服务器性能预测模型训练方法,其特征在于,所述判断所述当前数据预测结果是否满足预设结果相关性条件,包括:
利用预设相关性算法对根据所述当前数据预测结果确定出的预测结果误差进行分析,以得到相关性分析结果值;
判断所述相关性分析结果值是否大于预设相关性阈值;
如果所述相关性分析结果值大于所述预设相关性阈值,则判定所述当前数据预测结果满足预设结果相关性条件。
7.根据权利要求6所述的服务器性能预测模型训练方法,其特征在于,所述判断所述相关性分析结果值是否大于预设相关性阈值之后,还包括:
如果所述相关性分析结果值不大于所述预设相关性阈值,则重新跳转至将所述样本标签和所述样本特征输入至预设基学习器进行处理的步骤,直到所述当前数据预测结果对应的所述相关性分析结果值大于所述预设相关性阈值。
8.一种服务器性能预测模型训练装置,其特征在于,包括:
样本构造模块,用于基于预设性能指标数据构造样本标签和样本特征;
基学习器处理模块,用于将所述样本标签和所述样本特征输入至预设基学习器进行处理,以得到当前数据预测结果;
第一条件判断模块,用于判断所述当前数据预测结果是否满足预设结果相关性条件;
元学习器处理模块,用于如果所述当前数据预测结果满足所述预设结果相关性条件,则将利用所述当前数据预测结果确定出的目标数据集输入至预设元学习器进行处理,以得到目标学习后结果;
第二条件判断模块,用于判断所述目标学习后结果是否满足预设服务器性能预测模型训练完成条件,并基于判断结果确定是否完成服务器性能预测模型训练。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至7任一项所述的服务器性能预测模型训练方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的服务器性能预测模型训练方法。
CN202211726681.0A 2022-12-30 2022-12-30 服务器性能预测模型训练方法、装置、设备及存储介质 Pending CN115934490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211726681.0A CN115934490A (zh) 2022-12-30 2022-12-30 服务器性能预测模型训练方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211726681.0A CN115934490A (zh) 2022-12-30 2022-12-30 服务器性能预测模型训练方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115934490A true CN115934490A (zh) 2023-04-07

Family

ID=86552343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211726681.0A Pending CN115934490A (zh) 2022-12-30 2022-12-30 服务器性能预测模型训练方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115934490A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116701127A (zh) * 2023-08-09 2023-09-05 睿至科技集团有限公司 一种基于大数据的应用性能监控方法及平台
CN117807411A (zh) * 2024-02-29 2024-04-02 济南浪潮数据技术有限公司 一种服务器性能指标预测方法、装置、电子设备
CN117807411B (zh) * 2024-02-29 2024-06-07 济南浪潮数据技术有限公司 一种服务器性能指标预测方法、装置、电子设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116701127A (zh) * 2023-08-09 2023-09-05 睿至科技集团有限公司 一种基于大数据的应用性能监控方法及平台
CN116701127B (zh) * 2023-08-09 2023-12-19 睿至科技集团有限公司 一种基于大数据的应用性能监控方法及平台
CN117807411A (zh) * 2024-02-29 2024-04-02 济南浪潮数据技术有限公司 一种服务器性能指标预测方法、装置、电子设备
CN117807411B (zh) * 2024-02-29 2024-06-07 济南浪潮数据技术有限公司 一种服务器性能指标预测方法、装置、电子设备

Similar Documents

Publication Publication Date Title
US8775338B2 (en) Computer-implemented systems and methods for constructing a reduced input space utilizing the rejected variable space
CN111310860B (zh) 改进梯度提升决策树性能的方法及计算机可读存储介质
CN111160959B (zh) 一种用户点击转化预估方法及装置
CN111310799B (zh) 一种基于历史评估结果的主动学习方法
CN111563158B (zh) 文本排序方法、排序装置、服务器和计算机可读存储介质
CN111242387A (zh) 一种人才离职预测方法、装置、电子设备及存储介质
CN115934490A (zh) 服务器性能预测模型训练方法、装置、设备及存储介质
CN113239702A (zh) 意图识别方法、装置、电子设备
CN114138977A (zh) 日志处理方法、装置、计算机设备和存储介质
CN112949746B (zh) 应用于用户行为分析的大数据处理方法及人工智能服务器
CN113591998A (zh) 分类模型的训练和使用方法、装置、设备以及存储介质
CN112099889A (zh) 一种信息显示方法、设备、装置及存储介质
CN111046156A (zh) 奖励数据的确定方法、装置和服务器
CN115600818A (zh) 多维评分方法、装置、电子设备和存储介质
KR102284440B1 (ko) 딥러닝 모델 거래중개서버에 의해서 수행되는 딥러닝 모델 거래를 중개하는 방법
CN113033938B (zh) 确定资源分配策略的方法、装置、终端设备及存储介质
US20220292393A1 (en) Utilizing machine learning models to generate initiative plans
CN114444654A (zh) 一种面向nas的免训练神经网络性能评估方法、装置和设备
US20210365831A1 (en) Identifying claim complexity by integrating supervised and unsupervised learning
CN109978038B (zh) 一种集群异常判定方法及装置
CN113919510A (zh) 一种样本特征选择方法、装置、设备及介质
CN112801226A (zh) 数据筛选方法和装置、计算机可读存储介质、电子设备
CN115146258B (zh) 请求处理方法、装置、存储介质及电子设备
CN117390465B (zh) 一种工作负载预测方法
US20240185130A1 (en) Normalizing text attributes for machine learning models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination