CN110333991A - 云平台任务最大资源使用率预测方法 - Google Patents

云平台任务最大资源使用率预测方法 Download PDF

Info

Publication number
CN110333991A
CN110333991A CN201910461547.4A CN201910461547A CN110333991A CN 110333991 A CN110333991 A CN 110333991A CN 201910461547 A CN201910461547 A CN 201910461547A CN 110333991 A CN110333991 A CN 110333991A
Authority
CN
China
Prior art keywords
task
maximum
utilization rate
resource utilization
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910461547.4A
Other languages
English (en)
Other versions
CN110333991B (zh
Inventor
邓莉
任雨林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Science and Engineering WUSE
Original Assignee
Wuhan University of Science and Engineering WUSE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Science and Engineering WUSE filed Critical Wuhan University of Science and Engineering WUSE
Priority to CN201910461547.4A priority Critical patent/CN110333991B/zh
Publication of CN110333991A publication Critical patent/CN110333991A/zh
Application granted granted Critical
Publication of CN110333991B publication Critical patent/CN110333991B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开云平台中任务在未来一段时间内的最大资源使用率预测方法,基于云平台多个任务的历史资源使用信息,通过分析云平台任务的资源使用情况提取初步任务资源使用特征,然后使用稀疏自编码模型进一步提取特征,接着使用K‑medoids聚类方法对任务进行聚类,并对每一个任务类别使用改进的随机森林回归模型进行训练,最后,基于给定的任务在最近一段时间内的资源使用率历史信息,就可以利用训练好的模型预测出该任务在未来一段时间内的最大资源使用率。同时,根据云平台任务的资源使用特征,本发明也设计了适合任务的资源使用预测性能评价函数——改进的平均绝对百分比误差,该评价函数更能直观反映出不同的任务资源使用预测方法的性能差异。

Description

云平台任务最大资源使用率预测方法
技术领域
本发明涉及云计算领域,尤其涉及云平台中一种任务最大资源使用率预测方法。
背景技术
虽然云计算提供了便捷灵活的资源管理方式,但是现有大多数云平台的资源使用率依然较为低下,比如,Twitter云平台千台服务器在一个月内的总CPU使用率始终低于20%,然而预留的资源却达到了总资源的80%;Google云平台CPU平均使用率在10%~45%之间波动。预测任务的资源使用状况是提高云平台资源使用率的重要手段之一。但是云平台任务资源使用的动态性、不确定性和突变性使得预测工作变得困难。现有的大部分相关研究都是基于仿真数据而展开的,最终的实验结果缺乏有效的说服性。而针对真实云平台数据集,目前已提出了利用反向传播神经网络模型、随机森林回归模型(Breiman L.Randomforests[J].Machine learning,2001,45(1):5-32)进行任务负载预测,但是由于这些模型没有充分考虑到云平台任务资源使用的特点,造成预测的性能有待进一步提高。
稀疏自编码模型(Andrew Ng."Sparse autoencoder."CS294A Lecturenotes72.2011(2011):1-19.)可以自动从无标签样本数据中学习特征,可以进一步提升预测模型的准确度。K-medoids聚类方法(Park H S,Jun C H.A simple and fast algorithmfor K-medoids clustering[J].Expert systems with applications,2009,36(2):3336-3341.)以样本中的数据为中心,对样本中的异常值具有较好的鲁棒性。
发明内容
本发明的目的在于提供一种具有较低的平均绝对误差和较低的改进平均绝对百分比误差的云平台任务最大资源使用率预测方法。
改进的平均绝对百分比误差公式如下所示:
其中,
R表示测试样本数量,a1和a2是两个实参数,且a1<a2,hi表示测试样本集中样本i的目标真实值,Hi表示测试样本集中样本i的目标预测值。
为解决上述问题,本发明的云平台任务最大资源使用率预测方法采用了如下技术方案:
云平台任务最大资源使用率预测方法,包括如下步骤:
S1、先对云平台任务资源使用状况历史数据集中缺失的数据进行填充,然后统计各任务在时间间隔为T内的平均资源使用率和最大资源使用率,其中,平均资源使用率包括平均CPU使用率、平均内存使用率,最大资源使用率包括最大CPU使用率、最大内存使用率;
S2、使用n个连续计时周期,每个计时周期时长为T,基于n个计时周期内任务的最大资源使用率提取任务的加权最大资源使用率和最大资源使用率的公平性指数,其中,加权最大资源使用率包括加权最大CPU使用率、加权最大内存使用率,最大资源使用率的公平性指数包括最大CPU使用率公平性指数、最大内存使用率公平性指数;
S3、将上述n个计时周期内的平均资源使用率和最大资源使用率、基于n个周期的加权最大资源使用率和最大资源使用率的公平性指数、任务的优先级作为样本的特征集Z’,并将每个特征在所有任务中的最大值保持在Mi中,i为特征的序号且Mi≠0,接着对所有任务的每个特征各自进行归一化处理,然后将其结果作为样本的初始数据集;
S4、基于上述样本的特征集和初始数据集,使用稀疏自编码模型进一步提取任务特征,得到新的特征集Z={z1,z2,…,zf},结合各任务的这些特征值以及第(n+1)个计时周期内的最大CPU使用率或者最大内存使用率得到新的样本数据集D,其中,第(n+1)个计时周期内的最大CPU使用率或者最大内存使用率是样本的目标变量;
S5、基于步骤S4中得到的样本数据集D,使用K-medoids聚类算法将任务分成L类,得到L个样本数据子集,每一类别都有一个中心任务ci,i=1,2,…,L;
S6、按照一定比例(b1:b2)将每一类样本数据子集分成训练集和测试集两个部分,其中b1、b2为正实数,且b1>b2;这样,就得到L个训练集和测试集的组合;
S7、基于每一类样本数据子集中的训练集数据,使用改进的随机森林回归模型进行训练,得到L个已训练好的改进的随机森林回归模型;
S8、基于对应的测试集数据,使用改进的平均绝对百分比误差对已训练好的改进的随机森林回归模型进行性能评价,改进的平均绝对百分比误差公式如下所示:
其中,
R表示测试样本数量,a1和a2是两个正实参数,且a1<a2,hi表示测试样本集中样本i的目标真实值,Hi表示测试样本集中样本i的目标预测值;
S9、给定需预测的任务在最近连续时间段(n×T)内等距离监测点下的最大资源使用率和平均资源使用率,确定该任务的类别;
S10、使用步骤9得到的任务类别对应的已经训练好的改进的随机森林回归模型,对任务进行预测。
进一步的,步骤S1具体包括:
S10:对于云平台任务资源使用状况历史数据集中的缺失数据,先进行填充;
S11:计算时间段T内K个等距离监测点下的任务的平均CPU使用率的算术平均值,作为该时间段T内的任务的平均CPU使用率;
S12:计算时间段T内K个等距离监测点下的任务的平均内存使用率的算术平均值,作为该时间段T内的任务的平均内存使用率;
S13:从时间段T内K个等距离监测点下的任务的最大CPU使用率中取最大值,作为该时间段T内的任务的最大CPU使用率;
S14:从时间段T内K个等距离监测点下的任务的最大内存使用率中取最大值,作为该时间段T内的任务的最大内存使用率。
进一步的,步骤S2具体包括:
S20:基于步骤S1得到的任务在时间段(n×T)内的n个最大CPU使用率,计算任务的加权最大CPU使用率;
S21:基于步骤S1得到的任务在时间段(n×T)内的n个最大内存使用率,计算任务的加权最大内存使用率;
S22:基于步骤S1得到的任务在时间段(n×T)内的n个最大CPU使用率,计算任务的最大CPU使用率的公平性指数;
S23:基于步骤S1得到的任务在时间段(n×T)内的n个最大内存使用率,计算任务的最大内存使用率的公平性指数;
进一步的,步骤S7具体包括:
S70:使用以下的函数作为改进的随机森林回归模型特征值对选择函数:
其中,
其中,Xm是当前训练样本集合,Nm是当前训练样本集合包含的样本数,i为样本集合中一个样本的编号,k1和k2是两个正实参数,且k1<k2;yi是样本i的目标值,是当前训练样本集合中所有目标值的算数平均数;
S71:基于步骤S6得到的每一个训练集,分别使用步骤S70所述的改进的随机森林回归模型进行训练,得到L个不同的改进的随机森林回归模型。
进一步的,步骤S9具体包括:
S90:对于任务在最近连续时间段(n×T)内的最大资源使用率和平均资源使用率,如果存在缺失数据,先进行填充,然后,统计该任务在时间间隔为T内的平均资源使用率和最大资源使用率;
S91:使用步骤S2所述方法,计算该任务的加权最大资源使用率和最大资源使用率的公平性指数;
S92:将步骤3的Z’作为该任务的初始特征集,使用步骤3得到的Mi对这些特征值各自进行归一化处理;
S93:以步骤4得到的新特征集Z={z1,z2,…,zf},作为该任务的新特征集;
S94:基于任务的新特征值,计算该任务分别与步骤5得到的各类中心任务ci的距离,i=1,2,…,L,该任务距离最近的中心任务所在的类别,即为该任务所属的类别。
进一步的,步骤S10具体包括:
S100:根据步骤S9得到的任务类别,选择对应的已训练好的改进随机森林回归模型;
S101:将该任务的新特征值,作为步骤S100确定的改进随机森林回归模型的输入,即可得到任务在未来T时间段内的最大CPU使用率或者最大内存使用率。
本发明云平台任务最大资源使用率预测方法,基于云平台的任务资源使用历史信息,通过上述步骤,较为准确地预测出云平台任务的最大资源使用率,该预测方法具有较低的平均绝对误差和较低的改进平均绝对百分比误差,并为资源的有效管理和调度提供了重要信息。
附图说明
图1为本发明云平台任务最大资源使用率预测方法的处理流程图。
具体实施方式
为了进一步理解本发明,下面结合实施例对本发明优选实施方案进行描述,但是应当理解,这些描述只是为进一步说明本发明的特征和优点,而不是对本发明权利要求的限制。
本发明的基本思想是:首先,对云平台任务的资源使用历史数据进行预处理,将根据云平台任务的资源使用特点提取的任务特征通过稀疏自编码模型进一步提取特征;然后,使用K-medoids聚类算法对任务进行聚类;接着,使用改进的随机森林回归模型分别对不同的样本训练集进行训练,训练完成后,用改进的平均绝对百分比误差评价已训练好的随机森林回归模型的性能;最后,根据要预测任务的类别,选择对应的已训练好的随机森林回归模型来预测任务的最大资源使用率。
为了实现上述方案,在一个实施例中,本发明的方法采用了如下步骤:
步骤1:先对云平台任务资源使用状况历史数据集中缺失的数据进行填充,然后统计各任务在时间间隔为60分钟内的平均资源使用率和最大资源使用率,其中,平均资源使用率包括平均CPU使用率、平均内存使用率,最大资源使用率包括最大CPU使用率、最大内存使用率;
具体步骤如下:
步骤1.1:对于云平台任务资源使用状况历史数据集中的缺失数据,采用向前填充的方法;
步骤1.2:计算60分钟内12个等距离监测点下的任务的平均CPU使用率的算术平均值,作为该60分钟内的任务的平均CPU使用率;
步骤1.3:计算60分钟内12个等距离监测点下的任务的平均内存使用率的算术平均值,作为该60分钟内的任务的平均内存使用率;
步骤1.4:从60分钟内12个等距离监测点下的任务的最大CPU使用率中取最大值,作为该60分钟内的任务的最大CPU使用率;
步骤1.5:从60分钟内12个等距离监测点下的任务的最大内存使用率中取最大值,作为该60分钟内的任务的最大内存使用率;
步骤2:使用6个连续计时周期,每个计时周期时长为60分钟,基于6个计时周期内任务的最大资源使用率提取任务的加权最大资源使用率和最大资源使用率的公平性指数,其中,加权最大资源使用率包括加权最大CPU使用率、加权最大内存使用率,最大资源使用率的公平性指数包括最大CPU使用率的公平性指数、最大内存使用率的公平性指数;
具体步骤如下:
步骤2.1:基于步骤1得到的任务在连续360分钟内的6个最大CPU使用率,计算任务的加权最大CPU使用率G1(x),相应的计算公式如下所示:
其中,x1、x2、…、x6分别表示按时间先后次序排列的最大CPU使用率;
步骤2.2:基于步骤1得到的任务在连续360分钟内的6个最大内存使用率,计算任务的加权最大内存使用率G2(x),相应的计算公式如下所示:
其中,x1、x2、…、x6分别表示按时间先后次序排列的最大内存使用率;
步骤2.3:基于步骤1得到的任务在连续360分钟内的6个最大CPU使用率,计算任务的最大CPU使用率的公平性指数F1(x),相应的计算公式如下所示:
其中,x1、x2、…、x6分别表示按时间先后次序排列的最大CPU使用率;
步骤2.4:基于步骤1得到的任务在连续360分钟内的6个最大内存使用率,计算任务的最大内存使用率的公平性指数F2(x),相应的计算公式如下所示:
其中,x1、x2、…、x6分别表示按时间先后次序排列的最大内存使用率;
步骤3:在预测任务的最大CPU使用率时,将上述6个计时周期内的平均CPU使用率和最大资源使用率、基于6个周期的加权最大CPU使用率和最大CPU使用率的公平性指数、任务的优先级作为样本的特征集Z’,而在预测任务的最大内存使用率时,将上述6个计时周期内的平均内存使用率和最大资源使用率、基于6个周期的加权最大内存使用率和最大内存使用率的公平性指数、任务的优先级作为样本的特征集Z’,并将每个特征在所有任务中的最大值保持在Mi中,i为特征的序号且Mi≠0,接着对所有任务的每个特征各自进行归一化处理,然后将其结果作为样本的初始数据集;
步骤4:基于上述样本的特征集和初始数据集,使用稀疏自编码模型进一步提取任务特征,得到新的特征集Z={z1,z2,…,zf},结合各任务的这些特征值以及第7个计时周期内的最大CPU使用率或者最大内存使用率得到新的样本数据集D,其中,第7个计时周期内的最大CPU使用率或者最大内存使用率是样本的目标变量;
步骤5:基于步骤4中得到的样本数据集D,使用K-medoids聚类算法将任务分成4类,得到4个样本数据子集,每一类别都有一个中心任务ci,i=1,2,…,4,两个任务之间的距离计算采用动态时间规整算法;
步骤6:按照(8:2)的比例将每一类样本数据子集分成训练集和测试集两个部分,这样,就得到4个训练集和测试集的组合;
步骤7:基于每一类样本数据子集中的训练集数据,使用改进的随机森林回归模型进行训练,得到4个已训练好的改进的随机森林回归模型;
具体步骤如下:
步骤7.1:使用以下的函数作为改进的随机森林回归模型特征值对选择函数:
其中,
其中,Xm是当前训练样本集合,Nm是当前训练样本集合包含的样本数,i为样本集合中一个样本的编号;yi是样本i的目标值,是当前训练样本集合中所有目标值的算数平均数;
步骤7.2:基于步骤6得到的每一个训练集,分别使用步骤7.1所述的改进的随机森林回归模型进行训练,得到4个不同的改进的随机森林回归模型。
步骤8:基于对应的测试集数据,使用改进的平均绝对百分比误差对已训练好的改进的随机森林回归模型进行性能评价,改进的平均绝对百分比误差公式如下所示:
其中,
R表示测试样本数量,hi表示测试样本集中样本i的目标真实值,Hi表示测试样本集中样本i的目标预测值;
步骤9:给定需预测的任务在最近连续360分钟内等距离监测点下的最大资源使用率和平均资源使用率,确定该任务的类别;
具体步骤如下:
步骤9.1:对于任务在最近连续360分钟内的最大资源使用率和平均资源使用率,如果存在缺失数据,先进行填充,然后,统计该任务在连续60分钟内的平均资源使用率和最大资源使用率;
步骤9.2:使用步骤2所述方法,计算该任务的加权最大资源使用率和最大资源使用率的公平性指数;
步骤9.3:将步骤3的Z’作为该任务的初始特征集,使用步骤3得到的Mi对这些特征值各自进行归一化处理;
步骤9.4:以步骤4得到的新特征集Z={z1,z2,…,zf},作为该任务的新特征集;
步骤9.5:基于任务的新特征值,计算该任务分别与步骤5得到的各类中心任务ci的距离,i=1,2,…,4,该任务距离最近的中心任务所在的类别,即为该任务所属的类别;
步骤10:使用步骤9得到的任务类别对应的已经训练好的改进的随机森林回归模型,对任务进行预测。
具体步骤如下:
步骤10.1:根据步骤9得到的任务类别,选择对应的已训练好的改进随机森林回归模型;
步骤10.2:将该任务的新特征值,作为步骤10.1确定的改进随机森林回归模型的输入,即可得到任务在未来60分钟内的最大CPU使用率或者最大内存使用率。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (6)

1.云平台任务最大资源使用率预测方法,其特征在于,包括如下步骤:
S1、先对云平台任务资源使用状况历史数据集中缺失的数据进行填充,然后统计各任务在时间间隔为T内的平均资源使用率和最大资源使用率,其中,平均资源使用率包括平均CPU使用率、平均内存使用率,最大资源使用率包括最大CPU使用率、最大内存使用率;
S2、使用n个连续计时周期,每个计时周期时长为T,基于n个计时周期内任务的最大资源使用率提取任务的加权最大资源使用率和最大资源使用率的公平性指数,其中,加权最大资源使用率包括加权最大CPU使用率、加权最大内存使用率,最大资源使用率的公平性指数包括最大CPU使用率的公平性指数、最大内存使用率的公平性指数;
S3、将上述n个计时周期内的平均资源使用率和最大资源使用率、基于n个周期的加权最大资源使用率和最大资源使用率的公平性指数、任务的优先级作为样本的特征集Z’,并将每个特征在所有任务中的最大值保持在Mi中,i为特征的序号且Mi≠0,接着对所有任务的每个特征各自进行归一化处理,然后将其结果作为样本的初始数据集;
S4、基于上述样本的特征集和初始数据集,使用稀疏自编码模型进一步提取任务特征,得到新的特征集Z={z1,z2,…,zf},结合各任务的这些特征值以及第(n+1)个计时周期内的最大CPU使用率或者最大内存使用率得到新的样本数据集D,其中,第(n+1)个计时周期内的最大CPU使用率或者最大内存使用率是样本的目标变量;
S5、基于步骤S4中得到的样本数据集D,使用K-medoids聚类算法将任务分成L类,得到L个样本数据子集,每一类别都有一个中心任务ci,i=1,2,…,L;
S6、按照一定比例(b1:b2)将每一类样本数据子集分成训练集和测试集两个部分,其中b1、b2为正实数,且b1>b2;这样,就得到L个训练集和测试集的组合;
S7、基于每一类样本数据子集中的训练集数据,使用改进的随机森林回归模型进行训练,得到L个已训练好的改进的随机森林回归模型;
S8、基于对应的测试集数据,使用改进的平均绝对百分比误差对已训练好的改进的随机森林回归模型进行性能评价,改进的平均绝对百分比误差公式如下所示:
其中,
R表示测试样本数量,a1和a2是两个正实参数,且a1<a2,hi表示测试样本集中样本i的目标真实值,Hi表示测试样本集中样本i的目标预测值;
S9、给定需预测的任务在最近连续时间段(n×T)内等距离监测点下的最大资源使用率和平均资源使用率,确定该任务的类别;
S10、使用步骤9得到的任务类别对应的已经训练好的改进的随机森林回归模型,对任务进行预测。
2.根据权利要求1所述的云平台任务最大资源使用率预测方法,其特征在于,步骤S1具体包括:
S10:对于云平台任务资源使用状况历史数据集中的缺失数据,先进行填充;
S11:计算时间段T内K个等距离监测点下的任务的平均CPU使用率的算术平均值,作为该时间段T内的任务的平均CPU使用率;
S12:计算时间段T内K个等距离监测点下的任务的平均内存使用率的算术平均值,作为该时间段T内的任务的平均内存使用率;
S13:从时间段T内K个等距离监测点下的任务的最大CPU使用率中取最大值,作为该时间段T内的任务的最大CPU使用率;
S14:从时间段T内K个等距离监测点下的任务的最大内存使用率中取最大值,作为该时间段T内的任务的最大内存使用率。
3.根据权利要求1所述的云平台任务最大资源使用率预测方法,其特征在于,步骤S2具体包括:
S20:基于步骤S1得到的任务在时间段(n×T)内的n个最大CPU使用率,计算任务的加权最大CPU使用率;
S21:基于步骤S1得到的任务在时间段(n×T)内的n个最大内存使用率,计算任务的加权最大内存使用率;
S22:基于步骤S1得到的任务在时间段(n×T)内的n个最大CPU使用率,计算任务的最大CPU使用率的公平性指数;
S23:基于步骤S1得到的任务在时间段(n×T)内的n个最大内存使用率,计算任务的最大内存使用率的公平性指数。
4.根据权利要求1所述的云平台任务最大资源使用预测方法,其特征在于,步骤S7具体包括:
S70:使用以下的函数作为改进的随机森林回归模型特征值对选择函数:
其中,
其中,Xm是当前训练样本集合,Nm是当前训练样本集合包含的样本数,i为样本集合中一个样本的编号,k1和k2是两个正实参数,且k1<k2;yi是样本i的目标值,是当前训练样本集合中所有目标值的算数平均数;
S71:基于步骤S6得到的每一个训练集,分别使用步骤S70所述的改进的随机森林回归模型进行训练,得到L个不同的改进的随机森林回归模型。
5.根据权利要求1所述的云平台任务最大资源使用率预测方法,其特征在于,步骤S9具体包括:
S90:对于任务在最近连续时间段(n×T)内的最大资源使用率和平均资源使用率,如果存在缺失数据,先进行填充,然后,统计该任务在时间间隔为T内的平均资源使用率和最大资源使用率;
S91:使用步骤S2所述方法,计算该任务的加权最大资源使用率和最大资源使用率的公平性指数;
S92:将步骤3的Z’作为该任务的初始特征集,使用步骤3得到的Mi对这些特征值各自进行归一化处理;
S93:以步骤4得到的新特征集Z={z1,z2,…,zf},作为该任务的新特征集;
S94:基于任务的新特征值,计算该任务分别与步骤5得到的各类中心任务ci的距离,i=1,2,…,L,该任务距离最近的中心任务所在的类别,即为该任务所属的类别。
6.根据权利要求1所述的云平台任务最大资源使用率预测方法,其特征在于,步骤S10具体包括:
S100:根据步骤S9得到的任务类别,选择对应的已训练好的改进随机森林回归模型;
S101:将该任务的新特征值,作为步骤S100确定的改进随机森林回归模型的输入,即可得到任务在未来T时间段内的最大CPU使用率或者最大内存使用率。
CN201910461547.4A 2019-05-30 2019-05-30 云平台任务最大资源使用率预测方法 Active CN110333991B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910461547.4A CN110333991B (zh) 2019-05-30 2019-05-30 云平台任务最大资源使用率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910461547.4A CN110333991B (zh) 2019-05-30 2019-05-30 云平台任务最大资源使用率预测方法

Publications (2)

Publication Number Publication Date
CN110333991A true CN110333991A (zh) 2019-10-15
CN110333991B CN110333991B (zh) 2022-11-25

Family

ID=68140426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910461547.4A Active CN110333991B (zh) 2019-05-30 2019-05-30 云平台任务最大资源使用率预测方法

Country Status (1)

Country Link
CN (1) CN110333991B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111813631A (zh) * 2020-07-15 2020-10-23 江苏方天电力技术有限公司 一种面向云数据中心的资源态势可视化与分析方法
CN112395046A (zh) * 2020-07-30 2021-02-23 上海有孚智数云创数字科技有限公司 基于温度预测的虚拟机迁移规划调度方法及其系统与介质
CN113360265A (zh) * 2021-06-18 2021-09-07 特斯联科技集团有限公司 一种大数据运算任务调度和监控系统及方法
CN112181659B (zh) * 2020-10-09 2023-07-18 中国人民解放军国防科技大学 云仿真内存资源预测模型构建方法与内存资源预测方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873498A (zh) * 2012-12-11 2014-06-18 中国电信股份有限公司 云平台资源自适应预警方法与系统
CN104809052A (zh) * 2014-01-29 2015-07-29 西门子公司 用于对系统资源利用率进行预测的方法和装置
US20160140262A1 (en) * 2014-11-16 2016-05-19 International Business Machines Corporation Predicting Performance Regression of a Computer System with a Complex Queuing Network Model
CN105760213A (zh) * 2016-02-22 2016-07-13 东北大学 云环境下虚拟机资源利用率的预警系统及方法
US20160380908A1 (en) * 2013-12-18 2016-12-29 Telefonaktiebolaget Lm Ericsson (Publ) Resource Prediction for Cloud Computing
CN106817401A (zh) * 2016-11-18 2017-06-09 武汉科技大学 一种云环境中的资源配置方法
CN107509202A (zh) * 2017-07-10 2017-12-22 东南大学 一种基于接入用户数变化预测的超密集网络资源分配方法
CN108182115A (zh) * 2017-12-28 2018-06-19 福州大学 一种云环境下的虚拟机负载均衡方法
CN108196957A (zh) * 2017-12-28 2018-06-22 福州大学 一种云环境下的主机负载预测方法
US20180302291A1 (en) * 2017-04-14 2018-10-18 Accenture Global Solutions Limited Comparative multi-forecasting analytics service stack for cloud computing resource allocation
CN109284871A (zh) * 2018-09-30 2019-01-29 北京金山云网络技术有限公司 资源调整方法、装置和云平台

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873498A (zh) * 2012-12-11 2014-06-18 中国电信股份有限公司 云平台资源自适应预警方法与系统
US20160380908A1 (en) * 2013-12-18 2016-12-29 Telefonaktiebolaget Lm Ericsson (Publ) Resource Prediction for Cloud Computing
CN104809052A (zh) * 2014-01-29 2015-07-29 西门子公司 用于对系统资源利用率进行预测的方法和装置
US20160140262A1 (en) * 2014-11-16 2016-05-19 International Business Machines Corporation Predicting Performance Regression of a Computer System with a Complex Queuing Network Model
CN105760213A (zh) * 2016-02-22 2016-07-13 东北大学 云环境下虚拟机资源利用率的预警系统及方法
CN106817401A (zh) * 2016-11-18 2017-06-09 武汉科技大学 一种云环境中的资源配置方法
US20180302291A1 (en) * 2017-04-14 2018-10-18 Accenture Global Solutions Limited Comparative multi-forecasting analytics service stack for cloud computing resource allocation
CN107509202A (zh) * 2017-07-10 2017-12-22 东南大学 一种基于接入用户数变化预测的超密集网络资源分配方法
CN108182115A (zh) * 2017-12-28 2018-06-19 福州大学 一种云环境下的虚拟机负载均衡方法
CN108196957A (zh) * 2017-12-28 2018-06-22 福州大学 一种云环境下的主机负载预测方法
CN109284871A (zh) * 2018-09-30 2019-01-29 北京金山云网络技术有限公司 资源调整方法、装置和云平台

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YONGJIA YU: "Integrating Clustering and Learning for Improved Workload Prediction in the Cloud", 《2016 IEEE 9TH INTERNATIONAL CONFERENCE ON CLOUD COMPUTING (CLOUD)》 *
吴毅华: "云计算环境下基于需求预测的虚拟机节能分配方法研究", 《小型微型计算机系统》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111813631A (zh) * 2020-07-15 2020-10-23 江苏方天电力技术有限公司 一种面向云数据中心的资源态势可视化与分析方法
CN112395046A (zh) * 2020-07-30 2021-02-23 上海有孚智数云创数字科技有限公司 基于温度预测的虚拟机迁移规划调度方法及其系统与介质
CN112181659B (zh) * 2020-10-09 2023-07-18 中国人民解放军国防科技大学 云仿真内存资源预测模型构建方法与内存资源预测方法
CN113360265A (zh) * 2021-06-18 2021-09-07 特斯联科技集团有限公司 一种大数据运算任务调度和监控系统及方法

Also Published As

Publication number Publication date
CN110333991B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
CN110333991A (zh) 云平台任务最大资源使用率预测方法
CN110568359B (zh) 一种锂电池剩余寿命预测方法
CN109598368B (zh) 路径决策评估、订单分配方法及装置、电子设备及介质
CN108984301A (zh) 自适应云资源调配方法和装置
CN103310388B (zh) 基于信源熵的电网运行综合指数计算方法
CN108399453A (zh) 一种电力客户信用等级评价方法和装置
CN109325640A (zh) 用户价值预测方法、装置、存储介质及设备
CN108171379A (zh) 一种用电负荷预测方法
CN102402732A (zh) 科研项目评估方法及系统
CN109636213A (zh) 订单分配、评价方法及装置、电子设备及存储介质
CN109816177A (zh) 一种负荷聚合商短期负荷预测方法、装置及设备
CN106600058A (zh) 一种制造云服务QoS的组合预测方法
CN112633316A (zh) 一种基于边界估值理论的负荷预测方法和装置
CN106772205A (zh) 一种电力计量自动化系统终端设备异常监测方法及装置
CN110059913A (zh) 一种计及未来态的停电计划的量化评估方法
CN109670653A (zh) 一种基于工业模型预测引擎进行预测的方法及装置
CN105373692B (zh) 基于区间二元语义的驾驶舱人机功能分配方法
CN111008790A (zh) 一种水电站群发电调度规则提取方法
Mathew et al. Demand forecasting for economic order quantity in inventory management
CN109657122B (zh) 一种基于学术大数据的学术团队重要成员识别方法
CN115169634A (zh) 一种任务分配优化处理方法及装置
CN106600119A (zh) 基于k均值的电力用户聚类方法及装置
CN111652403A (zh) 一种基于反馈修正的工作平台任务工作量预测方法
CN109298989A (zh) 业务指标阈值获取方法及装置
CN111260161A (zh) 一种众包任务下发的方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant