CN110275773B - 基于真实数据模型拟合的Paas资源循环利用指标系统 - Google Patents

基于真实数据模型拟合的Paas资源循环利用指标系统 Download PDF

Info

Publication number
CN110275773B
CN110275773B CN201811272168.2A CN201811272168A CN110275773B CN 110275773 B CN110275773 B CN 110275773B CN 201811272168 A CN201811272168 A CN 201811272168A CN 110275773 B CN110275773 B CN 110275773B
Authority
CN
China
Prior art keywords
fitting
resources
resource
index
paas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811272168.2A
Other languages
English (en)
Other versions
CN110275773A (zh
Inventor
张彤
刘麟
付毅
徐星
张琳
孙振
肖迁
姚胜
金魏
刘尤亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Rural Credit Cooperatives Network Information Center
Original Assignee
Hubei Rural Credit Cooperatives Network Information Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Rural Credit Cooperatives Network Information Center filed Critical Hubei Rural Credit Cooperatives Network Information Center
Priority to CN201811272168.2A priority Critical patent/CN110275773B/zh
Publication of CN110275773A publication Critical patent/CN110275773A/zh
Application granted granted Critical
Publication of CN110275773B publication Critical patent/CN110275773B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于真实数据模型拟合的Paas资源循环利用指标系统。包括:指标组合模块,用于选取指标对象,并将指标对象的数据建模拟合,得到指标组合变量关系拟合方程;场景分类模块,用于将目标场景拟真测试数据的回归曲线对真实拟合模型进行二次拟合,得到目标场景的阈值矩阵;指导方法模块,依据阈值矩阵得到的阈值集合及判断标准,判定、区分及归类资源使用情况,形成引导私有云资源被回收,被再分配的指导方法。本系统提供了具有实践价值的指导方法,形成了标准、完整的Paas资源循环利用指标系统。

Description

基于真实数据模型拟合的Paas资源循环利用指标系统
技术领域
本发明属于云计算技术领域,更具体地,涉及基于真实数据模型拟合的Paas资源循环利用指标系统。
背景技术
私有云Paas资源的循环利用,涉及资源的回收及周转,而资源的使用情况是指引回收及周转动作的关键标准。资源的使用情况包含一系列的指标对象以及界定标准,以何种方式去区分、判定、组合以及使用“资源指标”,来引导我们在什么样的情况下回收,又该在什么样的情况下再分配,这是Paas资源循环利用的关键。
现有的资源循环利用手段的依据标准,仅通过“技术经验”来判断CPU、内存等计算资源的使用阈值,然后经过资源供需双方对富余资源的沟通认可,产生非标准化清单后,约定进行资源的回收与周转。
由于现有Paas资源循环利用标准指标系统的缺乏,在庞大的私有云规模背景下,会存在以下问题:
(一)缺少有效、确凿的数据事实,资源供需双方在CPU、内存等资源的使用判断上各执一词。由资源供给方即IT部门依据专业“技术经验”而判断的阈值指标,缺乏严谨缜密的真实场景建模及推导演算,难以成为实际标准。
(二)缺乏规范、一致、完整的数据依据系统,来指导私有云资源回收再分配。各项指标相对独立、不够精确,阈值范围与目标场景结合不紧密,指标规则不一致,系统方法不完整。在长远意义上无法解决资源使用信息不对称难点,无法形成常态化资源循环利用规则,最终造成资源回收周期长,难度大,资源周转效率低等长期的、影响较深远的困难。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供基于真实数据模型拟合的Paas资源循环利用指标系统,其目的在于从“资源指标”及“低效资源类型”出发,以数据拟合原理为指导思想,通过数学建模分析演绎Paas资源循环利用指标系统的建立,解决缺乏规范完整的数据依据,资源回收周期长,难度大,资源周转效率低的问题。
为实现上述目的,按照本发明的一个方面,提供了基于真实数据模型拟合的Paas资源循环利用指标系统,包括:
指标组合模块,所述指标组合模块用于选取指标对象,并将指标对象的数据建模拟合,得到指标组合变量关系拟合方程;
场景分类模块,所述场景分类模块用于将目标场景拟真测试数据的回归曲线对真实拟合模型进行二次拟合,得到目标场景的阈值矩阵;
指导方法模块,所述指导方法模块依据阈值矩阵得到的阈值集合及判断标准,判定、区分及归类资源使用情况,形成引导私有云资源被回收,被再分配的指导方法。
根据本发明实施例,所述指标对象,通过真实数据及拟真测试数据趋势曲线,论证选取“CPU峰值”及“计算内存平均使用率”为指标对象。
根据本发明实施例,所述指标组合变量关系拟合方程,利用最小二乘法原理及方法,基于真实数据模型进行数据拟合,得到描述因变量y“VM资源利用度”与自变量x1“CPU峰值”、x2“计算内存平均使用率”之间关系的拟合方程:
Figure BDA0001846228820000021
根据本发明实施例,所述场景分类包括Paas资源回收、Paas资源周转,
所述Paas资源回收包括闲置资源、富余资源;
当阈值CPU峰值小于等于5%,计算内存平均使用率小于等于5%,判定为闲置资源,整台VM回收;
当阈值CPU峰值范围5%至20%,20%为达标点,计算内存平均使用率10%至50%,50%为达标点,判定为富余资源,资源低效部分进行回收,直至VM资源使用率达到达标点,保证资源充分利用;
所述Paas资源周转,当阈值CPU峰值超过20%,计算内存平均使用率超过50%,重新分配资源给VM,直至VM资源使用率返回达标点,满足资源需求方法的需求。
根据本发明实施例,所述系统还包括算法自我优化校准模块,用于校准拟合本身存在的误差,在不断更新的真实数据的收集过程中完成数据模型拟合的优化更新,为指标系统提供最优的数据模型基础。。
根据最小二乘法拟合原理及方法,可以在指标组合中加入更多的自变量资源使用指标,扩大资源回收利用的覆盖面,完善资源指标阈值矩阵,逐步解决一些难点的资源对象比如磁盘使用率。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,由于提供了基于真实数据模型拟合的Paas资源循环利用指标系统,能够取得下列有益效果:
(1)以经过论证的更为准确的指标对象作为更科学可靠的数据事实对象。通过真实数据及拟真测试数据趋势曲线论证,摒弃了以往的“CPU均值”及“内存平均使用率”指标,确定了能更准确反应资源使用情况的“CPU峰值”及“计算内存平均使用率”指标对象。
(2)通过真实数据拟合演绎得到回归方程,描述“VM资源利用度”与“CPU峰值”、“计算内存平均使用率”之间的函数关系事实,使得Paas资源的回收及周转拥有更为确实有效的数学依据。严谨缜密有效的数学方法,由真实数据而产生的数据模型事实,是比以往的“经验判断”和“印象总结”更为科学更为有力的一种论证方法。
(3)利用“拟合优度”原理,解得目标场景阈值矩阵,并且以之为基础,形成Paas资源“低效利用”各场景的指导方法。本系统不仅提供了有效的数据事实和科学的数学依据,更提供了具有实践价值的指导方法,形成了经过科学校验后的一致、可靠、标准、完整的Paas资源循环利用指标系统。
附图说明
图1是基于真实数据模型拟合的Paas资源循环利用指标系统结构图。
图2是生产主机CPU峰值与CPU均值数组曲线趋势图。
图3是20台VM分为A、B两组、两种场景下数组曲线趋势图。
图4是y与x1散点图。
图5是y与x1 2散点图。
图6是y与x2散点图。
图7是y与x2 2散点图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,基于真实数据模型拟合的Paas资源循环利用指标系统,包括:
指标组合模块,所述指标组合模块用于选取指标对象,并将指标对象的数据建模拟合,得到指标组合变量关系拟合方程;
场景分类模块,所述场景分类模块用于将目标场景拟真测试数据的回归曲线对真实拟合模型进行二次拟合,得到目标场景的阈值矩阵;
指导方法模块,所述指导方法模块依据阈值矩阵得到的阈值集合及判断标准,判定、区分及归类资源使用情况,形成引导私有云资源被回收,被再分配的指导方法。
(1)指标对象。通过真实数据及拟真测试数据趋势曲线,论证选取更为准确的“CPU峰值”及“计算内存平均使用率”指标对象;
(2)指标组合变量关系拟合方程。利用最小二乘法原理及方法,基于真实数据模型进行数据拟合,得到描述因变量y“VM资源利用度”与自变量x1“CPU峰值”、x2“计算内存平均使用率”之间确切关系的拟合方程:
Figure BDA0001846228820000051
(3)结合场景分类的阈值矩阵。利用“拟合优度”公式原理,将目标场景拟真测试数据的回归曲线对真实拟合模型进行二次拟合,得到目标场景的阈值矩阵;
(4)在完整的指标阈值内容的基础上,赋予指标系统判定、区分及归类资源使用情况的能力,形成引导私有云资源在正确的条件下被回收,在合适的情况下被再分配的完整的指导方法如下:
所述场景分类包括Paas资源回收、Paas资源周转,
所述Paas资源回收包括闲置资源、富余资源;
当阈值CPU峰值小于等于5%,计算内存平均使用率小于等于5%,判定为闲置资源,整台VM回收;
当阈值CPU峰值范围5%至20%,20%为达标点,计算内存平均使用率10%至50%,50%为达标点,判定为富余资源,资源低效部分进行回收,直至VM资源使用率达到达标点,保证资源充分利用;
所述Paas资源周转,当阈值CPU峰值超过20%,计算内存平均使用率超过50%,重新分配资源给VM,直至VM资源使用率返回达标点,满足资源需求方法的需求。
基于真实数据模型拟合的Paas资源循环利用指标系统数据模型演绎及系统实践研究过程如下:
私有云Paas资源的循环利用,涉及资源的回收及周转,而资源的使用情况是指引回收及周转动作的关键标准。资源的使用情况包含一系列的指标对象以及界定标准,以何种方式去区分、判定、组合以及使用“资源指标”,来引导我们在什么样的情况下回收,又该在什么样的情况下再分配,这是Paas资源循环利用的关键。
通常,按照私有云资源需求方/使用方资源利用的低效程度,我们将需要回收的资源基本分为两类:一类是较长时间未被使用的整台VM(虚拟机,私有云基础对象中最小单元)——“闲置资源”,一类是被VM占有却未被高效利用的“富余资源”。如何界定它们的区间也是资源循环利用的难点之一。
一、指标对象,数据建模对象的选取
1.CPU峰值
与CPU相关的指标一般包括CPU均值、CPU峰值两种,在考虑VM CPU资源使用效率时,结合CPU在资源消耗中相对较低的特征,以CPU均值衡量使用效率有失偏颇。
我们选取了一组正在处理生产A类业务的主机一个月(30天)内的CPU峰值、CPU均值数据,数组如下:
{(xi,yi,zi),i=1,2,3…30}(y为CPU峰值,z为CPU均值)
Figure BDA0001846228820000061
数组曲线趋势如图2。
avg(zi)=1.373;CPU月均值仅为1.373;
max(zi)=3.4;CPU均值最高仅为3.4;
max(yi)={(x6=6)y6=21.2;(x19=19)y19=16.7;(x26=6)y26=13.4};
而实际上此组主机的CPU资源使用率根据应用程序运算负荷的变化而变化,在一个月内出现3次使用高峰,分别在第6天、第19天以及第26天时,峰值分别为21.2、16.7以及13.4,均显式地不同于CPU均值指标,但实际上更精准。
由“CPU峰值”这组数据所表达出来的资源使用场景更准确,更基于事实。
2.计算内存平均使用率
大多数私有云资源监控指标会将内存使用率排在前列,但根据实际数据推演,我们发现“计算内存使用率”是更准确反应VM内存资源使用情况的指标对象。
我们选择在相同的虚拟化平台上,批量创建20台相同配置的VM,在其上部署、加载、运行相同的应用程序。该应用程序主要包含两个部分,一是涉及读取文件data,二是涉及执行程序代码。
这两种类型的工作正好对应两种不同的内存类型,“频繁读取文件data”会使内核选择将这部分data放入内存,节省开销,提高性能,这部分内存用来存放文件缓存,叫做“非计算内存”。而执行程序代码会使内存中工作段和永久段可执行文件部分增加,这部分内存叫做“计算内存”。
我们将20台VM分为A、B两组,每组10台,均运行相同的应用程序,但运行的方式不同:
A组VM加载应用程序只涉及执行代码部分,并通过操作调整,使内存平均使用率一直稳定在80%左右;
B组VM加载应用程序只涉及读取文件data部分,但在内存平均使用率达到80%一段时间后,模拟资源浪费场景,大幅度减缓应用程序对VM的压力,程序仅保持在最低消耗挂起。
根据以上两种场景取数组如下:
{(xi,yi,zi),i=1,2,3…20}(y为计算内存均值,z为内存均值)
Figure BDA0001846228820000081
数组曲线趋势如图3:
内存平均使用率(%):
A组:zi(i=1,2,3…10)=81.5±1.5
B组:zi(i=11,12,13…20)=81.5±1.5
计算内存平均使用率(%):
A组:avg{yi(i=1,2,3…10)}=71.9
B组:avg{yi(i=11,12,13…20)}=31.5
在“内存平均使用率”始终相近的情况下,A组——一直保持应用程序压力运行的VM,计算内存平均使用率71.9%;
而B组在应用程序挂起后,VM几近处于空闲状态,内存平均使用率却出现一直处在81.5%左右的“假象”,计算内存平均使用率仅31.5%,比真正在使用内存资源的A组VM的计算内存平均使用率低一半。
因此,在以上拟真测试数据的推演下,我们可以发现使用“计算内存平均使用率”更加科学、可靠,更能表达VM对内存资源的使用情况。
二、指标系统,基于真实数据模型拟合的数学体系
在已知“VM资源利用度”与“CPU峰值”、“计算内存平均使用率”间存在关联的情况下,我们期望利用一种数据拟合的数学方法,找到一个有预期和实践价值的数式与真实数据吻合,并且能确切反应三个变量之间的参数关系。而且在此基础上,通过目标场景拟合模型与真实拟合模型的比对,以科学的方式,找到包括“闲置资源回收指标阈值”和“富余资源回收指标阈值”在内的指示区间,建立经过科学校验后的一致、可靠、标准、完整的Paas资源循环利用指标系统。
1.数组样本
根据指标对象即数据建模对象,采集真实场景数组数据如下:
{(x1i,x1i2,x2i,x2i2,yi),i=1,2,3…13}
(x1为CPU峰值,x1 2为CPU峰值的平方,x2为计算内存平均使用率,x2 2为计算内存平均使用率的平方,yi为VM资源利用度)
Figure BDA0001846228820000091
2.散点图
y与x1散点图如图4。
y与x1 2散点图如图5。
y与x2散点图如图6。
y与x2 2散点图如图7。
3.利用最小二乘法原理作拟合
根据散点图,近似于二次非线性函数,设其数学模型估算表达式为:
yi=a+b1x1i+b2x1i 2+b3x2i+b4x2i 2
根据最小二乘法原理,核心目标就是最小化实际数据yj与计算预测值yi的离差平方和θ,设:
θ=∑(yi-yj)2
将①式代入②:
θ=∑(yi-a-b1x1i-b2x1i 2-b3x2i-b4x2i 2)2
当θ最小时,对等式右边数组{(a,bi),i=1,2,3,4}求偏导数,令偏导为0:
Figure BDA0001846228820000101
简化:
Figure BDA0001846228820000102
表示成矩阵:
Figure BDA0001846228820000103
则:
Figure BDA0001846228820000104
解得{(a,bi),i=1,2,3,4}以θ为变量的函数的极值点,矩阵运算结果为:
Figure BDA0001846228820000105
Figure BDA0001846228820000111
将系数矩阵带入①可得本例拟合模型④:
y=0.00597-0.8775x<sub>1</sub>+3.3434x<sub>1</sub><sup>2</sup>+2.1641x<sub>2</sub>-1.6861x<sub>2</sub><sup>2</sup>
其他演算值:
Figure BDA0001846228820000112
拟合优度(R Square)为:
R2=0.99637
拟合优度非常接近1,表明自变量x解释因变量y的变差程度接近100%,因变量y的拟合效果很好。因此,该拟合模型能够精准的表达“VM资源利用度”(y)与“CPU峰值”(x1)、“计算内存平均使用率”(x2)间的非线性关系。
4.模拟“闲置资源”和“富余资源”场景
拟真测试在以下条件下进行:虚拟化平台相同,VM配置相同,所采取的测试应用程序相同。
A组:10台VM保持闲置,采集其资源使用数组如下:
{(x1n,x1n 2,x2n,x2n 2,yn),n=1,2,3…10}
(xn为CPU峰值,xn 2为CPU峰值的平方,xn为计算内存平均使用率,xn 2为计算内存平均使用率的平方,yn为VM资源利用度)
Figure BDA0001846228820000121
B组:10台VM以低负荷姿态运行应用程序,模拟部分浪费资源场景,包括:数据IO任务量较全负荷情况随机减10%-70%不等,可执行工作段量较全负荷情况随机减10%-70%不等,采集其资源使用数组如下:
{(x1m,x1m 2,x2m,x2m 2,ym),m=1,2,3…10}
(xm为CPU峰值,xm 2为CPU峰值的平方,xm为计算内存平均使用率,xm 2为计算内存平均使用率的平方,ym为VM资源利用度)
Figure BDA0001846228820000122
5.目标场景数据拟合
同样利用最小二乘法原理,对A、B组拟真测试数据进行拟合。所采用方法与上述第3小点里拟合方法一样,因此过程不再赘述,结果如下:
A组系数矩阵:
Coefficients
a -0.066335846
b<sub>1</sub> 2.489388508
b<sub>2</sub> -38.08837015
b<sub>3</sub> 1.877934714
b<sub>4</sub> 3.136460697
A组回归方程⑤:
yn=-0.0663+2.4894x1n-38.0883x1n 2+1.877x2n+3.1365x2n 2
B组系数矩阵:
Coefficients
a -0.462915867
b<sub>1</sub> 4.852061719
b<sub>2</sub> -11.00845032
b<sub>3</sub> 1.844969637
b<sub>4</sub> -1.478158116
B组回归方程⑥:
ym=-0.4629+4.852x1m-11x1m 2+1.845x2m-1.478x2m 2
6.目标场景拟合模型与真实数据拟合模型比对及结论
拟合模型中通常采用拟合优度(R2)来解释回归方程对实测数据的拟合程度:
Figure BDA0001846228820000131
利用拟合优度的原理,我们将A、B组目标场景的拟合模型预测值作为真实拟合模型的观察值yactual,让拟合优度去评价目标场景观察值与真实拟合模型的拟合度,找到最贴近(即R2接近1)真实拟合模型的相应目标场景的CPU峰值(x1)、计算内存平均使用率(x2)、VM资源利用度(y)的数组区间,以此为基础,建立起经过科学检验的,能够精准描述目标场景的指标系统。
本例运用拟合优度如下⑦:
Figure BDA0001846228820000141
A组(闲置资源场景)——
回归方程④(y)和⑤(yn)和带入⑦,设拟合度最高情况R2=1:
Figure BDA0001846228820000142
可得:
Figure BDA0001846228820000143
解得:
Figure BDA0001846228820000144
Figure BDA0001846228820000151
与真实拟合模型拟合度最好的目标场景(闲置资源)拟合方程各变量取值区段:
Figure BDA0001846228820000152
根据上解,结合A组场景设定,可知当VM的“CPU峰值”小于等于5%,且“计算内存平均使用率”小于等于10%时,该VM因为资源需求方/使用方长时间的不使用而处于“废弃”状态,现定义为“闲置资源”,需要被整台回收。
B组(富余资源场景)——
回归方程④(y)和⑥(ym)和带入⑦,同样的方法解得:
变量 说明 区间
X<sub>1m</sub> CPU峰值 [0.05,0.2]
X<sub>1m</sub><sup>2</sup> CPU峰值的平方 [0.0025,0.04]
X<sub>2m</sub> 计算内存平均使用率 [0.1,0.5]
X<sub>2m</sub><sup>2</sup> 计算内存平均使用率的平方 [0.01,0.25]
Ym VM资源利用度 [0.2,0.6]
与真实拟合模型拟合度最好的目标场景(富余资源)拟合方程各变量取值区段:
Figure BDA0001846228820000153
根据上解,结合B组场景设定,可知当VM的“CPU峰值”在5%~20%之间(不包含两个端点),且“计算内存平均使用率”在10%~50%之间(不包含两个端点)时,该VM的资源处于“低效利用”状态,需回收低效率部分资源,保证资源被充分利用,需要回收的部分被定义为“富余资源”。
结合场景分类的阈值矩阵及指导方法可表达为:
Figure BDA0001846228820000161
本发明围绕“闲置资源”及“富余资源”两大“低效资源类型”,结合“CPU峰值”、“计算内存平均使用率”及其组合指标变量,利用最小二乘法原理及方法,在基于数学建模的两次拟合下,求得符合目标场景的组合解,将其作为资源使用指标系统的核心组件;并以科学的完整的指标阈值为内容,一致的、标准化的指标规则为指引,赋予指标系统判定、区分及归类资源使用情况的能力,引导私有云资源在正确的条件下被回收,在合适的情况下被再分配,实现Paas资源的高效、精准、系统地循环利用。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.基于真实数据模型拟合的Paas资源循环利用指标系统,其特征在于,所述Paas资源为私有云Paas资源,所述私有云Paas资源的循环利用涉及资源的回收及周转,所述私有云Paas资源回收包括闲置资源、富余资源;
所述闲置资源是较长时间未被使用的整台虚拟机的闲置资源,所述富余资源是被虚拟机占有却未被高效利用的富余资源;
所述虚拟机为私有云基础对象中最小单元;
所述系统包括:
指标组合模块,所述指标组合模块用于选取指标对象,并将指标对象的数据建模拟合,得到指标组合变量关系拟合方程;
所述指标对象,通过真实数据及拟真测试数据趋势曲线,论证选取“CPU峰值”及“计算内存平均使用率”为指标对象;
所述指标组合变量关系拟合方程,利用最小二乘法原理及方法,基于真实数据模型进行数据拟合,得到描述因变量y“VM资源利用度”与自变量x1“CPU峰值”、x2“计算内存平均使用率”之间关系的拟合方程:
y=0.00597-0.8775x1+3.3434x1 2+2.1641x2-1.6861x2 2
场景分类模块,所述场景分类模块用于将目标场景拟真测试数据的回归曲线对真实拟合模型进行二次拟合,得到目标场景的阈值矩阵;所述场景分类包括Paas资源回收、Paas资源周转;
拟合模型中采用拟合优度R2来解释回归方程对实测数据的拟合程度,拟合优度R2公式如下:
Figure FDA0002409170820000011
式中:ynorm即yn或ym,为闲置资源场景数组回归方程或富余资源场景数组回归方程;
yavg为拟合优度中用来评价拟合度的回归均方;
指导方法模块,所述指导方法模块依据阈值矩阵得到的阈值集合及判断标准,判定、区分及归类资源使用情况,形成引导私有云资源被回收,被再分配的指导方法。
2.根据权利要求1所述的基于真实数据模型拟合的Paas资源循环利用指标系统,其特征在于,
当阈值CPU峰值小于等于5%,计算内存平均使用率小于等于10%,判定为闲置资源,整台VM回收;
当阈值CPU峰值范围5%至20%,20%为达标点,计算内存平均使用率10%至50%,50%为达标点,判定为富余资源,资源低效部分进行回收,直至VM资源使用率达到达标点,保证资源充分利用;
所述Paas资源周转,当阈值CPU峰值超过20%,计算内存平均使用率超过50%,重新分配资源给VM,直至VM资源使用率返回达标点,满足资源需求方法的需求。
3.根据权利要求1所述的基于真实数据模型拟合的Paas资源循环利用指标系统,其特征在于,还包括算法自我优化校准模块,用于校准拟合本身存在的误差,在不断更新的真实数据的收集过程中完成数据模型拟合的优化更新。
CN201811272168.2A 2018-10-30 2018-10-30 基于真实数据模型拟合的Paas资源循环利用指标系统 Active CN110275773B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811272168.2A CN110275773B (zh) 2018-10-30 2018-10-30 基于真实数据模型拟合的Paas资源循环利用指标系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811272168.2A CN110275773B (zh) 2018-10-30 2018-10-30 基于真实数据模型拟合的Paas资源循环利用指标系统

Publications (2)

Publication Number Publication Date
CN110275773A CN110275773A (zh) 2019-09-24
CN110275773B true CN110275773B (zh) 2020-08-28

Family

ID=67958039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811272168.2A Active CN110275773B (zh) 2018-10-30 2018-10-30 基于真实数据模型拟合的Paas资源循环利用指标系统

Country Status (1)

Country Link
CN (1) CN110275773B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102854968A (zh) * 2012-05-04 2013-01-02 北京邮电大学 一种虚拟机实时能耗计量方法
CN105183627A (zh) * 2015-10-20 2015-12-23 浪潮(北京)电子信息产业有限公司 一种服务器性能预测的方法及系统
CN105607948A (zh) * 2015-12-18 2016-05-25 国云科技股份有限公司 一种基于sla的虚拟机迁移预测方法
CN105808355A (zh) * 2016-03-10 2016-07-27 西安电子科技大学 一种基于二元线性回归方程的动态调频方法
CN106201700A (zh) * 2016-07-19 2016-12-07 北京工业大学 一种虚拟机在线迁移的调度方法
CN106201718A (zh) * 2016-07-05 2016-12-07 北京邮电大学 一种基于负载预测的云计算资源动态伸缩方法
CN106250306A (zh) * 2016-08-18 2016-12-21 电子科技大学 一种适用于企业级运维自动化平台的性能预测方法
CN106445636A (zh) * 2016-09-28 2017-02-22 郑州云海信息技术有限公司 一种paas平台下的动态资源调度算法
CN106528266A (zh) * 2016-10-28 2017-03-22 柏域信息科技(上海)有限公司 一种云计算系统中的资源动态调整方法及装置
CN108074022A (zh) * 2016-11-10 2018-05-25 中国电力科学研究院 一种基于集中运维的硬件资源分析与评估方法
CN108710540A (zh) * 2018-05-23 2018-10-26 深信服网络科技(深圳)有限公司 一种分布式集群中的资源调度方法、装置及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104216783B (zh) * 2014-08-20 2017-07-11 上海交通大学 云游戏中虚拟gpu资源自主管理与控制方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102854968A (zh) * 2012-05-04 2013-01-02 北京邮电大学 一种虚拟机实时能耗计量方法
CN105183627A (zh) * 2015-10-20 2015-12-23 浪潮(北京)电子信息产业有限公司 一种服务器性能预测的方法及系统
CN105607948A (zh) * 2015-12-18 2016-05-25 国云科技股份有限公司 一种基于sla的虚拟机迁移预测方法
CN105808355A (zh) * 2016-03-10 2016-07-27 西安电子科技大学 一种基于二元线性回归方程的动态调频方法
CN106201718A (zh) * 2016-07-05 2016-12-07 北京邮电大学 一种基于负载预测的云计算资源动态伸缩方法
CN106201700A (zh) * 2016-07-19 2016-12-07 北京工业大学 一种虚拟机在线迁移的调度方法
CN106250306A (zh) * 2016-08-18 2016-12-21 电子科技大学 一种适用于企业级运维自动化平台的性能预测方法
CN106445636A (zh) * 2016-09-28 2017-02-22 郑州云海信息技术有限公司 一种paas平台下的动态资源调度算法
CN106528266A (zh) * 2016-10-28 2017-03-22 柏域信息科技(上海)有限公司 一种云计算系统中的资源动态调整方法及装置
CN108074022A (zh) * 2016-11-10 2018-05-25 中国电力科学研究院 一种基于集中运维的硬件资源分析与评估方法
CN108710540A (zh) * 2018-05-23 2018-10-26 深信服网络科技(深圳)有限公司 一种分布式集群中的资源调度方法、装置及设备

Also Published As

Publication number Publication date
CN110275773A (zh) 2019-09-24

Similar Documents

Publication Publication Date Title
CN110688288B (zh) 基于人工智能的自动化测试方法、装置、设备及存储介质
US20170330078A1 (en) Method and system for automated model building
CN111967696B (zh) 基于神经网络的电动汽车充电需求预测方法、系统及装置
CN102541736A (zh) 一种软件可靠性执行过程加速测试方法
CN108764335A (zh) 一种综合能源系统多能需求典型场景生成方法及装置
CN107957929A (zh) 一种基于主题模型的软件缺陷报告修复人员分配方法
CN113032367A (zh) 面向动态负载场景的大数据系统跨层配置参数协同调优方法和系统
CN114897451B (zh) 考虑需求响应用户关键特征的双层聚类修正方法及装置
CN115081515A (zh) 能效评价模型构建方法、装置、终端及存储介质
CN105184403A (zh) 基于机器学习和统计模型检验的工作流最优配置寻优方法
CN112947080B (zh) 一种基于场景参数变换的智能决策模型性能评估系统
CN112232886B (zh) 一种电价概率预测方法、系统、计算机设备和存储介质
CN110275773B (zh) 基于真实数据模型拟合的Paas资源循环利用指标系统
CN110377525B (zh) 一种基于运行时特征和机器学习的并行程序性能预测系统
CN101206727A (zh) 数据处理装置、方法和程序以及计算机可读介质
CN111310121A (zh) 一种新能源出力概率预测方法和系统
CN113919449B (zh) 基于精准模糊聚类算法的居民电力数据聚类方法及装置
CN112668223B (zh) 基于数字孪生轻量化模型的机电装备仿真方法及系统
CN110262891B (zh) 跨虚拟化平台自动化多功能资源循环利用系统
CN113988493A (zh) 终端评价模型的构建方法、装置和存储介质
CN111026661A (zh) 一种软件易用性全面测试方法及系统
CN113361960B (zh) 一种大规模需求响应能力量化方法、介质、装置及设备
CN110942149B (zh) 一种基于信息变化率及条件互信息的特征变量选择方法
CN117834455B (zh) 一种电力物联网数据传输仿真方法和系统
CN115936243A (zh) 一种企业稳定性评价方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant