CN103019366B - 基于cpu心跳幅度的物理主机负载检测方法 - Google Patents
基于cpu心跳幅度的物理主机负载检测方法 Download PDFInfo
- Publication number
- CN103019366B CN103019366B CN201210494858.9A CN201210494858A CN103019366B CN 103019366 B CN103019366 B CN 103019366B CN 201210494858 A CN201210494858 A CN 201210494858A CN 103019366 B CN103019366 B CN 103019366B
- Authority
- CN
- China
- Prior art keywords
- physical host
- use amount
- current
- cpu
- hosts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明涉及一种基于CPU心跳幅度的物理主机负载检测方法,包括以下步骤:为所有物理主机设定一致的监控参数,并设定各物理主机的判断激活时刻;各物理主机接到开始检测指令,判断激活,然后读取CPU使用量历史记录表(H),计算负载评估值(MH)和实际负载值(MR),若MR>MH则处于过载状态,否则处于正常状态。本发明能快速、准确地检测出物理主机负载状态,进而降低物理主机主要耗能指标、提升物理主机性能,并最终降低整个系统的运行、维护、管理成本。
Description
技术领域
本发明涉及一种基于CPU心跳幅度的物理主机负载检测方法,是针对物理主机资源动态优化机制的改进,属于计算机网络技术领域。
背景技术
据申请人了解,目前在云计算环境下,物理主机负载检测方法的核心思想都立足于中心偏离度统计值。例如,当前最具影响力的四分间距(IQR)法即属于基于中心偏离度统计值的物理主机负载检测方法,其一般过程为:将一系列原始数值依据从小到大顺序重排列,然后将排序所得数列分成四等份,最后取第三个四分位上的数值与第一个四分位上的数值之差,作为判断物理主机负载的依据。
但是这种方法存在的主要问题是:仅考虑到物理主机的平均负载分布,而未能考虑到物理主机运行过程中的抖动因素,致使现有方法很难快速、准确地检测到运行负载不稳定的物理主机,并使得系统运行时的物理主机主要耗能指标较高(例如虚拟机实际迁移数量,迁移操作导致虚拟机性能下降比例,目标待迁移虚拟机选择时间,目标虚拟机实际迁移时间平均值),导致物理主机能量消耗增加,且性能下降,使用户体验效果降低,最终使整个系统的运行、维护、管理成本上升。
现有技术中还存在使多台物理主机负载均衡的方法,如申请号200910238364.2公布号CN101719081A的中国发明专利申请公开了一种虚拟机调度方法;申请号201110199822.3公布号CN102236582A的中国发明专利申请公开了一种虚拟化集群负载在多台物理机中均衡分配的方法。
这两种方法基本上都是通过监测虚拟机的实际负载及变化,预估虚拟机的最大负载,并将同一物理主机上所有虚拟机最大负载之和与该物理主机预设的最大负载限值进行比较,若前者大于或等于后者,则认为该物理主机过载或运行负载不稳定。但是,由于这两种方法并不是直接监测物理主机的实际负载,很难及时检测到物理主机运行过程中发生的抖动(如负载突然增大等),因此这两种方法并不能解决前述现有物理主机负载检测方法存在的技术问题。
再如申请号201110373058.7公布号CN1025108718A的中国发明专利申请公开了一种虚拟机负载均衡方法和装置,其方法判断物理主机过载的标准为:某物理主机最近连续N次负载指数均超过预设阈值时,则认为该物理主机过载。其中,负载指数由CPU利用率、内存使用率和IO吞吐量因子通过加权计算获得,而IO吞吐量因子的确定过程为:监测若干物理主机在同一时期的IO吞吐量,选出值最大的IO吞吐量,再以各物理主机自身IO吞吐量与该最大IO吞吐量的比值为各物理主机的IO吞吐量因子。该方法以直接监测到的物理主机参数作为判断依据,在一定程度上可以解决前述现有物理主机负载判断方法存在的技术问题,但是该方法还存在以下主要问题:(1)确定IO吞吐量因子时需要考虑到所有物理主机的IO吞吐量,而IO吞吐量因子本身是具有相对性的比值,这就决定了该方法仅适用于采用负载容量相同的同构物理主机的系统,若系统中存在负载容量不同的物理主机,则难以判断出物理主机是否过载;(2)需要以CPU利用率、内存使用率和IO吞吐量因子三个变量来确定负载指数,并需要以最近连续N次负载指数分别与预设阈值比较,这样做虽然能在一定程度上防止误判,但是也不可避免地增加了判断过程的复杂程度,无疑会降低判断的速度,很难满足运算量极大的云计算系统对迅速找出过载物理主机的要求,同时也不利于降低能耗;(3)对该方法而言,预设阈值是判断物理主机是否过载的重点之一,但是该专利申请文件中并未说明如何设定该阈值,而显然该阈值是不能随意设定的,需要反复实践研究才能得出合适的阈值,使判断结果与事实相符,也就是说该专利申请文件无法起到与阈值设定相关的教导作用。
发明内容
本发明所要解决的技术问题是:针对现有技术存在的问题,提供一种基于CPU心跳幅度的物理主机负载检测方法,能快速、准确地检测出物理主机负载状态,进而降低物理主机主要耗能指标、提升物理主机性能,并最终降低整个系统的运行、维护、管理成本。
本发明解决其技术问题的技术方案如下:
一种基于CPU心跳幅度的物理主机负载检测方法,其特征是,包括以下步骤:
第一步、为所有物理主机设定一致的监控参数,并以开始执行本步骤时的时刻为各物理主机的判断激活时刻(t1);所述监控参数包括CPU使用量采集周期(T),安全系数(S),历史数据记录数(N);各物理主机每隔所述CPU使用量采集周期(T)则采集一次CPU使用量数据,并存入CPU使用量历史记录表(H);所述CPU使用量历史记录表(H)包括一组数量为历史数据记录数(N)的、最近的CPU使用量数据(H1,H2,...HN);转至第二步;
第二步、各物理主机接到开始检测指令后,分别以自身为当前主机(M);转至第三步;
第三步、比较第二步结束时的时刻(t2)与当前主机(M)的判断激活时刻(t1);若t2>t1则转至第四步,否则转至第九步;
第四步、读取当前主机(M)的CPU使用量历史记录表(H);转至第五步;
第五步、根据第四步读取数据,按预定第一算法计算当前主机(M)的负载评估值(MH);转至第六步;
第六步、检测当前主机(M)上所有虚拟机的当前CPU使用量,并计算得到虚拟机当前CPU使用量之和(MVS);检测当前主机(M)的当前CPU频率(MSH);按预定第二算法计算当前主机(M)的实际负载值(MR);转至第七步;
第七步、比较实际负载值(MR)和负载评估值(MH),若MR>MH则当前主机(M)处于过载状态,否则当前主机(M)处于正常状态;转至第八步;
第八步、向外部控制系统发送当前主机(M)所处状态,并以第七步结束时刻为当前主机(M)的判断激活时间(t1);转至第九步;
第九步、判断是否停止检测,若不停止则转至第三步;若停止则结束检测。
本发明能快速、准确地检测出物理主机负载状态,进而降低物理主机主要耗能指标、提升物理主机性能,并最终降低整个系统的运行、维护、管理成本。
附图说明
图1为本发明实施例的流程示意图。
图2为图1实施例应用案例中系统运行时能量消耗的结果示意图。
图3为图1实施例应用案例中系统运行时虚拟机实际迁移数量的结果示意图。
图4为图1实施例应用案例中系统运行时迁移操作导致虚拟机性能下降比例的结果示意图。
图5为图1实施例应用案例中系统运行时目标待迁移虚拟机选择时间的结果示意图。
图6为图1实施例应用案例中系统运行时目标虚拟机实际迁移时间平均值的结果示意图。
具体实施方式
下面参照附图并结合实施例对本发明作进一步详细描述。但是本发明不限于所给出的例子。
实施例
本实施例基于CPU心跳幅度的物理主机负载检测方法如图1所示,包括以下步骤:
第一步、为所有物理主机设定一致的监控参数,并以开始执行本步骤时的时刻为各物理主机的判断激活时刻(t1);所述监控参数包括CPU使用量采集周期(T),安全系数(S),历史数据记录数(N);各物理主机每隔CPU使用量采集周期(T)则采集一次CPU使用量数据,并存入CPU使用量历史记录表(H);所述CPU使用量历史记录表(H)包括一组数量为历史数据记录数(N)的、最近的CPU使用量数据(H1,H2,...HN);转至第二步;
第二步、各物理主机接到开始检测指令后,分别以自身为当前主机(M);转至第三步;
第三步、比较第二步结束时的时刻(t2)与当前主机(M)的判断激活时刻(t1);若t2>t1则转至第四步,否则转至第九步;
第四步、读取当前主机(M)的CPU使用量历史记录表(H);转至第五步;
第五步、根据第四步读取数据,计算当前主机(M)的负载评估值(MH):
转至第六步;
第六步、检测当前主机(M)上所有虚拟机的当前CPU使用量,并计算得到虚拟机当前CPU使用量之和(MVS);检测当前主机(M)的当前CPU频率(MSH);计算当前主机(M)的实际负载值(MR):
转至第七步;
第七步、比较实际负载值(MR)和负载评估值(MH),若MR>MH则当前主机(M)处于过载状态,否则当前主机(M)处于正常状态;转至第八步;
第八步、向外部控制系统发送当前主机(M)所处状态,并以第七步结束时刻为当前主机(M)的判断激活时间(t1);转至第九步;
第九步、判断是否停止检测,若不停止则转至第三步;若停止则结束检测。
应用案例:
代号为CoMon的某项目,其系统涉及全球约500个服务器中心,有800台物理主机节点以及1052个虚拟机节点,且每个虚拟机的负载数据都是随机生成的。
在该系统中随机抽取一物理主机,该主机配置参数如下:CPU为AMDAthlon(tm)II X2260,3.2GHz;内存2GB;虚拟内存2GB;操作系统为WindowsXP。以同等条件分别实施传统的四分间距(IQR)法和本实施例方法(命名为HDS),并分别检测86127次,然后比较系统能耗和主要耗能指标。虚拟机动态迁移方法采用现有技术的最大相关度(MC)法。
采用本实施例方法时,设定CPU使用量采集周期为300微秒,安全系数为2.0,历史数据记录数为12。
其中,在第136次检测时,t2>t1,继续读取含有(H1,H2,...H12)的CPU使用量历史记录表(H),如下表所示:
CPU使用量 | |
H1 | 0.8496134085213034 |
H2 | 0.8327124060150377 |
H3 | 0.6485576441102756 |
H4 | 0.7781522556390978 |
H5 | 0.8289304511278196 |
H6 | 0.8364636591478698 |
H7 | 0.7500288220551378 |
H8 | 0.9642142857142859 |
H9 | 0.5941083959899749 |
H10 | 0.7818922305764411 |
H11 | 0.7161873433583961 |
H12 | 0.6673095238095239 |
然后根据以下公式计算负载评估值(MH):
接着根据虚拟机当前CPU使用量之和(MVS=4519.943333333334)以及当前CPU频率(MSH=5320),按以下公式计算得出实际负载值(MR):
MR=0.8496134085213033。
由于MR>MH,则该物理主机当前处于过载状态。
其它次数的检测过程与此基本相同,只有具体数据值的差别,以及判断状态的差别。
本应用案例中,四分间距(IQR)法和本实施例方法(HDS)的各项指标对比结果如图2至图6所示。
系统运行时能量消耗的结果如图2所示,与之对应的数据如下表所示:
虚拟机实际迁移数量的结果如图3所示,与之对应的数据如下表所示:
迁移操作导致虚拟机性能下降的结果如图4所示,与之对应的数据如下表所示:
目标待迁移虚拟机选择时间的结果如图5所示,与之对应的数据如下表所示:
目标虚拟机实际迁移时间平均值的结果如图6所示,与之对应的数据如下表所示:
由以上结果对比可知,采用本实施例方法后,系统能耗有所降低,单台主机可省电2kWh,那么整个系统800个物理主机可省电1600kWh,相当可观;此外,该系统的主要耗能指标(虚拟机实际迁移数量,迁移操作导致虚拟机性能下降比例,目标待迁移虚拟机选择时间,目标虚拟机实际迁移时间平均值)均有大幅下降,这一方面可以降低系统能耗,另一方面可大幅提升物理主机性能,提高用户体验效果,进而降低整个系统的运行、维护、管理成本。
与现有技术相比,本实施例方法的优势如下:
(1)定周期监测物理主机的CPU使用量,以其作为CPU心跳幅度值,并以某连续时段内物理主机CPU心跳幅度值统计分析结果为评价基准,从而兼顾了物理主机的运行负载分布及负载的抖动因素,能快速、准确地检测到运行负载不稳定的物理主机,可显著降低物理主机主要耗能指标(例如虚拟机实际迁移数量,迁移操作导致虚拟机性能下降比例,目标待迁移虚拟机选择时间,目标虚拟机实际迁移时间平均值),进而降低物理主机主要耗能指标、提升物理主机性能,使整个系统的运行、维护、管理更加有效。
(2)整个检测过程以各物理主机自身的CPU使用量历史记录为基础,对负载容量不同的物理主机均能做出正确的判断,适用范围更广。
(3)仅需考虑CPU使用量一个变量,且判断过程简便易行,这就使得整个检测方法运行迅速,从而满足系统的要求。
(4)本发明申请人经过反复实践研究,终于得出适合于本发明方法的负载评估值(MH)设定方法(即第五步),使本发明方法能准确地检测出物理主机负载状态,进而降低物理主机主要耗能指标、提升物理主机性能,并最终降低整个系统的运行、维护、管理成本。
除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。
Claims (1)
1.一种基于CPU心跳幅度的物理主机负载检测方法,其特征是,包括以下步骤:
第一步、为所有物理主机设定一致的监控参数,并以开始执行本步骤时的时刻为各物理主机的判断激活时刻t1;所述监控参数包括CPU使用量采集周期T,安全系数S,历史数据记录数N;各物理主机每隔所述CPU使用量采集周期T则采集一次CPU使用量数据,并存入CPU使用量历史记录表H;所述CPU使用量历史记录表H包括一组数量为历史数据记录数N的、最近的CPU使用量数据H1,H2,...HN;转至第二步;
第二步、各物理主机接到开始检测指令后,分别以自身为当前主机M;转至第三步;
第三步、比较第二步结束时的时刻t2与当前主机M的判断激活时刻t1;若t2>t1则转至第四步,否则转至第九步;
第四步、读取当前主机M的CPU使用量历史记录表H;转至第五步;
第五步、根据第四步读取数据,按预定第一算法计算当前主机M的负载评估值MH;转至第六步;
第六步、检测当前主机M上所有虚拟机的当前CPU使用量,并计算得到虚拟机当前CPU使用量之和MVS;检测当前主机M的当前CPU频率MSH;按预定第二算法计算当前主机M的实际负载值MR;转至第七步;
第七步、比较实际负载值MR和负载评估值MH,若MR>MH则当前主机M处于过载状态,否则当前主机M处于正常状态;转至第八步;
第八步、向外部控制系统发送当前主机M所处状态,并以第七步结束时刻为当前主机M的判断激活时间t1;转至第九步;
第九步、判断是否停止检测,若不停止则转至第三步;若停止则结束检测;
第五步中,所述预定第一算法为:
第六步中,所述预定第二算法为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210494858.9A CN103019366B (zh) | 2012-11-28 | 2012-11-28 | 基于cpu心跳幅度的物理主机负载检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210494858.9A CN103019366B (zh) | 2012-11-28 | 2012-11-28 | 基于cpu心跳幅度的物理主机负载检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103019366A CN103019366A (zh) | 2013-04-03 |
CN103019366B true CN103019366B (zh) | 2015-06-10 |
Family
ID=47968051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210494858.9A Expired - Fee Related CN103019366B (zh) | 2012-11-28 | 2012-11-28 | 基于cpu心跳幅度的物理主机负载检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103019366B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224426A (zh) * | 2014-06-09 | 2016-01-06 | 中兴通讯股份有限公司 | 物理主机故障检测方法、装置及虚机管理方法、系统 |
CN106445680B (zh) * | 2016-08-31 | 2020-01-14 | 杭州聚玻科技有限公司 | 基于综合效用的计算单元迁移方法 |
CN108052375B (zh) * | 2017-12-29 | 2021-06-29 | 哈尔滨工业大学 | 一种主机过载检测方法 |
CN110300035B (zh) * | 2019-05-23 | 2021-07-13 | 厦门网宿有限公司 | 判断存储系统负载状态的方法、系统、装置及服务器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101719081A (zh) * | 2009-12-01 | 2010-06-02 | 北京大学 | 一种虚拟机调度方法 |
CN102096461A (zh) * | 2011-01-13 | 2011-06-15 | 浙江大学 | 基于虚拟机迁移和负载感知整合的云数据中心节能方法 |
CN102236582A (zh) * | 2011-07-15 | 2011-11-09 | 浙江大学 | 虚拟化集群负载在多台物理机中均衡分配的方法 |
CN102508718A (zh) * | 2011-11-22 | 2012-06-20 | 杭州华三通信技术有限公司 | 一种虚拟机负载均衡方法和装置 |
CN102662759A (zh) * | 2012-03-20 | 2012-09-12 | 浪潮电子信息产业股份有限公司 | 一种云os中基于cpu负载的节能方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739113B (zh) * | 2008-11-20 | 2013-04-10 | 国际商业机器公司 | 在虚拟化集群系统中进行能效管理的方法及装置 |
-
2012
- 2012-11-28 CN CN201210494858.9A patent/CN103019366B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101719081A (zh) * | 2009-12-01 | 2010-06-02 | 北京大学 | 一种虚拟机调度方法 |
CN102096461A (zh) * | 2011-01-13 | 2011-06-15 | 浙江大学 | 基于虚拟机迁移和负载感知整合的云数据中心节能方法 |
CN102236582A (zh) * | 2011-07-15 | 2011-11-09 | 浙江大学 | 虚拟化集群负载在多台物理机中均衡分配的方法 |
CN102508718A (zh) * | 2011-11-22 | 2012-06-20 | 杭州华三通信技术有限公司 | 一种虚拟机负载均衡方法和装置 |
CN102662759A (zh) * | 2012-03-20 | 2012-09-12 | 浪潮电子信息产业股份有限公司 | 一种云os中基于cpu负载的节能方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103019366A (zh) | 2013-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103019366B (zh) | 基于cpu心跳幅度的物理主机负载检测方法 | |
US9286099B2 (en) | Balancing virtual machine loads | |
CN103441906B (zh) | 基于自主计算的代理缓存集群异常检测系统 | |
CN102111337B (zh) | 任务调度方法和系统 | |
EP2417534B1 (en) | Optimized virtual machine migration mechanism | |
CN109586952B (zh) | 服务器扩容方法、装置 | |
EP2932812B1 (en) | Energy conservation and hardware usage management for data centers | |
CN103916438B (zh) | 基于负载预测的云测试环境调度方法及其系统 | |
CN108347352B (zh) | 一种电力系统中信息系统及设备性能的诊断方法 | |
CN104516808A (zh) | 数据预处理装置及方法 | |
CN102662822B (zh) | 负载监控装置和方法 | |
CN107034617B (zh) | 洗衣机耗电量监测方法、洗衣机及洗衣机系统 | |
CN102394799B (zh) | 一种应用服务器集群效率测试方法及系统 | |
CN103108039A (zh) | 一种低能耗集群环境下的服务质量保证方法 | |
CN116881085A (zh) | 一种服务器能耗优化的方法 | |
US20140013142A1 (en) | Processing unit power management | |
CN104899072B (zh) | 基于虚拟化平台的细粒度资源调度系统及方法 | |
CN110018797B (zh) | 一种数据迁移方法、装置、设备及可读存储介质 | |
CN104345858A (zh) | 服务器硬件设备的功耗管理方法及装置、服务器 | |
CN114660504B (zh) | 绝缘监测回路的检测方法、装置、电子设备及存储介质 | |
CN107341060B (zh) | 一种虚拟机内存分配方法和装置 | |
CN113064075B (zh) | 一种基于边缘计算及深度学习的电机寿命预估方法 | |
CN107831388A (zh) | 集群10kV电缆线路过载的识别方法和系统 | |
CN104283943A (zh) | 一种集群服务器的通信优化方法 | |
CN109344025A (zh) | Cpu性能自监控方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150610 Termination date: 20181128 |
|
CF01 | Termination of patent right due to non-payment of annual fee |