CN104765435A - 一种云数据中心主机延迟开机的方法、装置和系统 - Google Patents

一种云数据中心主机延迟开机的方法、装置和系统 Download PDF

Info

Publication number
CN104765435A
CN104765435A CN201510147721.XA CN201510147721A CN104765435A CN 104765435 A CN104765435 A CN 104765435A CN 201510147721 A CN201510147721 A CN 201510147721A CN 104765435 A CN104765435 A CN 104765435A
Authority
CN
China
Prior art keywords
main frame
data center
host
cloud data
started shooting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510147721.XA
Other languages
English (en)
Other versions
CN104765435B (zh
Inventor
夏云霓
郭坤垠
罗辛
朱庆生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Zhongke Yuncong Technology Co Ltd
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201510147721.XA priority Critical patent/CN104765435B/zh
Publication of CN104765435A publication Critical patent/CN104765435A/zh
Application granted granted Critical
Publication of CN104765435B publication Critical patent/CN104765435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Selective Calling Equipment (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种云数据中心主机延迟开机的方法、装置和系统,属于云计算系统控制领域,本发明开启数据中心中第一台主机,然后收集云数据中心负载信息,分析未来新增主机需求量后计算下一次开机控制的等待时间和预期开机数量,最后开启主机。本发明充分考虑了系统负载的动态波动性,通过跟踪其趋势预测合理的新主机开机数量和时机,兼顾性能和节能性。本发明能够根据云数据中心中各主机负载的变化趋势,评估未来任务负载对新主机数量的需求程度,并制定可变的控制间隔时间,使系统对平稳和突变的任务负载变化响应及时。

Description

一种云数据中心主机延迟开机的方法、装置和系统
技术领域
本发明属于云计算系统控制领域,特别是涉及一种云数据中心主机延迟开机的方法、装置和系统。
背景技术
云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机和其他设备。相对于传统的软件和计算形态,云计算具有松散耦合、随需应变、成本可控、资源虚拟、异构协同等显著的优势,使其更适应现今的电子商务、柔性制造、移动互联网等应用。
云数据中心是指由多个异构的、由网络连接在一起的主机所组成的用于承载提供在线云服务的企业级应用的分布式计算系统。在云数据中心中,将大量的主机进行集中统一管理,可以保障主机运行所需要的稳定电源环境,适宜的温湿度控制以及网络带宽条件。
同其他软硬件系统一样,云数据中心中的主机在运行时也消耗电力能源。由于现今的云计算系统多运用于大规模科学计算、实时金融、在线交易、流媒体多播等高负载和高复杂度的应用,其主机时常处于超负荷运行的状态,因而能源消耗很大。同时,为了对处于运行状态的主机进行散热和降温,散热风扇阵列本身还需额外消耗很多电力能源,这进一步加大了云系统整体的能源消耗,增大了运行成本。值得注意的是,实际的商业云数据中心都不会长时间的持续运行,而会周期性的进行关闭维护工作,之后选择在访问负载较小的时间(如深夜、凌晨、节假日最后一天晚上等等)重新开机。传统的开机控制技术,多选择一次性的将所有主机全部打开并产生电力能源消耗,将导致可用的计算资源远高于低负载时的任务需求,这显然是不经济的。也有部分系统实现了延迟开机的管理策略,但这些策略只是机械的设定开机的时间点和数量,没有充分的考虑系统实时的负载变化,容易出现“开机过多”或者“开机不足”的弊端。另外,现有的方法多预先设定一个固定的间隔时间进行周期性的开机动作控制。然而,由于系统负载的动态可变性,固定间隔时间的控制策略往往难以即时的对短时间内负载的突发性变化做出迅速响应
在此背景下,如何动态的跟踪云数据中心启动后的运行负载,设置合理的开机策略,实现节能性与系统性能的双赢,便成为了研究的热点和难点。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种能够合理预测新主机开机数量和时机的云数据中心主机延迟开机方法。
为实现上述目的,本发明提供了一种云数据中心主机延迟开机的方法,包括以下步骤:
步骤一、开启数据中心中第一台主机,此时的时间记为0;等待时间t后,执行步骤二;t为预先给定的默认控制间隔时间,t>0;
步骤二、收集云数据中心负载信息;
所述负载信息包括:
当前时间dt;
已开机的主机数量k,k≥1;
各已经开机的主机的开机时刻kt1,kt2,...ktk
各已开机的主机在时间t内的新增任务数量xs1,xs2,...xsk
各已开机的主机在时间t内的完成任务数量ws1,ws2,...wsk
各已开机的主机在时间t内,出现故障的任务数量gs1,gs2,...gsk
步骤三、分析未来新增主机需求量:
设定已开启的各个主机平均故障率为gli
计算 g l i = gs i t × t t + dt - k t i + xtgl × dt - k t i t + dt - k t i 得到已开启的各个主机平均故障率;
所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为0;为最近t时间内第i个主机的等效故障率,i为正整数;
然后,将xtgl修改为以下新数值:
所述zjsl为云数据中心中主机数量;
设定主机最近平均执行率为zxl,计算得到主机最近平均执行率;
步骤四、计算下一次开机控制的等待时间和预期开机数量;
设定下一次开机控制的等待时间为ddt,计算 ddt = t if &Sigma; i = 1 k w s i x s i > 0.7 t &times; zx l - 1 max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } elseif max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } > 0 a &times; t else 得到下一次开机控制的等待时间;
设定预期开机数量为kjl,计算
得到预期开机数量;所述zds为单个主机并行处理任务数的最大值;
步骤五、在剩余的未开启的主机中,随机选择kjl个主机开启,等待ddt时间后,返回执行步骤二。
较佳的,所述步骤二之后还包括判断已开机的主机数量是否等于云数据中心中主机数量的步骤,当已开机的主机数量等于云数据中心中主机数量时,停止操作并结束;当已开机的主机数量不等于云数据中心中主机数量时,执行步骤三。
本发明所要解决的另一技术问题是提供一种能够合理预测新主机开机数量和时机的云数据中心主机延迟开机装置。
为实现上述目的,本发明提供了一种云数据中心主机延迟开机装置,包括主机状态监测模块、控制决策模块和开机控制模块;所述主机状态监测模块的输出端连接所述控制决策模块的输入端,所述控制决策模块的输出端连接所述开机控制模块的输入端;
所述主机状态监测模块用于获取云数据中心各主机的负载信息;
所述控制决策模块用于分析未来新增主机需求量、计算下一次开机控制的等待时间和预期开机数量;
所述开机控制模块用于执行开启新主机的操作。
较佳的,所述控制决策模块包括开机需求量分析单元、控制时机决策单元和开机数计算单元;所述主机状态监测模块的第一输出端连接所述开机需求量分析单元的输入端,所述主机状态监测模块的第二输出端连接所述控制时机决策单元的第一输入端,所述主机状态监测模块的第三输出端连接所述开机数计算单元的输入端;所述开机需求量分析单元的输出端连接所述控制时机决策单元的第二输入端;所述控制时机决策单元的输出端连接所述开机控制模块的第一输入端,所述开机数计算单元的输出端连接所述开机控制模块的第二输入端;
所述主机状态监测模块收集云数据中心负载信息,并判断已开机的主机数量是否等于云数据中心中主机数量的步骤,当已开机的主机数量等于云数据中心中主机数量时,停止操作并结束;当已开机的主机数量不等于云数据中心中主机数量时,主机状态监测模块将收集的云数据中心负载信息发送给所述开机需求量分析单元、开机数计算单元和控制时机决策单元;
所述负载信息包括:
当前时间dt;
已开机的主机数量k,k≥1;
各已经开机的主机的开机时刻kt1,kt2,...ktk
各已开机的主机在时间t内的新增任务数量xs1,xs2,...xsk;t为预先给定的默认控制间隔时间,t>0;
各已开机的主机在时间t内的完成任务数量ws1,ws2,...wsk
各已开机的主机在时间t内,出现故障的任务数量gs1,gs2,...gsk
所述开机需求量分析单元计算已开启的各个主机平均故障率gli
计算 g l i = gs i t &times; t t + dt - k t i + xtgl &times; dt - k t i t + dt - k t i ;
所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为0;为最近t时间内第i个主机的等效故障率,i为正整数;
然后,将xtgl修改为以下新数值:
所述zjsl为云数据中心中主机数量;
所述开机需求量分析单元计算主机最近平均执行率zxl:
所述控制时机决策单元计算下一次开机控制的等待时间为ddt:
ddt = t if &Sigma; i = 1 k w s i x s i > 0.7 t &times; zx l - 1 max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } elseif max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } > 0 a &times; t else ;
所述开机数计算单元计算预期开机数量kjl:
所述zds为单个主机并行处理任务数的最大值;
所述控制决策模块在云数据中心剩余的未开启的主机中,随机选择kjl个主机开启。
本发明还要解决的一技术问题是提供一种能够合理预测新主机开机数量和时机的云数据中心主机延迟开机系统。
为实现上述目的,本发明提供了一种云数据中心主机延迟开机系统,包括云数据中心服务器,所述云数据中心服务器内设置有云数据中心主机延迟开机装置;所述云数据中心主机延迟开机装置包括主机状态监测模块、控制决策模块和开机控制模块;所述主机状态监测模块的输出端连接所述控制决策模块的输入端,所述控制决策模块的输出端连接所述开机控制模块的输入端;
所述主机状态监测模块用于获取云数据中心各主机的负载信息;
所述控制决策模块用于分析未来新增主机需求量、计算下一次开机控制的等待时间和预期开机数量;
所述开机控制模块用于执行开启新主机的操作。
较佳的,所述控制决策模块包括开机需求量分析单元、控制时机决策单元和开机数计算单元;所述主机状态监测模块的第一输出端连接所述开机需求量分析单元的输入端,所述主机状态监测模块的第二输出端连接所述控制时机决策单元的第一输入端,所述主机状态监测模块的第三输出端连接所述开机数计算单元的输入端;所述开机需求量分析单元的输出端连接所述控制时机决策单元的第二输入端;所述控制时机决策单元的输出端连接所述开机控制模块的第一输入端,所述开机数计算单元的输出端连接所述开机控制模块的第二输入端;
所述主机状态监测模块收集云数据中心负载信息,并判断已开机的主机数量是否等于云数据中心中主机数量的步骤,当已开机的主机数量等于云数据中心中主机数量时,停止操作并结束;当已开机的主机数量不等于云数据中心中主机数量时,主机状态监测模块将收集的云数据中心负载信息发送给所述开机需求量分析单元、开机数计算单元和控制时机决策单元;
所述负载信息包括:
当前时间dt;
已开机的主机数量k,k≥1;
各已经开机的主机的开机时刻kt1,kt2,...ktk
各已开机的主机在时间t内的新增任务数量xs1,xs2,...xsk;t为预先给定的默认控制间隔时间,t>0;
各已开机的主机在时间t内的完成任务数量ws1,ws2,...wsk
各已开机的主机在时间t内,出现故障的任务数量gs1,gs2,...gsk
所述开机需求量分析单元计算已开启的各个主机平均故障率gli
计算 g l i = gs i t &times; t t + dt - k t i + xtgl &times; dt - k t i t + dt - k t i ;
所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为0;为最近t时间内第i个主机的等效故障率,i为正整数;
然后,将xtgl修改为以下新数值:
所述zjsl为云数据中心中主机数量;
所述开机需求量分析单元计算主机最近平均执行率zxl:
所述控制时机决策单元计算下一次开机控制的等待时间为ddt:
ddt = t if &Sigma; i = 1 k w s i x s i > 0.7 t &times; zx l - 1 max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } elseif max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } > 0 a &times; t else ;
所述开机数计算单元计算预期开机数量kjl:
所述zds为单个主机并行处理任务数的最大值;
所述控制决策模块在云数据中心剩余的未开启的主机中,随机选择kjl个主机开启。
本发明的有益效果是:本发明充分考虑了系统负载的动态波动性,通过跟踪其趋势预测合理的新主机开机数量和时机,兼顾性能和节能性。本发明能够根据云数据中心中各主机负载的变化趋势,评估未来任务负载对新主机数量的需求程度,并制定可变的控制间隔时间,使系统对平稳和突变的任务负载变化响应及时。
附图说明
图1是本发明云数据中心主机延迟开机方法一具体实施方式的流程示意图。
图2是本发明云数据中心主机延迟开机装置一具体实施方式的原理示意图。
图3是本发明云数据中心主机延迟开机系统一具体实施方式的原理示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明:
如图1所示,一种云数据中心主机延迟开机的方法,包括以下步骤:
步骤一、开启数据中心中第一台主机,此时的时间记为0;等待时间t后,执行步骤二;t为预先给定的默认控制间隔时间,t>0;本实施例中,t为100-1000毫秒之间的任何数值。
步骤二、收集云数据中心负载信息;
所述负载信息包括:
当前时间dt;
已开机的主机数量k,k≥1;
各已经开机的主机的开机时刻kt1,kt2,...ktk
各已开机的主机在时间t内的新增任务数量xs1,xs2,...xsk
各已开机的主机在时间t内的完成任务数量ws1,ws2,...wsk
各已开机的主机在时间t内,出现故障的任务数量gs1,gs2,...gsk
步骤三、分析未来新增主机需求量:
设定已开启的各个主机平均故障率为gli
计算 g l i = gs i t &times; t t + dt - k t i + xtgl &times; dt - k t i t + dt - k t i 得到已开启的各个主机平均故障率;
所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为0;为最近t时间内第i个主机的等效故障率,i为正整数,上述公式的直观意义是:各个主机的故障率,可以计算为最近t时间内的等效故障率和一个阶段的系统故障率的概率平均值。dt为当前时间,必定晚于第i个主机的开机时间kti,因此上述公式中的分母必定不为0。
然后,将xtgl修改为以下新数值:
所述zjsl为云数据中心中主机数量;上述公式的直观意义是,系统故障率被更新为已开机的主机的平均故障率与还未开机的主机的故障率(计算为0)的平均值。
设定主机最近平均执行率为zxl,计算得到主机最近平均执行率;
上述公式的直观意义是,主机最近平均执行率计算为k个已开机主机在t时间内的单位时间任务完成数的平均值。值得注意的是,k为已开启的主机数量,初始状态时k就已经为1并且逐步增大,因此上述公式分母不会为0。
步骤四、计算下一次开机控制的等待时间和预期开机数量;
设定下一次开机控制的等待时间为ddt,计算 ddt = t if &Sigma; i = 1 k w s i x s i > 0.7 t &times; zx l - 1 max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } elseif max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } > 0 a &times; t else 得到下一次开机控制的等待时间;所述t为步骤一中设置的默认等待时间。
设定预期开机数量为kjl,计算
得到预期开机数量;所述zds为单个主机并行处理任务数的最大值;所述zds由系统硬件配置和任务管理提前决定,本实施例中,所述zds为5-10之间的自然数。
步骤五、在剩余的未开启的主机中,随机选择kjl个主机开启,等待ddt时间后,返回执行步骤二。
所述步骤二之后还包括判断已开机的主机数量是否等于云数据中心中主机数量的步骤,当已开机的主机数量等于云数据中心中主机数量时,停止操作并结束;当已开机的主机数量不等于云数据中心中主机数量时,执行步骤三。
如图2所示,一种云数据中心主机延迟开机装置,包括主机状态监测模块3、控制决策模块4和开机控制模块5;所述主机状态监测模块3的输出端连接所述控制决策模块4的输入端,所述控制决策模块4的输出端连接所述开机控制模块5的输入端。
所述主机状态监测模块3用于获取云数据中心各主机的负载信息。
所述控制决策模块4用于分析未来新增主机需求量、计算下一次开机控制的等待时间和预期开机数量。
所述开机控制模块5用于执行开启新主机的操作。
所述控制决策模块4包括开机需求量分析单元401、控制时机决策单元402和开机数计算单元403;所述主机状态监测模块3的第一输出端连接所述开机需求量分析单元401的输入端,所述主机状态监测模块3的第二输出端连接所述控制时机决策单元402的第一输入端,所述主机状态监测模块3的第三输出端连接所述开机数计算单元403的输入端;所述开机需求量分析单元401的输出端连接所述控制时机决策单元402的第二输入端;所述控制时机决策单元402的输出端连接所述开机控制模块5的第一输入端,所述开机数计算单元403的输出端连接所述开机控制模块5的第二输入端。
所述主机状态监测模块3收集云数据中心负载信息,并判断已开机的主机数量是否等于云数据中心中主机数量的步骤,当已开机的主机数量等于云数据中心中主机数量时,停止操作并结束;当已开机的主机数量不等于云数据中心中主机数量时,主机状态监测模块3将收集的云数据中心负载信息发送给所述开机需求量分析单元401、开机数计算单元403和控制时机决策单元402。
所述负载信息包括:
当前时间dt;
已开机的主机数量k,k≥1;
各已经开机的主机的开机时刻kt1,kt2,...ktk
各已开机的主机在时间t内的新增任务数量xs1,xs2,...xsk;t为预先给定的默认控制间隔时间,t>0;
各已开机的主机在时间t内的完成任务数量ws1,ws2,...wsk
各已开机的主机在时间t内,出现故障的任务数量gs1,gs2,...gsk
所述开机需求量分析单元401计算已开启的各个主机平均故障率gli
计算 g l i = gs i t &times; t t + dt - k t i + xtgl &times; dt - k t i t + dt - k t i ;
所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为0;为最近t时间内第i个主机的等效故障率,i为正整数;
然后,将xtgl修改为以下新数值:
所述zjsl为云数据中心中主机数量;
所述开机需求量分析单元401计算主机最近平均执行率zxl:
所述控制时机决策单元402计算下一次开机控制的等待时间为ddt:
ddt = t if &Sigma; i = 1 k w s i x s i > 0.7 t &times; zx l - 1 max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } elseif max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } > 0 a &times; t else ;
所述开机数计算单元403计算预期开机数量kjl:
所述zds为单个主机并行处理任务数的最大值;所述zds由系统硬件配置和任务管理提前决定,本实施例中,所述zds为5-10之间的自然数。
所述控制决策模块4在云数据中心剩余的未开启的主机中,随机选择kjl个主机开启。
如图3所示,一种云数据中心主机延迟开机系统,包括云数据中心服务器1,所述云数据中心服务器1内设置有云数据中心主机延迟开机装置2;所述云数据中心主机延迟开机装置2包括主机状态监测模块3、控制决策模块4和开机控制模块5;所述主机状态监测模块3的输出端连接所述控制决策模块4的输入端,所述控制决策模块4的输出端连接所述开机控制模块5的输入端。
所述主机状态监测模块3用于获取云数据中心各主机的负载信息。
所述控制决策模块4用于分析未来新增主机需求量、计算下一次开机控制的等待时间和预期开机数量。
所述开机控制模块5用于执行开启新主机的操作。
所述控制决策模块4包括开机需求量分析单元401、控制时机决策单元402和开机数计算单元403;所述主机状态监测模块3的第一输出端连接所述开机需求量分析单元401的输入端,所述主机状态监测模块3的第二输出端连接所述控制时机决策单元402的第一输入端,所述主机状态监测模块3的第三输出端连接所述开机数计算单元403的输入端;所述开机需求量分析单元401的输出端连接所述控制时机决策单元402的第二输入端;所述控制时机决策单元402的输出端连接所述开机控制模块5的第一输入端,所述开机数计算单元403的输出端连接所述开机控制模块5的第二输入端。
所述主机状态监测模块3收集云数据中心负载信息,并判断已开机的主机数量是否等于云数据中心中主机数量的步骤,当已开机的主机数量等于云数据中心中主机数量时,停止操作并结束;当已开机的主机数量不等于云数据中心中主机数量时,主机状态监测模块3将收集的云数据中心负载信息发送给所述开机需求量分析单元401、开机数计算单元403和控制时机决策单元402。
所述负载信息包括:
当前时间dt;
已开机的主机数量k,k≥1;
各已经开机的主机的开机时刻kt1,kt2,...ktk
各已开机的主机在时间t内的新增任务数量xs1,xs2,...xsk;t为预先给定的默认控制间隔时间,t>0;
各已开机的主机在时间t内的完成任务数量ws1,ws2,...wsk
各已开机的主机在时间t内,出现故障的任务数量gs1,gs2,...gsk
所述开机需求量分析单元401计算已开启的各个主机平均故障率gli
计算 g l i = gs i t &times; t t + dt - k t i + xtgl &times; dt - k t i t + dt - k t i ;
所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为0;为最近t时间内第i个主机的等效故障率,i为正整数。
然后,将xtgl修改为以下新数值:
所述zjsl为云数据中心中主机数量;
所述开机需求量分析单元401计算主机最近平均执行率zxl:
所述控制时机决策单元402计算下一次开机控制的等待时间为ddt:
ddt = t if &Sigma; i = 1 k w s i x s i > 0.7 t &times; zx l - 1 max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } elseif max { x s i | 0 < i &le; k } + max { g s i | 0 < i &le; k } > 0 a &times; t else ;
所述开机数计算单元403计算预期开机数量kjl:
所述zds为单个主机并行处理任务数的最大值;所述zds由系统硬件配置和任务管理提前决定,本实施例中,zds为5-10之间的自然数。
所述控制决策模块4在云数据中心剩余的未开启的主机中,随机选择kjl个主机开启。
本发明减少了一次性开启全部数据中心主机带来的能耗浪费,根据系统实时的负载变化预测任务对主机数量的需求度,选择性的逐步开启部分主机以应付新任务对计算资源的需求增长,兼顾了云数据中心的性能和节能醒。本发明实施例所提供的一种云数据中心主机延迟开机的装置,可以部署于一个现有的主机中,也可以部署以一个单独设置的专用于云数据中心主机延迟开机的服务器中。为此,本发明提供了一种服务器,包括本发明实施例所提供的一种云数据中心主机延迟开机的装置。本领域普通技术人员可以理解实现上述实施例方法中一种云数据中心主机延迟开机的过程,可以通过程序指令相关的硬件来完成,该程序在执行时执行上述方法中的对应步骤。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (6)

1.一种云数据中心主机延迟开机的方法,其特征在于包括以下步骤:
步骤一、开启数据中心中第一台主机,此时的时间记为0;等待时间t后,执行步骤二;t为预先给定的默认控制间隔时间,t>0;
步骤二、收集云数据中心负载信息;
所述负载信息包括:
当前时间dt;
已开机的主机数量k,k≥1;
各已经开机的主机的开机时刻kt1,kt2,...ktk
各已开机的主机在时间t内的新增任务数量xs1,xs2,...xsk
各已开机的主机在时间t内的完成任务数量ws1,ws2,...wsk
各已开机的主机在时间t内,出现故障的任务数量gs1,gs2,...gsk
步骤三、分析未来新增主机需求量:
设定已开启的各个主机平均故障率为gli
计算 gl 1 = gs 1 t &times; t t + dt - kt 1 + xtgl &times; dt - kt 1 t + dt - kt 1 得到已开启的各个主机平均故障率;
所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为0;为最近t时间内第i个主机的等效故障率,i为正整数;
然后,将xtgl修改为以下新数值:
所述zjsl为云数据中心中主机数量;
设定主机最近平均执行率为zxl,计算得到主机最近平均执行率;
步骤四、计算下一次开机控制的等待时间和预期开机数量;
设定下一次开机控制的等待时间为ddt,计算
ddt= t if &Sigma; i = 1 k ws i xs i > 0.7 t &times; zxl - 1 max { xs i | 0 < i &le; k } + max { gs i | 0 < i &le; k } elseif max { xs i | 0 < i &le; k } + max { gs i | 0 < i &le; k } > 0 a &times; t else 得到下一次开机控制的等待时间;
设定预期开机数量为kjl,计算
得到预期开机数量;所述zds为单个主机并行处理任务数的最大值;
步骤五、在剩余的未开启的主机中,随机选择kjl个主机开启,等待ddt时间后,返回执行步骤二。
2.如权利要求1所述的一种云数据中心主机延迟开机的方法,其特征是:所述步骤二之后还包括判断已开机的主机数量是否等于云数据中心中主机数量的步骤,当已开机的主机数量等于云数据中心中主机数量时,停止操作并结束;当已开机的主机数量不等于云数据中心中主机数量时,执行步骤三。
3.一种云数据中心主机延迟开机装置,其特征是:包括主机状态监测模块(3)、控制决策模块(4)和开机控制模块(5);所述主机状态监测模块(3)的输出端连接所述控制决策模块(4)的输入端,所述控制决策模块(4)的输出端连接所述开机控制模块(5)的输入端;
所述主机状态监测模块(3)用于获取云数据中心各主机的负载信息;
所述控制决策模块(4)用于分析未来新增主机需求量、计算下一次开机控制的等待时间和预期开机数量;
所述开机控制模块(5)用于执行开启新主机的操作。
4.如权利要求3所述的一种云数据中心主机延迟开机装置,其特征是:所述控制决策模块(4)包括开机需求量分析单元(401)、控制时机决策单元(402)和开机数计算单元(403);所述主机状态监测模块(3)的第一输出端连接所述开机需求量分析单元(401)的输入端,所述主机状态监测模块(3)的第二输出端连接所述控制时机决策单元(402)的第一输入端,所述主机状态监测模块(3)的第三输出端连接所述开机数计算单元(403)的输入端;所述开机需求量分析单元(401)的输出端连接所述控制时机决策单元(402)的第二输入端;所述控制时机决策单元(402)的输出端连接所述开机控制模块(5)的第一输入端,所述开机数计算单元(403)的输出端连接所述开机控制模块(5)的第二输入端;
所述主机状态监测模块(3)收集云数据中心负载信息,并判断已开机的主机数量是否等于云数据中心中主机数量的步骤,当已开机的主机数量等于云数据中心中主机数量时,停止操作并结束;当已开机的主机数量不等于云数据中心中主机数量时,主机状态监测模块(3)将收集的云数据中心负载信息发送给所述开机需求量分析单元(401)、开机数计算单元(403)和控制时机决策单元(402);
所述负载信息包括:
当前时间dt;
已开机的主机数量k,k≥1;
各已经开机的主机的开机时刻kt1,kt2,...ktk
各已开机的主机在时间t内的新增任务数量xs1,xs2,...xsk;t为预先给定的默认控制间隔时间,t>0;
各已开机的主机在时间t内的完成任务数量ws1,ws2,...wsk
各已开机的主机在时间t内,出现故障的任务数量gs1,gs2,...gsk
所述开机需求量分析单元(401)计算已开启的各个主机平均故障率gli
计算 gl 1 = gs 1 t &times; t t + dt - kt 1 + xtgl &times; dt - kt 1 t + dt - kt 1 ;
所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为0;为最近t时间内第i个主机的等效故障率,i为正整数;
然后,将xtgl修改为以下新数值:
所述zjsl为云数据中心中主机数量;
所述开机需求量分析单元(401)计算主机最近平均执行率zxl: zxl = &Sigma; i = 1 k ws i t k ;
所述控制时机决策单元(402)计算下一次开机控制的等待时间为ddt:
ddt= t if &Sigma; i = 1 k ws i xs i > 0.7 t &times; zxl - 1 max { xs i | 0 < i &le; k } + max { gs i | 0 < i &le; k } elseif max { xs i | 0 < i &le; k } + max { gs i | 0 < i &le; k } > 0 a &times; t else ;
所述开机数计算单元(403)计算预期开机数量kjl:
所述zds为单个主机并行处理任务数的最大值;
所述控制决策模块(4)在云数据中心剩余的未开启的主机中,随机选择kjl个主机开启。
5.一种云数据中心主机延迟开机系统,包括云数据中心服务器(1),其特征是:所述云数据中心服务器(1)内设置有云数据中心主机延迟开机装置(2);所述云数据中心主机延迟开机装置(2)包括主机状态监测模块(3)、控制决策模块(4)和开机控制模块(5);所述主机状态监测模块(3)的输出端连接所述控制决策模块(4)的输入端,所述控制决策模块(4)的输出端连接所述开机控制模块(5)的输入端;
所述主机状态监测模块(3)用于获取云数据中心各主机的负载信息;
所述控制决策模块(4)用于分析未来新增主机需求量、计算下一次开机控制的等待时间和预期开机数量;
所述开机控制模块(5)用于执行开启新主机的操作。
6.如权利要求5所述的一种云数据中心主机延迟开机系统,其特征是:所述控制决策模块(4)包括开机需求量分析单元(401)、控制时机决策单元(402)和开机数计算单元(403);所述主机状态监测模块(3)的第一输出端连接所述开机需求量分析单元(401)的输入端,所述主机状态监测模块(3)的第二输出端连接所述控制时机决策单元(402)的第一输入端,所述主机状态监测模块(3)的第三输出端连接所述开机数计算单元(403)的输入端;所述开机需求量分析单元(401)的输出端连接所述控制时机决策单元(402)的第二输入端;所述控制时机决策单元(402)的输出端连接所述开机控制模块(5)的第一输入端,所述开机数计算单元(403)的输出端连接所述开机控制模块(5)的第二输入端;
所述主机状态监测模块(3)收集云数据中心负载信息,并判断已开机的主机数量是否等于云数据中心中主机数量的步骤,当已开机的主机数量等于云数据中心中主机数量时,停止操作并结束;当已开机的主机数量不等于云数据中心中主机数量时,主机状态监测模块(3)将收集的云数据中心负载信息发送给所述开机需求量分析单元(401)、开机数计算单元(403)和控制时机决策单元(402);
所述负载信息包括:
当前时间dt;
已开机的主机数量k,k≥1;
各已经开机的主机的开机时刻kt1,kt2,...ktk
各已开机的主机在时间t内的新增任务数量xs1,xs2,...xsk;t为预先给定的默认控制间隔时间,t>0;
各已开机的主机在时间t内的完成任务数量ws1,ws2,...wsk
各已开机的主机在时间t内,出现故障的任务数量gs1,gs2,...gsk
所述开机需求量分析单元(401)计算已开启的各个主机平均故障率gli
计算 gl 1 = gs 1 t &times; t t + dt - kt 1 + xtgl &times; dt - kt 1 t + dt - kt 1 ;
所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为0;为最近t时间内第i个主机的等效故障率,i为正整数;
然后,将xtgl修改为以下新数值:
所述zjsl为云数据中心中主机数量;
所述开机需求量分析单元(401)计算主机最近平均执行率zxl: zxl = &Sigma; i = 1 k ws i t k ;
所述控制时机决策单元(402)计算下一次开机控制的等待时间为ddt:
ddt= t if &Sigma; i = 1 k ws i xs i > 0.7 t &times; zxl - 1 max { xs i | 0 < i &le; k } + max { gs i | 0 < i &le; k } elseif max { xs i | 0 < i &le; k } + max { gs i | 0 < i &le; k } > 0 a &times; t else ;
所述开机数计算单元(403)计算预期开机数量kjl:
所述zds为单个主机并行处理任务数的最大值;
所述控制决策模块(4)在云数据中心剩余的未开启的主机中,随机选择kjl个主机开启。
CN201510147721.XA 2015-03-31 2015-03-31 一种云数据中心主机延迟开机的方法、装置和系统 Active CN104765435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510147721.XA CN104765435B (zh) 2015-03-31 2015-03-31 一种云数据中心主机延迟开机的方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510147721.XA CN104765435B (zh) 2015-03-31 2015-03-31 一种云数据中心主机延迟开机的方法、装置和系统

Publications (2)

Publication Number Publication Date
CN104765435A true CN104765435A (zh) 2015-07-08
CN104765435B CN104765435B (zh) 2018-01-16

Family

ID=53647327

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510147721.XA Active CN104765435B (zh) 2015-03-31 2015-03-31 一种云数据中心主机延迟开机的方法、装置和系统

Country Status (1)

Country Link
CN (1) CN104765435B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105204961A (zh) * 2015-09-21 2015-12-30 重庆大学 一种云数据中心主机检查点设置的方法、装置和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120317425A1 (en) * 2011-06-13 2012-12-13 Hon Hai Precision Industry Co., Ltd. Power supply control system and method
CN103685541A (zh) * 2013-12-23 2014-03-26 重庆广播电视大学 IaaS云系统运行速率动态控制装置、系统及方法
CN104063282A (zh) * 2014-05-06 2014-09-24 重庆大学 IaaS云可变规模资源池管理方法、装置和服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120317425A1 (en) * 2011-06-13 2012-12-13 Hon Hai Precision Industry Co., Ltd. Power supply control system and method
CN103685541A (zh) * 2013-12-23 2014-03-26 重庆广播电视大学 IaaS云系统运行速率动态控制装置、系统及方法
CN104063282A (zh) * 2014-05-06 2014-09-24 重庆大学 IaaS云可变规模资源池管理方法、装置和服务器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105204961A (zh) * 2015-09-21 2015-12-30 重庆大学 一种云数据中心主机检查点设置的方法、装置和系统
CN105204961B (zh) * 2015-09-21 2018-10-26 重庆大学 一种云数据中心主机检查点设置的方法、装置和系统

Also Published As

Publication number Publication date
CN104765435B (zh) 2018-01-16

Similar Documents

Publication Publication Date Title
US8473768B2 (en) Power control apparatus and method for cluster system
US9424084B2 (en) Systems, methods, and media for online server workload management
CN102326134B (zh) 能量感知服务器管理
RU2601957C2 (ru) Способ и устройство управления энергетическими услугами на основе рыночных данных
US9728976B2 (en) Method and system for allocating energy
US20090240964A1 (en) Method and apparatus for holistic power management to dynamically and automatically turn servers, network equipment and facility components on and off inside and across multiple data centers based on a variety of parameters without violating existing service levels
JP6602079B2 (ja) 電力配電回路網を制御するためのシステムおよび方法
CN105320559A (zh) 一种云计算系统的调度方法和装置
CN102624546B (zh) 功耗封顶的控制方法、设备和系统
CN107544381A (zh) 能源管理方法及装置
Fu et al. Assessments of data centers for provision of frequency regulation
CN109324679A (zh) 一种服务器能耗控制方法及装置
JP2023532492A (ja) 空調制御方法及び装置、電気機器、媒体
CN115016923A (zh) 基于边缘网关的物联网数据智能处理方法
CN115619136A (zh) 楼宇管理方法和系统
CN115314343A (zh) 一种源荷储资源聚合控制网关装置及负荷和出力预测方法
CN116405407A (zh) 一种基于大数据的网络管理方法及系统
CN117353349B (zh) 储能系统的供电状态控制方法、存储介质及电子设备
CN115576203A (zh) 基于神经网络的嵌入式电除尘智能控制方法和系统
CN117850494A (zh) 基于ai算法的数据中心节能控制方法
CN113690885B (zh) 一种供电控制方法及供电平台
WO2024113906A1 (zh) 一种服务器集群温度调节方法和装置
CN104765435A (zh) 一种云数据中心主机延迟开机的方法、装置和系统
CN105116987A (zh) 一种云计算中心的通用电源和性能管理系统
CN110334900B (zh) 数据处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Li Weiling

Inventor after: Zhang Yu

Inventor after: Ren Hao

Inventor after: Wang Luyue

Inventor after: Xia Yunni

Inventor after: Wu Quanwang

Inventor after: Guo Kunyin

Inventor after: Zhu Qingsheng

Inventor before: Xia Yunni

Inventor before: Guo Kunken

Inventor before: Luo Xin

Inventor before: Zhu Qingsheng

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190415

Address after: 401120 5 stories, Block 106, West Jinkai Avenue, Yubei District, Chongqing

Patentee after: Chongqing Zhongke Yuncong Technology Co., Ltd.

Address before: 400045 Sha Zheng street, Shapingba District, Chongqing City, No. 174

Patentee before: Chongqing University

TR01 Transfer of patent right