CN104777890A - 一种多路服务器的功耗管理系统 - Google Patents

一种多路服务器的功耗管理系统 Download PDF

Info

Publication number
CN104777890A
CN104777890A CN201510153673.5A CN201510153673A CN104777890A CN 104777890 A CN104777890 A CN 104777890A CN 201510153673 A CN201510153673 A CN 201510153673A CN 104777890 A CN104777890 A CN 104777890A
Authority
CN
China
Prior art keywords
power consumption
clump
rmc
smc
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510153673.5A
Other languages
English (en)
Inventor
叶丰华
林楷智
李鹏翀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201510153673.5A priority Critical patent/CN104777890A/zh
Publication of CN104777890A publication Critical patent/CN104777890A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开一种多路服务器的功耗管理系统,属于服务器管理领域;多路服务器包括三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;一定数量的clump组成一个group,一定数量的group组成rack;clump内BMC收集clump的功耗信息发送给所在group的SMC,所有group的SMC收集到的功耗信息发送给RMC进行系统集中功耗管理;本发明根据以上设置可以制定灵活的功耗控制策略,实现多路服务器功耗的智能管理和控制,能够适应多路服务器各种配置要求。

Description

一种多路服务器的功耗管理系统
技术领域
本发明公开一种多路服务器的功耗管理系统,属于服务器管理领域,具体涉及多路服务器的功耗管理系统,多路服务器的功耗管理方法。
背景技术
整个服务器处理器领域大体分三大块,那就是单处理器、双处理器和多处理器,单处理器就是个在同一系统中只支持单个处理器的处理器,如PC处理器,双处理器目前来说只是服务器和高性能工作站中使用,而多处理器则通常是专为服务器而开发的。其中的“路”都是指服务器物理CPU的数量,也就是服务器主板上CPU插槽的数量。多路服务器作为一个高度集成化的整体系统,其内部集成很多计算节点,尤其是达到一定规模后如16路、32路甚至64路服务器,功耗总量相对普通服务器高很多,而机房供电系统的升级改造成本较高,故对功耗的控制和节电要求较高。而且其组成的clump数量非常多,依靠传统Intel芯片内集成的功耗管理引擎ME很难适应这种多路服务器的系统管理。本发明提出一种多路服务器的功耗管理系统,通过创建3级管理控制器,即rack、group、clump为单位层级进行功耗数据收集和功耗策略的制定、转发,实现多路服务器功耗的智能管理,其中每个clump内集成BMC;每个group内集成SMC;整个多路服务器rack系统由RMC进行管理。根据以上设置制定灵活的功耗控制策略,实现多路服务器功耗的智能管理和控制,能够适应多路服务器各种配置要求。
 其中BMC, Baseboard Management Controller,基板管理控制器。支持行业标准的 IPMI 规范。该规范描述了已经内置到主板上的管理功能。这些功能包括:本地和远程诊断、控制台支持、配置管理、硬件管理和故障排除。
SMC,System Management Controller,系统管理控制器。
RMC,Racks Management Controller,机柜管理控制器。
发明内容
本发明针对多路服务器功耗总量相对普通服务器高很多,对功耗的控制和节电要求较高,依靠传统Intel芯片内集成的功耗管理引擎ME很难适应这种多路服务器的系统管理的问题,提供一种多路服务器的功耗管理系统,可应用于对多路服务器的功耗进行动态管理和控制,根据本发明设置3级管理控制器,制定灵活的功耗控制策略,实现多路服务器功耗的智能管理和控制,能够适应多路服务器各种配置要求。
本发明提出的具体方案是:
一种多路服务器的功耗管理系统,多路服务器包括三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;
一定数量的clump组成一个group,一定数量的group组成rack;clump内BMC收集clump的功耗信息发送给所在group的SMC,所有group的SMC收集到的功耗信息发送给RMC进行系统集中功耗管理;
RMC为最高级功耗策略控制器,负责接收整机功耗信息,根据机房对每个rack的功率分配状况,制定对应的功耗控制策略;SMC为次级功耗策略控制器,负责传达RMC发送过来的功耗控制策略,同时在没有RMC功耗控制时,制定group内的功耗控制策略;BMC为最低级功耗策略控制器,负责执行SMC发过来的功耗控制策略,控制clump功耗。
所述的clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中。
每个所述的group设置独立的AC供电系统。
所述的clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC。
一种多路服务器的功耗管理方法,在多路服务器中设置三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;
功耗信息的收集:一定数量的clump组成一个group,一定数量的group组成rack;clump内BMC收集clump的功耗信息发送给所在group的SMC,所有group的SMC收集到的功耗信息发送给RMC进行系统集中功耗管理;
功耗控制:RMC为最高级功耗策略控制器,负责接收整机功耗信息,根据机房对每个rack的功率分配状况,制定对应的功耗控制策略;SMC为次级功耗策略控制器,负责传达RMC发送过来的功耗控制策略,同时在没有RMC功耗控制时,制定group内的功耗控制策略;BMC为最低级功耗策略控制器,负责执行SMC发过来的功耗控制策略,控制clump功耗。
所述的clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中。
所述的功耗信息的收集中clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC。
所述的功耗控制:
当RMC收集到系统总功耗超出rack所分配的功耗,RMC判断需要限制系统功耗,制定限制功耗策略下达给SMC,SMC将策略转发给所属clump的BMC,BMC通过PECI总线与CPU进行带内带外交互,对CPU下达功耗限制指令,对系统内功耗设备进行降频,限制clump的功耗,降低整机总功耗;
当RMC判断系统总功耗没有超出rack所分配的功耗,先不做功耗限制,SMC根据group内部的功耗判断是否超出该group内部功耗来制定group功耗限制策略,将策略下达给BMC进行功耗控制,BMC控制clump的功耗。
当RMC判断系统总功耗没有超出rack所分配的功耗,进行功耗节电控制,过程为:
当系统处于临时空闲时,RMC通过SMC对各个clump的BMC下达节电指令,BMC通过PECI总线对系统内功耗设备进行降频以节省能耗;
当前系统处于空闲时,RMC根据系统负载状况计算出需要的处理器数量,并调节多路服务器中CPU的在线数量。
当前系统处于空闲时,RMC根据系统负载状况计算出需要的处理器数量,并调节多路服务器中CPU的在线数量,过程为:
RMC通过部分group中的SMC通知BMC,以clump为单位进行任务的迁移,BMC通过LPC总线进行带内带外交互,将过剩的clump离线操作,减少系统CPU的数量;当系统需要更多CPU资源时,OS通知legacy clump的BMC将需求的指令通过SMC发送给RMC,RMC根据资源的需求计算出需要增加的clump数量,启动clump在线,增加CPU数量。
本发明的有益之处是:本发明通过创建三级管理控制器,即rack、group、clump为单位层级进行功耗数据收集和功耗策略的制定、转发,实现多路服务器功耗的智能管理,其中每个clump内集成BMC;每个group内集成SMC;整个多路服务器rack系统由RMC进行管理。根据以上设置可以制定灵活的功耗控制策略,实现多路服务器功耗的智能管理和控制,能够适应多路服务器各种配置要求。
附图说明
图1 多路服务器的功耗管理系统组成示意图;
图2功耗信息收集过程示意图;
图3功耗控制过程示意图;
图4减少CPU数量的功耗控制过程示意图。
具体实施方式
结合附图对本发明做进一步说明。
结合图1,一种多路服务器的功耗管理系统,此系统包括三级功耗管理层:rack系统管理层,设置RMC进行管理; group管理层,有4组独立的group,每个group设置独立的AC供电系统,内部集成SMC进行管理,分别是SMC1、SMC2、SMC1′、SMC2′;clump管理层,分别在4组独立的group下,其中group1下是clump0至clump03,group2下是clump4至clump07,group1′下是clump0′至clump3′,group2′下是clump4′至clump7′,每个clump内部集成BMC进行管理,;clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中,legacy clump可以根据用户需要指定;
结合图2,clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC;
RMC为最高级功耗策略控制器,负责接收整机功耗信息,根据机房对每个rack的功率分配状况,制定对应的功耗控制策略;SMC为次级功耗策略控制器,负责传达RMC发送过来的功耗控制策略,同时在没有RMC功耗控制时,制定group内的功耗控制策略;BMC为最低级功耗策略控制器,负责执行SMC发过来的功耗控制策略,控制clump功耗。
结合图3,一种多路服务器的功耗管理方法,在多路服务器中设置三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中;
图中为clump内为4颗CPU,通过PECI总线连接BMC,4个clump组成一个group,2个group组成rack;clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC;
功耗控制过程:
当RMC收集到系统总功耗超出rack所分配的功耗,RMC判断需要限制系统功耗,制定限制功耗策略下达给SMC,SMC将策略转发给所属clump的BMC,BMC通过PECI总线与CPU进行带内带外交互,对CPU下达功耗限制指令,对系统内功耗设备进行降频,限制clump的功耗,降低整机总功耗;
当RMC判断系统总功耗没有超出rack所分配的功耗,先不做功耗限制,SMC根据group内部的功耗判断是否超出该group内部功耗来制定group功耗限制策略,将策略下达给BMC进行功耗控制,BMC控制clump的功耗。
结合图4,当RMC判断系统总功耗没有超出rack所分配的功耗,进行功耗节电控制,过程为:
当系统处于临时空闲时,RMC通过SMC对各个clump的BMC下达节电指令,BMC通过PECI总线对系统内功耗设备进行降频以节省能耗;
图中当前系统处于空闲时,RMC根据系统负载状况计算出需要的处理器数量,并调节多路服务器中CPU的在线数量,过程为:
RMC通过部分group中的SMC通知BMC,以clump为单位进行任务的迁移,BMC通过LPC总线进行带内带外交互,将过剩的clump离线操作,减少系统CPU的数量;当系统需要更多CPU资源时,OS与BIOS通知legacy clump的BMC将需求的指令通过SMC发送给RMC,RMC根据资源的需求计算出需要增加的clump数量,启动clump在线,增加CPU数量。

Claims (10)

1.一种多路服务器的功耗管理系统,其特征是多路服务器包括三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;
一定数量的clump组成一个group,一定数量的group组成rack;clump内BMC收集clump的功耗信息发送给所在group的SMC,所有group的SMC收集到的功耗信息发送给RMC进行系统集中功耗管理;
RMC为最高级功耗策略控制器,负责接收整机功耗信息,根据机房对每个rack的功率分配状况,制定对应的功耗控制策略;SMC为次级功耗策略控制器,负责传达RMC发送过来的功耗控制策略,同时在没有RMC功耗控制时,制定group内的功耗控制策略;BMC为最低级功耗策略控制器,负责执行SMC发过来的功耗控制策略,控制clump功耗。
2.根据权利要求1所述的一种多路服务器的功耗管理系统,其特征是所述的clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中。
3.根据权利要求1或2所述的一种多路服务器的功耗管理系统,其特征是每个所述的group设置独立的AC供电系统。
4.根据权利要求1所述的一种多路服务器的功耗管理系统,其特征是所述的clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC。
5.一种多路服务器的功耗管理方法,其特征是在多路服务器中设置三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;
功耗信息的收集:一定数量的clump组成一个group,一定数量的group组成rack;clump内BMC收集clump的功耗信息发送给所在group的SMC,所有group的SMC收集到的功耗信息发送给RMC进行系统集中功耗管理;
功耗控制:RMC为最高级功耗策略控制器,负责接收整机功耗信息,根据机房对每个rack的功率分配状况,制定对应的功耗控制策略;SMC为次级功耗策略控制器,负责传达RMC发送过来的功耗控制策略,同时在没有RMC功耗控制时,制定group内的功耗控制策略;BMC为最低级功耗策略控制器,负责执行SMC发过来的功耗控制策略,控制clump功耗。
6.根据权利要求5所述的一种多路服务器的功耗管理方法,其特征是所述的clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中;每个所述的group设置独立的AC供电系统。
7.根据权利要求6所述的一种多路服务器的功耗管理方法,其特征是所述的功耗信息的收集过程中clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC。
8.根据权利要求6所述的一种多路服务器的功耗管理方法,其特征是所述的功耗控制过程中:
当RMC收集到系统总功耗超出rack所分配的功耗,RMC判断需要限制系统功耗,制定限制功耗策略下达给SMC,SMC将策略转发给所属clump的BMC,BMC通过PECI总线与CPU进行带内带外交互,对CPU下达功耗限制指令,对系统内功耗设备进行降频,限制clump的功耗,降低整机总功耗;
当RMC判断系统总功耗没有超出rack所分配的功耗,先不做功耗限制,SMC根据group内部的功耗判断是否超出该group内部功耗来制定group功耗限制策略,将策略下达给BMC进行功耗控制,BMC控制clump的功耗。
9.根据权利要求8所述的一种多路服务器的功耗管理方法,其特征是当RMC判断系统总功耗没有超出rack所分配的功耗,进行功耗节电控制,过程为:
当系统处于临时空闲时,RMC通过SMC对各个clump的BMC下达节电指令,BMC通过PECI总线对系统内功耗设备进行降频以节省能耗;
当前系统处于空闲时,RMC根据系统负载状况计算出需要的处理器数量,并调节多路服务器中CPU的在线数量。
10.根据权利要求9所述的一种多路服务器的功耗管理方法,其特征是当前系统处于空闲时,RMC根据系统负载状况计算出需要的处理器数量,并调节多路服务器中CPU的在线数量,过程为:
RMC通过部分group中的SMC通知BMC,以clump为单位进行任务的迁移,BMC通过LPC总线进行带内带外交互,将过剩的clump离线操作,减少系统CPU的数量;当系统需要更多CPU资源时,OS通知legacy clump的BMC将需求的指令通过SMC发送给RMC,RMC根据资源的需求计算出需要增加的clump数量,启动clump在线,增加CPU数量。
CN201510153673.5A 2015-04-02 2015-04-02 一种多路服务器的功耗管理系统 Pending CN104777890A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510153673.5A CN104777890A (zh) 2015-04-02 2015-04-02 一种多路服务器的功耗管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510153673.5A CN104777890A (zh) 2015-04-02 2015-04-02 一种多路服务器的功耗管理系统

Publications (1)

Publication Number Publication Date
CN104777890A true CN104777890A (zh) 2015-07-15

Family

ID=53619411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510153673.5A Pending CN104777890A (zh) 2015-04-02 2015-04-02 一种多路服务器的功耗管理系统

Country Status (1)

Country Link
CN (1) CN104777890A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068641A (zh) * 2015-08-19 2015-11-18 山东超越数控电子有限公司 一种计算机系统待机/唤醒功能实现方法
CN105490859A (zh) * 2015-12-18 2016-04-13 山东海量信息技术研究院 一种高端容错服务器的节点定位方法
CN106020422A (zh) * 2016-05-24 2016-10-12 英业达科技有限公司 计算机系统的功耗控制方法及系统
CN106598188A (zh) * 2016-12-15 2017-04-26 郑州云海信息技术有限公司 一种确定系统功耗基准的方法及装置
CN106843444A (zh) * 2016-12-29 2017-06-13 郑州云海信息技术有限公司 一种多架构cpu能耗控制系统
CN108090000A (zh) * 2018-01-11 2018-05-29 郑州云海信息技术有限公司 一种获取cpu寄存器信息的方法及系统
CN108958837A (zh) * 2018-06-29 2018-12-07 深圳市同泰怡信息技术有限公司 一种动态配置me固件的方法、系统及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101441506A (zh) * 2007-11-20 2009-05-27 中兴通讯股份有限公司 一种刀片服务器系统及其功耗管理方法
US20120136484A1 (en) * 2010-11-30 2012-05-31 Inventec Corporation Data center
US20130110926A1 (en) * 2011-10-28 2013-05-02 Inventec Corporation Method for Controlling Rack System
CN103428021A (zh) * 2012-05-25 2013-12-04 华为技术有限公司 机柜级服务器、机柜级服务器节点信息管理方法和系统
CN104049692A (zh) * 2014-06-27 2014-09-17 浪潮(北京)电子信息产业有限公司 一种刀片服务器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101441506A (zh) * 2007-11-20 2009-05-27 中兴通讯股份有限公司 一种刀片服务器系统及其功耗管理方法
US20120136484A1 (en) * 2010-11-30 2012-05-31 Inventec Corporation Data center
US20130110926A1 (en) * 2011-10-28 2013-05-02 Inventec Corporation Method for Controlling Rack System
CN103428021A (zh) * 2012-05-25 2013-12-04 华为技术有限公司 机柜级服务器、机柜级服务器节点信息管理方法和系统
CN104049692A (zh) * 2014-06-27 2014-09-17 浪潮(北京)电子信息产业有限公司 一种刀片服务器

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068641A (zh) * 2015-08-19 2015-11-18 山东超越数控电子有限公司 一种计算机系统待机/唤醒功能实现方法
CN105490859A (zh) * 2015-12-18 2016-04-13 山东海量信息技术研究院 一种高端容错服务器的节点定位方法
CN105490859B (zh) * 2015-12-18 2019-01-22 山东海量信息技术研究院 一种高端容错服务器的节点定位方法
CN106020422A (zh) * 2016-05-24 2016-10-12 英业达科技有限公司 计算机系统的功耗控制方法及系统
CN106598188A (zh) * 2016-12-15 2017-04-26 郑州云海信息技术有限公司 一种确定系统功耗基准的方法及装置
CN106843444A (zh) * 2016-12-29 2017-06-13 郑州云海信息技术有限公司 一种多架构cpu能耗控制系统
CN106843444B (zh) * 2016-12-29 2019-12-17 苏州浪潮智能科技有限公司 一种多架构cpu能耗控制系统
CN108090000A (zh) * 2018-01-11 2018-05-29 郑州云海信息技术有限公司 一种获取cpu寄存器信息的方法及系统
CN108958837A (zh) * 2018-06-29 2018-12-07 深圳市同泰怡信息技术有限公司 一种动态配置me固件的方法、系统及介质
CN108958837B (zh) * 2018-06-29 2021-10-01 深圳市同泰怡信息技术有限公司 一种动态配置me固件的方法、系统及介质

Similar Documents

Publication Publication Date Title
CN104777890A (zh) 一种多路服务器的功耗管理系统
US9778718B2 (en) Power supply and data center control
Durand et al. Euroserver: Energy efficient node for european micro-servers
EP2619637B1 (en) Data center control
CN104035817A (zh) 大规模集成电路物理实现的分布式并行计算方法及其系统
CN104503932B (zh) 多主板服务器主基板管理控制器仲裁方法及系统
CN102271145A (zh) 一种虚拟计算机集群及其实施方法
CN102289402A (zh) 一种基于物理多分区计算机体系结构的监控管理方法
CN104158911A (zh) 一种面向服务器集群的控制方法及系统
CN102426544A (zh) 任务分配方法和系统
CN103455378A (zh) 一种虚拟化集群的资源分配方法、装置和系统
CN203745989U (zh) 一体化高密度服务器机箱
CN103780646A (zh) 一种云资源的调度方法及系统
CN104035849A (zh) 一种防止Rack机柜风扇管理失效的方法
CN106951027A (zh) 一种刀片服务器的bmc时间管理的系统和方法
CN1979423A (zh) 多处理器负载分配调整方法
CN103117874A (zh) 一种刀片服务器管理网络快速配置方法
CN104572400A (zh) 一种单bmc管理多计算板的管理方法及其装置
US9509562B2 (en) Method of providing a dynamic node service and device using the same
CN101634882B (zh) 高密度服务器电源控制系统及其方法
CN205692107U (zh) 一种分布式架构的集群微服务器系统
CN104104725A (zh) 一种应用于云计算的分层异构结构的服务器管理系统
CN204833253U (zh) 一种用于云计算的usb服务器
CN106919533A (zh) 4u高密度存储型服务器
CN204117069U (zh) 一种服务器底板

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150715

RJ01 Rejection of invention patent application after publication