CN104777890A - 一种多路服务器的功耗管理系统 - Google Patents
一种多路服务器的功耗管理系统 Download PDFInfo
- Publication number
- CN104777890A CN104777890A CN201510153673.5A CN201510153673A CN104777890A CN 104777890 A CN104777890 A CN 104777890A CN 201510153673 A CN201510153673 A CN 201510153673A CN 104777890 A CN104777890 A CN 104777890A
- Authority
- CN
- China
- Prior art keywords
- power consumption
- clump
- rmc
- smc
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明公开一种多路服务器的功耗管理系统,属于服务器管理领域;多路服务器包括三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;一定数量的clump组成一个group,一定数量的group组成rack;clump内BMC收集clump的功耗信息发送给所在group的SMC,所有group的SMC收集到的功耗信息发送给RMC进行系统集中功耗管理;本发明根据以上设置可以制定灵活的功耗控制策略,实现多路服务器功耗的智能管理和控制,能够适应多路服务器各种配置要求。
Description
技术领域
本发明公开一种多路服务器的功耗管理系统,属于服务器管理领域,具体涉及多路服务器的功耗管理系统,多路服务器的功耗管理方法。
背景技术
整个服务器处理器领域大体分三大块,那就是单处理器、双处理器和多处理器,单处理器就是个在同一系统中只支持单个处理器的处理器,如PC处理器,双处理器目前来说只是服务器和高性能工作站中使用,而多处理器则通常是专为服务器而开发的。其中的“路”都是指服务器物理CPU的数量,也就是服务器主板上CPU插槽的数量。多路服务器作为一个高度集成化的整体系统,其内部集成很多计算节点,尤其是达到一定规模后如16路、32路甚至64路服务器,功耗总量相对普通服务器高很多,而机房供电系统的升级改造成本较高,故对功耗的控制和节电要求较高。而且其组成的clump数量非常多,依靠传统Intel芯片内集成的功耗管理引擎ME很难适应这种多路服务器的系统管理。本发明提出一种多路服务器的功耗管理系统,通过创建3级管理控制器,即rack、group、clump为单位层级进行功耗数据收集和功耗策略的制定、转发,实现多路服务器功耗的智能管理,其中每个clump内集成BMC;每个group内集成SMC;整个多路服务器rack系统由RMC进行管理。根据以上设置制定灵活的功耗控制策略,实现多路服务器功耗的智能管理和控制,能够适应多路服务器各种配置要求。
其中BMC, Baseboard Management Controller,基板管理控制器。支持行业标准的 IPMI 规范。该规范描述了已经内置到主板上的管理功能。这些功能包括:本地和远程诊断、控制台支持、配置管理、硬件管理和故障排除。
SMC,System Management Controller,系统管理控制器。
RMC,Racks Management Controller,机柜管理控制器。
发明内容
本发明针对多路服务器功耗总量相对普通服务器高很多,对功耗的控制和节电要求较高,依靠传统Intel芯片内集成的功耗管理引擎ME很难适应这种多路服务器的系统管理的问题,提供一种多路服务器的功耗管理系统,可应用于对多路服务器的功耗进行动态管理和控制,根据本发明设置3级管理控制器,制定灵活的功耗控制策略,实现多路服务器功耗的智能管理和控制,能够适应多路服务器各种配置要求。
本发明提出的具体方案是:
一种多路服务器的功耗管理系统,多路服务器包括三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;
一定数量的clump组成一个group,一定数量的group组成rack;clump内BMC收集clump的功耗信息发送给所在group的SMC,所有group的SMC收集到的功耗信息发送给RMC进行系统集中功耗管理;
RMC为最高级功耗策略控制器,负责接收整机功耗信息,根据机房对每个rack的功率分配状况,制定对应的功耗控制策略;SMC为次级功耗策略控制器,负责传达RMC发送过来的功耗控制策略,同时在没有RMC功耗控制时,制定group内的功耗控制策略;BMC为最低级功耗策略控制器,负责执行SMC发过来的功耗控制策略,控制clump功耗。
所述的clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中。
每个所述的group设置独立的AC供电系统。
所述的clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC。
一种多路服务器的功耗管理方法,在多路服务器中设置三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;
功耗信息的收集:一定数量的clump组成一个group,一定数量的group组成rack;clump内BMC收集clump的功耗信息发送给所在group的SMC,所有group的SMC收集到的功耗信息发送给RMC进行系统集中功耗管理;
功耗控制:RMC为最高级功耗策略控制器,负责接收整机功耗信息,根据机房对每个rack的功率分配状况,制定对应的功耗控制策略;SMC为次级功耗策略控制器,负责传达RMC发送过来的功耗控制策略,同时在没有RMC功耗控制时,制定group内的功耗控制策略;BMC为最低级功耗策略控制器,负责执行SMC发过来的功耗控制策略,控制clump功耗。
所述的clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中。
所述的功耗信息的收集中clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC。
所述的功耗控制:
当RMC收集到系统总功耗超出rack所分配的功耗,RMC判断需要限制系统功耗,制定限制功耗策略下达给SMC,SMC将策略转发给所属clump的BMC,BMC通过PECI总线与CPU进行带内带外交互,对CPU下达功耗限制指令,对系统内功耗设备进行降频,限制clump的功耗,降低整机总功耗;
当RMC判断系统总功耗没有超出rack所分配的功耗,先不做功耗限制,SMC根据group内部的功耗判断是否超出该group内部功耗来制定group功耗限制策略,将策略下达给BMC进行功耗控制,BMC控制clump的功耗。
当RMC判断系统总功耗没有超出rack所分配的功耗,进行功耗节电控制,过程为:
当系统处于临时空闲时,RMC通过SMC对各个clump的BMC下达节电指令,BMC通过PECI总线对系统内功耗设备进行降频以节省能耗;
当前系统处于空闲时,RMC根据系统负载状况计算出需要的处理器数量,并调节多路服务器中CPU的在线数量。
当前系统处于空闲时,RMC根据系统负载状况计算出需要的处理器数量,并调节多路服务器中CPU的在线数量,过程为:
RMC通过部分group中的SMC通知BMC,以clump为单位进行任务的迁移,BMC通过LPC总线进行带内带外交互,将过剩的clump离线操作,减少系统CPU的数量;当系统需要更多CPU资源时,OS通知legacy clump的BMC将需求的指令通过SMC发送给RMC,RMC根据资源的需求计算出需要增加的clump数量,启动clump在线,增加CPU数量。
本发明的有益之处是:本发明通过创建三级管理控制器,即rack、group、clump为单位层级进行功耗数据收集和功耗策略的制定、转发,实现多路服务器功耗的智能管理,其中每个clump内集成BMC;每个group内集成SMC;整个多路服务器rack系统由RMC进行管理。根据以上设置可以制定灵活的功耗控制策略,实现多路服务器功耗的智能管理和控制,能够适应多路服务器各种配置要求。
附图说明
图1 多路服务器的功耗管理系统组成示意图;
图2功耗信息收集过程示意图;
图3功耗控制过程示意图;
图4减少CPU数量的功耗控制过程示意图。
具体实施方式
结合附图对本发明做进一步说明。
结合图1,一种多路服务器的功耗管理系统,此系统包括三级功耗管理层:rack系统管理层,设置RMC进行管理; group管理层,有4组独立的group,每个group设置独立的AC供电系统,内部集成SMC进行管理,分别是SMC1、SMC2、SMC1′、SMC2′;clump管理层,分别在4组独立的group下,其中group1下是clump0至clump03,group2下是clump4至clump07,group1′下是clump0′至clump3′,group2′下是clump4′至clump7′,每个clump内部集成BMC进行管理,;clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中,legacy clump可以根据用户需要指定;
结合图2,clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC;
RMC为最高级功耗策略控制器,负责接收整机功耗信息,根据机房对每个rack的功率分配状况,制定对应的功耗控制策略;SMC为次级功耗策略控制器,负责传达RMC发送过来的功耗控制策略,同时在没有RMC功耗控制时,制定group内的功耗控制策略;BMC为最低级功耗策略控制器,负责执行SMC发过来的功耗控制策略,控制clump功耗。
结合图3,一种多路服务器的功耗管理方法,在多路服务器中设置三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中;
图中为clump内为4颗CPU,通过PECI总线连接BMC,4个clump组成一个group,2个group组成rack;clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC;
功耗控制过程:
当RMC收集到系统总功耗超出rack所分配的功耗,RMC判断需要限制系统功耗,制定限制功耗策略下达给SMC,SMC将策略转发给所属clump的BMC,BMC通过PECI总线与CPU进行带内带外交互,对CPU下达功耗限制指令,对系统内功耗设备进行降频,限制clump的功耗,降低整机总功耗;
当RMC判断系统总功耗没有超出rack所分配的功耗,先不做功耗限制,SMC根据group内部的功耗判断是否超出该group内部功耗来制定group功耗限制策略,将策略下达给BMC进行功耗控制,BMC控制clump的功耗。
结合图4,当RMC判断系统总功耗没有超出rack所分配的功耗,进行功耗节电控制,过程为:
当系统处于临时空闲时,RMC通过SMC对各个clump的BMC下达节电指令,BMC通过PECI总线对系统内功耗设备进行降频以节省能耗;
图中当前系统处于空闲时,RMC根据系统负载状况计算出需要的处理器数量,并调节多路服务器中CPU的在线数量,过程为:
RMC通过部分group中的SMC通知BMC,以clump为单位进行任务的迁移,BMC通过LPC总线进行带内带外交互,将过剩的clump离线操作,减少系统CPU的数量;当系统需要更多CPU资源时,OS与BIOS通知legacy clump的BMC将需求的指令通过SMC发送给RMC,RMC根据资源的需求计算出需要增加的clump数量,启动clump在线,增加CPU数量。
Claims (10)
1.一种多路服务器的功耗管理系统,其特征是多路服务器包括三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;
一定数量的clump组成一个group,一定数量的group组成rack;clump内BMC收集clump的功耗信息发送给所在group的SMC,所有group的SMC收集到的功耗信息发送给RMC进行系统集中功耗管理;
RMC为最高级功耗策略控制器,负责接收整机功耗信息,根据机房对每个rack的功率分配状况,制定对应的功耗控制策略;SMC为次级功耗策略控制器,负责传达RMC发送过来的功耗控制策略,同时在没有RMC功耗控制时,制定group内的功耗控制策略;BMC为最低级功耗策略控制器,负责执行SMC发过来的功耗控制策略,控制clump功耗。
2.根据权利要求1所述的一种多路服务器的功耗管理系统,其特征是所述的clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中。
3.根据权利要求1或2所述的一种多路服务器的功耗管理系统,其特征是每个所述的group设置独立的AC供电系统。
4.根据权利要求1所述的一种多路服务器的功耗管理系统,其特征是所述的clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC。
5.一种多路服务器的功耗管理方法,其特征是在多路服务器中设置三级功耗管理层:rack系统管理层,设置RMC进行管理;group管理层,内部集成SMC进行管理;clump管理层,内部集成BMC进行管理;
功耗信息的收集:一定数量的clump组成一个group,一定数量的group组成rack;clump内BMC收集clump的功耗信息发送给所在group的SMC,所有group的SMC收集到的功耗信息发送给RMC进行系统集中功耗管理;
功耗控制:RMC为最高级功耗策略控制器,负责接收整机功耗信息,根据机房对每个rack的功率分配状况,制定对应的功耗控制策略;SMC为次级功耗策略控制器,负责传达RMC发送过来的功耗控制策略,同时在没有RMC功耗控制时,制定group内的功耗控制策略;BMC为最低级功耗策略控制器,负责执行SMC发过来的功耗控制策略,控制clump功耗。
6.根据权利要求5所述的一种多路服务器的功耗管理方法,其特征是所述的clump管理层内,设置一个legacy clump,其他的是non-legacy clump,操作系统安装在legacy clump中;每个所述的group设置独立的AC供电系统。
7.根据权利要求6所述的一种多路服务器的功耗管理方法,其特征是所述的功耗信息的收集过程中clump内部集成数字电源系统,获取CPU、内存以及clump的总功耗的信息,由BMC收集发送给所在group的SMC,所有SMC收集group内部的AC电源的功耗信息及BMC收集的功耗信息,发送给rack的RMC。
8.根据权利要求6所述的一种多路服务器的功耗管理方法,其特征是所述的功耗控制过程中:
当RMC收集到系统总功耗超出rack所分配的功耗,RMC判断需要限制系统功耗,制定限制功耗策略下达给SMC,SMC将策略转发给所属clump的BMC,BMC通过PECI总线与CPU进行带内带外交互,对CPU下达功耗限制指令,对系统内功耗设备进行降频,限制clump的功耗,降低整机总功耗;
当RMC判断系统总功耗没有超出rack所分配的功耗,先不做功耗限制,SMC根据group内部的功耗判断是否超出该group内部功耗来制定group功耗限制策略,将策略下达给BMC进行功耗控制,BMC控制clump的功耗。
9.根据权利要求8所述的一种多路服务器的功耗管理方法,其特征是当RMC判断系统总功耗没有超出rack所分配的功耗,进行功耗节电控制,过程为:
当系统处于临时空闲时,RMC通过SMC对各个clump的BMC下达节电指令,BMC通过PECI总线对系统内功耗设备进行降频以节省能耗;
当前系统处于空闲时,RMC根据系统负载状况计算出需要的处理器数量,并调节多路服务器中CPU的在线数量。
10.根据权利要求9所述的一种多路服务器的功耗管理方法,其特征是当前系统处于空闲时,RMC根据系统负载状况计算出需要的处理器数量,并调节多路服务器中CPU的在线数量,过程为:
RMC通过部分group中的SMC通知BMC,以clump为单位进行任务的迁移,BMC通过LPC总线进行带内带外交互,将过剩的clump离线操作,减少系统CPU的数量;当系统需要更多CPU资源时,OS通知legacy clump的BMC将需求的指令通过SMC发送给RMC,RMC根据资源的需求计算出需要增加的clump数量,启动clump在线,增加CPU数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510153673.5A CN104777890A (zh) | 2015-04-02 | 2015-04-02 | 一种多路服务器的功耗管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510153673.5A CN104777890A (zh) | 2015-04-02 | 2015-04-02 | 一种多路服务器的功耗管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104777890A true CN104777890A (zh) | 2015-07-15 |
Family
ID=53619411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510153673.5A Pending CN104777890A (zh) | 2015-04-02 | 2015-04-02 | 一种多路服务器的功耗管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104777890A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068641A (zh) * | 2015-08-19 | 2015-11-18 | 山东超越数控电子有限公司 | 一种计算机系统待机/唤醒功能实现方法 |
CN105490859A (zh) * | 2015-12-18 | 2016-04-13 | 山东海量信息技术研究院 | 一种高端容错服务器的节点定位方法 |
CN106020422A (zh) * | 2016-05-24 | 2016-10-12 | 英业达科技有限公司 | 计算机系统的功耗控制方法及系统 |
CN106598188A (zh) * | 2016-12-15 | 2017-04-26 | 郑州云海信息技术有限公司 | 一种确定系统功耗基准的方法及装置 |
CN106843444A (zh) * | 2016-12-29 | 2017-06-13 | 郑州云海信息技术有限公司 | 一种多架构cpu能耗控制系统 |
CN108090000A (zh) * | 2018-01-11 | 2018-05-29 | 郑州云海信息技术有限公司 | 一种获取cpu寄存器信息的方法及系统 |
CN108958837A (zh) * | 2018-06-29 | 2018-12-07 | 深圳市同泰怡信息技术有限公司 | 一种动态配置me固件的方法、系统及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101441506A (zh) * | 2007-11-20 | 2009-05-27 | 中兴通讯股份有限公司 | 一种刀片服务器系统及其功耗管理方法 |
US20120136484A1 (en) * | 2010-11-30 | 2012-05-31 | Inventec Corporation | Data center |
US20130110926A1 (en) * | 2011-10-28 | 2013-05-02 | Inventec Corporation | Method for Controlling Rack System |
CN103428021A (zh) * | 2012-05-25 | 2013-12-04 | 华为技术有限公司 | 机柜级服务器、机柜级服务器节点信息管理方法和系统 |
CN104049692A (zh) * | 2014-06-27 | 2014-09-17 | 浪潮(北京)电子信息产业有限公司 | 一种刀片服务器 |
-
2015
- 2015-04-02 CN CN201510153673.5A patent/CN104777890A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101441506A (zh) * | 2007-11-20 | 2009-05-27 | 中兴通讯股份有限公司 | 一种刀片服务器系统及其功耗管理方法 |
US20120136484A1 (en) * | 2010-11-30 | 2012-05-31 | Inventec Corporation | Data center |
US20130110926A1 (en) * | 2011-10-28 | 2013-05-02 | Inventec Corporation | Method for Controlling Rack System |
CN103428021A (zh) * | 2012-05-25 | 2013-12-04 | 华为技术有限公司 | 机柜级服务器、机柜级服务器节点信息管理方法和系统 |
CN104049692A (zh) * | 2014-06-27 | 2014-09-17 | 浪潮(北京)电子信息产业有限公司 | 一种刀片服务器 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068641A (zh) * | 2015-08-19 | 2015-11-18 | 山东超越数控电子有限公司 | 一种计算机系统待机/唤醒功能实现方法 |
CN105490859A (zh) * | 2015-12-18 | 2016-04-13 | 山东海量信息技术研究院 | 一种高端容错服务器的节点定位方法 |
CN105490859B (zh) * | 2015-12-18 | 2019-01-22 | 山东海量信息技术研究院 | 一种高端容错服务器的节点定位方法 |
CN106020422A (zh) * | 2016-05-24 | 2016-10-12 | 英业达科技有限公司 | 计算机系统的功耗控制方法及系统 |
CN106598188A (zh) * | 2016-12-15 | 2017-04-26 | 郑州云海信息技术有限公司 | 一种确定系统功耗基准的方法及装置 |
CN106843444A (zh) * | 2016-12-29 | 2017-06-13 | 郑州云海信息技术有限公司 | 一种多架构cpu能耗控制系统 |
CN106843444B (zh) * | 2016-12-29 | 2019-12-17 | 苏州浪潮智能科技有限公司 | 一种多架构cpu能耗控制系统 |
CN108090000A (zh) * | 2018-01-11 | 2018-05-29 | 郑州云海信息技术有限公司 | 一种获取cpu寄存器信息的方法及系统 |
CN108958837A (zh) * | 2018-06-29 | 2018-12-07 | 深圳市同泰怡信息技术有限公司 | 一种动态配置me固件的方法、系统及介质 |
CN108958837B (zh) * | 2018-06-29 | 2021-10-01 | 深圳市同泰怡信息技术有限公司 | 一种动态配置me固件的方法、系统及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104777890A (zh) | 一种多路服务器的功耗管理系统 | |
US9778718B2 (en) | Power supply and data center control | |
Durand et al. | Euroserver: Energy efficient node for european micro-servers | |
EP2619637B1 (en) | Data center control | |
CN104035817A (zh) | 大规模集成电路物理实现的分布式并行计算方法及其系统 | |
CN104503932B (zh) | 多主板服务器主基板管理控制器仲裁方法及系统 | |
CN102271145A (zh) | 一种虚拟计算机集群及其实施方法 | |
CN102289402A (zh) | 一种基于物理多分区计算机体系结构的监控管理方法 | |
CN104158911A (zh) | 一种面向服务器集群的控制方法及系统 | |
CN102426544A (zh) | 任务分配方法和系统 | |
CN103455378A (zh) | 一种虚拟化集群的资源分配方法、装置和系统 | |
CN203745989U (zh) | 一体化高密度服务器机箱 | |
CN103780646A (zh) | 一种云资源的调度方法及系统 | |
CN104035849A (zh) | 一种防止Rack机柜风扇管理失效的方法 | |
CN106951027A (zh) | 一种刀片服务器的bmc时间管理的系统和方法 | |
CN1979423A (zh) | 多处理器负载分配调整方法 | |
CN103117874A (zh) | 一种刀片服务器管理网络快速配置方法 | |
CN104572400A (zh) | 一种单bmc管理多计算板的管理方法及其装置 | |
US9509562B2 (en) | Method of providing a dynamic node service and device using the same | |
CN101634882B (zh) | 高密度服务器电源控制系统及其方法 | |
CN205692107U (zh) | 一种分布式架构的集群微服务器系统 | |
CN104104725A (zh) | 一种应用于云计算的分层异构结构的服务器管理系统 | |
CN204833253U (zh) | 一种用于云计算的usb服务器 | |
CN106919533A (zh) | 4u高密度存储型服务器 | |
CN204117069U (zh) | 一种服务器底板 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150715 |
|
RJ01 | Rejection of invention patent application after publication |