CN106445055A - 一种Rack服务器电源保护机制 - Google Patents
一种Rack服务器电源保护机制 Download PDFInfo
- Publication number
- CN106445055A CN106445055A CN201610812296.6A CN201610812296A CN106445055A CN 106445055 A CN106445055 A CN 106445055A CN 201610812296 A CN201610812296 A CN 201610812296A CN 106445055 A CN106445055 A CN 106445055A
- Authority
- CN
- China
- Prior art keywords
- power supply
- bmc
- cpu
- node
- rack
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/28—Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/324—Power saving characterised by the action undertaken by lowering clock frequency
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Power Sources (AREA)
Abstract
本发明公开了一种Rack服务器电源保护机制,通过建立节点BMC和电源状态寄存器之间的通信,使BMC实时监测电源的运行状态,并根据电源的运行状态调节CPU的运行频率;当电源运行状态正常时,CPU按照系统默认设置运行,BMC不做干涉;当BMC监测到电源状态出现异常时,通过I2C给CPU发送降频指令,使CPU以较低的频率运行;当电源状态恢复正常后,BMC将发送指令使CPU频率恢复正常。本发明可以保证当电源出现异常时,Rack机柜降低运行功耗,减轻电源负载,保证电源的安全运行,避免电源损毁、机柜掉电等严重后果,提高机柜稳定性,增强在同类产品中的市场竞争力。
Description
技术领域
本发明涉及服务器供电领域,具体地说是一种Rack服务器电源保护机制。
背景技术
天蝎标准Rack服务器以对环境要求低、部署方便、成本低等优点在数据中心中占据了越来越大的份额。Rack服务器采用集中供电的方式,为整机柜提供集中电源转换,由于运行时间长、整机柜负载高,电源模块是机柜故障的高发区。一旦电源模块发生异常,而Rack服务器持续以高负载运行时,会加速电源元器件的老化,严重了会导致电源损毁、整机柜掉电的后果。
Rack服务器中的电源模块内置状态寄存器,可以根据PMbus协议寄存电源状态信息。目前的天蝎标准中,并没有定义节点与电源之间的通信。由于缺少对应的电源保护机制,当电源状态出现异常时,节点无法及时调整自身运行负载。
I2C(Inter Integrated Circuit,内部集成电路)总线是微电子通信控制领域广泛采用的一种总线标准,用于连接I2C主机、I2C从机等器件。I2C主机是初始 化发送、产生时钟信号和终止发送的器件,可以成为控制I2C总线的器件,I2C 从机是被I2C主机寻址的器件。
PSUs (power supply units ),电源。
发明内容
本发明的技术任务是提供一种Rack服务器电源保护机制。
本发明的技术任务是按以下方式实现的,当电源状态出现异常时,BMC可降低节点运行负载,起到对电源的保护作用。
一种Rack服务器电源保护机制,通过建立节点BMC和电源状态寄存器之间的通信,使BMC实时监测电源的运行状态,并根据电源的运行状态调节CPU的运行频率;
当电源运行状态正常时,CPU按照系统默认设置运行,BMC不做干涉;当BMC监测到电源状态出现异常时,通过I2C给CPU发送降频指令,使CPU以较低的频率运行;当电源状态恢复正常后,BMC将发送指令使CPU频率恢复正常。
优选的,所述的保护机制采用了二级管理的方式,RMC为第一级管理,节点中板为第二级管理,RMC通过I2C与节板中点通信。
优选的,具体步骤如下:第一步,电源的运行状态按照PM_Bus标准保存到状态寄存器中;第二步,RMC通过I2C读取这些日志;第三步,RMC通过I2C将电源状态信息传送给机柜上所有的节点中板;第四步,每个节点中板通过I2C将电源状态传送给其连接的所有节点BMC,BMC通过这种方式可以监测到电源的运行状态。
优选的, 所述的BMC通过I2C读取日志的周期为1s。
本发明的一种Rack服务器电源保护机制建立起Rack服务器中BMC和电源寄存器之间的通信,使BMC可以实时获取电源的运行状态。一旦BMC监测到电源出现异常,可以通过使CPU降频的方式降低整机柜运行功耗,减轻电源负载。从而保证电源的安全运行,避免电源损毁、整机柜掉电等后果;当BMC监测到电源状态恢复正常后,可以使CPU恢复正常运行频率。
本发明可以保证当电源出现异常时,Rack机柜降低运行功耗,减轻电源负载,保证电源的安全运行,避免电源损毁、机柜掉电等严重后果,提高机柜稳定性,增强在同类产品中的市场竞争力。
附图说明
附图1为电源与BMC通信示意图;
附图2为机柜功耗调整示意图。
具体实施方式
RMC是属于天蝎项目上的机柜的管理模块,而天蝎项目是由阿里巴巴、百度、腾讯三方合作推动、众多服务器厂商参与的一整套整机柜服务器解决方案。英特尔担任该项目顾问。该项目将致力于推进数据中心基础架构的技术发展,和制定开放的行业规范。天蝎项目旨在共同推动行业合作、产业创新和新技术的应用,推动业界统一整机柜服务器规范、推动产业链配套和规模化生产、持续降低营运成本、提高服务器部署速度和运维效率。
RMC主要两部分组成,RMC管理主板和RMC 管理软件。RMC管理软件主要遵循”机柜管理单元RMC CLI规范 Version 1.0”,其中RMC CLI定义参考SMASH SM_CLP 标准进行定义,具体参考模型为SM_CLP的“Modular System Profile”(参考文献:DSP1008)。
节点中板,其实现所有节点的带外监控、二级管理、告警上报、风扇监控;节点BMC,其集成在各个节点上,负责子系统级的状态实时监控、故障诊断、功耗检测等;以及管理网络等组成。其中BMC负责节点资产管理、实时监控,故障诊断。
其中,BMC:Baseboard Management Controller,基板管理控制器,是一个专门的服务处理机,它利用传感器来监控一台计算机,网络服务器,或者是其他硬件驱动设备的状态,并且通过独立的连接线路和系统管理员进行通信。BMC的传感器用来测量内部物理变量,例如:温度,湿度,电源电压,风扇速度,通信参数和操作系统函数,如果这些变量中任何一个超出了指定限制的范围之外,他就会通知管理员,管理员就会利用远程控制来采取正确的措施。监控设备可以动力循环或者当必要的时候重新启动,这样,单一的管理员就可以同时远程控制无数个服务器和其他设备,节省了网络的总体成本,并且可以确保可靠性。功能:本地和远程诊断、控制台支持,配置管理,硬件管理和故障排除。
一种Rack服务器电源保护机制,通过建立节点BMC和电源状态寄存器之间的通信,使BMC实时监测电源的运行状态,并根据电源的运行状态调节CPU的运行频率;
当电源运行状态正常时,CPU按照系统默认设置运行,BMC不做干涉;当BMC监测到电源状态出现异常时,通过I2C给CPU发送降频指令,使CPU以较低的频率运行;当电源状态恢复正常后,BMC将发送指令使CPU频率恢复正常。
所述的保护机制采用了二级管理的方式,RMC为第一级管理,节点中板为第二级管理,RMC通过I2C与节板中点通信。
具体步骤如下:第一步,电源的运行状态按照PM_Bus标准保存到状态寄存器中;第二步,RMC通过I2C读取这些日志,周期为1s;第三步,RMC通过I2C将电源状态信息传送给机柜上所有的节点中板;第四步,每个节点中板通过I2C将电源状态传送给其连接的所有节点BMC,BMC通过这种方式可以监测到电源的运行状态。
实施例1:
如附图1所示,电源的运行状态按照PM_Bus标准保存到寄存器中,RMC可以通过I2C读取这些log,周期为1s。RMC通过I2C将电源状态信息传送给机柜上所有的节点中板。每个节点中板通过I2C将电源状态传送给其连接的所有节点BMC。BMC通过这种方式可以监测到电源的运行状态。
如附图2所示,BMC实时监测电源和CPU的运行状态。当电源运行状态正常时,CPU按照系统默认设置运行,BMC不做干涉;当BMC监测到电源状态出现异常时,会通过I2C给CPU发送降频指令,使CPU以较低的频率运行,通过这种方式降低整机柜的运行功耗,减轻电源的负载。当电源状态恢复正常后,BMC将发送指令使CPU频率恢复正常。
Claims (4)
1.一种Rack服务器电源保护机制,其特征在于,通过建立节点BMC和电源状态寄存器之间的通信,使BMC实时监测电源的运行状态,并根据电源的运行状态调节CPU的运行频率;
当电源运行状态正常时,CPU按照系统默认设置运行,BMC不做干涉;当BMC监测到电源状态出现异常时,通过I2C给CPU发送降频指令,使CPU以较低的频率运行;当电源状态恢复正常后,BMC将发送指令使CPU频率恢复正常。
2.根据权利要求1所述的一种Rack服务器电源保护机制,其特征在于,所述的保护机制采用了二级管理的方式,RMC为第一级管理,节点中板为第二级管理,RMC通过I2C与节板中点通信。
3.根据权利要求1所述的一种Rack服务器电源保护机制,其特征在于,具体步骤如下:
第一步,电源的运行状态按照PM_Bus标准保存到状态寄存器中;
第二步,RMC通过I2C读取这些日志;
第三步,RMC通过I2C将电源状态信息传送给机柜上所有的节点中板;
第四步,每个节点中板通过I2C将电源状态传送给其连接的所有节点BMC,BMC通过这种方式可以监测到电源的运行状态。
4.根据权利要求3所述的一种Rack服务器电源保护机制,其特征在于,
所述的BMC通过I2C读取日志的周期为1s。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610812296.6A CN106445055A (zh) | 2016-09-09 | 2016-09-09 | 一种Rack服务器电源保护机制 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610812296.6A CN106445055A (zh) | 2016-09-09 | 2016-09-09 | 一种Rack服务器电源保护机制 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106445055A true CN106445055A (zh) | 2017-02-22 |
Family
ID=58165242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610812296.6A Pending CN106445055A (zh) | 2016-09-09 | 2016-09-09 | 一种Rack服务器电源保护机制 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106445055A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106908738A (zh) * | 2017-04-13 | 2017-06-30 | 广东浪潮大数据研究有限公司 | 一种SmartRack备份电池的自动检测方法 |
CN107135123A (zh) * | 2017-05-10 | 2017-09-05 | 郑州云海信息技术有限公司 | 一种rack服务器资源动态池化的调配方法 |
CN107315675A (zh) * | 2017-07-24 | 2017-11-03 | 郑州云海信息技术有限公司 | 一种服务器开关电源保护装置和方法 |
CN107526664A (zh) * | 2017-09-06 | 2017-12-29 | 郑州云海信息技术有限公司 | 一种服务器异常掉电快速定位方法和装置 |
CN110554759A (zh) * | 2019-08-02 | 2019-12-10 | 苏州浪潮智能科技有限公司 | 一种节能型刀片服务器及其节能方法 |
CN110850951A (zh) * | 2019-09-29 | 2020-02-28 | 苏州浪潮智能科技有限公司 | 一种psu信息的刷新和读取方法、系统及设备 |
CN111984109A (zh) * | 2020-08-05 | 2020-11-24 | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) | 基于基板管理控制器的中央处理器调频方法、系统及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541239A (zh) * | 2010-12-16 | 2012-07-04 | 鸿富锦精密工业(深圳)有限公司 | 网络设备及其功耗控制方法 |
CN103455120A (zh) * | 2012-05-28 | 2013-12-18 | 鸿富锦精密工业(深圳)有限公司 | 电源控制系统及方法 |
CN104484026A (zh) * | 2015-01-07 | 2015-04-01 | 加弘科技咨询(上海)有限公司 | 一种电源管理方法、系统及机架服务器 |
-
2016
- 2016-09-09 CN CN201610812296.6A patent/CN106445055A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541239A (zh) * | 2010-12-16 | 2012-07-04 | 鸿富锦精密工业(深圳)有限公司 | 网络设备及其功耗控制方法 |
CN103455120A (zh) * | 2012-05-28 | 2013-12-18 | 鸿富锦精密工业(深圳)有限公司 | 电源控制系统及方法 |
CN104484026A (zh) * | 2015-01-07 | 2015-04-01 | 加弘科技咨询(上海)有限公司 | 一种电源管理方法、系统及机架服务器 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106908738A (zh) * | 2017-04-13 | 2017-06-30 | 广东浪潮大数据研究有限公司 | 一种SmartRack备份电池的自动检测方法 |
CN107135123A (zh) * | 2017-05-10 | 2017-09-05 | 郑州云海信息技术有限公司 | 一种rack服务器资源动态池化的调配方法 |
CN107315675A (zh) * | 2017-07-24 | 2017-11-03 | 郑州云海信息技术有限公司 | 一种服务器开关电源保护装置和方法 |
CN107526664A (zh) * | 2017-09-06 | 2017-12-29 | 郑州云海信息技术有限公司 | 一种服务器异常掉电快速定位方法和装置 |
CN107526664B (zh) * | 2017-09-06 | 2020-07-24 | 苏州浪潮智能科技有限公司 | 一种服务器异常掉电快速定位方法和装置 |
CN110554759A (zh) * | 2019-08-02 | 2019-12-10 | 苏州浪潮智能科技有限公司 | 一种节能型刀片服务器及其节能方法 |
CN110850951A (zh) * | 2019-09-29 | 2020-02-28 | 苏州浪潮智能科技有限公司 | 一种psu信息的刷新和读取方法、系统及设备 |
CN110850951B (zh) * | 2019-09-29 | 2021-07-06 | 苏州浪潮智能科技有限公司 | 一种psu信息的刷新和读取方法、系统及设备 |
CN111984109A (zh) * | 2020-08-05 | 2020-11-24 | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) | 基于基板管理控制器的中央处理器调频方法、系统及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106445055A (zh) | 一种Rack服务器电源保护机制 | |
CN100450044C (zh) | 一种智能平台管理接口系统中的后插板监控装置 | |
CN107145428A (zh) | 一种服务器及服务器监控方法 | |
CN111176939B (zh) | 一种基于cpld的多节点服务器的管理系统及方法 | |
CN103186452A (zh) | 服务器系统 | |
CN103139248B (zh) | 机架系统 | |
CN102495785A (zh) | 整机柜服务器集中管理方法和装置 | |
US20180164795A1 (en) | Fan monitoring system | |
US9037878B2 (en) | Server rack system | |
CN111078393B (zh) | 一种交互型边缘计算服务器及其控制方法 | |
CN113374724B (zh) | 一种基于多温度节点的风扇控制系统及方法 | |
CN106774752A (zh) | 一种Rack服务器备用风扇控制方法 | |
CN106383569A (zh) | 一种通用服务器电源保护机制 | |
CN105978724A (zh) | 一种基于ipmi的服务器管理系统 | |
CN102081567A (zh) | 服务器 | |
CN102087511A (zh) | 利用电源供应器执行电子系统远程监控的方法 | |
TW201328575A (zh) | 機櫃系統及其伺服器 | |
WO2014173027A1 (zh) | 基于智能平台管理接口的通信基站电源监视和控制系统 | |
CN104317682A (zh) | 一种实现风扇停转的异常状态快速区分识别的设计方法 | |
CN104506342A (zh) | 机架式服务器系统 | |
CN203554493U (zh) | 一种服务器用远程管理接口系统 | |
CN106502355A (zh) | 一种Rack服务器电源进风温度获取方法 | |
CN113176982A (zh) | 一种基于vpx架构机箱管理系统的实现装置及方法 | |
CN111324503A (zh) | 机框管理装置、方法和计算机可读存储介质 | |
CN103186180A (zh) | 机柜系统及其服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170222 |