CN106445055A - 一种Rack服务器电源保护机制 - Google Patents

一种Rack服务器电源保护机制 Download PDF

Info

Publication number
CN106445055A
CN106445055A CN201610812296.6A CN201610812296A CN106445055A CN 106445055 A CN106445055 A CN 106445055A CN 201610812296 A CN201610812296 A CN 201610812296A CN 106445055 A CN106445055 A CN 106445055A
Authority
CN
China
Prior art keywords
power supply
bmc
cpu
node
rack
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610812296.6A
Other languages
English (en)
Inventor
王聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201610812296.6A priority Critical patent/CN106445055A/zh
Publication of CN106445055A publication Critical patent/CN106445055A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/324Power saving characterised by the action undertaken by lowering clock frequency

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本发明公开了一种Rack服务器电源保护机制,通过建立节点BMC和电源状态寄存器之间的通信,使BMC实时监测电源的运行状态,并根据电源的运行状态调节CPU的运行频率;当电源运行状态正常时,CPU按照系统默认设置运行,BMC不做干涉;当BMC监测到电源状态出现异常时,通过I2C给CPU发送降频指令,使CPU以较低的频率运行;当电源状态恢复正常后,BMC将发送指令使CPU频率恢复正常。本发明可以保证当电源出现异常时,Rack机柜降低运行功耗,减轻电源负载,保证电源的安全运行,避免电源损毁、机柜掉电等严重后果,提高机柜稳定性,增强在同类产品中的市场竞争力。

Description

一种Rack服务器电源保护机制
技术领域
本发明涉及服务器供电领域,具体地说是一种Rack服务器电源保护机制。
背景技术
天蝎标准Rack服务器以对环境要求低、部署方便、成本低等优点在数据中心中占据了越来越大的份额。Rack服务器采用集中供电的方式,为整机柜提供集中电源转换,由于运行时间长、整机柜负载高,电源模块是机柜故障的高发区。一旦电源模块发生异常,而Rack服务器持续以高负载运行时,会加速电源元器件的老化,严重了会导致电源损毁、整机柜掉电的后果。
Rack服务器中的电源模块内置状态寄存器,可以根据PMbus协议寄存电源状态信息。目前的天蝎标准中,并没有定义节点与电源之间的通信。由于缺少对应的电源保护机制,当电源状态出现异常时,节点无法及时调整自身运行负载。
I2C(Inter Integrated Circuit,内部集成电路)总线是微电子通信控制领域广泛采用的一种总线标准,用于连接I2C主机、I2C从机等器件。I2C主机是初始 化发送、产生时钟信号和终止发送的器件,可以成为控制I2C总线的器件,I2C 从机是被I2C主机寻址的器件。
PSUs (power supply units ),电源。
发明内容
本发明的技术任务是提供一种Rack服务器电源保护机制。
本发明的技术任务是按以下方式实现的,当电源状态出现异常时,BMC可降低节点运行负载,起到对电源的保护作用。
一种Rack服务器电源保护机制,通过建立节点BMC和电源状态寄存器之间的通信,使BMC实时监测电源的运行状态,并根据电源的运行状态调节CPU的运行频率;
当电源运行状态正常时,CPU按照系统默认设置运行,BMC不做干涉;当BMC监测到电源状态出现异常时,通过I2C给CPU发送降频指令,使CPU以较低的频率运行;当电源状态恢复正常后,BMC将发送指令使CPU频率恢复正常。
优选的,所述的保护机制采用了二级管理的方式,RMC为第一级管理,节点中板为第二级管理,RMC通过I2C与节板中点通信。
优选的,具体步骤如下:第一步,电源的运行状态按照PM_Bus标准保存到状态寄存器中;第二步,RMC通过I2C读取这些日志;第三步,RMC通过I2C将电源状态信息传送给机柜上所有的节点中板;第四步,每个节点中板通过I2C将电源状态传送给其连接的所有节点BMC,BMC通过这种方式可以监测到电源的运行状态。
优选的, 所述的BMC通过I2C读取日志的周期为1s。
本发明的一种Rack服务器电源保护机制建立起Rack服务器中BMC和电源寄存器之间的通信,使BMC可以实时获取电源的运行状态。一旦BMC监测到电源出现异常,可以通过使CPU降频的方式降低整机柜运行功耗,减轻电源负载。从而保证电源的安全运行,避免电源损毁、整机柜掉电等后果;当BMC监测到电源状态恢复正常后,可以使CPU恢复正常运行频率。
本发明可以保证当电源出现异常时,Rack机柜降低运行功耗,减轻电源负载,保证电源的安全运行,避免电源损毁、机柜掉电等严重后果,提高机柜稳定性,增强在同类产品中的市场竞争力。
附图说明
附图1为电源与BMC通信示意图;
附图2为机柜功耗调整示意图。
具体实施方式
RMC是属于天蝎项目上的机柜的管理模块,而天蝎项目是由阿里巴巴、百度、腾讯三方合作推动、众多服务器厂商参与的一整套整机柜服务器解决方案。英特尔担任该项目顾问。该项目将致力于推进数据中心基础架构的技术发展,和制定开放的行业规范。天蝎项目旨在共同推动行业合作、产业创新和新技术的应用,推动业界统一整机柜服务器规范、推动产业链配套和规模化生产、持续降低营运成本、提高服务器部署速度和运维效率。
RMC主要两部分组成,RMC管理主板和RMC 管理软件。RMC管理软件主要遵循”机柜管理单元RMC CLI规范 Version 1.0”,其中RMC CLI定义参考SMASH SM_CLP 标准进行定义,具体参考模型为SM_CLP的“Modular System Profile”(参考文献:DSP1008)。
节点中板,其实现所有节点的带外监控、二级管理、告警上报、风扇监控;节点BMC,其集成在各个节点上,负责子系统级的状态实时监控、故障诊断、功耗检测等;以及管理网络等组成。其中BMC负责节点资产管理、实时监控,故障诊断。
其中,BMC:Baseboard Management Controller,基板管理控制器,是一个专门的服务处理机,它利用传感器来监控一台计算机,网络服务器,或者是其他硬件驱动设备的状态,并且通过独立的连接线路和系统管理员进行通信。BMC的传感器用来测量内部物理变量,例如:温度,湿度,电源电压,风扇速度,通信参数和操作系统函数,如果这些变量中任何一个超出了指定限制的范围之外,他就会通知管理员,管理员就会利用远程控制来采取正确的措施。监控设备可以动力循环或者当必要的时候重新启动,这样,单一的管理员就可以同时远程控制无数个服务器和其他设备,节省了网络的总体成本,并且可以确保可靠性。功能:本地和远程诊断、控制台支持,配置管理,硬件管理和故障排除。
一种Rack服务器电源保护机制,通过建立节点BMC和电源状态寄存器之间的通信,使BMC实时监测电源的运行状态,并根据电源的运行状态调节CPU的运行频率;
当电源运行状态正常时,CPU按照系统默认设置运行,BMC不做干涉;当BMC监测到电源状态出现异常时,通过I2C给CPU发送降频指令,使CPU以较低的频率运行;当电源状态恢复正常后,BMC将发送指令使CPU频率恢复正常。
所述的保护机制采用了二级管理的方式,RMC为第一级管理,节点中板为第二级管理,RMC通过I2C与节板中点通信。
具体步骤如下:第一步,电源的运行状态按照PM_Bus标准保存到状态寄存器中;第二步,RMC通过I2C读取这些日志,周期为1s;第三步,RMC通过I2C将电源状态信息传送给机柜上所有的节点中板;第四步,每个节点中板通过I2C将电源状态传送给其连接的所有节点BMC,BMC通过这种方式可以监测到电源的运行状态。
实施例1:
如附图1所示,电源的运行状态按照PM_Bus标准保存到寄存器中,RMC可以通过I2C读取这些log,周期为1s。RMC通过I2C将电源状态信息传送给机柜上所有的节点中板。每个节点中板通过I2C将电源状态传送给其连接的所有节点BMC。BMC通过这种方式可以监测到电源的运行状态。
如附图2所示,BMC实时监测电源和CPU的运行状态。当电源运行状态正常时,CPU按照系统默认设置运行,BMC不做干涉;当BMC监测到电源状态出现异常时,会通过I2C给CPU发送降频指令,使CPU以较低的频率运行,通过这种方式降低整机柜的运行功耗,减轻电源的负载。当电源状态恢复正常后,BMC将发送指令使CPU频率恢复正常。

Claims (4)

1.一种Rack服务器电源保护机制,其特征在于,通过建立节点BMC和电源状态寄存器之间的通信,使BMC实时监测电源的运行状态,并根据电源的运行状态调节CPU的运行频率;
当电源运行状态正常时,CPU按照系统默认设置运行,BMC不做干涉;当BMC监测到电源状态出现异常时,通过I2C给CPU发送降频指令,使CPU以较低的频率运行;当电源状态恢复正常后,BMC将发送指令使CPU频率恢复正常。
2.根据权利要求1所述的一种Rack服务器电源保护机制,其特征在于,所述的保护机制采用了二级管理的方式,RMC为第一级管理,节点中板为第二级管理,RMC通过I2C与节板中点通信。
3.根据权利要求1所述的一种Rack服务器电源保护机制,其特征在于,具体步骤如下:
第一步,电源的运行状态按照PM_Bus标准保存到状态寄存器中;
第二步,RMC通过I2C读取这些日志;
第三步,RMC通过I2C将电源状态信息传送给机柜上所有的节点中板;
第四步,每个节点中板通过I2C将电源状态传送给其连接的所有节点BMC,BMC通过这种方式可以监测到电源的运行状态。
4.根据权利要求3所述的一种Rack服务器电源保护机制,其特征在于,
所述的BMC通过I2C读取日志的周期为1s。
CN201610812296.6A 2016-09-09 2016-09-09 一种Rack服务器电源保护机制 Pending CN106445055A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610812296.6A CN106445055A (zh) 2016-09-09 2016-09-09 一种Rack服务器电源保护机制

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610812296.6A CN106445055A (zh) 2016-09-09 2016-09-09 一种Rack服务器电源保护机制

Publications (1)

Publication Number Publication Date
CN106445055A true CN106445055A (zh) 2017-02-22

Family

ID=58165242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610812296.6A Pending CN106445055A (zh) 2016-09-09 2016-09-09 一种Rack服务器电源保护机制

Country Status (1)

Country Link
CN (1) CN106445055A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106908738A (zh) * 2017-04-13 2017-06-30 广东浪潮大数据研究有限公司 一种SmartRack备份电池的自动检测方法
CN107135123A (zh) * 2017-05-10 2017-09-05 郑州云海信息技术有限公司 一种rack服务器资源动态池化的调配方法
CN107315675A (zh) * 2017-07-24 2017-11-03 郑州云海信息技术有限公司 一种服务器开关电源保护装置和方法
CN107526664A (zh) * 2017-09-06 2017-12-29 郑州云海信息技术有限公司 一种服务器异常掉电快速定位方法和装置
CN110554759A (zh) * 2019-08-02 2019-12-10 苏州浪潮智能科技有限公司 一种节能型刀片服务器及其节能方法
CN110850951A (zh) * 2019-09-29 2020-02-28 苏州浪潮智能科技有限公司 一种psu信息的刷新和读取方法、系统及设备
CN111984109A (zh) * 2020-08-05 2020-11-24 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于基板管理控制器的中央处理器调频方法、系统及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541239A (zh) * 2010-12-16 2012-07-04 鸿富锦精密工业(深圳)有限公司 网络设备及其功耗控制方法
CN103455120A (zh) * 2012-05-28 2013-12-18 鸿富锦精密工业(深圳)有限公司 电源控制系统及方法
CN104484026A (zh) * 2015-01-07 2015-04-01 加弘科技咨询(上海)有限公司 一种电源管理方法、系统及机架服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541239A (zh) * 2010-12-16 2012-07-04 鸿富锦精密工业(深圳)有限公司 网络设备及其功耗控制方法
CN103455120A (zh) * 2012-05-28 2013-12-18 鸿富锦精密工业(深圳)有限公司 电源控制系统及方法
CN104484026A (zh) * 2015-01-07 2015-04-01 加弘科技咨询(上海)有限公司 一种电源管理方法、系统及机架服务器

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106908738A (zh) * 2017-04-13 2017-06-30 广东浪潮大数据研究有限公司 一种SmartRack备份电池的自动检测方法
CN107135123A (zh) * 2017-05-10 2017-09-05 郑州云海信息技术有限公司 一种rack服务器资源动态池化的调配方法
CN107315675A (zh) * 2017-07-24 2017-11-03 郑州云海信息技术有限公司 一种服务器开关电源保护装置和方法
CN107526664A (zh) * 2017-09-06 2017-12-29 郑州云海信息技术有限公司 一种服务器异常掉电快速定位方法和装置
CN107526664B (zh) * 2017-09-06 2020-07-24 苏州浪潮智能科技有限公司 一种服务器异常掉电快速定位方法和装置
CN110554759A (zh) * 2019-08-02 2019-12-10 苏州浪潮智能科技有限公司 一种节能型刀片服务器及其节能方法
CN110850951A (zh) * 2019-09-29 2020-02-28 苏州浪潮智能科技有限公司 一种psu信息的刷新和读取方法、系统及设备
CN110850951B (zh) * 2019-09-29 2021-07-06 苏州浪潮智能科技有限公司 一种psu信息的刷新和读取方法、系统及设备
CN111984109A (zh) * 2020-08-05 2020-11-24 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于基板管理控制器的中央处理器调频方法、系统及介质

Similar Documents

Publication Publication Date Title
CN106445055A (zh) 一种Rack服务器电源保护机制
CN100450044C (zh) 一种智能平台管理接口系统中的后插板监控装置
CN107145428A (zh) 一种服务器及服务器监控方法
CN111176939B (zh) 一种基于cpld的多节点服务器的管理系统及方法
CN103186452A (zh) 服务器系统
CN103139248B (zh) 机架系统
CN102495785A (zh) 整机柜服务器集中管理方法和装置
US20180164795A1 (en) Fan monitoring system
US9037878B2 (en) Server rack system
CN111078393B (zh) 一种交互型边缘计算服务器及其控制方法
CN113374724B (zh) 一种基于多温度节点的风扇控制系统及方法
CN106774752A (zh) 一种Rack服务器备用风扇控制方法
CN106383569A (zh) 一种通用服务器电源保护机制
CN105978724A (zh) 一种基于ipmi的服务器管理系统
CN102081567A (zh) 服务器
CN102087511A (zh) 利用电源供应器执行电子系统远程监控的方法
TW201328575A (zh) 機櫃系統及其伺服器
WO2014173027A1 (zh) 基于智能平台管理接口的通信基站电源监视和控制系统
CN104317682A (zh) 一种实现风扇停转的异常状态快速区分识别的设计方法
CN104506342A (zh) 机架式服务器系统
CN203554493U (zh) 一种服务器用远程管理接口系统
CN106502355A (zh) 一种Rack服务器电源进风温度获取方法
CN113176982A (zh) 一种基于vpx架构机箱管理系统的实现装置及方法
CN111324503A (zh) 机框管理装置、方法和计算机可读存储介质
CN103186180A (zh) 机柜系统及其服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222