CN111258405A - 一种服务器主板防烧系统及方法 - Google Patents

一种服务器主板防烧系统及方法 Download PDF

Info

Publication number
CN111258405A
CN111258405A CN202010056643.3A CN202010056643A CN111258405A CN 111258405 A CN111258405 A CN 111258405A CN 202010056643 A CN202010056643 A CN 202010056643A CN 111258405 A CN111258405 A CN 111258405A
Authority
CN
China
Prior art keywords
power consumption
cpld
bmc
monitoring chip
consumption monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010056643.3A
Other languages
English (en)
Other versions
CN111258405B (zh
Inventor
陈占良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010056643.3A priority Critical patent/CN111258405B/zh
Publication of CN111258405A publication Critical patent/CN111258405A/zh
Application granted granted Critical
Publication of CN111258405B publication Critical patent/CN111258405B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)

Abstract

本发明提供一种服务器主板防烧系统及方法,所述系统包括:CPLD,所述CPLD与BMC通信连接,所述CPLD的输入端连接功耗监控芯片的信号输出端,所述CPLD的输出端连接功耗监控芯片的功耗阈值设定管脚;所述BMC连接功耗监控芯片;所述功耗监控芯片连接主板的电源。本发明能够解决BMC在不工作的情况下,当出现板卡过流等异常情况时,可以对板卡进行下电保护,提高了板卡过流保护的安全性,同时CPLD能够在BMC故障的情况下记录异常数据,保证断电数据不丢失,从而能够快速定位问题原因。

Description

一种服务器主板防烧系统及方法
技术领域
本发明属于服务器技术领域,具体涉及一种服务器主板防烧系统及方法。
背景技术
服务器运行过程中,由于板卡设计及运行环境的因素,会导致服务器存在短路、器件损坏及温度过高等情况,当多种异常情况发生时,会引起板卡的烧毁。服务器运行过程中出现板卡烧毁现象时,一方面会造成运行服务的中断,另一方面,板卡烧毁引起的火灾对机房的安全造成一定的隐患。
由于烧板现象是随机的,且发生之后板卡已被损坏,对问题分析造成了极大的困难。因此,在板卡出现短路等异常状态时,板卡设计时通过实时地电流监控,并及时地采取措施,保证在板卡烧毁之前中断通电线路,从而保证板卡处于断路状态,从而保证板卡的安全。
现有的服务器主板设计中,通过会使用BMC、CPLD和监控芯片的组合设计进行板卡的监控及保护设计。功耗监控芯片监测PSU输出的12V是否出现过流问题,当出现过流时,功耗监控芯片拉高shutdown信号,通过CPLD进行事件触发,BMC接受到alert_n信号后,通过I2C总线读取功耗监控芯片的日志信息,如确认存在过流现象,BMC通过I2C指令关闭功耗监控芯片,从而中断12V的后续输出。
现有的技术方案中,依靠BMC通过I2C进行切断功耗监控芯片的输出,从而实现板卡的防烧板设计。但是,当BMC工作异常时,CPLD触发中断后,BMC不能正常中断功耗监控芯片,从而使主板仍然存在烧板的可能。
发明内容
针对现有技术的上述不足,本发明提供一种服务器主板防烧系统及方法,以解决上述技术问题。
本发明提供一种服务器主板防烧系统,所述系统包括:
CPLD,所述CPLD与BMC通信连接,所述CPLD的输入端连接功耗监控芯片的信号输出端,所述CPLD的输出端连接功耗监控芯片的功耗阈值设定管脚;
所述BMC连接功耗监控芯片;
所述功耗监控芯片连接主板的电源。
进一步的,所述BMC通过I2C总线连接功耗监控芯片。
进一步的,所述主板包括多个电源,每个电源均连接一个功耗监控芯片。
本发明还提供一种服务器主板防烧方法,所述方法包括:
所述CPLD确认BMC故障;
所述CPLD根据接收的功耗监控芯片的异常中断信号拉低功耗阈值控制信号;
所述CPLD将低位功耗阈值控制信号发送至功耗监控芯片的功耗阈值设定管脚,控制功耗监控芯片切断电源输出。
进一步的,所述CPLD确认BMC异常,包括:
所述CPLD接收BMC发送的喂狗信号并监控所述喂狗信号状态;
若所述喂狗信号为方波,则所述CPLD判定BMC正常;
若所述喂狗信号的电平持续不变,则所述CPLD判定BMC故障。
进一步的,所述方法还包括:
所述CPLD从接收到功耗监控芯片发送的异常中断信号开始计时;
所述CPLD判断在预设等待时间内接收的异常中断信号是否消除:
若是,则判定为干扰因素;
若否,则将发送至功耗监控芯片的功耗阈值控制信号拉低。
进一步的,所述方法还包括:
所述CPLD接收到所述异常中断信号后生成异常事件;
所述CPLD将所述异常事件存储至UFM;
所述CPLD在服务器重启后读取所述UFM的异常事件并将所述异常事件发生至BMC。
进一步的,所述方法还包括:
所述CPLD确认BMC正常;
所述CPLD根据所述异常中断信号向所述BMC发送异常事件信号,控制所述BMC通过I2C总线向功耗监控芯片发送电源切断指令。
本发明的有益效果在于,
本发明提供的服务器主板防烧系统及方法,通过令CPLD的输出端连接功耗监控芯片的功耗阈值设定管脚,在BMC故障后,CPLD立即根据功耗监控芯片发送的异常中断信号将向功耗监控芯片发送的功耗阈值控制信号拉低,从而控制功耗监控芯片切断电源的输出。本发明能够解决BMC在不工作的情况下,当出现板卡过流等异常情况时,可以对板卡进行下电保护,提高了板卡过流保护的安全性,同时CPLD能够在BMC故障的情况下记录异常数据,保证断电数据不丢失,从而能够快速定位问题原因。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例的系统的结构示意图。
图2是本申请一个实施例的方法的示例性流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明的描述中除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
下面将参考附图并结合实施例来详细说明本发明。
实施例1
参考图1,本实施例提供一种服务器主板防烧系统,所述系统包括以下部件和连接关系:
CPLD与BMC通信连接,此外,CPLD与功耗监控芯片形成一个连接回路,具体为:CPLD的输入端连接功耗监控芯片的信号输出端,CPLD的输出端连接功耗监控芯片的功耗阈值设定管脚。BMC连接功耗监控芯片,功耗监控芯片连接主板的电源。
实施例2
本实施例提供一种服务器主板防烧系统,所述系统包括以下部件和连接关系:
本实施例服务器有三个接入电源,每个电源均连接一个功耗监控芯片(MAX34411芯片),因此本实施例有三个功耗监控芯片。三个功耗监控芯片与CPLD和BMC的连接关系都是相同的,具体连接关系如下:
CPLD与BMC通信连接,此外,CPLD与功耗监控芯片形成一个连接回路,具体为:CPLD的输入端连接功耗监控芯片的信号输出端,CPLD的输出端连接功耗监控芯片的功耗阈值设定管脚。BMC通过I2C总线连接功耗监控芯片的I2C管脚。
实施例3
本实施例提供一种服务器主板防烧方法,所述方法包括以下步骤:
S1、CPLD确认BMC故障;
S2、CPLD根据接收的功耗监控芯片的异常中断信号拉低功耗阈值控制信号;
S3、CPLD将低位功耗阈值控制信号发送至功耗监控芯片的功耗阈值设定管脚,控制功耗监控芯片切断电源输出。
实施例4
参考图2,本实施例提供一种服务器主板防烧方法,所述方法包括以下步骤:
CPLD通过看门狗信号(WDT)监控BMC的工作状态,当WDT为方波信号时,表示BMC正常工作;当WDT持续高电平或者持续低电平时,表示BMC工作异常。
BMC工作正常阶段,CPLD关闭防烧板功能,在出现电源过流时,由BMC控制功耗监控芯片切断电源输出。
BMC工作异常时,CPLD通过功耗阈值控制信号实现防烧板功能,具体过程为:
CPLD通过逻辑设计控制功耗控制信号,当板卡功耗正常时,CPLD输出高电平,将功耗监控芯片的功耗值设定为800w,此时电源可以输出电流。
CPLD可以监控MAX34411的异常中断(shutdown)信号,当MAX34411出现异常中断时,CPLD延时确认异常情况,避免由于信号干扰引起的误触发。其中延时确认异常情况的过程为:当出现异常中断时,CPLD持续监测50ms,避免由于干扰等因素导致的系统误触发。若50ms后仍然存在异常中断,则CPLD判定电源出现过流情况,需要启动防烧控制。
CPLD确认电源出现过流情况后,将异常事件记录到UFM内部,同时,CPLD向功耗监控芯片的功耗阈值设定管脚输出低电平功耗阈值控制信号,从而将功耗监控芯片的功耗阈值设定为0W,此时功耗监控芯片实际监测功耗大于功耗设定值,从而会自动切断电源输出,从而保证板卡不被烧毁。
服务器再次上电启动后,CPLD读取UFM存储的异常事件数据并将读取的异常事件数据发送至BMC,从而定位问题原因。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种服务器主板防烧系统,其特征在于,所述系统包括:
CPLD,所述CPLD与BMC通信连接,所述CPLD的输入端连接功耗监控芯片的信号输出端,所述CPLD的输出端连接功耗监控芯片的功耗阈值设定管脚;
所述BMC连接功耗监控芯片;
所述功耗监控芯片连接主板的电源。
2.根据权利要求1所述的系统,其特征在于,所述BMC通过I2C总线连接功耗监控芯片。
3.根据权利要求1所述的系统,其特征在于,所述主板包括多个电源,每个电源均连接一个功耗监控芯片。
4.一种服务器主板防烧方法,其特征在于,所述方法包括:
所述CPLD确认BMC故障;
所述CPLD根据接收的功耗监控芯片的异常中断信号拉低功耗阈值控制信号;
所述CPLD将低位功耗阈值控制信号发送至功耗监控芯片的功耗阈值设定管脚,控制功耗监控芯片切断电源输出。
5.根据权利要求4所述的方法,其特征在于,所述CPLD确认BMC异常,包括:
所述CPLD接收BMC发送的喂狗信号并监控所述喂狗信号状态;
若所述喂狗信号为方波,则所述CPLD判定BMC正常;
若所述喂狗信号的电平持续不变,则所述CPLD判定BMC故障。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
所述CPLD从接收到功耗监控芯片发送的异常中断信号开始计时;
所述CPLD判断在预设等待时间内接收的异常中断信号是否消除:
若是,则判定为干扰因素;
若否,则将发送至功耗监控芯片的功耗阈值控制信号拉低。
7.根据权利要求4所述的方法,其特征在于,所述方法还包括:
所述CPLD接收到所述异常中断信号后生成异常事件;
所述CPLD将所述异常事件存储至UFM;
所述CPLD在服务器重启后读取所述UFM的异常事件并将所述异常事件发生至BMC。
8.根据权利要求5所述的方法,其特征在于,所述方法还包括:
所述CPLD确认BMC正常;
所述CPLD根据所述异常中断信号向所述BMC发送异常事件信号,控制所述BMC通过I2C总线向功耗监控芯片发送电源切断指令。
CN202010056643.3A 2020-01-18 2020-01-18 一种服务器主板防烧系统及方法 Active CN111258405B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010056643.3A CN111258405B (zh) 2020-01-18 2020-01-18 一种服务器主板防烧系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010056643.3A CN111258405B (zh) 2020-01-18 2020-01-18 一种服务器主板防烧系统及方法

Publications (2)

Publication Number Publication Date
CN111258405A true CN111258405A (zh) 2020-06-09
CN111258405B CN111258405B (zh) 2021-11-23

Family

ID=70947208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010056643.3A Active CN111258405B (zh) 2020-01-18 2020-01-18 一种服务器主板防烧系统及方法

Country Status (1)

Country Link
CN (1) CN111258405B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949466A (zh) * 2020-09-11 2020-11-17 苏州浪潮智能科技有限公司 一种能快速读取设备信息的系统及方法
CN113204471A (zh) * 2021-05-14 2021-08-03 山东英信计算机技术有限公司 一种服务器防烧主板及其控制方法、相关组件
CN113448422A (zh) * 2021-05-28 2021-09-28 山东英信计算机技术有限公司 一种服务器bios闪存芯片保护电路及服务器
CN114816022A (zh) * 2022-04-28 2022-07-29 苏州浪潮智能科技有限公司 一种服务器电源异常监控方法、系统及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268144A (zh) * 2013-06-07 2013-08-28 张宁 电源监控装置及过流保护方法
US20140115348A1 (en) * 2012-10-24 2014-04-24 Inventec Corporation Server system and heat dissipation control method thereof
CN105183611A (zh) * 2015-09-23 2015-12-23 浪潮电子信息产业股份有限公司 一种通过侦测电压防止pcb板卡烧毁的方法
CN107133119A (zh) * 2017-05-02 2017-09-05 郑州云海信息技术有限公司 一种通过cpld实现硬件看门狗功能的方法
CN108089964A (zh) * 2017-12-07 2018-05-29 郑州云海信息技术有限公司 一种通过bmc监控服务器cpld状态的装置及方法
CN109683696A (zh) * 2018-12-25 2019-04-26 浪潮电子信息产业股份有限公司 服务器电源故障检测系统、方法、装置、设备及介质
CN109842088A (zh) * 2017-11-27 2019-06-04 深圳中电长城信息安全系统有限公司 一种保护电路、电路保护方法及设备
CN109857614A (zh) * 2018-12-28 2019-06-07 曙光信息产业(北京)有限公司 一种机架服务器的容灾装置和方法
CN109882440A (zh) * 2019-04-16 2019-06-14 苏州浪潮智能科技有限公司 一种风扇转速控制装置及控制方法
CN110008091A (zh) * 2019-04-15 2019-07-12 苏州浪潮智能科技有限公司 一种在soc上记录高温日志的方法、装置和介质
CN110362175A (zh) * 2019-06-29 2019-10-22 苏州浪潮智能科技有限公司 一种风扇控制方法及装置
CN110377138A (zh) * 2019-06-29 2019-10-25 苏州浪潮智能科技有限公司 一种多路服务器供电电路及供电控制方法
CN110502087A (zh) * 2019-07-19 2019-11-26 苏州浪潮智能科技有限公司 一种服务器防烧板系统及工作方法
CN110609760A (zh) * 2019-08-14 2019-12-24 苏州浪潮智能科技有限公司 一种防止服务器误触发降频的系统

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140115348A1 (en) * 2012-10-24 2014-04-24 Inventec Corporation Server system and heat dissipation control method thereof
CN103268144A (zh) * 2013-06-07 2013-08-28 张宁 电源监控装置及过流保护方法
CN105183611A (zh) * 2015-09-23 2015-12-23 浪潮电子信息产业股份有限公司 一种通过侦测电压防止pcb板卡烧毁的方法
CN107133119A (zh) * 2017-05-02 2017-09-05 郑州云海信息技术有限公司 一种通过cpld实现硬件看门狗功能的方法
CN109842088A (zh) * 2017-11-27 2019-06-04 深圳中电长城信息安全系统有限公司 一种保护电路、电路保护方法及设备
CN108089964A (zh) * 2017-12-07 2018-05-29 郑州云海信息技术有限公司 一种通过bmc监控服务器cpld状态的装置及方法
CN109683696A (zh) * 2018-12-25 2019-04-26 浪潮电子信息产业股份有限公司 服务器电源故障检测系统、方法、装置、设备及介质
CN109857614A (zh) * 2018-12-28 2019-06-07 曙光信息产业(北京)有限公司 一种机架服务器的容灾装置和方法
CN110008091A (zh) * 2019-04-15 2019-07-12 苏州浪潮智能科技有限公司 一种在soc上记录高温日志的方法、装置和介质
CN109882440A (zh) * 2019-04-16 2019-06-14 苏州浪潮智能科技有限公司 一种风扇转速控制装置及控制方法
CN110362175A (zh) * 2019-06-29 2019-10-22 苏州浪潮智能科技有限公司 一种风扇控制方法及装置
CN110377138A (zh) * 2019-06-29 2019-10-25 苏州浪潮智能科技有限公司 一种多路服务器供电电路及供电控制方法
CN110502087A (zh) * 2019-07-19 2019-11-26 苏州浪潮智能科技有限公司 一种服务器防烧板系统及工作方法
CN110609760A (zh) * 2019-08-14 2019-12-24 苏州浪潮智能科技有限公司 一种防止服务器误触发降频的系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949466A (zh) * 2020-09-11 2020-11-17 苏州浪潮智能科技有限公司 一种能快速读取设备信息的系统及方法
CN111949466B (zh) * 2020-09-11 2023-01-06 苏州浪潮智能科技有限公司 一种能快速读取设备信息的系统及方法
CN113204471A (zh) * 2021-05-14 2021-08-03 山东英信计算机技术有限公司 一种服务器防烧主板及其控制方法、相关组件
CN113448422A (zh) * 2021-05-28 2021-09-28 山东英信计算机技术有限公司 一种服务器bios闪存芯片保护电路及服务器
CN114816022A (zh) * 2022-04-28 2022-07-29 苏州浪潮智能科技有限公司 一种服务器电源异常监控方法、系统及存储介质
CN114816022B (zh) * 2022-04-28 2023-08-04 苏州浪潮智能科技有限公司 一种服务器电源异常监控方法、系统及存储介质

Also Published As

Publication number Publication date
CN111258405B (zh) 2021-11-23

Similar Documents

Publication Publication Date Title
CN111258405B (zh) 一种服务器主板防烧系统及方法
CN102263645A (zh) 通信设备中电源管理方法及通信设备中的电源管理系统
CN110445638B (zh) 一种交换机系统故障保护方法及装置
CN111831488B (zh) 具有安全等级设计的tcms-mpu控制单元
CN112596568B (zh) 一种读取电压调节器报错信息的方法、系统、设备及介质
EP3806257A1 (en) Single phase fault isolation and restoration for loss of voltage fault in power distribution network
WO2024082873A1 (zh) 数据备份方法、计算机设备及存储介质
US7045914B2 (en) System and method for automatically providing continuous power supply via standby uninterrupted power supplies
CN111722987A (zh) 一种服务器的报警装置及其报警方法和存储介质
US6598170B1 (en) Power supply control based on preset schedule with independent schedule monitor and backup system for executing schedule operation when malfunction occurs
CN105426263B (zh) 一种实现金库系统安全运行的方法及系统
US20200012579A1 (en) Monitoring and management system of operational and performance parameters of a cryptocurrency mining farm
CN117453036A (zh) 调整服务器中的设备的功耗的方法、系统及装置
CN112148535B (zh) 一种机架式设备双监控系统
CN108243358B (zh) 可插拔业务板
CN114610562A (zh) 服务器功耗管控方法、系统、终端及存储介质
CN113162015A (zh) 一种主板电源异常定位保护方法及装置
CN113225216A (zh) 数据传输交换机自动重启的方法及数据传输交换装置
CN105391575A (zh) 一种金库控制方法及系统
CN218161802U (zh) 一种优化系统电源异常触发机制的可编程逻辑器件、系统
CN114089824B (zh) 一种热插拔部件保护方法及装置
CN220455472U (zh) 一种开关检测装置和机器人
CN117075706A (zh) 一种服务器板卡的保护系统及方法
JP2003319547A (ja) 過電流検出制御システム
CN114647293B (zh) 掉电保护方法、装置、电源监控组件以及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201022

Address after: 518000 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer

Applicant after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Address before: 215100 No. 1 Guanpu Road, Guoxiang Street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province

Applicant before: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant