CN110362176A - 一种服务器bmc失效时散热控制系统及方法 - Google Patents

一种服务器bmc失效时散热控制系统及方法 Download PDF

Info

Publication number
CN110362176A
CN110362176A CN201910580852.5A CN201910580852A CN110362176A CN 110362176 A CN110362176 A CN 110362176A CN 201910580852 A CN201910580852 A CN 201910580852A CN 110362176 A CN110362176 A CN 110362176A
Authority
CN
China
Prior art keywords
bmc
baseboard management
fan
management controller
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910580852.5A
Other languages
English (en)
Inventor
韩红瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910580852.5A priority Critical patent/CN110362176A/zh
Publication of CN110362176A publication Critical patent/CN110362176A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及服务器散热技术领域,提供一种服务器BMC失效时散热控制系统及方法,系统包括基板管理控制器BMC、控制器、选通器以及待控风扇;控制器通过I2C总线从所述基板管理控制器BMC同步获取最新的风扇控制策略;控制器与基板管理控制器BMC之间通过心跳包机制进行在线互动检测,当检测到基板管理控制器BMC正常在线时,基板管理控制器BMC控制待控风扇的转动状态,当检测到基板管理控制器BMC不在线时,控制器控制待控风扇的转动状态,从而实现当BMC失效时,保证服务器的正常运行,既减少硬件链路连接,降低硬件设计复杂度和系统设计复杂度,又充分利用控制的资源、降低成本且提高系统稳定性。

Description

一种服务器BMC失效时散热控制系统及方法
技术领域
本发明属于服务器散热控制技术领域,尤其涉及一种服务器BMC失效时散热控制系统及方法。
背景技术
在服务器运行过程中,有效地控制散热,是保证服务器稳定运行的关键。在当前的服务器设计中,一般采用BMC(Baseboard Management Controller,基板管理控制器)对服务器主板进行管理。BMC可以监控主板的健康信息,实现功耗、温度和风扇转速的检测以及主板风扇的控制。当前的服务器应用中,人们对于服务器在功耗以及稳定性方面的要求越来越高,但是,BMC芯片的方案会存在一定的失效比率。若当BMC在某些情况下失效,主板风扇便失去控制,则服务器散热将受到影响,若系统过热则将导致系统宕机,对服务器稳定性造成影响。
目前,存在当服务器的BMC失效时散热的控制方案,例如下述两种:
(1)专利号为CN201510614465.0、发明名称为一种防止BMC失效后服务器系统过热的方法的发明专利,其具体实现过程为:在服务器内部,采用BMC作为风扇转速的控制器,并且BMC在正常工作状态下输出周期性的脉冲信号作为喂狗信号,将BMC芯片连接单片机,该单片机作为BMC工作状态的监测单元,通过监测BMC丢出的喂狗信号,实现对BMC是否正常工作的监测,当BMC失效后,调控风扇转速,保证系统的正常散热。该一种防止BMC失效后服务器系统过热的方法与现有技术相比,实现BMC工作状态的监控,通过检测MBC的工作状态,当发现BMC失效工作异常后,选通线路选通脉冲发生器生成的信号实现风扇的转速的控制,保证服务器可以正常工作,实用性强,易于推广。
但是,脉冲发生器用来生成BMC失效后风扇的控制信号,脉冲发生器通过调节上下拉电阻阻值实现脉冲宽度的调节,即采用可变电阻进行脉冲调节,在BMC失效后,通过调节电阻阻值,使脉冲发生器生成客户需要风扇控制信号,从而实现风扇保持在可控转速的工作状态下。此种方式无法根据服务器系统实际温度进行自动调节风扇的转速。存在调节不便利,甚至散热不够,导致服务器宕机的情况。
(2)专利号为201710047345.6、专利名称为一种服务器散热控制方法及系统的发明专利,其具体公开如下内容:BMC按照预设的周期向控制器发送喂狗信号,并向待控制风扇发送第一控制信号,通过第一控制信号控制待控制风扇;控制器接收BMC发送的喂狗信号,根据喂狗信号确定BMC是否发生故障,如果是,则向风扇控制芯片发送触发指令;风扇控制芯片接收控制器发送的触发指令,根据触发指令,向待控制风扇发送第二控制信号,通过第二控制信号控制待控制风扇。该方法可以使风扇控制芯片在BMC失效时,控制主板风扇,能够提高服务器的稳定性。但是,该服务器散热控制系统设计较为复杂。
发明内容
针对现有技术中的缺陷,本发明提供了一种既可减少硬件链路连接,降低硬件设计复杂度和系统设计复杂度,又能充分利用控制的资源、降低成本且提高系统稳定性的服务器BMC失效时散热控制系统。
本发明所提供的技术方案是:一种服务器BMC失效时散热控制系统,包括基板管理控制器BMC、控制器、选通器以及待控风扇;
所述选通器分别与所述基板管理控制器BMC和控制连接,且所述控制器与所述基板管理控制器BMC之间通过I2C总线通讯连接,所述选通器与所述待控风扇连接;
其中,所述控制器通过所述I2C总线从所述基板管理控制器BMC同步获取最新的风扇控制策略;
所述控制器与所述基板管理控制器BMC之间通过心跳包机制进行在线互动检测,当检测到所述基板管理控制器BMC正常在线时,所述选通器控制保持所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,所述基板管理控制器BMC控制所述待控风扇的转动状态,当检测到所述基板管理控制器BMC不在线时,所述选通器控制切断所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,在所述控制器与所述待控风扇之间建立信号连通,所述控制器控制所述待控风扇的转动状态。
作为一种改进的方案,所述选通器包括第一数据输入接口、第二数据输入接口、控制接口以及数据输出接口;
其中,第一数据输入接口与所述基板管理控制器BMC连接,所述第二数据输入接口、控制接口分别与所述控制器连接,所述数据输出接口与所述待控风扇连接。
作为一种改进的方案,所述控制器定期通过所述I2C总线向所述基板管理控制器BMC发送心跳包,所述基板管理控制器BMC接收到所述心跳包后,向所述控制器反馈一个响应报文;
当所述控制连续发送若干次心跳包,且收不到所述基板管理控制器BMC的响应报文时,则判定所述基板管理控制器BMC出现异常状态。
作为一种改进的方案,在所述控制器控制所述待控风扇的转动状态时,所述控制器持续向所述基板管理控制器BMC发送心跳包,判断所述基板管理控制器BMC是否有响应报文的应答;
当接收到所述基板管理控制器BMC反馈的响应报文时,则判定所述基板管理控制器BMC重新生效,并控制所述选通器在所述基板管理控制器BMC与所述待控风扇之间重新建立连通状态,由所述基板管理控制器BMC控制所述待控风扇的转动状态。
作为一种改进的方案,当在所述控制器与所述待控风扇之间建立信号连通时,所述控制器控制读取温度传感器的温度参数,同时依据从所述基板管理控制器同步的风扇控制策略对所述温度参数进行解析,生成风扇控制信号,控制待控风扇转动。
作为一种改进的方案,所述服务器BMC失效时散热控制系统还包括与所述控制器连接的蜂鸣器和告警LED灯。
本发明的另一目的在于提供一种基于服务器BMC失效时散热控制系统的服务器BMC失效时散热控制方法,所述方法包括下述步骤:
控制器与所述基板管理控制器BMC之间通过心跳包机制进行在线互动检测,判断基板管理控制器BMC是否正常在线;
当检测到所述基板管理控制器BMC正常在线时,所述选通器控制保持所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,所述基板管理控制器BMC控制所述待控风扇的转动状态;
当检测到所述基板管理控制器BMC不在线时,所述选通器控制切断所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,在所述控制器与所述待控风扇之间建立信号连通,所述控制器控制所述待控风扇的转动状态。
作为一种改进的方案,所述方法还包括下述步骤:
控制器定期通过所述I2C总线向所述基板管理控制器BMC发送心跳包,所述基板管理控制器BMC接收到所述心跳包后,向所述控制器反馈一个响应报文;
当所述控制连续发送若干次心跳包,且收不到所述基板管理控制器BMC的响应报文时,则判定所述基板管理控制器BMC出现异常状态;
在所述控制器控制所述待控风扇的转动状态时,所述控制器持续向所述基板管理控制器BMC发送心跳包,判断所述基板管理控制器BMC是否有响应报文的应答;
当接收到所述基板管理控制器BMC反馈的响应报文时,则判定所述基板管理控制器BMC重新生效,并控制所述选通器在所述基板管理控制器BMC与所述待控风扇之间重新建立连通状态,由所述基板管理控制器BMC控制所述待控风扇的转动状态。
作为一种改进的方案,所述方法还包括下述步骤:
当在所述控制器与所述待控风扇之间建立信号连通时,所述控制器控制读取温度传感器的温度参数,同时依据从所述基板管理控制器同步的风扇控制策略对所述温度参数进行解析,生成风扇控制信号,控制待控风扇转动。
作为一种改进的方案,所述方法还包括下述步骤:
当检测到所述基板管理控制器BMC不在线时,控制所述告警LED灯进行闪烁,同时,控制蜂鸣器进行鸣叫报警。
在本发明实施例中,服务器BMC失效时散热控制系统包括基板管理控制器BMC、控制器、选通器以及待控风扇;控制器通过I2C总线从所述基板管理控制器BMC同步获取最新的风扇控制策略;控制器与基板管理控制器BMC之间通过心跳包机制进行在线互动检测,当检测到基板管理控制器BMC正常在线时,基板管理控制器BMC控制待控风扇的转动状态,当检测到基板管理控制器BMC不在线时,控制器控制待控风扇的转动状态,从而实现当BMC失效时,保证服务器的正常运行,既减少硬件链路连接,降低硬件设计复杂度和系统设计复杂度,又充分利用控制的资源、降低成本且提高系统稳定性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1是本发明提供的服务器BMC失效时散热控制系统的结构示意图;
图2是本发明提供的服务器BMC失效时散热控制方法的实现流程图;
图3是本发明提供的风扇控制策略的实现流程图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的、技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
图1是本发明提供的服务器BMC失效时散热控制系统的结构示意图,为了便于说明,图中仅给出了与本发明实施例相关的部分。
服务器BMC失效时散热控制系统包括基板管理控制器BMC、控制器、选通器以及待控风扇;
所述选通器分别与所述基板管理控制器BMC和控制连接,且所述控制器与所述基板管理控制器BMC之间通过I2C总线通讯连接,所述选通器与所述待控风扇连接;
其中,所述控制器通过所述I2C总线从所述基板管理控制器BMC同步获取最新的风扇控制策略;
所述控制器与所述基板管理控制器BMC之间通过心跳包机制进行在线互动检测,当检测到所述基板管理控制器BMC正常在线时,所述选通器控制保持所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,所述基板管理控制器BMC控制所述待控风扇的转动状态,当检测到所述基板管理控制器BMC不在线时,所述选通器控制切断所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,在所述控制器与所述待控风扇之间建立信号连通,所述控制器控制所述待控风扇的转动状态。
结合图1所示,选通器包括第一数据输入接口、第二数据输入接口、控制接口以及数据输出接口;
其中,第一数据输入接口与所述基板管理控制器BMC连接,所述第二数据输入接口、控制接口分别与所述控制器连接,所述数据输出接口与所述待控风扇连接。
图2示出了本发明提供的服务器BMC失效时散热控制方法的实现流程图,其具体包括下述步骤:
在步骤S101中,控制器与所述基板管理控制器BMC之间通过心跳包机制进行在线互动检测,判断基板管理控制器BMC是否正常在线;
在步骤S102中,当检测到所述基板管理控制器BMC正常在线时,所述选通器控制保持所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,所述基板管理控制器BMC控制所述待控风扇的转动状态;
在步骤S103中,当检测到所述基板管理控制器BMC不在线时,所述选通器控制切断所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,在所述控制器与所述待控风扇之间建立信号连通,所述控制器控制所述待控风扇的转动状态。
为了对服务器BMC失效时散热控制系统的具体工作原理和内容进行说明,下述结合其具体的实现方法进行详细说明,具体包括基板管理控制器BMC和控制器之间的数据链路、心跳包机制、风扇控制策略、散热策略更新、选通器的控制、告警机制以及控制器的恢复机制,其中:
(1)基板管理控制器BMC和控制器之间的数据链路
在控制器和基板管理控制器BMC之间设置的I2C总线,使基板管理控制器BMC与控制器之间可以进行数据信号传送和通讯,可以实现心跳包和风扇散热策略等数据的通讯。
(2)心跳包机制
由于基板管理控制器BMC和控制器之间有数据链路,为节省GPIO,去掉原喂狗信号IO,改用网络中常用的“心跳包”机制,进行基板管理控制器BMC失效检测方式;控制器会定期(本设计为间隔10S)通过数据链路发送“心跳包”给BMC,BMC收到心跳包后给控制器返回一个响应报文,具体为:
控制器定期通过所述I2C总线向所述基板管理控制器BMC发送心跳包,所述基板管理控制器BMC接收到所述心跳包后,向所述控制器反馈一个响应报文;当所述控制连续发送若干次心跳包,且收不到所述基板管理控制器BMC的响应报文时,则判定所述基板管理控制器BMC出现异常状态。
其中,如果控制器多次(本设计为3次)收不到基板管理控制器BMC返回的响应报文时,则可以判定基板管理控制器BMC异常,首先尝试与BMC通讯,如果通讯失败,此时控制器尝试接管BMC,对于风扇进行管控;
在所述控制器控制所述待控风扇的转动状态时,所述控制器持续向所述基板管理控制器BMC发送心跳包,判断所述基板管理控制器BMC是否有响应报文的应答;
当接收到所述基板管理控制器BMC反馈的响应报文时,则判定所述基板管理控制器BMC重新生效,并控制所述选通器在所述基板管理控制器BMC与所述待控风扇之间重新建立连通状态,由所述基板管理控制器BMC控制所述待控风扇的转动状态。
(3)风扇控制策略
在该实施例中,待控风扇的控制源有两个,一个基板管理控制器BMC输出的,另一个是控制器输出;
默认是BMC控制信号生效,选通器默认连通基板管理控制器BMC和待控风扇;当当控制器检测到BMC失效后,控制器会接管BMC控制风扇,其具体实现为,如图3所示:
在步骤S201中,控制器通过控制选通器,切断基板管理控制器BMC和风扇之间的连通状态,并接通控制器和风扇;
在步骤S202中,控制器开始读取服务器的传感器温度,获取温度参数;
在步骤S203中,依据从所述基板管理控制器BMC同步的风扇控制策略,计算待控风扇的控制量;
在步骤S204中,根据计算得到的控制量,控制器产生风扇控制信号,控制风扇的运转。
在该实施例中,当控制器检测到基板管理控制器BMC恢复后,控制器会恢复BMC控制风扇,首先控制器停止读取服务器传感器温度,控制器控制选通器,恢复BMC和风扇的联通,最后,控制器停止风扇控制信号的产生。(4)散热策略更新
控制器固件中有一个默认简单风扇控制策略配置,在与基板管理控制器BMC建立通讯连接前会使用该策略进行简单控制;
当控制器启动后与基板管理控制器BMC建立数据链接,控制器会申请从基板管理控制器BMC同步最新风扇控制策略。首先,控制器向BMC请求当前风扇控制策略的版本号。其次,控制器判断是否需要更新,如果不需要则终止,如果需要更新则向BMC发起风扇控制策略同步申请。再次,控制器收到BMC发送的最新风扇控制策略解析验证。最后,将其存储到控制器内部flash中,覆盖默认风扇控制策略,后续控制器初始化时将加载该风扇控制策略;
当用户更新BMC的风扇控制策略时,BMC会通知控制器同步当前最新风扇控制策略,控制器发起同步申请,保证控制器的风扇控制策略与BMC同步。
(5)选通器的控制
选通器默认保持基板管理控制器BMC和风扇的连接,保证基板管理控制器BMC的控制信号能够直达待控风扇;
控制器接管基板管理控制器BMC控制后,会发送指令给选通器,切换控制器的控制信号连通待控风扇。
基板管理控制器BMC恢复正常后,控制器会发送指令给选通器,恢复基板管理控制器BMC控制信号联通待控风扇。
(6)告警机制
当控制器检测到基板管理控制器BMC失效时,会出发告警动作,告警装置包括告警LED和蜂鸣器,通知运维人员该服务器的基板管理控制器BMC失效,需要尽快恢复,其中:
控制器控制告警LED进行闪烁,闪烁频率为0.5Hz;
控制器控制蜂鸣器进行鸣叫,可以设置2秒滴一声。
(7)控制器恢复机制:
控制器为一个ARM或者单片机,存在自身软件Bug或者外部电磁干扰的情况,控制器存在死机、程序跑飞等情况。当该情况发生时,如果不能及时的将控制器重启恢复将会导致该设计失效;
对于一般的软件程序问题,本发明中控制器开启一个看门狗,在软件主程序大循环中进行喂狗操作,如果程序跑飞或者死机,看门狗将会使控制器进行重启;
对于控制器硬件问题,本实施例中采用双向验证心跳包的机制,即BMC统计控制器发送的心跳包,如果发现一段时间没有收到控制器发来的心跳包时,尝试与控制器进行通讯,查看状态,如果通讯失败,则判定控制器失效。BMC则记录log日志和报警处理,待运维人员确认。
在本发明实施例中,服务器BMC失效时散热控制系统包括基板管理控制器BMC、控制器、选通器以及待控风扇;控制器通过I2C总线从所述基板管理控制器BMC同步获取最新的风扇控制策略;控制器与基板管理控制器BMC之间通过心跳包机制进行在线互动检测,当检测到基板管理控制器BMC正常在线时,基板管理控制器BMC控制待控风扇的转动状态,当检测到基板管理控制器BMC不在线时,控制器控制待控风扇的转动状态,从而对散热控制系统进行硬件电路精简,同时扩展软件系统,形成一种低成本、低复杂度、高可靠性、高扩展性的创新解决方案。
通过本实施例,可以确保当BMC失效时,不论服务器处于何种状态,都能保证服务器正常运行,业务不收到影响,并且及时告知运维人员对失效的BMC进行恢复,大大提高了服务器的稳定性。
以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (10)

1.一种服务器BMC失效时散热控制系统,其特征在于,包括基板管理控制器BMC、控制器、选通器以及待控风扇;
所述选通器分别与所述基板管理控制器BMC和控制连接,且所述控制器与所述基板管理控制器BMC之间通过I2C总线通讯连接,所述选通器与所述待控风扇连接;
其中,所述控制器通过所述I2C总线从所述基板管理控制器BMC同步获取最新的风扇控制策略;
所述控制器与所述基板管理控制器BMC之间通过心跳包机制进行在线互动检测,当检测到所述基板管理控制器BMC正常在线时,所述选通器控制保持所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,所述基板管理控制器BMC控制所述待控风扇的转动状态,当检测到所述基板管理控制器BMC不在线时,所述选通器控制切断所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,在所述控制器与所述待控风扇之间建立信号连通,所述控制器控制所述待控风扇的转动状态。
2.根据权利要求1所述的服务器BMC失效时散热控制系统,其特征在于,所述选通器包括第一数据输入接口、第二数据输入接口、控制接口以及数据输出接口;
其中,第一数据输入接口与所述基板管理控制器BMC连接,所述第二数据输入接口、控制接口分别与所述控制器连接,所述数据输出接口与所述待控风扇连接。
3.根据权利要求2所述的服务器BMC失效时散热控制系统,其特征在于,所述控制器定期通过所述I2C总线向所述基板管理控制器BMC发送心跳包,所述基板管理控制器BMC接收到所述心跳包后,向所述控制器反馈一个响应报文;
当所述控制连续发送若干次心跳包,且收不到所述基板管理控制器BMC的响应报文时,则判定所述基板管理控制器BMC出现异常状态。
4.根据权利要求3所述的服务器BMC失效时散热控制系统,其特征在于,在所述控制器控制所述待控风扇的转动状态时,所述控制器持续向所述基板管理控制器BMC发送心跳包,判断所述基板管理控制器BMC是否有响应报文的应答;
当接收到所述基板管理控制器BMC反馈的响应报文时,则判定所述基板管理控制器BMC重新生效,并控制所述选通器在所述基板管理控制器BMC与所述待控风扇之间重新建立连通状态,由所述基板管理控制器BMC控制所述待控风扇的转动状态。
5.根据权利要求4所述的服务器BMC失效时散热控制系统,其特征在于,当在所述控制器与所述待控风扇之间建立信号连通时,所述控制器控制读取温度传感器的温度参数,同时依据从所述基板管理控制器同步的风扇控制策略对所述温度参数进行解析,生成风扇控制信号,控制待控风扇转动。
6.根据权利要求5所述的服务器BMC失效时散热控制系统,其特征在于,所述服务器BMC失效时散热控制系统还包括与所述控制器连接的蜂鸣器和告警LED灯。
7.一种基于权利要求1所述的服务器BMC失效时散热控制系统的服务器BMC失效时散热控制方法,其特征在于,所述方法包括下述步骤:
控制器与所述基板管理控制器BMC之间通过心跳包机制进行在线互动检测,判断基板管理控制器BMC是否正常在线;
当检测到所述基板管理控制器BMC正常在线时,所述选通器控制保持所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,所述基板管理控制器BMC控制所述待控风扇的转动状态;
当检测到所述基板管理控制器BMC不在线时,所述选通器控制切断所述基板管理控制器BMC与所述待控风扇之间的信号连通状态,在所述控制器与所述待控风扇之间建立信号连通,所述控制器控制所述待控风扇的转动状态。
8.根据权利要求7所述的服务器BMC失效时散热控制方法,其特征在于,所述方法还包括下述步骤:
控制器定期通过所述I2C总线向所述基板管理控制器BMC发送心跳包,所述基板管理控制器BMC接收到所述心跳包后,向所述控制器反馈一个响应报文;
当所述控制连续发送若干次心跳包,且收不到所述基板管理控制器BMC的响应报文时,则判定所述基板管理控制器BMC出现异常状态;
在所述控制器控制所述待控风扇的转动状态时,所述控制器持续向所述基板管理控制器BMC发送心跳包,判断所述基板管理控制器BMC是否有响应报文的应答;
当接收到所述基板管理控制器BMC反馈的响应报文时,则判定所述基板管理控制器BMC重新生效,并控制所述选通器在所述基板管理控制器BMC与所述待控风扇之间重新建立连通状态,由所述基板管理控制器BMC控制所述待控风扇的转动状态。
9.根据权利要求8所述的服务器BMC失效时散热控制方法,其特征在于,所述方法还包括下述步骤:
当在所述控制器与所述待控风扇之间建立信号连通时,所述控制器控制读取温度传感器的温度参数,同时依据从所述基板管理控制器同步的风扇控制策略对所述温度参数进行解析,生成风扇控制信号,控制待控风扇转动。
10.根据权利要求9所述的服务器BMC失效时散热控制方法,其特征在于,所述方法还包括下述步骤:
当检测到所述基板管理控制器BMC不在线时,控制所述告警LED灯进行闪烁,同时,控制蜂鸣器进行鸣叫报警。
CN201910580852.5A 2019-06-29 2019-06-29 一种服务器bmc失效时散热控制系统及方法 Pending CN110362176A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910580852.5A CN110362176A (zh) 2019-06-29 2019-06-29 一种服务器bmc失效时散热控制系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910580852.5A CN110362176A (zh) 2019-06-29 2019-06-29 一种服务器bmc失效时散热控制系统及方法

Publications (1)

Publication Number Publication Date
CN110362176A true CN110362176A (zh) 2019-10-22

Family

ID=68216039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910580852.5A Pending CN110362176A (zh) 2019-06-29 2019-06-29 一种服务器bmc失效时散热控制系统及方法

Country Status (1)

Country Link
CN (1) CN110362176A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026611A (zh) * 2019-12-10 2020-04-17 苏州浪潮智能科技有限公司 一种服务器散热控制方法及系统
CN111580626A (zh) * 2020-04-28 2020-08-25 北京达佳互联信息技术有限公司 风扇控制方法、装置、电子设备及存储介质
CN111708418A (zh) * 2020-06-15 2020-09-25 西安易朴通讯技术有限公司 风扇控制方法、装置、设备及计算机可读存储介质
CN112922893A (zh) * 2021-03-29 2021-06-08 中科长城海洋信息系统有限公司长沙分公司 一种基于i3c总线的智能风扇系统及其管理方法
CN113048090A (zh) * 2021-03-12 2021-06-29 山东英信计算机技术有限公司 一种风扇转速控制方法及系统
CN114281890A (zh) * 2021-11-26 2022-04-05 苏州浪潮智能科技有限公司 一种bios带外管理系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224049A (zh) * 2015-09-24 2016-01-06 浪潮电子信息产业股份有限公司 一种防止bmc失效后服务器系统过热的方法
CN106814834A (zh) * 2017-01-22 2017-06-09 济南浪潮高新科技投资发展有限公司 一种服务器散热控制方法和系统
CN107632907A (zh) * 2017-08-07 2018-01-26 郑州云海信息技术有限公司 一种bmc芯片托管系统及其控制方法
CN109185208A (zh) * 2018-08-15 2019-01-11 郑州云海信息技术有限公司 一种风扇调速方法及相关装置
CN109236714A (zh) * 2018-11-06 2019-01-18 英业达科技有限公司 风扇控制电路及风扇控制系统
CN109656739A (zh) * 2018-12-10 2019-04-19 英业达科技有限公司 服务方法、系统、主板及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224049A (zh) * 2015-09-24 2016-01-06 浪潮电子信息产业股份有限公司 一种防止bmc失效后服务器系统过热的方法
CN106814834A (zh) * 2017-01-22 2017-06-09 济南浪潮高新科技投资发展有限公司 一种服务器散热控制方法和系统
CN107632907A (zh) * 2017-08-07 2018-01-26 郑州云海信息技术有限公司 一种bmc芯片托管系统及其控制方法
CN109185208A (zh) * 2018-08-15 2019-01-11 郑州云海信息技术有限公司 一种风扇调速方法及相关装置
CN109236714A (zh) * 2018-11-06 2019-01-18 英业达科技有限公司 风扇控制电路及风扇控制系统
CN109656739A (zh) * 2018-12-10 2019-04-19 英业达科技有限公司 服务方法、系统、主板及计算机可读存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026611A (zh) * 2019-12-10 2020-04-17 苏州浪潮智能科技有限公司 一种服务器散热控制方法及系统
CN111580626A (zh) * 2020-04-28 2020-08-25 北京达佳互联信息技术有限公司 风扇控制方法、装置、电子设备及存储介质
CN111708418A (zh) * 2020-06-15 2020-09-25 西安易朴通讯技术有限公司 风扇控制方法、装置、设备及计算机可读存储介质
CN113048090A (zh) * 2021-03-12 2021-06-29 山东英信计算机技术有限公司 一种风扇转速控制方法及系统
CN113048090B (zh) * 2021-03-12 2023-02-28 山东英信计算机技术有限公司 一种风扇转速控制方法及系统
CN112922893A (zh) * 2021-03-29 2021-06-08 中科长城海洋信息系统有限公司长沙分公司 一种基于i3c总线的智能风扇系统及其管理方法
CN112922893B (zh) * 2021-03-29 2022-07-22 中科长城海洋信息系统有限公司长沙分公司 一种基于i3c总线的智能风扇系统及其管理方法
CN114281890A (zh) * 2021-11-26 2022-04-05 苏州浪潮智能科技有限公司 一种bios带外管理系统及方法
CN114281890B (zh) * 2021-11-26 2024-01-19 苏州浪潮智能科技有限公司 一种bios带外管理系统及方法

Similar Documents

Publication Publication Date Title
CN110362176A (zh) 一种服务器bmc失效时散热控制系统及方法
US12100287B2 (en) Method and system for processing security event data
US20160100348A1 (en) Server-based notification of alarm event subsequent to communication failure with armed security system
CN107612748A (zh) 一种多节点服务器功耗管理系统
WO2015184866A1 (zh) 一种监控方法、装置及电源系统中的第一监控单元
KR20080058454A (ko) 분산 모니터링 방법
CN112596568B (zh) 一种读取电压调节器报错信息的方法、系统、设备及介质
WO2007083971A1 (en) Device management scheduling method and apparatus thereof
CN118245269B (zh) Pci设备的故障处理方法及装置、故障处理系统
US7436291B2 (en) Protection of devices in a redundant configuration
BRPI0813519B1 (pt) método para comunicação sem fio dentro de um sistema de automação predial, sistema de automação predial e componente de automação
CN111045505A (zh) 一种片上系统的延时复位装置及方法
CN117873040A (zh) 工控主板的远程监测与故障诊断方法以及相关设备
CN110990903B (zh) 一种云端系统以及云端系统保护方法
US11093014B2 (en) Method for monitoring, control and graceful shutdown of control and/or computer units
JP2603805Y2 (ja) 複数の機能要素を有するシステムのための監視回路
CN113994274A (zh) 网络压力测试
CN103036778B (zh) 一种家庭网关设备中防止设备僵死的装置和方法
CN107315660A (zh) 一种虚拟化系统的双机热备份方法、装置及系统
TW200945029A (en) Control system and management method utilizing the same
EP0962862B1 (en) Apparatus and method for remote diagnostic of data processing units
EP3286881B1 (en) Lighting-control processor and method for operating a lighting-control processor
CN113722185B (zh) 一种国产化计算机远程管理系统
JPH10247962A (ja) コンピュータ通信監視システム
US7500154B2 (en) Method and system for generating a console log

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191022

RJ01 Rejection of invention patent application after publication