CN112948185A - 一种服务器散热方法、装置及相关组件 - Google Patents

一种服务器散热方法、装置及相关组件 Download PDF

Info

Publication number
CN112948185A
CN112948185A CN202110218540.7A CN202110218540A CN112948185A CN 112948185 A CN112948185 A CN 112948185A CN 202110218540 A CN202110218540 A CN 202110218540A CN 112948185 A CN112948185 A CN 112948185A
Authority
CN
China
Prior art keywords
state
heat dissipation
server
bmc
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110218540.7A
Other languages
English (en)
Inventor
张世强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN202110218540.7A priority Critical patent/CN112948185A/zh
Publication of CN112948185A publication Critical patent/CN112948185A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Power Sources (AREA)

Abstract

本申请公开了一种服务器散热方法,应用于CPLD,该服务器散热方法包括:监测BMC的状态;当状态为正常状态,根据BMC发送的风扇控制信号控制散热系统运行;当状态为异常状态,获取服务器的温度数据和/或处理器状态,根据温度数据和/或处理器状态控制散热系统运行。本申请能够在BMC处于异常状态时,通过CPLD控制散热系统正常工作,提高服务器的运行安全性,相较于现有技术中采用强制风扇全速运转的方式,本申请可以减少噪音和服务器的供电能耗。本申请还公开了一种服务器散热装置、电子设备及计算机可读存储介质,具有以上有益效果。

Description

一种服务器散热方法、装置及相关组件
技术领域
本申请涉及服务器领域,特别涉及一种服务器散热方法、装置及相关组件。
背景技术
随着高性能服务器的快速增长,对服务器的散热设计更是提出严峻挑战,一旦服务器散热系统发生故障,而得不到及时、有效地处理,就会使服务器内部温度迅速升高,从而引起服务器停机,造成服务中断、数据丢失等事故,给用户带来严重损失。目前,主流服务器的散热系统一般由BMC(Baseboard Management Controller,基板管理控制器)通过转速控制信号和转速反馈信号来控制风扇转速实现,但对BMC未启动时缺乏散热管控,部分服务器采用强制风扇全速运转的方案,而风扇全速运转会产生极大地噪音,不利于现场故障维护,同时大大增加了服务器供电能耗。
因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
发明内容
本申请的目的是提供一种服务器散热方法、装置、电子设备及计算机可读存储介质,在BMC处于异常状态时,通过CPLD控制散热系统正常工作,提高服务器的运行安全性。
为解决上述技术问题,本申请提供了一种服务器散热方法,应用于CPLD,该服务器散热方法包括:
监测BMC的状态;
当所述状态为正常状态,根据所述BMC发送的风扇控制信号控制散热系统运行;
当所述状态为异常状态,获取所述服务器的温度数据和/或处理器状态,根据所述温度数据和/或所述处理器状态控制所述散热系统运行。
优选的,所述监测BMC的状态的过程包括:
当接收到所述服务器的开机信号,判断所述BMC是否在第一预设时间段内启动完成;
若是,判定所述状态为所述正常状态;
若否,判定所述状态为所述异常状态中的启动异常状态。
优选的,所述监测BMC的状态的过程包括:
每隔预设周期判断是否接收到所述BMC的心跳信号;
若是,判定所述状态为所述正常状态;
若否,判定所述状态为所述异常状态中的工作异常状态。
优选的,根据所述处理器状态控制所述散热系统运行的过程包括:
当所述处理器状态为上电异常状态,控制所述散热系统按预设最低转速运行。
优选的,该服务器散热方法还包括:
当所述BMC在所述第一预设时间段内启动完成,将所述温度数据发送至所述BMC,以便所述BMC在判定所述温度数据异常时告警。
优选的,当所述服务器包括主处理器和从处理器时,该服务器散热方法还包括:
控制所述主处理器的散热系统上电完成后,间隔第二预设时间段,控制所述从处理器的散热系统上电。
优选的,该服务器散热方法还包括:
当接收到所述服务器的关机信号,先控制所述散热系统按预设最低转速运行第三预设时间段后,再控制所述散热系统停止运行。
为解决上述技术问题,本申请还提供了一种服务器散热装置,应用于CPLD,该服务器散热装置包括:
监测模块,用于监测BMC的状态,当所述状态为正常状态生成第一触发信号,当所述状态为异常状态生成第二触发信号;
第一控制模块,用于当接收到所述第一触发信号,根据所述BMC发送的风扇控制信号控制散热系统运行;
第二控制模块,用于当接收到所述第二触发信号,获取所述服务器的温度数据和/或处理器状态,根据所述温度数据和/或所述处理器状态控制所述散热系统运行。
为解决上述技术问题,本申请还提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任意一项所述的服务器散热方法的步骤。
为解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文任意一项所述的服务器散热方法的步骤。
本申请提供了一种服务器散热方法,当BMC处于正常状态时,由BMC完成对服务器散热系统的管控,当BMC处于异常状态时,散热系统在CPLD的控制下正常工作,从而提高服务器的运行安全性。CPLD在对散热系统进行管控时,既考虑服务器的温度数据又考虑处理器状态,提高了散热管控的可靠性和全面性,相较于现有技术中采用强制风扇全速运转的方式,本申请可以减少噪音和服务器的供电能耗。本申请还提供了一种服务器散热装置、电子设备及计算机可读存储介质,具有和上述服务器散热方法相同的有益效果。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请所提供的一种服务器系统的结构示意图;
图2为本申请所提供的一种服务器散热方法的步骤流程图;
图3为本申请所提供的一种服务器散热装置的结构示意图。
具体实施方式
本申请的核心是提供一种服务器散热方法、装置、电子设备及计算机可读存储介质,在BMC处于异常状态时,通过CPLD控制散热系统正常工作,提高服务器的运行安全性。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参照图1,图1为本实施例所提供的一种服务器散热方法所适用的服务器系统的结构示意图,该服务器系统包括开机按键001、主处理器002、从处理器003、EEPROM 004(Electrically Erasable Programmable Read Only Memory,带电可擦可编程存储器)、第一散热系统005、第二散热系统006、BMC 007、CPLD 008(Complex Programmable LogicDevice,复杂可编程逻辑器件)、第一温度传感器009、第二温度传感器010、第一风扇供电监控芯片011和第二风扇供电监控芯片012,第一散热系统005和第二散热系统006均包括风扇和用于放置风扇的插座,插座可以选用4Pin连接器HF27004E-M2,与风扇对插连接,专门用于主板处理器端风冷散热。
其中,主处理器002和从处理器003具体为Ampere处理器,开机按键001可以选用板载轻触开关,与CPLD 008直接连接;BMC 007主要负责服务器板卡管理,可采用ASPEEDAST2500;CPLD 008选用LATTIC公司CPLD 008芯片LCMXO2-7000HC-4FG484C,主要负责Ampere平台服务器温控系统智能调控。第一风扇供电监控芯片011和第二风扇供电监控芯片012分别为第一散热系统005和第二散热系统006供电、并提供电流监控和热插拔保护,风扇供电监控芯片均可采用具有电流监控能力的热插拔保护芯片MP50022CGQV-Z。EEPROM004可以选用型号为AT24C002的EEPROM存储器,存储容量为2Kbits,AT24C002支持I2C总线数据传送协议I2C(Inter-Integrated Circuit,集成电路总线),CPLD 008可通过I2C总线读写EEPROM 004中存储的数据。
第一温度传感器 009用于温度采集,通过SMBus总线与BMC 007连接,BMC 007通过SMBus总线可以直接读写第一温度传感器 009的温度数据,本实施例中的第一温度传感器009具体为多个点位的温度传感器检测点集合,可监测主板进风口、CPU出风口、M.2存储硬盘温度、PSU进风口温度、OCP卡进风口温度、10G网卡控制器温度及系统出风口温度,第一温度传感器009可以采用TI公司温度传感器TMP112AIDRLR,TMP112AIDRLR是数字温度传感器,专为需要高精度的高精度低功耗NTC/PTC热敏电阻替代产品而设计,不校准时–40℃至+125℃温度范围内精度为1.0℃。第二温度传感器010作为第一温度传感器009的冗余监控传感器,与第一温度传感器009紧靠安装在同一测温点,第二温度传感器010同CPLD 008通过SMBus总线直接相连,CPLD 008通过SMBus总线可读取第二温度传感器010的温度数据。
在上述实施例的基础上,对本申请所提供的一种服务器散热方法进行详细说明。
请参照图2,图2为本申请所提供的一种服务器散热方法的步骤流程图,应用于CPLD,该服务器散热方法包括:
S101:监测BMC的状态;
具体的,CPLD对BMC的状态进行监测,可分为BMC启动前的监测和BMC启动后的监测,状态包括正常状态和异常状态。相应的,在BMC启动前,BMC的状态包括启动正常状态和启动异常状态,在BMC启动后,BMC的状态包括工作正常状态和工作异常状态。具体的,CPLD可以根据BMC在不同阶段发送的信号,判定BMC的状态。
S102:当状态为正常状态,根据BMC发送的风扇控制信号控制散热系统运行;
本步骤中的正常状态包括启动正常状态或工作正常状态,CPLD在监测到BMC正常启动后,将散热系统的管控权交给BMC,由BMC根据处理器状态和/或第一传感器采集的温度数据生成对应的风扇控制信号,CPLD接收到BMC发送的风扇控制信号后,将该风扇控制信号转发给散热系统,以控制散热系统中的风扇按对应的转速运行,CPLD自身不生成风扇控制信号。
S103:当状态为异常状态,获取服务器的温度数据和/或处理器状态,根据温度数据和/或处理器状态控制散热系统运行。
本步骤中的异常状态包括启动异常状态或工作状态状态,当BMC未正常启动或正常启动后未正常工作时,由CPLD接管散热系统的管控权,CPLD根据获取到的第二传感器采集的温度数据以及获取到的处理器状态,生成对应的风扇控制信号并发送给散热系统,以便散热系统中的风扇根据对应的转速运行。具体的,风扇控制信号具体为PWM信号。
具体的,本步骤中对主处理器的FAULT_ALERT、OVER_TEMP_n、HIGH_TEMP_n、FW_BOOT_OK、SPI_AUTH_FAIL_n等状态信号进行监控,根据上述状态信号可确定主处理器处于何种处理器状态,其中,FAULT_ALERT对应主处理器的告警状态信号,OVER_TEMP_n对应主处理器超过极限温度的状态信号、HIGH_TEMP_n对应主处理器的高温状态信号,FW_BOOT_OK:该信号低电平0代表SMpro启动失败或SCP启动失败;1代表其正常启动,SPI_AUTH_FAIL_n该信号低电平0代表BIOS启动失败;1代表BIOS启动成功;获取到处理器状态后,参照表1所示的散热策略对主处理器对应的散热系统进行调控。
表1主处理器状态监测风扇占空比调速表
Figure BDA0002954912820000061
其中,1为高电平,0为低电平,x为任意值。
具体的,当FAULT_ALERT状态信号为1时,不管其他状态信号,CPLD生成占空比100%的风扇控制信号发送至主处理器对应的散热系统;当FAULT_ALERT状态信号为0,且OVER_TEMP_n状态信号为0,CPLD生成占空比100%的风扇控制信号发送至主处理器对应的散热系统;当FAULT_ALERT状态信号为0、OVER_TEMP_n状态信号为1,且HIGH_TEMP_n状态信号为0,CPLD生成占空比80%的风扇控制信号发送至主处理器对应的散热系统;当FAULT_ALERT状态信号为0、OVER_TEMP_n状态信号为1、HIGH_TEMP_n状态信号为1、FW_BOOT_OK状态信号为0、SPI_AUTH_FAIL_n状态信号为1时,CPLD生成占空比40%的风扇控制信号发送至主处理器对应的散热系统;当FAULT_ALERT状态信号为0、OVER_TEMP_n状态信号为1、HIGH_TEMP_n状态信号为1、FW_BOOT_OK状态信号为1、SPI_AUTH_FAIL_n状态信号为1时,CPLD生成占空比20%的风扇控制信号发送至主处理器对应的散热系统。
具体的,本步骤中对从处理器的FAULT_ALERT、OVER_TEMP_n、HIGH_TEMP_n、CPU1_SLAVE_PRESENT_N等状态信号进行监控,根据上述状态信号可确定从处理器处于何种处理器状态,其中,FAULT_ALERT对应从处理器的告警状态信号,OVER_TEMP_n对应从处理器超过极限温度的状态信号、HIGH_TEMP_n对应从处理器的高温状态信号,CPU1_SLAVE_PRESENT_N代表CPU1是否存在。获取到从处理器的处理器状态后,参照表2所示的散热策略对从处理器对应的散热系统进行调控。
表2从处理器状态监测风扇占空比调速表
Figure BDA0002954912820000071
具体的,当FAULT_ALERT状态信号为1、CPU1_SLAVE_PRESENT_N状态信号为0时,CPLD生成占空比100%的风扇控制信号发送至从处理器对应的散热系统;当FAULT_ALERT状态信号为0、OVER_TEMP_n状态信号为0、CPU1_SLAVE_PRESENT_N状态信号为0时,CPLD生成占空比100%的风扇控制信号发送至从处理器对应的散热系统;当FAULT_ALERT状态信号为0、OVER_TEMP_n状态信号为1、HIGH_TEMP_n状态信号为0、CPU1_SLAVE_PRESENT_N状态信号为0时,CPLD生成占空比80%的风扇控制信号发送至从处理器对应的散热系统;当FAULT_ALERT状态信号为0、OVER_TEMP_n状态信号为1、HIGH_TEMP_n状态信号为1、CPU1_SLAVE_PRESENT_N状态信号为0时,CPLD生成占空比20%的风扇控制信号发送至从处理器对应的散热系统;当FAULT_ALERT状态信号为0、OVER_TEMP_n状态信号为1、HIGH_TEMP_n状态信号为1、CPU1_SLAVE_PRESENT_N状态信号为1时,CPLD生成占空比20%的风扇控制信号发送至从处理器对应的散热系统。
可以理解的是,上述散热策略可预先存储在EEPROM中。
可见,本实施例中,当BMC处于正常状态时,由BMC完成对服务器散热系统的管控,当BMC处于异常状态时,散热系统在CPLD的控制下正常工作,从而提高服务器的运行安全性。CPLD在对散热系统进行管控时,既考虑服务器的温度数据又考虑处理器状态,提高了散热管控的可靠性和全面性,相较于现有技术中采用强制风扇全速运转的方式,本申请可以减少噪音和服务器的供电能耗。
在上述实施例的基础上:
作为一种优选的实施例,监测BMC的状态的过程包括:
当接收到服务器的开机信号,判断BMC是否在第一预设时间段内启动完成;
若是,判定状态为正常状态;
若否,判定状态为异常状态中的启动异常状态。
具体的,当服务器接电,用户可通过开机按键触发开机信号,CPLD接收到该开机信号后,对BMC的启动过程进行监控,判断接收到开机信号后的第一预设时间段内,BMC是否启动完成,若在第一时间段内接收到BMC反馈的信号,则说明BMC正常启动,此时判定BMC的状态为正常状态,CPLD将散热系统的管控权交给BMC,否则判定BMC为启动异常状态,由CPLD对散热系统进行管控。可以理解的是,在接收到开机信号到BMC正常启动之前,都可以当作BMC的启动异常状态,由CPLD对散热系统进行管控。
作为一种优选的实施例,监测BMC的状态的过程包括:
每隔预设周期判断是否接收到BMC的心跳信号;
若是,判定状态为正常状态;
若否,判定状态为异常状态中的工作异常状态。
具体的,当BMC正常启动后,对BMC的工作状态进行监测。BMC正常工作时,会每隔预设周期向CPLD发送一个心跳信号,若CPLD未在预设周期内接收到BMC发送的心跳信号,则判定BMC处于工作异常状态,此时由CPLD根据其自身获取到的温度数据和/或处理器状态对散热系统进行管控。
作为一种优选的实施例,根据处理器状态控制散热系统运行的过程包括:
当处理器状态为上电异常状态,控制散热系统按预设最低转速运行。
具体的,CPLD会监控主处理器和从处理器的上电信号,上电信号包括但不限于SOC0_PWRGOOD_X7、PCP0_PWRGOOD_X8、SOC1_PWRGOOD_X9、PCP1_PWRGOOD_X10等信号,其中,SOC0_PWRGOOD_X7、PCP0_PWRGOOD_X8影响主处理器的风扇调控,SOC1_PWRGOOD_X9、PCP1_PWRGOOD_X10影响从处理器的风扇调控。
具体的,SOC0_PWRGOOD_X7包括PWRGD_CPU0_PVPP_DDRABCD、PWRGD_CPU0_PVPP_DDREFGH、PWRGD_CPU0_PVTT_DDRABCD、PWRGD_CPU0_PVTT_DDREFGH、PWRGD_CPU0_VDDH_RCA、PWRGD_CPU0_VDDH_RCB、PWRGD_CPU0_VDD33_SOC等信号,这些信号是CPU0_SOC供电的POWERGOOD信号,高电平有效,可认为CPU0_SOC电供电输出正常,低电平输出,认为没有完成上电。CPLD将以上7种POWER GOOD信号进行逻辑与信号输出给主处理器,作为主处理器的PWRGD_CPU0_SOC信号,同时CPLD监测到PWRGD_CPU0_SOC信号为低电平时,考虑到主处理器没有上电完全,释放的热量比完全上电时小,因此,可控制对应的散热系统按预设最低转速运行,如生成20%占空比的风扇控制信号发送至主处理器对应的散热系统,从而节约散热系统的能耗。
具体的,SOC1_PWRGOOD_X9同SOC0_PWRGOOD_X7,包括PWRGD_CPU1_PVPP_DDRABCD、PWRGD_CPU1_PVPP_DDREFGH、PWRGD_CPU1_PVTT_DDRABCD、PWRGD_CPU1_PVTT_DDREFGH、PWRGD_CPU1_VDDH_RCA、PWRGD_CPU1_VDDH_RCB、PWRGD_CPU1_VDD33_SOC等信号,这些信号是CPU1_SOC供电的POWER GOOD信号,高电平有效,认为CPU1_SOC电供电输出正常,低电平输出,认为没有完成上电。CPLD将以上7种POWER GOOD信号进行逻辑与信号输出给从处理器,作为从处理器的PWRGD_CPU0_SOC信号,同时CPL监测到PWRGD_CPU0_SOC信号为低电平时,考虑到从处理器没有上电完全,释放的热量比完全上电时小,因此,可控制对应的散热系统按预设最低转速运行,将如生成20%占空比的风扇控制信号发送至主处理器对应的散热系统,从而节约散热系统的能耗。
具体的,PCP0_PWRGOOD_X8为CPU0_VDD1V8_PCP供电的POWER GOOD信号,这个信号是CPU0_PCP供电的POWER GOOD信号,高电平有效,认为供电输出正常,低电平输出,认为没有完成上电。CPLD监测PCP0_PWRGOOD_X8信号状态,作为主处理器的PWRGD_CPU0_PCP信号,同时CPLD监测到PWRGD_CPU0_PCP信号为低电平,将固定输出20%占空比的风扇控制信号给到主处理器对应的散热系统,高电平将输出30%占空比的风扇控制信号给到主处理器对应的散热系统,从而节约散热系统的能耗。
作为一种优选的实施例,该服务器散热方法还包括:
当BMC在第一预设时间段内启动完成,将温度数据发送至BMC,以便BMC在判定温度数据异常时告警。
具体的,CPLD将从第二温度传感器处获取到的温度数据,发送给BMC,BMC比较从第一温度传感器处获取到的温度数据及CPLD发送的温度数据的大小,由于第一温度传感器和第二温度传感器在每个检测点相邻设置,因此,采集到的温度数据应相同或仅存在微小差异,若二者差值大于一定值,如2℃,那么说明可能有温度传感器存在异常,有某一温度传感器采集到的温度数据不准确,影响后续的散热管控,在此条件下判定温度数据异常告警,便于工作人员检查和维护。
作为一种优选的实施例,当服务器包括主处理器和从处理器时,该服务器散热方法还包括:
控制主处理器的散热系统上电完成后,间隔第二预设时间段,控制从处理器的散热系统上电。
具体的,本实施例中,对主从处理器各自对应的散热系统错峰上电,从根本上避免了风扇同时供电、启动导致过大瞬时电流,提高安全性。
作为一种优选的实施例,该服务器散热方法还包括:
当接收到服务器的关机信号,先控制散热系统按预设最低转速运行第三预设时间段后,再控制散热系统停止运行。
具体的,当CPLD检测到开机按键发出关机信号,CPLD将延时第三预设时间段后,在发送风扇停转信号,控制散热系统停止运行。在接收到关机信号后的第三预设时间段内,控制散热系统按预设最低转速运行,如输出20%占空比的风扇控制信号到各个散热系统,以对服务器进行最后的散热,进一步提高安全性和可靠性。其中,第三预设时间可以设置为60s。
综上所述,本申请为Ampere平台服务器提供了主、从处理器状态监控机制的温度调控策略。主、从处理器的风扇错峰上电控制,同时监测BMC运行状态,并提供BMC开机尚未启动和超时故障情况时,CPLD的备选风扇控制方案,提高Ampere平台服务器风冷散热系统长时间工作的稳定性和安全性。
请参照图3,图3为本申请所提供的一种服务器散热装置的结构示意图,应用于CPLD,该服务器散热装置包括:
监测模块101,用于监测BMC的状态,当状态为正常状态生成第一触发信号,当状态为异常状态生成第二触发信号;
第一控制模块102,用于当接收到第一触发信号,根据BMC发送的风扇控制信号控制散热系统运行;
第二控制模块103,用于当接收到第二触发信号,获取服务器的温度数据和/或处理器状态,根据温度数据和/或处理器状态控制散热系统运行。
可见,本实施例中,当BMC处于正常状态时,由BMC完成对服务器散热系统的管控,当BMC处于异常状态时,散热系统在CPLD的控制下正常工作,从而提高服务器的运行安全性。CPLD在对散热系统进行管控时,既考虑服务器的温度数据又考虑处理器状态,提高了散热管控的可靠性和全面性,相较于现有技术中采用强制风扇全速运转的方式,本申请可以减少噪音和服务器的供电能耗。
作为一种优选的实施例,监测BMC的状态的过程包括:
当接收到服务器的开机信号,判断BMC是否在第一预设时间段内启动完成;
若是,判定状态为正常状态;
若否,判定状态为异常状态中的启动异常状态。
作为一种优选的实施例,监测BMC的状态的过程包括:
每隔预设周期判断是否接收到BMC的心跳信号;
若是,判定状态为正常状态;
若否,判定状态为异常状态中的工作异常状态。
作为一种优选的实施例,根据处理器状态控制散热系统运行的过程包括:
当处理器状态为上电异常状态,控制散热系统按预设最低转速运行。
作为一种优选的实施例,该服务器散热装置还包括:
告警模块,用于当BMC在第一预设时间段内启动完成,将温度数据发送至BMC,以便BMC在判定温度数据异常时告警。
作为一种优选的实施例,当服务器包括主处理器和从处理器时,该服务器散热装置还包括:
上电控制模块,用于控制主处理器的散热系统上电完成后,间隔第二预设时间段,控制从处理器的散热系统上电。作为一种优选的实施例,该服务器散热装置还包括:
关机控制模块,用于当接收到服务器的关机信号,先控制散热系统按预设最低转速运行第三预设时间段后,再控制散热系统停止运行。
另一方面,本申请还提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上文任意一个实施例所描述的服务器散热方法的步骤。
对于本申请所提供的一种电子设备的介绍请参照上述实施例,本申请在此不再赘述。
本申请所提供的一种电子设备具有和上述服务器散热方法相同的有益效果。
另一方面,本申请还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上文任意一个实施例所描述的服务器散热方法的步骤。
对于本申请所提供的一种计算机可读存储介质的介绍请参照上述实施例,本申请在此不再赘述。
本申请所提供的一种计算机可读存储介质具有和上述服务器散热方法相同的有益效果。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其他实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种服务器散热方法,其特征在于,应用于CPLD,该服务器散热方法包括:
监测BMC的状态;
当所述状态为正常状态,根据所述BMC发送的风扇控制信号控制散热系统运行;
当所述状态为异常状态,获取所述服务器的温度数据和/或处理器状态,根据所述温度数据和/或所述处理器状态控制所述散热系统运行。
2.根据权利要求1所述的服务器散热方法,其特征在于,所述监测BMC的状态的过程包括:
当接收到所述服务器的开机信号,判断所述BMC是否在第一预设时间段内启动完成;
若是,判定所述状态为所述正常状态;
若否,判定所述状态为所述异常状态中的启动异常状态。
3.根据权利要求1所述的服务器散热方法,其特征在于,所述监测BMC的状态的过程包括:
每隔预设周期判断是否接收到所述BMC的心跳信号;
若是,判定所述状态为所述正常状态;
若否,判定所述状态为所述异常状态中的工作异常状态。
4.根据权利要求1所述的服务器散热方法,其特征在于,根据所述处理器状态控制所述散热系统运行的过程包括:
当所述处理器状态为上电异常状态,控制所述散热系统按预设最低转速运行。
5.根据权利要求2所述的服务器散热方法,其特征在于,该服务器散热方法还包括:
当所述BMC在所述第一预设时间段内启动完成,将所述温度数据发送至所述BMC,以便所述BMC在判定所述温度数据异常时告警。
6.根据权利要求1所述的服务器散热方法,其特征在于,当所述服务器包括主处理器和从处理器时,该服务器散热方法还包括:
控制所述主处理器的散热系统上电完成后,间隔第二预设时间段,控制所述从处理器的散热系统上电。
7.根据权利要求1-6任意一项所述的服务器散热方法,其特征在于,该服务器散热方法还包括:
当接收到所述服务器的关机信号,先控制所述散热系统按预设最低转速运行第三预设时间段后,再控制所述散热系统停止运行。
8.一种服务器散热装置,其特征在于,应用于CPLD,该服务器散热装置包括:
监测模块,用于监测BMC的状态,当所述状态为正常状态生成第一触发信号,当所述状态为异常状态生成第二触发信号;
第一控制模块,用于当接收到所述第一触发信号,根据所述BMC发送的风扇控制信号控制散热系统运行;
第二控制模块,用于当接收到所述第二触发信号,获取所述服务器的温度数据和/或处理器状态,根据所述温度数据和/或所述处理器状态控制所述散热系统运行。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1-7任意一项所述的服务器散热方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任意一项所述的服务器散热方法的步骤。
CN202110218540.7A 2021-02-26 2021-02-26 一种服务器散热方法、装置及相关组件 Pending CN112948185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110218540.7A CN112948185A (zh) 2021-02-26 2021-02-26 一种服务器散热方法、装置及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110218540.7A CN112948185A (zh) 2021-02-26 2021-02-26 一种服务器散热方法、装置及相关组件

Publications (1)

Publication Number Publication Date
CN112948185A true CN112948185A (zh) 2021-06-11

Family

ID=76246516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110218540.7A Pending CN112948185A (zh) 2021-02-26 2021-02-26 一种服务器散热方法、装置及相关组件

Country Status (1)

Country Link
CN (1) CN112948185A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342148A (zh) * 2021-06-30 2021-09-03 深圳市信锐网科技术有限公司 一种板卡过热保护方法、系统、业务卡、主控卡及介质
CN113655829A (zh) * 2021-08-23 2021-11-16 浪潮商用机器有限公司 一种温度调控系统和服务器
CN113719461A (zh) * 2021-08-30 2021-11-30 苏州浪潮智能科技有限公司 一种风扇控制方法、系统及相关组件
CN113849056A (zh) * 2021-09-22 2021-12-28 新华三技术有限公司 一种风扇控制方法及服务器
CN113966153A (zh) * 2021-10-29 2022-01-21 苏州浪潮智能科技有限公司 一种交换机散热控制系统及控制方法
CN114564350A (zh) * 2022-01-29 2022-05-31 苏州浪潮智能科技有限公司 一种cpu安装状态的监测装置及其监测方法
CN114816022A (zh) * 2022-04-28 2022-07-29 苏州浪潮智能科技有限公司 一种服务器电源异常监控方法、系统及存储介质
CN115047954A (zh) * 2022-04-30 2022-09-13 苏州浪潮智能科技有限公司 一种设备散热控制方法、系统、装置、设备及存储介质
CN115391152A (zh) * 2022-10-27 2022-11-25 浙江数思信息技术有限公司 一种基于物联网的服务器状态监测方法与装置
CN116483180A (zh) * 2023-03-10 2023-07-25 苏州振畅智能科技有限公司 一种主动散热装置的智能控制方法、系统、设备及介质
US11762791B1 (en) 2022-04-24 2023-09-19 Fulian Precision Electronics (Tianjin) Co., Ltd. System, method, and non-transitory computer readable medium for detecting baseboard management controller

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140142764A1 (en) * 2012-11-20 2014-05-22 Inventec Corporation Fan rotational speed control system and method for controlling rotational speed of fan
WO2016169222A1 (zh) * 2015-04-24 2016-10-27 北京百度网讯科技有限公司 整机柜服务器风扇的控制方法和装置
CN206159091U (zh) * 2016-11-09 2017-05-10 郑州云海信息技术有限公司 一种风扇控制系统
CN107015810A (zh) * 2017-04-14 2017-08-04 广东浪潮大数据研究有限公司 一种控制系统风扇实现服务器静音启动的方法及系统
CN108170575A (zh) * 2017-12-25 2018-06-15 曙光信息产业(北京)有限公司 一种服务器散热的控制方法及装置
CN109826822A (zh) * 2019-04-11 2019-05-31 苏州浪潮智能科技有限公司 一种风扇控制方法及相关装置
CN111176921A (zh) * 2020-01-02 2020-05-19 英业达科技有限公司 辅助测试主板的方法及主板

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140142764A1 (en) * 2012-11-20 2014-05-22 Inventec Corporation Fan rotational speed control system and method for controlling rotational speed of fan
WO2016169222A1 (zh) * 2015-04-24 2016-10-27 北京百度网讯科技有限公司 整机柜服务器风扇的控制方法和装置
CN206159091U (zh) * 2016-11-09 2017-05-10 郑州云海信息技术有限公司 一种风扇控制系统
CN107015810A (zh) * 2017-04-14 2017-08-04 广东浪潮大数据研究有限公司 一种控制系统风扇实现服务器静音启动的方法及系统
CN108170575A (zh) * 2017-12-25 2018-06-15 曙光信息产业(北京)有限公司 一种服务器散热的控制方法及装置
CN109826822A (zh) * 2019-04-11 2019-05-31 苏州浪潮智能科技有限公司 一种风扇控制方法及相关装置
CN111176921A (zh) * 2020-01-02 2020-05-19 英业达科技有限公司 辅助测试主板的方法及主板

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342148A (zh) * 2021-06-30 2021-09-03 深圳市信锐网科技术有限公司 一种板卡过热保护方法、系统、业务卡、主控卡及介质
CN113655829A (zh) * 2021-08-23 2021-11-16 浪潮商用机器有限公司 一种温度调控系统和服务器
CN113719461A (zh) * 2021-08-30 2021-11-30 苏州浪潮智能科技有限公司 一种风扇控制方法、系统及相关组件
CN113849056A (zh) * 2021-09-22 2021-12-28 新华三技术有限公司 一种风扇控制方法及服务器
CN113849056B (zh) * 2021-09-22 2024-03-22 新华三技术有限公司 一种风扇控制方法及服务器
CN113966153A (zh) * 2021-10-29 2022-01-21 苏州浪潮智能科技有限公司 一种交换机散热控制系统及控制方法
CN113966153B (zh) * 2021-10-29 2022-11-29 苏州浪潮智能科技有限公司 一种交换机散热控制系统及控制方法
CN114564350A (zh) * 2022-01-29 2022-05-31 苏州浪潮智能科技有限公司 一种cpu安装状态的监测装置及其监测方法
CN114564350B (zh) * 2022-01-29 2024-06-28 苏州浪潮智能科技有限公司 一种cpu安装状态的监测装置及其监测方法
TWI827031B (zh) * 2022-04-24 2023-12-21 新加坡商鴻運科股份有限公司 基板管理控制器檢測系統及方法
US11762791B1 (en) 2022-04-24 2023-09-19 Fulian Precision Electronics (Tianjin) Co., Ltd. System, method, and non-transitory computer readable medium for detecting baseboard management controller
CN114816022B (zh) * 2022-04-28 2023-08-04 苏州浪潮智能科技有限公司 一种服务器电源异常监控方法、系统及存储介质
CN114816022A (zh) * 2022-04-28 2022-07-29 苏州浪潮智能科技有限公司 一种服务器电源异常监控方法、系统及存储介质
CN115047954B (zh) * 2022-04-30 2023-06-20 苏州浪潮智能科技有限公司 一种设备散热控制方法、系统、装置、设备及存储介质
CN115047954A (zh) * 2022-04-30 2022-09-13 苏州浪潮智能科技有限公司 一种设备散热控制方法、系统、装置、设备及存储介质
CN115391152A (zh) * 2022-10-27 2022-11-25 浙江数思信息技术有限公司 一种基于物联网的服务器状态监测方法与装置
CN116483180A (zh) * 2023-03-10 2023-07-25 苏州振畅智能科技有限公司 一种主动散热装置的智能控制方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
CN112948185A (zh) 一种服务器散热方法、装置及相关组件
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
CN106371540B (zh) 系统电源管理方法、芯片及电子设备
US10856438B2 (en) Fan control circuit and fan control system
US10394293B2 (en) Method for preventing over-heating of a device within a data processing system
US9170618B2 (en) Power management circuit, server, and power management method thereof
WO2017136986A1 (zh) 一种电源管理方法以及系统
CN111722686B (zh) 一种跨节点的带内散热控制方法和装置
CN100378617C (zh) 网络唤醒装置与方法
CN114166266B (zh) 一种检测cpu散热器螺丝是否漏拧的方法和装置
CN104660440A (zh) 一种刀片服务器管理系统及其控制方法
CN113204466A (zh) 一种过温保护方法和电子设备
CN113835508A (zh) 一种服务器的功耗管理方法、装置、bmc及存储介质
CN117590917B (zh) 温度控制组件
US20050086460A1 (en) Apparatus and method for wakeup on LAN
CN102566726A (zh) 自动控制功耗的网络设备及其功耗控制方法
CN111190468B (zh) 一种ocp网卡散热装置及方法
CN113359967B (zh) 一种设备启动方法和装置
CN113451990A (zh) 一种增强过流保护可靠性的系统、方法及服务器
CN102023694A (zh) 电源管理装置、电子设备和电源管理方法
CN108279761B (zh) 一种支持风扇热插拔的服务器电源电路及控制方法
EP3594779A1 (en) Method for controlling fan in electronic system
TWI719461B (zh) 伺服器電源管理方法及系統
CN114564093A (zh) 一种设备散热方法、装置、电子设备及存储介质
CN113721747B (zh) 一种服务器及其防烧板电路和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210611