CN115720433A - 散热装置、散热控制方法、电子设备、存储介质及产品 - Google Patents

散热装置、散热控制方法、电子设备、存储介质及产品 Download PDF

Info

Publication number
CN115720433A
CN115720433A CN202211478031.9A CN202211478031A CN115720433A CN 115720433 A CN115720433 A CN 115720433A CN 202211478031 A CN202211478031 A CN 202211478031A CN 115720433 A CN115720433 A CN 115720433A
Authority
CN
China
Prior art keywords
liquid
cooling
flow rate
temperature
heat dissipation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211478031.9A
Other languages
English (en)
Inventor
李倩倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211478031.9A priority Critical patent/CN115720433A/zh
Publication of CN115720433A publication Critical patent/CN115720433A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本发明提供的散热装置、散热控制方法、电子设备、存储介质及产品,属于计算机技术领域,包括:基板管理控制器、至少一个液冷板和流速控制设备;所述基板管理控制器,用于向所述流速控制设备发送控制信号,所述控制信号是根据目标服务器的运行状态信息生成的;所述流速控制设备,用于根据所述控制信号,对所述液冷板中的冷却液进行流速控制;所述至少一个液冷板,用于对所述目标服务器进行热交换。本发明提供的散热装置、散热控制方法、电子设备、存储介质及产品,根据服务器的运行状态对应调节冷却液的流速,从而实现对散热器的快速降温,提高了散热能力,满足了不同运行状态下服务器的散热需求。

Description

散热装置、散热控制方法、电子设备、存储介质及产品
技术领域
本发明涉及计算机技术领域,尤其涉及散热装置、散热控制方法、电子设备、存储介质及产品。
背景技术
在服务器行业,随着人工智能的高度发展,人工智能(Artificial Intelligence,AI)服务器、多节点服务器横空出世,更强的计算能力,更紧凑的结构设计对服务器散热水平提出了更高的要求。
传统的服务器散热或是通过风扇,或是通过液冷与风扇的组合,实现对服务器的降温。
然而上述方案散热效率低下,无法满足现在的服务器散热需求。
发明内容
本发明提供的散热装置、散热控制方法、电子设备、存储介质及产品,用以解决现有技术中散热效率低下,无法满足现在的服务器散热需求的缺陷,实现提高了散热能力,满足了不同运行状态下服务器的散热需求。
本发明提供一种散热装置,包括:基板管理控制器、至少一个液冷板和流速控制设备;
所述基板管理控制器,用于向所述流速控制设备发送控制信号,所述控制信号是根据目标服务器的运行状态信息生成的;
所述流速控制设备,用于根据所述控制信号,对所述液冷板中的冷却液进行流速控制;
所述至少一个液冷板,用于对所述目标服务器进行热交换。
根据本发明提供的一种散热装置,所述基板管理控制器与所述目标服务器通信连接,用于按照预设频率接收所述运行状态信息;所述运行状态信息,包括所述目标服务器的服务器功耗和所述目标服务器中各个器件的器件温度;
所述基板管理控制器,具体用于:
在所述服务器功耗大于第一功耗阈值,且任一器件温度大于第一温度阈值的情况下,生成所述控制信号,所述控制信号用于控制所述流速控制设备调高所述液冷板中冷却液的流速;
在所述服务器功耗小于第二功耗阈值,且所有的器件温度均大于第二温度阈值的情况下,生成所述控制信号,所述控制信号用于控制所述流速控制设备调低所述液冷板中冷却液的流速;
所述第一功耗阈值大于所述第二功耗阈值,所述第一温度阈值大于所述第二温度阈值。
根据本发明提供的一种散热装置,所述流速控制设备包括第一流速控制器和第二流速控制器;
所述第一流速控制器,用于根据所述控制信号,对各液冷板进水口处冷却液的流速进行控制;
所述第二流速控制器,用于根据所述控制信号,对各液冷板出水口处冷却液的流速进行控制。
根据本发明提供的一种散热装置,所述装置还包括:第一流速传感器与第二流速传感器;
所述第一流速传感器设置于各液冷板进水口处,用于对各液冷板进水口处的冷却液进行流速监测,并将冷却液的流入速度发送至所述基板管理控制器;
所述第二流速传感器设置于各液冷板出水口处,用于对各液冷板出水口处的冷却液进行流速监测,并将冷却液的流出速度发送至所述基板管理控制器;
所述基板管理控制器,还用于在流入速度与流出速度之间的差异度大于流速阈值的情况下,生成报警信号和/或关机信号,所述关机信号用于控制所述目标服务器关机;所述报警信号用于提示漏液等级信息,所述漏液等级信息是根据所述流入速度和流出速度之间的差异度确定的。
根据本发明提供的一种散热装置,所述装置还包括:冷却装置;
所述冷却装置,用于接收所述液冷板的出水口的冷却液,并对冷却液进行冷却处理,将冷却处理之后的冷却液提供至所述液冷板的进水口。
根据本发明提供的一种散热装置,所述冷却装置内置有制冷设备和通信模块;
所述制冷设备,用于对所述冷却装置内的冷却液进行冷却处理;
所述通信模块,用于接收所述基板管理控制器的功率调节信号,所述功率调节信号用于调节所述制冷设备的运行功率。
根据本发明提供的一种散热装置,所述装置还包括:温度传感器,所述温度传感器与所述基板管理控制器通信连接;
设置于所述进水口处的温度传感器,用于对进水口的冷却液进行温度监测,获取流入液体温度;设置于所述出水口处的温度传感器,用于对出水口的冷却液进行温度监测,获取流出液体温度;
所述通信模块,用于:
将所述流入液体温度和所述流出液体温度发送至所述基板管理控制器;
接收所述基板管理控制器发送的功率调节信号,所述功率调节信号用于对所述制冷设备进行功率调节;所述功率调节信号是根据所述流入液体温度和所述流出液体温度生成的。
根据本发明提供的一种散热装置,在所述流入液体温度大于第三温度阈值,或所述流出液体温度大于第四温度阈值的情况下,所述功率调节信号用于增大所述制冷设备的运行功率;
在所述流入液体温度不大于第三温度阈值,且所述流出液体温度不大于第四温度阈值的情况下,所述功率调节信号用于降低所述制冷设备的运行功率。
本发明还提供一种散热控制方法,所述方法包括:
接收目标服务器的运行状态信息;
根据所述运行状态信息,生成控制信号;
将所述控制信号发送至流速控制设备,所述控制信号用于指示所述流速控制设备对液冷板的进水口和出水口的冷却液的流速进行控制。
根据本发明提供的一种散热控制方法,还包括:
接收所述进水口处的流入液体温度,以及所述出水口处的流出液体温度;
根据所述流入液体温度和所述流出液体温度,生成功率调节信号;
将所述功率调节信号发送至冷却装置的通信模块,所述功率调节信号用于调节所述冷却装置中制冷设备的运行功率;所述冷却装置,用于接收所述出水口的冷却液,并对冷却液进行冷却处理,将冷却处理之后的冷却液提供至进水口;
在所述流入液体温度大于第三温度阈值,或所述流出液体温度大于第四温度阈值的情况下,所述功率调节信号用于增大所述制冷设备的运行功率;
在所述流入液体温度不大于第三温度阈值,且所述流出液体温度不大于第四温度阈值的情况下,所述功率调节信号用于降低所述制冷设备的运行功率。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述散热控制方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述散热控制方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述散热控制方法。
本发明提供的散热装置、散热控制方法、电子设备、存储介质及产品,根据服务器的运行状态对应调节冷却液的流速,从而实现对散热器的快速降温,提高了散热能力,满足了不同运行状态下服务器的散热需求。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的散热装置的结构示意图之一;
图2是本发明提供的散热装置的结构示意图之二;
图3是本发明提供的散热装置的结构示意图之三;
图4是本发明提供的散热控制方法的流程示意图;
图5是本发明提供的漏液检测方法的流程示意图;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着大数据、深度计算、云计算等课题的不断深入发展,电子设备的功耗不断提高。日益攀升的设备集成度和功耗,对散热能力提出了新挑战,电子设备的散热水平已经成为制约行业发展的重要因素。
对于服务器,现有单纯依靠风扇进行散热的方案,BMC会自动检测中央处理器(Central Processing Unit,CPU)和图形处理器(Graphics Processing Unit,GPU)等器件的温度,当温度较高时,BMC会自动拉高风扇转速,提高系统的散热能力。虽然单纯依靠风扇进行散热能够节约成本,但是对于一些高功耗的服务器系统,风扇功耗大到一定程度时,即使所有风扇满转,也无法满足服务器系统的散热需求,具有很大的局限性。
此外,还有液冷和风扇双管齐下的方案,液冷水管有进水口和出水口,液体从进水口进入液冷水管,流经服务器系统中功耗较大的器件附件的液冷水管,带走热量,最终从出水口流出。经过冷却装置,重新流入进水口,形成一个冷热水交换的循环系统。同时,仍然有风扇进行散热,BMC会根据服务器系统的温度智能调节风扇转速。这种散热方案的漏液检测,一般将漏水检测绳缠绕在液冷水管上,一旦漏水,检测绳会浸湿短路,触发对服务器系统的保护措施。
虽然液冷和风扇双管齐下的方案,相较于单纯依靠风扇散热在散热能力方面有很大的提高,然而只能通过调节风扇转速来改变系统的散热能力,而液冷的冷热交换是固定的,无法改变,灵活性较差;且漏液检测需要在整个水管上均缠上绳子,可操作性差,容易松动,工作寿命短。
下面结合图1至图6描述本发明的实施例所提供的散热装置、散热控制方法、电子设备、存储介质及产品。
图1是本发明提供的散热装置的结构示意图之一,如图1所示,包括但不限于:基板管理控制器、至少一个液冷板和流速控制设备;
所述基板管理控制器,用于向所述流速控制设备发送控制信号,所述控制信号是根据目标服务器的运行状态信息生成的;
所述流速控制设备,用于根据所述控制信号,对所述液冷板中的冷却液进行流速控制;
所述至少一个液冷板,用于对所述目标服务器进行热交换。
液冷板可以为携带有管网的固定板,管网中流动有冷却液,所有的液冷板可以共用进水口和出水口。
各个液冷板可以分别设于目标服务器的CPU和GPU等功耗较大且产热量大的器件附近,实现对于目标服务器的散热降温。
冷却液从进水口流入,在管网中与目标服务器进行热交换,带走目标服务器产生的热量,再从出水口中流出。从出水口流出的冷却液可以经过降温处理后,再从进水口流入,或是向进水口持续提供低温的冷却液。
流速控制设备可以设于液冷板的进水口、出水口或是液冷板中的管网的任意位置。
可选地,所述流速控制设备包括第一流速控制器和第二流速控制器;
所述第一流速控制器,用于根据所述控制信号,对各液冷板进水口处冷却液的流速进行控制;
所述第二流速控制器,用于根据所述控制信号,对各液冷板出水口处冷却液的流速进行控制。
流速控制设备可以包括至少两个流速控制器,装设于进水口处的第一流速控制器,用于控制液冷板的进水口处冷却液的流速;装设于出水口处的第二流速控制器,用于控制液冷板的出水口处冷却液的流速。
流速控制器可以是水泵,通过调节水泵电机的转速,从而实现对冷却液流速的调整。
第一流速控制器与第二流速控制器调节幅度相同,可以有效保证液冷板中的冷却液的量基本上是恒定的,能够避免液冷板的管网中冷却液不足,或是水压过大导致管网壁破裂。
根据本发明提供的散热装置,通过同时调节进水口和出水口的流速控制器,从而使得液冷板中冷却液的流速能够快速稳定地调节,提高冷热水的循环速度,进而提升了装置的散热水平。
基板管理控制器(Baseboard Management Controller,BMC)监测目标服务器的运行状态,获取器件温度、功耗等运行状态信息。BMC在监测到目标服务器的器件温度较高或功耗较大的情况下,生成控制信号,发送至控制流速控制设备,流速控制设备根据控制信号,调高冷却液的流动速度,提高散热效率,以实现对目标服务器的快速散热。
BMC在监测到目标服务器的器件温度较低且功耗较小的情况下,生成控制信号,发送至控制流速控制设备,流速控制设备根据控制信号,调低冷却液的流动速度,以降低散热装置的能耗。
BMC在监测到目标服务器的器件温度较低且功耗为0的情况下,生成控制信号,发送至控制流速控制设备,流速控制设备根据控制信号,将冷却液的流动速度调节为0,以降低散热装置的能耗。
流速控制设备可以包括水泵电机,通过调节水泵电机的转速,对进水口和出水口的冷却液进行加压或减压,或是通过阀门控制冷却液的流量,实现增大或减少液冷板中冷却液的流速。
本发明提供的散热装置,根据服务器的运行状态对应调节冷却液的流速,从而实现对散热器的快速降温,提高了散热能力,满足了不同运行状态下服务器的散热需求。
可选地,所述基板管理控制器与所述目标服务器通信连接,用于按照预设频率接收所述运行状态信息;所述运行状态信息,包括所述目标服务器的服务器功耗和所述目标服务器中各个器件的器件温度;
所述基板管理控制器,具体用于:
在所述服务器功耗大于第一功耗阈值,且任一器件温度大于第一温度阈值的情况下,生成所述控制信号,所述控制信号用于控制所述流速控制设备调高所述液冷板中冷却液的流速;
在所述服务器功耗小于第二功耗阈值,且所有的器件温度均大于第二温度阈值的情况下,生成所述控制信号,所述控制信号用于控制所述流速控制设备调低所述液冷板中冷却液的流速;
所述第一功耗阈值大于所述第二功耗阈值,所述第一温度阈值大于所述第二温度阈值。
BMC可以通过IIC总线与目标服务器连接,读取目标服务器的服务器功耗和温度传感器采集的器件温度。
预设频率、第一功耗阈值P1、第二功耗阈值P2,以及第一温度阈值T1和第二温度阈值T2均可以根据目标服务器对散热的要求灵活调整,例如,预设频率越高,对冷却液流速的控制越灵敏;P1、P2,以及T1和T2越低,目标服务器对散热的要求越高。
例如,服务器功耗为P,目标服务器中多个器件均有对应的器件温度,在P>P1或任一器件温度>T1的情况下,目标服务器功耗过大或器件过热,冷却液的当前流速不足以满足目标服务器的散热需求,此时,BMC生成的控制信号并发送至流速控制设备,由流速控制设备,根据控制信号控制所述冷却液的流速增大。冷却液流速增大的幅度可以根据P与P1之间的差值,或T与T1之间的差值确定,差值越大,流速增大的幅度越大。
在P<P2且所有的器件温度均小于T2的情况下,目标服务器对散热的需求不高,为了节省散热装置的功耗,此时,BMC生成的控制信号并发送至流速控制设备,由流速控制设备,根据控制信号控制所述冷却液的流速降低。冷却液流速降低的幅度可以根据P与P2之间的差值,以及T与T2之间的差值确定,差值越大,流速较小的幅度越大。
其中,BMC接收目标服务器中所有器件的温度,并将其中的最高值作为器件温度T。
根据本发明提供的散热装置,通过对服务器的功耗和器件温度进行监测,从而对应调节冷却液的流速,从而达到对服务器散热能力的智能调节,满足各种情况下的散热需求。
可选地,所述装置还包括:第一流速传感器与第二流速传感器;
所述第一流速传感器设置于各液冷板进水口处,用于对各液冷板进水口处的冷却液进行流速监测,并将冷却液的流入速度发送至所述基板管理控制器;
所述第二流速传感器设置于各液冷板出水口处,用于对各液冷板出水口处的冷却液进行流速监测,并将冷却液的流出速度发送至所述基板管理控制器;
所述基板管理控制器,还用于在流入速度与流出速度之间的差异度大于流速阈值的情况下,生成报警信号和/或关机信号,所述关机信号用于控制所述目标服务器关机;所述报警信号用于提示漏液等级信息,所述漏液等级信息是根据所述流入速度和流出速度之间的差异度确定的。
可以理解的是,在流速控制设备控制冷却液的流速增加或降低的过程中,冷却液的流速不稳定,这个过程中采集的流入数据和流出数据是无效的。
报警信号可以声音播报、灯光闪烁提示运维人员,也可以将漏液等级信息发送至运维人员的终端设备。
在仅生成报警信号的情况下,报警信号还用于提示运维人员关闭目标服务器。
进水口和出水口可以为均一的,具有一定长度的管道,第一流速传感器可以包括多个流速传感器,分别设置于进水口管道内的不同位置,第二流速传感器可以包括多个流速传感器,分别设置于出水口管道内的不同位置,第一流速传感器和第二流速传感器均用于测量安装位置处的冷却液的流速,第一流速传感器中各传感器测量的冷却液的流入速度的均值为A,第二流速传感器中各传感器测量的冷却液的流出速度的均值为B。
差异度S用于表征各个流入速度与各个流出速度之间的差异程度,可以为|A-B|,也可以为(A-B)2,或是
Figure BDA0003959993580000111
还可以为各流入速度的中位数与各流出速度中位数之间的差值的绝对值,以降低误差,排除个例的影响。
在S>0的情况下,液冷板的管网可能出现了冷却液泄露,为了减少误判,设置了流速阈值C,C>0。其中,C越小,对冷却液泄露的判断越灵敏。
因此,在S>C的情况下,为避免冷却液泄露对服务器的损害,BMC生成报警信号和/或关机信号,关机信号通过IIC总线发送至目标服务器,目标服务器在接收到关机信号后,触发关机,以避免服务器在运行过程中渗入冷却液,实现对服务器的保护。
差异度S越大,冷却液的泄露越严重,漏液等级信息对应的漏液等级也越高,漏液等级信息用于提示运维人员携带相应的工具,配置相应的人员,以及采取的抢修措施。
若S>C,则随着差异度S由小至大,分别对应的漏液等级信息为:轻微、轻度、中度和重度。
根据本发明提供的散热装置,通过比较进水口和出水口的流速,实现对漏液的检测,以确保服务器的安全。
可选地,所述装置还包括:冷却装置;
所述冷却装置,用于接收所述液冷板的出水口的冷却液,并对冷却液进行冷却处理,将冷却处理之后的冷却液提供至所述液冷板的进水口。
图2是本发明提供的散热装置的结构示意图之二,如图2所示,包括:冷却装置和液冷板,液冷板包括CPU液冷板和GPU液冷板;
冷却装置中较低温度的冷却液从进水口流入至各个液冷板的管网,在管网中与服务器进行热交换后,带着服务器的器件工作所产生的热量,从出水口流出至冷却装置,在冷却装置中进行降温处理后再从进水口流入至各个液冷板的管网,形成一个冷热水交换的循环系统,实现对冷却液的循环利用。
图3是本发明提供的散热装置的结构示意图之三,如图3所示,包括:冷却装置、流速控制器、流速传感器、液冷板和BMC,液冷板包括CPU液冷板和GPU液冷板;
冷却装置中较低温度的冷却液从进水口流入至各个液冷板的管网,多个流速传感器对进水口处的冷却液的流速进行监测,进水口处的流速控制器可以接收BMC发送的控制信号,并根据控制信号对进水口处的冷却液的流速进行控制,在管网中与服务器进行热交换后,带着服务器的器件工作所产生的热量,从出水口流出至冷却装置,多个流速传感器对出水口处的冷却液的流速进行监测,出水口处的流速控制器可以接收由BMC发送的控制信号,并根据控制信号对出水口处的冷却液的流速进行控制,在冷却装置中进行降温处理后再从进水口流入至各个液冷板的管网,形成一个冷热水交换的循环系统,实现对冷却液的循环利用。
根据本发明提供的散热装置,通过设置冷却装置对冷却液进行降温,实现了冷却液的循环利用,有利于节省资源。
可选地,所述冷却装置内置有制冷设备和通信模块;
所述制冷设备,用于对所述冷却装置内的冷却液进行冷却处理;
所述通信模块,用于接收所述基板管理控制器的功率调节信号,所述功率调节信号用于调节所述制冷设备的运行功率。
制冷设备具有制冷功能,可以对冷却装置内的冷却液进行降温和冷却;冷却装置内的通信模块与BMC通信连接,可以接收由BMC发送的功率调节信号,功率调节信号用于将制冷功能的运行功率调低或调高。
例如,在P>P1或T>T1的情况下,目标服务器功耗过大或器件过热,BMC生成的功率调节信号用于调高制冷设备的运行功率,以增强对冷却液的降温效果,以更好地对目标服务器进行散热。运行功率调高的幅度可以根据P与P1之间的差值,或T与T1之间的差值确定,差值越大,运行功率调高的幅度越大。
在P<P2且T<T2的情况下,目标服务器对散热的需求不高,BMC生成的功率调节信号用于调低制冷设备的运行功率,以节省散热装置的功耗。运行功率调低的幅度可以根据P与P2之间的差值,以及T与T2之间的差值确定,差值越大,运行功率调低的幅度越大。
根据本发明提供的散热装置,通过对制冷设备运行功率的调节,能够满足不同使用场景下服务器的散热需求,提升了散热装置的散热水平。
可选地,所述装置还包括:温度传感器,所述温度传感器与所述基板管理控制器通信连接;
设置于所述进水口处的温度传感器,用于对进水口的冷却液进行温度监测,获取流入液体温度;设置于所述出水口处的温度传感器,用于对出水口的冷却液进行温度监测,获取流出液体温度;
所述通信模块,用于:
将所述流入液体温度和所述流出液体温度发送至所述基板管理控制器;
接收所述基板管理控制器发送的功率调节信号,所述功率调节信号用于对所述制冷设备进行功率调节;所述功率调节信号是根据所述流入液体温度和所述流出液体温度生成的。
进水口和出水口可以为均一的,具有一定长度的管道,温度传感器分别设置于进水口或出水口处的管道内,用于测量安装位置处的冷却液的温度,在进水口处传感器测量的冷却液的流入液体温度为X,在出水口处传感器测量的冷却液的流出液体温度为Y。
BMC可以根据X-Y的值,确定调低或是调高制冷设备的运行功率,生成对应的功率调节信号,并发送至冷却设备的通信模块。
可选地,在所述流入液体温度大于第三温度阈值,或所述流出液体温度大于第四温度阈值的情况下,所述功率调节信号用于增大所述制冷设备的运行功率;
在所述流入液体温度不大于第三温度阈值,且所述流出液体温度不大于第四温度阈值的情况下,所述功率调节信号用于降低所述制冷设备的运行功率。
第三温度阈值T3和第四温度阈值T4的值可以根据实际需求灵活调节。
在X>T3或Y>T4的情况下,目标服务器的器件产生了大量的热量,制冷设备可以通过调高运行功率的方式,实现对冷却液的有效降温,为目标服务器的散热提供基础。
在X≤T3且Y≤T4的情况下,目标服务器的器件产生的热量不大,制冷设备可以通过调低运行功率的方式,降低散热装置的功耗,实现节能减排。
根据本发明提供的散热装置,通过对冷却液的温度监控,调节制冷设备的运行功率,能够满足不同使用场景下服务器的散热需求,提升了散热装置的散热水平。
下面对本发明提供的散热控制方法进行描述,下文描述的散热控制方法与上文描述的散热装置可相互对应参照。
图4是本发明提供的散热控制方法的流程示意图,其执行主体为散热设备的BMC,如图4所示,至少包括以下步骤:
首先,在步骤S11中,接收目标服务器的运行状态信息;
运行状态信息,包括目标服务器的服务器功耗和目标服务器中各个器件的器件温度。
目标服务器上设置有散热装置的液冷板。液冷板可以为携带有管网的固定板,管网中流动有冷却液,所有的液冷板可以共用进水口和出水口。
各个液冷板可以分别设于目标服务器的CPU和GPU等功耗较大且产热量大的器件附近,实现对于目标服务器的散热降温。
BMC可以通过IIC总线与目标服务器连接,读取目标服务器的服务器功耗和温度传感器采集的器件温度等运行状态信息。
进一步地,在步骤S12中,根据所述运行状态信息,生成控制信号;
进一步地,在步骤S13中,将所述控制信号发送至流速控制设备,所述控制信号用于指示所述流速控制设备对液冷板的进水口和出水口的冷却液的流速进行控制。
流速控制设备可以设于液冷板的进水口、出水口或是液冷板中的管网的任意位置。
BMC在监测到目标服务器的器件温度较高或功耗较大的情况下,生成控制信号,发送至控制流速控制设备,流速控制设备根据控制信号,调高冷却液的流动速度,提高散热效率,以实现对目标服务器的快速散热。
BMC在监测到目标服务器的器件温度较低且功耗较小的情况下,生成控制信号,发送至控制流速控制设备,流速控制设备根据控制信号,调低冷却液的流动速度,以降低散热装置的能耗。
BMC在监测到目标服务器的器件温度较低且功耗为0的情况下,生成控制信号,发送至控制流速控制设备,流速控制设备根据控制信号,将冷却液的流动速度调节为0,以降低散热装置的能耗。
本发明提供的散热控制方法,根据服务器的运行状态对应调节冷却液的流速,从而实现对散热器的快速降温,提高了散热能力,满足了不同运行状态下服务器的散热需求。
可选地,散热控制方法还包括:
接收所述进水口处的流入液体温度,以及所述出水口处的流出液体温度;
根据所述流入液体温度和所述流出液体温度,生成功率调节信号;
将所述功率调节信号发送至冷却装置的通信模块,所述功率调节信号用于调节所述冷却装置中制冷设备的运行功率;所述冷却装置,用于接收所述出水口的冷却液,并对冷却液进行冷却处理,将冷却处理之后的冷却液提供至进水口;
在所述流入液体温度大于第三温度阈值,或所述流出液体温度大于第四温度阈值的情况下,所述功率调节信号用于增大所述制冷设备的运行功率;
在所述流入液体温度不大于第三温度阈值,且所述流出液体温度不大于第四温度阈值的情况下,所述功率调节信号用于降低所述制冷设备的运行功率。
进水口和出水口可以为均一的,具有一定长度的管道,温度传感器分别设置于进水口或出水口处的管道内,用于测量安装位置处的冷却液的温度,在进水口处传感器测量的冷却液的流入液体温度为X,在出水口处传感器测量的冷却液的流出液体温度为Y。
第三温度阈值T3和第四温度阈值T4的值可以根据实际需求灵活调节。
在X>T3或Y>T4的情况下,目标服务器的器件产生了大量的热量,制冷设备可以通过调高运行功率的方式,实现对冷却液的有效降温,为目标服务器的散热提供基础。
在X≤T3且Y≤T4的情况下,目标服务器的器件产生的热量不大,制冷设备可以通过调低运行功率的方式,降低散热装置的功耗,实现节能减排。
根据本发明提供的散热控制方法,通过对冷却液的温度监控,调节制冷设备的运行功率,能够满足不同使用场景下服务器的散热需求,提升了散热装置的散热水平。
图5是本发明提供的漏液检测方法的流程示意图,其执行主体为散热设备的BMC,如图5所示,至少包括以下步骤:
首先,在步骤S21中,获取液冷板的进水口的流入速度,以及所述液冷板的出水口的流出速度;
可以理解的是,在流速控制设备控制冷却液的流速增加或降低的过程中,冷却液的流速不稳定,这个过程中采集的流入数据和流出数据是无效的。
进水口和出水口可以为均一的,具有一定长度的管道,第一流速传感器可以包括多个流速传感器,分别设置于进水口管道内的不同位置,第二流速传感器可以包括多个流速传感器,分别设置于出水口管道内的不同位置,第一流速传感器和第二流速传感器均用于测量安装位置处的冷却液的流速,第一流速传感器中各传感器测量的冷却液的流入速度的均值为A,第二流速传感器中各传感器测量的冷却液的流出速度的均值为B。
进一步地,在步骤S22中,在所述流入速度和所述流出速度之间的差异度大于流速阈值的情况下,生成报警信号和/或关机信号;
差异度S用于表征各个流入速度与各个流出速度之间的差异程度,可以为|A-B|,也可以为(A-B)2,或是
Figure BDA0003959993580000171
还可以为各流入速度的中位数与各流出速度中位数之间的差值的绝对值,以降低误差,排除个例的影响。
在S>0的情况下,液冷板的管网可能出现了冷却液泄露,为了减少误判,设置了流速阈值C,C>0。其中,C越小,对冷却液泄露的判断越灵敏。
因此,在S>C的情况下,为避免冷却液泄露对服务器的损害,BMC生成报警信号和/或关机信号。
进一步地,在步骤S23中,将所述关机信号发送至目标服务器;所述关机信号用于控制所述目标服务器关机;所述报警信号用于提示漏液等级信息,所述漏液等级信息是根据所述流入速度和流出速度之间的差异度确定的。
BMC将关机信号通过IIC总线发送至目标服务器,目标服务器在接收到关机信号后,触发关机,以避免服务器在运行过程中渗入冷却液,实现对服务器的保护。
差异度S越大,冷却液的泄露越严重,漏液等级信息对应的漏液等级也越高,漏液等级信息用于提示运维人员携带相应的工具,配置相应的人员,以及采取的抢修措施。
若S>C,则随着差异度S由小至大,分别对应的漏液等级信息为:轻微、轻度、中度和重度。
本发明提供的漏液检测方法,通过比较进水口和出水口的流速,实现对漏液的检测,以确保服务器的安全。
图6是本发明提供的电子设备的结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行散热控制方法,该方法包括:接收目标服务器的运行状态信息;根据所述运行状态信息,生成控制信号;将所述控制信号发送至流速控制设备,所述控制信号用于指示所述流速控制设备对液冷板的进水口和出水口的冷却液的流速进行控制。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的散热控制方法,该方法包括:接收目标服务器的运行状态信息;根据所述运行状态信息,生成控制信号;将所述控制信号发送至流速控制设备,所述控制信号用于指示所述流速控制设备对液冷板的进水口和出水口的冷却液的流速进行控制。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的散热控制方法,该方法包括:接收目标服务器的运行状态信息;根据所述运行状态信息,生成控制信号;将所述控制信号发送至流速控制设备,所述控制信号用于指示所述流速控制设备对液冷板的进水口和出水口的冷却液的流速进行控制。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (13)

1.一种散热装置,其特征在于,包括:基板管理控制器、至少一个液冷板和流速控制设备;
所述基板管理控制器,用于向所述流速控制设备发送控制信号,所述控制信号是根据目标服务器的运行状态信息生成的;
所述流速控制设备,用于根据所述控制信号,对所述液冷板中的冷却液进行流速控制;
所述至少一个液冷板,用于对所述目标服务器进行热交换。
2.根据权利要求1所述的散热装置,其特征在于,所述基板管理控制器与所述目标服务器通信连接,用于按照预设频率接收所述运行状态信息;所述运行状态信息,包括所述目标服务器的服务器功耗和所述目标服务器中各个器件的器件温度;
所述基板管理控制器,具体用于:
在所述服务器功耗大于第一功耗阈值,且任一器件温度大于第一温度阈值的情况下,生成所述控制信号,所述控制信号用于控制所述流速控制设备调高所述液冷板中冷却液的流速;
在所述服务器功耗小于第二功耗阈值,且所有的器件温度均大于第二温度阈值的情况下,生成所述控制信号,所述控制信号用于控制所述流速控制设备调低所述液冷板中冷却液的流速;
所述第一功耗阈值大于所述第二功耗阈值,所述第一温度阈值大于所述第二温度阈值。
3.根据权利要求2所述的散热装置,其特征在于,所述流速控制设备包括第一流速控制器和第二流速控制器;
所述第一流速控制器,用于根据所述控制信号,对各液冷板进水口处冷却液的流速进行控制;
所述第二流速控制器,用于根据所述控制信号,对各液冷板出水口处冷却液的流速进行控制。
4.根据权利要求1所述的散热装置,其特征在于,所述装置还包括:第一流速传感器与第二流速传感器;
所述第一流速传感器设置于各液冷板进水口处,用于对各液冷板进水口处的冷却液进行流速监测,并将冷却液的流入速度发送至所述基板管理控制器;
所述第二流速传感器设置于各液冷板出水口处,用于对各液冷板出水口处的冷却液进行流速监测,并将冷却液的流出速度发送至所述基板管理控制器;
所述基板管理控制器,还用于在流入速度与流出速度之间的差异度大于流速阈值的情况下,生成报警信号和/或关机信号,所述关机信号用于控制所述目标服务器关机;所述报警信号用于提示漏液等级信息,所述漏液等级信息是根据所述流入速度和流出速度之间的差异度确定的。
5.根据权利要求1-4中任一项所述的散热装置,其特征在于,所述装置还包括:冷却装置;
所述冷却装置,用于接收所述液冷板的出水口的冷却液,并对冷却液进行冷却处理,将冷却处理之后的冷却液提供至所述液冷板的进水口。
6.根据权利要求5所述的散热装置,其特征在于,所述冷却装置内置有制冷设备和通信模块;
所述制冷设备,用于对所述冷却装置内的冷却液进行冷却处理;
所述通信模块,用于接收所述基板管理控制器的功率调节信号,所述功率调节信号用于调节所述制冷设备的运行功率。
7.根据权利要求6所述的散热装置,其特征在于,所述装置还包括:温度传感器,所述温度传感器与所述基板管理控制器通信连接;
设置于所述进水口处的温度传感器,用于对进水口的冷却液进行温度监测,获取流入液体温度;设置于所述出水口处的温度传感器,用于对出水口的冷却液进行温度监测,获取流出液体温度;
所述通信模块,用于:
将所述流入液体温度和所述流出液体温度发送至所述基板管理控制器;
接收所述基板管理控制器发送的功率调节信号,所述功率调节信号用于对所述制冷设备进行功率调节;所述功率调节信号是根据所述流入液体温度和所述流出液体温度生成的。
8.根据权利要求7所述的散热装置,其特征在于,在所述流入液体温度大于第三温度阈值,或所述流出液体温度大于第四温度阈值的情况下,所述功率调节信号用于增大所述制冷设备的运行功率;
在所述流入液体温度不大于第三温度阈值,且所述流出液体温度不大于第四温度阈值的情况下,所述功率调节信号用于降低所述制冷设备的运行功率。
9.一种散热控制方法,应用于如权利要求1-8任一项所述散热装置,其特征在于,所述方法包括:
接收目标服务器的运行状态信息;
根据所述运行状态信息,生成控制信号;
将所述控制信号发送至流速控制设备,所述控制信号用于指示所述流速控制设备对液冷板的进水口和出水口的冷却液的流速进行控制。
10.根据权利要求9所述的散热控制方法,其特征在于,还包括:
接收所述进水口处的流入液体温度,以及所述出水口处的流出液体温度;
根据所述流入液体温度和所述流出液体温度,生成功率调节信号;
将所述功率调节信号发送至冷却装置的通信模块,所述功率调节信号用于调节所述冷却装置中制冷设备的运行功率;所述冷却装置,用于接收所述出水口的冷却液,并对冷却液进行冷却处理,将冷却处理之后的冷却液提供至进水口;
在所述流入液体温度大于第三温度阈值,或所述流出液体温度大于第四温度阈值的情况下,所述功率调节信号用于增大所述制冷设备的运行功率;
在所述流入液体温度不大于第三温度阈值,且所述流出液体温度不大于第四温度阈值的情况下,所述功率调节信号用于降低所述制冷设备的运行功率。
11.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求9或10所述散热控制方法。
12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求9或10所述散热控制方法。
13.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求9或10所述散热控制方法。
CN202211478031.9A 2022-11-23 2022-11-23 散热装置、散热控制方法、电子设备、存储介质及产品 Pending CN115720433A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211478031.9A CN115720433A (zh) 2022-11-23 2022-11-23 散热装置、散热控制方法、电子设备、存储介质及产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211478031.9A CN115720433A (zh) 2022-11-23 2022-11-23 散热装置、散热控制方法、电子设备、存储介质及产品

Publications (1)

Publication Number Publication Date
CN115720433A true CN115720433A (zh) 2023-02-28

Family

ID=85256117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211478031.9A Pending CN115720433A (zh) 2022-11-23 2022-11-23 散热装置、散热控制方法、电子设备、存储介质及产品

Country Status (1)

Country Link
CN (1) CN115720433A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116560480A (zh) * 2023-07-10 2023-08-08 荣耀终端有限公司 一种电子设备、散热系统及电子设备的功耗控制方法
CN116860095A (zh) * 2023-09-05 2023-10-10 北京华鲲振宇智能科技有限责任公司 一种服务器集中式散热系统及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116560480A (zh) * 2023-07-10 2023-08-08 荣耀终端有限公司 一种电子设备、散热系统及电子设备的功耗控制方法
CN116560480B (zh) * 2023-07-10 2024-05-17 荣耀终端有限公司 一种电子设备、散热系统及电子设备的功耗控制方法
CN116860095A (zh) * 2023-09-05 2023-10-10 北京华鲲振宇智能科技有限责任公司 一种服务器集中式散热系统及方法

Similar Documents

Publication Publication Date Title
CN115720433A (zh) 散热装置、散热控制方法、电子设备、存储介质及产品
US10180665B2 (en) Fluid-cooled computer system with proactive cooling control using power consumption trend analysis
US10271457B2 (en) Heat dissipation apparatus, heat dissipation control method, and controller
US8755948B2 (en) Controlling fluid coolant flow in cooling systems of computing devices
CN106194806B (zh) 风扇能率控制系统、方法与非暂态计算机可读储存介质
US8782450B2 (en) Power capping system and method
EP2986097B1 (en) Liquid cooling system and control method therefor
CN115686117B (zh) 液冷控制方法、系统、液冷机柜、电子设备及存储介质
US20130098599A1 (en) Independent computer system zone cooling responsive to zone power consumption
CN106229574B (zh) 电池包的冷却方法及系统
CN111442438A (zh) 一种冷冻机房的系统与控制方法
WO2021120700A1 (zh) 一种处理器的功率调整方法及装置
TWI482581B (zh) 溫度控制系統及其溫度控制方法
CN110881262A (zh) 一种数据机房液冷系统冷源输出容量的控制方法
CN207543493U (zh) 一种液冷散热系统
CN113626291A (zh) 一种液冷监测方法和装置
CN116471802A (zh) 一种冷却液回流控制方法、系统及液冷机柜
Chowdhury et al. Characterization of an isolated hybrid cooled server with failure scenarios using warm water cooling
CN114867297A (zh) 液冷机柜、计算设备冷却控制系统及方法
CN207315502U (zh) 一种分布式控制的发动机热管理系统
JP2006003947A (ja) 液冷情報処理装置システム
KR102557884B1 (ko) 건물 공조 및 냉동을 위한 수냉식 냉동기 열교환기 제어 시스템
CN220509421U (zh) 液冷服务器温度监控设备
CN101377755A (zh) 主机板、电脑系统与其多重监控方法
CN117349056A (zh) 服务器漏液保护方法、装置以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination