CN113626291A - 一种液冷监测方法和装置 - Google Patents

一种液冷监测方法和装置 Download PDF

Info

Publication number
CN113626291A
CN113626291A CN202111007687.8A CN202111007687A CN113626291A CN 113626291 A CN113626291 A CN 113626291A CN 202111007687 A CN202111007687 A CN 202111007687A CN 113626291 A CN113626291 A CN 113626291A
Authority
CN
China
Prior art keywords
refrigerant
temperature
secondary side
side liquid
flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111007687.8A
Other languages
English (en)
Other versions
CN113626291B (zh
Inventor
张晓伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111007687.8A priority Critical patent/CN113626291B/zh
Publication of CN113626291A publication Critical patent/CN113626291A/zh
Application granted granted Critical
Publication of CN113626291B publication Critical patent/CN113626291B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2200/00Indexing scheme relating to G06F1/04 - G06F1/32
    • G06F2200/20Indexing scheme relating to G06F1/20
    • G06F2200/201Cooling arrangements using cooling fluid
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本发明公开了一种液冷监测方法和装置,方法包括:从负压液冷散热系统的一次侧入液端采集冷媒温度和冷媒流量,从二次侧供液端采集冷媒温度和冷媒流量,从二次侧回液端采集冷媒温度和冷媒压强;根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化;从发热设备采集功耗信息,并响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量,并选择性地发出告警和/或关闭发热设备。本发明能够保护服务器芯片不会超温烧毁,提高服务器的稳定性与可靠性。

Description

一种液冷监测方法和装置
技术领域
本发明涉及一种液冷监测方法和装置。
背景技术
随着CPU、GPU等部件功耗的成倍增长,传统风冷技术已经达到其经济有效的散热极限,伴随着国家建设绿色数据中心的倡议,可以解决更高热流密度散热问题同时具有更高能效的液冷散热技术应运而生,在近几年时间里得到了蓬勃发展。目前常用的芯片级液冷技术有浸没式液冷和冷板式液冷。浸没式液冷由于成本高、维护困难,应用规模较小。冷板式液冷是采用泵驱动冷却液(水、乙二醇等)流过芯片背部的通道,冷却液在通道内通过板壁与芯片进行热交换,带走芯片上的热量达到散热目的,该技术具有技术成熟、节能降噪等优势,应用较为广泛。
目前常规液冷系统内部为正压,即系统内气压大于外部大气压,存在着当系统某处发生破裂或者松动时冷却液泄漏的缺陷,而水和乙二醇等冷却液具有导电性,会造成服务器损毁的致命危害。为解决上述问题,负压冷板式液冷技术正在冉冉兴起,其系统内压强均低于外部大气压,系统某处存在破损时,冷却液不会泄漏至服务器,而是外部气体进入系统中。
温度和压力会影响流体的流态,液体在每个温度下都有对应的饱和蒸汽压力,当液体压力降至饱和蒸气压以下时就会产生汽化现象,这种由于压力降低使其低于饱和蒸气压而产生的汽化现象称之为空化。空化过程中,空泡急速产生、扩张和溃灭,在液体中形成激波或高速微射流,会对系统和管路造成巨大的冲击作用。而且液体中空泡溃灭会产生空蚀、噪音(一种很强的水动力噪声)和振动等现象,这些都会使得液冷系统运行不稳,阻碍流体的正常流动,在系统运行时应该避免空化现象的发生。
负压系统内部压强小于外部大气压,压强最低处通常可以达到30kpa,在此压强下,水的沸点仅为70℃,易产生汽化问题。因为沿程阻力和局部阻力的存在,系统中冷却液在流动方向上压强逐渐减小,流过散热部件后,因管路摩擦或者与管路的热交换热量可忽略不计,冷却液温度基本保持不变,当回路中液体压强降低至饱和蒸气压以下,就会产生空化现象,会对系统和管路造成冲击,阻碍流体流动,带来振动噪音等不良影响,从而影响系统正常稳定运行甚至导致系统失效。当外界气候环境变化或者负载发生改变,如果液冷循环散热系统不能自适应调节,很容易因为没有及时的监测、调整和告警会产生空化现象使得液冷系统失效从而让服务器设备元器件因为过热损坏。
针对现有技术中负压液冷散热系统的冷媒空化导致负压液冷散热系统不能正常运转甚至损坏服务器设备的问题,目前尚无有效的解决方案。
发明内容
有鉴于此,本发明实施例的目的在于提出一种液冷监测方法和装置,能够降低由于负载或气候条件变化导致负压液冷系统空化导致液冷失效的风险,保护服务器芯片不会超温烧毁,提高服务器的稳定性与可靠性。
基于上述目的,本发明实施例的第一方面提供了一种液冷监测方法,包括执行以下步骤:
从负压液冷散热系统的一次侧入液端采集冷媒温度和冷媒流量,从二次侧供液端采集冷媒温度和冷媒流量,从二次侧回液端采集冷媒温度和冷媒压强;
根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化;
从发热设备采集功耗信息,并响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量,并选择性地发出告警和/或关闭发热设备。
在一些实施方式中,根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化包括:
读取预设的风险温度阈值;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而确定不存在冷媒空化;
响应于确定二次侧回液端的冷媒温度高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,而确定存在冷媒空化现象;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,并且高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而确定存在冷媒空化风险。
在一些实施方式中,响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量包括:响应于确定存在冷媒空化现象或冷媒空化风险,而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度,并调整一次侧入液端的冷媒温度和冷媒流量使得二次侧供液端的冷媒温度降低到不超过期望冷媒温度,并且二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差。
在一些实施方式中,根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度包括:基于功耗信息与冷媒的比热容和二次侧供液端的冷媒流量之商确定发热设备偏移,并基于二次侧供液端的冷媒温度与发热设备偏移之差确定期望冷媒温度。
在一些实施方式中,响应于确定存在冷媒空化而选择性地发出告警和/或关闭发热设备包括:
响应于确定存在冷媒空化风险而发出告警;
响应于确定存在冷媒空化风险并且确定调整一次侧入液端的冷媒温度和冷媒流量后未能使二次侧供液端的冷媒温度降低到不超过期望冷媒温度、或二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而关闭发热设备;
响应于确定存在冷媒空化现象而发出告警并且关闭发热设备。
本发明实施例的第二方面提供了一种液冷监测装置,包括:
设置有发热设备的服务器;
配置为使发热设备降温的负压液冷散热系统;
配置为受控输出告警信息的告警模块;
控制系统,通信连接到服务器针对发热设备的供电使能、负压液冷散热系统的控制总线和数据总线、以及告警模块的输入端,控制系统存储有可运行的程序代码并且在运行程序代码时执行以下步骤:
从负压液冷散热系统的一次侧入液端采集冷媒温度和冷媒流量,从二次侧供液端采集冷媒温度和冷媒流量,从二次侧回液端采集冷媒温度和冷媒压强;
根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化;
从发热设备采集功耗信息,并响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量,并选择性地发出告警和/或关闭发热设备。
在一些实施方式中,根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化包括:
读取预设的风险温度阈值;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而确定不存在冷媒空化;
响应于确定二次侧回液端的冷媒温度高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,而确定存在冷媒空化现象;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,并且高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而确定存在冷媒空化风险。
在一些实施方式中,响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量包括:响应于确定存在冷媒空化现象或冷媒空化风险,而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度,并调整一次侧入液端的冷媒温度和冷媒流量使得二次侧供液端的冷媒温度降低到不超过期望冷媒温度,并且二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差。
在一些实施方式中,根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度包括:基于功耗信息与冷媒的比热容和二次侧供液端的冷媒流量之商确定发热设备偏移,并基于二次侧供液端的冷媒温度与发热设备偏移之差确定期望冷媒温度。
在一些实施方式中,响应于确定存在冷媒空化而选择性地发出告警和/或关闭发热设备包括:
响应于确定存在冷媒空化风险而发出告警;
响应于确定存在冷媒空化风险并且确定调整一次侧入液端的冷媒温度和冷媒流量后未能使二次侧供液端的冷媒温度降低到不超过期望冷媒温度、或二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而关闭发热设备;
响应于确定存在冷媒空化现象而发出告警并且关闭发热设备。
本发明具有以下有益技术效果:本发明实施例提供的液冷监测方法和装置,通过从负压液冷散热系统的一次侧入液端采集冷媒温度和冷媒流量,从二次侧供液端采集冷媒温度和冷媒流量,从二次侧回液端采集冷媒温度和冷媒压强;根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化;从发热设备采集功耗信息,并响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量,并选择性地发出告警和/或关闭发热设备的技术方案,能够降低由于负载或气候条件变化导致负压液冷系统空化导致液冷失效的风险,保护服务器芯片不会超温烧毁,提高服务器的稳定性与可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的液冷监测方法的流程示意图;
图2为本发明提供的液冷监测方法的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了一种降低由于负载或气候条件变化导致负压液冷系统空化导致液冷失效的风险,保护服务器芯片不会超温烧毁,提高服务器的稳定性与可靠性的液冷监测方法的一个实施例。图1示出的是本发明提供的液冷监测方法的流程示意图。
所述的液冷监测方法,如图1所示,包括执行以下步骤:
步骤S101,从负压液冷散热系统的一次侧入液端采集冷媒温度和冷媒流量,从二次侧供液端采集冷媒温度和冷媒流量,从二次侧回液端采集冷媒温度和冷媒压强;
步骤S103,根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化;
步骤S105,从发热设备采集功耗信息,并响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量,并选择性地发出告警和/或关闭发热设备。
本发明针对负压液冷系统中由于二次侧回水端液体压强逐渐减小(相当于恒温降压)造成回路中出现冷却液空化问题的缺陷,本发明创造提供一种可以实现负压液冷系统的闭环控制、通过系统运行参数的调整避免系统因为空化问题而影响可靠性,根据系统是否存在空化风险及时告警并采取有效措施的方法,使得负压液冷系统可以自适应冷却负载和气候环境,提高负压液冷系统的可靠性和适应性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器,使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中,存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在ASIC中。ASIC可以驻留在用户终端中。在一个替换方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。
在一些实施方式中,根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化包括:
读取预设的风险温度阈值;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而确定不存在冷媒空化;
响应于确定二次侧回液端的冷媒温度高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,而确定存在冷媒空化现象;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,并且高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而确定存在冷媒空化风险。
在一些实施方式中,响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量包括:响应于确定存在冷媒空化现象或冷媒空化风险,而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度,并调整一次侧入液端的冷媒温度和冷媒流量使得二次侧供液端的冷媒温度降低到不超过期望冷媒温度,并且二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差。
在一些实施方式中,根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度包括:基于功耗信息与冷媒的比热容和二次侧供液端的冷媒流量之商确定发热设备偏移,并基于二次侧供液端的冷媒温度与发热设备偏移之差确定期望冷媒温度。
在一些实施方式中,响应于确定存在冷媒空化而选择性地发出告警和/或关闭发热设备包括:
响应于确定存在冷媒空化风险而发出告警;
响应于确定存在冷媒空化风险并且确定调整一次侧入液端的冷媒温度和冷媒流量后未能使二次侧供液端的冷媒温度降低到不超过期望冷媒温度、或二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而关闭发热设备;
响应于确定存在冷媒空化现象而发出告警并且关闭发热设备。
结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现所述的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里所述功能的下列部件来实现或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP和/或任何其它这种配置。
下面根据具体实施例来进一步阐述本发明的具体实施方式。
首先,在液冷系统在一次侧入水端设置冷媒温度和流量传感器,二次侧供液端设置温度和流量传感器,二次侧回液末端(末端压强最小)设置温度传感器和压强传感器,并将这些传感器信号实时反馈至控制系统。同时服务器可以反馈CPU热功耗信息至控制系统。
控制系统根据接收到的温度和压强传感器反馈信号建立数据分析模型,判断负压液冷循环系统是否存在空化风险或者已经出现空化问题。当控制系统判定存在空化风险或者空化问题后发送相应的控制信号至负压液冷系统,通过调节一次侧冷媒流量来满足液冷系统二次侧供液温度需求,同时发出相应的告警信号。
控制系统还连接着服务器,当系统出现空化问题,控制器出现流量调节出现故障或者错误时,控制系统发出关机指令,控制服务器关机,同时告警模块会发出报警声,通知运维人员进行维护。
其中控制系统判定液冷循环系统是否存在空化问题具体包括如下步骤:
1.液冷循环系统二次侧回水端温度传感器和压强传感器将冷却液实时温度和压强信号传输至控制系统;
2.控制系统根据对应压力下的汽化温度点,同时为控制系统设置一个偏离度额定值△T,在某压强下冷却液汽化温度为T1,实时温度为T,当二次侧回液末端温度是在其压强下汽化温度点之下额定值△T,即T≤T1-△T时,控制系统判定液冷系统无空化风险;当T1≥T≥T1-△T,控制系统即判定系统存在空化风险;若冷却液温度达到或超过监测点压强下汽化温度点,即T≥T1,控制系统判定液冷系统出现空化问题。
其中控制系统发出的控制和告警信号具体包括以下步骤:
1.当控制系统判定无空化风险,不发出控制指令信号;
2.当控制系统判定存在空化风险或者空化问题后,发出控制指令信号,调整一次侧冷媒流量使得二次侧供液温度为T0,二次侧回液温度T降至T1-△T。二次侧供液温度T0根据二次侧流量传感器提供的流量和CPU的热功耗信息计算得出,即液冷循环系统二次侧供回液温差T-T0=Q/qc,其中Q为CPU热功耗,c为冷却液比热容,q为二次侧冷却液流量。
3.当控制系统判定出现空化问题后,发出控制指令信号,当通过调整一次侧冷媒流量无法使得二次侧供液温度满足要求或者控制系统出现无法调节的故障时,报警模块告警通知运维人员同时控制系统发出指令控制服务器关机。
此外,根据本发明实施例公开的方法还可以被实现为由CPU执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时,执行本发明实施例公开的方法中限定的上述功能。上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
从上述实施例可以看出,本发明实施例提供的液冷监测方法,通过从负压液冷散热系统的一次侧入液端采集冷媒温度和冷媒流量,从二次侧供液端采集冷媒温度和冷媒流量,从二次侧回液端采集冷媒温度和冷媒压强;根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化;从发热设备采集功耗信息,并响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量,并选择性地发出告警和/或关闭发热设备的技术方案,能够降低由于负载或气候条件变化导致负压液冷系统空化导致液冷失效的风险,保护服务器芯片不会超温烧毁,提高服务器的稳定性与可靠性。
需要特别指出的是,上述液冷监测方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于液冷监测方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
基于上述目的,本发明实施例的第二个方面,提出了一种降低由于负载或气候条件变化导致负压液冷系统空化导致液冷失效的风险,保护服务器芯片不会超温烧毁,提高服务器的稳定性与可靠性的液冷监测装置的一个实施例。装置包括:
设置有发热设备的服务器;
配置为使发热设备降温的负压液冷散热系统;
配置为受控输出告警信息的告警模块;
控制系统,通信连接到服务器针对发热设备的供电使能、负压液冷散热系统的控制总线和数据总线、以及告警模块的输入端,控制系统存储有可运行的程序代码并且在运行程序代码时执行以下步骤:
从负压液冷散热系统的一次侧入液端采集冷媒温度和冷媒流量,从二次侧供液端采集冷媒温度和冷媒流量,从二次侧回液端采集冷媒温度和冷媒压强;
根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化;
从发热设备采集功耗信息,并响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量,并选择性地发出告警和/或关闭发热设备。
在一些实施方式中,根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化包括:
读取预设的风险温度阈值;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而确定不存在冷媒空化;
响应于确定二次侧回液端的冷媒温度高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,而确定存在冷媒空化现象;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,并且高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而确定存在冷媒空化风险。
在一些实施方式中,响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量包括:响应于确定存在冷媒空化现象或冷媒空化风险,而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度,并调整一次侧入液端的冷媒温度和冷媒流量使得二次侧供液端的冷媒温度降低到不超过期望冷媒温度,并且二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差。
在一些实施方式中,根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度包括:基于功耗信息与冷媒的比热容和二次侧供液端的冷媒流量之商确定发热设备偏移,并基于二次侧供液端的冷媒温度与发热设备偏移之差确定期望冷媒温度。
在一些实施方式中,响应于确定存在冷媒空化而选择性地发出告警和/或关闭发热设备包括:
响应于确定存在冷媒空化风险而发出告警;
响应于确定存在冷媒空化风险并且确定调整一次侧入液端的冷媒温度和冷媒流量后未能使二次侧供液端的冷媒温度降低到不超过期望冷媒温度、或二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与风险温度阈值之差,而关闭发热设备;
响应于确定存在冷媒空化现象而发出告警并且关闭发热设备。
装置结构参见图2,包括控制系统、负压液冷循环系统、告警模块和服务器。负压液冷循环系统包括一次侧冷却系统和二次侧冷却系统,一次侧和二次侧冷却系统之间通过换热器进行热交换,一次侧是室外冷却塔/冷水机组制冷循环,二次侧是服务器侧换热循环,液冷循环系统的反馈信号包括一次侧冷媒流量及温度,二次侧冷媒温度、流量、压强。控制系统根据接收到的反馈信号判断系统是否运行在正常工作状态,并对散热数据进行分析,调节较优的工作状态。
本发明例公开的装置、设备等可为各种电子终端设备,例如手机、个人数字助理(PDA)、平板电脑(PAD)、智能电视等,也可以是大型终端设备,如装置等,因此本发明实施例公开的保护范围不应限定为某种特定类型的装置、设备。本发明实施例公开的客户端可以是以电子硬件、计算机软件或两者的组合形式应用于上述任意一种电子终端设备中。
从上述实施例可以看出,本发明实施例提供的液冷监测装置,通过从负压液冷散热系统的一次侧入液端采集冷媒温度和冷媒流量,从二次侧供液端采集冷媒温度和冷媒流量,从二次侧回液端采集冷媒温度和冷媒压强;根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化;从发热设备采集功耗信息,并响应于确定存在冷媒空化而根据功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量,并选择性地发出告警和/或关闭发热设备的技术方案,能够降低由于负载或气候条件变化导致负压液冷系统空化导致液冷失效的风险,保护服务器芯片不会超温烧毁,提高服务器的稳定性与可靠性。
需要特别指出的是,上述装置的实施例采用了所述液冷监测方法的实施例来具体说明各模块的工作过程,本领域技术人员能够很容易想到,将这些模块应用到所述液冷监测方法的其他实施例中。当然,由于所述液冷监测方法实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于所述装置也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
本发明实施例还可以包括相应的计算机设备。计算机设备包括存储器、至少一个处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时执行上述任意一种方法。
其中,存储器作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的所述液冷监测方法对应的程序指令/模块。处理器通过运行存储在存储器中的非易失性软件程序、指令以及模块,从而执行装置的各种功能应用以及数据处理,即实现上述方法实施例的液冷监测方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据装置的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。所述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (10)

1.一种液冷监测方法,其特征在于,包括执行以下步骤:
从负压液冷散热系统的一次侧入液端采集冷媒温度和冷媒流量,从二次侧供液端采集冷媒温度和冷媒流量,从二次侧回液端采集冷媒温度和冷媒压强;
根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化;
从发热设备采集功耗信息,并响应于确定存在冷媒空化而根据所述功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量,并选择性地发出告警和/或关闭发热设备。
2.根据权利要求1所述的方法,其特征在于,根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化包括:
读取预设的风险温度阈值;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与所述风险温度阈值之差,而确定不存在冷媒空化;
响应于确定二次侧回液端的冷媒温度高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,而确定存在冷媒空化现象;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,并且高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与所述风险温度阈值之差,而确定存在冷媒空化风险。
3.根据权利要求2所述的方法,其特征在于,响应于确定存在冷媒空化而根据所述功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量包括:响应于确定存在冷媒空化现象或冷媒空化风险,而根据所述功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度,并调整一次侧入液端的冷媒温度和冷媒流量使得二次侧供液端的冷媒温度降低到不超过期望冷媒温度,并且二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与所述风险温度阈值之差。
4.根据权利要求3所述的方法,其特征在于,根据所述功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度包括:基于所述功耗信息与冷媒的比热容和二次侧供液端的冷媒流量之商确定发热设备偏移,并基于二次侧供液端的冷媒温度与所述发热设备偏移之差确定所述期望冷媒温度。
5.根据权利要求3所述的方法,其特征在于,响应于确定存在冷媒空化而选择性地发出告警和/或关闭发热设备包括:
响应于确定存在冷媒空化风险而发出告警;
响应于确定存在冷媒空化风险并且确定调整一次侧入液端的冷媒温度和冷媒流量后未能使二次侧供液端的冷媒温度降低到不超过期望冷媒温度、或二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与所述风险温度阈值之差,而关闭发热设备;
响应于确定存在冷媒空化现象而发出告警并且关闭发热设备。
6.一种液冷监测装置,其特征在于,包括:
设置有发热设备的服务器;
配置为使发热设备降温的负压液冷散热系统;
配置为受控输出告警信息的告警模块;
控制系统,通信连接到所述服务器针对所述发热设备的供电使能、所述负压液冷散热系统的控制总线和数据总线、以及所述告警模块的输入端,所述控制系统存储有可运行的程序代码并且在运行所述程序代码时执行以下步骤:
从负压液冷散热系统的一次侧入液端采集冷媒温度和冷媒流量,从二次侧供液端采集冷媒温度和冷媒流量,从二次侧回液端采集冷媒温度和冷媒压强;
根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化;
从发热设备采集功耗信息,并响应于确定存在冷媒空化而根据所述功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量,并选择性地发出告警和/或关闭发热设备。
7.根据权利要求6所述的装置,其特征在于,根据一次侧入液端的冷媒温度和冷媒流量、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强确定是否存在冷媒空化包括:
读取预设的风险温度阈值;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与所述风险温度阈值之差,而确定不存在冷媒空化;
响应于确定二次侧回液端的冷媒温度高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,而确定存在冷媒空化现象;
响应于确定二次侧回液端的冷媒温度低于冷媒在二次侧回液端的冷媒压强之下的气化临界温度,并且高于冷媒在二次侧回液端的冷媒压强之下的气化临界温度与所述风险温度阈值之差,而确定存在冷媒空化风险。
8.根据权利要求7所述的装置,其特征在于,响应于确定存在冷媒空化而根据所述功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来调节一次侧入液端的冷媒温度和冷媒流量包括:响应于确定存在冷媒空化现象或冷媒空化风险,而根据所述功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度,并调整一次侧入液端的冷媒温度和冷媒流量使得二次侧供液端的冷媒温度降低到不超过期望冷媒温度,并且二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与所述风险温度阈值之差。
9.根据权利要求8所述的装置,其特征在于,根据所述功耗信息、二次侧供液端的冷媒温度和冷媒流量、以及二次侧回液端的冷媒温度和冷媒压强来确定二次侧供液端的期望冷媒温度包括:基于所述功耗信息与冷媒的比热容和二次侧供液端的冷媒流量之商确定发热设备偏移,并基于二次侧供液端的冷媒温度与所述发热设备偏移之差确定所述期望冷媒温度。
10.根据权利要求8所述的装置,其特征在于,响应于确定存在冷媒空化而选择性地发出告警和/或关闭发热设备包括:
响应于确定存在冷媒空化风险而发出告警;
响应于确定存在冷媒空化风险并且确定调整一次侧入液端的冷媒温度和冷媒流量后未能使二次侧供液端的冷媒温度降低到不超过期望冷媒温度、或二次侧供液端的冷媒温度降低到不超过冷媒在二次侧回液端的冷媒压强之下的气化临界温度与所述风险温度阈值之差,而关闭发热设备;
响应于确定存在冷媒空化现象而发出告警并且关闭发热设备。
CN202111007687.8A 2021-08-30 2021-08-30 一种液冷监测方法和装置 Active CN113626291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111007687.8A CN113626291B (zh) 2021-08-30 2021-08-30 一种液冷监测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111007687.8A CN113626291B (zh) 2021-08-30 2021-08-30 一种液冷监测方法和装置

Publications (2)

Publication Number Publication Date
CN113626291A true CN113626291A (zh) 2021-11-09
CN113626291B CN113626291B (zh) 2023-07-14

Family

ID=78388553

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111007687.8A Active CN113626291B (zh) 2021-08-30 2021-08-30 一种液冷监测方法和装置

Country Status (1)

Country Link
CN (1) CN113626291B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115097877A (zh) * 2022-06-17 2022-09-23 广东海悟科技有限公司 液冷系统防汽化控制方法和液冷系统
CN115666088A (zh) * 2022-10-29 2023-01-31 深圳市瀚强科技股份有限公司 电子设备及其液冷散热流量控制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302182A (zh) * 2015-11-02 2016-02-03 张存勇 一种服务器液冷散热节能控制系统和方法
CN212411145U (zh) * 2020-07-06 2021-01-26 曙光节能技术(北京)股份有限公司 一种液冷服务器散热系统
CN112799489A (zh) * 2021-01-29 2021-05-14 苏州浪潮智能科技有限公司 一种液冷散热系统和服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302182A (zh) * 2015-11-02 2016-02-03 张存勇 一种服务器液冷散热节能控制系统和方法
CN212411145U (zh) * 2020-07-06 2021-01-26 曙光节能技术(北京)股份有限公司 一种液冷服务器散热系统
CN112799489A (zh) * 2021-01-29 2021-05-14 苏州浪潮智能科技有限公司 一种液冷散热系统和服务器

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115097877A (zh) * 2022-06-17 2022-09-23 广东海悟科技有限公司 液冷系统防汽化控制方法和液冷系统
CN115097877B (zh) * 2022-06-17 2024-01-30 广东海悟科技有限公司 液冷系统防汽化控制方法和液冷系统
CN115666088A (zh) * 2022-10-29 2023-01-31 深圳市瀚强科技股份有限公司 电子设备及其液冷散热流量控制方法
CN115666088B (zh) * 2022-10-29 2023-07-21 深圳市瀚强科技股份有限公司 电子设备及其液冷散热流量控制方法

Also Published As

Publication number Publication date
CN113626291B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
US20230020354A1 (en) Thermal management method, device, system, and computer-readable storage medium
CN113626291A (zh) 一种液冷监测方法和装置
US20140069626A1 (en) Temperature control system and temperature control method thereof
CN103582396A (zh) 一种直流换流阀用带蓄冷的外冷却系统及其操作方法
CN107664339B (zh) 中央空调的冷却水泵的控制方法、装置以及中央空调
CN104501648A (zh) 一种数据机房机柜冷却系统
CN113038807B (zh) 一种液冷电能系统的控制方法、液冷电能系统及存储介质
CN113258105B (zh) 一种液氢燃料电池余热回收系统的控制方法
CN215121663U (zh) 一种工作稳定可靠的大型服务器液冷系统
CN114071972B (zh) 一种用于高功率密度机柜的泵驱双环路热管组合散热系统
CN113597215A (zh) 调节双相冷板液冷系统并联支路流量的系统、方法及装置
TWI482581B (zh) 溫度控制系統及其溫度控制方法
CN204359196U (zh) 一种数据机房机柜冷却系统
CN104390311A (zh) 针对高温服务器的空调制冷方法、系统和装置
US20140332197A1 (en) Air Conditioner Terminal Device, Air Conditioning Apparatus And Data Center
CN118380694B (zh) 一种储能柜冷却系统及冷却方法
CN204131372U (zh) 一种矿用变频器冷却装置
TW201947350A (zh) 用於機櫃伺服器的液冷系統
CN104679195A (zh) 一种电脑散热冷却系统及其控制方法
WO2024040867A1 (zh) 一种液冷系统
CN112243332B (zh) 制冷系统及数据中心
CN204943789U (zh) 冷却水节能控制系统
CN109085905B (zh) 一种用于不同发热量的服务器的冷却系统
CN203474138U (zh) 一种提升机中压变频柜的冷却装置
CN106852086B (zh) 双级串联式液气双通道自然冷却数据中心散热系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant