CN114356059A - 服务器的冷却液分配设备控制方法、装置及服务器系统 - Google Patents
服务器的冷却液分配设备控制方法、装置及服务器系统 Download PDFInfo
- Publication number
- CN114356059A CN114356059A CN202111682097.5A CN202111682097A CN114356059A CN 114356059 A CN114356059 A CN 114356059A CN 202111682097 A CN202111682097 A CN 202111682097A CN 114356059 A CN114356059 A CN 114356059A
- Authority
- CN
- China
- Prior art keywords
- server
- type
- cooling unit
- parameter
- cooling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 239000000110 cooling liquid Substances 0.000 title claims description 8
- 238000001816 cooling Methods 0.000 claims abstract description 168
- 230000008859 change Effects 0.000 claims abstract description 10
- 239000007788 liquid Substances 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 description 9
- 230000001276 controlling effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000002826 coolant Substances 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000012809 cooling fluid Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Cooling Or The Like Of Electrical Apparatus (AREA)
Abstract
本发明公开了一种服务器系统的冷却系统的控制方法、装置及服务器系统,服务器系统包括多个服务器,冷却系统配置多个冷却单元,每一冷却单元对应一个服务器,该方法中首先获取每一服务器的多个第一类运行参数,第一类运行参数能够表示出服务器的温度,然后获取每一冷却单元的第二类运行参数和第三类运行参数,第二类运行参数能够表示出冷却单元的压力变化,第三类运行参数能够表示出冷却单元是否发生故障;根据第一类运行参数的第一参数范围、第二类参数的第二参数范围和第三类参数的第三参数范围,确定是否针对冷却单元进行报警控制。由此,将冷却单元和服务器联动起来,避免服务器和冷却单元误报引起不必要的关机,有效提升服务器系统使用效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种服务器的冷却液分配设备的控制方法、装置及服务器系统。
背景技术
随着计算机技术的发展,服务器将采用更加精细集成的芯片架构来提高计算性能,由此,也将导致服务器功率密度迅速增大,传统的风冷制冷技术不再是最佳选择。液冷技术应用冷却液体直接对服务器或芯片散热,省去中间的风冷环节,散热效率更高。
目前,在液体冷却的设计方案中,CDU(Coolant Distribution Unit,冷却液分配装置)和服务器分别独立控制自身的运行状况。对服务器或者CDU的检测参数中的其中一个存在问题的情况下,均直接对服务器做关机处理。由此,存在较多的误报情况,易引起较多不必要的麻烦,在运维人员对服务器或CDU进行检查的过程中也很难检查出设备的问题。例如,如果服务器端检测到漏液检测线值发生变化,则直接将服务器关机。
发明内容
本发明实施例提供一种服务器的冷却液分配设备的控制方法、装置及服务器系统。
根据本发明第一方面,提供了一种服务器系统的冷却系统的控制方法,所述服务器系统包括多个服务器,所述冷却系统配置多个冷却单元,每一所述冷却单元对应一个所述服务器,所述方法包括:获取每一所述服务器的多个第一类运行参数,所述多个第一类运行参数能够表示出所述服务器的温度;获取每一所述冷却单元的第二类运行参数和第三类运行参数,所述第二类运行参数能够表示出所述冷却单元的压力变化,所述第三类运行参数能够表示出所述冷却单元是否发生故障;根据所述第一类运行参数的第一参数范围、所述第二类参数的第二参数范围和所述第三类参数的第三参数范围,确定是否针对所述冷却单元进行报警控制。
根据本发明一实施方式,所述根据所述第一类运行参数的第一参数范围、所述第二类参数的第二参数范围和所述第三类参数的第三参数范围,确定是否针对所述冷却单元进行报警控制,包括:在所述第一类运行参数示出所述服务器的温度小于第一设定阈值并且所述第三类运行参数示出所述服务器相对应的冷却单元未发生故障的情况下,但是所述第二类运行参数示出与所述服务器相对应的冷却单元的压降超出设定压降范围的情况下,发出用于提醒对所述冷却单元进行检修的通知。
根据本发明一实施方式,所述方法还包括:在所述多个第一类运行参数示出所述服务器的温度小于第一设定阈值且大于第二设定阈值,所述第二类运行参数示出与所述服务器相对应的冷却单元的压降符合设定压降范围,并且所述第三类运行参数示出所述服务器相对应的冷却单元未发生漏液的情况下,增加所述服务器相对应的冷却单元的进液流量;在所述多个第一类运行参数示出所述服务器的温度小于第三设定阈值,所述第二类运行参数示出与所述服务器相对应的冷却单元的压降符合设定压降范围,并且所述第三类运行参数示出所述服务器相对应的冷却单元未发生漏液的情况下,减小所述服务器相对应的冷却单元的进液流量;其中,所述第一设定阈值大于第二设定阈值,第二设定阈值大于第三设定阈值。
根据本发明一实施方式,所述方法还包括:在所述多个第一类运行参数示出所述服务器的温度大于第一设定阈值的情况下,对所述服务器进行关机处理,并关闭所述冷却单元的进液开关。
根据本发明一实施方式,所述方法还包括:将所述第一类运行参数、所述第二类运行参数、所述第二类运行参数以及对所述多个服务器和所述多个冷却单元的运行进行控制的方式以设定方式展示。
根据本发明一实施方式,所述第一类运行参数包括以下至少之一:所述服务器的CPU和/或GPU的温度;所述服务器的CPU和/或GPU的占用率;所述服务器的CPU和/或GPU的功耗。
根据本发明一实施方式,所述冷却单元的第二类运行参数通过冷却液分配单元获取。
根据本发明一实施方式,所述冷却单元的第三类运行参数通过与所述冷却单元相对应的服务器获取。
根据本发明第二方面,还提供了一种服务器系统的冷却系统的控制装置,所述装置包括:第一获取模块,用于获取每一所述服务器的多个第一类运行参数;第二获取模块,用于获取每一所述冷却单元的第二类运行参数和第三类运行参数;控制模块,用于根据所述第一类运行参数、所述第二类运行参数和所述第二类运行参数,对所述多个服务器和所述多个冷却单元的运行进行控制;其中,所述多个第一类运行参数能够示出所述服务器的温度变化趋势,所述第二类运行参数能够示出所述冷却单元的压降变化趋势,所述第三类运行参数能够示出所述冷却单元是否发生漏液。
根据本发明第三方面,又提供了一种服务器系统,所述服务器系统包括如上所述的服务器系统的冷却系统的控制装置。
本发明实施例提供的一种服务器系统的冷却系统的控制方法、装置及服务器系统,服务器系统包括多个服务器,冷却系统配置多个冷却单元,每一冷却单元对应一个服务器,该方法中首先获取每一服务器的多个第一类运行参数,多个第一类运行参数能够表示出服务器的温度,然后获取每一冷却单元的第二类运行参数和第三类运行参数,第二类运行参数能够表示出冷却单元的压力变化,第三类运行参数能够表示出冷却单元是否发生故障;根据第一类运行参数的第一参数范围、第二类参数的第二参数范围和第三类参数的第三参数范围,确定是否针对冷却单元进行报警控制。由此,将服务器系统的冷却单元和服务器联动起来,根据服务器的运行参数和冷却单元的运行参数,确定是否针对冷却单元进行报警控制,能够有效控制服务器的CPU或GPU稳定在一个温度范围内,避免服务器和冷却单元误报引起不必要的关机,有效提升服务器系统的使用效率。
需要理解的是,本发明的教导并不需要实现上面的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本发明的其他实施方式还能够实现上面未提到的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本发明实施例服务器系统的冷却系统的控制方法的应用场景示意图;
图2示出了本发明实施例服务器系统的冷却系统的冷却单元与服务器节点之间的连接关系示意图;
图3示出了本发明实施例服务器系统的冷却系统的控制方法的实现流程示意图;
图4示出了本发明实施例对多个服务器和多个冷却单元的运行进行控制的展示方式示意图;
图5示出了本发明实施例服务器系统的冷却系统的控制装置的组成结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为使本发明更加透彻和完整,并能够将本发明的范围完整地传达给本领域的技术人员。
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
图1示出了本发明实施例服务器系统的冷却系统的控制方法的应用场景示意图。
如图1所示,本发明实施例服务器系统的冷却系统的控制方法可以应用于包括CDU和服务器机架Rack的服务器系统。Rack中可以配置多个服务器,CDU通过Manifold(分流板)与服务器机架Rack上配置的服务器连接,每一服务器可以配置一个CDU单元。同时,还可以多个服务器配置一个CDU单元。本发明实施例中以一个服务器配置一个CDU单元为例,对方案进行详细描述。
CDU的出液端流出来的冷却液体通过Manifold来分配给Rack上面每台服务器的CDU冷板所需要的冷却液体流量,再将CDU冷板上的出液流量在通过CDU换热,进行反复循环,保证冷板的进液温度稳定在一个合理的范围内。
图2示出了本发明实施例服务器系统的冷却系统的冷却单元与服务器节点之间的连接关系示意图。
如图2所示,将每一个服务器视为服务器系统中的一个节点,这里在为每一服务器节点配置的CDU单元可以包括多个CPU冷板,采用快插的方式连接,并且每一CDU单元与相对应的服务器节点之间配置调节阀,调节阀可以增大或减小CDU单元的进水流量。服务器系统的冷却系统CDU自身包含流量计。
对于每一服务器节点,可以获取到相应的服务器节点的节点温度,以及CDU单元的进水端压力和出水端压力。通过节点温度和进水端压力和出水端压力可以更精准的对每一CDU单元进行独立控制,例如:增加或减小单个CDU单元的进水流量等。有效提高了对CDU的控制效率,在保证服务器系统正常运行的同时,有效降低CDU的能耗。
图3示出了本发明实施例服务器系统的冷却系统的控制方法的实现流程示意图。
参考图3,本发明实施例服务器系统的冷却系统的控制方法,服务器系统包括多个服务器,冷却系统配置多个冷却单元,每一冷却单元对应一个服务器,至少包括如下操作流程:操作301,获取每一服务器的多个第一类运行参数,多个第一类运行参数能够表示出服务器的温度;操作302,获取每一冷却单元的第二类运行参数和第三类运行参数,第二类运行参数能够表示出冷却单元的压力变化,第三类运行参数能够表示出冷却单元是否发生故障;操作303,根据第一类运行参数的第一参数范围、第二类参数的第二参数范围和第三类参数的第三参数范围,确定是否针对冷却单元进行报警控制。
在操作301中,获取每一服务器的多个第一类运行参数,多个第一类运行参数能够表示出服务器的温度。
服务器的CPU和GPU通常是服务器中最容易出现温度升高的器件,CPU和GPU的温度可以从很大程度上表示出服务器的运行状态,因此,在本发明这一实施方式中,第一类运行参数包括以下至少之一:
服务器的CPU和/或GPU的温度;
服务器的CPU和/或GPU的占用率;
服务器的CPU和/或GPU的功耗。
需要说明的是,还可以采用其他参数作为服务器的第一类运行参数,例如:在服务器上配置多个温度采集点,并确定每一温度采集点所采集的温度的权重,最终根据多个温度采集点所采集的温度值以及每一温度采集点的温度的权重来确定服务器的温度。同样的,还可以根据实际情况来设置其他参数作为服务器的第一类运行参数。
在操作302中,获取每一冷却单元的第二类运行参数和第三类运行参数,第二类运行参数能够表示出冷却单元的压力变化,第三类运行参数能够表示出冷却单元是否发生故障。
在本发明这一实施方式中,冷却单元的第二类运行参数通过冷却液分配单元获取。
第二类运行参数可以是冷却单元的压降,返回参考图2,冷却单元的压降可以通过CDU来获取。举例说明,对于为服务器节点1配置的冷却单元,冷却单元的压降即为节点压力1.1与节点压力1的差值。
在本发明这一实施方式中,冷却单元的第三类运行参数通过与冷却单元相对应的服务器获取。
举例说明,第三类运行参数可以是CDU单元的漏液检测线的检测值。CDU单元的漏液检测线的检测值可以通过与CDU单元相应的服务器获取。
在操作303中,根据第一类运行参数的第一参数范围、第二类参数的第二参数范围和第三类参数的第三参数范围,确定是否针对冷却单元进行报警控制。
在本发明这一实施方式中,可以采用以下操作实现根据第一类运行参数的第一参数范围、第二类参数的第二参数范围和第三类参数的第三参数范围确定是否针对冷却单元进行报警控制:在第一类运行参数示出服务器的温度小于第一设定阈值并且第三类运行参数示出服务器相对应的冷却单元未发生故障的情况下,但是第二类运行参数示出与服务器相对应的冷却单元的压降超出设定压降范围的情况下,发出用于提醒对冷却单元进行检修的通知。
第一设定阈值可以根据服务器的正常运行状态下的温度设定。第一类运行参数示出服务器的温度小于第一设定阈值的情况下,服务器能够正常运行。若此时服务器所检测到的冷却单元的漏液检测线参数表示出冷却单元未发生故障,但是第二类运行参数示出与服务器相对应的冷却单元的压降超出设定压降范围,则说明与服务器相对应的冷却单元的压降需要调整。冷却单元的压降稳定在设定范围内即可保证冷却单元正常工作,并进一步保证相对应的服务器能够有效降温正常运行。由此,可以发出用于提醒对冷却单元进行检修的通知,通知的内容可以表示出需要检修的问题是冷却单元的压降超出设定范围。
在本发明这一实施方式中,还在多个第一类运行参数示出服务器的温度小于第一设定阈值且大于第二设定阈值,第二类运行参数示出与服务器相对应的冷却单元的压降符合设定压降范围,并且第三类运行参数示出服务器相对应的冷却单元未发生漏液的情况下,增加服务器相对应的冷却单元的进液流量。其中,第一设定阈值大于第二设定阈值。
在本发明这一实施方式中,还在多个第一类运行参数示出服务器的温度小于第三设定阈值,第二类运行参数示出与服务器相对应的冷却单元的压降符合设定压降范围,并且第三类运行参数示出服务器相对应的冷却单元未发生漏液的情况下,减小服务器相对应的冷却单元的进液流量。其中,第一设定阈值大于第二设定阈值,第二设定阈值大于第三设定阈值。
举例说明,与服务器相对应的冷却单元的压降符合设定压降范围并且未发生漏液,则说明冷却单元运行正常。此时,若服务器温度升高,但为达到可能导致服务器发生故障的第一设定阈值的情况下,可以通过增加进液流量的方式对服务器进行冷却,加速对服务器进行降温以保证服务器正常运行。
若此时服务器温度非常低,小于第三设定阈值的情况下,说明服务器此时的功率较小,发热量较小,可以通过减小冷却单元进液流量的方式,在保证服务器正常运行的情况下,有效节约冷却单元的能耗,避免能源浪费。
在本发明这一实施方式中,还在多个第一类运行参数示出服务器的温度大于第一设定阈值的情况下,对服务器进行关机处理,并关闭冷却单元的进液开关。
若服务器温度大于第一设定温度,则服务器有可能已经发生故障,通过增加相应的冷却单元的进液流量的方式已经无法有效降低服务器的温度,此时,就需要对服务器进行关机处理。同时,此时该服务器相对应的冷却单元也不具有继续工作的必要性,因此,可以同时关闭与该服务器相对应的冷却单元的进液开关。
在本发明这一实施方式中,还将第一类运行参数、第二类运行参数、第二类运行参数以及对多个服务器和多个冷却单元的运行进行控制的方式以设定方式展示。
图4示出了本发明实施例对多个服务器和多个冷却单元的运行进行控制的展示方式示意图。
参考图4,通过本发明实施例所提供的服务器系统的冷却系统的控制方法,对每一服务器节点的CPU/GPU温度、相对应的CDU压降、能够示出服务器状态的漏液检测线值的变化。
管理界面上可以示出以上参数,同时可以示出根据以上参数确定的是否告警的结果、服务器shutdown(关机)按钮是否打开、CDU节点进液流量按钮是否打开。具体的:
针对CPU/GPU温度,可以在测试之前根据CPU/GPU型号给出一个正常温度范围,超过温度范围后,可以以红色显示。
针对CDU压降,测试之前会提供节点压降的正常范围值,超过正常范围值后,就会显示红色。
针对服务器状态,如果漏液检测值发生变化,服务器就会告警,管理界面上面的灯就显示红色。
针对CDU状态,如果压降超出正常范围值,管理界面上CDU状态灯就显示红色。
针对告警界面,如果以上CPU/GPU温度、CDU压降、服务器状态和CDU状态的状态指示都是绿色,则告警界面的灯可以以绿色显示。如果CPU/GPU温度状态为红色,告警界面的灯可以以红色显示,否则均为黄色显示。
针对服务器shutdown按钮,只有CPU/GPU温度状态为红色的情况下,服务器shutdown按钮才打开。
针对CDU节点进液流量按钮,只有CPU/GPU温度状态为红色,CDU节点进液流量进行关闭。
需要说明的是,图4中,以序号“1”表示相应的指示灯为绿色,以序号“2”表示相应的指示灯为黄色,以序号“3”表示相应的指示灯为红色。
本发明实施例提供的一种服务器系统的冷却系统的控制方法、装置及服务器系统,服务器系统包括多个服务器,冷却系统配置多个冷却单元,每一冷却单元对应一个服务器,该方法中首先获取每一服务器的多个第一类运行参数,多个第一类运行参数能够表示出服务器的温度,然后获取每一冷却单元的第二类运行参数和第三类运行参数,第二类运行参数能够表示出冷却单元的压力变化,第三类运行参数能够表示出冷却单元是否发生故障;根据第一类运行参数的第一参数范围、第二类参数的第二参数范围和第三类参数的第三参数范围,确定是否针对冷却单元进行报警控制。由此,将服务器系统的冷却单元和服务器联动起来,根据服务器的运行参数和冷却单元的运行参数,确定是否针对冷却单元进行报警控制,能够有效控制服务器的CPU或GPU稳定在一个温度范围内,避免服务器和冷却单元误报引起不必要的关机,有效提升服务器系统的使用效率。
同理,基于上文服务器系统的冷却系统的控制方法,本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有程序,当程序被处理器执行时,使得处理器至少执行如下的操作步骤:操作301,获取每一服务器的多个第一类运行参数,多个第一类运行参数能够表示出服务器的温度;操作302,获取每一冷却单元的第二类运行参数和第三类运行参数,第二类运行参数能够表示出冷却单元的压力变化,第三类运行参数能够表示出冷却单元是否发生故障;操作303,根据第一类运行参数的第一参数范围、第二类参数的第二参数范围和第三类参数的第三参数范围,确定是否针对冷却单元进行报警控制。
进一步,基于如上文服务器系统的冷却系统的控制方法,本发明实施例还提供一种服务器系统的冷却系统的控制装置,如图5,该装置50包括:第一获取模块501,用于获取每一服务器的多个第一类运行参数;第二获取模块502,用于获取每一冷却单元的第二类运行参数和第三类运行参数;控制模块503,用于根据第一类运行参数、第二类运行参数和第二类运行参数,对多个服务器和多个冷却单元的运行进行控制;其中,多个第一类运行参数能够示出服务器的温度变化趋势,第二类运行参数能够示出冷却单元的压降变化趋势,第三类运行参数能够示出冷却单元是否发生漏液。
进一步,基于如上文服务器系统的冷却系统的控制方法,本发明实施例还提供一种服务器系统,服务器系统包括如上的服务器系统的冷却系统的控制装置。
这里需要指出的是:以上对针对服务器系统的冷却系统的控制装置及服务器系统实施例的描述,与前述图1至4所示的方法实施例的描述是类似的,具有同前述图1至4所示的方法实施例相似的有益效果,因此不做赘述。对于本发明服务器系统的冷却系统的控制装置及服务器系统实施例中未披露的技术细节,请参照本发明前述图1至4所示的方法实施例的描述而理解,为节约篇幅,因此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种服务器系统的冷却系统的控制方法,所述服务器系统包括多个服务器,所述冷却系统配置多个冷却单元,每一所述冷却单元对应一个所述服务器,所述方法包括:
获取每一所述服务器的多个第一类运行参数,所述多个第一类运行参数能够表示出所述服务器的温度;
获取每一所述冷却单元的第二类运行参数和第三类运行参数,所述第二类运行参数能够表示出所述冷却单元的压力变化,所述第三类运行参数能够表示出所述冷却单元是否发生故障;
根据所述第一类运行参数的第一参数范围、所述第二类参数的第二参数范围和所述第三类参数的第三参数范围,确定是否针对所述冷却单元进行报警控制。
2.根据权利要求1所述的方法,所述根据所述第一类运行参数的第一参数范围、所述第二类参数的第二参数范围和所述第三类参数的第三参数范围,确定是否针对所述冷却单元进行报警控制,包括:
在所述第一类运行参数示出所述服务器的温度小于第一设定阈值并且所述第三类运行参数示出所述服务器相对应的冷却单元未发生故障的情况下,但是所述第二类运行参数示出与所述服务器相对应的冷却单元的压降超出设定压降范围的情况下,发出用于提醒对所述冷却单元进行检修的通知。
3.根据权利要求1所述的方法,所述方法还包括:
在所述多个第一类运行参数示出所述服务器的温度小于第一设定阈值且大于第二设定阈值,所述第二类运行参数示出与所述服务器相对应的冷却单元的压降符合设定压降范围,并且所述第三类运行参数示出所述服务器相对应的冷却单元未发生漏液的情况下,增加所述服务器相对应的冷却单元的进液流量;
在所述多个第一类运行参数示出所述服务器的温度小于第三设定阈值,所述第二类运行参数示出与所述服务器相对应的冷却单元的压降符合设定压降范围,并且所述第三类运行参数示出所述服务器相对应的冷却单元未发生漏液的情况下,减小所述服务器相对应的冷却单元的进液流量;
其中,所述第一设定阈值大于第二设定阈值,第二设定阈值大于第三设定阈值。
4.根据权利要求1所述的方法,所述方法还包括:
在所述多个第一类运行参数示出所述服务器的温度大于第一设定阈值的情况下,对所述服务器进行关机处理,并关闭所述冷却单元的进液开关。
5.根据权利要求1所述的方法,所述方法还包括:
将所述第一类运行参数、所述第二类运行参数、所述第二类运行参数以及对所述多个服务器和所述多个冷却单元的运行进行控制的方式以设定方式展示。
6.根据权利要求1-5中任一项所述的方法,所述第一类运行参数包括以下至少之一:
所述服务器的CPU和/或GPU的温度;
所述服务器的CPU和/或GPU的占用率;
所述服务器的CPU和/或GPU的功耗。
7.根据权利要求1-5中任一项所述的方法,所述冷却单元的第二类运行参数通过冷却液分配单元获取。
8.根据权利要求1-5中任一项所述的方法,所述冷却单元的第三类运行参数通过与所述冷却单元相对应的服务器获取。
9.一种服务器系统的冷却系统的控制装置,所述装置包括:
第一获取模块,用于获取每一所述服务器的多个第一类运行参数;
第二获取模块,用于获取每一所述冷却单元的第二类运行参数和第三类运行参数;
控制模块,用于根据所述第一类运行参数、所述第二类运行参数和所述第二类运行参数,对所述多个服务器和所述多个冷却单元的运行进行控制;
其中,所述多个第一类运行参数能够示出所述服务器的温度变化趋势,所述第二类运行参数能够示出所述冷却单元的压降变化趋势,所述第三类运行参数能够示出所述冷却单元是否发生漏液。
10.一种服务器系统,所述服务器系统包括权利要求9所述的服务器系统的冷却系统的控制装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111682097.5A CN114356059A (zh) | 2021-12-31 | 2021-12-31 | 服务器的冷却液分配设备控制方法、装置及服务器系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111682097.5A CN114356059A (zh) | 2021-12-31 | 2021-12-31 | 服务器的冷却液分配设备控制方法、装置及服务器系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114356059A true CN114356059A (zh) | 2022-04-15 |
Family
ID=81105414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111682097.5A Pending CN114356059A (zh) | 2021-12-31 | 2021-12-31 | 服务器的冷却液分配设备控制方法、装置及服务器系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114356059A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024031900A1 (zh) * | 2022-08-08 | 2024-02-15 | 浪潮电子信息产业股份有限公司 | 一种液冷服务器机柜 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120180979A1 (en) * | 2010-04-19 | 2012-07-19 | Steve Harrington | Computer Cooling System And Method of Use |
EP2663172A1 (en) * | 2012-05-11 | 2013-11-13 | eCube Computing GmbH | Method for operating a data centre with efficient cooling means |
EP3182813A1 (de) * | 2015-12-18 | 2017-06-21 | ABB Technology Oy | Umrichterkühlsystem |
CN110602927A (zh) * | 2019-09-20 | 2019-12-20 | 苏州浪潮智能科技有限公司 | 一种用于数据通信设备中心液体冷却系统的冷量分配单元 |
US20210318062A1 (en) * | 2020-04-08 | 2021-10-14 | Bitspower International Co., Ltd. | Warning system for water-cooling heat dissipation device |
CN215262290U (zh) * | 2021-06-30 | 2021-12-21 | 潍柴动力股份有限公司 | 一种电池系统及电池系统漏液检测装置 |
-
2021
- 2021-12-31 CN CN202111682097.5A patent/CN114356059A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120180979A1 (en) * | 2010-04-19 | 2012-07-19 | Steve Harrington | Computer Cooling System And Method of Use |
EP2663172A1 (en) * | 2012-05-11 | 2013-11-13 | eCube Computing GmbH | Method for operating a data centre with efficient cooling means |
EP3182813A1 (de) * | 2015-12-18 | 2017-06-21 | ABB Technology Oy | Umrichterkühlsystem |
CN110602927A (zh) * | 2019-09-20 | 2019-12-20 | 苏州浪潮智能科技有限公司 | 一种用于数据通信设备中心液体冷却系统的冷量分配单元 |
US20210318062A1 (en) * | 2020-04-08 | 2021-10-14 | Bitspower International Co., Ltd. | Warning system for water-cooling heat dissipation device |
CN215262290U (zh) * | 2021-06-30 | 2021-12-21 | 潍柴动力股份有限公司 | 一种电池系统及电池系统漏液检测装置 |
Non-Patent Citations (3)
Title |
---|
冯亚利: "《一体式自循环液冷机箱设计及性能测试》", 《航空精密制造技术》, vol. 56, no. 2, pages 40 - 45 * |
朱信龙: "《集装箱储能系统热管理系统的现状及发展》", 《储能科学与技术》, vol. 11, no. 1, pages 107 - 112 * |
高益兵: "《刀片服务器液冷系统的设计和探究》", 《电子机械工程》, vol. 36, no. 6, pages 20 - 22 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024031900A1 (zh) * | 2022-08-08 | 2024-02-15 | 浪潮电子信息产业股份有限公司 | 一种液冷服务器机柜 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10747187B2 (en) | Building management system with voting-based fault detection and diagnostics | |
CN109441864B (zh) | 一种服务器风扇控制方法、装置、设备及计算机存储介质 | |
US10394293B2 (en) | Method for preventing over-heating of a device within a data processing system | |
WO2021077749A1 (zh) | 一种液冷散热系统、散热控制方法及控制芯片 | |
US20090210735A1 (en) | Apparatus, system, and method for controlling power sequence in a blade center environment | |
US20170350403A1 (en) | Fan failure detection and reporting | |
CN109034424A (zh) | 一种变电站设备维护管理方法、装置及终端设备 | |
CN114356059A (zh) | 服务器的冷却液分配设备控制方法、装置及服务器系统 | |
EP2607987A1 (en) | Computing apparatus and system for remote control of operating states | |
US20190191593A1 (en) | Water-cooling heat-dissipating assembly and electronic device | |
US8370000B2 (en) | System and method for increasing the power efficiency of cooling fans | |
TW201414408A (zh) | 溫度控制系統及其溫度控制方法 | |
CN107735744B (zh) | 阀故障预测的系统、方法和介质 | |
CN115826716A (zh) | 制冷方法、虚装置和系统 | |
CN113534934A (zh) | 一种单独液冷智能控制系统、方法及服务器 | |
CN109192340A (zh) | 百万千瓦级压水堆核电站发电机测量点监测的方法及装置 | |
CN109815080A (zh) | 计算机设备的三维监控方法及其装置 | |
US11770050B2 (en) | Heat exchange system and motor | |
CN109460340A (zh) | 计算机硬件监控方法及装置 | |
CN112433585A (zh) | 一种计算机智能散热系统 | |
CN117349056A (zh) | 服务器漏液保护方法、装置以及存储介质 | |
CN211149368U (zh) | 计算机管理系统 | |
CN109932065A (zh) | 适用于超导纳米线单光子探测系统的监控系统、方法、终端、介质 | |
CN117113835A (zh) | 热力系统的信息预测方法、装置、设备及存储介质 | |
CN216313329U (zh) | 一种防低温型无源光网络onu设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |