CN110557925A - 用于数据中心电子机架的液体冷却的泄漏检测和响应系统 - Google Patents

用于数据中心电子机架的液体冷却的泄漏检测和响应系统 Download PDF

Info

Publication number
CN110557925A
CN110557925A CN201811433804.5A CN201811433804A CN110557925A CN 110557925 A CN110557925 A CN 110557925A CN 201811433804 A CN201811433804 A CN 201811433804A CN 110557925 A CN110557925 A CN 110557925A
Authority
CN
China
Prior art keywords
server
liquid
rack
cooling
supply line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811433804.5A
Other languages
English (en)
Inventor
高天翼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of CN110557925A publication Critical patent/CN110557925A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20836Thermal management, e.g. server temperature control
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M3/00Investigating fluid-tightness of structures
    • G01M3/02Investigating fluid-tightness of structures by using fluid or vacuum
    • G01M3/26Investigating fluid-tightness of structures by using fluid or vacuum by measuring rate of loss or gain of fluid, e.g. by pressure-responsive devices, by flow detectors
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks
    • H05K7/1488Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures
    • H05K7/1489Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures characterized by the mounting of blades therein, e.g. brackets, rails, trays
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20218Modifications to facilitate cooling, ventilating, or heating using a liquid coolant without phase change in electronic enclosures
    • H05K7/20254Cold plates transferring heat from heat source to coolant
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20218Modifications to facilitate cooling, ventilating, or heating using a liquid coolant without phase change in electronic enclosures
    • H05K7/20272Accessories for moving fluid, for expanding fluid, for connecting fluid conduits, for distributing fluid, for removing gas or for preventing leakage, e.g. pumps, tanks or manifolds
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20718Forced ventilation of a gaseous coolant
    • H05K7/20727Forced ventilation of a gaseous coolant within server blades for removing heat from heat source
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20763Liquid cooling without phase change
    • H05K7/20772Liquid cooling without phase change within server blades for removing heat from heat source
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20763Liquid cooling without phase change
    • H05K7/20781Liquid cooling without phase change within cabinets for removing heat from server blades
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20763Liquid cooling without phase change
    • H05K7/2079Liquid cooling without phase change within rooms for removing heat from cabinets

Abstract

电子机架包括机架歧管和服务器刀片,其中,机架歧管具有机架液体供应线和机架液体返回线,服务器刀片以堆叠布置。每个服务器刀片包括冷板和服务器液体分配回路,以及泄漏检测器,泄漏检测器配置成检测分配至服务器刀片的冷却液体的泄漏。电子机架还包括与服务器刀片对应的服务器FCD和联接至服务器FCD和服务器刀片的泄漏检测器的RMC单元。在一个实施方式中,响应于从第一服务器刀片的第一泄漏检测器接收的指示第一服务器刀片内存在泄漏的信号,RMC单元配置成向第一服务器FCD发送控制信号以减少待分配至第一服务器刀片的冷却液体的量或使完全液体绕开。

Description

用于数据中心电子机架的液体冷却的泄漏检测和响应系统
技术领域
本发明的实施方式总体上涉及数据中心。更具体地,本发明的实施方式涉及用于数据中心中的电子机架的液体冷却的液体分配单元设计。
背景技术
散热是计算机系统和数据中心设计的重要因素。高性能电子组件(诸如,封装在服务器内部的高性能处理器)的数目稳步增加,从而使服务器的常规操作期间产生和消散的热量增加。如果允许服务器运行的环境随着时间而升高温度,则数据中心内使用的服务器的可靠性降低。保持合适的热环境对于数据中心中的这些服务器的正常运行以及服务器性能和寿命来说是至关重要的。这需要更有效和高效的散热解决方案,特别是在冷却这些高性能服务器的情况下尤其如此。
功率密集型处理器能够实现诸如深度学习的密集计算方案。具有这种处理器(即,高功率中央处理单元(CPU)和/或通用或图形处理单元(GPU))的电子服务器具有每体积空间的非常高的功率密度。液体冷却是针对高功率密度的合适的热管理解决方案。
在液体冷却中,歧管被用于经由主入口端口/主出口端口和流体子端口分配和调节流体。主入口端口和主出口端口连接至外部冷却源,并且子端口与服务器回路或冷却设备回路连接。流体分配歧管是一项成熟技术;然而,大部分传统歧管设计在一些应用场景中效率不高。
在液体冷却可以作为成熟的方案应用并在数据中心中规模采用之前,主要挑战之一是可靠性。可靠性问题为流体泄漏。存在用于改善液体冷却系统可靠性的多种方法,诸如改善产品质量、开发组件测试程序和标准(软管连接器、歧管等)、流体选择标准、材料选择标准等。然而,仍然经常可能发生泄漏,并且缺乏有效的机构来降低液体泄漏的风险。
发明内容
根据本申请的一方面,提供了一种电子机架,其包括:
机架歧管,所述机架歧管具有机架液体供应线和机架液体返回线,所述机架液体供应线从冷却液体源接收冷却液体,所述机架液体返回线使较暖液体返回到所述冷却液体源;
多个服务器刀片,所述多个服务器刀片堆叠布置,其中,所述服务器刀片中的每个包括一个或多个冷板和服务器液体分配回路,所述一个或多个冷板与一个或多个信息技术(IT)组件相关联,所述服务器液体分配回路从所述机架歧管接收所述冷却液体并将所述冷却液体分配至所述冷板以交换由所述IT组件产生的热,从而将所述冷却液体转变成所述较暖液体,其中,所述服务器刀片中的每个还包括泄漏检测器,所述泄漏检测器配置成检测分配至所述服务器刀片的所述冷却液体的泄漏;
多对服务器液体供应线和服务器液体返回线,每对与所述服务器刀片中的一个对应,其中,所述服务器液体供应线和所述服务器液体返回线联接在所述机架歧管与所述服务器刀片的所述服务器液体分配回路之间;
多个服务器流控制设备(FCD),每个服务器流控制设备与多对所述服务器液体供应线和所述服务器液体返回线中的一个对应,所述多个服务器流控制设备包括联接至第一服务器刀片的、成对的第一服务器液体供应线和第一服务器液体返回线的第一服务器FCD;
机架管理控制器(RMC)单元,所述机架管理控制器单元联接至所述服务器FCD和所述服务器刀片的泄漏检测器,其中,所述RMC配置成响应于从所述第一服务器刀片的第一泄漏检测器接收的指示所述第一服务器刀片内存在液体泄漏的信号,向所述第一服务器FCD发送控制信号以减少分配至所述第一服务器刀片的所述冷却液体的量。
根据本申请的另一方面,提供了一种数据中心的电子机架,其包括:
机架歧管,所述机架歧管具有机架液体供应线和机架液体返回线,所述机架液体供应线从冷却液体源接收冷却液体,所述机架液体返回线使较暖液体返回到所述冷却液体源;
多个服务器刀片,所述多个服务器刀片堆叠布置,其中,所述服务器刀片中的每个包括一个或多个冷板和服务器液体分配回路,所述一个或多个冷板与一个或多个信息技术(IT)组件相关联,所述服务器液体分配回路从所述机架歧管接收所述冷却液体并将所述冷却液体分配至所述冷板以交换由所述IT组件产生的热,从而将所述冷却液体转变成所述较暖液体,其中,所述服务器刀片中的至少一个还包括泄漏检测器,所述泄漏检测器配置成检测分配至所述服务器刀片的所述冷却液体的泄漏;
机架流控制设备(FCD),所述机架流控制设备联接至所述机架液体供应线和所述机架液体返回线;以及
机架管理控制器(RMC)单元,所述机架管理控制器单元联接至所述机架FCD和所述服务器刀片中的每个服务器刀片的所述泄漏检测器,其中,所述RMC配置成响应于从任何所述服务器刀片中的泄漏检测器接收的指示存在液体泄漏的信号,向所述机架FCD发送控制信号以减少到达所述服务器刀片的所述冷却液体的量。
附图说明
本发明的实施方式在附图的各图中以举例而非限制的方式示出,附图中的相同的参考数字指代相似的元件。
图1是示出根据一个实施方式的数据中心设施的示例的框图。
图2是示出根据一个实施方式的电子机架的示例的框图。
图3是示出根据一个实施方式的冷板配置的示例的框图。
图4A至图4B是示出根据某些实施方式的电子机架的示例的框图。
图5是示出根据一个实施方式的可以实现为服务器刀片的一部分的冷却模块的示例的框图。
具体实施方式
将参考以下所讨论的细节来描述本发明的各种实施方式和方面,并且附图将示出所述各种实施方式。下列描述和附图是对本发明的说明,而不应当解释为限制本发明。描述了许多特定细节以提供对本发明的各种实施方式的全面理解。然而,在某些情况下,并未描述众所周知的或常规的细节以提供对本发明的实施方式的简洁讨论。
本说明书中对“一个实施方式”或“实施方式”的提及意味着结合该实施方式所描述的特定特征、结构或特性可以包括在本发明的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各个地方的出现不必全部指同一实施方式。
本发明的实施方式集中在用于服务器液体冷却的泄漏响应设计。它提供了液体泄漏响应的基本构思,包括机械和热设计、控制设计以及信息技术(IT)响应设计。基本上,该概念是通过使用旁路回路来切断或转移供应至已经泄漏的冷却回路或冷却模块的流体。旁路回路的功能是绕过冷却回路/冷却模块。可以在机架级和/或服务器级实现旁路机构。
根据本发明的一个方面,电子机架包括具有机架液体供应线和机架液体返回线的机架歧管。机架液体供应线配置成从冷却液体源接收冷却液体。机架液体返回线配置成使携带从电子机架的服务器交换的热量的较暖液体返回到冷却液体源。电子机架还包括以堆叠布置的多个服务器刀片。服务器刀片中的每个包括一个或多个冷板和服务器液体分配回路,一个或多个冷板与一个或多个IT组件(例如,处理器、存储器和/或存储储设备)相关联,服务器液体分配回路从机架歧管接收冷却液体并将冷却液体分配至冷板以交换由IT组件产生的热量。每个服务器刀片还包括配置成检测分配至服务器刀片的冷却液体的泄漏的泄漏检测器。
电子机架还包括多对服务器液体供应线和服务器液体返回线。每对服务器液体供应线和服务器液体返回线与服务器刀片中的一个对应。服务器液体供应线和服务器液体返回线联接在机架歧管与服务器刀片的服务器液体分配回路之间。电子机架还包括与服务器刀片对应的多个服务器流控制设备(FCD)。每个服务器FCD联接至多对的服务器液体供应线和服务器液体返回线中的一对,包括与第一服务器刀片的第一对服务器液体供应线和服务器液体返回线联接的第一服务器FCD。电子机架还包括联接至服务器FCD和服务器刀片的泄漏检测器的机架管理控制器(RMC)单元。在一个实施方式,RMC单元配置成响应于从第一服务器刀片的第一泄漏检测器接收的指示第一服务器刀片内存在泄漏的信号,向第一服务器FCD发送控制信号以减少待分配至第一服务器刀片的冷却液体的量。在一个实施方式中,当检测到液体泄漏时,FCD可完全切断到服务器刀片的供应线。
根据一个实施方式,第一服务器FCD配置成阻挡基本上全部的冷却液体被分配至第一服务器刀片的第一液体分配回路。在特定实施方式中,第一服务器FCD配置成经由旁路路径或路线将冷却液体从第一服务器刀片的服务器供应线转移或改道至服务器返回线,从而绕过第一服务器刀片的液体分配回路。
根据另一实施方式,每个服务器刀片还至少包括设置在服务器液体供应线、服务器液体返回线之一上或者设置在两者上的液体压力传感器以感测在服务器刀片内流动的液体压力。如果液体压力降低至预定阈值以下,则意味着服务器刀片内可能存在液体泄漏。RMC单元配置成响应于从压力传感器接收的信号,激活服务器FCD以阻挡至少大量或大量的冷却液体被分配至服务器刀片或使用旁路机构转移至少大量或大量的冷却液体。
根据另一实施方式,机架FCD联接至机架液体供应线。机架FCD配置成控制待分配至服务器刀片的冷却液体的量。响应于从RMC单元接收的、指示服务器刀片中的至少一个内存在液体泄漏的信号,机架FCD被激活以阻挡或者转移至少大量的冷却液体,这减少了大量的冷却液体进入服务器刀片。根据又一实施方式,液体压力传感器可联接至机架液体供应线和/或机架液体返回线以在机架级感测液体压力。如果机架液体压力下降至预定阈值以下,则意味着服务器刀片中的至少一个内可能存在液体泄漏。作为响应,RMC单元可以激活机架FCD以减少至少大量或大量的冷却液体被分配至服务器刀片。
根据本发明的另一方面,电子机架包括具有机架液体供应线和机架液体返回线的机架歧管。机架液体供应线从冷却液体源接收冷却液体,并且机架液体返回线使携带被交换的热量的较暖液体返回到冷却液体源。电子机架包括堆叠布置的多个服务器刀片。每个服务器刀片包括一个或多个冷板和服务器液体分配回路,一个或多个冷板与一个或多个IT组件相关联,服务器液体分配回路接收冷却液体并将冷却液体分配至冷板以交换由IT组件产生的热量,进而将冷却液体转变成较暖液体。服务器刀片中的至少一个包括泄漏检测器以检测可能的液体泄漏。电子机架还包括至少联接至机架液体供应线的机架FCD、以及联接至机架FCD和服务器刀片的泄漏检测器的RMC单元。响应于从液体泄漏检测器接收的信号,RMC单元向机架FCD发送命令以减少流入到服务器刀片中的冷却液体的量,或完全切断流体。
根据一个实施方式,机架FCD配置成基本上阻挡全部冷却液体进入服务器刀片的液体分配回路。替代地,机架FCD配置成将至少大量或大量的冷却液体从机架液体供应线转移至机架液体返回线,从而绕过服务器刀片。根据另一实施方式,电子机架还包括设置在机架液体供应线或机架液体返回线上的机架液体压力传感器,以感测在机架液体供应线或机架液体返回线内流动的液体压力。RMC单元配置成响应于从机架液体压力传感器接收的指示液体压力降低至预定阈值以下的信号,激活机架FCD以减少进入服务器刀片的冷却液体的量。
根据又一实施方式,每个服务器刀片包括至少联接至服务器液体供应线的服务器FCD,当服务器FCD激活时,服务器FCD配置成减少进入相应的服务器刀片的冷却液体的量。服务器FCD可以仅为用于基本上关闭或阻挡液体进入服务器刀片的阀。替代地,当服务器FCD激活时,服务器FCD可以将大多数或全部冷却液体从服务器液体供应线转移至服务器液体返回线,从而绕过服务器刀片的液体分配回路。
图1是示出根据一个实施方式的数据中心或数据中心单元的示例的框图。在本示例中,图1示出了数据中心的至少一部分的俯视图。参考图1,根据一个实施方式,数据中心系统100包括信息技术(IT)组件、设备或仪器的多行电子机架101-102,例如,通过网络(例如,互联网)向各种客户端提供数据服务的计算机服务器或计算节点。在本实施方式中,每行包括电子机架,诸如,电子机架110A-110N的阵列。然而,可实施更多行或更少行的电子机架。通常,行101-102平行对准,其中,前端彼此面对并且后端彼此背离,从而在行101-102中间形成通道103以允许管理人员在通道103中行走。然而,还可应用其它配置或布置。
在一个实施方式中,电子机架(例如,电子机架110A-110N)中的每个包括壳体以容纳在其中运行的IT组件的多个电子机架。电子机架可以包括散热液体歧管、多个服务器插槽以及能够插入服务器插槽中和从服务器插槽移除的多个服务器刀片。每个服务器刀片表示具有一个或多个处理器、存储器和/或永久性存储设备(例如,硬盘)的计算节点。至少一个处理器附接至液体冷板(还被称为冷板组件)以接收冷却液体。此外,一个或多个可选的冷却风扇与服务器刀片相关联,以向包含在服务器刀片中的计算节点提供空气冷却。应注意,散热系统120可联接到诸如数据中心系统100的多个数据中心系统。散热系统将数据中心内产生的大量热移出至大气。
在一个实施方式中,散热系统120包括连接到建筑物/容纳容器外部的冷却塔或干燥冷却器的外部液体回路。散热系统120可以包括但不限于蒸发冷却、自由空气、以及抛弃较大热质量和废热回收设计。散热系统120可包括提供冷却液体的冷却液体源或可联接至提供冷却液体的冷却液体源。
在一个实施方式中,每个服务器刀片模块化地联接到散热液体歧管,使得可以从电子机架移除服务器刀片,而不影响电子机架上的剩余服务器刀片和散热液体歧管的运行。在另一实施方式中,每个服务器刀片通过快速释放联接组件联接到散热液体歧管(还被称为冷却液体歧管),快速释放联接组件具有联接到柔性软管的第一液体入口连接器和第一液体出口连接器以将散热液体分配至处理器。第一液体入口连接器经由第二液体入口连接器从安装在电子机架的后端上的散热液体歧管接收散热液体。第一液体出口连接器经由第二液体出口连接器将携带有从处理器交换的热量的较暖或较热液体排出到散热液体歧管,然后回到电子机架内的冷却剂分配单元(CDU)。
在一个实施方式中,设置在每个电子机架的后端上的散热液体歧管联接到液体供应线132以从散热系统120接收散热液体(还被称为冷却液体)。散热液体通过附接到其上安装有处理器的冷板组件的液体分配回路来分配,以将热从处理器移除。冷板配置成与散热器类似,其中,液体分配管附接到冷板或嵌入到冷板中。携带有从处理器交换的热量而产生的较暖或较热液体经由液体返回线131输送回到散热系统120。液体供应线132和液体返回线131被称为数据中心或房间液体供应/返回线(例如,全局液体供应/返回线),其向电子机架行101-102中的所有供应散热液体。液体供应线132和液体返回线131联接到位于每个电子机架内的CDU的热交换器,从而形成主回路。热交换器的次级回路联接到电子机架中的每个服务器刀片,以将冷却液体输送至处理器的冷板。
在一个实施方式中,数据中心系统100还包括可选的气流供应系统135,以产生气流使得气流行进通过电子机架的服务器刀片的空气间隔,从而交换由于计算节点(例如,服务器)的运行而由计算节点产生的热,并将气流交换的热排出到房屋/房间/建筑物外部的外部环境108。例如,空气供应系统135产生凉的/冷的空气气流以从通道103循环通过电子机架110A-110N,从而带走交换的热量。冷气流通过电子机架的前端进入电子机架,并且暖/热气流从电子机架的后端离开电子机架。带有交换的热量的暖/热空气从房间/建筑物排出。因此,冷却系统是混合液体-空气冷却系统,其中由处理器产生的一部分热量经由相应冷板通过冷却液体移除,而由处理器(或其他电子器件或处理设备)产生的热量的剩余部分通过冷却气流移除。空气供应系统135可以连接至散热系统120以将热量引出到大气。
图2是示出根据一个实施方式的电子机架的框图。电子机架200可表示图1中示出的任意电子机架,例如,电子机架110A-110N。参考图2,根据一个实施方式,电子机架200包括但不限于可选的CDU 201、RMU 202以及一个或多个服务器刀片203A-203E(统称为服务器刀片203)。服务器刀片203可以分别从电子机架200的前端204或后端205插入到服务器插槽的阵列中。应注意,虽然这里示出了五个服务器刀片203A-203E,但是可在电子机架200内保持更多或更少的服务器刀片。还应注意,CDU 201、RMU 202和服务器刀片203的具体位置仅出于说明的目的而示出;还可实施CDU 201、RMU 202和服务器刀片203的其它布置或配置。在一个实施方式中,只要冷却风扇可以产生从前端到后端的气流,电子机架200就可以对环境开放或由机架容纳装置部分地包含。
此外,对于服务器刀片203中的至少一些,可选的风扇模块(未示出)与服务器刀片相关联。风扇模块中的每个包括一个或多个冷却风扇。风扇模块可安装在服务器刀片203的后端上或电子机架上,以产生从前端204流动、行进通过服务器刀片203的空气间隔并存在于电子机架200的后端205处的气流。
在一个实施方式中,CDU 201主要包括热交换器211、液体泵212和泵控制器(未示出)以及一些其它组件,诸如贮液器、电源、监控传感器等。热交换器211可为液体-液体热交换器。热交换器211包括具有入口端口和出口端口的第一回路以形成主回路,入口端口和出口端口具有联接到外部液体供应线132/返回线131的第一对液体连接器。联接到外部液体供应线132/返回线131的连接器可设置或安装在电子机架200的后端205上。液体供应线132/返回线131(还被称为房间液体供应线/返回线)联接至如上所述的散热系统120。此外,热交换器211还包括具有两个端口的第二回路以形成次级回路,两个端口具有联接到液体歧管225的第二对液体连接器,次级回路可包括用于向服务器刀片203供应冷却液体的供应歧管(还被称为机架液体供应线)和用于使较暖液体返回到CDU 201的返回歧管(也被称为机架液体返回线)。应注意,CDU 201可以是市售的任何种类的CDU或定制的CDU。因此,将不在本文中描述CDU 201的细节。
服务器刀片203中的每个可包括一个或多个IT组件(例如,中央处理单元或CPU、图形处理单元(GPU)、存储器和/或存储设备)。每个IT组件可执行数据处理任务,其中,IT组件可包括安装在存储设备中、载入存储器中并且由一个或多个处理器执行的软件以执行数据处理任务。服务器刀片203可包括联接到一个或多个计算服务器(还称为计算节点,诸如CPU服务器和GPU服务器)的主机服务器(称为主机节点)。主机服务器(具有一个或多个CPU)通常通过网络(例如,互联网)与客户端对接,以接收诸如存储服务(例如,基于云的存储服务,诸如,备份和/或恢复)的特定服务的请求,执行应用以执行某些操作(例如,作为软件即服务或SaaS平台的一部分的图像处理、深度数据学习算法或建模等)。响应于请求,主机服务器将任务分配给由主机服务器管理的一个或多个性能计算节点或计算服务器(具有一个或多个GPU)。性能计算服务器执行实际任务,这可能在运行期间产生热量。
电子机架200还包括RMU 202,RMU 202配置成提供和管理供应至服务器203和CDU201的电力。RMU 202可联接到电源单元(未示出)以管理电源单元的功率消耗。电源单元可包括必要的电路(例如,交流电(AC)到直流电(DC)电源转换器或直流到直流电源转换器、电池、变压器或调节器等)以向电子机架200的剩余组件提供电力。
在一个实施方式中,RMU 202包括优化模块221和机架管理控制器(RMC)222。RMC222可包括监控器以监控电子机架200内的多种组件(例如,计算节点203、CDU 201和风扇模块)的运行状态。具体地,监控器从多种传感器接收表示电子机架200的运行环境的运行数据。例如,监控器可接收表示处理器、冷却液体和空气的温度的运行数据,其可经由多种温度传感器捕获和收集。监控器还可接收表示由风扇模块和液体泵212产生的风扇功率和泵功率的数据,风扇功率和泵功率可与风扇和泵的各自速度成比例。这些运行数据被称为实时运行数据。此外,监控器还可例如从泄漏检测器和/或传感器(例如,液体传感器,温度传感器)接收表示是否在任何服务器刀片中发生液体泄漏的信号。应注意,监控器可实施为RMU 202内的单独模块。
基于运行数据,优化模块221使用预定优化函数或优化模型执行优化,以获得用于风扇模块的一组最优风扇速度和用于液体泵212的最优泵速度,使得液体泵212和风扇模块的总功率消耗达到最小值,同时与液体泵212以及风扇模块的冷却风扇相关联的运行数据处于它们各自的设计规格内。一旦已经确定最优泵速度和最优风扇速度,RMC 222基于最优泵速度和最优风扇速度配置液体泵212以及风扇模块的冷却风扇。
作为示例,基于最优泵速度,RMC 222与CDU 201的泵控制器通信以控制液体泵212的速度,进而控制待分配给至少一些服务器刀片203的、供应至液体歧管225的冷却液体的液体流动速率。类似地,基于最优风扇速度,RMC 222与风扇模块中的每个通信以控制风扇模块中的每个冷却风扇的速度,进而控制风扇模块的气流速度。应注意,风扇模块中的每个可利用其特定的最优风扇速度单独进行控制,并且不同的风扇模块和/或相同的风扇模块内的不同冷却风扇可具有不同的最优风扇速度。
图3是示出根据一个实施方式的处理器冷板配置的框图。处理器/冷板结构300可以代表如图2中所示的服务器刀片203中的任何处理器/冷板结构。参考图3,处理器301插塞在安装在印刷电路板(PCB)或母板302上的处理器插座上,印刷电路板(PCB)或母板302联接至数据处理系统或服务器的其他电子组件或电路。处理器301还包括附接至其的冷板303,冷板303联接至液体供应线132和液体返回线131。由处理器301产生的热量中的一部分经由冷板303通过冷却液体移除。热量的剩余部分进入下方的空气间隔305,可通过冷却风扇304产生的气流移除热量的剩余部分。
返回参考图2,根据一个实施方式,电子机架200包括联接至RMU 202以及至少机架液体供应线和/或机架液体返回线的机架FCD 230,以控制流向服务器刀片203的冷却液体的量。服务器刀片203中的每个还包括泄漏检测器(未示出)以检测服务器刀片内的液体泄漏。泄漏检测器可以是任何液体泄漏检测器。在一个实施方式中,响应于从服务器刀片的泄漏检测器接收的信号,RMC 222配置成向机架FCD 230发送命令以减少到达服务器刀片203的冷却液体的量。机架FCD 230可以仅仅为阀或开关,机架FCD 230配置到第一位置,冷却液体被允许流过机架歧管225以到达服务器刀片203。当机架FCD 230配置到第二位置时,冷却液体基本被阻挡。根据另一实施方式,响应于指示在服务器刀片203中的至少一个内存在液体泄漏的信号,RMC 222激活机架FCD 230以将冷却液体从机架液体供应线(联接至房间供应线132)转移至机架液体返回线(联接至房间返回线131),从而绕过服务器刀片203。
根据另一实施方式,服务器刀片203中的每个包括位于机架歧管225与服务器刀片203之间的诸如服务器FCD 250A-250E(被统称为服务器FCD 250)的服务器FCD,或与其相关联。服务器FCD 250中的每个配置成控制流入到服务器刀片203中的冷却液体的流量。如上所述,每个服务器刀片包括联接至机架供应线的服务器液体供应线和联接至机架返回线的服务器液体返回线。服务器液体供应线联接至服务器液体分配回路的一端,并且服务器液体返回线联接至服务器液体分配回路的另一端,使得冷却液体循环通过分配回路循环以进行热交换。服务器FCD中的每个联接至RMC 222,并且可以由RMC 222控制。
在一个实施方式,响应于从特定服务器刀片的泄漏检测器接收的、指示服务器刀片内存在液体泄漏的信号,RMC 222控制相应的服务器FCD以减少待分配给服务器刀片203的冷却液体的量。在一个实施方式中,服务器FCD配置成基本上或完全切断供应至服务器刀片的液体。替代地,服务器FCD将冷却液体从服务器供应线转移至服务器返回线,绕过服务器刀片的液体分配回路。
根据另一实施方式,除了泄漏检测器之外或代替泄漏检测器,可以使用液体压力传感器来检测是否存在液体泄漏。当存在液体泄漏时,泄漏很可能导致液体压力下降。液体压力传感器(被称为机架压力传感器)可以放置在机架歧管225上以检测机架歧管上的液体压力。替代地,液体压力传感器(被称为服务器压力传感器)可以放置在服务器供应线和/或服务器返回线上以感测流入到服务器刀片的液体分配线中的液体压力。机架压力传感器可以在机架级检测机架内的液体泄漏,而服务器压力传感器可以在服务器级检测特定服务器刀片内的液体泄漏。替代地,还可在多个位置处放置温度传感器(例如,附接至冷板)以检测是否存在液体泄漏。当温度上升而高于预定阈值或呈现非正常读数时,可发生可能的液体泄漏。
图4A是示出根据一个实施方式的电子机架的框图。电子机架400可表示图2的电子机架200。参考图4A,电子机架400包括以堆叠布置的服务器刀片410A-410B(被统称为服务器刀片410)的阵列。电子机架400还包括具有机架液体供应线225A和机架液体返回线225B的机架歧管。机架液体供应线225A配置成从外部冷却液态源接收冷却液体并将冷却液体分配至服务器刀片410中的每个。机架液体返回线225B配置成使携带从服务器刀片410的IT组件交换的热量的较暖液体返回到冷却液体源。
根据一个实施方式,服务器刀片410中的每个包括附接至一个或多个冷板(诸如冷板411A-411B(被统称为冷板411))的一个或多个IT组件。每个冷板附接至冷却液体在其中流动的服务器液体分配回路(未示出)。冷板的配置与散热器类似,其中,液体分配管附接至冷板或嵌入到冷板中。产生的较暖或较热液体携带从IT组件(例如,处理器)交换的热量。在一个实施方式中,服务器液体分配回路的第一端联接至服务器液体供应线(例如,服务器液体供应线401A-401B),然后服务器液体供应线联接至机架液体供应线225A。服务器液体分配回路的第二端联接至服务器液体返回线(例如,服务器液体返回线402A-402B),然后服务器液体返回线联接至机架液体返回线225B。每个服务器刀片经由其相应的服务器液体供应线从机架液体供应线225A接收冷却液体。每个服务器刀片经由其服务器液体返回线使携带交换热量的较暖液体返回到机架液体返回线225B。
根据一个实施方式,每个服务器刀片还包括诸如泄漏检测器413A-413B(被统称为泄漏检测器413)的液体泄漏检测器。泄漏检测器可以是任何种类的泄漏检测器,诸如配置成检测来自液体分配线的任何液体泄漏的传感器和/或机械结构。每个泄漏检测器通信地联接至RMC 222,其中RMC 222经由泄漏检测器413监控任何服务器刀片410内的任何可能的液体泄漏。
根据一个实施方式,电子机架400还包括至少联接至服务器刀片410中的至少一个的服务器供应线的服务器FCD。在本示例中,服务器FCD 403A附接至服务器刀片410A的服务器供应线401A,并且服务器FCD 403B附接至服务器刀片410B的服务器供应线401B。在本实施方式中,服务器FCD位于机架歧管225与服务器刀片410之间。服务器FCD 403中的每个还通信地联接至RMC 222。
根据一个实施方式,响应于从特定服务器刀片的泄漏检测器接收的、指示该服务器刀片内可能存在液体泄漏的信号,RMC 222配置成向与该特定服务器刀片对应的服务器FCD发送命令或信号以减少流入到服务器刀片中的冷却液体的量。服务器刀片可基本上阻挡冷却液体进入服务器刀片。替代地,服务器FCD可将冷却液体从服务器刀片的服务器供应线转移至服务器返回线,绕过服务器刀片的液体分配回路。
例如,响应于从泄漏检测器413A接收到指示服务器刀片410A内可能存在液体泄漏的信号,RMC 222向服务器FCD 403A发送命令以激活或启用服务器FCD 403A来减少流入到服务器刀片410A中的冷却液体的量。服务器FCD 403A可为双向阀或双向开关,以简单地阻止至少大部分冷却液体经由服务器供应线401A进入服务器刀片410A。替代地,服务器FCD403A可放置在服务器供应线401A与服务器返回线402A之间(例如,双向阀或双向开关)以形成旁路路径420A。当服务器FCD 403A由RMC 222激活时,使得至少大部分冷却液体从服务器供应线401A转移至服务器返回线402A。旁路路径420A允许冷却液体绕过服务器刀片410A的液体分配回路而不进入服务器刀片410A。
此外,服务器FCD 403A可为三向阀,其可以配置在第一位置和第二位置中。当服务器FCD 403A在正常操作期间配置在第一位置中时,服务器供应线401A打开以允许冷却液体进入服务器刀片410A。当服务器FCD 403A配置在第二位置中时,至服务器刀片410A的服务器供应线关闭,但是旁路路径420A打开以允许冷却液体从服务器供应线401A转移至服务器返回线402A,绕过服务器刀片410A。类似的操作可以适用于诸如服务器刀片410B的其他服务器刀片。
根据另一实施方式,除了泄漏检测器413之外或代替泄漏检测器413,可使用一个或多个液体压力传感器来检测液体泄漏。例如,压力传感器422可设置在服务器液体供应线401A上或附接至服务器液体供应线401A,以感测在服务器液体供应线401A中流动的液体压力。当液体分配回路内存在泄漏时,供应线401A或返回线402A上的液体压力将可能下降。通过检测液体压力变化,RMC 222可以确定并做出适当的响应。
在一个实施方式中,响应于从压力传感器接收的指示服务器刀片的液体分配回路的液体压力降低到预定阈值以下的信号,RMC 222向与特定服务器刀片相关联的服务器FCD发送命令或信号。服务器FCD被激活以减少待分配至服务器刀片的液体分配回路的冷却液体的量。例如,响应于从压力传感器422接收的指示服务器液体供应线401A的液体压力降低到预定阈值以下的信号,RMC 222配置成激活服务器FCD 403A。作为响应,在一个实施方式中,服务器FCD 403A配置成基本上阻挡冷却液体进入服务器刀片410A的液体分配回路。替代地,服务器FCD 403A配置成经由旁路路径420A将至少大部分冷却液体从服务器液体供应线401A转移至服务器液体返回线402A,绕过服务器刀片410A的液体分配回路。此外,还可在多个位置处放置温度传感器(例如,附接至冷板)以检测是否存在液体泄漏。当温度上升而高于预定阈值或显示非正常读数时,可发生可能的液体泄漏。
在一个实施方式中,RMC 222同时监控液体压力传感器的运行状态和服务器刀片的泄漏检测器。对于服务器刀片中的每个,如果相关联的泄漏检测器和液体压力传感器中的一个指示服务器刀片内可能存在泄漏,则RMC 222可以激活相应的服务器FCD以减少进入服务器刀片的冷却液体的量。替代地,只有当液体压力传感器和泄漏检测器两者均指示存在液体泄漏时,RMC 222才激活服务器FCD,其中,一个设备用作对另一设备的确认。
注意到,液体压力传感器还可以放置在诸如液体返回线402A-402B的服务器液体返回线上。替代地,液体压力传感器可放置在服务器刀片410中的任何一个的服务器液体供应线和服务器液体返回线两者上。通过单独地检测和控制冷却液体分配,可以独立地控制每个服务器刀片,同时其余的服务器刀片仍可以正常运行。
根据另一方面,机架FCD用于在机架级或全局级控制冷却液体流,而服务器FCD在服务器级或局部级运行。在本示例中,机架FCD 415放置或附接至机架液体供应线225A。机架FCD 415配置成以与服务器FCD 403类似的方式运行。根据一个实施方式,响应于检测到服务器刀片410中的一个或多个中的液体泄漏,RMC 222可激活机架FCD 415以减少流过下游的机架液体供应线225A的冷却液体的量,进而减少到达服务器刀片410的冷却液体的量。与服务器FCD 403类似,机架FCD 415可阻挡机架液体供应线225A内的向下游流动的至少大量或大量的冷却液体。替代地,机架FCD 415可经由旁路路径430绕过服务器刀片410,将至少大量或大量的冷却液体从机架液体供应线225A转移至机架液体返回线225B。
在一个实施方式中,除了激活服务器FCD 403中的至少一些之外,RMC 222可激活机架FCD 415。替代地,当具有液体泄漏的服务器刀片的数目大于预定阈值时,RMC 222可激活机架FCD 415。即,最初,当检测到单个服务器刀片内存在液体泄漏时,RMC 222可仅激活该特定服务器刀片的服务器FCD。当检测到具有液体泄漏的服务器刀片的数目超过预定阈值时,除了激活服务器FCD之外,RMC 222可激活机架FCD 415。
根据另一实施方式,诸如压力传感器421的液体压力传感器可放置在机架液体供应线225A和/或机架液体返回线225B上、或附接至机架液体供应线225A和/或机架液体返回线225B。机架液体压力传感器可用于检测或测量机架液体供应线225A和/或机架液体返回线225B内流动的液体的液体压力,作为指示任何服务器刀片410中是否存在任何液体泄漏的指示符。机架压力传感器的操作可与如上所述的服务器液体压力传感器类似。
根据一个实施方式,除了切断分配给具有液体泄漏的服务器刀片的冷却液体之外,RMC 222还可减少工作负荷或关闭服务器刀片的电源以防止IT组件过热。可以在服务器刀片级或机架级执行工作负荷调整或电源控制。即,如果特定服务器刀片遇到液体泄漏,则可减少该服务器刀片的工作负荷以降低过热的可能性,或者替代地,可使该服务器刀片断电,同时其他服务器刀片仍可正常运行。
在如图4A中所示的实施方式中,服务器FCD放置在机架歧管225与服务器刀片410之间。替代地,如图4B中所示,服务器FCD可放置在单独的服务器刀片内,靠近服务器刀片的液体分配回路的终端或位于在服务器刀片的液体分配回路的终端之前。根据又一实施方式,服务器FCD可与位于机架歧管225与服务器液体供应线401和服务器液体返回线402之间的连接器集成。服务器液体供应线可以使用第一对快速释放连接器联接至机架液体供应线225A,并且服务器液体返回线可以使用第二对快速释放连接器联接至机架液体返回线225B。服务器FCD可在服务器刀片侧上或机架歧管侧上集成为快速释放连接器的一部分或位于快速释放连接器之间。
图5是示出根据一个实施方式的服务器刀片的冷却模块的俯视图的框图。参考图5,冷却模块500可实现为图4A-图4B中的任何服务器刀片410的一部分。在本实施方式中,冷却模块500包括冷板501-508的阵列。诸如处理器的IT组件可以安装在任何冷板501-508上。在本示例中,冷板中的至少一些级联或串联链接。然而,示出的冷板501-508的配置或布置仅用于说明。可存在其他配置。
根据一个实施方式,由于存在多条冷板链,因此形成多个液体分配回路,每条链具有一个液体分配回路。在本示例中,存在四条链:冷板501-502、冷板503-504、冷板505-506和冷板507-508。对于每条链,形成液体分配回路,即,液体分配回路531-534,这些液体分配回路共享公共返回线535。液体分配回路531-534联接至具有服务器供应歧管511和服务器返回歧管512的服务器歧管。此外,一个或多个泄漏检测器和/或传感器(例如,温度传感器)可放置在冷却模块500内的多个位置处以检测液体泄漏。
在一个实施方式中,服务器FCD 520联接在服务器供应歧管511与服务器返回歧管512之间。如上所述,当服务器FCD 520激活时,服务器FCD 520可以将大部分冷却液体从服务器供应歧管511转移至服务器返回歧管512,而绕过液体分配回路531-534和冷板501-508。根据另一实施方式,另外的FCD可附接至液体分配回路531-534中的一个或多个以控制各个液体分配回路的冷却液体流。此外,根据又一实施方式,一个或多个液体压力传感器还可以联接至服务器供应歧管511、服务器返回歧管512和/或各个液体分配回路531-534。如上所述,液体压力传感器可以用于检测冷却液体的液体压力,作为是否存在液体泄漏的指示符。替代地,还可在多个位置处(例如,附接至冷板)放置温度传感器(未示出)以检测是否存在液体泄漏。当温度上升而高于预定阈值时,可发生可能的液体泄漏。
在上述说明书中,已经参考本发明的特定示例性实施方式描述了本发明的实施方式。将显而易见的是,可在不背离如所附权利要求中阐述的本发明的更宽泛的精神和范围的情况下对本发明作出多种修改。因此,说明书和附图应被视为说明性意义而非限制性意义。

Claims (20)

1.电子机架,包括:
机架歧管,所述机架歧管具有机架液体供应线和机架液体返回线,所述机架液体供应线从冷却液体源接收冷却液体,所述机架液体返回线使较暖液体返回到所述冷却液体源;
多个服务器刀片,所述多个服务器刀片堆叠布置,其中,所述服务器刀片中的每个包括一个或多个冷板和服务器液体分配回路,所述一个或多个冷板与一个或多个信息技术组件相关联,所述服务器液体分配回路从所述机架歧管接收所述冷却液体并将所述冷却液体分配至所述冷板以交换由所述信息技术组件产生的热,从而将所述冷却液体转变成所述较暖液体,其中,所述服务器刀片中的每个还包括泄漏检测器,所述泄漏检测器配置成检测分配至所述服务器刀片的所述冷却液体的泄漏;
多对服务器液体供应线和服务器液体返回线,每对与所述服务器刀片中的一个对应,其中,所述服务器液体供应线和所述服务器液体返回线联接在所述机架歧管与所述服务器刀片的所述服务器液体分配回路之间;
多个服务器流控制设备,每个服务器流控制设备与多对所述服务器液体供应线和所述服务器液体返回线中的一个对应,所述多个服务器流控制设备包括联接至第一服务器刀片的、成对的第一服务器液体供应线和第一服务器液体返回线的第一服务器流控制设备;
机架管理控制器单元,所述机架管理控制器单元联接至所述服务器流控制设备和所述服务器刀片的泄漏检测器,其中,所述机架管理控制器单元配置成响应于从所述第一服务器刀片的第一泄漏检测器接收的指示所述第一服务器刀片内存在液体泄漏的信号,向所述第一服务器流控制设备发送控制信号以减少分配至所述第一服务器刀片的所述冷却液体的量。
2.根据权利要求1所述的电子机架,其中,所述第一服务器流控制设备配置成阻挡待分配至所述第一服务器刀片的第一液体分配回路的基本全部冷却液体。
3.根据权利要求2所述的电子机架,其中,所述第一服务器流控制设备配置成绕过所述第一服务器刀片的所述第一液体分配回路、将所述冷却液体从所述第一服务器液体供应线转移至所述第一服务器液体返回线。
4.根据权利要求1所述的电子机架,其中,每个服务器刀片还包括设置在所述服务器液体供应线上的供应液体压力传感器,以及其中,所述机架管理控制器单元配置成响应于从第二服务器刀片的供应液体压力传感器接收的指示所述第二服务器刀片的第二服务器液体供应线的液体压力降低至预定阈值以下的信号,使得所述第二服务器刀片的第二服务器流控制设备减少待分配至所述第二服务器液体供应线的所述冷却液体的量。
5.根据权利要求4所述的电子机架,其中,每个服务器刀片还包括设置在所述服务器返回供应线上的返回液体压力传感器,以及其中所述机架管理控制器单元配置成响应于从第二服务器刀片的返回液体压力传感器接收的指示所述第二服务器刀片的第二服务器液体返回线的液体压力降低至预定阈值以下的信号,使得所述第二服务器刀片的第二服务器流控制设备减少待分配至所述第二服务器液体供应线的所述冷却液体的量。
6.根据权利要求1所述的电子机架,还包括联接至所述机架液体供应线的机架流控制设备,其中,所述机架流控制设备配置成控制待分配至所述服务器刀片的所述冷却液体的量。
7.根据权利要求6所述的电子机架,其中,所述机架流控制设备配置成响应于从所述机架管理控制器单元接收的命令,阻挡大量的所述冷却液体到达所述服务器刀片。
8.根据权利要求7所述的电子机架,其中,所述机架流控制设备配置成绕过所述服务器刀片、将大量的所述冷却液体从所述机架液体供应线转移至所述机架液体返回线。
9.根据权利要求6所述的电子机架,还包括第一机架液体压力传感器,所述第一机架液体压力传感器联接至所述机架液体供应线以感测所述机架液体供应线内的液体压力,其中,响应于从所述第一机架液体压力传感器接收指示所述液体压力降低至第一预定阈值以下的第一信号,所述机架管理控制器单元激活所述机架流控制设备以减少到达所述服务器刀片的所述冷却液体的量。
10.根据权利要求9所述的电子机架,还包括第二机架液体压力传感器,所述第二机架液体压力传感器联接至所述机架液体返回线以感测所述机架液体返回线内的液体压力,其中,响应于从所述第二机架液体压力传感器接收指示所述液体压力降低至第二预定阈值以下的第二信号,所述机架管理控制器单元激活所述机架流控制设备以减少到达所述服务器刀片的所述冷却液体的量。
11.数据中心的电子机架,包括:
机架歧管,所述机架歧管具有机架液体供应线和机架液体返回线,所述机架液体供应线从冷却液体源接收冷却液体,所述机架液体返回线使较暖液体返回到所述冷却液体源;
多个服务器刀片,所述多个服务器刀片堆叠布置,其中,所述服务器刀片中的每个包括一个或多个冷板和服务器液体分配回路,所述一个或多个冷板与一个或多个信息技术组件相关联,所述服务器液体分配回路从所述机架歧管接收所述冷却液体并将所述冷却液体分配至所述冷板以交换由所述信息技术组件产生的热,从而将所述冷却液体转变成所述较暖液体,其中,所述服务器刀片中的至少一个还包括泄漏检测器,所述泄漏检测器配置成检测分配至所述服务器刀片的所述冷却液体的泄漏;
机架流控制设备,所述机架流控制设备联接至所述机架液体供应线和所述机架液体返回线;以及
机架管理控制器单元,所述机架管理控制器单元联接至所述机架流控制设备和所述服务器刀片中的每个服务器刀片的所述泄漏检测器,其中,所述机架管理控制器单元配置成响应于从任何所述服务器刀片中的泄漏检测器接收的指示存在液体泄漏的信号,向所述机架流控制设备发送控制信号以减少到达所述服务器刀片的所述冷却液体的量。
12.根据权利要求11所述的电子机架,其中,所述机架流控制设备包括联接至所述机架液体供应线和所述机架液体返回线的第一阀,并且其中,响应于所述液体泄漏,所述机架管理控制器单元使所述第一阀打开以绕过所述服务器刀片而将所述冷却液体从所述机架液体供应线转移至所述机架液体返回线。
13.根据权利要求12所述的电子机架,其中,所述机架流控制设备包括设置在所述机架液体供应线上的第二阀,以及其中,响应于所述液体泄漏,所述机架管理控制器单元使所述第二阀关闭以阻止所述冷却液体进入所述服务器刀片的所述服务器液体分配回路。
14.根据权利要求13所述的电子机架,其中,所述第一阀和所述第二阀集成为双向阀,其中,当所述双向阀配置在第一位置中时,所述冷却液体被允许进入所述服务器刀片的所述服务器液体分配回路,以及其中,当所述双向阀配置在第二位置中时,所述冷却液体绕过所述服务器刀片的所述服务器液体分配回路从所述机架液体供应线转移至所述机架液体返回线。
15.根据权利要求11所述的电子机架,还包括联接至所述机架管理控制器单元和所述机架液体供应线的第一机架液体压力传感器以感测所述机架液体供应线内的液体压力,其中所述机架管理控制器单元配置成响应于从所述第一机架液体压力传感器接收的指示所述液体压力降低至第一预定阈值以下的第一信号,激活所述机架流控制设备以将所述冷却液体从所述机架液体供应线转移至所述机架液体返回线。
16.根据权利要求15所述的电子机架,还包括联接至所述机架管理控制器单元和所述机架液体返回线的第二机架液体压力传感器,其中,所述机架管理控制器单元配置成响应于从所述第二机架液体压力传感器接收的指示所述冷却液体的液体压力降低至第二预定阈值以下的第二信号,激活所述机架流控制设备以将所述冷却液体从所述机架液体供应线转移至所述机架液体返回线。
17.根据权利要求11所述的电子机架,其中,所述服务器刀片中的每个包括服务器流控制设备,所述服务器流控制设备联接至相应服务器液体分配回路的服务器供应线和服务器返回线,以及其中,所述服务器流控制设备配置成,当所述服务器流控制设备激活时,减少待分配至所述服务器刀片的液体分配回路的大量的所述冷却液体。
18.根据权利要求17所述的电子机架,其中,所述机架管理控制器单元配置成响应于从所述服务器刀片的第一服务器刀片的第一泄漏检测器接收的指示在所述第一服务器刀片内存在液体泄漏的信号,激活所述第一服务器刀片的第一服务器流控制设备以阻止大量的所述冷却液体进入所述第一服务器刀片的第一服务器液体分配回路。
19.根据权利要求18所述的电子机架,其中,所述第一服务器刀片还包括设置在所述第一服务器液体分配回路上的第一液体压力传感器,以及其中,所述机架管理控制器单元配置成响应于从所述第一液体压力传感器接收的指示所述第一服务器液体分配回路的液体压力降低至预定阈值以下的信号,激活所述第一服务器流控制设备。
20.根据权利要求18所述的电子机架,其中,所述机架管理控制器单元配置成激活所述第一服务器刀片的第一服务器流控制设备,以绕过所述第一服务器刀片的第一液体分配回路将大量的所述冷却液体从第一服务器液体供应线转移至第一服务器液体返回线。
CN201811433804.5A 2018-06-04 2018-11-28 用于数据中心电子机架的液体冷却的泄漏检测和响应系统 Pending CN110557925A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/997,428 2018-06-04
US15/997,428 US10925190B2 (en) 2018-06-04 2018-06-04 Leak detection and response system for liquid cooling of electronic racks of a data center

Publications (1)

Publication Number Publication Date
CN110557925A true CN110557925A (zh) 2019-12-10

Family

ID=68693624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811433804.5A Pending CN110557925A (zh) 2018-06-04 2018-11-28 用于数据中心电子机架的液体冷却的泄漏检测和响应系统

Country Status (2)

Country Link
US (1) US10925190B2 (zh)
CN (1) CN110557925A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI741881B (zh) * 2020-11-23 2021-10-01 邁萪科技股份有限公司 用於機櫃的水冷式控流散熱系統及其控制方法
CN114756099A (zh) * 2022-04-18 2022-07-15 苏州浪潮智能科技有限公司 冷液分配装置的保护系统、方法、液冷分配装置及机柜
CN114980666A (zh) * 2022-05-13 2022-08-30 佛山市液冷时代科技有限公司 一种数据中心液冷散热系统的控制方法及其系统

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020034594A1 (zh) * 2018-08-16 2020-02-20 北京航天动力研究所 一种撬装减压系统
TWI684743B (zh) * 2019-01-04 2020-02-11 雙鴻科技股份有限公司 可翻轉的水冷管與具有該可翻轉的水冷管之電子裝置
US10905030B1 (en) * 2019-07-24 2021-01-26 Facebook, Inc. Liquid-cooling within an air-cooled facility
US11116103B2 (en) * 2019-12-11 2021-09-07 Baidu Usa Llc Multi-floor data center cooling system
US20210267095A1 (en) * 2020-02-21 2021-08-26 Nvidia Corporation Intelligent and integrated liquid-cooled rack for datacenters
EP4150216A4 (en) * 2020-05-11 2023-11-01 Coolit Systems, Inc. LIQUID PUMPING UNITS, AND ASSOCIATED SYSTEMS AND METHODS
US11206745B2 (en) * 2020-05-12 2021-12-21 Baidu Usa Llc Highly integrated liquid cooling system design for data center IT room
US11864359B2 (en) * 2020-08-27 2024-01-02 Nvidia Corporation Intelligent threshold leak remediaton of datacenter cooling systems
JP2022064480A (ja) * 2020-10-14 2022-04-26 富士通株式会社 電子装置及び電子装置の制御方法
US20220272873A1 (en) * 2021-02-24 2022-08-25 Taiwan Microloops Corp. Water-cooled and flow-controlled heat dissipation system used in cabinet and control method thereof
US11589478B2 (en) * 2021-04-02 2023-02-21 Baidu Usa Llc Liquid cooling leakage prevention design
US20220338374A1 (en) * 2021-04-20 2022-10-20 Nvidia Corporation Quick disconnect blind-mate manifold
US11683910B2 (en) * 2021-04-27 2023-06-20 Quanta Computer Inc. Hot plug redundant pump for cooling system
US20220361375A1 (en) * 2021-05-04 2022-11-10 Nvidia Corporation Server unit with built-in flow distribution
US20220369514A1 (en) * 2021-05-12 2022-11-17 Nvidia Corporation Intelligent flow controllers with hot-swappable cold plates in datacenter cooling systems
US11937401B2 (en) * 2021-06-22 2024-03-19 Baidu Usa Llc System design and operation for liquid cooling
US20230052992A1 (en) * 2021-08-12 2023-02-16 ZT Group Int’l, Inc. dba ZT Systems Liquid Collection, Detection and Containment System For Liquid Cooled Servers

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102791107A (zh) * 2011-05-20 2012-11-21 周哲明 一种用于冷却电子设备的密封水冷方法和设备
CN104054407A (zh) * 2011-11-28 2014-09-17 阿塞泰克公司 用于服务器的冷却系统
CN105472943A (zh) * 2014-09-30 2016-04-06 波音公司 供功率电子组件使用的冷却系统及其制造方法
CN107069142A (zh) * 2017-06-12 2017-08-18 华霆(合肥)动力技术有限公司 管路热管理装置及系统
CN107580804A (zh) * 2015-05-04 2018-01-12 谷歌有限责任公司 冷却数据中心中的电子设备
US20180084676A1 (en) * 2015-02-12 2018-03-22 International Business Machines Corporation Cooling system with integrated fill and drain pump
CN207382771U (zh) * 2017-09-19 2018-05-18 大冶和诚换热器有限公司 一种背包式散热器

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7011143B2 (en) * 2004-05-04 2006-03-14 International Business Machines Corporation Method and apparatus for cooling electronic components
US7808783B2 (en) * 2008-02-25 2010-10-05 International Business Machines Corporation Multiple chip module cooling system and method of operation thereof
US8583290B2 (en) * 2009-09-09 2013-11-12 International Business Machines Corporation Cooling system and method minimizing power consumption in cooling liquid-cooled electronics racks
US20110313576A1 (en) * 2010-06-17 2011-12-22 Mark Randal Nicewonger System and method for flowing fluids through electronic chassis modules
WO2012003895A1 (de) * 2010-07-06 2012-01-12 Sam Technologies Gmbh System und verfahren zur kühlung einer rechenanlage
US20120111037A1 (en) * 2010-11-04 2012-05-10 International Business Machines Corporation Vapor-compression refrigeration apparatus with refrgierant bypass and controlled heat load
US9295181B2 (en) * 2012-11-08 2016-03-22 International Business Machines Corporation Coolant-conditioning unit with automated control of coolant flow valves
CN105409341B (zh) * 2012-12-18 2018-05-04 施耐德电气It公司 冷却单元和冷却方法
FR3002625B1 (fr) * 2013-02-28 2015-02-27 Bull Sas Systeme de refroidissement liquide pour armoire informatique
US9883616B2 (en) * 2014-09-29 2018-01-30 International Business Machines Corporation Manifold heat exchanger
US9504184B2 (en) * 2015-02-12 2016-11-22 International Business Machines Corporation Flexible coolant manifold-heat sink assembly
US10085367B2 (en) * 2015-03-12 2018-09-25 International Business Machines Corporation Minimizing leakage in liquid cooled electronic equipment
US10098258B2 (en) * 2015-03-12 2018-10-09 International Business Machines Corporation Minimizing leakage in liquid cooled electronic equipment
US10146231B2 (en) * 2015-12-21 2018-12-04 Dell Products, L.P. Liquid flow control based upon energy balance and fan speed for controlling exhaust air temperature
US10206312B2 (en) * 2015-12-21 2019-02-12 Dell Products, L.P. Liquid cooled rack information handling system having storage drive carrier for leak containment and vibration mitigation
US10238010B2 (en) * 2015-12-21 2019-03-19 Dell Products, L.P. Rackmount appliance for server and rack liquid management and water control policy execution
US9795065B2 (en) * 2015-12-21 2017-10-17 Dell Products, L.P. Integrated air-spring for hydraulic force damping of a rigid liquid cooling subsystem
US10156873B2 (en) * 2015-12-21 2018-12-18 Dell Products, L.P. Information handling system having fluid manifold with embedded heat exchanger system
US10064314B2 (en) * 2015-12-21 2018-08-28 Dell Products, L.P. Runtime service of liquid cooled servers operating under positive hydraulic pressure without impacting component performance
US10222134B2 (en) * 2016-10-06 2019-03-05 Ford Global Technologies, Llc Dual loop cooling system energy storage and reuse

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102791107A (zh) * 2011-05-20 2012-11-21 周哲明 一种用于冷却电子设备的密封水冷方法和设备
CN104054407A (zh) * 2011-11-28 2014-09-17 阿塞泰克公司 用于服务器的冷却系统
CN105472943A (zh) * 2014-09-30 2016-04-06 波音公司 供功率电子组件使用的冷却系统及其制造方法
US20180084676A1 (en) * 2015-02-12 2018-03-22 International Business Machines Corporation Cooling system with integrated fill and drain pump
CN107580804A (zh) * 2015-05-04 2018-01-12 谷歌有限责任公司 冷却数据中心中的电子设备
CN107069142A (zh) * 2017-06-12 2017-08-18 华霆(合肥)动力技术有限公司 管路热管理装置及系统
CN207382771U (zh) * 2017-09-19 2018-05-18 大冶和诚换热器有限公司 一种背包式散热器

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI741881B (zh) * 2020-11-23 2021-10-01 邁萪科技股份有限公司 用於機櫃的水冷式控流散熱系統及其控制方法
CN114756099A (zh) * 2022-04-18 2022-07-15 苏州浪潮智能科技有限公司 冷液分配装置的保护系统、方法、液冷分配装置及机柜
CN114980666A (zh) * 2022-05-13 2022-08-30 佛山市液冷时代科技有限公司 一种数据中心液冷散热系统的控制方法及其系统

Also Published As

Publication number Publication date
US10925190B2 (en) 2021-02-16
US20190373776A1 (en) 2019-12-05

Similar Documents

Publication Publication Date Title
CN110557925A (zh) 用于数据中心电子机架的液体冷却的泄漏检测和响应系统
CN110381696B (zh) 数据中心的电子机架及系统
JP6667593B2 (ja) データセンターの電子ラックの複合型液体−空気冷却システムの最適化制御装置(optimal controller for hybrid liquid−air cooling system of electronic racks of a data center)
US10146231B2 (en) Liquid flow control based upon energy balance and fan speed for controlling exhaust air temperature
US11019752B2 (en) Cooling module design for servers
US10729039B2 (en) Liquid cooled rack information handling system having storage drive carrier for leak containment and vibration mitigation
US10334763B2 (en) Method for providing cooling to electronic racks using liquid cooling and air cooling
US10238010B2 (en) Rackmount appliance for server and rack liquid management and water control policy execution
US20220369517A1 (en) Thermal management plate for critical processors
US11871547B2 (en) Two phase system for enclosure systems
US11818866B2 (en) Electronic rack control system for cloud servers
US11937401B2 (en) System design and operation for liquid cooling
EP3965543B1 (en) Integrating thermal storage system in electronics cooling
US11758693B2 (en) Connection module for fluid management in liquid cooled electronics system
US11740003B2 (en) Optimized air cooling unit
US11765865B2 (en) Data center system for various electronic rack architectures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191210