TWI803276B - 機架系統、液體冷卻系統、以及用以控制液體冷卻系統洩漏的方法 - Google Patents

機架系統、液體冷卻系統、以及用以控制液體冷卻系統洩漏的方法 Download PDF

Info

Publication number
TWI803276B
TWI803276B TW111113653A TW111113653A TWI803276B TW I803276 B TWI803276 B TW I803276B TW 111113653 A TW111113653 A TW 111113653A TW 111113653 A TW111113653 A TW 111113653A TW I803276 B TWI803276 B TW I803276B
Authority
TW
Taiwan
Prior art keywords
liquid
valve
leak
rack
heat
Prior art date
Application number
TW111113653A
Other languages
English (en)
Other versions
TW202311899A (zh
Inventor
陳朝榮
黃玉年
連信宏
陳仁茂
Original Assignee
廣達電腦股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 廣達電腦股份有限公司 filed Critical 廣達電腦股份有限公司
Publication of TW202311899A publication Critical patent/TW202311899A/zh
Application granted granted Critical
Publication of TWI803276B publication Critical patent/TWI803276B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20763Liquid cooling without phase change
    • H05K7/20781Liquid cooling without phase change within cabinets for removing heat from server blades
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/02Digital function generators
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20218Modifications to facilitate cooling, ventilating, or heating using a liquid coolant without phase change in electronic enclosures
    • H05K7/20272Accessories for moving fluid, for expanding fluid, for connecting fluid conduits, for distributing fluid, for removing gas or for preventing leakage, e.g. pumps, tanks or manifolds
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20218Modifications to facilitate cooling, ventilating, or heating using a liquid coolant without phase change in electronic enclosures
    • H05K7/20281Thermal management, e.g. liquid flow control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2200/00Indexing scheme relating to G06F1/04 - G06F1/32
    • G06F2200/20Indexing scheme relating to G06F1/20
    • G06F2200/201Cooling arrangements using cooling fluid

Abstract

一種控制一機架中之液體冷卻系統洩漏的方法以及系統。此方法包括監測洩漏偵測感應器,洩漏偵測感應器位於電腦系統並且在一液體輸送系統之段部下方。回應於判定是否從洩漏偵測感應器之一接收到指示一洩漏的一信號,判定洩漏偵測感應器以及複數個電腦系統中、與接收到的信號相聯之一對應電腦系統。斷開所述複數個電腦系統中之對應電腦系統的電源,並且傳送一個信號以實施將一第一閥以及一第二閥從開啟位置移動到關閉位置。第一閥定位於一熱機架歧管以及一熱接觸結構之間之液體輸送系統內,所述熱接觸結構相聯於所述與接收到的信號相聯之電腦系統。第二閥定位於一冷機架歧管以及熱接觸結構之間之液體輸送系統內。

Description

機架系統、液體冷卻系統、以及用以控制液體冷卻系統洩漏的方法
本發明大致是關於一種液體冷卻系統,用於電腦裝置,且更具體地,關於控制設置於伺服器機架中之伺服器裝置中之液體冷卻系統洩漏。
典型的伺服器機架系統被配置以安置伺服器以及其他部件。這些部件的各個部件在運行時都會產生熱。伺服器以及其他部件產生的結合熱增加伺服器機架中部件的整體溫度、伺服器機架、以及伺服器機架外界環境的溫度。此溫度升高會引起單獨伺服器以及包含其中的部件的效率降低。
用於降低伺服器機架中的溫度之一習知作法包括使用液體冷卻。冷卻劑在包括泵的一液體迴路中循環,其中熱從較高溫度之一發熱裝置傳遞到較低溫度之一散熱器。透過與一中間熱接觸結構的接觸達成熱傳遞。隨後熱經由液體迴路傳遞並且透過一熱交換器排出至周圍的空氣。用於液體冷卻迴路的泵通常持續地運作,以最小化發熱裝置的過熱。因此,冷卻劑洩漏將導致冷卻劑積聚在伺服器機架中,直到冷卻劑不再存留於液體迴路中。因此,由於洩漏,液體冷卻系統的使用一般不能可靠地維持伺服器機架系統、或其中任何部件於期望溫度。
據此,需要改善對液體冷卻系統以及方法的控制,以保持包括伺服器機架系統中的發熱部件(例如伺服器裝置)的伺服器機架系統於期望溫度。
實施例的用語以及相似的用語(例如,實施方式、配置、特點、示例、以及選項)意在廣義地泛指所有本揭露之標的以及以下申請專利範圍。數個包含這些用語的陳述項應被理解為不限制在此所述的標的或限制以下申請專利範圍的含義或範圍。在此所涵蓋本揭露的實施例由以下申請專利範圍定義,而非本發明內容。此發明內容是本揭露多種特點的上位(high-level)概述,且介紹以下的實施方式段落中所更描述的一些概念。此發明內容非意在確認申請專利範圍標的的關鍵或必要特徵,也非意在被獨立使用以決定申請專利範圍標的的範圍。本標的經由參考本揭露的完整說明書的適當部分、任何或所有附圖以及每一申請專利範圍,應當被理解。
根據本揭露的某些特點,揭露一種液體冷卻系統,用於一機架中的計算裝置。液體冷卻系統包括一熱接觸結構、一熱機架歧管、一冷機架歧管、一第一閥、一第二閥、一液體洩漏偵測感應器、以及一控制系統。熱接觸結構用於安置於機架中之複數個發熱電腦系統中之一發熱電腦系統。熱機架歧管以及冷機架歧管經由一封閉液體輸送系統連接至熱接觸結構。第一閥定位於熱機架歧管以及熱接觸結構之間之封閉液體輸送系統內。第一閥控制冷卻液體從熱接觸結構流出至熱機架歧管之流動。第二閥定位於冷機架歧管以及熱接觸結構之間之封閉液體輸送系統內。第二閥控制冷卻液體從冷機架歧管流入熱接觸結構之流動。液體洩漏偵測感應器定位於一第一個發熱電腦系統,所述第一個發熱電腦系統為在封閉液體輸送系統下之複數個發熱電腦系統中之第一個發熱電腦系統。控制系統電性連接液體洩漏偵測感應器、第一閥、以及第二閥。控制系統包括一個或多個處理器,並且耦接至一記憶體,儲存機器可讀取之指令。當在一個或多個處理器上執行時,指令實施的動作包括: (i)判定是否從液體洩漏偵測感應器接收到指示封閉液體輸送系統中的一洩漏的一電信號,(ii)回應於判定接收到指示一洩漏的一電信號,關閉複數個發熱電腦系統中之第一個發熱電腦系統的電源,以及(iii)回應於判定接收到指示一洩漏的所述電信號,傳送一個或多個電信號以實施將第一閥以及第二閥從開啟位置移動到關閉位置。閥的移動限制冷卻液體從熱機架歧管以及從冷機架歧管、沿封閉液體輸送系統的移動。
在另一特點中,液體冷卻系統包括一熱交換器,經由封閉液體輸送系統連接至熱機架歧管以及冷機架歧管。在另一特點中,液體冷卻系統包括一冷卻劑分配單元,包括一個或多個泵,用以經由封閉液體輸送系統,輸送從熱交換器接收之冷卻液體至冷機架歧管以及熱接觸結構。在另一特點中,冷卻液體從熱接觸結構被輸送回熱機架歧管以及熱交換器。
在另一特點中,液體冷卻系統包括一第二熱接觸結構、一第三閥、一第四閥。第二熱接觸結構用於所述安置於機架中之複數個發熱電腦系統之第二個發熱電腦系統。熱機架歧管以及冷機架歧管經由封閉液體輸送系統連接至第二熱接觸結構。第三閥定位於熱機架歧管以及第二熱接觸結構之間之封閉液體輸送系統內。第三閥控制冷卻液體從熱接觸結構流出至熱機架歧管之流動。第四閥定位於冷機架歧管以及第二熱接觸結構之間之封閉液體輸送系統內。第四閥控制冷卻液體從冷機架歧管流入熱接觸結構之流動。
在另一特點中,液體冷卻系統包括一第二液體洩漏偵測感應器,沿在封閉液體輸送系統下之複數個發熱電腦系統中之第二個發熱電腦系統之一機殼之一基座定位。控制系統更電性連接至第二液體洩漏偵測感應器、第三閥、以及第四閥。控制系統耦接至所述記憶體,儲存機器可讀取之指令,當在一個或多個處理器上執行時,實施的動作更包括(iv)判定是否從第二液體洩漏偵測感應器接收到指示封閉液體輸送系統中的一洩漏的一電信號,(v)回應於判定接收到指示一洩漏的一電信號,關閉複數個發熱電腦系統中之第二個發熱電腦系統的電源,以及(vi)回應於判定接收到指示一洩漏的電信號,傳送一個或多個電信號以實施將第三閥以及第四閥從一開啟位置移動到一關閉位置,從而限制冷卻液體從熱機架歧管以及從冷機架歧管、沿液體輸送系統的移動。
在另一特點中,熱接觸結構、熱機架歧管、冷機架歧管、第一閥、第二閥、液體洩漏偵測感應器、以及控制器都安置在機架內。在又一特點中,控制器為一基板管理控制器。在又一特點中,冷卻液體為純水、乙二醇、丙二醇或其組合之一。
在另一特點中,控制系統更被配置以傳送一警報信號以就偵測到之一洩漏、發起一人類可感知的指示。在又一特點中,回應於判定接收到指示一洩漏的電信號,液體冷卻系統繼續冷卻除了複數個發熱電腦系統之第一個發熱電腦系統以外的複數個發熱電腦系統,並且除了複數個發熱電腦系統之第一個發熱電腦系統以外的複數個發熱電腦系統繼續接收電力。
根據本揭露的某些特點,揭露一種用以控制一伺服器機架中之一液體冷卻系統洩漏的方法。所述伺服器機架包括複數個伺服器。所述方法包括監測複數個洩漏偵測感應器,各個洩漏偵測感應器位於一液體輸送系統之一相應段下方的複數個伺服器中之一相應伺服器之一相應底座。判定是否從複數個洩漏偵測感應器之一接收到指示液體輸送系統中的一洩漏的一信號。回應於判定接收到指示一洩漏的一信號,判定複數個伺服器以及洩漏偵測感應器中、與接收到的信號相聯之一對應伺服器以及洩漏偵測感應器。回應於判定複數個伺服器中、與接收到的信號相聯之所述對應伺服器,斷開複數個伺服器之對應伺服器的電源。回應於判定複數個伺服器中、與接收到的信號相聯之所述對應伺服器,傳送一個或多個信號以實施將一第一閥以及一第二閥從開啟位置移動到關閉位置。第一閥定位於一熱機架歧管以及一熱接觸結構之間之液體輸送系統內,所述熱接觸結構相聯於複數個伺服器中、與接收到的信號相聯之所述對應伺服器。第二閥定位於一冷機架歧管以及熱接觸結構之間之液體輸送系統內,從而限制冷卻液體從熱機架歧管以及冷機架歧管沿液體輸送系統的移動。
在另一特點中,冷卻液體使用一冷卻劑分配單元,透過液體輸送系統輸送。在用以控制液體冷卻系統洩漏之另一特點中,傳送一警報信號以就偵測到之一洩漏,發起一人類可感知的指示。在另一特點中,冷卻液體為純水、乙二醇、丙二醇或其組合之一。在另一特點中,回應於判定接收到指示一洩漏的信號,液體冷卻系統繼續監測複數個洩漏偵測感應器。在又一特點中,回應於判定複數個伺服器中、與接收到的信號相聯之對應伺服器,繼續向除了複數個伺服器之對應伺服器以外的複數個伺服器供電。
根據本揭露的某些特點,揭露一種機架系統。所述機架系統包括複數個計算裝置以及一液體冷卻系統。液體冷卻系統包括複數個洩漏偵測感應器、一第一閥、一第二閥、以及一控制器。複數個洩漏偵測感應器各自定位於一液體輸送系統之一段部下方的複數個計算裝置中之一相應計算裝置上。第一閥定位於一熱機架歧管以及一熱接觸結構之間之液體輸送系統內,熱接觸結構與複數個計算裝置之一相聯。第二閥定位於一冷機架歧管以及熱接觸結構之間之液體輸送系統內。控制器連接至複數個液體洩漏偵測感應器、第一閥、以及第二閥。控制器被配置以監測複數個洩漏偵測感應器以及判定是否從複數個液體洩漏偵測感應器接收到指示液體輸送系統中的一洩漏的一信號。回應於判定接收到指示一洩漏的一信號,控制器判定洩漏偵測感應器以及複數個計算裝置中、與接收到的信號相聯之一對應計算裝置。回應於判定複數個計算裝置中、與接收到的信號相聯之對應計算裝置,控制器傳送一信號以斷開複數個計算裝置之對應計算裝置的電源。回應於判定複數個計算裝置中、與接收到的信號相聯之對應計算裝置,控制器傳送一個或多個信號以實施將第一閥以及第二閥從開啟位置移動到關閉位置。
以上發明內容並非意在呈現本揭露的每一實施例或每個特點。而是,前述發明內容僅提供在此闡述的一些新穎特點以及特徵的示例。當結合附圖以及所附申請專利範圍時,從用以進行實施本發明的代表性實施例以及模式的以下詳細描述,本揭露的以上特徵以及優點以及其他特徵以及優點將變得顯而易見。鑑於參考附圖、以下所提供的符號簡單說明對各種實施例的詳細描述,本揭露的附加的特點對於本領域具有通常知識者將是顯而易見的。
多種實施例被參照附圖描述,在整個附圖中相似的參考符號被用來指定相似或均等元件。附圖並未按比例繪製,且提供附圖僅用以顯示本揭露之特點和特徵。應當理解許多具體細節、關係以及方法被闡述以提供全面的理解。然而,該領域具有通常知識者將容易的想到,多種實施例可在沒有一個或多個特定細節之下或在其他方法下實踐。在一些情況下,為了說明性的目的,未詳細顯示公知的結構或操作。多種實施例不受限於動作或事件的顯示順序,如一些動作可以不同的順序及/或與其他動作或事件同時發生。此外,並非全部所顯示的動作或事件都是實施本揭露之某些特點和特徵所需的。
為了本實施方式的目的,除非明確地說明並非如此,單數包括複數且反之亦然。用語「包括」意為「包括而不限於」。此外,近似詞如「大約(about, almost, substantially, approximately)」以及其相似詞,可在此意為例如「在(at)」、「近於(near , nearly at)」、「在3%到5%之內(within 3-5% of)」、「在可接受的製造公差內(within acceptable manufacturing tolerances)」或任何其邏輯組合。類似地,術語「垂直」或「水平」旨在分別另外包括垂直或水平方向的「3-5%內」。此外,例如「頂部」、「底部」、「左方」、「右方」、「上方」和「下方」等方向詞意在相關於參考圖示中描寫的等效方向;從參考對象或元件上下文中理解,例如從對象或元件的常用位置;或如此的其他描述。
對於本揭露,術語「電腦系統」或「電腦裝置」或「伺服器裝置」或「伺服器」是指具有硬體、軟體、以及/或韌體部件的任何電子供電或電池供電設備,其中軟體以及/或韌體部件可被配置以操作裝置上的元件。非限制性地,所述設備可包括伺服器、儲存裝置、交換器、以及其類似物。
用於機架系統中的伺服器、或其他發熱部件的液體冷卻系統,可使用冷卻劑移除電子部件產生的熱。冷卻劑在一液體輸送系統內的一冷卻劑分配單元(coolant distribution unit, CDU)的協助下流動。冷卻劑流動通過一熱接觸結構,例如一冷板,並流動通過冷機架歧管以及熱機架歧管。冷卻劑隨後向一熱交換器(或散熱器或冷卻器)流動以冷卻在暴露於來自發熱部件之輻射熱之後溫度升高的冷卻劑。冷卻劑分配單元可包括一個或多個泵,並且液體輸送系統可包括一系列管道或管子,所述管道或管子將冷卻劑運送到液體冷卻系統的各種部件以及從液體冷卻系統的各種部件運送冷卻劑。在一些實施方式中,冷卻液體或冷卻劑可為純水、乙二醇、丙二醇或它們的組合。
在正常的伺服器機架運行期間,冷卻劑分配單元的一個或多個泵持續運行以提供導致液體冷卻系統內的流動所需的力,以將冷卻劑持續分配至機架系統中的各個熱接觸結構(例如一冷板)。如在示例性第1圖至第4圖的上下文中更詳細地闡述,本液體冷卻系統以及方法的一個理想特點為偵測可能發生於一機架系統中的洩漏事件。本揭露可將被冷卻的發熱裝置(例如,伺服器裝置、電腦裝置)從伺服器機架中的其他發熱部件隔離。
當進入或離開與發熱裝置相鄰的熱接觸結構的液體輸送段(例如管道或管子)發生一洩漏時,液體輸送段中的冷卻劑的流動藉由液體輸送段被與其餘的液體冷卻系統阻隔而停止。這是尤其理想的,因為如果冷卻劑洩漏沒有被隔離,冷卻劑分配單元的一個或多個泵繼續循環冷卻劑,並且冷卻劑將會流動通過液體輸送系統中的孔並積聚在機架的底盤、或機架中的單獨伺服器的底盤中。洩漏將繼續,直到所有冷卻劑都從液體冷卻系統中流出。這將對發熱部件的運行尤其有害。此外,如果需要維護以修復發生洩漏的系統部分,則通常需要關閉泵直到冷卻劑不再在液體輸送系統中循環,意味著機架中的所有伺服器或其他發熱系統被關閉,直到可完成洩漏修復。藉由將洩漏的液體輸送段從其餘的液體輸送系統斷開,本揭露允許機架系統以另外的方式正常運行,並且最小化停機之衝擊將會對一數據中心的計算性能的影響。
現在參考第1圖以及第2圖,繪示具有複數個伺服器裝置110a、110b、110i的一伺服器機架100的示意圖。第1圖繪示包括具有液體洩漏偵測感應器118a、118b、118i的正常運行的一液體冷卻系統200,並且第2圖繪示在偵測到液體冷卻系統200中的一洩漏之後的伺服器機架100。液體冷卻系統200在使用液體洩漏偵測感應器118a、118b、118i偵測到一液體冷卻系統洩漏之後,最小化冷卻液體的洩漏。儘管裝置110a、110b、以及110i在此示例中是伺服器,但是其中的原理可應用於需要冷卻的任何類型的計算裝置。
用於伺服器機架100中的伺服器裝置110a、110b、110i的液體冷卻系統200包括與伺服器裝置110a、110b、110i內的對應發熱部件114a、114b、114i相鄰設置的熱接觸結構112a、112b、112i。液體冷卻系統200更包括熱機架歧管120、冷機架歧管130、複數個第一閥150a、150b、…150i、複數個第二閥152a、152b、…152i、液體洩漏偵測感應器118a、118b、…118i以及一控制系統160。液體冷卻系統200更包括一液體輸送系統170,液體輸送系統170包括一系列液體輸送段(例如,管道、管子)172a、172b、172c、172d、172e、172i、174d、174e、174i,將一封閉液體輸送系統中的冷卻液體運送進出伺服器機架100至一熱交換器180(例如,散熱器、冷卻器)。冷卻液體藉由包括一個或多個泵的一冷卻劑分配單元190沿液體輸送系統170循環。
各個熱接觸結構112a、112b、112i相聯於並且定位於緊接相鄰(或靠近)其一對應發熱部件114a、114b、114i,發熱部件114a、114b、114i為安置於伺服器機架100中之伺服器裝置110a、110b、110i之發熱部件。熱機架歧管120經由液體輸送系統170的液體輸送段172d、172e、172i連接至熱接觸結構112a、112b、112i。此排列允許被加熱的冷卻液體從熱接觸結構112a、112b、112i流動進入熱機架歧管120。類似地,冷機架歧管130經由液體輸送系統170的液體輸送段174d、174e、174i連接至熱接觸結構112a、112b、112i。此排列允許被冷卻的冷卻液體從冷機架歧管130流動進入熱接觸結構112a、112b、112i。
閥150a、150b、150i、152a、152b、152i沿液體輸送段172d、172e、172i、174d、174e、174i定位。閥150a、150b、150i、152a、152b、152i定位於熱機架歧管120或冷機架歧管130與對應的熱接觸結構112a、112b、112i之間。閥150a、150b、150i、152a、152b、152i可通信地連接至控制系統160,從而閥150a、150b、150i、152a、152b、152i可被監控並且單獨地定位於一開啟位置,以獨立地允許冷卻液體的流動進出熱接觸結構112a、112b、112i、或當例如沿液體輸送段172d、172e、172i、174d、174e、174 i之一偵測到一洩漏時,定位於一關閉位置以隔離一特定熱接觸結構。例如,藉由開啟或關閉閥150b,冷卻液體從熱接觸結構112b流出到熱機架歧管120的流動被控制。類似地,藉由開啟或關閉閥152b,冷卻液體從冷機架歧管130進入熱接觸結構112b的流動被控制。此種藉由閥150b、152b的控制,允許在洩漏沿著液體輸送段172e、174e發生的情況下隔離伺服器裝置110b的冷卻。
液體洩漏偵測感應器118a、118b、118i沿著伺服器裝置110a、110b、110i中各個的殼體111a、111b、111i的一底座、定位於個別的液體輸送段172d、174d;172e、174e;172i、174i下方。控制系統160也通信地連接至液體洩漏偵測感應器118a、118b、118i以監測任何冷卻液體洩漏。如果控制系統160從液體洩漏偵測感應器118a、118b、118i之一接收到一信號,則控制系統160將接續關閉與傳送洩漏偵測信號之洩漏偵測感應器相聯的發熱部件的閥。例如,在第2圖中,在液體輸送段172e中繪示一洩漏174,冷卻液體積聚在殼體111b的底座,觸發洩漏偵測感應器118b對洩漏的偵測。
控制系統160在接收到指示已偵測到一洩漏的信號後,接續向伺服器裝置110b發送一信號以關閉電源,並且向閥150b、152b發送一信號以移動到一關閉位置。藉由採取此行動,伺服器機架100中其餘的伺服器裝置110a、110i繼續運行,同時也保護伺服器裝置110b。此行動也最小化由於液體輸送系統170外部的冷卻液體積聚而形成潛在電短路的機會。如果發生不止一個洩漏或如果偵測到之洩漏相聯於一不同的伺服器裝置,將考慮對於伺服器裝置110a、110i採取類似的行動。
控制系統160包括一個或多個處理器,並且耦合至其上儲存機器可讀取之指令之一記憶體。在執行機器可讀取之指令時,控制系統160實施之行動包括首先判定是否從液體洩漏偵測感應器118a、118b、118i接收到指示液體輸送系統170中一洩漏的一信號。特別地,液體輸送段172d、174d、172e、174e、172i、174i中的洩漏判定可基於感應器信號來判定。回應於判定接收到指示一洩漏的一信號,從控制系統160傳送一信號以關閉正在經歷洩漏的伺服器裝置(例如,第2圖中繪示的洩漏的伺服器裝置110b)的電源。回應於判定接收到指示一洩漏的信號,隨後一個或多個信號也被傳送(在第2圖的示例中)以實施將閥150b、152b從開啟位置移動至關閉位置。閥的關閉限制冷卻液體沿液體輸送系統170至熱機架歧管120以及來自冷機架歧管130的移動。
液體冷卻系統200更包括一熱交換器180,藉由液體輸送段172a、172b與熱機架歧管120以及冷機架歧管130流體連接。冷卻液體從接收被加熱的冷卻液體的熱機架歧管120向熱交換器180流動。冷卻液體藉由通過熱交換器180的氣流冷卻,移除冷卻液體中積聚的熱。被冷卻的冷卻液體隨後在被輸送到熱接觸結構112a、112b、112i、以繼續從發熱裝置114a、114b、114i移除產生的熱的週期之前,循環到冷機架歧管130。
冷卻液體的循環由冷卻劑分配單元190導致,冷卻劑分配單元具有一個或多個泵,用於將接收自熱交換器180的冷卻液體輸送到冷機架歧管130。自冷機架歧管130,冷卻液體循環到熱接觸結構112a、112b、112i並且在通過熱機架歧管120之後,最終再次返回熱交換器180。
在一些實施方式中,熱接觸結構112a、112b、112i、熱機架歧管120、冷機架歧管130、液體輸送段172d、174d、172e、174e、172i、174i、閥150a、152a、150b、152b、150i、152i、液體洩漏偵測感應器118a、118b、118i以及控制系統160全部安置在伺服器機架100內,如第1圖以及第2圖所繪示。在一些實施方式中,熱機架歧管120、冷機架歧管130、或控制系統160中一個或多個位於伺服器機架100的外部。
在一些實施方式中,控制系統160可為一基板管理控制器(baseboard management controller, BMC)或機架管理控制器(rack management controller, RMC)。基板管理控制器可為定位於伺服器裝置110a、110b、110i之一的主機板上的小型電腦,或可為設置於伺服器機架100內部或外部某處的一個別實體。基板管理控制器可具有內建的控制邏輯,在其他可能的控制器操作中,用於控制閥150a、150b、150i、152a、152b、152i、用於控制伺服器裝置110a、110b、110i的電源、以及用於控制液體洩漏偵測感應器118a、118b、118i。或者,可將一機架管理控制器安裝在機架的一背板上。機架管理控制器可監控洩漏偵測感應器並且控制整個機架的閥。
在一些實施方式中,控制系統160被配置以在偵測到一洩漏時傳送一警報信號以發起一人類可感知的指示,例如一視覺指示或一聲音。所傳送的信號還可或可替代地包括傳送一訊息至可觸發額外行動的一智慧型手機或計算裝置。另一理想的實施方式為液體冷卻系統200繼續冷卻與洩漏相聯的一個(或多個) (例如114b)除外的複數個發熱裝置(例如114a、114i),作為回應於識別一洩漏的一部分。此外,除了與洩漏相聯的一個(或多個)之外的複數個發熱裝置繼續接收電力以維持正常的伺服器機架運作。
現在參考第3A圖以及第3B圖,繪示可用於第1圖以及第2圖中所繪示的液體輸送系統170的閥300A、300B的示例性橫截面。例如,閥300a、300b可用作第1圖以及第2圖中的閥150a、150b、150i、152a、152b、152i中的任何一個。閥300a、300b是可直接地操作(例如,300a)或間接地操作(例如,300b)的電磁閥。兩個閥都包括一線圈310a、310b並且被繪示為處於一開啟狀態,其允許冷卻液體370a、370b沿著路徑F-F以及F'-F'流動通過液體輸送段375a、375b,類似於第1圖以及第2圖中繪示的液體輸送段172d、172e、172i、174d、174e、174i。閥300a可藉由將線圈310a通電以向下移動柱塞320a而移動到關閉位置。閥300b可類似地藉由將線圈310b通電以向下移動柱塞320b而關閉,除了考慮到閥300b之間接操作性,其中壓力差也提供柱塞320b移動到關閉位置。類似於第1圖以及第2圖所闡述,閥300a、300b由控制系統160(見第1圖以及第2圖)控制,控制系統160傳送信號以導致電磁閥關閉以及開啟。
現在參考第4圖,繪示用於一液體冷卻系統(例如,第1圖以及第2圖的液體冷卻系統200)的包括一冷板412的一示例性熱接觸結構400。熱接觸結構400包括一冷板412以及定位於冷板412中的一系列微通道440上方之一歧管430。冷卻液體自一冷機架歧管(未顯示,但類似於第1圖以及第2圖中的冷機架歧管130)流出,並通過冷板412的歧管430流動進入一系列微通道440。隨後冷卻液體流出微通道440並且離開冷板412,自熱接觸結構400流動至一熱機架歧管(未顯示,但類似於第1圖以及第2圖中的熱機架歧管120)。
現在參考第5圖,繪示用於控制一伺服器機架中的發熱裝置中的液體冷卻系統洩漏的一方法的流程圖500。在一些特點中,可使用第1圖至第4圖中繪示的裝置,應用於第5圖所繪示的行動。作為此方法的預備步驟,於步驟510啟動一伺服器機架之電源並且監測發熱裝置的液體輸送段的潛在洩漏。接下來,在一些實施方式中,於步驟520,將沿液體輸送系統定位的閥,例如第3圖的示例性電磁閥300a、300b,通電並且置入開啟狀態,以允許冷卻液體流動通過機架,為發熱裝置提供冷卻。
接著於步驟530,在液體冷卻系統的正常操作期間,複數個洩漏偵測感應器被監測。洩漏偵測感應器沿發熱裝置(例如,伺服器裝置)之相應底座定位。洩漏偵測感應器也定位於液體輸送段的下方,所述液體輸送段進入以及離開與發熱裝置相鄰的熱接觸結構。判定是否從複數個洩漏偵測感應器之一接收到指示液體輸送系統中的一洩漏的一信號。如果沒有接收到信號,步驟530保持在一監視循環中。回應於判定接收到指示一洩漏的一信號,此方法接續至步驟540,其中在一些實施方式中可產生或傳送一警報信號以提供一洩漏狀況的警報。另外,回應於判定接收到指示一洩漏的一信號,判定哪個洩漏偵測感應器以及對應的發熱或伺服器裝置與接收到的信號相聯。
接著於步驟550,回應於判定與接收到的信號相聯的發熱或伺服器裝置,斷開所述發熱或伺服器裝置之電源。隨後於步驟560,回應於判定與接收到的信號相聯的發熱或伺服器裝置,從控制器系統傳送一個或多個信號,以實施閥沿進入以及離開熱接觸結構的液體輸送段、從開放位置到關閉位置的移動。其中一個閥定位於液體輸送系統內的一熱機架歧管以及一熱接觸結構之間,所述熱接觸結構與接收到的信號的發熱或伺服器裝置相聯。第二個閥定位於一冷機架歧管以及用於同一發熱或伺服器裝置的熱接觸結構之間的液體輸送系統內。閥的關閉限制冷卻液體沿液體輸送系統向熱機架歧管以及自冷機架歧管的移動。
在所述方法的一些實施方式中,回應於判定接收到指示一洩漏的信號,液體冷卻系統繼續監測複數個洩漏偵測感應器。在所述方法的又一實施方式中,回應於判定與接收到的信號相聯的發熱或伺服器裝置,繼續向除了與接收到的信號相聯的發熱或伺服器裝置之外的其餘發熱裝置(例如伺服器)供電。
儘管已關於一個或多個實施方式示出和描述本揭露之實施例,本領域具有通常知識者經閱讀和理解本說明書和附圖後,將想到均等物和修改。另外,雖然可能已經關於幾種實施方式的僅一種實施方式揭露本揭露的特定特徵,對於任何給予或特定的應用,這種特徵如可能有需求和有利的可與其他實施方式的一個或多個其他特徵組合。
雖然本揭露的多種實施例已由以上所描述,應當理解其僅以示例且非限制的方式呈現。在不脫離本揭露的精神或範圍下,可根據本揭露在此所揭露的實施例進行多種改變。因此,本揭露的廣度和範圍不應受到任何上述實施例的限制。相反的,本揭露的範圍應根據以下申請專利範圍及其均等物所界定。
100:伺服器機架 110a, 110b, 110i:伺服器裝置 111a, 111b, 111i:殼體 112a, 112b, 112i:熱接觸結構 114a, 114b, 114i:對應發熱部件/發熱裝置 118a, 118b, 118i:液體洩漏偵測感應器 120:熱機架歧管 130:冷機架歧管 150a, 150b, 150i:第一閥 152a, 152b, 152i:第二閥 160:控制系統 170:液體輸送系統 172a, 172b, 172c, 172d, 172e, 172i, 174d, 174e, 174i:液體輸送段 174:洩漏 180:熱交換器 190:冷卻劑分配單元 200:液體冷卻系統 300a, 300b:閥 310a, 310b:線圈 320a, 320b:柱塞 370a, 370b:冷卻液體 375a, 375b:液體輸送段 F-F, F’-F’:路徑 400:示例性熱接觸結構 412:冷板 430:歧管 440:微通道 500:流程圖 510, 520, 530, 540, 550, 560:步驟
從以下示例性實施例的描述並結合參考附圖,將更好地理解本揭露及其優點以及附圖。這些附圖僅繪示了示例性實施例,且因此不應被視為對各種實施例或申請專利範圍的限制。 第1圖為根據本揭露之一些實施方式,一伺服器機架包括具有洩漏偵測器之正常運行的一液體冷卻系統的示意圖。 第2圖為根據本揭露之一些實施方式,第1圖之伺服器機架在偵測到液體冷卻系統中的一洩漏之後的示意圖。 第3A圖以及第3B圖為根據本揭露之一些實施方式,液體冷卻系統的一液體輸送系統中的示例性閥的示意圖。 第4圖為根據本揭露之一些實施方式,用於一液體冷卻系統之一熱接觸結構的示意圖。 第5圖為根據本揭露之一些實施方式,控制液體冷卻系統洩漏的一方法的流程圖。
100:伺服器機架 110a, 110b, 110i:伺服器裝置 111a, 111b, 111i:殼體 112a, 112b, 112i:熱接觸結構 114a, 114b, 114i:對應發熱部件/發熱裝置 118a, 118b, 118i:液體洩漏偵測感應器 120:熱機架歧管 130:冷機架歧管 150a, 150b, 150i:第一閥 152a, 152b, 152i:第二閥 160:控制系統 170:液體輸送系統 172a, 172b, 172c, 172d, 172e, 172i, 174d, 174e, 174i:液體輸送段 174:洩漏 180:熱交換器 190:冷卻劑分配單元 200:液體冷卻系統

Claims (9)

  1. 一種液體冷卻系統,用於一機架中的計算裝置,該液體冷卻系統包括:一熱接觸結構,用於一發熱電腦系統,該發熱電腦系統為安置於該機架中之複數個發熱電腦系統之一;一熱機架歧管以及一冷機架歧管,經由一封閉液體輸送系統連接至該熱接觸結構;一第一閥,定位於該熱機架歧管以及該熱接觸結構之間之該封閉液體輸送系統內,該第一閥控制冷卻液體從該熱接觸結構流出至該熱機架歧管之流動;一第二閥,定位於該冷機架歧管以及該熱接觸結構之間之該封閉液體輸送系統內,該第二閥控制冷卻液體從該冷機架歧管流入該熱接觸結構之流動;一液體洩漏偵測感應器,定位於一第一個發熱電腦系統,該第一個發熱電腦系統為該等在該封閉液體輸送系統下之複數個發熱電腦系統中之第一個發熱電腦系統;以及一控制系統,電性連接該液體洩漏偵測感應器、該第一閥、以及該第二閥,該控制系統被配置以:判定是否從該液體洩漏偵測感應器接收到指示該封閉液體輸送系統中的一洩漏的一電信號,回應於判定接收到指示一洩漏的一電信號,關閉該等複數個發熱電腦系統中之該第一個發熱電腦系統的電源, 回應於判定接收到指示一洩漏的該電信號,傳送一個或多個電信號以實施將該第一閥以及該第二閥從開啟位置移動到關閉位置,從而限制冷卻液體從該熱機架歧管以及從該冷機架歧管、沿該封閉液體輸送系統的移動,回應於判定接收到指示一洩漏的該電信號,該液體冷卻系統繼續冷卻除了該等複數個發熱電腦系統之該第一個發熱電腦系統以外的該等複數個發熱電腦系統,並且除了該等複數個發熱電腦系統之該第一個發熱電腦系統以外的該等複數個發熱電腦系統繼續接收電力。
  2. 如請求項1之液體冷卻系統,更包括一熱交換器,經由該封閉液體輸送系統連接至該熱機架歧管以及該冷機架歧管。
  3. 如請求項2之液體冷卻系統,其中該冷卻液體更從該熱接觸結構被輸送回該熱機架歧管以及該熱交換器。
  4. 如請求項1之液體冷卻系統,更包括:一第二熱接觸結構,用於一第二個發熱電腦系統,該第二個發熱電腦系統為該等安置於該機架中之複數個發熱電腦系統之第二個發熱電腦系統,該熱機架歧管以及該冷機架歧管經由該封閉液體輸送系統連接至該第二熱接觸結構;一第三閥,定位於該熱機架歧管以及該第二熱接觸結構之間之該封閉液體輸送系統內,該第三閥控制冷卻液體從該熱接觸結構流出至該熱機架歧管之流動;以及一第四閥,定位於該冷機架歧管以及該第二熱接觸結構之間之該 封閉液體輸送系統內,該第四閥控制冷卻液體從該冷機架歧管流入該熱接觸結構之流動。
  5. 如請求項4之液體冷卻系統,更包括:一第二液體洩漏偵測感應器,定位於該第二個發熱電腦系統,該第二個發熱電腦系統為該等在該封閉液體輸送系統下之複數個發熱電腦系統中之第二個發熱電腦系統,其中該控制系統更電性連接至該第二液體洩漏偵測感應器、該第三閥、以及該第四閥,該控制系統更被配置以:判定是否從該第二液體洩漏偵測感應器接收到指示該封閉液體輸送系統中的一洩漏的一電信號,回應於判定接收到指示一洩漏的一電信號,關閉該等複數個發熱電腦系統中之該第二個發熱電腦系統的電源,並且回應於判定接收到指示一洩漏的該電信號,傳送一個或多個電信號以實施將該第三閥以及該第四閥從一開啟位置移動到一關閉位置,從而限制冷卻液體從該熱機架歧管以及從該冷機架歧管、沿該液體輸送系統的移動。
  6. 一種用以控制液體冷卻系統洩漏的方法,該液體冷卻系統在一伺服器機架中,該伺服器機架包括複數個伺服器,該方法包括:監測複數個洩漏偵測感應器,各個洩漏偵測感應器位於一液體輸送系統之一段部下方的該等複數個伺服器中之一相應伺服器上;判定是否從該等複數個洩漏偵測感應器之一接收到指示該液體 輸送系統中的一洩漏的一信號;回應於判定接收到指示一洩漏的一信號,判定該洩漏偵測感應器以及該等複數個伺服器中、與接收到的信號相聯之一對應伺服器;回應於判定該等複數個伺服器中、與接收到的信號相聯之該對應伺服器,斷開該等複數個伺服器中之該對應伺服器的電源;回應於判定該等複數個伺服器中、與接收到的信號相聯之該對應伺服器,傳送一個或多個信號以實施將一第一閥以及一第二閥從開啟位置移動到關閉位置;以及回應於判定該等複數個伺服器中、與接收到的信號相聯之該對應伺服器,該液體冷卻系統繼續冷卻除了該等複數個伺服器之該對應伺服器以外的該等複數個伺服器,並且除了該等複數個伺服器之該對應伺服器以外的該等複數個伺服器繼續接收電力,其中該第一閥定位於一熱機架歧管以及一熱接觸結構之間之該液體輸送系統內,該熱接觸結構相聯於該等複數個伺服器之一,該伺服器與該接收到的信號相聯,並且其中該第二閥定位於一冷機架歧管以及該熱接觸結構之間之該液體輸送系統內,從而限制冷卻液體從該熱機架歧管以及該冷機架歧管沿該液體輸送系統的移動。
  7. 如請求項6之方法,其中回應於判定接收到指示一洩漏的該信號,該液體冷卻系統繼續監測該等複數個洩漏偵測感應器。
  8. 如請求項6之方法,其中回應於判定該等複數個伺服器中、與該接收到的信號相聯之該對應伺服器,繼續向除了該等複數個伺服器之該對應伺服器以外的該等複數個伺服器供電。
  9. 一種機架系統,包括:複數個計算裝置;以及一液體冷卻系統,包括:複數個洩漏偵測感應器,各自定位於一液體輸送系統之一段部下方的該等複數個計算裝置中之一相應計算裝置上,一第一閥,定位於一熱機架歧管以及一熱接觸結構之間之該液體輸送系統內,該熱接觸結構與該等複數個計算裝置之一相聯,一第二閥,定位於一冷機架歧管以及該熱接觸結構之間之該液體輸送系統內,以及一控制器,連接至該等複數個液體洩漏偵測感應器、該第一閥、以及該第二閥,該控制器被配置以:監測該等複數個洩漏偵測感應器,判定是否從該等複數個液體洩漏偵測感應器之一接收到指示該液體輸送系統中的一洩漏的一信號,回應於判定接收到指示一洩漏的一信號,判定該洩漏偵測感應器以及該等複數個計算裝置中、與該接收到的信號相聯之一對應計算裝置,回應於判定該等複數個計算裝置中、與接收到的信號相 聯之該對應計算裝置,傳送一信號以斷開該等複數個計算裝置中之該對應計算裝置的電源,回應於判定該等複數個計算裝置中、與接收到的信號相聯之該對應計算裝置,傳送一個或多個信號以實施將該第一閥以及該第二閥從開啟位置移動到關閉位置,以及回應於判定該等複數個計算裝置中、與接收到的信號相聯之該對應計算裝置,該液體冷卻系統繼續冷卻除了該等複數個計算裝置之該對應計算裝置以外的該等複數個計算裝置,並且除了該等複數個計算裝置之該對應計算裝置以外的該等複數個計算裝置繼續接收電力。
TW111113653A 2021-09-01 2022-04-11 機架系統、液體冷卻系統、以及用以控制液體冷卻系統洩漏的方法 TWI803276B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202163260816P 2021-09-01 2021-09-01
US63/260,816 2021-09-01
US17/514,479 US11868189B2 (en) 2021-09-01 2021-10-29 Systems and methods for controlling leaks in liquid cooling systems for computer devices
US17/514,479 2021-10-29

Publications (2)

Publication Number Publication Date
TW202311899A TW202311899A (zh) 2023-03-16
TWI803276B true TWI803276B (zh) 2023-05-21

Family

ID=85287124

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111113653A TWI803276B (zh) 2021-09-01 2022-04-11 機架系統、液體冷卻系統、以及用以控制液體冷卻系統洩漏的方法

Country Status (3)

Country Link
US (2) US11868189B2 (zh)
CN (1) CN115734562A (zh)
TW (1) TWI803276B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210267095A1 (en) * 2020-02-21 2021-08-26 Nvidia Corporation Intelligent and integrated liquid-cooled rack for datacenters

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110446396A (zh) * 2018-05-03 2019-11-12 百度(美国)有限责任公司 用于数据中心的液体冷却系统
US10729039B2 (en) * 2015-12-21 2020-07-28 Dell Products, L.P. Liquid cooled rack information handling system having storage drive carrier for leak containment and vibration mitigation
CN112533438A (zh) * 2019-09-18 2021-03-19 百度(美国)有限责任公司 InRow液体冷却模块

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110308783A1 (en) * 2010-06-17 2011-12-22 Mark Randal Nicewonger Fluid-powered heat exchanger apparatus for cooling electronic equipment
US9155230B2 (en) * 2011-11-28 2015-10-06 Asetek Danmark A/S Cooling system for a server
US10098258B2 (en) * 2015-03-12 2018-10-09 International Business Machines Corporation Minimizing leakage in liquid cooled electronic equipment
US9696235B2 (en) * 2015-03-18 2017-07-04 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Managing water leakage from a water cooling system within a compute node
JP2017145793A (ja) * 2016-02-19 2017-08-24 富士通株式会社 冷却装置及び電子機器
US20220390195A1 (en) * 2021-06-07 2022-12-08 Baidu Usa Llc Sectional architecture for fluid management and leakage sensors
US11818866B2 (en) * 2021-06-21 2023-11-14 Baidu Usa Llc Electronic rack control system for cloud servers
US11729946B2 (en) * 2021-08-31 2023-08-15 Baidu Usa Llc Electronics rack with leak segregation system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10729039B2 (en) * 2015-12-21 2020-07-28 Dell Products, L.P. Liquid cooled rack information handling system having storage drive carrier for leak containment and vibration mitigation
CN110446396A (zh) * 2018-05-03 2019-11-12 百度(美国)有限责任公司 用于数据中心的液体冷却系统
CN112533438A (zh) * 2019-09-18 2021-03-19 百度(美国)有限责任公司 InRow液体冷却模块

Also Published As

Publication number Publication date
CN115734562A (zh) 2023-03-03
US20230068535A1 (en) 2023-03-02
TW202311899A (zh) 2023-03-16
US20240053805A1 (en) 2024-02-15
US11868189B2 (en) 2024-01-09

Similar Documents

Publication Publication Date Title
US7349213B2 (en) Coolant control unit, and cooled electronics system and method employing the same
US9313931B2 (en) Multi-level redundant cooling method for continuous cooling of an electronic system(s)
US9874413B2 (en) Data center with dual radiator cabinets for redundant operation
US9811097B2 (en) Environmental control of liquid cooled electronics
US20080266726A1 (en) Cooling system for electrical devices
US7086247B2 (en) Cooling system and method employing auxiliary thermal capacitor unit for facilitating continuous operation of an electronics rack
US20080205003A1 (en) Redundant Cooling Systems And Methods
US20110265983A1 (en) Cooling apparatus and method
US9655286B2 (en) Facilitating fluid level sensing
CN103687442A (zh) 冷却设备及其制造方法
JP2010513845A5 (zh)
US11284535B2 (en) Leak mitigation in a cooling system for computing devices
TW200533276A (en) Cooling system and method employing multiple dedicated coolant conditioning units for cooling multiple electronics subsystems
US20210092880A1 (en) Cooling System For High Density Heat Loads
TWI803276B (zh) 機架系統、液體冷卻系統、以及用以控制液體冷卻系統洩漏的方法
US10893633B2 (en) Method of cooling an electronics cabinet
EP3702740B1 (en) Flow detection device, cooling arrangement for an electronic device, and rack hosting a plurality of electronic devices
EP3703476B1 (en) Cooling arrangement having primary and secondary cooling devices for cooling an electronic device
US20230025554A1 (en) Cooling circuits for cooling a computing system and flow control methods thereof
US11785748B2 (en) Backup cooling for a data center and servers
JP2004150664A (ja) 冷却装置
JP2022146556A (ja) 電池冷却システム
US20230062986A1 (en) Rack assembly for a data center and method for controlling cooling fluid in a cooling loop of the rack assembly
US11662126B2 (en) Leak mitigation system
TW202245583A (zh) 用於冷卻伺服器機架的流體迴路和系統