CN115135096A - 用于冷却电子机架的功率优化的热管理系统和方法 - Google Patents

用于冷却电子机架的功率优化的热管理系统和方法 Download PDF

Info

Publication number
CN115135096A
CN115135096A CN202210249433.5A CN202210249433A CN115135096A CN 115135096 A CN115135096 A CN 115135096A CN 202210249433 A CN202210249433 A CN 202210249433A CN 115135096 A CN115135096 A CN 115135096A
Authority
CN
China
Prior art keywords
power
input power
component
tec
components
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210249433.5A
Other languages
English (en)
Inventor
高天翼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of CN115135096A publication Critical patent/CN115135096A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20836Thermal management, e.g. server temperature control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D23/00Control of temperature
    • G05D23/19Control of temperature characterised by the use of electric means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/2039Modifications to facilitate cooling, ventilating, or heating characterised by the heat transfer by conduction from the heat generating element to a dissipating body
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2200/00Indexing scheme relating to G06F1/04 - G06F1/32
    • G06F2200/20Indexing scheme relating to G06F1/20
    • G06F2200/201Cooling arrangements using cooling fluid

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Thermal Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computer Hardware Design (AREA)
  • Human Computer Interaction (AREA)
  • Automation & Control Theory (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)
  • Dc-Dc Converters (AREA)
  • Cooling Or The Like Of Semiconductors Or Solid State Devices (AREA)

Abstract

根据一个实施例,一种热管理系统包括安装在信息技术(IT)组件上的热电冷却(TEC)元件,其中元件汲取第一功率以冷却组件;负载传感器,用于感测由组件汲取的用以执行第一组操作的第二功率;用于感测组件的温度的温度传感器;以及控制器,用于基于负载传感器确定所汲取的第二功率是否已经改变,其中组件在汲取第二功率的同时执行第二组操作,并且响应于改变的第二功率,基于温度和提供给组件的功率调整提供给元件和组件的功率,使得组件继续执行第二组操作,同时汲取小于调整前汲取的功率的经调整的功率。

Description

用于冷却电子机架的功率优化的热管理系统和方法
技术领域
本公开的实施例总体上涉及一种用于冷却电子机架的功率优化的热管理系统。
背景技术
包括多个有源电子机架的数据中心的热管理对于确保在机架中操作的服务器和其他信息技术(IT)装置(例如,执行IT数据处理服务)的适当性能至关重要。然而,如果没有适当的热管理,机架内的热环境(例如,温度)可能会超过热操作阈值,这可能导致不利后果(例如,服务器故障等)。管理热环境的一种方法是使用冷却空气来冷却IT装置。冷却空气使用冷却单元进行再循环,冷却单元提取由冷却空气捕获的热量。一种常用的冷却单元是机房空调(CRAC)单元,它是一种吸入热废气并向数据中心提供冷却空气以维持数据中心的热环境的设备。CRAC是一种广泛应用于现有风冷数据中心的风冷单元,并且还有很多用于风冷数据中心的其他类型的解决方案。此外,大多数现有数据中心都是风冷的。
最近,数据中心已经部署了更多的高功率密度电子机架,其中更多的高密度芯片被更紧密地封装在一起以提供更多的处理功率。由于人工智能(AI)和基于云的服务的发展,情况更是如此,它们需要高性能和高功率密度的处理器,诸如控制处理单元(CPU)和图形处理单元(GPU)。冷却这些高功率密度的处理器对于保持电子机架的功率效率至关重要。例如,处理器汲取的电能被转换为热能,从而产生更高的核心温度。随着温度升高,泄漏电流(或功率泄漏)增加,因此可能降低处理器的整体功率效率。为了对抗高温以保持机架的功率效率,可以增加数据中心的冷却能力(例如,增加数据中心室中冷却空气的产生以从处理器吸取更多热量)。尽管可以保持芯片效率,但是由于将处理器保持在期望温度以保持芯片的功率效率需要过量的冷却功率,因此整个数据中心的功率效率可能会受到影响。
如本文所述,数据中心可以利用额外的冷却功率以通过减少或消除由于过高的核心温度引起的功率泄漏来保持芯片效率。为了实施这样的方案,数据中心可以从公共设施(例如,交流(AC)干线(mains,也称为电源))汲取必要的功率。然而,为了减少对AC线路的依赖并减少碳足迹,一些设施正在转向可再生电力系统,诸如将太阳辐射转换为直流(DC)电力的光伏(PV)系统。与可从中汲取额外功率的AC线路不同,可再生电力系统可提供有限(恒定)量的功率(例如,在有限时间内),可用其为电气元件和冷却系统供电。
发明内容
在第一方面,提供一种用于电子机架的热管理系统,所述热管理系统包括:
安装到所述电子机架的信息技术(IT)组件上的热电冷却(TEC)元件,其中所述TEC元件和所述IT组件电耦接到电源,其中所述TEC元件从所述电源汲取第一输入功率以冷却所述IT组件;
负载传感器,其被布置为感测由所述IT组件从所述电源汲取的用以执行第一组操作的第二输入功率;
温度传感器,其被布置为感测所述IT组件的温度;以及
控制器,其被配置为
基于所述负载传感器确定所述IT组件汲取的所述第二输入功率是否已经改变,其中所述IT组件在汲取改变的第二输入功率的同时执行第二组操作,以及
响应于所述改变的第二输入功率,基于所述温度和所述改变的第二输入功率调整分别由所述TEC元件和所述IT组件汲取的所述第一输入功率和所述改变的第二输入功率,
其中,所述IT组件在汲取小于所述改变的第二输入功率的经调整的第二输入功率的同时继续执行所述第二组操作。
在第二方面,提供一种用于冷却信息技术(IT)组件的方法,所述方法包括:
确定由正在执行一组操作的有源IT组件从电源汲取的第一输入功率,其中耦接到所述IT组件的是从所述电源汲取第二输入功率以冷却所述有源IT组件的热电冷却(TEC)元件;
从温度传感器接收所述IT组件的温度读数;
基于所述温度读数和所述第一输入功率确定是否调整所述第一输入功率和所述第二输入功率;以及
响应于确定调整所述第一输入功率和所述第二输入功率,调整分别由所述IT组件和所述TEC元件汲取的所述第一输入功率和所述第二输入功率,使得所述IT组件在汲取小于所述第一输入功率的经调整的第一输入功率的同时继续执行所述一组操作。
在第三方面,提供一种非暂时性机器可读介质,具有存储在其中的指令,所述指令当由处理器执行时使所述处理器执行上述第二方面所述的方法的操作。
在第四方面,提供一种用于冷却信息技术(IT)组件的装置,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第二方面所述的方法的操作。
在第五发面,提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时使得所述处理器执行上述第二方面所述的方法的操作。
附图说明
在附图的图中通过示例而非限制性的方式示出了实施例,其中相同的附图标记表示相似的元件。需要说明的是,对本公开的“一个”或“一种”实施例的引用不一定是指同一实施例,而是指至少一个实施例。此外,为了简洁和减少图的总数,可以使用给定的图来说明一个以上实施例的特征,并且对于给定的实施例,并非需要图中的所有元件。
图1是示出根据一个实施例的TEC元件(或TEC设备)的示例的框图。
图2是示出根据一个实施例的包括用于冷却信息技术(IT)组件的TEC元件的热管理冷却系统的示例的框图。
图3是示出根据一个实施例的用于在TEC元件和IT组件之间分配优化功率的方法的流程图。
图4是示出根据一个实施例的功率优化曲线图。
图5是示出根据一个实施例的用于在TEC元件和IT组件之间分配优化功率的另一方法的流程图。
图6是示出根据一个实施例的电子机架的示例。
具体实施方式
现在参照附图解释本公开的几个实施例。当给定实施例中描述的组件的形状、相对位置和其他实施例没有明确定义时,本文公开的范围不仅限于所示出的组件,其仅用于说明的目的。此外,虽然阐述了许多细节,但应当理解,一些实施例可以在没有这些细节的情况下实践。在其他情况下,没有详细示出众所周知的电路、结构和技术,以免对本说明书的理解造成混淆。此外,除非有明显相反的含义,否则本文列出的所有范围均被视为包括各个范围的端点。
说明书中对“一个实施例”或“一种实施例”的提及是指结合实施例描述的特定特征、结构或特性可以包括在本公开的至少一个实施例中。说明书中不同地方出现的短语“在一个(种)实施例中”不一定均指同一实施例。
本公开通过实施可以由有限电源供电的用于优化用于冷却可以安装在数据中心室内的(例如,高功率密度)电子机架的功率以及优化计算功率使用效率的热管理和控制系统,解决了有效冷却电气组件(例如,处理器或芯片)的问题以减少电力泄漏。本公开中提出的解决方案提供了一种热管理和控制系统(或热管理系统),其部署安装在电子机架的一个或多个信息技术(IT)组件(例如,处理器)上的一个或多个热电冷却(TEC)元件(或TEC设备),并优化每个TEC元件和每个IT组件之间的功率分配,以有效地驱动IT组件(例如,减少功率泄漏)。例如,IT组件和TEC元件可以电耦接到有限的电源,诸如从太阳辐射产生直流(DC)电力的光伏(PV)系统。在操作期间,TEC元件可以从电源汲取功率以冷却IT组件,并且IT组件可以从相同的有限电源汲取功率以执行一个或多个计算操作。因此,在操作期间,TEC元件和IT组件都可以共享电源能够提供的有限量的能量。系统确定IT组件的温度读数并确定IT组件的计算工作量。例如,系统可以包括负载检测器,该负载检测器感测电源提供给IT组件的负载电流。根据工作量和温度读数,系统确定最佳运行温度(或温度阈值),在该温度下,IT组件和TEC元件之间的功率最佳分配,同时通过使功率泄漏最小化或消除功率泄漏而使IT组件的计算功率效率最大化。然后,系统向TEC元件分配功率以调整(例如,增加)系统的冷却能力,以便冷却IT组件,从而使温度读数可以匹配最佳操作温度或处于最佳操作温度的范围内。因此,此设计通过使提供给IT组件的功率量最大化同时使提供给TEC元件以消除(或减少)IT组件产生的泄漏功率所需的功率量最小化来优化IT组件和TEC元件的功率分配。通过使IT组件汲取的功率量最大化,使得IT组件能够在高功率操作条件下操作,在该条件下,IT组件可以使用较高的功率作为动力(例如,计算能力),同时保持适当的温度。此外,由于来自有限电源的可用功率有限,这种优化的冷却方案可以在高功率条件期间更好地利用电源,同时优化IT组件的性能。
根据一个实施例,一种用于电子机架的热管理系统包括:安装到电子机架的信息技术(IT)组件上的热电冷却(TEC)元件,其中TEC元件和IT组件电耦接到电源,其中TEC元件从电源汲取第一输入功率以冷却IT组件;负载传感器,其被布置为感测由IT组件从电源汲取的用以执行第一组操作的第二输入功率;温度传感器,其被布置为感测IT组件的温度;控制器,其被配置为基于负载传感器确定由IT组件汲取的第二输入功率是否已改变,其中IT组件在汲取第二输入功率的同时执行第二组操作,以及响应于改变的第二输入功率,基于温度和改变的第二输入功率,调整分别由TEC元件和IT组件汲取的第一输入功率和改变的第二输入功率,其中IT组件在汲取小于改变的第二输入功率的经调整的第二输入功率的同时继续执行第二组操作。
在一个实施例中,电源是包括PV板的光伏(PV)系统,PV板被布置成将太阳辐射转换成用于IT组件和TEC元件的输出功率。
在另一个实施例中,TEC元件和IT组件并联电耦接到电源,其中热管理系统进一步包括耦接在电源和TEC元件之间的功率调整设备,其中控制器通过向功率调整设备发送控制信号来调整第一输入功率和第二输入功率,以向TEC元件提供汲取的第一经调整的输入功率。在一些实施例中,第二输入功率的调整响应于功率调整设备向TEC元件提供第一经调整的输入功率并且与第一输入功率的调整成反比。在一个实施例中,功率调整设备为可调电阻设备或功率开关设备。
在一个实施例中,控制器被配置为通过使用改变的第二输入功率在将输入功率值与温度阈值相关联的数据结构中执行表查找来确定在执行第二组操作时IT组件运行所述的温度阈值,其中控制器基于与改变的第二输入功率相关联的温度阈值与由温度传感器感测的温度之间的差来调整第一输入功率和改变的第二输入功率。
根据另一个实施例,一种用于冷却信息技术(IT)组件的方法包括确定由正在执行一组操作的有源IT组件从电源汲取的第一输入功率,其中耦接到IT组件的是热电冷却(TEC)元件,其从电源汲取第二输入功率以冷却有源IT组件;从温度传感器接收IT组件的温度读数;基于温度读数和第一输入功率确定是否调整第一输入功率和第二输入功率;并且响应于确定调整第一输入功率和第二输入功率,调整分别由IT组件和TEC元件汲取的第一输入功率和第二输入功率,使得IT组件继续执行所述一组操作,同时汲取小于第一输入功率的经调整的第一输入功率。
在一个实施例中,电源是光伏(PV)系统,其包括被布置成将太阳辐射转换成用于IT组件和TEC元件的输出功率的PV板。在另一实施例中,TEC元件和IT组件并联电耦接到电源设备,其中耦接在TEC元件和电源之间的是功率调整设备,其中调整第一输入功率和第二输入功率包括向功率调整设备发送控制信号,以向TEC元件提供经调整的第二输入功率。在一些实施例中,第一输入功率的调整响应于功率调整设备向TEC元件提供经调整的第二输入功率并且与第二输入功率的调整成反比。在一个实施例中,功率调整设备为可调电阻设备或功率开关设备。
在一个实施例中,确定是否调整第一输入功率和第二输入功率包括:通过使用第一输入功率在将输入功率值与温度阈值相关联的数据结构中执行表查找来确定在执行所述一组操作时IT组件运行所处的温度阈值;并且确定温度读数是否超过所确定的与第一输入功率相关联的温度阈值。在另一个实施例中,确定由有源IT组件从电源汲取的第一输入功率包括确定IT组件的计算工作量,该计算工作量包括将由IT组件执行的所述一组操作,其中第一输入功率是根据计算工作量确定。
根据另一个实施例,非暂时性机器可读介质具有存储在其中的指令,该指令当被处理器执行时使处理器执行与在本文描述的方法中执行的操作类似的操作。
在一个实施例中,如本文所用,将一个组件(或元件)“耦接”到另一组件可以指将两个电子组件“电”耦接(例如,经由一根或多根导线)使得电流可以从一个组件流到另一个组件,从而向另一个组件的负载供电。
图1是示出根据一个实施例的TEC元件(或TEC设备)的示例的框图。此图示出了具有(至少)两个半导体4(即p型半导体和n型半导体,其具有不同的电子密度,例如,n型>p型)的TEC元件1。这些半导体可以布置为柱体,这些柱体彼此热并联布置,并且通过连接到热导体2的电导体3电串联布置。半导体中没有连接到电导体3的各个端连接到单独的导体。特别地,p型半导体连接到电导体5,而n型半导体连接到与导体5分开的另一个电导体9。电导体5和9均连接到另一个热导体6。另外,电导体5电耦接到电压源7的负极端并且电导体9电耦接到电压源的正极端(例如,经由一根或多根导线8)。在一个实施例中,电压源可以是外部电压源(例如,与TEC元件1分开)。在另一实施例中,电压源和TEC元件可以彼此耦接。例如,两个元件均可以是电气组件的一部分(例如,均安装在PCB板上)。在一些实施例中,电压源可以是电源21和/或一个或多个控制器的一部分,诸如控制器28,如图2所示。
在一个实施例中,TEC元件的任何组件可以由任何(已知)材料构成。例如,热导体2和6可以由陶瓷材料制成,陶瓷材料可以导热但不导电。作为另一个示例,电导体3、5和/或9可以由任何导体材料(例如,铜等)构成。
TEC元件被布置成以额外的外部电功率PTEC为代价将热量从一个表面移动到另一个表面。具体而言,当电压源7在两个电导体5和9上施加电压VTEC时,电流ITEC通过半导体,使TEC元件将热量Q0从“冷侧”传递到“热侧”。因此,施加到TEC上的功率PTEC=VTEC*ITEC。当电流通过半导体4时,半导体4会产生温差,如T0-T1所示。最终从热侧排出的热量是Q1,它可能大于Q0,因为Q1可能包括Q0和在TEC处于活跃状态时由TEC元件产生的任何热量Q’。换句话说,Q1=Q0+Q’。因此,在操作期间,作为如本文描述的热管理系统的一部分,热导体2可以耦接到(例如,安装在)IT组件上,使得TEC元件将IT组件生成的Q0从该组件抽走并且进入热导体6。将该热量从IT组件中抽走从而在IT组件处于活跃状态(例如,执行一个或多个计算操作)并且TEC元件处于操作状态时冷却IT组件。
图2是示出根据一个实施例的包括用于冷却一个或多个信息技术(IT)组件25的TEC元件1的热管理系统20的示例的框图。特别地,此图示出了热管理系统20,其被配置为优化TEC元件1和IT组件25之间的功率分配。如图所示,该系统包括TEC元件1、电源21、功率调整设备22、IT装置24、IT组件25、温度传感器26、负载传感器(或检测器)27和控制器28。
如图所示,热管理系统20的组件布置被设计成使得TEC元件和IT组件从电源汲取功率。特别地,电源21被耦接到TEC元件1,并且被耦接到IT组件(经由IT装置)。特别地,电源21可以耦接到IT装置,由此IT装置可以将功率路由到安装在其上的IT组件(例如,经由一根或多根走线)。在一个实施例中,电源可以直接耦接到IT组件。如图所示,TEC元件和IT组件并联耦接到电源,并被布置为从电源汲取输入功率。电源和TEC元件之间耦接的是功率调整设备22。此外,热管理系统包括多个开关,S1-S3,其中S1耦接在电源和两个并联支路之间,S2耦接在功率调整设备与S1之间,S3耦接在IT组件与S1之间。在一个实施例中,热管理系统布置可以不同。例如,系统可以包括更多或更少的开关。
在一个实施例中,每个元件可以是单独的电气设备(例如,它们可以相互耦接或安装),如此图所示。在另一个实施例中,这些元件中的至少一些元件可以是一个或多个元件的一部分,诸如容纳在共享外壳内。例如,温度传感器26可以是IT组件25的一部分,如本文所述。
电源21可以是被设计成向热管理系统20的一个或多个元件提供功率的任何类型的电源。例如,电源可以是“有限”电源,其中该电源产生总输出功率P,作为有限(或恒定)的功率量,用于给定数量的与电源电耦接的组件。在一个实施例中,电源可以是任何类型的可再生能源,诸如包括一个或多个PV板的PV系统,该一个或多个PV板被布置为将太阳辐射转换为用于系统(例如,TEC元件1和/或IT组件25)的DC输出功率,作为P。在一个实施例中,热管理系统(例如,的电源)可以包括附加元件,诸如耦接在PV板和至少一些其他元件之间的DC-DC转换器(未示出),并被配置为将PV板的输出电压转换为DC-DC转换器的输出电压。在一些实施例中,转换器可以是降压转换器、升压转换器或降压-升压转换器。在另一个实施例中,电源可包括其他可再生能源,诸如设计成将风能转换成电能的一个或多个风力涡轮机。在另一个实施例中,PV系统可以包括一个或多个电池,该一个或多个电池被充电以存储由PV板产生的能量以供稍后用于为一个或多个负载供电,如本文所述。在另一个实施例中,电源可以设计为提供AC功率,诸如发电机。在一些实施例中,电源可以是公用电源(例如,交流(AC)干线)。在这种情况下,公用电源在功率上限条件下可能是有限电源。
在一些实施例中,热管理系统20可以包括两个或更多个电源。例如,系统可包括PV系统和一个或多个电池,使得系统可从PV系统、电池或其组合汲取功率。
功率调整设备22可以是被设计成响应于接收到控制信号来调整(例如,增加或减少)从电源21流向TEC元件的输入电流(或输入功率)的量的任何设备。特别地,通过该设备的调整可以调整供应给IT组件和TEC元件的输入功率。例如,调整可以增加从电源到TEC元件的电流,而(例如,同时地)可以减少供应给IT组件的电流(例如,成反比)。这种比例可能是由于电源是有限电源,其中TEC元件和IT组件共享由电源提供的P。在一个实施例中,调整设备可以是可调电阻设备(例如,数字可变电阻器或电位器),其电阻值可以被调整以增加或减少电流。在另一个实施例中,调整设备可包括大功率开关(例如,功率金属-氧化物-半导体场效应晶体管(MOSFET)),其可以基于脉冲宽度调制(PWM)信号的工作周期而减少(或增加)从电源流入TEC元件的平均输入电流。本文描述了更多关于控制功率调整设备的内容。
在一个实施例中,IT装置24可以是布置成容纳一个或多个IT组件25和/或任何类型的电气组件(诸如控制器)的任何元件(诸如PCB)。在另一个实施例中,IT组件可以是被设计为执行数据处理任务(或计算操作)的任何电气组件(例如,处理器等)。本文描述了有关IT组件和IT装置的更多信息。
在一个实施例中,热管理系统20可以是风冷系统,其中TEC元件可以将从IT组件汲取的热量散发到周围环境中以冷却IT组件。在这种情况下,TEC元件可以耦接到(或安装在)IT组件上,并且散热器(未示出)可以堆叠在TEC元件的顶部。对于这种设计,散热器可以从TEC元件接收热量,然后将热量传送(或排出)到空气中。在另一个实施例中,该系统可以是液冷系统,其中TEC元件与安装在IT组件和/或TEC元件上的液冷设备(例如,冷板)结合使用。例如,冷板可以堆叠在TEC元件的顶部,而TEC元件安装在IT组件上。在这种设计中,TEC可以将热量从IT组件吸走并传送到流经冷板的液体冷却剂中。在另一种设计中,冷板可以设置在TEC元件和IT组件之间。在这种情况下,系统可以采用混合冷却设计,其中冷板将至少一些热量从IT组件传送到液体冷却剂中,而TEC元件可以布置为从冷板和/或IT组件吸取热量进入散热器,散热器经由安装在TEC元件和/或冷板上的一个或多个散热器将热量散发到周围环境中。
在一个实施例中,TEC元件1可以被设计成基于热管理系统的需要而处理不同的功率范围。例如,TEC元件可以被设计成汲取和散发低热负载,或者可以被设计成散发高热负载。在一个实施例中,TEC元件可以与性能系数(COP)相关联,其中COP等于从IT组件移除的热负载(例如Q0)除以TEC元件的输入功率。因此,随着COP的增长,驱动TEC元件以去除相同量的由IT组件生成的热量所需的输入功率会减少。在一个实施例中,热管理系统的最佳功率分配可以基于TEC元件的最大COP,使得需要最小的输入功率来冷却系统。
如本文所述,TEC元件1可汲取电功率(例如,从电源21)作为PTEC,以将热量从TEC元件的冷侧传送到热侧(并且最终通过例如散热器)。在一个实施例中,TEC元件可以是TEC系统(其是热管理系统的一部分)的一部分,TEC系统从电源汲取更多功率以提供冷却能力。例如,当系统为风冷系统时,TEC系统可以包括一个或多个风扇,这些风扇被布置为将空气推(或拉)过散热器(和TEC元件)以提高热量传送。作为另一示例,当系统是液冷系统时,TEC系统可以包括一个或多个液体泵,这些液体泵被布置为供应(或抽吸)液体冷却剂通过一个或多个冷板。因此,PTEC还可以包括TEC系统的其他元件(诸如一个或多个风扇和一个或多个泵)所需的额外功率。在另一个实施例中,PTEC还可以包括操作一个或多个控制器(例如,控制器28)所需的电功率。
温度传感器26可以是任何类型的传感器,其被设计为感测IT组件25(和/或IT装置24)的温度,并且被配置为产生代表温度读数的电信号。例如,传感器可以感测IT组件的外壳温度。在一个实施例中,传感器可以是单独的电气组件。在另一个实施例中,传感器可以是IT组件和/或IT装置的一部分。在一些实施例中,热管理系统可以包括附加的温度传感器。例如,该系统可以包括被布置为感测环境温度的传感器。在一个实施例中,IT组件的温度读数可以代表当TEC元件1正在冷却组件时组件的温度。因此,较低的温度读数可能与TEC元件从电源汲取更多功率以增加冷却能力相关。
负载传感器27可以是任何类型的传感器,其被设计为感测IT组件25的(计算)工作量,并且被配置为产生代表工作量的电信号。特别地,负载传感器可以感测由IT组件从电源汲取的用以执行一组操作的输入功率。例如,负载传感器可以是感测IT组件从电源汲取的负载电流的电流传感器。在另一个实施例中,负载传感器可以感测来自可以与IT组件通信耦接的控制器28的工作量。在另一个实施例中,负载传感器可以被配置为通过感测IT组件的计算工作量来确定IT组件的输入功率,IT组件的计算工作量包括将要(或正在)由IT组件执行的一组操作(例如,功能或任务)。例如,负载传感器可以确定来自控制器28的计算工作量,这可以指示IT组件的性能(例如,IT组件的时钟速度)。根据确定的计算工作量,负载传感器可以确定IT组件执行操作所需的输入功率(例如,通过使用计算工作量在将工作量与功率需求相关联的数据结构中执行表查找)。
控制器28可以是专用处理器,诸如专用集成电路(ASIC)、通用微处理器、现场可编程门阵列(FPGA)、数字信号控制器或一组硬件逻辑结构(例如,过滤器、算术逻辑单元和专用状态机)。在一个实施例中,控制器可以是具有模拟元件(例如,电阻器、电容器、电感器等)和/或数字元件(例如,基于逻辑的元件,诸如晶体管等)的组合的电路。控制器还可以包括存储器。如图所示,控制器28通信耦接到温度传感器26和负载传感器27以分别接收一个或多个指示IT组件25的温度读数和IT组件的电流负载的电信号。控制器还通信耦接到三个开关S1-S3和功率调整设备22。例如,控制器可以经由有线连接耦接到这些元件。
在一个实施例中,控制器28可以被配置为执行一个或多个功率优化操作以确定TEC元件和IT组件之间的最优功率分配,以便使电源21提供的可用(但有限)功率最大化,同时使TEC元件所需的功率最小化并使IT组件的功率泄漏最小化。具体地,对于IT组件在高功率条件下执行时(例如,当需要大量负载电流来执行计算操作的时候),IT组件可能需要来自电源21的最大量的输入功率。然而,在汲取高功率时,IT组件的核心温度会升高。这导致IT组件的输入功率P组件(例如,从电源汲取的)是组件的功率泄漏P泄露和计算功率P计算的组合,其中功率泄漏P泄露由于核心温度的升高而增加,计算功率P计算是IT组件用来执行必要计算操作的功率。因此,P组件=P泄露+P计算。控制器被配置为确定温度阈值(或温度范围),在该温度阈值(或温度范围)下,TEC元件可以在高功率条件下操作时冷却IT组件,从而使组件能够最大化P计算并最小化(或消除)P泄露,同时最小化PTEC。随着将IT组件冷却到温度阈值,IT组件从电源汲取较少功率,因为至少消除了P泄露(例如,在最佳温度下,P组件=P计算)。因此,IT组件可以能够在较少的功率条件下执行相同的操作,因为IT组件汲取的大部分功率用于执行计算。
在另一个实施例中,功率优化可以使IT组件能够汲取更多的功率,并因此执行更多的计算操作。如前所述,一旦系统达到最佳温度,IT组件可以汲取P计算,期可能小于P组件=P泄露+P计算(例如,当IT组件未在最佳工作温度下操作时)。作为替代的实施例,当PTEC被最小化时,IT组件可以被配置为汲取更多功率Pextra(其中P组件=P计算+P额外)。在一个实施例中,P额外可以与P泄露相同,使得IT组件可以汲取与优化功率分配时相同的功率。在一个实施例中,由于温度阈值可以是一个范围,因此IT组件可能能够汲取更多功率,使得IT组件响应于汲取更多功率而生成更多热量,只要IT组件的温度保持在范围内。
例如,控制器从温度传感器26接收温度读数,并从负载传感器27接收IT组件的(电流)输入功率(作为电信号)。控制器基于温度读数和感测到的IT组件的输入功率来确定是否调整IT组件和TEC元件的输入功率。换句话说,控制器确定TEC元件是否需要更多或更少的功率,以便将IT组件的核心温度设置为实现最佳性能的温度阈值。在一个实施例中,为了确定这一点,控制器可以使用IT组件的输入功率在将输入功率值与温度阈值(或范围)相关联的数据结构中执行表查找。在另一个实施例中,控制器可以包括功率优化模型(例如,在受控设置中派生),其响应于作为输入的功率值输出温度阈值。一旦确定,控制器可以向功率调整设备22发送控制信号以向TEC元件提供更多(或更少)的功率以便调整IT组件的温度。例如,当功率调整设备是可变电阻器时,为了降低提供给TEC元件的功率,控制信号可以增加电阻。另一方面,为了增加TEC元件的功率输入以降低温度,控制信号可以降低电阻。作为另一个示例,当功率调整设备为功率开关时,控制信号可以是PWM信号,当工作周期高时,其可以使TEC元件接收更多功率以降低温度。因此,控制器可以持续调整输入功率,直到IT组件的温度读数达到温度阈值或处于温度阈值的范围内。
在一个实施例中,控制器可以基于调整功率调整设备22来调整TEC元件1和IT组件25两者的输入功率,如前所述。特别地,对IT组件的功率调整可以响应于对TEC元件的输入功率的调整,例如,对IT组件的功率调整可以是响应于对TEC元件的输入功率的调整而进行的自动调整。例如,在高功率条件下,IT组件可以汲取与电源21的总输出功率(例如,“X”瓦特)相等(或近似)的输入功率。在这种情况下,随着控制器调整功率调整设备以向TEC元件提供更多的输入功率,IT组件的输入功率可以响应于控制器的调整而调整并且可以与TEC元件的功率调整成反比。换句话说,TEC元件可以从电源汲取在其他情况下可能由IT组件汲取的功率(例如,TEC元件可以汲取“Y”瓦特,而IT组件现在汲取“X-Y”瓦特)。在一个实施例中,IT组件的输入功率的减少可以至少部分地对应于IT组件在温度阈值下操作所产生的P泄露的减少。
如本文所示,热管理系统20包括多个开关S1-S3,它们通信耦节至控制器28以便从控制器接收控制信号以控制开关的状态(例如,打开或闭合)。在一个实施例中,控制器基于电源的操作状态来控制S1的状态。如本文所述,电源可以是PV系统。然而,在PV系统没有提供足够的输出功率的情况下(例如,在阴天或夜间),控制器可以打开S1以防止电源成为负载。在这种情况下,热管理系统20可以从诸如电池(未示出)之类的其他电源汲取功率。在另一个实施例中,控制器可以在边界条件下控制S2和S3。例如,控制器可以闭合S3并打开S2以最初从电源向IT组件提供全输出功率。然而,随着温度升高,控制器可以闭合S2,以开始为TEC元件提供功率来冷却IT组件。
在一个实施例中,系统可以包括更多或更少如本文所述的元件。如本文所描述的,TEC元件被布置成耦接到(或安装在)IT组件上,以便在组件处于活跃状态时(例如,执行一个或多个计算或操作)将热量从IT组件吸走。TEC元件和IT组件均可以连接(诸如电耦接)到电源21以汲取功率。在一些实施例中,系统可以包括一个或多个IT组件,其中至少一些附加IT组件可以具有安装在其上的TEC元件,使得附加IT组件和TEC元件可以耦接到电源21。作为另一示例,系统可以不包括负载传感器,但是控制器(或另一电子设备)可以执行负载传感器操作以感测IT组件的工作量,如本文所述。
图3是根据一个实施例的用于在TEC元件1和IT组件25之间分配优化功率的方法30的流程图。在一个实施例中,方法30的至少一些操作可以由图2的控制器28执行。
方法30开始于控制器28确定IT组件的当前操作状态(在块31)。特别地,控制器可以确定IT组件的计算工作量、IT组件在执行一组操作时汲取的输入功率(或负载电流)等。例如,控制器可以从负载传感器接收电信号,该电信号表示供应给IT组件的负载电流。根据负载电流,控制器可以确定IT组件的输入功率P组件。在另一个实施例中,控制器可以基于IT组件要执行(或正在执行)的计算工作量来确定负载电流。控制器可以确定一个或多个热管理系统特性(在块32)。在一个实施例中,该特性可以包括电源的总输出功率P、由TEC元件1汲取以冷却IT组件的PTEC(或输入电流)、热管理系统所处环境的环境温度、TEC元件的最大COP等。在一个实施例中,PTEC可以基于电源21的总功率来计算,因为P=P组件+PTEC。控制器从温度传感器26接收IT组件的温度读数(在块33)。
控制器28确定IT组件的温度读数是否为IT组件和TEC元件之间的功率分配最优时的温度(在块34)。具体而言,控制器确定是否需要调整IT组件和/或TEC元件汲取的输入功率,以确保IT组件处于最佳温度,在该最佳温度下,功率被最佳(或有效)分配(例如,相对于P,通过最小化PTEC和P泄露和/或最大化P计算)。特别地,控制器可以基于IT组件的当前操作状态(例如,P组件)和/或IT组件的温度读数来做出此确定。在另一个实施例中,该确定可以基于一个或多个系统特性,诸如PTEC、P和环境温度。在一个实施例中,控制器可以通过使用P组件(其可以是在不太理想的功率条件下汲取的功率,使得P组件=P计算+P泄露)以在将输入功率值与温度阈值(或范围)相关联的数据结构中执行表查找,来确定在较低(更优化的)功率条件下执行(例如,相同)操作时IT组件运行所处的温度阈值(或范围)。在一个实施例中,该确定还可以基于P。例如,热管理系统(例如,控制器的存储器)可以包括针对电源的每个(或一系列)潜在P的数据结构。
如果IT组件25的温度不是优化功率分配的最佳温度(例如,等于温度阈值或在温度阈值的范围内),则控制器28调整IT组件和TEC元件1之间的功率分配,使得IT组件的温度处于最佳温度,例如,在最佳温度的范围内(在块35)。特别地,控制器可以基于从表查找获取的温度阈值与由温度传感器26感测的温度读数之间的差来调整TEC元件1的输入功率(通过向功率调整设备发送控制信号来调整元件的输入电流)。例如,如果温度阈值低于温度读数,则控制器可以降低功率调整设备的电阻(当设备为可变电阻时),使得TEC元件汲取更多功率为IT组件提供更多冷却。如本文所述,热管理系统是封闭系统,其中由TEC元件汲取的功率可从IT组件汲取。
在一个实施例中,控制器在调整功率分配时还可以考虑其他系统特性。例如,当TEC元件是空冷的(例如,具有散热器)时,系统可以考虑环境温度,使得在温度高的情况下,系统可以向TEC元件提供更多功率以补偿高环境温度(例如,为了增加向周围环境的热传送)。在另一个实施例中,系统可以基于对TEC元件的COP的调整,使得PTEC可以最大化COP。
然而,如果温度读数是温度阈值或在其范围内,则控制器28可以维持IT组件25和TEC元件1之间的功率分配(例如,通过不调整功率设备22)。
在一个实施例中,方法30的操作可以在热管理系统的启动期间执行。具体地,这些操作可以在IT组件25开始汲取输入功率以执行操作时执行。此时,TEC元件可能不会汲取功率(例如,S2打开),因此IT组件可能在(或接近)环境温度下运行。当确定了最佳温度,控制器就可以调整TEC元件和/或IT组件的输入功率(例如,通过闭合S2并调整功率调整设备22,如本文所述)。
在另一个实施例中,控制器可以基于IT组件的操作状态的改变来执行操作。特别地,每当IT组件的工作量调整时(例如,基于IT组件执行的计算操作的改变而汲取更少或更多输入功率),控制器可以执行至少一些操作以针对改变的条件优化功率分配。例如,控制器可以基于由IT组件汲取的用于执行一组操作的输入功率来执行至少一些操作。控制器可以确定IT组件的操作状态(例如,定期地或响应于改变)。例如,控制器可以基于由负载传感器感测到的负载来确定IT组件的输入功率是否已经改变。在这种情况下,IT组件可以执行与以前不同(例如,更多)的操作。响应于改变的输入功率,控制器可以执行方法30的操作以基于IT组件的当前温度和改变的输入功率来确定优化功率分配的IT组件的温度阈值。确定后,控制器就可以调整TEC元件和/或IT组件的输入功率(例如,通过控制功率调整设备以允许TEC元件从IT组件汲取功率)。在这种情况下,当IT组件的外壳温度达到最佳温度,IT组件可以继续执行操作,同时汲取更少的功率P计算,因为较低的温度可以减少或消除P泄露
图4是根据一个实施例的功率优化曲线图40。如本文所述,热管理系统确定如何将来自电源21的功率最佳地分配到(至少)TEC元件1和IT组件25。具体地,热管理系统可以在将温度阈值与输入功率值(例如,P计算)相关联的数据结构(例如,调谐表)中执行表查找,其中当IT组件在该温度下冷却时,组件的功耗被最大化。在一个实施例中,IT组件效率可以表示为
Figure BDA0003546341520000141
因此,必须降低PTEC+P泄露项以实现P计算的高效率,其中剩余的功率可用于为IT组件供电,使得P计算=P–(PTEC+P泄露)。
在一个实施例中,可以基于当确保η尽可能接近1时从热管理系统的一个或多个元件(例如,TEC元件、IT组件等)的特性(例如,在操作条件下)得出的计算数据来开发调谐表(例如,在受控环境中,诸如实验室)。
例如,功率优化曲线图40示出了热管理系统相对于TEC元件的输入电流消耗的功率。特别地,该曲线图示出了相对于电流的三个输入功率,PTEC41、P计算42和P泄露43。在一个实施例中,输入功率中的每一个可以为相同比例或不同比例。如图所示,随着PTEC41从零增加,P泄露43减少,这是IT组件的核心温度由于TEC元件的冷却能力增加而降低的直接结果。此外,随着P泄露43的减少,P计算42由于IT组件的效率提高而增加。
在一个实施例中,所有三个输入功率可以等于电源的总输出功率,使得P=P计算+P泄露+PTEC。因此,沿相同X值的三个输入功率的Y值等于P。如图所示,驱动TEC元件的最佳电流I最佳44与P计算的最高点相关联,P计算的最高点是最优输入功率,在该输入功率下IT组件可以最有效地操作(例如,在这种情况下η最接近1或为1)。根据I最佳44,可以确定温度阈值(例如,通过在用I最佳44驱动TEC元件时感测温度),利用它可以生成调谐表。
如上所述,调谐表可以将温度阈值与IT组件的输入功率值相关联。在一些实施例中,调谐表可以将TEC元件的最佳输入电流与输入功率值相关联。
图5是根据一个实施例的用于在TEC元件1和IT组件25之间分配优化功率的方法50的流程图。在一个实施例中,该方法的操作可以由图2的热管理系统20(例如,热管理系统20的控制器28)执行。该方法50开始于控制器确定有源IT组件正在执行一组操作时从电源汲取的第一输入功率,其中耦接到IT组件的是TEC元件,其从电源汲取第二输入功率以冷却有源IT组件(在块51)。控制器从温度传感器26接收IT组件的温度读数(在块52)。控制器基于温度读数和第一输入功率确定是否调整第一输入功率和第二输入功率(在块53)。具体地,控制器确定应该从电源向TEC元件提供更多还是更少的输入功率。例如,控制器可以通过使用第一输入功率在将输入功率值与温度阈值相关联的数据结构中执行表查找来确定当执行一组操作时IT组件运行所处的温度阈值,并且可以确定IT组件的温度读数是否超过(或小于)所确定的与第一输入功率相关联的温度阈值,如图3中所述。响应于确定调整第一输入功率和第二输入功率,调整分别由IT组件和TEC元件汲取的第一输入功率和第二输入功率,使得IT组件在汲取小于第一输入功率的经调整的第一输入功率的同时继续执行该组操作(在块54)。例如,在IT组件从电源汲取尽可能多的功率(例如,接近或处于P)的高功率条件下,对TEC元件的第二输入功率的调整会影响由IT组件汲取的第一输入功率。例如,热管理系统可以通过调整(或控制)功率调整设备22,将IT组件汲取的一些功率重新路由到TEC元件来分配功率,如本文所述。因此,对IT组件的第一输入功率的调整可以响应于功率设备22的调整,和/或可以与TEC元件的增加成反比。
一些实施例可以分别对图3和图5的方法30和方法50进行变型。比如,方法的具体操作可以不按照所示出和描述的确切顺序执行。具体的操作可以不以一个连续的操作序列执行,且不同的具体操作可以在不同的实施例中进行。例如,可以省略一些操作,诸如在具有虚线边框的块(例如,块32)中描述的操作。在这种情况下,控制器28可以被配置为基于IT组件的当前操作状态(例如,输入功率)和IT组件的温度读数来确定(或调整)TEC元件和IT组件之间的功率分配,如本文所述。
如上所述,热管理系统被配置为确定TEC元件1和IT组件25的优化功率。在另一个实施例中,可以执行操作以确定耦接(或安装)到多个IT组件的多个TEC元件的功率优化。在这种情况下,可以执行至少一些操作以使每个IT组件的P计算最大化且P泄露最小化,同时还使用于冷却组件的TEC元件的PTEC最小化。因此,在一个示例中,当多个TEC元件冷却组件时,系统可以确定优化TEC元件和TEC元件从中汲取热量的组件的性能的不同(或相似)温度。
图6是根据一个实施例的电子机架的示例。电子机架500可以包括一个或多个服务器插槽以分别容纳一个或多个服务器。每台服务器都包括一个或多个信息技术(IT)组件(例如,处理器、存储器、存储设备、网络接口)。根据一个实施例,电子机架500包括但不限于CDU501、机架管理单元(RMU)502(可选)、电源单元(PSU)550和一件或多件IT装置(或IT装置)503A-503D,该IT装置可以是任何类型的IT装置,诸如刀锋服务器。IT装置503可以分别从电子机架500的前端504或后端505插入服务器插槽阵列中。
注意,尽管此处仅示出了四件IT装置503A-503D,但在电子机架500内可以保持更多或更少的IT装置。还要注意,CDU 501、RMU 502、PSU 550和IT装置503的特定位置仅示出用于说明目的;也可以实现这些组件的其他布置或配置。注意,电子机架500可以对环境开放或部分被机架容器容纳,只要冷却风扇可以产生从前端到后端的气流(或产生从后端到前端的气流)。
在一个实施例中,机架500可以包括热管理系统20的一个或多个电子组件,如图2中所示。例如,IT装置24可以是多件IT装置503A-503B中的一件。此外,如图所示,每件IT装置包括安装在至少一个IT组件25上的至少一个TEC元件23。在这种情况下,系统20可以为电子机架(例如,其组件中的至少一些)提供冷却。在一个实施例中,控制器28可以安装在机架500内(例如,作为多件IT装置的一件)。
此外,风扇模块可以与每件IT装置503和PSU模块相关联。在该实施例中,风扇模块531A-531E统称为风扇模块531,并且分别与多件IT装置503A-503D和PSU相关联。每个风扇模块531包括一个或多个冷却风扇。风扇模块531可以安装在IT装置503的后端以产生从前端504流动、穿过机架500并且从电子机架500的后端505排出的气流。在另一个实施例中,一个或多个风扇模块可以位于机架500的前端504。这样的前端风扇可以被配置为将空气推入安装的装置中。
在一个实施例中,CDU 501主要包括热交换器511、液体泵512和泵控制器(未示出),以及一些其他组件,诸如储液器、电源、监测传感器等。热交换器511可以是液体-液体热交换器。热交换器511包括具有入口和出口端口的第一回路,该第一回路具有耦接到外部液体供应/返回管线532-533以形成主回路的第一对液体连接器。耦接到外部液体供应/返回管线532-533的连接器可以设置或安装在电子支架500的后端505。液体供应/返回管线532-533耦接到一组室内歧管,该组室内歧管耦接到外部散热系统,或极值冷却回路。此外,热交换器511进一步包括具有两个端口的第二回路,该第二回路具有耦接到液体歧管525以形成辅助回路的第二对液体连接器,其可以包括用于将冷却液体供应到IT装置503的供应歧管和将较热液体返回到CDU 501的返回歧管。注意,CDU 501可以是任何类型的市售或定制的CDU。因此,本文将不描述CDU 501的细节。
每件IT装置503包括一个或多个IT组件25(例如,中央处理单元或CPU、图形处理单元(GPU)、存储器和/或存储设备)。每个IT组件可以执行数据处理任务,其中IT组件可以包括安装在存储设备中、加载到存储器中并由一个或多个处理器执行以执行数据处理任务的软件。这些IT组件中的至少一些可附接到上述任何冷却设备的底部。IT装置503可以包括耦接到一个或多个计算服务器(也称为计算节点,诸如CPU服务器和GPU服务器)的主机服务器(称为主机节点)。主机服务器(具有一个或多个CPU)通常通过网络(例如,互联网)与客户端连接以接收对特定服务的请求,诸如存储服务(例如,诸如备份和/或恢复之类的基于云的存储服务)、执行应用以执行某些操作(例如,图像处理、深度数据学习算法或建模等,作为软件即服务或SaaS平台的一部分)。响应于该请求,主机服务器将任务分配给由主机服务器管理的一个或多个性能计算节点或计算服务器(具有一个或多个GPU)。性能计算服务器执行实际任务,在操作过程中可能会生成热量。
电子机架500进一步包括可选的RMU 502,其被配置为提供和管理供应给服务器503、风扇模块531和CDU 501的功率。优化模块521和RMC 522可以在一些应用中与控制器通信。RMU 502可以耦接到PSU 550以管理PSU的功耗。PSU 550可以包括必要的电路(例如,交流电(AC)到直流电(DC)或DC到DC的功率转换器、备用电池、变压器或调节器等)以向电子机架500的其余组件提供功率。
在一个实施例中,电子机架500可以从AC干线汲取功率以给安装在其中的电子设备供电。在另一个实施例中,机架可以从一个或多个可再生能源,诸如图2的电源21汲取功率。在这种情况下,电子机架可以从一个或多个可再生能源(例如,PV系统)汲取功率,并且供应给IT装置503、IT组件25和耦接到IT组件以提供冷却能力的TEC元件1。在一个实施例中,PSU可以电耦接到电源,诸如图2中所示的电源21。
在一个实施例中,RMU 502包括优化模块521和机架管理控制器(RMC)522。RMC 522可以包括监控器,以监控电子机架500内的各个组件(诸如,例如,IT装置503、CDU 501和风扇模块531)的操作状态。特别地,监控器从各个传感器接收表示电子机架500的操作环境的操作数据。例如,监控器可以接收表示处理器、冷却液体和气流的温度的操作数据,其可以经由各个温度传感器捕获和收集。监控器还可以接收表示由风扇模块531和液体泵512产生的风扇功率和泵功率的数据,这些数据可以与它们相应的速度成比例。这些操作数据被称为实时操作数据。注意,监控器可以作为RMU 502内的单独模块来实现。
基于操作数据,优化模块521使用预定的优化函数或优化模型进行优化以获得风扇模块531的一组最佳风扇速度和液体泵512的最佳泵速度,使得液体泵512和风扇模块531的总功耗达到最小值,同时与液体泵512和风扇模块531的冷却风扇相关的操作数据在它们相应的设计规格内。当确定了最佳泵速度和最佳风扇速度,RMC522就基于最佳泵速度和风扇速度配置液体泵512和风扇模块531的冷却风扇。
例如,基于最佳泵速度,RMC522与CDU501的泵控制器通信以控制液体泵512的速度,进而控制供应至液体歧管525的将要分配给至少一些刀锋服务器503的冷却液的液体流速。因此,操作条件和相应的冷却设备性能被调整。类似地,基于最佳风扇速度,RMC522与每个风扇模块531通信以控制风扇模块531的每个冷却风扇的速度,进而控制风扇模块531的气流速度。注意,每个风扇模块531可以以其特定的最佳风扇速度被单独控制,并且不同风扇模块和/或同一风扇模块内的不同冷却风扇可以具有不同的最佳风扇速度。
注意,一些或所有IT装置503(例如,503A、503B、503C和/或503D)可以使用不同的冷却方法。例如,一台服务器可以使用空气冷却,而另一台服务器可以使用液体冷却。可替代地,服务器的一个IT组件可以使用空气冷却,而同一服务器的另一个IT组件可以使用液体冷却。在另一实施例中,可通过使用一个或多个TEC元件来冷却至少一件IT装置,如本文所述。
如先前解释的,本公开的实施例可以是(或包括)其上存储有指令的非暂时性机器可读介质(诸如微电子存储器),该指令对一个或多个数据处理组件(这里一般称为“处理器”)进行编程以执行功率优化操作,如本文所述。在其他实施例中,这些操作中的一些可以由包含硬连线逻辑的特定硬件组件来执行。这些操作可以替代地由编程的数据处理组件和固定的硬连线电路组件的任何组合来执行。
在上述说明中,已经参考本公开的具体示例性实施例描述了本公开的实施例。清楚的是,在不脱离所附权利要求中阐述的本公开的更广泛的精神和范围的情况下,可以对其进行各种修改。因此,说明书和附图被认为是说明性的而不是限制性的。
虽然附图中已经描述和示出了某些实施例,但是应当理解,这些实施例仅是说明性的而不是对广泛公开的限制,并且本公开不限于所示和所描述的具体构造和布置,因为本领域的普通技术人员可以想到各种其他修改。因此,描述被认为是说明性的而不是限制性的。
在一些实施例中,本公开可以包括以下语言,例如“[元素A]和[元素B]中的至少一个”。这种语言可以指这些元素中的一个或多个。例如,“A和B中的至少一个”可以指“A”、“B”或“A和B”。特别地,“A和B中的至少一个”可以指“A中的至少一个和B中的至少一个”,或“A或B中的至少一个”。在一些实施例中,本公开可包括以下语言,例如“[元素A]、[元素B]和/或[元素C]”。这种语言可以指任何一个元素或其任何组合。例如,“A、B和/或C”可以指“A”、“B”、“C”、“A和B”、“A和C”、“B和C”或“A、B和C。”。

Claims (16)

1.一种用于电子机架的热管理系统,所述热管理系统包括:
安装到所述电子机架的信息技术(IT)组件上的热电冷却(TEC)元件,其中所述TEC元件和所述IT组件电耦接到电源,其中所述TEC元件从所述电源汲取第一输入功率以冷却所述IT组件;
负载传感器,其被布置为感测由所述IT组件从所述电源汲取的用以执行第一组操作的第二输入功率;
温度传感器,其被布置为感测所述IT组件的温度;以及
控制器,其被配置为基于所述负载传感器确定所述IT组件汲取的所述第二输入功率是否已经改变,其中所述IT组件在汲取改变的第二输入功率的同时执行第二组操作,以及
响应于所述改变的第二输入功率,基于所述温度和所述改变的第二输入功率调整分别由所述TEC元件和所述IT组件汲取的所述第一输入功率和所述改变的第二输入功率,
其中,所述IT组件在汲取小于所述改变的第二输入功率的经调整的第二输入功率的同时继续执行所述第二组操作。
2.根据权利要求1所述的热管理系统,其中,所述电源是包括PV板的光伏(PV)系统,所述PV板被布置成将太阳辐射转换成用于所述IT组件和所述TEC元件的输出功率。
3.根据权利要求1或2所述的热管理系统,其中所述TEC元件和所述IT组件并联电耦接到所述电源,其中所述冷却系统进一步包括耦接在所述电源和所述TEC元件之间的功率调整设备,其中,所述控制器通过向所述功率调整设备发送控制信号来调整所述第一输入功率和所述第二输入功率以将汲取的第一经调整的输入功率提供给所述TEC元件。
4.根据权利要求3所述的热管理系统,
其中,所述第二输入功率的调整响应于所述功率调整设备向所述TEC元件提供所述第一经调整的输入功率并且与所述第一输入功率的调整成反比。
5.根据权利要求3所述的热管理系统,其中,所述功率调整设备是可调电阻设备或功率开关设备。
6.根据权利要求1或2所述的热管理系统,其中,所述控制器被配置为通过使用所述改变的第二输入功率在将输入功率值与温度阈值相关联的数据结构中执行表查找来确定在执行所述第二组操作时所述IT组件运行所处的温度阈值,其中所述控制器基于与所述改变的第二输入功率相关联的温度阈值与由所述温度传感器感测的温度之间的差来调整所述第一输入功率和所述改变的第二输入功率。
7.一种用于冷却信息技术(IT)组件的方法,所述方法包括:
确定由正在执行一组操作的有源IT组件从电源汲取的第一输入功率,其中耦接到所述IT组件的是从所述电源汲取第二输入功率以冷却所述有源IT组件的热电冷却(TEC)元件;
从温度传感器接收所述IT组件的温度读数;
基于所述温度读数和所述第一输入功率确定是否调整所述第一输入功率和所述第二输入功率;以及
响应于确定调整所述第一输入功率和所述第二输入功率,调整分别由所述IT组件和所述TEC元件汲取的所述第一输入功率和所述第二输入功率,使得所述IT组件在汲取小于所述第一输入功率的经调整的第一输入功率的同时继续执行所述一组操作。
8.根据权利要求7所述的方法,其中,所述电源是包括PV板的光伏(PV)系统,所述PV板被布置为将太阳辐射转换成用于所述IT组件和所述TEC元件的输出功率。
9.根据权利要求7或8所述的方法,其中所述TEC元件和所述IT组件并联电耦接到所述电源,其中耦接在所述TEC元件和所述电源之间的是功率调整设备,其中调整所述第一输入功率和所述第二输入功率包括向所述功率调整设备发送控制信号以向所述TEC元件提供经调整的第二输入功率。
10.根据权利要求9所述的方法,其中所述第一输入功率的调整响应于所述功率调整设备向所述TEC元件提供所述经调整的第二输入功率并且与所述第二输入功率的调整成反比。
11.根据权利要求9所述的方法,其中,所述功率调整设备是可调电阻设备或功率开关设备。
12.根据权利要求7或8所述的方法,其中确定是否调整所述第一输入功率和所述第二输入功率包括:
通过使用所述第一输入功率在将输入功率值与温度阈值相关联的数据结构中执行表查找,确定在执行所述一组操作时所述IT组件运行所处的温度阈值;以及
确定所述温度读数是否超过所确定的与所述第一输入功率相关联的温度阈值。
13.根据权利要求7或8所述的方法,其中确定由所述有源IT组件从所述电源汲取的所述第一输入功率包括确定所述IT组件的计算工作量,所述计算工作量包括将由所述IT组件执行的所述一组操作,其中所述第一输入功率根据所述计算工作量确定。
14.一种非暂时性机器可读介质,具有存储在其中的指令,所述指令当由处理器执行时使所述处理器执行如权利要求7至13中任一项所述的方法的操作。
15.一种用于冷却信息技术(IT)组件的装置,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求7-13中任一项所述的方法的操作。
16.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时使得所述处理器执行如权利要求7-13中任一项所述的方法的操作。
CN202210249433.5A 2021-03-26 2022-03-14 用于冷却电子机架的功率优化的热管理系统和方法 Pending CN115135096A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/214,689 US11930625B2 (en) 2021-03-26 2021-03-26 Thermal management system and method for power optimization for cooling an electronic rack
US17/214,689 2021-03-26

Publications (1)

Publication Number Publication Date
CN115135096A true CN115135096A (zh) 2022-09-30

Family

ID=80933668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210249433.5A Pending CN115135096A (zh) 2021-03-26 2022-03-14 用于冷却电子机架的功率优化的热管理系统和方法

Country Status (4)

Country Link
US (1) US11930625B2 (zh)
EP (1) EP4025027A3 (zh)
JP (1) JP2022084840A (zh)
CN (1) CN115135096A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240028100A1 (en) * 2022-07-20 2024-01-25 University Of Malta Method and system for power optimization for system of thermoelectric cooling devices

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3246199B2 (ja) * 1994-07-18 2002-01-15 富士通株式会社 マルチチップモジュール
JP2001156228A (ja) 1999-11-24 2001-06-08 Mitsubishi Electric Corp 冷却装置付半導体装置および冷却装置付半導体装置の製造方法
US6809538B1 (en) 2001-10-31 2004-10-26 Intel Corporation Active cooling to reduce leakage power
WO2014082028A1 (en) * 2012-11-26 2014-05-30 Abb Technology Ag System and method for energy harvesting in a data center
US9297559B2 (en) 2013-09-25 2016-03-29 Intel Corporation Adaptive thermoelectric cooling in a processor
US10101756B2 (en) 2014-07-29 2018-10-16 Qualcomm Incorporated Systems and methods for reducing leakage power of a system on chip with integrated thermoelectric cooling
WO2016132533A1 (ja) * 2015-02-20 2016-08-25 富士通株式会社 熱電変換モジュール、センサモジュール及び情報処理システム
EP3527052B1 (en) 2016-12-30 2020-05-13 Google LLC Powering electronic devices in a data center
CN108319940A (zh) 2018-04-12 2018-07-24 Oppo广东移动通信有限公司 人脸识别处理方法、装置、设备及存储介质
WO2021129692A1 (en) 2019-12-27 2021-07-01 Intel Corporation Cooling systems, cooling structures and electronic devices and methods for manufacturing or operating cooling systems, cooling structures and electronic devices
US11848641B2 (en) 2021-01-13 2023-12-19 Baidu Usa Llc Temperature based self-regulated cooling enhancement

Also Published As

Publication number Publication date
EP4025027A2 (en) 2022-07-06
JP2022084840A (ja) 2022-06-07
EP4025027A3 (en) 2022-09-21
US11930625B2 (en) 2024-03-12
US20220312646A1 (en) 2022-09-29

Similar Documents

Publication Publication Date Title
CN109656336B (zh) 数据中心的电子器件机架的混合液体-空气冷却系统的优化控制器
US9968008B2 (en) Method of improving efficiency of fan in information technology hardware
US11349334B2 (en) Charge balancing control for parallel-connected battery energy storage system
US10727553B1 (en) Thermal management system design for battery pack
US20200403283A1 (en) Self-activating thermal management system for battery pack
US9059372B2 (en) System for recycling energy
CN115135096A (zh) 用于冷却电子机架的功率优化的热管理系统和方法
US11735948B2 (en) Bi-directional multi-function converter for backup battery unit
US11552345B2 (en) Power architecture design for thermal management of battery backup energy storage
US11271262B2 (en) Shelf design for battery modules
US11435766B2 (en) Fine-grain dynamic solid-state cooling system
JP7397111B2 (ja) 液冷装置、データセンターおよび電子機器を調整する方法
US11627687B2 (en) Multiple phase multiple system architecture
US11457547B1 (en) Phase change thermal management system for electronic racks
US11825628B2 (en) Hybrid cooling system for electronic racks
US11996708B2 (en) Data center multi-stage backup system
US20210126179A1 (en) Energy regeneration in fuel cell-powered datacenter with thermoelectric generators
US11614783B2 (en) Method and system for providing power from a utility power source or a photovoltaic (PV) system to information technology
US20230066855A1 (en) Energy-generating fluid distribution module for servers
US20230112559A1 (en) Self-regulated and self-powered fluid module for liquid cooling
US20220418167A1 (en) Rack architecture for multiple mixed thermal systems
US20230106883A1 (en) Energy-efficient fluid distributor for server racks
BG113601A (bg) Aвтоматизирана компютърна термоелектрическа охлаждаща система с оптимизирана електрорекуперация на отпадна топлина

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination