具体实施方式
在以下描述中,阐述了某些细节,比如具体数量、尺寸、布置、配置、部件等,以便提供对本文公开的当前实施例的透彻理解。然而,对于本领域的普通技术人员显而易见的是,可以在没有这些具体细节的情况下实践本公开。在许多情况下,已经省略了关于这种考虑等的细节,因为这种细节对于获得对本公开的完整理解不是必要的,并且在相关领域的普通技术人员的技能范围内。
下面公开的一些实施例的设备、部件、系统和子系统是根据商品名称来描述的。对于本领域的普通技术人员显而易见的是,本公开可以用许多类似的部件来实践,无论这些部件是否以特定的商品名称开发和/或销售,并且与特定商品名称部件相关联的特征和/或限制对于实践所公开的发明不是必需的。
介电流体
浸没冷却的一个方面是使用导热但基本上非导电或基本上介电流体。这种流体的示例包括3M™的Novec™系列工程流体(包括Novec 7100)中的一些,尽管所述发明不限于任何特定的介电流体。一些浸没流体通常具有一定沸点,期望的是使冷却的计算机部件在该沸点运行。所有计算机部件以及所公开系统的其他方面优选由在与介电流体接触时不可溶并且另外地不会在压力受控容器内破裂的材料制成。在一些实施例中,介电流体在标准大气压下的沸点可以小于约100℃,或小于约80℃,或小于约60℃,或小于约50℃,或甚至更低。在一些实施例中,介电流体在标准大气压下的沸点大于约60℃,或大于约40℃,或大于约30℃,或大于约20℃。浸没冷却流体的某些实施例通常具有低的蒸汽压力。浸没冷却流体的一些实施例是碳氟化合物和/或氟化酮。介电流体的某些实施例可以具有(CF3)2CFCF2OCH3、C4F9OCH3或CF3CF2CF2CF2OCH3或与之类似的化学式。某些介电流体包括氢氟醚、甲氧基-九氟丁烷。
浸没冷却流体的其他期望特性包括低毒性、不易燃和/或低表面张力。在一些实施例中,在处于用于液体浸没冷却的压力和温度下,浸没冷却流体基本上不会损害计算机部件和/或与计算机部件相关联的连接件、电线、线缆、密封件和/或粘合剂。一些介电流体具有范围从约1.8至约8的介电常数,以及约15兆伏/米(MV/m)的介电强度。在一些实施例中,介电流体具有至少约5 MV/m、或至少约8 MV/m、或至少约10 MV/m、或至少约12 MV/m的介电强度。在一些实施例中,介电流体具有至多约3 MV/m,或至多约5 MV/m,或至多约8 MV/m的介电强度。在公开的实施例中,与计算机部件170接触的任何液体都具有足够高的介电强度,以避免在特定应用的间隔和条件下损坏计算机部件。
一些介电流体具有至少约10 W/cm2、或至少约15 W/cm2、或至少约18 W/cm2、或至少约20 W/cm2的临界热通量。一些介电流体具有至多约15 W/cm2、或至多约10 W/cm2、或至多约8 W/cm2、或至多约5 W/cm2的临界热通量。
图1示出了根据示例实施例的冷却的计算系统110的示意图。所公开的冷却的计算系统110(或计算系统、系统、容器或压力受控容器,所有这些都可以互换使用)的实施例可以利用液体介电流体140通过将部件浸没到流体的浴槽中来冷却计算机部件170。当电力穿过部件170时,部件170产生热。随着部件170变热,部件的性能可能降低,或者部件可能损坏到故障点。将各种计算部件维持在稳定且相对低的温度是有利的。在一些实施例中,计算机部件170可以被保持在小于约80°C,或小于约70°C,或小于约65°C,或小于约60°C,或小于约55°C。在一些实施例中,计算机部件170可以被维持在大于约60°C,或大于约50°C,或大于约40°C,或大于约35°C,或大于约30°C。当计算机部件170变热时,热量转移至包围部件170的液体介电流体140。当液体介电流体达到其沸点时,它将从液相转变为气相,并从液体浴槽142上升离开。介电流体的液体浴槽142中的部件170通常可以维持在所使用的特定液体介电流体140的沸点左右。
当液体介电流体在用于给定应用的压力下被加热到汽化点并变成气体时,介电蒸汽的气泡将从液体浴槽142中上升离开并上升到系统110的顶部。蒸汽然后使用冷凝器被冷却至冷凝点。根据系统110的配置,介电流体从液相到蒸汽相以及从蒸汽相到液相的加热和冷却可以产生图2所示的对流。
在一些实施例中,当系统运行时,计算机部件170将完全沉浸在液体介电流体140中。换句话说,计算机部件170的上部部分低于液体介电流体140的水平面。应当理解,由于来自计算机部件的热量导致介电流体从液相变为气相,介电流体蒸汽的小气泡将与计算机部件接触。这种部件仍将被认为完全沉浸在介电流体的液相中。在一些实施例中,计算机部件170可以沉浸在介电流体140的液相中。在一个示例实施例中,如果计算机部件的任何部分(包括但不限于主板、芯片、服务器、卡、叶片、GPU或CPU的任何部分和/或任何外围部件)与液体介电流体140的液相直接接触,则计算机部件将被认为是沉浸的。在某些实施例中,计算机部件170可以至少部分地沉浸在液体介电流体140的液相中。如果计算机部件170没有沉浸,而是被电介质蒸汽充分冷却,则计算机部件将被认为至少部分沉浸。
在一些现有的浸没冷却系统中,随着流体不断地汽化,介电流体必须恒定地添加到介电流体的浴槽中。不向液体浴槽142中添加介电流体可能导致液体浴槽142中的介电流体的水平面下降,直到部件暴露在气体氛围中并且没有被充分冷却。这可能导致部件170的性能下降或损坏。
在一些实施例中,可以有多种运行模式,所述运行模式可以说明用于与处于其液体状态的介电流体相关的流体管理系统。这些模式可以包括:(1)初始填充,这是将介电流体从储存系统转移到容器中的过程;(2)连续水平调节,这是向容器添加额外流体或从容器移除过量流体的过程;(3)去填充,这是将流体从容器中排出并放置到储存系统中的过程;以及(4)操作过滤,这是使流体通过过滤系统连续循环以确保移除任何颗粒的过程。
在一些实施例中,首先三个液体管理目标,即初始填充、连续水平调节和去填充,可以通过同一整套的管路、泵和阀来实现。用于储存液体冷却剂的专用罐可以用于储存新的和过量的流体,所述流体在蒸汽管理过程中被移除并重新冷凝。一套管道和泵可以用于在填充和水平调节期间将冷却剂(或介电流体)从储存系统带到容器,并在去填充操作期间从容器中返回并进入储存系统。
在一些实施例中,第四个液体管理目标,即操作过滤,可以通过一系列撇渣器和/或过滤器来实现。第一级可以是位于容器的底部的大颗粒过滤器。该过滤器的目的是防止过大而无法被后一级处理的颗粒进入系统的其余部分。第二级可以是位于第一级和第三级之间的管路系统中共线的中等微粒过滤器。该第二级中等微粒过滤器可以使用小筒式过滤器来移除太小而不能被第一级过滤器移除但仍然太大而不能被第三级过滤器处理的微粒。第三级过滤器可以由一个或更多个并联过滤器组成,并支持各种类型的过滤器配置。在一些实施例中,特定类型的过滤器将通过在流体暴露后对其进行分析并利用位于容器环境中的一套硬件部件进行操作来决定。不同的硬件和/或部件可能会产生不同类型的微粒和化学物质,这些微粒和化学物质可能需要被过滤以确保介电流体的长期寿命和效率。
压力管理
一般来说,浸没冷却流体必须保持无灰尘、水和/或其他污染物。由于计算机部件170与浸没冷却流体直接接触,微小的污染物可能会导致计算机部件的短路或损坏。此外,可能污染介电流体的水或水蒸汽可能会降低流体被污染时的流体的介电特性,包括但不限于流体的介电强度。如果介电流体的介电强度降低,计算机部件在运行时可能会短路或以其他方式损坏。减少污染的一种方式是在保持略高于或高于大气压的封闭件中运行浸没冷却系统。
当计算机部件170运行时,由计算机部件的初始使用产生的热量导致一些液体介电流体140蒸发成气体。如果浸没冷却系统被限制在基本封闭的壳体内,这种蒸发通常会增加壳体内的大气的压力。减压阀、膨胀封闭件和/或其他技术可以用于限制增加的压力和/或将壳体内的压力维持在或仅略高于大气压。在封闭件中维持轻微的正压可以有助于减少灰尘、水蒸汽或其他污染物渗透到浸没冷却计算系统中。
当前实施例利用封闭的压力受控容器110(或冷却的计算系统110)封闭件来在压力受控容器内容纳计算部件170和浸没冷却设备,以及相关联的电源、网络连接、布线连接等。与现有模型相比,压力受控容器110可以至少维持在轻微真空,从而将液体介电流体140的沸点降低到低于其在标准大气压下的沸点的温度。
通过在真空下操作计算和浸没冷却系统,部件170可以维持在液体介电流体140的降低的低压沸点处。这具有增加冷却的好处,这允许更多的电力穿过各种部件170,从而导致部件的更高性能。通过控制压力受控容器110中的压力,也可以控制介电流体140的沸点,从而允许相同的流体在更宽范围的条件下使用。许多实施例受益于较冷的温度,然而某些计算机部件170具有理想的范围,并且在低于该范围的温度下性能降低。通过控制压力受控容器110中的压力,也可以控制浸没冷却流体的沸点。在某些实施例中,所公开的压力管理系统可以用于在计算系统启动、关闭或响应其他变化的条件时动态地控制压力,并从而控制液体介电流体140的沸点。
除了通过在低于环境压力的压力受控容器110中操作来降低液体介电流体140的沸点之外,可以修改计算机部件170本身,以便更有效地将热量从其自身转移走至液体介电流体140中。通过增加暴露于液体介电流体140的部件170(例如芯片)的表面积,可以增加部件170和液体介电流体140的液体浴槽142之间的热传递。用于增加表面积的示例性装置可以是铜锅炉或铜盘,其可以粘附到其他计算机部件170的芯片上。在某些实施例中,所使用的粘合剂将基于其传热能力及其在介电冷却流体中的溶解度来选择。优选的粘合剂在选定的介电流体中表现出高导热性和低溶解度。
图1示出了所公开的计算系统的示例实施例的示意图。所公开的系统的实施例包括压力受控容器110(或冷却的计算系统110)、压力控制器150、包括至少一定体积的液体介电流体140和冷凝结构130的浸没冷却系统以及期望的计算机部件170。压力系统可以被配置成维持期望程度的减小的压力。压力受控容器110可以被配置为保持负压,同时仍然允许多个穿透件进入压力受控容器110以用于各种连接,包括但不限于电力、数据、网络、冷却水和/或通信系统。一些实施例利用密封级和/或船用级连接。在低于环境压力的压力受控容器110内操作计算机系统需要对系统整体进行一系列修改。这些修改将在下面讨论,并且其中一些对本领域普通技术人员来说是显而易见的
图3示出了压力受控容器110的示例实施例的外部。在一些实施例中,所公开的压力受控容器110至少约2英尺高,或至少约3英尺高,或至少约4英尺高,或至少约5英尺高。在一些实施例中,压力受控容器至多约3英尺高,或至多约4英尺高,或至多约5英尺高。
在某些实施例中,压力受控容器具有至少约100立方英尺,或至少约150立方英尺,或至少约200立方英尺,或至少约250立方英尺,或至少约300立方英尺,或至少约350立方英尺,或至少约400立方英尺的内部体积。
在一些实施例中,压力受控容器将被配置为在运行时容纳大约12竖直英寸的液体介电流体和大约36竖直英寸的介电流体蒸汽。在某些实施例中,液体体积与气体体积的比值有助于产生对流,并将气态电介质蒸汽引导至冷凝结构,该冷凝结构使蒸汽转变回液体。在一些实施例中,压力受控容器被配置成在操作期间容纳大约1∶6的一定体积的液体介电流体与一定体积的气态介电流体的比值。在其他实施例中,压力受控容器被配置成在操作期间容纳大约1∶3、或大约1:5、或大约1:8、或大约1:10、或大约1:15的一定体积的液体介电流体与一定体积的气体介电流体的比值。
在一个示例实施例中,压力管理系统可以包括压力控制器150。压力控制器150可以是真空源,例如,压力控制器150可以是可以连接到压力受控容器110的真空泵。在一些实施例中,真空泵150可以是远程的,并且真空可以使用管路和/或管道被传递到压力受控容器110。在优选实施例中,压力传感器180被容纳在压力受控容器110内,并且用于调节和/或维持压力受控容器110内的期望负压。在一些实施例中,压力传感器180和/或压力调节器190可以连接到处理器,该处理器使用压力传感器180监测压力受控容器110中的压力,并使用压力调节器190调节压力。
一些实施例包括操作员保护机构。在一个示例实施例中,操作员保护机构可以是锁定机构,如果压力受控容器的任何盖子或服务面板没有就位,该锁定机构阻止系统运行。在一个示例实施例中,操作员保护机构可以包括控制器,以在压力受控容器的门或面板之一被未授权而破坏的情况下立即使系统断电。除了提供生命安全功能外,操作员保护机构还可以为容器内的存放敏感数据的部署件提供增强的操作安全功能。通过确保在正常运行期间在不关断系统电力的情况下就不能接近设备,可以在磁盘保护机构的效率上实现高水平的保证。此外,在一些实施例中,磁盘保护机构可以使用运行时储存的加密密钥来保护压力受控容器上的静态数据。
在某些实施例中,除了拒绝不安全地接近压力受控容器之外,还可以放置传感器以确保系统按照设计运行。主传感器包装可以包括蒸汽空间中的温度传感器;液体空间中的温度传感器;蒸汽空间中的湿度传感器;和/或蒸汽空间中的压力传感器。这些传感器读数可以由软件和/或人类操作员监测,以确保系统以安全和正确的方式运行。在一些实施例中,传感器数据将被记录或稍后分析。
在一些实施例中,额外的传感器可以结合在容器或超级结构(定义如下)内。这种传感器可以包括,例如,基于FLIR的热成像相机;VESDA或其他形式的吸气式烟雾检测器;和/或制冷剂泄漏检测器,其被设计成检测介电流体泄漏到周围环境中。
在一些实施例中,容器和/或超级结构可以配备有与系统的运行状态相关的指示灯。
尽管冷却的计算系统110有时被称为压力受控系统110,但是本领域的普通技术人员认识到,冷却的计算系统110的许多益处(如果不是全部的话)可以在不使用“压力受控系统”的情况下实现。
蒸汽管理系统
液体浸没冷却系统可以以不同的方式运行。一些可以通过直接连续冷却浸没流体来运行。其他的可以通过允许液体达到其最高液相温度,然后沸腾成蒸汽相来运行。通过允许液体蒸发来运行的浸没冷却系统被称为两相浸没冷却系统。两相浸没冷却系统通常允许介电流体沸腾和/或蒸发,并且定期添加额外的流体以替换流失到大气中的流体。
所公开的实施例利用容纳在压力受控容器110内的液体浸没冷却系统。这具有即使在液体介电流体140已经转换成气态形式之后也不会损失该介电流体的优点。在封闭或基本封闭的压力受控容器110中,气态介电流体可以被冷凝并且被加回到液体介电流体140的液体浴槽142中,该液体介电流体被主动用于冷却计算部件170。冷凝步骤可以以任何方便的方式进行,例如,通过使工艺用水流过导热管。冷凝结构130可以包括散热器翅片和/或类似设备,其增加冷凝器的表面积,从而允许气态介电流体更大和/或更快的冷凝,并且使其返回到液体形式。在一些实施例中,工艺用水处于环境温度,并且没有被主动冷却。在其他实施例中,可以使用蒸发冷却、干式冷却塔和/或本领域已知的其他冷冻工艺用水的方法来冷冻工艺用水。
在一些实施例中,压力受控容器和外部系统之间可以有两个接口。第一个可以是工艺用水供应接口。这可能是一个管道,其将工艺用水从提供冷冻工艺用水的设施递送到压力受控容器上的分配歧管。第二个可以是工艺用水返回接口。这可以是一个管道,其将工艺用水返回到提供冷冻水的设施。在工艺用水已经流过压力受控容器和相关联的冷却部件之后,工艺用水可以返回到设施。冷却部件可以包括例如容器内的冷凝器、冷凝盘管和/或散热器,以及从任何动力部件(包括例如马达、泵和/或实用机柜)的排气管排出热量的盘管。在一些实施例中,在超级结构和外部系统之间可以有两个接口。接口可以类似于或基本类似于压力受控容器和外部系统之间的两个接口。
在一些实施例中,可以配置压力受控容器110内的冷凝结构130的位置,以便优化蒸汽相介电流体的流动并且增加冷凝的速率和/或效率。在一些实施例中,可以控制压力受控容器110本身的几何形状,以便增加冷凝的速率和/或效率。
如图1-3所示,在一个示例性实施例中,压力受控容器长约10英尺,宽约4英尺,高约4英尺。使用约130加仑的Novec™介电流体140可以在压力受控容器110内创建液体浴槽142。这在压力受控容器的底部处的浸没冷却罐中留下了深约12英寸的液体介电流体层,而压力受控容器的大部分体积是气态的。压力受控容器的顶板在纵向延伸的结构的中间较低。顶板和/或盖子120向上成角度,并且随着接近压力受控容器110的侧壁而升高。冷凝结构130在压力受控容器110的两侧上纵向延伸。该示例性实施例中的冷凝结构130可以是宽约12英寸和高约24英寸,并且基本上延伸压力受控容器110的整个长度。冷凝结构130包括带有高表面积翅片的散热器状材料,这些翅片使用流动的工艺用水冷却。一些实施例可以附加地或替代地包括热交换器。
如图2所示,压力受控容器110内的结构布置在介电流体蒸汽沸腾后从液体浴槽142上升时引导介电流体蒸汽的对流。该结构布置将对流向上引导至压力受控容器的顶板,在那里,该流动被引向冷凝结构130的高表面积,并且冷凝回液体形式。然后液体介电流体140流回到液体浴槽142中。以这种方式,液体介电流体140的总量可以保存在该封闭壳体内。使用对流来循环介电流体蒸汽会允许所公开的实施例在没有用于循环介电液体的机械泵的情况下运行,从而减少所公开的系统的总能量使用。
某些实施例可以利用额外的介电流体的罐和/或储存容器,这些罐和/或储存容器可以在系统的启动和/或关闭期间使用,以防压力受控容器必须打开,和/或允许对液体介电流体的液位进行冗余和鲁棒控制。
图11示出了用于压力受控容器110的示例冷却和蒸汽管理系统600。在该示例实施例中,冷却和蒸汽管理系统600可以包括冷冻的工艺用水储存器611,其延伸穿过冷凝器盘管132以引起液体介电流体140的冷凝。在穿过冷凝器盘管132之后,工艺用水可以前进到工艺用水返回储存器612。冷却和蒸汽管理系统600还可以包括用于蒸汽储存的罐614和用于介电流体储存的罐615。当需要时,例如,在系统启动和/或关闭期间,罐614和615可以提供介电流体或蒸汽。在一个示例实施例中,罐614和615可以经由冷凝结构616联接。在罐614中存在过量蒸汽供应的情况下,冷凝结构616可以移除蒸汽并且将其作为介电流体添加到流体储存罐615中。
在一些实施例中,在运行期间,压力受控容器维持在比环境大气压力低约3 psi,这有助于降低介电流体的沸点,从而降低计算机芯片和其他部件的运行温度。在一些实施例中,压力受控容器110维持在低于环境压力至少约2 psi,或低于环境压力至少约4 psi,或低于环境压力至少约6 psi,或低于环境压力至少约8 psi,或低于环境压力至少约10psi。
在一些实施例中,将有必要选择对压力波动具有一定程度公差的部件。优选的是,通过调节系统的运行压力,使用能够承受大范围压力的部件,以允许对冷却剂沸点的操纵,以及同样整体系统的总体运行温度。鉴于两相系统的运行性质,一些实施例的标准运行条件将看到±4 PSIg之间的差异。在某些情况下,例如在系统快速启动或关闭期间,可能会经历三个额外PSIg的差别。在一些实施例中,可以进行系统级调整,以更好地控制这些变量,并且将它们保持在更受控和限定的范围内。
在某些实施例中,计算机部件170以比环境压力低至少约3%,或比环境压力低至少约5%,或比环境压力低至少约10%,或比环境压力低至少约15%,或比环境压力低至少约20%,或比环境压力低至少约25%,或比环境压力低至少约30%来运行。
在一些实施例中,在运行期间,压力受控容器维持在小于约750托、或小于约710托、或小于约650托、或小于约550托、或小于约500托、或小于约450托、或小于约400托,或更低。在一些实施例中,在运行期间,压力受控容器维持在大于约650托、或大于约600托、或大于约550托、或大于约500托、或大于约450托、或大于约400托、或大于约300托。
一些实施例利用蒸汽洗涤过程和/或初始净化过程以便控制压力受控容器内的气态大气。该过程从压力受控容器中移除部分气态大气,并且移除不需要的大气的一部分,例如空气和水蒸汽。这些以及其他不需要的大气的一部分可以基于蒸汽冷凝成液体的温度来分离。由于介电流体专有的性质和沸点,许多自然产生的污染物可以使用这种方法移除。移除不容易冷凝的流体有助于保持介电流体的纯度。如果流体的凝点比标准大气压力下的介电流体的凝点低约大于20℃,或者如果流体的凝点在标准大气压力下低于10℃,则流体将被认为不容易冷凝。
在维护、启动和/或关闭的操作期间,可以将一层惰性气体(例如氮气)引入压力受控容器中,以便减少当压力受控容器打开和/或暴露于大气条件时介电流体的损失量。如图11所示,冷却和蒸汽管理系统600可以包括惰性气体罐613,其可以供应惰性气体以减少介电流体损失。
一些公开的实施例可以包括基本上自持式服务器和/或计算系统。在一些实施例中,可以利用专用的密封和/或连接以减少进入压力受控容器110的穿透件的总数。一些实施例将电力、水、真空和网络连接组合成一束线路,以便最少化进入压力受控容器的穿透件,以便在系统处于真空时减少泄漏的可能性。
图4描绘了容纳多个压力受控容器的超级结构的示例性实施例。在该示例实施例中,两个压力受控容器110被预铺管、预布线并且容纳在模块化超级结构210内。这允许实施例作为基本上完整的、自持的系统被预制和递送。模块化系统可以被配置为连接到所公开的计算系统的其他模块化实施例。在一些实施例中,模块化超级结构210将仅需要单个电力连接,并且将与适当的电子器件预布线,以向计算机部件和/或其他电子部件提供所需的电压。
图5描绘了示例性数据中心实施例,示出了连接到中央电源的多个压力受控容器。图6描绘了示例性数据中心实施例,示出了彼此串联连接的多个压力受控容器。在这些示例实施例中,压力受控容器110可以或可以不被放置在超级结构内。
图7A-D描绘了带有内部机械臂、气闸和外部机械臂的冷却的计算系统的示例性实施例。在该示例实施例中,容纳在压力受控容器110内的内部机械臂230可用于移除部件170并且将移除的部件递送到气闸220。使用气闸220,可以移除部件170,而基本上不会干扰或破坏压力受控容器110内的压力、大气、介电流体和/或其他条件。一旦部件170从压力受控容器110移除,使用气闸220可以将替换部件引入压力受控容器110中。然后替换部件可以由内部机械臂230安装。使用可以以“插槽(slot-in)”方式安装的部件(例如刀片服务器和机箱)可以显著地简化这一过程。
压力受控容器内的条件的破坏可以由放置在压力受控容器内的传感器(例如,压力传感器)来检测。在操作条件的标准范围之外的条件下,破坏可以通过至少10%的偏差来指示。在操作条件的标准范围之外的条件下,压力受控容器内对条件的显著破坏可以通过至少30%的偏差来指示。
在某些实施例中,可以运行自持式诊断程序,该诊断程序分析压力受控容器110内的部件的性能。如果部件170未按期望执行,内部机械臂230可以用于自动移除和/或替换该部件。以这种方式,可以创建自愈、自持式服务器和/或计算系统。在某些实施例中,这种自愈式系统可以被预制和预布线以创建模块化单元,该模块化单元使用传统方法可以被运送或递送到远程位置,以提供需要有限设置和/或维护的显著高效的计算能力。
在一些实施例中,通过使用冷凝盘管,在容器的封闭系统内完全实现冷却蒸汽并使其从气态冷凝回液态的第一蒸汽管理目标。工艺用水将通过容器内的冷凝盘管进行管道输送。容器本身的形状和几何结构将促使蒸汽从浴槽区流向盘管区,并且重力将用于把重新冷凝的液体拉回到浴槽区。
在一些实施例中,通过使用容器内的集成压力传感器和使用净化系统来实现监测和保持容器的内部压力的第二蒸汽管理目标。在一些实施例中,净化系统将用于从容器中移除过量的蒸汽,并且将其冷凝回液体,以储存在液体储存罐中。
在一些实施例中,经由与第二目标相同的机制,来实现控制和移除在系统启动期间存在的蒸汽的不可冷凝成分的第三蒸汽管理目标。净化系统可用于在其初始启动期间使系统处于压力下,并且从系统中移除任何不可冷凝的气体。
在一些实施例中,使用专用的氮气层覆盖进给系统可以实现控制惰性气体的覆盖层的第四蒸汽管理目标。这种覆盖层将冷却剂保持在容器的顶部之下,允许在容器打开以维修其中部件的阶段期间使冷却剂的损失最小化。当操作员期望打开系统时,从一组氮气储存罐通过位于容器内的一组专用覆盖管道的专用管路将允许添加惰性覆盖层。这种气体,以及任何其他不可冷凝物,可以在系统启动时可能发生的不可冷凝移除过程期间被移除。基于用户命令和系统状态监测,通过控制系统软件,可以管理和监测整个蒸汽管理过程。
压载块体
在所公开的系统的一些实施例中,例如图1所示,压力受控容器110可以包括用于容纳大部分液体介电流体140的更深的浴槽部分和邻近浴槽的更宽的搁架区域112。板、卡、芯片、刀片和/或任何其他计算机部件170基本上容纳在压力受控容器110的更深的浴槽部分内。较宽的搁架区域112也可以容纳液体介电流体140和/或收集从蒸汽相重新冷凝成液相的介电流体。在某些实施例中,压力受控容器110中的介电液体的深度可以利用压载块体160来增加。压载块体160可以用于占据搁架上不期望的体积,从而置换搁架区域112上的任何液体介电流体140,并且升高液体的液位,而不需要添加额外的液体介电流体140。在一些实施例中,压载块体160包括抬升件支脚161,其允许流体在压载块体160下方流动,使得冷凝的液体可以继续流入压力受控容器的更深的浴槽部分,而流动不会被压载块体160阻碍。
压载块体160可以由不干涉所公开的浸没冷却系统的操作的任何材料制成。压载块体可以由包括但不限于金属、橡胶、硅树脂和/或聚合物的材料制成。优选的材料基本上不可溶于介电流体中。块体必须比介电流体密度大,但不要求是固体。在优选实施例中,块体具有把手或切口,这允许块体更容易被处理和操纵。压载块体160的一些实施例利用互锁的顶部和底部部分,使得块体可以以安全的方式堆叠在彼此的顶部上。互锁的顶部和底部减少了如果块体滑动或以其他方式从其预定位置移位时损坏任何附近部件的风险。在一些实施例中,互锁顶部包括凹陷部分,该凹陷部分与底部部分上的支脚和/或抬升件对齐,使得最低的块体不会防止流体流动,并且块体可以安全地堆叠在最低的块体的顶部上,以便占据显著的体积,从而允许升高介电液体的液位,而不需要添加大量的额外介电液体。
在一些实施例中,压载块体160被配置成延伸压力受控容器110和/或搁架区域112的整个长度。在其他实施例中,压载块体160基本上可以是允许处理块体的任何尺寸。在这样的实施例中,多个模块化压载块体可以被配置为根据期望替代尽可能大或尽可能小的体积。在一些实施例中,单个压载块体的外部尺寸为约2英尺长或约3英尺长或约4英尺长或更长,并且约6英寸宽,或约8英寸宽,或约12英寸宽,或更宽,并且约1英寸高,或约3英寸高,或约6英寸高,或约8英寸高或更高。
超级结构
如图4所示,所公开的计算系统由各种部件构成,所有这些部件都可以直接或间接附接到物理超级结构210。超级结构210允许任何所需的电气、传感器、控制、电力、流体控制、压力控制和/或通信系统的预布线和预铺管。这允许在递送给客户之前,更快并且更简单地在现场部署和在工厂测试。
超级结构210通常由金属部件制造,并且可以滑撬式安装或被配置成用叉车、升降机或起重机搬运。在一些实施例中,超级结构210被配置成适配在标准容器内,以便促进运送。超级结构210和相关联的部件可以被配置成总重量小于约58000lbs,并且可以被划分成更小的子部件,以便促进运送而不需要特殊设备。在一些实施例中,超级结构210和相关联的部件的重量小于约50,000lbs,或小于约40,000lbs,或小于约30,000lbs,或小于约20,000lbs。在一些实施例中,超级结构210和相关联的部件的重量大于约5,000lbs,或大于约10,000lbs,或大于约20,000lbs,或大于约30,000lbs。超级结构210的实施例可以是任何尺寸和/或形状。许多实施例足够大,以容纳多个压力受控容器110、服务器机架310和相关联的液体浸没冷却设备以及用于管理电力递送和分配以及网络连接的必要设备。
可以调整超级结构210的整体设计,以适应每个部署的独特方面,包括定制电力和工艺用水互连的类型和数量,以满足现有设施的需求。
所公开的压力受控容器内的所有部件的控制和管理系统可以被包括作为所公开的计算系统的一部分。所公开系统的优选实施例包括维持和操作两相液体浸没冷却环境所有所需的机械系统,包括所需的泵、阀、调节器、蒸汽管理系统、压力管理系统和其他相关联的部件。
超级结构210可以是开放式框架设计,或者可以包括侧面板和进入门。这允许在现有结构内或在现场位置外部署。超级结构210可以被修改以包括耐候性(weatherization)特征,允许在恶劣环境中部署。在一些实施例中,超级结构可以是滑撬式/模块构架。
各种系统、特征和/或能力可以被结合到超级结构210中,以支持、监测和管理压力受控容器的其他部件以及包含在压力受控容器内或与压力受控容器相关联的任何环境。在一些实施例中,这样的系统可以包括火灾探测和/或抑制能力、专用空调和/或环境管理能力、例如进入控制的安全特征和/或监视特征等等。
电力系统
超级结构210的一些实施例被设计成接受各种电输入装置,并且将它们连接到内置在超级结构内的现有电力分配系统。许多示例性实施例中的一个包括到主断路器的415V输入,然后该主断路器被分配到一系列电源搁架,电源搁架将415V AC输入转换成12V DC输出。在优选实施例中,这种转换基本上发生在一个转换步骤中,从而降低了通常与这种转换相关联的效率损失。传统的计算机服务器位置通常将输入的工业电力从高AC电压(例如415V)转换成降低的AC电压(例如120V)。这种转换导致热能损失。在一般情况下,这可能会导致大约6%的能量损失。然后,120V的电力必须进一步转换成DC电流,供各种计算机部件使用。这种第二次转换导致第二次,大约6%的热能损失。通过将大约415V的工业电力直接转换成大约12V的DC,总的热能损失可以被减少。
另一个示例性实施方式可以包括将480V的AC输入连接到电源搁架,该电源搁架将480V的AC输入转换成48V的DC输出,然后将其分配到一系列中间电源,该中间电源将48V的DC输入转换成各种DC输出,包括例如12V、5V、3.5V、3.3V等。
在一些实施方式中,可以有单个电源组,或者可以有在不同的输入和输出电压下运行的多个电源。精确的配置可以被调整以满足被装配的特定设备的需要并且取决于应用条件。电力系统的特定设计可以被调整以满足所公开的计算系统被部署在其中的特定环境的需求。定制可以包括系统的电力的输入和输出的类型、容量和接口。
在一些实施例中,机架电力分配系统可以包括模块化电源系统和/或一组模块化电源系统。模块化电源系统或多个系统的具体配置并不特别关键,只要它可以向机架递送期望的数量和类型的电力。因此,模块化电力系统可以以并联或串联或其组合来配置,以提供一个或两个或甚至多个电力分配路径。通向机架的具体路径可以是直接的或间接的,通常可以取决于所包含的部件、电力数量和类型和/或期望的配置。如果需要,通向机架的路径可以包含将电力分配给位于机架内的机箱。所分配的电力可以以一个或多个期望的电压递送,电压可以根据配置和部件而变化。在一些情况下,期望的电压可以包括例如12V、5V和/或3.5V。在一些实施例中,如果采用机箱,那么它可以采用一个或更多个子系统。这样的子系统可以包括不干涉待递送到机架的期望的电力的数量和类型的任何期望的子系统。仅作为一个示例,可以采用封装通电子系统。根据期望,这种封装可以接受AC电流并且转换成DC电流和/或反之亦然。例如,特别有用的封装通电子系统可以被设计成接受208、240、380、400、415、480和/或600伏AC的输入电力,并且将该电力直接转换成DC电力,例如48V DC。
模块化电源系统或多个系统可以以任何方便的方式直接或间接供电。例如,模块化电源系统可以经由机箱内的主电力分配系统直接供电。根据电力和其他部件的类型和数量,机箱可以使用接口,例如一组弹簧加载的引脚或其他合适的连接器接口,以在电力分配路径和机箱本身之间建立电性连续性。然后,可以在接口连接器和位于机箱上的所期望的服务器或其他计算部件上的任何期望的电源输入接口之间建立连续性。在一些实施例中,可以在每个机箱内利用封装通电模块以直接在机箱本身将电压转换成适当的电平。这可以用于各种类型的电力分配,但是对于例如48V电力分配可能特别有用。图17示出了机架电力分配系统950的示例性实施例。在该示例实施例中,机架310可以在机架310的AC接口311处接收AC输入960。电力分配系统950可以产生DC输出320,并且将DC输出320分配给一个或多个机箱400。
在一些实施例中,确保向机架内的计算机部件供应可靠的电力是首要关注的问题。为此,一些实施例使用刀片级电源或计算机部件级电源,其可以供应特定的输入电压并且向刀片和/或部件级电源提供所需的输出电压。一些实施例将多个电源结合到每个刀片以提供冗余。
在一些实施例中,一个或多个交换机可能需要电力。示例性交换机可以是标准的数据中心级别交换机,其带有适当的接口以连接到背板,并且向每个刀片提供机架级通信。一些实施例仅分配单个电压,并且这可以通过带有连接器的电力轨道和接口系统来完成,以用作电力轨道和每个刀片之间的接口,从而将电压直接递送到电源输入轨道,或者经由中间连接器安置在电源电线和机架级电压分配系统之间。
在一些实施例中,可以具有沿着机架的底部分配主电压的电力轨道。该轨道可由一个或多个主电力整流器供电,该电力整流器可能位于压力受控容器外部,并且经由线缆或母线系统递送至每个机架。在这个水平上使用更高的电压,例如48伏,可以降低分配系统所需的电流承载能力,并且可以有效地连接在(多个)分配轨道与负载接口之间。
在一些实施例中,将有位于超级结构平台内的两个主电力分配系统。第一个是主要设备电力系统(PEPS),第二个是辅助设备电力系统(SEPS)。PEPS的目的是为容器内的部件提供电气服务。该系统可以是高电压高电流分配系统,其经由铜导体或母线系统接受输入,并且将输入输送到负责向机箱、计算机部件和/或其他关键负载设备提供操作电流的主电源。电力将在限定的点处进入超级结构,并且截止于主服务断开断路器。该点的上游将是电气服务和系统中使用的所有电力冗余部件。该输入将处于高电压,例如,举例来说415或480伏AC。主设备负载将由电源或整流器驱动,该电源或整流器由主断开断路器下游的断路器面板供电。
SEPS的目的是为位于超级结构内的所有基础设施支撑系统和部件提供电气服务。由于作为辅助设备基础设施的一部分所需的部件可能期望较低的输入电压,因此通过降压变压器可以为SEPS供电,该降压变压器经由辅助服务断开连接到PEPS主服务断开断路器的上游。
这种布置将允许超级结构支撑和基础设施系统,包括所有由SEPS供电的部件,即使没有将主要电力递送到系统部件的其余部分,也可以开启和运行。管理和控制系统的所有方面,以及蒸汽控制系统,可以能够独立于PEPS的运行而运行。
在一些实施例中,不间断电源(UPS)被包括作为电力分配系统的一部分或添加到电力分配系统中。UPS的结合允许在外部电源暂时中断的情况下所公开的计算系统继续运行。
所公开的电力分配系统的部件可以包括但不限于商业上可获得的部件,例如,举例来说不间断电源、DC电力系统、AC电力系统和/或电力控制和监测系统。一些这样的部件可以包括但不限于Vertiv产品,例如,举例来说Liebert和/或Chloride UPS产品、双转换在线UPS、线路交互式UPS、备用UPS、锂离子电池UPS及其组合。UPS产品可以是单相或三相的。其他示例性电力分配系统部件可以包括,例如,艾默生(Emerson)网络电力产品、NetSureDC电力系统、Vertiv、Liebert、Chloride和/或NetSure电力分配单元和相关部件,例如,举例来说逆变器、整流器、转接开关及其组合。商业上可获得的监测单元、控制器单元和/或与这些部件相关的软件也可以结合到某些公开的实施例中。
压力受控容器和压力管理系统
所公开系统的实施例包括压力受控容器,其被设计成容纳两相液体浸没冷却系统。压力受控容器110包含液体介电流体140的液体浴槽142、带有冷凝器盘管132以将气态相介电流体冷凝成液体的冷凝器、以及保持计算机部件170和将来自电力系统的电力分配到位于压力受控容器110内的设备和部件所需的物理机构和/或设备。
在操作期间,压力受控容器110可以保持在略微的真空状态。应当理解,为了在维持负压的压力受控容器110内操作计算系统,必须进行各种专门的连接和考虑。
所公开系统的一些实施例使用一系列光纤介质传输协议(MTP)接口,除了分接用于将光纤分配到机架310的面板和线缆托架之外,还允许光纤连接到压力受控容器110。这种布置减少了进入到压力受控容器110中的穿透件的总数量,从而降低了容器中泄漏的可能性。
压力受控容器110的一些实施例包括传感器以确保安全操作。这些传感器可以包括但不限于温度传感器、流体液位传感器、压力传感器180、气体分压传感器、位置传感器、电气传感器、麦克风和/或相机,以确保和/或自动化系统的操作。
在一个示例实施例中,温度传感器可以包括但不限于用于测量压力受控容器110内的气态相的温度的传感器、用于测量压力受控容器内的液相的温度的传感器、用于测量水和/或其他工艺流体的温度的传感器、和/或用于测量包括计算机部件170的其他部件的温度的传感器。在一些实施例中,热电偶、热敏电阻和/或硅树脂传感器可以用来测量计算机部件的温度。在一些实施例中,系统可以依赖于由部件本身提供的信息,并且通过使用普遍接受的通信协议(例如装置提供的API或其他编程接口,例如经由HTTPT或SNMP的JSON)来进行检索或监测该信息,以确定设备温度。
一些实施例可以包括各种生命安全特征,以确保用户的安全。这些特征可以包括但不限于自动电磁锁定机构、故障安全系统、火灾和/或烟雾探测和/或抑制系统、通风系统和/或备用照明。在某些实施例中,这些特征可以作为综合平台的一部分被结合。
某些实施例包括基于自动蒸汽检测的泄漏检测系统,以确保压力受控容器中的任何流体损失被快速检测到。这些系统可以包括在压力受控容器110内的压力传感器180,其监测压力以便确保没有大量泄漏;和/或定位在压力受控容器外部上的气体传感器,其检测可能已经从压力受控容器泄漏出的任何介电蒸汽的存在。
所公开系统的实施例的特定设计、布置和/或布局可以基于其部署的条件来调节。在一些实施例中,尺寸、材料、内部系统、部件安装和配置选项、压力受控容器110、计算机部件170和电力系统之间的接口都可以基于系统利用的条件来调节。
机架系统
图8A-C示出了机架系统(或机架310)的示例实施例。机架310可以用作装配在压力受控容器110内的电气和通信系统与装配在机架310内的计算设备170之间的中间件。计算机部件170可以安装在机架310上,以便控制压力受控容器110中的计算机部件170的间距、方向、位置和/或配置。在一个示例实施例中,每个计算机部件170可以在安装在压力受控容器110上之前装配在机箱400中。
机架310可以是可用于安装计算机部件170的任何物理结构,其包括但不限于任何框架、支架、支撑件或其他结构。当计算机部件170直接或间接地附接到机架310并且保持在基本固定的位置时,它们将被认为安装到机架310上。一些实施例可以包括使用专用机械导向板作为安装机构、附接到隔板配件的线束,和/或通过使用中间电源和背板接收器331以在机架内分配电力和信号。
机架系统的特定设计可以基于系统部署的条件进行调整。机架310的一些实施例可以包括专用交换机。在一些实施例中,上行链路接口可以经由光纤基础设施连接,和/或下行链路接入接口可以经由背板接收器331接口或连接计算设备的任何其他合适方式连接到机架内的计算设备170。
在某些实施例中,机架系统可以包括用于一个或多个中间电源的壳体,该壳体可以将来自电力接口的合适电压分配到装配在机架310内的其他设备。用于将来自分配系统的电力互连到中间电源的接口可以被结合到机架310的设计中,以允许通过断开各种机架、电力和通信系统之间的接口来将其移除和/或用替代的机架配置替换。
图8A示出了支架310的俯视图。在该示例实施例中,机架310包括AC接口311和数据接口312。机架310还包括一对电源、电源313和冗余电源314(或备用电源)。机架310还可以包括整流器和控制器。冗余电源314和/或整流器和控制器允许支架310被快速修复,或者甚至如果主电源停止起作用时会继续起作用。机架310可以可选地包括转换器315。机架310被配置成接收多个机箱400并且将机箱400保持在基本固定的位置。
在一些实施例中,整个支架310可以浸没在介电流体中。这可以包括在运行期间将整流器、电力连接和/或数据连接浸没在介电液体中。为了减少和/或消除介电流体的塑料污染,在一些实施例中,可以消除塑料绝缘和/或线缆屏蔽。在这样的实施例中,介电流体可以用来绝缘以其他方式暴露的线缆和/或连接。
图8B示出了包括多个机箱400的机架310的透视图。所公开的机架构造促进机箱400的热交换性。在该示例实施例中,机架310可以包括将AC接口311连接到电源313和/或冗余电源314的多条AC线缆318。电源313和/或冗余电源314可以产生DC输出320,该输出可以经由DC线缆321输送到背板接收器331。机架310还可以包括将数据接口312连接到背板接收器331的多条数据线缆319。背板接收器331可用于将来自机箱400的底部上的数据连接的数据供应到在机架的顶部处的数据连接。
图8C示出了支架310的侧视图。在一些实施例中,机架310为机箱400及其部件提供机械稳定性和/或壳体。此外,支架310促进将电力和数据线缆从支架310的顶部(在这里它们通常可进入容器内)布线到支架310的底部(在这里它们与机箱400连接)。
机箱和接口系统
在一个示例实施例中,所公开的机箱系统400的目的是用作传统和/或意图内置的计算部件170和所公开的机架系统之间的标准化物理中间部件。在一个示例实施例中,背板接收器331的目的是在机箱400和机架310之间提供插槽式接口,允许在电力系统中的电源和通信系统中的网络交换机之间分配电力和信号,其中各种计算部件170装配在机箱400内。
在一些实施例中,本公开的压力受控容器可以包括至少一个机架310,其可以包括一个或多个服务器,例如,刀片服务器。每个服务器可以附接到机箱400(也称为服务器箱体或箱体)。图9A-G示出了用于安装各种部件170的机箱400的示例实施例。机箱可以促进将服务器安装在压力受控容器的机架上,或者将其从系统中移除。在一些实施例中,压力受控容器的其他电子部件可以安装在机箱中。例如,计算机部件或硬件(例如主板、芯片、卡、GPU或CPU的任何部分)都可以装配在机箱中。作为另一个示例,例如电源、电力接口或网络通信接口的部件可以安装在机箱中。
在一个示例实施例中,机箱可以用作部件(例如,服务器)和压力受控容器之间的公共接口。机箱可以提供各种安装、电力和连接特征,这些特征可以基于部件的性质或设计进行定制。换句话说,机箱的各种方面可以基于部件的设计规格进行修改。因此,机箱可以适应几乎任何型号或类型的硬件。例如,机箱可以促进使用特殊设计的硬件或现成的硬件。
机箱400的实施例可以包括设计成允许现有商业部件的适配、定制设计部件的使用和/或用于特定应用的专门机箱的使用的部件。实施例可以包括用于标准主板和专业部件的适配套件。在特定实施例中,这样的部件包括带有NVidia GPU的千兆字节主板和/或带有英特尔(Intel)CPU的超微型主板。
图9A示出了根据示例实施例的用于将服务器安装在机架上的机箱400。在该示例实施例中,机箱400可以是包括后壁410和两个侧壁420的矩形盒体。后壁410可以包括多个孔411,以促进机箱400内的流体循环。机箱400可以在每个侧壁420上包括导向轨道421。
图9B示出了根据示例实施例的机箱400内部的多个部件。在该示例实施例中,后壁410被移除。因此,图9B示出了包括电源模块431、GPU模块432、CPU模块433和接口卡434的服务器430。在一个示例实施例中,机箱400内部的部件可以包括刀片服务器中使用的部件,例如,CPU模块433和GPU模块432。另外,机箱400内部的部件可以包括传统上不包括在服务器中的其他部件,例如,电源模块431或接口卡434。因为机箱400不需要传统的空气冷却设备,所以机箱400在机箱中不包括任何风扇或散热器。因此,相对于机箱的计算电力,机箱具有非常薄的轮廓。
图9C示出了机箱内的部件的示意图。在该示例性实施例中,服务器主板445、多个电源模块431和接口卡434安装在机箱400上。储存装置和/或其他外围部件也可以与背板接口330和/或电力模块和通信系统模块一起安装到机箱400。
在一个示例中,安装接口可以被添加到机箱或从机箱移除,使得一件硬件被固定到机箱。在机箱400的内表面上,可以形成有允许部件(例如,主板、GPU、CPU、接口卡和其他相关部件)安装到机箱的装置。这些装置是安装接口。机箱系统400的具体布置可以取决于将被附接到机箱400和/或机架的设备和/或部件。机箱400的一些实施例可以具有可用于设备附接的可互换安装板。一套标准附接板可用于普通或常用部件。
机箱系统400内的电力和网络接口模块的样式和形式因素可以基于某些部件和/或用户指定设备的指令和要求来调整。在一个示例中,可以修改机箱的电力子系统以满足特定部件的需求。在另一个示例中,机箱的尺寸可以设计成适应任何尺寸的一件硬件。在又一个示例中,根据装配在机箱中的网络连接卡,机箱可以提供不同的网络选项。因为这些特征和机箱的其他特征,机箱可以适应各种部件。因此,压力受控容器的这些部件的组装或移除可以变得简化,从而自动化。例如,机箱可以包括刀片服务器,并且机器人可以容易地将机箱装配到压力受控容器的机架上或从压力受控容器的机架上移除机箱。因此,机器人可以在没有任何人工交互的情况下移除和替换刀片服务器,从而使人类暴露于介电流体最小化。
在一个示例实施例中,机箱可以包括微控制器,该微控制器可以与压力受控容器的管理系统通信。微控制器可以从放置在机箱中或外部的各种传感器接收传感器数据。例如,机箱可以包括用于检测机箱是否正确放置在机架中的传感器。如果服务器可以与机架连接,则服务器可以正确放置在机架中。传感器可以确定机箱是否正确放置在机架中。因此,传感器可以向微控制器传输数据,并且通过使用该数据,微控制器可以向管理系统提供信号,指示机箱是否正确地放置在机架中。
在一个实施例中,微控制器可以联接到开关,该开关可以开启或关停安装在机箱中的部件。微控制器可以从管理系统接收电源开启或关闭信号,并且响应于接收信号,微控制器可以向开关传输信号以开启或关停部件,例如,服务器。在一个示例实施例中,微控制器可以从服务器接收操作数据,并且微控制器可以将该数据转发到管理系统。操作数据是服务器的关键性能指标,并且可以指示其性能。操作数据可以包括计算速度、计算降级(degradation)、功耗、电路的温度和系统的带宽。
在一个示例实施例中,微控制器可以监测、管理和控制刀片服务器的电气和通信设施。例如,监测电流(即,安培数)和电压的指示器,以确保系统能够自我保护,例如,没有提供过电流或欠电流。
在一个示例实施例中,机箱可以包括能够使机器人抓取和移除机箱的结构。例如,机箱可以是具有前部、后部和侧壁的矩形盒体的形状。机箱还可以包括顶壁和底壁。机箱的顶壁可以包括板,该板可以与机械臂联接。使用该板,机械臂可以抓取板用于卸载和其他处理操作。
在一个示例实施例中,机箱可以包括机械导向轨道和定位销,以确保机箱在机架中的正确对准和插入。机械导向轨道可以放置在机箱的侧壁上。
在一个示例实施例中,机箱可以包括各种特征以提升流体流动。例如,机箱可以是具有前部、后部和侧壁的矩形盒体的形状。机箱还可以包括顶壁和底壁。在这个示例中,机箱的至少一个壁可以包括贯穿壁的流体流动开孔。例如,后壁可以包括多个开孔,当机箱浸没在液体浴槽中时,所述开孔可以促进流体流入和流出机箱。
在一个示例实施例中,机箱可以包括穿孔,以确保当机箱从液体浴槽中移除时,机箱内的所有流体排出。例如,机架可以位于液体浴槽中,以冷却由机架保持的计算机部件。为了移除服务器,机器人可以抓取机箱的板并且将机箱从机架中提起(从而将机箱从液体浴槽移除)。当机箱从液体浴槽中移除时,一定量的流体可能会保留在机箱内。机箱可以在机箱的底壁处包括槽口或排放口,以确保即使压力受控容器不是完全水平的,流体也可以逸出。槽口或排放口可以位于底壁的拐角处。
在一个示例实施例中,机箱可以包括电力接口和/或通信接口。接口可以将安装在机箱内的部件电联接到机架和/或压力受控容器。电力接口和/或通信接口可以放置在背板处。例如,安装在机箱内的服务器可以经由各种导线和线缆连接到机箱的接口。当机箱放置在机架内时,接口可以电联接到与机架(即,背板接收器)和/或压力受控容器连接的另一个接口。两个接口(例如,背板和背板接收器)之间的电联接可以向服务器供电,并且将服务器连接到压力受控容器内或外部的通信网络。在将机箱机械插入机架期间,可以自动完成两个接口之间的联接。类似地,将机箱从机架上移除可以将服务器与机架和/或压力受控容器断开。
在一些实施例中,通过背板接口330和通信系统接口提供标准化的互连可以最小化数据接口的错误连接的可能性,并且减少对连接故障排除的需要。
在某些实施例中,机箱400将包括一组标准电力和网络接口。网络接口可以是Cat6A或Cat7兼容的RJ45接口的形式,用于连接到设备主板上的1G或10G以太网接口。在这样的实施例中,电力接口可以包括一组用于连接标准主板和/或外围部件的标准Molex型连接器。
在一个示例实施例中,压力受控容器可以包括内部数据库,用于储存关于装配在系统内的部件的信息。内部数据库可以是装配在压力受控容器上的部件的储存库。例如,内部数据库可以储存系统内装配的每个服务器和电源的品牌和型号。当系统的部件被例如机器人更换或替换时,管理系统可以跟踪变化并且更新存储在内部数据库中的信息。压力受控容器也可以经由网络连接到外部数据库。
在一个示例实施例中,每个机箱可以与唯一的序列号相关联,例如,在机箱上显示为条形码。当部件放置在机箱内时,部件的规格(或部件的品牌和型号)可以存储在与唯一的序列号相关联的外部数据库中。随后,当机箱装配在压力受控容器中时,压力受控容器可以通过在外部数据库中搜索唯一的序列号来查找部件。例如,机械臂可以扫描机箱上的条形码,并且管理系统可以使用条形码来搜索外部数据库。管理系统可以使用从外部数据库获得的信息来更新内部数据库。类似地,当从压力受控容器移除机箱时,机械臂可以扫描与机箱相关联的条形码,并且管理系统可以更新内部数据库以指示安装在机箱中的部件不再装配在系统中。
在一个示例实施例中,机箱可以包括RFID标签。压力受控容器的机械臂可以包括能够发射射频以检测RFID标签的扫描仪。当机械臂处理机箱时,机械臂可以扫描RDIF标签,并且向管理系统提供唯一的序列号,以更新内部数据库。
在一个示例实施例中,机箱可以包括识别板,该识别板可以包含用户指定的资产识别号。该资产识别号可以与安装在机箱内的部件相关联地存储。在一些实施例中,识别板可以是被配置成存储资产识别号的芯片。
在一个示例实施例中,机箱可以包括泵以增强机箱内的流体流动。为了使机箱内的部件和液体浴槽之间的热交换最大化,机箱可以包括泵,该泵可以使机箱内和部件周围的流体循环。泵可以从分布在机箱周围的各种导管中抽取流体,并且将流体驱动到机箱外,反之亦然。
在一个示例实施例中,机箱可以包括围绕机箱的各种导管,用于干燥机箱和安装在其中的部件。当机箱从液体浴槽中拉出时,一定量的液体可能保留在机箱内或其中的部件内。机箱可以包括各种导管,这些导管可以引导机箱内或部件周围的气流,以促进机箱和部件的干燥。在一个示例实施例中,压力受控容器可以在将机箱递送给用户之前将机箱暴露于气流中。例如,机箱可以包括用于接收气流的输入管道,并且压力受控容器提供通过输入管道的气流。
图9D示出了根据示例实施例的机箱400的底壁415。在该示例实施例中,底壁415可以包括电力接口416和通信接口417。图9D也示出了机箱400的侧壁420上的导向轨道421。
图9E示出了根据示例实施例的机箱400的顶壁425。在该示例实施例中,顶壁425可以包括板426和一对手柄427。机械臂可以使用板426来拾取机箱400。
图9F示出了根据示例实施例的机箱400的侧壁420。在该示例实施例中,侧壁420可以包括导向轨道421。图9F还示出了后壁410、手柄427和电力接口416。
图9G示出了根据示例实施例的机箱400的底部排放开孔450的分解图。在该示例实施例中,底部排放开孔450可以放置在底壁415、侧壁420和后壁410的拐角上。
图10A-F示出了压力受控容器500的示例实施例。特别地,图10A示出了容器500的示例实施例,例如,600KW的滑撬装置。该示例实施例包括模块化滑撬。容器500可以包括多个叉举管514,其促进容器500移动和转移到期望的位置。容器500可以接收电力和通信输入511,以及来自最低限度地穿透容器本身的工艺用水管道512的工艺用水。这些连接可以定位在容器的顶部上,以便促进模块化容器在数据中心的封闭包装。在一些实施例中,连接可以放置在容器的前部和/或侧部上,以便适应数据中心内多个模块化容器的竖直堆叠。在一些实施例中,容器可以包括竖直间隔件,以促进容器在彼此顶部上的竖直堆叠。竖直空间可以为容器之间的连接、空气流和/或绝缘创建额外的空间。通过竖直堆叠容器,可以在平方英尺的基础上实现非凡的电力密度。在一些实施例中,容器500可以包括电力和通信盒体,该电力和通信盒体被配置成接收输入511并且在整个容器500中分配电力和网络连接。容器500可以包括密封盖515,其可以促进从容器500添加和/或移除部件。
图10B示出了容器500的另一视图。在一些实施例中,替换部件的库存可以储存在容器500内,使得可以在不打开容器的情况下使用容器内的机器人系统替换部件。机器人系统可以使用门架马达516来操作。在这样的实施例中,当部件断裂或需要修理时,替换部件被装配到系统中,并且断裂或以其他方式移除的部件可以储存在暗盒中,直到暗盒满了。此时,可以从容器中移除容纳移除部件的暗盒,并且可以将带有新的替换部件的新鲜暗盒插入容器中以备将来使用。在一些实施例中,所公开的容器大约15英尺长,大约7英尺宽,大约10英尺高。在一些实施例中,所公开的系统可以提供600KW的计算电力以在大约150平方英尺内实现。
在一些实施例中,容器500也可以包括一个或多个波纹管罐517。波纹管罐517可用于调节容器内的压力。当所公开的计算和/或冷却系统最初被激活时,膨胀的介电流体可以被引导到波纹管罐,使得它不会损失到环境中和/或避免容器内的压力累积。在一些实施例中,波纹管罐517可以足够大,以在容器内容纳大约两倍的液体介电流体。
图10C示出了容器500的剖视图。容器500的下部可以容纳机架310和/或机箱400,该机架和/或机箱容纳计算部件。机架上方是冷凝器盘管132,其冷却和冷凝任何介电蒸汽。使用电力母线排518可以在容器内分配电力。这允许以热插拔方式将电力分配给各个计算部件。电力母线排518允许容器仅使用穿过容器的一个或少量穿透件来接收外部电力。这种设计简化了容器系统的装配和操作。在一些实施例中,每个电力母线排可以向五个机架的电源提供600安培的电流。在这样的实施例中,可以有两组母线,容器的每一侧一组。在一些实施例中,母线不包括塑料绝缘体。塑料可能被认为是某些介电流体的污染物,并且在一些实施例中通常可以避免。
在一些实施例中,容器500可以包括干燥剂519。在一些实施例中,介电蒸汽可以从容器500的头部空间移除,并且以允许从介电流体移除任何不可冷凝的成分的方式冷凝。在与许多介电流体相同的条件下,水不会凝结。因此,该系统可用于从介电流体中移除水污染物。
在一些实施例中,容器500可以包括流体过滤器520、流体管道521和流体泵522。在一些实施例中,介电流体可以以使液体介电流体溢出机架310并进入到集液区域523的方式添加到容器中。然后,可以使用流体过滤器520过滤流体,并使用流体泵522和流体管道521将流体泵送到容器的远侧。该系统使新过滤的介电流体循环通过容器,因此,介电流体可以被重新用于冷却计算部件。
图10D示出了容器500的剖视图。在该实施例中,液体介电流体的液位可以保持在高于机架310和/或其中的计算部件的高度的流体液位524处。因此,机架310和/或计算部件可以浸没在介电流体中。在流体液位524上方可以是饱和介电蒸汽,例如,直到中间液位525。在一些实施例中,饱和的电介质蒸汽被保持到中间液位525,该中间液位可以是冷凝器盘管132的高度的大约一半。在饱和蒸汽上方是头部空间,在一些实施例中,该头部空间可以包含密度较低的电介质蒸汽。
通信系统
所公开的通信系统的实施例被设计成提供标准化的第1层至第3层连接和管理接口,所述连接和管理接口用于所公开的超级结构210、压力受控容器110和/或计算系统内的设备或与它们相关联的设备。
在一些实施例中,一系列MTP接口提供将多个高密度多模光纤连接到压力受控容器110中的能力。一旦容纳在压力受控容器110中,光纤连接可以使用一组专用的分接线缆、分接接口、接插板和/或到机架310的分布接插板被分割成单独的交换机级连接。
所公开的系统的一些实施例可以在每个机架310处包括专用的光纤接插板接口端口,以允许经由短接插板连接到装配在其中的交换机系统。在其他实施例中,可以有专用的接插板或一组接插板,从每个交换机系统延伸到MTP分布接口。
在一些实施例中,交换机系统和机箱400之间的接口可以经由背板接口330和/或经由一些其他机构,所述替他机构可以包括或不包括背板连接器的使用。在一些实施例中,可能没有中间机架级交换机系统。这些实施例可以使用压力受控容器110内的一组集中式交换机以连接到位于其中的各种计算设备。
交换机系统和机箱400之间的典型的接口可以使用附接到机架310的接插板来实现,并且使用接插线缆来布线到背板系统,所述接插线缆将接插板上的端口与交换机系统上的适当的端口连接。
在一些实施例中,将有小的(6U)机架导轨区域,该导轨区域包含将通信系统机柜与每个压力受控容器110上的MTP接口互连的接插板,以及集中式通信系统分布交换机,其用于将交换机系统彼此互连和/或与外部世界互连。在这样的实施例中,终端用户或客户可以选择在该空间内装配他们自己的路由设备,并向其提供外部连接,以用作所公开的计算系统和外部世界之间的连接,或者在压力受控容器110或超级结构210与现有网络环境之间运行光纤连接。
在通信系统环境的实施例中使用的接入、通信和/或联网部件可以是标准设备或者可以是用户指定的。机架310和背板接口330系统可以包括通过移除现有的交换机,用任何标准交换机(例如1U交换机)替换现有的交换机来替换位于每个机架310内的交换机系统的能力,以及将期望的接口重新布线到背板网络接口面板的能力。
在某些实施例中,可以利用被设计成直接与背板系统接口的产品。这种产品可以利用机箱400接插板系统和/或直接电接口,该直接电接口被专门地设计成经由专门用途内置的网络互联接口、经由商业上使用的协议或经由用于设计网络级互连接口的规范来互连交换机端口。
在一些实施例中,每个刀片或机箱与交换机之间的连接可以包含多个接口。一个接口可以是标准的交换机端口,该交换机端口可以是商用交换机上可用的标准端口。公共接口可以是1GBASE-T或10GBASE-T,其利用交换机和主机装置之间的Cat6或Cat7双绞线铜线连接。另一个接口可以是交换机到背板的中间装置,该中间装置可以由接插板和一组硬布线连接组成,所述接插板具有从标准交换机端口延伸到接插板的前侧的标准接插线缆,所述硬布线连接从该接插板的背侧到信号背板的信号接口。或者,这可以由专用的线缆和/或标准RJ45接口组成,其从交换机端口延伸到板,以在标准交换机端口和背板之间建立连接。另一个接口可以是接口系统信号背板,其沿着印刷电路板(PCB)从标准交换机端口分配信号路径。一个或更多个信号路径可以终止于PCB上的连接器,信号背板接口将连接到该连接器。又一个接口可以是机箱信号背板接口。这可以是位于机箱本身上的连接器,其与接口系统信号背板上的连接器相匹配。它用作接口系统信号背板与机箱本身之间的接口。另一个接口可以是机箱网络接口。这可能是标准的接插接口,其允许将接插线缆从机箱网络接口连接到服务器上的RJ45接口,该服务器附接到机箱。
机器人系统
在所公开的系统的一些实施例中,一种潜在的方法解决对压力受控容器110内的部件的热交换性的需求。对远程移除和替换故障部件170的能力的需求可以通过机器人来解决。
所公开的系统的组合的特定实施例可以包括内部机械臂230和/或外部机械臂240。一些实施例,比如用于加密货币应用和/或某些高性能计算环境的实施例,可能不要求部件的热交换能力。在其他超大规模GPU和CPU环境中,这可能是基本要求。所公开的机器人系统的实施例允许在不中断任何其他部件的情况下更换机箱和/或其他计算机部件。在一些实施例中,故障卡和/或部件可以被自动和/或有计划地替换和/或储存。这允许所公开系统的实施例的短期和中期、完全远程和自主地操作。
内部机械臂230机构位于压力受控容器110环境内。如图7A-D所示,在一个示例实施例中,当卡或部件运行不正常时,可以开启移除序列。当开启移除序列时,内部机械臂230将从机架310移除适当的计算机部件170和/或相关联的机箱400,将其移动到位于压力受控容器110内的气闸220,并发出移除序列完成的信号。一旦该序列完成,内气闸门222将关闭,气闸压力将与外部大气的压力平衡,并且外部气闸门224将打开。一旦外部气闸门224打开,外部机械臂240将从气闸220中移除机箱400,并将其放置到空的储存狭槽中。
在一些实施例中,在气闸220打开到外部环境之前,气闸220将通过氮气和/或另一种惰性气体和/或不可冷凝的气体净化。在这样的实施例中,当气闸打开和关闭时,这具有减少或消除介电蒸汽损失的效果。在某些实施例中,气闸将在内部、外部或两者上安装有单向阀。在气闸的内部和外部都具有单向阀的实施例中,对气闸进行净化将防止外部环境到压力受控容器110的内部大气中的交叉污染,并且还防止电介质蒸汽的损失。
当卡或部件替换序列开启时,外部机械臂240将从储存狭槽中移除替换部件和/或机箱400,并将该部件放置到气闸220中。一旦完成,外部气闸门224将关闭,气闸压力将与压力受控容器110的内部的压力平衡,并且内气闸门222将打开。一旦内气闸门222打开,内部机械臂230将从气闸220移除机箱400,并将其插入到适当的机架310中。
当与远程可接入的管理系统联接时,内部机械臂230和外部机械臂240允许数据中心环境的远程操作和管理。这可以减少对人工操作员的需要,从而保持可用性并减少成本和/或停机时间。在一些实施例中,外部机械臂240安装在可移动基座上,从而允许单个外部机械臂系统服务于所公开的计算系统的多个实施例。
当与定制开发的工作流管理系统和虚拟化技术集成时,所公开的机器人系统允许开发完全自主、自愈的数据中心解决方案,该解决方案可以提供最大程度的系统可靠性。
在一些实施例中,具有唯一的人类和/或机器可读序列号和/或生产批次代码的资产标签可以被包括在每个计算机部件和/或机箱上。在这些实施例中,资产标签可以是唯一的序列号。所述标签可以包含印刷的条形码或QR码,并允许通过所公开的机器人系统的实施例进行自动部分识别。标签代码还可以与管理软件系统结合使用,以提供关于仓库管理和自动化系统的详细的部件信息。标签和任何相关的粘合剂或其他部件优选由与介电流体可相容的材料制成。所述标签优选地位于机箱上,在机箱被插入机架时可读的地方。在一些实施例中,次级标签或额外标签可以位于机箱的其他区域,以帮助识别部件和/或库存管理。
所公开的机器人系统的实施例允许任何单独的机箱被临时移除和替换,这一过程被称为“重新安置(re-seating)”。在故障排除期间,当确定需要对部件进行硬性电力循环(hard power cycle)时,这很有用。重新安置通过断开所有电力、等待片刻并重新连接来实现这一点。
一些实施例允许通过气闸将单独的卡和/或机箱从压力受控容器中移除。在一些实施例中,机器人系统将从机架中的狭槽处移除机箱,将其移动至气闸,并发出完成该任务的信号,以允许气闸被打开以及卡和/或机箱被移除。一些实施例允许通过用于移除的同一气闸将替换部件和/或机箱放置到特定的机架狭槽中。在一些实施例中,机器人系统将从气闸中移除机箱,将其放置到适当的机架插槽中,并发出完成该任务的信号。
内部系统中的机器人
所公开的系统的实施例可以包含“内部机器人”的机器人系统。在这样的实施例中,压力受控容器可以被膨胀,以便容纳在容器内操作的机械臂。该容器还可以被布置成适应计算机部件和/或机箱在机架上方的移动或转移,所述机架包含运行的计算机部件。应当理解的是,压力受控容器也可以被称为罐、舱和/或真空室。替代地,可以理解的是,压力受控容器的某些部件可以称为罐或舱。
图10E描绘了所公开的系统的实施例,所述系统具有被配置为移除、替换和/或装配计算部件(例如,机架310的机箱400)的门架机器人526。在一些实施例中,门架机器人526还可以被配置成移除、替换和/或装配DC整流器和/或电力分配系统的其他部件。应当理解,所公开的计算机部件和电力分配部件的一些实施例可以被设计成可热插拔的,并且可以包括手柄或便于门架机器人526处理的其他特征。在一些实施例中,门架机器人526被布置成在x和y方向上行进,并且可以在z方向上下降,以便移除和/或装配替换部件。在一些实施例中,门架机器人526包括抓持工具以抓取机箱400和/或电源,例如,抓持工具可以抓取板426。
图10E示出了所公开的罐的示例实施例的顶部截面图。在一些实施例中,机架310的阵列可以装填有机箱400和/或计算板。在一些实施例中,每个机箱400可以利用大约6KW的功率,并且每个机架310可以包含10个机箱。因此,在包含10个这样的机架310的实施例中,容器可以利用大约600千瓦的功率用于计算目的。在一些实施例中,机箱400和DC电力整流器的额外机架310和/或机匣527可以储存在容器500中,以用作替换部件和/或提供空间来储存已经从容器500移除的部件。
外部系统上的机器人
图12A-E示出了容器的另一个实施例。具体而言,图12A描绘了容器700的实施例,其中门架机器人526在容纳机箱400和/或计算部件的罐710的外部。在该实施例中,罐710可以更小,但是需要更频繁地打开,以便外部门架机器人526接近罐710内部的机箱400和/或电源。此外,替换设备可以储存和/或容纳在模块化封闭件内,比如罐710的外部的储存器716。在一些实施例中,罐710可以具有多个门711,从而在为了移除、装配和/或替换部件或机箱400而打开单个门711时,限制罐710的内部的暴露。在这样的实施例中,替换部件可以储存在罐710的外部,以便避免不必要地打开罐。
此外,容器700可以包括一个或更多个变压器712、电气分配面板713、工艺用水管道512和电气管槽714。容器700还可以包括可编程逻辑控制器(PLC)机柜715,其监测并控制容器700内各种设备的状态。变压器712、电气分配面板713、工艺用水管道512、电气管槽714和PLC机柜715可以位于罐710的外部。
图12B示出了容器700的截面图,其中外部门架机器人526可进入罐710。在该示例实施例中,冷凝器盘管132、机架310和波纹管717位于罐710中。图12C示出了容器700的侧视图,其中罐710具有外部门架机器人和多个门711。在该示例实施例中,罐710包括流体泵,其用于从集液区域移除流体并通过流体管道521将流体发送到流体过滤器520。容器700还包括用于储存替换设备的机匣718。在该示例实施例中,机匣718位于罐710的外部。在一些实施例中,可以使用间隔件和/或压载块体160,以减少罐710中的液体介电流体的总体积。
图12D示出了根据示例实施例的机架310。在一些实施例中,冗余电源314可以定位在机架310的相对侧上,而不是邻近主电源313。此外,电力和/或数据线缆318和319可以以替代配置走线,以便适应具体部署的特定要求。在该示例实施例中,背板接收器331位于机架310下方。
图12E示出了可以用于所公开的罐710的一些替代实施例中的示例铰接门711。在一些实施例中,可以利用滑动门,而不是铰接门,以便减少或避免介电蒸汽中的感应电流。缓慢地将门滑动打开,对电介质蒸汽的干扰可能比打开铰接门并引起混合电流要小。
管理系统
管理系统是所公开的计算系统的用户和计算系统本身之间的基于网络的界面。管理系统的实施例提供了计算系统的操作视图,并允许监测和管理各种部件,包括监测并管理压力受控容器110、机器人系统、通信系统、电力系统和/或所有其他系统和部件。在一个示例实施例中,管理系统可以实现在图12A的PLC机柜715中。在另一个示例实施例中,管理系统可以实现在图10A的电力和通信盒体513中。在每个实施例中,电力管理系统可以被实现为控制装置或其他合适装置(例如,计算机)上的软件程序。
在某些实施例中,一组简单的网络管理协议可访问的数据点可以对管理系统的用户可用,以允许经由第三方监测系统监测关键操作参数。可以维护完整的操作日志,并可以提供图表供用户查看操作条件数据。
可以经由管理系统安排和维护系统部件的定期维护。用户可以被提供有常规维护的定期提醒,并且能够在执行定期维护时在界面中得知。这些数据都可以作为操作日志信息的一部分进行维护,以便进行历史操作审查。
在一些实施例中,操作功能也可以经由API接口来展示,以允许计算系统和相关部件的远程编程监测和管理。可以包括一整套运行监测和报警功能,以运行在出现任何问题时通知操作员。
管理系统的集中式服务器版本或基于托管云的管理版本可以由具有多个压力受控容器计算系统的客户使用。这为操作员提供了单一的程序和用户可访问的界面,用于管理压力受控容器计算系统的队列。
在一些实施例中,基于软件的接口模块允许与计算平台和第三方管理实用程序(比如Microsoft System Center和VMWare VCenter)进行互操作。由管理系统提供的用户和API接口可以允许与所公开的机器人系统的完全互操作,允许所公开的计算平台的完全远程和程序化的自主操作和监管。
在一些实施例中,控制系统允许调节和控制操作,包括温度、压力、流速和/或电力管理。在一些实施例中,用户认证系统允许多个唯一用户向系统进行认证。一些实施例包括基于角色和/或基于元素的许可系统。在这样的实施例中,管理员将能够配置多个角色,用户可以与这些角色相关联和/或将特定权限应用于其角色分配之外的单个用户。
一些实施例结合了视频管理,以便向用户提供记录和检索来自相机的视频反馈的能力,所述相机可以位于容器和/或超级结构内。在一些实施例中,相机可以获取可以由处理器分析的视觉数据。在这样的实施例中,处理器可以利用计算机视觉技术,以便响应于所获取的视觉数据来控制容器、机器人和/或超级结构系统的操作。
在一些实施例中,控制系统和软件可以被配置成生成关于整个系统和/或所公开的计算平台的单独子系统和/或部件的操作和状态的报告。
示例性组合系统实施例
应当理解,所公开的系统可以单独使用或组合使用。组合计算系统有多个实施例,其可以针对各种使用案例进行定制。
一个示例实施例是加密系列。这是所公开技术的超高密度的实现,其利用了专门构建的计算硬件、具有为该硬件设计的引导板和线束的机架310、通信系统360架构的改型实现以及1MW的压力受控容器110和电力分配系统。该实施例的典型用户是那些希望使用定制的计算部件执行加密货币开采或其他超高功率密度过程的人,或者是那些希望开发全范围两相液体浸没冷却系统的计算部件制造商(他们将把自己的硬件结合到所述系统中)。
另一个示例实施例是GPU系列。这是一种所公开技术的高密度GPU超级计算的实现。这种实现将利用定制的机箱400、机架310和背板接口330技术,这些技术被设计成结合Gigabyte的主板和NVidia的使用NVidia NVLink技术的GPU,以便于超高速GPU到GPU的通信。这项技术的典型用户包括通用并行处理应用程序,其可以利用基于GPU的计算和内存能力,包括图形渲染、粒子模拟和通用研究活动。
另一个示例实施例是CPU系列。这是所公开技术的高密度CPU计算的实现。该实现将利用高端的基于超微的主板、Intel Xeon CPU、高速网络接口、高速内存和固态储存装置进行本地储存。这种技术的典型用户包括数据中心、企业和云/VPS主机提供商和服务提供商,他们将高性能计算用于自己的内部应用程序或用于提供给第三方客户和其他组织的应用程序。
又一示例实施例包括边缘系列。这是所公开的计算系统的按比例缩小的实现,该计算系统是专门为远程/现场部署设计的,或者是在传统的商业和数据中心环境内或旁边设计的。该实施例侧重于具有完全远程监测和管理能力的安全、耐气候影响的环境。该技术的目标用户将是现场部署和分布式技术的运营商,比如网络运营商和具有分布式现场基础设施的其他组织,以及希望通过对现有设施或结构的最小修改来增强其计算能力的现有设施的运营商。该系统可以对外部结构进行各种改进,以简化公用设施的连接,包括系统的电气、水和网络连接。
自持的实施例
一些公开的实施例不依赖外部水源。这样的实施例可以包括用于冷却水或另一种流体的闭环冷冻器,该冷却水或另一种流体可以通过如上所述的冷凝器循环。使用闭环冷动器而不是外部冷却水源允许实施例基本上是自持的。
图13示出了一个示例性的自持式容器750。图13的示例实施例利用撬装式闭环冷动器719来冷却要在舱或浸没罐710内的冷凝器中使用的水或另一种液体。通过使用闭环冷动器,可以消除对外部冷却水源的需求,从而产生自持的数据中心解决方案,其只需要外部电源和网络连接就可以完全运行。容器750还可以包括波纹管717、门711、门架机器人526、电气分配面板713、PLC机柜715和机匣718。
在一些实施例中,闭环冷却器719可以是撬装式闭环冷却器,其封闭在模块化压力受控容器的外壳体内。在这样的实施例中,热量从计算机部件转移到罐710内的介电液体。如本文所述,该过程将介电液体转化为电介质蒸汽。电介质蒸汽在罐710内上升,并被冷凝器冷却,从而将电介质蒸汽转化回介电液体。从电介质蒸汽转移到冷凝器的热量然后从冷凝器转移到冷凝器内的制冷剂或冷凝流体,并且然后传递到闭环冷却器719。在一些实施例中,闭环冷却器719使用蒸汽压缩、压缩机、蒸发器、热交换器或使制冷剂或冷凝流体冷却的其他闭环方法从制冷剂或冷凝流体中移除热量。来自制冷剂或冷凝流体的热量最终经由空气冷却被分散。在一些实施例中,这导致自持的、模块化的、空气冷却的两相液体浸没计算系统。一些自持实施例的空气冷却令人惊讶,因为浸没冷却的领域通常反对空气冷却,尤其是自持设备的空气冷却。
一些公开的实施例可以以节省空间占地面积的形式因素来提供。一个示例实施例包括单个机架,该机架包含浸没在如上所述的介电液体中的十个刀片或服务器。在一些实施例中,每个服务器可以汲取大约6 kW的功率。因此,一些示例实施例在小的占地面积内提供大约60 kW的计算机功率。
图13所示的示例实施例被包含在约4英尺2英寸深、约8英尺8.5英寸宽和约8英尺8英寸高的占地面积内。该示例实施例包括约60kW的计算机功率以及其他操作部件和系统,并且其被包含在大约36.3平方英尺的区域中。应当理解,容器的操作部件可以包括但不限于容纳介电流体的罐或舱、冷凝器、电源和用于计算机部件的数据连接。该容器还可以包括传感器、控制设备、电力机柜、波纹管717、真空系统、流体过滤器、净化系统和/或其他部件。一些自持的实施例可以包括外壳体。在一些实施例中,外壳体可以封闭容器、提供结构支撑、可撬装、通风、耐气候影响和/或防水和/或装饰性。在一些实施例中,独立容器的外壳体可以包括散热器盘管、风扇格栅、热转移部件和/或空气冷却部件,以便于使用闭环冷动器。
在一些实施例中,自持计算系统提供每平方英尺面积至少约1.5kW、每平方英尺至少约1.6kW、每平方英尺至少约1.65kW、每平方英尺至少约1.8kW、每平方英尺至少约2.0kW、或每平方英尺至少约3.0kW的计算功率。在一些实施例中,自持计算系统提供每平方英尺面积至多约1.5kW、每平方英尺至多约1.6kW、每平方英尺至多约1.65kW、每平方英尺至多约1.8kW、每平方英尺至多约2.0kW、或每平方英尺至多约3.0kW的计算功率。可以理解的是,自持系统的高度可以调节,从而允许在给定占地面积内提供更多或更少的计算功率。
应当理解,所公开的示例实施例的尺寸、部件、布置和配置可以被修改、增加和/或减少,以产生各种外形因素的各种潜在实施例。
在一些实施例中,自持的计算系统可以包括机器人系统,比如门架机器人526,其被配置为移除、替换和/或装配刀片服务器、电源或其他部件,例如机箱400。自持系统可以包括“内部的机器人”或“外部的机器人”系统。在具有较小占地面积的实施例中,可以使用替换部件的较小机匣718。在一些实施例中,如图13所示,替换部件的机匣718可以附接到罐710的外部。在一些实施例中,罐710、机架、计算机部件、电源、替换机匣718和门架机器人526可以被布置成使得门架机器人526可以移除、替换和/或装配部件,同时基本上仅在一个方向上行进。如果各种部件基本上线性布置,则门架机器人526可以能够沿着单个轴线行进,以便移除、替换和/或装配期望的部件,而无需在第二方向上行进。应当理解,除了在单一线性方向上行进之外,门架机器人526还可以能够提升和降低部件。
利用紧凑的外形因素,比如图13所示的实施例,允许容易地运输自持的2PLIC系统。闭环冷却器719的结合允许两相液体浸没冷却系统在可能无法获取实际冷冻水源的远程条件下使用。此外,对外部冷却水的需求的消除产生了自持的计算系统,在一些实施例中,所述自持的计算系统仅需要两个外部连接,电源和数据连接。
在一些实施例中,计算系统可以被包含在外壳体内,如图14所示。在一些实施例中,图13中示意性标识的部件和/或本文公开的部件可以被包含在外壳体内。在一些实施例中,外壳体的体积可以基于预期的冷却要求、闭环冷动器的配置和/或自持的计算系统预期被部署的环境来调整。
所公开的自持、自修复、紧凑外形因素的实施例可以用作独立的解决方案,以向几乎任何位置或环境提供显著的计算能力。在一些应用中,多个紧凑计算系统可以彼此靠近地定位和/或链接在一起以创建集群。在一些实施例中,外壳体被布置成允许在仅进入外壳体的一侧或两侧时执行维护和/或维修操作。这种布置允许单独的自持计算系统以各个自持系统之间减小的或最小的距离来定位。
在一个示例实施例中,四个示例性自持计算系统的集群可以被战略性地定位,以在约140平方英尺的占地面积中允许约240kW的自持的计算机功率。在一些实施例中,这些单元可以彼此电力和/或数据连通,从而允许仅具有单个外部电力连接和单个数据连接的多单元集群的运行。在一些实施例中,可以使用多个紧凑计算系统或这种计算系统的多个集群来建立数据中心。
本文公开的一些公开的实施例和/或计算系统可以在现代数据中心和/或气候受控环境中使用,然而,公开的自持的计算系统的一些实施例可以部署在远程位置和/或恶劣的环境条件中。在一些实施例中,外壳体可以是耐气候影响的、防水的,和/或以其它方式被布置成在延长的时间段耐受暴露于恶劣环境的。一些公开的实施例允许将大量计算资源快速部署到偏远或具有挑战性的位置。一些自持的实施例可以被布置成在接入电源和数据连接的基本任何位置中都可运行。在一些实施例中,不间断电源和/或发电机可以可操作地连接到计算系统,以提供对电力的更可靠或一致的接入。
一些公开的自持实施例被设计成可堆叠的。一些可堆叠的实施例可以设计成具有降低的高度。某些实施例可以是约5’5”高、5’6”深和9’宽。这可以在42平方英尺的占地面积上产生约60kW的计算机功率。这种单元可以竖直堆叠,在同一42平方英尺的占地面积上提供120kW的计算机功率。
所公开的计算系统的实施例可以堆叠,并且多个堆叠可以彼此相邻地定位。这减少了各个计算系统之间对岛式空间的需求,从而允许数据中心内整体更高的功率密度。
一些实施例可以被设计成通过仅进入自持的计算系统的一侧就完全可操作和可维护的。这些实施例可以有利的,因为它们有助于将自持系统定位成彼此非常靠近。此外,在一些自持的实施例中,在仅进入装置的一侧的同时,整个浸没罐可以被移除和/或替换。在某些实施例中,罐可以单独模块化和/或滑撬式安装(skid mounted)。
在一些实施例中,自持的计算系统可以竖直地布置,以利用甚至更小的占地面积。所公开系统的竖直设计的实施例可以在约22.9平方英尺的占地面积上提供约60 kW的计算功率。如一些其他公开的实施例,一些竖直定向的自持计算系统可以彼此紧密靠近地定位。同样如一些其他实施例所讨论的,一些竖直定向的自持计算系统可以通过仅进入装置的一侧来操作和维护。在一些实施例中,整个罐可以从外壳体移除并替换。这种布置允许快速替换多个刀片服务器和/或其他计算部件。
移动实施例
不需要外部冷却水源的自持的计算系统允许新颖的计算应用。在一些实施例中,可以使用发电机向系统供电,从而去除了将系统连接到外部和/或固定电力源的需要。在一些实施例中,系统可以依赖于无线数据通信。
在不依赖于固定电力源或有线数据通信的特定自持的实施例中,可以实现完全移动的计算系统。所公开的实施例包括安装在车辆上的、自持的计算系统,其可以用于在几乎任何环境中提供显著的计算功率。在一些实施例中,安装在卡车上的无线计算系统可以在现有或临时网络的无线通信范围内被驱动,并且提供大量计算功率,而基本上没有设置或装配时间。
天然水的实施例
在一些实施例中,计算系统可以被布置成在船舶、舰艇、石油钻机、浮动平台或定位成接近水体的其他容器或结构上使用。在这样的实施例中,可以使用来自所述水体的水来冷却冷凝器,所述冷凝器用于将电介质蒸汽转换回介电液体,如本文所讨论。在一个示例实施例中,模块化计算系统可以包括进水口、出水口和泵或叶轮。泵和/或叶轮可以使水从水体中流出,通过冷凝器,并且然后流到水体中。一些实施例可以包括过滤器和/或工艺部件,其被设计成保护冷凝器、管路和其他计算系统部件免受水体中潜在污染源的影响。在一些实施例中,冷凝器和其他部件被布置成承受与微咸水或盐水(比如,举例来说海水)的长时间接触。
水平机匣交换
在一些实施例中,替换部件的机匣可以储存在罐的外部和计算系统的外壳体内。替换部件(比如,举例来说机箱、服务器、刀片和/或电力部件)可以从机匣中移除,并用于替换罐内的部件。该机匣可以在平台上,所述平台被配置为延伸出计算系统的外壳体,以便允许替换来自机匣的部件。
在一个非限制性示例中,当罐内的刀片服务器发生故障时,机械臂可以用于从罐中提取出不工作的部件,并将该不工作的部件移动到机匣的储存狭槽中。然后,机械臂可以从机匣中移出功能正常的刀片服务器,并将其装配在不工作的服务器先前装配的位置,从而用新的工作的服务器替换不工作的服务器。
随着时间的推移,机匣将积累不工作的部件,所述不工作的部件可以会被新的工作部件替换,以便使机器人系统继续长期运行。在一些实施例中,机匣位于可以延伸到外壳体的外部的平台上,从而允许操作员接近机匣。在一些实施例中,平台被配置成将机匣从基本竖直的位置旋转到基本水平的位置,以便允许部件滑入或滑出机匣。
在一些实施例中,可调节高度的推车可用于移动、装载和/或接收部件,使得人类操作人员在从机匣移除或更换部件时不需要提升或支撑部件的重量。应当理解,被配置成旋转到基本水平位置的机匣也可以有助于将功能正常的部件装载到机匣中以及移除功能不正常的部件。
图15A-D示出了位于能够延伸出容器的平台820上的示例机匣810。在图15A中,机匣810可以连接到包括旋转构件821、支撑构件822和轨道823的平台。在一些实施例中,支撑构件822可以连接到轨道823,该轨道允许支撑构件822移动,同时支撑机匣810和储存在机匣内的任何服务器或其他部件的重量。在图15A的示例实施例中,平台820处于延伸位置。
如图15B所示,在正常操作期间,支撑构件822可以相对于计算系统的外壳体缩回。在正常操作期间,机匣810可以储存在轨道823上方。在一些实施例中,无论支撑构件822在轨道823上的位置如何,机匣810的重量都由支撑构件822和轨道823支撑。
在一些实施例中,与公开的实施例一起使用的计算机部件(比如,举例来说服务器)可以比传统的计算机部件更密集和/或更重。在一些实施例中,由于所公开的实施例的增加的冷却能力,刀片服务器可以重达至少约50磅,或至少约60磅,或至少约70磅,或至少约80磅,或至少约90磅,或至少约100磅。在一些实施例中,刀片服务器可以重达至多约50磅,或至多约60磅,或至多约70磅,或至多约80磅,或至多约90磅,或至多约100磅。如图15B所示,机匣810可以容纳多个机箱400或刀片服务器,其中,单个刀片服务器可以重达约73磅。当机匣装载有三个这样的服务器时,机匣810和服务器的组合重量可以是约395磅。
在一些实施例中,所使用的服务器是安装在机箱上的刀片服务器。服务器和/或机箱可以包含背板系统,以便于在计算系统中安装和移除服务器。在一些实施例中,服务器可以是不包括风扇或其他空气冷却装置的沉浸服务器。在一些实施例中,单个服务器板可以包括16个GPU,并且被配置为汲取大约6 KW的功率。在一些实施例中,服务器是1.5U服务器。一些公开的服务器可以是1 奥托(Otto)沉浸单元(Otto Immersion Unit,OIU)服务器。这种服务器1.5U高,并且被配置为液体浸没冷却。在一些实施例中,计算系统内的单个罐可以被配置为当所有十个服务器都以基本上满功率运行时,运行十个1OIU服务器和大约60KW的功率。在一些实施例中,计算系统可以包括一个或两个这样的罐。在一些实施例中,计算系统可以包括多个罐,比如举例来说十个这样的罐。
在一些实施例中,当从计算系统中提取出机匣时,如图15A所示,支撑构件沿着轨道从储存位置移动,并且悬臂地伸到该计算系统的外壳体的外部。
同样如图15C-15D所示,机匣可以被拉出或者以其它方式沿着轨道滑动,并且悬臂地伸到计算系统的外部。在一些实施例中,如图15C-15D所示,机匣移除工具可以用于移除整个机匣和容纳在该机匣内的部件。在这样的实施例中,机匣移除工具可以用于将机匣从支撑构件和滑动轨道上提起,以便运输机匣。
在一些实施例中,一旦机匣已经被移动到计算系统的外部,平台就可以将机匣旋转到基本水平的位置。容纳在机匣内的服务器然后可以滑出机匣。
图15A-15D示出了根据示例实施例的用于从机匣移除服务器的一系列示例性步骤。在示例实施例中,机匣可以附接到进入门后面的直线导向轨道系统。如图15C-15D所示,机匣可以被拉出并悬臂地伸出到计算系统的外部。机匣可以被手动地拉出,或者使用机动化或自动化系统将其移出计算系统。如图15D所示,机匣可以旋转大约90度,以将容纳在机匣中的服务器和/或其他部件定向在基本水平的位置。一旦处于基本水平的位置,服务器和/或其他部件可以滑出机匣,并滑到被配置成接收服务器和/或其他部件的推车或其他工具上。如图15C所示,剪式提升推车可以被调节到方便的高度,以接收服务器或其他部件。可以使用具有滚动表面的可调节高度的推车,以允许服务器从机匣转移到推车上,而不需要人类操作人员支撑服务器的重量。如图15D所示,一旦服务器滑动到具有滑行或滚动表面的推车上,服务器或其他部件就可以被运输到其他位置以进行替换或维修。可以理解的是,可以以相反的顺序使用基本相同的步骤将新的部件装载到机匣中。
在一些替代实施例中,机匣可以被支撑在没有轨道的旋转且可延伸的臂上。在这样的实施例中,在正常运行期间,机匣可以被储存在计算系统的外壳体内的基本竖直的位置。一旦确定机匣内的部件应该替换,就可以使用可延伸的臂将机匣延伸到外壳体的外部。一旦机匣延伸超出外壳体,机匣就可以从基本竖直的位置旋转到基本水平的位置,以允许储存在该机匣内的部件从机匣中水平地移除。
波纹管
在一些实施例中,可以使用波纹管和/或蒸汽收集系统。在一些公开的实施例被初始启用之前,介电流体、诸如服务器的计算机部件和其他系统部件可以处于热平衡。一旦计算系统启用,诸如服务器之类的计算机部件就可能开始产生热量,所述热量可以散发到介电流体中。这个过程导致一些介电流体从液态转变为蒸汽状态。随着流体的温度升高,更大比例的介电流体可以转变为蒸汽状态。在封闭系统中,介电蒸汽的增加的体积可能导致系统内的增加的压力。在一些实施例中,包含介电流体的罐可以与回收系统流体和/或蒸汽连通。
图16示出了根据示例实施例的蒸汽回收系统900。回收系统900连接到容纳介电蒸汽的罐710。介电蒸汽可以从罐710通过管路流动至一个或更多个波纹管905。在一些实施例中,蒸汽回收系统900包括膨胀和收缩的波纹管905,其被配置成接收介电蒸汽,从而减少或消除罐710中的任何压力累积。当系统冷却或一部分介电蒸汽冷凝成介电液体时,波纹管可以收缩或缩回,以基本上维持罐710内的压力平衡。
在一些实施例中,蒸汽回收系统900包括阀912,该阀被配置成允许环境空气进入蒸汽回收系统。在这样的实施例中,介电蒸汽可以与环境空气混合。将介电蒸汽与环境空气混合可以降低介电蒸汽的温度。在一些实施例中,混合空气/蒸汽可以被引导通过碳床911。碳床911内的碳介质可以被配置成吸引介电蒸汽,同时允许环境空气穿过碳介质并从系统900排气,例如通过出口阀913。以这种方式,加热的介电蒸汽可以被冷却并被碳介质捕获。
在运行足够长的时间后,计算系统的实施例将基于所使用的计算部件的功率容量达到稳定的热状态。如果使用更多或更少的计算功率,则可以将更多或更少的介电流体转变成介电蒸汽。这可以导致波纹管905响应于消散到介电流体中的热量而膨胀和/或收缩。
在一些实施例中,波纹管905可以包括一个或更多个储袋。每个储袋可以包括金属箔和聚合物层压构造。波纹管储袋可以串联或并联地连接至彼此和蒸汽回收系统管路。在一些实施例中,膨胀的波纹管储袋的总体积可以是罐的液体流体体积的至少约15%。在一些实施例中,膨胀的波纹管储袋的总体积可以是罐的液体流体体积的至少约20%,或至少约23%,或至少约25%,或更大。在一些实施例中,膨胀的波纹管储袋的总体积可以为罐的液体流体体积的至多约40%,或至多约30%,或至少约25%,或更少。
在一些实施例中,当计算系统已经基本达到热稳定时,蒸汽回收系统900可以被关闭以冷却环境空气,并且允许空气被排放到系统之外的阀可以被关闭。在一些实施例中,碳床可以被配置为使用阀仅向罐和波纹管打开。在一些实施例中,被配置成将热量传递给碳介质的解吸加热器可以被启用以升高碳介质的温度。随着碳介质温度的升高,先前被碳介质捕获的任何介电流体可以被从碳中驱动出并返回到罐中,在罐中,如前所述,其可以被冷凝回介电流体。
在一些实施例中,当计算系统以低于先前稳定状态供电时,介电流体的处于蒸汽状态的部分可能减少,并且在一些实施例中,波纹管可以缩回以适应介电蒸汽的减少。在一些实施例中,可以打开允许环境空气进入波纹管的阀,以便允许空气进入波纹管并进一步减小任何压差。在一些实施例中,可以使用氮气而不是环境空气来降低压差,并且还避免引入来自环境空气的任何潜在污染物。
在一些实施例中,波纹管和/或蒸汽回收系统可以完全或基本上是被动的。在一些实施例中,波纹管和/或蒸汽回收系统可以基于来自定位在整个计算系统中的温度传感器、压力传感器和/或功率传感器的传感器数据被供电和/或自动化。
在一些实施例中,具有蒸汽回收系统的计算系统是无排放的,即使该系统不是封闭系统。在一些实施例中,环境空气或氮气可以被引入到系统中并从系统中排放出去,而不会将任何或基本上任何介电流体释放到周围大气中。
示例实施例
公开的实施例允许增加计算机部件和/或计算功率的密度。在一些在压力受控容器110内包括两相液体浸没冷却的计算机部件170的实施例中,部件可以彼此分开小于约1”或小于约0.7英寸,或小于约0.5英寸。在一些实施例中,单独部件可以分开大于约0.3英寸,或大于约0.5英寸,或大于约0.7英寸,或大于约1英寸,或大于约1.5英寸。
与传统数据中心相比,一些公开的实施例允许提高电力利用效率(PUE)。使用公开的实施例允许减少冷却计算机部件170的能量使用,从而减少数据中心的总能量使用,并使PUE更接近1.0。一些实施例涉及在压力受控容器110内包括两相液体浸没冷却的计算机部件的数据中心,其中,数据中心具有小于约1.15,或小于约1.10,或小于约1.08,或小于约1.05的PUE。一些实施例涉及在压力受控容器110内包括两相液体浸没冷却的计算机部件的数据中心,其中,数据中心具有大于约1.05,或大于约1.06,或大于约1.08,或大于约1.10的PUE。
在一些实施例中,导热可冷凝的介电流体被提供用于两相液体浸没冷却系统。计算机部件在低于环境大气压的压力下运行,这降低了介电流体蒸发的温度,从而将介电流体的液相维持在与标准大气压相比的较低温度处。计算机部件在运行时会产生热量。产生的热量被转移到与计算机部件接触的介电液体,导致介电液体蒸发成气体。气态介电流体可以使用冷凝器来冷凝。环境温度或冷冻的工艺用水穿过冷凝器。当气态介电流体被冷凝器冷却时,它冷凝回液相,并回落到液体介电流体的浴槽中。
一些公开的实施例涉及高密度数据中心。传统数据中心包括分布在大约10000平方英尺上的约1兆瓦(MW)的计算功率。高端的数据中心可以包括分布在约6000平方英尺上的约1MW的计算功率。所公开的实施例涉及在压力受控容器110内包括两相液体浸没冷却的计算机部件170的数据中心,其中数据中心利用分布在大约3000平方英尺、或者大约1500平方英尺、或者大约1000平方英尺、或者大约800平方英尺、或者大约600平方英尺上的大约1MW的计算功率。在一些实施例中,包含所公开的计算系统的多个压力受控容器可以成排布置,并且由中央电源供电。在一些实施例中,所公开的计算系统的多个实施例可以彼此串联地连接。
所公开的实施例包括在压力受控容器110内的液体浸没冷却的计算机部件170,因此,部件通过压力受控容器和沉浸在液体介电流体140中而与大气污染物隔离。一些公开的实施例涉及以最小的空气过滤和/或清洁需求来运行的数据中心。在一些实施例中,数据中心在没有HEPA过滤器或等同物的情况下,或者在没有MERV 11过滤器或等同物的情况下,或者在没有MERV 8过滤器或等同物的情况下运行。
所公开的实施例包括在压力受控容器110内的液体浸没冷却的计算机部件170,因此,这些部件不被气体空气冷却。所公开的实施例包括在没有冷却风扇和/或用于循环空气的任何其他类似装置的情况下运行的数据中心。
所公开的实施例涉及环境友好的数据中心。在一些实施例中,数据中心包括在压力受控容器110内的液体浸没冷却的计算机部件170,并且消耗很少或不消耗用于冷却过程的水。一些实施例利用闭合回路干式冷却塔来降低通过所公开的冷凝结构130循环的水的温度,以便冷却冷凝结构130并将介电流体蒸汽冷凝成介电流体液体。这样的实施例在没有显著的水输入或输出的情况下运行,因为闭环干式冷却塔不依赖于用于冷却操作的水流或汽化冷却。一些数据中心实施例利用和/或排放少于每天约10000加仑的水,或每天少于约1000加仑的水,或每天少于约100加仑的水,或每天少于约10加仑的水,或每天0加仑的水。一些数据中心实施例利用和/或排放超过每天约100加仑的水,或超过每天约1000加仑的水,或超过每天约10000加仑的水。
所公开的实施例涉及一种计算系统,包括:可操作地连接到压力控制器和/或真空源的压力受控容器,其中压力受控容器具有内部和外部,并且被配置为在内部中容纳一定氛围气;一定体积的导热、可冷凝的介电流体;用于安装计算机部件的机架,其中该机架被布置成使得当计算机部件安装在机架上时,计算机部件至少部分地沉浸在所述体积的导热介电流体中;以及冷凝结构,其中所述体积的导热介电流体、机架、计算机部件和冷凝结构被容纳在压力受控容器内。一些实施例涉及一种冷却系统,该冷却系统包括:压力受控容器,该压力受控容器包括内部,其中所述容器被配置成可操作地连接到压力控制器,以将内部压力降低到大气压力以下,其中压力受控容器被配置成包括处于液相和气相的一定体积的导热、可冷凝的介电流体;一个或更多个计算机部件,其被布置成使得一个或更多个计算机部件可以至少部分地沉浸在一定体积的导热、可冷凝的介电流体的液相中;以及冷凝器,其用于将气相介电流体冷凝成液相介电流体。
在一些实施例中,压力受控容器安装在超级结构内,刀片服务器被配置为可在不破坏计算系统的情况下是可交换的,压力受控容器可操作地连接到电源、水源和网络连接,压力受控容器包括顶部上的开口和被配置为密封地关闭该开口的盖子,所述盖子被配置成将上升的蒸汽从压力受控容器的中部引导到压力受控容器的侧部,压力受控容器具有在大约100立方英尺和大约300立方英尺之间的内部体积,和/或其中压力受控容器包含大约1∶3和大约1∶8之间的液体介电流体与气态介电流体的比值。一些实施例还包括压载块体、刀片服务器和刀片服务器机箱、机械臂和气闸,其中气闸被配置为允许进入压力受控容器的内部,而不会显著破坏压力受控容器内的氛围气,和/或净化系统,其中净化系统被配置为从导热介电流体的体积中移除污染物。在一些实施例中,净化系统被配置成从压力受控容器移除所述氛围气的一部分,从所述氛围气中冷凝任何介电流体,并抛弃任何剩余的蒸汽。在一些实施例中,净化系统被配置成冷凝气态介电流体中的至少一部分,并抛弃气态污染物。
一些实施例涉及一种用于冷却计算机部件的方法,该方法包括:提供壳体,其中该壳体容纳导热、可冷凝的介电流体和产生热的计算机部件,并且其中该壳体被配置为承受至少轻微的真空;使计算机部件运行,其中使计算机部件运行产生热量,并且其中计算机部件与介电流体接触;以及在壳体内产生真空,其中壳体内的压力至少低于约1个大气压。一些实施例还包括维持壳体内的真空,其中当计算机部件运行时,壳体内的压力低于约1个大气压,使用计算机部件产生的热量将介电流体从液体状态蒸发成气体状态,并使用冷凝器将介电流体从气体状态冷凝成液体状态,从而从介电流体中去除不容易冷凝的流体。在一些实施例中,和/或在系统运行时替换计算机部件的一部分。在某些实施例中,移除不可冷凝的流体包括:将气态氛围气的一部分与壳体内的氛围气隔离,从气体氛围气中冷凝任何介电流体;使冷凝的介电流体返回到壳体,并丢弃气态氛围气的任何剩余部分,和/或壳体被配置成产生对流。
一些实施例涉及一种冷却计算机部件的方法,包括在低于环境压力下操作计算机部件,其中计算机部件与导热的介电流体接触。一些实施例还包括在低于环境压力下蒸发介电流体和冷凝介电流体。
一些实施例涉及一种用于冷却计算机部件的方法,该方法包括:提供处于液相和气相的导热、可冷凝的介电流体;以及使计算机部件在导热、可冷凝的介电流体存在的情况下,在低于环境大气压的压力下运行,其中计算机部件至少部分地与处于液相的导热、可冷凝的介电流体接触。一些实施例还包括使用由运行的计算机部件产生的任何热量中的至少一部分将介电流体从液相蒸发到气相;将介电流体的至少一部分从气相冷凝成液相;从介电流体中移除至少一部分不容易冷凝的流体;和/或在所述计算机部件运行时替换至少一个或更多个计算机部件。
一些实施例涉及一种冷却计算机组件的方法,该方法包括:使计算机部件在低于环境压力至少1psi的压力下运行,其中计算机部件至少部分地与导热介电流体接触,并且其中,介电流体的沸点低于约80℃。一些实施例还包括在计算机部件不超过约80℃的条件下冷凝介电流体。
将会理解,各种公开的实施例可以结合到本文中以其他方式描述的一些或所有部件。可以基于每个特定实施例的属性来调整特定部件及其属性。修改可以包括使用更高或更低密度的电力、冷却和网络连接系统、压力管理系统、蒸汽管理系统以及特殊设备和部件的选择。
从前面的描述中,本领域普通技术人员可以容易地确定本公开的基必要征,并且在不脱离其精神和范围的情况下:可以进行各种改变和修改以使本公开适应各种用途和条件。上文描述的实施例意味着仅是说明性的,并且不应被视为对本公开范围的限制。
浸没冷却的过程
1.一种方法,包括:
使计算机部件至少部分沉浸在导热、可冷凝的介电流体中,其中:
计算机部件安装在机箱中,所述机箱包括用于从机架接收电力的背板;并且
所述计算机部件被配置为当所述计算机部件运行时在介电流体中散发热量;
使用冷凝器将介电流体的气相冷凝成介电流体的液相;
其中所述机架在包括压力控制器的罐内,用于降低或增加所述罐的内部压力。
2.根据实施例1所述的方法,其中所述罐具有分散在每平方英尺的空间上的至少300W的计算功率的计算功率密度。
3.根据实施例1所述的方法,还包括使用机器人从所述机架处移除所述机箱,其中所述机器人位于所述罐内。
4.根据实施例3所述的方法,还包括使用所述机器人将所述机箱递送至气闸,其中所述气闸被配置为允许进入所述罐的内部,而不会显著破坏所述罐内的压力。
5.根据实施例4所述的方法,还包括:
打开所述气闸的内门;
将所述机箱放置在所述气闸中;
关闭所述气闸的内门;
使所述气闸的压力与大气压力平衡;以及
打开气闸的外门。
6.根据实施例3所述的方法,还包括使用所述机器人将所述机箱储存在机匣中。
7.根据实施例6所述的方法,其中所述机匣位于包括支撑构件、旋转构件和轨道的平台上。
8.根据实施例3所述的方法,其中所述机器人是被配置成移除、更换或装配所述机箱的门架机器人。
9.根据实施例8所述的方法,其中所述门架机器人被配置为在水平面上移动并竖直下降。
10.根据实施例9所述的装置,其中所述机器人被配置为移除、替换或安装电力分配系统的部件。
11.根据实施例10所述的方法,其中所述机器人包括用于抓取所述机箱的抓持工具。
12.根据实施例1所述的方法,其中所述罐安装在包括多个罐的超级结构内。
13.根据实施例1所述的方法,还包括从所述介电流体中移除污染物。
14.根据实施例1所述的方法,还包括移除气态污染物。
15.根据实施例1所述的方法,还包括向所述罐提供电力、网络连接和工艺流体。
16.根据实施例1所述的方法,其中所述罐包括顶部上的开口和可移除的盖子。
17.根据实施例1所述的方法,其中所述罐包括在大约100立方英尺和大约300立方英尺之间的内部体积。
18.根据实施例1所述的方法,其中所述机箱不包括散热器和风扇。
19.根据实施例1所述的方法,其中所述机箱包括刀片服务器、处理器、电源或接口卡。
20.根据实施例19所述的装置,其中所述背板电连接到接口卡,所述接口卡是用于连接到1G或10G以太网接口的Cat6A或Cat7兼容的RJ45接口。
用于浸没冷却的容器设计和配置
1.一种装置,包括:
罐,其被配置成容纳导热、可冷凝的介电流体;
压力控制器,其用于降低或增加所述罐的内部压力;
机架,其至少部分沉浸在所述介电流体中;
冷凝器,其用于冷凝所述介电流体的气相;以及
机器人,其被配置为在所述机架内移动机箱。
2.根据实施例1所述的装置,其中所述装置包括模块化滑撬,所述模块化滑橇包括多个叉举管。
3.根据实施例1所述的装置,其中所述罐具有分散在每平方英尺的空间上的至少300W的计算功率的计算功率密度。
4.根据实施例1所述的装置,其中,所述装置的外部包括电力输入和通信输入。
5.根据实施例4所述的装置,其中:
所述电力输入和通信输入电性连接到盒体;并且
所述盒体使用多根导线将所述电力输入和通信输入分配至所述机架。
6.根据实施例5所述的装置,其中所述机架包括背板接收器,所述背板接收器被配置为向所述机箱分配电力信号和通信信号。
7.根据实施例6所述的装置,其中,所述机箱包括背板,所述背板被构造成:
从所述机架的背板接收器接收电力信号和通信信号;并且
将电力信号和通信信号分配给所述机箱内的计算机部件。
8.根据实施例5所述的装置,其中所述多个导线不包括塑料绝缘体。
9.根据实施例5所述的装置,其中所述机架包括变压器。
10.根据实施例1所述的装置,其中所述装置是可堆叠的。
11.根据实施例1所述的装置,其中所述装置包括机匣,所述机匣用于储存替换部件。
12.根据实施例11所述的装置,其中所述机器人被配置为从所述机架移除所述机箱并将所述机箱放置在所述机匣中。
13.根据实施例12所述的装置,其中所述机匣位于平台上,所述平台包括旋转构件、支撑构件和轨道。
14.根据实施例13所述的装置,其中,所述平台被配置成将所述机匣引导到所述装置的外部。
15.根据实施例1所述的装置,其中所述装置包括干燥剂,所述干燥剂被配置为从所述装置移除水蒸汽污染物。
16.根据实施例1所述的装置,还包括:
集液区域;
泵;以及
过滤器;
其中所述泵被配置成从所述集液区域移除所述介电流体,并且在将所述介电流体递送至所述罐的浴槽部分之前使所述介电流体穿过所述过滤器。
17.根据实施例1所述的装置,其中所述介电流体具有在20℃至100℃的范围内的沸点。
18.根据实施例1所述的装置,其中所述介电流体包括具有(CF3)2CFCF2OCH3、C4F9OCH3、CF3CF2CF2CF2OCH3的化学式的化学品,氢氟醚或甲氧基-九氟丁烷。
19.根据实施例1所述的装置,还包括锁,如果所述装置的盖子或门中的任何一个没有被固定,所述锁就阻止所述装置运行。
20.根据实施例1所述的设备,还包括控制器,所述控制器被配置为在未授权进入所述盖子或门的情况下使所述装置断电。
用于浸没冷却的机器人技术和自动化
1.一种装置,包括:
罐,其被配置成容纳导热、可冷凝的介电流体;
压力控制器,其用于降低或增加所述罐的内部压力;
计算机部件,其至少部分沉浸在所述介电流体中;
冷凝器,其用于冷凝所述介电流体的气相;以及
机器人,其被配置为拾取所述计算机部件。
2.根据实施例1所述的装置,还包括气闸。
3.根据实施例2所述的装置,其中所述气闸包括内门和外门。
4.根据实施例3所述的装置,其中所述气闸被配置成在所述外门打开之前接收惰性气体以净化所述介电流体的气相。
5.根据实施例3所述的装置,其中所述机器人位于所述罐的外部。
6.根据实施例3所述的装置,其中所述机器人位于所述罐内。
7.根据实施例6所述的装置,其中所述机器人被配置成从机架处移除计算机部件并将所述计算机部件递送至所述气闸。
8.根据实施例7所述的装置,其中所述机器人还被配置成:
打开所述气闸的内门;
将所述计算机部件放置在所述气闸中;
关闭所述气闸的内门;
使所述气闸的压力与大气压力平衡;以及
打开所述气闸的外门。
9.根据实施例8所述的装置,还包括位于所述罐的外部的第二机器人。
10.根据实施例9所述的装置,其中所述第二机器人被配置为当所述外门打开时从所述气闸移除所述计算机部件。
11.根据实施例9所述的装置,其中所述第二机器人被配置为将所述计算机部件放置在储存狭槽中。
12.根据实施例9所述的装置,其中所述气闸被配置成在所述外门关闭后平衡所述气闸的压力。
13.根据实施例1所述的装置,其中所述装置被配置为从位于所述装置的外部的服务器接收指令。
14.根据实施例1所述的装置,其中所述计算机部件位于示出资产标签的机箱内。
15.根据实施例14所述的装置,其中所述机器人被配置为扫描所述资产标签并将所述资产标签转发给管理系统。
16.根据实施例1所述的装置,其中,所述机器人是被配置为移除、替换或装配所述计算机部件的门架机器人。
17.根据实施例8所述的装置,其中所述门架机器人被配置为在水平和竖直地移动。
18.根据实施例1所述的装置,其中所述机器人被配置为移除、替换或安装电力分配系统的部件。
19.根据实施例10所述的装置,其中所述电力分配系统的部件是变压器或电源。
20.根据实施例1所述的装置,其中所述机器人包括用于抓持所述计算机部件的抓持工具。
用于浸没冷却的压载块体
1.一种装置,包括:
罐,包括:
浴槽部分,其用于容纳导热、可冷凝的介电流体和计算机部件;以及
搁架部分,其被配置为保持至少一个压载块体;
压力控制器,其用于降低或增加所述罐的内部压力;
冷凝器,其用于冷凝所述介电流体的气相;以及
机器人,其被配置为拾取所述计算机部件。
2.根据实施例1所述的装置,其中所述浴槽部分的底部点具有比所述搁架部分的高度更低的高度。
3.根据实施例1所述的装置,其中,所述浴槽部分被配置为使所述计算机部件至少部分沉浸在所述介电流体中。
4.根据实施例3所述的装置,其中,所述计算机部件是刀片服务器、处理器、电源或变压器。
5.根据实施例1所述的装置,其中,所述介电流体的液位足够高以覆盖所述搁架部分的至少一部分。
6.根据实施例1所述的装置,其中隔架部分紧邻冷凝器。
7.根据实施例6所述的装置,其中所述搁架部分被配置成从所述冷凝器接收冷凝的介电流体。
8.根据实施例1所述的装置,其中所述压载块体被配置为占据所述罐的搁架上方的体积,以将所述介电流体从所述搁架转移到浴槽部分上方的区域。
9.根据实施例1所述的装置,其中所述压载块体包括多个抬升件支脚,其用于允许介电流体在压载块体下方流动。
10.根据实施例1所述的装置,其中,所述压载块体不溶于所述介电流体。
11.根据实施例1所述的装置,其中所述压载块体由金属、橡胶、硅树脂或聚合物制成。
12.根据实施例1所述的装置,其中所述压载块体比所述介电流体密度大。
13.根据实施例1所述的装置,其中所述压载块体具有手柄、切割部或板件,以用于移除或替换所述压载块体。
14.根据实施例13所述的装置,其中所述机器人被配置成使用所述手柄、切割部或板件来提升所述压载块体。
15.根据实施例1所述的装置,其中所述压载块体被配置成从所述压载块体的顶侧或底侧处与另一个压载块体互锁。
16.根据实施例15所述的装置,其中所述互锁防止另一压载块体滑动。
17.根据实施例15所述的装置,其中所述另一压载块体被配置为在所述压载块体的顶侧或底侧上。
18.根据实施例15所述的装置,其中所述压载块体包括在所述压载块体的顶侧上的凹陷部分,使得另一压载块体的抬升件支脚被配置成锁定在所述压载块体的凹陷部分中的一个中。
19.根据实施例1所述的装置,其中所述压载块体被配置为横跨所述搁架部分的整个长度的至少40%。
20.根据实施例1所述的装置,其中所述压载块体具有大约2英尺长、大约8英寸宽和大约1英寸高的外部尺寸。
用于浸没冷却的服务器箱体
1.一种装置,包括:
罐,其被配置成容纳导热、可冷凝的介电流体;
压力控制器,其用于降低或增加所述罐的内部压力;
机箱,其至少部分沉浸在所述介电流体中;
冷凝器,其用于冷凝所述介电流体的气相;以及
机器人,其被配置为拾取所述机箱。
2.根据实施例1所述的装置,其中所述机箱不需要热沉或风扇。
3.根据实施例1所述的装置,其中所述机箱包括刀片服务器。
4.根据实施例1所述的装置,其中所述机箱包括处理器、电源或接口卡。
5.根据实施例19所述的装置,其中所述接口卡是用于连接到1G或10G以太网接口的Cat6A或Cat7兼容的RJ45接口。
6.根据实施例1所述的装置,其中所述机箱可移除地附接至机架。
7.根据实施例6所述的装置,其中所述机箱包括背板,以在所述机箱和所述机架之间提供插槽式接口。
8.根据实施例7所述的装置,其中所述背板被配置为在所述机箱内分配从所述机架接收的电力和信号。
9.根据实施例8所述的装置,其中所述背板被配置为经由线缆向刀片服务器传送电力和数据。
10.根据实施例1所述的装置,其中所述机箱是包括后壁和两个侧壁的基本矩形盒体,其中所述后壁具有多个开孔以便于所述机箱内的介电流体的循环。
11.根据实施例10所述的装置,其中所述机箱包括在两个侧壁中的每一个上的引导轨道。
12.根据实施例1所述的装置,其中所述机箱包括用于保持计算机部件的安装接口。
13.根据实施例1所述的装置,其中所述机箱包括板件,并且所述机器人被配置为使用所述板件提升所述机箱。
14.根据实施例1所述的装置,其中所述机箱包括微控制器。
15.根据实施例14所述的装置,其中所述微控制器被配置成:
从安装在所述机箱上的传感器接收传感器数据,所述传感器数据指示所述机箱是否正确地放置在机架中;以及
将所述传感器数据传输到管理系统。
16.根据实施例14所述的装置,其中所述微控制器被配置成:
从管理系统接收电力信号;并且
将所述电力信号传输到被配置为切断所述机箱内的电力的开关。
17.根据实施例14所述的装置,其中所述微控制器被配置成:
从安装在所述机箱内的计算机部件处接收运行数据;并且
将所述运行数据传输到所述管理系统。
18.根据实施例14的装置,其中所述微控制器被配置成控制刀片服务器的电气和通信设施。
19.根据实施例1所述的装置,其中所述机箱包括RFID标签。
20.根据实施例19所述的装置,其中所述机器人被配置为扫描所述RFID标签并将信号传输到管理系统。
使用波纹管进行浸没冷却的蒸汽管理
1.一种装置,包括:
罐,其被配置成容纳导热、可冷凝的介电流体和计算机部件;
压力控制器,其用于降低或增加所述罐的内部压力;
蒸汽管理系统,用于冷凝所述介电流体的气相;以及
机器人,其被配置为拾取所述计算机部件。
2.根据实施例1所述的装置,其中所述蒸汽管理系统包括在所述罐内的冷凝结构。
3.根据实施例2所述的装置,其中所述冷凝结构包括导热管、盘管或散热器翅片。
4.根据实施例2所述的装置,其中所述冷凝结构被配置为联接到冷却液体源,使得冷却液体穿过所述冷凝结构。
5.根据实施例2所述的装置,其中所述装置被配置成使用汽化冷却或干式冷却塔来冷冻冷却液体。
6.根据实施例2所述的装置,其中所述蒸汽管理系统包括流入管道和流出管道。
7.根据实施例6所述的装置,其中所述流入管道被配置为从冷冻的冷却液体源接收冷却液体,并且引导所述冷却液体通过冷凝结构。
8.根据实施例6所述的装置,其中所述流出管道被配置为从所述冷凝结构接收冷却液体并使所述冷却液体返回到冷冻的冷却液体源。
9.根据实施例1所述的装置,其中所述蒸汽管理系统包括用于储存介电流体的储存单元。
10.根据实施例9所述的装置,其中所述蒸汽管理系统被配置为从所述储存单元将介电流体引导到所述罐中。
11.根据实施例1所述的装置,其中所述蒸汽管理系统包括用于储存介电流体的蒸汽的蒸汽储存单元。
12.根据实施例11所述的装置,其中所述蒸汽储存单元是波纹管。
13.根据实施例12所述的装置,其中所述波纹管被配置成膨胀或收缩以维持所述罐的内部压力。
14.根据实施例12所述的装置,其中所述波纹管包括一个或更多个储袋。
15.根据实施例11所述的装置,其中所述蒸汽储存单元包括用于允许空气进入蒸汽管理系统以降低介电流体的蒸汽的温度的阀。
16.根据实施例15所述的装置,其中所述蒸汽储存单元可操作地连接到碳床,以将介电流体的蒸汽与空气分离。
17.根据实施例16所述的装置,其中所述碳床包括解吸加热器,所述解吸加热器被配置为加热所述碳床以升高所述碳床的温度。
18.根据实施例1所述的装置,其中所述蒸汽管理系统包括过滤器。
19.根据实施例17所述的装置,其中所述过滤器被构造成移除空气和水蒸汽。
20.根据实施例1所述的装置,其中所述蒸汽管理系统:
包括惰性气体储存单元;并且
被配置成在启动操作或关闭操作期间将惰性气体从所述惰性气体储存单元引入到所述罐中。