具体实施方式
将参照附图更加详细地描述本发明的优选实施方式,在附图中显示了本发明的优选实施例。然而,本发明可以以各种形式实现而不应该理解为被这里阐述的实施例所限制。相反,提供这些实施例是为了使本发明更加透彻和完整,并且,完全将本发明的范围传达给本领域的技术人员。
根据背景技术的描述,可以知道数据中心管理员很难对数据中心的众多机架的空间利用率和各个机架的总功率及需要的制冷能力有一个整体的把握,比如数据中心管理员可能会面临这样一些问题:(1)如何给一台新设备找到一个有足够空闲空间的机架来放置;(2)如果已经选定了一个机架来放置这台新设备,放入之后,这个机架的总功率是否会超负载,包括这个机架加入这台新设备之后,是否散热量太大,导致产生局部热点;(3)如果同时有多个机架都有空闲空间来放置这台新机器,放到哪个机架上更合适,即从机架空间和散热上综合考虑,放在哪个机架有利于将来进一步放置新机器以及提高整个数据中心的整体的机架空间利用率;(4)数据中心内各区域的制冷能力并不总是均匀的,例如对于机架A来说,适合放入总功率为10KW的一批设备,这个区域的制冷能力足够,不会有热点产生。而对于机架B来说,只适合放入总功率为8KW的一批设备,如果在机架B中也放入10KW的设备,热点就会产生。由此带来一个需要解决的问题:在放置新机器时,应该如何考虑和充分利用机架制冷能力的不均衡这个问题。
本发明提出了一种事前管理和提高机架空间利用率的方法和系统,通过使用本发明的方法和系统,在数据中心的规划阶段,在新设备的放置阶段,或者在已有设备的重定位阶段,例如把已有设备挪动一个机架位置的阶段,能够帮助数据中心的管理员找到放置设备的优选的机架位置,从而提高数据中心内的各个机架的空间利用率,并且各个机架上的设备总功率均符合这个机架所配备的制冷能力,避免热点的产生。而且,本发明的方法和系统也可以用于监控和分析现有机架在空间利用率和散热能力上存在的风险。
对于一个机架而言,当该机架的空间利用率高时,很可能其机架功率密度也非常高,造成局部热点,从而使空调不能达到预定的制冷效果。本发明考虑在尽可能提高机架空间利用率的同时,减少局部热点产生的可能性,从而使数据中心在规划、设计过程中效率更高,风险更小。
图1示出了本发明的一种在数据中心中为设备确定安装机架的方法流程,该方法包括:
在步骤S101,获取该设备的物理尺寸和功率;
在步骤S102,根据该设备的物理尺寸和功率,判断将该设备加入到数据中心内的机架中后,该机架的机架空间、机架总功率和机架单位功率密度是否满足预设要求;
在步骤S103,选择满足预设要求的机架为安装机架。
图1所述的方法可以帮助数据中心的管理员设计数据中心的设备安放,包括确定放置一台新设备的位置和调整一台现有设备的位置。
首先,对于步骤S101,设备的物理尺寸可以是1U或者是其它任何可以用于度量一台设备的度量单位,例如长度,宽度,高度,面积,体积的单位,比如平方英尺,平方米,立方米,厘米等等。以下以1U为例,服务器中的U是指服务器占用的物理空间单位,是指服务器的的物理尺寸,1U=4.445厘米。设备的功率,包括很多种,可以获得的功率包括:额定功率、实际运行时平均功率以及实际运行时最大攻率。额定功率也称为铭牌功率,是该设备在出厂时由厂家经试验在产品标签或者说明书中给出的功率,通常比设备的实际使用功率要大的多;实际运行时平均功率指该设备在使用过程中的实际功率;实际运行时最大功率为该设备在使用过程中的瞬时最大功率。本发明中,优选使用实际运行时平均功率或者实际运行时最大功率来进行后续的分析。对于一台已有的设备,可以从系统的历史监控数据中获得该参数;对于一台新设备,可以通过在系统的历史监控数据中,搜索同型号同配置的设备来获得该参数;对于一台新设备,如果本数据中心从来没有使用过这样的同类设备,则可以先使用额定功率来进行后续分析,当设备运行一段时间之后,取得了相应的监控数据,再用实际的运行的监控数据中获得的实际运行时平均功率和实际运行时最大功率来重新分析,以求得更精确的结果。
具体对于图1中的步骤102,其核心在于判断将该设备加入到数据中心内的机架中后,该机架的机架空间、机架总功率和机架单位功率密度是否满足预设要求,至于先判断哪一个参数,是先判断机架空间还是先判断机架总功率,或者是机架单位功率密度是没有关系的。因此有多种实施方式。图2示意性地示出了图1中步骤S102的一种实施方式的流程。该流程中包括:
在步骤S201,获得数据中心中的机架列表;
在步骤S202,选择上述机架列表中的一个待判断机架;
在步骤S203,判断该机架的机架空间是否满足预设要求,如果该机架的机架空间不满足要求,返回步骤S202;判断机架的机架空间是否满足要求可以采用现有技术进行判断,也就是判断该机架的空闲空间是否足以安装该设备,例如,如果机架空间还剩1U,而该设备的高度为2U,则机架的空闲空间不满足要求。优选地,在对于机架空间的预设要求中,可以要求在机架列表中选择当前空间利用率最高的机架。选择当前空间利用率最高的机架来放置新的机器,有利于进一步提高机架的空间利用率。例如,某第一机架共有42U,已经使用30U,而第二机架共有42U,已经使用20U,则第一机架的空间利用率更高,更应优先选择。当然,关于空间的预设要求还要和机架总功率的预设要求以及机架单位功率密度的预设要求相结合考虑。其它的关于机架空间的预设要求例如:数据中心内划分了不同的区域,如果该设备只想放入指定的区域,可以在机架空间的预设要求进行限定,或者只把该区域的机架放入机架列表中。另外,如果数据中心内某区域的制冷能力存在富余,想优选将这台设备放入该区域,可以在机架空间的预设要求进行限定,或者只把该区域的机架放入候选机架列表中。
在步骤S204,判断该机架的机架总功率是否满足预设要求,如果该机架的机架总功率不满足预设要求,返回步骤S202。机架总功率的预设要求包括:机架内所有设备的总功率不能超过该机架的最大可允许总功率。机架的最大可允许总功率是由该机架的供电负载,所属供电线路的供电负载以及空调能够为该机架提供的制冷能力来限制的。在已有的技术中,主要关注于供电负载限制的功率,而没有关注到由机架的制冷能力限制的功率。每个机架,除了受供电负载的制约之外,还受其制冷能力的制约,其可以安放的设备总功率不能超过一定的值,否则制冷不能满足散热的要求,会形成热点。可以预先估算数据中心内每一个机架的最大可允许总功率。机架的最大可允许总功率由供电负载和机架制冷能力两个因素的制约。优选地可以取两个因素制约的最大可允许总功率的最小值作为该机架的最大可允许总功率。其中供电负载的上限是确定的,无需估算,而估算由机架的制冷能力限制的最大可允许总功率则需要一定的方法和工具。机架的制冷能力限制的功率估算方法有多种,这里简单介绍几种:(1)根据数据中心规划和实施的各个区域的制冷能力来估算;(2)根据历史监控数据,包括各机架的实际运行总功率及各机架附近的温度来估算;(3)根据IBM MMT移动测量技术测量的各个机架冷通道进风口的出风地板数量,出风量,气压,计算流体力学CFD(Computational Fluid Dynamics)模拟结果来估算等等。
在步骤S205,判断该机架的机架单位功率密度是否满足预设要求,如果该机架的机架单位功率密度不满足预设要求,返回步骤S202。机架单位功率密度为机架内部单位高度的设备的功率,也即机架内部单位高度的设备的耗电量。由于设备的高度通常用U来表示,一台设备的单位功率密度等于该设备的总功率除以该设备的高度(多少个U),将该概念推广,一个机架的单位功率密度等于该机架内的所有设备的总功率除以该机架已经被使用的U数,例如,一个机架内部容纳了8U的设备,这些设备的总功率为16千瓦,则该机架的机架功率密度为2千瓦/U;某块数据中心区域的单位功率密度等于该区域内所有设备的总功率除以这些设备的高度之和(多少个U);整个数据中心的单位功率密度等于数据中心内所有设备的总功率除以这些设备的高度之和(多少U),例如,一个数据中心有3个机架,每个机架上分别消耗5千瓦,6千瓦和7千瓦,每个机架上的设备高度为6U,则该数据中心的功率密度为1千瓦/U。
机架单位功率密度的预设要求可以是:使选中的机架加入该设备后的单位功率密度趋近于整个数据中心的单位功率密度,或趋近于某块制冷区域的单位功率密度,或趋近于某个特殊指定的值,例如,该值可以有数据中心的系统管理员指定。对于趋近于某个特殊指定的值,是指如果选中的机架使用了特殊的制冷方法,比如使用了水冷背板技术,可以容纳更高的总功率,就可以在机架单位功率密度的预设要求中让这个机架的加入该设备后的单位功率密度趋近一个特定的值,而不是趋近于整个数据中心的单位功率密度或指定的某数据中心区域的单位功率密度。这样可以处理机架之间制冷能力不均衡的问题。因此,这里将上述三个单位功率密度值统称为单位功率密度预设值。在一种实施方式中,机架的单位功率密度的预设要求还可以为如下之一:
(1)该设备的单位功率密度大于单位功率密度预设值,并且选择的机架的单位功率密度小于单位功率密度预设值。这种情况认为该机架满足机架单位功率密度的预设要求。因为将该设备放入该机架之后,可以提升该机架的单位功率密度,使之趋近于单位功率密度预设值。
(2)该设备的单位功率密度小于单位功率密度预设值,并且选择的机架的单位功率密度大于单位功率密度预设值。这种情况认为认为该机架满足机架单位功率密度的预设要求。因为将该设备放入该机架之后,可以降低该机架的单位功率密度,使之趋近于单位功率密度预设值。
而另外一些情形,则认为该机架不满足机架单位功率密度的预设要求,例如:如果该设备的单位功率密度大于单位功率密度预设值,并且选择的机架的单位功率密度也要大于单位功率密度预设值,则认为该机架不满足机架单位功率密度的预设要求;或者如果该设备的单位功率密度小于单位功率密度预设值,并且选择的机架的单位功率密度也要小于单位功率密度预设值,则认为该机架不满足机架单位功率密度的预设要求等等。
图2中,步骤S203、S204、以及S205的顺序可以任意调换。
图3示意性地示出了另外一种图1中的步骤102的优选实施方式流程,根据图3,该流程包括:
在步骤S301,把数据中心内的可用机架按其空间利用率排序,形成一个候选机架列表;例如,这里可以按其空间利用率从高到低排序,也可以按其空间利用率从低到高排序,等等。
在步骤S302,在候选机架列表中选择当前空间利用率最高的机架;
在步骤S303,判断选择机架的机架空间是否满足预设要求,如果该机架的机架空间不满足要求,在步骤S304,从候选机架列表中删除该机架,返回步骤S302;
在步骤S305,判断选择机架的机架总功率是否满足预设要求,如果该机架的机架总功率不满足预设要求,在步骤S304,从候选机架列表中删除该机架,返回步骤S302。
在步骤S306,判断选择机架的机架单位功率密度是否满足预设要求,如果该机架的机架单位功率密度不满足预设要求,在步骤S304,从候选机架列表中删除该机架,返回步骤S302。
图3中步骤S303、S305、以及S306的顺序可以任意调换,并且具体的判断机架的机架空间、机架总功率和机架单位功率密度是否满足预设要求与图2中的判断方法是一样的,这里不再重复。
图2和图3的结合还可以生成该方法的各种变种,例如首先筛除空闲空间不足的机架,将剩余的机架形成候选机架,然后逐一判断机架总功率以及机架单位功率密度是否满足预设要求;或者首先使用机架总功率或者机架单位功率密度进行筛选等等,所有这些变种都在本发明的保护范围之内。
在同一个发明构思下,本发明还公开了一种在数据中心中评估一设备安装在当前机架中是否存在风险的方法流程,该方法如图4所示,包括:
在步骤S401,获取该设备的物理尺寸和功率。
在步骤S402,根据该设备的物理尺寸和功率,判断该设备在当前机架中机架总功率和机架单位功率密度是否满足预设要求;
在步骤S403,如果机架总功率或者机架单位功率密度任意一项不满足预设要求,则评估该设备安装在当前机架中存在风险。
具体的判别方法和图2中的判别方法是一样的,这里不再重复。当发现某一设备的放置位置存在风险时,可以自动指出某台已有的设备需要重新放置到一个新的机架位置,并使用图1所述的方法获得该新的合适位置,提示给数据中心的管理员。
同一个发明构思下,本发明还公开了一种在数据中心中为设备确定安装机架的系统500,系统框图如图5所示,该系统包括:获取装置501,用于获取该设备的物理尺寸和功率;判断装置502,用于根据该设备的物理尺寸和功率,判断将该设备加入到数据中心内的机架中后,该机架的机架空间、机架总功率和机架单位功率密度是否满足预设要求;以及选择装置503,用于选择满足预设要求的机架为安装机架。
图5所示的系统中,该设备的功率为该设备的额定功率,或者是实际运行时平均功率,或者是实际运行时最大功率。设备的实际运行时平均功率和实际运行时最大功率可以从历史监控数据中获得,也可以在历史监控数据中,搜索同型号同配置的设备来获得,如果上述方案都不能获得,还可以先使用额定功率,当设备运行一段时间之后,取得了相应的监控数据,再从监控数据中获得实际运行时平均功率和实际运行时最大功率。
图5所示的系统中,判断装置只要判断该机架的机架空间、机架总功率和机架单位功率密度是否满足预设要求,至于先判断哪一个参数,是先判断机架空间还是先判断机架总功率,或者是机架单位功率密度是没有关系的。因此有多种实施方式。
在一种优选的实施方式中,图5的判断装置502包括(图5未示出):机架列表获得装置,用于获得数据中心中的机架列表;机架选择装置,用于选择机架列表中的一个待判断机架;机架空间判断装置,用于判断选择的机架的机架空间是否满足预设要求;机架总功率判断装置,用于判断选择的机架的机架总功率是否满足预设要求;机架单位功率密度判断装置,用于判断选择的机架的机架单位功率密度是否满足预设要求;其中,如果选择的机架的空闲空间、机架总功率、或者机架单位功率密度之一不满足预设要求,机架选择装置重新选择机架列表中的一个待判断机架,机架空间判断装置、机架空间判断装置和机架总功率判断装置分别判断重新选择的机架是否满足预设要求。
在另一种优选的实施方式中,图5的判断装置502包括(图5未示出):候选机架列表形成装置,用于把数据中心内的可用机架按空间利用率排序,形成一个候选机架列表;机架选择装置,用于在候选机架列表中选择当前空间利用率最高的机架;机架空间判断装置,用于判断选择的机架的机架空间是否满足预设要求;机架总功率判断装置,用于判断选择的机架的机架总功率是否满足预设要求;机架单位功率密度判断装置,用于判断选择的机架的机架单位功率密度是否满足预设要求;其中,如果选择的机架的机架空间、机架总功率、或者机架单位功率密度之一不满足预设要求,候选机架列表形成装置从候选机架列表中删除该机架,机架选择装置在候选机架列表中重新选择当前空间利用率最高的机架,机架空间判断装置、机架空间判断装置和机架总功率判断装置分别判断重新选择的机架是否满足预设要求。
在一种实施方式中,机架总功率的预设要求包括:机架内所有设备的总功率不能超过该机架的最大可允许总功率,机架的最大可允许总功率为由机架供电负载限制的功率和机架制冷能力限制的功率二者的最小值。机架制冷能力限制的功率可以通过估算获得,例如根据数据中心规划和实施的各个区域的制冷能力来估算;或者根据历史监控数据,包括各机架的实际运行总功率及各机架附近的温度来估算;甚至还可以根据IBM移动测量技术测量的各个机架冷通道进风口的出风地板数量,出风量,气压,计算流体力学模拟结果来估算。
在一种实施方式中,机架的单位功率密度的预设要求可以为:加入该设备后的机架的单位功率密度趋近于单位功率密度预设值,所述单位功率密度预设值可以为整个数据中心的单位功率密度;或者为某块制冷区域的单位功率密度;还可以为指定的值。
在一种实施方式中,机架的单位功率密度的预设要求可以为如下之一(1)该设备的单位功率密度大于单位功率密度预设置,并且选择的机架的单位功率密度小于单位功率密度预设置;(2)该设备的单位功率密度小于单位功率密度预设置,并且选择的机架的单位功率密度大于单位功率密度预设置。而另外一些情形,例如如果该设备的单位功率密度大于单位功率密度预设置,并且选择的机架的单位功率密度也要大于单位功率密度预设置,则认为该机架不满足机架单位功率密度的预设要求;或者如果该设备的单位功率密度小于单位功率密度预设置,并且选择的机架的单位功率密度也要小于单位功率密度预设置,也认为该机架不满足机架单位功率密度的预设要求,等等。
同一个发明构思下,本发明还公开了一种在数据中心中评估一设备安装在当前机架中是否存在风险的系统600,系统框图如图6所示,该系统包括:获取装置601,用于获取该设备的物理尺寸和功率;判断装置602,用于根据该设备的物理尺寸和功率,判断该设备在当前机架中机架总功率和机架单位功率密度是否满足预设要求;以及评估装置603,用于如果机架总功率或者机架单位功率密度任意一项不满足预设要求,则评估该设备安装在当前机架中存在风险。
虽然这里参照附图描述了本发明的示例性实施例,但是应该理解本发明不限于这些精确的实施例,并且在不背离本发明的范围和宗旨的情况下,本领域普通技术人员能对实施例进行各种变化的修改。所有这些变化和修改意欲包含在所附权利要求中限定的本发明的范围中。
并且根据上述描述,所属技术领域的技术人员知道,本发明可以体现为装置、方法或计算机程序产品。因此,本发明可以具体实现为以下形式,即,可以是完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、或者本文一般称为“电路”、“模块”或“系统”的软件部分与硬件部分的组合。此外,本发明还可以采取体现在任何有形的表达介质(medium ofexpression)中的计算机程序产品的形式,该介质中包含计算机可用的程序码。
可以使用一个或多个计算机可用的或计算机可读的介质的任何组合。计算机可用的或计算机可读的介质例如可以是——但不限于——电的、磁的、光的、电磁的、红外线的、或半导体的系统、装置、器件或传播介质。计算机可读介质的更具体的例子(非穷举的列表)包括以下:有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、诸如支持因特网或内部网的传输介质、或者磁存储器件。注意计算机可用的或计算机可读的介质甚至可以是上面印有程序的纸张或者其它合适的介质,这是因为,例如可以通过电扫描这种纸张或其它介质,以电子方式获得程序,然后以适当的方式加以编译、解释或处理,并且必要的话在计算机存储器中存储。在本文件的语境中,计算机可用的或计算机可读的介质可以是任何含有、存储、传达、传播、或传输供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的介质。计算机可用的介质可包括在基带中或者作为载波一部分传播的、由其体现计算机可用的程序码的数据信号。计算机可用的程序码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等。
用于执行本发明的操作的计算机程序码,可以以一种或多种程序设计语言的任何组合来编写,所述程序设计语言包括面向对象的程序设计语言——诸如Java、Smalltalk、C++之类,还包括常规的过程式程序设计语言——诸如”C”程序设计语言或类似的程序设计语言。程序码可以完全地在用户的计算上执行、部分地在用户的计算机上执行、作为一个独立的软件包执行、部分在用户的计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户的计算机,或者,可以(例如利用因特网服务提供商来通过因特网)连接到外部计算机。
此外,本发明的流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得通过计算机或其它可编程数据处理装置执行的这些指令,产生实现流程图和/或框图中的方框中规定的功能/操作的装置(means)。
也可以把这些计算机程序指令存储在能指令计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令产生一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instruction means)的制造品,
也可以把计算机程序指令加载到计算机或其它可编程数据处理装置上,使得在计算机或其它可编程数据处理装置上执行一系列操作步骤,以产生计算机实现的过程,从而在计算机或其它可编程装置上执行的指令就提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。