CN110955320B - 一种机架功耗管理设备、系统和方法 - Google Patents

一种机架功耗管理设备、系统和方法 Download PDF

Info

Publication number
CN110955320B
CN110955320B CN201811133150.4A CN201811133150A CN110955320B CN 110955320 B CN110955320 B CN 110955320B CN 201811133150 A CN201811133150 A CN 201811133150A CN 110955320 B CN110955320 B CN 110955320B
Authority
CN
China
Prior art keywords
power consumption
rack
consumption threshold
physical machine
attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811133150.4A
Other languages
English (en)
Other versions
CN110955320A (zh
Inventor
周宇
宋军
郑旭东
田政雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811133150.4A priority Critical patent/CN110955320B/zh
Publication of CN110955320A publication Critical patent/CN110955320A/zh
Application granted granted Critical
Publication of CN110955320B publication Critical patent/CN110955320B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/329Power saving characterised by the action undertaken by task scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种机架功耗管理方法,其基于机架的属性以及驻留在机架中的各物理机的属性,计算机架的当前功耗阈值;并基于各物理机的功耗相关特征,计算各物理机的功耗预测值,并接着计算机架的功耗阈值预测值;将当前功耗阈值和功耗阈值预测值发送给控制服务器,以便控制服务器基于当前功耗阈值和功耗阈值预测值进行各物理机的程序调度。本发明还提供了一种对应的机架功耗管理设备和相应的管理系统。

Description

一种机架功耗管理设备、系统和方法
技术领域
本发明涉及功耗管理领域,尤其涉及对驻留有诸如服务器之类的物理机的机架进行功耗管理的机架功耗管理领域。
背景技术
随着互联网的发展,出现了越来越多的云存储和云计算等以云为基础的需求。云通常需要大量的服务器资源,这些服务器资源一般构成集群。同时为了方便云存储和计算,提出了虚拟化以及虚拟机(VM)的概念。利用虚拟机,可以对计算和存储能力进行缩放,从而支持弹性计算。随着弹性计算所需要的集群越来越大,对虚拟机在集群内的调度提出了越来越高的要求。,需要一种新的机架功耗管理方案,可以提供更准确的机架功耗阈值,以便更精确地进行调度控制。同时还需要一种机架功耗管理方案,可以根据实际业务场景来改变机架的功耗阈值,从而进一步满足精确调度控制的需要。
发明内容
为此,本发明提供了一种新的数据存取处理方案,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种机架功耗管理方法。该管理方法包括步骤,基于机架的属性以及驻留在机架中的各物理机的属性,计算机架的当前功耗阈值;基于各物理机的功耗相关特征,计算各物理机的功耗预测值基于该功耗预测值,计算机架的功耗阈值预测值;以及将当前功耗阈值和功耗阈值预测值发送给控制服务器,以便控制服务器基于当前功耗阈值和功耗阈值预测值进行各物理机的程序调度。
可选地,根据本发明的管理方法还包括步骤,接收来自控制服务器的策略请求;以及基于该策略请求修改机架的属性,从而修改机架的当前功耗阈值。
可选地,在根据本发明的管理方法中,基于策略请求修改机架的属性的步骤包括:调整机架相关联变压器的功耗阈值。
可选地,在根据本发明的管理方法中,基于策略请求修改机架的属性的步骤包括:调整机架的制冷结构的局部和/或定向的制冷策略。
可选地,在根据本发明的管理方法中,机架的属性包括下列中的至少一种或者多种:拓扑结构、电器特性和制冷结构。
可选地,在根据本发明的管理方法中,各物理机的属性包括下列中的至少一种或者多种:厂商、业务模型、型号、温度、实时功耗、功耗阈值和功耗字典。
可选地,在根据本发明的管理方法中,各物理机的功耗相关特征包括下列中的至少一种或者多种:用户、CPU利用率和寄存器指令集。
根据本发明的另一个方面,还提供了一种机架功耗管理设备。该管理设备包括:采集单元,适于采集机架的属性以及驻留在机架中的各物理机的属性和功耗相关特征;控制单元,适于基于所采集机架的属性以及驻留在机架中的各物理机的属性来计算该机架的当前功耗阈值;基于各物理机的功耗相关特征,计算各物理机的功耗预测值;并基于功耗预测值,计算所述机架的功耗阈值预测值;通信单元,适于将当前功耗阈值和功耗阈值预测值发送给控制服务器,以便控制服务器基于当前功耗阈值和功耗阈值预测值进行各物理机的程序调度。
根据本发明的还有一个方面,提供了一种虚拟机管理系统,包括:机架,所述机架中驻留有物理机;如上所述的机架功耗管理设备,耦接到所述机架,适于计算机架的当前功耗阈值和功耗阈值预测值;以及控制服务器,耦接到机架和机架功耗管理设备,从功耗管理设备接收机架的当前功耗阈值和功耗阈值预测值,并基于此来管理物理机中的虚拟机。
根据本发明的还有一个方面,还提供了一种计算设备。该计算设备包括至少一个处理器和存储有程序指令的存储器,其中,程序指令被配置为适于由至少一个处理器执行并包括用于执行上述机架功耗管理方法的指令。
根据本发明的还有另一个方面,还提供了一种存储有程序指令的可读存储介质,当该程序指令被计算设备读取并执行时,使得计算设备执行上述机架功耗管理方法。
根据本发明的机架功耗管理方案,可以基于机架的属性以及驻留在机架中的各物理机的属性来计算机架的当前功耗阈值,并且可以基于各物理机的功耗相关特征,来计算机架的功耗阈值预测值,由此以这两个动态且最新的机架功耗阈值为参考指标进行调度,显著提高了调度的精确性。
另一方面,可以根据实际的应用场景,在调度期间将根据这些应用场景来修改机架的相关参数,从而改变机架的功耗阈值及其预测值,从而使得该机架更适合于实际应用场景中的调度。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的虚拟机管理系统100的示意图;
图2示出了根据本发明一个实施例的计算设备200的示意图;
图3示出了根据本发明一个实施例的机架功耗管理方法300的流程图;
图4示出了根据本发明另一个实施例的机架功耗管理方法400的流程图;以及
图5示出了根据本发明一个实施例的机架功耗管理设备500的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的虚拟机管理系统100的境示意图。如图1所示虚拟机管理系统100包括机架120、机架功耗管理设备500和控制服务器130。
虽然在图1中仅仅示出了一个机架120,但是应当理解,在实际的系统100中,存在有相当大量的机架120,并且也存在相当大量的机架功耗管理设备500。每个机架功耗管理设备500可以对一个机架120进行控制和管理,也可以对多个机架120进行控制和管理。本发明不受限于机架120和机架功耗管理设备500的数量和对应关系。
如图1所述,机架120中驻留有多台物理机122。物理机122由机架120提供电源并运行。在虚拟化的云计算和存储环境中,物理机122中通常会运行多个虚拟机(VM)。物理机122在运行过程中会产生功耗并且产生热量。一般来说,每个物理机122都有相应的厂商、型号、业务模型、额定功耗、功耗阈值和功耗字典等静态信息。这些静态信息在物理机出厂时就已经确定了,或者可以在物理机运行一段时间之后进行重新标定。功耗阈值也称为功耗水位,定义了该物理机122最高可以允许的功耗。当物理机的实时功耗超过功耗阈值时,此时物理机处于超水状态,系统会将该该物理机确定为状态异常。功耗字典定义了物理机122在一些情况如节能模式下的功耗值。
除了静态信息之外,物理机122还有一些随着运行而变化的动态属性,例如物理机的温度和实时功耗等。
以上给出了与物理机122的功耗以及功耗阈值相关的静态信息和动态属性示例,应当理解,本发明不受限于此,所有会影响物理机122的功耗以及功耗阈值的信息都在本发明的保护范围之内。
机架120可以对物理机122的运行进行控制。例如,可以对机架120上为物理机122提供电源的变压器进行功耗阈值调整,从而在物理机122的外部就调整物理机的功耗阈值。另外,机架可以调整其制冷方式,从而调整物理机122的散热状态,改变物理机的运行温度,以便调整物理机的功耗阈值。举例来说,加大机架的制冷风速,可以降低物理机的温度,并允许物理机以更大的功耗运行,提高了物理机的功耗阈值。
机架120同样有一些功耗相关的信息,例如机架的额定功耗、机架上的电表读数,机架的标称功耗阈值等。另外,机架120的拓扑结构、电器特性和制冷结构等属性也会影响机架的实际功耗阈值。
本发明同样不受限于机架120与功耗或者功耗阈值相关的属性。所有与功耗或者功耗阈值相关的属性都在本发明的保护范围之内。
机架功耗管理设备500与机架120耦接。设备500可以耦接到一个机架120,以便对机架120的功耗进行管理。在另一个实施方式中,设备500可以同时耦接到多个机架120,以便同时管理多个机架120的功耗。本发明不受限于设备500和机架120的对应关系,所以可以通过设备500对机架120的功耗进行管理的方法都在本发明的保护范围之内。
管理设备500可以获得机架120与功耗相关的属性。在一个实施例中,管理设备500可以和机架120上的各个电表进行电连接,以获得机架的电表读数。另外,机架120新加入系统100中时,可以在管理设备500中登记机架120的各种属性,如机架的额定功耗、标称功耗阈值、拓扑结构、电器特性和制冷结构等。机架120可以在其电器和制冷等结构中加入传感器和制动器。管理设备500可以通过这些传感器获得机架和功耗相关的属性值,也可以通过这些制动器来控制制冷结构和电器的运行。
另外,管理设备500还可以耦接到机架120上的各个物理机122,以各种方式获得物理机122的静态和动态信息。例如,物理机122在安装到机架120上时,将物理机122的各种静态属性值,如厂商、型号、业务模型、额定功耗、功耗阈值和功耗字典等在管理设备500中进行登记。另外,物理机122运行中的各种属性,一方面,可以通过机架上的传感器发送给管理设备500;另一方面,物理机122可以通过网络将其各种动态属性值发送给某个服务器,以方便管理设备500从这个服务器获得该物理机122的这些值。
另外,物理机122还具有一些能够用于预测该物理机未来功耗值的功耗相关特征,这些特征值通常在运行产生并且会发生改变,包括但不限于在该物理机上运行应用的用户、物理机的CPU利用率,所采用的寄存器指令集等。管理设备500同样可以各种方式从物理机122获得这些功耗相关特征。
管理设备500在采集了机架120的属性以及驻留在机架120中的各物理机122的属性和功耗相关特征之后,可以基于这些属性值来计算机架120的当前功耗阈值。和现有方案中仅仅读取机架120的固定功耗阈值不同,管理设备500可以基于机架120及其中的各物理机122的各种静态和动态属性,来计算出来一个机架的功耗阈值的当前值。这个功耗阈值的当前值可以随着机架120的动态属性改变而改变。本发明并不受限于计算功耗阈值的当前值的特定方式。在一种实施方式中,可以采集机架120的长期运行数据,并基于此来计算机架的功耗阈值。
另外,管理设备500还可以基于所获得的各物理机122的功耗相关特征,计算各物理机122的功耗预测值。在一张实施方式中,可以采集物理机的各种功耗相关特征和功耗的历史数据,并建立对应的关联关系,从而可以确定在未来一个时间的功耗预测值。
在获得各物理机122的功耗预测值之后,还可以基于该功耗预测值,计算机架120的功耗阈值预测值。由于管理设备500在计算机架的功耗阈值时就需要考虑各物理机122的当前功耗值,因此,可以相同和类似的方式,基于各物理机的功耗预测值来计算机架120的功耗阈值预测值。
管理设备500将计算得到的机架120的功耗阈值和功耗阈值预测值发送给控制服务器130。控制服务器130进行计算调度,例如在云计算和存储的环境中,进行虚拟机的调度。即根据各个机架120和机架上的物理机122的负载等情况,将虚拟机部署在某个机架120的某台物理机122上,或者将虚拟机从一个机架120中的一台物理机122迁移到另一个机架120的另一台物理机122上。控制服务器130进行虚拟机调度时,会考虑来自机架120的功耗阈值和功耗阈值预测值,例如将这些值作为一种库存资源来使用。本发明并不受限于具体的虚拟机调度方法,所有考虑了机架的当前功耗阈值和功耗预测值的调度方法都在本发明的保护范围之内。
另外,可选地,控制服务器130为了满足特定用户的需要,或者为了实现特定用户场景,还希望可以改变一些机架120的功耗阈值。具体而言,控制服务器130可以将调整机架功耗阈值的策略请求发送给管理设备500。
管理设备500基于接收到的策略请求,改变其相关联的机架120的各种功耗相关属性,从而进一步改变机架120的功耗阈值当前值和预测值,从而完成策略请求的目的。
根据一种实施方式,管理设备500可以通过机架120上的制动器来改变机架的功耗相关属性。
可选地,管理设备500可以调整机架120上的变压器的功耗阈值;或者管理设备500还可以调整机架120的制冷结构的局部和/或定向的制冷策略。利用这样的方式,机架120的功耗阈值当前值和预测值都会发生改变,从而使得机架120的功耗阈值符合控制服务器130的调度要求。
根据本发明的实施方式,机架功耗管理设备500、控制服务器130和物理机122均可以通过如下所述的计算设备200来实现。图2示出了根据本发明一个实施例的计算设备200的示意图。
如图2所示,在基本的配置202中,计算设备200典型地包括系统存储器206和一个或者多个处理器204。存储器总线208可以用于在处理器204和系统存储器206之间的通信。
取决于期望的配置,处理器204可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器204可以包括诸如一级高速缓存210和二级高速缓存212之类的一个或者多个级别的高速缓存、处理器核心214和寄存器216。示例的处理器核心214可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器218可以与处理器204一起使用,或者在一些实现中,存储器控制器218可以是处理器204的一个内部部分。
取决于期望的配置,系统存储器206可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器206可以包括操作系统220、一个或者多个应用222以及程序数据224。在一些实施方式中,应用222可以布置为在操作系统上由一个或多个处理器204利用程序数据224执行指令。
计算设备200还可以包括有助于从各种接口设备(例如,输出设备242、外设接口244和通信设备246)到基本配置202经由总线/接口控制器230的通信的接口总线240。示例的输出设备242包括图形处理单元248和音频处理单元250。它们可以被配置为有助于经由一个或者多个A/V端口252与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口244可以包括串行接口控制器254和并行接口控制器256,它们可以被配置为有助于经由一个或者多个I/O端口258和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备246可以包括网络控制器260,其可以被布置为便于经由一个或者多个通信端口264与一个或者多个其他计算设备262通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备200可以实现为服务器,例如数据库服务器、应用程序服务器和WEB服务器等,也可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。当然,计算设备200也可以实现为小尺寸便携(或者移动)电子设备的一部分。
在根据本发明的实施例中,计算设备200被实现为机架功耗管理设备500,并被配置为执行根据本发明的机架功耗管理方法300和/或400。其中,计算设备200的应用222中包含执行根据本发明的机架功耗管理方法300和/或400的多条程序指令,而程序数据224还可以存储系统100的配置信息等。
图3示出了根据本发明一个实施例的机架功耗管理方法300的流程图。方法300在上述机架功耗管理设备500中执行,如图3所示,管理方法300始于步骤S310。
在步骤S310中,获取机架的属性以及驻留在机架中的各物理机的属性。如上面参考图1所述,在机架120中的各物理机122具有相应的厂商、型号、业务模型、额定功耗、功耗阈值和功耗字典等静态信息。除了静态信息之外,物理机122还有一些随着运行而变化的动态属性,例如物理机的温度和实时功耗等。同样,机架120本身也有一些功耗相关的信息,例如机架的额定功耗、机架上的电表读数,机架的标称功耗阈值等。另外,机架120的拓扑结构、电器特性和制冷结构等属性也会影响机架的实际功耗阈值。
随后在步骤S320中,基于在步骤S310获得的机架和机架上的物理机的静态和动态属性值,计算机架的功耗阈值。由于机架和物理机在运行期间的动态属性值会随时发生改变,因此在步骤S320所计算得到的值,即机架功耗阈值的当前值,也会随时间发生改变。与单纯提供某个机架的固定功耗阈值相比,在步骤S320中所计算得到的动态功耗阈值能够更准确地反映机架的当前运行状态,并且可以为系统调度提供更精确的参考依据。
本发明并不受限于计算功耗阈值的当前值的特定方式。在一种实施方式中,可以采集机架120的长期运行数据,根据这些历史数据中的机架功耗和机架和物理机的动态和静态属性值之间关系来计算机架的功耗阈值。
随后,在步骤S330中,获取各物理机的功耗相关特征。物理机122还具有一些能够用于预测物理机未来功耗值的功耗相关特征,这些特征值通常在运行产生并且会发生改变,包括但不限于在该物理机上运行应用的用户、物理机的CPU利用率,所采用的寄存器指令集等。接着,在步骤S330中,基于所获取到的各物理机的功耗相关特征,计算各物理机的功耗预测值。可以有多种方法来计算功耗预测值。在一种实施方式中,可以收集物理机的各种功耗相关特征和功耗的历史数据,并建立对应的关联关系,从而可以确定在未来一个时间的功耗预测值。
在步骤S340中,基于步骤S330中计算得到的物理机的功耗预测值,来计算机架的功耗阈值预测值。由于在步骤S320中计算机架的功耗阈值时就需要考虑各物理机122的当前功耗值,因此,可以与步骤S320相同和类似的方式,基于各物理机的功耗预测值来计算机架120的功耗阈值预测值。
随后,在步骤S350中,将步骤S320计算得到的机架的当前功耗阈值和步骤S340所获得的机架的功耗阈值预测值发送给控制服务器130,以便控制服务器基于所述当前功耗阈值和功耗阈值预测值对该机架上各物理机进行调度。例如进行虚拟机的调度。控制服务器130进行虚拟机调度时,会考虑来自机架120的功耗阈值当前值和功耗阈值预测值,例如将这些值作为一种库存资源来使用。如果能够获得机架的动态功耗阈值信息,那么调度也会更加精确。
机架功耗管理方法300可以提供机架更准确的功耗阈值信息,从而方便对机架进行更加精确的调度控制。对于云计算和云存储这样的云服务来说,可以提高调度的精确性和调度效率。
在图4中示出了根据本发明另一个实施例的机架功耗管理方法400的示意图。图4所示的方法400是图3所示方法的进一步扩展说明。在图4中,与图3所示的方法步骤相同的步骤用相同的标号进行指示,并且不再进行赘述。
如图4所示,处理方法400还包括步骤S410。可选地,控制服务器130为了满足特定用户的需要,或者为了实现特定用户场景,还希望可以改变一些机架120的功耗阈值。为此,控制服务器130可以将调整机架功耗阈值的策略请求发送给管理设备500。因此,在步骤S410中,接收来自控制服务器130的策略请求。
随后,在步骤S420中,基于步骤S410接收到的策略请求,修改机架120的属性。由于机架120的属性发生了改变,根据后续的步骤S310到S340,机架的当前功耗阈值和预测值都被更新。控制服务器130可以通过步骤S350接收到更新后的机架功耗阈值和预测值,以实现控制服务器130的调度要求。
如上参考图1所述,在步骤S420中,可以有多种方式基于接收到的策略请求改变其相关联的机架120的各种功耗相关属性。根据一种实施方式,可以通过机架120上的制动器来改变机架的功耗相关属性。可选地,可以调整机架120上的变压器的功耗阈值;或者调整机架120的制冷结构的局部和/或定向的制冷策略。
图5示出了根据本发明一个实施例的机架功耗管理设备500的示意图。应当注意的是,图2描述一种可以实现机架功耗管理设备500的计算设备200。计算设备200是以硬件划分的方式对机架功耗管理设备500进行了描述,而图5是以功能模块划分的方式对机架功耗管理设备500进行了描述。二者描述的方式不同,但是都在本发明的保护范围之内。
如图5所示,机架功耗管理设备500包括采集单元510、存储单元520、控制单元530和通信单元540。
采集单元510采集机架120的属性以及驻留在机架120中的各物理机122的属性和功耗相关特征。如上参考图1所述,机架120和其上的物理机122有各种影响机架实际功耗阈值的静态和动态属性值。采集单元510将这些属性值存到存储单元520中。
另外,采集单元510还采集各物理机的功耗相关特征。如上参考图1所述,物理机122还具有一些能够用于预测物理机未来功耗值的功耗相关特征,这些特征值通常在运行产生并且会发生改变,包括但不限于在该物理机上运行应用的用户、物理机的CPU利用率,所采用的寄存器指令集等。采集单元510同样将这些功耗相关特征值存储到存储单元520中。
控制单元530耦接到采集单元510和存储单元520,并基于采集单元510采集的机架以及驻留在所述机架中的各物理机的静态和动态属性值来计算机架的当前功耗阈值。另外,控制单元530还基于采集单元210所采集的各物理机的功耗相关特征,计算各物理机的功耗预测值,并在所计算得到的各物理机122的功耗预测值基础上,继续计算机架120的功耗阈值预测值。控制单元530计算机架120的功耗阈值和功耗阈值预测值的具体方式在上面结合图3和4的步骤S320-S340中进行了详细描述,这里不再进行赘述。
通信单元540耦接到控制单元530,将控制单元530计算得到的机架当前功耗阈值和功耗阈值预测值发送给控制服务器130,以便控制服务器130在进行调度时进行参考。
另外,可选地,通信单元540还可以接收来自控制服务器130的策略请求,并将该策略请求发送给控制单元530。控制单元530基于该策略请求来修改机架120的属性。这样,采集单元510接收到发生了改变的机架120的属性值,导致控制单元530计算出更新后的机架120的功耗阈值和预测值,并通过通信单元540发送到控制服务器130,使得控制服务器130获得更新后的功耗阈值当前值和功耗阈值预测值进行调度,以满足期望的使用场景。
如上参考图1和4所述,控制单元530可以有多种方式基于接收到的策略请求改变其相关联的机架120的各种功耗相关属性。根据一种实施方式,可以通过机架120上的制动器来改变机架的功耗相关属性。可选地,可以调整机架120上的变压器的功耗阈值;或者调整机架120的制冷结构的局部和/或定向的制冷策略。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (12)

1.一种机架功耗管理方法,包括步骤:
基于机架的属性以及驻留在所述机架中的各物理机的属性,计算所述机架的当前功耗阈值,所述机架的属性包括下列中的至少一种或者多种:拓扑结构、电器特性和制冷结构,所述各物理机的属性包括下列中的至少一种或者多种:厂商、业务模型、型号、温度、实时功耗、功耗阈值和功耗字典;
基于所述各物理机的功耗相关特征,计算各物理机的功耗预测值,所述各物理机的功耗相关特征包括下列中的至少一种或者多种:用户、CPU利用率和寄存器指令集;
基于所述功耗预测值,计算所述机架的功耗阈值预测值;
将所述当前功耗阈值和功耗阈值预测值发送给控制服务器,以便控制服务器基于所述当前功耗阈值和功耗阈值预测值进行所述各物理机的程序调度。
2.如权利要求1所述的方法,还包括步骤:
接收来自控制服务器的策略请求;以及
基于所述策略请求修改所述机架的属性,从而修改所述机架的当前功耗阈值。
3.如权利要求2所述的方法,其中所述基于策略请求修改所述机架的属性的步骤包括:
调整所述机架相关联变压器的功耗阈值。
4.如权利要求2或者3所述的方法,其中所述基于策略请求修改所述机架的属性的步骤包括:
调整所述机架的制冷结构的局部和/或定向的制冷策略。
5.一种机架功耗管理设备,包括:
采集单元,适于采集机架的属性以及驻留在所述机架中的各物理机的属性和功耗相关特征,所述机架的属性包括下列中的至少一种或者多种:拓扑结构、电器特性和制冷结构,所述各物理机的属性包括下列中的至少一种或者多种:厂商、业务模型、型号、温度、实时功耗、功耗阈值和功耗字典,所述各物理机的功耗相关特征包括下列中的至少一种或者多种:用户、CPU利用率和寄存器指令集;
控制单元,适于基于所采集机架的属性以及驻留在所述机架中的各物理机的属性来计算所述机架的当前功耗阈值;基于所述各物理机的功耗相关特征,计算各物理机的功耗预测值;并基于所述功耗预测值,计算所述机架的功耗阈值预测值;
通信单元,适于将所述当前功耗阈值和功耗阈值预测值发送给控制服务器,以便控制服务器基于所述当前功耗阈值和功耗阈值预测值进行所述各物理机的程序调度。
6.如权利要求5所述的设备,其中所述通信单元还适于接收来自控制服务器的策略请求;以及
所述控制单元基于所述策略请求修改所述机架的属性,从而修改所述机架的当前功耗阈值。
7.如权利要求6所述的设备,其中所述控制单元适于调整所述机架相关联变压器的功耗阈值。
8.如权利要求6或者7所述的设备,其中所述控制单元适于调整所述机架的制冷结构的局部和/或定向的制冷策略。
9.一种虚拟机管理系统,包括:
机架,所述机架中驻留有物理机;
如权利要求5-8中任一个所述的机架功耗管理设备,耦接到所述机架,适于计算所述机架的当前功耗阈值和功耗阈值预测值;以及
控制服务器,耦接到所述机架和机架功耗管理设备,从所述功耗管理设备接收所述机架的当前功耗阈值和功耗阈值预测值,并基于此来管理所述物理机中的虚拟机。
10.如权利要求9所述的管理系统,其中所述控制服务器适于根据业务需求,发送策略请求给所述机架功耗管理设备;以及
所述机架功耗管理设备适于基于所述策略请求改变所述机架的属性,从而修改所述机架的当前功耗阈值。
11.一种计算设备,包括:
至少一个处理器;和
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-4中任一项所述方法的指令。
12.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-4中任一项所述的方法。
CN201811133150.4A 2018-09-27 2018-09-27 一种机架功耗管理设备、系统和方法 Active CN110955320B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811133150.4A CN110955320B (zh) 2018-09-27 2018-09-27 一种机架功耗管理设备、系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811133150.4A CN110955320B (zh) 2018-09-27 2018-09-27 一种机架功耗管理设备、系统和方法

Publications (2)

Publication Number Publication Date
CN110955320A CN110955320A (zh) 2020-04-03
CN110955320B true CN110955320B (zh) 2023-04-07

Family

ID=69967953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811133150.4A Active CN110955320B (zh) 2018-09-27 2018-09-27 一种机架功耗管理设备、系统和方法

Country Status (1)

Country Link
CN (1) CN110955320B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022048674A1 (zh) * 2020-09-07 2022-03-10 华为云计算技术有限公司 基于服务器机柜的虚拟机管理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1969248A (zh) * 2004-06-17 2007-05-23 英特尔公司 用于管理服务器的功耗的方法和装置
CN103218261A (zh) * 2013-03-12 2013-07-24 浙江大学 一种基于性能预测的虚拟机动态迁移方法
CN105975385A (zh) * 2016-04-28 2016-09-28 浪潮(北京)电子信息产业有限公司 一种基于模糊神经网络的虚拟机能耗预测方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8156490B2 (en) * 2004-05-08 2012-04-10 International Business Machines Corporation Dynamic migration of virtual machine computer programs upon satisfaction of conditions
US7412611B2 (en) * 2005-06-13 2008-08-12 Hewlett-Packard Development Company, L.P. Power management with low power processes
AU2008317006A1 (en) * 2007-10-21 2009-04-30 Citrix Systems, Inc. Systems and methods to adaptively load balance user sessions to reduce energy consumption
US8689017B2 (en) * 2009-03-12 2014-04-01 Cisco Technology, Inc. Server power manager and method for dynamically managing server power consumption
US9423854B2 (en) * 2014-03-06 2016-08-23 Dell Products, Lp System and method for server rack power management

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1969248A (zh) * 2004-06-17 2007-05-23 英特尔公司 用于管理服务器的功耗的方法和装置
CN103218261A (zh) * 2013-03-12 2013-07-24 浙江大学 一种基于性能预测的虚拟机动态迁移方法
CN105975385A (zh) * 2016-04-28 2016-09-28 浪潮(北京)电子信息产业有限公司 一种基于模糊神经网络的虚拟机能耗预测方法及系统

Also Published As

Publication number Publication date
CN110955320A (zh) 2020-04-03

Similar Documents

Publication Publication Date Title
CN110869909B (zh) 应用机器学习算法来计算健康分数以进行工作负载调度的系统和方法
US10175745B2 (en) Optimizing power consumption by dynamic workload adjustment
Bui et al. Energy efficiency for cloud computing system based on predictive optimization
US9959146B2 (en) Computing resources workload scheduling
CN106055379B (zh) 用于调度计算任务的方法和系统
CN103106043B (zh) 用于管理存储服务器的资源的方法和计算机系统
US8655610B2 (en) Virtual machine placement for minimizing total energy cost in a datacenter
US20160357610A1 (en) Techniques to allocate configurable computing resources
Song et al. An optimization-based scheme for efficient virtual machine placement
CN109669774B (zh) 硬件资源的量化方法、编排方法、装置及网络设备
US8457807B2 (en) Thermal relationships based workload planning
EP4198727A1 (en) Apparatus, articles of manufacture, and methods to partition neural networks for execution at distributed edge nodes
CN108090000A (zh) 一种获取cpu寄存器信息的方法及系统
CN112395161A (zh) 大数据中心能耗分析方法及计算设备
US8457805B2 (en) Power distribution considering cooling nodes
Zhou et al. Goldilocks: Adaptive resource provisioning in containerized data centers
CN110955320B (zh) 一种机架功耗管理设备、系统和方法
CN103399799A (zh) 云操作系统中计算物理资源节点负载评价的方法及装置
CN113918352A (zh) 一种服务资源配置方法、计算设备及存储介质
WO2018006696A1 (zh) 均衡板卡内存利用率的板卡、方法和系统
Kang et al. Dynamic virtual machine consolidation for energy efficient cloud data centers
CN110955513B (zh) 一种服务资源的调度方法及系统
Kanagaraj et al. Uniform distribution elephant herding optimization (UDEHO) based virtual machine consolidation for energy-efficient cloud data centres
US9052881B2 (en) Discovering thermal relationships in data processing environments
CN110647516A (zh) 文件副本存储方法、装置、可读存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40026981

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant