CN116830125A - 计算系统的功率容量规划 - Google Patents
计算系统的功率容量规划 Download PDFInfo
- Publication number
- CN116830125A CN116830125A CN202180083145.0A CN202180083145A CN116830125A CN 116830125 A CN116830125 A CN 116830125A CN 202180083145 A CN202180083145 A CN 202180083145A CN 116830125 A CN116830125 A CN 116830125A
- Authority
- CN
- China
- Prior art keywords
- power
- computing system
- activity
- evolution
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000694 effects Effects 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 30
- 238000010801 machine learning Methods 0.000 claims abstract description 29
- 238000011156 evaluation Methods 0.000 claims description 7
- 230000000737 periodic effect Effects 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 208000015778 Undifferentiated pleomorphic sarcoma Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000004402 ultra-violet photoelectron spectroscopy Methods 0.000 description 2
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/28—Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
- G06F11/3062—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
- G06F11/3419—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
- G06F11/3433—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3442—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for planning or managing the needed capacity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/865—Monitoring of software
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种用于计算系统的功率容量规划的计算机实现的方法,其中该方法包括以下步骤:a)评估(S10)该计算系统的活动,其中该活动包括由该计算系统执行的程序实例的数量和由所执行的程序实例引起的负载;b)通过使用被配置用于活动演进预测的第一机器学习算法(10),基于所评估的活动来预测(S12)该活动的演进;c)基于所预测的活动演进并且通过使用被配置用于该计算系统的功耗预测的第二机器学习算法(12),预测(S14)该计算系统的功耗作为第一功率度量;d)基于所预测的功耗并且通过使用被配置用于不间断电源自主性预测的第三机器学习算法(12')以及接收该计算系统的该功耗预测作为输入,预测(S16)该计算系统的一个或多个不间断电源的自主性作为第二功率度量;e)基于所预测的功耗和该计算系统的功率架构,预测(S18)该计算系统的冗余水平作为第三功率度量;f)通过处理该第一、第二和第三功率度量来生成(S20)与功率容量规划相关的输出数据。
Description
技术领域
本说明书涉及可在数据中心中采用的计算系统的功率设备(诸如UPS或ePDU)的功率容量规划,并且本说明书特别涉及预测功率度量并且基于一个或多个用户定义场景来计算所预测的功率度量的演进以用于计算系统的功率容量规划。
背景技术
通常的数据中心包括具有一个或多个房间的建筑物或一组建筑物。此类数据中心中的每个房间通常包含一个或多个行,其中可以布置一个或多个机架,该一个或多个机架包含IT(信息技术)系统装备,诸如物理服务器(PS)或服务器计算机。该IT系统装备通常由包括功率设备如(但不限于)电子配电单元(ePDU)或不间断电源(UPS)或它们的组合的功率装备供电。
计算系统的示例是包括由两个或更多个PS托管的若干虚拟机(VM)的虚拟系统。此类虚拟系统可以例如应用于具有托管该VM的PS的数据中心中。典型地,每个PS托管一个管理程序。每个管理程序托管一个或若干VM。
数据中心中应用的计算系统(诸如前面提到的虚拟系统)的功率容量规划通常基于计算系统的PS的最大功耗的固定降额值。例如,在10个PS的情况下,每个PS包括两个各自最大500瓦的电源单元。60%的降额导致6000瓦功耗的降额值。
当来自VMware公司的软件VMware vRealize操作管理器7用于规划虚拟系统时,计算机和存储度量可被考虑用于容量规划,然而这导致仅计算和仅存储容量规划。
GB1919009.9涉及计算系统的功率管理,该计算系统可在数据中心中采用,并且特别涉及管理该计算系统上的动作,特别涉及应对功率事件或应对电网不稳定而特别通过“需求响应”机制要执行的动作。GB1919009.9中描述的功率管理提供了一种预测这些动作对计算系统的功耗的影响的方法。
JP2011160596A涉及一种电源系统,其包括由服务器表示的IT设备和向IT设备供电的电源设备。控制操作电源单元的数量以使得根据在多个操作服务器中流动的负载电流,电源设备的馈电效率变为最大,并且不间断电源布置在每个电源单元的输出侧。此外,通过利用作业信息或测量功耗来控制操作电源单元的数量。即使预测失败,通过由来自安装在电源单元的每个输出处的不间断电源的功率馈送来补偿不足的电流以维持服务器装置和其他设备的稳定操作,避免了馈电总线中的功率的瞬时中断。
发明内容
本说明书描述了用于计算系统的功率容量规划的计算机实现的方法和计算机实现的系统,该计算系统可在数据中心中采用。
根据本说明书的一个方面,提供了一种用于计算系统的功率容量规划的计算机实现的方法,其中该方法包括以下步骤:
a)评估该计算系统的活动,其中该活动包括由该计算系统执行的程序实例的数量和由所执行的程序实例引起的负载;
b)通过使用被配置用于活动演进预测的第一机器学习算法,基于所评估的活动来预测该活动的演进;
c)基于所预测的活动演进并且通过使用被配置用于该计算系统的功耗预测的第二机器学习算法,预测该计算系统的功耗作为第一功率度量;
d)基于所预测的功耗并且通过使用被配置用于不间断电源自主性预测的第三机器学习算法以及接收该计算系统的该功耗预测作为输入,预测该计算系统的一个或多个不间断电源的自主性作为第二功率度量;
e)基于所预测的功耗和该计算系统的功率架构,预测该计算系统的冗余水平作为第三功率度量;
f)通过处理该第一、第二和第三功率度量来生成与功率容量规划相关的输出数据。
该程序实例可包括虚拟机和/或容器并且该计算系统的活动的该评估可包括以下中的至少一者:确定由该计算系统执行的虚拟机的数量;确定由该计算系统执行的容器的数量;确定由该计算系统执行的虚拟机和/或容器的数量的演进模式;确定每个虚拟机和/或容器的该处理负载和/或存储负载的演进模式。
该活动的演进的该预测可包括通过该第一机器学习算法根据所确定的虚拟机和/或容器的数量、根据所确定的虚拟机和/或容器的该数量的演进模式、和/或根据所确定的每个虚拟机和/或容器的该处理负载和/或存储负载的演进模式来预测虚拟机和/或容器的该数量的演进和/或该处理负载和/或存储负载的演进。
用于该计算系统的功耗的该预测的该第二机器学习算法可基于该计算系统的执行该程序实例的物理服务器的功耗,和/或用于该计算系统的一个或多个不间断电源的自主性的该预测的该第三机器学习算法可包括不间断电源自主性模型。
该计算系统的冗余水平的该预测可包括从功率管理器程序接收关于该功率架构的数据,该功率管理器程序被配置为管理该计算系统的该功率要求。
与功率容量规划相关的输出数据的该生成可包括生成用于在用户界面上显示该第一、第二和第三功率度量(特别是该第一、第二和第三功率度量的时间演进)的数据。
该方法还可包括生成用于在该用户界面上显示与该第一、第二和第三功率度量相关的警告的数据。
该方法还可进一步包括接收与该功率容量规划相关的用户定义场景,基于所接收的用户定义场景来执行该预测动作c)-e)以获得所接收的用户定义场景的该第一、第二和第三功率度量,以及通过处理所接收的用户定义场景的该第一、第二和第三功率度量来生成与功率容量规划相关的输出数据。
本说明书的另一方面涉及一种用于计算系统的功率容量规划的计算机实现的系统,其中该系统特别地被配置用于执行根据任一前述权利要求该的方法,并且其中该系统包括
评估模块,该评估模块被配置用于评估该计算系统的活动,其中该活动包括由该计算系统执行的程序实例的数量和由所执行的程序实例引起的负载;
第一预测模块,该第一预测模块被配置用于通过使用被配置用于活动演进预测的第一机器学习算法,基于所评估的活动来预测该活动的演进;
第二预测模块,该第二预测模块被配置用于基于所预测的活动演进并且通过使用被配置用于该计算系统的功耗预测的第二机器学习算法,预测该计算系统的功耗作为第一功率度量,并且被配置用于基于所预测的功耗并且通过使用被配置用于不间断电源自主性预测的第三机器学习算法以及接收该计算系统的该功耗预测作为输入,预测该计算系统的一个或多个不间断电源的自主性作为第二功率度量;
第三预测模块,该第三预测模块被配置用于基于所预测的功耗和该计算系统的功率架构,预测该计算系统的冗余水平作为第三功率度量;和
输出数据生成模块,该输出数据生成模块被配置用于通过处理该第一、第二和第三功率度量来生成与功率容量规划相关的输出数据。
本说明书的又一方面涉及存储软件的非暂态计算机可读存储设备,该软件包括可由计算设备的处理器执行的指令,该指令在此类执行时使计算设备执行本说明书中公开的方法。
下文在附图和说明书中阐述一个或多个实施方案的细节。根据说明书和附图,并且根据权利要求,其他特征和优点将是显而易见的。
附图说明
图1A和图1B示出了用于计算系统的功率容量规划的方法的示例;
图2示出了用于计算系统的功率容量规划的系统的示例;
图3示出了通过用于计算系统的功率容量规划的方法针对三个不同的用户定义场景生成的输出数据的表示的示例。
具体实施方式
在下文中,功能上类似或相同的元件可以具有相同的附图标记。绝对值在下文仅通过示例示出,而不应该被解释为限制性的。
本文使用的术语“虚拟机”-VM描述了特定计算机系统的仿真。VM在本发明的上下文中是具有操作系统的计算机程序的特殊情况。该解决方案也适用于还被称为“容器”的“轻质”VM。VM和容器可被认为是封装计算环境,其组合不同的IT部件并且将它们与底层系统(特别是在其上执行VM或容器的计算系统)隔离。本文中使用的术语“物理服务器”-PS描述了包括物理计算机的实体。PS可以包括管理程序软件,其将物理计算机配置为托管一个或多个虚拟机。PS在本发明的上下文中是计算设备的特殊情况。在本文中使用的术语“虚拟系统”表示包括两个或更多个PS的系统,每个PS托管至少一个VM。如本文所使用的术语“计算系统”通常描述包括如例如在数据中心中采用的软件和硬件的系统。虚拟系统在本发明的上下文中是计算系统的特殊情况。计算系统可包括一个或多个虚拟系统。
本说明书涉及可在数据中心中采用的计算系统的功率容量规划,并且本说明书特别涉及预测功率度量并且基于一个或多个用户定义场景来计算所预测的功率度量的演进以用于计算系统的功率容量规划。此外,在本文中描述的方法和系统可允许数据中心管理器根据用户定义场景来预测数据中心功率度量,例如将10个服务器和100个VM添加到现有数据中心计算系统中。因此,在本文中描述的方法和系统可允许数据中心管理器执行数据中心中的功率容量规划。
在本文中描述的方法和系统可使用GB1919009.9中描述的特征中的一些,该文献通过引用并入本文并且描述如何使用机器学习来特别地预测计算系统(诸如虚拟系统)中的VM级功耗。GB1919009.9中描述的机器学习算法可应用于本文描述的方法和系统中的至少一些。特别地,来自GB1919009.9的方法和系统可被扩展至根据本说明书预测功率容量度量,其然后可由如在本文中描述的方法和系统使用。
被设置用于数据中心中的容量规划的现有软件(诸如来自VMware公司的VMwarevRealize操作管理器7)仅基于计算和存储度量来执行数据中心中的容量规划。本说明书提出将功率容量规划也扩展到诸如以下的一个或多个功率度量:
-功耗,其意味着每单位时间的电能并且被供应以操作诸如计算系统的部件(特别是PS)的某物。
-UPS自主性,其意味着UPS可在功率故障的情况下持续的时间段。该值取决于由UPS供应的计算系统的负载水平。
-冗余水平(N、N+1、2N、…),其意味着在数据中心中复制计算系统的一个或多个关键部件以增加系统的可靠性。该冗余水平可取决于计算系统的负载水平。
功率度量预测可特别地基于:
-IT和功率数据采集(VM资源消耗、PS消耗…)。
-用于数据中心功耗预测的人工智能模型。
在本文中描述的方法和系统可特别地以下面方式解决客户问题:
-基于“数据中心IT负载趋势”,可估计三个关键度量何时处于预定义警告或临界阈值下。
-基于“数据中心IT负载趋势”和特定IT负载增加”,可估计三个关键度量何时处于特定警告或临界阈值下。
图1A和图1B示出了通过用于计算系统的功率容量规划的方法执行的动作:
执行以下项目a)和b)以用于获得关于计算系统中的活动水平的数据:
a)在S10中,评估计算系统的活动。计算系统由例如通过用于规划数据中心中的计算系统的程序提供的数据表示。关于计算系统的数据可特别地包括关于VM和/或容器的数量的信息。所评估的活动包括由计算系统执行的程序实例(特别是在PS上执行的VM和容器)的数量,以及由所执行的程序实例引起的负载。评估特别地包括确定VM和/或容器的数量的演进模式,例如数量持续增长、为平坦、减少、以白天/夜晚级别为周期性、以周末级别为周期性、以特定年度事件为周期性(例如,黑五、圣诞节、世界足球杯……)。此外,评估特别地包括针对每个VM和/或容器确定处理负载(CPU负载)和/或存储负载的演进模式,例如相应的负载持续增长、为平坦、减少、以白天/夜晚级别为周期性、以周末级别为周期性、以特定年度事件为周期性(例如,黑五、圣诞节、世界足球杯……)。
b)在S12中,基于所评估的活动来预测活动的演进。对于预测,应用专用机器学习算法10,其被配置用于活动演进预测。机器学习算法10接收所评估的活动作为输入数据并且输出活动的演进的预测,特别是VM和/或容器数量的演进和/或处理和/或存储负载的演进(特别是在单独水平和全局水平)。
对于功率度量和容量规划执行以下项目c)到f):
c)在S14中,基于预测的活动演进(项目b))并且通过使用被构造用于计算系统的功耗预测的另一专用机器学习算法12,预测计算系统的功耗作为第一功率度量(预测的功耗)。机器学习算法12可以是例如GB1919009.9中描述的算法。
d)在S16中,基于所预测的功耗并且通过使用又一专用机器学习算法12',预测为计算系统供电的一个或多个UPS的自主性作为第二功率度量(预测的UPS自主性),该又一专用机器学习算法被配置为接收计算系统的功耗预测作为输入并且例如为GB1919009.9中描述的算法。特别地,机器学习算法12'可包括用于预测计算系统的UPS的自主性的UPS自主性模型。
e)在S18中,基于预测的功耗和计算系统的功率架构,预测计算系统的冗余水平作为第三功率度量(预测的冗余水平)。可例如从被配置为管理计算系统的功率要求的程序管理器程序14(诸如Eaton智能功率管理器(EIPM)软件套件)接收关于数据中心功率架构的信息。
f)在S20中,通过处理第一、第二和第三功率度量来生成与功率容量规划相关的输出数据。处理可特别地包括准备度量作为输出数据以用于在用户界面(UI)(特别是图形UI(GUI)16)上显示它们。如上所述获得的第一至第三功率度量可被视为功率度量的基线预测而无需附加的容量规划场景。表示功率度量的这些基线预测的曲线图的显示可能已经向用户提供了值。此外,可输出警告18和/或警报,特别是在功率度量在预定时间跨度内改变的情况下,例如可在6个月内预见到降级的情况下。
图2示出了用于计算系统的功率容量规划的系统的框图。系统可通过在计算机上执行的计算机程序来实现。系统包括实现上述方法的功能的以下模块:
-评估模块102实现S10;
-第一预测模块104实现S12;
-第二预测模块106实现S14和S16;
-第三预测模块108实现S18,并且
-输出数据生成模块110实现S20。
模块可例如被实现为被设置用于数据中心中的综合功率管理的软件套件的一部分并且可扩展例如现有软件套件(诸如上述EIPM软件套件)的功能。模块可被认为是单独软件模块,其实现如上面列出的相应功能并且接收输入数据以及生成输出数据,如图2所示。
可通过处理用户定义场景来提供进一步功能。用户定义场景可被提供用于功率容量规划,例如下个月在具有给定资源使用的现有PS上添加100个VM或者下个月添加托管200个VM的30个新PS。
通过考虑到用户定义场景来预测第一至第三功率度量,将利用S14、S16、S18(参见上面的c)至e))来计算来自用户定义场景的功率度量的演进。然后可将新预测的功率度量“添加”到功率度量的基线预测而无需在S20中获得的附加容量规划场景(参见上面的f))。它还可被输出以用于在UI上显示它们,使得用户可看到用户定义场景的功率度量并且将它们与没有用户定义场景的功率度量进行比较。
用户定义场景可例如由用户经由GUI输入到实现用于功率容量规划的方法和/或系统的计算机程序或软件套件中。
用户定义场景特别地允许用户预料并且然后调整功率架构以避免功率容量度量的任何降级。例如,用户可定义不同的用户定义场景,利用如本文所描述的方法和/或系统来执行功率容量规划,并且让每个场景的不同功率度量在GUI上可视化以比较它们。这可使得用户能够检测不同用户定义场景的功率容量度量的降级,从而给予用户改善数据中心中的计算系统的功率容量规划的可能性。此外,可向用户输出警告18和/或警报,当特定参数超过特定阈值时(例如当超过特定劣化程度时),可自动生成该警告和/或警报。可例如通过GUI使得用户能够改变用户定义场景以便关于功率度量调整功率架构。
图2示出了用户可如何通过所示系统来执行功率容量规划的另一应用:在图1B的S20中显示的关于功率度量阈值的警告或者如警告和/或警报18可由用户解释(在图2中从18到用户的箭头),例如因为用户可理解在哪些情况下超过阈值。用户然后可特别地基于警告和/或警报来定义具有附加功率容量的“新功率架构”。例如,用户可解释警报或警告,使得由于增加的处理需求而引起的进一步功率需求可导致UPS自主性的进一步减小,用户计划通过向功率架构添加进一步冗余来增加UPS自主性。“新功率架构”可通过例如上述EIPM软件套件来模拟(在图2中从用户到14的箭头)。然后,用户将能够检查该“新功率架构”是否解决功率度量警告“18”。
图3示出了三个不同的用户定义场景1至3的表示的示例。每个表示示出了随时间推移(以月为单位)的三个曲线图:底部曲线图是冗余水平,中间曲线图是以分钟为单位的UPS自主性(右竖直轴),并且顶部曲线图是以kW为单位的功率(左竖直轴)。场景1是在没有添加特定负载下的预测演进。应当注意,趋势可以是平坦的或者可以是循环的(每天、每周、每年…)。场景2是当在现有100个PS上添加30个VM(活动xxx)时的预测演进。用户可定义VM计算特性作为输入参数。场景3是当在新的20个PS上添加30个VM时的预测演进(模型xxx)。用户可定义以下信息作为输入参数:新PS功率特性(如果新PS类似于现有PS,则估计可为更准确的)、VM计算特性。
本文描述的方法和系统以相对精细的粒度实现计算系统(特别是虚拟系统,特别是在数据中心中采用)的改进功率容量规划。
Claims (10)
1.一种用于计算系统的功率容量规划的计算机实现的方法,所述方法包括以下步骤:
a)评估(S10)所述计算系统的活动,其中所述活动包括由所述计算系统执行的程序实例的数量和由所执行的程序实例引起的负载;
b)通过使用被配置用于活动演进预测的第一机器学习算法(10),基于所评估的活动来预测(S12)所述活动的演进;
c)基于所预测的活动演进并且通过使用被配置用于所述计算系统的功耗预测的第二机器学习算法(12),预测(S14)所述计算系统的功耗作为第一功率度量;
d)基于所预测的功耗并且通过使用被配置用于不间断电源自主性预测的第三机器学习算法(12')以及接收所述计算系统的所述功耗预测作为输入,预测(S16)所述计算系统的一个或多个不间断电源的自主性作为第二功率度量;
e)基于所预测的功耗和所述计算系统的功率架构,预测(S18)所述计算系统的冗余水平作为第三功率度量;
f)通过处理所述第一、第二和第三功率度量来生成(S20)与功率容量规划相关的输出数据。
2.根据权利要求1所述的方法,其中所述程序实例包括虚拟机和/或容器并且所述计算系统的活动的所述评估(S10)包括以下中的至少一者:确定由所述计算系统执行的虚拟机的数量;确定由所述计算系统执行的容器的数量;确定由所述计算系统执行的虚拟机和/或容器的数量的演进模式;确定每个虚拟机和/或容器的处理负载和/或存储负载的演进模式。
3.根据权利要求2所述的方法,其中所述活动的演进的所述预测(S12)包括通过所述第一机器学习算法(10)根据所确定的虚拟机和/或容器的数量、根据所确定的虚拟机和/或容器的所述数量的演进模式、和/或根据所确定的每个虚拟机和/或容器的所述处理负载和/或存储负载的演进模式来预测虚拟机和/或容器的所述数量的演进和/或所述处理负载和/或存储负载的演进。
4.根据任一前述权利要求所述的方法,其中用于所述计算系统的功耗的所述预测(S14)的所述第二机器学习算法(12)基于所述计算系统的执行所述程序实例的物理服务器的功耗,并且/或者其中用于所述计算系统的一个或多个不间断电源的自主性的所述预测(S16)的所述第三机器学习算法(12')包括不间断电源自主性模型。
5.根据任一前述权利要求所述的方法,其中所述计算系统的冗余水平的所述预测(S18)包括从功率管理器程序(14)接收关于所述功率架构的数据,所述功率管理器程序被配置为管理所述计算系统的所述功率要求。
6.根据任一前述权利要求所述的方法,其中与功率容量规划相关的输出数据的所述生成(S20)包括生成用于在用户界面(16)上显示所述第一、第二和第三功率度量的数据。
7.根据权利要求6所述的方法,所述方法还包括生成用于在所述用户界面(16)上显示与所述第一、第二和第三功率度量相关的警告(18)的数据。
8.根据任一前述权利要求所述的方法,所述方法还包括
-接收与所述功率容量规划相关的用户定义场景(20),
-基于所接收的用户定义场景(20)来执行所述预测动作c)-e)以获得所接收的用户定义场景(20)的所述第一、第二和第三功率度量,以及
-通过处理所接收的用户定义场景(20)的所述第一、第二和第三功率度量来生成(S20)与功率容量规划相关的输出数据。
9.一种用于计算系统的功率容量规划的计算机实现的系统(100),其中所述系统(100)特别地被配置用于执行根据任一前述权利要求所述的方法,并且其中所述系统(100)包括
-评估模块(102),所述评估模块被配置用于评估所述计算系统的活动,其中所述活动包括由所述计算系统执行的程序实例的数量和由所执行的程序实例引起的负载;
-第一预测模块(104),所述第一预测模块被配置用于通过使用被配置用于活动演进预测的第一机器学习算法(10),基于所评估的活动来预测所述活动的演进;
-第二预测模块(106),所述第二预测模块被配置用于基于所预测的活动演进并且通过使用被配置用于所述计算系统的功耗预测的第二机器学习算法(12),预测所述计算系统的功耗作为第一功率度量,并且被配置用于基于所预测的功耗并且通过使用被配置用于不间断电源自主性预测的第三机器学习算法(12')以及接收所述计算系统的所述功耗预测作为输入,预测所述计算系统的一个或多个不间断电源的自主性作为第二功率度量;
-第三预测模块(108),所述第三预测模块被配置用于基于所预测的功耗和所述计算系统的功率架构,预测所述计算系统的冗余水平作为第三功率度量;
-输出数据生成模块(110),所述输出数据生成模块被配置用于通过处理所述第一、第二和第三功率度量来生成与功率容量规划相关的输出数据。
10.一种存储软件的非暂态计算机可读存储设备,所述软件包括能够由计算设备的处理器执行的指令,所述指令在此类执行时致使所述计算设备执行根据权利要求1至8中的任一项所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB2019470.0A GB2601787A (en) | 2020-12-10 | 2020-12-10 | Power capacity planning for a computing system |
GB2019470.0 | 2020-12-10 | ||
PCT/EP2021/083644 WO2022122486A2 (en) | 2020-12-10 | 2021-11-30 | Power capacity planning for a computing system |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116830125A true CN116830125A (zh) | 2023-09-29 |
Family
ID=74188798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180083145.0A Pending CN116830125A (zh) | 2020-12-10 | 2021-11-30 | 计算系统的功率容量规划 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20240037008A1 (zh) |
EP (1) | EP4260244A2 (zh) |
CN (1) | CN116830125A (zh) |
GB (1) | GB2601787A (zh) |
WO (1) | WO2022122486A2 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024206951A2 (en) * | 2023-03-29 | 2024-10-03 | Torus Inc. | Artificial intelligence-based management of energy storage units |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7325050B2 (en) * | 2001-09-19 | 2008-01-29 | Dell Products L.P. | System and method for strategic power reduction in a computer system |
JP5304265B2 (ja) * | 2009-01-23 | 2013-10-02 | 日本電気株式会社 | 電源制御システム、電源制御方法、電源振分制御回路、および、電源制御プログラム |
US8631411B1 (en) * | 2009-07-21 | 2014-01-14 | The Research Foundation For The State University Of New York | Energy aware processing load distribution system and method |
JP5450136B2 (ja) * | 2010-02-03 | 2014-03-26 | 株式会社日立製作所 | 給電システム |
US20120053925A1 (en) * | 2010-08-31 | 2012-03-01 | Steven Geffin | Method and System for Computer Power and Resource Consumption Modeling |
-
2020
- 2020-12-10 GB GB2019470.0A patent/GB2601787A/en active Pending
-
2021
- 2021-11-30 WO PCT/EP2021/083644 patent/WO2022122486A2/en active Application Filing
- 2021-11-30 US US18/256,106 patent/US20240037008A1/en active Pending
- 2021-11-30 EP EP21823545.5A patent/EP4260244A2/en active Pending
- 2021-11-30 CN CN202180083145.0A patent/CN116830125A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
GB202019470D0 (en) | 2021-01-27 |
WO2022122486A2 (en) | 2022-06-16 |
WO2022122486A3 (en) | 2022-07-21 |
GB2601787A (en) | 2022-06-15 |
US20240037008A1 (en) | 2024-02-01 |
EP4260244A2 (en) | 2023-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11126242B2 (en) | Time varying power management within datacenters | |
US10128684B2 (en) | Energy control via power requirement analysis and power source enablement | |
Qu et al. | A reliable and cost-efficient auto-scaling system for web applications using heterogeneous spot instances | |
Barrett et al. | Applying reinforcement learning towards automating resource allocation and application scalability in the cloud | |
US11216059B2 (en) | Dynamic tiering of datacenter power for workloads | |
Kumbhare et al. | {Prediction-Based} power oversubscription in cloud platforms | |
Zhang et al. | Flex: High-availability datacenters with zero reserved power | |
EP3201717B1 (en) | Monitoring of shared server set power supply units | |
US11550634B2 (en) | Capacity management in a cloud computing system using virtual machine series modeling | |
Saxena et al. | A high availability management model based on VM significance ranking and resource estimation for cloud applications | |
Sampaio et al. | A comparative cost analysis of fault-tolerance mechanisms for availability on the cloud | |
Caton et al. | Towards autonomic management for cloud services based upon volunteered resources | |
Kulshrestha et al. | An efficient host overload detection algorithm for cloud data center based on exponential weighted moving average | |
Monshizadeh Naeen et al. | Adaptive Markov‐based approach for dynamic virtual machine consolidation in cloud data centers with quality‐of‐service constraints | |
US20240037008A1 (en) | Power capacity planning for a computing system | |
Pabitha et al. | Proactive Fault Prediction and Tolerance in Cloud Computing | |
Forshaw et al. | Energy-efficient checkpointing in high-throughput cycle-stealing distributed systems | |
US11316345B2 (en) | Predictive voltage stability of a power system post-contingency | |
WO2019213466A1 (en) | Time varying power management within datacenters | |
Azimi et al. | PowerCoord: A coordinated power capping controller for multi-CPU/GPU servers | |
Das et al. | On fault tolerance of resources in computational grids | |
WO2021122652A1 (en) | Power management of a computing system | |
Oliner et al. | Probabilistic qos guarantees for supercomputing systems | |
Abdul-Rahman et al. | Toward a genetic algorithm based flexible approach for the management of virtualized application environments in cloud platforms | |
Garg et al. | Deadline aware energy-efficient task scheduling model for a virtualized server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |