CN113867905A - 一种应用服务器集群实时能耗优化方法 - Google Patents

一种应用服务器集群实时能耗优化方法 Download PDF

Info

Publication number
CN113867905A
CN113867905A CN202111047326.6A CN202111047326A CN113867905A CN 113867905 A CN113867905 A CN 113867905A CN 202111047326 A CN202111047326 A CN 202111047326A CN 113867905 A CN113867905 A CN 113867905A
Authority
CN
China
Prior art keywords
server
cluster
ith
model
energy consumption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111047326.6A
Other languages
English (en)
Inventor
熊智
蔡玲如
朱长盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shantou University
Original Assignee
Shantou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shantou University filed Critical Shantou University
Priority to CN202111047326.6A priority Critical patent/CN113867905A/zh
Publication of CN113867905A publication Critical patent/CN113867905A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • G06F9/4893Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues taking into account power or heat criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/329Power saving characterised by the action undertaken by task scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本发明公开了一种应用服务器集群实时能耗优化方法。本发明在保证开启服务器的CPU利用率不超过给定目标值的前提下,根据负载状况动态优化集群中各服务器的部署使得集群的能耗最小。本发明针对集群中服务器同构性的好坏,采用合适的变量定义方式,将集群能耗优化问题描述成混合整数线性规划问题,进而根据规划问题的求解结果确定各服务器的开关状态、CPU频率和负载。本发明所使用的规划变量定义方式能大幅度减少变量数目,并且规划问题是线性的,即使应用于大规模的集群,规划问题依然能够实时精确求解。本发明提供的方法在集群能耗优化问题中考虑了服务器开关的开销,并对服务器开关进行惩罚,能有效避免细小的负载变化导致服务器开关抖动。

Description

一种应用服务器集群实时能耗优化方法
技术领域
本发明涉及服务器集群能耗管理技术领域,尤其涉及一种基于混合整数线性规划的应用服务器集群实时能耗优化方法。
背景技术
网络应用服务运营商通常是按峰值负载来部署应用服务器集群(简称集群)的规模,但平时运营时的负载通常远低于峰值负载并且是波动的,因此必须根据实际的负载状况动态优化集群中各服务器的部署(包括开关、CPU频率和负载)以进行节能,从而降低运营成本提升竞争力。
基于规划问题的集群能耗优化是一种常用的方法,其通过定义变量描述集群中各个服务器的部署,将集群能耗优化描述成规划问题,然后求解。已有的方法大体上可分为两种模式,一种针对单个服务器定义变量,将集群能耗优化描述成线性规划问题,并采用工具包进行精确求解(即求得最优解)。但当集群规模很大时,变量数目巨大,规划问题无法实时精确求解。另一种针对服务器型号定义变量,将集群能耗优化描述成非线性规划问题,然后针对问题的特点提出求解算法(例如差分进化算法或遗传算法等)。但这些方法在很短的时间内通常只能求得次优解(近似解),并且求解质量还取决于算法的参数。
另外,已有的方法都没有很好的解决服务器开关抖动的问题,即细小的负载变化可能导致服务器频繁的开关。因为一旦考虑该问题,将使得集群的能耗优化问题变得更加复杂,更加难以实时求解。也有些方法意识到了该问题,但仅采用简单的处理办法,例如“不关闭一台开启不到60秒的服务器”。
发明内容
本发明实施例所要解决的技术问题在于,提供一种应用服务器集群实时能耗优化方法。可在保证开启服务器的CPU利用率不超过给定目标值的前提下,根据负载状况动态优化集群中各服务器的部署使得集群的能耗最小,尤其是当集群规模较大时如何使得优化依然能够在线实时进行,以及如何避免细小的负载变化导致服务器开关抖动。
为了解决上述技术问题,本发明实施例提供了一种基于混合整数线性规划的应用服务器集群实时能耗优化方法,包括具体以下步骤:
S1:测定每台服务器的每个离散频率对应的满载功率、空闲功率和负载能力,以及每台服务器关机时的待机功率,其中,负载是指承担的请求平均达到速率;
S2:计算每台服务器的开机开销和关机开销;
S3:根据历史负载数据预测下一个优化周期的集群负载;
S4:计算集群的同构指数;
S5:根据集群同构指数的不同,采用不同的变量定义方式描述集群中各服务器的部署,将集群能耗优化问题描述成混合整数线性规划问题;
S6:求解混合整数线性规划问题;
S7:根据求解结果确定各服务器的开关状态、CPU频率和负载,并实施新的部署。
具体地,所述步骤S2进一步包括:服务器的开机开销计算如下:(服务器开启过程中的平均功率*开机时间+惩罚参数)/优化周期;所述服务器的关机开销计算如下:(服务器关机过程中的平均功率*关机时间+惩罚参数)/优化周期。
进一步地,所述步骤S4进一步包括:所述集群同构指数的计算如下:
Figure BDA0003251468770000021
其中,
n表示集群中服务器的数量,
fi表示第i台服务器离散频率的数量,
M表示集群中服务器型号的数量,
Fi表示第i种型号服务器离散频率的数量。
更进一步地,所述步骤S5进一步包括:在所述混合整数线性规划问题中,目标函数为各服务器的功率之和,加上各服务器的开机关机开销之和;
约束条件为所有服务器承担的负载和等于预测的集群负载,以及所有开启服务器的CPU利用率不高于给定的值。
更进一步地,所述步骤S5进一步包括:如果所述集群同构指数小于等于1,则针对集群中的每台服务器定义变量;如果所述集群同构指数大于1,则针对集群中的每种服务器型号定义变量。
更进一步地,所述步骤S5进一步包括:所述针对集群中的每台服务器定义变量的方法如下:
为第i台服务器的第j个离散频率定义一个实数变量xi,j和一个二进制变量yi,j,yi,j表示第i台服务器是否工作在第j个离散频率上,xi,j表示第i台服务器工作在第j个离散频率上时的CPU利用率;如果yi,j=0,那么xi,j=0。
更进一步地,所述步骤S5进一步包括:所述针对集群中的每种服务器型号定义变量的方法如下:
为第i种型号服务器的第j个离散频率定义两个整数变量
Figure BDA0003251468770000031
Figure BDA0003251468770000032
两个实数变量
Figure BDA0003251468770000033
Figure BDA0003251468770000034
以及为第i种服务器型号定义两个二进制变量
Figure BDA0003251468770000035
Figure BDA0003251468770000036
表示有
Figure BDA0003251468770000037
台第i种型号的服务器工作在第j个离散频率上且其负载和为
Figure BDA0003251468770000038
其中,
Figure BDA0003251468770000039
的取值有2种情况:
(1,0)表示“需要新开启一些第i种型号的服务器或者第i种型号服务器的开关均保持不变”;
(0,1)表示“需要关闭一些第i种型号的服务器或者第i种型号服务器的开关均保持不变”,
并且,
如果
Figure BDA00032514687700000310
那么
Figure BDA00032514687700000311
如果
Figure BDA00032514687700000312
那么
Figure BDA00032514687700000313
实施本发明实施例,具有如下有益效果:本发明的方法在保证开启服务器的CPU利用率不超过给定目标值的前提下,根据负载状况动态优化集群中各服务器的部署使得集群的能耗最小;针对集群中服务器同构性的好坏,采用合适的变量定义方式,将集群能耗优化问题描述成混合整数线性规划问题,进而根据规划问题的求解结果确定各服务器的开关状态、CPU频率和负载;所使用的规划变量定义方式能大幅度减少变量数目,并且规划问题是线性的,即使应用于大规模的集群,规划问题依然能够实时精确求解;在集群能耗优化问题中考虑了服务器开关的开销,并对服务器开关进行惩罚,能有效避免细小的负载变化导致服务器开关抖动。
附图说明
图1示出了本发明实施例中的方法步骤流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,本发明提供了一种基于混合整数线性规划的应用服务器集群实时能耗优化方法,包括具体以下步骤:
步骤S1:测定每台服务器的每个离散频率对应的满载功率、空闲功率和负载能力,以及每台服务器关机时的待机功率,其中,负载是指承担的请求平均达到速率。
步骤S2:计算每台服务器的开机开销和关机开销。
进一步地,步骤S2进一步包括:服务器的开机开销计算如下:(服务器开启过程中的平均功率*开机时间+惩罚参数)/优化周期;所述服务器的关机开销计算如下:(服务器关机过程中的平均功率*关机时间+惩罚参数)/优化周期。
步骤S3:根据历史负载数据预测下一个优化周期的集群负载。
步骤S4:计算集群的同构指数。
进一步地,步骤S4进一步包括:集群同构指数的计算如下:
Figure BDA0003251468770000051
其中,
n表示集群中服务器的数量,
fi表示第i台服务器离散频率的数量,
M表示集群中服务器型号的数量,
Fi表示第i种型号服务器离散频率的数量。
步骤S5:根据集群同构指数的不同,采用不同的变量定义方式描述集群中各服务器的部署,将集群能耗优化问题描述成混合整数线性规划问题。
进一步地,步骤S5进一步包括:在混合整数线性规划问题中,
目标函数为各服务器的功率之和,加上各服务器的开机关机开销之和;
约束条件为所有服务器承担的负载和等于预测的集群负载,以及所有开启服务器的CPU利用率不高于给定的值。
更进一步地,步骤S5进一步包括:如果所述集群同构指数小于等于1,则针对集群中的每台服务器定义变量;如果所述集群同构指数大于1,则针对集群中的每种服务器型号定义变量。
更进一步地,步骤S5进一步包括:针对集群中的每台服务器定义变量的方法如下:
为第i台服务器的第j个离散频率定义一个实数变量xi,j和一个二进制变量yi,j,yi,j表示第i台服务器是否工作在第j个离散频率上,xi,j表示第i台服务器工作在第j个离散频率上时的CPU利用率;如果yi,j=0,那么xi,j=0。
更进一步地,步骤S5进一步包括:针对集群中的每种服务器型号定义变量的方法如下:
为第i种型号服务器的第j个离散频率定义两个整数变量
Figure BDA0003251468770000052
Figure BDA0003251468770000053
两个实数变量
Figure BDA0003251468770000054
Figure BDA0003251468770000055
以及为第i种服务器型号定义两个二进制变量
Figure BDA0003251468770000056
Figure BDA0003251468770000057
表示有
Figure BDA0003251468770000058
台第i种型号的服务器工作在第j个离散频率上且其负载和为
Figure BDA0003251468770000059
其中,
Figure BDA0003251468770000061
的取值有2种情况:
(1,0)表示“需要新开启一些第i种型号的服务器或者第i种型号服务器的开关均保持不变”;
(0,1)表示“需要关闭一些第i种型号的服务器或者第i种型号服务器的开关均保持不变”,
并且,
如果
Figure BDA0003251468770000062
那么
Figure BDA0003251468770000063
如果
Figure BDA0003251468770000064
那么
Figure BDA0003251468770000065
步骤S6:求解混合整数线性规划问题;
步骤S7:根据求解结果确定各服务器的开关状态、CPU频率和负载,并实施新的部署。
上述集群能耗优化周期性地进行,每个优化周期结束时,首先预测下一个周期的集群负载,然后根据所预测的负载来调整各服务器的开关状态,CPU频率和负载,使得在保证开启服务器的CPU利用率不超过给定目标值的前提下集群的总能耗最小。
本发明具有以下优点:
1)能耗和负载模型较为准确。两个混合整数线性规划问题均针对每个离散频率定义变量,即优化方案是针对每个离散频率建立“功率-频率”和“负载-频率”模型,而已有的方法通常针对整个频率区间较为粗糙地建立上述两个模型,本发明所构建的模型较为准确。
2)集群能耗优化问题能够实时精确求解。已有的基于规划问题的集群能耗优化方法,要么当集群规模很大时,规划变量数目巨大,规划问题难以实时精确求解(即求得最优解),或者针对问题的特点提出求解算法,但在很短的时间内通常只能求得次优解(即近似解),并且求解质量还取决于算法的参数。而本发明提供的方案,一方面将集群能耗优化描述成线性规划问题,一方面变量数目较少,无论应用于小规模或是大规模的集群,规划问题均能采用已有的工具包实时精确求解。
3)能够避免服务器开关抖动。本发明提供的方法在集群能耗优化问题中考虑了服务器开关的开销,并对服务器开关进行惩罚,能有效避免细小的负载变化导致服务器开关抖动。已有的方法没有这么做,这是因为考虑了服务器开关的开销后,优化问题将变得更加复杂,更加难以实时求解。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (7)

1.一种基于混合整数线性规划的应用服务器集群实时能耗优化方法,其特征在于,包括以下步骤:
S1:测定每台服务器的每个离散频率对应的满载功率、空闲功率和负载能力,以及每台服务器关机时的待机功率,所述负载为承担的请求平均达到速率;
S2:计算每台服务器的开机开销和关机开销;
S3:根据历史负载数据预测下一个优化周期的集群负载;
S4:计算集群的同构指数;
S5:根据集群同构指数的不同,采用不同的变量定义方式描述集群中各服务器的部署,将集群能耗优化问题描述成混合整数线性规划问题;
S6:求解混合整数线性规划问题;
S7:根据求解结果确定各服务器的开关状态、CPU频率和负载,并实施新的部署。
2.根据权利要求1所述的方法,其特征在于,所述步骤S2进一步包括:所述开机开销计算如下:(服务器开启过程中的平均功率*开机时间+惩罚参数)/优化周期;所述关机开销计算如下:(服务器关机过程中的平均功率*关机时间+惩罚参数)/优化周期。
3.根据权利要求1所述的方法,其特征在于,所述步骤S4进一步包括:所述集群的同构指数的计算如下:
Figure FDA0003251468760000011
其中,
n表示集群中服务器的数量,
fi表示第i台服务器离散频率的数量,
M表示集群中服务器型号的数量,
Fi表示第i种型号服务器离散频率的数量。
4.根据权利要求1或2所述的方法,其特征在于,所述步骤S5进一步包括:在所述混合整数线性规划问题中,目标函数为各服务器的功率之和,加上各服务器的开机关机开销之和;约束条件为所有服务器承担的负载和等于预测的集群负载,以及所有开启服务器的CPU利用率不高于给定的值。
5.根据权利要求4所述的方法,其特征在于,所述步骤S5进一步包括:如果所述集群同构指数小于等于1,则针对集群中的每台服务器定义变量;如果所述集群同构指数大于1,则针对集群中的每种服务器型号定义变量。
6.根据权利要求5所述的方法,其特征在于,所述步骤S5进一步包括:所述针对集群中的每台服务器定义变量的方法如下:
为第i台服务器的第j个离散频率定义一个实数变量xi,j和一个二进制变量yi,j,yi,j表示第i台服务器是否工作在第j个离散频率上,xi,j表示第i台服务器工作在第j个离散频率上时的CPU利用率;如果yi,j=0,那么xi,j=0。
7.根据权利要求6所述的方法,其特征在于,所述步骤S5进一步包括:所述针对集群中的每种服务器型号定义变量的方法如下:
为第i种型号服务器的第j个离散频率定义两个整数变量
Figure FDA0003251468760000021
Figure FDA0003251468760000022
两个实数变量
Figure FDA0003251468760000023
Figure FDA0003251468760000024
以及为第i种服务器型号定义两个二进制变量
Figure FDA0003251468760000025
Figure FDA0003251468760000026
表示有
Figure FDA0003251468760000027
台第i种型号的服务器工作在第j个离散频率上且其负载和为
Figure FDA0003251468760000028
其中,
Figure FDA0003251468760000029
的取值有2种情况:
(1,0)表示“需要新开启一些第i种型号的服务器或者第i种型号服务器的开关均保持不变”;
(0,1)表示“需要关闭一些第i种型号的服务器或者第i种型号服务器的开关均保持不变”,
并且,
如果
Figure FDA00032514687600000210
那么
Figure FDA00032514687600000211
如果
Figure FDA00032514687600000212
那么
Figure FDA00032514687600000213
CN202111047326.6A 2021-09-08 2021-09-08 一种应用服务器集群实时能耗优化方法 Pending CN113867905A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111047326.6A CN113867905A (zh) 2021-09-08 2021-09-08 一种应用服务器集群实时能耗优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111047326.6A CN113867905A (zh) 2021-09-08 2021-09-08 一种应用服务器集群实时能耗优化方法

Publications (1)

Publication Number Publication Date
CN113867905A true CN113867905A (zh) 2021-12-31

Family

ID=78994856

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111047326.6A Pending CN113867905A (zh) 2021-09-08 2021-09-08 一种应用服务器集群实时能耗优化方法

Country Status (1)

Country Link
CN (1) CN113867905A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114915631A (zh) * 2022-05-20 2022-08-16 东南大学 一种面向异构集群能效优化的负载均衡系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114915631A (zh) * 2022-05-20 2022-08-16 东南大学 一种面向异构集群能效优化的负载均衡系统及方法
CN114915631B (zh) * 2022-05-20 2024-02-09 东南大学 一种面向异构集群能效优化的负载均衡系统及方法

Similar Documents

Publication Publication Date Title
CN107591811B (zh) 配电网无功优化方法及装置
CN110289631B (zh) 一种风电场储能装置容量的计算方法及系统
WO2016078268A1 (zh) 节能方法及装置
CN113867905A (zh) 一种应用服务器集群实时能耗优化方法
CN115345380A (zh) 一种基于人工智能的新能源消纳电力调度方法
CN115186916A (zh) 负荷预测方法、装置、设备及计算机可读存储介质
CN112054561A (zh) 基于SARSA(λ)算法的风电-抽蓄联合系统日随机动态调度方法
Nesmachnow et al. Controlling datacenter power consumption while maintaining temperature and QoS levels
CN113690885A (zh) 一种供电控制方法及供电平台
CN116028193A (zh) 一种混部集群的大数据任务动态高能效调度方法和系统
CN106452822B (zh) 一种大规模服务器集群的在线能耗管理方法与装置
CN115360768A (zh) 基于muzero和深度强化学习的电力调度方法、装置及存储介质
CN115396955A (zh) 一种基于深度强化学习算法的资源分配方法及装置
Xiong et al. Energy-saving optimization of application server clusters based on mixed integer linear programming
CN110518585B (zh) 一种多区域电网联络线交换功率优化方法
EP4049204A1 (en) System for configuring demand response for energy grid assets
Zhang et al. Dynamic energy storage control for reducing electricity cost in data centers
CN115167652A (zh) 基于主从优化的大规模应用服务器集群实时能耗优化方法
Abbasi et al. Holistic management of sustainable geo-distributed data centers
Li et al. Learning-Augmented Decentralized Online Convex Optimization in Networks
CN117901703B (zh) 充电负荷调控方法、装置和电子设备
CN117767324A (zh) 一种配电网电压波动预测方法、系统、设备和介质
CN117479327A (zh) 一种信控方法、装置、电子设备及存储介质
CN115632417A (zh) 一种用于终端储能的电能质量治理方法
Weibin Simulation of distribution network planning model based on mobile IoT and deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination