CN104158754A - 基于热负载均衡的数据中心自适应性耗能管理方法 - Google Patents

基于热负载均衡的数据中心自适应性耗能管理方法 Download PDF

Info

Publication number
CN104158754A
CN104158754A CN201410322951.0A CN201410322951A CN104158754A CN 104158754 A CN104158754 A CN 104158754A CN 201410322951 A CN201410322951 A CN 201410322951A CN 104158754 A CN104158754 A CN 104158754A
Authority
CN
China
Prior art keywords
power
server
model
overbar
data center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410322951.0A
Other languages
English (en)
Other versions
CN104158754B (zh
Inventor
姚建国
周海航
管海兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201410322951.0A priority Critical patent/CN104158754B/zh
Publication of CN104158754A publication Critical patent/CN104158754A/zh
Application granted granted Critical
Publication of CN104158754B publication Critical patent/CN104158754B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Air Conditioning Control Device (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开一种基于热负载均衡的数据中心自适应性耗能管理方法,在每个采样时间内,采用以下步骤进行耗能管理:1)使用RLS模型估算服务器的功耗;2)在约束条件下对费用函数进行优化求解,得出最优的Up(k);3)从Up(k)中选出第一组输入U(k|k)作为真实的控制量U(k);4)计算需要的活跃服务器个数mj;5)平均分配任务到每个机架。本发明方法,能够动态地分配服务器任务,使数据中心中服务器和冷却系统的总功率消耗降低。

Description

基于热负载均衡的数据中心自适应性耗能管理方法
技术领域
本发明涉及网络数据中心的耗能管理,更具体的说,涉及一种基于热负载均衡的数据中心自适应性耗能管理方法。
背景技术
最近几年,随着云计算的蓬勃发展。网络数据中心,作为其基础设施,承载着大量的计算、存储和应用等任务,需要消耗大量的能量来运行和冷却设备。随着云计算服务发展的越来越迅速,数据中心中的能耗越来越大。
数据中心中的服务器,作为处理和存储用户任务请求的所在,需要使用大量的能量,并散发大量能量。而由于电子设备的工作温度限制,需要使用冷却设备对数据中心中服务器产生的大量热能进行冷却。
当前,学术界和工业界对于数据中心中能量消耗的问题越来越感兴趣。不过,当前学术界的研究主要专注于
1、提高服务器的耗能效率,包括使用虚拟化技术,动态电压、频率切换等。
2、解决制冷系统中能量效率问题,主要是计算机房间空调系统(Computer Room AirConditioner,CRAC)制冷效率的提高。
3、其它提高方式。如通过动态负载来达到降温和计算功率的平衡;通过对IT设备、功率及降温设施的整合管理等。
然而,对于如何分配任务给服务器,使得服务器和冷却系统的总功率消耗降低,这个问题,却并没有涉及。
发明内容
针对上述现有技术中存在的技术问题,本发明提供一种基于热负载均衡的数据中心自适应性耗能管理方法,来动态地分配服务器任务,使数据中心中服务器和冷却系统的总功率消耗降低。考虑到问题可扩展性、实时性和应用性,对数据中心中的制冷系统和服务器模型进行了相应的设计和约束,并设计了一种任务分配算法,能够实时地将任务分配给各服务器。
为达到上述目的,本发明所采用的技术方案如下:
一种基于热负载均衡的数据中心自适应性耗能管理方法,在每个采样时间内,采用以下步骤进行耗能管理:
1)使用RLS模型估算服务器的功耗;
2)在约束条件下对费用函数进行优化求解,得出最优的Up(k);
3)从Up(k)中选出第一组输入U(k|k)作为真实的控制量U(k);
4)计算需要的活跃服务器个数mj
5)平均分配任务到每个机架。
所述步骤1)的方法是:
a)首先建立热量模型、功率消耗模型以及任务模型;
b)对数据中心功率控制,对所述功率消耗模型做处理能力、负载、功率输入、总功率的限制;
c)基于RLS的热量模型评估。
所述步骤a)中,热量模型的建立方法是:
根据热力学定理,机架j出口的空气温度与机架j输入空气温度,机架j功率消耗的关系为:
根据热力学定理,机架j输入空气温度,同机架j输出空气温度及CRACh输出空气温度的关系为:
同理,根据热力学定理,CRACh出口的空气温度,输入空气温度与CRACh功率消耗,机架j出口的空气温度间关系为:
功率消耗模型的建立方法是:
对于功率消耗模型,由于服务器的功率消耗主要依赖于服务器的两个参数,CPU使用率和频率,假定在每个服务器CPU频率一定的情况下,服务器的功率消耗则主要同CPU使用率相关,同时,假定可以采用开-关服务器以节省服务器能耗的策略,则机架j上功率消耗还和机架j上保持开状态的服务器个数相关,因此,可以对其功率建模为:
任务模型的建立方法是:
考虑Web服务器架构产生的数据请求,前段Web服务器从客户端接收用户请求后,将这些请求分配到不同机架的服务器上进行处理,其中,总请求数为:
L = Σ j = 1 M λ j
根据排队论,对任务请求的平均处理延时为:
D j a = 1 m j μ j - λ j ,
考虑到实时性,需要对任务的平均处理延迟进行限制,即其最大值在一定范围内:
D j a ≤ D j .
所述步骤b)对功率消耗模型做处理能力、负载、功率输入、总功率的限制的方法是:
对于一般的连续系统而言,其状态空间模型为:
X · = AX + BU ,
Y=WX,
其中 X = [ T out 1 , . . . , T out M , T out 1 , . . . , T out F ] T , Y = [ T in 1 , . . . , T in M ] T , U=[P1,...,PM,P,...,PF]T,对离散系统而言,其状态模型为:
X(k)=ΦX(k-1)+GU(k-1),
Y(k)=WX(k),
其中,是系统的第k个采样周期,该离散系统的模型参数为在该离散系统中,涉及对处理能力、负载、功率输入、总功率限制如下;
(1)处理能力限制
根据任务模型中对服务延迟的限制,将公式变形为:
λ j ≤ μ j ( m j - 1 μ j D j ) , ≤ μ j ( M j - 1 μ j D j )
将其变换为矩阵形式,为
其中,
Ψ1=(IM×M  OM×F),
(2)负载限制
能够被服务器服务的负载量为:
其中,PA是对应于每个请求的平均功率;
(3)功率输入限制
首先,每个机架的服务器和CRAC的输入功率都是非负的,同时CRAC的输入功率必须是整数级的,可以对其限制为:
U≥O(M+F)×1,
Pj≤Pmax,Pj∈Z+
Pmax是CRAC功率输入的最大允许值,将其变为矩阵形式为:
Ψ3U≤[Pmax]F×1
其中,
Ψ3=(OF×M  IF×F);
(4)总功率限制
机架服务器和CRAC的总功率需求为:
将其变换为矩阵形式为:
Ψ4U≤Pd
其中,Ψ4=[1,…,1]1×(M+F).,Pd是总功率需求的上界。
所述步骤c)基于RLS的热量模型评估的方法是:使用计算流体力学CFD分析方法,将功率消耗建模为多输入多输出线性模型:
A ‾ ( q - 1 ) X ( k ) = B ‾ ( q - 1 ) U ( k ) ,
其中,
A ‾ ( q - 1 ) = I - Aq - 1 , B ‾ ( q - 1 ) = Bq - 1 ,
基于RLS模型,对系统模型进行重写,将其形式变为:
X(k+1)=A(k)φ(k)
其中,
φ(k)=[UT(k),XT(k)]T
X(k)=[B,A],
使用RLS模型,主要用于计算系统矩阵A和B,由于使用的RLS模型,依赖于时间变量,考虑其根据时间的迭代过程为:
E ( k + 1 ) = X ( k + 1 ) - X ^ ( k ) φ ( k ) , X ^ ( k + 1 ) = X ^ ( k ) + E ( k + 1 ) ( φ ) T ( k ) P ( k - 1 ) λ ‾ + ( φ ) T ( k ) P ( k - 1 ) φ ( k ) ,
P - 1 ( k ) = P - 1 ( k - 1 ) + ( 1 + ( λ ‾ - 1 ) ( φ ) T P ( k - 1 ) φ ( k ) [ ( φ ) T ( k ) φ ( k ) ] 2 ) φ ( k ) ( φ ) T ( k ) ,
其中表示模型的估计量,E(k+1)表示估测误差向量,P(k)为协方差矩阵,为遗忘因子, 0 < &lambda; &OverBar; < 1 .
所述步骤2)的方法是:使用模型预测控制MPC控制方法进行控制,MPC控制器通过计算控制输入U(k)来最小化下列费用函数:
J ( k ) = &Sigma; s = 1 P Y | | Y ( k + s | k ) - Y T ( k + s | k ) | | Q ( s ) 2 + &Sigma; s = 0 P U - 1 | | U ( k + s | k ) | | R ( s ) 2 ,
其中,PY和PU是状态和输入的预测长度范围,X(k+s|k)是之后第s个采样间隔的状态预测,和U(k+s|k)都是类似的,Q(s)和R(s)是用来对时间误差和输入功率的补偿矩阵,其中||x||Q(s)=xTQ(s)x,该费用函数主要为最小化温度追踪误差和功率需求,即:使功率需求较小的同时,使得不同时间间隔间的温度变化较小,因此,需要在每一个时间间隔中,对该费用函数求解最小值,并满足相应约束条件如下:
&Psi; &OverBar; 2 U = [ LP A ] P U &times; 1 ,
U p ( k ) &GreaterEqual; O P U ( M + F ) &times; 1 , &Psi; &OverBar; 3 U p ( k ) &le; [ P max ] P U F &times; 1 ,
&Psi; &OverBar; 4 U p ( k ) &le; [ P d ] P U &times; 1 ,
Pj∈Z+
其中:
&Psi; &OverBar; 1 = diag [ &Psi; 1 ] , &Psi; &OverBar; 2 = diag [ &Psi; 2 ] , &Psi; &OverBar; 3 = diag [ &Psi; 3 ] , &Psi; &OverBar; 4 = diag [ &Psi; 4 ] - ,
Q=diag[Q(s)],R=dian[R(s)]。
所述步骤4)的方法是:在满足处理能力约束的情况下,应尽可能地减少保持开状态的处理器,因此,设定每次保持开状态的处理器个数为:
并满足限制:
所述步骤5)的方法是:假定每个任务的分配,在各个服务器上是均一的,因此,每个机架上分到的任务数为:
并满足约束: &Sigma; i = 1 m j &lambda; ij = &lambda; j .
本发明方法,对于数据中心中服务器和CRAC系统的耗能进行优化管理,在提供数据中心中服务器和CRAC温度较小变动、满足任务处理约束等各项约束的同时,降低总能耗。其有益效果如下:
1.当使服务器室温度保持在某一定值附近时,温度变化较已有方法平稳;
2.能够有效地对热负载做负载均衡,使得热负载的负载峰值降低;
3.在服务器室设定温度变化时,我们能够降低总能耗。在具体实施例中,我们能够达到在提高5摄氏度时,总功率消耗能够降低5%以上,CRAC能够降低15%以上的功率消耗。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明方法的系统模型图;
图2是本发明实施例中周围温度同时间的关系;
图3是本发明实施例中峰值功率开-关服务器方法同MPC方法对比;
图4是本发明实施例中功率减少同设定温度升高的关系。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
本发明基于热负载均衡的数据中心自适应性耗能管理方法,其基本结构如图1所示,其中,CRAC和服务器主要在数据中心的服务器室中。
在该结构中,在一个时间周期内,对服务器室中采集的温度、功率,进行热量模型评估,综合到达负载,进行自适应性控制,自适应性控制的输出为对服务器室中各服务器中任务负载量以及CRAC的温度调节控制。并在下一个时间周期,对服务器室的温度和功率数据进行采集,进行下一轮迭代。
本发明方法通过使用建模的方式进行分析。
参数表如下:
在本方法中,主要涉及三种模型的建立,热量模型,功率消耗模型以及任务模型。
1.热量模型
在数据中心中,服务器都储存在一个个机柜中,对于数据中心的制冷系统而言,制冷系统产生的冷空气进入服务器机柜,吸收热量后,从机柜的空气出口端排出。然后,这被加热后的空气,进入CRAC系统,循环利用。
根据热力学定理,机架j出口的空气温度与机架j输入空气温度,机架j功率消耗的关系为:
根据热力学定理,机架j输入空气温度,同机架j输出空气温度及CRACh输出空气温度的关系为:
同理,根据热力学定理,CRACh出口的空气温度,输入空气温度与CRACh功率消耗,机架j出口的空气温度间关系为:
2.功率消耗模型
对于功率消耗模型,由于服务器的功率消耗主要依赖于服务器的两个参数,CPU使用率和频率。假定在每个服务器CPU频率一定的情况下,服务器的功率消耗则主要同CPU使用率相关,同时,假定可以采用开-关服务器以节省服务器能耗的策略,则机架j上功率消耗还和机架j上保持开状态的服务器个数相关。因此,可以对其功率建模为:
3.任务模型
在我们的模型中,主要考虑Web服务器架构产生的数据请求。前段Web服务器从客户端接收用户请求后,将这些请求分配到不同机架的服务器上进行处理。其中,总请求数为:
L = &Sigma; j = 1 M &lambda; j ,
根据排队论,对任务请求的平均处理延时为:
D j a = 1 m j &mu; j - &lambda; j ,
在模型中,考虑到实时性,需要对任务的平均处理延迟进行限制,即其最大值在一定范围内:
D j a &le; D j .
通过对模型的建构,建立任务请求分配的自适应性耗能控制方法。主要有以下几个步骤
1.对数据中心功率控制
首先,对于数据中心功率模型做相应限制。
对于一般的连续系统而言,其状态空间模型为
X &CenterDot; = AX + BU ,
Y=WX,
其中 X = [ T out 1 , . . . , T out M , T out 1 , . . . , T out F ] T , Y = [ T in 1 , . . . , T in M ] T , U=[P1,...,PM,P,...,PF]T
考虑该方法中涉及的系统为离散系统,其状态模型为:
X(k)=ΦX(k-1)+GU(k-1),
Y(k)=WX(k),
其中,是系统的第k个采样周期。该离散系统的模型参数为 &Phi; = e AT s , G = &Integral; 0 T s e At Bdt ,
在该离散系统中,需要涉及对处理能力、负载、功率输入、总功率限制。
1)处理能力限制
根据任务模型中对服务延迟的限制,将公式变形为:
&lambda; j &le; &mu; j ( m j - 1 &mu; j D j ) , &le; &mu; j ( M j - 1 &mu; j D j ) ,
将其变换为矩阵形式,为:
其中,
Ψ1=(IM×M  OM×F),
2)负载限制
能够被服务器服务的负载量为
其中,PA是对应于每个请求的平均功率。
3)功率输入限制
首先,每个机架的服务器和CRAC的输入功率都是非负的,同时CRAC的输入功率必须是整数级的,可以对其限制为:
U≥O(M+F)×1
Pj≤Pmax,Pj∈Z+
Pmax是CRAC功率输入的最大允许值。
将其变为矩阵形式为:
Ψ3U≤[Pmax]F×1
其中,
Ψ3=(OF×M  IF×F)。
4)总功率限制
机架服务器和CRAC的总功率需求为:
将其变换为矩阵形式为:
Ψ4U≤Pd
其中,
Ψ4=[1,…,1]1×(M+F),Pd是总功率需求的上界。
2.基于最小二乘回归(Recursive Least Square,RLS)的热量模型评估
在该方法中,使用计算流体力学(Computational fluid dynamics,CFD)分析方法。将功率消耗建模为多输入多输出线性模型:
A &OverBar; ( q - 1 ) X ( k ) = B &OverBar; ( q - 1 ) U ( k ) ,
其中,
A &OverBar; ( q - 1 ) = I - Aq - 1 , B &OverBar; ( q - 1 ) = Bq - 1 ,
基于RLS模型,对系统模型进行重写,将其形式变为:
X(k+1)=A(k)φ(k)
其中,
φ(k)=[UT(k),XT(k)]T
X(k)=[B,A],
使用RLS模型,主要用于计算系统矩阵A和B。由于使用的RLS模型,依赖于时间变量,考虑其根据时间的迭代过程为:
E ( k + 1 ) = X ( k + 1 ) - X ^ ( k ) &phi; ( k ) ,
X ^ ( k + 1 ) = X ^ ( k ) + E ( k + 1 ) ( &phi; ) T ( k ) P ( k - 1 ) &lambda; &OverBar; + ( &phi; ) T ( k ) P ( k - 1 ) &phi; ( k ) , P - 1 ( k ) = P - 1 ( k - 1 ) + ( 1 + ( &lambda; &OverBar; - 1 ) ( &phi; ) T P ( k - 1 ) &phi; ( k ) [ ( &phi; ) T ( k ) &phi; ( k ) ] 2 ) &phi; ( k ) ( &phi; ) T ( k ) ,
其中表示模型的估计量,E(k+1)表示估测误差向量,P(k)为协方差矩阵,为遗忘因子, 0 < &lambda; &OverBar; < 1 .
3.自适应性耗能最优设计
使用模型预测控制(Model Predictive Control,MPC)控制方法进行控制,MPC控制器通过计算控制输入来最小化下列费用函数:
J ( k ) = &Sigma; s = 1 P Y | | Y ( k + s | k ) - Y T ( k + s | k ) | | Q ( s ) 2 + &Sigma; s = 0 P U - 1 | | U ( k + s | k ) | | R ( s ) 2 ,
其中,PY和PU是状态和输入的预测长度范围。X(k+s|k)是之后第s个采样间隔的状态预测,和U(k+s|k)都是类似的。Q(s)和R(s)是用来对时间误差和输入功率的补偿矩阵。其中||x||Q(s)=xTQ(s)x。
该费用函数主要为最小化温度追踪误差和功率需求。即使功率需求较小的同时,使得不同时间间隔间的温度变化较小。
因此,该自适应方法中,需要在每一个时间间隔中,对该费用函数求解最小值,并满足相应约束条件。约束条件整理如下:
&Psi; &OverBar; 2 U = [ LP A ] P U &times; 1 ,
U p ( k ) &GreaterEqual; O P U ( M + F ) &times; 1 ,
&Psi; &OverBar; 3 U p ( k ) &le; [ P max ] P U F &times; 1 ,
&Psi; &OverBar; 4 U p ( k ) &le; [ P d ] P U &times; 1 ,
Pj∈Z+
其中
&Psi; &OverBar; 1 = diag [ &Psi; 1 ] , &Psi; &OverBar; 2 = diag [ &Psi; 2 ] , &Psi; &OverBar; 3 = diag [ &Psi; 3 ] , &Psi; &OverBar; 4 = diag [ &Psi; 4 ] - ,
Q=diag[Q(s)],R=diag[R(s)]。
4.服务器开-关控制
在能够处理任务请求的情况下,服务器开的数量越少,总耗能变越少,因此,在满足处理能力约束的情况下,应尽可能地减少保持开状态的处理器。因此,设定每次保持开状态的处理器个数为:
并满足限制
5.在每个机架上,任务的平均分配
在该方法中,假定每个任务的分配,在各个服务器上是均一的,因此,每个机架上分到的任务数为:
并满足约束:
&Sigma; i = 1 m j &lambda; ij = &lambda; j .
本发明相关矩阵定义如下:
A = A 11 A 12 A 21 A 22 ,
Y &prime; ( k ) = Y ( k + 1 | k ) Y ( k + 2 | k ) . . . Y ( k + P Y | k ) , X &OverBar; ( k ) = &Phi;X ( k ) &Phi; 2 X ( k ) . . . &Phi; P Y X ( k ) ,
W′=diag(W W…W),
U p ( k ) = U ( k | k ) U ( k + 1 | k ) . . . U ( k + P U - 1 | k ) .
下面结合具体实施例对本发明做进一步详细的描述。
在该实施例中,设置了3个机架和3个CRAC,任务的产生率为每秒其中,rand表示一个0到1之间的随机数。任务处理时间延迟上限设置为10ms,每个服务器的处理速度设置为2请求/秒,每个服务器在休眠状态(开-关状态中的关状态)和开状态的功率消耗分别为150W和285W。机架的其它设置请参照表2。
对于机架和CRAC的热动态参数设置为参照表1和表3,服务器间设定温度为25摄氏度。温度误差最大限定为±1摄氏度。
表1 本发明实施例中部分参数
节点 机架1 机架2 机架3 CRAC1 CRAC2 CRAC
机架1 g11=0.01 g12=0.02 g13=0.06 H11=0.80 H12=0.07 H13=0.04
机架2 g21=0.03 g22=0.01 g23=0.05 H21=0.04 H22=0.85 H23=0.02
机架3 g31=0.04 g32=0.04 g12=0.01 H31=0.04 H32=0.03 H33=0.84
CRAC1 H11=0.85 H12=0.07 H13=0.03 G11=0.01 G12=0.01 G13=0.04
CRAC2 H21=0.04 H22=0.88 H23=0.02 G21=0.01 G22=0.01 G23=0.04
CRAC3 H31=0.07 H32=0.02 H33=0.81 G31=0.05 G32=0.04 G33=0.01
表2 本发明实施例中每个机架的参数设置
表3 本发明实施例中部分参数设置
上述实施例中,同现有的开-关服务器进行降低功率峰值的方式进行对比,在图3中可以看到,MPC方法在峰值功率的降低上,比现有的开-关服务器方式能够获得更加稳定及更低的峰值功率。
在图2中可以看到,上述实施例中,各个机柜的温度都能够稳定在设定温度25摄氏度左右,并且每个时间间隔的变化幅度较平稳。
在实施例中,服务器机房的温度设定,从25摄氏度提高至30摄氏度,数据中心总功率消耗降低量如图4中所示。当温度设定达到30摄氏度时,总功率消耗能够降低5%以上,CRAC能够降低15%以上的功率消耗。
尽管本发明的内容已经通过上述实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (8)

1.一种基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,在每个采样时间内,采用以下步骤进行耗能管理:
1)使用RLS模型估算服务器的功耗;
2)在约束条件下对费用函数进行优化求解,得出最优的Up(k);
3)从Up(k)中选出第一组输入U(k|k)作为真实的控制量U(k);
4)计算需要的活跃服务器个数mj
5)平均分配任务到每个机架。
2.根据权利要求1所述的基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,所述步骤1)的方法是:
a)首先建立热量模型、功率消耗模型以及任务模型;
b)对数据中心功率控制,对所述功率消耗模型做处理能力、负载、功率输入、总功率的限制;
c)基于RLS的热量模型评估。
3.根据权利要求2所述的基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,所述步骤a)中,热量模型的建立方法是:
根据热力学定理,机架j出口的空气温度与机架j输入空气温度,机架j功率消耗的关系为:
根据热力学定理,机架j输入空气温度,同机架j输出空气温度及CRACh输出空气温度的关系为:
同理,根据热力学定理,CRACh出口的空气温度,输入空气温度与CRACh功率消耗,机架j出口的空气温度间关系为:
功率消耗模型的建立方法是:
对于功率消耗模型,由于服务器的功率消耗主要依赖于服务器的两个参数,CPU使用率和频率,假定在每个服务器CPU频率一定的情况下,服务器的功率消耗则主要同CPU使用率相关,同时,假定可以采用开-关服务器以节省服务器能耗的策略,则机架j上功率消耗还和机架j上保持开状态的服务器个数相关,因此,可以对其功率建模为:
任务模型的建立方法是:
考虑Web服务器架构产生的数据请求,前段Web服务器从客户端接收用户请求后,将这些请求分配到不同机架的服务器上进行处理,其中,总请求数为:
L = &Sigma; j = 1 M &lambda; j
根据排队论,对任务请求的平均处理延时为:
D j a = 1 m j &mu; j - &lambda; j ,
考虑到实时性,需要对任务的平均处理延迟进行限制,即其最大值在一定范围内:
D j a &le; D j .
4.根据权利要求3所述的基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,所述步骤b)对功率消耗模型做处理能力、负载、功率输入、总功率的限制的方法是:
对于一般的连续系统而言,其状态空间模型为:
X &CenterDot; = AX + BU ,
Y=WX,
其中 X = [ T out 1 , . . . , T out M , T out 1 , . . . , T out F ] T , Y = [ T in 1 , . . . , T in M ] T , U=[P1,...,PM,P,...,PF]T
对离散系统而言,其状态模型为:
X(k)=ΦX(k-1)+GU(k-1),
Y(k)=WX(k),
其中,是系统的第k个采样周期,该离散系统的模型参数为在该离散系统中,涉及对处理能力、负载、功率输入、总功率限制如下;
(1)处理能力限制
根据任务模型中对服务延迟的限制,将公式变形为:
&lambda; j &le; &mu; j ( m j - 1 &mu; j D j ) , &le; &mu; j ( M j - 1 &mu; j D j )
将其变换为矩阵形式,为:
其中,
Ψ1=(IM×M  OM×F),
(2)负载限制
能够被服务器服务的负载量为:
其中,PA是对应于每个请求的平均功率;
(3)功率输入限制
首先,每个机架的服务器和CRAC的输入功率都是非负的,同时CRAC的输入功
率必须是整数级的,可以对其限制为:
U≥O(M+F)×1
Pj≤Pmax,Pj∈Z+
Pmax是CRAC功率输入的最大允许值,将其变为矩阵形式为:
Ψ3U≤[Pmax]F×1
其中,
Ψ3=(OF×M  IF×F);
(4)总功率限制
机架服务器和CRAC的总功率需求为:
将其变换为矩阵形式为:
Ψ4U≤Pd
其中,Ψ4=[1,…,1]1×(M+F)·,Pd是总功率需求的上界。
5.根据权利要求4所述的基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,所述步骤c)基于RLS的热量模型评估的方法是:使用计算流体力学CFD分析方法,将功率消耗建模为多输入多输出线性模型:
A &OverBar; ( q - 1 ) X ( k ) = B &OverBar; ( q - 1 ) U ( k ) ,
其中,
A &OverBar; ( q - 1 ) = I - Aq - 1 , B &OverBar; ( q - 1 ) = Bq - 1 ,
基于RLS模型,对系统模型进行重写,将其形式变为:
X(k+1)=A(k)φ(k)
其中,
φ(k)=[UT(k),XT(k)]T
X(k)=[B,A],
使用RLS模型,主要用于计算系统矩阵A和B,由于使用的RLS模型,依赖于时间变量,考虑其根据时间的迭代过程为:
E ( k + 1 ) = X ( k + 1 ) - X ^ ( k ) &phi; ( k ) ,
X ^ ( k + 1 ) = X ^ ( k ) + E ( k + 1 ) ( &phi; ) T ( k ) P ( k - 1 ) &lambda; &OverBar; + ( &phi; ) T ( k ) P ( k - 1 ) &phi; ( k ) ,
P - 1 ( k ) = P - 1 ( k - 1 ) + ( 1 + ( &lambda; &OverBar; - 1 ) ( &phi; ) T P ( k - 1 ) &phi; ( k ) [ ( &phi; ) T ( k ) &phi; ( k ) ] 2 ) &phi; ( k ) ( &phi; ) T ( k ) ,
其中表示模型的估计量,E(k+1)表示估测误差向量,P(k)为协方差矩阵,为遗忘因子, 0 < &lambda; &OverBar; < 1 .
6.根据权利要求1所述的基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,所述步骤2)的方法是:使用模型预测控制MPC控制方法进行控制,MPC控制器通过计算控制输入U(k)来最小化下列费用函数:
J ( k ) = &Sigma; s = 1 P Y | | Y ( k + s | k ) - Y T ( k + s | k ) | | Q ( s ) 2 + &Sigma; s = 0 P U - 1 | | U ( k + s | k ) | | R ( s ) 2 ,
其中,PY和PU是状态和输入的预测长度范围,X(k+s|k)是之后第s个采样间隔的状态预测,和U(k+s|k)都是类似的,Q(s)和R(s)是用来对时间误差和输入功率的补偿矩阵,其中||x||Q(s)=xTQ(s)x,该费用函数主要为最小化温度追踪误差和功率需求,即:使功率需求较小的同时,使得不同时间间隔间的温度变化较小,因此,需要在每一个时间间隔中,对该费用函数求解最小值,并满足相应约束条件如下:
&Psi; &OverBar; 2 U = [ LP A ] P U &times; 1 ,
U p ( k ) &GreaterEqual; O P U ( M + F ) &times; 1 , &Psi; &OverBar; 3 U p ( k ) &le; [ P max ] P U F &times; 1 ,
&Psi; &OverBar; 4 U p ( k ) &le; [ P d ] P U &times; 1 ,
Pj∈Z+
其中:
&Psi; &OverBar; 1 = diag [ &Psi; 1 ] , &Psi; &OverBar; 2 = diag [ &Psi; 2 ] , &Psi; &OverBar; 3 = diag [ &Psi; 3 ] , &Psi; &OverBar; 4 = diag [ &Psi; 4 ] - ,
Q=diag[Q(s)],R=diag[R(s)]。
7.根据权利要求1所述的基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,所述步骤4)的方法是:在满足处理能力约束的情况下,应尽可能地减少保持开状态的处理器,因此,设定每次保持开状态的处理器个数为:
并满足限制:
8.根据权利要求1所述的基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,所述步骤5)的方法是:假定每个任务的分配,在各个服务器上是均一的,因此,每个机架上分到的任务数为:
并满足约束: &Sigma; i = 1 m j &lambda; ij = &lambda; j .
CN201410322951.0A 2014-07-08 2014-07-08 基于热负载均衡的数据中心自适应性耗能管理方法 Active CN104158754B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410322951.0A CN104158754B (zh) 2014-07-08 2014-07-08 基于热负载均衡的数据中心自适应性耗能管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410322951.0A CN104158754B (zh) 2014-07-08 2014-07-08 基于热负载均衡的数据中心自适应性耗能管理方法

Publications (2)

Publication Number Publication Date
CN104158754A true CN104158754A (zh) 2014-11-19
CN104158754B CN104158754B (zh) 2017-07-11

Family

ID=51884162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410322951.0A Active CN104158754B (zh) 2014-07-08 2014-07-08 基于热负载均衡的数据中心自适应性耗能管理方法

Country Status (1)

Country Link
CN (1) CN104158754B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105757765A (zh) * 2016-03-16 2016-07-13 上海上塔软件开发有限公司 一种电采暖设备的加热特性建模与能效评估方法
CN106507640A (zh) * 2016-10-13 2017-03-15 内蒙古工业大学 一种绿色数据中心温度感知的服务器管理策略
CN106817909A (zh) * 2015-10-01 2017-06-09 松下知识产权经营株式会社 空调控制方法、空调控制装置以及空调控制程序
CN107683443A (zh) * 2015-06-05 2018-02-09 苹果公司 预测控制系统和方法
CN108334406A (zh) * 2017-12-14 2018-07-27 上海交通大学 基于区域气温差异化的跨数据中心节能负载均衡方法
CN109375994A (zh) * 2018-09-10 2019-02-22 西安交通大学 基于rbf神经网络的数据中心任务温度预测及调度方法
CN110008515A (zh) * 2019-03-07 2019-07-12 青海大学 一种可再生能源数据中心管理方法及装置
CN110068105A (zh) * 2017-12-14 2019-07-30 施耐德电气It公司 用于预测瞬态事件对数据中心的影响的方法和系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102759984A (zh) * 2012-06-13 2012-10-31 上海交通大学 虚拟化服务器集群的电源和性能管理系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102759984A (zh) * 2012-06-13 2012-10-31 上海交通大学 虚拟化服务器集群的电源和性能管理系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
L. PAROLINI等: "a cyber-physical systems approach to data center modeling and control for energy efficiency", 《IEEE》 *
RONGLIANG ZHOU等: "data center cooling management and analysis-a model-based approach", 《28TH IEEE SEMI-THERM SYMPOSIUM》 *
张小庆: "基于云计算环境的资源提供优化方法研究", 《中国优秀博士学位论文全文数据库信息科技辑》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107683443A (zh) * 2015-06-05 2018-02-09 苹果公司 预测控制系统和方法
CN106817909A (zh) * 2015-10-01 2017-06-09 松下知识产权经营株式会社 空调控制方法、空调控制装置以及空调控制程序
CN105757765A (zh) * 2016-03-16 2016-07-13 上海上塔软件开发有限公司 一种电采暖设备的加热特性建模与能效评估方法
CN105757765B (zh) * 2016-03-16 2018-08-24 上海上塔软件开发有限公司 一种电采暖设备的加热特性建模与能效评估方法
CN106507640A (zh) * 2016-10-13 2017-03-15 内蒙古工业大学 一种绿色数据中心温度感知的服务器管理策略
CN108334406A (zh) * 2017-12-14 2018-07-27 上海交通大学 基于区域气温差异化的跨数据中心节能负载均衡方法
CN110068105A (zh) * 2017-12-14 2019-07-30 施耐德电气It公司 用于预测瞬态事件对数据中心的影响的方法和系统
CN110068105B (zh) * 2017-12-14 2022-08-05 施耐德电气It公司 用于预测瞬态事件对数据中心的影响的方法和系统
CN109375994A (zh) * 2018-09-10 2019-02-22 西安交通大学 基于rbf神经网络的数据中心任务温度预测及调度方法
CN110008515A (zh) * 2019-03-07 2019-07-12 青海大学 一种可再生能源数据中心管理方法及装置
CN110008515B (zh) * 2019-03-07 2021-07-13 青海大学 一种可再生能源数据中心管理方法及装置

Also Published As

Publication number Publication date
CN104158754B (zh) 2017-07-11

Similar Documents

Publication Publication Date Title
CN104158754A (zh) 基于热负载均衡的数据中心自适应性耗能管理方法
Gai et al. Efficiency-aware workload optimizations of heterogeneous cloud computing for capacity planning in financial industry
Shi et al. Energy efficient building HVAC control algorithm with real-time occupancy prediction
CN109714400B (zh) 一种面向容器集群的能耗优化资源调度系统及其方法
CN104698843B (zh) 一种基于模型预测控制的数据中心节能控制方法
Forouzandehmehr et al. Autonomous demand response using stochastic differential games
Mukherjee et al. Spatio-temporal thermal-aware job scheduling to minimize energy consumption in virtualized heterogeneous data centers
EP2277092B1 (en) Arrangement for managing data center operations to increase cooling efficiency
Tang et al. Sensor-based fast thermal evaluation model for energy efficient high-performance datacenters
Van Damme et al. Optimized thermal-aware job scheduling and control of data centers
Zhang et al. Joint parallel offloading and load balancing for cooperative-MEC systems with delay constraints
WO2016009311A1 (en) System and method for electronic work prediction and dynamically adjusting server resources
CN104991830A (zh) 基于服务等级协议的yarn资源分配和节能调度方法及系统
Yao et al. Adaptive power management through thermal aware workload balancing in internet data centers
Dong et al. A distributed parallel genetic algorithm of placement strategy for virtual machines deployment on cloud platform
Ran et al. Optimizing energy efficiency for data center via parameterized deep reinforcement learning
Song et al. An efficient scheduling algorithm for energy consumption constrained parallel applications on heterogeneous distributed systems
Shamalizadeh et al. Optimized thermal-aware workload distribution considering allocation constraints in data centers
Zhao et al. Ensuring DNN Solution Feasibility for Optimization Problems with Linear Constraints
Obando et al. A centre–free approach for resource allocation with lower bounds
Ogura et al. Model predictive control for energy-efficient operations of data centers with cold aisle containments
Chisca et al. On energy-and cooling-aware data centre workload management
Tang et al. iGreen: green scheduling for peak demand minimization
Vakilian et al. Enhancing users' quality of experienced with minimum energy consumption by fog nodes cooperation in Internet of Things
Carnerero et al. Particle based optimization for predictive energy efficient data center management

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant