CN113962142B - 一种基于两段式lstm的数据中心温度预测方法及系统 - Google Patents
一种基于两段式lstm的数据中心温度预测方法及系统 Download PDFInfo
- Publication number
- CN113962142B CN113962142B CN202111131700.0A CN202111131700A CN113962142B CN 113962142 B CN113962142 B CN 113962142B CN 202111131700 A CN202111131700 A CN 202111131700A CN 113962142 B CN113962142 B CN 113962142B
- Authority
- CN
- China
- Prior art keywords
- server
- temperature
- air inlet
- lstm
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 26
- 230000008859 change Effects 0.000 claims abstract description 20
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 238000013527 convolutional neural network Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 9
- 230000015556 catabolic process Effects 0.000 abstract description 4
- 238000006731 degradation reaction Methods 0.000 abstract description 4
- 238000004590 computer program Methods 0.000 description 10
- 238000001816 cooling Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000020169 heat generation Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000017525 heat dissipation Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/08—Thermal analysis or thermal optimisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Air Conditioning Control Device (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于两段式LSTM的数据中心温度预测方法及系统,使用K‑mean算法进行服务器聚类得到训练数据;针对服务器资源占用率建立最短时间周期的资源占用预测模型;建立针对服务器入风口温度的最长时间周期的温度预测模型构成两段式LSTM预测模型,将资源占用预测模型的预测结果作为温度预测模型输入的一部分,使用训练数据训练两段式LSTM预测模型直至收敛,将服务器CPU利用率、服务器入风口温度历史数据,空调出风口历史数据输入收敛后的两段式LSTM预测模型中,输出预测温度。本发明通过服务器聚类降低服务器间差异导致的模型退化,并通过两段式LSTM预测模型匹配不同来源数据的不同变化规律,提高数据中心温度预测的精度。
Description
技术领域
本发明属于数据中心温度预测技术领域,具体涉及一种基于两段式LSTM的数据中心温度预测方法及系统。
背景技术
近年来随着移动互联网的发展,互联网数据量呈现爆炸式增长,越来越多的互联网业务也都基于对大数据的分析。这些都导致了对计算资源的需求飞速提升。单机的计算能力已经不能满足需求。因此云计算应运而生。云计算是分布式计算、并行计算、虚拟化、负载均衡等传统计算机和网络技术发展融合的产物。云计算将大量的服务器通过虚拟机技术虚拟为一个个计算资源节点,用户无需关心硬件的实现和维护,只需要在云端购买计算资源,即可快速的获取自己所需的资源。而云计算的背后离不开数据中心的支撑。数据中心是由数万台服务器,数百台网络设备,以及冷却设备、供电设备等构成。而且设备数量随着云计算的发展仍在继续增长。随着这些平台的规模和复杂性的不断增长,数据中心系统的可靠性成为一个主要问题。
数据中心热安全是保证数据中心稳定运行的必要条件。一旦IT设备发生过热,IT设备出于保护目的会进入停机状态,可能会导致数据丢失。当自动保护机制失效时,甚至可能导致火灾的发生,造成严重的后果。因此对于IT的温度感知非常重要。同时IT设备的温度也是IT设备发热量的特征数据,也影响着冷却设备的工作状态从而影响冷却设备的能耗。因此,任何对数据中心的控制都离不开热安全的约束。然而,数据中心中设备种类多、布局多变,导致了各设备间存在复杂的热耦合关系。如何准确的建模数据中心热耦合关系受到了研究界广泛的关注。
服务器入风口温度是国家标准和美国标准中衡量服务器热安全的主要指标。因此本专利主要关注的是服务器入风口温度。传统的基于温度感知的方法是通过对服务器入风口温度的动态监控,当发现服务器入风口温度超出限制时,通过任务动态迁移等方法将服务器负载降低,从而避免服务器过热。但是这种基于反馈的方法首先存在反馈滞后性的问题,其次任务迁移会导致服务质量降低,存在违反服务级别协议(Service LevelAgreement,SLA)的风险。而基于温度预测的方法,可以提前感知服务器的过热,避免分配更多任务给过热服务器,减少任务的再迁移,保证服务质量。对于服务器的入风口温度的预测是非常有必要的。同时,温度预测方法可以建模冷却设备和服务器的热耦合关系,为在保证服务器热安全的前提下调控冷却设备提供了途径。因此温度预测对于数据中心来说十分重要。
传统的数据中心热预测模型大多是基于CFD仿真的。但是,CFD仿真计算开销非常大,运行时间长,而且对空间环境依赖性强,需要专家对数据中心机房准确的进行建模。因此并不适合在线实时温度预测,不能适应数据中心管理需求。
随着机器学习的发展,基于数据驱动的温度预测方法越发成熟,受到了广泛的关注。但是现存的基于数据驱动的温度预测方法仍然存在着预测精度低,没有考虑数据中心布局和物理属性的问题。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于两段式LSTM的数据中心温度预测方法及系统,通过服务器聚类降低了服务器间差异导致的模型预测精度降低,并通过两段式LSTM匹配了不同来源数据的不同变化规律,提高了数据中心温度预测的精度。
本发明采用以下技术方案:
一种基于两段式LSTM的数据中心温度预测方法,定义温度序列A和温度序列B,根据温度对服务器入风口温度历史数据,基于sDTW距离计算公式,使用K-mean算法进行服务器聚类,得到各个类簇的数据作为训练数据;
针对服务器资源占用率建立一个最短时间周期的资源占用预测模型;再建立一个针对服务器入风口温度的最长时间周期的温度预测模型,构成两段式LSTM预测模型,将资源占用预测模型的预测结果作为温度预测模型输入的一部分,使用训练数据训练两段式LSTM预测模型直至收敛,将服务器CPU利用率、服务器入风口温度历史数据,空调出风口历史数据输入收敛后的两段式LSTM预测模型中,输出预测温度。
具体的,温度序列A为A={a1,a2,…,ai,…,aN},温度序列B为B={b1,b2,…,bj,…,bM},下标表示时间点。
具体的,温度序列A和温度序列B的两个数据点之间的距离M(ai,bj)为:
M(ai,bj)=E(ai,bj)
其中,E(ai,bj)为ai与bj的欧式距离,L(aN,bM)是以aN和bM为结束点的序列的距离;L(a1,b1)=M(a1,b1),γ是一个常数。
具体的,使用K-mean算法进行服务器聚类具体为:
随机初始化k个聚类中心;计算每个服务器的入风口温度数据与聚类中心之间的sDTW距离;每个服务器的入风口温度数据属于距离最近的聚类中心代表的类;求每个类中服务器的入风口温度数据的平均值作为此类的聚类中心;重复以上步骤至聚类中心不变或超过迭代阈值;每个类中包含的服务器作为一个类簇,数据共同用于训练一个预测模型。
具体的,两段式LSTM预测模型中,第一段LSTM预测模型用于捕捉时间常数最小的CPU利用率变化数据,第二段LSTM预测模型中引入卷积神经网络用于捕捉时间常数最大的其余变量的变化数据。
进一步的,第一段LSTM预测模型将服务器的CPU历史利用率作为输入,输出预测视野后的服务器CPU利用率,第一段LSTM预测模型的预测表示为:
u(t+ph)=f1(u(t-ts),u(t-ts+1),…,u(t))
其中,u(t+ph)为服务器t+ph时刻的CPU利用率,f1为第一段LSTM模型的非线性映射,u(t-ts)为服务器t-ts时刻的CPU利用率,u(t-ts+1)为服务器t-ts+1时刻的CPU利用率,u(t)为服务器t时刻的CPU利用率。
具体的,第二段LSTM预测模型将第一段LSTM预测模型的输出,服务器的历史入风口温度、服务器上下两个服务器的历史入风口温度、CRAC历史设定温度作为输入,输出服务器预测视野后的入风口温度。
进一步的,首先将服务器的历史入风口温度、服务器上下两个服务器的历史入风口温度输入到一个卷积核大小为3,卷积核数目为timesteps整数倍的1D-CNN中,以捕捉温度间的空间关系,然后将1D-CNN网络的输出、第一段LSTM预测模型的输出和CRAC历史设定温度合并作为LSTM网络的输入,将第一段LSTM预测模型的输出复制扩展至长timesteps的向量,将1D-CNN网络的输出变形成为长timesteps的向量。
更进一步的,第二段LSTM的预测表示为
其中,(t+ph)为服务器t+ph时刻的入风口温度,f2为第二段LSTM的非线性映射,fcnn为CNN模型的非线性映射,u1(t+ph),u2(t+ph),…,uts(t+ph)为ts个第一段LSTM模型的温度预测结果,T(t-ts+1)为服务器t-ts+1时刻的入风口温度,T(t-ts+2)为服务器t-ts+2时刻的入风口温度,T(t)为服务器t时刻的入风口温度,T+1(t-ts+1)为上方服务器t-ts+1时刻的入风口温度,T+1(t-ts+2)为上方服务器t-ts+2时刻的入风口温度,T+1(t)为上方服务器t时刻的入风口温度,T-1(t-ts+1)为下方服务器t-ts+1时刻的入风口温度,T-1(t-ts+2)为下方服务器t-ts+2时刻的入风口温度,T-1(t)为下方服务器t时刻的入风口温度,c(t-ts+1)为空调t-ts+1时刻的出风口温度,c(c-ts+2)为空调t-ts+2时刻的出风口温度,c(t)为空调t时刻的出风口温度。
本发明的另一技术方案是,一种基于两段式LSTM的数据中心温度预测系统,包括:
聚类模块,定义温度序列A和温度序列B,根据温度对服务器入风口温度历史数据,基于sDTW距离计算公式,使用K-mean算法进行服务器聚类,得到各个类簇的数据作为训练数据;
预测模块,针对服务器资源占用率建立一个最短时间周期的资源占用预测模型;再建立一个针对服务器入风口温度的最长时间周期的温度预测模型,构成两段式LSTM预测模型,将资源占用预测模型的预测结果作为温度预测模型输入的一部分,使用聚类模块得到的训练数据训练两段式LSTM预测模型直至收敛,将服务器CPU利用率、服务器入风口温度历史数据,空调出风口历史数据输入收敛后的两段式LSTM预测模型中,输出预测温度。
与现有技术相比,本发明至少具有以下有益效果:
本发明一种基于两段式LSTM的数据中心温度预测方法,针对数据中心中机房布局复杂,服务器型号和规格各异,不同服务器存在不同的产热模式的问题。首先根据服务器入风口温度数据对服务器进行聚类,每个类簇训练一个温度预测模型,相比于全局模型提高了预测精度。进一步的,在聚类方法中充分考虑了服务器入风口温度数据是时序数据的特点,基于sDTW对其距离进行衡量,提高了聚类精度,首先预测CPU利用率,然后考虑温度特征进一步的预测温度,提高了温度预测精度。
进一步的,定义温度序列A={a1,a2,…,ai,…,aN}和温度序列B={b1,b2,…,bj,…,bM},用于计算温度序列间的sDTW距离。
进一步的,通过计算温度序列间的sDTW距离,解决了传统欧式距离对于温度序列这种具有关联性、滞后性的时间序列距离衡量不准确的问题,提高了聚类精度。
进一步的,通过K-means算法对服务器进行聚类,解决了不同模式的服务器其数据的差异过大导致模型退化,预测精度下降的问题
进一步的,CPU利用率和温度具有不同的变化周期,使用同一个LSTM模型进行模式捕捉会降低模型预测精度。通过两段式LSTM模型分别进行拟合,提高了预测精度。而且在第二段预测模型中引入CNN以考虑服务器空间布局,提高了预测精度。
进一步的,第一段LSTM预测模型用于捕捉时间常数小的CPU利用率变化规律,并将预测结果提供给第二段LSTM模型以补充预测视野之后的信息,提高预测精度。
进一步的,第二段LSTM预测模型用于捕捉时间常数大的温度变化规律,并结合第一段LSTM预测模型提供了预测视野后的CPU利用率信息,提高预测精度。
进一步的,通过卷积核为3的CNN模型捕捉服务器和上下两个服务器三个服务器温度变化的空间关系,提高预测精度。
综上所述,本发明首先通过服务器聚类解决了不同模式服务器其数据共同训练模型导致的模型退化、预测精度下降问题,并采取sDTW方法衡量距离,降低了温度序列距离的计算误差。通过K-means聚类方法进行聚类,提高了聚类精度,然后使用每个类簇的数据训练一个属于当前类簇的基于两段式LSTM的温度预测模型,第一段LSTM预测模型捕捉了时间常数小的CPU利用率变化规律,第二段LSTM预测模型捕捉时间常数大的温度变化规律,并使用CNN捕捉了服务器间温度变化的空间规律,相比于之前基于单段式LSTM的预测模型提高了预测精度,有助于保障数据中心运行安全和数据中心节能减排。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明流程示意图;
图2为本发明两段式LSTM预测模型结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在附图中示出了根据本发明公开实施例的各种结构示意图。这些图并非是按比例绘制的,其中为了清楚表达的目的,放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
数据中心负载具有规律性,服务器入风口温度具有时间序列相关性,而LSTM网络对长时间周期相关性和短时间相关性周期都可以较好地提取特征,是建立温度预测模型良好的基元。
在数据中心中,服务器和冷却设备的响应周期并不相同。现代服务器的CPU频率高达数GHz,因此服务器CPU占用率变化时间周期非常短,最快可以达到毫秒以下。数据中心中热交换的形式主要是对流,其速度相对缓慢。服务器产生的热量可能要经过一段时间才会被冷却设备感知到,因此冷却设备的响应周期相对较长,可以是数分钟。而服务器的热功率受到其资源占用率直接影响。服务器热功率的变化又会引起服务器和冷却设备的变化。
此外,服务器入风口温度也会受到其周边服务器入风口温度的影响,这一影响与服务器的空间布局有关。
本发明提供了一种基于两段式LSTM的数据中心温度预测方法,首先对服务器根据温度进行聚类;然后使用两段式的预测模型进行温度预测;在两段式预测模型中,首先针对服务器资源占用率建立一个短时间周期的资源占用预测模型;然后建立一个针对服务器入风口温度的长时间周期的温度预测模型,并将前一个模型预测结果作为温度预测模型输入的一部分,从而提高了温度预测精度。
请参阅图1,本发明一种基于两段式LSTM的数据中心温度预测方法,包括以下步骤:
S1、服务器聚类
在数据中心中机房布局非常复杂,机柜距离CARC的距离各不相同。而且在底部送风机房中,服务器的散热效果还会部分受到距离地板高度的影响。此外,从作业调度的角度出发,不同服务器可能存在不同的调度偏好,从而存在不同的产热模式。而且,数据中心中可能存在不同规格的服务器和CRAC,这进一步加大了不同服务器入风口温度模式的差异。因此,首先对服务器根据其入风口温度历史数据进行聚类,每个类簇单独训练一个两段式预测模型以提高预测精度。
定义温度序列A为A={a1,a2,…,ai,…,aN},温度序列B为B={b1,b2,…,bj,…,bM},下标表示时间点。
由此定义温度序列A和温度序列B的两个数据点之间的距离M(ai,bj)为:
M(ai,bj)=E(ai,bj)
其中,L(aN,bM)是以aN和bM为结束点的序列的距离;L(a1,b1)=M(a1,b1)。γ是一个常数。
然后基于sDTW距离计算公式,使用K-mean算法进行服务器聚类,聚类算法伪代码如表1所示。
表1基于sDTW的K-means聚类算法伪代码
S2、基于LSTM的两段式预测模型
影响服务器入风口温度的因素主要有服务器CPU利用率、服务器入风口历史温度、CRAC出风口温度,以及上下两个服务器的入风口温度。其中服务器CPU利用率直接决定了服务器的发热量,而且CPU利用率的变化速度很快,时间常数较小。其余几个因素是通过热对流影响服务器入风口温度,因此变化速度较慢,时间常数较大。
因此,本发明提出了一种两段式LSTM预测模型,具体为:
第一段LSTM预测模型用于捕捉时间常数较小的CPU利用率的变化;第二段LSTM预测模型用于捕捉时间常数较大的其余变量的变化。
此外,考虑到服务器入风口温度和其上下两个服务器的入风口温度间的关系受空间布局的影响,因此在第二段LSTM预测模型中引入卷积神经网络(Convolutional NeuralNetworks,CNN)用于捕捉空间关系,模型结构图见图2所示。
第一段LSTM预测模型将服务器的CPU历史利用率作为输入,输出预测视野后的服务器CPU利用率。因此第一段LSTM预测模型的预测表示为:
u(t+ph)=f1(u(t-ts),u(t-ts+1),…,u(t))
第二段LSTM预测模型将第一段LSTM预测模型的输出,服务器的历史入风口温度、服务器上下两个服务器的历史入风口温度、CRAC历史设定温度作为输入,输出服务器预测视野后的入风口温度。
首先将服务器的历史入风口温度、服务器上下两个服务器的历史入风口温度输入到一个卷积核大小为3,卷积核数目为timesteps整数倍的1D-CNN中,以步骤温度间的空间关系。然后将1D-CNN网络的输出、第一段LSTM预测模型的输出和CRAC历史设定温度合并作为LSTM网络的输入。由于LSTM网络的输入是[samples,timesteps,features]形式的三维矩阵,因此需要将第一段LSTM的输出复制扩展至长timesteps的向量,将1D-CNN网络的输出变形成为长timesteps的向量,以便和其余输入向量对齐。
因此第二段LSTM的预测表示为
机柜顶(底)的服务器的上(下)方是没有服务器的,对于这种服务器,在预测时设定一个虚拟服务器作为上(下)方服务器,其数据使用被预测服务器的数据。
本发明再一个实施例中,提供一种基于两段式LSTM的数据中心温度预测系统,该系统能够用于实现上述基于两段式LSTM的数据中心温度预测方法,具体的,该基于两段式LSTM的数据中心温度预测系统包括聚类模块以及预测模块。
其中,聚类模块,定义温度序列A和温度序列B,根据温度对服务器入风口温度历史数据,基于sDTW距离计算公式,使用K-mean算法进行服务器聚类,得到各个类簇的数据作为训练数据;
预测模块,针对服务器资源占用率建立一个最短时间周期的资源占用预测模型;再建立一个针对服务器入风口温度的最长时间周期的温度预测模型,构成两段式LSTM预测模型,将资源占用预测模型的预测结果作为温度预测模型输入的一部分,使用聚类模块得到的训练数据训练两段式LSTM预测模型直至收敛,将服务器CPU利用率、服务器入风口温度历史数据,空调出风口历史数据输入收敛后的两段式LSTM预测模型中,输出预测温度。
本发明再一个实施例中,提供了一种终端设备,该终端设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于基于两段式LSTM的数据中心温度预测方法的操作,包括:
定义温度序列A和温度序列B,根据温度对服务器入风口温度历史数据,基于sDTW距离计算公式,使用K-mean算法进行服务器聚类,得到各个类簇的数据作为训练数据;针对服务器资源占用率建立一个最短时间周期的资源占用预测模型;再建立一个针对服务器入风口温度的最长时间周期的温度预测模型,构成两段式LSTM预测模型,将资源占用预测模型的预测结果作为温度预测模型输入的一部分,使用训练数据训练两段式LSTM预测模型直至收敛,将服务器CPU利用率、服务器入风口温度历史数据,空调出风口历史数据输入收敛后的两段式LSTM预测模型中,输出预测温度。
本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是终端设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括终端设备中的内置存储介质,当然也可以包括终端设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关基于两段式LSTM的数据中心温度预测方法的相应步骤;计算机可读存储介质中的一条或一条以上指令由处理器加载并执行如下步骤:
定义温度序列A和温度序列B,根据温度对服务器入风口温度历史数据,基于sDTW距离计算公式,使用K-mean算法进行服务器聚类,得到各个类簇的数据作为训练数据;针对服务器资源占用率建立一个最短时间周期的资源占用预测模型;再建立一个针对服务器入风口温度的最长时间周期的温度预测模型,构成两段式LSTM预测模型,将资源占用预测模型的预测结果作为温度预测模型输入的一部分,使用训练数据训练两段式LSTM预测模型直至收敛,将服务器CPU利用率、服务器入风口温度历史数据,空调出风口历史数据输入收敛后的两段式LSTM预测模型中,输出预测温度。
综上所述,本发明一种基于两段式LSTM的数据中心温度预测方法及系统,通过服务器聚类降低服务器间差异导致的模型退化,并通过两段式LSTM预测模型匹配不同来源数据的不同变化规律,提高数据中心温度预测的精度。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。
Claims (5)
1.一种基于两段式LSTM的数据中心温度预测方法,其特征在于,定义温度序列A和温度序列B,根据温度对服务器入风口温度历史数据,基于sDTW距离计算公式,使用K-mean算法进行服务器聚类,得到各个类簇的数据作为训练数据;
针对服务器资源占用率建立一个最短时间周期的资源占用预测模型;再建立一个针对服务器入风口温度的最长时间周期的温度预测模型,构成两段式LSTM预测模型,将资源占用预测模型的预测结果作为温度预测模型输入的一部分,使用训练数据训练两段式LSTM预测模型直至收敛,将服务器CPU利用率、服务器入风口温度历史数据,空调出风口历史数据输入收敛后的两段式LSTM预测模型中,输出预测温度;
两段式LSTM预测模型中,第一段LSTM预测模型用于捕捉时间常数最小的CPU利用率变化数据,第二段LSTM预测模型中引入卷积神经网络用于捕捉时间常数最大的其余变量的变化数据,第一段LSTM预测模型将服务器的CPU历史利用率作为输入,输出预测视野后的服务器CPU利用率,第一段LSTM预测模型的预测表示为:
u(t+ph)=f1(u(t-ts),u(t-ts+1),…,u(t))
其中,u(t+ph)为服务器t+ph时刻的CPU利用率,f1为第一段LSTM模型的非线性映射,u(t-ts)为服务器t-ts时刻的CPU利用率,u(t-ts+1)为服务器t-ts+1时刻的CPU利用率,u(t)为服务器t时刻的CPU利用率;
第二段LSTM预测模型将第一段LSTM预测模型的输出,服务器的历史入风口温度、服务器上下两个服务器的历史入风口温度、CRAC历史设定温度作为输入,输出服务器预测视野后的入风口温度,首先将服务器的历史入风口温度、服务器上下两个服务器的历史入风口温度输入到一个卷积核大小为3,卷积核数目为timesteps整数倍的1D-CNN中,以捕捉温度间的空间关系,然后将1D-CNN网络的输出、第一段LSTM预测模型的输出和CRAC历史设定温度合并作为LSTM网络的输入,将第一段LSTM预测模型的输出复制扩展至长timesteps的向量,将1D-CNN网络的输出变形成为长timesteps的向量,第二段LSTM的预测表示为
其中,(t+ph)为服务器t+ph时刻的入风口温度,f2为第二段LSTM的非线性映射,fcnn为CNN模型的非线性映射,u1(t+ph),u2(t+ph),…,uts(t+ph)为ts个第一段LSTM模型的温度预测结果,T(t-ts+1)为服务器t-ts+1时刻的入风口温度,T(t-ts+2)为服务器t-ts+2时刻的入风口温度,T(t)为服务器t时刻的入风口温度,T+1(t-ts+1)为上方服务器t-ts+1时刻的入风口温度,T+1(t-ts+2)为上方服务器t-ts+2时刻的入风口温度,T+1(t)为上方服务器t时刻的入风口温度,T-1(t-ts+1)为下方服务器t-ts+1时刻的入风口温度,T-1(t-ts+2)为下方服务器t-ts+2时刻的入风口温度,T-1(t)为下方服务器t时刻的入风口温度,c(t-ts+1)为空调t-ts+1时刻的出风口温度,c(c-ts+2)为空调t-ts+2时刻的出风口温度,c(t)为空调t时刻的出风口温度。
2.根据权利要求1所述的方法,其特征在于,温度序列A为A={a1,a2,…,ai,…,aN},温度序列B为B={b1,b2,…,bj,…,bM},下标表示时间点。
3.根据权利要求2所述的方法,其特征在于,温度序列A和温度序列B的两个数据点之间的距离M(ai,bj)为:
M(ai,bj)=E(ai,bj)由此定义序列A和序列B的sDTW距离L(aN,bM)为
其中,E(ai,bj)为ai与bj的欧式距离,L(aN,bM)是以aN和bM为结束点的序列的距离;L(a1,b1)=M(a1,b1),γ是一个常数。
4.根据权利要求1所述的方法,其特征在于,使用K-mean算法进行服务器聚类具体为:
随机初始化k个聚类中心;计算每个服务器的入风口温度数据与聚类中心之间的sDTW距离;每个服务器的入风口温度数据属于距离最近的聚类中心代表的类;求每个类中服务器的入风口温度数据的平均值作为此类的聚类中心;重复以上步骤至聚类中心不变或超过迭代阈值;每个类中包含的服务器作为一个类簇,数据共同用于训练一个预测模型。
5.一种基于两段式LSTM的数据中心温度预测系统,其特征在于,包括:
聚类模块,定义温度序列A和温度序列B,根据温度对服务器入风口温度历史数据,基于sDTW距离计算公式,使用K-mean算法进行服务器聚类,得到各个类簇的数据作为训练数据;
预测模块,针对服务器资源占用率建立一个最短时间周期的资源占用预测模型;再建立一个针对服务器入风口温度的最长时间周期的温度预测模型,构成两段式LSTM预测模型,将资源占用预测模型的预测结果作为温度预测模型输入的一部分,使用聚类模块得到的训练数据训练两段式LSTM预测模型直至收敛,将服务器CPU利用率、服务器入风口温度历史数据,空调出风口历史数据输入收敛后的两段式LSTM预测模型中,输出预测温度;
两段式LSTM预测模型中,第一段LSTM预测模型用于捕捉时间常数最小的CPU利用率变化数据,第二段LSTM预测模型中引入卷积神经网络用于捕捉时间常数最大的其余变量的变化数据,第一段LSTM预测模型将服务器的CPU历史利用率作为输入,输出预测视野后的服务器CPU利用率,第一段LSTM预测模型的预测表示为:
u(t+ph)=f1(u(t-ts),u(t-ts+1),…,u(t))
其中,u(t+ph)为服务器t+ph时刻的CPU利用率,f1为第一段LSTM模型的非线性映射,u(t-ts)为服务器t-ts时刻的CPU利用率,u(t-ts+1)为服务器t-ts+1时刻的CPU利用率,u(t)为服务器t时刻的CPU利用率;
第二段LSTM预测模型将第一段LSTM预测模型的输出,服务器的历史入风口温度、服务器上下两个服务器的历史入风口温度、CRAC历史设定温度作为输入,输出服务器预测视野后的入风口温度,首先将服务器的历史入风口温度、服务器上下两个服务器的历史入风口温度输入到一个卷积核大小为3,卷积核数目为timesteps整数倍的1D-CNN中,以捕捉温度间的空间关系,然后将1D-CNN网络的输出、第一段LSTM预测模型的输出和CRAC历史设定温度合并作为LSTM网络的输入,将第一段LSTM预测模型的输出复制扩展至长timesteps的向量,将1D-CNN网络的输出变形成为长timesteps的向量,第二段LSTM的预测表示为
其中,(t+ph)为服务器t+ph时刻的入风口温度,f2为第二段LSTM的非线性映射,fcnn为CNN模型的非线性映射,u1(t+ph),u2(t+ph),…,uts(t+ph)为ts个第一段LSTM模型的温度预测结果,T(t-ts+1)为服务器t-ts+1时刻的入风口温度,T(t-ts+2)为服务器t-ts+2时刻的入风口温度,T(t)为服务器t时刻的入风口温度,T+1(t-ts+1)为上方服务器t-ts+1时刻的入风口温度,T+1(t-ts+2)为上方服务器t-ts+2时刻的入风口温度,t+1(t)为上方服务器t时刻的入风口温度,T-1(t-ts+1)为下方服务器t-ts+1时刻的入风口温度,T-1(t-ts+2)为下方服务器t-ts+2时刻的入风口温度,T-1(t)为下方服务器t时刻的入风口温度,c(t-ts+1)为空调t-ts+1时刻的出风口温度,c(c-ts+2)为空调t-ts+2时刻的出风口温度,c(t)为空调t时刻的出风口温度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111131700.0A CN113962142B (zh) | 2021-09-26 | 2021-09-26 | 一种基于两段式lstm的数据中心温度预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111131700.0A CN113962142B (zh) | 2021-09-26 | 2021-09-26 | 一种基于两段式lstm的数据中心温度预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113962142A CN113962142A (zh) | 2022-01-21 |
CN113962142B true CN113962142B (zh) | 2024-04-19 |
Family
ID=79462273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111131700.0A Active CN113962142B (zh) | 2021-09-26 | 2021-09-26 | 一种基于两段式lstm的数据中心温度预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113962142B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114528083B (zh) * | 2022-02-17 | 2023-03-21 | 珠海星云智联科技有限公司 | 数据处理单元dpu业务数据的调度处理方法及相关产品 |
CN115685941B (zh) * | 2022-11-04 | 2023-06-13 | 中国电子工程设计院有限公司 | 一种基于机柜热点温度预测的机房运行调控方法及装置 |
CN116127840B (zh) * | 2023-01-05 | 2023-09-22 | 无锡钊源电力电子有限公司 | 一种基于数据驱动的数据中心负荷预测方法 |
CN116820214B (zh) * | 2023-08-30 | 2024-01-05 | 深圳智锐通科技有限公司 | 一种服务器通风散热智能调控方法及系统 |
CN116963482B (zh) * | 2023-09-21 | 2023-12-05 | 广东云下汇金科技有限公司 | 一种基于数据中心暖通系统的智能化节能方法及相关设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020206705A1 (zh) * | 2019-04-10 | 2020-10-15 | 山东科技大学 | 一种基于集群节点负载状态预测的作业调度方法 |
CN111914873A (zh) * | 2020-06-05 | 2020-11-10 | 华南理工大学 | 一种两阶段云服务器无监督异常预测方法 |
CN112433927A (zh) * | 2020-11-30 | 2021-03-02 | 西安理工大学 | 基于时间序列聚类和lstm的云服务器老化预测方法 |
-
2021
- 2021-09-26 CN CN202111131700.0A patent/CN113962142B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020206705A1 (zh) * | 2019-04-10 | 2020-10-15 | 山东科技大学 | 一种基于集群节点负载状态预测的作业调度方法 |
CN111914873A (zh) * | 2020-06-05 | 2020-11-10 | 华南理工大学 | 一种两阶段云服务器无监督异常预测方法 |
CN112433927A (zh) * | 2020-11-30 | 2021-03-02 | 西安理工大学 | 基于时间序列聚类和lstm的云服务器老化预测方法 |
Non-Patent Citations (2)
Title |
---|
LSTM在煤矿瓦斯预测预警系统中的应用与设计;李伟山;王琳;卫晨;;西安科技大学学报(06);全文 * |
基于长短期记忆网络(LSTM)的数据中心温度预测算法;徐一轩;伍卫国;王思敏;胡壮;崔舜;;计算机技术与发展(12);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113962142A (zh) | 2022-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113962142B (zh) | 一种基于两段式lstm的数据中心温度预测方法及系统 | |
Seghir et al. | A hybrid approach using genetic and fruit fly optimization algorithms for QoS-aware cloud service composition | |
Kang et al. | Neurosurgeon: Collaborative intelligence between the cloud and mobile edge | |
Hossain et al. | A belief rule based expert system for datacenter PUE prediction under uncertainty | |
US20220391771A1 (en) | Method, apparatus, and computer device and storage medium for distributed training of machine learning model | |
US10175745B2 (en) | Optimizing power consumption by dynamic workload adjustment | |
Tuli et al. | HUNTER: AI based holistic resource management for sustainable cloud computing | |
CN104137660B (zh) | 用于在电子系统中预测温度值的系统和方法 | |
Wang et al. | Accelerating federated learning with cluster construction and hierarchical aggregation | |
Yi et al. | Efficient compute-intensive job allocation in data centers via deep reinforcement learning | |
Chen et al. | Resource allocation with workload-time windows for cloud-based software services: a deep reinforcement learning approach | |
WO2018017245A1 (en) | Performance provisioning using machine learning based automated workload classification | |
CN111881358B (zh) | 一种对象推荐系统、方法、装置、电子设备和存储介质 | |
Zhang et al. | Two-phase industrial manufacturing service management for energy efficiency of data centers | |
Li et al. | Research on QoS service composition based on coevolutionary genetic algorithm | |
US20230368028A1 (en) | Automated machine learning pre-trained model selector | |
CN115718826A (zh) | 图结构数据中的目标节点分类方法、系统、设备及介质 | |
Wang et al. | Toward physics-guided safe deep reinforcement learning for green data center cooling control | |
Aghasi et al. | A decentralized adaptation of model-free Q-learning for thermal-aware energy-efficient virtual machine placement in cloud data centers | |
CN103984588B (zh) | 一种基于温度的虚拟机迁移方法及其系统 | |
CN113158435B (zh) | 基于集成学习的复杂系统仿真运行时间预测方法与设备 | |
Zhang et al. | DRL-S: Toward safe real-world learning of dynamic thermal management in data center | |
CN113776122A (zh) | 供热控制方法、装置、设备、介质和产品 | |
CN111083201B (zh) | 一种工业物联网中数据驱动制造服务的节能资源分配方法 | |
Deng et al. | A MapReduce‐based parallel K‐means clustering for large‐scale CIM data verification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |