CN115860277A - 一种数据中心能耗预测方法及系统 - Google Patents
一种数据中心能耗预测方法及系统 Download PDFInfo
- Publication number
- CN115860277A CN115860277A CN202310164998.8A CN202310164998A CN115860277A CN 115860277 A CN115860277 A CN 115860277A CN 202310164998 A CN202310164998 A CN 202310164998A CN 115860277 A CN115860277 A CN 115860277A
- Authority
- CN
- China
- Prior art keywords
- data center
- energy consumption
- data
- component
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005265 energy consumption Methods 0.000 title claims abstract description 76
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000005215 recombination Methods 0.000 claims abstract description 44
- 230000006798 recombination Effects 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 43
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 21
- 238000005516 engineering process Methods 0.000 claims abstract description 7
- 238000012795 verification Methods 0.000 claims description 29
- 238000000354 decomposition reaction Methods 0.000 claims description 21
- 230000010354 integration Effects 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 abstract description 57
- 230000005611 electricity Effects 0.000 abstract description 6
- 230000007787 long-term memory Effects 0.000 abstract description 6
- 230000006403 short-term memory Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 4
- 238000012731 temporal analysis Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000000700 time series analysis Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种数据中心能耗预测方法及系统,涉及IT基础领域。该方法包括:获取数据中心历史能耗数据;所述数据中心历史能耗数据为数据中心IT机房用电负荷;运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量;重组不同尺度的所述固有模态分量,生成多个本征模态函数重组组合;构建堆叠式LSTM网络,并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络,并利用训练后的堆叠式LSTM网络预测新的模态分量;重构所述新的模态分量,预测未来的数据中心IT机房用电负荷。本发明能够避免将历史用电数据直接输入长短期记忆网络导致的滞后现象,降低预测误差。
Description
技术领域
本发明涉及IT基础领域,特别是涉及一种数据中心能耗预测方法及系统。
背景技术
经验模态分解(empirical mode decomposition,EMD)是一种新的处理非平稳信号的方法——希尔伯特——黄变化的重要组成部分。基于EMD的时频分析方法既适合于非线性、非平稳信号的分析,也适合于线性、平稳信号的分析,并且对于线性、平稳信号的分析也比其他的时频分析方法更好地反映了信号的物理意义。
自适应白噪声完整集合经验模态分解(Complete ensemble EMD with adaptivenoise,CEEMDAN),方法是对EMD方法的改进,利用白噪声均匀分布的统计特性,通过对目标信号多次添加一定幅值的白噪声来克服模态混叠的影响。
长短期记忆网络(Long Short-Term Memory,LSTM)是一种时间循环神经网络,是为了解决一般的循环神经网络(Recurrent Neural Network,RNN)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。
公开号为CN109685290A,名称为《一种基于深度学习的用电量预测方法、装置及设备》的技术方案是一种基于深度学习的用电量预测方法,采用包括长短期记忆网络LSTM嵌入块的序列到序列seq2seq模型为预测模型,增强了序列到序列seq2seq模型的可学习型和表达性,利用包括历史时间序列和外源性特征数据的历史用电数据训练得到该预测模型,使预测模型除了时间特征外,还对外源性特征进行学习和表达,增加了对影响用电量趋势的多个因素的约束,从而得到了更贴近用电量实际状况的预测模型,通过该预测模型对用电量进行预测,得到了更为准确的用电量预测结果。
公开号为CN107992968A,名称为《基于集成时间序列分析技术的电能表计量误差预测方法》的技术方案是一种基于集成时间序列分析技术的电能表计量误差预测方法,包括:对计量误差及相关数据进行数据异常处理和数据概括;将处理后的计量误差数据依据时间特性划分为多份数据集;构建时间序列模型ARIMA和神经网络模型,并进行训练评估集成所述时间序列模型ARIMA和神经网络模型,从而获得最终预测结果。本发明提供的关于集成时间序列分析技术的电能表计量误差预测方法,较传统时间序列分析方法有了更强的预测能力;将时间序列模型与神经网络模型一起组成基模型,能够有效利用多个单模型的特点,提升预测能力和准确性。
现有技术方案的缺点是直接用历史电量数据输入模型进行训练预测,由于历史用电数据是非平稳和非线性的,容易造成预测误差较大,且直接将历史用电数据,输入长短期记忆网络LSTM容易导致预测出现滞后现象,预测结果为前一时刻的数据。
发明内容
本发明的目的是提供一种数据中心能耗预测方法及系统,以解决直接将历史用电数据,输入长短期记忆网络LSTM容易导致预测出现滞后现象以及预测误差大的问题。
为实现上述目的,本发明提供了如下方案:
一种数据中心能耗预测方法,包括:
获取数据中心历史能耗数据;所述数据中心历史能耗数据为数据中心IT机房用电负荷;
运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量;
重组不同尺度的所述固有模态分量,生成多个本征模态函数重组组合;
构建堆叠式LSTM网络,并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络,并利用训练后的堆叠式LSTM网络预测新的模态分量;
重构所述新的模态分量,预测未来的数据中心IT机房用电负荷。
可选的,所述获取数据中心历史能耗数据,之后还包括:
将所述数据中心历史能耗数据划分为训练集以及验证集;
将所述训练集作为训练所述堆叠式LSTM网络的训练数据;
将所述验证集作为优化器的验证数据,优化最优参数,以预测未来的数据中心IT机房用电负荷;所述最优参数包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构以及堆叠式LSTM网络的堆叠结构。
可选的,所述运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量,具体包括:
利用公式计算固有模态分量;其中,/>为第k+1阶段的第k+1个固有模态分量,n为集成次数;N为经验模态分解次数;i为噪声添加次数;IMF1为第一阶段的第1个固有模态分量;/>为第一阶段的剩余分量;/>为第k阶段的自适应系数;/>为加入白噪声后的第k阶段的第k个固有模态分量;/>为白噪系数;
可选的,所述堆叠式LSTM网络为四层LSTM堆叠网络;
第一层包括32个LSTM单元;第二层包括128个LSTM单元;第三层包括32个LSTM单元;第四层包括3个全连接层单元;
其中,所述LSTM单元包括遗忘门、更新门以及输出门;输入任一时刻的输入向量和以及先前状态经过所述更新门运算后,与修正过的遗忘门更新状态,生成当前状态;同时,使用非线性的激活函数过滤所述当前状态,与所述输出门运算后输出下一时刻状态。
可选的,所述重构所述新的模态分量,预测未来的数据中心IT机房用电负荷,具体包括:
重构所述新的模态分量,生成新的本征模态函数重组组合;
根据所述新的本征模态函数重组组合以及所述验证集输入至所述优化器,确定最佳参数;
根据所述最佳参数预测未来的数据中心IT机房用电负荷。
一种数据中心能耗预测系统,包括:
数据中心历史能耗数据获取模块,用于获取数据中心历史能耗数据;所述数据中心历史能耗数据为数据中心IT机房用电负荷;
分解模块,用于运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量;
本征模态函数重组组合生成模块,用于重组不同尺度的所述固有模态分量,生成多个本征模态函数重组组合;
堆叠式LSTM网络构建以及新的模态分量预测模块,用于构建堆叠式LSTM网络,并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络,并利用训练后的堆叠式LSTM网络预测新的模态分量;
数据中心IT机房用电负荷预测模块,用于重构所述新的模态分量,预测未来的数据中心IT机房用电负荷。
可选的,还包括:
数据划分模块,用于将所述数据中心历史能耗数据划分为训练集以及验证集;
训练集应用模块,用于将所述训练集作为训练所述堆叠式LSTM网络的训练数据;
验证集应用模块,用于将所述验证集作为优化器的验证数据,优化最优参数,以预测未来的数据中心IT机房用电负荷;所述最优参数包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构以及堆叠式LSTM网络的堆叠结构。
可选的,所述分解模块,具体包括:
固有模态分量计单元,用于用于利用公式计算固有模态分量;其中,为第k+1阶段的第k+1个固有模态分量,n为集成次数;N为经验模态分解次数;i为噪声添加次数;IMF1为第一阶段的第1个固有模态分量;/>为第一阶段的剩余分量;为第k阶段的自适应系数;/>为加入白噪声后的第k阶段的第k个固有模态分量;/>为白噪系数;
可选的,所述堆叠式LSTM网络为四层LSTM堆叠网络;
第一层包括32个LSTM单元;第二层包括128个LSTM单元;第三层包括32个LSTM单元;第四层包括3个全连接层单元;
其中,所述LSTM单元包括遗忘门、更新门以及输出门;输入任一时刻的输入向量和以及先前状态经过所述更新门运算后,与修正过的遗忘门更新状态,生成当前状态;同时,使用非线性的激活函数过滤所述当前状态,与所述输出门运算后输出下一时刻状态。
可选的,所述数据中心IT机房用电负荷预测模块,具体包括:
重构单元,用于重构所述新的模态分量,生成新的本征模态函数重组组合;
最佳参数确定单元,用于根据所述新的本征模态函数重组组合以及所述验证集输入至所述优化器,确定最佳参数;
数据中心IT机房用电负荷预测单元,用于根据所述最佳参数预测未来的数据中心IT机房用电负荷。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供了一种数据中心能耗预测方法及系统,运用CEEMDAN算法将非线性、非平稳的数据中心历史能耗数据分解为多个相对平稳,并具有不同特征尺度的固有模态分量以及剩余分量,在一定程度上降低时间序列的复杂程度;同时,在预测过程中构建堆叠式LSTM网络,利用堆叠式LSTM网络对分解的固有模态分量以及剩余分量进行分别预测,叠加预测结果,预测未来的数据中心IT机房用电负荷,比常用的单一预测算法具有更高的模型预测精度,避免了将历史用电数据直接输入长短期记忆网络导致的滞后现象,降低了预测误差。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的数据中心能耗预测方法流程图;
图2为本发明所提供的数据中心IT机房用电负荷数据图;
图3为本发明所提供的IMF1处理结果示意图;
图4为本发明所提供的IMF2处理结果示意图;
图5为本发明所提供的IMF3处理结果示意图;
图6为本发明所提供的Res处理结果示意图;
图7为本发明所提供的长短期记忆网络单元结构图;
图8为本发明所提供的本征模态函数输入堆叠网络进行训练的流程图;
图9为本发明所提供的数据中心能耗预测方法优化过程流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种数据中心能耗预测方法及系统,避免了将历史用电数据直接输入长短期记忆网络导致的滞后现象,降低了预测误差。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明所提供的数据中心能耗预测方法流程图,如图1所示,一种数据中心能耗预测方法,包括:
步骤101:获取数据中心历史能耗数据;所述数据中心历史能耗数据为数据中心IT机房用电负荷。
所述步骤101之后还包括:将所述数据中心历史能耗数据划分为训练集以及验证集;将所述训练集作为训练所述堆叠式LSTM网络的训练数据;将所述验证集作为优化器的验证数据,优化最优参数,以预测未来的数据中心IT机房用电负荷;所述最优参数包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构以及堆叠式LSTM网络的堆叠结构,以下将“本征模态函数”简称为“本征函数”。
在实际应用中,图2为本发明所提供的数据中心IT机房用电负荷数据图,如图2所示,横坐标为时间,单位为月,纵坐标为功率,单位为瓦,利用数据中心能耗数据月为单位,建立一组能耗时间序列(3年周期),预测未来一段时间(3个月)的数据中心能耗情况。
选择一个数据中心IT机房IT设备用电量数据作为处理对象,选择40个月的历史数据,其中36个月的数据作为训练数据,4个月的数据作为优化器的验证数据。
步骤102:运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量。
在实际应用中,所述步骤102具体包括:利用公式计算固有模态分量;其中,/>为第k+1阶段的第k+1个固有模态分量,n为集成次数;N为经验模态分解次数;i为噪声添加次数;IMF1为第一阶段的第1个固有模态分量;/>为第一阶段的剩余分量;/>为第k阶段的自适应系数;/>为加入白噪声后的第k阶段的第k个固有模态分量,固有模态分量即为本征模态函数;/>为白噪系数;利用公式计算剩余分量;其中,rk(n)为第k阶段的剩余分量;rk-1(n)为第k-1阶段的剩余分量;/>为第k阶段的第k个固有模态分量。
在实际应用中,对数据中心IT机房IT设备用电量数据进行平稳检验。所谓的平稳性,一般指宽平稳,即时间序列的均值和方差为与时间无关的常数,其协方差与时间间隔有关而与时间无关。一个平稳的时间序列指的是:遥想未来所能获得的样本时间序列,断定其均值、方差、协方差必定与眼下已获得的样本时间序列等同。反之,如果样本时间序列的本质特征只存在于所发生的当期,并不会延续到未来,亦即样本时间序列的均值、方差、协方差非常数,则这样一个时间序列不足以昭示未来,便称这样的样本时间序列是非平稳的。一般情况下能耗数据是非平稳的。
因为“平稳序列性消除了小概率事件”。平稳性就是要求经由能耗数据时间序列所得到的拟合曲线在未来的一段时间内仍能顺着现有的形态“惯性”地延续下去。如果数据非平稳,则说明样本拟合曲线的形态不具有“惯性”延续的特点,也就是基于未来将要获得的样本时间序列所拟合出来的曲线将迥异于当前的样本拟合曲线。所以选择CEEMDAN自适应白噪声完整集合经验模态分解处理是为了将非平稳的IT机房能耗数据分解为多个平稳的分量。
在实际应用中,CEEMDAN算法的详细处理过程如下:
CEEMDAN是在经验模态分解(EmpiricalModeDecomposition,EMD)基础上所发展出来的理论成果。在EMD的基础上通过添加自适应的白噪声有效地抑制EMD的模态混叠现象,使信号的重构误差几乎接近于0。该方法适合将非平稳、非线性数据中心能耗数据自适应地分解成若干个不同尺度的固有模态分量(IntrinsicModeFunction,IMF),其实现步骤为:
步骤1:设为数据中心能耗数据时间序列,ε为自适应系数,/>为每次分解加入的噪声序列,/>为第i次添加噪声之后的信号序列。EMD分解的N次实验平均值则为第1个固有模态分量IMF1,/>为第1阶段第i个固有模态分量。
步骤3:在步骤2的基础上,计算第2阶段的第2个固有模态分量IMF2。
步骤4:重复计算到第k+1阶段,获得第k阶段的余量序列rk(n)和第k+1个固有模态分量IMFk。
步骤5:重复上述步骤,若余量序列的极值点个数≤2,则停止EMD分解,得到最后的余量序列R(n)和固有模态分量IMFk,那么原始信号序列x(n)最终分解为:
步骤103:重组不同尺度的所述固有模态分量,生成多个本征模态函数重组组合。
在实际应用中,数据中心能耗数据经过CEEMDAN,变为IMF1、IMF2、IMF3、Res,将本征模态函数重组组合,变为三种组合,原组合(IMF1、IMF2、IMF3、Res)、新组合(IMF1+IMF2、IMF3、Res)、新组合(IMF1、IMF2+IMF3、Res)。
组合的目的是为了,产生更有效的数据分量。三种组合最后会确定一种作为最终的组合方式。组合的确定依据该组合在验证集的效果最优。
步骤104:构建堆叠式LSTM网络,并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络,并利用训练后的堆叠式LSTM网络预测新的模态分量。
在实际应用中,所述堆叠式LSTM网络为四层LSTM堆叠网络;第一层包括32个LSTM单元;第二层包括128个LSTM单元;第三层包括32个LSTM单元;第四层包括3个全连接层单元;其中,所述LSTM单元包括遗忘门、更新门以及输出门;输入任一时刻的输入向量和以及先前状态经过所述更新门运算后,与修正过的遗忘门更新状态,生成当前状态;同时,使用非线性的激活函数过滤所述当前状态,与所述输出门运算后输出下一时刻状态。
在实际应用中,图7为本发明所提供的长短期记忆网络单元结构图,如图7所示,单个长短期记忆网络单元通过3个门保护和控制存储单元中的信息,这些信息由激活函数的点乘⊙实现,通过梯度下降训练一系列参数来控制每个门的状态;LSTM中的每一个门都有一个特定且独特的功能。
遗忘门f从先前的状态ht-1中决定丢弃哪些信息。
为了生成输出yt,首先使用非线性的g2函数过滤它的当前状态,然后与输出门o运算后一块输出yt,其中返回部分状态yt作为下次输入yt-1。
每一个门都依赖于当前的外部输入xt和之前的输出yt-1。
式中:xt为t时刻的输入向量;Wt、Wh、Wu和Wo是与输入单元相关的权重矩阵;Rf、Rh、Ru和Ro为隐藏层连接的权重矩阵;而bf、bh、bu和bo为偏置向量;激活函数σ为sigmoid或者tanh;g1和g2为非线性激活函数。
步骤105:重构所述新的模态分量,预测未来的数据中心IT机房用电负荷。
在实际应用中,所述步骤105具体包括:重构所述新的模态分量,生成新的本征模态函数重组组合;根据所述新的本征模态函数重组组合以及所述验证集输入至所述优化器,确定最佳参数;根据所述最佳参数预测未来的数据中心IT机房用电负荷。
将CEEMDAN分解后的本征模态函数输入堆叠网络进行训练:
图8为本发明所提供的本征模态函数输入堆叠网络进行训练的流程图,如图8所示,将CEEMADN计算好的本征模态函数重组组合输入LSTM网络,原组合(IMF1、IMF2、IMF3、Res)、新组合(IMF1+IMF2、IMF3、Res)、新组合(IMF1、IMF2+IMF3、Res)。
网络的batch_size为32,训练的迭代数epochs为300,评价指标为均方根误差RMSE。
每个本征模态函数重组组合均对应一个网络模型,本次本征模态函数组对应组合(IMF1、IMF2、IMF3、Res)、对应组合(IMF1+IMF2、IMF3、Res)、新组合(IMF1、IMF2+IMF3、Res),本征模态函数重组组合共有IMF1,IMF2,IMF3,IMF1+IMF2,IMF2+IMF3,Res共6个对应6个LSTM网络模型。
优化器进行参数优化:
模型搭建完成后,对应不同的参数有不同的结果,要选择最佳的参数来确定整个模型。
对应CEEMDAN阶段的参数(白噪系数10%-20%、集成次数300-600、最大迭代次数50-150),对应本征模态函数重组组合有三种重组方式,对应LSTM堆叠网络预测网络的结构(第一层16-38,第二层38-128,第三层3-32),通过初始值搭建的网络,需要优化模型的参数使预测效果最佳。通过优化器寻找最优解。
优化器的算法:优化器算法可以分解为解空间、目标函数和初始解三部分。
(1)初始化:初始温度T(充分大),初始解状态S(是算法迭代的起点),每个T值的迭代次数L。
(2)对k=1,…,L做第(3)至第6步。
(3)产生新解S′。
(4)计算增量ΔT=C(S′)-C(S),其中C(S)为代价函数。
(5)若ΔT<0则接受S′作为新的当前解,否则以概率exp(-ΔT/T)接受S′作为新的当前解。
(6)如果满足终止条件则输出当前解作为最优解,结束程序。终止条件通常取为连续若干个新解都没有被接受时终止算法。
(7)T逐渐减少,且T->0,然后转第2步。
解空间,对应CEEMDAN阶段的参数(白噪系数10%-20%、集成次数300-600、最大迭代次数50-150),对应本征模态函数重组组合有三种重组方式,对应LSTM堆叠网络预测网络的结构(第一层16-38,第二层38-128,第三层3-32)
目标函数,测试集与预测集的均方根误差。
初始解,对应CEEMDAN阶段的参数(白噪系数20%、集成次数500、最大迭代次数100),对应本征模态函数重组组合有三种重组方式,对应LSTM堆叠网络预测网络的结构(第一层32,第二层128,第三层32)。
优化过程:
第一步:由一个产生函数从当前解产生一个位于解空间的新解;为便于后续的计算和接受,减少算法耗时,通常选择由当前新解经过简单地变换即可产生新解的方法,如对构成新解的全部或部分元素进行置换、互换等,注意到产生新解的变换方法决定了当前新解的邻域结构,因而对冷却进度表的选取有一定的影响。
第二步:计算测试的输入与预测集的所对应的均方根误差。
第三步:判断新解是否被接受,判断的依据是一个接受准则,最常用的接受准则是Metropolis准则:若ΔT<0则接受S′作为新的当前解S,否则以概率exp(-ΔT/T)接受S′作为新的当前解S。
第四步:当新解被确定接受时,用新解代替当前解,这只需将当前解中对应于产生新解时的变换部分予以实现,同时修正目标函数值即可。此时,当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时,则在原当前解的基础上继续下一轮试验。
优化器求得的解与初始解状态S(是算法迭代的起点)无关;优化器具有渐近收敛性,已在理论上被证明是一种以概率l收敛于全局最优解的全局优化算法。
当最佳参数确定后,把数据中心IT机房能耗的最近36个月数据输入以上网络,最终输出一组未来三个月重组本征模态函数值,将本征模态函数值相加,得到未来3个的数据中心IT机房能耗值。
图9为本发明所提供的数据中心能耗预测方法优化过程流程图,如图9所示,本发明首先运用CEEMDAN算法将数据中心IT机房用电负荷序列分成若干个不同固有模态分量和趋势分量;之后模态分类组合将临近的模态分类组合一起形成一个较大的尺度的模态分类,将较大尺度的模态分类输入到一个由长短波记忆单元LSTM(包括LSTM1、LSTM2、......、LSTMo、LSTM21、LSTM22、......、LSTM2p、LSTM31、LSTM32、......、LSTM3q)构建的堆叠循环神经网络,由循环神经网络预测各较大尺度的模态分量,然后将预测的模态分量进行组合得到预测未来的数据中心IT用电负荷。其中,主要的参数,包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构、LSTM网络堆叠的结构,由优化器对比预测数据和验证数据确定。本发明较传统模型精度上有明显提高,具有更强的预测性能和泛化能力、误差更低,为数据中心的节能提供科学决策的依据。
此外,本发明还提供了一种数据中心能耗预测系统,包括:
数据中心历史能耗数据获取模块,用于获取数据中心历史能耗数据;所述数据中心历史能耗数据为数据中心IT机房用电负荷。
分解模块,用于运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量。
本征模态函数重组组合生成模块,用于重组不同尺度的所述固有模态分量,生成多个本征模态函数重组组合。
堆叠式LSTM网络构建以及新的模态分量预测模块,用于构建堆叠式LSTM网络,并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络,并利用训练后的堆叠式LSTM网络预测新的模态分量。
数据中心IT机房用电负荷预测模块,用于重构所述新的模态分量,预测未来的数据中心IT机房用电负荷。
本发明还包括:数据划分模块,用于将所述数据中心历史能耗数据划分为训练集以及验证集;训练集应用模块,用于将所述训练集作为训练所述堆叠式LSTM网络的训练数据;验证集应用模块,用于将所述验证集作为优化器的验证数据,优化最优参数,以预测未来的数据中心IT机房用电负荷;所述最优参数包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构以及堆叠式LSTM网络的堆叠结构。
在实际应用中,所述分解模块,具体包括:固有模态分量计单元,用于利用公式计算固有模态分量;其中,IMFk+1(n)为第k+1阶段的第k+1个固有模态分量,n为集成次数;N为经验模态分解次数;i为噪声添加次数;IMF1为第一阶段的第1个固有模态分量;/>为第一阶段的剩余分量;/>为第k阶段的自适应系数;/>为加入白噪声后的第k阶段的第k个固有模态分量;/>为白噪系数;剩余分量计算单元,用于利用公式/>计算剩余分量;其中,rk(n)为第k阶段的剩余分量;rk-1(n)为第k-1阶段的剩余分量;/>为第k阶段的第k个固有模态分量。
在实际应用中,所述堆叠式LSTM网络为四层LSTM堆叠网络;第一层包括32个LSTM单元;第二层包括128个LSTM单元;第三层包括32个LSTM单元;第四层包括3个全连接层单元;其中,所述LSTM单元包括遗忘门、更新门以及输出门;输入任一时刻的输入向量和以及先前状态经过所述更新门运算后,与修正过的遗忘门更新状态,生成当前状态;同时,使用非线性的激活函数过滤所述当前状态,与所述输出门运算后输出下一时刻状态。
在实际应用中,所述数据中心IT机房用电负荷预测模块,具体包括:重构单元,用于重构所述新的模态分量,生成新的本征模态函数重组组合;最佳参数确定单元,用于根据所述新的本征模态函数重组组合以及所述验证集输入至所述优化器,确定最佳参数;数据中心IT机房用电负荷预测单元,用于根据所述最佳参数预测未来的数据中心IT机房用电负荷。
由于数据中心能耗的预测历史数据的非平稳性,现行的去噪方法效果并不理想,本发明基于样本数据的本征模态函数组合抑制数据中心能耗数据中的噪声,保留有效信号的幅值。数据中心能耗的预测历史数据经过分解,经自适应白噪声完整集合经验模态分解分解为若干个本征模态分量IMFs;本发明所提的本征模态函数组合方法效果优于传统EMD和直接用能耗数据的预测方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种数据中心能耗预测方法,其特征在于,包括:
获取数据中心历史能耗数据;所述数据中心历史能耗数据为数据中心IT机房用电负荷;
运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量;
重组不同尺度的所述固有模态分量,生成多个本征模态函数重组组合;
构建堆叠式LSTM网络,并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络,并利用训练后的堆叠式LSTM网络预测新的模态分量;
重构所述新的模态分量,预测未来的数据中心IT机房用电负荷。
2.根据权利要求1所述的数据中心能耗预测方法,其特征在于,所述获取数据中心历史能耗数据,之后还包括:
将所述数据中心历史能耗数据划分为训练集以及验证集;
将所述训练集作为训练所述堆叠式LSTM网络的训练数据;
将所述验证集作为优化器的验证数据,优化最优参数,以预测未来的数据中心IT机房用电负荷;所述最优参数包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构以及堆叠式LSTM网络的堆叠结构。
3.根据权利要求2所述的数据中心能耗预测方法,其特征在于,所述运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量,具体包括:
利用公式计算固有模态分量;其中,/>为第k+1阶段的第k+1个固有模态分量,n为集成次数;N为经验模态分解次数;i为噪声添加次数;IMF1为第一阶段的第1个固有模态分量;/>为第一阶段的剩余分量;/>为第k阶段的自适应系数;/>为加入白噪声后的第k阶段的第k个固有模态分量;/>为白噪系数;
4.根据权利要求3所述的数据中心能耗预测方法,其特征在于,所述堆叠式LSTM网络为四层LSTM堆叠网络;
第一层包括32个LSTM单元;第二层包括128个LSTM单元;第三层包括32个LSTM单元;第四层包括3个全连接层单元;
其中,所述LSTM单元包括遗忘门、更新门以及输出门;输入任一时刻的输入向量和以及先前状态经过所述更新门运算后,与修正过的遗忘门更新状态,生成当前状态;同时,使用非线性的激活函数过滤所述当前状态,与所述输出门运算后输出下一时刻状态。
5.根据权利要求4所述的数据中心能耗预测方法,其特征在于,所述重构所述新的模态分量,预测未来的数据中心IT机房用电负荷,具体包括:
重构所述新的模态分量,生成新的本征模态函数重组组合;
根据所述新的本征模态函数重组组合以及所述验证集输入至所述优化器,确定最佳参数;
根据所述最佳参数预测未来的数据中心IT机房用电负荷。
6.一种数据中心能耗预测系统,其特征在于,包括:
数据中心历史能耗数据获取模块,用于获取数据中心历史能耗数据;所述数据中心历史能耗数据为数据中心IT机房用电负荷;
分解模块,用于运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量;
本征模态函数重组组合生成模块,用于重组不同尺度的所述固有模态分量,生成多个本征模态函数重组组合;
堆叠式LSTM网络构建以及新的模态分量预测模块,用于构建堆叠式LSTM网络,并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络,并利用训练后的堆叠式LSTM网络预测新的模态分量;
数据中心IT机房用电负荷预测模块,用于重构所述新的模态分量,预测未来的数据中心IT机房用电负荷。
7.根据权利要求6所述的数据中心能耗预测系统,其特征在于,还包括:
数据划分模块,用于将所述数据中心历史能耗数据划分为训练集以及验证集;
训练集应用模块,用于将所述训练集作为训练所述堆叠式LSTM网络的训练数据;
验证集应用模块,用于将所述验证集作为优化器的验证数据,优化最优参数,以预测未来的数据中心IT机房用电负荷;所述最优参数包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构以及堆叠式LSTM网络的堆叠结构。
9.根据权利要求8所述的数据中心能耗预测系统,其特征在于,所述堆叠式LSTM网络为四层LSTM堆叠网络;
第一层包括32个LSTM单元;第二层包括128个LSTM单元;第三层包括32个LSTM单元;第四层包括3个全连接层单元;
其中,所述LSTM单元包括遗忘门、更新门以及输出门;输入任一时刻的输入向量和以及先前状态经过所述更新门运算后,与修正过的遗忘门更新状态,生成当前状态;同时,使用非线性的激活函数过滤所述当前状态,与所述输出门运算后输出下一时刻状态。
10.根据权利要求9所述的数据中心能耗预测系统,其特征在于,所述数据中心IT机房用电负荷预测模块,具体包括:
重构单元,用于重构所述新的模态分量,生成新的本征模态函数重组组合;
最佳参数确定单元,用于根据所述新的本征模态函数重组组合以及所述验证集输入至所述优化器,确定最佳参数;
数据中心IT机房用电负荷预测单元,用于根据所述最佳参数预测未来的数据中心IT机房用电负荷。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310164998.8A CN115860277B (zh) | 2023-02-27 | 2023-02-27 | 一种数据中心能耗预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310164998.8A CN115860277B (zh) | 2023-02-27 | 2023-02-27 | 一种数据中心能耗预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115860277A true CN115860277A (zh) | 2023-03-28 |
CN115860277B CN115860277B (zh) | 2023-05-09 |
Family
ID=85658840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310164998.8A Active CN115860277B (zh) | 2023-02-27 | 2023-02-27 | 一种数据中心能耗预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115860277B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116205382A (zh) * | 2023-05-05 | 2023-06-02 | 南方电网科学研究院有限责任公司 | 用电量的预测方法、预测装置、电子装置和电子设备 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110059844A (zh) * | 2019-02-01 | 2019-07-26 | 东华大学 | 基于集合经验模态分解和lstm的储能装置控制方法 |
WO2020191801A1 (zh) * | 2019-03-27 | 2020-10-01 | 东北大学 | 基于灰狼群优化lstm网络的锂离子电池剩余寿命预测方法 |
CN111784068A (zh) * | 2020-07-09 | 2020-10-16 | 北京理工大学 | 基于eemd的电力负荷组合预测方法及装置 |
CN111815065A (zh) * | 2020-07-21 | 2020-10-23 | 东北大学 | 基于长短时记忆神经网络的短期电力负荷预测方法 |
CN112488415A (zh) * | 2020-12-14 | 2021-03-12 | 国网江苏省电力有限公司经济技术研究院 | 基于经验模态分解和长短时记忆网络的电力负荷预测方法 |
CN113159361A (zh) * | 2020-12-03 | 2021-07-23 | 安徽大学 | 基于VDM和Stacking模型融合的短期负荷预测方法及系统 |
CN113239624A (zh) * | 2021-05-21 | 2021-08-10 | 长沙理工大学 | 基于神经网络组合模型的短期负荷预测方法、设备及介质 |
CN113850438A (zh) * | 2021-09-29 | 2021-12-28 | 西安建筑科技大学 | 公共建筑能耗预测方法、系统、设备及介质 |
US20220045509A1 (en) * | 2020-08-05 | 2022-02-10 | Wuhan University | Method and system of predicting electric system load based on wavelet noise reduction and emd-arima |
CN114091766A (zh) * | 2021-11-24 | 2022-02-25 | 东北电力大学 | 基于ceemdan-lstm的空间负荷预测方法 |
CN114219126A (zh) * | 2021-11-12 | 2022-03-22 | 三峡大学 | 基于残差修正的小水电渗透地区网供负荷预测方法 |
CN114740360A (zh) * | 2022-03-29 | 2022-07-12 | 安徽理工大学 | 一种基于sae-ceemdan-lstm的锂离子电池剩余使用寿命预测方法 |
CN115169703A (zh) * | 2022-07-12 | 2022-10-11 | 广东电网有限责任公司广州供电局 | 一种基于长短时记忆网络组合的短期电力负荷预测方法 |
US20220382263A1 (en) * | 2021-04-30 | 2022-12-01 | Dalian University Of Technology | Distributed industrial energy operation optimization platform automatically constructing intelligent models and algorithms |
CN115456312A (zh) * | 2022-11-09 | 2022-12-09 | 广东电网有限责任公司肇庆供电局 | 基于辛几何模态分解的短期电力负荷预测方法及系统 |
-
2023
- 2023-02-27 CN CN202310164998.8A patent/CN115860277B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110059844A (zh) * | 2019-02-01 | 2019-07-26 | 东华大学 | 基于集合经验模态分解和lstm的储能装置控制方法 |
WO2020191801A1 (zh) * | 2019-03-27 | 2020-10-01 | 东北大学 | 基于灰狼群优化lstm网络的锂离子电池剩余寿命预测方法 |
CN111784068A (zh) * | 2020-07-09 | 2020-10-16 | 北京理工大学 | 基于eemd的电力负荷组合预测方法及装置 |
CN111815065A (zh) * | 2020-07-21 | 2020-10-23 | 东北大学 | 基于长短时记忆神经网络的短期电力负荷预测方法 |
US20220045509A1 (en) * | 2020-08-05 | 2022-02-10 | Wuhan University | Method and system of predicting electric system load based on wavelet noise reduction and emd-arima |
CN113159361A (zh) * | 2020-12-03 | 2021-07-23 | 安徽大学 | 基于VDM和Stacking模型融合的短期负荷预测方法及系统 |
CN112488415A (zh) * | 2020-12-14 | 2021-03-12 | 国网江苏省电力有限公司经济技术研究院 | 基于经验模态分解和长短时记忆网络的电力负荷预测方法 |
US20220382263A1 (en) * | 2021-04-30 | 2022-12-01 | Dalian University Of Technology | Distributed industrial energy operation optimization platform automatically constructing intelligent models and algorithms |
CN113239624A (zh) * | 2021-05-21 | 2021-08-10 | 长沙理工大学 | 基于神经网络组合模型的短期负荷预测方法、设备及介质 |
CN113850438A (zh) * | 2021-09-29 | 2021-12-28 | 西安建筑科技大学 | 公共建筑能耗预测方法、系统、设备及介质 |
CN114219126A (zh) * | 2021-11-12 | 2022-03-22 | 三峡大学 | 基于残差修正的小水电渗透地区网供负荷预测方法 |
CN114091766A (zh) * | 2021-11-24 | 2022-02-25 | 东北电力大学 | 基于ceemdan-lstm的空间负荷预测方法 |
CN114740360A (zh) * | 2022-03-29 | 2022-07-12 | 安徽理工大学 | 一种基于sae-ceemdan-lstm的锂离子电池剩余使用寿命预测方法 |
CN115169703A (zh) * | 2022-07-12 | 2022-10-11 | 广东电网有限责任公司广州供电局 | 一种基于长短时记忆网络组合的短期电力负荷预测方法 |
CN115456312A (zh) * | 2022-11-09 | 2022-12-09 | 广东电网有限责任公司肇庆供电局 | 基于辛几何模态分解的短期电力负荷预测方法及系统 |
Non-Patent Citations (4)
Title |
---|
刘英翰: ""电力系统短期电力负荷预测模型研究"", 《中国优秀硕士学位论文全文数据库电子期刊 工程科技Ⅱ辑》 * |
范新桥;朱永利;尹金良;: "基于经验模态分解和基因表达式程序设计的电力系统短期负荷预测", 电力系统保护与控制 * |
邓带雨;李坚;张真源;滕予非;黄琦;: "基于EEMD-GRU-MLR的短期电力负荷预测", 电网技术 * |
马梦冬;彭道刚;王丹豪;: "基于EEMD-LSTM的区域能源短期负荷预测", 浙江电力 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116205382A (zh) * | 2023-05-05 | 2023-06-02 | 南方电网科学研究院有限责任公司 | 用电量的预测方法、预测装置、电子装置和电子设备 |
CN116205382B (zh) * | 2023-05-05 | 2023-08-22 | 南方电网科学研究院有限责任公司 | 用电量的预测方法、预测装置、电子装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115860277B (zh) | 2023-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109886498B (zh) | 一种基于特征选择的emd-gru短期电力负荷预测方法 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN111027772B (zh) | 基于pca-dbilstm的多因素短期负荷预测方法 | |
CN110309603B (zh) | 一种基于风速特性的短期风速预测方法及系统 | |
CN112085254B (zh) | 基于多重分形协同度量门控循环单元的预测方法及模型 | |
CN111985719B (zh) | 一种基于改进的长短期记忆网络的电力负荷预测方法 | |
CN113657661A (zh) | 一种企业碳排放预测方法、装置、计算机设备和存储介质 | |
CN110443419A (zh) | 基于iceemdan与极限学习机的中长期径流预测方法 | |
CN112884236B (zh) | 一种基于vdm分解与lstm改进的短期负荷预测方法及系统 | |
CN111861013A (zh) | 一种电力负荷预测方法及装置 | |
CN111680786A (zh) | 一种基于改进权重门控单元的时序预测方法 | |
CN115545265A (zh) | 一种基于数据修复和分解序列预测的售电量预测方法 | |
CN115860277A (zh) | 一种数据中心能耗预测方法及系统 | |
CN113409072A (zh) | 一种经验模态分解和分布式gru神经网络及价格预测方法 | |
CN111461445A (zh) | 短期风速预测方法、装置、计算机设备及存储介质 | |
CN114707712A (zh) | 一种发电机组备件需求的预测方法 | |
CN111242353A (zh) | 风电功率组合预测建模和预测方法 | |
CN113111592A (zh) | 一种基于emd-lstm的短期风电功率预测方法 | |
CN114154753A (zh) | 一种负荷预测方法及系统 | |
CN113850438A (zh) | 公共建筑能耗预测方法、系统、设备及介质 | |
CN117543537A (zh) | 一种代理购电用户电量预测方法、装置、存储介质 | |
CN117494545A (zh) | 一种基于混合学习方法的断路器老化故障率预测方法 | |
CN113610665B (zh) | 一种基于多延迟输出回声状态网的风力发电功率预测方法 | |
CN115564466A (zh) | 校准窗口集成与耦合市场特征的双层日前电价预测方法 | |
CN114925940A (zh) | 一种基于负荷分解的节假日负荷预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |