CN115860277B

CN115860277B - 一种数据中心能耗预测方法及系统

Info

Publication number: CN115860277B
Application number: CN202310164998.8A
Authority: CN
Inventors: 魏文斌
Original assignee: Xi'an Junshuo Communication Technology Co ltd
Current assignee: Xi'an Junshuo Communication Technology Co ltd
Priority date: 2023-02-27
Filing date: 2023-02-27
Publication date: 2023-05-09
Anticipated expiration: 2043-02-27
Also published as: CN115860277A

Abstract

本发明涉及一种数据中心能耗预测方法及系统，涉及IT基础领域。该方法包括：获取数据中心历史能耗数据；所述数据中心历史能耗数据为数据中心IT机房用电负荷；运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量；重组不同尺度的所述固有模态分量，生成多个本征模态函数重组组合；构建堆叠式LSTM网络，并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络，并利用训练后的堆叠式LSTM网络预测新的模态分量；重构所述新的模态分量，预测未来的数据中心IT机房用电负荷。本发明能够避免将历史用电数据直接输入长短期记忆网络导致的滞后现象，降低预测误差。

Description

一种数据中心能耗预测方法及系统

技术领域

本发明涉及IT基础领域，特别是涉及一种数据中心能耗预测方法及系统。

背景技术

经验模态分解（empirical mode decomposition，EMD）是一种新的处理非平稳信号的方法——希尔伯特——黄变化的重要组成部分。基于EMD的时频分析方法既适合于非线性、非平稳信号的分析，也适合于线性、平稳信号的分析，并且对于线性、平稳信号的分析也比其他的时频分析方法更好地反映了信号的物理意义。

自适应白噪声完整集合经验模态分解（Complete ensemble EMD with adaptivenoise，CEEMDAN），方法是对EMD方法的改进，利用白噪声均匀分布的统计特性，通过对目标信号多次添加一定幅值的白噪声来克服模态混叠的影响。

长短期记忆网络（Long Short-Term Memory，LSTM）是一种时间循环神经网络，是为了解决一般的循环神经网络（Recurrent Neural Network，RNN）存在的长期依赖问题而专门设计出来的，所有的RNN都具有一种重复神经网络模块的链式形式。

公开号为CN109685290A，名称为《一种基于深度学习的用电量预测方法、装置及设备》的技术方案是一种基于深度学习的用电量预测方法，采用包括长短期记忆网络LSTM嵌入块的序列到序列seq2seq模型为预测模型，增强了序列到序列seq2seq模型的可学习型和表达性，利用包括历史时间序列和外源性特征数据的历史用电数据训练得到该预测模型，使预测模型除了时间特征外，还对外源性特征进行学习和表达，增加了对影响用电量趋势的多个因素的约束，从而得到了更贴近用电量实际状况的预测模型，通过该预测模型对用电量进行预测，得到了更为准确的用电量预测结果。

公开号为CN107992968A，名称为《基于集成时间序列分析技术的电能表计量误差预测方法》的技术方案是一种基于集成时间序列分析技术的电能表计量误差预测方法，包括：对计量误差及相关数据进行数据异常处理和数据概括；将处理后的计量误差数据依据时间特性划分为多份数据集；构建时间序列模型ARIMA和神经网络模型，并进行训练评估集成所述时间序列模型ARIMA和神经网络模型，从而获得最终预测结果。本发明提供的关于集成时间序列分析技术的电能表计量误差预测方法，较传统时间序列分析方法有了更强的预测能力；将时间序列模型与神经网络模型一起组成基模型，能够有效利用多个单模型的特点，提升预测能力和准确性。

现有技术方案的缺点是直接用历史电量数据输入模型进行训练预测，由于历史用电数据是非平稳和非线性的，容易造成预测误差较大，且直接将历史用电数据，输入长短期记忆网络LSTM容易导致预测出现滞后现象，预测结果为前一时刻的数据。

发明内容

本发明的目的是提供一种数据中心能耗预测方法及系统，以解决直接将历史用电数据，输入长短期记忆网络LSTM容易导致预测出现滞后现象以及预测误差大的问题。

为实现上述目的，本发明提供了如下方案：

一种数据中心能耗预测方法，包括：

获取数据中心历史能耗数据；所述数据中心历史能耗数据为数据中心IT机房用电负荷；

运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量；

重组不同尺度的所述固有模态分量，生成多个本征模态函数重组组合；

构建堆叠式LSTM网络，并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络，并利用训练后的堆叠式LSTM网络预测新的模态分量；

重构所述新的模态分量，预测未来的数据中心IT机房用电负荷。

可选的，所述获取数据中心历史能耗数据，之后还包括：

将所述数据中心历史能耗数据划分为训练集以及验证集；

将所述训练集作为训练所述堆叠式LSTM网络的训练数据；

将所述验证集作为优化器的验证数据，优化最优参数，以预测未来的数据中心IT机房用电负荷；所述最优参数包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构以及堆叠式LSTM网络的堆叠结构。

可选的，所述运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量，具体包括：

利用公式计算固有模态分量；其中，为第k+1阶段的第k+1个固有模态分量，n为集成次数；N为经验模态分解次数；i为噪声添加次数；IMF₁为第一阶段的第1个固有模态分量；为第一阶段的剩余分量；为第k阶段的自适应系数；为加入白噪声后的第k阶段的第k个固有模态分量；为白噪系数；

利用公式计算剩余分量；其中，r_k(n)为第k阶段的剩余分量；r_k-1(n)为第k-1阶段的剩余分量；为第k阶段的第k个固有模态分量。

可选的，所述堆叠式LSTM网络为四层LSTM堆叠网络；

第一层包括32个LSTM单元；第二层包括128个LSTM单元；第三层包括32个LSTM单元；第四层包括3个全连接层单元；

其中，所述LSTM单元包括遗忘门、更新门以及输出门；输入任一时刻的输入向量和以及先前状态经过所述更新门运算后，与修正过的遗忘门更新状态，生成当前状态；同时，使用非线性的激活函数过滤所述当前状态，与所述输出门运算后输出下一时刻状态。

可选的，所述重构所述新的模态分量，预测未来的数据中心IT机房用电负荷，具体包括：

重构所述新的模态分量，生成新的本征模态函数重组组合；

根据所述新的本征模态函数重组组合以及所述验证集输入至所述优化器，确定最佳参数；

根据所述最佳参数预测未来的数据中心IT机房用电负荷。

一种数据中心能耗预测系统，包括：

数据中心历史能耗数据获取模块，用于获取数据中心历史能耗数据；所述数据中心历史能耗数据为数据中心IT机房用电负荷；

分解模块，用于运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量；

本征模态函数重组组合生成模块，用于重组不同尺度的所述固有模态分量，生成多个本征模态函数重组组合；

堆叠式LSTM网络构建以及新的模态分量预测模块，用于构建堆叠式LSTM网络，并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络，并利用训练后的堆叠式LSTM网络预测新的模态分量；

数据中心IT机房用电负荷预测模块，用于重构所述新的模态分量，预测未来的数据中心IT机房用电负荷。

可选的，还包括：

数据划分模块，用于将所述数据中心历史能耗数据划分为训练集以及验证集；

训练集应用模块，用于将所述训练集作为训练所述堆叠式LSTM网络的训练数据；

验证集应用模块，用于将所述验证集作为优化器的验证数据，优化最优参数，以预测未来的数据中心IT机房用电负荷；所述最优参数包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构以及堆叠式LSTM网络的堆叠结构。

可选的，所述分解模块，具体包括：

固有模态分量计单元，用于用于利用公式计算固有模态分量；其中，为第k+1阶段的第k+1个固有模态分量，n为集成次数；N为经验模态分解次数；i为噪声添加次数；IMF₁为第一阶段的第1个固有模态分量；为第一阶段的剩余分量；为第k阶段的自适应系数；为加入白噪声后的第k阶段的第k个固有模态分量；为白噪系数；

剩余分量计算单元，用于利用公式计算剩余分量；其中，r_k(n)为第k阶段的剩余分量；r_k-1(n)为第k-1阶段的剩余分量；为第k阶段的第k个固有模态分量。

可选的，所述堆叠式LSTM网络为四层LSTM堆叠网络；

可选的，所述数据中心IT机房用电负荷预测模块，具体包括：

重构单元，用于重构所述新的模态分量，生成新的本征模态函数重组组合；

最佳参数确定单元，用于根据所述新的本征模态函数重组组合以及所述验证集输入至所述优化器，确定最佳参数；

数据中心IT机房用电负荷预测单元，用于根据所述最佳参数预测未来的数据中心IT机房用电负荷。

根据本发明提供的具体实施例，本发明公开了以下技术效果：本发明提供了一种数据中心能耗预测方法及系统，运用CEEMDAN算法将非线性、非平稳的数据中心历史能耗数据分解为多个相对平稳，并具有不同特征尺度的固有模态分量以及剩余分量，在一定程度上降低时间序列的复杂程度；同时，在预测过程中构建堆叠式LSTM网络，利用堆叠式LSTM网络对分解的固有模态分量以及剩余分量进行分别预测，叠加预测结果，预测未来的数据中心IT机房用电负荷，比常用的单一预测算法具有更高的模型预测精度，避免了将历史用电数据直接输入长短期记忆网络导致的滞后现象，降低了预测误差。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明所提供的数据中心能耗预测方法流程图；

图2为本发明所提供的数据中心IT机房用电负荷数据图；

图3为本发明所提供的IMF1处理结果示意图；

图4为本发明所提供的IMF2处理结果示意图；

图5为本发明所提供的IMF3处理结果示意图；

图6为本发明所提供的Res处理结果示意图；

图7为本发明所提供的长短期记忆网络单元结构图；

图8为本发明所提供的本征模态函数输入堆叠网络进行训练的流程图；

图9为本发明所提供的数据中心能耗预测方法优化过程流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的目的是提供一种数据中心能耗预测方法及系统，避免了将历史用电数据直接输入长短期记忆网络导致的滞后现象，降低了预测误差。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明所提供的数据中心能耗预测方法流程图，如图1所示，一种数据中心能耗预测方法，包括：

步骤101：获取数据中心历史能耗数据；所述数据中心历史能耗数据为数据中心IT机房用电负荷。

所述步骤101之后还包括：将所述数据中心历史能耗数据划分为训练集以及验证集；将所述训练集作为训练所述堆叠式LSTM网络的训练数据；将所述验证集作为优化器的验证数据，优化最优参数，以预测未来的数据中心IT机房用电负荷；所述最优参数包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构以及堆叠式LSTM网络的堆叠结构，以下将“本征模态函数”简称为“本征函数”。

在实际应用中，图2为本发明所提供的数据中心IT机房用电负荷数据图，如图2所示，横坐标为时间，单位为月，纵坐标为功率，单位为瓦，利用数据中心能耗数据月为单位，建立一组能耗时间序列（3年周期），预测未来一段时间（3个月）的数据中心能耗情况。

选择一个数据中心IT机房IT设备用电量数据作为处理对象，选择40个月的历史数据，其中36个月的数据作为训练数据，4个月的数据作为优化器的验证数据。

步骤102：运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量。

在实际应用中，所述步骤102具体包括：利用公式计算固有模态分量；其中，为第k+1阶段的第k+1个固有模态分量，n为集成次数；N为经验模态分解次数；i为噪声添加次数；IMF₁为第一阶段的第1个固有模态分量；为第一阶段的剩余分量；为第k阶段的自适应系数；为加入白噪声后的第k阶段的第k个固有模态分量，固有模态分量即为本征模态函数；为白噪系数；利用公式计算剩余分量；其中，r_k(n)为第k阶段的剩余分量；r_k-1(n)为第k-1阶段的剩余分量；为第k阶段的第k个固有模态分量。

在实际应用中，对数据中心IT机房IT设备用电量数据进行平稳检验。所谓的平稳性，一般指宽平稳，即时间序列的均值和方差为与时间无关的常数，其协方差与时间间隔有关而与时间无关。一个平稳的时间序列指的是：遥想未来所能获得的样本时间序列，断定其均值、方差、协方差必定与眼下已获得的样本时间序列等同。反之，如果样本时间序列的本质特征只存在于所发生的当期，并不会延续到未来，亦即样本时间序列的均值、方差、协方差非常数，则这样一个时间序列不足以昭示未来，便称这样的样本时间序列是非平稳的。一般情况下能耗数据是非平稳的。

因为“平稳序列性消除了小概率事件”。平稳性就是要求经由能耗数据时间序列所得到的拟合曲线在未来的一段时间内仍能顺着现有的形态“惯性”地延续下去。如果数据非平稳，则说明样本拟合曲线的形态不具有“惯性”延续的特点，也就是基于未来将要获得的样本时间序列所拟合出来的曲线将迥异于当前的样本拟合曲线。所以选择CEEMDAN自适应白噪声完整集合经验模态分解处理是为了将非平稳的IT机房能耗数据分解为多个平稳的分量。

在实际应用中，CEEMDAN算法的详细处理过程如下：

CEEMDAN是在经验模态分解（EmpiricalModeDecomposition，EMD）基础上所发展出来的理论成果。在EMD的基础上通过添加自适应的白噪声有效地抑制EMD的模态混叠现象，使信号的重构误差几乎接近于0。该方法适合将非平稳、非线性数据中心能耗数据自适应地分解成若干个不同尺度的固有模态分量（IntrinsicModeFunction，IMF），其实现步骤为：

步骤1：设为数据中心能耗数据时间序列，ε为自适应系数，为每次分解加入的噪声序列，为第i次添加噪声之后的信号序列。EMD分解的N次实验平均值则为第1个固有模态分量IMF₁，为第1阶段第i个固有模态分量。

步骤2:计算第1阶段的余量序列r₁(n)，获得新的，进行N次实验，直到EMD分解IMF分量结束为止，所述余量序列即为剩余分量。

步骤3:在步骤2的基础上，计算第2阶段的第2个固有模态分量IMF2。

步骤4：重复计算到第k+1阶段，获得第k阶段的余量序列r_k(n)和第k+1个固有模态分量IMF_k。

，；

步骤5：重复上述步骤，若余量序列的极值点个数≤2，则停止EMD分解，得到最后的余量序列R(n)和固有模态分量IMF_k，那么原始信号序列x(n)最终分解为:

CEEMDAN的参数，在以上算法步骤中，CEEMDAN涉及到白噪系数、集成次数n、最大迭代次数；图3-图6为本发明所提供的CEEMDAN处理结果，如图3-图6所示。

步骤103：重组不同尺度的所述固有模态分量，生成多个本征模态函数重组组合。

在实际应用中，数据中心能耗数据经过CEEMDAN，变为IMF1、IMF2、IMF3、Res，将本征模态函数重组组合，变为三种组合，原组合（IMF1、IMF2、IMF3、Res）、新组合（IMF1+IMF2、IMF3、Res）、新组合（IMF1、IMF2+IMF3、Res）。

组合的目的是为了，产生更有效的数据分量。三种组合最后会确定一种作为最终的组合方式。组合的确定依据该组合在验证集的效果最优。

步骤104：构建堆叠式LSTM网络，并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络，并利用训练后的堆叠式LSTM网络预测新的模态分量。

在实际应用中，所述堆叠式LSTM网络为四层LSTM堆叠网络；第一层包括32个LSTM单元；第二层包括128个LSTM单元；第三层包括32个LSTM单元；第四层包括3个全连接层单元；其中，所述LSTM单元包括遗忘门、更新门以及输出门；输入任一时刻的输入向量和以及先前状态经过所述更新门运算后，与修正过的遗忘门更新状态，生成当前状态；同时，使用非线性的激活函数过滤所述当前状态，与所述输出门运算后输出下一时刻状态。

在实际应用中，图7为本发明所提供的长短期记忆网络单元结构图，如图7所示，单个长短期记忆网络单元通过3个门保护和控制存储单元中的信息，这些信息由激活函数的点乘⊙实现，通过梯度下降训练一系列参数来控制每个门的状态；LSTM中的每一个门都有一个特定且独特的功能。

遗忘门f从先前的状态h_t-1中决定丢弃哪些信息。

输入x_t和h_t-1经过更新门u运算后，与修正过的遗忘门f一块决定更新状态h_t应该用候选状态多少权重。

为了生成输出y_t，首先使用非线性的g₂函数过滤它的当前状态，然后与输出门o运算后一块输出y_t，其中返回部分状态y_t作为下次输入y_t-1。

每一个门都依赖于当前的外部输入x_t和之前的输出y_t-1。

式中：x_t为t时刻的输入向量；W_t、W_h、W_u和W_o是与输入单元相关的权重矩阵；R_f、R_h、R_u和R_o为隐藏层连接的权重矩阵；而b_f、b_h、b_u和b_o为偏置向量；激活函数σ为sigmoid或者tanh；g₁和g₂为非线性激活函数。

步骤105：重构所述新的模态分量，预测未来的数据中心IT机房用电负荷。

在实际应用中，所述步骤105具体包括：重构所述新的模态分量，生成新的本征模态函数重组组合；根据所述新的本征模态函数重组组合以及所述验证集输入至所述优化器，确定最佳参数；根据所述最佳参数预测未来的数据中心IT机房用电负荷。

将CEEMDAN分解后的本征模态函数输入堆叠网络进行训练：

图8为本发明所提供的本征模态函数输入堆叠网络进行训练的流程图，如图8所示，将CEEMADN计算好的本征模态函数重组组合输入LSTM网络，原组合（IMF1、IMF2、IMF3、Res）、新组合（IMF1+IMF2、IMF3、Res）、新组合（IMF1、IMF2+IMF3、Res）。

网络的batch_size为32，训练的迭代数epochs为300，评价指标为均方根误差RMSE。

每个本征模态函数重组组合均对应一个网络模型，本次本征模态函数组对应组合（IMF1、IMF2、IMF3、Res）、对应组合（IMF1+IMF2、IMF3、Res）、新组合（IMF1、IMF2+IMF3、Res），本征模态函数重组组合共有IMF1，IMF2，IMF3，IMF1+IMF2，IMF2+IMF3，Res共6个对应6个LSTM网络模型。

优化器进行参数优化：

模型搭建完成后，对应不同的参数有不同的结果，要选择最佳的参数来确定整个模型。

对应CEEMDAN阶段的参数（白噪系数10%-20%、集成次数300-600、最大迭代次数50-150），对应本征模态函数重组组合有三种重组方式，对应LSTM堆叠网络预测网络的结构（第一层16-38，第二层38-128，第三层3-32），通过初始值搭建的网络，需要优化模型的参数使预测效果最佳。通过优化器寻找最优解。

优化器的算法：优化器算法可以分解为解空间、目标函数和初始解三部分。

（1）初始化：初始温度T（充分大），初始解状态S（是算法迭代的起点），每个T值的迭代次数L。

（2）对k=1，…，L做第（3）至第6步。

（3）产生新解S′。

（4）计算增量ΔT=C（S′）-C（S），其中C（S）为代价函数。

（5）若ΔT<0则接受S′作为新的当前解，否则以概率exp（-ΔT/T）接受S′作为新的当前解。

（6）如果满足终止条件则输出当前解作为最优解，结束程序。终止条件通常取为连续若干个新解都没有被接受时终止算法。

（7）T逐渐减少，且T->0，然后转第2步。

解空间，对应CEEMDAN阶段的参数（白噪系数10%-20%、集成次数300-600、最大迭代次数50-150），对应本征模态函数重组组合有三种重组方式，对应LSTM堆叠网络预测网络的结构（第一层16-38，第二层38-128，第三层3-32）

目标函数，测试集与预测集的均方根误差。

初始解，对应CEEMDAN阶段的参数（白噪系数20%、集成次数500、最大迭代次数100），对应本征模态函数重组组合有三种重组方式，对应LSTM堆叠网络预测网络的结构（第一层32，第二层128，第三层32）。

优化过程：

第一步：由一个产生函数从当前解产生一个位于解空间的新解；为便于后续的计算和接受，减少算法耗时，通常选择由当前新解经过简单地变换即可产生新解的方法，如对构成新解的全部或部分元素进行置换、互换等，注意到产生新解的变换方法决定了当前新解的邻域结构，因而对冷却进度表的选取有一定的影响。

第二步：计算测试的输入与预测集的所对应的均方根误差。

第三步：判断新解是否被接受，判断的依据是一个接受准则，最常用的接受准则是Metropolis准则:若ΔT<0则接受S′作为新的当前解S，否则以概率exp（-ΔT/T）接受S′作为新的当前解S。

第四步：当新解被确定接受时，用新解代替当前解，这只需将当前解中对应于产生新解时的变换部分予以实现，同时修正目标函数值即可。此时，当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时，则在原当前解的基础上继续下一轮试验。

优化器求得的解与初始解状态S（是算法迭代的起点）无关；优化器具有渐近收敛性，已在理论上被证明是一种以概率l收敛于全局最优解的全局优化算法。

当最佳参数确定后，把数据中心IT机房能耗的最近36个月数据输入以上网络，最终输出一组未来三个月重组本征模态函数值，将本征模态函数值相加，得到未来3个的数据中心IT机房能耗值。

图9为本发明所提供的数据中心能耗预测方法优化过程流程图，如图9所示，本发明首先运用CEEMDAN算法将数据中心IT机房用电负荷序列分成若干个不同固有模态分量和趋势分量；之后模态分类组合将临近的模态分类组合一起形成一个较大的尺度的模态分类，将较大尺度的模态分类输入到一个由长短波记忆单元LSTM（包括LSTM1、LSTM2、......、LSTMo、LSTM21、LSTM22、......、LSTM2p、LSTM31、LSTM32、......、LSTM3q）构建的堆叠循环神经网络，由循环神经网络预测各较大尺度的模态分量，然后将预测的模态分量进行组合得到预测未来的数据中心IT用电负荷。其中，主要的参数，包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构、LSTM网络堆叠的结构，由优化器对比预测数据和验证数据确定。本发明较传统模型精度上有明显提高，具有更强的预测性能和泛化能力、误差更低，为数据中心的节能提供科学决策的依据。

此外，本发明还提供了一种数据中心能耗预测系统，包括：

数据中心历史能耗数据获取模块，用于获取数据中心历史能耗数据；所述数据中心历史能耗数据为数据中心IT机房用电负荷。

分解模块，用于运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量。

本征模态函数重组组合生成模块，用于重组不同尺度的所述固有模态分量，生成多个本征模态函数重组组合。

堆叠式LSTM网络构建以及新的模态分量预测模块，用于构建堆叠式LSTM网络，并利用多个所述本征模态函数重组组合以及所述剩余分量训练所述堆叠式LSTM网络，并利用训练后的堆叠式LSTM网络预测新的模态分量。

本发明还包括：数据划分模块，用于将所述数据中心历史能耗数据划分为训练集以及验证集；训练集应用模块，用于将所述训练集作为训练所述堆叠式LSTM网络的训练数据；验证集应用模块，用于将所述验证集作为优化器的验证数据，优化最优参数，以预测未来的数据中心IT机房用电负荷；所述最优参数包括白噪声稀疏、集成次数、最大迭代次数、本征模态函数重组组合的结构以及堆叠式LSTM网络的堆叠结构。

在实际应用中，所述分解模块，具体包括：固有模态分量计单元，用于利用公式计算固有模态分量；其中，IMF_k+1（n）为第k+1阶段的第k+1个固有模态分量，n为集成次数；N为经验模态分解次数；i为噪声添加次数；IMF₁为第一阶段的第1个固有模态分量；为第一阶段的剩余分量；为第k阶段的自适应系数；为加入白噪声后的第k阶段的第k个固有模态分量；为白噪系数；剩余分量计算单元，用于利用公式计算剩余分量；其中，r_k(n)为第k阶段的剩余分量；r_k-1(n)为第k-1阶段的剩余分量；为第k阶段的第k个固有模态分量。

在实际应用中，所述数据中心IT机房用电负荷预测模块，具体包括：重构单元，用于重构所述新的模态分量，生成新的本征模态函数重组组合；最佳参数确定单元，用于根据所述新的本征模态函数重组组合以及所述验证集输入至所述优化器，确定最佳参数；数据中心IT机房用电负荷预测单元，用于根据所述最佳参数预测未来的数据中心IT机房用电负荷。

由于数据中心能耗的预测历史数据的非平稳性，现行的去噪方法效果并不理想，本发明基于样本数据的本征模态函数组合抑制数据中心能耗数据中的噪声，保留有效信号的幅值。数据中心能耗的预测历史数据经过分解，经自适应白噪声完整集合经验模态分解分解为若干个本征模态分量IMFs；本发明所提的本征模态函数组合方法效果优于传统EMD和直接用能耗数据的预测方法。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种数据中心能耗预测方法，其特征在于，包括：

重构所述新的模态分量，预测未来的数据中心IT机房用电负荷；

所述运用CEEMDAN算法将所述数据中心历史能耗数据自适应地分解成若干个不同尺度的固有模态分量以及剩余分量，具体包括：

利用公式计算固有模态分量；其中，IMF_k+1（n）为第k+1阶段的第k+1个固有模态分量，n为集成次数；N为经验模态分解次数；i为噪声添加次数；IMF₁为第一阶段的第1个固有模态分量；为第一阶段的剩余分量；为第k阶段的自适应系数；IMFk（为加入白噪声后的第k阶段的第k个固有模态分量；为白噪系数；

利用公式计算剩余分量；其中，r_k(n)为第k阶段的剩余分量；r_k-1(n)为第k-1阶段的剩余分量；IMF_k（n）为第k阶段的第k个固有模态分量。

2.根据权利要求1所述的数据中心能耗预测方法，其特征在于，所述获取数据中心历史能耗数据，之后还包括：

将所述数据中心历史能耗数据划分为训练集以及验证集；

将所述训练集作为训练所述堆叠式LSTM网络的训练数据；

3.根据权利要求1所述的数据中心能耗预测方法，其特征在于，所述堆叠式LSTM网络为四层LSTM堆叠网络；

4.根据权利要求2所述的数据中心能耗预测方法，其特征在于，所述重构所述新的模态分量，预测未来的数据中心IT机房用电负荷，具体包括：

重构所述新的模态分量，生成新的本征模态函数重组组合；

根据所述最佳参数预测未来的数据中心IT机房用电负荷。

5.一种数据中心能耗预测系统，其特征在于，包括：

数据中心IT机房用电负荷预测模块，用于重构所述新的模态分量，预测未来的数据中心IT机房用电负荷；

所述分解模块，具体包括：

固有模态分量计单元，用于利用公式计算固有模态分量；其中，IMF_k+1（n）为第k+1阶段的第k+1个固有模态分量，n为集成次数；N为经验模态分解次数；i为噪声添加次数；IMF₁为第一阶段的第1个固有模态分量；为第一阶段的剩余分量；为第k阶段的自适应系数；IMFk（为加入白噪声后的第k阶段的第k个固有模态分量；为白噪系数；

剩余分量计算单元，用于利用公式计算剩余分量；其中，r_k(n)为第k阶段的剩余分量；r_k-1(n)为第k-1阶段的剩余分量；IMF_k（n）为第k阶段的第k个固有模态分量。

6.根据权利要求5所述的数据中心能耗预测系统，其特征在于，还包括：

7.根据权利要求5所述的数据中心能耗预测系统，其特征在于，所述堆叠式LSTM网络为四层LSTM堆叠网络；

8.根据权利要求6所述的数据中心能耗预测系统，其特征在于，所述数据中心IT机房用电负荷预测模块，具体包括：