CN115186803A

CN115186803A - 一种考虑pue的数据中心算力负荷需求组合预测方法和系统

Info

Publication number: CN115186803A
Application number: CN202210907072.9A
Authority: CN
Inventors: 陈冬林; 邹安琪; 吴天昊; 马一帆
Original assignee: Wuhan University of Technology WUT
Current assignee: Wuhan University of Technology WUT
Priority date: 2022-07-29
Filing date: 2022-07-29
Publication date: 2022-10-14

Abstract

本发明公开了一种基于神经网络考虑PUE的数据中心算力负荷需求组合预测方法和系统，该系统包括数据中心算力负荷需求预测模型构建模块、BP神经网络优化模块、模型训练模块和预测模块；本发明采用BP‑GRU组合预测模型对传统预测方法作出改进，并采用改进的GA‑PSO算法改善了BP神经网络对初始权重敏感，易陷入局部最优、收敛速度慢，泛化能力较差的缺陷并结合GRU模型进行组合预测，弥补了BP神经网络的缺乏时序状态缺陷。该预测方法基于需求侧角度，考虑了数据中心内能耗指标以及内外部各影响因素之间的联动性，为“东数西算”背景下，数据中心企业的算力负荷需求预测提供了可行性方案，以期进行科学有效的跨域调度。

Description

一种考虑PUE的数据中心算力负荷需求组合预测方法和系统

技术领域

本发明属于计算机科学信息分析以及预测技术领域，具体涉及一种考虑PUE的数据中心算力负荷需求组合预测方法和系统。

背景技术

数字经济正在成为重组要素资源、重塑经济结构、提升市场竞争力的关键力量。数据中心将电力转化为算力推动数字经济发展，并依托“东数西算”工程每年以超过20％的速度增长，我国数据中心用电量已超过全社会的2％。在电力储能技术难以达到大量高效存储以及负荷需求时刻发生变化的背景下，对数据中心算力负荷需求的精准预测是实现电力系统供给与算力负荷需求之间动态平衡的一种有效方法。有助于数据中心企业合理提升上架率，降低资源虚耗成本，优化能耗指标，进行调度规划。

目前数据中心算力负荷需求主要作用于存储和传输数据的IT设备负荷，因其较高的可变性和差异性，从而导致其负荷受多重因素影响。数据中心负荷预测研究通常从供给侧视角，选取气温、制冷量、制热量、湿度、数据中心内外部设备等相关指标对其总负荷进行单一映射分析，而忽视了数据中心能耗指标和需求侧的影响，更未考虑各影响因素之间的联动性，致使算力需求负荷的特性的分析不够全面。

此外，传统预测模型如时间序列模型、神经网络模型、人工智能优化模型等，在单一数据集上预测结果较好，但在多个数据集预测上精准度较低。并且，传统预测算法极易陷入对初始权重异常敏感、局部最优解、收敛速度慢，泛化能力较差等缺陷。上述问题均给数据中心的精准负荷预测带来挑战。

在现有专利中，《一种基于混合模型预测的数据中心站多元负荷预测方法(申请号CN202111048836.5)》通过GRA方法对多元负荷数据进行特征分析和归一化,将处理后的数据输入到QPSO-BP神经网络与XGBoost模型并行预测，但其仅考虑影响数据中心电力负荷的外部因素，未将数据中心内部能耗PUE值等关键影响因素相结合进行预测。

发明内容

为了解决上述忽视了数据中心能耗指标和需求侧的影响，更未考虑各影响因素之间的联动性、以及传统预测算法极易陷入对初始权重异常敏感、局部最优解、收敛速度慢，泛化能力较差等缺陷的技术问题，本发明提出一种考虑PUE的数据中心算力负荷需求组合预测方法，在考虑数据中心外部天气因素的基础上还考虑了数据中心内部能耗PUE值的影响，并对数据集采用K-Means算法聚类分析进行特征提取，而后采用BP-GRU组合预测模型对传统预测方法作出改进，并引入GA-PSO算法对BP神经网络的缺陷进行优化，将机器学习和深度学习技术同时应用于负荷预测。

实现本发明目的之一的一种考虑PUE的数据中心算力负荷需求组合预测方法，包括如下步骤：

S1、根据预设时间段内的由大规模GPU集群产生的工作负载的历史数据建立数据中心算力负荷需求预测模型，所述数据中心算力负荷需求预测模型是基于GA-PSO优化算法优化的BP神经网络和GRU神经网络的组合预测模型，用于根据当前时刻的工作负载数据预测未来时刻的算力负荷需求；

所述工作负载数据包括日期，用户ID，该日期对应的并行运行的任务实例数量及每个任务实例的运行时长，GPU数量和型号；

所述数据中心算力负荷需求预测模型的输入层数据包括：算力负荷需求、PUE值、时间特征值；输出层数据为算力负荷需求；

所述时间特征值即用于判断工作负载数据中的日期是否为节假日还是工作日；节假日和工作日分别用不同的标记去标识；

所述PUE值的计算公式为：

PUE＝数据中心所有机器的总耗能/数据中心GPU的总耗能；

所述算力负荷需求即为数据中心并行运行的任务实例的数量；

S2、采用GA-PSO优化算法优化BP神经网络每个维度的权值和阈值，得到GA-PSO-BP网络模型，其优化目标为样本误差平方和的倒数，以使得上述数据中心算力负荷需求预测模型的拟合误差最小；

所述样本为GPU集群产生的工作负载的历史数据；当所述样本误差平方和的倒数不再变小时，则认为此时的BP神经网络每个维度的权值和阈值最优，GA-PSO-BP网络模型训练完毕；

S3、将大规模GPU集群产生的工作负载的历史数据划分为训练集和测试集，利用训练集对所述数据中心算力负荷需求预测模型进行训练，得到训练完毕的数据中心算力负荷需求预测模型，在测试阶段，将测试集输入GA-PSO-BP网络模型；达到最大迭代次数后，输出预测的算力负荷需求A；再将所述算力负荷需求A输入GRU神经网络，得到预测的算力负荷需求数据集B；达到最大迭代次数后，将所述数据集A与GA-PSO-BP网络模型的输出结果的权重相乘，所述数据集B与GRU神经网络的输出结果的权重相乘，然后将乘积之和作为预测的算力负荷需求输出，对预测的算力负荷需求输出进行评价，从而确定训练完毕的数据中心算力负荷需求预测模型是否满足要求。

S4、将当前时刻的工作负载数据输入步骤S3中训练完毕的数据中心算力负荷需求预测模型，数据中心算力负荷需求预测模型输出数据中心未来时刻的算力负荷需求。

进一步地，为了改善BP神经网络缺乏时序状态的不足，利用GRU神经网络结合BP神经网络以进行神经网络的组合预测。

进一步地，所述步骤S2中，采用GA-PSO算法优化BP神经网络的的权值和阈值，需要对如下参数进行设定：

(1)、设定工作负载数据中的算力负荷需求、PUE值、时间特征作为BP网络的输入层；设定算力负荷需求作为BP神经网络的输出层；

(2)、根据下式设定BP网络的隐含层个数：

式中：

H为隐含层节点个数；

M为输入层节点个数；N为输出层节点个数；

a为设定的调节整数，优选范围为[1,10]；

(3)、根据下式设定BP网络的学习率η：

式中：

T_now为当前迭代次数；

T_max为最大迭代次数；

(4)、设定tansig函数作为输出层和隐含层之间的节点传递函数；purelin线性函数作为输出层的节点传递函数；trainlm函数作为训练函数；

运用GA算法中的交叉、变异操作对GA-PSO算法的参数进行优化，具体优化流程如下：

粒子i在d维(1≤d≤D)的速度v_id和位置X_id随个体极值和群体极值的更新而变化，更新公式分别如下：

X_id＝X_id+v_id

式中：

V_id：表示第i个粒子在第d维的速度；

X_id：表示第i个粒子在第d维的位置；

ω为惯性权重；

c₁，c₂为学习因子；

表示区间[0,1]上的随机数，其中t为当前迭代次数；

Pbest_id为第i个粒子在第d维的个体极值，d为解的空间维度；

Gbest_id为第i个粒子在第d维的群体极值，d为解的空间维度；

迭代过程中，需要对每个粒子的好坏进行评价。采用样本误差平方和的倒数的线性函数作为适应度函数，为了防止偶然一次变异失败或者交叉失败，本发明引入惯性权重对适应度函数进行优化，适度度的计算公式为:

式中：

fitnesss_now：表示更新后的适应度值；

fitnesss_past：表示更新前的适应度值；

w_now+w_past＝1，A，B均为设定的常数；

p_i为第i个训练样本的网络预测值；

r_i为第i个训练样本的实际输出值；

N为训练样本总数。

粒子群交叉、变异操作：对种群个体进行实数编码，以交叉概率P_c进行交叉。

设置交叉的段数为n，n为0到10之间的整数；把染色体分为2n段，对奇数段进行交叉；即如果交叉的段数为4段时，则把染色体分为8段，其中1，3，5，7段交叉。

对配对粒子i和j的交叉操作如下式：

速度交叉：

位置交叉：

式中：

α₁，α₂为区间[0,1]上的随机数；

V_jd：表示第j个粒子在第d维的速度；

X_jd：表示第j个粒子在第d维的位置；

选取第i个粒子以变异概率P_m进行变异，如下式：

速度变异：

位置变异：

式中：

V_id(t)：表示第i个粒子t时刻在第d维的速度；

X_id(t)：表示第i个粒子t时刻在第d维的位置；

v_min，v_max分别为粒子的最小速度和最大速度；

X_min，X_max分别为粒子位置的下界和上界；

为区间[0,1]上的随机数。

实现本发明目的之二的一种考虑PUE的数据中心算力负荷需求组合预测系统，包括数据中心算力负荷需求预测模型构建模块、BP神经网络优化模块、模型训练模块和预测模块；

所述数据中心算力负荷需求预测模型构建模块用于根据预设时间段内的由GPU集群产生的工作负载的历史数据建立数据中心算力负荷需求预测模型，所述数据中心算力负荷需求预测模型是基于GA-PSO优化算法优化的BP神经网络和GRU神经网络的组合预测模型，用于根据当前时刻的工作负载数据预测未来时刻的算力负荷需求；

所述BP神经网络优化模块用于采用GA-PSO优化算法优化BP神经网络每个维度的权值和阈值，得到GA-PSO-BP网络模型，其优化目标为样本误差平方和的倒数，以使得上述数据中心算力负荷需求预测模型的拟合误差最小；

所述模型训练模块用于将GPU集群产生的工作负载的历史数据划分为训练集和测试集，利用训练集对所述数据中心算力负荷需求预测模型进行训练，得到训练完毕的数据中心算力负荷需求预测模型，在测试阶段，将测试集输入GA-PSO-BP网络模型；达到最大迭代次数后，输出预测的算力负荷需求A；再将所述算力负荷需求A输入GRU神经网络，得到预测的算力负荷需求数据集B；达到最大迭代次数后，将所述数据集A与GA-PSO-BP层输出结果的权重相乘得到乘积A’，将所述数据集B与GRU层输出结果的权重相乘得到乘积B’，将A’与B’之和作为预测的算力负荷需求输出，对预测的算力负荷需求输出进行评价，从而确定训练完毕的数据中心算力负荷需求预测模型是否满足要求；

所述预测模块将当前时刻的工作负载数据输入训练完毕的数据中心算力负荷需求预测模型，数据中心算力负荷需求预测模型输出数据中心未来时刻的算力负荷需求。

进一步地，所述BP神经网络优化模块还包括参数优化模块、粒子优化模块；

所述参数优化模块用于对BP网络的隐含层个数、BP网络的学习率、输出层和隐含层之间的节点传递函数、输出层的节点传递函数和训练函数进行优化；

所述粒子优化模块用于对BP神经网络中的粒子i在d维(1≤d≤D)的速度v_id和位置X_id进行优化。

所述BP神经网络优化模块还包括粒子交叉优化模块，用于运用GA算法中的交叉操作对BP神经网络的交叉过程中的配对粒子i和j的速度和位置进行优化。

所述BP神经网络优化模块还包括粒子变异优化模块，用于运用GA算法中的变异操作对BP神经网络的变异过程中的粒子的速度和位置进行优化。

有益效果

本发明采用BP-GRU组合预测模型对传统预测方法作出改进，并采用改进的GA-PSO算法改善了BP神经网络对初始权重敏感，易陷入局部最优、收敛速度慢，泛化能力较差的缺陷并结合GRU模型进行组合预测，弥补了BP神经网络的缺乏时序状态缺陷。该预测方法基于需求侧角度，考虑了数据中心内能耗指标以及内外部各影响因素之间的联动性，为“东数西算”背景下，数据中心企业的算力负荷需求预测提供了可行性方案，以期进行科学有效的跨域调度。

附图说明

图1是本发明所述方法的实施例的流程示意图；

图2是BP神经网络结构示意图；

图3是本发明所述方法的实施例中采用GA-PSO优化算法优化BP神经网络模型的流程示意图；

图4是GRU结构示意图。

具体实施方式

下列具体实施方式用于对本发明权利要求技术方案的解释，以便本领域的技术人员理解本权利要求书。本发明的保护范围不限于下列具体的实施结构。本领域的技术人员做出的包含有本发明权利要求书技术方案而不同于下列具体实施方式的也是本发明的保护范围。

下面结合图1～4讲述本发明所述方法的一个实施例。

步骤1、收集数据中心由大规模GPU集群产生的原始数据集，所述数据集包括日期，用户ID，任务实例数及其运行时长，GPU数量和型号；并将月转换为以小时为单位的数据集；并获取相应的PUE(Power Usage Effectiveness，评价数据中心能源效率的指标)数据，本发明所述的算力负荷需求即为用户在该平台上的任务实例；PUE值为数据中心所有机器的总耗能/数据中心GPU的总耗能，相关研究表明，PUE受温度影响，温度越高，PUE值越大；

步骤2、对上述原始数据集进行预处理，鉴于用户多样化的海量数据，需对各个数据集分别进行数据清洗，包括：数据集特征属性扩展，处理缺失值和异常值，归一化处理。

数据集特征扩展即：针对可能对数据中心算力负荷需求产生影响的特征属性，将其纳入当前用户的数据集中。

如日期特征上的工作日和节假日，如果是节假日，则额外赋值为1，工作日则额外值赋值为0，此额外值作为时间特征作为数据集的扩展属性。将扩展属性和原始数据集进行合并，形成具有特征扩展的数据集。

缺失值和异常值的处理包括：对于缺失值采用固定值进行填补，异常值如负值予以剔除；

根据预设时间段内的由大规模GPU集群产生的工作负载的历史数据建立数据中心算力负荷需求预测模型，确定所述预测模型的输入节点为预测日之前1日且以小时为单位的数据中心算力需求负荷值，PUE值，时间特征；输出节点是预测当日数据中心算力需求负荷值。鉴于PUE值取值范围一般在[1,2]之间与数据中心算力需求负荷值差异较大，故采用特征缩放法对样本进行归一化处理。将每个数据的特征值X_i缩放到[0,1]或[-1,1]之间，即：

其中，X_max，X_min分别为特征值X的最大值和最小值，X_i为原始数据，X_i为特征值X的第i个值。

步骤3、K-means聚类模型优化。应用K-means聚类模型对不同时刻相似的算力负荷曲线进行聚类，用于提升后续数据中心算力负荷需求预测模型的精度。考虑到不同用户个性化的需求对算力负荷产生的影响，本发明将用户ID作为特征，将归一化后的数据集以用户ID为单位重新拆分成多个数据集，而后采用K-Means聚类模型对拆分后的数据集进行聚类。

针对K-Means聚类模型中k值的选择问题，本实施例中把不同k值以及聚类模型的损失函数值共同组成的k-mark曲线绘制出来。随着k值的增大，mark会减小，每个类包含的样本数会减少，于是样本离其类的中心点更近。随着k值继续增大，虽然mark仍然会减少，但下降幅度明显变缓了，也就表明聚类模型的改善效果会不断减低。k值增大过程中，聚类模型的改善效果下降幅度最大的位置对应的值就是曲线中的转折点，本发明中将这个k值作为近似最优的k值。进一步地，本发明中的mark计算公式如下：

其中，mark为每个样本点到重心的误差平方和，m_i表示为第i类的重心，P_i为m_i类中的样本点。

步骤4、GA-PSO-BP神经网络模型优化。将利用K-Means聚类模型进行优化后的数据集以7：3的比例随机划分用于神经网络模型的训练和测试。采用GA-PSO优化算法优化BP神经网络模型的权值和阈值，得到GA-PSO-BP网络模型，其优化目标为样本误差平方和的倒数，其优化过程如图3所示，以获得拟合误差较小的算力负荷需求预测模型；维数D是BP神经网络权值和阈值的和，GA-PSO优化BP神经网络的具体流程如下：

1、BP神经网络拓扑结构初始化。确定输入层、隐含层、输出层神经元个数和训练函数，图2为BP神经网络结构图。算力负荷需求、PUE值、时间特征(是否为节假日)作为BP神经网络的输入，由此输入层神经元个数为3；算力负荷需求作为BP神经网络的输出，故输出层神经元个数为1；

2、合适的隐含层的节点数H是BP神经网络结构功能顺利实现的关键，确定隐含层节点数的基本原则是：在满足精度的前提下，取尽可能紧凑的结构,即取尽可能少的隐含层节点数。本发明采用向上取整法来确定最佳隐含层个数：

其中，H为隐含层节点个数，M为输入层节点个数，N为输出层节点个数，a为1-10之间的调节整数。

3、学习率η是在BP神经网络每一次训练中更新权重和阈值的修正变化量，学习率η过小，可能导致收敛速度慢或者陷入次优解，而学习率η过大，则可能因为更新的步长太大而错过最优解，网络结构陷入不稳定的振荡期。考虑到学习率η的范围小于1，且取值偏小，本实施例对学习率作了动态变换的计算：

其中，T_now为当前迭代，T_max为最大迭代次数。

4、为解决非线性问题，BP神经网络输入层和隐含层大多采用非线性函数，S型传递函数，可将中间过程数据控制在合理的范围内，输出层采用线性函数，则输出数据可在任意范围取值。本实施例中选择非线性函数tansig函数作为输出层和隐含层之间的节点传递函数，输出层的节点传递函数则采用purelin线性函数。trainlm函数作为训练函数。

5、BP神经网络权值和阈值的设计，本实施例采用误差修正学习规则对BP神经网络进行训练，具体如下所示：

5.1、信号的正向计算过程：样本数据从输入层经过隐含层向输出层传播的计算过程，根据输入样本计算网络输出值。

网络隐含层中第i个节点的输入Hid_i：

网络隐含层中第i个节点的输出y_i：

网络输出层中第k个节点的输入In_k：

网络输出层中第k个节点的输出Out_k：

上述公式中：

Hid_i为网络隐含层中第i个节点的输入；

w_ij为隐含层节点i和输入层节点j的连接权值；

x_j为输入层第j个神经元的输入；

M为隐含层的神经元个数；

b_i为隐含层节点i的阈值；

y_i为网络隐含层中第i个节点的输出；

f₁是隐含层的传递函数；f₂是输出层的传递函数；

In_k为网络输出层中第k个节点的输入；

a_k为输出层的阈值；

Out_k为网络输出层中第k个节点的输出；

S为输出层神经元个数。

5.2、误差信号反向传递计算过程：

利用样本正向传递计算过程得到网络输出误差对网络的权值和阈值进行学习修正，直到达到期望值或迭代次数输出误差。误差函数为：

上式中：

E为样本误差；

w为惯性权重；

b为维度；

T_k为输出层迭代k节点的目标输出值；

Out_k为输出层迭代k节点的实际输出值。

根据梯度下降法反向计算修正后的输出层权值，则从第i个输入到第k个输出的权值为：

隐含层权值修正，从第j个输入到第i个输出的权值为：

输出层阈值修正：

隐含层阈值修正：

根据：

最终得到的权值和阈值调整公式：

上述公式中：

Δw_ki为；第i个输入到第k个输出的权值；

η为：学习率；

s为：输出层神经元个数；

T_k为：为输出层迭代k节点的目标输出值；

OUT_k为网络输出层中第k个节点的输出；

f'₁(Hid_k)为：隐含层K节点的传递函数的倒数；

y_i为网络隐含层中第i个节点的输出；

f₂'(Hid_i)为:输出层K节点的传递函数的倒数；

x_j为：输入层第j个神经元的输入；

Δw_ij为：从第j个输入到第i个输出的权值；

Δa_k为：修正的输出层阈值；

Δb_i为：修正的隐含层阈值；

将网络输出偏差从输出层传递到隐含层再到输入层，对网络每层的权值和阈值作出修正。

6、种群初始化。改善BP神经网络易对权值敏感的缺陷，将BP神经网络的所有参数看作一个D维向量，便于引入GA-PSO算法对BP网络的每个维度的权值和阈值进行优化。GA-PSO算法的基本参数设置如下：

①种群U的粒子个数设置为m；种群U代表输入的算力负荷需求影响因素的数据序列；本实例将种群数U设为30，粒子个数m设为100。对粒子进行实数编码后与BP神经网络的权值和阈值相对应，即一个编码信息包含一个BP神经网络的所有权值和阈值也代表种群中每一个个体；

③粒子速度上下限v_min,～v_max：所述vmin,～vmax代表粒子移动距离的范围宽度；本实例中v_min设为-5，v_max设为5；

④设置学习因子c₁,c₂：其优选范围为[0，4]，优选值为2；

⑤设置惯性权重ω：优选范围为[0.4，0.9]，优选值为0.8；

⑥设置收敛精度为δ，视具体问题而定；

⑦设置最大迭代次数为G，根据实际问题调整，本实例中设置为100。

⑧设置交叉概率P_c，变异概率P_m：在粒子群迭代时分别对粒子的位置向量和速度向量以一定概率进行交叉操作和变异操作，避免陷入局部极值点，增强了种群的空间搜索性能的同时种群的多样性，本实施例中P_c的优选值为0.3，P_m的优选值为0.1，但均不限于此。

7、运用GA算法中的交叉、变异操作对GA-PSO算法的参数进行优化，具体优化流程如下：

粒子i在d维(1≤d≤D)的速度V_id和位置X_id随个体极值和群体极值的更新而变化，其中D为总的维度数据，更新公式分别如下：

X_id＝X_id+v_id

其中，t为当前迭代次数；d为解的空间维数；ω为惯性权重；C₁，C₂是学习因子；

表示区间[0,1]上的随机数；Pbest_id为第i个粒子个体极值的第d维；Gbest_id为群体极值的第d维。

适应度函数设计：迭代过程中，需要对每个粒子的好坏进行评价。采用样本误差平方和倒数的线性函数作为适应度函数，为了防止偶然一次变异失败或者交叉失败，本发明引入惯性权重，其计算公式为:

式中：

fitnesss_now：表示更新后的适应度值；

ω_now：表示更新后的惯性权重；

fitnesss_past：表示更新前的适应度值；

ω_past和ω_now：分别表示迭代前和迭代后的惯性权重，w_now+w_past＝1；

A，B均为设定常数；

P_i为第i个训练样本的网络预测值；

r_i为相应的实际输出值；

N为训练样本总数。

粒子群交叉、变异操作：对种群个体进行实数编码，以交叉概率P_c进行交叉，本实施例中P_c为0.3，但不限于此。

设置交叉的段数为n，本实施例中n为0到10之间的整数，通过rand函数来选择交叉段数，选定交叉段数后，把染色体分为2n段，对奇数段进行交叉，即如果交叉的段数为4段时，则把染色体分为8段，其中1，3，5，7段交叉。对配对粒子i和j的交叉操作如下式：

速度交叉：

位置交叉：

式中：

α₁、α₂为区间[0,1]上的随机数；

V_jd：表示第j个粒子在第d维的速度；

X_jd：表示第j个粒子在第d维的位置；

选取第i个粒子进行变异，如下式：

速度变异：

位置变异：

式中，v_min、v_max分别为粒子的最小速度和最大速度；X_min、X_max分别为粒子位置的下界和上界；

为区间[0,1]上的随机数。

步骤5、考虑PUE的数据中心算力负荷需求组合预测模型。所述算力负荷需求组合预测模型基于GA-PSO-BP模型和GRU模型的组合预测。门循环单元(GRU)是循环神经网络(RNN)的一种，是长短期记忆网络(LSTM)的简化改进版本，GRU模型引入了两个门函数：更新门与重置门，分别用于记忆信息和过滤信息。GRU数学模型如下：

z_t＝σ(U^(z)h_t-1+W^(z)x_t)

r_t＝σ(U^(r)h_t-1+W^(r)x_t)

h_t＝(1σ-z_t)⊙h_t-1+z_t⊙h_t

y_t＝σ(W'h_t)

式中，σ为Sigmoid激活函数，tanh为双曲正切激活函数，U^(z)和W^(z)为更新门的权重矩阵，U^(r)和W^(r)为重置门的权重矩阵，h_t为第t时刻当前层的输出，x_t为第t时刻该层隐藏层的输入的PUE值和时间特征，y_t为预测的算力负荷需求。

是上一时刻h_t-1输出和当前输入x_t的汇总。具体内部结构如图4所示。

对GRU层参数进行如下设定：

①滑动时间窗口长度设置为24，即用于预测时间片段的长度等于GA-PSO-BP网络的输出维度，即连续24h的数据中心算力负荷的序列输出作为一个输出维度；

②训练批次大小设置为56，即每次调整参数前选取的样本个数；

③GRU输入维度设置为与GAP-SO-BP网络的输出维度相同；

④GRU层神经元个数设置为60个；

⑤GA-PSO-BP层输出结果的权重与GRU层输出结果的权重分别取0.4与0.6；所述GA-PSO-BP层输出结果的权重即GRU层输入权重；

⑥预测组合模型的迭代次数设置为100次；

将所述由大规模GPU集群产生的工作负载的历史数据按7：3的比例划分为训练集与测试集；首先将经过预处理的训练集分别输入GA-PSO-BP网络模型和GRU神经网络模型进行训练，并保存训练好的两种模型参数，并将训练结果用于测试集的预测。在测试阶段，将测试集输入GA-PSO-BP网络；达到最大迭代次数后，输出预测的算力负荷需求A；再将所述算力负荷需求A输入GRU神经网络，得到预测的算力负荷需求数据集B；达到最大迭代次数后，将数据集A与数据集B分别与自身结果权重相乘之和作为预测的算力负荷需求输出。

步骤6、模型的训练和测试。通过算力负荷需求的训练集对组合预测模型进行训练，并计算其MSE(均方误差)，采用算力负荷需求的测试集进行测试，并对比模型输出结果和测试样本的MSE，计算公式为：

其中，N为训练样本总数，n＝1……N,y_i表示实际算力负荷需求，

表示预测的算力负荷需求。

步骤7、模型评价。为了更好展示该组合模型的优越性，本发明选取平均绝对误差(MAE)，均方误差(MSE)，均方根误差(RMSE)三大性能指标函数进行误差对比分析，MAE和RMSE的计算公式分别为：

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

本申请实施例还提供一种考虑PUE的数据中心算力负荷需求组合预测系统，包括数据中心算力负荷需求预测模型构建模块、BP神经网络优化模块、模型训练模块和预测模块；

数据中心算力负荷需求预测模型构建模块用于根据预设时间段内的由GPU集群产生的工作负载的历史数据建立数据中心算力负荷需求预测模型，所述数据中心算力负荷需求预测模型是基于GA-PSO优化算法优化的BP神经网络和GRU神经网络的组合预测模型，用于根据当前时刻的工作负载数据预测未来时刻的算力负荷需求；

BP神经网络优化模块用于采用GA-PSO优化算法优化BP神经网络每个维度的权值和阈值，得到GA-PSO-BP网络模型，其优化目标为样本误差平方和的倒数，以使得上述数据中心算力负荷需求预测模型的拟合误差最小；

模型训练模块用于将GPU集群产生的工作负载的历史数据划分为训练集和测试集，利用训练集对所述数据中心算力负荷需求预测模型进行训练，得到训练完毕的数据中心算力负荷需求预测模型，在测试阶段，将测试集输入GA-PSO-BP网络模型；达到最大迭代次数后，输出预测的算力负荷需求A；再将所述算力负荷需求A输入GRU神经网络，得到预测的算力负荷需求数据集B；达到最大迭代次数后，将所述数据集A与GA-PSO-BP网络模型的输出结果的权重相乘得到乘积A’，将所述数据集B与GRU神经网络的输出结果的权重相乘得到乘积B’，将A’与B’之和作为预测的算力负荷需求输出，对预测的算力负荷需求输出进行评价，从而确定训练完毕的数据中心算力负荷需求预测模型是否满足要求；

预测模块将当前时刻的工作负载数据输入训练完毕的数据中心算力负荷需求预测模型，数据中心算力负荷需求预测模型输出数据中心未来时刻的算力负荷需求。

另一个实施例中，BP神经网络优化模块还包括参数优化模块、粒子优化模块；参数优化模块用于对BP网络的隐含层个数、BP网络的学习率、输出层和隐含层之间的节点传递函数、输出层的节点传递函数和训练函数进行优化；粒子优化模块用于对BP神经网络中的粒子i在第d维(1≤d≤D)的速度v_id和位置X_id进行优化，D为维度总数；

另一个实施例中，BP神经网络优化模块还包括粒子交叉优化模块，用于运用GA算法中的交叉操作对BP神经网络的交叉过程中的配对粒子i和j的速度和位置进行优化。

另一个实施例中，BP神经网络优化模块还包括粒子变异优化模块，用于运用GA算法中的变异操作对BP神经网络的变异过程中的粒子的速度和位置进行优化。

本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种考虑PUE的数据中心算力负荷需求组合预测方法，其特征在于，包括如下步骤：

S1、根据预设时间段内的由GPU集群产生的工作负载的历史数据建立数据中心算力负荷需求预测模型，所述数据中心算力负荷需求预测模型是基于GA-PSO优化算法优化的BP神经网络和GRU神经网络的组合预测模型，用于根据当前时刻的工作负载数据预测未来时刻的算力负荷需求；

S3、将GPU集群产生的工作负载的历史数据划分为训练集和测试集，利用训练集对所述数据中心算力负荷需求预测模型进行训练，得到训练完毕的数据中心算力负荷需求预测模型，在测试阶段，将测试集输入GA-PSO-BP网络模型；达到最大迭代次数后，输出预测的算力负荷需求A；再将所述算力负荷需求A输入GRU神经网络，得到预测的算力负荷需求数据集B；达到最大迭代次数后，将所述数据集A与GA-PSO-BP网络模型的输出结果的权重相乘得到乘积A’，将所述数据集B与GRU神经网络的输出结果的权重相乘得到乘积B’，将A’与B’之和作为预测的算力负荷需求输出，对预测的算力负荷需求输出进行评价，从而确定训练完毕的数据中心算力负荷需求预测模型是否满足要求；

2.如权利要求1所述的考虑PUE的数据中心算力负荷需求组合预测方法，其特征在于，采用GA-PSO算法优化BP神经网络的权值和阈值的方法包括对如下参数进行优化：

(1)、根据下式设定BP网络的隐含层个数：

式中：

H为隐含层节点个数；

M为输入层节点个数；N为输出层节点个数；

a为设定的调节整数；

(2)、根据下式设定BP网络的学习率η：

式中：

T_now为当前迭代次数；

T_max为最大迭代次数；

(3)、设定tansig函数作为输出层和隐含层之间的节点传递函数；purelin线性函数作为输出层的节点传递函数；trainlm函数作为训练函数。

3.如权利要求1所述的考虑PUE的数据中心算力负荷需求组合预测方法，其特征在于，采用GA-PSO算法优化BP神经网络的的权值和阈值的方法，还包括对BP神经网络中的粒子i在第d维的速度v_id和位置X_id进行优化；

粒子i在第d维的速度v_id和位置X_id随个体极值和群体极值的更新公式如下：

X_id＝X_id+v_id

式中：

V_id：表示第i个粒子在第d维的速度；

X_id：表示第i个粒子在第d维的位置；

t为当前迭代次数；

d为解的空间维数，1≤d≤D，D为总维数；

ω为惯性权重；

C₁、C₂是学习因子；

表示区间[0,1]上的随机数；

Pbest_id为第i个粒子在第d维的个体极值；

Gbest_id为第i个粒子在第d维的群体极值。

4.如权利要求1所述的考虑PUE的数据中心算力负荷需求组合预测方法，其特征在于，采用GA-PSO算法优化BP神经网络的的权值和阈值的方法，还包括运用GA算法中的交叉操作对BP神经网络中交叉过程中的配对粒子i和j的速度和位置进行优化，公式如下：

速度交叉：

位置交叉：

式中：

α₁，α₂为设定区间内的随机数；

V_id(t)、V_jd(t)：分别表示第i个粒子和第j个粒子t时刻在第d维的速度；

X_id(t)和X_jd(t)：表示第i个粒子和第j个粒子t时刻在第d维的位置；

d为解的空间维数，1≤d≤D，D为总维数。

5.如权利要求1所述的考虑PUE的数据中心算力负荷需求组合预测方法，其特征在于，采用GA-PSO算法优化BP神经网络的的权值和阈值的方法，还包括运用GA算法中的变异操作对BP神经网络变异过程中的粒子i的速度和位置进行优化，公式如下：

速度变异：

位置变异：

式中：

V_id(t)：表示第i个粒子t时刻在第d维的速度；

X_id(t)：表示第i个粒子t时刻在第d维的位置；

V_min，V_max：分别为粒子i的最小速度和最大速度；

X_min，X_max：分别为粒子i位置的下界和上界；

d为解的空间维数，1≤d≤D，D为总维数；

为区间[0,1]上的随机数。

6.如权利要求1所述的考虑PUE的数据中心算力负荷需求组合预测方法，其特征在于，所述采用GA-PSO算法优化BP神经网络的的权值和阈值的方法，还包括对BP神经网络中的适应度函数进行优化，其计算公式为:

式中：

fitnesss_now：表示更新后的适应度值；

ω_now：表示更新后的惯性权重；

fitnesss_past：表示更新前的适应度值；

ω_past和ω_now：分别表示迭代前和迭代后的惯性权重，且ω_past和ω_now的和为设定值；

A，B均为设定的常数；

p_i为第i个训练样本的网络预测值；

r_i为第i个训练样本的实际输出值；

N为训练样本总数。

7.一种如权利要求1所述方法的考虑PUE的数据中心算力负荷需求组合预测系统，其特征在于，包括数据中心算力负荷需求预测模型构建模块、BP神经网络优化模块、模型训练模块和预测模块；

所述模型训练模块用于将GPU集群产生的工作负载的历史数据划分为训练集和测试集，利用训练集对所述数据中心算力负荷需求预测模型进行训练，得到训练完毕的数据中心算力负荷需求预测模型，在测试阶段，将测试集输入GA-PSO-BP网络模型；达到最大迭代次数后，输出预测的算力负荷需求A；再将所述算力负荷需求A输入GRU神经网络，得到预测的算力负荷需求数据集B；达到最大迭代次数后，将所述数据集A与GA-PSO-BP网络模型的输出结果的权重相乘得到乘积A’，将所述数据集B与GRU神经网络的输出结果的权重相乘得到乘积B’，将A’与B’之和作为预测的算力负荷需求输出，对预测的算力负荷需求输出进行评价，从而确定训练完毕的数据中心算力负荷需求预测模型是否满足要求；

8.如权利要求7所述的考虑PUE的数据中心算力负荷需求组合预测系统，其特征在于，所述BP神经网络优化模块还包括参数优化模块、粒子优化模块；

所述粒子优化模块用于对BP神经网络中的粒子i在第d维的速度v_id和位置X_id进行优化，其中1≤d≤D，D为维度总数。

9.如权利要求7所述的考虑PUE的数据中心算力负荷需求组合预测系统，其特征在于，所述BP神经网络优化模块还包括粒子交叉优化模块，用于运用GA算法中的交叉操作对BP神经网络的交叉过程中的配对粒子i和j的速度和位置进行优化。

10.如权利要求7所述的考虑PUE的数据中心算力负荷需求组合预测系统，其特征在于，所述BP神经网络优化模块还包括粒子变异优化模块，用于运用GA算法中的变异操作对BP神经网络的变异过程中的粒子的速度和位置进行优化。