CN110866592A

CN110866592A - 模型训练方法、装置、能效预测方法、装置和存储介质

Info

Publication number: CN110866592A
Application number: CN201911032274.8A
Authority: CN
Inventors: 夏恒; 夏俐; 赵千川; 贾庆山; 管晓宏; 杨震; 朱华; 高江; 岳上; 韩建军; 栗权; 林森; 赵静洲; 徐东; 黄现东; 郑焕琼
Original assignee: Tsinghua University; Tencent Technology Shenzhen Co Ltd
Current assignee: Tsinghua University; Tencent Technology Shenzhen Co Ltd
Priority date: 2019-10-28
Filing date: 2019-10-28
Publication date: 2020-03-06
Anticipated expiration: 2039-10-28
Also published as: CN110866592B

Abstract

本发明实施例公开了一种模型训练方法、装置、能效预测方法、装置和存储介质，其中，通过获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关数据，并构建时序训练集和时序测试集；再构建基于长短期记忆网络结构的循环神经网络模型，并根据时序训练集对循环神经网络模型进行训练，直至循环神经网络模型收敛；最后根据时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。相比于现有技术，本发明能够使得训练得到能耗使用效率预测模型的预测准确度较高，从而更准确的对数据中心的能耗使用效率进行预测。

Description

模型训练方法、装置、能效预测方法、装置和存储介质

技术领域

本发明涉及机器学习技术领域，具体涉及一种模型训练方法、装置、能效预测方法、装置和存储介质。

背景技术

随着能源成本的不断攀升以及人们对绿色环保的重视，对数据中心的节能需求越来越高。为了更好的对数据中心进行节能控制，首先需要对数据中心的能耗使用效率进行预测。

在现有技术中，对能耗使用效率的预测正在初步发展中，比如，可以采用岭回归算法来预测数据中心的能耗使用效率，其针对不同数据中心的主要能耗组件不同的特点，基于域适应模型融合，以及不同数据中心之间的差异性，进行针对性的预测。

在对现有技术的研究和实践过程中，本发明的发明人发现，现有的这种预测能耗使用效率的方式，在预测能耗使用效率的过程中，容易丢失部分信息，且其决定系数相较于普通回归方法较低，导致整体预测的准确度较差。

发明内容

本发明实施例提供一种模型训练方法、装置、能效预测方法、装置和存储介质，可以训练得到预测准确度更高的能耗使用效率预测模型，从而利用该能耗使用效率预测模型对数据中心的能耗使用效率进行更准确的预测。

本发明实施例提供一种模型训练方法，包括：

获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关数据；

根据所述历史能耗使用效率和所述历史能耗使用效率相关数据构建时序训练集和时序测试集；

构建基于长短期记忆网络结构的循环神经网络模型，并根据所述时序训练集对所述循环神经网络模型进行训练，直至所述循环神经网络模型收敛；

根据所述时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将所述收敛的循环神经网络模型作为用于预测所述数据中心的能耗使用效率的能耗使用效率预测模型。

本发明实施例还提供一种模型训练装置，包括：

数据获取模块，用于获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关数据；

样本构建模块，用于根据所述历史能耗使用效率和所述历史能耗使用效率相关数据构建时序样本集，并将所述时序样本集划分为时序训练集和时序测试集；

模型训练模块，用于构建基于长短期记忆网络结构的循环神经网络模型，并根据所述时序训练集对所述循环神经网络模型进行训练，直至所述循环神经网络模型收敛；

模型校验模块，用于根据所述时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将所述收敛的循环神经网络模型作为用于预测所述数据中心的能耗使用效率的能耗使用效率预测模型。

在一实施例中，在构建基于长短期记忆网络结构的循环神经网络模型时，所述模型训练模块用于：

设置长短期记忆层以及全连接层；

将所述长短期记忆层与全连接层连接，得到所述循环神经网络模型。

在一实施例中本，所述模型训练模块还用于：

在所述长短期记忆层与所述全连接层之间增加随机失活层。

在一实施例中，在根据所述时序训练集对所述循环神经网络模型进行训练时，所述模型训练模块用于：

将所述时序训练集输入所述长短期记忆层进行计算，得到所述长短期记忆层的输出值；

将所述长短期记忆层的输出值输入所述随机失活层进行随机失活处理，得到随机失活后的输出值；

将所述随机失活后的输出值输入所述全连接层进行计算，得到对应的预测值；

根据所述预测值，采用时序反向传播算法对所述长短期记忆层和/或所述全连接层的参数进行调整。

在一实施例中，所述长短期记忆层包括长短期记忆单元，所述长短期记忆单元按照如下公式进行迭代计算：

i_t＝σ(W_ixx_t+W_ihh_t-1+W_icc_t-1+b_i)；

f_t＝σ(W_fxx_t+W_fhh_t-1+W_fcc_t-1+b_f)；

c_t＝f_t·c_t-1+i_t·tanh(W_cxx_t+W_chh_t-1+b_c))；

o_t＝σ(W_oxx_t+W_ohh_t-1+W_occ_t+b_o)；

h_t＝o_t·tanh(c_t)；

其中，i_t表示所述长短期记忆单元中输入门的输出值，σ表示sigmoid函数，W_ix表示当前时刻的输入数据到所述输入门的权重矩阵，x_t表示当前时刻的输入数据，W_ih表示所述长短期记忆单元上一时刻的输出值到所述输入门的权重矩阵，h_t-1表示所述长短期记忆单元上一时刻的输出值，W_ic表示所述长短期记忆单元中记忆单元到所述输入门的权重矩阵，c_t-1表示所述记忆单元上一时刻的输出值，b_i表示所述输入门的偏置量，f_t表示所述长短期记忆单元中遗忘门的输出值，W_fx表示当前时刻的输入数据到所述遗忘门的权重矩阵，W_fh表示所述长短期记忆单元上一时刻的输出值到所述遗忘门的权重矩阵，W_fc表示所述记忆单元到所述遗忘门的权重矩阵，b_f表示所述记忆单元的偏置量，c_t表示所述记忆单元的输出值，W_cx表示当前时刻的输入数据到所述记忆单元的权重矩阵，W_ch表示所述长短期记忆单元上一时刻的输出值到所述记忆单元的权重矩阵，b_c表示所述记忆单元的偏置量，o_t表示所述长短期记忆单元中输出门的输出值，W_ox表示当前时刻的输入数据到所述输出门的权重矩阵，W_oh表示所述长短期记忆单元上一时刻的输出值到所述输出门的权重矩阵，W_oc表示所述记忆单元的输出值到所述输出门的权重矩阵，b_o表示所述输出门的偏置量，h_t表示所述长短期记忆单元的输出值。

本发明实施例还提供一种能效预测方法，包括：

接收针对数据中心的能耗使用效率预测请求；

根据所述能耗使用效率预测请求获取所述数据中心的能耗使用效率相关数据；

调用预先训练的能耗使用效率预测模型；

将所述能耗使用效率相关数据输入所述能耗使用效率预测模型进行预测，得到所述数据中心的能耗使用效率；

其中，所述能耗使用效率预测模型采用本发明实施例提供的模型训练方法训练得到。

本发明实施例还提供一种能效预测装置，包括：

请求接收模块，用于接收针对数据中心的能耗使用效率预测请求；

数据采集模块，用于根据所述能耗使用效率预测请求采集所述数据中心的能耗使用效率相关数据；

模型调用模块，用于调用预先训练的能耗使用效率预测模型；

效率预测模块，用于将所述能耗使用效率相关数据输入所述能耗使用效率预测模型进行预测，得到所述数据中心的能耗使用效率；

在一实施例中，本发明实施例提供的能效预测装置还包括运行控制模块，用于在所述效率预测模块将所述能耗使用效率相关数据输入所述能耗使用效率预测模型进行预测，得到所述数据中心的能耗使用效率之后，获取对应所述数据中心的目标能耗使用效率；以及

根据所述目标能耗使用效率以及所述能耗使用效率，对所述数据中心的运行状态进行调整。

此外，本发明实施例还提供一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本发明实施例所提供的任一种模型训练方法中的步骤，或者执行本发明实施例所提供的任一种能效预测方法中的步骤。

本发明实施例通过获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关数据，并构建时序训练集和时序测试集；再构建基于长短期记忆网络结构的循环神经网络模型，并根据时序训练集对循环神经网络模型进行训练，直至循环神经网络模型收敛；最后根据时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。相比于现有技术，本发明能够使得训练得到能耗使用效率预测模型的预测准确度较高，从而更准确的对数据中心的能耗使用效率进行预测。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的模型训练方法的场景示意图；

图2是本发明实施例提供的模型训练方法的一流程示意图；

图3是本发明实施例中构建的循环神经网络的一架构示意图；

图4是本发明实施例中构建的循环神经网络的另一架构示意图；

图5是本发明实施例中长短期记忆单元的内部结构示意图；

图6是本发明实施例提供的能效预测方法的一流程示意图；

图7是本发明实施例中提供的能效预测界面的示例图；

图8是本发明实施例中提供的选择子界面的示例图；

图9是本发明实施例提供的模型训练装置的一结构示意图；

图10是本发明实施例提供的能效预测装置的一结构示意图；

图11是本发明实施例提供的网络设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

其中，机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。

本发明实施例提供的方案涉及人工智能的机器学习技术，具体通过如下实施例进行说明:

本发明实施例提供一种模型训练方法、装置、能效预测方法、装置和存储介质。

请参阅图1，图1为本发明实施例所提供的模型训练方法的场景示意图，该模型训练方法可以应用于模型训练装置，该模型训练装置具体可以集成在具备储存器并安装有处理器而具有运算能力的网络设备中，例如，该网络设备可以获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关数据，其中，数据中心可以为模块化数据中心；然后，根据历史能耗使用效率和历史能耗使用效率相关数据构建时序训练集和时序测试集；然后，构建基于长短期记忆网络结构的循环神经网络模型，并根据时序训练集对循环神经网络模型进行训练，直至循环神经网络模型收敛；然后，根据时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。之后，当需要对数据中心的能耗使用效率进行检索时，即可利用该训练得到的能耗使用效率预测模型对数据中心的能耗使用效率进行预测。

需要说明的是，图1所示的模型训练方法的场景示意图仅仅是一个示例，本发明实施例描述的模型训练方法的场景是为了更加清楚的说明本发明实施例的技术方案，并不构成对于本发明实施例提供的技术方案的限定，本领域普通技术人员可知，随着模型训练方法的演变和新业务场景的出现，本发明实施例提供的技术方案对于类似的技术问题，同样适用。

以下分别进行详细说明。

在本实施例中，将从模型训练装置的角度进行描述，该模型训练装置具体可以集成在具备储存器并安装有处理器的网络设备中。

一种模型训练方法，包括：获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关数据；根据历史能耗使用效率和历史能耗使用效率相关数据构建时序训练集和时序测试集；构建基于长短期记忆网络结构的循环神经网络模型，并根据时序训练集对循环神经网络模型进行训练，直至循环神经网络模型收敛；根据时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。

请参阅图2，图2是本发明实施例提供的模型训练方法的流程示意图。该模型训练方法可以包括：

在201中，获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关数据。

需要说明的是，数据中心是全球协作的特定设备网络，用来在互联网络基础设施上传递、加速、展示、计算、存储数据信息等。随着云计算的快速发展，数据中心的发展也被大大促进，由于数据中心集成了大量的IT设备、空调设备以及电力传输设备等，导致数据中心在运行过程中存在巨大的能耗。目前，由于能源价格的增长，使得数据中心的能效问题变得不可忽视。因此，研究对数据中心的能效预测方法具有重大的应用价值。

在本发明实施例中，数据中心可以为模块化数据中心，模块化数据中心是在云计算、集中化、虚拟化等服务器发展的趋势下，发展起来的基于云计算的新一代数据中心部署形式，因其易部署、易扩展以及绿色节能的特点，得到越来越多的重视和研究。

能耗使用效率是数据中心消耗的所有能耗与IT设备消耗的能耗之比，为国际通用的数据中心的能效的衡量指标。

能耗使用效率相关数据可以为多维特征，包括但不限于冷水机组电流百分比、冷水机组蒸发器小温差、冷水机组冷凝器小温差、冷水机组冷冻水出水温度、冷却塔风机变频反馈、冷却塔冷却水出水温度、冷却泵变频反馈、冷冻泵变频反馈、室外平均焓值、室内平均焓值、室外温度、湿球温度、室外湿度以及板换冷却侧阀门开状态等特征。

示例性的，对于某数据中心，获取的能耗使用效率相关数据包括：

1号冷水机组电流百分比、1号冷水机组冷却水出水温度、1号冷水机组蒸发器小温差、1号冷水机组冷凝器小温差、1号冷水机组冷冻水出水温度、2号冷水机组电流百分比、2号冷水机组冷却水出水温度、2号冷水机组蒸发器小温差、2号冷水机组冷凝器小温差、2号冷水机组冷冻水出水温度、3号冷水机组电流百分比、3号冷水机组冷却水出水温度、3号冷水机组蒸发器小温差、3号冷水机组冷凝器小温差、3号冷水机组冷冻水出水温度、4号冷水机组电流百分比、4号冷水机组冷却水出水温度、4号冷水机组蒸发器小温差、4号冷水机组冷凝器小温差、4号冷水机组冷冻水出水温度、1号冷却塔1号风机变频反馈、1号冷却塔2号风机变频反馈、1号冷却塔冷却水出水温度、2号冷却塔1号风机变频反馈、2号冷却塔2号风机变频反馈、2号冷却塔冷却水出水温度、3号冷却塔1号风机变频反馈、3号冷却塔2号风机变频反馈、3号冷却塔冷却水出水温度、4号冷却塔1号风机变频反馈、4号冷却塔2号风机变频反馈、4号冷却塔冷却水出水温度、1号冷却泵变频反馈、2号冷却泵变频反馈、3号冷却泵变频反馈、4号冷却泵变频反馈、1号冷冻泵变频反馈、2号冷冻泵变频反馈、3号冷冻泵变频反馈、4号冷冻泵变频反馈、室外平均焓值、室内平均焓值、室外温度、湿球温度、室外湿度、1号板换冷却侧阀门开状态、1号板换冷冻侧阀门开状态、2号板换冷却侧阀门开状态、2号板换冷冻侧阀门开状态、3号板换冷却侧阀门开状态、3号板换冷冻侧阀门开状态、4号板换冷却侧阀门开状态以及4号板换冷冻侧阀门开状态。

在获取数据中心的历史能耗使用效率时，可以获取历史采集的数据中心总能耗以及历史采集的对应IT设备的能耗，然后按照如下公式计算得到历史能耗使用效率：

其中，PUE表示计算得到的历史能耗使用效率，L_total表示数据中心总能耗，L_IT表示IT设备的能耗。可以看出，能耗使用效率值越小，表示数据中心的电力使用效率越高。

在获取历史能耗使用效率相关数据时，可以获取历史采集的对应能耗使用效率相关数据。

示例性的，以每一分钟作为一个采样周期，使用相应的传感器周期采集数据中心的能耗使用效率相关数据、数据中心总能耗以及IT设备的能耗，将每一周期采集到的能耗使用效率相关数据、数据中心总能耗以及IT设备的能耗作为一条数据样本，如此，按照采样周期在一年内对数据中心进行数据采集，得到多条数据样本。这样，在获取数据中心的历史能耗使用效率时，即可根据之前采集得到数据样本进行获取，相应获取到多条历史能耗使用效率，同理，在获取对应历史能耗使用效率的历史能耗使用效率相关数据时，可从之前采集得到的数据样本中获取，相应获取到多条历史能耗使用效率相关数据。

在202中，根据历史能耗使用效率和历史能耗使用效率相关数据构建时序训练集和时序测试集。

本发明实施例中，在获取到数据中心的历史能耗使用效率以及对应的历史能耗使用效率相关数据之后，按照预设的划分比例将获取到的历史能耗使用效率以及对应的历史能耗使用效率相关数据划分两部分，其中一部分用于构建时序训练集，另一部分用于构建时序测试集。其中，划分比例可由本领域普通技术人员根据实际需要进行划分，比如，本发明实施例中划分比例配置为7:3。

示例性的，以构建时序训练集为例，假设历史能耗使用效率相关数据包括M维特征，且划分有N条用于构建时序训练集的历史能耗使用效率相关数据，对这N条历史能耗使用效率相关数据进行向量化表征，并根据向量化表征结果构建特征矩阵X，X∈R^N*M，其中每一列X_m代表第m维特征的表征向量，每一行X_n对应一条历史能耗使用效率相关数据，其中，m∈[1,M]，n∈[1,N]。

此外，对应于N条历史能耗使用效率相关数据，存在对应的N条历史能耗使用效率，向量化表征获取到的N条历史能耗使用效率，得到对应N条历史能耗使用效率的向量表征Y＝[y₁，…，y_N]^T，每一行y_n代表第n条历史能耗使用效率的向量表征。

然后，构建时序训练集的时序样本对([X_n-4,……X_n；y_n])，其中，n∈[5,N]。

此外，按照构建时序训练集同样的方式，根据划分的另一部分历史能耗使用效率以及对应的历史能耗使用效率相关数据构建时序测试集。

在203中，构建基于长短期记忆网络结构的循环神经网络模型，并根据时序训练集对循环神经网络模型进行训练，直至循环神经网络模型收敛。

本发明实施例中，在完成时序训练集和时序测试集的构建之后，进一步基于构建的时序训练集，构建基于长短期记忆网络结构的循环神经网络模型。

在一实施例中，“构建基于长短期记忆网络结构的循环神经网络模型”，包括：

(1)设置长短期记忆层以及全连接层；

(2)将长短期记忆层与全连接层连接，得到基于长短期记忆网络结构的循环神经网络模型。

本发明实施例中，在构建基于长短期记忆网络结构的循环神经网络模型时，首先设置长短期记忆层和全连接层，然后，将构建的长短期记忆层与全连接层连接，得到基于长短期记忆网络结构的循环神经网络模型。应当说明的是，本发明实施例中对于设置的长短期记忆层以及全连接层的层数以及连接关系不做具体限制，以第一层长短期记忆层，最后一层全连接层为约束，可由本领域普通技术人员根据实际需要设置长短期记忆层以及全连接层的层数和连接关系。

比如，请参照图3，可以设置一层长短期记忆层和一层全连接层，然后将长短期记忆层和全连接层连接，即得到基于长短期记忆网络结构的循环神经网络模型。

其中，请参照图4，对应于时序训练集([X_n-4,……X_n；y_n])，设置的长短期记忆层包括一个时间步长为5的长短期记忆单元，并设置输出维度为n1(可由本领域普通技术人员根据实际需要灵活取值，比如，本发明中配置n1为16)，每个时刻特征的表征向量X_t依次输入到长短期记忆单元，结合上一时刻输出的长记忆C_t-1与短记忆h_t-1，由长短期记忆单元输出更新的C_t和h_t。在最后一个时间步长，将输出的h_t作为长短期记忆层的输出，输入全连接层，全连接层的输出维度设为1，即预测的能耗使用效率(为数值表现形式)。

在一实施例中，本发明实施例提供的模型训练方法，还包括：

在长短期记忆层与全连接层之间增加随机失活层。

本发明实施例中，在构建得到包括一层长短期记忆层以及一层全连接层的循环神经网络模型之后，进一步在长短期记忆层和全连接层之间增加一层随机失活层。由随机失活层对长短期记忆层的输出进行随机失活处理后再送入全连接层中进行后续处理，防止过拟合问题。

在一实施例中，“根据时序训练集对循环神经网络模型进行训练”，包括：

(1)将时序训练集输入长短期记忆层进行计算，得到长短期记忆层的输出值；

(2)将长短期记忆层的输出值输入随机失活层进行随机失活处理，得到随机失活后的输出值；

(3)将随机失活后的输出值输入全连接层进行计算，得到对应的预测值；

(4)根据预测值，采用时序反向传播算法对长短期记忆层和/或全连接层进行调整。

其中，首先配置训练超参数，包括但不限于学习率以及批次大小等，具体可由本领域普通技术人员根据实际需要灵活进行配置。比如，本发明实施例中配置学习率为0.001，批次大小为64，即一个批次包括64条时序样本对。

然后，建立优化方案，比如，本发明实施例中采用学习率自适应算法，损失函数定义为

其中，N_batch表示一个批次中时序样本对的数量，y_i表示该批次中第i个样本对中历史能耗使用效率的表征向量，y_i'表示根据第i个样本对中历史能耗使用效率相关数据的表征向量得到的预测结果。

根据以上配置，按照批次大小，时序样本对中的历史能耗使用效率相关数据的表征向量依次输入长短期记忆层进行计算，得到长短期记忆层的输出值。

然后，将长短期记忆层的输出值输入随机失活层进行随机失活处理，得到随机失活后的输出值。

然后，将随机失活后的输出值输入全连接层进行计算，将全连接层的输出结果作为对应的预测值，即预测的对应时序样本对中历史能耗使用效率相关数据的预测能耗使用效率(为数值表现形式)。

由此，将得到对应该批次所有时序样本对的预测值，然后根据以上定义的损失函数计算得到该批次对应的损失值，利用时序反向传播算法对长短期记忆层和/或全连接层的参数进行调整。

如上，通过对长短期记忆层和/或所述全连接层的参数进行多次迭代训练，直至收敛。

在一实施例中，长短期记忆层包括长短期记忆单元，请参照图5，该长短期记忆单元包括输入门、输出门、遗忘门以及记忆单元(或称记忆细胞)，其中，σ表示sigmoid函数，g和h分别表示记忆单元输入到输出的激活函数，取双曲正切函数，即tanh()，具体按照如下公式进行迭代计算：

i_t＝σ(W_ixx_t+W_ihh_t-1+W_icc_t-1+b_i)；

f_t＝σ(W_fxx_t+W_fhh_t-1+W_fcc_t-1+b_f)；

c_t＝f_t·c_t-1+i_t·tanh(W_cxx_t+W_chh_t-1+b_c))；

o_t＝σ(W_oxx_t+W_ohh_t-1+W_occ_t+b_o)；

h_t＝o_t·tanh(c_t)；

其中，i_t表示长短期记忆单元中输入门的输出值，σ表示sigmoid函数，W_ix表示当前时刻的输入数据到输入门的权重矩阵，x_t表示当前时刻的输入数据，W_ih表示长短期记忆单元上一时刻的输出值到输入门的权重矩阵，h_t-1表示长短期记忆单元上一时刻的输出值，W_ic表示长短期记忆单元中记忆单元到输入门的权重矩阵，c_t-1表示记忆单元上一时刻的输出值，b_i表示输入门的偏置量，f_t表示长短期记忆单元中遗忘门的输出值，W_fx表示当前时刻的输入数据到遗忘门的权重矩阵，W_fh表示长短期记忆单元上一时刻的输出值到遗忘门的权重矩阵，W_fc表示记忆单元到遗忘门的权重矩阵，b_f表示记忆单元的偏置量，c_t表示记忆单元的输出值，W_cx表示当前时刻的输入数据到记忆单元的权重矩阵，W_ch表示长短期记忆单元上一时刻的输出值到记忆单元的权重矩阵，b_c表示记忆单元的偏置量，o_t表示长短期记忆单元中输出门的输出值，W_ox表示当前时刻的输入数据到输出门的权重矩阵，W_oh表示长短期记忆单元上一时刻的输出值到输出门的权重矩阵，W_oc表示记忆单元的输出值到输出门的权重矩阵，b_o表示输出门的偏置量，h_t表示长短期记忆单元的输出值。

在204中，根据时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。

本发明实施例中，在循环神经网络模型收敛后，根据时序测试集对收敛的循环神经网络模型进行校验，也即是对收敛的循环神经网络模型的预测准确率进行校验。

可选的，可以采用均方根误差来评价收敛的循环神经网络模型的预测准确率，表示为

其中，RMSE表示均方根误差，N_test表示时序测试集中时序样本对的数量，

表示时序测试集中第t个时序样本对中历史能耗使用效率的表征向量，

表示时序测试集中第t个时序样本对所对应的预测能耗使用效率的表征向量。相应的，可以通过比较收敛的循环神经网络模型对时序测试集的均方根误差是否小于预设均方根误差(可由本领域普通技术人员根据实际需要灵活设置)，根据比较结果判定收敛的循环神经网络模型的预测准确率是否校验通过，其中，当前述均方根误差小于预设均方根误差时，判定收敛的循环神经网络的预测准确率校验通过。

可选的，还可以采用平均绝对误差来评价收敛的循环神经网络模型的预测准确率，表示为

其中，MAE表示平均绝对误差，N_test表示时序测试集中时序样本对的数量，

表示时序测试集中第t个时序样本对所对应的预测能耗使用效率的表征向量。相应的，可以通过比较收敛的循环神经网络模型对时序测试集的平均绝对误差是否小于预设平均绝对误差(可由本领域普通技术人员根据实际需要灵活设置)，根据比较结果判定收敛的循环神经网络模型的预测准确率是否校验通过，其中，当前述平均绝对误差小于预设平均绝对误差时，判定收敛的循环神经网络的预测准确率校验通过。

当对收敛的循环神经网络模型的预测准确率校验通过时，即可将该收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。

在一实施例中，“将收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型”之后，还包括：

(1)当接收到针对前述数据中心的能耗使用效率预测请求时，获取对应前述数据中心的能耗使用效率相关数据；

(2)调用能耗使用效率预测模型，并将获取到的能耗使用效率相关数据输入到能耗使用效率预测模型进行预测，得到前述数据中心的能耗使用效率。

本发明实施例中，在训练得到用于预测前述数据中心的能耗使用效率的能耗使用效率预测模型之后，即可根据该能耗使用效率预测模型对前述数据中心的能耗使用效率进行预测。

比如，可以接收针对前述数据中心的能耗使用效率预测请求，当接收到针对前述数据中心的能耗使用效率预测请求时，实时获取对应前述数据中心的能耗使用效率相关数据，然后调用能耗使用效率预测模型，将获取到的能耗使用效率相关数据输入到能耗使用效率预测模型进行预测，即可得到对应前述数据中心的能耗使用效率。

由上可知，本发明实施例中，首先获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关数据；然后根据历史能耗使用效率和历史能耗使用效率相关数据构建时序训练集和时序测试集；再构建基于长短期记忆网络结构的循环神经网络模型，并根据时序训练集对循环神经网络模型进行训练，直至循环神经网络模型收敛；最后根据时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。相比于现有技术，本发明采用基于长短期记忆网络结构的循环神经网络模型作为基础模型进行训练，可以缓解训练过程中梯度消失的问题，使得训练得到能耗使用效率预测模型的预测准确度较高。

实施例二、

本发明实施例还提供一种能效预测方法，该能效预测方法可以应用于能效预测装置，该能效预测装置可以集成在具备存储器并安装有处理器而具有运算能力的网络设备中，例如，该网络设备可以接收针对数据中心的能耗使用效率预测请求；根据能耗使用效率预测请求采集数据中心的能耗使用效率相关数据；调用预先训练的能耗使用效率预测模型；将能耗使用效率相关数据输入能耗使用效率预测模型进行预测，得到数据中心的能耗使用效率。其中，能耗使用效率预测模型采用本发明实施例的模型训练方法训练得到。

请参阅图6，图6是本发明实施例提供的能效预测方法的流程示意图，该能效预测方法可以包括：

在301中，接收针对数据中心的能耗使用效率预测请求。

在本发明实施例中，将从能效预测装置的角度进行描述。

其中，可以通过多种不同的方式接收能耗使用效率预测请求。

比如，能效预测装置可以通过其所在的网络设备向技术人员提供能效预测界面，该能效预测界面包括请求输入接口，如图7所示，该请求输入接口可以为输入框的形式，技术人员可以在该输入框形式的请求输入接口中键入需要进行能效预测的数据中心的标识信息，并输入确认信息(如直接按下键盘的回车键)以输入能耗使用效率预测请求，该能耗使用效率预测请求携带有需要进行能效预测的数据中心的标识信息。相应的，能效预测装置即可根据接收到的能耗使用效率预测请求中的标识信息确定需要进行能效预测的目标数据中心。

又比如，在图7所述的能效预测界面中，还包括“打开”控件，一方面，能效预测装置在侦测到该打开控件触发时，将在能效预测界面之上叠加显示选择子界面(如图8所示)，该选择子界面向技术人员提供可进行能效预测的数据中心的图标，如数据中心A、数据中心B、数据中心C、数据中心D、数据中心E、数据中心F等数据中心的图标，供技术人员查找并选中需要进行能效预测的数据中心的图标；另一方面，技术人员可以在选中需要分析的数据中心的图标之后，触发选择子界面提供的确认控件，以向能效预测装置输入能耗使用效率预测请求，该能耗使用效率预测请求与技术人员选中的数据中心的图标相关联，指示能效预测装置将技术人员选中的数据中心作为需要进行能效预测的数据中心。

此外，本领域普通技术人员还可以根据实际需要设置其它输入能耗使用效率预测请求的具体实现方式，本发明对此不做具体限制。比如，可以数据中心自动产生能耗使用效率预测请求，如周期性的自动产生能耗使用效率预测请求。

在302中，根据能耗使用效率预测请求获取数据中心的能耗使用效率相关数据。

本发明实施例中，在接收针到对数据中心的能耗使用效率预测请求时，根据该能耗使用效率预测请求确定需要进行能效预测的数据中心，并获取该数据中心的能耗使用效率相关数据。

应当说明的是，本发明实施例中针对不同的数据中心，采用本发明实施例提供的模型训练方法，预先针对性的训练有对应的能耗使用效率预测模型。

相应的，在获取需要进行能效预测的数据中心的能耗使用效率相关数据时，获取与该数据中心对应的能耗使用效率预测模型向匹配的能耗使用效率相关数据。

示例性的，对应于某数据中心的能耗使用效率预测模型在训练时采用了该数据中心的冷水机组电流百分比、冷水机组蒸发器小温差、冷水机组冷凝器小温差、冷水机组冷冻水出水温度、冷却塔风机变频反馈、冷却塔冷却水出水温度、冷却泵变频反馈、冷冻泵变频反馈、室外平均焓值、室内平均焓值、室外温度、湿球温度、室外湿度以及板换冷却侧阀门开状态等特征作为能耗使用效率相关数据进行训练，则在预测时，相应获取数据中心这些能耗使用效率相关数据进行预测。

在303中，调用预先训练的能耗使用效率预测模型。

如上所述，由于本发明实施例中预先训练有针对多个不同数据中心的能耗使用效率预测模型，相应的，在获取到需要进行能效预测的数据中心的能耗使用效率相关数据之后，即调用对应该数据中心的能耗使用效率预测模型。

在304中，将能耗使用效率相关数据输入能耗使用效率预测模型进行预测，得到数据中心的能耗使用效率。

其中，首先对获取到的能耗使用效率相关数据进行向量化表征，得到能耗使用效率的表征向量，然后将该表征向量输入调用的能耗使用效率预测模型进行预测，得到能耗使用效率预测模型输出的数值表现形式的能耗使用效率。

在一实施例中，“将能耗使用效率相关数据输入能耗使用效率预测模型进行预测，得到数据中心的能耗使用效率”的步骤之后，还包括：

(1)获取对应数据中心的目标能耗使用效率；

(2)根据目标能耗使用效率以及预测得到的能耗使用效率，对数据中心的运行状态进行调整。

其中，目标能耗使用效率为期望的所述数据中心在运行时的能耗使用效率，可由本领域普通技术人员根据实际需要进行设置。

本发明实施例中，在预测得到数据中心的能耗使用效率之后，还获取到对应该数据中心的目标能耗使用效率，进一步将预测得到的能耗使用效率与目标能耗使用效率进行比较，若预测得到的能耗使用效率未达到目标能耗使用效率，则按照预设的运行状态调整策略，对数据中心的运行状态进行调整，以使得数据中心的能耗使用效率达到目标能耗使用效率。

实施例三、

为了更好地实施以上模型训练方法，本发明实施例还提供一种模型训练装置，该模型训练装置具体可以集成在网络设备中。

例如，如图9所示，该模型训练装置可以包括数据获取模块401、样本构建模块402、模型训练模块403、模型校验模块404以及模型训练模块405，如下：

数据获取模块401，用于获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关数据；

样本构建模块402，用于根据历史能耗使用效率和历史能耗使用效率相关数据构建时序训练集和时序测试集；

模型训练模块403，用于构建基于长短期记忆网络结构的循环神经网络模型，并根据时序训练集对循环神经网络模型进行训练，直至循环神经网络模型收敛；

模型校验模块404，用于根据时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。

在一实施例中，在构建基于长短期记忆网络结构的循环神经网络模型时，模型训练模块403用于：

设置长短期记忆层以及全连接层；

将长短期记忆层与全连接层连接，得到基于长短期记忆网络结构的循环神经网络模型。

在一实施例中，模型训练模块403还用于：

在长短期记忆层与全连接层之间增加随机失活层。

在一实施例中，在根据时序训练集对循环神经网络模型进行训练时，模型训练模块403用于：

将时序训练集输入长短期记忆层进行计算，得到长短期记忆层的输出值；

将长短期记忆层的输出值输入随机失活层进行随机失活处理，得到随机失活后的输出值；

将随机失活后的输出值输入全连接层进行计算，得到对应的预测值；

根据预测值，采用时序反向传播算法对长短期记忆层和/或全连接层进行调整。

在一实施例中，长短期记忆层包括长短期记忆单元，长短期记忆单元按照如下公式进行迭代计算：

i_t＝σ(W_ixx_t+W_ihh_t-1+W_icc_t-1+b_i)；

f_t＝σ(W_fxx_t+W_fhh_t-1+W_fcc_t-1+b_f)；

c_t＝f_t·c_t-1+i_t·tanh(W_cxx_t+W_chh_t-1+b_c))；

o_t＝σ(W_oxx_t+W_ohh_t-1+W_occ_t+b_o)；

h_t＝o_t·tanh(c_t)；

应当说明的是，本发明实施例提供的模型训练装置与上文实施例中的模型训练方法属于同一构思，在模型训练装置上可以运行模型训练方法实施例中提供的任一方法，其具体实现过程详见以上实施例，此处不再赘述。

实施例四、

为了更好地实施以上能效预测方法，本发明实施例还提供一种能效预测装置，该能效预测装置具体可以集成在网络设备中。

例如，如图10所示，该能效预测装置可以包括请求接收模块501、数据采集模块502、模型调用模块503、效率预测模块504以及下发模块505，如下：

请求接收模块501，用于接收针对数据中心的能耗使用效率预测请求；

数据采集模块502，用于根据能耗使用效率预测请求获取数据中心的能耗使用效率相关数据；

模型调用模块503，用于调用预先训练的能耗使用效率预测模型；

效率预测模块504，用于将能耗使用效率相关数据输入能耗使用效率预测模型进行预测，得到数据中心的能耗使用效率；

其中，能耗使用效率预测模型采用本发明实施例提供的模型训练方法训练得到。

在一实施例中，能效预测装置还包括运行控制模块，用于在效率预测模块504将能耗使用效率相关数据输入能耗使用效率预测模型进行预测，得到数据中心的能耗使用效率之后，获取对应数据中心的目标能耗使用效率；以及根据目标能耗使用效率以及预测得到的能耗使用效率，对数据中心的运行状态进行调整。

应当说明的是，本发明实施例提供的能效预测装置与上文实施例中的能效预测方法属于同一构思，在能效预测装置上可以运行能效预测方法实施例中提供的任一方法，其具体实现过程详见以上实施例，此处不再赘述。

实施例五、

本发明实施例还提供一种网络设备，如图11所示，其示出了本发明实施例所涉及的网络设备的结构示意图，具体来讲：

该网络设备可以包括一个或者一个以上处理核心的处理器601、一个或一个以上计算机可读存储介质的存储器602、电源603和输入单元604等部件。本领域技术人员可以理解，图11中示出的网络设备结构并不构成对网络设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器601是该网络设备的控制中心，利用各种接口和线路连接整个网络设备的各个部分，通过运行或执行存储在存储器602内的软件程序和/或模块，以及调用存储在存储器602内的数据，执行网络设备的各种功能和处理数据。

存储器602可用于存储软件程序以及模块，处理器601通过运行存储在存储器602的软件程序以及模块，从而执行各种功能应用以及数据处理。此外，存储器602可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器602还可以包括存储器控制器，以提供处理器601对存储器602的访问。

网络设备还包括给各个部件供电的电源603，优选的，电源603可以通过电源管理系统与处理器601逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

该网络设备还可包括输入单元604，该输入单元604可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，网络设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，网络设备中的处理器601会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中，并由处理器601来运行存储在存储器602中的应用程序，从而实现各种功能，如下：

根据历史能耗使用效率和历史能耗使用效率相关数据构建时序训练集和时序测试集；

构建基于长短期记忆网络结构的循环神经网络模型，并根据时序训练集对循环神经网络模型进行训练，直至循环神经网络模型收敛；

根据时序测试集对收敛的循环神经网络模型的进行校验，当校验通过时，将收敛的循环神经网络模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。

或者，实现如下功能：

接收针对数据中心的能耗使用效率预测请求；

根据能耗使用效率预测请求获取数据中心的能耗使用效率相关数据；

调用预先训练的能耗使用效率预测模型；

将能耗使用效率相关数据输入能耗使用效率预测模型进行预测，得到数据中心的能耗使用效率；

应当说明的是，本发明实施例提供的网络设备与上文实施例中的适用于网络设备的模型训练方法/能效预测方法属于同一构思，其具体实现过程详见以上方法实施例，此处不再赘述。

实施例六、

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本发明实施例提供一种存储介质，其中存储有计算机程序，该计算机程序包括的多条指令能够被网络设备的处理器进行加载，以执行本发明实施例所提供的适用于网络设备的模型训练方法，例如：

或者，该计算机程序包括的多条指令能够被网络设备的处理器进行加载，以执行本发明实施例所提供的适用于网络设备的能效预测方法，例如：

接收针对数据中心的能耗使用效率预测请求；

调用预先训练的能耗使用效率预测模型；

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

本发明实施例所提供的存储介质能够实现本发明实施例所提供的对应模型训练方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本发明实施例所提供的一种模型训练方法、装置和存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种模型训练方法，其特征在于，适用于网络设备，所述模型训练方法包括：

2.根据权利要求1所述的模型训练方法，其特征在于，所述构建基于长短期记忆网络结构的循环神经网络模型的步骤，包括：

设置长短期记忆层以及全连接层；

3.根据权利要求2所述的模型训练方法，其特征在于，还包括：

在所述长短期记忆层与所述全连接层之间增加随机失活层。

4.根据权利要求3所述的模型训练方法，其特征在于，所述根据所述时序训练集对所述循环神经网络模型进行训练的步骤，包括：

5.根据权利要求4所述的模型训练方法，其特征在于，所述长短期记忆层包括长短期记忆单元，所述长短期记忆单元按照如下公式进行迭代计算：

i_t＝σ(W_ixx_t+W_ihh_t-1+W_icc_t-1+b_i)；

f_t＝σ(W_fxx_t+W_fhh_t-1+W_fcc_t-1+b_f)；

c_t＝f_t·c_t-1+i_t·tanh(W_cxx_t+W_chh_t-1+b_c)；

o_t＝σ(W_oxx_t+W_ohh_t-1+W_occ_t+b_o)；

h_t＝o_t·tanh(c_t)；

6.一种能效预测方法，其特征在于，包括：

接收针对数据中心的能耗使用效率预测请求；

调用预先训练的能耗使用效率预测模型；

其中，所述能耗使用效率预测模型采用权利要求1-5任一项所述的模型训练方法训练得到。

7.根据权利要求6所述的能效预测方法，其特征在于，所述将所述能耗使用效率相关数据输入所述能耗使用效率预测模型进行预测，得到所述数据中心的能耗使用效率的步骤之后，还包括：

获取对应所述数据中心的目标能耗使用效率；

8.一种模型训练装置，其特征在于，适用于网络设备，所述模型训练装置包括：

9.一种能效预测装置，其特征在于，包括：

10.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行如权利要求1至5任一项所述的模型训练方法，或者执行如权利要求6或7所述的能效预测方法。