CN110866528A

CN110866528A - 一种模型训练方法、能耗使用效率预测方法、装置和介质

Info

Publication number: CN110866528A
Application number: CN201911032302.6A
Authority: CN
Inventors: 夏恒; 夏俐; 赵千川; 贾庆山; 管晓宏; 杨震; 朱华; 高江; 岳上; 韩建军; 栗权; 林森; 赵静洲; 徐东; 黄现东; 郑焕琼
Original assignee: Tsinghua University; Tencent Technology Shenzhen Co Ltd
Current assignee: Tsinghua University; Tencent Technology Shenzhen Co Ltd
Priority date: 2019-10-28
Filing date: 2019-10-28
Publication date: 2020-03-06
Anticipated expiration: 2039-10-28
Also published as: CN110866528B

Abstract

本发明实施例公开了一种模型训练方法、能耗使用效率预测方法、装置和介质，其中，首先获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关特征；然后根据历史能耗使用效率和历史能耗使用效率相关特征构建训练集和测试集；再构建轻量梯度提升机模型，并根据训练集对轻量梯度提升机模型进行训练；最后根据测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。相比于现有技术，本发明能够使得训练得到的能耗使用效率预测模型的预测准确度较高，从而更准确的对数据中心的能耗使用效率进行预测。

Description

一种模型训练方法、能耗使用效率预测方法、装置和介质

技术领域

本发明涉及机器学习技术领域，具体涉及一种模型训练方法、能耗使用效率预测方法、装置和介质。

背景技术

随着能源成本的不断攀升以及人们对绿色环保的重视，对数据中心的节能需求越来越高。为了更好的对数据中心进行节能控制，首先需要对数据中心的能耗使用效率进行预测。

在现有技术中，对能耗使用效率的预测正在初步发展中，比如，可以采用岭回归算法来预测数据中心的能耗使用效率，其针对不同数据中心的主要能耗组件不同的特点，基于域适应模型融合，以及不同数据中心之间的差异性，进行针对性的预测。

在对现有技术的研究和实践过程中，本发明的发明人发现，现有的这种预测能耗使用效率的方式，在预测能耗使用效率的过程中，容易丢失部分信息，且其决定系数相较于普通回归方法较低，导致整体预测的准确度较差。

发明内容

本发明实施例提供一种模型训练方法、能耗使用效率预测方法、装置和介质，可以训练得到预测准确度更高的能耗使用效率预测模型，从而利用该能耗使用效率预测模型对数据中心的能耗使用效率进行更准确的预测。

本发明实施例提供一种模型训练方法，包括：

获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关特征；

根据所述历史能耗使用效率和所述历史能耗使用效率相关特征构建训练集和测试集；

构建轻量梯度提升机模型，并根据所述训练集对所述轻量梯度提升机模型进行训练；

根据所述测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将所述训练后的轻量梯度提升机模型作为用于预测所述数据中心的能耗使用效率的能耗使用效率预测模型。

本发明实施例还提供一种模型训练装置，包括：

数据获取模块，用于获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关特征；

样本构建模块，用于根据所述历史能耗使用效率和所述历史能耗使用效率相关特征构建训练集和测试集；

模型训练模块，用于构建轻量梯度提升机模型，并根据所述训练集对所述轻量梯度提升机模型进行训练；

模型校验模块，用于根据所述测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将所述训练后的轻量梯度提升机模型作为用于预测所述数据中心的能耗使用效率的能耗使用效率预测模型。

在一实施例中，在构建轻量梯度提升机模型，并根据所述训练集对所述轻量梯度提升机模型进行训练时，所述模型训练模块用于：

构建基于分类回归树的轻量梯度提升机模型，并构建对应所述基于分类回归树的轻量梯度提升机模型的目标函数；

根据所述训练集以及所述目标函数对所述基于分类回归树的轻量梯度提升机模型的进行迭代训练。

在一实施例中，在根据所述训练集以及所述目标函数对所述基于分类回归树的轻量梯度提升机模型的进行训练时，所述模型训练模块用于：

对被划分为训练集的历史能耗使用效率相关特征进行离散化处理，并根据离散结果生成对应的直方图；

遍历所述直方图确定出当次节点分裂的最优分割特征和最优分割点；

获取当前的目标函数，并对所述当前的目标函数进行二阶泰勒展开，根据二阶泰勒展开结果得到对应节点分裂前后的损失函数差值；

根据所述最优分割特征以及所述最优分割点，以最大化损失函数差值为方向进行节点分裂。

在一实施例中，在构建对应所述基于分类回归树的轻量梯度提升机模型的目标函数时，所述模型训练模块用于：

构建对应所述基于分类回归树的轻量梯度提升机模型的损失函数；

构建对应所述基于分类回归树的轻量梯度提升机模型的正则项函数；

根据所述损失函数以及所述正则项函数构建所述目标函数。

本发明实施例还提供一种能耗使用效率预测方法，包括：

接收针对数据中心的能耗使用效率预测请求；

根据所述能耗使用效率预测请求获取所述数据中心的当前能耗使用效率相关特征；

调用预先训练的能耗使用效率预测模型；

将所述当前能耗使用效率相关特征输入所述能耗使用效率预测模型进行预测，得到所述数据中心的预测能耗使用效率；

其中，所述能耗使用效率预测模型采用本发明实施例提供的模型训练方法训练得到。

本发明实施例还提供一种能耗使用效率预测装置，包括：

请求接收模块，用于接收针对数据中心的能耗使用效率预测请求；

数据采集模块，用于根据所述能耗使用效率预测请求获取所述数据中心的当前能耗使用效率相关特征；

模型调用模块，用于调用预先训练的能耗使用效率预测模型；

效率预测模块，用于将所述当前能耗使用效率相关特征输入所述能耗使用效率预测模型进行预测，得到所述数据中心的预测能耗使用效率；

在一实施例中，本发明实施例提供的能耗使用效率预测装置还包括运行控制模块，用于在所述效率预测模块将所述当前能耗使用效率相关特征输入所述能耗使用效率预测模型进行预测，得到所述数据中心的预测能耗使用效率之后，获取对应所述数据中心的目标能耗使用效率；以及

根据所述目标能耗使用效率以及所述预测能耗使用效率，对所述数据中心的运行状态进行调整。

在一实施例中，在根据所述目标能耗使用效率以及所述预测能耗使用效率，对所述数据中心的运行状态进行调整时，所述运行控制模块用于：

获取所述当前能耗使用效率相关特征中每类特征与能耗使用效率的相关程度；

根据每类特征与能耗使用效率的相关程度进行排序，得到排序信息；

根据所述目标能耗使用效率、所述预测能耗使用效率以及所述排序信息，对所述数据中心的运行状态进行调整。

此外，本发明实施例还提供一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本发明实施例所提供的任一种模型训练方法中的步骤，或者执行本发明实施例所提供的任一种能耗使用效率预测方法中的步骤。

本发明实施例通过首先获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关特征；然后根据历史能耗使用效率和历史能耗使用效率相关特征构建训练集和测试集；再构建轻量梯度提升机模型，并根据训练集对轻量梯度提升机模型进行训练；最后根据测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。相比于现有技术，本发明能够使得训练得到的能耗使用效率预测模型的预测准确度较高，从而更准确的对数据中心的能耗使用效率进行预测。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的模型训练方法的场景示意图；

图2是本发明实施例提供的模型训练方法的一流程示意图；

图3是本发明实施例中进行模型训练的示意图；

图4是本发明实施例中生成直方图的示意图；

图5是本发明实施例中生成的可视化图像的示例图；

图6是本发明实施例提供的能耗使用效率预测方法的一流程示意图；

图7是本发明实施例中提供的能效预测界面的示例图；

图8是本发明实施例中提供的选择子界面的示例图；

图9是本发明实施例提供的模型训练装置的一结构示意图；

图10是本发明实施例提供的能耗使用效率预测装置的一结构示意图；

图11是本发明实施例提供的网络设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

其中，机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

本发明实施例提供的方案涉及人工智能的机器学习技术，具体通过如下实施例进行说明:

本发明实施例提供一种模型训练方法、能耗使用效率预测方法、装置和存储介质。

请参阅图1，图1为本发明实施例所提供的模型训练方法的场景示意图，该模型训练方法可以应用于模型训练装置，该模型训练装置具体可以集成在具备储存器并安装有处理器而具有运算能力的网络设备中，例如，该网络设备可以获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关特征，其中，数据中心可以为模块化数据中心；然后，根据历史能耗使用效率和历史能耗使用效率相关特征构建训练集和测试集，比如，将获取到的历史能耗使用效率相关特征按照预设比例划分为两部分，分别用于构建训练集和测试集；然后，构建轻量梯度提升机模型，并根据训练集对轻量梯度提升机模型进行训练；根据测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。之后，当需要对数据中心的能耗使用效率进行预测时，即可利用该训练得到的能耗使用效率预测模型对数据中心的能耗使用效率进行预测。

需要说明的是，图1所示的模型训练方法的场景示意图仅仅是一个示例，本发明实施例描述的模型训练方法的场景是为了更加清楚的说明本发明实施例的技术方案，并不构成对于本发明实施例提供的技术方案的限定，本领域普通技术人员可知，随着模型训练方法的演变和新业务场景的出现，本发明实施例提供的技术方案对于类似的技术问题，同样适用。

以下分别进行详细说明。

在本实施例中，将从模型训练装置的角度进行描述，该模型训练装置具体可以集成在具备储存器并安装有处理器的网络设备中。

一种模型训练方法，包括：获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关特征；根据历史能耗使用效率和历史能耗使用效率相关特征构建训练集和测试集；构建轻量梯度提升机模型，并根据训练集对轻量梯度提升机模型进行训练；根据测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。

请参阅图2，图2是本发明实施例提供的模型训练方法的流程示意图。该模型训练方法可以包括：

在201中，获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关特征。

需要说明的是，数据中心是全球协作的特定设备网络，用来在互联网络基础设施上传递、加速、展示、计算、存储数据信息等。随着云计算的快速发展，数据中心的发展也被大大促进，由于数据中心集成了大量的IT设备、空调设备以及电力传输设备等，导致数据中心在运行过程中存在巨大的能耗。目前，由于能源价格的增长，使得数据中心的能效问题变得不可忽视。因此，研究对数据中心的能效预测方法具有重大的应用价值。

在本发明实施例中，数据中心可以为模块化数据中心，模块化数据中心是在云计算、集中化、虚拟化等服务器发展的趋势下，发展起来的基于云计算的新一代数据中心部署形式，因其易部署、易扩展以及绿色节能的特点，得到越来越多的重视和研究。

能耗使用效率是数据中心消耗的所有能耗与IT设备消耗的能耗之比，为国际通用的数据中心的能效的衡量指标。

每一条能耗使用效率相关特征为多维特征，可由本领域普通技术人员根据业务经验和/或专家知识从数据中心的运行数据中选取与能耗使用效率相关的数据作为能耗使用效率相关特征，比如，本发明实施例中，选取的能耗使用效率相关特征包括但不限于冷水机组电流百分比、冷水机组蒸发器小温差、冷水机组冷凝器小温差、冷水机组冷冻水出水温度(网关)、冷却塔风机变频反馈、冷却塔冷却水出水温度(网关)、冷却泵变频反馈、冷冻泵变频反馈、室外平均焓值、室内平均焓值、室外温度、湿球温度、室外湿度以及板换冷却侧阀门开状态等特征。

示例性的，对于某数据中心，获取的能耗使用效率相关特征包括：

1#冷水机组电流百分比、1#冷水机组冷却水出水温度(网关)、1#冷水机组蒸发器小温差、1#冷水机组冷凝器小温差、1#冷水机组冷冻水出水温度(网关)、2#冷水机组电流百分比、2#冷水机组冷却水出水温度(网关)、2#冷水机组蒸发器小温差、2#冷水机组冷凝器小温差、2#冷水机组冷冻水出水温度(网关)、3#冷水机组电流百分比、3#冷水机组冷却水出水温度(网关)、3#冷水机组蒸发器小温差、3#冷水机组冷凝器小温差、3#冷水机组冷冻水出水温度(网关)、4#冷水机组电流百分比、4#冷水机组冷却水出水温度(网关)、4#冷水机组蒸发器小温差、4#冷水机组冷凝器小温差、4#冷水机组冷冻水出水温度(网关)、1#冷却塔1风机变频反馈、1#冷却塔2风机变频反馈、1#冷却塔冷却水出水温度(网关)、2#冷却塔1风机变频反馈、2#冷却塔2风机变频反馈、2#冷却塔冷却水出水温度(网关)、3#冷却塔1风机变频反馈、3#冷却塔2风机变频反馈、3#冷却塔冷却水出水温度(网关)、4#冷却塔1风机变频反馈、4#冷却塔2风机变频反馈、4#冷却塔冷却水出水温度(网关)、1#冷却泵变频反馈、2#冷却泵变频反馈、3#冷却泵变频反馈、4#冷却泵变频反馈、1#冷冻泵变频反馈、2#冷冻泵变频反馈、3#冷冻泵变频反馈、4#冷冻泵变频反馈、室外平均焓值、室内平均焓值、室外温度、湿球温度、室外湿度、1#板换冷却侧阀门开状态、1#板换冷冻侧阀门开状态、2#板换冷却侧阀门开状态、2#板换冷冻侧阀门开状态、3#板换冷却侧阀门开状态、3#板换冷冻侧阀门开状态、4#板换冷却侧阀门开状态以及4#板换冷冻侧阀门开状态。

在获取数据中心的历史能耗使用效率时，可以获取历史采集的数据中心总能耗以及历史采集的对应IT设备的能耗，然后按照如下公式计算得到历史能耗使用效率：

其中，PUE表示计算得到的历史能耗使用效率，L_total表示数据中心总能耗，L_IT表示IT设备的能耗。可以看出，能耗使用效率值越小，表示数据中心的电力使用效率越高。

在获取历史能耗使用效率相关特征时，可以获取历史采集的对应能耗使用效率相关特征。

示例性的，以每一分钟作为一个采样周期，使用相应的传感器周期采集数据中心的能耗使用效率相关特征、数据中心总能耗以及IT设备的能耗，将每一采样周期采集到的能耗使用效率相关特征、数据中心总能耗以及IT设备的能耗组合为数据组，如此，按照采样周期在一年内对数据中心进行数据采集，得到多个数据组。这样，在获取数据中心的历史能耗使用效率时，即可获取到之前记录的数据值，提取出每一数据组中的数据中心总能耗以及IT设备的能耗，计算得到每一数据组对应的历史能耗使用效率，由此得到多个历史能耗使用效率；同理，在获取对应历史能耗使用效率的历史能耗使用效率相关特征时，以某历史能耗使用效率为例，可以从该历史能耗使用效率对应的数据组中直接提取出对应的历史能耗使用效率相关特征。由此，对应于获取到的多个历史能耗使用效率，将对应获取到多个历史能耗使用效率相关特征。

此外，在获取到数据中心的历史能耗使用效率以及对应的历史能耗使用效率相关特征之后，还对历史能耗使用效率和/或历史能耗使用效率相关特征进行预处理。

示例性的，可以对获取到的历史能耗使用效率和/或历史能耗使用效率相关特征进行数据清洗，比如，采用插值的方式填补缺失的历史能耗使用效率和/或历史能耗使用效率相关特征，采用近似值替换明显有误差的历史能耗使用效率和/或历史能耗使用效率相关特征，剔除缺失过多的历史能耗使用效率特征等。

在202中，根据历史能耗使用效率和历史能耗使用效率相关特征构建训练集和测试集。

本发明实施例中，在获取到数据中心的历史能耗使用效率以及对应的历史能耗使用效率相关特征之后，按照预设的划分比例将获取到的历史能耗使用效率以及对应的历史能耗使用效率相关特征划分两部分，其中一部分用于构建训练集，另一部分用于构建测试集。其中，划分比例可由本领域普通技术人员根据实际需要进行划分，比如，本发明实施例中划分比例配置为8:2。

示例性的，以构建训练集为例，假设历史能耗使用效率相关特征包括M维特征，且划分有N条用于构建训练集的历史能耗使用效率相关特征，对这N条历史能耗使用效率相关特征进行向量化表征，并根据向量化表征结果构建特征矩阵X，X∈R^N*M，其中每一列Xm代表第m维特征的表征向量，每一行Xn对应一条历史能耗使用效率相关特征，其中，m∈[1,M]，n∈[1,N]。

此外，对应于N条历史能耗使用效率相关特征，存在对应的N条历史能耗使用效率，向量化表征获取到的N条历史能耗使用效率，得到对应N条历史能耗使用效率的向量表征Y＝[y1，…，yN]^T，每一行yn代表第n条历史能耗使用效率的向量表征。

然后，构建训练集的样本对(Xn，yn)，其中，Xn为样本，yn为标签，n∈[1,N]。

此外，按照构建训练集同样的方式，根据划分的另一部分历史能耗使用效率以及对应的历史能耗使用效率相关特征构建测试集。

在203中，构建轻量梯度提升机模型，并根据训练集对轻量梯度提升机模型进行训练。

本发明实施例中，在完成训练集和测试集的构建之后，进一步基于构建的训练集，构建轻量梯度提升机模型，并根据构建的训练集对轻量梯度提升机模型进行训练。

应当说明的是，轻量梯度提升机算法是梯度提升数算法的高效实现，其核心在于拟合前k-1课树的预测误差来训练第k颗数，如图3所示。

在一实施例中，“构建轻量梯度提升机模型，并根据构建的训练集对轻量梯度提升机模型进行训练”，包括：

(1)构建基于分类回归树的轻量梯度提升机模型，并构建对应基于分类回归树的轻量梯度提升机模型的目标函数；

(2)根据训练集以及目标函数对基于分类回归树的轻量梯度提升机模型的进行迭代训练。

本发明实施例中，在构建轻量梯度提升机模型时，可以构建基于分类回归树的轻量梯度提升机模型。然后，构建对应该基于分类回归树的轻量梯度提升机模型的目标函数。

在构建基于分类回归树的轻量梯度提升机模型以及对应的目标函数之后，即可根据训练集以及目标函数对该基于分类回归树的轻量梯度提升机模型，进行迭代训练，最终得到一棵完整的决策树。

在一实施例中，“构建对应基于分类回归树的轻量梯度提升机模型的目标函数”，包括：

(1)构建对应基于分类回归树的轻量梯度提升机模型的损失函数；

(2)构建对应基于分类回归树的轻量梯度提升机模型的正则项函数；

(3)根据前述损失函数以及前述正则项函数构建对应基于分类回归树的轻量梯度提升机模型的目标函数。

本发明实施例中，构建的目标函数由两部分组成，分别为损失函数和正则项函数。

相应的，在构建对应基于分类回归树的轻量梯度提升机模型的目标函数时，分别构建对应基于分类回归树的轻量梯度提升机模型的损失函数和对应基于分类回归树的轻量梯度提升机模型的正则项函数。

其中，可由本领域普通技术人员根据实际需要构建对应基于分类回归树的轻量梯度提升机模型的损失函数，包括但不限于均方差损失函数、绝对值损失函数等，比如，本发明实施例构建对应基于分类回归树的轻量梯度提升机模型的绝对值损失函数l(y,y')＝|y-y'|，其中，y表示实际值，y'表示预测值。

同理，可由本领域普通技术人员根据实际需要构建对应基于分类回归树的轻量梯度提升机模型的正则项函数，比如，本发明实施例构建对应基于分类回归树的轻量梯度提升机模型的正则项函数

其中，T表示分类回归树f的叶节点个数，ω_j表示对应第j个叶节点的权重，α、λ表示惩罚系数，可由本领域普通技术人员根据实际需要取经验值。

在构建得到对应基于分类回归树的轻量梯度提升机模型的损失函数以及对应基于分类回归树的轻量梯度提升机模型的正则项函数之后，进一步基于该损失函数以及该正则项函数，构建对应基于分类回归树的轻量梯度提升机模型的目标函数，在第k轮迭代中，目标函数可以表示为：

其中，l[yn，yn'^(k-1)+f_k(Xn)]表示样本Xn在第k轮迭代的训练误差，N_batch表示一个批次中样本的数量，yn代表样本Xn的标签值，yn'^(k-1)表示前k-1棵分类回归树的预测结果，f_k(Xn)表示加入的第k棵分类回归树，C表示前k-1棵树的正则项。

在一实施例中，“根据训练集以及目标函数对基于分类回归树的轻量梯度提升机模型的进行迭代训练”，包括：

(1)对被划分为训练集的历史能耗使用效率相关特征进行离散化处理，并根据离散结果生成对应的直方图；

(2)遍历直方图确定出当次节点分裂的最优分割特征和最优分割点；

(3)获取当前的目标函数，并对当前的目标函数进行二阶泰勒展开，根据二阶泰勒展开结果得到对应节点分裂前后的损失函数差值；

(4)根据最优分割特征以及最优分割点，以最大化损失函数差值为方向进行节点分裂。

其中，首先配置训练超参数，包括但不限于直方图最大划分数W、最大深度、学习率、批次大小以及迭代次数K等，具体可由本领域普通技术人员根据实际需要灵活进行配置。比如，本发明实施例中配置学习率为0.001，批次大小为64，即一个批次包括64条样本对。

在完成训练超参数的配置之后，首先对被划分为训练集的历史能耗使用效率相关特征进行离散化处理，并根据离散结果生成对应的直方图，如图4所示。

其中，被划分为训练集的历史能耗使用效率相关特征即训练集中的样本。可以采用直方图算法将每一个样本离散化成w个整数，相应构造一个宽度为w的直方图，其中，w∈[3,W]。

在生成直方图之后，进一步遍历生成的直方图以确定出当次节点分裂的最优分割特征和最优分割点

其中，在遍历直方图的时候，根据离散化后的值作为索引在直方图中累积统计量，当遍历一次后，直方图累积了需要的统计量，然后根据直方图的离散值，遍历寻找最优分割特征和最优分割点。

此外，还获取当前的目标函数，并对所述当前的目标函数进行二阶泰勒展开，根据二阶泰勒展开结果得到对应节点分裂前后的损失函数差值。

示例性的，以第k轮迭代为例，则获取到当前的目标函数即第k轮迭代的目标函数

对第k轮迭代的目标函数使用二阶泰勒函数展开，得到：

其中，gn表示l(yn,yn'^(k-1))对yn'^(k-1)的一阶导数，hn表示l(yn,yn'^(k-1))对yn'^(k-1)的二阶导数。

假设第k棵分类回归树的结构已知，定义每棵树的分裂节点的候选特征集合为I_j＝{n|q(Xn＝j)}，其中，q()为结构函数，用于将输入映射到叶子节点的索引号上。

对展开后的目标函数进行化简，得到最终的目标函数为：

使目标函数obj^(k)对ω_j的偏导为0，求得使目标函数最小的最优权重为：

其中，G_j为

H_j为

进而可以得到目标函数最优值为：

因此，节点分裂前后的损失函数差值可以表示为：

其中，下标L和下标R分别对应在j节点分裂后的左节点和右节点。

最后，根据确定出的最优分割特征以及最优分割点，以最大化损失函数差值为方向进行节点分裂。

在204中，根据测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。

当迭代训练的次数达到配置的迭代次数K时训练完成，此时根据测试集对训练后的轻量梯度提升机模型的进行校验，也即是对训练后的轻量梯度提升机模型的预测准确率进行校验。

可选的，可以采用均方根误差来评价训练后的轻量梯度提升机模型的预测准确率，表示为

其中，RMSE表示均方根误差，Ntest表示测试集中样本对的数量，

表示测试集中第t个样本对中历史能耗使用效率的表征向量，

表示测试集中第t个样本对所对应的预测能耗使用效率的表征向量。相应的，可以通过比较训练后的轻量梯度提升机模型对测试集的均方根误差是否小于预设均方根误差(可由本领域普通技术人员根据实际需要灵活设置)，根据比较结果判定训练后的轻量梯度提升机模型的预测准确率是否校验通过，其中，当前述均方根误差小于预设均方根误差时，判定收敛的循环神经网络的预测准确率校验通过。

可选的，还可以采用平均绝对误差来评价训练后的轻量梯度提升机模型的预测准确率，表示为

其中，MAE表示平均绝对误差，Ntest表示测试集中样本对的数量，

表示测试集中第t个样本对中历史能耗使用效率的表征向量，

表示测试集中第t个样本对所对应的预测能耗使用效率的表征向量。相应的，可以通过比较训练后的轻量梯度提升机模型对测试集的平均绝对误差是否小于预设平均绝对误差(可由本领域普通技术人员根据实际需要灵活设置)，根据比较结果判定训练后的轻量梯度提升机模型的预测准确率是否校验通过，其中，当前述平均绝对误差小于预设平均绝对误差时，判定收敛的循环神经网络的预测准确率校验通过。

当对训练后的轻量梯度提升机模型的预测准确率校验通过时，即可将该训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。

在一实施例中，“将训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型”之后，还包括：

(1)当接收到针对前述数据中心的能耗使用效率预测请求时，获取对应前述数据中心的当前能耗使用效率相关特征；

(2)调用能耗使用效率预测模型，并将获取到的当前能耗使用效率相关特征输入到能耗使用效率预测模型进行预测，得到前述数据中心的能耗使用效率。

本发明实施例中，在训练得到用于预测前述数据中心的能耗使用效率的能耗使用效率预测模型之后，即可根据该能耗使用效率预测模型对前述数据中心的能耗使用效率进行预测。

比如，可以接收针对前述数据中心的能耗使用效率预测请求，当接收到针对前述数据中心的能耗使用效率预测请求时，实时获取对应前述数据中心的当前能耗使用效率相关特征，然后调用能耗使用效率预测模型，将获取到的当前能耗使用效率相关特征输入到能耗使用效率预测模型进行预测，即可得到对应前述数据中心的能耗使用效率。

在一实施例中，本发明实施例提供的模型训练方法，还包括：

(1)确定历史能耗使用效率相关特征中每一类特征被确定为最优分割特征的次数；

(2)根据每一类特征对应的次数进行排序，得到排序信息；

(3)根据排序信息生成可视化图像。

根据以上描述，可以理解的是，对于历史能耗使用效率相关特征中的每一类特征，其在训练过程中被确定为最优分割特征的次数体现了该类特征与能耗使用效率的相关程度(其中，次数越多，表示相关程度越大)，本发明实施例中还进一步对每一类特征与能耗使用效率的相关程度进行可视化描述。

其中，首先确定历史能耗使用效率相关特征中每一类特征被确定为最优分割特征的次数；然后，根据每一类特征对应的次数进行排序，得到排序信息；最后，根据该排序信息生成可视化图像。

比如，请参照图5，其中矩形条的长度用于表征对应特征与能耗使用效率的相关程度，可以看出，在图5中，湿球温度与能耗使用效率的相关程度最高。

由上可知，本发明实施例中，首先获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关特征；然后根据历史能耗使用效率和历史能耗使用效率相关特征构建训练集和测试集；再构建轻量梯度提升机模型，并根据训练集对轻量梯度提升机模型进行训练；最后根据测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。相比于现有技术，本发明采用轻量梯度提升机模型作为基础模型进行训练，可以缓解训练过程中梯度消失的问题，使得训练得到的能耗使用效率预测模型的预测准确度较高。

实施例二、

本发明实施例还提供一种能耗使用效率预测方法，该能耗使用效率预测方法可以应用于能耗使用效率预测装置，该能耗使用效率预测装置可以集成在具备存储器并安装有处理器而具有运算能力的网络设备中，例如，该网络设备可以接收针对数据中心的能耗使用效率预测请求；根据能耗使用效率预测请求获取数据中心的当前能耗使用效率相关特征；调用预先训练的能耗使用效率预测模型；将当前能耗使用效率相关特征输入能耗使用效率预测模型进行预测，得到数据中心的预测能耗使用效率。其中，能耗使用效率预测模型采用本发明实施例的模型训练方法训练得到。

请参阅图6，图6是本发明实施例提供的能耗使用效率预测方法的流程示意图，该能耗使用效率预测方法可以包括：

在301中，接收针对数据中心的能耗使用效率预测请求。

在本发明实施例中，将从能耗使用效率预测装置的角度进行描述。

其中，可以通过多种不同的方式接收能耗使用效率预测请求。

比如，能耗使用效率预测装置可以通过其所在的网络设备向技术人员提供能效预测界面，该能效预测界面包括请求输入接口，如图7所示，该请求输入接口可以为输入框的形式，技术人员可以在该输入框形式的请求输入接口中键入需要进行能效预测的数据中心的标识信息，并输入确认信息(如直接按下键盘的回车键)以输入能耗使用效率预测请求，该能耗使用效率预测请求携带有需要进行能效预测的数据中心的标识信息。相应的，能耗使用效率预测装置即可根据接收到的能耗使用效率预测请求中的标识信息确定需要进行能效预测的目标数据中心。

又比如，在图7所述的能效预测界面中，还包括“打开”控件，一方面，能耗使用效率预测装置在侦测到该打开控件触发时，将在能效预测界面之上叠加显示选择子界面(如图8所示)，该选择子界面向技术人员提供可进行能效预测的数据中心的图标，如数据中心A、数据中心B、数据中心C、数据中心D、数据中心E、数据中心F等数据中心的图标，供技术人员查找并选中需要进行能效预测的数据中心的图标；另一方面，技术人员可以在选中需要分析的数据中心的图标之后，触发选择子界面提供的确认控件，以向能耗使用效率预测装置输入能耗使用效率预测请求，该能耗使用效率预测请求与技术人员选中的数据中心的图标相关联，指示能耗使用效率预测装置将技术人员选中的数据中心作为需要进行能效预测的数据中心。

此外，本领域普通技术人员还可以根据实际需要设置其它输入能耗使用效率预测请求的具体实现方式，本发明对此不做具体限制。比如，可以数据中心自动产生能耗使用效率预测请求，如周期性的自动产生能耗使用效率预测请求。

在302中，根据能耗使用效率预测请求获取数据中心的当前能耗使用效率相关特征。

本发明实施例中，在接收针到对数据中心的能耗使用效率预测请求时，根据该能耗使用效率预测请求确定需要进行能效预测的数据中心，并获取该数据中心的当前能耗使用效率相关特征。

应当说明的是，本发明实施例中针对不同的数据中心，采用本发明实施例提供的模型训练方法，预先针对性的训练有对应的能耗使用效率预测模型。

相应的，在获取需要进行能效预测的数据中心的当前能耗使用效率相关特征时，获取与该数据中心对应的能耗使用效率预测模型向匹配的当前能耗使用效率相关特征。

示例性的，对应于某数据中心的能耗使用效率预测模型在训练时采用了该数据中心的冷水机组电流百分比、冷水机组蒸发器小温差、冷水机组冷凝器小温差、冷水机组冷冻水出水温度(网关)、冷却塔风机变频反馈、冷却塔冷却水出水温度(网关)、冷却泵变频反馈、冷冻泵变频反馈、室外平均焓值、室内平均焓值、室外温度、湿球温度、室外湿度以及板换冷却侧阀门开状态等特征作为当前能耗使用效率相关特征进行训练，则在预测时，相应获取数据中心这些当前能耗使用效率相关特征进行预测。

在303中，调用预先训练的能耗使用效率预测模型。

如上所述，由于本发明实施例中预先训练有针对多个不同数据中心的能耗使用效率预测模型，相应的，在获取到需要进行能效预测的数据中心的能耗使用效率相关特征之后，即调用对应该数据中心的能耗使用效率预测模型。

在304中，将当前能耗使用效率相关特征输入能耗使用效率预测模型进行预测，得到数据中心的预测能耗使用效率。

其中，首先对获取到的当前能耗使用效率相关特征进行向量化表征，得到能耗使用效率的表征向量，然后将该表征向量输入调用的能耗使用效率预测模型进行预测，得到能耗使用效率预测模型输出的数值表现形式的能耗使用效率。

在一实施例中，“将当前能耗使用效率相关特征输入能耗使用效率预测模型进行预测，得到数据中心的预测能耗使用效率”的之后，还包括：

(1)获取对应数据中心的目标能耗使用效率；

(2)根据目标能耗使用效率以及预测能耗使用效率，对数据中心的运行状态进行调整。

其中，目标能耗使用效率为期望的所述数据中心在运行时的能耗使用效率，可由本领域普通技术人员根据实际需要进行设置。

本发明实施例中，在预测得到数据中心的预测能耗使用效率之后，还获取到对应该数据中心的目标能耗使用效率，进一步将预测得到的预测能耗使用效率与目标能耗使用效率进行比较，若预测得到的预测能耗使用效率未达到目标能耗使用效率，则按照预设的运行状态调整策略，对数据中心的运行状态进行调整，以使得数据中心的能耗使用效率达到目标能耗使用效率。

在一实施例中，“根据目标能耗使用效率以及预测得到的能耗使用效率，对数据中心的运行状态进行调整”，包括：

(1)获取当前能耗使用效率相关特征中每类特征与能耗使用效率的相关程度；

(2)根据每类特征与能耗使用效率的相关程度进行排序，得到排序信息；

(3)根据目标能耗使用效率、预测能耗使用效率以及排序信息，对数据中心的运行状态进行调整。

本发明实施例中，在根据目标能耗使用效率以及预测得到的能耗使用效率，对数据中心的运行状态进行调整时，首先获取当前能耗使用效率相关特征中类每特征与能耗使用效率的相关程度。其中，相关程度包括该类特征在能耗使用效率预测模型的训练过程中被确定为最优分割特征的次数。

然后，进一步根据每类特征与能耗使用效率的相关程度进行排序，得到排序信息，该排序信息即反映了每类特征与能耗使用效率的相关程度的高低。

最后，根据目标能耗使用效率、预测能耗使用效率以及排序信息，对数据中心的运行状态进行调整，比如，根据排序信息，以改变相关程度较高的特征为目标对数据中心的运行状态进行调整。

实施例三、

为了更好地实施以上模型训练方法，本发明实施例还提供一种模型训练装置，该模型训练装置具体可以集成在网络设备中。

例如，如图9所示，该模型训练装置可以包括数据获取模块401、样本构建模块402、模型训练模块403、模型校验模块404以及模型训练模块405，如下：

数据获取模块401，用于获取数据中心的历史能耗使用效率，以及获取对应的历史能耗使用效率相关特征；

样本构建模块402，用于根据历史能耗使用效率和历史能耗使用效率相关特征构建训练集和测试集；

模型训练模块403，用于构建轻量梯度提升机模型，并根据训练集对轻量梯度提升机模型进行训练；

模型校验模块404，用于根据测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。

在一实施例中，在构建轻量梯度提升机模型，并根据构建的训练集对轻量梯度提升机模型进行训练时，模型训练模块403用于：

构建基于分类回归树的轻量梯度提升机模型，并构建对应基于分类回归树的轻量梯度提升机模型的目标函数；

根据训练集以及目标函数对基于分类回归树的轻量梯度提升机模型的进行迭代训练。

在一实施例中，构建对应基于分类回归树的轻量梯度提升机模型的目标函数，模型训练模块403用于：

构建对应基于分类回归树的轻量梯度提升机模型的损失函数；

构建对应基于分类回归树的轻量梯度提升机模型的正则项函数；

根据前述损失函数以及前述正则项函数构建对应基于分类回归树的轻量梯度提升机模型的目标函数。

在一实施例中，在根据训练集以及目标函数对基于分类回归树的轻量梯度提升机模型的进行迭代训练时，模型训练模块403用于：

遍历直方图确定出当次节点分裂的最优分割特征和最优分割点；

获取当前的目标函数，并对当前的目标函数进行二阶泰勒展开，根据二阶泰勒展开结果得到对应节点分裂前后的损失函数差值；

根据最优分割特征以及最优分割点，以最大化损失函数差值为方向进行节点分裂。

应当说明的是，本发明实施例提供的模型训练装置与上文实施例中的模型训练方法属于同一构思，在模型训练装置上可以运行模型训练方法实施例中提供的任一方法，其具体实现过程详见以上实施例，此处不再赘述。

实施例四、

为了更好地实施以上能耗使用效率预测方法，本发明实施例还提供一种能耗使用效率预测装置，该能耗使用效率预测装置具体可以集成在网络设备中。

例如，如图10所示，该能耗使用效率预测装置可以包括请求接收模块501、数据采集模块502、模型调用模块503、效率预测模块504以及下发模块505，如下：

请求接收模块501，用于接收针对数据中心的能耗使用效率预测请求；

数据采集模块502，用于根据能耗使用效率预测请求获取数据中心的当前能耗使用效率相关特征；

模型调用模块503，用于调用预先训练的能耗使用效率预测模型；

效率预测模块504，用于将当前能耗使用效率相关特征输入能耗使用效率预测模型进行预测，得到数据中心的预测能耗使用效率；

其中，能耗使用效率预测模型采用本发明实施例提供的模型训练方法训练得到。

在一实施例中，能耗使用效率预测装置还包括运行控制模块，用于在效率预测模块504将当前能耗使用效率相关特征输入能耗使用效率预测模型进行预测，得到数据中心的预测能耗使用效率之后，获取对应数据中心的目标能耗使用效率；以及根据目标能耗使用效率以及预测能耗使用效率，对数据中心的运行状态进行调整。

在一实施例中，在根据目标能耗使用效率以及预测能耗使用效率，对数据中心的运行状态进行调整时，运行控制模块用于：

获取当前能耗使用效率相关特征中每类特征与能耗使用效率的相关程度；

根据目标能耗使用效率、预测能耗使用效率以及排序信息，对数据中心的运行状态进行调整。

应当说明的是，本发明实施例提供的能耗使用效率预测装置与上文实施例中的能耗使用效率预测方法属于同一构思，在能耗使用效率预测装置上可以运行能耗使用效率预测方法实施例中提供的任一方法，其具体实现过程详见以上实施例，此处不再赘述。

实施例五、

本发明实施例还提供一种网络设备，如图11所示，其示出了本发明实施例所涉及的网络设备的结构示意图，具体来讲：

该网络设备可以包括一个或者一个以上处理核心的处理器601、一个或一个以上计算机可读存储介质的存储器602、电源603和输入单元604等部件。本领域技术人员可以理解，图11中示出的网络设备结构并不构成对网络设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器601是该网络设备的控制中心，利用各种接口和线路连接整个网络设备的各个部分，通过运行或执行存储在存储器602内的软件程序和/或模块，以及调用存储在存储器602内的数据，执行网络设备的各种功能和处理数据。

存储器602可用于存储软件程序以及模块，处理器601通过运行存储在存储器602的软件程序以及模块，从而执行各种功能应用以及数据处理。此外，存储器602可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器602还可以包括存储器控制器，以提供处理器601对存储器602的访问。

网络设备还包括给各个部件供电的电源603，优选的，电源603可以通过电源管理系统与处理器601逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

该网络设备还可包括输入单元604，该输入单元604可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，网络设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，网络设备中的处理器601会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中，并由处理器601来运行存储在存储器602中的应用程序，从而实现各种功能，如下：

根据历史能耗使用效率和历史能耗使用效率相关特征构建训练集和测试集；

构建轻量梯度提升机模型，并根据训练集对轻量梯度提升机模型进行训练；

根据测试集对训练后的轻量梯度提升机模型的进行校验，当校验通过时，将训练后的轻量梯度提升机模型作为用于预测数据中心的能耗使用效率的能耗使用效率预测模型。

或者，实现如下功能：

接收针对数据中心的能耗使用效率预测请求；

根据能耗使用效率预测请求获取数据中心的当前能耗使用效率相关特征；

调用预先训练的能耗使用效率预测模型；

将当前能耗使用效率相关特征输入能耗使用效率预测模型进行预测，得到数据中心的预测能耗使用效率；

应当说明的是，本发明实施例提供的网络设备与上文实施例中的适用于网络设备的模型训练方法/能耗使用效率预测方法属于同一构思，其具体实现过程详见以上方法实施例，此处不再赘述。

实施例六、

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本发明实施例提供一种存储介质，其中存储有计算机程序，该计算机程序包括的多条指令能够被网络设备的处理器进行加载，以执行本发明实施例所提供的适用于网络设备的模型训练方法，例如：

或者，该计算机程序包括的多条指令能够被网络设备的处理器进行加载，以执行本发明实施例所提供的适用于网络设备的能耗使用效率预测方法，例如：

接收针对数据中心的能耗使用效率预测请求；

调用预先训练的能耗使用效率预测模型；

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

本发明实施例所提供的存储介质能够实现本发明实施例所提供的对应模型训练方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本发明实施例所提供的一种模型训练方法、装置和存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的模型训练方法，其特征在于，所述构建轻量梯度提升机模型，并根据所述训练集对所述轻量梯度提升机模型进行训练的步骤，包括：

3.根据权利要求2所述的模型训练方法，其特征在于，所述根据所述训练集以及所述目标函数对所述基于分类回归树的轻量梯度提升机模型的进行训练的步骤，包括：

4.根据权利要求2或3所述模型训练方法，其特征在于，所述构建对应所述基于分类回归树的轻量梯度提升机模型的目标函数的步骤，包括：

根据所述损失函数以及所述正则项函数构建所述目标函数。

5.一种能耗使用效率预测方法，其特征在于，包括：

接收针对数据中心的能耗使用效率预测请求；

调用预先训练的能耗使用效率预测模型；

其中，所述能耗使用效率预测模型采用权利要求1-4任一项所述的模型训练方法训练得到。

6.根据权利要求5所述的能耗使用效率预测方法，其特征在于，所述将所述当前能耗使用效率相关特征输入所述能耗使用效率预测模型进行预测，得到所述数据中心的预测能耗使用效率的步骤之后，还包括：

获取对应所述数据中心的目标能耗使用效率；

7.根据权利要求6所述的能耗使用效率预测方法，其特征在于，所述根据所述目标能耗使用效率以及所述预测能耗使用效率，对所述数据中心的运行状态进行调整的步骤，包括：

8.一种模型训练装置，其特征在于，包括：

9.一种能耗使用效率预测装置，其特征在于，包括：

10.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行如权利要求1至4任一项所述的模型训练方法，或者执行如权利要求5-7所述的能耗使用效率预测方法。