CN116205359A

CN116205359A - 一种日前电力负荷预测的方法、装置、终端和存储介质

Info

Publication number: CN116205359A
Application number: CN202310184942.9A
Authority: CN
Inventors: 刘宁; 王栋; 杨明杰; 张驰; 赵书函; 闫润珍
Original assignee: Information and Telecommunication Branch of State Grid Gansu Electric Power Co Ltd
Current assignee: Information and Telecommunication Branch of State Grid Gansu Electric Power Co Ltd
Priority date: 2023-02-28
Filing date: 2023-02-28
Publication date: 2023-06-02

Abstract

本发明公开了一种日前电力负荷预测的方法、装置、终端和存储介质，该方法包括：将源域建筑的历史负荷数据迁移至目标建筑的历史数据中，得到更新后的所述目标建筑的历史数据；基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型记为第一负荷预测模型，并训练得到基于相似日的负荷预测模型记为第二负荷预测模型；将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型；利用所述集成负荷预测模型，对待进入日前电力负荷预测的源域建筑进行日前电力负荷预测。该方案，通过采用基于多元分解迁移和集成学习的综合能源系统负荷预测方式，避免负迁移，提升日前负荷预测模型建立的准确性。

Description

一种日前电力负荷预测的方法、装置、终端和存储介质

技术领域

本发明属于计算机技术领域，具体涉及一种日前电力负荷预测的方法、装置、终端和存储介质，尤其涉及一种综合能源系统日前电力负荷预测方法、装置、终端和存储介质。

背景技术

随着社会经济的快速发展，人们对能源的需求持续增加，由于化石能源逐渐枯竭，传统的火力发电效率低下、环境污染严重等问题，综合能源系统(Integrated EnergySystem，IES)应运而生。IES是下一代智能的能源系统，其将多种类型的能源紧密结合，使用系统化、集成化和精细化的方法来优化整个能源系统的能量生产、传输、存储和使用，从而极大的提高整个能源系统的能源利用效率、可持续性和安全可靠性。IES以其高效性、分布式和各能源之间的耦合性强等优势受到广泛的应用，其主要形式是以天然气为主清洁能源为辅的冷热电联供，而用户侧的负荷预测对IES的规划、运行、调度和储能有重要意义，已经成为当今的研究热点。

在机器学习中，若想准确的预测IES中一栋建筑物未来一段一时间的负荷需求量，需要大量的历史负荷数据作为模型的支撑。随着园区的逐步扩大，越来越多的新建筑物并入IES中，这些新建筑物的历史负荷数据非常少，而综合能源系统的管理者希望尽早做出准确的预测以便于对IES进行优化和调整。所以挑战在于使用有限的数据做出准确的预测。

在同一IES中，相同类型的建筑必然有相似的负荷消耗模式，因此他们的历史负荷数据可以共享于新建筑。迁移学习是一种很好的解决数据缺失的方法，它通过将源域中提取到的数据特征整合到目标域来强化目标模型；但是这个方法存在产生负迁移的可能性，在负荷预测领域中主要有以下两点：一是源域的选择问题，虽然源域建筑来源于同一IES，但是不同建筑的用电模式不同，负荷数据的相似性也不同，如果源域建筑选择不当甚至会降低预测性能，并且与目标建筑的负荷相似性较高的源域建筑可能多于一个，这时可能需要选择多个建筑进行迁移；二是数据迁移的问题，负荷预测的准确性和历史数据的数量和质量呈现正相关的关系，长期的负荷数据存在明显的季节性趋势，若直接进行样本迁移或参数迁移，可能导致预测性能达不到最优甚至下降。

可见，在针对新并入能源管理系统的建筑物的历史数据，采用迁移学习的方式建立日前负荷预测模型的情况下，负荷数据的波动性和随机性会导致负迁移，影响了日前负荷预测模型建立的准确性。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的目的在于，提供一种日前电力负荷预测的方法、装置、终端和存储介质，以解决在针对新并入能源管理系统的建筑物的历史数据，采用迁移学习的方式建立日前负荷预测模型的情况下，负荷数据的波动性和随机性会导致负迁移，影响了日前负荷预测模型建立的准确性的问题，达到通过采用基于多元分解迁移和集成学习的综合能源系统负荷预测方式，将同一综合能源系统中的其他相似建筑物负荷数据迁移到目标建筑物，并将相似日预测模型与神经网络预测模型相结合提出了集成预测模型，能够避免负迁移，有利于提升日前负荷预测模型建立的准确性的效果。

本发明提供一种日前电力负荷预测的方法，包括：针对待进入日前电力负荷预测的源域建筑，获取所述源域建筑的历史负荷数据；将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据；基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型；基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型；将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型；利用所述集成负荷预测模型，对待进入日前电力负荷预测的源域建筑进行日前电力负荷预测。

在一些实施方式中，将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据，包括：以所述源域建筑的历史负荷数为源域，以所述目标建筑的历史数据为目标域，采用移动平均分解法将所述源域中的每个数据集划分为趋势、季节和残差三类，得到源域分类数据集；采用移动平均分解法将所述目标域中的每个数据集划分为趋势、季节和残差三类，得到目标域分类数据集；采用皮尔逊相关系数量化所述源域分类数据集和所述目标域分类数据集之间的线性相关性，得到线性相关性量化结果；在所述源域分类数据集中的每类数据集中选择所述线性相关性量化结果在相似度阈值以上的相应数据，形成迁移数据集；基于所述迁移数据集，采用多元线性回归方式重构所述目标域的历史数据，以实现将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，得到更新后的所述目标建筑的历史数据。

在一些实施方式中，其中，基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型，包括：将更新后的所述目标建筑的历史数据中待预测日前一天的负荷、以及待预测日当天的负荷作为第一训练样本；将第一训练样本中待预测日前一天的负荷作为长短时记忆网络模型的输入量，并将第一训练样本中待预测日当天的负荷作为所述长短时记忆网络模型的输出量，以此训练，得到基于神经网络的负荷预测模型，记为第一负荷预测模型；和/或，基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型，包括：对更新后的所述目标建筑的历史数据进行相似性分析，得到更新后的所述目标建筑的历史数据中日期负荷相同、且负荷曲线的相近程度达到设定程度的历史日的历史数据作为第二训练样本；从所述第二训练样本中按设定顺序排列的n个相似日的第二日负荷中筛选出与待预测日日期类型相同、且相似度最大的前m个日子作为相似日的负荷值；计算所述相似日的负荷值的加权平均值来预测待预测日的负荷值，以此训练，得到基于相似日的负荷预测模型，记为第二负荷预测模型；其中，计算所述相似日的负荷值的加权平均值所用的权重，为日期类型相同的第i个历史日的负荷向量与该日的欧氏距离的倒数，i为正整数。

在一些实施方式中，将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型，包括：按设定的非负权重系数，利用线性回归分析法，将所述第一负荷预测模型与所述第二负荷预测模型进行加权结合，实现对所述第一负荷预测模型与所述第二负荷预测模型的集成，得到集成负荷预测模型。

与上述方法相匹配，本发明另一方面提供一种日前电力负荷预测的装置，包括：获取单元，被配置为针对待进入日前电力负荷预测的源域建筑，获取所述源域建筑的历史负荷数据；控制单元，被配置为将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据；所述控制单元，还被配置为基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型；所述控制单元，还被配置为基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型；所述控制单元，还被配置为将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型；所述控制单元，还被配置为利用所述集成负荷预测模型，对待进入日前电力负荷预测的源域建筑进行日前电力负荷预测。

在一些实施方式中，所述控制单元，将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据，包括：以所述源域建筑的历史负荷数为源域，以所述目标建筑的历史数据为目标域，采用移动平均分解法将所述源域中的每个数据集划分为趋势、季节和残差三类，得到源域分类数据集；采用移动平均分解法将所述目标域中的每个数据集划分为趋势、季节和残差三类，得到目标域分类数据集；采用皮尔逊相关系数量化所述源域分类数据集和所述目标域分类数据集之间的线性相关性，得到线性相关性量化结果；在所述源域分类数据集中的每类数据集中选择所述线性相关性量化结果在相似度阈值以上的相应数据，形成迁移数据集；基于所述迁移数据集，采用多元线性回归方式重构所述目标域的历史数据，以实现将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，得到更新后的所述目标建筑的历史数据。

在一些实施方式中，其中，所述控制单元，基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型，包括：将更新后的所述目标建筑的历史数据中待预测日前一天的负荷、以及待预测日当天的负荷作为第一训练样本；将第一训练样本中待预测日前一天的负荷作为长短时记忆网络模型的输入量，并将第一训练样本中待预测日当天的负荷作为所述长短时记忆网络模型的输出量，以此训练，得到基于神经网络的负荷预测模型，记为第一负荷预测模型；和/或，所述控制单元，基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型，包括：对更新后的所述目标建筑的历史数据进行相似性分析，得到更新后的所述目标建筑的历史数据中日期负荷相同、且负荷曲线的相近程度达到设定程度的历史日的历史数据作为第二训练样本；从所述第二训练样本中按设定顺序排列的n个相似日的第二日负荷中筛选出与待预测日日期类型相同、且相似度最大的前m个日子作为相似日的负荷值；计算所述相似日的负荷值的加权平均值来预测待预测日的负荷值，以此训练，得到基于相似日的负荷预测模型，记为第二负荷预测模型；其中，计算所述相似日的负荷值的加权平均值所用的权重，为日期类型相同的第i个历史日的负荷向量与该日的欧氏距离的倒数，i为正整数。

在一些实施方式中，所述控制单元，将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型，包括：按设定的非负权重系数，利用线性回归分析法，将所述第一负荷预测模型与所述第二负荷预测模型进行加权结合，实现对所述第一负荷预测模型与所述第二负荷预测模型的集成，得到集成负荷预测模型。

与上述装置相匹配，本发明再一方面提供一种终端，包括：以上所述的日前电力负荷预测的装置。

与上述方法相匹配，本发明再一方面提供一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行以上所述的日前电力负荷预测的方法。

由此，本发明的方案，通过将同一综合能源系统中负荷相似度较高的多个建筑物作为源域建筑，将源域建筑的历史负荷数据分解加权转移到目标建筑以得到目标建筑数据集；基于目标建筑数据集分别构建相似日预测模型与神经网络预测模型，并将构建得到的相似日预测模型与神经网络预测模型集成，得到集成预测模型，以利用集成预测模型对同一综合能源系统进行日前电力负荷预测，从而，通过采用基于多元分解迁移和集成学习的综合能源系统负荷预测方式，将同一综合能源系统中的其他相似建筑物负荷数据迁移到目标建筑物，并将相似日预测模型与神经网络预测模型相结合提出了集成预测模型，能够避免负迁移，有利于提升日前负荷预测模型建立的准确性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明的日前电力负荷预测的方法的一实施例的流程示意图；

图2为本发明的方法中将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中的一实施例的流程示意图；

图3为本发明的方法中训练得到基于神经网络的负荷预测模型的一实施例的流程示意图；

图4为本发明的方法中训练得到基于相似日的负荷预测模型的一实施例的流程示意图；

图5为本发明的日前电力负荷预测的装置的一实施例的结构示意图；

图6为基于分解的迁移学习模型的结构示意图；

图7为建筑物B11月19日至1月25日连续7天的历史负荷曲线示意图；

图8为建筑B9的预测误差示意图；

图9不同建筑负荷数据分解后的趋势序列和残差序列相关性热力分布示意图，其中，(a)为相关趋势示意图(即Correlation trend)，(b)为相关残差示意图(即Correlationresidual)；

图10为不同阈值下趋势序列的选定源域建筑表(即Selected source domainbuildings of trend series under different thresholds表)；

图11为不同阈值下剩余序列的选定源域建筑物表(即Selected source domainbuildings of residual series under different thresholds表)；

图12为建筑物B1、B2和B9在不同阈值条件下的重构MAE表(即Datareconstruction error of three buildings表)；

图13为三栋建筑物在四种方法下的每周预测误差表；

图14为各个建筑物的总体误差示意图(即Comparison of predictive accuracyof different models)，其中，(a)为平均绝对误差图(Mean Absolute Error，MAE)，衡量的是真实值与预测值的偏离的绝对大小情况，(b)为平均绝对百分比误差图(mean absolutePercentage error，MAPE)，衡量的是偏离的相对大小(即百分率)；

图15为各个建筑物的拟合曲线示意图(即Prediction results of differentmodels)，其中，(a)为建筑物B1的拟合曲线示意图，(b)为建筑物B2的拟合曲线示意图，(c)为建筑物B9的拟合曲线示意图。

结合附图，本发明实施例中附图标记如下：

102-获取单元；104-控制单元。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在负荷预测(即Load forecasting)中，采取精准的预测方法可以使IES的运行更加稳定和可靠。相关方案中，以深度学习为代表的负荷预测方法以其处理非线性数据能力强、预测精度高等优点而受到了广泛的应用。其中对于电力系统的负荷预测已有较多研究，主要运用模糊理论、支持向量机、灰色模型、随机森林、自回归差分滑动平均模型、神经网络和集成学习等方法预测电负荷。这些研究都取得了不错的预测结果，这是因为它们都有丰富的历史数据，未来负荷消耗模式遵循历史循环模式。

迁移学习(即Transfer learning)在计算机视觉领域中已经得到了广泛的研究，但在时间序列分析领域的应用依然很少。迁移学习是一种可以利用数据特征相关性，将已有的数据信息应用到另一个场景中解决问题的技术，在面对两个领域的输入特征空间、样本数据分布有所差异的情况时，可以通过构造样本筛选机制完成域间信息传递，从而利用迁移信息对新数据建立模型。

根据调查研究，解决时间序列预测问题的迁移学习方法可以分为三类：基于模型的、基于特征的和基于样本的方法。1)基于模型的：这是最常用迁移学习的方法，旨在将源域中预训练的模型参数共享于目标域模型。Yuwei Jin等人提出一种根据源数据集和目标数据集的大小和相似性差异来确定模型迁移层数的方法，相似度较高时迁移模型的最后几层，相似度较低时迁移模型的前几层。2)基于特征的：这是一种通过特征变换来进行迁移的方法。Qinghua Hu等人提出一种共享隐藏层的架构模型，它可以将输入层和隐藏层共享于所有风电场之间，把通用特征转移到每个数据集中。3)基于样本的：这种方法通过对样本进行加权转移，根据样本的重要程度赋予不同的权重，例如对相似度较高的样本赋予更高的权重。Mauro Ribeiro等人提出一种基于季节性和趋势调整的跨建筑能量预测方法，它通过使用其他学校的数据集来提高数据有限的学校的能量预测准确性。基于样本的迁移学习方法具有良好的理论支持条件和直接推导的优点，对于样本分布差异较小时有显著效果。

考虑到，综合能源系统作为一种新型的、高效的智能能源系统，已经得到了广泛的应用。由于越来越多的新建筑物并入系统中，准确的日前负荷预测对综合能源系统的规划和运行至关重要。其中，日前负荷预测，是指使用历史负荷数据预测未来一天各个时段的负荷量。新并入能源管理系统的建筑物的历史数据不足以建立准确的预测模型，迁移学习作为一种跨域学习方法，在时间序列预测中已得到了应用，但是，在针对新并入能源管理系统的建筑物的历史数据，采用迁移学习的方式建立日前负荷预测模型的情况下，负荷数据的波动性和随机性会导致负迁移，影响了日前负荷预测模型建立的准确性。

为了解决在针对新并入能源管理系统的建筑物的历史数据，采用迁移学习的方式建立日前负荷预测模型的情况下，负荷数据的波动性和随机性导致负迁移从而影响了日前负荷预测模型建立的准确性的问题，本发明的方案提出一种综合能源系统日前电力负荷预测方法，具体是一种将迁移学习和集成学习结合的日前电力负荷预测模型的建立方法。

根据本发明的实施例，提供了一种日前电力负荷预测的方法，如图1所示本发明的方法的一实施例的流程示意图。该日前电力负荷预测的方法可以包括：步骤S110至步骤S160。

在步骤S110处，针对待进入日前电力负荷预测的源域建筑，获取所述源域建筑的历史负荷数据。其中，源域建筑，是指需要将历史负荷数据迁移到目标建筑物的多个建筑物。

在步骤S120处，将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据。

在一些实施方式中，步骤S120中将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据的具体过程，参见以下示例性说明。

下面结合图2所示本发明的方法中将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中的一实施例流程示意图，进一步说明步骤S120中将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中的具体过程，包括：步骤S210至步骤S230。

步骤S210，以所述源域建筑的历史负荷数为源域，以所述目标建筑的历史数据为目标域，采用移动平均分解法将所述源域中的每个数据集划分为趋势、季节和残差三类，得到源域分类数据集。采用移动平均分解法将所述目标域中的每个数据集划分为趋势、季节和残差三类，得到目标域分类数据集。

步骤S220，采用皮尔逊相关系数量化所述源域分类数据集和所述目标域分类数据集之间的线性相关性，得到线性相关性量化结果。在所述源域分类数据集中的每类数据集中选择所述线性相关性量化结果在相似度阈值以上的相应数据，形成迁移数据集。

步骤S230，基于所述迁移数据集，采用多元线性回归方式重构所述目标域的历史数据，以实现将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，得到更新后的所述目标建筑的历史数据。

由于能源需求和人们工作习惯息息相关，所以负荷趋势存在着明显的工作日负荷需求高、节假日负荷需求低的周期特性。对于不同建筑，虽然它们的负荷序列趋势和形状相似，但数据分布有所差异，直接选择源域中与目标域总体相似性最高的数据集进行迁移通常会导致负迁移的发生。为解决这个问题，本发明的方案提出一种基于数据分解和相关性分析的源域建筑选择方法，在本发明的方案中，采用移动平均分解法将源域和目标域中的每个数据集划分为趋势、季节和残差三类。之后采用皮尔逊相关系数来量化两个数据集之间的线性相关性，在源域中分别选择相似度阈值之上的数据作为迁移数据集，如图9、图10所示的例子中，阈值越低，所选源域建筑越多，产生负迁移的可能性就越大，所以本发明的方案选择的最低阈值为0.6。最后采用多元线性回归(即Multiple linear regression)重新构建目标域的历史数据。图6为基于分解的迁移学习模型的结构示意图，图6展示了本发明的方案中基于分解的迁移学习结构(即Overview of transfer learning method)。如图6所示，源域(即Source domain)、以及目标域(即Target domain)，经数据预处理(即Datapreprocessing)后，得到预处理结果。预处理结果，经时间序列分解(即Time seriesadaptation and transfer)得到多个来源如来源1(即Source 1)、来源2(即Source 2)至来源n(即Source n)等，n为正整数。多个来源、以及预处理结果，经时间序列适应和迁移(即Time series adaptation and transfer)后，得到目标域重建数据集(即Target domainreconstruction dataset)。其中，在时间序列适应和迁移中，包含了：趋势成分(即Trendcomponent)、季节性成分(即Seasonal component)、不规则成分(即Irregularcomponent)。

由于绝大多数新建筑物的已有数据有限，若想取得不错的预测精度，需要重新构建大量的历史数据来扩充数据集，所以基于数据驱动的机器学习算法并不会取得较为理想的效果。从迁移学习(即Transfer learning)中可知，目标域可能同时与源域中的多个数据集存在线性关系，所以本发明的方案采用多元线性回归(即Multiple linear regression)作为目标域历史数据构建方式。

多元线性回归是一种经典的数学统计模型，通常应用于时间序列预测当中，即使用多元线性方程来表示历史值与待预测值之间的关系。本发明的方案使用多元线性回归建立目标域与选中的源域数据集之间的线性关系，该线性关系的矩阵表达式为Y＝X×β+μ，具体表达式如下：

其中，y_i表示目标域负荷值。x_ij表示影响负荷的各种影响因素，即本发明的方案中为大于阈值的数据集的负荷值。β₀表示常数项。β_i(i＝1,2,…,n)表示回归系数。μ_i表示随机扰动。

采用最小二乘法对回归参数进行估计，求出回归函数，即为目标域历史数据重构模型，其公式如下：

其中，β为回归参数，XY为上述矩阵表达式中的X向量和Y向量，即y_i、x_ij。

在步骤S130处，基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型。

在一些实施方式中，步骤S130中基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型的具体过程，参见以下示例性说明。

下面结合图3所示本发明的方法中训练得到基于神经网络的负荷预测模型的一实施例流程示意图，进一步说明步骤S130中训练得到基于神经网络的负荷预测模型的具体过程，包括：步骤S310至步骤S320。

步骤S310，将更新后的所述目标建筑的历史数据中待预测日前一天的负荷、以及待预测日当天的负荷作为第一训练样本。

步骤S320，将第一训练样本中待预测日前一天的负荷作为长短时记忆网络模型的输入量，并将第一训练样本中待预测日当天的负荷作为所述长短时记忆网络模型的输出量，以此训练，得到基于神经网络的负荷预测模型，记为第一负荷预测模型。

在本发明的方案中，负荷预测模型(即Load forecasting model)，包括：基于神经网络的负荷预测模型(即Load forecasting model based on Neural Network)。长短时记忆网络(LSTM)作为循环神经网络(Recurrent Neural Network，RNN)的变形，不仅可以挖掘负荷数据的时序特征，还可以学习序列的长期依赖关系，降低在模型训练时梯度失控的风险。LSTM由三个存储门组成，即输入门i_t、输出门o_t和遗忘门f_t。在本发明的方案中，LSTM的输入为待预测日前一天的负荷，输出为待预测日当天的负荷。x_t和h_t分别表示t时刻的输入与输出，C_t表示t时刻LSTM隐藏节点状态，其更新过程如下所示：

f_t＝σ(W_f·[h_t-1，x_t]+b_f)

i_t＝σ(W_i·[h_t-1，x_t]+b_i)

o_t＝σ(W_o·[h_t-1，x_t]+b_o)

h_t＝o_t*tanh(C_t) (3)。

其中，W_f、W_i、W_o、E_c为权重矩阵，b_f、b_i、b_o、b_c为对应偏置，σ为ReLU激活函数，tanh为双曲正切函数。

在步骤S140处，基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型。

在一些实施方式中，步骤S140中基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型的具体过程，参见以下示例性说明。

下面结合图4所示本发明的方法中训练得到基于相似日的负荷预测模型的一实施例流程示意图，进一步说明步骤S140中训练得到基于相似日的负荷预测模型的具体过程，包括：步骤S410至步骤S430。

步骤S410，对更新后的所述目标建筑的历史数据进行相似性分析，得到更新后的所述目标建筑的历史数据中日期负荷相同、且负荷曲线的相近程度达到设定程度的历史日的历史数据作为第二训练样本。

步骤S420，从所述第二训练样本中按设定顺序排列的n个相似日的第二日负荷中筛选出与待预测日日期类型相同、且相似度最大的前m个日子作为相似日的负荷值。

步骤S430，计算所述相似日的负荷值的加权平均值来预测待预测日的负荷值，以此训练，得到基于相似日的负荷预测模型，记为第二负荷预测模型；其中，计算所述相似日的负荷值的加权平均值所用的权重，为日期类型相同的第i个历史日的负荷向量与该日的欧氏距离的倒数，i为正整数。

在本发明的方案中，负荷预测模型(即Load forecasting model)，还包括：基于相似日的负荷预测模型(即Load forecasting model based on similar days)。图7为建筑物B11月19日至1月25日连续7天的历史负荷(即Load data for seven days)，其中20、21日为节假日，其余日期均为工作日，图7的横坐标为时间，图7的纵坐标为电力负荷(即Electricity Load)且单位为千瓦(KW)。可以看出，22日和23日的输出功率是相似的，可以使用LSTM神经网络模型通过相邻日的负荷数据进行准确预测。而19日与20日虽同为相邻日，负荷却相差甚远。这是由于这两日分别为工作日与节假日，而负荷能源需求受日期类型影响较大，节假日负荷曲线显著降低，此时单纯的基于前一日的负荷数据进行日前负荷预测精度会有所降低。

日前电力负荷预测中根据相似日数据进行预测可以利用较少的训练数据达到较高的预测精度，所以选择合适的相似日就尤为重要。考虑到相同日期类型下，相邻日用能规律具有相似性，通过寻找待预测日前一日的相似日，对应相似日第二天的输出负荷有很大可能与待预测日相似，其步骤如下：

步骤1、相似性分析：

通过相似性分析，挑选历史负荷中日期类型相同且负荷曲线相近历史日作为训练样本。将全部日期合集D划分为节假日D_h与工作日D_w，待预测日d的日期类型为D_d、负荷向量为x_d＝[x_d(1),x_d(2),...,x_d(24)]，其前一天的负荷向量为x_d-1＝[x_d-1(1),x_d-1(2),…,x_d-1(24)]，日期类型相同的第i个历史日的负荷向量与该日的欧氏距离dis_i为：

按照相似度的大小将dis_i按降序排列，相似日的索引记录为H₁,H₂,...,H_n。

步骤2、计算待预测日负荷量：

从降序排列的n个相似日的第二日负荷

中进一步筛选出与待预测日日期类型相同且相似度最大的前m个日子作为相似日的负荷值，计算加权平均值来预测目标日的负荷量。其中，n为全部相似日，m由图8得知可取6；第二日是指n个相似日的次日，与带预测日可能存在较高相关性。权重按距离的倒数计算，如式(5)所示。使用(6)计算待预测日的负荷量：

在步骤S150处，将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型。

在一些实施方式中，步骤S150中将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型，包括：按设定的非负权重系数，利用线性回归分析法，将所述第一负荷预测模型与所述第二负荷预测模型进行加权结合，实现对所述第一负荷预测模型与所述第二负荷预测模型的集成，得到集成负荷预测模型。

在本发明的方案中，负荷预测模型(即Load forecasting model)，还包括：日前负荷集合预测模型(即Day-ahead Load ensemble forecasting model)。LSTM模型的准确性取决于相邻日的负荷相似性，若相邻日日期类型不同，预测精度将有所降低。相似日模型根据前一日负荷向量选取相同日期类型的相似日，虽无法捕获建筑负荷的连续性特征，但弥补了该模型无法应对不同日期类型进行精确预测的不足。为充分融合两个模型的优点，本发明的方案利用线性回归分析将两种预测模型进行加权结合，提高模型的预测精度。

假设两种模型的预测结果序列为：Y₁＝[y₁₁,y₁₂,...,y_1n]和Y₂＝[y₂₁,y₂₂,...,y_2n]，集成模型的预测结果表示为：

Y＝αY₁+βY₂ (7)。

其中，Y1为第一种预测模型的预测结果。Y2为第二种预测模型的预测结果。Y为两种模型集成后的最终预测结果。将两个非负权重α和β分别分配给LSTM模型(即基于神经网络的负荷预测模型)和相似日模型(即基于相似日的负荷预测模型)。通常，非负权重满足α+β＝1，此处通过线性回归确定最优权重值。

在步骤S160处，利用所述集成负荷预测模型，对待进入日前电力负荷预测的源域建筑进行日前电力负荷预测，以实现对待进入日前电力负荷预测的源域建筑的日前电力负荷预测。

在本发明的方案提出的一种将迁移学习和集成学习结合的日前电力负荷预测模型的建立方法中，首先，提出了一种基于数据分解的多元迁移方法，通过将源域建筑的历史负荷数据分解加权转移到目标建筑，丰富目标建筑数据集以提高预测精度，实现将负荷相似度较高的多个建筑物进行数据迁移以丰富目标建筑的历史数据，避免了负迁移。从而，在本发明的方案中，使用迁移学习来提高目标建筑在历史数据稀缺的情况下日前短期负荷预测的精度。其次，提出了相似日和神经网络集成的预测模型以应对不同日期类型对预测精度产生的影响，具体是集成了相似日预测模型与神经网络预测模型，解决了节假日预测结果精度较低的问题。最后，通过仿真实验对提出的模型进行了验证，例如：对IES中三个目标建筑的日前短期负荷预测进行了评估，所提出的模型在各个目标建筑上都展现了理想的预测精度。实验结果表明，本发明的方案提出的数据重构方法和预测模型取得了理想的重构误差和预测精度。

为了验证本发明的方案所提出的方法，进行了综合能源系统中多栋建筑的负荷预测的案例研究。与仅使用目标建筑物一个月的数据进行预测相比，使用了多元分解迁移方法的数据的预测准确率均得到了较大提升。即使目标建筑使用十二个月的数据进行预测，此方法也的预测精度与其持平甚至更优。在未来的研究探索中，将使用更优秀的阈值选择方法以提高工作效率。

在实验数据集(即Experimental datasets)方面，本发明的方案所选数据集来自亚利桑那州立大学坦佩校区的综合能源系统，包含十栋具有研究性质的建筑物的电力负荷数据。这十栋建筑物分别为：Phys Sci A_B_C(即物理科学A_B_C)、Lifescience A_B_D(即生命科学A_B_D)、ISTB(即跨领域科学与技术中心)-4、Engineering(即工程)、EngineeringG(即工程G)、Goldwater(为Barry Goldwater名字命名，直译为戈德华特)、Interdisciplinary AB(即跨学科AB)、Bio Design Institute A(即生物设计院A)、BioDesign Institute B(即生物设计院B)、Phys Sci F(即物理科学F)。每栋建筑物的数据集包含2018年1月1日至2019年1月31日的每日负荷数据，采样频率为1h。在验证过程中将数据集分为两部分，2018年1月1日至2018年1月31日的数据用于训练和重构数据，2019年1月1日至2019年1月31日用于预测。对于时间序列预测而言，优质的数据集是得出理想结果的基础。异常值会在一定程度上影响模型的性能，因此本发明的方案采用平均值修正法来处理异常值，来确保数据集的优质性。

在实验设置(即Experimental setting)方面，为了验证上述日前负荷集合预测模型的性能，将上述日前负荷集合预测模型分为数据重构和负荷预测两个阶段分别进行验证。为了方便表示，将这十栋建筑物依次标号为B1、B2、B3、B4、B5、B6、B7、B8、B9和B10。本发明的方案中，随机选择三栋建筑物作为目标域，其余数据集作为源域。

在数据重建(即Data reconstruction)中，为了评估所提出的重构方法，为目标域中每个建筑实施了四个数据构建方式：

M0：不进行数据重构，使用目标建筑物原始的12个月的负荷数据。

M1：不进行数据重构，使用目标建筑的12月份的负荷数据。

M2：不进行数据分解，重新构建目标建筑前11个月的负荷数据。

M3：采用数据分解的方法，分别重构目标建筑物前11个月的负荷数据。

对于M2和M3，本发明的方案中将目标建筑的前11个月的数据剔除，使用源域建筑中的负荷数据重新构建前11个月的数据，训练数据为前11月份的重构数据加上12月份的原始数据。理论上，M3的表现结果应优于M1和M2并且与M0持平，并且预计M2表现可能不佳，这是因为M2没有进行数据分解直接进行数据重构，这样会增加负迁移的发生率。

在负荷预测(即Load forecasting)方面，为了验证所提出重构方法的有效性，所有数据构建方式均采用同一模型进行训练。为了进一步提升预测精度，本发明的方案采用相似日和神经网络的集成预测模型作为本发明的方案的预测方法。

对于神经网络模型，模型超参的选择对模型的性能会产生很大的影响，本发明的方案采用网格搜索法对LSTM模型的超参进行寻优，最终采用3层的LSTM模块，隐藏层单元数目分别为96、64、32个。对于相似日模型，相似日天数m是唯一可变参数。图8为建筑B9的预测误差示意图。为获取最优参数，分别计算不同相似日参数m时负荷预测误差的评价指标，以建筑B9为例，预测误差如图8所示(即Evaluation indexes with different similar dayparameter)。

由图8可知，随着相似日参数m的增大，预测误差先减小后增大，说明相似日的天数并不是越多越好，只有相似度高的相似日能有效提高预测精度，若相似日天数过多，可能会引入相似度较低的相似日造成更大误差。因此，选取相似日参数m＝6时，MAE和MAPE误差都是最小值，说明此时相似日的历史负荷与待预测日的负荷最接近。

在绩效评估(即Performance evaluation)方面，鉴于所构建的负荷预测模型分为数据重构和负荷预测两部分，因此需要对两部分分别进行评估。在数据重构部分，为了直观的看出重构值与原值的偏差，本发明的方案采用MAE评估数据重构结果。在负荷预测部分，使用RMSE和MAPE来评估模型的预测结果。公式如下：

其中，y_i表示真实值，

表示重构值，y′_i表示预测值。平均绝对误差(MeanAbsolute Error，MAE)，衡量的是真实值与预测值的偏离的绝对大小情况；平均绝对百分比误差图(mean absolute Percentage error，MAPE)，衡量的是偏离的相对大小(即百分率)。

在数据分析(即Data analysis)方面，对于时间序列的多元迁移而言，需要选择合适的迁移对象进行重构，阈值的选择至关重要。若阈值过小，有可能会选取与目标建筑关联度较低的建筑作为迁移对象，导致负迁移。若阈值过大，则可能会漏选可供学习特征，重构结果达不到最优，影响预测模型的准确度。

本发明的方案采用皮尔逊相关系数作为阈值的衡量标准。图9不同建筑负荷数据分解后的趋势序列和残差序列相关性热力分布示意图，其中，(a)为相关趋势示意图(即Correlation trend)，(b)为相关残差示意图(即Correlation residual)。对于12月份而言，不同建筑负荷数据分解后的趋势序列和残差序列相关性热力图如图9所示(即Correlation thermodynamic diagram of trend series and residual series)。

图10为不同阈值下趋势序列的选定源域建筑表(即Selected source domainbuildings of trend series under different thresholds表)，图11为不同阈值下剩余序列的选定源域建筑物表(即Selected source domain buildings of residual seriesunder different thresholds表)，阈值(threshold)可以取不同的值。本发明的方案随机的选择了B1、B2和B9作为目标建筑，图10所示的表1和图11所示的表2列出了当选取不同阈值时被选中的源域建筑。由表可知，阈值越低，所选源域建筑越多，产生负迁移的可能性就越大，所以本发明的方案选择的最低阈值为0.6。

在数据重建结果评估(即Evaluation of data reconstruction results)方面，在进行数据重构时，选择不同的阈值会有不同的重构结果，就会有不同的预测结果。为避免实验结果的偶然性，我们将不同阈值条件下的趋势序列和残差序列的所有组合都进行了重构和预测。图12为建筑物B1、B2和B9在不同阈值条件下的重构MAE表(即Datareconstruction error of three buildings表)。图12所示的表3展示了建筑物B1、B2和B9在不同阈值条件下的重构MAE。其中，第一列表示残差序列的阈值，第二行表示趋势序列的阈值。根据表3中的结果，为使重构误差最小，建筑物B1的阈值选取0.8、0.6，建筑物B2的阈值选取0.7、0.6，建筑物B9的阈值选取0.7、0.6，是较为合适的。

在负荷预测结果评估(即Evaluation of load forecasting results)方面，图13为三栋建筑物在四种方法下的每周预测误差表。图13所示的表4展示了2019年1月份三栋建筑物在四种方法下的每周预测误差。根据迁移学习的定义，只要M3的实验结果优于或仅次于M0的实验结果，就可以认为所提出的方法是理想的、有意义的。从表中可以看出，除了建筑物B9的第三周预测结果，其余的预测结果均在理想范围之内，负迁移的发生率仅为8.3％。对于M2，虽然应用了迁移学习的方法，但是没有进行数据分解，所以表现效果均差于M0。

图14为各个建筑物的总体误差示意图(即Comparison of predictive accuracyof different models)，其中，(a)为平均绝对误差图(Mean Absolute Error，MAE)，衡量的是真实值与预测值的偏离的绝对大小情况，(b)为平均绝对百分比误差图(mean absolutePercentage error，MAPE)，衡量的是偏离的相对大小(即百分率)。图15为各个建筑物的拟合曲线示意图(即Prediction results of different models)，其中，(a)为建筑物B1的拟合曲线示意图，(b)为建筑物B2的拟合曲线示意图，(c)为建筑物B9的拟合曲线示意图，其中，Power Consumption(负荷消耗，千瓦)；time steps(时间步)；Actual data(真实值)。图14和图15展示了各个建筑物在2019年1月份的总体误差和拟合曲线。从图14可以看出，M0方法下建筑物B1和B2的MAE和MAPE均为最优，建筑物B9的MAE和MAPE均为次优，充分体现了本发明的方案所提方法的优越性。

可见，本发明的方案提出一种基于多元分解迁移和集成学习的综合能源系统负荷预测方法。为了对数据贫乏的建筑物进行准确的负荷预测，将同一综合能源系统中的其他相似建筑物负荷数据迁移到目标建筑物，这种基于样本的迁移学习方法可以适用于大多数机器学习算法，并且有效避免了负迁移。对于神经网络对节假日负荷数据不敏感的问题，本发明的方案将相似日预测模型与神经网络预测模型相结合，提出了集成预测模型，很大程度上改善了节假日预测精度低的问题。

采用本实施例的技术方案，通过将同一综合能源系统中负荷相似度较高的多个建筑物作为源域建筑，将源域建筑的历史负荷数据分解加权转移到目标建筑以得到目标建筑数据集。基于目标建筑数据集分别构建相似日预测模型与神经网络预测模型，并将构建得到的相似日预测模型与神经网络预测模型集成，得到集成预测模型，以利用集成预测模型对同一综合能源系统进行日前电力负荷预测，从而，通过采用基于多元分解迁移和集成学习的综合能源系统负荷预测方式，将同一综合能源系统中的其他相似建筑物负荷数据迁移到目标建筑物，并将相似日预测模型与神经网络预测模型相结合提出了集成预测模型，能够避免负迁移，有利于提升日前负荷预测模型建立的准确性。

根据本发明的实施例，还提供了对应于日前电力负荷预测的方法的一种日前电力负荷预测的装置。参见图5所示本发明的装置的一实施例的结构示意图。该日前电力负荷预测的装置可以包括：获取单元102和控制单元104。

其中，获取单元102，被配置为针对待进入日前电力负荷预测的源域建筑，获取所述源域建筑的历史负荷数据。其中，源域建筑，是待进入日前电力负荷预测的建筑物集中负荷相似度较高的多个建筑物。该获取单元102的具体功能及处理参见步骤S110。

控制单元104，被配置为将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据。该控制单元104的具体功能及处理参见步骤S120。

在一些实施方式中，所述控制单元104，将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据，包括：

所述控制单元104，具体还被配置为以所述源域建筑的历史负荷数为源域，以所述目标建筑的历史数据为目标域，采用移动平均分解法将所述源域中的每个数据集划分为趋势、季节和残差三类，得到源域分类数据集。采用移动平均分解法将所述目标域中的每个数据集划分为趋势、季节和残差三类，得到目标域分类数据集。该控制单元104的具体功能及处理还参见步骤S210。

所述控制单元104，具体还被配置为采用皮尔逊相关系数量化所述源域分类数据集和所述目标域分类数据集之间的线性相关性，得到线性相关性量化结果。在所述源域分类数据集中的每类数据集中选择所述线性相关性量化结果在相似度阈值以上的相应数据，形成迁移数据集。该控制单元104的具体功能及处理还参见步骤S220。

所述控制单元104，具体还被配置为基于所述迁移数据集，采用多元线性回归方式重构所述目标域的历史数据，以实现将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，得到更新后的所述目标建筑的历史数据。该控制单元104的具体功能及处理还参见步骤S230。

由于能源需求和人们工作习惯息息相关，所以负荷趋势存在着明显的工作日负荷需求高、节假日负荷需求低的周期特性。对于不同建筑，虽然它们的负荷序列趋势和形状相似，但数据分布有所差异，直接选择源域中与目标域总体相似性最高的数据集进行迁移通常会导致负迁移的发生。为解决这个问题，本发明的方案提出一种基于数据分解和相关性分析的源域建筑选择装置，在本发明的方案中，采用移动平均分解法将源域和目标域中的每个数据集划分为趋势、季节和残差三类。之后采用皮尔逊相关系数来量化两个数据集之间的线性相关性，在源域中分别选择相似度阈值之上的数据作为迁移数据集。最后采用多元线性回归(即Multiple linear regression)重新构建目标域的历史数据。图6为基于分解的迁移学习模型的结构示意图，图6展示了本发明的方案中基于分解的迁移学习结构(即Overview of transfer learning method)。如图6所示，源域(即Source domain)、以及目标域(即目标域)，经数据预处理(即Data preprocessing)后，得到预处理结果。预处理结果，经时间序列分解(即Time series decomposition)得到多个来源如来源1(即Source1)、来源2(即Source 2)至来源n(即Source n)等，n为正整数。多个来源、以及预处理结果，经时间序列适应和迁移(即Time series adaptation and transfer)后，得到目标域重建数据集(即Target domain reconstruction dataset)。其中，在时间序列适应和迁移中，包含了：趋势成分(即Trend component)、季节性成分(即Seasonal component)、不规则成分(即Irregular component)。

多元线性回归是一种经典的数学统计模型，通常应用于时间序列预测当中，即使用多元线性方程来表示历史值与待预测值之间的关系。本发明的方案使用多元线性回归建立目标域与选中的源域数据集之间的线性关系，其表达式如下：

所述控制单元104，还被配置为基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型。该控制单元104的具体功能及处理还参见步骤S130。

在一些实施方式中，所述控制单元104，基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型，包括：

所述控制单元104，具体还被配置为将更新后的所述目标建筑的历史数据中待预测日前一天的负荷、以及待预测日当天的负荷作为第一训练样本。该控制单元104的具体功能及处理还参见步骤S310。

所述控制单元104，具体还被配置为将第一训练样本中待预测日前一天的负荷作为长短时记忆网络模型的输入量，并将第一训练样本中待预测日当天的负荷作为所述长短时记忆网络模型的输出量，以此训练，得到基于神经网络的负荷预测模型，记为第一负荷预测模型。该控制单元104的具体功能及处理还参见步骤S320。

f_t＝σ(W_f·[h_t-1,x_t]+b_f)

i_t＝σ(W_i·[h_t-1,x_t]+b_i)

o_t＝σ(W_o·[h_t-1,x_t]+b_o)

h_t＝o_t*tanh(C_t) (3)。

其中，W_f、W_i、W_o、W_c为权重矩阵，b_f、b_i、b_o、b_c为对应偏置，σ为ReLU激活函数，tanh为双曲正切函数。

所述控制单元104，还被配置为基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型。该控制单元104的具体功能及处理还参见步骤S140。

在一些实施方式中，所述控制单元104，基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型，包括：

所述控制单元104，具体还被配置为对更新后的所述目标建筑的历史数据进行相似性分析，得到更新后的所述目标建筑的历史数据中日期负荷相同、且负荷曲线的相近程度达到设定程度的历史日的历史数据作为第二训练样本。该控制单元104的具体功能及处理还参见步骤S410。

所述控制单元104，具体还被配置为从所述第二训练样本中按设定顺序排列的n个相似日的第二日负荷中筛选出与待预测日日期类型相同、且相似度最大的前m个日子作为相似日的负荷值。该控制单元104的具体功能及处理还参见步骤S420。

所述控制单元104，具体还被配置为计算所述相似日的负荷值的加权平均值来预测待预测日的负荷值，以此训练，得到基于相似日的负荷预测模型，记为第二负荷预测模型；其中，计算所述相似日的负荷值的加权平均值所用的权重，为日期类型相同的第i个历史日的负荷向量与该日的欧氏距离的倒数，i为正整数。该控制单元104的具体功能及处理还参见步骤S430。

步骤1、相似性分析：

步骤2、计算待预测日负荷量：

从降序排列的n个相似日的第二日负荷

中进一步筛选出与待预测日日期类型相同且相似度最大的前m个日子作为相似日的负荷值，计算加权平均值来预测目标日的负荷量。权重按距离的倒数计算，如式(5)所示。使用(6)计算待预测日的负荷量：

所述控制单元104，还被配置为将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型。该控制单元104的具体功能及处理还参见步骤S150。

在一些实施方式中，所述控制单元104，将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型，包括：所述控制单元104，具体还被配置为按设定的非负权重系数，利用线性回归分析法，将所述第一负荷预测模型与所述第二负荷预测模型进行加权结合，实现对所述第一负荷预测模型与所述第二负荷预测模型的集成，得到集成负荷预测模型。

假设两种模型的预测结果序列为：Y₁＝[y₁₁,y₁₂,…,y_1n]和Y₂＝[y₂₁,y₂₂,...,y_2n]，集成模型的预测结果表示为：

Y＝αY₁+βY₂ (7)。

将两个非负权重α和β分别分配给LSTM模型(即基于神经网络的负荷预测模型)和相似日模型(即基于相似日的负荷预测模型)。通常，非负权重满足α+β＝1，此处通过线性回归确定最优权重值。

所述控制单元104，还被配置为利用所述集成负荷预测模型，对待进入日前电力负荷预测的源域建筑进行日前电力负荷预测，以实现对待进入日前电力负荷预测的源域建筑的日前电力负荷预测。该控制单元104的具体功能及处理还参见步骤S160。

在本发明的方案提出的一种将迁移学习和集成学习结合的日前电力负荷预测模型的建立装置中，首先，提出了一种基于数据分解的多元迁移装置，通过将源域建筑的历史负荷数据分解加权转移到目标建筑，丰富目标建筑数据集以提高预测精度，实现将负荷相似度较高的多个建筑物进行数据迁移以丰富目标建筑的历史数据，避免了负迁移。从而，在本发明的方案中，使用迁移学习来提高目标建筑在历史数据稀缺的情况下日前短期负荷预测的精度。其次，提出了相似日和神经网络集成的预测模型以应对不同日期类型对预测精度产生的影响，具体是集成了相似日预测模型与神经网络预测模型，解决了节假日预测结果精度较低的问题。最后，通过仿真实验对提出的模型进行了验证，例如：对IES中三个目标建筑的日前短期负荷预测进行了评估，所提出的模型在各个目标建筑上都展现了理想的预测精度。实验结果表明，本发明的方案提出的数据重构装置和预测模型取得了理想的重构误差和预测精度。

为了验证本发明的方案所提出的装置，进行了综合能源系统中多栋建筑的负荷预测的案例研究。与仅使用目标建筑物一个月的数据进行预测相比，使用了多元分解迁移装置的数据的预测准确率均得到了较大提升。即使目标建筑使用十二个月的数据进行预测，此装置也的预测精度与其持平甚至更优。在未来的研究探索中，将使用更优秀的阈值选择装置以提高工作效率。

在实验数据集(即Experimental datasets)方面，本发明的方案所选数据集来自亚利桑那州立大学坦佩校区的综合能源系统，包含十栋具有研究性质的建筑物的电力负荷数据。这十栋建筑物分别为：Phys Sci A_B_C(即物理科学A_B_C)、Lifescience A_B_D(即生命科学A_B_D)、ISTB-4、Engineering(即工程)、Engineering G(即工程G)、Goldwater、Interdisciplinary AB(即跨学科AB)、Bio Design Institute A(即生物设计院A)、BioDesign Institute B(即生物设计院B)、Phys Sci F(即物理科学F)。每栋建筑物的数据集包含2018年1月1日至2019年1月31日的每日负荷数据，采样频率为1h。在验证过程中将数据集分为两部分，2018年1月1日至2018年1月31日的数据用于训练和重构数据，2019年1月1日至2019年1月31日用于预测。对于时间序列预测而言，优质的数据集是得出理想结果的基础。异常值会在一定程度上影响模型的性能，因此本发明的方案采用平均值修正法来处理异常值，来确保数据集的优质性。

在数据重建(即Data reconstruction)中，为了评估所提出的重构装置，为目标域中每个建筑实施了四个数据构建方式：

M1：不进行数据重构，使用目标建筑的12月份的负荷数据。

M3：采用数据分解的装置，分别重构目标建筑物前11个月的负荷数据。

在负荷预测(即Load forecasting)方面，为了验证所提出重构装置的有效性，所有数据构建方式均采用同一模型进行训练。为了进一步提升预测精度，本发明的方案采用相似日和神经网络的集成预测模型作为本发明的方案的预测装置。

其中，y_i表示真实值，

表示重构值，y′_i表示预测值。

在负荷预测结果评估(即Evaluation of load forecasting results)方面，图13为三栋建筑物在四种装置下的每周预测误差表。图13所示的表4展示了2019年1月份三栋建筑物在四种装置下的每周预测误差。根据迁移学习的定义，只要M3的实验结果优于或仅次于M0的实验结果，就可以认为所提出的装置是理想的、有意义的。从表中可以看出，除了建筑物B9的第三周预测结果，其余的预测结果均在理想范围之内，负迁移的发生率仅为8.3％。对于M2，虽然应用了迁移学习的装置，但是没有进行数据分解，所以表现效果均差于M0。

图14为各个建筑物的总体误差示意图(即Comparison of predictive accuracyof different models)，其中，(a)为平均绝对误差图(Mean Absolute Error，MAE)，衡量的是真实值与预测值的偏离的绝对大小情况，(b)为平均绝对百分比误差图(mean absolutePercentage error，MAPE)，衡量的是偏离的相对大小(即百分率)。图15为各个建筑物的拟合曲线示意图(即Prediction results of different models)，其中，(a)为建筑物B1的拟合曲线示意图，(b)为建筑物B2的拟合曲线示意图，(c)为建筑物B9的拟合曲线示意图。图14和图15展示了各个建筑物在2019年1月份的总体误差和拟合曲线。从图14可以看出，M0装置下建筑物B1和B2的MAE和MAPE均为最优，建筑物B9的MAE和MAPE均为次优，充分体现了本发明的方案所提装置的优越性。

可见，本发明的方案提出一种基于多元分解迁移和集成学习的综合能源系统负荷预测装置。为了对数据贫乏的建筑物进行准确的负荷预测，将同一综合能源系统中的其他相似建筑物负荷数据迁移到目标建筑物，这种基于样本的迁移学习装置可以适用于大多数机器学习算法，并且有效避免了负迁移。对于神经网络对节假日负荷数据不敏感的问题，本发明的方案将相似日预测模型与神经网络预测模型相结合，提出了集成预测模型，很大程度上改善了节假日预测精度低的问题。

由于本实施例的装置所实现的处理及功能基本相应于前述方法的实施例、原理和实例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。

采用本发明的技术方案，通过将同一综合能源系统中负荷相似度较高的多个建筑物作为源域建筑，将源域建筑的历史负荷数据分解加权转移到目标建筑以得到目标建筑数据集；基于目标建筑数据集分别构建相似日预测模型与神经网络预测模型，并将构建得到的相似日预测模型与神经网络预测模型集成，得到集成预测模型，以利用集成预测模型对同一综合能源系统进行日前电力负荷预测，很大程度上改善了节假日预测精度低的问题，提高了预测精度。

根据本发明的实施例，还提供了对应于日前电力负荷预测的装置的一种终端。该终端可以包括：以上所述的日前电力负荷预测的装置。

由于本实施例的终端所实现的处理及功能基本相应于前述装置的实施例、原理和实例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。

采用本发明的技术方案，通过将同一综合能源系统中负荷相似度较高的多个建筑物作为源域建筑，将源域建筑的历史负荷数据分解加权转移到目标建筑以得到目标建筑数据集；基于目标建筑数据集分别构建相似日预测模型与神经网络预测模型，并将构建得到的相似日预测模型与神经网络预测模型集成，得到集成预测模型，以利用集成预测模型对同一综合能源系统进行日前电力负荷预测，避免了负迁移，且能提高预测精度。

根据本发明的实施例，还提供了对应于日前电力负荷预测的方法的一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行以上所述的日前电力负荷预测的方法。

由于本实施例的存储介质所实现的处理及功能基本相应于前述方法的实施例、原理和实例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。

采用本发明的技术方案，通过将同一综合能源系统中负荷相似度较高的多个建筑物作为源域建筑，将源域建筑的历史负荷数据分解加权转移到目标建筑以得到目标建筑数据集；基于目标建筑数据集分别构建相似日预测模型与神经网络预测模型，并将构建得到的相似日预测模型与神经网络预测模型集成，得到集成预测模型，以利用集成预测模型对同一综合能源系统进行日前电力负荷预测，在各个目标建筑上都展现了理想的预测精度。

综上，本领域技术人员容易理解的是，在不冲突的前提下，上述各有利方式可以自由地组合、叠加。

以上所述仅为本发明的实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

Claims

1.一种日前电力负荷预测的方法，其特征在于，包括：

针对待进入日前电力负荷预测的源域建筑，获取所述源域建筑的历史负荷数据；

将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据；

基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型；

基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型；

将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型；

利用所述集成负荷预测模型，对待进入日前电力负荷预测的源域建筑进行日前电力负荷预测。

2.根据权利要求1所述的日前电力负荷预测的方法，其特征在于，将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据，包括：

以所述源域建筑的历史负荷数为源域，以所述目标建筑的历史数据为目标域，采用移动平均分解法将所述源域中的每个数据集划分为趋势、季节和残差三类，得到源域分类数据集；采用移动平均分解法将所述目标域中的每个数据集划分为趋势、季节和残差三类，得到目标域分类数据集；

采用皮尔逊相关系数量化所述源域分类数据集和所述目标域分类数据集之间的线性相关性，得到线性相关性量化结果；在所述源域分类数据集中的每类数据集中选择所述线性相关性量化结果在相似度阈值以上的相应数据，形成迁移数据集；

基于所述迁移数据集，采用多元线性回归方式重构所述目标域的历史数据，以实现将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，得到更新后的所述目标建筑的历史数据。

3.根据权利要求1所述的日前电力负荷预测的方法，其特征在于，其中，

基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型，包括：

将更新后的所述目标建筑的历史数据中待预测日前一天的负荷、以及待预测日当天的负荷作为第一训练样本；

将第一训练样本中待预测日前一天的负荷作为长短时记忆网络模型的输入量，并将第一训练样本中待预测日当天的负荷作为所述长短时记忆网络模型的输出量，以此训练，得到基于神经网络的负荷预测模型，记为第一负荷预测模型；

和/或，

基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型，包括：

对更新后的所述目标建筑的历史数据进行相似性分析，得到更新后的所述目标建筑的历史数据中日期负荷相同、且负荷曲线的相近程度达到设定程度的历史日的历史数据作为第二训练样本；

从所述第二训练样本中按设定顺序排列的n个相似日的第二日负荷中筛选出与待预测日日期类型相同、且相似度最大的前m个日子作为相似日的负荷值；

计算所述相似日的负荷值的加权平均值来预测待预测日的负荷值，以此训练，得到基于相似日的负荷预测模型，记为第二负荷预测模型；其中，计算所述相似日的负荷值的加权平均值所用的权重，为日期类型相同的第i个历史日的负荷向量与该日的欧氏距离的倒数，i为正整数。

4.根据权利要求1至3中任一项所述的日前电力负荷预测的方法，其特征在于，将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型，包括：

按设定的非负权重系数，利用线性回归分析法，将所述第一负荷预测模型与所述第二负荷预测模型进行加权结合，实现对所述第一负荷预测模型与所述第二负荷预测模型的集成，得到集成负荷预测模型。

5.一种日前电力负荷预测的装置，其特征在于，包括：

获取单元，被配置为针对待进入日前电力负荷预测的源域建筑，获取所述源域建筑的历史负荷数据；

控制单元，被配置为将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据；

所述控制单元，还被配置为基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型；

所述控制单元，还被配置为基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型；

所述控制单元，还被配置为将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型；

所述控制单元，还被配置为利用所述集成负荷预测模型，对待进入日前电力负荷预测的源域建筑进行日前电力负荷预测。

6.根据权利要求5所述的日前电力负荷预测的装置，其特征在于，所述控制单元，将所述源域建筑的历史负荷数据迁移至目标建筑的历史数据中，以实现对所述目标建筑的历史数据的更新，得到更新后的所述目标建筑的历史数据，包括：

7.根据权利要求5所述的日前电力负荷预测的装置，其特征在于，其中，

所述控制单元，基于更新后的所述目标建筑的历史数据，训练得到基于神经网络的负荷预测模型，记为第一负荷预测模型，包括：

和/或，

所述控制单元，基于更新后的所述目标建筑的历史数据，训练得到基于相似日的负荷预测模型，记为第二负荷预测模型，包括：

8.根据权利要求5至7中任一项所述的日前电力负荷预测的装置，其特征在于，所述控制单元，将所述第一负荷预测模型与所述第二负荷预测模型进行集成，得到集成负荷预测模型，包括：

9.一种终端，其特征在于，包括：如权利要求5至8中任一项所述的日前电力负荷预测的装置。

10.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至4中任一项所述的日前电力负荷预测的方法。