WO2020098728A1

WO2020098728A1 - 集群负荷预测方法、装置及存储介质

Info

Publication number: WO2020098728A1
Application number: PCT/CN2019/118309
Authority: WO
Inventors: 黎昱; 汪建; 汤奕; 崔晗
Original assignee: 中兴通讯股份有限公司
Priority date: 2018-11-14
Filing date: 2019-11-14
Publication date: 2020-05-22
Also published as: CN111191811A

Abstract

一种集群负荷预测方法、装置及存储介质，其方法包括：获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据（S101）；通过机器学习算法学习拟合个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型（S102）；获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值（S103）；其中，还可以结合个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测。

Description

集群负荷预测方法、装置及存储介质

本公开要求享有2018年11月14日提交的名称为“集群负荷预测方法、装置及存储介质”的中国专利申请CN201811350529.0的优先权，其全部内容通过引用并入本文中。

技术领域

本公开涉及电力技术领域，尤其涉及一种基于分布式用电数据与外部信息的集群负荷预测方法、装置及存储介质。

背景技术

电力系统负荷预测对于电力系统运行调度以及发电计划安排是非常重要的内容，它既是保证电力系统安全经济运行和实现电网科学管理及调度的重要方面，又是能量管理系统的组成部分，也是今后进行电网商业化运营所必需的内容。传统研究是从总体负荷及外部数据去进行分析预测，但存在预测粗略忽略细节的问题，影响集群负荷预测的精细化程度。

发明内容

本公开的主要目的在于提供一种集群负荷预测方法、装置及存储介质，旨在提高集群负荷预测的精细化程度及预测效果。

为实现上述目的，本公开提供的一种集群负荷预测方法，包括：获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；通过机器学习算法学习拟合所述个体的历史用电数据与所述同一时期的外部数据，形成个体的用电负荷预测模型；获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

此外，本公开实施例还提出一种集群负荷预测装置，包括：数据获取模块，用于获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；负荷预测模型创建模块，用于通过机器学习算法学习拟合所述个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型；预测模块，用于获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

本公开实施例还提出一种集群负荷预测装置，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的集群负荷预测方法的步骤。

本公开实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的集群负荷预测方法的步骤。

附图说明

图1是本公开集群负荷预测方法第一实施例的流程示意图；

图2是本公开集群负荷预测方法第二实施例的流程示意图；

图3是本公开集群负荷预测方法第三实施例的流程示意图；

图4是本公开实施例涉及的集群负荷预测原理框图；

图5是本公开实施例涉及的集群负荷预测流程示意图；

图6是本公开实施例集群负荷预测方法的居民用户负荷预测与实际测量对比示意图；

图7是本公开实施例集群负荷预测方法的在测试数据中预测精度与其他方法的对比示意图；

图8是本公开实例1中涉及的人工神经网络结构示意图；

图9是采用图8所示的人工神经网络进行测试的测试结果示意图；

图10是本公开实例1中集群用户负荷误差修正时将预测结果累加后与真实集群负荷用电量进行对比示意图；

图11是图10中经过误差修正后的数据结果示意图；

图12是本公开实例2中个体负荷预测算法训练中数据回归预测效果示意图；

图13是本公开实例2中集群用户负荷误差修正测试结果示意图；

图14是本公开实例3中个体负荷预测结果示意图；

图15是本公开实例3中集群用户负荷误差修正测试结果示意图；

图16是本公开实例4中集群用户负荷误差修正测试结果示意图；

图17是本公开实施例方案涉及的装置结构示意图。

本公开目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

为了使本公开的技术方案更加清楚、明了，下面将结合附图作进一步详述。

具体实施方式

应当理解，此处所描述的实施例仅仅用以解释本公开，并不用于限定本公开。

本公开实施例的主要解决方案是：通过获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；通过机器学习算法学习拟合个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型；结合个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测，充分利用电力系统中的精细化量测数据，且通过机器学习算法挖掘个体与集群负荷间的数据误差，结合个体用电数据与气象和节假日等外部信息，综合考虑负荷变化趋势，提高集群负荷预测的精细化程度及预测效果，实现对异常用户的快速准确判别，为电力调度和发电计划安排等电力业务提供数据支撑。

由于一些情况中，是从总体负荷及外部数据去进行分析预测，但存在预测粗略忽略细节的问题，影响集群负荷预测的精细化程度。

本公开提供一种解决方案，可以提高集群负荷预测的精细化程度及预测效果。主要利用智能电表采集的用户用电信息以及气象和节假日等外部信息，综合考虑负荷变化趋势。涉及数据分析相关技术，包括关联性分析、数值关系拟合和误差分析等。采用各类人工智能算法进行数据分析成为高效的技术手段，常用的算法包括神经网络、支持向量机、极限学习机和决策树等，将集群负荷预测这个大任务分解成对于大量个体的负荷预测子任务，充分利用电力系统中的精细化量测数据，进而通过对个体数据的微观研究分析为宏观负荷预测提供帮助，将更多的量测数据考虑进负荷预测中，提高集群负荷的预测精细化程度及预测效果，实现对异常用户的快速准确判别。

在一个实施例中，如图1所示，本公开第一实施例提出一种集群负荷预测方法，包括：

步骤S101，获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；

本实施例方案涉及对电力系统中集群负荷进行预测，基于分布式用电数据与外部数据，结合机器学习算法对个体进行微观负荷预测，并分析个体负荷预测结果与集群的总体负荷数据关系得出集群负荷预测结果，实现对异常用户的快速准确判别。

在一个实施例中，首先，获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据。

其中，待预测集群对应的样本集群可以是某个地区所有个体的集群，待预测集群对应的样本集群中的每个个体的用电量数据为分布式用电数据，可以根据预测需要统计某一时段的历史用电数据，用来作为对未来某一时段待预测集群用电负荷预测的依据。

此处所提分布式用电数据泛指用电整体中的个体用电数据，包括不限于居民用户之于小区，商业区之于城市，省级行政单位之于全国。因此，所提预测方法的应用范围覆盖此类存在从属关系的用电个体与整体，通过个体用电负荷预测整体(集群)用电负荷。

因此，首先要获取与每个个体的历史用电数据同一时期的个体所属集群的历史总负荷，作为所述待预测集群对应的样本集群总体负荷。

然后，从样本集群总体负荷中获取每个个体的历史用电数据以及同一时期的外部数据。

比如：样本集群是某地区6月至7月某区域873户，样本集群总体负荷为某地区6月至7月某区域873户的总用电负荷，每个个体的历史用电数据是某地区6月至7月某区域873户中各个用户的历史用电数据。

待预测集群是某地区8月某区域873户，预测待预测集群的总体负荷是指基于样本集群(某地区6月至7月某区域873户)的实际数据预测某地区8月某区域873户的总用电负荷。

其中，选择待预测集群对应的样本集群的规则，可以根据实际情况设定，比如可以选择与待预测集群相隔预设时间段(比如1个月、10个月等)的集群作为样本集群，比如，待预测集群是2013～2018年期间的集群用户，样本集群是2003～2012年期间的集群用户。

此外，考虑用户用电量与气象、经济及其他社会因素的强相关性，需要考虑利用外部数据进行负荷预测，其中，外部数据可以包括：气象数据、经济数据、社会信息，比如包括气象数据、节假日信息、公共交通流量情况和/或地区生产总值中的一种或多种，根据不同的用电场景进行选择。

此处气象信息包括但不限于温度、湿度、光照和风速等，经济数据包括但不限于金融指数、宏观财经指数等，社会信息包括但不限于是否周末、是否法定假日和是否有重大社会活动等。

为了确保用电数据和外部数据的正确映射关系，需要将两者形成一一映射的数据结构。

比如，待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据可以是以下几种情况：

第一种用电场景：

分布式用电数据为某地区6月至8月某区域873户的用电负荷，外部数据为气象数据(1小时间隔采集)和节假日信息。集群负荷预测问题(预测目标)为根据6、7月份实际数据(待预测集群对应的样本集群的实际数据)，训练预测模型对8月份每天的873户形成的集群负荷(待预测集群总体负荷)日用电量进行预测。

第二种用电场景：

分布式用电数据为全国部分省市自治区(6个)的2004～2015年度电力消费量，外部数据为2004～2015年的地区生产总值。集群负荷预测问题(预测目标)为基于2004～2012年的分布式用电数据(样本集群的实际数据)和2004～2015年的外部数据，预测2013～2015年的全国年度电力消费量(待预测集群总体负荷)。

第三种用电场景：

分布式用电数据为某市各商业区用电负荷曲线，外部数据为各商业区覆盖范围内公共交通(公交、地铁、出租)流量情况(1小时精度)，各商业区所处位置气象信息(气温、雨量，1小时精度)。集群负荷预测问题(预测目标)为通过历史数据的训练，基于未来一天的外部数据预测全市商业区的用电负荷曲线。

步骤S102，通过机器学习算法学习拟合所述个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型；

在得到待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据后，通过统计表等方式形成个体的历史用电数据与外部数据(气象数据和节假日信息等)之间的映射关系，得到两者的数据关联关系。

通过机器学习算法对所述个体的历史用电数据与同一时期的外部数据的数据关联关系进行学习拟合，形成个体的用电负荷预测模型。

其中，机器学习算法可以采用人工神经网络或线性回归算法，得到的个体的用电负荷预测模型可以为神经网络模型或线性回归模型。

人工神经网络的结构可以包含三层神经元，分别是输入层、隐含层和输出层，该结构能够拟合各种复杂的数据关系。

步骤S103，获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

在一个实施例中，首先，获取待预测集群的外部数据，然后，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

其中，该待预测的集群总体负荷可以是相对样本集群的未来某一段时间内的待预测集群所有用电数据。

以上述第一种用电场景为例，比如当前统计的分布式用电数据为某地区6月至8月某区域873户的用电负荷，实际获取的是作为样本集群的某地区6月至7月某区域873户的历史用电负荷，外部数据为气象数据(1小时间隔采集)和节假日信息。待预测的集群总体负荷为8月份每天的873户形成的集群负荷日用电量。

在获取待预测集群的外部数据后，将待预测集群的外部数据输入至个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

以上述第一种用电场景为例，根据6、7月份实际数据(历史用电数据)，训练预测模型对8月份每天的873户形成的集群负荷日用电量(即待预测的集群总体负荷)进行预测，最终输出8月份每天的873户形成的集群负荷日用电量的预测值。

也就是说，6、7月用电数据和外部数据输入训练模型，建立用电量和外部数据之间的函数关系，生成个体的用电负荷预测模型，在预测8月份用电量时，只需要将8月份的外部数据输入个体的用电负荷预测模型即可。在实际使用中，比如需要预测明天的用电数据，则首先获取明天气象数据，将气象数据输入，则得到明天的用电数据。

再比如上述第二种用电场景，个体的历史用电数据为全国部分省市自治区(6个)的2004～2012年度电力消费量，同一时期外部数据为2004～2015年的地区生产总值(GDP)。可以基于2004～2012年的分布式用电数据和2004～2015年的外部数据，预测2013～2015年的全国年度电力消费量。

将2004-2012年用电数据和GDP输入训练模型，建立用电量和GDP之间的函数关系，在预测2013年时，只需要将2013年的GDP数据输入模型即可。实际使用中，如预测2019年用电量，则需要知道2019年的GDP，这个值可以由外部提供。

本实施例通过上述方案，通过获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；通过机器学习算法学习拟合个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型；获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值，实现对异常用户的快速准确判别，为电力调度和发电计划安排等电力业务提供数据支撑；此外还可以结合个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测。相比一些情况，本公开将集群负荷预测这个大任务分解成对于大量个体的负荷预测子任务，充分利用了电力系统中的精细化量测数据，从而通过对个体数据的微观研究分析为宏观负荷预测提供帮助，将更多的量测数据考虑进负荷预测中，利用精细化影响因素提高了集群负荷预测的精细化程度，而且通过机器学习算法构建个体的用电负荷预测模型，结合个体用电数据与气象和节假日等外部信息，综合考虑负荷变化趋势，提高了集群负荷的预测效果；此外，利用机器学习算法加快了负荷预测的速度，可以实现短期负荷预测的快速更新。

如图2所示，本公开第二实施例提出一种集群负荷预测方法，基于上述图1所示的实施例，在上述步骤S103，获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值之前还包括：

步骤S1031，创建个体的用电负荷与集群总体负荷间的误差修正模型；

上述步骤S103，通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值包括：

步骤S1032，获取待预测集群的外部数据，基于所述待预测集群的外部数据，并结合所述个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

由于个体用户的负荷预测存在误差且数据预处理过程中剔除了部分用户数据，因此需要建立各用户与集群负荷的映射关系。本实施例采用机器学习的方法，将多个用户的个体数据与集群负荷的关系进行拟合，创建个体的用电负荷与集群总体负荷间的误差修正模型。

其中，作为一种实施方式，创建个体的用电负荷与集群总体负荷间的误差修正模型可以采用如下方案：

获取与所述每个个体的历史用电数据同一时期的个体所属集群的历史总负荷，作为所述待预测集群对应的样本集群总体负荷；

基于所述个体的用电负荷预测模型对待预测集群对应的样本集群中个体的用电负荷进行预测，得到各个个体的用电负荷预测值；

累计各个个体的用电负荷预测值，得到个体的负荷预测累加值；

分析所述个体的负荷预测累加值与样本集群总体负荷的数据关联关系，进行误差拟合，形成个体的用电负荷与集群总体负荷间的误差修正模型。

其中，样本集群总体负荷为统计的待预测集群对应的样本集群的所有个体历史用电数据，相对个体的分布式用电数据，该样本集群总体负荷为集中式数据，参照图5所示。

其中，误差修正模型可以为线性回归模型或极限学习机模型。

在获得个体的用电负荷预测模型及误差修正模型后，结合所述个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

在一个实施例中，待预测的集群总体负荷可以是相对样本集群的未来某一段时间内的待预测集群所有用电数据。

以上述第一种用电场景为例，比如当前统计的分布式用电数据为某地区6月至8月某区域873户的用电负荷，实际获取的是作为样本集群的某地区6月至7月某区域873户的历史用电负荷，外部数据为气象数据(1小时间隔采集)和节假日信息。待预测的集群总体负荷为8月份每天的873户形成的集群负荷日用电量，根据6、7月份实际数据(历史用电数据)，训练预测模型及误差修正模型对8月份每天的873户形成的集群负荷日用电量(即待预测的集群总体负荷)进行预测。

本实施例通过上述方案，通过获取待预测集群中每个个体的历史用电数据以及同一时期的外部数据；通过机器学习算法对所述个体的历史用电数据与同一时期的外部数据的数据关联关系进行学习拟合，形成个体的用电负荷预测模型；创建个体的用电负荷与集群总体负荷间的误差修正模型；获取待预测集群的外部数据，基于所述待预测集群的外部数据，并结合个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测，输出集群负荷预测值，实现对异常用户的快速准确判别，为电力调度和发电计划安排等电力业务提供数据支撑。相比一些情况，本公开将集群负荷预测这个大任务分解成对于大量个体的负荷预测子任务，充分利用了电力系统中的精细化量测数据，从而通过对个体数据的微观研究分析为宏观负荷预测提供帮助，将更多的量测数据考虑进负荷预测中，利用精细化影响因素提高了集群负荷预测的精细化程度，而且通过机器学习算法挖掘个体与集群负荷间的数据误差，结合个体用电数据与气象和节假日等外部信息，综合考虑负荷变化趋势，提高了集群负荷的预测效果；此外，利用机器学习算法加快了负荷预测的速度，可以实现短期负荷预测的快速更新。

如图3所示，本公开第三实施例提出一种集群负荷预测方法，基于上述图2所示的实施例，该方法在上述步骤S101：获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据之后，还包括：

步骤S1011，对所述个体的历史用电数据以及同一时期的外部数据进行预处理；

上述步骤S102：通过机器学习算法学习拟合所述个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型包括：

步骤S1021，通过机器学习算法学习拟合预处理后的个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型。

其中，考虑到电力系统配电网中数据流量较大，存在部分用户的用电数据传输丢失或错误等情况，为了防止此类错误信息对于负荷预测的影响，故须通过数据预处理方法将原始数据进行剔除或重新加工。而言，包括校验异常值、检查数据格式和查询数据空缺等，最终确保用电数据的完整性、真实性和可用性。

因此，对所述个体的历史用电数据、外部数据进行预处理主要是对数据缺失、数据错误等异常情况进行处理，形成规范化的用电数据，为后续负荷预测提供精准数据，从而提高集群负荷预测的精细化程度和预测效果。

其中，预处理的方式可以是均值平滑处理、将用电数据和外部数据的时间尺度调整到同一水平、对一些外部数据的量化处理、对外部数据进行归一化，以消除绝对值大小的影响等等。

需要说明的是，根据需要可以选择对历史用电数据、外部数据其中之一进行预处理。

在一个实施例中，在获得待预测集群负荷预测值后，还可以将集群负荷预测值输出至电力业务平台，为所述电力业务平台提供数据支持；或者，基于集群负荷预测值进行异常用电行为检测。

本实施例通过上述方案，通过获取待预测集群中每个个体的历史用电数据以及同一时期的外部数据，对所述个体的历史用电数据以及同一时期的外部数据进行预处理；通过机器学习算法对所述个体的历史用电数据与同一时期的外部数据的数据关联关系进行学习拟合，形成个体的用电负荷预测模型；创建个体的用电负荷与集群总体负荷间的误差修正模型；获取待预测集群的外部数据，基于所述待预测集群的外部数据，并结合个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测，输出集群负荷预测值，实现对异常用户的快速准确判别，为电力调度和发电计划安排等电力业务提供数据支撑。相比一些情况，本公开将集群负荷预测这个大任务分解成对于大量个体的负荷预测子任务，充分利用了电力系统中的精细化量测数据，从而通过对个体数据的微观研究分析为宏观负荷预测提供帮助，将更多的量测数据考虑进负荷预测中，利用精细化影响因素提高了集群负荷预测的精细化程度，而且通过机器学习算法挖掘个体与集群负荷间的数据误差，结合个体用电数据与气象和节假日等外部信息，综合考虑负荷变化趋势，提高了集群负荷的预测效果；此外，利用机器学习算法加快了负荷预测的速度，可以实现短期负荷预测的快速更新。

本实施例涉及的集群负荷预测原理框图如图4所示。

本实施例涉及的集群负荷预测流程如图5所示。主要流程包括：

1、采集待预测集群对应的样本集群中每个个体的历史用电量数据，并对数据缺失，数据错误等异常情况进行处理，形成规范化的用电数据，存储至负荷数据库；

2、采集待预测集群对应的样本集群中个体用电数据同一时期的气象数据、经济数据以及节假日信息等外部数据，存储至外部信息数据库，并形成用电数据与外部数据的映射关系；

3、通过机器学习算法对个体的用电数据与外部数据的数据关联关系进行学习拟合，形成个体的用电负荷预测模型；

4、根据步骤3中个体的用电负荷预测模型，对各个用户分别进行负荷预测，得到个体的负荷预测累加值；分析个体的负荷预测累加值与集群负荷(集群负荷真实值)的数据关联关系，进行误差拟合，形成个体用电量与总体负荷间的误差修正模型。

5、结合步骤3和步骤4中形成的负荷预测模型与误差修正模型，对待预测的集群负荷数据进行预测，最终输出集群用户的负荷预测值，为电力调度和发电计划安排等电力业务提供数据支撑。

参照图6，图6是本公开实施例集群负荷预测方法的居民用户负荷预测与实际测量对比示意图。

参照图7，图7是本公开实施例集群负荷预测方法的在测试数据中预测精度与其他方法的对比示意图。

与一些情况相比，本公开实施例具有如下优点：

1、通过提高个体的负荷预测精度，将更多的量测数据考虑进负荷预测中，利用精细化影响因素提高对集群负荷的预测精度；

2、通过机器学习算法挖掘个体与集群负荷间的数据误差，提高了集群负荷的预测效果；

3、利用机器学习算法加快了负荷预测的速度，可以实现短期负荷预测的快速更新。

以下通过实例对本公开实施例方案进行详细阐述：

实例1

分布式用电数据为某地区6月至8月某区域873户的负荷(每5分钟采集间隔)，外部数据为气象数据(1小时采集间隔)和节假日信息，预测目标为根据6、7月份实际数据，训练预测模型对8月份每天的873户形成的集群负荷日用电量进行预测。

一、数据预处理

1)将单个用户的用电数据进行换算，求出每个用户每天的用电量；

2)将用电量异常值进行均值平滑处理，公式为：

上述公式中，异常值为第n天；L _n为第n天的用电量；m为均值平滑的取值天数范围，根据使用需求设为正整数即可；L _i为第i天的用电量。

3)将气象信息进行按日均值处理，形成每日气象数据，包括气温、湿度、雨量和气压。

二、个体负荷预测算法训练

根据步骤一中获取的数据，以用户242在6月4日的数据为例结构如下：

用户编号	用电量	气温	湿度	雨量	气压	是否节假日
242	4.31	24	68	0	1008.2	否

由于数据内容较多，不在此罗列。按照此格式整理的数据进行个体的负荷预测，本实施例采用人工神经网络构建个体负荷预测模型，人工神经网络结构如图8所示，其包含了三层神经元，分别是输入层、隐含层和输出层，该结构能够拟合各种复杂的数据关系，测试结果如图9所示，分别将训练、验证和测试的误差进行比较，预测误差主要集中于±5％左右。

三、集群用户负荷误差修正

根据步骤二中个体负荷预测方法，对各个用户分别进行负荷预测，共计873户。将预测结果累加后与真实集群负荷用电量进行对比，如图10所示，对15天的负荷进行了预测，误差约为8.3％。为了修正误差，采用多元线性回归模型对数据进行拟合构建误差修正模型，公式如下：

式中，L _total为真实集群负荷用电总量，k _i为回归系数，L _i为第i个用户的预测值，b为回归偏差系数。

经过误差修正后的数据结果如图11所示，相对误差降低至1.2％。

之后，即可根据上述负荷预测模型及误差修正模型对待预测集群负荷进行预测，输出集群负荷预测值。

相比一些情况，本公开实施例提高了集群负荷的预测精度。

实例2

分布式用电数据为全国部分省市自治区(6个)的2004～2015年度电力消费量，外部数据为2004～2015的地区生产总值，数据如下表1所示。负荷预测问题为基于2004～2012年的分布式用电数据和2004～2015年的外部数据，预测2013～2015年的全国年度电力消费量。

表1电力消费量与生产总值

一、数据预处理

本实施例数据来源正规，已经过处理，数据真实可靠，可用性高，故本实施例中无需进行预处理工作。

二、个体负荷预测算法训练

本实施例属于长时间周期的负荷预测，且数据样本较小，故通过线性回归分析各省级行政单位的年度电力消费量与地区生产总值的数据关系，构建负荷预测模型，回归公式如下：

L＝kM+b

式中，L为年度电力消费量，k为回归系数，b为回归偏差系数。数据回归预测效果如图12所示，M是地区生产总值，用电量和GDP间的相关关系大致为线性关系，且有一个常数项用于调整偏差。

三、集群用户负荷误差修正

由于本实施例中分布式数据只选取了集群数据间部分信息，因此，这是一个不完全分布式数据预测集群用电负荷的问题。单纯累加6个省级行政单位用电信息对于整体而言差异较大，因此需要进行关联性挖掘，本实施例采用极限学习机学习两者间的数据关系，构建误差修正模型，测试结果如图13所示。从2013年到2016年的三年中，负荷预测的相对误差分别为2.5％，3.5％，2.25％，效果较好。

相比一些情况，本公开实施例提高了集群负荷的预测精度。

实例3

分布式用电数据为某市各商业区用电负荷曲线(5分钟精度)，外部数据为各商业区覆盖范围内公共交通(公交、地铁、出租)流量情况(1小时精度)以及各商业区所处位置气象信息(气温、雨量，1小时精度)。集群负荷预测问题为通过历史数据的训练，基于未来一天的外部数据预测全市商业区的用电负荷曲线。

一、数据预处理

1.根据预测问题所需的用电负荷曲线，需要将用电数据和外部数据的时间尺度调整到同一水平。对外部数据进行外延扩展，将1小时精度的数据平均到每5分钟一个数据。

2.此外对于外部数据进行归一化，以消除绝对值大小的影响。

3.对于公共交通进行量化处理，形成公共交通流量密度指标，公式如下：

式中，P为公共交通流量密度，N _bus为单位时间内公共汽车数量，N _metro为单位时间内地铁数量，N _taxi为单位时间内出租车数量，T为单位时间长度。处理完的数据结构如下表2所示。

表2实例3数据结构

二、个体商业区负荷预测算法训练

本实施例中负荷预测影响因素较多，既包括公共交通数据，又包括多种气象指标，且数据量较大，因此考虑采用神经网络构建个体的用电负荷预测模型进行个体商业区负荷预测。通过经验公式选择隐层节点数：

式中，n _hidden为隐层节点数，n _hidden为输入属性个数，n _hidden为输出结果个数。预测结果如图14所示，在一天24小时的负荷曲线中，预测值与真实值的拟合程度较高，但在个别时段如17时-20时之间误差相对较大，由上述公式得到神经网络模型的隐层节点数。

三、集群用户负荷误差修正

根据步骤二中单个商业区负荷曲线预测结果，进行累加后与各商业区集群负荷曲线进行比较，通过极限学习机进行误差拟合，构建误差修正模型，得到精确结果，如图15所示。24小时的负荷预测相对误差均低于5％。本实施例选用的极限学习机算法具有训练速度快，预测精度高等特点。

实例4

分布式用电数据为某电力用户家庭智能插座采集的用电数据，外部数据为气温、节假日信息、家庭实时人数，预测目标为根据各智能插座采集的用电数据及外部数据预测该家庭该日的用电总量。

一、数据预处理

本实例预测目标为日用电总量，需要将原始数据进行处理形成日典型数据，如智能插座采集数据频率较高需要进行全天累加；气温数据全天变化较大，选取当日最高温度作为属性；节假日信息为逻辑量，需要通过历史数据的规律挖掘转变为最终的比例系数参与预测，家庭实时人口处于变化之中，可以简化为工作人口数量与常住家庭人口数量两个属性。数据格式如下表3所示。

表3实例4数据结构

二、个体负荷预测算法训练

本实施例的个体负荷预测问题为不完全数据的估计性预测，基于外部数据对家庭多个智能插座用电量进行预测。采用决策树进行回归预测，通过MATLAB工具箱(MATLAB是一门计算机编程语言，取名来源于Matrix Laboratory，本意是专门以矩阵的方式来处理计算机数据，它把数值计算和可视化环境集成到一起，非常直观，而且提供了大量的函数，工具箱越来越多，使其应用范围越来越广泛)进行参数优化，构建负荷预测模型。

三、集群用户负荷误差修正

基于步骤二中对家庭各智能插座的用电量预测，挖掘智能插座预测负荷和集群负荷间的数据关系，采用多元线性回归法进行预测，构建误差修正模型，公式如下：

式中L _total为真实集群负荷用电总量(即家庭用电总量)，n为智能插座数量，k _i为回归系数，L _i为第i个智能插座的预测值，b为回归偏差系数，预测结果如图16所示。图 16中展示了训练、验证和测试的相对误差，本实施例所采用的预测方法的误差分布为±10％，进一步说明了本公开实施例集群负荷预测方法的有效性。

相比一些情况，本公开实施例基于分布式用电数据与外部信息的集群负荷预测方法，结合机器学习算法对个体进行微观负荷预测，并分析个体负荷预测结果与集群的总体负荷数据关系得出集群负荷预测结果，提高了集群负荷预测的精细化程度和预测效果，而且利用机器学习算法加快了负荷预测的速度，可以实现短期负荷预测的快速更新。

对应地，本公开实施例还提出一种集群负荷预测装置，包括：数据获取模块，用于获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；负荷预测模型创建模块，用于通过机器学习算法学习拟合所述个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型；预测模块，用于通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

在一个实施例中，所述装置还包括：误差修正模型创建模块，用于创建个体的用电负荷与集群总体负荷间的误差修正模型；所述预测模块，还用于结合所述个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

此外，本公开实施例还提出一种集群负荷预测装置，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如下操作：获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；通过机器学习算法学习拟合所述个体的历史用电数据与所述同一时期的外部数据，形成个体的用电负荷预测模型；获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

在一个实施例中，如图17所示，本实施例集群负荷预测装置可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图17中示出的装置结构并不构成对装置的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图17所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及集群负荷预测程序。

在图17所示的装置中，网络接口1004主要用于连接网络服务器，与网络服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的集群负荷预测程序，并执行以下操作：获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；通过机器学习算法学习拟合所述个体的历史用电数据与所述同一时期的外部数据，形成个体的用电负荷预测模型；获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

在一个实施例中，处理器1001还可以用于调用存储器1005中存储的集群负荷预测程序，并执行以下操作：创建个体的用电负荷与集群总体负荷间的误差修正模型；所述获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值的步骤包括：

获取待预测集群的外部数据，基于所述待预测集群的外部数据，并结合所述个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

在一个实施例中，处理器1001还可以用于调用存储器1005中存储的集群负荷预测程序，并执行以下操作：获取与所述每个个体的历史用电数据同一时期的个体所属集群的历史总负荷，作为所述待预测集群对应的样本集群总体负荷；基于所述个体的用电负荷预测模型对待预测集群对应的样本集群中个体的用电负荷进行预测，得到各个个体的用电负荷预测值；累计各个个体的用电负荷预测值，得到个体的负荷预测累加值；分析所述个体的负荷预测累加值与所述样本集群总体负荷的数据关联关系，形成个体的用电负荷与集群总体负荷间的误差修正模型。

在一个实施例中，处理器1001还可以用于调用存储器1005中存储的集群负荷预测程序，并执行以下操作：对所述个体的历史用电数据以及同一时期的外部数据进行预处理；通过机器学习算法学习拟合预处理后的个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型。

在一个实施例中，处理器1001还可以用于调用存储器1005中存储的集群负荷预测程序，并执行以下操作：将所述集群负荷预测值输出至电力业务平台，为所述电力业务平台提供数据支持；或者，基于所述集群负荷预测值进行异常用电行为检测。

此外，本公开实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下操作：获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；通过机器学习算法学习拟合所述个体的历史用电数据与所述同一时期的外部数据，形成个体的用电负荷预测模型；获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。

在一个实施例中，所述计算机程序被处理器执行时还实现如下操作：创建个体的用电负荷与集群总体负荷间的误差修正模型；所述获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值的步骤包括：

本实施例实现集群负荷预测的原理，请参照上述各实施例，在此不再赘述。

相比一些情况，本公开实施例提出的一种集群负荷预测方法、装置及存储介质，通过机器学习算法学习拟合个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型；通过个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值，实现对异常用户的快速准确判别，为电力调度和发电计划安排等电力业务提供数据支撑；此外还可以结合个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测。相比一些情况，本公开将集群负荷预测这个大任务分解成对于大量个体的负荷预测子任务，充分利用了电力系统中的精细化量测数据，从而通过对个体数据的微观研究分析为宏观负荷预测提供帮助，将更多的量测数据考虑进负荷预测中，利用精细化影响因素提高了集群负荷预测的精细化程度，而且通过机器学习算法挖掘个体与集群负荷间的数据误差，结合个体用电数据与气象和节假日等外部信息，综合考虑负荷变化趋势，提高了集群负荷的预测效果；此外，利用机器学习算法加快了负荷预测的速度，可以实现短期负荷预测的快速更新。

本公开提高了集群负荷预测的精细化程度和预测效果。

本公开实施例提出的一种集群负荷预测方法、装置及存储介质，通过获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；通过机器学习算法学习拟合个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型；获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值，实现对异常用户的快速准确判别，为电力调度和发电计划安排等电力业务提供数据支撑；此外还可以结合个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测。相比一些情况，本公开将集群负荷预测这个大任务分解成对于大量个体的负荷预测子任务，充分利用了电力系统中的精细化量测数据，从而通过对个体数据的微观研究分析为宏观负荷预测提供帮助，将更多的量测数据考虑进负荷预测中，利用精细化影响因素提高了集群负荷预测的精细化程度，而且通过机器学习算法挖掘个体与集群负荷间的数据误差，结合个体用电数据与气象和节假日等外部信息，综合考虑负荷变化趋势，提高了集群负荷的预测效果；此外，利用机器学习算法加快了负荷预测的速度，可以实现短期负荷预测的快速更新。

以上所述仅为本公开的优选实施例，并非因此限制本公开的专利范围，凡是利用本公开说明书及附图内容所作的等效结构或流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本公开的专利保护范围内。

Claims

一种集群负荷预测方法，其中，包括：

获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；

通过机器学习算法学习拟合所述个体的历史用电数据与所述同一时期的外部数据，形成个体的用电负荷预测模型；

获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。
根据权利要求1所述的方法，其中，所述获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值的步骤之前还包括：

创建个体的用电负荷与集群总体负荷间的误差修正模型；

所述获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值的步骤包括：

获取待预测集群的外部数据，基于所述待预测集群的外部数据，并结合所述个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。
根据权利要求2所述的方法，其中，所述创建个体的用电负荷与集群总体负荷间的误差修正模型的步骤包括：

获取与所述每个个体的历史用电数据同一时期的个体所属集群的历史总负荷，作为所述待预测集群对应的样本集群总体负荷；

基于所述个体的用电负荷预测模型对待预测集群对应的样本集群中个体的用电负荷进行预测，得到各个个体的用电负荷预测值；

累计各个个体的用电负荷预测值，得到个体的负荷预测累加值；

分析所述个体的负荷预测累加值与所述样本集群总体负荷的数据关联关系，形成个体的用电负荷与集群总体负荷间的误差修正模型。
根据权利要求1-3中任一项所述的方法，其中，所述获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据的步骤之后，还包括：

对所述个体的历史用电数据以及同一时期的外部数据进行预处理；

所述通过机器学习算法学习拟合所述个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型的步骤包括：

通过机器学习算法学习拟合预处理后的个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型。
根据权利要求4所述的方法，其中，所述外部数据包括：气象数据、经济数据、社会信息中的一种或多种；所述个体的用电负荷预测模型为神经网络模型或线性回归模型；所述误差修正模型为线性回归模型或极限学习机模型。
根据权利要求1-3中任一项所述的方法，其中，所述方法还包括：

将所述集群负荷预测值输出至电力业务平台，为所述电力业务平台提供数据支持；或者，基于所述集群负荷预测值进行异常用电行为检测。
一种集群负荷预测装置，其中，包括：

数据获取模块，用于获取待预测集群对应的样本集群中每个个体的历史用电数据以及同一时期的外部数据；

负荷预测模型创建模块，用于通过机器学习算法学习拟合所述个体的历史用电数据与同一时期的外部数据，形成个体的用电负荷预测模型；

预测模块，用于获取待预测集群的外部数据，基于所述待预测集群的外部数据，并通过所述个体的用电负荷预测模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。
根据权利要求7所述的集群负荷预测装置，其中，所述装置还包括：

误差修正模型创建模块，用于创建个体的用电负荷与集群总体负荷间的误差修正模型；

所述预测模块，还用于获取待预测集群的外部数据，基于所述待预测集群的外部数据，并结合所述个体的用电负荷预测模型及误差修正模型，对待预测集群总体负荷进行预测，输出集群负荷预测值。
一种集群负荷预测装置，其中，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-6中任一项所述的集群负荷预测方法的步骤。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的集群负荷预测方法的步骤。