CN110503256A

CN110503256A - 基于大数据技术的短期负荷预测方法及系统

Info

Publication number: CN110503256A
Application number: CN201910750171.9A
Authority: CN
Inventors: 施明泰; 许中平; 李欣; 刘暘; 韩毅平; 赵宁
Original assignee: Beijing Netstone Accenture Information Technology Co Ltd; National Network Information and Communication Industry Group Co Ltd
Current assignee: Beijing Sgitg Accenture Information Technology Co ltd; State Grid Siji Location Service Co ltd; State Grid Information and Telecommunication Co Ltd
Priority date: 2019-08-14
Filing date: 2019-08-14
Publication date: 2019-11-26
Anticipated expiration: 2039-08-14
Also published as: CN110503256B

Abstract

本发明公开了一种基于大数据技术的短期负荷预测方法及系统，包括以下步骤：获取系统中各用户的用电历史数据；各用户的负荷水平和负荷曲线形状；确定用户的用电模式；根据各用户的用电模式，选择各用户负荷的预测模型；构建各用户负荷的影响因素集合；筛选出若干主导影响因素并赋予权值，然后通过各主导影响因素构建影响因素子集；利用各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化，然后再预测各用户在待预测时间的用电负荷预测值；根据各用户在待预测时间的用电负荷预测值以及系统网损，得到系统在待预测时间的总用电负荷预测值，该方法及系统能够实现短期负荷的预测，并且预测精度较高。

Description

基于大数据技术的短期负荷预测方法及系统

技术领域

本发明属于电力技术领域，涉及一种短期负荷预测方法及系统，具体涉及一种基于大数据技术的短期负荷预测方法及系统。

背景技术

长期以来，由于用户信息采集装置的覆盖程度低，短期负荷预测的对象通常局限在全网的系统负荷，国内外学者对此作了大量的理论和方法的研究工作，提出了多种各具特点的预测方法，如时间序列法，人工神经网络法，专家系统法以及模糊神经网络法等，精度不断提高。

但是由于系统负荷由多个用电负荷构成，用电负荷的变化千差万别，不同类型的用电负荷具有自身的负荷特性与负荷发展规律，用电负荷在叠加时会削弱甚至抵消某些用电负荷的变化规律，使得系统负荷变化的规律性变得模糊，难以精确定位负荷波动真正原因；同时由于负荷的影响因素众多，且它们之间的非线性、复杂性和滞后性等特点，在实际应用中建立系统负荷与众多影响因素之间的关系模型存在很大困难。因此，现有的负荷预测的精度不高。

发明内容

本发明的目的在于克服上述现有技术的缺点，提供了一种基于大数据技术的短期负荷预测方法及系统，该方法及系统能够实现短期负荷的预测，并且预测精度较高。

为达到上述目的，本发明所述的基于大数据技术的短期负荷预测方法包括以下步骤：

获取系统中各用户的用电历史数据；

利用预设的聚类算法，根据各用户的用电历史数据对各用户的负荷进行聚类，得各用户的负荷水平和负荷曲线形状；

根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式；

根据各用户的用电模式，选择各用户负荷的预测模型；

根据各用户的用电历史数据构建各用户负荷的影响因素集合；

对构建的各用户负荷的影响因素集合进行关联分析，筛选出若干对负荷产生强关联的主导影响因素，然后通过筛选出的各主导影响因素构建影响因素子集，同时对各主导影响因素赋予权值；

利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化，然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值；

根据各用户在待预测时间的用电负荷预测值以及系统网损，得到系统在待预测时间的总用电负荷预测值，完成基于大数据技术的短期负荷预测。

可选地，还包括：

对各用户的用电历史数据进行分析，找出用电负荷异常的采样点；

根据该采样点对应的各主导影响因素的权值，判断该采样点采集的异常用电负荷为坏值还是由于突发事件引起的负荷突变；

当该采样点采集的异常用电负荷为坏值时，则删除该异常用电负荷，当该采样点采集的异常用电负荷为由于突发事件引起的负荷突变时，则保存该异常用电负荷。

可选地，根据聚类得到的各用户的负荷水平和负荷曲线形状确定各用户的用电模式具体包括以下步骤：

通过各用户的日平均负荷表示各用户的负荷水平，再根据各用户的日平均负荷得到各用户的负荷水平波动幅度，其中，每用户的负荷水平波动幅度通过以下公式得到：

其中，为第i天的日平均负荷，为第j天的日平均负荷，N为参与聚类分析的负荷天数，M为用电模式下包含的负荷天数；

根据各用户的负荷曲线形状，得各用户的负荷曲线相似度r_ij，其中，

其中，X_ik为第i天第k个采样点的负荷标幺值，X_jk为第j天第k个采样点的负荷标幺值，k＝1～m，X_ik及X_jk均为非负数；

根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度r_ij，确定各用户的用电模式。

所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式；

按照下表根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度r_ij，确定各用户的用电模式；

可选地，当用户的用电模式为稳定模式时，选取ARIMA模型或一元线性回归模型作为用户负荷的预测模型；当用户的用电模式为第一波动模式、第二波动模式或第三波动模式时，则选取模式识别模型或神经网络模型作为用户负荷的预测模型。

可选地，各用户负荷的影响因素集合中的影响因素包括正常日、节假日、星期类型、农历日期、节假日前第几天、节假日后第几天、与待预测日相距几天、天气情况、日气象特征值、逐时气象、前n天的气象及前n天的气象累积值。

本发明所述的基于大数据技术的短期负荷预测系统包括：

历史数据获取模块，用于获取系统中各用户的用电历史数据；

聚类模块，与历史数据获取模块相连接，用于利用预设的聚类算法，根据各用户的用电历史数据对各用户的负荷进行聚类，得各用户的负荷水平和负荷曲线形状；

用电模式确定模块，与聚类模块相连接，用于根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式；

预测模型选择模块，与用电模式确定模块相连接，用于根据各用户的用电模式，选择各用户负荷的预测模型；

影响因素确定模块，与历史数据获取模块相连接，用于根据各用户的用电历史数据构建各用户负荷的影响因素集合；

影响规则确定模块，与影响因素集合相连接，用于对构建的各用户负荷的影响因素集合进行关联分析，筛选出若干对负荷产生强关联的主导影响因素，然后通过筛选出的各主导影响因素构建影响因素子集，同时对各主导影响因素赋予权值；

预测模块，与影响规则确定模块及预测模型选择模块相连接，用于利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化，然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值；

累加模块，与预测模块相连接，用于根据各用户在待预测时间的用电负荷预测值以及系统网损，得到系统在待预测时间的总用电负荷预测值，完成基于大数据技术的短期负荷预测。

可选地，还包括：

异常点分析模块，用于对各用户的用电历史数据进行分析，找出用电负荷异常的采样点；

异常点判断模块，与异常点分析模块相连接，用于根据该采样点对应的各主导影响因素的权值，判断该采样点采集的异常用电负荷为坏值还是由于突发事件引起的负荷突变；

异常点处理模块，与异常点判断模块相连接，用于当该采样点采集的异常用电负荷为坏值时，则删除该异常用电负荷，当该采样点采集的异常用电负荷为由于突发事件引起的负荷突变时，则保存该异常用电负荷。

可选地，所述用电模式确定模块包括：

负荷水平波动幅度确定单元，与聚类模块相连接，用于通过各用户的日平均负荷表示各用户的负荷水平，再根据各用户的日平均负荷得到各用户的负荷水平波动幅度，其中，每用户的负荷水平波动幅度通过以下公式得到：

负荷曲线相似度确定单元，与聚类模块相连接，用于根据各用户的负荷曲线形状，得各用户的负荷曲线相似度r_ij，其中，

用电模式确定单元，与负荷水平波动幅度确定单元及负荷曲线相似度确定单元相连接，用于根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度r_ij，确定各用户的用电模式。

可选地，所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式；

本发明具有以下有益效果：

本发明所述的基于大数据技术的短期负荷预测方法及系统在具体操作时，基于系统中各用户的用电历史数据，通过聚类算法得到各用户的负荷水平及负荷曲线形状，并依此确定用户的用电模式，为选取各用户负荷的预测模型提供依据；同时基于各用户的用电历史数据构建各用户负荷的影响因素集合，并通过关联分析，筛选出主导影响因素，再利用各主导影响因素及其权重对预测模型的参数进行选择及优化，以确定预测模型，最后根据预测模型预测的各用户在待预测时间的用电负荷预测值及系统网损计算系统在待预测时间的总用电负荷预测值，以实现系统短期负荷的精准预测，计算速度较快。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本发明的流程图；

图2为本发明中聚类的示意图；

图3为本发明中影响因素对负荷的影响规律示意图；

图4为本发明中用户负荷预测的一种可选处理架构示意图；

图5为本发明中一种用户负荷预测的流程图；

图6为采用不同方法预测的结果图；

图7为本发明的结构示意图。

其中，1为历史数据获取模块 1、2为聚类模块 2、3为用电模式确定模块 3、4为预测模型选择模块 4、5为影响因素确定模块 5、6为影响规则确定模块 6、7为预测模块 7、8为累加模块8。

具体实施方式

下面结合附图对本发明做进一步详细描述：

通过用电信息采集系统的广泛应用，获取了大量用户的负荷信息，因此，可以根据采集的用电信息，分析出用户用电负荷的变化规律。由于用户受行业属性决定，其生产活动具有自身明显的规律性，影响因素相对单一，负荷与影响因素的关系更加简单，负荷特性更易于把握，因此负荷分析点越接近于负荷需求地越有利于掌握负荷发展规律性。基于以此，本发明提出一种基于大数据技术的短期负荷预测方法及系统。

统调负荷＝∑用户的用电负荷+系统网损，由于系统网损很小且相对固定，因此，在用户的用电负荷预测准确基础上，即可提高系统负荷的预测准确性。但由于电网用户数量众多，数据量大、计算量大，传统的数据架构已无法胜任如此大量的数据计算工作，为此本发明提供了一种基于大数据技术的短期负荷预测方法，该方法从大数据理论出发，对电力系统的用户用电负荷进行分析及预测，并通过预测模型对电力系统负荷进行短期的预测。

具体的，本发明所述的基于大数据技术的短期负荷预测方法包括以下步骤：

S100，获取系统中各用户的用电历史数据；

在具体获取过程中，可以根据具体需求进行采集，采样点为采集时间，例如，以某地区的负荷为例，可以采集120万用户的负荷数据，采样时间范围为2012-01-01—2012-12-31，采样间隔为15min，每个用户每天采样96点数据。

在采集到数据之后，根据各用户的用电历史数据，对用户的用电规律进行分析，为避免将坏数据作为分析的基础或者将有效数据作为坏数据丢弃而导致数据分析不准确的问题，本发明在对用户的用电规律进行分析之前，先进行用电负荷异常采样点(孤立点)的分析，即找出显著差异、异常的或不一致的对象。数据库中可能包含一些数据对象，它们与数据的一般行为或模型不一致，这些数据对象是孤立点，大部分数据挖掘方法将孤立点视为噪音或例外而丢弃，然而，在负荷预测中，孤立点包含了两层含义：一是采集错误产生的坏数据；二是特殊事件引起的负荷突变(如：持续高温使得负荷跃升)，对于坏数据，用于预测时需要剔除或借助数据修正技术进行修补；对于负荷突变，虽然特殊事件发生的概率极低，但它们属于预测工作范畴，可将其汇总后，分析突变产生的原因、影响时间范围和影响程度，为后续负荷预测提供参考依据。因此，在本发明中，先对各用户的用电历史数据进行分析，找出用电负荷异常的采样点，然后根据用电负荷异常的采样点的各主导影响因素的权值，判断该采样点采集的异常用电负荷为坏值还是由于突发事件引起的负荷突变，当该采样点采集的异常用电负荷为坏值时，则删除该异常用电负荷，当该采样点采集的异常用电负荷为由于突发事件引起的负荷突变时，则保存该异常用电负荷，通过去除坏值，以提高后续负荷预测的准确率。

S101，利用预设的聚类算法，根据各用户的用电历史数据对各用户的负荷进行聚类，得各用户的负荷水平和负荷曲线形状；

同一用户的用电负荷数据之间存在关联性和相似性，同一用户的用电历史数据中隐藏着该用户的用电行为习惯，对这些用电负荷数据进行挖掘并研究用户类型，可以帮助电网了解用户的个性化，并为预测模型的选择提供数据支撑。

在本发明中的用电行为分析借助聚类技术，例如可以采用基于SOM的聚类算法，SOM神经网络是由芬兰神经网络专家Kohonen教授提出的，该算法假设在输入对象中存在一些拓扑结构或顺序，可以实现从输入空间(n维)到输出平面(2维)的降维映射，其映射具有拓扑特征保持性质，与实际的大脑处理有很强的理论联系。聚类过程的流程主要包括以下步骤：

1)网络初始化，对输出层每个节点的权重赋初值；

2)从输入样本中随机选取输入向量，找到与输入向量距离最小的权重向量；

3)定义获胜单元，在获胜单元的邻近区域调整权重使其向输入向量靠拢；

4)提供新样本，并进行训练；

5)收缩邻域半径、减小学习率、重复，直到小于允许值，输出聚类结果。

如图2所示，根据用户的用电历史数据，可以绘出用户的负荷曲线样本，对负荷曲线样本进行聚类，可以得到图2中右侧的聚类结果。

S102，根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式；

其中，X_ik为第i天第k个采样点的负荷标幺值，X_jk为第j天第k个采样点的负荷标幺值，k＝1～m，X_ik及X_jk均为非负数，且为第i天第k个负荷点的负荷值，为第j天第k个负荷点的负荷值。

最后按照表1根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度r_ij，确定各用户的用电模式；

表1

用电模式的确定为预测模型的选择提供了依据，不同用电模式表示负荷的变化规律差异，负荷波动较小的可选用时间序列模型，负荷呈线性增长趋势的可选用回归模型，负荷波动大的，需进一步依据波动类型选取考虑相关影响因素的模式识别模型或神经网络模型。

S103，根据各用户的用电模式，选择各用户负荷的预测模型；

具体的，当用户的用电模式为稳定模式时，选取ARIMA模型或一元线性回归模型作为用户负荷的预测模型；当用户的用电模式为第一波动模式、第二波动模式或第三波动模式时，则选取模式识别模型或神经网络模型作为用户负荷的预测模型。

S104，根据各用户的用电历史数据构建各用户负荷的影响因素集合；

具体的，用电负荷主要受以下因素影响包括天气情况、日期类型及社会事件等。影响因素根据类型和作用效果两个维度的耦合共同起作用，根据影响因素的作用效果，可分为直接影响因素和间接影响因素，本发明中直接因素为影响因素在当日发生作用，间接因素为影响因素超前、滞后或累积发生作用；依据类型划分，如日期类型和气象类型，还可以是以上两种情况的组合，如表2所示。为对各影响因素进行耦合，需要建立他们之间的耦合关系，形成一个“影响因素集合”，建立影响因素集合将打破传统只考虑某一或某几个因素，导致影响因素考虑不够全面的问题。

表2

本发明中负荷预测的影响因素主要包括日分类(正常日、国庆、春节等)、星期类型(周一～周日)、农历类型(农历日期、农历节气等)、前(后)第几天(超前或滞后天数)、日期差(两日之间相距的天数)、日天气情况(晴、阴等)、日气象类型(气温、降雨量、湿度、风速等)、日气象特征值(最高温度、平均温度、最低温度等)、逐小时气象及累积多天(累积效应天数)等。

因此某一日的影响因素集合为{正常日，节假日，星期类型，农历日期，节假日前第几天，节假日后第几天，与待预测日相距几天，天气情况，日气象特征值，逐时气象，前n天的气象，前n天的气象累积值}。影响因素集合是一个全面的、规范化的表征体系，尽可能的考虑了各种相关因素的直接、间接和耦合影响，既可以指导预测人员构造新的短期负荷预测方法，也可以对各种现有的预测方法进行改造，使之可以涉及各种因素的影响。

关联规则是指反映事物之间依赖或关联的知识，关联模型就是数据项之间的关联规则。关联规则的一般形式是：如果A发生，则B有c％的可能性发生，c称为关联规则的可信度。影响因素集合的关联分析发现关联规则，这些规则展示影响因素-负荷值频繁地在给定数据集中一起出现的条件。

具体的，关联规则是形如即的规则；其中，Ai(i∈{1,...,m})，Bj(j∈{1,...,n})是影响因素-负荷值对。关联规则解释为“满足X中条件的数据库元组多半也满足Y中的条件”。

S105，对构建的各用户负荷的影响因素集合进行关联分析，筛选出若干对负荷产生强关联的主导影响因素，然后通过筛选出的各主导影响因素构建影响因素子集，同时对各主导影响因素赋予权值；

通过影响因素与负荷值的关联分析，可以筛选出对负荷产生强关联的影响因素子集(由若干主导影响因素构成)，为下一步构建影响因素间的耦合关系提供数据支撑，降低预测模型的复杂度，同时有效缩小影响因素的考虑范围，减少相应数据处理工作量。

影响因素分析结论用于预测模型参数的选择和优化，对待预测日的日类型、气温、降水量以及历史上前天和昨天最高气温均有影响的用户，在预测参数选择上需考虑以上5个因素，并对主导影响因素赋予较大的权值。

在图3中，14时负荷共被分为5类，每一类代表不同的气象条件及工作日类型。以第5个节点为例，满足如下条件才可被认为属于节点5：待预测日5时的温度大于24℃；属于双休日；待预测日前一日20时的温度大于28℃。由此可见，节点5代表的是双休日且温度较高的情况。这一般发生在夏天，主要集中在七八月份。

采用上述方法，还可将气温进一步扩展到湿度、降雨量、日照小时数、天气情况的描述等，具体本实施例不作限定。

S106，利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化，然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值；

S107，根据各用户在待预测时间的用电负荷预测值以及系统网损，得到系统在待预测时间的总用电负荷预测值，完成基于大数据技术的短期负荷预测。

根据上述描述可知，用电负荷预测主要分为3个过程：用户用电信息采集系统的负荷数据整合、数据处理架构以及用电负荷预测，负荷数据整合主要完成对居民、工业及商业等用户用电信息采集数据的抽取，本发明中数据处理架构可以采用Hadoop数据处理架构，在抽取用户信息采集数据后，如图4所示，可以将这些用户的用电负荷数据都输入Hadoop的大数据处理模块，采用并行存储和并行计算技术，实现多用户、多日的数据存储和计算，具体实现流程如图5所示。

采用上述方式，可以通过网络分布式连接多台PC计算机，能够利用已有的普通计算资源，完成对大规模用户用电负荷数据的高效处理。例如，可以利用MapReduce并行方法处理用户的用电负荷数据，通过对某地区120万用户一年的负荷数据的应用测试，结果表明：分布式计算方法通过连接多计算节点，能够有效地提升用户的用电负荷数据的计算效率，而且计算节点对计算性能的影响非常明显，通过添加节点能够实现对性能的提升，解决用采数据分析计算的性能瓶颈。

采用本发明，以某地区的负荷为例，共收集120万用户的负荷数据，采样时间范围为2012-01-01—2012-12-31，采样间隔为15min，每个用户每天采样96点数据，将这些数据去除噪声(有些采样点为空值)后全部作为实验数据，以此为基础进行短期负荷预测研究。

借助大数据分析架构，在用户的用电负荷预测基础上，考虑系统网损，累加得到系统负荷，统计其预测精度，预测精度达到97.6％，与基于系统负荷的预测方法相比提高2.1个百分点，如图6所示。

如图6所示，采用本发明提供的基于大数据技术的负荷预测效果具有明显优势，由于预测对象的细分、考虑影响因素的全面性以及数据挖掘结论的准确性，使得更加容易精确定位负荷波动的真正源头，克服系统负荷预测无法跟踪具体用户用电负荷变化的缺陷。

另外，本发明还公开了一种基于大数据技术的短期负荷预测系统，所述基于大数据技术的短期负荷预测系统包括：

历史数据获取模块1，用于获取系统中各用户的用电历史数据；聚类模块2，与历史数据获取模块1相连接，用于利用预设的聚类算法，根据各用户的用电历史数据对各用户的负荷进行聚类，得各用户的负荷水平和负荷曲线形状；用电模式确定模块3，与聚类模块2相连接，用于根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式；预测模型选择模块4，与用电模式确定模块3相连接，用于根据各用户的用电模式，选择各用户负荷的预测模型；影响因素确定模块5，与历史数据获取模块1相连接，用于根据各用户的用电历史数据构建各用户负荷的影响因素集合；影响规则确定模块6，与影响因素确定模块5相连接，用于对构建的各用户负荷的影响因素集合进行关联分析，筛选出若干对负荷产生强关联的主导影响因素，然后通过筛选出的各主导影响因素构建影响因素子集，同时对各主导影响因素赋予权值；预测模块7，与影响规则确定模块6及预测模型选择模块4相连接，用于利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化，然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值；累加模块8，与预测模块7相连接，用于根据各用户在待预测时间的用电负荷预测值以及系统网损，得到系统在待预测时间的总用电负荷预测值，完成基于大数据技术的短期负荷预测。

本发明还包括：异常点分析模块，用于对各用户的用电历史数据进行分析，找出用电负荷异常的采样点；异常点判断模块，与异常点分析模块相连接，用于根据该采样点对应的各主导影响因素的权值，判断该采样点采集的异常用电负荷为坏值还是由于突发事件引起的负荷突变；异常点处理模块，与异常点判断模块相连接，用于当该采样点采集的异常用电负荷为坏值时，则删除该异常用电负荷，当该采样点采集的异常用电负荷为由于突发事件引起的负荷突变时，则保存该异常用电负荷。

所述用电模式确定模块3包括：

负荷水平波动幅度确定单元，与聚类模块2相连接，用于通过各用户的日平均负荷表示各用户的负荷水平，再根据各用户的日平均负荷得到各用户的负荷水平波动幅度，其中，每用户的负荷水平波动幅度通过以下公式得到：

负荷曲线相似度确定单元，与聚类模块2相连接，用于根据各用户的负荷曲线形状，得各用户的负荷曲线相似度r_ij，其中，

其中，X_ik为第i天第k个采样点的负荷标幺值，X_jk为第j天第k个采样点的负荷标幺值，k＝1～m，X_ik及X_jk均为非负数，且

所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式；另外，按照表1根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度r_ij，确定各用户的用电模式。

另外，需要说明的是，本发明所述基于大数据技术的短期负荷预测系统中各模块的工作过程中在本发明所述的基于大数据技术的短期负荷预测方法中均以介绍，对此不再说明。

本发明借助大数据的技术架构，研究了利用用电信息采集数据实现短期负荷预测，基于大数据的存储和计算能力为海量数据的处理提供了基础。综合考虑影响因素的类型与作用效果，构建了影响因素集合，并将数据挖掘技术应用到用户用电规律分析和影响因素分析中，为提升预测模型的适用性奠定了基础，实验结果表明本发明提出的短期负荷预测技术路线是可行的。

与传统方法有所不同，本发明提供了在短期负荷预测对象上基于用户的预测方案，并将大数据技术引入到负荷预测领域，可以更深入的了解负荷特性的变化规律，指导短期负荷预测工作做好了铺垫，将更加有利于提高调度部门的负荷预测工作效率。

需要说明的是，对于前述的方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明所必需的。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于大数据技术的短期负荷预测方法，其特征在于，包括以下步骤：

获取系统中各用户的用电历史数据；

根据各用户的用电模式，选择各用户负荷的预测模型；

根据各用户在待预测时间的用电负荷预测值及系统网损，得到系统在待预测时间的总用电负荷预测值，完成基于大数据技术的短期负荷预测。

2.根据权利要求1所述的基于大数据技术的短期负荷预测方法，其特征在于，还包括：

3.根据权利要求1或2所述的基于大数据技术的短期负荷预测方法，其特征在于，根据聚类得到的各用户的负荷水平和负荷曲线形状确定各用户的用电模式具体包括以下步骤：

4.根据权利要求3所述的基于大数据技术的短期负荷预测方法，其特征在于，所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式；

5.根据权利要求4所述的基于大数据技术的短期负荷预测方法，其特征在于，当用户的用电模式为稳定模式时，选取ARIMA模型或一元线性回归模型作为用户负荷的预测模型；当用户的用电模式为第一波动模式、第二波动模式或第三波动模式时，则选取模式识别模型或神经网络模型作为用户负荷的预测模型。

6.根据权利要求1或2所述的基于大数据技术的短期负荷预测方法，其特征在于，各用户负荷的影响因素集合中的影响因素包括正常日、节假日、星期类型、农历日期、节假日前第几天、节假日后第几天、与待预测日相距几天、天气情况、日气象特征值、逐时气象、前n天的气象及前n天的气象累积值。

7.一种基于大数据技术的短期负荷预测系统，其特征在于，包括：

历史数据获取模块(1)，用于获取系统中各用户的用电历史数据；

聚类模块(2)，与历史数据获取模块(1)相连接，用于利用预设的聚类算法，根据各用户的用电历史数据对各用户的负荷进行聚类，得各用户的负荷水平和负荷曲线形状；

用电模式确定模块(3)，与聚类模块(2)相连接，用于根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式；

预测模型选择模块(4)，与用电模式确定模块(3)相连接，用于根据各用户的用电模式，选择各用户负荷的预测模型；

影响因素确定模块(5)，与历史数据获取模块(1)相连接，用于根据各用户的用电历史数据构建各用户负荷的影响因素集合；

影响规则确定模块(6)，与影响因素确定模块(5)相连接，用于对构建的各用户负荷的影响因素集合进行关联分析，筛选出若干对负荷产生强关联的主导影响因素，然后通过筛选出的各主导影响因素构建影响因素子集，同时对各主导影响因素赋予权值；

预测模块(7)，与影响规则确定模块(6)及预测模型选择模块(4)相连接，用于利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化，然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值；

累加模块(8)，与预测模块(7)相连接，用于根据各用户在待预测时间的用电负荷预测值以及系统网损，得到系统在待预测时间的总用电负荷预测值，完成基于大数据技术的短期负荷预测。

8.根据权利要求7所述的基于大数据技术的短期负荷预测系统，其特征在于，还包括：

9.根据权利要求7或8所述的基于大数据技术的短期负荷预测系统，其特征在于，所述用电模式确定模块(3)包括：

负荷水平波动幅度确定单元，与聚类模块(2)相连接，用于通过各用户的日平均负荷表示各用户的负荷水平，再根据各用户的日平均负荷得到各用户的负荷水平波动幅度，其中，每用户的负荷水平波动幅度通过以下公式得到：

负荷曲线相似度确定单元，与聚类模块(2)相连接，用于根据各用户的负荷曲线形状，得各用户的负荷曲线相似度r_ij，其中，

10.根据权利要求9所述的基于大数据技术的短期负荷预测系统，其特征在于，所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式；