CN110503256A - 基于大数据技术的短期负荷预测方法及系统 - Google Patents

基于大数据技术的短期负荷预测方法及系统 Download PDF

Info

Publication number
CN110503256A
CN110503256A CN201910750171.9A CN201910750171A CN110503256A CN 110503256 A CN110503256 A CN 110503256A CN 201910750171 A CN201910750171 A CN 201910750171A CN 110503256 A CN110503256 A CN 110503256A
Authority
CN
China
Prior art keywords
load
user
influence factor
module
day
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910750171.9A
Other languages
English (en)
Other versions
CN110503256B (zh
Inventor
施明泰
许中平
李欣
刘暘
韩毅平
赵宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sgitg Accenture Information Technology Co ltd
State Grid Siji Location Service Co ltd
State Grid Information and Telecommunication Co Ltd
Original Assignee
Beijing Netstone Accenture Information Technology Co Ltd
National Network Information and Communication Industry Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Netstone Accenture Information Technology Co Ltd, National Network Information and Communication Industry Group Co Ltd filed Critical Beijing Netstone Accenture Information Technology Co Ltd
Priority to CN201910750171.9A priority Critical patent/CN110503256B/zh
Publication of CN110503256A publication Critical patent/CN110503256A/zh
Application granted granted Critical
Publication of CN110503256B publication Critical patent/CN110503256B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据技术的短期负荷预测方法及系统,包括以下步骤:获取系统中各用户的用电历史数据;各用户的负荷水平和负荷曲线形状;确定用户的用电模式;根据各用户的用电模式,选择各用户负荷的预测模型;构建各用户负荷的影响因素集合;筛选出若干主导影响因素并赋予权值,然后通过各主导影响因素构建影响因素子集;利用各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化,然后再预测各用户在待预测时间的用电负荷预测值;根据各用户在待预测时间的用电负荷预测值以及系统网损,得到系统在待预测时间的总用电负荷预测值,该方法及系统能够实现短期负荷的预测,并且预测精度较高。

Description

基于大数据技术的短期负荷预测方法及系统
技术领域
本发明属于电力技术领域,涉及一种短期负荷预测方法及系统,具体涉及一种基于大数据技术的短期负荷预测方法及系统。
背景技术
长期以来,由于用户信息采集装置的覆盖程度低,短期负荷预测的对象通常局限在全网的系统负荷,国内外学者对此作了大量的理论和方法的研究工作,提出了多种各具特点的预测方法,如时间序列法,人工神经网络法,专家系统法以及模糊神经网络法等,精度不断提高。
但是由于系统负荷由多个用电负荷构成,用电负荷的变化千差万别,不同类型的用电负荷具有自身的负荷特性与负荷发展规律,用电负荷在叠加时会削弱甚至抵消某些用电负荷的变化规律,使得系统负荷变化的规律性变得模糊,难以精确定位负荷波动真正原因;同时由于负荷的影响因素众多,且它们之间的非线性、复杂性和滞后性等特点,在实际应用中建立系统负荷与众多影响因素之间的关系模型存在很大困难。因此,现有的负荷预测的精度不高。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供了一种基于大数据技术的短期负荷预测方法及系统,该方法及系统能够实现短期负荷的预测,并且预测精度较高。
为达到上述目的,本发明所述的基于大数据技术的短期负荷预测方法包括以下步骤:
获取系统中各用户的用电历史数据;
利用预设的聚类算法,根据各用户的用电历史数据对各用户的负荷进行聚类,得各用户的负荷水平和负荷曲线形状;
根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式;
根据各用户的用电模式,选择各用户负荷的预测模型;
根据各用户的用电历史数据构建各用户负荷的影响因素集合;
对构建的各用户负荷的影响因素集合进行关联分析,筛选出若干对负荷产生强关联的主导影响因素,然后通过筛选出的各主导影响因素构建影响因素子集,同时对各主导影响因素赋予权值;
利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化,然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值;
根据各用户在待预测时间的用电负荷预测值以及系统网损,得到系统在待预测时间的总用电负荷预测值,完成基于大数据技术的短期负荷预测。
可选地,还包括:
对各用户的用电历史数据进行分析,找出用电负荷异常的采样点;
根据该采样点对应的各主导影响因素的权值,判断该采样点采集的异常用电负荷为坏值还是由于突发事件引起的负荷突变;
当该采样点采集的异常用电负荷为坏值时,则删除该异常用电负荷,当该采样点采集的异常用电负荷为由于突发事件引起的负荷突变时,则保存该异常用电负荷。
可选地,根据聚类得到的各用户的负荷水平和负荷曲线形状确定各用户的用电模式具体包括以下步骤:
通过各用户的日平均负荷表示各用户的负荷水平,再根据各用户的日平均负荷得到各用户的负荷水平波动幅度,其中,每用户的负荷水平波动幅度通过以下公式得到:
其中,为第i天的日平均负荷,为第j天的日平均负荷,N为参与聚类分析的负荷天数,M为用电模式下包含的负荷天数;
根据各用户的负荷曲线形状,得各用户的负荷曲线相似度rij,其中,
其中,Xik为第i天第k个采样点的负荷标幺值,Xjk为第j天第k个采样点的负荷标幺值,k=1~m,Xik及Xjk均为非负数;
根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式。
所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式;
按照下表根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式;
可选地,当用户的用电模式为稳定模式时,选取ARIMA模型或一元线性回归模型作为用户负荷的预测模型;当用户的用电模式为第一波动模式、第二波动模式或第三波动模式时,则选取模式识别模型或神经网络模型作为用户负荷的预测模型。
可选地,各用户负荷的影响因素集合中的影响因素包括正常日、节假日、星期类型、农历日期、节假日前第几天、节假日后第几天、与待预测日相距几天、天气情况、日气象特征值、逐时气象、前n天的气象及前n天的气象累积值。
本发明所述的基于大数据技术的短期负荷预测系统包括:
历史数据获取模块,用于获取系统中各用户的用电历史数据;
聚类模块,与历史数据获取模块相连接,用于利用预设的聚类算法,根据各用户的用电历史数据对各用户的负荷进行聚类,得各用户的负荷水平和负荷曲线形状;
用电模式确定模块,与聚类模块相连接,用于根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式;
预测模型选择模块,与用电模式确定模块相连接,用于根据各用户的用电模式,选择各用户负荷的预测模型;
影响因素确定模块,与历史数据获取模块相连接,用于根据各用户的用电历史数据构建各用户负荷的影响因素集合;
影响规则确定模块,与影响因素集合相连接,用于对构建的各用户负荷的影响因素集合进行关联分析,筛选出若干对负荷产生强关联的主导影响因素,然后通过筛选出的各主导影响因素构建影响因素子集,同时对各主导影响因素赋予权值;
预测模块,与影响规则确定模块及预测模型选择模块相连接,用于利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化,然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值;
累加模块,与预测模块相连接,用于根据各用户在待预测时间的用电负荷预测值以及系统网损,得到系统在待预测时间的总用电负荷预测值,完成基于大数据技术的短期负荷预测。
可选地,还包括:
异常点分析模块,用于对各用户的用电历史数据进行分析,找出用电负荷异常的采样点;
异常点判断模块,与异常点分析模块相连接,用于根据该采样点对应的各主导影响因素的权值,判断该采样点采集的异常用电负荷为坏值还是由于突发事件引起的负荷突变;
异常点处理模块,与异常点判断模块相连接,用于当该采样点采集的异常用电负荷为坏值时,则删除该异常用电负荷,当该采样点采集的异常用电负荷为由于突发事件引起的负荷突变时,则保存该异常用电负荷。
可选地,所述用电模式确定模块包括:
负荷水平波动幅度确定单元,与聚类模块相连接,用于通过各用户的日平均负荷表示各用户的负荷水平,再根据各用户的日平均负荷得到各用户的负荷水平波动幅度,其中,每用户的负荷水平波动幅度通过以下公式得到:
其中,为第i天的日平均负荷,为第j天的日平均负荷,N为参与聚类分析的负荷天数,M为用电模式下包含的负荷天数;
负荷曲线相似度确定单元,与聚类模块相连接,用于根据各用户的负荷曲线形状,得各用户的负荷曲线相似度rij,其中,
其中,Xik为第i天第k个采样点的负荷标幺值,Xjk为第j天第k个采样点的负荷标幺值,k=1~m,Xik及Xjk均为非负数;
用电模式确定单元,与负荷水平波动幅度确定单元及负荷曲线相似度确定单元相连接,用于根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式。
可选地,所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式;
按照下表根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式;
本发明具有以下有益效果:
本发明所述的基于大数据技术的短期负荷预测方法及系统在具体操作时,基于系统中各用户的用电历史数据,通过聚类算法得到各用户的负荷水平及负荷曲线形状,并依此确定用户的用电模式,为选取各用户负荷的预测模型提供依据;同时基于各用户的用电历史数据构建各用户负荷的影响因素集合,并通过关联分析,筛选出主导影响因素,再利用各主导影响因素及其权重对预测模型的参数进行选择及优化,以确定预测模型,最后根据预测模型预测的各用户在待预测时间的用电负荷预测值及系统网损计算系统在待预测时间的总用电负荷预测值,以实现系统短期负荷的精准预测,计算速度较快。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明的流程图;
图2为本发明中聚类的示意图;
图3为本发明中影响因素对负荷的影响规律示意图;
图4为本发明中用户负荷预测的一种可选处理架构示意图;
图5为本发明中一种用户负荷预测的流程图;
图6为采用不同方法预测的结果图;
图7为本发明的结构示意图。
其中,1为历史数据获取模块 1、2为聚类模块 2、3为用电模式确定模块 3、4为预测模型选择模块 4、5为影响因素确定模块 5、6为影响规则确定模块 6、7为预测模块 7、8为累加模块8。
具体实施方式
下面结合附图对本发明做进一步详细描述:
通过用电信息采集系统的广泛应用,获取了大量用户的负荷信息,因此,可以根据采集的用电信息,分析出用户用电负荷的变化规律。由于用户受行业属性决定,其生产活动具有自身明显的规律性,影响因素相对单一,负荷与影响因素的关系更加简单,负荷特性更易于把握,因此负荷分析点越接近于负荷需求地越有利于掌握负荷发展规律性。基于以此,本发明提出一种基于大数据技术的短期负荷预测方法及系统。
统调负荷=∑用户的用电负荷+系统网损,由于系统网损很小且相对固定,因此,在用户的用电负荷预测准确基础上,即可提高系统负荷的预测准确性。但由于电网用户数量众多,数据量大、计算量大,传统的数据架构已无法胜任如此大量的数据计算工作,为此本发明提供了一种基于大数据技术的短期负荷预测方法,该方法从大数据理论出发,对电力系统的用户用电负荷进行分析及预测,并通过预测模型对电力系统负荷进行短期的预测。
具体的,本发明所述的基于大数据技术的短期负荷预测方法包括以下步骤:
S100,获取系统中各用户的用电历史数据;
在具体获取过程中,可以根据具体需求进行采集,采样点为采集时间,例如,以某地区的负荷为例,可以采集120万用户的负荷数据,采样时间范围为2012-01-01—2012-12-31,采样间隔为15min,每个用户每天采样96点数据。
在采集到数据之后,根据各用户的用电历史数据,对用户的用电规律进行分析,为避免将坏数据作为分析的基础或者将有效数据作为坏数据丢弃而导致数据分析不准确的问题,本发明在对用户的用电规律进行分析之前,先进行用电负荷异常采样点(孤立点)的分析,即找出显著差异、异常的或不一致的对象。数据库中可能包含一些数据对象,它们与数据的一般行为或模型不一致,这些数据对象是孤立点,大部分数据挖掘方法将孤立点视为噪音或例外而丢弃,然而,在负荷预测中,孤立点包含了两层含义:一是采集错误产生的坏数据;二是特殊事件引起的负荷突变(如:持续高温使得负荷跃升),对于坏数据,用于预测时需要剔除或借助数据修正技术进行修补;对于负荷突变,虽然特殊事件发生的概率极低,但它们属于预测工作范畴,可将其汇总后,分析突变产生的原因、影响时间范围和影响程度,为后续负荷预测提供参考依据。因此,在本发明中,先对各用户的用电历史数据进行分析,找出用电负荷异常的采样点,然后根据用电负荷异常的采样点的各主导影响因素的权值,判断该采样点采集的异常用电负荷为坏值还是由于突发事件引起的负荷突变,当该采样点采集的异常用电负荷为坏值时,则删除该异常用电负荷,当该采样点采集的异常用电负荷为由于突发事件引起的负荷突变时,则保存该异常用电负荷,通过去除坏值,以提高后续负荷预测的准确率。
S101,利用预设的聚类算法,根据各用户的用电历史数据对各用户的负荷进行聚类,得各用户的负荷水平和负荷曲线形状;
同一用户的用电负荷数据之间存在关联性和相似性,同一用户的用电历史数据中隐藏着该用户的用电行为习惯,对这些用电负荷数据进行挖掘并研究用户类型,可以帮助电网了解用户的个性化,并为预测模型的选择提供数据支撑。
在本发明中的用电行为分析借助聚类技术,例如可以采用基于SOM的聚类算法,SOM神经网络是由芬兰神经网络专家Kohonen教授提出的,该算法假设在输入对象中存在一些拓扑结构或顺序,可以实现从输入空间(n维)到输出平面(2维)的降维映射,其映射具有拓扑特征保持性质,与实际的大脑处理有很强的理论联系。聚类过程的流程主要包括以下步骤:
1)网络初始化,对输出层每个节点的权重赋初值;
2)从输入样本中随机选取输入向量,找到与输入向量距离最小的权重向量;
3)定义获胜单元,在获胜单元的邻近区域调整权重使其向输入向量靠拢;
4)提供新样本,并进行训练;
5)收缩邻域半径、减小学习率、重复,直到小于允许值,输出聚类结果。
如图2所示,根据用户的用电历史数据,可以绘出用户的负荷曲线样本,对负荷曲线样本进行聚类,可以得到图2中右侧的聚类结果。
S102,根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式;
所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式;
通过各用户的日平均负荷表示各用户的负荷水平,再根据各用户的日平均负荷得到各用户的负荷水平波动幅度,其中,每用户的负荷水平波动幅度通过以下公式得到:
其中,为第i天的日平均负荷,为第j天的日平均负荷,N为参与聚类分析的负荷天数,M为用电模式下包含的负荷天数;
根据各用户的负荷曲线形状,得各用户的负荷曲线相似度rij,其中,
其中,Xik为第i天第k个采样点的负荷标幺值,Xjk为第j天第k个采样点的负荷标幺值,k=1~m,Xik及Xjk均为非负数,且 为第i天第k个负荷点的负荷值,为第j天第k个负荷点的负荷值。
最后按照表1根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式;
表1
用电模式的确定为预测模型的选择提供了依据,不同用电模式表示负荷的变化规律差异,负荷波动较小的可选用时间序列模型,负荷呈线性增长趋势的可选用回归模型,负荷波动大的,需进一步依据波动类型选取考虑相关影响因素的模式识别模型或神经网络模型。
S103,根据各用户的用电模式,选择各用户负荷的预测模型;
具体的,当用户的用电模式为稳定模式时,选取ARIMA模型或一元线性回归模型作为用户负荷的预测模型;当用户的用电模式为第一波动模式、第二波动模式或第三波动模式时,则选取模式识别模型或神经网络模型作为用户负荷的预测模型。
S104,根据各用户的用电历史数据构建各用户负荷的影响因素集合;
具体的,用电负荷主要受以下因素影响包括天气情况、日期类型及社会事件等。影响因素根据类型和作用效果两个维度的耦合共同起作用,根据影响因素的作用效果,可分为直接影响因素和间接影响因素,本发明中直接因素为影响因素在当日发生作用,间接因素为影响因素超前、滞后或累积发生作用;依据类型划分,如日期类型和气象类型,还可以是以上两种情况的组合,如表2所示。为对各影响因素进行耦合,需要建立他们之间的耦合关系,形成一个“影响因素集合”,建立影响因素集合将打破传统只考虑某一或某几个因素,导致影响因素考虑不够全面的问题。
表2
本发明中负荷预测的影响因素主要包括日分类(正常日、国庆、春节等)、星期类型(周一~周日)、农历类型(农历日期、农历节气等)、前(后)第几天(超前或滞后天数)、日期差(两日之间相距的天数)、日天气情况(晴、阴等)、日气象类型(气温、降雨量、湿度、风速等)、日气象特征值(最高温度、平均温度、最低温度等)、逐小时气象及累积多天(累积效应天数)等。
因此某一日的影响因素集合为{正常日,节假日,星期类型,农历日期,节假日前第几天,节假日后第几天,与待预测日相距几天,天气情况,日气象特征值,逐时气象,前n天的气象,前n天的气象累积值}。影响因素集合是一个全面的、规范化的表征体系,尽可能的考虑了各种相关因素的直接、间接和耦合影响,既可以指导预测人员构造新的短期负荷预测方法,也可以对各种现有的预测方法进行改造,使之可以涉及各种因素的影响。
关联规则是指反映事物之间依赖或关联的知识,关联模型就是数据项之间的关联规则。关联规则的一般形式是:如果A发生,则B有c%的可能性发生,c称为关联规则的可信度。影响因素集合的关联分析发现关联规则,这些规则展示影响因素-负荷值频繁地在给定数据集中一起出现的条件。
具体的,关联规则是形如 的规则;其中,Ai(i∈{1,...,m}),Bj(j∈{1,...,n})是影响因素-负荷值对。关联规则解释为“满足X中条件的数据库元组多半也满足Y中的条件”。
S105,对构建的各用户负荷的影响因素集合进行关联分析,筛选出若干对负荷产生强关联的主导影响因素,然后通过筛选出的各主导影响因素构建影响因素子集,同时对各主导影响因素赋予权值;
通过影响因素与负荷值的关联分析,可以筛选出对负荷产生强关联的影响因素子集(由若干主导影响因素构成),为下一步构建影响因素间的耦合关系提供数据支撑,降低预测模型的复杂度,同时有效缩小影响因素的考虑范围,减少相应数据处理工作量。
影响因素分析结论用于预测模型参数的选择和优化,对待预测日的日类型、气温、降水量以及历史上前天和昨天最高气温均有影响的用户,在预测参数选择上需考虑以上5个因素,并对主导影响因素赋予较大的权值。
在图3中,14时负荷共被分为5类,每一类代表不同的气象条件及工作日类型。以第5个节点为例,满足如下条件才可被认为属于节点5:待预测日5时的温度大于24℃;属于双休日;待预测日前一日20时的温度大于28℃。由此可见,节点5代表的是双休日且温度较高的情况。这一般发生在夏天,主要集中在七八月份。
采用上述方法,还可将气温进一步扩展到湿度、降雨量、日照小时数、天气情况的描述等,具体本实施例不作限定。
S106,利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化,然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值;
S107,根据各用户在待预测时间的用电负荷预测值以及系统网损,得到系统在待预测时间的总用电负荷预测值,完成基于大数据技术的短期负荷预测。
根据上述描述可知,用电负荷预测主要分为3个过程:用户用电信息采集系统的负荷数据整合、数据处理架构以及用电负荷预测,负荷数据整合主要完成对居民、工业及商业等用户用电信息采集数据的抽取,本发明中数据处理架构可以采用Hadoop数据处理架构,在抽取用户信息采集数据后,如图4所示,可以将这些用户的用电负荷数据都输入Hadoop的大数据处理模块,采用并行存储和并行计算技术,实现多用户、多日的数据存储和计算,具体实现流程如图5所示。
采用上述方式,可以通过网络分布式连接多台PC计算机,能够利用已有的普通计算资源,完成对大规模用户用电负荷数据的高效处理。例如,可以利用MapReduce并行方法处理用户的用电负荷数据,通过对某地区120万用户一年的负荷数据的应用测试,结果表明:分布式计算方法通过连接多计算节点,能够有效地提升用户的用电负荷数据的计算效率,而且计算节点对计算性能的影响非常明显,通过添加节点能够实现对性能的提升,解决用采数据分析计算的性能瓶颈。
采用本发明,以某地区的负荷为例,共收集120万用户的负荷数据,采样时间范围为2012-01-01—2012-12-31,采样间隔为15min,每个用户每天采样96点数据,将这些数据去除噪声(有些采样点为空值)后全部作为实验数据,以此为基础进行短期负荷预测研究。
借助大数据分析架构,在用户的用电负荷预测基础上,考虑系统网损,累加得到系统负荷,统计其预测精度,预测精度达到97.6%,与基于系统负荷的预测方法相比提高2.1个百分点,如图6所示。
如图6所示,采用本发明提供的基于大数据技术的负荷预测效果具有明显优势,由于预测对象的细分、考虑影响因素的全面性以及数据挖掘结论的准确性,使得更加容易精确定位负荷波动的真正源头,克服系统负荷预测无法跟踪具体用户用电负荷变化的缺陷。
另外,本发明还公开了一种基于大数据技术的短期负荷预测系统,所述基于大数据技术的短期负荷预测系统包括:
历史数据获取模块1,用于获取系统中各用户的用电历史数据;聚类模块2,与历史数据获取模块1相连接,用于利用预设的聚类算法,根据各用户的用电历史数据对各用户的负荷进行聚类,得各用户的负荷水平和负荷曲线形状;用电模式确定模块3,与聚类模块2相连接,用于根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式;预测模型选择模块4,与用电模式确定模块3相连接,用于根据各用户的用电模式,选择各用户负荷的预测模型;影响因素确定模块5,与历史数据获取模块1相连接,用于根据各用户的用电历史数据构建各用户负荷的影响因素集合;影响规则确定模块6,与影响因素确定模块5相连接,用于对构建的各用户负荷的影响因素集合进行关联分析,筛选出若干对负荷产生强关联的主导影响因素,然后通过筛选出的各主导影响因素构建影响因素子集,同时对各主导影响因素赋予权值;预测模块7,与影响规则确定模块6及预测模型选择模块4相连接,用于利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化,然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值;累加模块8,与预测模块7相连接,用于根据各用户在待预测时间的用电负荷预测值以及系统网损,得到系统在待预测时间的总用电负荷预测值,完成基于大数据技术的短期负荷预测。
本发明还包括:异常点分析模块,用于对各用户的用电历史数据进行分析,找出用电负荷异常的采样点;异常点判断模块,与异常点分析模块相连接,用于根据该采样点对应的各主导影响因素的权值,判断该采样点采集的异常用电负荷为坏值还是由于突发事件引起的负荷突变;异常点处理模块,与异常点判断模块相连接,用于当该采样点采集的异常用电负荷为坏值时,则删除该异常用电负荷,当该采样点采集的异常用电负荷为由于突发事件引起的负荷突变时,则保存该异常用电负荷。
所述用电模式确定模块3包括:
负荷水平波动幅度确定单元,与聚类模块2相连接,用于通过各用户的日平均负荷表示各用户的负荷水平,再根据各用户的日平均负荷得到各用户的负荷水平波动幅度,其中,每用户的负荷水平波动幅度通过以下公式得到:
其中,为第i天的日平均负荷,为第j天的日平均负荷,N为参与聚类分析的负荷天数,M为用电模式下包含的负荷天数;
负荷曲线相似度确定单元,与聚类模块2相连接,用于根据各用户的负荷曲线形状,得各用户的负荷曲线相似度rij,其中,
其中,Xik为第i天第k个采样点的负荷标幺值,Xjk为第j天第k个采样点的负荷标幺值,k=1~m,Xik及Xjk均为非负数,且
用电模式确定单元,与负荷水平波动幅度确定单元及负荷曲线相似度确定单元相连接,用于根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式。
所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式;另外,按照表1根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式。
另外,需要说明的是,本发明所述基于大数据技术的短期负荷预测系统中各模块的工作过程中在本发明所述的基于大数据技术的短期负荷预测方法中均以介绍,对此不再说明。
本发明借助大数据的技术架构,研究了利用用电信息采集数据实现短期负荷预测,基于大数据的存储和计算能力为海量数据的处理提供了基础。综合考虑影响因素的类型与作用效果,构建了影响因素集合,并将数据挖掘技术应用到用户用电规律分析和影响因素分析中,为提升预测模型的适用性奠定了基础,实验结果表明本发明提出的短期负荷预测技术路线是可行的。
与传统方法有所不同,本发明提供了在短期负荷预测对象上基于用户的预测方案,并将大数据技术引入到负荷预测领域,可以更深入的了解负荷特性的变化规律,指导短期负荷预测工作做好了铺垫,将更加有利于提高调度部门的负荷预测工作效率。
需要说明的是,对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明所必需的。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于大数据技术的短期负荷预测方法,其特征在于,包括以下步骤:
获取系统中各用户的用电历史数据;
利用预设的聚类算法,根据各用户的用电历史数据对各用户的负荷进行聚类,得各用户的负荷水平和负荷曲线形状;
根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式;
根据各用户的用电模式,选择各用户负荷的预测模型;
根据各用户的用电历史数据构建各用户负荷的影响因素集合;
对构建的各用户负荷的影响因素集合进行关联分析,筛选出若干对负荷产生强关联的主导影响因素,然后通过筛选出的各主导影响因素构建影响因素子集,同时对各主导影响因素赋予权值;
利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化,然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值;
根据各用户在待预测时间的用电负荷预测值及系统网损,得到系统在待预测时间的总用电负荷预测值,完成基于大数据技术的短期负荷预测。
2.根据权利要求1所述的基于大数据技术的短期负荷预测方法,其特征在于,还包括:
对各用户的用电历史数据进行分析,找出用电负荷异常的采样点;
根据该采样点对应的各主导影响因素的权值,判断该采样点采集的异常用电负荷为坏值还是由于突发事件引起的负荷突变;
当该采样点采集的异常用电负荷为坏值时,则删除该异常用电负荷,当该采样点采集的异常用电负荷为由于突发事件引起的负荷突变时,则保存该异常用电负荷。
3.根据权利要求1或2所述的基于大数据技术的短期负荷预测方法,其特征在于,根据聚类得到的各用户的负荷水平和负荷曲线形状确定各用户的用电模式具体包括以下步骤:
通过各用户的日平均负荷表示各用户的负荷水平,再根据各用户的日平均负荷得到各用户的负荷水平波动幅度,其中,每用户的负荷水平波动幅度通过以下公式得到:
其中,为第i天的日平均负荷,为第j天的日平均负荷,N为参与聚类分析的负荷天数,M为用电模式下包含的负荷天数;
根据各用户的负荷曲线形状,得各用户的负荷曲线相似度rij,其中,
其中,Xik为第i天第k个采样点的负荷标幺值,Xjk为第j天第k个采样点的负荷标幺值,k=1~m,Xik及Xjk均为非负数;
根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式。
4.根据权利要求3所述的基于大数据技术的短期负荷预测方法,其特征在于,所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式;
按照下表根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式;
5.根据权利要求4所述的基于大数据技术的短期负荷预测方法,其特征在于,当用户的用电模式为稳定模式时,选取ARIMA模型或一元线性回归模型作为用户负荷的预测模型;当用户的用电模式为第一波动模式、第二波动模式或第三波动模式时,则选取模式识别模型或神经网络模型作为用户负荷的预测模型。
6.根据权利要求1或2所述的基于大数据技术的短期负荷预测方法,其特征在于,各用户负荷的影响因素集合中的影响因素包括正常日、节假日、星期类型、农历日期、节假日前第几天、节假日后第几天、与待预测日相距几天、天气情况、日气象特征值、逐时气象、前n天的气象及前n天的气象累积值。
7.一种基于大数据技术的短期负荷预测系统,其特征在于,包括:
历史数据获取模块(1),用于获取系统中各用户的用电历史数据;
聚类模块(2),与历史数据获取模块(1)相连接,用于利用预设的聚类算法,根据各用户的用电历史数据对各用户的负荷进行聚类,得各用户的负荷水平和负荷曲线形状;
用电模式确定模块(3),与聚类模块(2)相连接,用于根据聚类得到的各用户的负荷水平和负荷曲线形状确定用户的用电模式;
预测模型选择模块(4),与用电模式确定模块(3)相连接,用于根据各用户的用电模式,选择各用户负荷的预测模型;
影响因素确定模块(5),与历史数据获取模块(1)相连接,用于根据各用户的用电历史数据构建各用户负荷的影响因素集合;
影响规则确定模块(6),与影响因素确定模块(5)相连接,用于对构建的各用户负荷的影响因素集合进行关联分析,筛选出若干对负荷产生强关联的主导影响因素,然后通过筛选出的各主导影响因素构建影响因素子集,同时对各主导影响因素赋予权值;
预测模块(7),与影响规则确定模块(6)及预测模型选择模块(4)相连接,用于利用影响因素子集中各主导影响因素及其权值对各用户负荷的预测模型的参数进行选择及优化,然后再根据各用户负荷的预测模型预测各用户在待预测时间的用电负荷预测值;
累加模块(8),与预测模块(7)相连接,用于根据各用户在待预测时间的用电负荷预测值以及系统网损,得到系统在待预测时间的总用电负荷预测值,完成基于大数据技术的短期负荷预测。
8.根据权利要求7所述的基于大数据技术的短期负荷预测系统,其特征在于,还包括:
异常点分析模块,用于对各用户的用电历史数据进行分析,找出用电负荷异常的采样点;
异常点判断模块,与异常点分析模块相连接,用于根据该采样点对应的各主导影响因素的权值,判断该采样点采集的异常用电负荷为坏值还是由于突发事件引起的负荷突变;
异常点处理模块,与异常点判断模块相连接,用于当该采样点采集的异常用电负荷为坏值时,则删除该异常用电负荷,当该采样点采集的异常用电负荷为由于突发事件引起的负荷突变时,则保存该异常用电负荷。
9.根据权利要求7或8所述的基于大数据技术的短期负荷预测系统,其特征在于,所述用电模式确定模块(3)包括:
负荷水平波动幅度确定单元,与聚类模块(2)相连接,用于通过各用户的日平均负荷表示各用户的负荷水平,再根据各用户的日平均负荷得到各用户的负荷水平波动幅度,其中,每用户的负荷水平波动幅度通过以下公式得到:
其中,为第i天的日平均负荷,为第j天的日平均负荷,N为参与聚类分析的负荷天数,M为用电模式下包含的负荷天数;
负荷曲线相似度确定单元,与聚类模块(2)相连接,用于根据各用户的负荷曲线形状,得各用户的负荷曲线相似度rij,其中,
其中,Xik为第i天第k个采样点的负荷标幺值,Xjk为第j天第k个采样点的负荷标幺值,k=1~m,Xik及Xjk均为非负数;
用电模式确定单元,与负荷水平波动幅度确定单元及负荷曲线相似度确定单元相连接,用于根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式。
10.根据权利要求9所述的基于大数据技术的短期负荷预测系统,其特征在于,所述用电模式包括稳定模式、第一波动模式、第二波动模式、第三波动模式和异常模式;
按照下表根据各用户的负荷水平波动幅度和各用户的负荷曲线相似度rij,确定各用户的用电模式;
CN201910750171.9A 2019-08-14 2019-08-14 基于大数据技术的短期负荷预测方法及系统 Active CN110503256B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910750171.9A CN110503256B (zh) 2019-08-14 2019-08-14 基于大数据技术的短期负荷预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910750171.9A CN110503256B (zh) 2019-08-14 2019-08-14 基于大数据技术的短期负荷预测方法及系统

Publications (2)

Publication Number Publication Date
CN110503256A true CN110503256A (zh) 2019-11-26
CN110503256B CN110503256B (zh) 2022-08-05

Family

ID=68587368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910750171.9A Active CN110503256B (zh) 2019-08-14 2019-08-14 基于大数据技术的短期负荷预测方法及系统

Country Status (1)

Country Link
CN (1) CN110503256B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110942195A (zh) * 2019-11-27 2020-03-31 广西电网有限责任公司 一种用电负荷预测方法及装置
CN111860985A (zh) * 2020-07-07 2020-10-30 国网天津市电力公司 基于负荷分解的日前电力负荷预测方法
CN111985701A (zh) * 2020-07-31 2020-11-24 国网上海市电力公司 一种基于供电企业大数据模型库的用电预测方法
CN112561193A (zh) * 2020-12-23 2021-03-26 上海亿边科技有限公司 一种基于fpga推断加速的ai智能电力负荷预测系统
CN112906931A (zh) * 2019-12-04 2021-06-04 国网电力科学研究院有限公司 一种电力现货市场下售电公司短期负荷的预测方法及系统
CN113792828A (zh) * 2021-11-18 2021-12-14 成都数联云算科技有限公司 基于深度学习的电网负荷预测方法、系统、设备及介质
CN114462783A (zh) * 2021-12-30 2022-05-10 昆明能讯科技有限责任公司 一种输电网分区分电压等级电力缺口计算的方法及系统
CN116760122A (zh) * 2023-08-21 2023-09-15 国网浙江省电力有限公司宁波供电公司 虚拟电厂资源管控方法、装置、计算机设备及存储介质
CN116845878A (zh) * 2023-07-10 2023-10-03 杭州齐智能源科技股份有限公司 一种用于微电网用电负荷预测方法
CN117094754A (zh) * 2023-10-20 2023-11-21 国网(天津)综合能源服务有限公司 一种结合宏观微观的中长期电量预测方法
CN117895659A (zh) * 2024-03-14 2024-04-16 山东理工大学 一种智能电网自动化调度方法及系统
CN117895659B (zh) * 2024-03-14 2024-05-31 山东理工大学 一种智能电网自动化调度方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120095608A1 (en) * 2009-07-14 2012-04-19 Yoshiki Murakami Demand prediction apparatus, and computer readable, non-transitory storage medium
CN104200277A (zh) * 2014-08-12 2014-12-10 南方电网科学研究院有限责任公司 一种中长期电力负荷预测模型建立方法
CN105069525A (zh) * 2015-07-30 2015-11-18 广西大学 全天候96点日负荷曲线预测及优化修正系统
US20160169202A1 (en) * 2013-05-03 2016-06-16 State Grid Corporation Of China Short-term operation optimization method of electric power system including large-scale wind power
CN106204162A (zh) * 2016-07-26 2016-12-07 郑州郑大智能科技股份有限公司 一种互联网环境下新入网电力用户用电模式预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120095608A1 (en) * 2009-07-14 2012-04-19 Yoshiki Murakami Demand prediction apparatus, and computer readable, non-transitory storage medium
US20160169202A1 (en) * 2013-05-03 2016-06-16 State Grid Corporation Of China Short-term operation optimization method of electric power system including large-scale wind power
CN104200277A (zh) * 2014-08-12 2014-12-10 南方电网科学研究院有限责任公司 一种中长期电力负荷预测模型建立方法
CN105069525A (zh) * 2015-07-30 2015-11-18 广西大学 全天候96点日负荷曲线预测及优化修正系统
CN106204162A (zh) * 2016-07-26 2016-12-07 郑州郑大智能科技股份有限公司 一种互联网环境下新入网电力用户用电模式预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ZHANG LIN等: ""Short-Term Load Forcasting Based on Big Data Technologies"", 《APPLIED MECHANICS AND MATERIALS》 *
朱祥和: "考虑气象因素的短期负荷预测模型研究", 《数学的实践与认识》 *
栗然等: "影响电力系统短期负荷预测因素的权重分析方法", 《华北电力大学学报(自然科学版)》 *
王志勇: ""数据挖掘方法在短期负荷预测中的应用研究"", 《中国优秀博硕士学位论文全文数据库(博士)工程科技Ⅱ辑》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110942195A (zh) * 2019-11-27 2020-03-31 广西电网有限责任公司 一种用电负荷预测方法及装置
CN112906931A (zh) * 2019-12-04 2021-06-04 国网电力科学研究院有限公司 一种电力现货市场下售电公司短期负荷的预测方法及系统
CN111860985A (zh) * 2020-07-07 2020-10-30 国网天津市电力公司 基于负荷分解的日前电力负荷预测方法
CN111860985B (zh) * 2020-07-07 2022-04-01 国网天津市电力公司 基于负荷分解的日前电力负荷预测方法
CN111985701A (zh) * 2020-07-31 2020-11-24 国网上海市电力公司 一种基于供电企业大数据模型库的用电预测方法
CN111985701B (zh) * 2020-07-31 2024-03-01 国网上海市电力公司 一种基于供电企业大数据模型库的用电预测方法
CN112561193A (zh) * 2020-12-23 2021-03-26 上海亿边科技有限公司 一种基于fpga推断加速的ai智能电力负荷预测系统
CN113792828A (zh) * 2021-11-18 2021-12-14 成都数联云算科技有限公司 基于深度学习的电网负荷预测方法、系统、设备及介质
CN114462783A (zh) * 2021-12-30 2022-05-10 昆明能讯科技有限责任公司 一种输电网分区分电压等级电力缺口计算的方法及系统
CN116845878B (zh) * 2023-07-10 2024-01-26 杭州齐智能源科技股份有限公司 一种用于微电网用电负荷预测方法
CN116845878A (zh) * 2023-07-10 2023-10-03 杭州齐智能源科技股份有限公司 一种用于微电网用电负荷预测方法
CN116760122B (zh) * 2023-08-21 2023-12-26 国网浙江省电力有限公司宁波供电公司 虚拟电厂资源管控方法、装置、计算机设备及存储介质
CN116760122A (zh) * 2023-08-21 2023-09-15 国网浙江省电力有限公司宁波供电公司 虚拟电厂资源管控方法、装置、计算机设备及存储介质
CN117094754A (zh) * 2023-10-20 2023-11-21 国网(天津)综合能源服务有限公司 一种结合宏观微观的中长期电量预测方法
CN117094754B (zh) * 2023-10-20 2024-02-27 国网(天津)综合能源服务有限公司 一种结合宏观微观的中长期电量预测方法
CN117895659A (zh) * 2024-03-14 2024-04-16 山东理工大学 一种智能电网自动化调度方法及系统
CN117895659B (zh) * 2024-03-14 2024-05-31 山东理工大学 一种智能电网自动化调度方法及系统

Also Published As

Publication number Publication date
CN110503256B (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN110503256A (zh) 基于大数据技术的短期负荷预测方法及系统
CN113962364B (zh) 一种基于深度学习的多因素用电负荷预测方法
CN110610280B (zh) 一种电力负荷短期预测方法、模型、装置及系统
US11043808B2 (en) Method for identifying pattern of load cycle
CN112561156A (zh) 基于用户负荷模式分类的短期电力负荷预测方法
CN110705760A (zh) 一种基于深度置信网络的光伏发电功率预测方法
US20210326696A1 (en) Method and apparatus for forecasting power demand
CN105868887A (zh) 一种基于分项计量的楼宇综合能效分析方法
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN115907822A (zh) 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法
CN109858667A (zh) 一种基于雷电气候对负荷影响的短期负荷聚类方法
CN113837434A (zh) 太阳能光伏发电预测方法、装置、电子设备和存储介质
CN114091776A (zh) 一种基于K-means的多分支AGCNN短期电力负荷预测方法
Zhang et al. Hybrid Model for Renewable Energy and Load Forecasting Based on Data Mining and EWT
CN112132344A (zh) 一种基于相似日和frs-svm的短期风电功率预测方法
Zhang et al. Short-term load forecasting based on big data technologies
CN116470491A (zh) 基于copula函数的光伏功率概率预测方法及系统
CN113837486B (zh) 一种基于rnn-rbm的配网馈线长期负荷预测方法
Qin Software reliability prediction model based on PSO and SVM
CN110175705B (zh) 一种负荷预测方法及包含该方法的存储器、系统
CN111860634A (zh) 基于OCHNN-Kmeans算法的负荷聚类方法
Wang et al. Analysis of user’s power consumption behavior based on k-means
CN111680818A (zh) 一种短期无功负荷预测方法和系统
Chen et al. Research on power consumption behavior analysis based on power big data
CN109784632B (zh) 一种工商业用户的中断响应特性挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231110

Address after: 566, 5th Floor, No. 22 Zhongguancun Street, Haidian District, Beijing, 100190

Patentee after: BEIJING SGITG-ACCENTURE INFORMATION TECHNOLOGY Co.,Ltd.

Patentee after: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Patentee after: State Grid Siji Location Service Co.,Ltd.

Address before: Room B209, 1st floor, No. 8, 29 Wangxi Road, Northeast of Zhongguancun Software Park, Haidian District, Beijing, 100193

Patentee before: BEIJING SGITG-ACCENTURE INFORMATION TECHNOLOGY Co.,Ltd.

Patentee before: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

TR01 Transfer of patent right