CN115829272A - 一种行业电量需求关键影响因素提取方法 - Google Patents

一种行业电量需求关键影响因素提取方法 Download PDF

Info

Publication number
CN115829272A
CN115829272A CN202211571460.0A CN202211571460A CN115829272A CN 115829272 A CN115829272 A CN 115829272A CN 202211571460 A CN202211571460 A CN 202211571460A CN 115829272 A CN115829272 A CN 115829272A
Authority
CN
China
Prior art keywords
electric quantity
industry
influence factor
data set
key influence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211571460.0A
Other languages
English (en)
Other versions
CN115829272B (zh
Inventor
袁健华
顾彬仕
黄霆
黄峰
丁小叶
陈赛赛
罗云
江陈桢
徐华泽
钱凌寒
袁贝尔
吴杰
李伟伦
徐凌子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co
Original Assignee
Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co filed Critical Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co
Priority to CN202211571460.0A priority Critical patent/CN115829272B/zh
Publication of CN115829272A publication Critical patent/CN115829272A/zh
Application granted granted Critical
Publication of CN115829272B publication Critical patent/CN115829272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种行业电量需求关键影响因素提取方法,补充了常规电量需求影响因素识别方法中仅使用一种数据挖掘方法的不足,且本发明提出的方法不是任取两种相关性分析方法然后随意组合,而是既考虑了数据之间的数理统计关系,又关注于电量时间序列的曲线发展规律,遵循了电量发展的客观规律,为电量需求影响因素识别提取提供了新思路,更加科学而合理的挖掘出电量需求的关键影响因素,也能更加有效的进行电量需求预测工作,所提出的电量需求影响因素提取方法的核心是计算电量序列与影响因素序列之间的Pearson相关性系数和灰色关联系数,并按相交的逻辑关系获取到电量的关键影响因素。

Description

一种行业电量需求关键影响因素提取方法
技术领域
本发明涉及电力系统领域,具体为一种行业电量需求关键影响因素提取方法。
背景技术
电量预测作为配电网规划中的关键环节,直接影响到变电站的定址选容、投资估算等重要工作。而在电量预测中仅依靠当地控规和历史电量数据会相对地偏离实际情况,无法适应远期电量增长的需求。因此为了进行更加准确、合理的电量预测工作,应该合理考虑电量需求的影响因素,对电网规划提供决策性建议。
电量具有众多的影响因素,虽然在电量预测等电网规划工作中存在着一些通用的影响因素,但是用电行为还存在着一定的地域性和差异性,如经济发达地区的用电量一定会高于经济落后的地区,人口密集地区的电量一定会大于人口稀疏的地区。同理,电量需求的影响因素也会因为行业的不同而不同。因此在进行电量预测等电网规划工作之前对影响因素要进行分析与筛选,得到影响较大的影响因素,更好为电网公司制定规划方案提供支撑。
目前关于电量需求影响因素的选取主要存在的问题为影响因素选取的准确性,即选取的影响因素是否真正能对电量需求产生较强的影响。因此电量需求关键影响因素的提取不仅要考虑专家学者的主观意见,还要结合对实际情况数理计算得到的客观结果。
发明内容
针对现有技术的不足,本发明提供了一种行业电量需求关键影响因素提取方法,以解决上述问题。
为实现以上目的,本发明通过以下技术方案予以实现。
一种行业电量需求关键影响因素提取方法,包括
(1)构建行业电量需求数据集、经济发展类指标数据集、自然气候类指标数据集、行业节能改造类数据集的数据集合;
(2)对行业电量及电量影响因素数据集合进行数据异常值的处理及无量纲化处理;
(3)利用Pearson相关性系数法电量影响因素与行业电量需求之间的相关性关系;
(4)利用灰色关联系数法分析电量影响因素与行业电量需求之间曲线相似程度;
(5)融会两种相关性分析的结果,提取行业电量需求关键影响因素;
补充了常规电量需求影响因素识别方法中仅使用一种数据挖掘方法的不足,且本发明提出的方法不是任取两种相关性分析方法然后随意组合,而是既考虑了数据之间的数理统计关系,又关注于电量时间序列的曲线发展规律,遵循了电量发展的客观规律,为电量需求影响因素识别提取提供了新思路,更加科学而合理的挖掘出电量需求的关键影响因素,也能更加有效的进行电量需求预测工作。
优选的,所述步骤(2)中,异常值识别的方式包括MAD异常值识别、IQA异常值识别、3S igama异常值识别,使用的MAD异常值识别的数学模型公式为:
MAD=median(|xi-xm|)(式1)。
优选的,其中,xi为数据集中第i个样本,xm为数据集的中位数,即MAD为二者差值绝对值的中位数,
使用拉格朗日插值算法对异常值进行处理,拉格朗日插值法步骤如下:
(1)输入电量时间序列的时间点X和对应的电量数据Y;
(2)计算n阶拉格朗日算法的基函数li(x),i=0,1,2,…n,
li(x),i=0,1,2,…n的计算表达式如下:
Figure BDA0003988235010000031
(3)计算n阶拉格朗日插值算法的插值函数Ln(x):
Figure BDA0003988235010000032
(4)输入插值点,通过阶拉格朗日公式就可得到相应负荷数据插值。
优选的,步骤(2)中,对电量数据集和影响因素数据集无量纲化处理有5种处理方式:标准差标准化、最大值标准化、总和标准化、最大-最小值标准化、小数定标标准化。
优选的,使用的最大值标准化法的数学模型公式为:
Figure BDA0003988235010000033
优选的,步骤(3)中,Pearson相关性系数法是定量计算数据集合中两两序列之间的相关性,Pearson相关性系数计算公式如下所示:
Figure BDA0003988235010000034
优选的,步骤(4)中,灰色关联系数是分析数据集合与电量序列曲线变化形状的相似度,关联系数ξ计算公式如式6,关联度计算公式如式7,
Figure BDA0003988235010000035
Figure BDA0003988235010000036
优选的,步骤(5)中,融会两种相关性分析的结果、提取行业电量需求关键影响因素的逻辑判断。
优选的,逻辑判断式为:If('R'≥0.8&'β'≥0.8,1,0)。
优选的,即为当且仅当某个影响因素与电量数据的两种相关性分析结果的值均大于0.8时,才判定该影响因素为电量数据的关键因素,所提出的电量需求影响因素提取方法的核心是计算电量序列与影响因素序列之间的Pearson相关性系数和灰色关联系数,并按相交的逻辑关系获取到电量的关键影响因素。
相比于现有技术而言,本发明公开了一种行业电量需求关键影响因素提取方法,补充了常规电量需求影响因素识别方法中仅使用一种数据挖掘方法的不足,且本发明提出的方法不是任取两种相关性分析方法然后随意组合,而是既考虑了数据之间的数理统计关系,又关注于电量时间序列的曲线发展规律,遵循了电量发展的客观规律,为电量需求影响因素识别提取提供了新思路,更加科学而合理的挖掘出电量需求的关键影响因素,也能更加有效的进行电量需求预测工作;
本发明所提出的电量需求影响因素提取方法的核心是计算电量序列与影响因素序列之间的Pearson相关性系数和灰色关联系数,并按相交的逻辑关系获取到电量的关键影响因素。
附图说明
图1为本发明行业电量需求关键影响因素提取方法的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
一种行业电量需求关键影响因素提取方法,包括
(1)构建行业电量需求数据集、经济发展类指标数据集、自然气候类指标数据集、行业节能改造类数据集的数据集合;
(2)对行业电量及电量影响因素数据集合进行数据异常值的处理及无量纲化处理;
(3)利用Pearson相关性系数法电量影响因素与行业电量需求之间的相关性关系;
(4)利用灰色关联系数法分析电量影响因素与行业电量需求之间曲线相似程度;
(5)融会两种相关性分析的结果,提取行业电量需求关键影响因素;
补充了常规电量需求影响因素识别方法中仅使用一种数据挖掘方法的不足,且本发明提出的方法不是任取两种相关性分析方法然后随意组合,而是既考虑了数据之间的数理统计关系,又关注于电量时间序列的曲线发展规律,遵循了电量发展的客观规律,为电量需求影响因素识别提取提供了新思路,更加科学而合理的挖掘出电量需求的关键影响因素,也能更加有效的进行电量需求预测工作。
所述步骤(2)中,异常值识别的方式包括MAD异常值识别、IQA异常值识别、3S igama异常值识别,使用的MAD异常值识别的数学模型公式为:
MAD=median(|xi-xm|) (式1)。
其中,xi为数据集中第i个样本,xm为数据集的中位数,即MAD为二者差值绝对值的中位数,
使用拉格朗日插值算法对异常值进行处理,拉格朗日插值法步骤如下:
(1)输入电量时间序列的时间点X和对应的电量数据Y;
(2)计算n阶拉格朗日算法的基函数li(x),i=0,1,2,…n,
li(x),i=0,1,2,…n的计算表达式如下:
Figure BDA0003988235010000051
(3)计算n阶拉格朗日插值算法的插值函数Ln(x):
Figure BDA0003988235010000061
(4)输入插值点,通过阶拉格朗日公式就可得到相应负荷数据插值。
步骤(2)中,对电量数据集和影响因素数据集无量纲化处理有5种处理方式:标准差标准化、最大值标准化、总和标准化、最大-最小值标准化、小数定标标准化。
使用的最大值标准化法的数学模型公式为:
Figure BDA0003988235010000062
步骤(3)中,Pearson相关性系数法是定量计算数据集合中两两序列之间的相关性,Pearson相关性系数计算公式如下所示:
Figure BDA0003988235010000063
步骤(4)中,灰色关联系数是分析数据集合与电量序列曲线变化形状的相似度,关联系数ξ计算公式如式6,关联度计算公式如式7,
Figure BDA0003988235010000064
Figure BDA0003988235010000065
步骤(5)中,融会两种相关性分析的结果、提取行业电量需求关键影响因素的逻辑判断。
逻辑判断式为:If('R'≥0.8&'β'≥0.8,1,0)。
即为当且仅当某个影响因素与电量数据的两种相关性分析结果的值均大于0.8时,才判定该影响因素为电量数据的关键因素,所提出的电量需求影响因素提取方法的核心是计算电量序列与影响因素序列之间的Pearson相关性系数和灰色关联系数,并按相交的逻辑关系获取到电量的关键影响因素。
通过电网内内部电量信息采集系统,获取电量数据,通过统计局年鉴获取到相关影响因素数据。下面结合附图和实际案例(本案例采用某市某行业电量历史数据,及同期经济数据、其气候类数据等。)对本发明进一步的说明。本方法包括以下步骤:
步骤一:对数据集合进行最大值标准化处理,表1列出电量数据和部分影响因素数据最大值化后的结果。采用最大值标准化可以最大程度的保留用电特性,并使各数据集在同一量纲下进行灰色关联分析。
表1
Figure BDA0003988235010000071
步骤二:对电量数据和影响因素数据计算Pearson相关系数,表2列出部分的电量数据和影响因素数据之间的Pearson相关性分析结果。
表2
Figure BDA0003988235010000072
Figure BDA0003988235010000081
步骤三:对电量数据和影响因素数据计算灰色关联系数,表3列出部分的电量数据和影响因素数据之间的灰色关联分析结果。
表3
Figure BDA0003988235010000082
Figure BDA0003988235010000091
步骤四:按照If('R'≥0.8&'β'≥0.8,1,0)的逻辑,表4为进一步提取电量的关键影响因素的结果。表中为1的影响因素均为电量的关键影响因素。
表4
Figure BDA0003988235010000092
Figure BDA0003988235010000101
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、工作、器件、组件和/或它们的组合。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施方式能够以除了在这里图示或描述的那些以外的顺序实施。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种行业电量需求关键影响因素提取方法,其特征在于:包括
(1)构建行业电量需求数据集、经济发展类指标数据集、自然气候类指标数据集、行业节能改造类数据集的数据集合;
(2)对行业电量及电量影响因素数据集合进行数据异常值的处理及无量纲化处理;
(3)利用Pearson相关性系数法电量影响因素与行业电量需求之间的相关性关系;
(4)利用灰色关联系数法分析电量影响因素与行业电量需求之间曲线相似程度;
(5)融会两种相关性分析的结果,提取行业电量需求关键影响因素。
2.根据权利要求1所述的行业电量需求关键影响因素提取方法,其特征在于:所述步骤(2)中,异常值识别的方式包括MAD异常值识别、IQA异常值识别、3Sigama异常值识别,使用的MAD异常值识别的数学模型公式为:
MAD=median(|xi-xm|) (式1)。
3.根据权利要求2所述的行业电量需求关键影响因素提取方法,其特征在于:其中,xi为数据集中第i个样本,xm为数据集的中位数,即MAD为二者差值绝对值的中位数,
使用拉格朗日插值算法对异常值进行处理,拉格朗日插值法步骤如下:
(1)输入电量时间序列的时间点X和对应的电量数据Y;
(2)计算n阶拉格朗日算法的基函数li(x),i=0,1,2,…n,li(x),i=0,1,2,…n的计算表达式如下:
Figure FDA0003988233000000011
(3)计算n阶拉格朗日插值算法的插值函数Ln(x):
Figure FDA0003988233000000012
(4)输入插值点,通过阶拉格朗日公式就可得到相应负荷数据插值。
4.根据权利要求1所述的行业电量需求关键影响因素提取方法,其特征在于:步骤(2)中,对电量数据集和影响因素数据集无量纲化处理有5种处理方式:标准差标准化、最大值标准化、总和标准化、最大-最小值标准化、小数定标标准化。
5.根据权利要求4所述的行业电量需求关键影响因素提取方法,其特征在于:使用的最大值标准化法的数学模型公式为:
Figure FDA0003988233000000021
6.根据权利要求1所述的行业电量需求关键影响因素提取方法,其特征在于:步骤(3)中,Pearson相关性系数法是定量计算数据集合中两两序列之间的相关性,Pearson相关性系数计算公式如下所示:
Figure FDA0003988233000000022
7.根据权利要求1所述的行业电量需求关键影响因素提取方法,其特征在于:步骤(4)中,灰色关联系数是分析数据集合与电量序列曲线变化形状的相似度,关联系数ξ计算公式如式6,关联度计算公式如式7,
Figure FDA0003988233000000023
Figure FDA0003988233000000024
8.根据权利要求1所述的行业电量需求关键影响因素提取方法,其特征在于:步骤(5)中,融会两种相关性分析的结果、提取行业电量需求关键影响因素的逻辑判断。
9.根据权利要求8所述的行业电量需求关键影响因素提取方法,其特征在于:逻辑判断式为:If('R'≥0.8&'β'≥0.8,1,0)。
10.根据权利要求9所述的行业电量需求关键影响因素提取方法,其特征在于:即为当且仅当某个影响因素与电量数据的两种相关性分析结果的值均大于0.8时,才判定该影响因素为电量数据的关键因素。
CN202211571460.0A 2022-12-08 2022-12-08 一种行业电量需求关键影响因素提取方法 Active CN115829272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211571460.0A CN115829272B (zh) 2022-12-08 2022-12-08 一种行业电量需求关键影响因素提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211571460.0A CN115829272B (zh) 2022-12-08 2022-12-08 一种行业电量需求关键影响因素提取方法

Publications (2)

Publication Number Publication Date
CN115829272A true CN115829272A (zh) 2023-03-21
CN115829272B CN115829272B (zh) 2023-07-28

Family

ID=85544620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211571460.0A Active CN115829272B (zh) 2022-12-08 2022-12-08 一种行业电量需求关键影响因素提取方法

Country Status (1)

Country Link
CN (1) CN115829272B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017208952A (ja) * 2016-05-19 2017-11-24 株式会社日立製作所 需給運用支援装置および需給運用支援方法
CN110210740A (zh) * 2019-05-22 2019-09-06 广西电网有限责任公司电力科学研究院 一种考虑供电质量的配电网可靠性评估方法
CN110991739A (zh) * 2019-11-29 2020-04-10 南方电网能源发展研究院有限责任公司 一种行业电量需求预测模型的构建方法及预测方法
CN113393028A (zh) * 2021-06-10 2021-09-14 国网江苏省电力有限公司南通供电分公司 一种基于数据挖掘技术的负荷预测方法
CN113888047A (zh) * 2021-11-08 2022-01-04 国网四川省电力公司经济技术研究院 考虑区域投资能力的技改项目投资规模预测方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017208952A (ja) * 2016-05-19 2017-11-24 株式会社日立製作所 需給運用支援装置および需給運用支援方法
CN110210740A (zh) * 2019-05-22 2019-09-06 广西电网有限责任公司电力科学研究院 一种考虑供电质量的配电网可靠性评估方法
CN110991739A (zh) * 2019-11-29 2020-04-10 南方电网能源发展研究院有限责任公司 一种行业电量需求预测模型的构建方法及预测方法
CN113393028A (zh) * 2021-06-10 2021-09-14 国网江苏省电力有限公司南通供电分公司 一种基于数据挖掘技术的负荷预测方法
CN113888047A (zh) * 2021-11-08 2022-01-04 国网四川省电力公司经济技术研究院 考虑区域投资能力的技改项目投资规模预测方法及系统

Also Published As

Publication number Publication date
CN115829272B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN116646933A (zh) 一种基于大数据的电力负荷调度方法及系统
CN108694470B (zh) 一种基于人工智能的数据预测方法及装置
CN105046591A (zh) 一种电力用户用电能效评估方法
Shi et al. Improving power grid monitoring data quality: An efficient machine learning framework for missing data prediction
Ye et al. Passenger flow prediction in bus transportation system using ARIMA models with big data
CN112417627A (zh) 一种基于四维指标体系配电网运行可靠性分析方法
CN113850475A (zh) 一种基于大数据的生产设备性能评估系统
CN117494906B (zh) 一种基于多元时间序列的天然气日负荷预测方法
CN114118588A (zh) 聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法
CN113112090B (zh) 基于综合互信息度的主成分分析的空间负荷预测方法
CN109711621A (zh) 基于判别分析和支持向量机结合的工业园区负荷预测方法
CN115829272A (zh) 一种行业电量需求关键影响因素提取方法
CN112288278A (zh) 一种基于知识图谱的设备资产管理方法
CN116796906A (zh) 基于数据融合的电力配电网投资预测分析系统及方法
CN114372835B (zh) 综合能源服务潜力客户识别方法、系统及计算机设备
CN114168662A (zh) 一种基于多数据源的配电网问题梳理分析方法及系统
CN114048592A (zh) 一种精轧全流程分布式运行性能评估及非优原因追溯方法
Farshchian et al. Stock market prediction with hidden markov model
CN108123436B (zh) 基于主成分分析和多元回归算法的电压越限预测模型
CN114254806A (zh) 配电网重过载预警方法、装置、计算机设备和存储介质
Zhu et al. A carbon efficiency upgrading method for mechanical machining based on scheduling optimization strategy
KR20170023547A (ko) 기업금융 조기경보 방법
Ugarte et al. Characterization of load curves in a real distribution system based on K-MEANS algorithm with time-series data
CN110689241A (zh) 一种基于大数据的电网实物资产评价系统
Shiwakoti et al. Time Series Analysis of Electricity Demand Forecasting Using Seasonal ARIMA and an Exponential Smoothing Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant