CN114781685B - 基于大数据挖掘技术的大用户用电负荷预测方法及系统 - Google Patents
基于大数据挖掘技术的大用户用电负荷预测方法及系统 Download PDFInfo
- Publication number
- CN114781685B CN114781685B CN202210262891.2A CN202210262891A CN114781685B CN 114781685 B CN114781685 B CN 114781685B CN 202210262891 A CN202210262891 A CN 202210262891A CN 114781685 B CN114781685 B CN 114781685B
- Authority
- CN
- China
- Prior art keywords
- load
- data
- load data
- electricity
- large user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 140
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000007418 data mining Methods 0.000 title claims abstract description 18
- 238000005516 engineering process Methods 0.000 title claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 238000003064 k means clustering Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 14
- 238000007405 data analysis Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000013524 data verification Methods 0.000 claims description 6
- 238000005065 mining Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 238000004138 cluster model Methods 0.000 claims description 4
- 230000005612 types of electricity Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 2
- 238000000556 factor analysis Methods 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/12—Circuit arrangements for ac mains or ac distribution networks for adjusting voltage in ac networks by changing a characteristic of the network load
- H02J3/14—Circuit arrangements for ac mains or ac distribution networks for adjusting voltage in ac networks by changing a characteristic of the network load by switching loads on to, or off from, network, e.g. progressively balanced loading
- H02J3/144—Demand-response operation of the power transmission or distribution network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Quality & Reliability (AREA)
- Power Engineering (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Operations Research (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于负荷预测技术领域,具体涉及一种基于大数据挖掘技术的大用户用电负荷预测方法及系统。通过对大用户历年数据进行影响用电负荷预测的因素分析,采用大数据挖掘技术挖掘影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,并构建目标函数对构建的大用户用电负荷预测模型进行动态调整,提高了针对大用户用电负荷的预测精度,并且构建的大用户用电负荷预测模型进行实时动态调整,确保了构建的大用户用电负荷预测模型的有效性和时效性、精确性。本发明采用K‑Means聚类算法分析影响用电负荷预测的因素,可以有效的将关联因素聚类,实现影响因素的精准分类。
Description
技术领域
本发明属于负荷预测技术领域,具体涉及一种基于大数据挖掘技术的大用户用电负荷预测方法及系统。
背景技术
用户是电网中的最基础组成部分,也是造成电网负荷波动的源头。然而,现今的负荷预测方法都是针对系统级的负荷预测,最深入的也不过是母线级别的预测。因此,研究一种针对用户级的负荷预测框架,并利用数据挖掘方法发掘用户用电行为规律,提高负荷预测的精度是十分必要的。
目前在针对开放售电环境下,供电企业期望增加与用户粘性,更加注重与用户的互动,用户的用电行为分析也是国际上的研究热点。通过对用户的用电行为进行数据化处理,可以对用户用电行为规律进行建模和挖掘,从而揭示与用户用电行为密切相关的属性,发现各类用户之间的隐含关系。而大用户的用电量一般比较大,基于大数据的大用户用电行为分析是供电企业了解用户的用户负荷模式特性的重要方法,研究大用户的用电负荷模式特征,有助于用电企业更深刻地认识大用户,并能够根据大用户群制定相应的市场策略、提供相应的个性化服务。在每年的调峰期间,都是通过负荷限制、行政分级限电等模式来进行错峰工作,还不能通过用户侧本身的用电需求急迫程度、用电经济效益等来进行科学合理的负荷预测以及调峰工作。研究大用户的用电行为可以为每年的调峰工作提供基础数据,然而目前对于大用户的用电行为分析不够精确,影响后续的大用户用电行为分析工作以及调峰工作。
发明内容
为了解决上述问题,本发明提供了一种基于大数据挖掘技术的大用户用电负荷预测方法及系统,具体技术方案如下:
一种基于大数据挖掘技术的大用户用电负荷预测方法,包括以下步骤:
S1:从营销系统获取大用户台账数据以及从计量系统获取该大用户n年历史用电负荷数据,并对用电负荷数据进行预处理;所述用电负荷数据包括用电负荷曲线;
S2:建立大用户台账数据与用电负荷数据的关联关系,对源端数据进行格式转换、分类存储、数据清洗;
S3:对获取的用电负荷数据进行基础数据分析和计算,得到负荷预测模型的影响因素;
S4:基于大数据挖掘技术,挖掘负荷影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,实现每个大用户用电负荷预测;
S5:构建大用户负荷数据验证模型,比较计算实际负荷与预测负荷的差值,动态调整大用户用电负荷预测模型。
优选地,所述步骤S1中对用电负荷数据进行预处理包括:剔除用电负荷曲线中的异常数据和重复数据,并对缺失的数据采用线性插值的方法进行补齐,所述线性插值的计算方法如下:求t时刻的大用户用电负荷y的方法如下:
其中,y0表示t0时刻的用电负荷,y1表示t1时刻的用电负荷。
优选地,所述步骤S3中得到负荷预测模型的影响因素具体包括以下步骤:
S31:将每个大用户的的用电负荷样本数据进行归一化处理,把所有数据转换为0~1之间的小数,具体公式为:
其中:y为用户用电负荷样本数据,y'为样本数据归一化处理后的值;
S32:根据K-Means聚类算法,基于大用户用电负荷归一化数据以及用电负荷曲线进行聚类分析;
1)设置初始聚类参数,即设置聚类结果中簇的个数K;
2)设置最大迭代次数;
3)聚类模型运行;
4)判断当聚类中心内的更改值为0.000时,模型达到收敛,否则返回步骤2),重新设置最大迭代次数;
5)当聚类模型结构收敛时,继续判断聚类是否满足业务要求,如果满足,则输出结果,如果不满足,则返回步骤1),重新设置聚类结果中簇的个数K。
优选地,所述构建大用户用电负荷预测模型具体包括以下步骤:
根据K-Means聚类算法得到的K类用电负荷数据,得到K个负荷预测模型的影响因素,并设置每类用电负荷数据的权重值,得到用电负荷预测模型为:
其中,yyc表示预测的用电负荷值,yoi表示第i类用电负荷数据的中心值,wi表示第i类用电负荷数据yi的权重系数,
优选地,所述权重系数wi的确定方法为:
优选地,所述步骤S5中大用户负荷数据验证模型具体为:
S51:采用K-Means聚类算法对每年的历史用电负荷数据分别进行聚类,得到每年的历史用电负荷数据的K类用电负荷数据;
S52:采用用电负荷预测模型计算每年的历史用电负荷数据,得到每年的历史用电负荷数据的预测值;
S53:计算每年的历史用电负荷数据的预测值与每年的历史用电负荷数据的真实值的差值;
S54:构件目标函数使得步骤S53中n年历史用电负荷数据的预测值与真实值的差值和最小,则对应的每类用电负荷数据的中心值与对应的权重达到最优组合。
优选地,所述步骤S54构建的目标函数F为:
其中,yycj为第j年历史用电负荷数据的预测值,yzsj为第j年历史用电负荷数据的真实值,yoji为第j年历史用电负荷数据聚类后第i类用电负荷数据的中心值。
一种基于大数据挖掘技术的大用户用电负荷预测系统,包括负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块;所述负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块依次连接;
所述负荷数据采集模块用于从营销系统采集获取大用户台账数据以及从计量系统获取该大用户历年的用电负荷数据;
所述负荷数据预处理模块用于对负荷数据采集模块采集的大用户历年的用电负荷数据进行预处理;
所述负荷数据处理模块用于对经过预处理后的大用户历年的用电负荷数据进行格式转换、分类存储、数据清洗;
所述负荷数据分析模块用于对经过处理后的大用户历年的用电负荷数据进行分析和计算得到负荷预测模型的影响因素;
所述负荷数据预测模块用于挖掘影响因素与大用户用电负荷的关系,并构建大用户用电负荷预测模型实现大用户用电负荷预测;
所述预测验证模块用于对负荷数据预测模块预测得到的大用户用电负荷预测模型进行验证。
本发明的有益效果为:本发明提供了一种基于大数据挖掘技术的大用户用电负荷预测方法及系统,通过对大用户历年数据进行影响用电负荷预测的因素分析,采用大数据挖掘技术挖掘影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,并构建目标函数对构建的大用户用电负荷预测模型进行动态调整,提高了针对大用户用电负荷的预测精度,并且构建的大用户用电负荷预测模型进行实时动态调整,确保了构建的大用户用电负荷预测模型的有效性和时效性、精确性。本发明采用K-Means聚类算法分析影响用电负荷预测的因素,可以有效的将关联因素聚类,实现影响因素的精准分类。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明的方法流程示意图;
图2为本发明的系统原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
一种基于大数据挖掘技术的大用户用电负荷预测方法,包括以下步骤:
S1:从营销系统获取大用户台账数据以及从计量系统获取该大用户n年历史用电负荷数据,并对用电负荷数据进行预处理;所述用电负荷数据包括用电负荷曲线;对用电负荷数据进行预处理包括:剔除用电负荷曲线中的异常数据和重复数据,并对缺失的数据采用线性插值的方法进行补齐,所述线性插值的计算方法如下:求t时刻的大用户用电负荷y的方法如下:
其中,y0表示t0时刻的用电负荷,y1表示t1时刻的用电负荷。对用电负荷数据进行预处理可以保证续步骤对数据计算分析的精确性。
S2:建立大用户台账数据与用电负荷数据的关联关系,对源端数据进行格式转换、分类存储、数据清洗;
S3:对获取的用电负荷数据进行基础数据分析和计算,得到负荷预测模型的影响因素;具体包括以下步骤:
S31:将每个大用户的的用电负荷样本数据进行归一化处理,把所有数据转换为0~1之间的小数,具体公式为:
其中:y为用户用电负荷样本数据,y'为样本数据归一化处理后的值;
S32:根据K-Means聚类算法,基于大用户用电负荷归一化数据以及用电负荷曲线进行聚类分析;
1)设置初始聚类参数,即设置聚类结果中簇的个数K;
2)设置最大迭代次数;
3)聚类模型运行;
4)判断当聚类中心内的更改值为0.000时,模型达到收敛,否则返回步骤2),重新设置最大迭代次数;
5)当聚类模型结构收敛时,继续判断聚类是否满足业务要求,如果满足,则输出结果,如果不满足,则返回步骤1),重新设置聚类结果中簇的个数K。采用K-Means聚类算法分析影响用电负荷预测的因素,可以有效的将关联因素聚类,实现影响因素的精准分类。
K-Means算法接受一个参数k用以决定结果中簇的数目。算法开始时,要在数据集中随机选择k个数据对象用来当做k个簇的初始中心,而将剩下的各个数据对象就根据他们和每个聚类簇心的距离选择簇心最近的簇分配到其中。然后重新计算各个聚类簇中的所有数据对象的平均值,并将得到的结果作为新的簇心;逐步重复上述的过程直至目标函数收敛为止。通常都是使用均方差函数作为目标函数,公式如下:
此公式中J为数据集合中所有数据与相应聚类中心的均方差的总和,D是数据对象,mi是簇的平均值(D和mi都是多维的)。在确定了数据集中聚类簇的预期数目k之后,该数字用来指定数据集中的k个种子点。并将各个种子点用作聚类的质心。数目k的确定既可以是主观的选择也可以是利用其它聚类技术得到的一个数。选好初始种子点之后,每个簇中没有其它的数据对象。下一步就是通过循环将剩余的点放到离种子点最近的簇之中去。有很多衡量聚类的方法,在此欧氏距离是一种比较常见的衡量数据点之间的距离的方法。然后就是簇心点重新计算,进而再一次对所有点进行所属簇的计算与划分。由于簇的中心点的移动(每次重新计算簇的中心点都有可能会改变中心点的位置直至中心点不变或者目标函数达到收敛为止)使得一些原本不在该簇的数据被划分到簇中,那么此次聚类过程就可以视为上一次聚类结果的校正使得更接近新的质心的点重新得以划分到更合理的簇中。通过一些数据点的重新划分使得质心也可以进行更新升级。上述质心更新的过程一直迭代,直至质心没有明显变化结束。
S4:基于大数据挖掘技术,挖掘负荷影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,实现每个大用户用电负荷预测;构建大用户用电负荷预测模型具体包括以下步骤:
S41:根据K-Means聚类算法得到的K类用电负荷数据,得到K个负荷预测模型的影响因素,并设置每类用电负荷数据的权重值,得到用电负荷预测模型为:
其中,yyc表示预测的用电负荷值,yoi表示第i类用电负荷数据的中心值,wi表示第i类用电负荷数据yi的权重系数,权重系数wi的确定方法为:
S5:构建大用户负荷数据验证模型,比较计算实际负荷与预测负荷的差值,动态调整大用户用电负荷预测模型。大用户负荷数据验证模型具体为:
S51:采用K-Means聚类算法对每年的历史用电负荷数据分别进行聚类,得到每年的历史用电负荷数据的K类用电负荷数据;
S52:采用用电负荷预测模型计算每年的历史用电负荷数据,得到每年的历史用电负荷数据的预测值;
S53:计算每年的历史用电负荷数据的预测值与每年的历史用电负荷数据的真实值的差值;
S54:构件目标函数使得步骤S53中n年历史用电负荷数据的预测值与真实值的差值和最小,则对应的每类用电负荷数据的中心值与对应的权重达到最优组合。步骤S54构建的目标函数F为:
其中,yycj为第j年历史用电负荷数据的预测值,yzsj为第j年历史用电负荷数据的真实值,yoji为第j年历史用电负荷数据聚类后第i类用电负荷数据的中心值。
一种基于大数据挖掘技术的大用户用电负荷预测系统,包括负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块;所述负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块依次连接;
所述负荷数据采集模块用于从营销系统采集获取大用户台账数据以及从计量系统获取该大用户历年的用电负荷数据;
所述负荷数据预处理模块用于对负荷数据采集模块采集的大用户历年的用电负荷数据进行预处理;
所述负荷数据处理模块用于对经过预处理后的大用户历年的用电负荷数据进行格式转换、分类存储、数据清洗;
所述负荷数据分析模块用于对经过处理后的大用户历年的用电负荷数据进行分析和计算得到负荷预测模型的影响因素;
所述负荷数据预测模块用于挖掘影响因素与大用户用电负荷的关系,并构建大用户用电负荷预测模型实现大用户用电负荷预测;
所述预测验证模块用于对负荷数据预测模块预测得到的大用户用电负荷预测模型进行验证。
其中,负荷数据预处理模块对负荷数据采集模块采集的大用户历年的用电负荷数据进行预处理包括剔除用电负荷曲线中的异常数据和重复数据,并对缺失的数据采用线性插值的方法进行补齐,所述线性插值的计算方法如下:求t时刻的大用户用电负荷y的方法如下:
其中,y0表示t0时刻的用电负荷,y1表示t1时刻的用电负荷。
负荷数据分析模块对经过处理后的大用户历年的用电负荷数据进行分析和计算得到负荷预测模型的影响因素包括:将每个大用户的的用电负荷样本数据进行归一化处理,把所有数据转换为0~1之间的小数,具体公式为:
其中:y为用户用电负荷样本数据,y'为样本数据归一化处理后的值;
根据K-Means聚类算法,基于大用户用电负荷归一化数据以及用电负荷曲线进行聚类分析;
1)设置初始聚类参数,即设置聚类结果中簇的个数K;
2)设置最大迭代次数;
3)聚类模型运行;
4)判断当聚类中心内的更改值为0.000时,模型达到收敛,否则返回步骤2),重新设置最大迭代次数;
5)当聚类模型结构收敛时,继续判断聚类是否满足业务要求,如果满足,则输出结果,如果不满足,则返回步骤1),重新设置聚类结果中簇的个数K。
负荷数据预测模块中构建大用户用电负荷预测模型具体为:根据K-Means聚类算法得到的K类用电负荷数据,得到K个负荷预测模型的影响因素,并设置每类用电负荷数据的权重值,得到用电负荷预测模型为:
其中,yyc表示预测的用电负荷值,yoi表示第i类用电负荷数据的中心值,wi表示第i类用电负荷数据yi的权重系数,权重系数wi的确定方法为:
预测验证模块动态调整大用户用电负荷预测模型具体为:
采用K-Means聚类算法对每年的历史用电负荷数据分别进行聚类,得到每年的历史用电负荷数据的K类用电负荷数据;
采用用电负荷预测模型计算每年的历史用电负荷数据,得到每年的历史用电负荷数据的预测值;
计算每年的历史用电负荷数据的预测值与每年的历史用电负荷数据的真实值的差值;
构件目标函数使得步骤S53中n年历史用电负荷数据的预测值与真实值的差值和最小,则对应的每类用电负荷数据的中心值与对应的权重达到最优组合。构建的目标函数F为:
其中,yycj为第j年历史用电负荷数据的预测值,yzsj为第j年历史用电负荷数据的真实值,yoji为第j年历史用电负荷数据聚类后第i类用电负荷数据的中心值。
本发明提供了一种基于大数据挖掘技术的大用户用电负荷预测方法及系统,通过对大用户历年数据进行影响用电负荷预测的因素分析,采用大数据挖掘技术挖掘影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,并构建目标函数对构建的大用户用电负荷预测模型进行动态调整,提高了针对大用户用电负荷的预测精度,并且构建的大用户用电负荷预测模型进行实时动态调整,确保了构建的大用户用电负荷预测模型的有效性和时效性、精确性。本发明采用K-Means聚类算法分析影响用电负荷预测的因素,可以有效的将关联因素聚类,实现影响因素的精准分类。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的实施例中,应该理解到,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元可结合为一个单元,一个单元可拆分为多个单元,或一些特征可以忽略等。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
Claims (2)
1.一种基于大数据挖掘技术的大用户用电负荷预测系统,其特征在于:包括负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块;所述负荷数据采集模块、负荷数据预处理模块、负荷数据处理模块、负荷数据分析模块、负荷数据预测模块、预测验证模块依次连接;
所述负荷数据采集模块用于从营销系统采集获取大用户台账数据以及从计量系统获取该大用户历年的用电负荷数据;
所述负荷数据预处理模块用于对负荷数据采集模块采集的大用户历年的用电负荷数据进行预处理;
所述负荷数据处理模块用于对经过预处理后的大用户历年的用电负荷数据进行格式转换、分类存储、数据清洗;
所述负荷数据分析模块用于对经过处理后的大用户历年的用电负荷数据进行分析和计算得到负荷预测模型的影响因素;
所述负荷数据预测模块用于挖掘影响因素与大用户用电负荷的关系,并构建大用户用电负荷预测模型实现大用户用电负荷预测;
所述预测验证模块用于对负荷数据预测模块预测得到的大用户用电负荷预测模型进行验证;
工作流程为:包括以下步骤:
S1:从营销系统获取大用户台账数据以及从计量系统获取该大用户n年历史用电负荷数据,并对用电负荷数据进行预处理;所述用电负荷数据包括用电负荷曲线;
S2:建立大用户台账数据与用电负荷数据的关联关系,对源端数据进行格式转换、分类存储、数据清洗;
S3:对获取的用电负荷数据进行基础数据分析和计算,得到负荷预测模型的影响因素;所述步骤S3中得到负荷预测模型的影响因素具体包括以下步骤:
S31:将每个大用户的用电负荷样本数据进行归一化处理,把所有数据转换为0~1之间的小数,具体公式为:
其中:y为用户用电负荷样本数据,y'为样本数据归一化处理后的值;
S32:根据K-Means聚类算法,基于大用户用电负荷归一化数据以及用电负荷曲线进行聚类分析;
1)设置初始聚类参数,即设置聚类结果中簇的个数K;
2)设置最大迭代次数;
3)聚类模型运行;
4)判断当聚类中心内的更改值为0.000时,模型达到收敛,否则返回步骤2),重新设置最大迭代次数;
5)当聚类模型结构收敛时,继续判断聚类是否满足业务要求,如果满足,则输出结果,如果不满足,则返回步骤1),重新设置聚类结果中簇的个数K;
S4:基于大数据挖掘技术,挖掘负荷影响因素与大用户用电负荷的关系,构建大用户用电负荷预测模型,实现每个大用户用电负荷预测;所述构建大用户用电负荷预测模型具体包括以下步骤:
根据K-Means聚类算法得到的K类用电负荷数据,得到K个负荷预测模型的影响因素,并设置每类用电负荷数据的权重值,得到用电负荷预测模型为:
其中,yyc表示预测的用电负荷值,yoi表示第i类用电负荷数据的中心值,wi表示第i类用电负荷数据yi的权重系数,所述权重系数wi的确定方法为:
S5:构建大用户负荷数据验证模型,比较计算实际负荷与预测负荷的差值,动态调整大用户用电负荷预测模型;
所述步骤S5中大用户负荷数据验证模型具体为:
S51:采用K-Means聚类算法对每年的历史用电负荷数据分别进行聚类,得到每年的历史用电负荷数据的K类用电负荷数据;
S52:采用用电负荷预测模型计算每年的历史用电负荷数据,得到每年的历史用电负荷数据的预测值;
S53:计算每年的历史用电负荷数据的预测值与每年的历史用电负荷数据的真实值的差值;
S54:构件目标函数使得步骤S53中n年历史用电负荷数据的预测值与真实值的差值和最小,则对应的每类用电负荷数据的中心值与对应的权重达到最优组合;构建的目标函数F为:
其中,yycj为第j年历史用电负荷数据的预测值,yzsj为第j年历史用电负荷数据的真实值,yoji为第j年历史用电负荷数据聚类后第i类用电负荷数据的中心值。
2.根据权利要求1所述的一种基于大数据挖掘技术的大用户用电负荷预测系统,其特征在于:所述步骤S1中对用电负荷数据进行预处理包括:剔除用电负荷曲线中的异常数据和重复数据,并对缺失的数据采用线性插值的方法进行补齐,所述线性插值的计算方法如下:求t时刻的大用户用电负荷y的方法如下:
其中,y0表示t0时刻的用电负荷,y1表示t1时刻的用电负荷。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210262891.2A CN114781685B (zh) | 2022-03-17 | 2022-03-17 | 基于大数据挖掘技术的大用户用电负荷预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210262891.2A CN114781685B (zh) | 2022-03-17 | 2022-03-17 | 基于大数据挖掘技术的大用户用电负荷预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114781685A CN114781685A (zh) | 2022-07-22 |
CN114781685B true CN114781685B (zh) | 2024-01-09 |
Family
ID=82425936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210262891.2A Active CN114781685B (zh) | 2022-03-17 | 2022-03-17 | 基于大数据挖掘技术的大用户用电负荷预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114781685B (zh) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184402A (zh) * | 2015-08-31 | 2015-12-23 | 国家电网公司 | 一种基于决策树的个性化用户短期负荷预测算法 |
CN105303263A (zh) * | 2015-11-16 | 2016-02-03 | 深圳合纵能源技术有限公司 | 一种区域电网的负荷预测系统及其方法 |
CN105590174A (zh) * | 2015-12-29 | 2016-05-18 | 南京因泰莱电器股份有限公司 | 基于k-均值聚类rbf神经网络的企业用电负荷预测方法 |
CN105844371A (zh) * | 2016-05-19 | 2016-08-10 | 北京中电普华信息技术有限公司 | 一种用电客户短期负荷需求预测方法及装置 |
CN109376971A (zh) * | 2018-12-29 | 2019-02-22 | 北京中电普华信息技术有限公司 | 一种面向电力用户的负荷曲线预测方法及系统 |
CN109636101A (zh) * | 2018-11-02 | 2019-04-16 | 国网辽宁省电力有限公司朝阳供电公司 | 基于大数据的开放售电环境下大用户用电行为分析方法 |
CN109858667A (zh) * | 2018-12-21 | 2019-06-07 | 国网江苏省电力有限公司苏州供电分公司 | 一种基于雷电气候对负荷影响的短期负荷聚类方法 |
CN109886465A (zh) * | 2019-01-20 | 2019-06-14 | 东北电力大学 | 一种基于智能电表用户聚类分析的配电网负荷预测方法 |
CN110610280A (zh) * | 2018-10-31 | 2019-12-24 | 山东大学 | 一种电力负荷短期预测方法、模型、装置及系统 |
CN110689195A (zh) * | 2019-09-26 | 2020-01-14 | 云南电网有限责任公司电力科学研究院 | 一种电力日负荷预测方法 |
CN110837857A (zh) * | 2019-10-31 | 2020-02-25 | 杭州中恒云能源互联网技术有限公司 | 工业用电负荷预测方法、系统及其存储介质 |
CN112561156A (zh) * | 2020-12-11 | 2021-03-26 | 国网江苏省电力有限公司南通供电分公司 | 基于用户负荷模式分类的短期电力负荷预测方法 |
CN113205207A (zh) * | 2021-04-19 | 2021-08-03 | 深圳供电局有限公司 | 一种基于XGBoost算法的用电短期负荷波动预测方法及系统 |
CN113282646A (zh) * | 2021-04-30 | 2021-08-20 | 国网四川省电力公司经济技术研究院 | 一种基于用电行为影响因素的日负荷曲线获取方法 |
CN113361202A (zh) * | 2021-06-11 | 2021-09-07 | 国网上海市电力公司 | 一种基于特征负荷预测的配变重过载快速预警方法 |
CN113393028A (zh) * | 2021-06-10 | 2021-09-14 | 国网江苏省电力有限公司南通供电分公司 | 一种基于数据挖掘技术的负荷预测方法 |
CN113869601A (zh) * | 2021-10-18 | 2021-12-31 | 深圳供电局有限公司 | 一种电力用户负荷预测方法、装置及设备 |
CN115689001A (zh) * | 2022-10-26 | 2023-02-03 | 四川大学 | 基于模式匹配的短期负荷预测方法 |
-
2022
- 2022-03-17 CN CN202210262891.2A patent/CN114781685B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184402A (zh) * | 2015-08-31 | 2015-12-23 | 国家电网公司 | 一种基于决策树的个性化用户短期负荷预测算法 |
CN105303263A (zh) * | 2015-11-16 | 2016-02-03 | 深圳合纵能源技术有限公司 | 一种区域电网的负荷预测系统及其方法 |
CN105590174A (zh) * | 2015-12-29 | 2016-05-18 | 南京因泰莱电器股份有限公司 | 基于k-均值聚类rbf神经网络的企业用电负荷预测方法 |
CN105844371A (zh) * | 2016-05-19 | 2016-08-10 | 北京中电普华信息技术有限公司 | 一种用电客户短期负荷需求预测方法及装置 |
CN110610280A (zh) * | 2018-10-31 | 2019-12-24 | 山东大学 | 一种电力负荷短期预测方法、模型、装置及系统 |
CN109636101A (zh) * | 2018-11-02 | 2019-04-16 | 国网辽宁省电力有限公司朝阳供电公司 | 基于大数据的开放售电环境下大用户用电行为分析方法 |
CN109858667A (zh) * | 2018-12-21 | 2019-06-07 | 国网江苏省电力有限公司苏州供电分公司 | 一种基于雷电气候对负荷影响的短期负荷聚类方法 |
CN109376971A (zh) * | 2018-12-29 | 2019-02-22 | 北京中电普华信息技术有限公司 | 一种面向电力用户的负荷曲线预测方法及系统 |
CN109886465A (zh) * | 2019-01-20 | 2019-06-14 | 东北电力大学 | 一种基于智能电表用户聚类分析的配电网负荷预测方法 |
CN110689195A (zh) * | 2019-09-26 | 2020-01-14 | 云南电网有限责任公司电力科学研究院 | 一种电力日负荷预测方法 |
CN110837857A (zh) * | 2019-10-31 | 2020-02-25 | 杭州中恒云能源互联网技术有限公司 | 工业用电负荷预测方法、系统及其存储介质 |
CN112561156A (zh) * | 2020-12-11 | 2021-03-26 | 国网江苏省电力有限公司南通供电分公司 | 基于用户负荷模式分类的短期电力负荷预测方法 |
CN113205207A (zh) * | 2021-04-19 | 2021-08-03 | 深圳供电局有限公司 | 一种基于XGBoost算法的用电短期负荷波动预测方法及系统 |
CN113282646A (zh) * | 2021-04-30 | 2021-08-20 | 国网四川省电力公司经济技术研究院 | 一种基于用电行为影响因素的日负荷曲线获取方法 |
CN113393028A (zh) * | 2021-06-10 | 2021-09-14 | 国网江苏省电力有限公司南通供电分公司 | 一种基于数据挖掘技术的负荷预测方法 |
CN113361202A (zh) * | 2021-06-11 | 2021-09-07 | 国网上海市电力公司 | 一种基于特征负荷预测的配变重过载快速预警方法 |
CN113869601A (zh) * | 2021-10-18 | 2021-12-31 | 深圳供电局有限公司 | 一种电力用户负荷预测方法、装置及设备 |
CN115689001A (zh) * | 2022-10-26 | 2023-02-03 | 四川大学 | 基于模式匹配的短期负荷预测方法 |
Non-Patent Citations (1)
Title |
---|
基于数据挖掘的电力系统中长期负荷预测新方法;崔旻, 顾洁;电力自动化设备(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114781685A (zh) | 2022-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111199016B (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
CN107220732B (zh) | 一种基于梯度提升树的停电投诉风险预测方法 | |
CN110991786A (zh) | 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法 | |
CN111210170B (zh) | 基于90%用电分布特征指标的环保管控监测及评价方法 | |
CN110503256A (zh) | 基于大数据技术的短期负荷预测方法及系统 | |
CN108428055B (zh) | 一种考虑负荷纵向特性的负荷聚类方法 | |
CN115081795A (zh) | 多维场景下企业能耗异常成因分析方法及系统 | |
CN112070121A (zh) | 一种基于变分自编码器的智能电表数据填补方法 | |
CN111460001A (zh) | 一种配电网理论线损率评估方法及系统 | |
CN110909786A (zh) | 一种基于特性指标与决策树模型的新装用户负荷辨识方法 | |
CN111275485A (zh) | 基于大数据分析的电网客户等级划分方法、系统、计算机设备及存储介质 | |
CN113378954B (zh) | 一种基于粒子群改进k均值算法的负荷曲线聚类方法及系统 | |
CN109389517B (zh) | 一种量化线路损耗影响因素的分析方法及装置 | |
CN112016797B (zh) | 基于knn的资源配额调整方法、装置和电子设备 | |
CN114781685B (zh) | 基于大数据挖掘技术的大用户用电负荷预测方法及系统 | |
CN114676931B (zh) | 一种基于数据中台技术的电量预测系统 | |
CN112330030A (zh) | 业扩物资需求预测系统及方法 | |
CN111798152A (zh) | 一种门店智能管理方法和装置 | |
CN116470491A (zh) | 基于copula函数的光伏功率概率预测方法及系统 | |
CN114372835B (zh) | 综合能源服务潜力客户识别方法、系统及计算机设备 | |
CN111222688B (zh) | 一种商业楼宇的日负荷预测方法 | |
CN114970660A (zh) | 一种电力负荷聚类方法 | |
CN114970928A (zh) | 一种电力数据能耗分析预测方法 | |
CN111724049A (zh) | 一种潜在电力能效服务客户的研判方法 | |
CN112990533A (zh) | 一种稀疏约束和动态权重分配的风电集群功率预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |