CN114881429A - 基于数据驱动的台区线损量化方法及系统 - Google Patents
基于数据驱动的台区线损量化方法及系统 Download PDFInfo
- Publication number
- CN114881429A CN114881429A CN202210412463.3A CN202210412463A CN114881429A CN 114881429 A CN114881429 A CN 114881429A CN 202210412463 A CN202210412463 A CN 202210412463A CN 114881429 A CN114881429 A CN 114881429A
- Authority
- CN
- China
- Prior art keywords
- line loss
- area
- data
- transformer area
- transformer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000011002 quantification Methods 0.000 title abstract description 13
- 238000004364 calculation method Methods 0.000 claims abstract description 54
- 238000009826 distribution Methods 0.000 claims description 38
- 238000013139 quantization Methods 0.000 claims description 34
- 238000013528 artificial neural network Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 12
- 238000003064 k means clustering Methods 0.000 claims description 11
- 230000003068 static effect Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 238000010219 correlation analysis Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 claims description 3
- 230000001537 neural effect Effects 0.000 claims description 3
- 238000002759 z-score normalization Methods 0.000 claims description 3
- 238000007726 management method Methods 0.000 abstract description 6
- 238000007418 data mining Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 4
- 239000002245 particle Substances 0.000 description 18
- 230000000694 effects Effects 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 7
- 210000002569 neuron Anatomy 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 6
- 239000006185 dispersion Substances 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 238000010220 Pearson correlation analysis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 235000015220 hamburgers Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于台区线损管理技术领域,提供了一种基于数据驱动的台区线损量化方法及系统,包括以下步骤:获取台区数据,建立台区电气特征的指标体系;基于所述台区数据和所述台区电气特征的指标体系,构建台区画像;构建台区线损计算模型;根据所构建的台区画像和台区线损计算模型,实现台区线损的量化。本发明能够在海量台区数据中通过数据挖掘技术根据台区特征刻画不同类型台区画像,构建特性各异台区的电气特征指标体系。在构建台区电气特征指标体系的基础上,各类台区通过台区合理线损预测模型进行快速准确的台区线损合理区间计算,从而实现海量台区线损精准量化。
Description
技术领域
本发明属于台区线损管理技术领域,具体涉及一种基于数据驱动的台区线损量化方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
台区线损是电力系统经济运行的一个重要经济技术指标,它反映了电力系统规划设计、生产运行和经营管理水平。台区理论线损计算对制定合理降损措施、线损考核提供了理论依据,快速准确地计算台区线损成为了供电企业的重要任务之一。传统的台区线损管理中采取一刀切的方式,通过采用国网划定的统一固定区间作为合理区间,不利于精益化管理。表计配置不齐备、运行数据不易收集、元件和节点数过多等问题的存在通常会导致线损率计算工作十分繁杂。
传统理论线损计算方法主要包括等值电阻法、均方根电流法、潮流法等计算方法以及对于这些方法的改进算法。随着国家经济的快速发展,供电需求逐步上升,配电网规模逐渐增大,台区下分支线路复杂、元件多样,理论线损的计算若仍依赖传统的计算方法,计算准确性和实时性将难以保证。近年来,随着智能电网的不断建设,低压台区自动化水平也逐年提高,数据采集系统日趋完善,为低压台区线损计算提供了大量的数据,逐渐将神经网络、深度学习等数据驱动的人工智能算法引进到理论线损计算。这些方法利用数据挖掘技术深入发掘电力系统台区线损的实时采集数据,找出其中蕴含的潜在规律,并应用于台区线损计算中,使海量台区线损精准量化成为可能。
发明内容
为了解决上述问题,本发明提出了一种基于数据驱动的台区线损量化方法及系统,能够在海量台区数据中通过数据挖掘技术根据台区特征刻画不同类型台区画像,构建特性各异台区的电气特征指标体系。在构建台区电气特征指标体系的基础上,各类台区通过台区合理线损预测模型进行快速准确的台区线损合理区间计算,从而实现海量台区线损精准量化。
具体地,本发明提供一种基于数据驱动的台区线损量化方法,包括以下步骤:
S1:获取台区数据,建立台区电气特征的指标体系;
S2:基于所述台区数据和所述台区电气特征的指标体系,构建台区画像;
S3:构建台区线损计算模型;
S4:根据所构建的台区画像和台区线损计算模型,实现台区线损的量化。
进一步地,所述步骤S1中,在获取台区数据之后,对所获取的台区数据进行Z-Score标准化处理。
进一步地,所述步骤S1中,根据指标的时变特性,将台区电气特征的指标划分为静态指标和动态指标;所述静态指标包括与台区网架结构和负荷相关且短时间内不可改变的电气特征参数;所述动态指标是指电气特征参数,至少包括由时变电气量计算得到的平均日最大功率、平均负载率和负荷曲线形状系数。
进一步地,所述步骤S2中,基于改进K-Means聚类算法对海量台区数据进行信息挖掘,根据台区特征进行台区分类,基于相关性分析方法对特征各异台区进行分析得到各类台区的线损关键影响因子集,实现台区画像的构建。
进一步地,所述步骤S3包括:在建立台区画像的基础上,基于BP神经网络和核密度估计方法,采用机器学习方法构建台区线损计算模型,其中台区线损区间的计算过程为:
步骤(1):将台区线损预测值进行等间隔划分成不同区间;
步骤(2):若存在间隔内样本数据较少,则合并相邻区间;
步骤(3):采用核密度估计方法,同时基于网格搜索交叉验证方法选择最优核函数和最优带宽,进而得到不同区间的预测误差概率密度函数
进一步地,,所述步骤S4包括:基于BP神经网络-核密估计台区线损计算模型对台区线损及合理区间进行计算,具体过程为:
步骤(1):判断台区所属类别,即根据该台区电气特征指标体系的指标数据与聚类中心的欧式距离判断台区所属类别为第k类台区;
步骤(2):构建台区线损影响关键因子集,即根据台区的所属类别构建对应的台区线损影响关键因子集;
步骤(3):BP神经网络预测,即将台区电气特征指标数据输入BP神经网络,对台区线损进行合理预测;
步骤(4):台区线损合理区间计算,即判断预测值所属区间,根据训练过程中求得的预测误差概率密度函数得到预测误差的a及1-a分位点,从而得到该预测值的置信区间,即为台区线损的合理区间。
进一步地,,所述步骤S4基于BP神经网络和核密度估计的计算分析,得到不同类别台区线损预测值及合理区间,实现台区线损的量化。
根据一些实施例,本发明的第二方案提供了一种基于数据驱动的台区线损量化系统,采用如下技术方案:
一种基于数据驱动的台区线损量化系统,包括:
获取模块,被配置为获取台区数据,建立台区电气特征的指标体系;
构建画像模块,被配置为基于所述台区数据和所述台区电气特征的指标体系,构建台区画像;
建模模块,被配置为构建台区线损计算模型;
台区线损量化模块,被配置为根据所构建的台区画像和台区线损计算模型,实现台区线损的量化。
根据一些实施例,本发明的第三方案提供了一种计算机可读存储介质,采用如下技术方案:
一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第一方面所述的基于数据驱动的台区线损量化方法中的步骤。
根据一些实施例,本发明的第四方案提供了一种电子设备,采用如下技术方案:
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所述的基于数据驱动的台区线损量化方法中的步骤。
与现有技术相比,本发明的有益效果为:
本发明提出了改进K-Means聚类算法,在算法中通过粒子群搜索较优的初始聚类中心;同时提出聚类效果综合评价指标,两者的结合可充分提高分类效率,保证台区画像的各异性。
本发明提出了客观权重提取方法,在皮尔逊相关分析的基础上进行客观权重修正,从而在众多电气指标中筛选出影响台区线损最关键的因素,形成关键影响因子集。
本发明所提出的台区线损计算模型基于数据驱动和机器学习方法,充分挖掘台区线损关键影响因子集与台区线损的内在映射关系,并结合核密度估计,使得能够快速准确地计算台区理论线损并给出其合理区间。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例一中的基于数据驱动的台区线损量化方法的流程图;
图2是本发明实施例一中的改进K-Means聚类算法流程示意图;
图3是本发明实施例一中的台区画像构建流程示意图;
图4是本发明实施例一中的台区线损计算模型训练流程示意图;
图5是本发明实施例一中的台区线损计算模型应用流程示意图;
图6是本发明实施例二中的基于数据驱动的台区线损量化系统的结构框图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
本发明实施例一介绍了一种基于数据驱动的台区线损量化方法。具体地,一种基于数据驱动的台区线损量化方法,包括以下步骤:
获取台区数据,建立台区电气特征的指标体系;
基于所述台区数据和所述台区电气特征的指标体系,构建台区画像;
构建台区线损计算模型;
根据所构建的台区画像和台区线损计算模型,实现台区线损的量化。
下面,本实施例详细介绍基于数据驱动的台区线损量化方法。
如图1所示的一种基于数据驱动的台区线损量化方法,具体过程为:
步骤S01:获取海量台区数据;
步骤S02:台区数据的标准化处理;
步骤S03:台区电气特征指标体系构建;
步骤S04:台区画像构建;
步骤S05:台区线损计算模型的构建;
步骤S06:台区线损精准量化。
作为一种或多种实施方式,在步骤S02中,对海量台区数据进行Z-Score标准化处理,避免数据量纲影响。
海量台区电气特征参数涉及的电气量众多,取值范围和单位都不相同,为了不受量纲影响进行计算,需要对原始数据进行标准化处理。设电气特征参数个数为M个,台区样本数为N个,则样本矩阵如式(1)所示,每一行表示一组台区信息样本,每一列表示不同台区下某电气特征参数。
标准化方法如下所示:
作为一种或多种实施方式,在步骤S03中,根据指标的时变特性,将台区电气特征指标划分为静态指标和动态指标,静态指标包括居民容量、居民用户比例、光伏用户比例、低压线路总长度、供电半径等与台区网架结构和负荷相关且短时间内不可改变的电气特征参数,动态指标包括由电压、电流等时变电气量计算得到的平均日最大功率、平均负载率、负荷曲线形状系数等电气特征参数。
线损变化主要和台区网架结构、负荷曲线的起伏波动、电容器投切和运行方式的不同等因素相关,因此本发明选取负荷曲线形状系数、平均负载率、平均日最大功率等动态指标与居民容量、非居民容量、居民用户比例、非居民用户比例等静态指标共同构成特征集作为台区电气特征指标体系。
其中,平均日最大功率计算公式如下式所示:
式中,N为典型日所在月的天数,Pmax为典型日所在月的每日的日最大功率值。
平均负载率计算公式如下式所示:
式中,Uij和Iij为典型日24点电压曲线和电流曲线,Cij为台区变压器容量。
负荷曲线形状系数Kl为典型日均方根电流与电流均值之比,其计算公式如下式所示:
式中,Im表示m时刻的电流值。
作为一种或多种实施方式,在步骤S04中,基于改进K-Means聚类算法对海量台区数据进行信息挖掘,根据台区特征进行台区分类,并基于相关性分析方法对特征各异台区进行分析得到各类台区的线损关键影响因子集,从而构建台区画像。
台区画像的构建步骤如图3所示。首先将上述已构建的台区电气特征指标体系和台区线损数据一同作为输入,通过改进K-Means聚类算法实现特征各异的台区分类;接着通过聚类效果综合评价指标对不同分类结果进行评估,得到最佳台区分类Kbest,对最佳台区分类结果进行相关性分析和客观权重修正,并依据客观权重进行排序选择,由此得到台区线损关键影响因子集,从而构建各类台区画像。
采用如图2所示的改进K-Means聚类算法进行台区分类,由于K-Means聚类算法的聚类效果对初始聚类中心敏感,因此改进K-Means聚类算法中采用粒子群搜索算法来寻找最优聚类中心。改进K-Means聚类算法流程如下:
输入台区样本数据矩阵N*M,其中样本数目N,电气特征指标数目M;
步骤(1)初始化:设置最大迭代次数为T,初始迭代次数为t=1,粒子数为Y,台区类别数为K,随机设置N个台区样本的所属类别形成台区类别矩阵,设置每个粒子的初始位置、初始速度和初始适应度。
步骤(2)获取粒子位置:根据样本所属类别获得各类别聚类中心ck(t,y),k∈[1,K],由各类别聚类中心构成的向量即为粒子的位置Pc(t,y)=[c1(t,y),c2(t,y),…ck(t,y)]。
式中,Ck,(y,t)为在第t次迭代第y个粒子的计算中第k类台区组成的簇,card(Ck,(y,t))为属于该簇的台区数目,xn为属于第k类台区的台区样本。
步骤(3)计算适应度值:根据适应度函数公式计算出每个粒子的适应度值,公式如下:
步骤(4)获取个体极值和全局极值:比较每个粒子的适应度值与历史最佳位置Pp(t,y)的适应度值,如果每个粒子的适应度值更小,则用当前粒子的位置和适应度值更新Pp(t,y)和其适应度值p(t,y);比较每个粒子的适应度值与整个粒子群的历史最好位置Pg(t,y)的适应度值,如果每个粒子的适应度值更小,则用当前粒子的位置和适应度值更新Pg(t,y)和其适应度值g(t,y)。
步骤(5)更新初始聚类中心:当粒子的位置被更新时即聚类中心被更新。根据下式更新每个粒子的速度和位置:
vd(t+1,y)=ωvd(t,y)+c1r1[Pp(t,y)-Pc(t,y)]+c2r2[Pg(t,y)-Pc(t,y)],r1,r2∈(0,1) (10)
Pc(t+1,y)=Pc(t,y)+vd(t+1,y) (11)
式中:d=1、2、...、K*M;ω为权重系数;p(t,y)和g(t,y)分别为粒子的个体极值和全局极值;r1和r2为(0,1)内的随机数,c1和c2为加速因子,通常取值为2。
步骤(6)更新台区类别矩阵:根据更新后的聚类中心重新对N个台区样本的所属类别分类,形成新的台区类别矩阵,然后进入下一次迭代,回到步骤(2)。若达到最大迭代次数,则退出循环。
根据上述的K-Means聚类算法流程,可以不同类别数的台区分类结果。不同聚类结果的有效性由相应的聚类结果评价指标衡量。由于台区分类过程没有确切的标准可以对照,即无法进行外部度量,因此通过内部度量聚类中心与属于其类内的台区样本的相似性来评判台区样本聚类效果。
当台区样本数为时,则聚类数的有效搜索范围为且K为整数。本发明考虑到簇类型对单一指标判定效果的影响,综合三种聚类效果内部度量指标形成综合评价指标对聚类效果进行评价。当台区数据分为K类时,综合评价指标的计算公式如下:
s(i)表示台区样本数据i的轮廓系数,计算如公式(13)所示。所有台区样本数据的轮廓系数的均值称为聚类结果为K时的整体轮廓系数,整体轮廓系数越大,聚类效果越好。当使用轮廓系数判断聚类效果时,当簇越接近一个标准簇时,即簇密集且分离较好时,分数更高。因此凸簇的轮廓系数会比其他类型的簇更高。
式中:a(i)为台区样本数据i到同簇内其它台区样本数据的平均距离,该值越小说明台区样本数据i越应该被聚类到该簇,a(i)又称为台区样本数据i的簇内不相似度。b(i)为台区样本数据i到其他某簇C其他某簇内所有台区样本数据的平均距离的最小值,即
b(i)=min{bi-c1,bi-c2,…,bi-cj,…bi-ck},cj∈C其他某簇,
b(i)又称为台区样本数据i的簇间不相似度。s(i)接近1,则说明台区样本数据i的聚类结果合理;s(i)接近-1,则说明台区样本数据i更应该分类到其他簇;s(i)近似为0,则说明台区样本数据i在两个簇的边界上。
CH分数被定义为簇间离散程度与簇内离散程度的比率,该分值越大说明同类自身越紧密,类与类之间越分散,聚类效果越好,计算下式所示:
式中:BK是簇间离散矩阵,WK是簇内离散矩阵,Ck表示簇k,ck是簇k的中心点,c是数据集的中心点。
原始场景集中有m个台区样本数据。DBI(K)值越小,聚类效果越好。计算过程如下:首先,计算分散度:
式中,Fi表示第i个簇内台区样本数据的离散程度,Xj表示簇i的第j个台区样本数据,Ai表示簇i的中心,Ti表示簇i内的台区样本数据个数。p=1时,计算的是簇i内各点到中心的距离的均值;p=2时,计算的是簇i内各点到中心的距离的标准差。
接着,计算簇i和簇j间的距离Dij:
式中,一个台区样本数据的电气特征参数个数为M个,aki表示簇i的中心点的第k个属性的值,akj表示簇j的中心点的第k个属性的值。
接着,计算簇i和簇j间的相似度Gij:
根据上述的综合评价指标对不同K时的台区分类结果进行评估,选择综合评价指标最大时的台区分类结果Kbest。
在台区分类的基础上,采用相关性分析方法形成不同类别台区的线损影响关键因子集,从而构建不同类别台区的台区画像。所提方法逐一对每类台区进行分析,采用基于改进加权的皮尔逊相关分析评估台区电气特征指标与台区线损的相关性,选择相关性更强的电气特征指标作为该类台区的线损影响关键因子集。
皮尔逊系数代表某一个电气指标同线损率的相关程度,分值在-1到1之间。一般来说,相关系数越接近于1或-1,代表指标同线损率的相关性越强;相关系数越接近于0,代表指标与线损率的相关性越弱,大多数情况下,根据相关性可以得到三种结论:
(1)当相关系数大于0时,认为特征与线损率呈正相关关系,表明指标数值越高,台区的线损率通常也越高。
(2)当相关系数小于0时,认为特征与线损率呈负相关关系,表明指标数值越高,台区的线损率通常越低。
(3)当相关系数等于0时,认为特征与台区的线损率无关,代表指标的数值的上升和下降对台区的线损率无影响。
进行相关性检验后,应对各指标进行权重分析,所提方法选取CRI T I C法作为权重修正方法,即对相关性检验后确定的各关键影响因子进行指标客观权重的计算。CRI T IC法作为一种客观赋权法,通过评价指标的变异程度和冲突性来度量指标的客观权重。考虑指标变异性大小的同时兼顾指标之间的相关性,能够实现基于整个指标体系的客观赋权。其中,指标的变异程度通过标准差来量化:
式中,xij表示指标j的第i个指标值,Sj则表示某类指标中第j个指标值的变异程度。
指标体系中第j个指标的客观权重Wj为:
式中,Sj×Rj表示信息量,即第j个指标在CRITIC权重评价体系中的作用大小。由上式可以看出,某个指标所包含的信息量越大,则重要性越大,进而权重值越大。
对第k类台区样本进行上述的改进加权皮尔逊相关性分析,最终根据加权关联度对台区电气特征指标排序,选取加权关联度较大的电气指标作为该类台区的线损影响关键因子,进而对不同类型台区形成线损影响关键因子集,刻画出该类台区的线损影响特征。
作为一种或多种实施方式,在步骤S05中,将各个台区画像应用在基于BP神经网络和核密度估计的台区线损计算模型上,得到特征各异台区线损合理区间,从而实现海量台区线损精益化管理。
在建立台区画像的基础上,采用机器学习方法构建Kbest个台区线损计算模型。台区线损计算模型基于BP神经网络和核密度估计方法建立。
BP神经网络结构包括输入层、隐含层和输出层三部分。BP神经网络是一种基于反向误差传递的方法。BP神经网络构建流程如下:
步骤(1)构建BP神经网络:选取台区线损关键因子集和对应的台区线损分别作为模型的输入和输出,输入层的节点个数取决于台区线损关键因子集中电气特征指标的个数,隐含层节点个数可依据式(26)大致确定:
式中,m和n分别为输出层和输入层的神经元个数,a是[0,10]之间的常数。
学习速率决定每次循环训练中所产生的权值变化量。学习速率过高可能导致系统的不稳定,但学习速率过低又会导致较长的训练时间,可能收敛很慢,不过能保证网络的误差值跳出误差表面的低谷而最终趋于最小误差值。在一般情况下,倾向于选取较小的学习速率以保证系统的稳定性。
期望误差的选取。在网络的训练过程中期望误差值也应当通过对比训练后确定一个合适的值。所谓的“合适”,是相对于所需要的隐含层的结点数来确定的,因为较小的期望误差要靠增加隐含层的结点以及训练时间来获得。
步骤(2)训练BP神经网络:本方法在前述步骤已经完成了输入数据标准化。通过数据标准化处理可取消各维数据间的数量级差别,避免因输入输出数据数量级差别较大而造成的网络训练误差。BP网络的训练过程由输入数据的前向传播和误差的反向传播两个部分组成。
在前向传播过程中,每一个输出神经元j得到输出信号:
式中,φj是激活函数,wji(n)是神经元权值,m是作用于神经元j的所有输入个数。wj0(n)等于神经元j的偏置bj。
在神经网络输出层,根据实际输出和期望输出求得瞬时误差能量:
式中,集合C包括输出层的所有神经元,dj(n)为神经元j的期望输出。
在反向传播过程中,BP神经网络反复通过梯度下降法修正权值wji(n)。权值修正值为:
Δwji(n)=ηδj(n)yi(n) (29)
式中,φ′j是对激活函数φj的微分,δj(n)为局部梯度,yi(n)为神经元i的输出信号。
为了加快模型学习速度同时保持训练稳定,在式(29)中增加动量项αΔwji(n-1),则修改后的权值修正值如下式所示:
Δwji(n)=ηδj(n)yi(n)+αΔwji(n-1) (31)
式中,α为动量常数,且满足α∈[0,1),动量项反映了以前积累的调整经验,当误差梯度出现局部极小时,使其跳出局部极小区域,加快迭代收敛速度。
BP神经网络通过上述的前向传播和反向传播反复修正网络,当网络稳定收敛时,BP神经网络的训练结束。
步骤(3)BP神经网络预测:将测试及样本数据输入训练好的BP神经网络模型,对台区线损进行合理预测,并分析预测误差。
此时BP神经网络获得的是台区线损预测值,为了得到台区线损的合理区间,所提方法采用核密度估计。
如图4所示的台区线损的合理区间计算流程如下:
步骤(4):将台区线损预测值进行等间隔划分成不同区间;
步骤(5):若存在间隔内样本数据较少,则合并相邻区间;
步骤(6):采用核密度估计方法,同时基于网格搜索交叉验证方法选择最优核函数和最优带宽,进而得到不同区间的预测误差概率密度函数。
接下来,所提的BP神经网络-核密度估计台区线损计算模型可以对台区线损及其合理区间进行计算,应用流程如图5所示,流程如下:
步骤(1)判断台区所属类别:根据该台区电气特征指标体系的指标数据与聚类中心的欧式距离判断台区所属类别为第k类台区。
步骤(2)构建台区线损影响关键因子集:根据台区的所属类别构建对应的台区线损影响关键因子集。
步骤(3)BP神经网络预测:将台区电气特征指标数据输入BP神经网络,对台区线损进行合理预测。
步骤(4)台区线损合理区间计算:判断预测值所属区间,根据训练过程中求得的预测误差概率密度函数得到预测误差的a及1-a分位点,从而得到该预测值的置信区间,即为台区线损的合理区间。
基于BP神经网络和核密度估计的计算分析,可得到不同类别台区线损预测值及合理区间,从而实现台区线损精准量化。
本实施例所介绍的基于数据驱动的台区线损量化方法能够在海量台区数据中通过数据挖掘技术根据台区特征刻画不同类型台区画像,构建特性各异台区的电气特征指标体系。在构建台区电气特征指标体系的基础上,各类台区通过台区合理线损预测模型进行快速准确的台区线损合理区间计算,从而实现海量台区线损精准量化。
实施例二
本发明实施例二介绍了一种基于数据驱动的台区线损量化系统。
如图6所示的一种基于数据驱动的台区线损量化系统,包括:
获取模块,被配置为获取台区数据,建立台区电气特征的指标体系;
构建画像模块,被配置为基于所述台区数据和所述台区电气特征的指标体系,构建台区画像;
建模模块,被配置为构建台区线损计算模型;
台区线损量化模块,被配置为根据所构建的台区画像和台区线损计算模型,实现台区线损的量化。
详细步骤与实施例一提供的基于数据驱动的台区线损量化方法相同,在此不再赘述。
实施例三
本发明实施例三提供了一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明实施例一所述的基于数据驱动的台区线损量化方法中的步骤。
详细步骤与实施例一提供的基于数据驱动的台区线损量化方法相同,在此不再赘述。
实施例四
本发明实施例四提供了一种电子设备。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明实施例一所述的基于数据驱动的台区线损量化方法中的步骤。
详细步骤与实施例一提供的基于数据驱动的台区线损量化方法相同,在此不再赘述。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
Claims (10)
1.一种基于数据驱动的台区线损量化方法,其特征在于,包括以下步骤:
S1:获取台区数据,建立台区电气特征的指标体系;
S2:基于所述台区数据和所述台区电气特征的指标体系,构建台区画像;
S3:构建台区线损计算模型;
S4:根据所构建的台区画像和台区线损计算模型,实现台区线损的量化。
2.如权利要求1中所述的一种基于数据驱动的台区线损量化方法,其特征在于,所述步骤S1中,在获取台区数据之后,对所获取的台区数据进行Z-Score标准化处理。
3.如权利要求1中所述的一种基于数据驱动的台区线损量化方法,其特征在于,所述步骤S1中,根据指标的时变特性,将台区电气特征的指标划分为静态指标和动态指标;所述静态指标包括与台区网架结构和负荷相关且短时间内不可改变的电气特征参数;所述动态指标是指电气特征参数,至少包括由时变电气量计算得到的平均日最大功率、平均负载率和负荷曲线形状系数。
4.如权利要求1中所述的一种基于数据驱动的台区线损量化方法,其特征在于,所述步骤S2中,基于改进K-Means聚类算法对海量台区数据进行信息挖掘,根据台区特征进行台区分类,基于相关性分析方法对特征各异台区进行分析得到各类台区的线损关键影响因子集,实现台区画像的构建。
5.如权利要求4中所述的一种基于数据驱动的台区线损量化方法,其特征在于,所述步骤S3包括:在建立台区画像的基础上,基于BP神经网络和核密度估计方法,采用机器学习方法构建台区线损计算模型,其中台区线损区间的计算过程为:
步骤(1):将台区线损预测值进行等间隔划分成不同区间;
步骤(2):若存在间隔内样本数据较少,则合并相邻区间;
步骤(3):采用核密度估计方法,同时基于网格搜索交叉验证方法选择最优核函数和最优带宽,进而得到不同区间的预测误差概率密度函数。
6.如权利要求5中所述的一种基于数据驱动的台区线损量化方法,其特征在于,所述步骤S4包括:基于BP神经网络-核密估计台区线损计算模型对台区线损及合理区间进行计算,具体过程为:
步骤(1):判断台区所属类别,即根据该台区电气特征指标体系的指标数据与聚类中心的欧式距离判断台区所属类别为第k类台区;
步骤(2):构建台区线损影响关键因子集,即根据台区的所属类别构建对应的台区线损影响关键因子集;
步骤(3):BP神经网络预测,即将台区电气特征指标数据输入BP神经网络,对台区线损进行合理预测;
步骤(4):台区线损合理区间计算,即判断预测值所属区间,根据训练过程中求得的预测误差概率密度函数得到预测误差的a及1-a分位点,从而得到该预测值的置信区间,即为台区线损的合理区间。
7.如权利要求6中所述的一种基于数据驱动的台区线损量化方法,其特征在于,所述步骤S4基于BP神经网络和核密度估计的计算分析,得到不同类别台区线损预测值及合理区间,实现台区线损的量化。
8.一种基于数据驱动的台区线损量化系统,其特征在于,包括:
获取模块,被配置为获取台区数据,建立台区电气特征的指标体系;
构建画像模块,被配置为基于所述台区数据和所述台区电气特征的指标体系,构建台区画像;
建模模块,被配置为构建台区线损计算模型;
台区线损量化模块,被配置为根据所构建的台区画像和台区线损计算模型,实现台区线损的量化。
9.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于数据驱动的台区线损量化方法中的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于数据驱动的台区线损量化方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210412463.3A CN114881429B (zh) | 2022-04-19 | 2022-04-19 | 基于数据驱动的台区线损量化方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210412463.3A CN114881429B (zh) | 2022-04-19 | 2022-04-19 | 基于数据驱动的台区线损量化方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114881429A true CN114881429A (zh) | 2022-08-09 |
CN114881429B CN114881429B (zh) | 2024-04-02 |
Family
ID=82671603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210412463.3A Active CN114881429B (zh) | 2022-04-19 | 2022-04-19 | 基于数据驱动的台区线损量化方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114881429B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809658A (zh) * | 2015-04-14 | 2015-07-29 | 华南理工大学 | 一种低压配网台区线损的快速分析方法 |
CN110348713A (zh) * | 2019-06-28 | 2019-10-18 | 广东电网有限责任公司 | 一种基于关联性分析和数据挖掘的台区线损计算方法 |
US20200366092A1 (en) * | 2019-05-15 | 2020-11-19 | University Of Electronic Science And Technology Of China | Method for analyzing correlation between different line loss actions |
CN112116205A (zh) * | 2020-08-21 | 2020-12-22 | 国网上海市电力公司 | 针对台区用电特征的画像方法、装置和存储介质 |
CN112990500A (zh) * | 2021-04-01 | 2021-06-18 | 国网山东省电力公司营销服务中心(计量中心) | 基于改进加权灰色关联分析的台区线损分析方法及系统 |
CN113139596A (zh) * | 2021-04-20 | 2021-07-20 | 武汉理工大学 | 低压台区线损神经网络的优化算法 |
-
2022
- 2022-04-19 CN CN202210412463.3A patent/CN114881429B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809658A (zh) * | 2015-04-14 | 2015-07-29 | 华南理工大学 | 一种低压配网台区线损的快速分析方法 |
US20200366092A1 (en) * | 2019-05-15 | 2020-11-19 | University Of Electronic Science And Technology Of China | Method for analyzing correlation between different line loss actions |
CN110348713A (zh) * | 2019-06-28 | 2019-10-18 | 广东电网有限责任公司 | 一种基于关联性分析和数据挖掘的台区线损计算方法 |
CN112116205A (zh) * | 2020-08-21 | 2020-12-22 | 国网上海市电力公司 | 针对台区用电特征的画像方法、装置和存储介质 |
CN112990500A (zh) * | 2021-04-01 | 2021-06-18 | 国网山东省电力公司营销服务中心(计量中心) | 基于改进加权灰色关联分析的台区线损分析方法及系统 |
CN113139596A (zh) * | 2021-04-20 | 2021-07-20 | 武汉理工大学 | 低压台区线损神经网络的优化算法 |
Non-Patent Citations (4)
Title |
---|
YIJING REN 等: "Calculation Method of the Line Loss Rate in Transformer District Based on Neural Network with Optimized Input Variables", 2020 IEEE STUDENT CONFERENCE ON ELECTRIC MACHINES AND SYSTEMS, pages 988 - 994 * |
张蓝宇 等: "基于数据挖掘技术的台区线损智能诊断研究及应用", 湖南电力, vol. 39, no. 2 * |
熊鸣: "基于BP神经网络与非参数核密度估计的短期风电功率概率区间预测", 北京信息科技大学学报, pages 0 - 4 * |
赵永红 等: "基于关联度变权的台区理论线损水平评估方法研究", 电力需求侧管理, vol. 22, no. 2 * |
Also Published As
Publication number | Publication date |
---|---|
CN114881429B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111199016B (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
CN111476435B (zh) | 基于密度峰值的充电桩负荷预测方法 | |
CN110610225A (zh) | 一种基于kriging代理模型加点策略的多目标粒子群优化算法 | |
CN108345908A (zh) | 电网数据的分类方法、分类设备及存储介质 | |
CN110880369A (zh) | 基于径向基函数神经网络的气体标志物检测方法及应用 | |
CN113255900A (zh) | 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法 | |
CN110738232A (zh) | 一种基于数据挖掘技术的电网电压越限成因诊断方法 | |
CN111882114B (zh) | 一种短时交通流量预测模型构建方法及预测方法 | |
CN111428766B (zh) | 一种高维海量量测数据的用电模式分类方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN115099511A (zh) | 基于优化copula的光伏功率概率估计方法及系统 | |
CN115907195A (zh) | 一种光伏发电功率预测方法、系统、电子设备及介质 | |
CN116468138A (zh) | 空调负荷预测方法、系统、电子设备及计算机存储介质 | |
Guo et al. | Harris hawks optimization algorithm based on elite fractional mutation for data clustering | |
CN111476303A (zh) | 基于量子优化粒子群的模糊c均值聚类的线损分析方法 | |
CN111209939A (zh) | 一种具有智能参数优化模块的svm分类预测方法 | |
CN113379116A (zh) | 基于聚类和卷积神经网络的台区线损预测方法 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
CN116956160A (zh) | 一种基于自适应树种算法的数据分类预测方法 | |
CN112418504A (zh) | 一种基于混合变量选择优化深度信念网络风速预测方法 | |
CN116826710A (zh) | 基于负荷预测的削峰策略推荐方法、装置及存储介质 | |
CN114881429B (zh) | 基于数据驱动的台区线损量化方法及系统 | |
CN116415177A (zh) | 一种基于极限学习机的分类器参数辨识方法 | |
CN115641231A (zh) | 一种电力系统典型场景提取方法、系统、电子设备及介质 | |
Qin | Software reliability prediction model based on PSO and SVM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |