CN114881429A

CN114881429A - 基于数据驱动的台区线损量化方法及系统

Info

Publication number: CN114881429A
Application number: CN202210412463.3A
Authority: CN
Inventors: 缪晓卫; 袁健华; 欧朱建; 施沩; 王卓; 翁凯斌; 毛艳芳; 江和和; 杨溢; 卫颖
Original assignee: Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co
Current assignee: Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co
Priority date: 2022-04-19
Filing date: 2022-04-19
Publication date: 2022-08-09
Anticipated expiration: 2042-04-19
Also published as: CN114881429B

Abstract

本发明属于台区线损管理技术领域，提供了一种基于数据驱动的台区线损量化方法及系统，包括以下步骤：获取台区数据，建立台区电气特征的指标体系；基于所述台区数据和所述台区电气特征的指标体系，构建台区画像；构建台区线损计算模型；根据所构建的台区画像和台区线损计算模型，实现台区线损的量化。本发明能够在海量台区数据中通过数据挖掘技术根据台区特征刻画不同类型台区画像，构建特性各异台区的电气特征指标体系。在构建台区电气特征指标体系的基础上，各类台区通过台区合理线损预测模型进行快速准确的台区线损合理区间计算，从而实现海量台区线损精准量化。

Description

基于数据驱动的台区线损量化方法及系统

技术领域

本发明属于台区线损管理技术领域，具体涉及一种基于数据驱动的台区线损量化方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

台区线损是电力系统经济运行的一个重要经济技术指标，它反映了电力系统规划设计、生产运行和经营管理水平。台区理论线损计算对制定合理降损措施、线损考核提供了理论依据，快速准确地计算台区线损成为了供电企业的重要任务之一。传统的台区线损管理中采取一刀切的方式，通过采用国网划定的统一固定区间作为合理区间，不利于精益化管理。表计配置不齐备、运行数据不易收集、元件和节点数过多等问题的存在通常会导致线损率计算工作十分繁杂。

传统理论线损计算方法主要包括等值电阻法、均方根电流法、潮流法等计算方法以及对于这些方法的改进算法。随着国家经济的快速发展，供电需求逐步上升，配电网规模逐渐增大，台区下分支线路复杂、元件多样，理论线损的计算若仍依赖传统的计算方法，计算准确性和实时性将难以保证。近年来，随着智能电网的不断建设，低压台区自动化水平也逐年提高，数据采集系统日趋完善，为低压台区线损计算提供了大量的数据，逐渐将神经网络、深度学习等数据驱动的人工智能算法引进到理论线损计算。这些方法利用数据挖掘技术深入发掘电力系统台区线损的实时采集数据，找出其中蕴含的潜在规律，并应用于台区线损计算中，使海量台区线损精准量化成为可能。

发明内容

为了解决上述问题，本发明提出了一种基于数据驱动的台区线损量化方法及系统，能够在海量台区数据中通过数据挖掘技术根据台区特征刻画不同类型台区画像，构建特性各异台区的电气特征指标体系。在构建台区电气特征指标体系的基础上，各类台区通过台区合理线损预测模型进行快速准确的台区线损合理区间计算，从而实现海量台区线损精准量化。

具体地，本发明提供一种基于数据驱动的台区线损量化方法，包括以下步骤：

S1：获取台区数据，建立台区电气特征的指标体系；

S2：基于所述台区数据和所述台区电气特征的指标体系，构建台区画像；

S3：构建台区线损计算模型；

S4：根据所构建的台区画像和台区线损计算模型，实现台区线损的量化。

进一步地，所述步骤S1中，在获取台区数据之后，对所获取的台区数据进行Z-Score标准化处理。

进一步地，所述步骤S1中，根据指标的时变特性，将台区电气特征的指标划分为静态指标和动态指标；所述静态指标包括与台区网架结构和负荷相关且短时间内不可改变的电气特征参数；所述动态指标是指电气特征参数，至少包括由时变电气量计算得到的平均日最大功率、平均负载率和负荷曲线形状系数。

进一步地，所述步骤S2中，基于改进K-Means聚类算法对海量台区数据进行信息挖掘，根据台区特征进行台区分类，基于相关性分析方法对特征各异台区进行分析得到各类台区的线损关键影响因子集，实现台区画像的构建。

进一步地，所述步骤S3包括：在建立台区画像的基础上，基于BP神经网络和核密度估计方法，采用机器学习方法构建台区线损计算模型，其中台区线损区间的计算过程为：

步骤(1)：将台区线损预测值进行等间隔划分成不同区间；

步骤(2)：若存在间隔内样本数据较少，则合并相邻区间；

步骤(3)：采用核密度估计方法，同时基于网格搜索交叉验证方法选择最优核函数和最优带宽，进而得到不同区间的预测误差概率密度函数

进一步地，，所述步骤S4包括：基于BP神经网络-核密估计台区线损计算模型对台区线损及合理区间进行计算，具体过程为：

步骤(1)：判断台区所属类别，即根据该台区电气特征指标体系的指标数据与聚类中心的欧式距离判断台区所属类别为第k类台区；

步骤(2)：构建台区线损影响关键因子集，即根据台区的所属类别构建对应的台区线损影响关键因子集；

步骤(3)：BP神经网络预测，即将台区电气特征指标数据输入BP神经网络，对台区线损进行合理预测；

步骤(4)：台区线损合理区间计算，即判断预测值所属区间，根据训练过程中求得的预测误差概率密度函数得到预测误差的a及1-a分位点，从而得到该预测值的置信区间，即为台区线损的合理区间。

进一步地，，所述步骤S4基于BP神经网络和核密度估计的计算分析，得到不同类别台区线损预测值及合理区间，实现台区线损的量化。

根据一些实施例，本发明的第二方案提供了一种基于数据驱动的台区线损量化系统，采用如下技术方案：

一种基于数据驱动的台区线损量化系统，包括：

获取模块，被配置为获取台区数据，建立台区电气特征的指标体系；

构建画像模块，被配置为基于所述台区数据和所述台区电气特征的指标体系，构建台区画像；

建模模块，被配置为构建台区线损计算模型；

台区线损量化模块，被配置为根据所构建的台区画像和台区线损计算模型，实现台区线损的量化。

根据一些实施例，本发明的第三方案提供了一种计算机可读存储介质，采用如下技术方案：

一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现如本发明第一方面所述的基于数据驱动的台区线损量化方法中的步骤。

根据一些实施例，本发明的第四方案提供了一种电子设备，采用如下技术方案：

一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的程序，所述处理器执行所述程序时实现如本发明第一方面所述的基于数据驱动的台区线损量化方法中的步骤。

与现有技术相比，本发明的有益效果为：

本发明提出了改进K-Means聚类算法，在算法中通过粒子群搜索较优的初始聚类中心；同时提出聚类效果综合评价指标，两者的结合可充分提高分类效率，保证台区画像的各异性。

本发明提出了客观权重提取方法，在皮尔逊相关分析的基础上进行客观权重修正，从而在众多电气指标中筛选出影响台区线损最关键的因素，形成关键影响因子集。

本发明所提出的台区线损计算模型基于数据驱动和机器学习方法，充分挖掘台区线损关键影响因子集与台区线损的内在映射关系，并结合核密度估计，使得能够快速准确地计算台区理论线损并给出其合理区间。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1是本发明实施例一中的基于数据驱动的台区线损量化方法的流程图；

图2是本发明实施例一中的改进K-Means聚类算法流程示意图；

图3是本发明实施例一中的台区画像构建流程示意图；

图4是本发明实施例一中的台区线损计算模型训练流程示意图；

图5是本发明实施例一中的台区线损计算模型应用流程示意图；

图6是本发明实施例二中的基于数据驱动的台区线损量化系统的结构框图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

实施例一

本发明实施例一介绍了一种基于数据驱动的台区线损量化方法。具体地，一种基于数据驱动的台区线损量化方法，包括以下步骤：

获取台区数据，建立台区电气特征的指标体系；

基于所述台区数据和所述台区电气特征的指标体系，构建台区画像；

构建台区线损计算模型；

根据所构建的台区画像和台区线损计算模型，实现台区线损的量化。

下面，本实施例详细介绍基于数据驱动的台区线损量化方法。

如图1所示的一种基于数据驱动的台区线损量化方法,具体过程为：

步骤S01：获取海量台区数据；

步骤S02：台区数据的标准化处理；

步骤S03：台区电气特征指标体系构建；

步骤S04：台区画像构建；

步骤S05：台区线损计算模型的构建；

步骤S06：台区线损精准量化。

作为一种或多种实施方式，在步骤S02中，对海量台区数据进行Z-Score标准化处理，避免数据量纲影响。

海量台区电气特征参数涉及的电气量众多，取值范围和单位都不相同，为了不受量纲影响进行计算，需要对原始数据进行标准化处理。设电气特征参数个数为M个，台区样本数为N个，则样本矩阵如式(1)所示，每一行表示一组台区信息样本，每一列表示不同台区下某电气特征参数。

标准化方法如下所示：

式中，

为电气特征参数j的样本平均值，x_ij是第i个台区样本的电气特征参数j的样本值，σ_j为电气特征参数j的样本方差，Z_ij为x_ij标准化处理后的量。

作为一种或多种实施方式，在步骤S03中，根据指标的时变特性，将台区电气特征指标划分为静态指标和动态指标，静态指标包括居民容量、居民用户比例、光伏用户比例、低压线路总长度、供电半径等与台区网架结构和负荷相关且短时间内不可改变的电气特征参数，动态指标包括由电压、电流等时变电气量计算得到的平均日最大功率、平均负载率、负荷曲线形状系数等电气特征参数。

线损变化主要和台区网架结构、负荷曲线的起伏波动、电容器投切和运行方式的不同等因素相关，因此本发明选取负荷曲线形状系数、平均负载率、平均日最大功率等动态指标与居民容量、非居民容量、居民用户比例、非居民用户比例等静态指标共同构成特征集作为台区电气特征指标体系。

其中，平均日最大功率计算公式如下式所示：

式中，N为典型日所在月的天数，P_max为典型日所在月的每日的日最大功率值。

平均负载率计算公式如下式所示：

式中,U_ij和I_ij为典型日24点电压曲线和电流曲线，C_ij为台区变压器容量。

负荷曲线形状系数K_l为典型日均方根电流与电流均值之比，其计算公式如下式所示：

式中，Im表示m时刻的电流值。

作为一种或多种实施方式，在步骤S04中，基于改进K-Means聚类算法对海量台区数据进行信息挖掘，根据台区特征进行台区分类，并基于相关性分析方法对特征各异台区进行分析得到各类台区的线损关键影响因子集，从而构建台区画像。

台区画像的构建步骤如图3所示。首先将上述已构建的台区电气特征指标体系和台区线损数据一同作为输入，通过改进K-Means聚类算法实现特征各异的台区分类；接着通过聚类效果综合评价指标对不同分类结果进行评估，得到最佳台区分类Kbest，对最佳台区分类结果进行相关性分析和客观权重修正，并依据客观权重进行排序选择，由此得到台区线损关键影响因子集，从而构建各类台区画像。

采用如图2所示的改进K-Means聚类算法进行台区分类，由于K-Means聚类算法的聚类效果对初始聚类中心敏感，因此改进K-Means聚类算法中采用粒子群搜索算法来寻找最优聚类中心。改进K-Means聚类算法流程如下：

输入台区样本数据矩阵N*M，其中样本数目N，电气特征指标数目M；

步骤(1)初始化：设置最大迭代次数为T，初始迭代次数为t＝1，粒子数为Y，台区类别数为K，随机设置N个台区样本的所属类别形成台区类别矩阵，设置每个粒子的初始位置、初始速度和初始适应度。

步骤(2)获取粒子位置：根据样本所属类别获得各类别聚类中心c_k(t,y),k∈[1,K]，由各类别聚类中心构成的向量即为粒子的位置P_c(t,y)＝[c₁(t,y),c₂(t,y),…c_k(t,y)]。

式中，C_k,(y,t)为在第t次迭代第y个粒子的计算中第k类台区组成的簇，card(C_k,(y,t))为属于该簇的台区数目，x_n为属于第k类台区的台区样本。

步骤(3)计算适应度值：根据适应度函数公式计算出每个粒子的适应度值，公式如下：

步骤(4)获取个体极值和全局极值：比较每个粒子的适应度值与历史最佳位置P_p(t,y)的适应度值，如果每个粒子的适应度值更小，则用当前粒子的位置和适应度值更新P_p(t,y)和其适应度值p(t,y)；比较每个粒子的适应度值与整个粒子群的历史最好位置P_g(t,y)的适应度值，如果每个粒子的适应度值更小，则用当前粒子的位置和适应度值更新P_g(t,y)和其适应度值g(t,y)。

步骤(5)更新初始聚类中心：当粒子的位置被更新时即聚类中心被更新。根据下式更新每个粒子的速度和位置：

v_d(t+1,y)＝ωv_d(t,y)+c₁r₁[P_p(t,y)-P_c(t,y)]+c₂r₂[P_g(t,y)-P_c(t,y)],r₁,r₂∈(0,1) (10)

P_c(t+1,y)＝P_c(t,y)+v_d(t+1,y) (11)

式中：d＝1、2、...、K*M；ω为权重系数；p(t,y)和g(t,y)分别为粒子的个体极值和全局极值；r1和r2为(0,1)内的随机数，c1和c2为加速因子，通常取值为2。

步骤(6)更新台区类别矩阵：根据更新后的聚类中心重新对N个台区样本的所属类别分类，形成新的台区类别矩阵，然后进入下一次迭代，回到步骤(2)。若达到最大迭代次数，则退出循环。

根据上述的K-Means聚类算法流程，可以不同类别数的台区分类结果。不同聚类结果的有效性由相应的聚类结果评价指标衡量。由于台区分类过程没有确切的标准可以对照，即无法进行外部度量，因此通过内部度量聚类中心与属于其类内的台区样本的相似性来评判台区样本聚类效果。

当台区样本数为时，则聚类数的有效搜索范围为

且K为整数。本发明考虑到簇类型对单一指标判定效果的影响，综合三种聚类效果内部度量指标形成综合评价指标对聚类效果进行评价。当台区数据分为K类时，综合评价指标的计算公式如下：

式中，β_i表示各评价指标的权重，且满足

该指标越大，表示聚类效果越好。综合评价指标由整体轮廓系数

和CH分数CH(K)和戴维森堡丁指数DBI(K)构成。

s(i)表示台区样本数据i的轮廓系数，计算如公式(13)所示。所有台区样本数据的轮廓系数的均值称为聚类结果为K时的整体轮廓系数，整体轮廓系数越大，聚类效果越好。当使用轮廓系数判断聚类效果时，当簇越接近一个标准簇时，即簇密集且分离较好时，分数更高。因此凸簇的轮廓系数会比其他类型的簇更高。

式中：a(i)为台区样本数据i到同簇内其它台区样本数据的平均距离，该值越小说明台区样本数据i越应该被聚类到该簇，a(i)又称为台区样本数据i的簇内不相似度。b(i)为台区样本数据i到其他某簇C_其他某簇内所有台区样本数据的平均距离的最小值，即

b(i)＝min{b_i-c1,b_i-c2,…,b_i-cj,…b_i-ck},cj∈C_其他某簇，

b(i)又称为台区样本数据i的簇间不相似度。s(i)接近1，则说明台区样本数据i的聚类结果合理；s(i)接近-1，则说明台区样本数据i更应该分类到其他簇；s(i)近似为0，则说明台区样本数据i在两个簇的边界上。

CH分数被定义为簇间离散程度与簇内离散程度的比率，该分值越大说明同类自身越紧密，类与类之间越分散，聚类效果越好，计算下式所示：

式中：B_K是簇间离散矩阵，W_K是簇内离散矩阵，C_k表示簇k，c_k是簇k的中心点，c是数据集的中心点。

原始场景集中有m个台区样本数据。DBI(K)值越小，聚类效果越好。计算过程如下：首先，计算分散度：

式中，F_i表示第i个簇内台区样本数据的离散程度，X_j表示簇i的第j个台区样本数据，A_i表示簇i的中心，T_i表示簇i内的台区样本数据个数。p＝1时，计算的是簇i内各点到中心的距离的均值；p＝2时，计算的是簇i内各点到中心的距离的标准差。

接着，计算簇i和簇j间的距离D_ij：

式中，一个台区样本数据的电气特征参数个数为M个，a_ki表示簇i的中心点的第k个属性的值，a_kj表示簇j的中心点的第k个属性的值。

接着，计算簇i和簇j间的相似度G_ij：

通过以上公式的计算，选出簇间相似度的最大值

并对各个簇的最大相似度求均值，得到DBI指数如下式:

根据上述的综合评价指标对不同K时的台区分类结果进行评估，选择综合评价指标最大时的台区分类结果Kbest。

在台区分类的基础上，采用相关性分析方法形成不同类别台区的线损影响关键因子集，从而构建不同类别台区的台区画像。所提方法逐一对每类台区进行分析，采用基于改进加权的皮尔逊相关分析评估台区电气特征指标与台区线损的相关性，选择相关性更强的电气特征指标作为该类台区的线损影响关键因子集。

皮尔逊系数代表某一个电气指标同线损率的相关程度，分值在-1到1之间。一般来说，相关系数越接近于1或-1，代表指标同线损率的相关性越强；相关系数越接近于0，代表指标与线损率的相关性越弱，大多数情况下，根据相关性可以得到三种结论：

(1)当相关系数大于0时，认为特征与线损率呈正相关关系，表明指标数值越高，台区的线损率通常也越高。

(2)当相关系数小于0时，认为特征与线损率呈负相关关系，表明指标数值越高，台区的线损率通常越低。

(3)当相关系数等于0时，认为特征与台区的线损率无关，代表指标的数值的上升和下降对台区的线损率无影响。

假设指标j的第i个指标值为x_ij，指标j的平均值为

第i个台区样本的线损率为y_i，平均值为

指标j的皮尔逊相关系数的计算式如下：

进行相关性检验后，应对各指标进行权重分析，所提方法选取CRI T I C法作为权重修正方法，即对相关性检验后确定的各关键影响因子进行指标客观权重的计算。CRI T IC法作为一种客观赋权法，通过评价指标的变异程度和冲突性来度量指标的客观权重。考虑指标变异性大小的同时兼顾指标之间的相关性，能够实现基于整个指标体系的客观赋权。其中，指标的变异程度通过标准差

来量化：

式中，x_ij表示指标j的第i个指标值，Sj则表示某类指标中第j个指标值的变异程度。

指标的冲突性通过相关系数

来量化：

式中，

可由式(21)的公式计算而得，表示xj和x_m的相关性，M表示指标体系中的指标个数，Rj表示第j个特征量的特征冲突性指标值。

指标体系中第j个指标的客观权重W_j为：

式中，S_j×R_j表示信息量，即第j个指标在CRITIC权重评价体系中的作用大小。由上式可以看出，某个指标所包含的信息量越大，则重要性越大，进而权重值越大。

结合上述皮尔逊相关计算得到的关联度

和式(24)得到的权重值W_j，最终得到各指标的加权关联度大小：

对第k类台区样本进行上述的改进加权皮尔逊相关性分析，最终根据加权关联度对台区电气特征指标排序，选取加权关联度较大的电气指标作为该类台区的线损影响关键因子，进而对不同类型台区形成线损影响关键因子集，刻画出该类台区的线损影响特征。

作为一种或多种实施方式，在步骤S05中，将各个台区画像应用在基于BP神经网络和核密度估计的台区线损计算模型上，得到特征各异台区线损合理区间，从而实现海量台区线损精益化管理。

在建立台区画像的基础上，采用机器学习方法构建Kbest个台区线损计算模型。台区线损计算模型基于BP神经网络和核密度估计方法建立。

BP神经网络结构包括输入层、隐含层和输出层三部分。BP神经网络是一种基于反向误差传递的方法。BP神经网络构建流程如下：

步骤(1)构建BP神经网络：选取台区线损关键因子集和对应的台区线损分别作为模型的输入和输出，输入层的节点个数取决于台区线损关键因子集中电气特征指标的个数，隐含层节点个数可依据式(26)大致确定：

式中，m和n分别为输出层和输入层的神经元个数，a是[0,10]之间的常数。

学习速率决定每次循环训练中所产生的权值变化量。学习速率过高可能导致系统的不稳定，但学习速率过低又会导致较长的训练时间，可能收敛很慢，不过能保证网络的误差值跳出误差表面的低谷而最终趋于最小误差值。在一般情况下，倾向于选取较小的学习速率以保证系统的稳定性。

期望误差的选取。在网络的训练过程中期望误差值也应当通过对比训练后确定一个合适的值。所谓的“合适”,是相对于所需要的隐含层的结点数来确定的，因为较小的期望误差要靠增加隐含层的结点以及训练时间来获得。

步骤(2)训练BP神经网络：本方法在前述步骤已经完成了输入数据标准化。通过数据标准化处理可取消各维数据间的数量级差别，避免因输入输出数据数量级差别较大而造成的网络训练误差。BP网络的训练过程由输入数据的前向传播和误差的反向传播两个部分组成。

在前向传播过程中，每一个输出神经元j得到输出信号：

式中，φ_j是激活函数，w_ji(n)是神经元权值，m是作用于神经元j的所有输入个数。w_j0(n)等于神经元j的偏置b_j。

在神经网络输出层，根据实际输出和期望输出求得瞬时误差能量：

式中，集合C包括输出层的所有神经元，d_j(n)为神经元j的期望输出。

在反向传播过程中，BP神经网络反复通过梯度下降法修正权值w_ji(n)。权值修正值为：

Δw_ji(n)＝ηδ_j(n)y_i(n) (29)

式中，φ′_j是对激活函数φ_j的微分，δ_j(n)为局部梯度，y_i(n)为神经元i的输出信号。

为了加快模型学习速度同时保持训练稳定，在式(29)中增加动量项αΔw_ji(n-1)，则修改后的权值修正值如下式所示：

Δw_ji(n)＝ηδ_j(n)y_i(n)+αΔw_ji(n-1) (31)

式中，α为动量常数，且满足α∈[0,1)，动量项反映了以前积累的调整经验，当误差梯度出现局部极小时，使其跳出局部极小区域，加快迭代收敛速度。

BP神经网络通过上述的前向传播和反向传播反复修正网络，当网络稳定收敛时，BP神经网络的训练结束。

步骤(3)BP神经网络预测：将测试及样本数据输入训练好的BP神经网络模型，对台区线损进行合理预测，并分析预测误差。

此时BP神经网络获得的是台区线损预测值，为了得到台区线损的合理区间，所提方法采用核密度估计。

如图4所示的台区线损的合理区间计算流程如下：

步骤(4)：将台区线损预测值进行等间隔划分成不同区间；

步骤(5)：若存在间隔内样本数据较少，则合并相邻区间；

步骤(6)：采用核密度估计方法，同时基于网格搜索交叉验证方法选择最优核函数和最优带宽，进而得到不同区间的预测误差概率密度函数。

接下来，所提的BP神经网络-核密度估计台区线损计算模型可以对台区线损及其合理区间进行计算，应用流程如图5所示，流程如下：

步骤(1)判断台区所属类别：根据该台区电气特征指标体系的指标数据与聚类中心的欧式距离判断台区所属类别为第k类台区。

步骤(2)构建台区线损影响关键因子集：根据台区的所属类别构建对应的台区线损影响关键因子集。

步骤(3)BP神经网络预测：将台区电气特征指标数据输入BP神经网络，对台区线损进行合理预测。

步骤(4)台区线损合理区间计算：判断预测值所属区间，根据训练过程中求得的预测误差概率密度函数得到预测误差的a及1-a分位点，从而得到该预测值的置信区间，即为台区线损的合理区间。

基于BP神经网络和核密度估计的计算分析，可得到不同类别台区线损预测值及合理区间，从而实现台区线损精准量化。

本实施例所介绍的基于数据驱动的台区线损量化方法能够在海量台区数据中通过数据挖掘技术根据台区特征刻画不同类型台区画像，构建特性各异台区的电气特征指标体系。在构建台区电气特征指标体系的基础上，各类台区通过台区合理线损预测模型进行快速准确的台区线损合理区间计算，从而实现海量台区线损精准量化。

实施例二

本发明实施例二介绍了一种基于数据驱动的台区线损量化系统。

如图6所示的一种基于数据驱动的台区线损量化系统，包括：

建模模块，被配置为构建台区线损计算模型；

详细步骤与实施例一提供的基于数据驱动的台区线损量化方法相同，在此不再赘述。

实施例三

本发明实施例三提供了一种计算机可读存储介质。

一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现如本发明实施例一所述的基于数据驱动的台区线损量化方法中的步骤。

实施例四

本发明实施例四提供了一种电子设备。

一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的程序，所述处理器执行所述程序时实现如本发明实施例一所述的基于数据驱动的台区线损量化方法中的步骤。

本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述，但是本领域技术人员应该理解，以上实施示例仅为本发明的优选实施方案，详尽的说明只是为了帮助读者更好地理解本发明精神，而并非对本发明保护范围的限制，相反，任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims

1.一种基于数据驱动的台区线损量化方法，其特征在于，包括以下步骤：

S1：获取台区数据，建立台区电气特征的指标体系；

S3：构建台区线损计算模型；

2.如权利要求1中所述的一种基于数据驱动的台区线损量化方法，其特征在于，所述步骤S1中，在获取台区数据之后，对所获取的台区数据进行Z-Score标准化处理。

3.如权利要求1中所述的一种基于数据驱动的台区线损量化方法，其特征在于，所述步骤S1中，根据指标的时变特性，将台区电气特征的指标划分为静态指标和动态指标；所述静态指标包括与台区网架结构和负荷相关且短时间内不可改变的电气特征参数；所述动态指标是指电气特征参数，至少包括由时变电气量计算得到的平均日最大功率、平均负载率和负荷曲线形状系数。

4.如权利要求1中所述的一种基于数据驱动的台区线损量化方法，其特征在于，所述步骤S2中，基于改进K-Means聚类算法对海量台区数据进行信息挖掘，根据台区特征进行台区分类，基于相关性分析方法对特征各异台区进行分析得到各类台区的线损关键影响因子集，实现台区画像的构建。

5.如权利要求4中所述的一种基于数据驱动的台区线损量化方法，其特征在于，所述步骤S3包括：在建立台区画像的基础上，基于BP神经网络和核密度估计方法，采用机器学习方法构建台区线损计算模型，其中台区线损区间的计算过程为：

步骤(1)：将台区线损预测值进行等间隔划分成不同区间；

步骤(2)：若存在间隔内样本数据较少，则合并相邻区间；

步骤(3)：采用核密度估计方法，同时基于网格搜索交叉验证方法选择最优核函数和最优带宽，进而得到不同区间的预测误差概率密度函数。

6.如权利要求5中所述的一种基于数据驱动的台区线损量化方法，其特征在于，所述步骤S4包括：基于BP神经网络-核密估计台区线损计算模型对台区线损及合理区间进行计算，具体过程为：

7.如权利要求6中所述的一种基于数据驱动的台区线损量化方法，其特征在于，所述步骤S4基于BP神经网络和核密度估计的计算分析，得到不同类别台区线损预测值及合理区间，实现台区线损的量化。

8.一种基于数据驱动的台区线损量化系统，其特征在于，包括：

建模模块，被配置为构建台区线损计算模型；

9.一种计算机可读存储介质，其上存储有程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一项所述的基于数据驱动的台区线损量化方法中的步骤。

10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于数据驱动的台区线损量化方法中的步骤。