CN114862139B - 一种基于数据驱动的台区线损率异常诊断方法 - Google Patents

一种基于数据驱动的台区线损率异常诊断方法 Download PDF

Info

Publication number
CN114862139B
CN114862139B CN202210412465.2A CN202210412465A CN114862139B CN 114862139 B CN114862139 B CN 114862139B CN 202210412465 A CN202210412465 A CN 202210412465A CN 114862139 B CN114862139 B CN 114862139B
Authority
CN
China
Prior art keywords
line loss
area
loss rate
user
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210412465.2A
Other languages
English (en)
Other versions
CN114862139A (zh
Inventor
缪晓卫
袁健华
欧朱建
戴卉婷
王孟希
江和和
吴楠
吴夕楠
沙杰
保扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co
Original Assignee
Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co filed Critical Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co
Priority to CN202210412465.2A priority Critical patent/CN114862139B/zh
Publication of CN114862139A publication Critical patent/CN114862139A/zh
Application granted granted Critical
Publication of CN114862139B publication Critical patent/CN114862139B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computational Mathematics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)

Abstract

本发明提出了一种基于数据驱动的台区线损率异常诊断方法,首先,进行多源数据采集,依据台区线损率标杆值及实际经验将台区分类为高线损台区、负线损台区、台区线损率持续为零台区及线损无法计量台区;在此基础上,基于离散系数及灰色关联度分析等方法识别出线损异常波动台区及相应原因;接着对负线损率台区、线损持续为零台区异常原因进行诊断,对台区总表相关技术性故障给出量化评判指标;然后,对高线损率台区异常原因进行诊断,构建了基于自编码器、k‑means聚类算法的用户窃电诊断模型,并基于多元线性回归算法的对台区结构合理度进行分析;并对线损无法计量台区异常原因进行诊断。由此实现台区线损异常原因的准确识别及故障定位。

Description

一种基于数据驱动的台区线损率异常诊断方法
技术领域
本发明涉及电网线损诊断技术领域,具体涉及一种基于数据驱动的台区线损率异常诊断方法。
背景技术
线损率是一项评估电网精益化水平的重要经济技术指标。加强低压台区线损管理是电网增强电网经济运行能力,提升电能利用效率的重要措施。为有针对性地给出科学降损措施,首要的是找出造成台区线损率异常的原因,实现其快速诊断。
造成线损异常的原因众多,如台区供电侧或用户侧电表电量采集问题、台区总表接线异常、负荷侧三相严重不平衡等技术性原因,或台区下用户的户—变关系匹配错误、严重窃电等管理性原因。而现有台区线损异常诊断方法多是根据人工经验或现场排查,准确率不足且效率低下,无法做到智能化分析和准确定位。
目前电网大数据平台为获取海量台区信息提供了便捷,如何在海量数据中挖掘有效信息,建立同线损异常诊断间的关系是待解决的难题。仅将台区线损率作为分析的唯一指标不仅与线损管理智能化、精细化的理念相悖,且显然无法准确判断造成台区线损异常的真正原因,难以为降损提供科学指导。
基于现有技术上述存在的问题,亟需发明一种台区线损率异常诊断方法。
发明内容
为解决上述问题,本发明的目的在于提供一种基于数据驱动的台区线损率异常诊断方法,实现台区线损异常的智能诊断及科学管理。
具体地,本发明提出一种基于数据驱动的台区线损率异常诊断方法,所述方法包括如下步骤:
S1,数据采集,并对采集数据进行数据预处理;
S2,根据台区线损率合理区间,将线损异常台区分为高线损率台区、负线损率台区或、损率持续为零台区、线损率无法计量台区;
S3,根据S2统计出的高线损率台区及负线损率台区的线损率台区,以上述台区日线损率为数据基础,判断上述台区线损率异常是否由天气因素或用户侧电表抄表成功率低下引起;
S4,针对线损率负值台区及损率持续为零台区,判断其线损异常来源于台区总表故障,还是台区下户变关系识别错误使原归属用户错划入相邻台区致本台区供电量小于售电量;其中,台区总表故障包含台区总表失流、台区总表电流互感器相间错接线、台区总表电流互感器进出口反向接线;
S5,针对高线损率台区,判断其线损异常来源于以下何种原因:
台区总表跳字导致计量错误,供电量远高于正常值;
台区自身结构不合理导致线损率高于正常台区;
台区下用户存在窃电行为;
存在户变关系识别错误,台区下用户档案归入相邻台区,导致售电量少计;
S6,针对线损率无法计量台区,即统计日期内供电量数据缺失达50%及以上,输出诊断结果及台区编号,通知检修人员进行故障检查。
进一步地,所述步骤S1包括:采集基础数据,包括:台区和用户基本档案信息、台区总表日供电量曲线、线损率变化曲线、抄表成功率、台区总表日电能示值及电压和电流曲线、台区运行功率因数、用户侧用电量、三相电压、三相电流、有功功率、无功功率数据,并收集天气情况、近期是否存在台区线路改造计划。
进一步地,所述步骤S3包括:
S31:选取台区下当月日线损率变化曲线,若存在小部分线损率数据缺失现象,运用分段线性插值法填补空值;
S32:引入离散系数CV量化台区线损率曲线波动程度;
S33:提取m=30日的某台区线损率变化曲线,计算离散系数CV,并引入线损率波动区间,设置临界值,当离散系数大于临界值时视为疑似台区,若有超过20%采集到的日线损率值不在此区间内,且离散系数大于临界值,则进行天气情况及抄表成功率同线损率的相关性分析,反之则认为线损波动情况在可接纳范围内,转入步骤S5和S6进行判断;
S34:针对分步骤S33确定的线损率波动台区,采用灰色关联度分析法量化天气状况及抄表成功率对线损异常的影响程度。
进一步地,所述步骤S31包括:假设有两个节点(m1,n1)、(m2,n2),则两点之间的分段线性插值函数为:
式中,x表示所选台区日线损率,F为分段线性插值函数。
进一步地,所述步骤S32中离散系数的定义是一组数据标准差与其均值的百分比量,CV计算公式为:
式中,为样本均值,δ为样本标准差,m为样本总量,xi表示样本值。
进一步地,所述步骤S33进一步包括:
取CV=0.25为临界值,CV>0.25则视为疑似异常点,引入线损率波动区间为若有超过20%采集到的日线损率值不在此区间内,且CV>0.25,则进行天气情况及抄表成功率同线损率的相关性分析,反之则认为线损波动情况在可接纳范围内,转入步骤S5和S6进行判断。
进一步地,所述步骤S34包括:将台区线损率作为参考序列,气温、是否出现极端天气及抄表成功率作为比较序列,对比较序列中的各元素进行无量纲化处理,计算比较序列中各元素同参考序列中对应元素的关联度,再计算各比较序列中的应元素关联度平均值,该值即为灰色关联度权重ri,若ri>0.6即认为存在较强关联性,则结束判断,输出对应指标;反之则认为不存在关联性,转入步骤S4、S5及S6进行判断。
进一步地,所述步骤S4包括:
S41:提取台区总表供电量数据及总表侧三相电流数据,根据三相电流数据的数值正负判断是否存在台区总表电流互感器接反故障;综合根据三相电流值、供电量及台区功率因数,判断是否存在台区总表相间错接线故障;若符合,结束判断,输出诊断结果,否则转入分步骤S42;
S42:提取台区总表三相电流及三相电压数据,根据电流失流准则判断是否存在电流失流故障,若符合,结束判断,输出诊断结果。
否则转入分步骤S43;
S43:考虑是否存在台区下户变关系识别错误,提取该台区历史12个月的月供电量及月售电量,计算得到线损电量并取绝对值,分别对供电量及线损电量进行归一化处理,采用Pearson相关系数法进行相关性分析,其计算公式为:
式中,gi为台区某月份的供电量;为台区统计月份供电量均值;hi为对应月份线损电量;/>为对应统计月份线损电量均值;
判断线损电量同供电量的相关性,当相关系数ρgh≤0.8,则认定为户—变关系识别嫌疑台区。
进一步地,所述步骤S5包括:
S51:判断台区线损率过高是否由于台区总表跳字导致计量错误:根据台区总表跳字判别标准,即台区当日供电量与日理论最大供电量比值超过100%,判定为台区总表跳字,输出诊断结果,进行台区总表故障修复,若台区线损率恢复至正常水平,结束判断;若台区当日供电量与日理论最大供电量比值未超过100%,则转入分步骤S52及S53进行判断;
S52:基于用户用电量数据,利用优化的聚类算法构建窃电用户筛查模型来判断台区线损率过高是否由于台区下用户窃电导致;
S53:考虑台区线损高于合理区间由于台区自身结构不合理造成,包含:台区供电线路长度过长、台区供电半径过大、台区下负荷量大、台区供电线路末端用户数量较多致使售电量难以统计;
S54:以剩余台区的供电线路长度,供电半径,台区供电末端用户数量及台区变压器运行功率为基础数据,分析上述台区基础指标同线损率异常的相关性,并采用多元线性回归模型进行量化,给出各因素对异常线损率的影响权重,从而诊断出台区线损异常的原因。
所述步骤S52包括:
a)基于用户电能采集装置分别获取高线损台区下所有用户日用电量及线损正常台区下用户日用电量,高线损台区用户及线损正常台区用户各占比50%,得到用户每日的负荷曲线,共采集l位用户m日的用户用电量;
b)引入加权平均用电量刻画用户负荷特征曲线,设用户在第j日提取到的负荷曲线为Pj=[Pj1,Pj2,...,Pji,...,Pj96],则第j日i时刻该用户的用电量权重为:
式中,N表示所选日期。
相应地,用户在i时刻的加权平均用电量为:
对各时刻的数据分别应用上述公式,即可得到单一用户的日负荷特征曲线;
c)对所得各用户日负荷特征曲线数据进行标准化处理,利用自动编码器对用户的日负荷特征曲线数据降维,所述自动编码器由输入层、隐层、输出层3层构成,选取自动编码器的编码器部分,将编码器降至4维的隐藏层输出数据作为聚类的输入数据;
d)采用k-means聚类算法对用户日负荷特征曲线进行聚类,利用轮廓系数作为聚类效果评价指标,不断改进聚类数,在最佳聚类数下得到聚类结果;根据分类结果,计算每一簇中各数据对象的均值,得到每簇曲线的聚类中心,刻画各类典型用户日负荷特征曲线;
e)对高线损率台区下用户开展用户日负荷曲线同所属典型用户日负荷特征曲线的匹配,综合Pearson相关系数、欧式距离量化用户窃电概率,当匹配率低于给定阈值,即判定该用户当日存在窃电行为,输出诊断结果。
所述步骤S54包括:
a)采集台区的基本信息,包括:供电线路长度、供电半径、台区供电末端用户数量及台区变压器运行功率作为输入数据,判断各因素同台区线损率的相关性,设线损率序列为y,相关台区基本信息序列为x=[x1,x2,...,xk],采用Pearson相关系数进行判断,经计算各因素同线损率的相关系数均大于75%,可认为存在相关性;
b)构建台区线损率与台区相关基本信息的多元线性回归模型,表示为:
y=β01x1+...+βkxk
式中,β01,...,βk为相关系数,ξ为随机误差。将x,y,β,ξ均写作矩阵形式,则多元回归模型可以写作如下形式:
y=Xβ+ξ
根据最小二乘原理,应使取最小值,则相关系数的估计值/>表示为:
c)根据计算出的的数值绝对值的大小,得出上述各基本信息对台区线损率的权重,从而给出导致线损率高值最有可能的相关原因,作出诊断结果。
从以上技术方案可以看出,本发明具有以下优点:
(1)基于大数据分析及机器学习算法,对于高线损台区、负线损或零线损台区及线损无法计量台区,依托采集的多源数据,融合典型研判规则与基于机器学习算法的智能判别方法,对台区线损异常原因开展智能化分析,实现台区线损异常原因的快速定位;
(2)提出了线损率异常波动台区识别及原因诊断流程,基于离散系数及灰色关联度分析识别出线损异常波动台区,根据Pearson相关系数判别线损异常波动对应原因;
(3)提出了负损或持续零损台区线损异常原因的诊断流程,重点梳理了台区总表故障的判断方法,给出了基于相关性分析的台区下户变关系识别错误的判断方法;
(4)提出了高损台区线损异常原因的诊断流程,重点构建了基于自编码器、k-means聚类算法的用户窃电诊断模型,给出了基于多元线性回归算法的台区结构合理度分析方法。
附图说明
图1为本发明的台区线损率异常诊断方法总流程示意图;
图2为本发明线损率异常波动台区识别及原因诊断流程示意图;
图3为本发明负线损率台区、线损持续为零台区异常原因诊断流程示意图;
图4为本发明高线损台区异常原因诊断流程示意图;
图5为本发明用户窃电筛查模型及k-means聚类算法流程示意图。
具体实施方式
本发明的目的在于提供一种基于数据驱动的台区线损率异常诊断方法,实现台区线损异常的智能诊断及科学管理。
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
如图1所示,本实施例提供一种基于数据驱动的台区线损率异常诊断方法,包含以下步骤:
步骤1,数据采集。基于营销业务应用系统、用电信息采集系统等采集基础数据,包括:台区和用户基本档案信息、台区总表日供电量曲线、线损率变化曲线、抄表成功率、台区总表日电能示值及电压和电流曲线、台区运行功率因数、用户侧用电量、三相电压、三相电流、有功功率、无功功率数据,收集天气情况、近期是否存在台区线路改造计划。对采集数据进行数据预处理;
步骤2,根据台区线损率标杆值及其合理区间,将线损异常台区分为高线损率台区、负线损率台区、线损率持续为零台区、线损率无法计量台区。
设置台区线损率合理区间下阈值为0,线损率低于0的台区即定义为负线损台区。设置台区线损率合理区间上阈值为H,线损率高于H的台区即定义为高线损率台区,通常H=10%。线损无法统计台区是指台区总表供电量计量数据缺失比例达50%及以上,统计此类台区线损率无意义,故直接设置为线损率无法计量台区;
步骤3,根据步骤2统计出的高线损率台区及负线损率台区,以上述台区日线损率为数据基础,判断上述台区线损率异常是否由天气因素(温度、极端天气情况)或用户侧电表抄表成功率低下(人工因素)引起。图2为线损率异常波动台区识别及原因诊断流程示意图。相关分析流程如下:
(1)选取台区下当月日线损率变化曲线,若存在小部分线损率数据缺失现象,运用分段线性插值法填补空值。假设有两个节点(m1,n1)、(m2,n2),则两点之间的分段线性插值函数F为:
式中,x表示所选台区日线损率,F为分段线性插值函数。
(2)引入离散系数CV量化台区线损率曲线波动程度,离散系数的定义是一组数据标准差与其均值的百分比量,CV计算公式为:
式中,为样本均值,δ为样本标准差,m为样本总量,xi表示样本值。
(3)提取m=30日的某台区线损率变化曲线,设x0(i)为某台区在第i日的线损率,为该台区线损率均值,δ为该台区线损率标准差。根据式(2)计算得CV,CV的数值绝对值越大,表示线损率的离散程度越高,反之则表示数据的离散程度越低。取CV=0.25为临界值,CV>0.25则视为疑似异常点。
为更准确校验线损率波动情况,引入线损率波动区间为若有超过20%采集到的日线损率值不在此区间内,且CV>0.25,则定义为线损波动异常台区,进行天气情况及抄表成功率同线损率的相关性分析,反之则认为线损波动情况在可接纳范围内,转入步骤4及步骤5进行判断。
(4)针对分步骤(3)确定的线损率波动异常台区,采用灰色关联度分析法量化天气状况及抄表成功率对线损异常的影响程度。灰色关联度分析流程如下:
a)将台区线损率x0作为参考序列,即x0=[x0(1),x0(2),...,x0(m)]T。气温、是否出现极端天气及抄表成功率作为比较序列,当出现极端天气记为1,否则记为0。设比较序列为xi=[xi(1),xi(2),...,xi(m)]T,i=1,2,3,分别代表气温、是否出现极端天气及抄表成功率三相指标。对比较序列中的各元素进行数据无量纲处理,选用均值化法,计算公式为:
b)逐项计算不同日期各比较序列元素与参考序列元素的差值绝对值,即|x0(k)-xi(k)|,k=1,2,...,m;i=1,2,3,……m;
c)确定与/>即比较序列元素与参考序列的差值绝对值序列中的最大元素与最小元素;
d)计算比较序列中各元素同参考序列中对应元素的关联度,序列对应元素关联度计算公式为:
式中,ζi(k)为序列对应元素关联度;ρ为分辨系数,此处取ρ=0.5。
e)计算序列对应元素关联度求取平均值,该值即为灰色关联度权重ei,ei计算公式为:
若ei>0.6即认为存在较强关联性,则结束判断,输出对应指标;反之则认为不存在关联性,转入步骤4和步骤5进行判断。
步骤4,针对线损率负值台区及线损率持续为零台区,考虑其线损异常原因来源于台区总表故障台区下户变关系识别错误使原归属用户错划入相邻台区致本台区供电量小于售电量。其中,台区总表故障包含台区总表失流、台区总表相间错接线、台区总表电流互感器进出口反向接线。针对上述可能造成台区负线损或持续零损的原因,图3为负线损率台区、线损持续为零台区异常原因诊断流程示意图,相关诊断流程如下:
(1)提取台区总表供电量数据及总表侧三相电流数据,根据三相电流数据的数值正负判断是否存在台区总表电流互感器接反故障;综合根据三相电流值、供电量及台区功率因数,判断是否存在台区总表相间错接线故障;设三相电流分别为IA,IB,IC,相应判别标准如表1所示:
表1
若相应数据符合判断依据,结束判断,输出诊断结果。否则转入分步骤(2);
(2)提取台区总表三相电流及三相电压数据,根据电流失流准则判断是否存在电流失流故障,设台区额定运行电压为UN,设台区额定运行电流为IN,台区实时运行电压为U,当U∈[0.7UN,0.9UN],若为三相三线制线路,当IA<0.5%IN,IC>5%IN或IC<0.5%IN,IA>5%IN即可判定为失流;若为三相四线制线路,IA<0.5%IN,IB∪IC>5%IN或IB<0.5%IN,IA∪IC>5%IN或IC<0.5%IN,IA∪IB>5%IN即可判定为失流。若相应数据符合判断依据,结束判断,输出诊断结果。否则转入分步骤(3);
(3)考虑是否存在台区下户变关系识别错误,提取该台区历史12个月的月供电量及月售电量,计算得到线损电量并取绝对值,分别对供电量及线损电量进行归一化处理,采用Min-Max标准化处理,即对原始数据进行线性变换,使其映射于[0,1]区间内,Min-Max标准化公式为:
式中,yk为所选样本值,ymax为所选样本最大值,ymin为所选样本最小值,y'k为Min-Max标准化后的样本值。
采用Pearson相关系数法进行相关性分析,其计算公式为:
式中,gi为台区某月份的供电量;为台区统计月份供电量均值;hi为对应月份线损电量;/>为对应统计月份线损电量均值。判断线损电量同供电量的相关性,当相关系数ρgh≤0.8,则认定为户—变关系识别嫌疑台区。
步骤5,针对高线损率台区,考虑其线损异常可能来源于以下几项原因:台区总表跳字导致计量错误,供电量远高于正常值;由于台区自身结构不合理导致线损率高于正常台区,包含:台区供电线路长度过长、台区供电半径过大、台区下负荷量大、台区供电线路末端用户数量较多致使售电量难以统计;台区下用户存在窃电行为;存在户—变关系识别错误,台区下用户档案归入相邻台区,导致售电量少计。图4为高线损率台区异常原因诊断流程示意图,相关判断流程如下:
(1)判断台区线损率过高是否由于台区总表跳字导致计量错误。根据台区总表跳字判别标准,即台区当日供电量与日理论最大供电量比值超过100%,判定为台区总表跳字。
设台区总表所能通过的最大电流为Imax,额定线电压为UN,l,日理论最大供电量gm计算公式为:
当计算结果符合判定标准,输出诊断结果,进行台区总表故障修复,若台区线损率恢复至正常水平,结束判断。否则转入分步骤(2)及分步骤(3)进行判断;
(2)判断台区线损率过高是否由于台区下用户窃电导致。基于用户用电量数据,利用优化的聚类算法构建窃电用户筛查模型。图5为用户窃电筛查模型及k-means聚类算法流程示意图,用户窃电分析流程如下:
a)考虑到仅采集高线损台区用户用电数据易导致样本不均衡问题,基于用户电能采集装置分别获取高线损台区下所有用户日用电量(每15分钟采集一次,一日采集96点)及线损正常台区下用户日用电量,高线损台区用户及线损正常台区用户各占比50%。由上述96个数据点即可得到用户每日的负荷曲线,共采集l位用户m日的用户用电量(即采集l×m×96点)。
b)提取各用户日负荷特征曲线。单独分析用户在某日的负荷曲线具有很大偶然性,难以准确量化用户用电行为。基于此,引入加权平均用电量刻画用户负荷特征曲线。设用户在第j日提取到的负荷曲线为Pj=[Pj1,Pj2,...,Pji,...,Pj96],则第j日i时刻该用户的用电量权重为:
式中,N表示所选日期。
相应地,用户在i时刻的加权平均用电量为:
对各时刻的数据分别应用公式(9)~(10),可得到单一用户的日负荷特征曲线。
c)对所得各用户日负荷特征曲线数据进行标准化处理,此处采用Min-Max标准化方法,即按式(6)进行计算,得到标准化后的各用户日负荷特征曲线。利用自动编码器对用户的日负荷特征曲线数据降维。自动编码器通过无监督学习方式,可以有效提取输入数据的特征并挖掘数据样本之间的内在关联。自动编码器由输入层、隐层、输出层3层构成。编码器由输入层和隐藏层组成。用户用电量特征曲线p∈[0,1]输入后,通过映射关系将其映射到隐层。映射公式为:
y=S(ωp+b) (11)
式中,S为激活函数,此处应用Relu函数作为激活函数。p为输入矩阵,ω为权重矩阵,b为偏移向量。解码器由一个隐层及一个输出层构成,通过映射关系映射至输出层,完成输入数据的重构。解码器映射公式为:
z=S(ω'y+b') (12)
式中,ω'为重建权重矩阵,b'为重建偏移向量。此处自动编码器各层设置的参量维度为96-48-16-4-16-48-96。通过重构损失函数,实现重构后的输出数据与输入数据差值最小化,损失函数采用交叉熵函数,表示为:
利用梯度下降法更新权重,使自编码器的误差最小化。选取自动编码器的编码器部分,将编码器降至4维的隐藏层输出数据作为聚类的输入数据。
d)采用k-means聚类算法对用户日负荷特征曲线进行聚类,在最佳聚类数下得到典型用户日负荷特征曲线。k-means聚类算法的步骤为:①给出聚类数k;②随机性地选取k个对象作为初始聚类中心,对数据集中的剩余对象依据其与选定的k个聚类中心的距离,将其归属于欧氏距离最近的类;③重新计算各个类的均值,即确定新的聚类中心;④不断重复上述过程,直至目标函数达最小值。目标函数采用最小方差函数,函数的定义式为:
式中,p表示数据对象,E为所有数据对象与质心间的平方误差和,ci是簇Ci的质心,n为数据对象的数目。由于k-means算法为无监督学习,故选取适当指标评估聚类结果的有效性。此处选用轮廓系数量化聚类的效果,选取轮廓系数最优情况下的聚类数目kbest作为最佳的聚类数目。对于单个数据对象,轮廓系数的计算公式表示为:
式中,a(i)为数据i到同簇内其它数据的平均距离,该值越小说明数据i应被聚到此簇内。b(i)为数据i到其他某簇内所有数据的平均距离的最小值,即b(i)=min{bi-c1,bi-c2,…,bi-cj,…bi-ck},cj∈C其他某簇。s(i)的数值接近1,则说明数据i的聚类结果越合理;s(i)的数值接近-1,则说明数据i更应被聚类至其余簇;s(i)近似为0,则说明数据对象i在两个簇的边界上。所有数据s(i)的均值称为聚类结果的轮廓系数,该值越大表明整体聚类效果越好。根据分类结果,计算每一簇中各数据对象的均值,得到每簇曲线的聚类中心,刻画各类典型用户日负荷特征曲线。
e)对高线损率台区下用户开展用户日负荷曲线同所属典型用户日负荷特征曲线的匹配,综合Pearson相关系数、欧式距离量化用户窃电概率。用户日负荷曲线同所属典型用户日负荷特征曲线的相关系数r根据式(16)进行计算,欧式距离l的计算公式为:
式中,Fi为判断用户所归属的相应用户日负荷特征曲线在对应时刻的用电量。设置相似度s综合量化相关系数r与欧式距离l,考虑到相关系数r∈[0,1],故将欧式距离l映射至[0,1]区间内,采用e-l表示映射后的欧氏距离,相似度s的计算公式为:
s=ξ1×r+ξ2×e-l (17)
式中,ξ1、ξ2为权重系数,ξ12=1。通常情况下ξ1、ξ2均设置为0.5。相似度s的下界值设置为0.75。当相似度s<0.75,即认为存在较大窃电嫌疑,输出诊断结果及对应的用户编号及用户所属台区编号,通知工作人员对相关用户进行窃电稽查;若不存在台区下用户窃电现象或窃电问题纠正后台区线损率仍高于给定的上限值,则进入分步骤(4);
(3)判断台区线损率过高是否由于户—变关系识别错误,即本台区下用户被错划入相邻台区导致本台区用户用电量少计,台区线损率为高值。此处判断方法同步骤5中分步骤(3)的方法一致,不再重复叙述。若不存在台区下户变关系识别错误或用户档案得到正确划分后台区线损率仍高于给定的上限值,则进入分步骤(4);
(4)考虑台区线损高于合理区间由于台区自身结构不合理造成。以剩余台区的供电线路长度,供电半径,台区供电末端用户数量及台区变压器运行功率为基础数据,分析上述台区基础指标同线损率异常的相关性,并采用多元线性回归模型进行量化,给出各因素对异常线损率的影响权重,从而诊断出台区线损异常的原因。相关分析流程如下:
a)采集台区的基本信息,包括:供电线路长度、供电半径、台区供电末端用户数量及台区变压器运行功率作为输入数据,判断各因素同台区线损率的相关性,设线损率序列为y,相关台区基本信息序列为x=[x1,x2,...,xk]。采用Pearson相关系数进行判断,即按公式(7)进行计算。经计算各因素同线损率的相关系数均大于75%,可认为存在相关性;
b)构建台区线损率与台区相关基本信息的多元线性回归模型,表示为:
y=β01x1+...+βkxk+ξ (18)
式中,β01,...,βk为相关系数,ξ为随机误差。将x,y,β,ξ均写作矩阵形式,则多元回归模型可以写作如下形式:
y=Xβ+ξ (19)
式中,X为矩阵表示的台区基本信息序列。
根据最小二乘原理,应使取最小值,则相关系数的估计值/>表示为:/>
c)根据计算出的的数值绝对值的大小,得出上述各基本信息对台区线损率的权重,从而给出导致线损率高值最有可能的相关原因,作出诊断结果。开展针对相关原因的台区改造计划。
步骤6,针对线损率无法计量台区,即统计日期内供电量数据缺失达50%及以上,考虑其线损率无法计量原因来源于:①台区总表由于老旧引发计量故障;②该总表已不担负所属台区计量工作但由于档案未更新导致供电量无法采集。输出诊断结果及台区编号,通知检修人员进行故障。
本发明结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (1)

1.一种基于数据驱动的台区线损率异常诊断方法,其特征在于,所述方法包括如下步骤:
S1,数据采集,并对采集数据进行数据预处理;
S2,根据台区线损率合理区间,将线损异常台区分为高线损率台区、负线损率台区、线损率持续为零台区和线损率无法计量台区;
S3,根据S2统计出的高线损率台区及负线损率台区的线损率台区,以上述台区日线损率为数据基础,判断上述台区线损率异常是否由天气因素或用户侧电表抄表成功率低下引起;
所述步骤S3包括:
S31:选取台区下当月日线损率变化曲线,若存在小部分线损率数据缺失现象,运用分段线性插值法填补空值;
S32:引入离散系数量化台区线损率曲线波动程度;
S33:提取30日的某台区日线损率变化曲线,计算离散系数,并引入线损率波动区间,若有超过20%采集到的日线损率值不在此区间内,且当离散系数大于0.25时,定义为线损率波动异常台区,进行天气情况及抄表成功率同线损率的相关性分析,反之则认为线损波动情况在接纳范围内,转入步骤S4和S5进行判断;
S34:针对分步骤S33确定的线损率波动异常台区,采用灰色关联度分析法量化天气情况及抄表成功率对线损异常的影响程度;
S4,针对负线损率台区及线损率持续为零台区,判断其线损异常来源于台区总表故障,还是台区下户变关系识别错误使原归属用户错划入相邻台区致本台区供电量小于售电量;其中,台区总表故障包含台区总表失流、台区总表电流互感器相间错接线、台区总表电流互感器进出口反向接线;
所述步骤S4包括:
S41:提取台区总表供电量数据及总表侧三相电流数据,根据三相电流数据的数值正负判断是否存在台区总表电流互感器接反故障;根据三相电流值、供电量及台区功率因数,判断是否存在台区总表相间错接线故障;若符合判断依据,结束判断,输出诊断结果,否则转入分步骤S42;
S42:提取台区总表三相电流及三相电压数据,根据电流失流准则判断是否存在电流失流故障,若符合判断依据,结束判断,输出诊断结果;否则转入分步骤S43;
S43:考虑是否存在台区下户变关系识别错误,提取该台区历史12个月的月供电量及月售电量,计算得到线损电量并取绝对值,采用Pearson相关系数法进行相关性分析,其计算公式为:
式中,为台区统计月份供电量均值;/>为对应统计月份线损电量均值;
判断线损电量同供电量的相关性,当相关系数ρgh≤0.8,认定为户变关系识别嫌疑台区;
S5,针对高线损率台区,判断其线损异常来源于以下几项原因:台区总表跳字导致计量错误,供电量高于正常值;台区自身结构不合理导致线损率高于正常台区;台区下用户存在窃电行为;存在户变关系识别错误,台区下用户档案归入相邻台区,导致售电量少计;
所述步骤S5包括:
S51:根据台区当日供电量与日理论最大供电量比值超过100%,判定为台区总表跳字,输出诊断结果,进行台区总表故障修复,若台区线损率恢复至正常水平,结束判断;若台区当日供电量与日理论最大供电量比值未超过100%,转入分步骤S52及分步骤S53进行判断;
S52:基于用户用电量数据,利用聚类算法构建窃电用户筛查模型;用户窃电分析流程如下:
a)基于用户电能采集装置分别获取高线损率台区下所有用户日用电量及线损正常台区下用户日用电量,每15分钟采集一次,一日采集96个时刻,高线损率台区用户及线损正常台区用户各占比50%,得到用户每日的负荷曲线;
b)引入加权平均用电量刻画用户日负荷特征曲线,设用户在第j日提取到的负荷曲线为Pj=[Pj1,Pj2,...,Pjt,...,Pj96],第j日t时刻该用户的用电量权重为:
用户在t时刻的加权平均用电量为:
对各时刻的数据分别应用公式和/>得到单一用户的日负荷特征曲线;
c)对所得各用户日负荷特征曲线数据进行标准化处理,利用自动编码器对用户的日负荷特征曲线数据降维,所述自动编码器由输入层、隐层、输出层3层构成,用户的日负荷特征曲线输入后,通过映射关系将其映射到隐层,将输出数据作为聚类的输入数据;
d)采用k-means聚类算法进行聚类,利用轮廓系数量化聚类效果,选取轮廓系数最优下的聚类数目作为最佳的聚类数目;根据分类结果,计算每一簇中各数据对象的均值,得到每簇曲线的聚类中心,刻画各类典型用户日负荷特征曲线;
e)对高线损率台区下用户开展用户日负荷特征曲线同所属典型用户日负荷特征曲线的匹配,综合Pearson相关系数法、欧式距离量化用户窃电概率,计算用户日负荷特征曲线同所属典型用户日负荷特征曲线的相关系数以及欧氏距离,设置相似度综合量化相关系数与欧式距离,当相似度<0.75,认为存在窃电嫌疑,输出诊断结果及对应的用户编号及用户所述台区编号,通知工作人员对用户进行窃电稽查;若不存在台区下用户窃电现象或窃电问题纠正后台区线损率仍高于给定的上限值,进入步骤S53;
S53:以剩余台区的供电线路长度,供电半径,台区供电末端用户数量及台区变压器运行功率为基础数据,分析上述基础数据同线损率异常的相关性,并采用多元线性回归模型进行量化,给出各因素对异常线损率的影响权重,诊断出台区线损异常的原因;
所述步骤S53包括:
a)以剩余台区的供电线路长度、供电半径、台区供电末端用户数量及台区变压器运行功率作为输入数据,判断各因素同台区线损率的相关性,设线损率序列为y,相关台区基本信息序列为x=[x1,x2,...,xk],采用Pearson相关系数法进行判断,经计算各因素同线损率的相关系数均大于75%,认为存在相关性;
b)构建台区线损率与相关台区基本信息的多元线性回归模型,表示为:
y=β01x1+…+βkxk
式中,β01,...,βk为相关系数,ξ为随机误差;X为矩阵表示的相关台区基本信息序列;根据最小二乘原理,相关系数的估计值表示为:
c)根据计算出的的数值绝对值的大小,得出上述各基本信息对台区线损率的权重,给出导致线损率高值的原因,作出诊断结果;
S6,针对线损率无法计量台区,线损率无法计量台区为统计日期内供电量数据缺失达50%及以上的台区,输出诊断结果及台区编号,通知检修人员进行故障检查。
CN202210412465.2A 2022-04-19 2022-04-19 一种基于数据驱动的台区线损率异常诊断方法 Active CN114862139B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210412465.2A CN114862139B (zh) 2022-04-19 2022-04-19 一种基于数据驱动的台区线损率异常诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210412465.2A CN114862139B (zh) 2022-04-19 2022-04-19 一种基于数据驱动的台区线损率异常诊断方法

Publications (2)

Publication Number Publication Date
CN114862139A CN114862139A (zh) 2022-08-05
CN114862139B true CN114862139B (zh) 2023-12-22

Family

ID=82630481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210412465.2A Active CN114862139B (zh) 2022-04-19 2022-04-19 一种基于数据驱动的台区线损率异常诊断方法

Country Status (1)

Country Link
CN (1) CN114862139B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115330202B (zh) * 2022-08-15 2023-07-11 烟台东方威思顿电气有限公司 基于数据驱动的低压配电台区窃电分析方法
CN115524534B (zh) * 2022-11-04 2023-02-28 广东欢联电子科技有限公司 一种通讯线缆的线损测试方法及系统
CN116699499B (zh) * 2023-05-29 2024-04-12 浙江东鸿电子股份有限公司 一种电表精度及可靠性自动检测系统
CN117110795B (zh) * 2023-10-18 2024-01-30 国网安徽省电力有限公司合肥供电公司 一种台区线路故障定位系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109771A (zh) * 2019-05-07 2019-08-09 北京恒泰实达科技股份有限公司 一种台区线损异常一键诊断方法
CN110134708A (zh) * 2019-03-03 2019-08-16 云南电网有限责任公司信息中心 电网台区线损异常原因诊断方法、装置、计算机设备和存储介质
CN110322371A (zh) * 2019-07-08 2019-10-11 长沙理工大学 基于多元线性回归分析的高损台区用电异常用户检测定位方法
CN111444241A (zh) * 2020-03-26 2020-07-24 南京工程学院 一种基于数据挖掘的台区线损异常关联用户精准定位方法
CN111781463A (zh) * 2020-06-25 2020-10-16 国网福建省电力有限公司 一种台区线损异常辅助诊断方法
CN111817299A (zh) * 2020-07-21 2020-10-23 南京工程学院 基于模糊推理的配电台区线损率异常成因智能辨识方法
CN111951125A (zh) * 2020-08-12 2020-11-17 积成电子股份有限公司 一种基于大数据分析的台区异常户变关系识别方法
CN112308459A (zh) * 2020-11-23 2021-02-02 国网北京市电力公司 电网户变关系的识别方法及识别装置、电子设备
WO2021073462A1 (zh) * 2019-10-15 2021-04-22 国网浙江省电力有限公司台州供电公司 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110134708A (zh) * 2019-03-03 2019-08-16 云南电网有限责任公司信息中心 电网台区线损异常原因诊断方法、装置、计算机设备和存储介质
CN110109771A (zh) * 2019-05-07 2019-08-09 北京恒泰实达科技股份有限公司 一种台区线损异常一键诊断方法
CN110322371A (zh) * 2019-07-08 2019-10-11 长沙理工大学 基于多元线性回归分析的高损台区用电异常用户检测定位方法
WO2021073462A1 (zh) * 2019-10-15 2021-04-22 国网浙江省电力有限公司台州供电公司 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法
CN111444241A (zh) * 2020-03-26 2020-07-24 南京工程学院 一种基于数据挖掘的台区线损异常关联用户精准定位方法
CN111781463A (zh) * 2020-06-25 2020-10-16 国网福建省电力有限公司 一种台区线损异常辅助诊断方法
CN111817299A (zh) * 2020-07-21 2020-10-23 南京工程学院 基于模糊推理的配电台区线损率异常成因智能辨识方法
CN111951125A (zh) * 2020-08-12 2020-11-17 积成电子股份有限公司 一种基于大数据分析的台区异常户变关系识别方法
CN112308459A (zh) * 2020-11-23 2021-02-02 国网北京市电力公司 电网户变关系的识别方法及识别装置、电子设备

Also Published As

Publication number Publication date
CN114862139A (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN114862139B (zh) 一种基于数据驱动的台区线损率异常诊断方法
CN110097297B (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
CN103678766B (zh) 一种基于pso算法的异常用电客户检测方法
CN111429027B (zh) 一种基于大数据的地区输电网运行多维度分析方法
CN106384210B (zh) 一种基于检修风险收益的输变电设备检修优先级排序方法
CN106651169A (zh) 基于模糊综合评价的配电自动化终端状态评价方法及系统
CN107609783B (zh) 一种基于数据挖掘的智能电能表综合性能进行评估的方法及系统
CN113435652B (zh) 一种一次设备缺陷诊断与预测方法
CN111738462B (zh) 电力计量装置故障抢修主动服务预警方法
CN111949939B (zh) 基于改进topsis和聚类分析的智能电表运行状态评价方法
CN109377409A (zh) 一种基于bp神经网络的用户用电异常行为检测方法
CN107221927A (zh) 一种基于量化评估模型窃电嫌疑分析算法的反窃电分析方法
CN110264107B (zh) 一种基于大数据技术的台区线损率异常诊断方法
CN106447534A (zh) 一种基于灰色关联度分析的用电模式稳定性判别方法
CN111695807A (zh) 计及发电和用电侧能效的地区电网能效评估方法及系统
CN108053148A (zh) 一种电力信息系统故障高效诊断方法
CN103699668A (zh) 基于数据断面一致性的配电网电气设备组合状态评估方法
CN110705859A (zh) 基于pca-自组织神经网络的中低压配电网运行状态评估方法
CN113987294A (zh) 一种基于遗传优化gru神经网络的cvt在线故障诊断方法
CN111639850A (zh) 多源异构数据的质量评估方法与系统
CN113342784A (zh) 一种电网主变设备风险评估的数据库设计方法
CN113884975A (zh) 一种基于改进动态线损估计的超差电表检测方法
CN114118588A (zh) 聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法
CN106327359A (zh) 一种基于用电模式分析的集抄数据异常判定方法
CN112417627A (zh) 一种基于四维指标体系配电网运行可靠性分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant