CN113362199B - 基于用户采集电量与台区线损相关性的窃电用户核查方法 - Google Patents
基于用户采集电量与台区线损相关性的窃电用户核查方法 Download PDFInfo
- Publication number
- CN113362199B CN113362199B CN202110661125.9A CN202110661125A CN113362199B CN 113362199 B CN113362199 B CN 113362199B CN 202110661125 A CN202110661125 A CN 202110661125A CN 113362199 B CN113362199 B CN 113362199B
- Authority
- CN
- China
- Prior art keywords
- user
- line loss
- data
- value
- change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000005611 electricity Effects 0.000 title claims description 230
- 238000004364 calculation method Methods 0.000 claims abstract description 68
- 238000010219 correlation analysis Methods 0.000 claims abstract description 14
- 230000002159 abnormal effect Effects 0.000 claims abstract description 8
- 238000011156 evaluation Methods 0.000 claims abstract description 5
- 230000008859 change Effects 0.000 claims description 251
- 230000000875 corresponding effect Effects 0.000 claims description 154
- 238000004458 analytical method Methods 0.000 claims description 17
- 230000001174 ascending effect Effects 0.000 claims description 17
- 230000006399 behavior Effects 0.000 claims description 17
- 238000011835 investigation Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 230000002596 correlated effect Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 6
- 238000004451 qualitative analysis Methods 0.000 claims description 6
- 239000003550 marker Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/12—Timing analysis or timing optimisation
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于用户采集电量与台区线损相关性的窃电用户核查方法,先分析和确定用户采集电量与台区线损相关性的算法模型,后选取样本并依据算法模型对样本中线损存在异常的日期进行标记,再在算法模型的基础上结合95%置信区间和多次权重评价方法,对选取样本中被标记日期对应的数据进行用户采集电量与台区线损相关性的计算,最后根据计算结果将筛选出用户的窃电嫌疑度确定为大、中、小三类并核查大的用户;本发明可以对台区下所有用户的采集电量与台区线损率进行相关性分析,精准锁定导致台区线损偏高的罪魁祸首,解决低压台区线损治理工作的痛点,助力反窃查违工作,高效提升线损管理水平,切实降低低压台区线损,为电力企业提质增效。
Description
技术领域
本发明属于供电企业线损管理技术领域,具体涉及一种基于用户采集电量与台区线损相关性的窃电用户核查方法。
背景技术
线损是电力企业经营管理过程中的一项重要的经济技术指标,而低压台区线损是供电企业线损管理的基础,低压台区线损值的高低反映了供电企业的营销管理水平,降低低压台区线损是电力企业提质增效的关键所在。
影响低压台区线损的因素错综复杂,想要查出对台区线损造成影响的异常用户更是如同抽丝剥茧;对线损异常台区进行分析治理的传统方法有现场逐户排查、用户电量比对、后台数据逐项核查等,都存在着诸多的不便;为解决上述问题,开发一种基于用户采集电量与台区线损相关性的窃电用户核查方法很有必要。
发明内容
本发明的目的是为了克服现有技术的不足,而提供一种基于用户采集电量与台区线损相关性的窃电用户核查方法,通过该方法可以对台区下所有用户的采集电量与台区线损率进行相关性分析,精准锁定导致台区线损偏高的罪魁祸首,解决低压台区线损治理工作的痛点,助力反窃查违工作,高效提升线损管理水平,切实降低低压台区线损,为电力企业提质增效。
本发明的目的是这样实现的:一种基于用户采集电量与台区线损相关性的窃电用户核查方法,包括如下步骤:
S1:分析和确定用户采集电量与台区线损相关性的算法模型;
S2:选取样本并依据算法模型对样本中线损存在异常的日期进行标记;
S3:在算法模型的基础上,对选取样本中被标记日期对应的数据进行用户采集电量与台区线损相关性的计算,计算过程中结合统计学原理置信区间,以减少正常用户的干扰,再结合多次权重评价方法,以增加计算结果的真实可靠性,最后根据计算结果将筛选出用户的窃电嫌疑度确定为大、中、小三类;
S4:按比例对窃电嫌疑度排名靠前的用户进行现场排查处理,若该台区下没有窃电嫌疑度为大的用户,且所选比例的排名靠前用户经现场排查都没有问题,则说明该台区下用户的窃电方式可能为无表计窃电或窃电表计采集电量非常接近0或等于0,工作人员需要重点排查台区的入户线与采集电量在大部分时间都非常接近或等于0的用户。
优选的基于用户采集电量与台区线损相关性的窃电用户核查方法,所述步骤S1包括如下步骤:
线损分为理论线损和管理线损,管理线损的成因复杂多样,而理论线损是可以进行计算的,在理想环境下,台区线损量等同于理论线损值,且不会因用户电量的变化而改变;
在这个理想环境下,且不考虑分布式电源的影响,则供电量-售电量=台区线损量=理论线损值,其中售电量为台区所有用户采集电量之和,供电量为台区关口表的采集电量;
引入1个窃电用户进行讨论,则窃电用户采集电量=窃电用户实际电量-窃电量,台区线损量=理论线损值+窃电量=供电量*理论线损率+窃电量,可见窃电量的变化会引起台区线损量的变化,且两者正相关;
一般情况下能被采集示数的窃电用户,采集电量通常是实际电量的某个百分比值,把它称作窃电系数k,则窃电用户采集电量=E-Ek=E(1-k),台区线损量=理论线损值+Ek;
画出y=E和y=Ek的函数图像进行定性分析;
定性分析后得出的相关性结论表为:
上表的窃电用户实际电量、用户窃电系数和窃电用户采集电量列中,“ ”表示对应数值增加幅度较大,“”表示对应数值增加幅度较小,“-”表示对应数值不变,“ ”表示对应数值减少幅度较大,“”表示对应数值减少幅度较小;可见,随着E和k的变化,台区线损量变化时,窃电用户的采集电量也会发生有相关性的不同幅度的变化,包括增加、减少或极小概率不变,略微类似正弦函数曲线,但台区线损量和窃电用户采集电量不是单纯的正相关和负相关,属于较为复杂的非线性相关,难以直接对台区线损量和窃电用户采集电量进行相关性分析,可以根据其变化率进行分析;
由此,确定用户采集电量与台区线损相关性的算法模型为:
存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系,且台区线损率变化较大时的相关性更高,尤其是当用户刚开始或终止窃电、明显增加或减少用电系数时,窃电用户采集电量与台区线损量呈负相关且此时台区线损率变化幅度一般较大;
将用户采集电量与台区线损相关性分析转化为各用户采集电量变化率绝对值和台区线损率变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户;
当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度一般较小。
进一步优选的基于用户采集电量与台区线损相关性的窃电用户核查方法,所述步骤S2包括如下步骤:
S21:在电力用户用电信息采集系统中,提取最近z天中每天的台区下所有用户表计的数据日期、用户编号、用户名称和采集电量作为用户电量表,以数据日期和用户编号作为主键,先按照用户编号升序,再按照数据日期升序,对用户电量表进行排序;
S22:在电力用户用电信息采集系统中,提取最近z天中每天的数据日期、台区编号、台区名称、理论线损率、供电量、售电量、线损量、线损率作为台区线损率表,以数据日期作为主键,按照数据日期升序,对台区线损率表进行排序;
其中,用户电量表和台区线损率表通过主键数据日期进行连接;
S23:依据算法模型中的“存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系”选取第一批样本;
将台区线损率表中线损率>理论线损率+3%的数据日期认定为存在用户窃电行为,为台区线损率表添加一列记为样本选取标记a,在该列中,当对应数据日期的线损率>理论线损率+3%时,为其赋值a;
S24:依据算法模型中的“台区线损率变化较大时的相关性更高”选取第二批样本;
采用箱线图原理,认定台区线损率变化值处于上四分位数和上边缘之间的数据为相对离群值,即存在窃电行为且台区线损率变化较大;为台区线损率表添加一列记为样本选取标记b,在该列中,当对应数据日期的台区线损率变化值大于相对离群值中的某一值时,为其赋值b。
更进一步优选的基于用户采集电量与台区线损相关性的窃电用户核查方法,所述步骤S24中采用箱线图原理选取样本标记b具体为:箱线图共由五个数值点构成,从下到上依次是下边缘、下四分位数Q1,中位数、上四分位数Q3和上边缘;
下边缘的取值可以为最小值或最小观察值,最小观察值=Q1-1.5(Q3-Q1);
上边缘的取值可以为最大值或最大观察值,最大观察值=Q3+1.5(Q3-Q1);
箱线图中,大于最大观察值或小于最小观察值的数值被定义为离群值;
进一步优选的基于用户采集电量与台区线损相关性的窃电用户核查方法,所述步骤S3包括如下步骤:
S31;依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率;
S311:以已计算出的台区线损率变化值为基础,为保证变化率在1以内方便比较,取与中的最大值作为分母,则数据日期为t时的台区线损率变化率为:,其中指台区线损率变化值的绝对值,指数据日期为t时的台区线损率,指数据日期为t-1时的台区线损率,为取和的最大值;
S32:减少正常用户的干扰;
采用统计学原理置信区间,找出正常用户采集电量变化值的高置信度范围,在计算采集电量变化率的过程中,当用户采集电量变化值小于正常用户采集电量变化值的高置信度范围内的某个值n时,将置为0,即只筛查≥n的数据;当正常用户采集电量变化值的高置信度范围为(-p,p)时,n的取值范围是(0,p);
S321:对标记为a的第一批样本数据,从(0,p)中选取一个值q,0<q<p,取n1=q;
在计算第一批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
S322:对标记为b的第二批样本数据,取n2=p;
在计算第二批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
S33:依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率的相关程度;
S331:用标记为a的第一批样本数据作为数据日期选取依据,则用户i的采集电量变化率与台区线损率变化率的相关程度为:;其中指第一批样本数据对应的数据日期为t时,用户i的采集电量变化率,指当数据日期为t时的台区线损率变化率,表示对样本选取标记a中所有对应值为a的数据日期对应的进行求和;
S332:用标记为b的第二批样本数据作为数据日期选取依据,则用户i的采集电量变化率与台区线损率变化率的相关程度为:;其中指第二批样本数据对应的数据日期为t时,用户i的采集电量变化率,指当数据日期为t时的台区线损率变化率,表示对样本选取标记b中所有对应值为b的数据日期对应的进行求和;
S34:数据加权;
S341:创建数据表数据加权a,数据列分别为用户编号、用户名称、相关程度a,以用户编号作为主键;
将对数据加权a表按照相关程度a升序进行排列;
新增加权计算1列,将数组{m1,m2,m3,……,mw}作为第一次加权计算的得分赋值到加权计算1列,其中m1>m2>m3>……>mw>0;
S342:创建数据表数据加权b,数据列分别为用户编号、用户名称、相关程度b,以用户编号作为主键;
将数据加权b表按照相关程度b升序进行排列;
新增加权计算I列,将数组{s1,s2,s3,……,sw}作为第一次加权计算的得分赋值到加权计算I列,其中s1>s2>s3>……>sw>0,又由于第二批样本数据相关程度最高的用户窃电可能性最高,s1>m1>s2≥m2>s3≥m3……>sw≥mw;
S35:依据算法模型中的“当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度一般较小”,对数据再次加权;
S351:为台区线损率表添加一列记为样本选取标记c,在该列中,为符合选取条件的数据日期对应的行赋值c;
为数据日期对应行赋值c的条件为:当某一数据日期对应样本选取标记a列的数据为a,且对应样本选取标记b列的数据不为b,则在样本选取标记c列的对应行赋值c;
S352:为用户电量表添加一列记为变化趋势;
用户i在数据日期为t时,若<0,则为变化趋势列中的对应行赋值“反向”;若=0,则为变化趋势列中的对应行赋值“不变”;若>0,则为变化趋势列中的对应行赋值“同向”;其中指用户i在数据日期为t时的采集电量,指用户i在数据日期为t-1时的采集电量,指数据日期为t时的台区线损率,指数据日期为t-1时的台区线损率;
S353:在台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势不同的比率为:;其中指所有样本选取标记c中所有c的数量之和,即台区存在用户窃电行为,且台区线损率变化率较小的总天数,指即台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势为反向天数之和;
变化趋势表中用户编号列中的数据为用户电量表中所有的去重后的用户编号,用户名称列为对应的用户名称,将变化趋势不同率的值D赋值到变化趋势表中变化趋势不同率列中对应用户编号的行;
S354:再次加权计算;
对数据加权a表新增加权计算2列,该列的数值X有以下约束规则:当用户i对应的相关程度a的值等于所有第一批样本的总天数时,其对应的置为0;当用户i对应的变化趋势不同率的值大于d时,即用户i是窃电用户的可能很小,将其对应的置为m0,其中0<d<1,0<m0<mw;当用户i不满足上述两个条件时,将其对应的置为对应加权计算1列的值;
对数据加权b表新增加权计算II列,该列的数值Y有以下约束规则:当用户i对应的相关程度b的值等于所有第一批样本的总天数时,其对应的置为0;当用户i对应的变化趋势不同率的值大于d时,即用户i是窃电用户的可能很小,将其对应的置为s0,其中0<d<1,s0=m0;当用户i不满足上述两个条件时,将其对应的置为对应加权计算1列的值;
S36:最终结果;
将数据加权a表中的用户编号、用户名称、加权计算2列与数据加权b表中的用户编号、用户名称、加权计算II列合并统计,并将对应用户在加权计算2与加权计算II的值求和,和记为最终结果;
创建数据表最终结果,包含用户编号、用户名称、最终结果、窃电嫌疑度列,以用户编号为主键;
最终结果中用户编号列中的数据为数据加权a和数据加权b表中所有汇总去重后的用户编号,用户名称列为对应的用户名称;
将加权计算2与加权计算II求和的值X+Y赋值到最终结果表中最终结果列中对应用户编号的行;
按照最终结果列,降序排列;
S37:确定窃电嫌疑度;
当最终结果列的值大于等于m1时,为窃电嫌疑度列中其对应行赋值大;当最终结果列的值小于等于mw时,为窃电嫌疑度列中其对应行赋值小;当最终结果列的值大于mw且小于m1时,为窃电嫌疑度列中其对应行赋值中。
由于采用了上述技术方案,本发明的有益效果是:
(1)本发明能够对台区下所有用户的采集电量与台区线损率进行相关性分析,精准锁定导致台区线损偏高的罪魁祸首,解决低压台区线损治理工作的痛点,助力反窃查违工作,高效提升线损管理水平,切实降低低压台区线损,为电力企业提质增效;
(2)本发明首先分析和确定算法模型,然后在算法模型的基础上,结合统计学原理95%置信区间,减少正常用户的干扰,再结合多次权重评价方法,增加计算结果的真实可靠性,从而使得最后能够根据相关性计算结果较为精准地筛选出嫌疑窃电用户;
(3)本发明还能够在核查电量异常用户过程中,也暴露处台区的变压器过载、末端低电压等技术线损问题,促使工作人员采取技术降损措施,有效降低低压台区电量的真实损耗,提高低压台区的经济运行率,为节能减排做出贡献。
附图说明
图1是本发明的y=E和y=Ek的函数图像图。
图2是本发明的箱线图。
图3是本发明的置信区间分析图。
图4是本发明的用户p的采集电量曲线与台区线损曲线对比图。
具体实施方式
下面通过实施例,对本发明的技术方案做进一步具体的说明。
本发明提供了一种基于用户采集电量与台区线损相关性的窃电用户核查方法,包括如下步骤:
S1:分析和确定用户采集电量与台区线损相关性的算法模型;
S2:选取样本并依据算法模型对样本中线损存在异常的日期进行标记;
S3:在算法模型的基础上,对选取样本中被标记日期对应的数据进行用户采集电量与台区线损相关性的计算,计算过程中结合统计学原理置信区间,以减少正常用户的干扰,再结合多次权重评价方法,以增加计算结果的真实可靠性,最后根据计算结果将筛选出用户的窃电嫌疑度确定为大、中、小三类;
S4:按比例对窃电嫌疑度排名靠前的用户进行现场排查处理,一般按1‰取前5~10名,若该台区下没有窃电嫌疑度为大的用户,且所选比例的排名靠前用户经现场排查都没有问题,则说明该台区下用户的窃电方式可能为无表计窃电或窃电表计采集电量非常接近0或等于0,工作人员需要重点排查台区的入户线与采集电量在大部分时间都非常接近或等于0的用户。
其中,步骤S1包括如下步骤:
线损分为理论线损和管理线损,管理线损的成因复杂多样,而理论线损是可以进行计算的,在理想环境下,台区线损量等同于理论线损值,且不会因用户电量的变化而改变。
在这个理想环境下,且不考虑分布式电源的影响,则供电量-售电量=台区线损量=理论线损值,其中售电量为台区所有用户采集电量之和,供电量为台区关口表的采集电量。
引入1个窃电用户进行讨论,则窃电用户采集电量=窃电用户实际电量-窃电量,台区线损量=理论线损值+窃电量=供电量*理论线损率+窃电量,可见窃电量的变化会引起台区线损量的变化,且两者正相关。
一般情况下能被采集示数的窃电用户,采集电量通常是实际电量的某个百分比值,把它称作窃电系数k,则窃电用户采集电量=E-Ek=E(1-k),台区线损量=理论线损值+Ek。
如图1所示,画出y=E和y=Ek的函数图像进行定性分析;
定性分析后得出的相关性结论表为:
上表的窃电用户实际电量、用户窃电系数和窃电用户采集电量列中,“ ”表示对应数值增加幅度较大,“”表示对应数值增加幅度较小,“-”表示对应数值不变,“ ”表示对应数值减少幅度较大,“”表示对应数值减少幅度较小;可见,随着E和k的变化,台区线损量变化时,窃电用户的采集电量也会发生有相关性的不同幅度的变化,包括增加、减少或极小概率不变,略微类似正弦函数曲线,但台区线损量和窃电用户采集电量不是单纯的正相关和负相关,属于较为复杂的非线性相关,难以直接对台区线损量和窃电用户采集电量进行相关性分析,可以根据其变化率进行分析。
由此,确定用户采集电量与台区线损相关性的算法模型为:
存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系,且台区线损率变化较大时的相关性更高,尤其是当用户刚开始或终止窃电、明显增加或减少用电系数时,窃电用户采集电量与台区线损量呈负相关且此时台区线损率变化幅度一般较大;
将用户采集电量与台区线损相关性分析转化为各用户采集电量变化率绝对值和台区线损率变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户;
当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度一般较小。
其中,步骤S2包括如下步骤:
S21:在电力用户用电信息采集系统中,提取最近z天中每天的台区下所有用户表计的数据日期、用户编号、用户名称和采集电量作为用户电量表,以数据日期和用户编号作为主键,先按照用户编号升序,再按照数据日期升序,对用户电量表进行排序。
S22:在电力用户用电信息采集系统中,提取最近z天中每天的数据日期、台区编号、台区名称、理论线损率、供电量、售电量、线损量、线损率作为台区线损率表,以数据日期作为主键,按照数据日期升序,对台区线损率表进行排序。
其中,选取样本天数z天一般为最近30天,时间近,数据更加有核查力,样本天数可结合实际增减。
其中,用户电量表和台区线损率表通过主键数据日期进行连接,即在后面的当对台区线损率表进行样本选取标记a和b后,通过连接,用户电量表上相同数据日期的数据行也会被标记为a和b。
S23:依据算法模型中的“存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系”选取第一批样本;
将台区线损率表中线损率>理论线损率+3%的数据日期认定为存在用户窃电行为,为台区线损率表添加一列记为样本选取标记a,在该列中,当对应数据日期的线损率>理论线损率+3%时,为其赋值a。
S24:依据算法模型中的“台区线损率变化较大时的相关性更高”选取第二批样本;
采用箱线图原理,认定台区线损率变化值处于上四分位数和上边缘之间的数据为相对离群值,即存在窃电行为且台区线损率变化较大;为台区线损率表添加一列记为样本选取标记b,在该列中,当对应数据日期的台区线损率变化值大于相对离群值中的某一值时,为其赋值b。
箱线图一般有两种用途:一是直观地识别数据中的异常值;二是判断数据离散分布的情况,了解数据分布状态。
如图2所示,步骤S24中采用箱线图原理选取样本标记b具体为:箱线图共由五个数值点构成,从下到上依次是下边缘、下四分位数(也称25%分位数)Q1,中位数、上四分位数(也称75%分位数)Q3和上边缘;
下边缘的取值可以为最小值或最小观察值,最小观察值=Q1-1.5(Q3-Q1);
上边缘的取值可以为最大值或最大观察值,最大观察值=Q3+1.5(Q3-Q1);
箱线图中,大于最大观察值或小于最小观察值的数值被定义为离群值。
其中,将最大值作为箱线图的上边缘是为了保证能够选取到第二批样本数据;其中,将数值e的取值范围定义为是为了使该范围的数据更符合“台区线损率变化较大”这一概念,具体实施时e的取值一般取箱线图中上四分位数与最大值连线的中点即进行样本标记b的选取。
其中,步骤S3包括如下步骤:
S31;依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率。
S311:以已计算出的台区线损率变化值为基础,为保证变化率在1以内方便比较,取与中的最大值作为分母,则数据日期为t时的台区线损率变化率为:,其中指台区线损率变化值的绝对值,指数据日期为t时的台区线损率,指数据日期为t-1时的台区线损率,为取和的最大值;
S32:减少正常用户的干扰。
由于正常用户的采集电量可能会不断变化,且用户采集电量较小时,其对应的变化率可能很小也可能很大,影响对窃电嫌疑用户的判断,因此需要找到正常用户采集电量变化值的高置信度范围。
采用统计学原理置信区间,找出正常用户采集电量变化值的高置信度范围,在计算采集电量变化率的过程中,当用户采集电量变化值小于正常用户采集电量变化值的高置信度范围内的某个值n时,将置为0,即只筛查≥n的数据;当正常用户采集电量变化值的高置信度范围为(-p,p)时,n的取值范围是(0,p)。
S321:对标记为a的第一批样本数据,从(0,p)中选取一个值q,0<q<p,取n1=q;
在计算第一批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
S322:对标记为b的第二批样本数据,取n2=p;
在计算第二批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
下面是本发明提供的一个确定正常用户采集电量变化值的高置信度范围以及确定样本a和样本b选取时对应n取值的实施例。
如图3所示,从电力用户用电信息采集系统线损率基本等于理论线损率的台区中,提取大约5000个正常样本用户,分析得出结论为:其采集电量变化值的95%置信区间约为正负7.5,则n的取值范围是0<n<7.5;
由于窃电用户的采集电量变化值也可能较小,在计算第一批样本数据,即样本选取标记a列数值a的对应数据日期时,可以适量取n1=2;即计算第一批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
为更多地减少正常用户干扰,在计算第二批样本数据即样本选取标记b列数值b的对应数据日期时,可以取n2=7.5;即在计算第二批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
S33:依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率的相关程度;
S331:用标记为a的第一批样本数据作为数据日期选取依据,则用户i的采集电量变化率与台区线损率变化率的相关程度为:;其中指第一批样本数据对应的数据日期为t时,用户i的采集电量变化率,指当数据日期为t时的台区线损率变化率,表示对样本选取标记a中所有对应值为a的数据日期对应的进行求和。
S332:用标记为b的第二批样本数据作为数据日期选取依据,则用户i的采集电量变化率与台区线损率变化率的相关程度为:;其中指第二批样本数据对应的数据日期为t时,用户i的采集电量变化率,指当数据日期为t时的台区线损率变化率,表示对样本选取标记b中所有对应值为b的数据日期对应的进行求和。
S34:数据加权。
S341:创建数据表数据加权a,数据列分别为用户编号、用户名称、相关程度a,以用户编号作为主键;
将对数据加权a表按照相关程度a升序进行排列;
新增加权计算1列,将数组{m1,m2,m3,……,mw}作为第一次加权计算的得分赋值到加权计算1列,其中m1>m2>m3>……>mw>0。
下面是本发明提供的一个已创建好的数据加权表a的排名靠前部分:
表中,相关程度a按升序进行排列后,将数组{100,10,9,8,7,6,5,4,3,2}作为第一次加权计算的得分赋值到“加权计算1”列。
S342:创建数据表数据加权b,数据列分别为用户编号、用户名称、相关程度b,以用户编号作为主键;
将数据加权b表按照相关程度b升序进行排列;
新增加权计算I列,将数组{s1,s2,s3,……,sw}作为第一次加权计算的得分赋值到加权计算I列,其中s1>s2>s3>……>sw>0,又由于第二批样本数据相关程度最高的用户窃电可能性最高,s1>m1>s2≥m2>s3≥m3……>sw≥mw。
下面是本发明提供的一个已创建好的数据加权表b的排名考前部分:
表中,相关程度b按升序进行排列后,将数组{1000,10,9,8,7,6,5,4,3,2}作为第一次加权计算的得分赋值到“加权计算I”列,由于第二批样本数据相关程度最高的用户窃电可能性最高,将其赋予1000的得分。
S35:依据算法模型中的“当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度一般较小”,对数据再次加权。
S351:为台区线损率表添加一列记为样本选取标记c,在该列中,为符合选取条件的数据日期对应的行赋值c;
为数据日期对应行赋值c的条件为:当某一数据日期对应样本选取标记a列的数据为a,且对应样本选取标记b列的数据不为b,则在样本选取标记c列的对应行赋值c。
S352:为用户电量表添加一列记为变化趋势;
用户i在数据日期为t时,若<0,则为变化趋势列中的对应行赋值“反向”;若=0,则为变化趋势列中的对应行赋值“不变”;若>0,则为变化趋势列中的对应行赋值“同向”;其中指用户i在数据日期为t时的采集电量,指用户i在数据日期为t-1时的采集电量,指数据日期为t时的台区线损率,指数据日期为t-1时的台区线损率。
S353:在台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势不同的比率为:;其中指所有样本选取标记c中所有c的数量之和,即台区存在用户窃电行为,且台区线损率变化率较小的总天数,指即台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势为反向天数之和;
变化趋势表中用户编号列中的数据为用户电量表中所有的去重后的用户编号,用户名称列为对应的用户名称,将变化趋势不同率的值D赋值到变化趋势表中变化趋势不同率列中对应用户编号的行。
S354:再次加权计算。
对数据加权a表新增加权计算2列,该列的数值X有以下约束规则:当用户i对应的相关程度a的值等于所有第一批样本的总天数时,其对应的置为0;当用户i对应的变化趋势不同率的值大于d时,即用户i是窃电用户的可能很小,将其对应的置为m0,其中0<d<1,0<m0<mw;当用户i不满足上述两个条件时,将其对应的置为对应加权计算1列的值。
下面是本发明提供的一个已创建好的再次加权计算后的数据加权表a的排名考前部分:
表中,由于台区线线损率可能不止受单一窃电用户影响,在所有“台区存在用户窃电行为,且台区线损率变化率较小”的数据日期中,当某用户的采集电量变化方向与台区线损率的变化方向不同的天数占比大于30%时即取d=30%时,可以认为该用户是窃电用户的可能非常小,那么对应取m0=1(m0<mw=2)。
对数据加权b表新增加权计算II列,该列的数值Y有以下约束规则:当用户i对应的相关程度b的值等于所有第一批样本的总天数时,其对应的置为0;当用户i对应的变化趋势不同率的值大于d时,即用户i是窃电用户的可能很小,将其对应的置为s0,其中0<d<1,s0=m0;当用户i不满足上述两个条件时,将其对应的置为对应加权计算1列的值。
下面是本发明提供的一个已创建好的再次加权计算后的数据加权表b的排名考前部分:
表中,同理数据加权表a的再次加权,取d=30%,取s0=m0=1。
S36:最终结果。
将数据加权a表中的用户编号、用户名称、加权计算2列与数据加权b表中的用户编号、用户名称、加权计算II列合并统计,并将对应用户在加权计算2与加权计算II的值求和,和记为最终结果。
创建数据表最终结果,包含用户编号、用户名称、最终结果、窃电嫌疑度列,以用户编号为主键;
最终结果中用户编号列中的数据为数据加权a和数据加权b表中所有汇总去重后的用户编号,用户名称列为对应的用户名称;
将加权计算2与加权计算II求和的值X+Y赋值到最终结果表中最终结果列中对应用户编号的行;
按照最终结果列,降序排列。
S37:确定窃电嫌疑度;
当最终结果列的值大于等于m1时,为窃电嫌疑度列中其对应行赋值大;当最终结果列的值小于等于mw时,为窃电嫌疑度列中其对应行赋值小;当最终结果列的值大于mw且小于m1时,为窃电嫌疑度列中其对应行赋值中。
下面是本发明提供的一个已创建好的最终结果表的排名考前部分:
表中,最终结果≥m1=100时,该用户的窃电嫌疑度赋值为“大”;最终结果≤mw=2时,该用户的窃电嫌疑度赋值为“小”;2=mw<最终结果<m1=100时,该用户的窃电嫌疑度赋值为“中”。
S38:最终结果展示。
为缩小排查范围,向工作人员展示“最终结果”列中最大的5个数据对应的用户信息及其窃电嫌疑度,并绘制对应的采集电量曲线与台区线损曲线,方便工作人员查看并前往现场针对性处理,从而高效解决窃电、串户等电量异常问题。
下面是本发明提供的用户p的采集电量曲线与台区线损曲线对比分析。
如图4所示,两条曲线吻合度极高,后经工作人员现场排查,用户p确实存在存在窃电行为;同时,两条曲线吻合度极高,也说明采用本发明的方法后,可以对数据进行量化分析,既克服了原有传统方法存在的不便,又极大地减轻了工作人员的工作量,并精准锁定嫌疑用户。
若该台区下不存在窃电嫌疑度为“大”的用户,且展示的5名用户经现场排查都没有问题,则说明该台区下用户的窃电方式可能为无表计窃电或窃电表计采集电量一直小于0,工作人员需要重点排查台区的入户线与采集电量在大部分时间都小于0的用户。
最后应说明的是,以上实施例仅用以说明本发明的技术方案,而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解,依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。
Claims (3)
1.一种基于用户采集电量与台区线损相关性的窃电用户核查方法,其特征在于包括如下步骤:
S1:分析和确定用户采集电量与台区线损相关性的算法模型;
S2:选取样本并依据算法模型对样本中线损存在异常的日期进行标记;
S3:在算法模型的基础上,对选取样本中被标记日期对应的数据进行用户采集电量与台区线损相关性的计算,计算过程中结合统计学原理置信区间,以减少正常用户的干扰,再结合多次权重评价方法,以增加计算结果的真实可靠性,最后根据计算结果将筛选出用户的窃电嫌疑度确定为大、中、小三类;
S4:按比例对窃电嫌疑度排名靠前的用户进行现场排查处理,若该台区下没有窃电嫌疑度为大的用户,且所选比例的排名靠前用户经现场排查都没有问题,则说明该台区下用户的窃电方式可能为无表计窃电或窃电表计采集电量非常接近0或等于0,工作人员需要重点排查台区的入户线与采集电量在大部分时间都非常接近或等于0的用户;
所述步骤S1包括如下步骤:
线损分为理论线损和管理线损,管理线损的成因复杂多样,而理论线损是可以进行计算的,在理想环境下,台区线损量等同于理论线损值,且不会因用户电量的变化而改变;
在这个理想环境下,且不考虑分布式电源的影响,则供电量-售电量=台区线损量=理论线损值,其中售电量为台区所有用户采集电量之和,供电量为台区关口表的采集电量;
引入1个窃电用户进行讨论,则窃电用户采集电量=窃电用户实际电量-窃电量,台区线损量=理论线损值+窃电量=供电量*理论线损率+窃电量,可见窃电量的变化会引起台区线损量的变化,且两者正相关;
一般情况下能被采集示数的窃电用户,采集电量通常是实际电量的某个百分比值,把它称作窃电系数k,则窃电用户采集电量=E-Ek=E(1-k),台区线损量=理论线损值+Ek;
画出y=E和y=Ek的函数图像进行定性分析;
定性分析后得出:随着E和k的变化,台区线损量变化时,窃电用户的采集电量也会发生有相关性的不同幅度的变化,包括增加、减少或不变,类似正弦函数曲线,但台区线损量和窃电用户采集电量不是单纯的正相关和负相关,属于较为复杂的非线性相关,难以直接对台区线损量和窃电用户采集电量进行相关性分析,可以根据其变化率进行分析;
由此,确定用户采集电量与台区线损相关性的算法模型为:
存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系,且台区线损率变化较大时的相关性更高,当用户刚开始或终止窃电、明显增加或减少用电系数时,窃电用户采集电量与台区线损量呈负相关且此时台区线损率变化幅度较大;
将用户采集电量与台区线损相关性分析转化为各用户采集电量变化率绝对值和台区线损率变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户;
当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度较小;
所述步骤S2包括如下步骤:
S21:在电力用户用电信息采集系统中,提取最近z天中每天的台区下所有用户表计的数据日期、用户编号、用户名称和采集电量作为用户电量表,以数据日期和用户编号作为主键,先按照用户编号升序,再按照数据日期升序,对用户电量表进行排序;
S22:在电力用户用电信息采集系统中,提取最近z天中每天的数据日期、台区编号、台区名称、理论线损率、供电量、售电量、线损量、线损率作为台区线损率表,以数据日期作为主键,按照数据日期升序,对台区线损率表进行排序;
其中,用户电量表和台区线损率表通过主键数据日期进行连接;
S23:依据算法模型中的“存在窃电量时,台区线损量变化才会和窃电用户采集电量变化有非线性相关关系”选取第一批样本;
将台区线损率表中线损率>理论线损率+3%的数据日期认定为存在用户窃电行为,为台区线损率表添加一列记为样本选取标记a,在该列中,当对应数据日期的线损率>理论线损率+3%时,为其赋值a;
S24:依据算法模型中的“台区线损率变化较大时的相关性更高”选取第二批样本;
采用箱线图原理,认定台区线损率变化值处于上四分位数和上边缘之间的数据为相对离群值,即存在窃电行为且台区线损率变化较大;为台区线损率表添加一列记为样本选取标记b,在该列中,当对应数据日期的台区线损率变化值大于相对离群值中的某一值时,为其赋值b。
2.根据权利要求1所述的基于用户采集电量与台区线损相关性的窃电用户核查方法,其特征在于,所述步骤S24中采用箱线图原理选取样本标记b具体为:箱线图共由五个数值点构成,从下到上依次是下边缘、下四分位数Q1,中位数、上四分位数Q3和上边缘;
下边缘的取值可以为最小值或最小观察值,最小观察值=Q1-1.5(Q3-Q1);
上边缘的取值可以为最大值或最大观察值,最大观察值=Q3+1.5(Q3-Q1);
箱线图中,大于最大观察值或小于最小观察值的数值被定义为离群值;
3.根据权利要求1所述的基于用户采集电量与台区线损相关性的窃电用户核查方法,其特征在于,所述步骤S3包括如下步骤:
S31;依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率;
S311:以已计算出的台区线损率变化值为基础,为保证变化率在1以内方便比较,取与中的最大值作为分母,则数据日期为t时的台区线损率变化率为:,其中指台区线损率变化值的绝对值,指数据日期为t时的台区线损率,指数据日期为t-1时的台区线损率,为取和的最大值;
S32:减少正常用户的干扰;
采用统计学原理置信区间,找出正常用户采集电量变化值的高置信度范围,在计算采集电量变化率的过程中,当用户采集电量变化值小于正常用户采集电量变化值的高置信度范围内的某个值n时,将置为0,即只筛查≥n的数据;当正常用户采集电量变化值的高置信度范围为(-p,p)时,n的取值范围是(0,p);
S321:对标记为a的第一批样本数据,从(0,p)中选取一个值q,0<q<p,取n1=q;
在计算第一批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
S322:对标记为b的第二批样本数据,取n2=p;
在计算第二批样本数据时,用户i在数据日期为t时的采集电量变化率重新定义为:
S33:依据算法模型中的“将用户电量与台区线损相关性分析转化为台区线损率变化率绝对值和各用户采集电量变化率绝对值的接近程度分析,若其越接近,则说明变化的相关性越强,最接近值对应的用户最有可能是窃电用户”计算台区线损率变化率和用户采集电量变化率的相关程度;
S331:用标记为a的第一批样本数据作为数据日期选取依据,则用户i的采集电量变化率与台区线损率变化率的相关程度为:;其中指第一批样本数据对应的数据日期为t时,用户i的采集电量变化率, 指当数据日期为t时的台区线损率变化率,表示对样本选取标记a中所有对应值为a的数据日期对应的进行求和;
S332:用标记为b的第二批样本数据作为数据日期选取依据,则用户i的采集电量变化率与台区线损率变化率的相关程度为:;其中指第二批样本数据对应的数据日期为t时,用户i的采集电量变化率,指当数据日期为t时的台区线损率变化率,表示对样本选取标记b中所有对应值为b的数据日期对应的进行求和;
S34:数据加权;
S341:创建数据表数据加权a,数据列分别为用户编号、用户名称、相关程度a,以用户编号作为主键;
将对数据加权a表按照相关程度a升序进行排列;
新增加权计算1列,将数组{m1,m2,m3,……,mw}作为第一次加权计算的得分赋值到加权计算1列,其中m1>m2>m3>……>mw>0;
S342:创建数据表数据加权b,数据列分别为用户编号、用户名称、相关程度b,以用户编号作为主键;
将数据加权b表按照相关程度b升序进行排列;
新增加权计算I列,将数组{s1,s2,s3,……,sw}作为第一次加权计算的得分赋值到加权计算I列,其中s1>s2>s3>……>sw>0,又由于第二批样本数据相关程度最高的用户窃电可能性最高,s1>m1>s2≥m2>s3≥m3……>sw≥mw;
S35:依据算法模型中的“当用户持续稳定窃电时,窃电用户采集电量与台区线损量呈正相关,由于一般情况下窃电用户的实际用电量也比较稳定,此时台区线损率变化幅度较小”,对数据再次加权;
S351:为台区线损率表添加一列记为样本选取标记c,在该列中,为符合选取条件的数据日期对应的行赋值c;
为数据日期对应行赋值c的条件为:当某一数据日期对应样本选取标记a列的数据为a,且对应样本选取标记b列的数据不为b,则在样本选取标记c列的对应行赋值c;
S352:为用户电量表添加一列记为变化趋势;
用户i在数据日期为t时,若<0,则为变化趋势列中的对应行赋值“反向”;若=0,则为变化趋势列中的对应行赋值“不变”;若>0,则为变化趋势列中的对应行赋值“同向”;其中指用户i在数据日期为t时的采集电量,指用户i在数据日期为t-1时的采集电量,指数据日期为t时的台区线损率,指数据日期为t-1时的台区线损率;
S353:在台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势不同的比率为:;其中指所有样本选取标记c中所有c的数量之和,即台区存在用户窃电行为,且台区线损率变化率较小的总天数,指即台区存在用户窃电行为,且台区线损率变化率较小时,用户i的采集电量与台区线损率变化趋势为反向天数之和;
变化趋势表中用户编号列中的数据为用户电量表中所有的去重后的用户编号,用户名称列为对应的用户名称,将变化趋势不同率的值D赋值到变化趋势表中变化趋势不同率列中对应用户编号的行;
S354:再次加权计算;
对数据加权a表新增加权计算2列,该列的数值X有以下约束规则:当用户i对应的相关程度a的值等于所有第一批样本的总天数时,其对应的置为0;当用户i对应的变化趋势不同率的值大于d时,即用户i是窃电用户的可能很小,将其对应的置为m0,其中0<d<1,0<m0<mw;当用户i不满足上述两个条件时,将其对应的置为对应加权计算1列的值;
对数据加权b表新增加权计算II列,该列的数值Y有以下约束规则:当用户i对应的相关程度b的值等于所有第一批样本的总天数时,其对应的置为0;当用户i对应的变化趋势不同率的值大于d时,即用户i是窃电用户的可能很小,将其对应的置为s0,其中0<d<1,s0=m0;当用户i不满足上述两个条件时,将其对应的置为对应加权计算1列的值;
S36:最终结果;
将数据加权a表中的用户编号、用户名称、加权计算2列与数据加权b表中的用户编号、用户名称、加权计算II列合并统计,并将对应用户在加权计算2与加权计算II的值求和,和记为最终结果;
创建数据表最终结果,包含用户编号、用户名称、最终结果、窃电嫌疑度列,以用户编号为主键;
最终结果中用户编号列中的数据为数据加权a和数据加权b表中所有汇总去重后的用户编号,用户名称列为对应的用户名称;
将加权计算2与加权计算II求和的值X+Y赋值到最终结果表中最终结果列中对应用户编号的行;
按照最终结果列,降序排列;
S37:确定窃电嫌疑度;
当最终结果列的值大于等于m1时,为窃电嫌疑度列中其对应行赋值大;当最终结果列的值小于等于mw时,为窃电嫌疑度列中其对应行赋值小;当最终结果列的值大于mw且小于m1时,为窃电嫌疑度列中其对应行赋值中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110661125.9A CN113362199B (zh) | 2021-06-15 | 2021-06-15 | 基于用户采集电量与台区线损相关性的窃电用户核查方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110661125.9A CN113362199B (zh) | 2021-06-15 | 2021-06-15 | 基于用户采集电量与台区线损相关性的窃电用户核查方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113362199A CN113362199A (zh) | 2021-09-07 |
CN113362199B true CN113362199B (zh) | 2022-12-02 |
Family
ID=77534455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110661125.9A Active CN113362199B (zh) | 2021-06-15 | 2021-06-15 | 基于用户采集电量与台区线损相关性的窃电用户核查方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113362199B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113947504B (zh) * | 2021-11-11 | 2024-07-30 | 国网辽宁省电力有限公司营销服务中心 | 一种基于随机森林法的窃电分析方法及其系统 |
CN114742668A (zh) * | 2022-05-17 | 2022-07-12 | 国网浙江省电力有限公司营销服务中心 | 一种基于用电数据回溯的低压反窃电分析方法及系统 |
CN115165553B (zh) * | 2022-06-10 | 2023-05-30 | 中复神鹰碳纤维股份有限公司 | 一种碳纤维复丝拉伸强度测试数值的取舍方法 |
CN115207909B (zh) * | 2022-07-20 | 2023-09-15 | 北京三圣凯瑞科技有限公司 | 一种台区拓扑识别方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104330678A (zh) * | 2014-11-20 | 2015-02-04 | 国家电网公司 | 一种基于低压配电网三相状态估计的台区用电监测方法 |
CN105590166A (zh) * | 2015-12-16 | 2016-05-18 | 国家电网公司 | 一种配电网中专变供电用户用电行为分析判断方法 |
CN106295985A (zh) * | 2016-08-08 | 2017-01-04 | 国网山东省电力公司济南供电公司 | 一种台区线损管理系统及管理方法 |
WO2017149748A1 (ja) * | 2016-03-04 | 2017-09-08 | 楽天株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
CN110097297A (zh) * | 2019-05-21 | 2019-08-06 | 国网湖南省电力有限公司 | 一种多维度窃电态势智能感知方法、系统、设备及介质 |
CN111507611A (zh) * | 2020-04-15 | 2020-08-07 | 北京中电普华信息技术有限公司 | 一种确定窃电嫌疑用户的方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022645B (zh) * | 2016-06-07 | 2021-02-12 | 深圳市芝电能源科技有限公司 | 非侵入式在线实时电力负荷识别方法及识别系统 |
CN110824270B (zh) * | 2019-10-09 | 2022-04-26 | 中国电力科学研究院有限公司 | 结合台区线损和异常事件的窃电用户辨识方法及装置 |
CN112730938B (zh) * | 2020-12-15 | 2023-05-02 | 北京科东电力控制系统有限责任公司 | 一种基于用电采集大数据的窃电用户判断方法 |
-
2021
- 2021-06-15 CN CN202110661125.9A patent/CN113362199B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104330678A (zh) * | 2014-11-20 | 2015-02-04 | 国家电网公司 | 一种基于低压配电网三相状态估计的台区用电监测方法 |
CN105590166A (zh) * | 2015-12-16 | 2016-05-18 | 国家电网公司 | 一种配电网中专变供电用户用电行为分析判断方法 |
WO2017149748A1 (ja) * | 2016-03-04 | 2017-09-08 | 楽天株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
CN106295985A (zh) * | 2016-08-08 | 2017-01-04 | 国网山东省电力公司济南供电公司 | 一种台区线损管理系统及管理方法 |
CN110097297A (zh) * | 2019-05-21 | 2019-08-06 | 国网湖南省电力有限公司 | 一种多维度窃电态势智能感知方法、系统、设备及介质 |
CN111507611A (zh) * | 2020-04-15 | 2020-08-07 | 北京中电普华信息技术有限公司 | 一种确定窃电嫌疑用户的方法及系统 |
Non-Patent Citations (1)
Title |
---|
《基于大数据的线损计算分析研究》;黄文思等;《电气技术》;20151031;第79-84页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113362199A (zh) | 2021-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113362199B (zh) | 基于用户采集电量与台区线损相关性的窃电用户核查方法 | |
CN110223196B (zh) | 基于典型行业特征库和反窃电样本库的反窃电分析方法 | |
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN110414768B (zh) | 一种基于仪器电流数据的大数据分析方法 | |
CN111291076A (zh) | 基于大数据的异常用水监测报警系统及其构建方法 | |
CN108846691A (zh) | 区域性粮油市场价格监测分析预测系统及监测方法 | |
JP5284548B2 (ja) | 地域特性を利用したプロファイリングシステム | |
CN112883062A (zh) | 一种不基于规则的自定义规则稽查方法 | |
CN117252632A (zh) | 一种基于计算机的商品价格分析系统及方法 | |
CN112184495B (zh) | 存量低效土地监测系统及应用其的分析平台 | |
CN118037469A (zh) | 基于大数据的财务管理系统 | |
CN117273456B (zh) | 一种基于大数据技术的项目成本智能管理系统 | |
CN117934035A (zh) | 一种房建工程造价预估方法、装置及存储介质 | |
CN112256681A (zh) | 一种空管数字化指标应用系统及方法 | |
CN106355306A (zh) | 基于地区用电特征的经济景气指数分析方法及其系统 | |
CN114077977B (zh) | 基于大数据的楼宇智慧管理方法、系统及可读存储介质 | |
CN113393169B (zh) | 基于大数据技术的金融行业交易系统性能指标分析方法 | |
CN116090891A (zh) | 一种基于大数据的电力施工企业客户行为分析方法 | |
CN113075448A (zh) | 一种基于知识图谱的业扩计量装置的配置方法及系统 | |
CN117520624B (zh) | 一种大数据指标的配置与计算的方法及装置 | |
CN112488572B (zh) | 一种审计对象推荐方法、装置、设备和介质 | |
CN116976861B (zh) | 一种铜管生产车间设备的养护数据管理方法及系统 | |
Hisnanick | Forecasting the demand for inpatient services for specific chronic conditions | |
Guo et al. | Research on Portrait Models of Performance Evaluation Built for Digital Intelligent Power Supply Departments | |
CN116090869A (zh) | 一种可持续的城市体检方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |