发明内容
本发明所要解决的技术问题是克服上述现有技术存在的缺陷,提供一种基于典型行业特征库和反窃电样本库的反窃电分析方法,其引入典型行业用电特征库和反窃电样本库,提出一种典型行业用电特征和反窃电样本库相结合的反窃电预警模型,通过该模型对专变用户用电数据进行挖掘分析,将结果进行分析处理,从而辨别出是否存在窃电行为。
为此,本发明采用如下的技术方案:基于典型行业特征库和反窃电样本库的反窃电分析方法,其包括:构建典型行业用电特征库和反窃电样本库;采用典型行业用电特征库和反窃电样本库作为数据基础,基于组合不同算法的优势,经过算法模型的综合判断后构建出反窃电预警模型,通过该模型对专变用户用电数据进行挖掘分析,进一步进行辅助研判,最后输出窃电用户嫌疑清单和窃电用户嫌疑分析报告。
典型行业用电特征库的建立是探索典型行业的窃电特征的差异性、规律性、相关性以及趋势性的重要方法,同时也为反窃电预警模型提供了重要的指标基础,如用户与本行业用电的相似度、用户与窃电用户之间的相似度等数据特征。反窃电样本库是通过特征工程分析方法生成反窃电样本库。
进一步的,所述的典型行业用电特征库采用以典型行业用户的日平均功率、周平均功率、日用电量、月用电量和负载率为输入参数,通过多种聚类算法分析,区别出异常的用电特征,形成典型行业的用电特征曲线;所述的用电特征为由单个聚类因子构成的特征或者由多个聚类因子组成的特征。
进一步的,所述典型行业用电特征库的构建步骤包括:
1)确定典型行业
典型行业的构建和选择有如下方法:对历年违窃电历史数据进行统计分析,按照案例数量进行排序,选择违窃电分布多的行业;选择当地反窃电重点行业作为典型行业;
2)选择聚类因子
选择功率曲线、日平均功率、周平均功率、三相不平衡率、负载率、功率因数、日用电量作为聚类的因子,其中对不同的聚类因子采取相同的标准化处理,即:
式中,Pi是指某个点的功率,max(P)、min(P)分别是指最大、最小功率;
3)选择聚类算法
基于已标准化的聚类因子,比较不同的聚类算法在不同行业的实用性后,通过聚类算法确定不同行业的日、周、季节不同维度的用电特征,从而构成不同行业的用电特征曲线;
4)生成典型行业用电特征库
典型行业用电特征库有两部分组成:一部分是数据曲线做为聚类因子,通过聚类算法生成的不同行业的用电曲线,并且包含其特征所属类别建立的用电特征库,此类行业用电特征库包括:典型行业+地区日峰谷用电特征类别;典型行业+地区工作日休息日周用电特征类别;典型行业+地区季节性年用电特征类别;
另一部分是由多个用电特征值组合生成的聚类因子所建立的特征库,该特征库包括:平均功率、日功率波动率、三相不平衡率、负载率、功率因数波动率、用电量变化率和聚类后的类别。
进一步的,所述反窃电样本库的构建包括初始特征构建、特征提取与选择、生成反窃电样本库三个部分;
初始特征构建从大量的原始数据选择相关的属性;特征提取与选择都是为了从原始特征中找出最有效的特征并进行整合,它们之间的区别是特征提取强调通过特征转换的方式得到一组具有明显物理或统计意义的特征;特征选择是从特征集合中挑选一组具有明显物理或统计意义的特征子集;通过算法分析最终生成反窃电样本库。
进一步的,选择构建如下初始特征:
初始静态特征:接线方式、供电方式、行业类别、用电性质、运行容量;
营销业务特征:增减容、暂停、历年逾期欠费、计量故障、违窃记录;
用电基础特征:用电数据需要带时间戳的用电相关值,包括:有功功率、带时间无功功率、分相电压、分相电流、功率因数;
用电加工特征:峰谷差、日用电波形、季度特性内月用电量特征、负载率、电流平衡率、电压平衡率、功率因数波动率;
异常事件:开盖事件、开箱时间、恒定电磁干扰事件、相序异常、停上电事件。
外部环境特征:气象信息。
进一步的,特征选择在对特征清理基础上进行,特征选择首先利用Pearson相关系数、判别指标之间的相关性,剔除存在高度共线性的指标,然后采用随机森林算法、PCA降维处理方法,分别得到不同特征指标的重要性排名以及包含主要特征信息的最小特征空间。
进一步的,反窃电样本库特征量包括:电量趋势下降指标、功率与电流相关性指标、计量反极性指标、功率因数相关性指标、电流不平衡相关性指标、线损波动性指标、事件类指标、信用类指标和负载类指标。
进一步的,反窃电预警模型的建立过程如下:
特征指标的选取:通过输入不同的特征向量,首先采用序列向后选择算法对特征向量的筛选、规约,选取对模型影响、贡献度大的指标构成的集合作为训练集;
分类算法的选择:选择的算法包括XGBoost、BP神经网络、电量波动离群点和多元逻辑回归,其中不同的分类模型的训练方法都采用KFold交叉验证,不同的算法在训练、测试的过程中剔除分类错误的训练数据集合,使得最终选取的模型精度不低于0.9;
反窃电预警模型的建立:通过对不同算法的综合决策分析,确定不同算法的权重的分配,构造一组组合最优的分类模型作为反窃电预警模型。
进一步的,反窃电预警模型对多种算法的优势进行组合,其中组合的模型包括:XGBoost、BP神经网络、多元逻辑回归算法以及电量波动离群点算法,输出结果表现形式为:
窃电嫌疑(P)=λ1fbp+λ2fxgb+λ3flogic+λ4fsubb
其中,λi,i∈(1,2,3,4)为算法权重,fbp、fxgb、flogic、fsubb分别为Bp神经网络、XGBoost、多元逻辑回归算法以及电量波动离群点算法;
根据不用行业的稽查结果反馈,采用AdaBoost算法中权重更新的方式对参数λi进行更新;
通过集中多种算法的优势构建反窃电预警模型,对于每个算法的可靠性判定是基于测试集合的ROC曲线。
进一步的,所述辅助研判的流程如下:输入反窃电预警模型计算结果,获取用户特征量,经过反窃电预警模型分析后,得出疑似用户清单,进一步获取此用户的模型计算特征量和疑似窃电时间段内的异常事件;对用户进一步进行用电行为分析,经过辅助研判,如果符合用电行为异常条件,则修改模型计算结果并形成最终的反窃电嫌疑用户报告;如果经过分析,不符合用电行为异常条件,则维护模型计算结果并形成最终反窃电嫌疑用户报告;辅助研判方法是将疑似窃电用户的用电特征与一些具备特殊用电用户的用电特征进行比较,相同的则判定为特殊用电用户,并移除该疑似窃电用户,所述的特殊用电包括电信基站用电、照明用电、感性用电和无功过补偿。
本发明具有的有益效果如下:本发明提出一种典型行业用电特征和反窃电样本库相结合的反窃电预警模型,通过该模型对专变用户用电数据进行挖掘分析,将结果进行分析处理,从而辨别出是否存在窃电行为。本发明主要用于应对窃电用户手段的智能性、隐蔽性、有规模性和职业性,解决现有电力工作人员现场发现窃电的难度大、耗时耗力、不及时、无强专业支撑等问题。
具体实施方式
下面结合说明书附图及实施例对本发明作以下详细描述。
如图2所示的反窃电分析方法,其在分析过程中涉及数据源、数据预处理、特征分析、模型构建和模型输出等部分,如图1所示。
1.数据源
本发明的数据以用电信息采集系统数据(曲线数据、冻结数据、报警数据)、营销业务应用系统数据(客户基础信息、信用违窃信息、业务变更信息、违窃历史信息)、一体化线损系统数据为基础。主要分析对象是专变用户负荷数据的三相电流数据。
2.数据预处理
用于建模的海量数据质量对于反窃电预警模型的准确性至关重要。从营销业务应用系统、用电信息采集系统、一体化线损系统中抽取数据时,海量原始数据中存在着大量不完整、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据预处理就显得尤为重要。
(1)数据筛选
异常值分析是检验数据是否有录入错误以及含有不合常理的数据的过程,忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会产生不良影响。考虑到反窃电预警模型的输入数据为时间序列数据,反窃电预警模型利用了小波多尺度分析方法对输入的时间序列数据进行异常值检测。
缺点数较多的用户数据会失去真实性,因此不适合应用于反窃电预警模型分析。因此在对用电信息采集系统的曲线数据进行分析时,会筛除每天缺点数在80%以上的数据。
(2)数据清洗
用户信息清洗:从营销业务应用系统中读取用户档案相关信息,排除计算周期内用户更换、业扩、换表等因素。
事件信息清洗:剔除短时间内重复上报以及逻辑错误的采集事件,排除采集异常事件影响因素。
表码清洗:顺序时间内表码示数必须是连贯的,剔除突增突减,小数点移位等异常因素。
负荷曲线数据清洗:将功率曲线与日用电量进行校核,电压电流曲线与功率曲线进行校核,排除逻辑错误因素。
用电明细数据清洗:针对电压、电流、功率、功率因数等基本数据,过滤掉存在NULL、空值的记录。
在用户用电明细数据清洗时,不同用电类型的用户需要抽取数据指标不一样,需要根据用户类型采取不同方式进行数据清洗。
1)过滤运行容量、综合倍率为0、NULL、空值、负值的记录;
2)过滤用户日用电量为NULL、空值、负值的记录;
3)过滤功率因数大于1的记录;
4)过滤电压、电流、功率为NULL、空值的记录。
(3)数据转换
用于反窃电预警建模的数据包含有非数值型数据(如用户有过窃电行为等),为了便于建模数值计算,需要将非数值型数据进行数值化处理。
用于反窃电预警建模的数据包含不同类型的数据,为了便于机器学习建模,需要将不同量纲的原始数据进行无量纲化和归一化处理。
3.构建典型行业用电特征库
不同行业的用电特性,以及同一行业下不同用户由于规模、行业、地区等差异展现出用电特征也不同。典型行业用电特征库的建立是探索典型行业的窃电特征的差异性、规律性、相关性以及趋势性的重要方法,同时也为反窃电预警模型提供了重要的指标基础,如用户与本行业用电的相似度、用户与窃电用户之间的相似度等数据特征。
以典型行业用户的日平均功率、周平均功率、日用电量、月用电量、负载率等因子为输入参数,通过多种聚类算法分析,不仅区别出了异常的用电特征(由单个聚类因子构成的曲线或者由多个聚类因子组成的特征),而且也形成了典型行业的用电特征曲线。
(1)确定典型行业
营销行业分类有1200多种,在此基础上构建用电特征库不仅样本量过多影响算法效率,而且反窃电行业分类要在营销系统行业分类的基础上,根据本省用户的分布、负荷特征的相似性等对营销行业进行归并,构建适合本省反窃电工作的行业分类,并与营销行业建立关联关系。
典型行业是指窃电多发或者可能多发的行业,典型行业的构建和选择有如下方法:
对历年违窃电历史数据进行统计分析,按照案例数量进行排序,选择违窃电分布较多的行业。
选择当地反窃电重点行业作为典型行业。
例如:在浙江省根据上述分析方法,根据行业上下级关系整理得出如下窃电典型行业树:
(2)选择聚类因子
用电行业不同决定了其负荷特性的差异性,为了反映典型行业日峰谷特征、工作日用电特征、季节性用电特征,构造聚类因子包括:功率曲线、日平均功率、周平均功率、三相不平衡率、负载率、功率因数、日用电量等特征作为聚类的因子。其中对不同的聚类因子采取了相同的标准化处理,即:
式中,Pi是指某个点的功率,max(P)、min(P)分别是指最大、最小功率。
(3)聚类算法选择
基于已标准化的聚类因子,比较了不同的聚类算法在不同行业的实用性后,使用的主要聚类算法包括距离判定的K-means聚类算法和基于密度DBSCAN聚类,其中K-means聚类算法能够直观反映出不同行业的负荷特征,而DBSCAN聚类算法处理不同大小和不同形状的簇(一组数据对象的集合)等优点。通过聚类算法确定了不同行业的日、周、季节等不同维度的用电特征,从而构成了不同行业的用电特征曲线。
聚类算法的簇个数的选择及特征向量与特征向量之间的距离判定是聚类算法的关键。对于K-means聚类算法我们采用通过轮廓系数自动选取聚类个数,相似度度量采用欧式距离,通过轮廓系数选择的k-means算法的聚类中心点的个数,虽然提高聚类的准确性及行业的总体负荷特性,但不能够识别出异常用电行为。而DBSCAN聚类算法是基于K近邻算法(距离的度量方式采用了欧式距离)自动选择了最优的簇与簇之间的距离,通过聚类能够反映出典型行业的负荷特征和用电特征,同时对异常用电行为具有较好的识别效果。
(4)生成典型行业用电特征库
典型行业用电特征库有两部分组成:一部分是数据曲线做为聚类因子,通过聚类算法生成的不同行业的用电曲线,并且包含其特征所属类别建立的用电特征库。此类行业用电特征库主要有:
典型行业+地区日峰谷用电特征类别;
典型行业+地区工作日休息日周用电特征类别;
典型行业+地区季节性年用电特征类别。
另一部分是由多个用电特征值组合生成的聚类因子所建立的特征库。该行业用电特征库主要包括:平均功率、日功率波动率、三相不平衡率、负载率、功率因数波动率、用电量变化率和聚类后的类别。
4.构建反窃电样本库
特征工程在机器学习中占有非常重要的作用,包括初始特征构建、特征提取与选择、生成典型行业用电特征库三个部分。初始特征构建从大量的原始数据选择相关的属性;特征提取与选择都是为了从原始特征中找出最有效的特征并进行整合,它们之间的区别是特征提取强调通过特征转换的方式得到一组具有明显物理或统计意义的特征;特征选择是从特征集合中挑选一组具有明显物理或统计意义的特征子集。通过算法分析最终生成反窃电样本库。
(1)初始特征构建
特征构建是指从用电信息采集系统、营销业务应用系统、一体化线损平台及外部环境的气象信息等源数据中获取一些具有物理意义的特征。需要花时间去观察原始数据,思考问题的潜在形式和数据结构,总结数据敏感性和经验特征。根据计量原理及业务、数据分析的经验,选择构建如下初始特征:
初始静态特征:接线方式、供电方式、行业类别、用电性质、运行容量;
营销业务特征:增减容、暂停、历年逾期欠费、计量故障、违窃记录;
用电基础特征:用电数据需要带时间戳的用电相关值,包括:有功功率、带时间无功功率、分相电压、分相电流、功率因数;
用电加工特征:峰谷差、日用电波形、周特特性(日平均用电量)、季度特性(月平均用电量)内月用电量特征、负载率、电流平衡率、电压平衡率、功率因数波动率;
异常事件:开盖事件、开箱时间、恒定电磁干扰事件、相序异常、停上电事件;
外部环境特征:气象信息。
(2)特征提取与选择
特征选择是剔除不相关或者冗余的特征,减少无效特征的个数,减少模型训练的时间,提高模型的精确度。通过用采数据、营销数据、一体化线损数据构建的多维度特征向量,包括功率与电流相关性指标、开盖/开箱次数、线损变化率、信用评级等指标,需要进行对其进行处理才能作为反窃电预警模型的输入。特征的选择是在对特征清理基础上进行的,特征的选择首先利用Pearson相关系数、判别指标之间的相关性,剔除存在高度共线性的指标,然后采用随机森林算法、PCA等降维处理方法,分别得到不同特征指标的重要性排名以及包含主要特征信息的最小特征空间。
(3)生成反窃电样本库
反窃电样本库特征量包括为:电量趋势下降、功率与电流相关性、计量反极性、功率因数相关性、电流不平衡相关性、线损波动性、事件类、信用类、负载类9大类指标。
(一)电量趋势下降指标
电量趋势下降指标可以反应通过改变计量回路进行窃电的特征,作为模型的特征指标,部分行业的用户在春节及长假数据可能对结果造成误判,需要剔除;其量化公式为:
式中,kl为当天下降趋势指标,fi为当天电量,fl为前后几天电量,αi为权重,d为前后天数。
通过数据挖掘的方法进行特征量的提取。通过日电量曲线和下降趋势方法,进行用电量下降趋势分析。
(二)功率与电流相关性指标
电流与功率之间是正相关关系,相同倍率下建立的电流与功率之间的线性回归系数是一致的。其中采用了线性回归函数:
P=f(|Ia|+|Ib|+|Ic|)
其中,P为瞬时有功功率,Ia,Ib,Ic分别为是三相电流,f是三相电流与瞬时有功功率的映射函数,其数值是通过最小二乘法得到的回归系数。从数据的平均值可以看出,平均电流相近时,平均功率存在较大的差异。从电流与功率关系图上可以看出,功率相同时电流相差很大,表明虽然增加了用电,但是计量功率没有改变。
(三)计量反极性指标
分析“采用改变电压/电流回路接法等移相法”进行窃电的用户均具备以下负荷特征:对比窃电前后负荷特性,发现该类用户窃电后负荷持续出现‘功率反极性’特征。
异常发生次数越多,该事件可靠性越高,将周期内发生异常点的占比作为模型的特征指标,其量化公式为:
式中,K为异常发生点数,Q为有效数据点数。
(四)功率因数相关性指标
对生产型的用户从电能计量装置上反映出来的有功和无功电量的比例是相对稳定的,窃电行为可能通过移相法改变有功、无功功率,改变功率因数,本发明从曲线点功率因数、日冻结功率因数、月用电功率因数,对功率因数进行量化分析。
计量方式三相三线和三相四线的用户,以月级别的功率因数曲线和电流曲线数据进行分析,分析如下内容:
日、月功率因数波动率分析;
日功率因数波动率分析;
功率因数曲线与电流相关性分析;
剔除低电流的干扰。
分析量化过程如下:
1)功率因数波动率表征功率因数的离散程度,采用变异离散系数来描述功率分布特征,在概率论和统计学中,变异系数又是概率分布离散程度的一个归一化量度,其定义为标准差与平均值之比:
式中,
为波动率,μ代表所采用的样本X1,X2,...,Xn的平均值,Xi代表第i个点的功率因数值。
2)功率因数与电流相关性分析
式中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差,X为功率因数波动率,Y为电流波动率。
式中,Cov(X,Y)表示协方差,
表示功率因数平均值,
表示电流平均值,Yi代表第i个点的电流值。
(五)电流不平衡相关性指标
三相负荷平衡才能保证用户的电能质量,是安全供电的基础,是节约能耗、降损降价的基础,但是存在通过移相法等窃电方法对某相施加影响导致三相不平衡的情况。对于计量方式为三相三线和三相四线的专变用户,以月级别的电流曲线和负载率曲线数据进行组合分析,分析内容如下:
分相电流平衡度与负载率关系;
某一负载水平之上时段与分相电流平衡率关系;
剔除低负载情形下的数据扰动干扰。
分析量化过程如下:
1)电流不平衡度是表征某一时间点分相负载的情况,其量化公式为:
X=max(In-Ip)/Ip
式中,In为分相功率,Ip为三相电流平均值,X为三相不平衡率。
2)负荷率是指用户运行功率与其运行容量之比,量化公式为:
Y=S/Se
式中,S为某一点有功功率(kW);Se为运行容量(kW);Y为负荷率。
3)对一个用户来说,生产一般具备连续性和相似性,在一定的负载水平内三相电流呈现相关系数,量化公式为:
式中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差,X为电流不平衡率,Y为负荷率。其中
式中,Cov(X,Y)表示协方差,
表示电流不平衡度平均值,
表示负荷率平均值;Xi第i个点的电流不平衡值;Yi为第i个点的负荷值。
(六)线损波动性指标
线损率是用于衡量供电线路的损失比例,可作为用户线损率的参考值,若用户发生窃电,则分析周期内的线损率会上升。由于用户的用电量存在波动,单纯以当天的线损率上升作为窃电特征则误差过大,所以考虑前后N天的线损率平均值,判断其增长率是否大于阀值K,若线损率的增加大于阀值K,则具有窃电的可能性。
对统计当天设定前后N天为统计窗口期,首先分别计算统计当天与前N天之间的线损率平均值
和统计当天与后5天之间的线损率平均值
若
比
的增长率大于阀值K,则认为具有一定的窃电嫌疑。
式中,K为预警阀值。
特征指标量化是将线损增长率Y和理论线损比对差值G进行加权处理来量化线损指标:
E=αY+βG
式中,α为Y所占权重,建议为40%。β为G所占权重,建议为60%。
(七)事件类指标
事件类指标相关的有以下几类:
特征指标量化:
(1)开盖,开箱,磁场干扰,相序异常,电表停上电记录等事件类:该计量点周期内是否产生事件进行指标量化处理:
(2)电能表倒走:根据该计量点周期内倒走次数进行指标量化处理:
式中,k为近周期内记录数。
(八)信用类
信用类数据包含窃电记录、欠费记录,将最近3年内发生窃电/欠费记录数进行指标量化处理:
式中,k为近3年发生窃电(欠费)记录数。
(九)负载率指标
用户周期内平均负载率进行指标量化处理:
式中,n为周期内采集点数,fi为负载率。
5.算法模型构建
(1)模型构建
典型行业用电特征库、反窃电样本库是反窃电预警模型建立的数据基础,从而实现反窃电预警的目标。典型行业用电特征库是探索行业用电特征的差异性、规律性和趋势性的重要方法,同时也为反窃电预警模型提供了重要的指标;反窃电样本库是表征窃电相关的关键指标,同时是构建模型的数据输入部分。
根据行业用电特征库大量数据的分析,不同行业的窃电频率、幅度、时间等数据特征存在着一定的差异性。仅通过单个算法并不能表征窃电数据的所有特征,然而基于组合不同算法的优势,可以提高模型训练、应用的准确性。经过反窃电预警模型的综合判断后,进一步进行辅助研判,使得出的结果更加准确,最后输出窃电用户嫌疑清单和窃电用户分析报告。
(2)模型选择
反窃电预警模型是采用由多种算法来分别分析,然后采用综合决策的方法给出用户判别结果。模型选择的算法由BP神经网络、XGBoost算法、多元逻辑回归算法、电量波动离群点算法,其优势主要表现为:XGBoost算法是优化的分类树模型;BP神经网络通过隐含层非线性变换能较好解决特征向量之间的非线性关系;多元逻辑回归算法能够以特征向量之间保持独立同分布为先验信息的前提下给出分类结果的概率;电量波动离群点算法是针对电量波动率的分析,反映窃电的变化趋势。
建立的反窃电预警模型的框架如图3所示:
特征指标的选取:通过输入不同的特征向量,首先采用序列向后选择(SBS)算法对特征向量的筛选、规约,选取对模型影响、贡献度较大的指标构成的集合作为训练集。
分类算法的选择:选择的算法包括XGBoost、BP神经网络、逻辑回归,其中不同的分类模型的训练方法都采用KFold交叉验证,不同的算法在训练、测试的过程中剔除了分类错误的训练数据集合,使得最终选取的模型精度的不低于0.9。
反窃电预警模型的建立:通过对不同算法的综合决策分析,确定了不同算法的权重的分配,构造一组组合最优的分类器作为窃电判断的方法。
(3)模型组合与评价
反窃电预警模型对多种算法的优势进行了组合,其中组合的模型包括:XGBoost、BP神经网络、逻辑回归算法以及离群点算法,输出结果表现形式为:
窃电嫌疑(P)=λ1fbp+λ2fxgb+λ3flogic+λ4fsubb
其中λi,i∈(1,2,3,4)为算法权重,fbp、fxgb、flogic、fsubb分别为Bp神经网络、XGBoost、逻辑回归算法以及离群点算法。
由于用电行业的差异性,其模型的组合系数也需要进行调整,初始化设置不同的算法是等概率的,根据不用行业的稽查结果反馈,采用AdaBoost算法中权重更新的方式对参数λi进行更新,即与稽查结果复合的权重赋予较大值,反之更新权重变小减小其对结果的贡献度。
通过集中多种算法的优势构建了反窃电预警模型,对于每个算法的可靠性判定是基于测试集合的ROC曲线,如图4所示。
其中,曲线下面的面积越大表明了分类效果越好。
(4)辅助研判
针对模型计算输出的结果进一步进行辅助研判,使得出的最终结果更加准确。
针对模型计算输出的结果,引用图5进一步进行辅助研判,具体流程如下:
经过模型分析后,得出疑似用户清单,进一步获取此用户的模型计算特征量和疑似窃电时间段内的异常事件;对用户进一步进行用电行为分析,经过辅助研判,如果符合用电行为异常条件,则修改模型计算结果并形成最终的反窃电嫌疑用户报告;如果经过分析,不符合用电行为异常条件,则维护模型计算结果并形成最终反窃电嫌疑用户报告。
辅助研判方法是将疑似窃电用户的用电特征与一些具备特殊用电用户的用电特征进行比较,相同的则判定为特殊用电用户,并移除该疑似窃电用户,所述的特殊用电包括电信基站用电、照明用电、感性用电和无功过补偿。
6.模型输出
输出窃电嫌疑清单,生成疑似窃电用户分析报告,主要内容如下:
1)用户基本信息(户号、计量点号、表号);
2)用电异常报告,包括:嫌疑系数,异常总体描述,用电特性(含负荷、电压、电流、功率因数、相位角运行特性)描述;
3)佐证数据:用于支撑分析总结内容,针对不同模型,相关各类曲线佐证展示。
应用例
本发明方法的应用例如下所示。通过模型判定该用户于7月份存在窃电嫌疑,通过窃电指标的分析,该用户存在多个指标异常,包括电量趋势下降,不平衡率变大,相关性指标变小。经实际查证的窃电时间为‘2018/07/29’,与实际建立的模型预测结果相符合,该用户的用电趋势为如图6所示。
该用户的用电异常分析表如下:
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。