CN109146705B - 一种用电特征指标降维与极限学习机算法进行窃电检测的方法 - Google Patents

一种用电特征指标降维与极限学习机算法进行窃电检测的方法 Download PDF

Info

Publication number
CN109146705B
CN109146705B CN201810711333.3A CN201810711333A CN109146705B CN 109146705 B CN109146705 B CN 109146705B CN 201810711333 A CN201810711333 A CN 201810711333A CN 109146705 B CN109146705 B CN 109146705B
Authority
CN
China
Prior art keywords
load
data
electricity
users
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810711333.3A
Other languages
English (en)
Other versions
CN109146705A (zh
Inventor
李川
李梓欣
李英娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201810711333.3A priority Critical patent/CN109146705B/zh
Publication of CN109146705A publication Critical patent/CN109146705A/zh
Application granted granted Critical
Publication of CN109146705B publication Critical patent/CN109146705B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种用电特征指标降维与极限学习机算法进行窃电检测的方法,属于用户用电行为检测领域。本发明对用户用电历史数据分析,提取特征指标进行降维并结合局部离群因子、极限学习机算法对窃电行为进行检测。首先对用户的负荷数据进行分类,提出度量负荷曲线的四种指标并得出特征变量;其次在分类的基础上对提取出的特征变量进行降维,利用局部离群因子筛选出用电异常用户;最后采用窃电判别指标并提取主成分,将用电异常用户提取主成分后的窃电判别指标数据作为训练样本输入模型。本发明对窃电用户有很好的识别效果。

Description

一种用电特征指标降维与极限学习机算法进行窃电检测的 方法
技术领域
本发明涉及一种用电特征指标降维与极限学习机算法的窃电检测方法,属于用户用电行为检测领域。
背景技术
我国已经进入了全面建成智能电网阶段,随着智能电网的快速发展,用电信息采集系统及配电自动化系统逐渐完善,配用电数据呈现出数据量大、数据类型多、增长速度快等大数据特征。但窃电现象依然严重且手段先进,反窃电手段仍以人工稽核为主,存在工作量大、取证困难和缺乏针对性等问题。窃电作为影响电网发展的主要问题之一,不仅给国家经济造成了重大的损失,而且威胁着电网的安全运行,也是电力部门一直需要解决的问题。窃电行为作为一种非法行为,一直受到了电力部门的严厉打击。虽然国家颁布了相关法律法规,但是窃电问题仍然存在,而且这个问题也越来越突出。在窃电手段上既有常规的窃电方法,如干扰电能计量装置使其少计、绕过电能计量装置用电或者乱接线用电。又有一些新的高科技窃电方法,如高频干扰窃电、大功率无线信号窃电。在面对电网智能化发展时,传统的窃电手段存在着一些不足,通过改变计量装置或乱接电线进行窃电,通过人工排查很容易发现窃电行为。但是随着科技的发展,窃电手段越来越多样化且隐蔽性更强,并向着高科技化方向发展,高科技化窃电手段通过人工排查很难发现,比如,大功率无线信号窃电就是对电表的CPU进行干扰,使电表少计或者不计,还可以随时恢复电表计量。这些高科技的窃电手段都比较的隐蔽而且不容易发觉,窃电操作时间短,这就给窃电侦查带来了很大的困难。而传统的窃电检测主要是靠人工进行排查,而且往往都是窃电行为产生很长时间之后才被发现,这需要很高的代价和大量的人力资源。随着数据挖掘、机器学习等技术的发展,一些智能检测方法出现了,对用户的历史数据进行分析,挖掘出用户潜在的窃电行为,建立用电异常判别模型或规则。通过异常用电检测,及时的发现异常行为,提前采取相关的措施将损失降到最低。
发明内容
针对上述问题,本发明提出一种用电特征指标降维与极限学习机算法的窃电检测方法。对用户用电历史数据分析,提取特征指标进行降维并结合局部离群因子、极限学习机算法对窃电行为进行检测,实验证明该模型对电力计量自动化系统中的窃电用户有很好的识别效果。
本发明采用了以下方案:一种用电特征指标降维与极限学习机算法的窃电检测方法按照下面步骤进行:
(1)从电力计量自动化系统中提取用户负荷数据集,用户负荷数据集包括N个用户F个月的数据,每天采集次数为t次,用户负荷数据集为X={xfn (T),n=1,2,...,N,f=1,2,...,F,T=1,2,...,t};
(2)对负荷数据进行清洗,剔除异常数据达到40%以上的用户,其中异常数据包括数据缺失和数据为负两部分,对保留的用户用电数据中出现异常的数据采用均值替换法替换异常值,为保证每个个体在分析过程中的地位相同,对数据进行极差归一化变换;
(3)对清洗后的负荷数据进行计算,得到负荷数据在相同时间点的负荷曲线平均值,进而得到典型日负荷曲线xn=(x1,x2,...,xt),(n=1,2,...,N);
(4)采用FCM算法对典型日负荷曲线进行分类,得到分类中心坐标矩阵,由中心坐标得出分类后的负荷特征曲线L=(l1,l2,...,lt);
(5)基于典型日负荷曲线和分类后的负荷特征曲线判断出用电异常用户,具体为基于两种曲线提取出若干特征变量,对特征变量做主成分分析提取前两个主成分;这些主成分能够反应原始变量的大部分信息,以前两个主成分为坐标轴将用户散射到二维平面上并利用局部离群因子算法得出用电异常用户;
(8)由得出的异常用户和部分正常用户作为样本集,随机选择正常用户,其数量相对于异常用户不要出现太少或者太多的情况即可。样本集随机分为训练样本和测试样本对极限学习机模型进行训练和测试;提取样本集的8类特征数据作为窃电判别指标,并用训练样本的8类特征数据对极限学习机模型进行训练,再利用训练后的极限学习机模型对测试样本对进行分类预测;
(9)根据极限学习机模型分类预测结果判断是否为窃电用户。
优选的,所述步骤(4)具体包括以下步骤:
采用VPC和VXB两种指标,根据综合指标结果得出聚类数,综合指标定义如下:
Figure BDA0001715532590000031
Figure BDA0001715532590000032
Figure BDA0001715532590000033
其中,WCI为综合指标,w1和w2分别为VPC和VXB对应的权重,具体的取值是根据实际情况来选择,VPC和VXB为指标结果;m为模糊权重指数,i∈[1,n],j∈[1,c],n为隶属度矩阵的列数即数据集用户数,c为隶属度矩阵的行数即类别数,vj为第j类的聚类中心,uij为个体xi属于第j类的模糊隶属度;
根据上述公式取得综合指标WCI最小时对应的聚类数,得出聚类数之后,采用FCM算法对用户的典型日负荷曲线进行聚类;
Figure BDA0001715532590000034
其中,s∈[1,c],vs是第s类的聚类中心,vj为第j类的聚类中心,
Figure BDA0001715532590000035
模糊聚类目标函数J为:
Figure BDA0001715532590000036
判断是否满足结束条件,满足则算法终止,否则继续计算模糊隶属度矩阵。
优选的,步骤5中的特征变量分别为:用户的典型日负荷曲线与得出的负荷特征曲线的欧氏距离和相关系数的综合结果,用户每两个月的典型负荷曲线之间的欧氏距离,负荷率r1,日峰谷差率r2,峰期负载率r3,平期负载率r4,谷期负载率r5,负荷上升指标和负荷下降指标,用户典型日负荷序列的标准差,前后时间点的平均差值。
用户的典型日负荷曲线与得出的负荷特征曲线的欧氏距离和相关系数的综合指标计算如下:
用户典型负荷曲线xn=(x1,x2,...,xt)和负荷特征曲线L=(l1,l2,...,lt)之间的欧式距离定义为:
Figure BDA0001715532590000041
变量xi与li的相关系数定义为:
Figure BDA0001715532590000042
对两者采用权重法进行综合,综合结果wcd=w3C+w4D,其中,wcd为两者的综合结果,w3和w4分别为C和D对应的权重。
负荷上升指标和负荷下降指标分别为:
Figure BDA0001715532590000043
比较用户的负荷时间序列与简单平均移动序列Mt各个时间点的相对大小,小于Ft的点记为a1,a2,...,ah1,大于Mt的点记为b1,b2,...,bh2
前后时间点的平均差值
Figure BDA0001715532590000044
此公式中计算的是典型负荷曲线前48个时间点与后48个时间点的平均差值。
利用局部离群因子算法得出用电异常用户的过程为:
首先计算对象p的k-距离(k-distance)对于任意的正整数k,对象p的k-距离,记为k-distance(p),定义为距离d(p,o)为p和对象o之间的距离:
至少存在k个对象o'∈D\{p},使得d(p,o')≤d(p,o);
至多存在k-1个对象o'∈D\{p},使得d(p,o')<d(p,o)。
计算对象p的k-距离邻域(Nk-distance)已知p的k-距离k-distance(p),p的k-距离邻域包含所有与p的距离不超过k-distance(p)的对象,即
Nk-distance(p)={q|d(p,q)≤k-distance(p)}
计算可达距离,给定自然数k,对象p与对象o的可达距离为
reach-distk(p,o)=max{k-distance(o),d(p,o)}
计算对象p局部可达密度
Figure BDA0001715532590000051
对象p的局部可达密度是对象p的MinPts邻域平均可达距离的倒数。
最后计算对象p的局部离群因子
Figure BDA0001715532590000052
局部离群因子表示异常程度,局部离群因子越大,则表示异常程度越高,即为用电异常用户。
优选地,步骤(8)得出的样本集选用以下8类特征数据信息作为模型输入,当出现窃电特征时,其计量数据也会出现一定的相关性变化;
1)额定电压偏离度。电压一般是保持平衡的,当发生窃电时,电压数据会发生变化波动,电压与额定电压的偏离程度,可以体现用电异常;
2)电压不平衡率。反映电压欠压现象,正常用电时三相电压是保持稳定的;
3)电流不平衡度。反映电流欠流现象,正常用电时三相电流是保持稳定的;
4)功率因数不平衡率。反应功率波动情况,正常用电功率因数不会发生大的变动;
5)用电量离散系数。正常用电时单位用电量标准差与电量平均值的绝对值之比应该在一定范围内保持稳定;
6)相位角。正常用电时相位角电压与相位角电流之间的夹角会在固定的范围;
7)线损率:线损率是电能在输送过程中的损耗的衡量标准。正常用电时线损率会在正常范围内。线损率=(线损电量/供电量)*100%;
8)合同容量比。当且窃电发生时,申请的容量与用户的月用电量之间的比值会超出固定范围;
当出现窃电特征时,其计量数据也会出现一定的相关性变化,用主成分分析降低数据维度,去除数据中的包含的重叠信息;
用电异常用户数据是按照4:1比例分配至训练样本与测试样本的数据;
对极限学习机隐含层神经元个数以及隐含层神经元的激活函数进行选取;
将训练样本的指标数据输入极限学习机模型对模型进行训练;
将测试样本数据带入训练后的模型对测试样本进行分类预测。
本发明的有益效果:
1、本发明对用户的负荷数据进行聚类,提出度量负荷曲线的特征变量,在分类的基础上对提取出的特征变量进行降维,利用局部离群因子筛选出用电异常用户,离群点检测与聚类计算能够互补,有很好的伸缩性。
2、本发明采用8个窃电判别指标并提取主成分,将用电异常用户提取主成分后的窃电判别指标数据作为训练样本输入模型,主成分分析降低数据维度,去除数据中的包含的重叠信息,满足极限学习机算法的训练样本具有较好的代表性这一要求提高算法效率。
附图说明
图1为本发明方法的流程示意图;
图2为WCI聚类数指标图;
图3为负荷曲线分类第一类用户图;
图4为负荷曲线分类第二类用户图;
图5为负荷曲线分类第三类用户图;
图6为第一类用户二维平面散点图;
图7为第一类用户离群点图;
图8为第一类用户离群点图;
图9为第一类用户离群点图;
图10为激活函数为sig隐含层神经元个数对ELM性能影响;
图11为激活函数为sin隐含层神经元个数对ELM性能影响;
图12为激活函数为hardlim隐含层神经元个数对ELM性能影响;
图13为PCA-ELM测试集预测结果图;
图14为ELM测试集预测结果图。
具体实施方式
为了使技术人员对本发明的流程、目的更加明白,下面结合附图和实施例对本发明做进一步说明。
实施例1:一种用电特征指标降维与极限学习机算法进行窃电检测的方法按照如图1所示的步骤以及发明内容中的方案进行:
对3100个用户3个月的用电数据,采样间隔为15分钟,一天采集96次;通过计算相同时间点的日负荷曲线的平均值可以得到该用户典型的日负荷曲线。采用WCI指标确定最佳聚类数,用户的典型日负荷曲线作为FCM算法的输入样本,对用户进行分类。本实施例中w1和w2均取0.5,在不同聚类数下WCI指标值如图2所示,由图2可以看出,在聚类数为3时,指标值最优,所以最佳聚类数为3。
如图3—图5所示,是采用FCM算法对用户的典型日负荷曲线进行分类,横坐标为时间点,纵坐标为归一化后负荷值。
计算特征变量,其中用户的典型日负荷曲线与得出的负荷特征曲线的欧氏距离和相关系数的综合指标中权重w3和w4均取0.5,
计算负荷的特性指标负荷率r1,日峰谷差率r2,峰期负载率r3,平期负载率r4,谷期负载率r5,其负荷特性指标如表1所示;
表1负荷特性指标
Figure BDA0001715532590000071
Figure BDA0001715532590000081
其中,P为负荷值,av均值、max最大值、min最小值,peak峰期、flp平期、val谷期
对计算出的特征变量进行主成分分析,以第一类用户为例(第二、三类皆按照同样方式处理),对其进行降维,提取出贡献率大的前两个主成分作为坐标轴,如表2所示,为主成分的积累贡献率。将用户以散点形式映射到二维坐标轴上,如图6所示。
表2主成分及其贡献率
Figure BDA0001715532590000082
通过计算AUC来确定局部离群因子算法中的k的取值,ROC曲线(ReceiverOperating Characteristic)用来评价一个二值分类器(binary classifier)的优劣,AUC(Area under the Curve of ROC)代表ROC曲线下方面积,值越大准确性越高。结果如表3所示。如图7—图9为经算法得到的用户异常点图,图中异常点用圆圈来标记。
表3不同类别下k值与AUC关系表
Figure BDA0001715532590000083
本实施例中采用的实验样本数据为某省3100个用户用电数据,经过用电异常检测得出的异常用户为71,经调查其中有58户存在窃电。为确保模型有足够的训练数据,从正常用户中选取229个用户数据加上得出的71个异常用户共300个用户作为样本数据。从电力计量系统中提取该300个用户的8个窃电指标数据,对数据做归一化处理。由于ELM算法要求训练样本有较好的代表性,为了降低ELM算法训练与分类的时间,对窃电指标做主成分分析可以减少数据信息的重叠提高效率。采用测试集与训练集分类预测正确率对模型进行评价。按照4:1比例分配训练样本与测试样本的数据,训练样本数225,测试样本数75。训练集选取窃电样本数为48,测试集窃电样本数为10。
采用8个指标数据做主成分分析降低数据维度,去除数据中的包含的重叠信息,如表4所示为其窃电指标主成分及其贡献率。
表4窃电指标主成分及其贡献率
Figure BDA0001715532590000091
由表4可见,前5个主成分方差占总方差的98.71%,主成分个数的选择是依据需求来选择,累积贡献率越高,替代后的准确性越高,同时要结合数据的维度来考虑。故原来的8项指标由前5列主成分代替。经主成分分析后窃电指标数据的系数如表5所示。
表5主成分系数表
-0.3536 0.103419 0.401083 -0.30019 -0.33073
0.469858 0.033013 0.083291 -0.12712 -0.46302
0.457801 0.047182 0.138419 -0.21419 -0.47903
0.269373 0.157388 0.530739 -0.48145 0.59734
-0.42485 0.075923 0.153394 -0.09264 -0.28394
0.418744 -0.05608 -0.27865 0.10485 0.095509
-0.00089 0.969948 -0.23433 0.052965 0.006554
0.127327 0.107285 0.612587 0.770503 -0.01274
7.ELM(Extreme Learning Machine,极限学习机)的连接权值与神经元阈值是随机产生且无需调整,只需确定隐含层神经元个数以及隐含层神经元的激活函数即可。激活函数的取值分别是sig、sin、hardlim,激活函数训练时间如表6所示。
表6激活函数训练时间对比表
Figure BDA0001715532590000092
Figure BDA0001715532590000101
从表6中可以看出激活函数取值为hardlim时,所用的时间是最少的,sig其次取值为sin所用时间最多。除了隐含层的激活函数,还需考虑隐含层神经元的个数,不同激活函数下隐含层神经元个数对ELM性能的影响如图10—图12所示。由图比较可知,在神经元个数为30和60时达到性能较好,结合运行时间、测试集和训练集的预测准确率,选取激活函数为sig,神经元个数为60。
采用上述的PCA(Principal Component Analysis,主成分分析)和ELM算法结合对数据进行分类预测,其中窃电用户标记为1,未窃电用户标记为2,训练集预测正确率为99.55%,测试集正确率为98.67%,采用ELM算法训练集正确率为99.10%,测试集正确率97.33%,实验结果如图13—图14所示。实验证明经过PCA处理的ELM相较于未经过PCA处理的ELM的预测精度更高,而该模型能够很好的识别出窃电用户,只需重点稽查被标示为窃电的用户,有助于提高稽查准确率节省时间、人力,减少挽回因窃电导致的经济损失。

Claims (4)

1.一种用电特征指标降维与极限学习机算法进行窃电检测的方法,其特征在于,包括以下步骤:
(1)从电力计量自动化系统中提取用户负荷数据集,用户负荷数据集包括N个用户F个月的数据,每天采集次数为t次,用户负荷数据集为X={xfn (T),n=1,2,...,N,f=1,2,...,F,T=1,2,...,t};
(2)对负荷数据进行清洗,剔除异常数据达到40%以上的用户,其中异常数据包括数据缺失和数据为负两部分,对保留的用户用电数据中出现异常的数据采用均值替换法替换异常值,再对数据进行极差归一化变换;
(3)对清洗后的负荷数据进行计算,得到负荷数据在相同时间点的负荷曲线平均值,进而得到典型日负荷曲线xn=(x1,x2,...,xt),(n=1,2,...,N);
(4)采用FCM算法对典型日负荷曲线进行分类,得到分类中心坐标矩阵,由中心坐标得出分类后的负荷特征曲线L=(l1,l2,...,lt);
(5)基于典型日负荷曲线和分类后的负荷特征曲线判断出用电异常用户,具体为基于两种曲线提取出若干特征变量,对特征变量做主成分分析提取前两个主成分;以前两个主成分为坐标轴将用户散射到二维平面上并利用局部离群因子算法得出用电异常用户;
所述步骤(5)中的特征变量分别为:用户的典型日负荷曲线与得出的负荷特征曲线的欧氏距离和相关系数的综合结果,用户每两个月的典型负荷曲线之间的欧氏距离,负荷率r1,日峰谷差率r2,峰期负载率r3,平期负载率r4,谷期负载率r5,负荷上升指标和负荷下降指标,用户典型日负荷序列的标准差,前后时间点的平均差值;
所述用户的典型日负荷曲线与得出的负荷特征曲线的欧氏距离和相关系数的综合指标计算如下:
用户典型负荷曲线xn=(x1,x2,...,xt)和负荷特征曲线L=(l1,l2,...,lt)之间的欧式距离定义为:
Figure FDA0003459815540000011
变量xi与li的相关系数定义为:
Figure FDA0003459815540000021
对两者采用权重法进行综合,综合结果wcd=w3C+w4D,其中,wcd为两者的综合结果,w3和w4分别为C和D对应的权重;
所述前后时间点的平均差值
Figure FDA0003459815540000022
(6)由得出的异常用户和部分正常用户作为样本集,分为训练样本和测试样本对极限学习机模型进行训练和测试;提取样本集的8类特征数据作为窃电判别指标,并用训练样本的8类特征数据对极限学习机模型进行训练,再利用训练后的极限学习机模型对测试样本对进行分类预测;
所述步骤(6)中的特征数据为额定电压偏离度、电压不平衡率、电流不平衡度、功率因数不平衡率、用电量离散系数、相位角、线损率和合同容量比;
(7)根据极限学习机模型分类预测结果判断是否为窃电用户。
2.根据权利要求1所述的用电特征指标降维与极限学习机算法进行窃电检测的方法,其特征在于,所述步骤(4)具体包括以下步骤:
采用VPC和VXB两种指标,根据综合指标结果得出聚类数,综合指标定义如下:
Figure FDA0003459815540000023
Figure FDA0003459815540000024
Figure FDA0003459815540000025
其中,WCI为综合指标,w1和w2分别为VPC和VXB对应的权重,VPC和VXB为指标结果;m为模糊权重指数,i∈[1,n],j∈[1,c],n为隶属度矩阵的列数即数据集用户数,c为隶属度矩阵的行数即类别数,vj为第j类的聚类中心,uij为个体xi属于第j类的模糊隶属度;
根据上述公式取得综合指标WCI最小时对应的聚类数,得出聚类数之后,采用FCM算法对用户的典型日负荷曲线进行聚类。
3.根据权利要求1所述的用电特征指标降维与极限学习机算法进行窃电检测的方法,其特征在于,所述负荷上升指标和负荷下降指标分别为:
Figure FDA0003459815540000031
比较用户的负荷时间序列与简单平均移动序列Mt各个时间点的相对大小,小于Ft的点记为a1,a2,...,ah1,大于Mt的点记为b1,b2,...,bh2
4.根据权利要求1所述的用电特征指标降维与极限学习机算法进行窃电检测的方法,其特征在于,所述步骤6中异常用户数据按照4:1比例分配至训练样本与测试样本中,对训练样本的8类特征数据要先进行主成分分析降低数据维度,去除数据中的包含的重叠信息。
CN201810711333.3A 2018-07-02 2018-07-02 一种用电特征指标降维与极限学习机算法进行窃电检测的方法 Active CN109146705B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810711333.3A CN109146705B (zh) 2018-07-02 2018-07-02 一种用电特征指标降维与极限学习机算法进行窃电检测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810711333.3A CN109146705B (zh) 2018-07-02 2018-07-02 一种用电特征指标降维与极限学习机算法进行窃电检测的方法

Publications (2)

Publication Number Publication Date
CN109146705A CN109146705A (zh) 2019-01-04
CN109146705B true CN109146705B (zh) 2022-04-12

Family

ID=64799649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810711333.3A Active CN109146705B (zh) 2018-07-02 2018-07-02 一种用电特征指标降维与极限学习机算法进行窃电检测的方法

Country Status (1)

Country Link
CN (1) CN109146705B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109740694A (zh) * 2019-01-24 2019-05-10 燕山大学 一种基于非监督学习的智能电网非技术性损失检测方法
CN109934456A (zh) * 2019-01-29 2019-06-25 中国电力科学研究院有限公司 一种用于对采集运维系统进行智能故障检测的方法及系统
CN110147871A (zh) * 2019-04-17 2019-08-20 中国电力科学研究院有限公司 一种基于som神经网络与k-均值聚类的窃电检测方法及系统
CN110083986A (zh) * 2019-05-21 2019-08-02 国网湖南省电力有限公司 再电气化能源消费装置反窃电模拟监测方法、系统、设备及介质
CN110298552B (zh) * 2019-05-31 2023-12-01 国网上海市电力公司 一种结合历史用电特征的配电网个体功率异常检测方法
CN110363384A (zh) * 2019-06-03 2019-10-22 杭州电子科技大学 基于深度加权神经网络的异常用电检测方法
CN110782007B (zh) * 2019-10-15 2023-04-07 中国航空无线电电子研究所 一种基于神经网络的飞行数据缺失补充方法
CN110739686B (zh) * 2019-10-15 2023-05-02 福建网能科技开发有限责任公司 一种基于总表异常分析的台区线损治理方法及系统
CN110956281A (zh) * 2019-10-29 2020-04-03 广东电网有限责任公司 一种基于Log分析的电力设备异常检测报警系统
CN110852384B (zh) * 2019-11-12 2023-06-27 武汉联影医疗科技有限公司 医学影像质量检测方法、装置和存储介质
CN110889441B (zh) * 2019-11-19 2023-07-25 海南电网有限责任公司海南输变电检修分公司 一种基于距离和点密度的变电设备数据异常识别方法
CN111080476A (zh) * 2019-12-06 2020-04-28 江苏瑞中数据股份有限公司 一种基于数据中台的用户窃电行为分析预警方法
CN111126820B (zh) * 2019-12-17 2023-08-29 国网山东省电力公司营销服务中心(计量中心) 反窃电方法及系统
CN111738364B (zh) * 2020-08-05 2021-05-25 国网江西省电力有限公司供电服务管理中心 一种基于用户负荷与用电参量相结合的窃电检测方法
CN112307435B (zh) * 2020-10-30 2024-05-31 三峡大学 一种基于模糊聚类和趋势判断筛查用电量异常的方法
CN112649641B (zh) * 2020-12-14 2023-05-02 北京科东电力控制系统有限责任公司 一种基于窃电特征的窃电用户判断方法
CN112926645B (zh) * 2021-02-22 2022-11-15 国网四川省电力公司营销服务中心 一种基于边缘计算的窃电检测方法
CN112991093B (zh) * 2021-02-22 2024-02-02 国网四川省电力公司营销服务中心 一种基于边缘计算的窃电检测方法及系统
CN113379322A (zh) * 2021-07-06 2021-09-10 国网江苏省电力有限公司营销服务中心 一种基于标签增广的窃电用户判别方法
CN113591613A (zh) * 2021-07-13 2021-11-02 广东电网有限责任公司 窃电行为识别方法、系统、终端设备及存储介质
CN113691130A (zh) * 2021-08-11 2021-11-23 深圳市浩博特电子有限公司 一种前后沿切相自动切换调压开关电路
CN113933556B (zh) * 2021-12-17 2022-04-08 广东电网有限责任公司东莞供电局 一种窃电行为的检测方法、装置、计算机设备和存储介质
CN114638555B (zh) * 2022-05-18 2022-09-16 国网江西综合能源服务有限公司 基于多层正则化极限学习机的用电行为检测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942453A (zh) * 2014-05-07 2014-07-23 华北电力大学 一种针对非技术性损失的智能用电异常检测方法
CN106373025A (zh) * 2016-08-22 2017-02-01 重庆邮电大学 基于离群点检测的用电信息采集系统实时防窃电监测方法
CN106645934A (zh) * 2016-12-12 2017-05-10 国网北京市电力公司 基于动态网格离群点的用电行为反窃电诊断方法和装置
CN106650797A (zh) * 2016-12-07 2017-05-10 广东电网有限责任公司江门供电局 一种基于集成elm的配电网窃电嫌疑用户智能识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942453A (zh) * 2014-05-07 2014-07-23 华北电力大学 一种针对非技术性损失的智能用电异常检测方法
CN106373025A (zh) * 2016-08-22 2017-02-01 重庆邮电大学 基于离群点检测的用电信息采集系统实时防窃电监测方法
CN106650797A (zh) * 2016-12-07 2017-05-10 广东电网有限责任公司江门供电局 一种基于集成elm的配电网窃电嫌疑用户智能识别方法
CN106645934A (zh) * 2016-12-12 2017-05-10 国网北京市电力公司 基于动态网格离群点的用电行为反窃电诊断方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ELM算法在用户用电行为分析中的应用;胡殿刚;《计算机系统应用》;20161231;第25卷(第8期);第155-161页 *
基于无监督学习的电力用户异常用电模式检测;庄池杰;《中国电机工程学报》;20160120;第36卷(第2期);第379-387页 *
基于隶属比的聚类有效性指标;时念云;《计算机系统应用》;20161231;第25卷(第8期);第109-114页 *
基于高斯核函数改进的电力用户用电数据离群点检测方法;孙毅;《电网技术》;20180531;第42卷(第5期);第1596-1604页 *

Also Published As

Publication number Publication date
CN109146705A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
CN109146705B (zh) 一种用电特征指标降维与极限学习机算法进行窃电检测的方法
CN110634080B (zh) 异常用电检测方法、装置、设备及计算机可读存储介质
CN105512799B (zh) 一种基于海量在线历史数据的电力系统暂态稳定评估方法
JP2019023937A5 (zh)
CN110991786A (zh) 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法
CN104809658B (zh) 一种低压配网台区线损的快速分析方法
CN114723704B (zh) 一种基于图像处理的纺织品质量评估方法
CN110674120B (zh) 一种风电场数据清洗方法及装置
CN113033598A (zh) 一种基于曲线相似度和集成学习算法的窃电识别方法
CN110738232A (zh) 一种基于数据挖掘技术的电网电压越限成因诊断方法
Gu et al. Partial discharge pattern recognition of power cable joints using extension method with fractal feature enhancement
CN109947815B (zh) 一种基于离群点算法的窃电辨识方法
CN111553444A (zh) 一种基于非侵入负荷终端数据的负荷辨识方法
CN108805213A (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN108333468A (zh) 一种有源配电网下不良数据的识别方法及装置
CN110995153A (zh) 一种光伏电站的异常数据检测方法、装置及电子设备
CN111539657A (zh) 结合用户日用电量曲线的典型用电行业负荷特性分类与综合方法
CN116796271A (zh) 一种居民用能异常识别方法
CN108090635B (zh) 一种基于聚类分类的路用性能预测方法
CN114266457A (zh) 一种配电线路异损诱因检测的方法
CN107274025B (zh) 一种实现用电模式智能识别与管理的系统和方法
CN113298148B (zh) 一种面向生态环境评价的不平衡数据重采样方法
CN114912356A (zh) 冲击性负荷的分段概率谐波模型构建方法
Tang et al. Typical power load profiles shape clustering analysis based on adaptive piecewise aggregate approximation
CN109447490B (zh) 一种基于用户地址的户变关系异常判别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant