CN110363384A - 基于深度加权神经网络的异常用电检测方法 - Google Patents
基于深度加权神经网络的异常用电检测方法 Download PDFInfo
- Publication number
- CN110363384A CN110363384A CN201910477053.5A CN201910477053A CN110363384A CN 110363384 A CN110363384 A CN 110363384A CN 201910477053 A CN201910477053 A CN 201910477053A CN 110363384 A CN110363384 A CN 110363384A
- Authority
- CN
- China
- Prior art keywords
- electricity
- exception
- ecf
- sample
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 32
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 8
- 230000005611 electricity Effects 0.000 claims abstract description 124
- 238000000605 extraction Methods 0.000 claims abstract description 37
- 230000002159 abnormal effect Effects 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims description 26
- 238000012360 testing method Methods 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000010354 integration Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000010248 power generation Methods 0.000 claims description 5
- 101150062794 FH10 gene Proteins 0.000 claims description 4
- 101150013681 FH11 gene Proteins 0.000 claims description 4
- 101150081594 FH14 gene Proteins 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims 1
- 230000005856 abnormality Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度加权神经网络的异常用电检测方法。本发明包括如下步骤:步骤1、数据预处理;步骤2、对预处理后的数据进行特征提取,形成特征库;步骤3、依据提取出的特征库,用DWELM算法构建异常电量的检测模型。本发明采用的DWELM算法由EH‑DrELM和改进的AdaBoost‑ID两种算法结合而成大大提高了少数样本的识别率,证明了算法的有效性。其中,EH‑DrELM比原始的ELM更好提高了表示能力,而且改进的AdaBoost‑ID解决了原始AdaBoost算法中不适用于不平衡的多类数据问题,更适用于数据类别极度不均衡的异常用电量的检测。
Description
技术领域
本发明属于机器学习和电网营销数据挖掘领域,涉及一种基于深度加权随机神经网络不均衡数据分类的异常用电量智能检测方法。
背景技术
频繁的异常电力消耗,不仅使电力企业遭受严重的经济损失,同时还会威胁到人们的生命安全。美国智能咨询和服务公司2017年发布的针对50多个发展中国家的用电异常调查报告显示,大多数国家电力企业遭遇了异常电力消耗所带来的严重的非技术损失,每年经济损失高达64.7亿美元;2013至2016年的非技术性损失年均增长率约为11%。因此,智能高效的异常用电检测对电网管理部门至关重要。目前,我国电力企业的异常用电检测都是采用人工排查或用电数据库规则推断的方法,往往存在适用性不高、准确率和效率较低等问题。随着智能电网的蓬勃发展以及用电数据急剧增加,复杂的数据结构和海量的数据流使得传统的用电异常检测算法已不再适用。因此,研究基于人工智能的智能高效用电异常检测算法是智慧用电管理与电力营销的重要保障。
根据国家电网浙江电力公司数据统计,目前最具有代表性的用电异常种类高达几十种,但相对于庞大的正常用电数据,异常用电数据总量的比例相对较小,不超过0.3%。使得异常用电检测的建模面临的是一个典型的不均衡数据集学习问题。
一方面,传统基于均衡数据集的智能建模算法并不适用于异常用电检测,虽然传统的智能算法在不均衡数据集上仍然能保证很高的识别率,但少数样本类(minorityclass)的识别率却很低,而少数样本类往往又是不均衡数据集处理中最重要的信息;另一方面,传统浅层不均衡集处理算法在处理大规模用电数据时,往往面临着表征能力不够、时效性差等缺点。因此,如何构建高效的表征能力强泛化性能好又同时适用于不均衡用电大数据的异常用电检测模型成为一个亟待解决的问题。
针对这个问题,本发明以国网浙江电力公司营销部用电大数据为应用背景,提出基于深度不均衡随机神经网络超限学习机(DWELM)算法的异常用电检测模型,重点分析10种典型的用电异常类别检测问题,提出能够描述传统基于规则推理判别方法的用电异常数据特征表示方法。详细的发明内容如下:
发明内容
本发明针对传统异常电量消耗检测方法的不足,提出了一种更适用于不均衡数据集的基于深度加权神经网络的异常用电量检测方法。本专利以10种出现频率较高用电异常检测为例,但实际算法并不局限于10种,易于扩展。这些典型用电异常包括:1)上期电量为0且本期电量大于设定值,该异常在电力系统标示为FH04;2)总峰谷电量异常,该异常在电力系统标示为FH06;3)电量值超过合同最大电量两倍,该异常在电力系统标示为FH08;4)低压居民电量异常波动,该异常在电力系统标示为FH09;5)低压非居民电量异常波动,该异常在电力系统标示为FH10;6)高压电量异常波动,该异常在电力系统标示为FH11;7)无功异常,该异常在电力系统标示为FH14;8)光伏电量异常,该异常在电力系统标示为FH22;9)光伏电量异常波动,该异常在电力系统标示为FH24;10)环比电量异常波动,该异常在电力系统标示为FH28。为方便说明,本专利选取来自杭州余杭区部分用户近两年历史用电数据为例。
本发明的技术方案主要包括如下步骤:
步骤1、数据预处理;
步骤2、对预处理后的数据进行特征提取,形成特征库;
步骤3、依据提取出的特征库,用DWELM算法构建异常电量的检测模型。
所述步骤1的数据预处理主要包括对相关用电数据的整合和用户分类。具体实现包括以下几个步骤:
1-1.把分布在不同数据源的用户的户号、用电客户类型、年月、总电量、峰电量、谷电量、总止度、尖止度、峰止度、谷止度、合同容量、有功抄表电量、无功抄表电量、光伏用户发电表电量、上网表电量及对应电量异常标签收集、整理、清洗,转换加载到一个新的数据源,同时剔除重复数据,形成新数据;
1-2.对整合后新数据按照用电客户类型划分成高压、低压居民、低压非居民和光伏用户这4种类别。
所述的步骤2对预处理后的用电数据进行特征提取;
2-1、首先把上月电量、本月电量、去年同期电量、尖电量、峰电量、谷电量、总电量、总止度、尖止度、峰止度、谷止度、合同容量、有功抄表电量、无功抄表电量、执行力调、光伏用户发电表电量和上网表电量分别记为xp、xc、xs、xse、xpe、xve、xte、xtd、xsd、xpd、xvd、xcc、xa、xr、xd、xg和xn,因此可得到电量同比(ECFL)和环比(ECFP)的计算公式为:
2-2.对上述4种用电客户类型一共进行了25维特征提取,分别记为f1、f2,…,f25。由于不同用电客户类型具有的电量异常种类不同,因此具有维度信息不完全一致,具体如下所述:
对于低压居民,只有f1~f5、f12和f14~f23,其中,f1=xp,f2=xc-200,f3=xc-100,f4=ECFL,f5=ECFP,f12=xs,f14=xt-xsd-xpd-xvd,f15=xse+xpe+xve,f16=xte,f17=xpe,f18=xve,f19=xse,f20=xcc*24*30*2,f21=xa,f22=xr,其余特征维度向量设置为0;
对于低压非居民,只有f1、f2、f6~f8、f12和f14~f23,其中,f6=xc-10000,f7~f8在低压非居民类别内的计算方法分别与f4~f5相同,其余特征维度向量设置为0;
对于高压居民,只有f1、f2、f9~f12、和f14~f23,其中,f9~f11在高压居民类别内的计算方法和f6、f4~f5一样,其余特征维度向量设置为0;
对于光伏用户,只有f13、f24~f25,其中f13=ECFP,f24=xg和f25=xn,其余特征维度向量设置为0;
所述步骤2中需要注意如下:
本专利中这10种电量异常具体审核规则为:
(1)异常FH04的审核规则为:xp=0&xc>200。
(2)异常FH06的审核规则为:(xt-xsd-xpd-xvd>2)|(xse+xpe+xve>xte)|(xte=xpe&xte>0)|(xte=xve&xte>0)|(xte=xse&xte>0)。
(3)异常FH08的审核规则为:xte>xcc*24*30*2。
(4)异常FH09的审核规则为:xc>100&|ECFL|>2&|ECFP|>2。
(5)异常FH14的审核规则为:(xd=1&xa=0&xr>0)(xd=1&xa≠0&xr=0)。
(6)异常FH10的审核规则为:xc>1000&|ECFL|>0.5&|ECFP|>0.5。
(7)异常FH11的审核规则为:xc>1000&|ECFL|>0.5&|ECFP|>0.5。
(8)异常FH22的审核规则为:xg<xn|xg=0。
(9)异常FH24的审核规则为:|ECFP|>0.3。
(10)异常FH28的审核规则为:xc>100&|ECFP|>2&xs=0。
所述的步骤3将样本提取后的特征库,用DWELM算法构建异常电量的检测模型。
3-1.采用已标定正常与异常用电数据类别的数据,构建分类模型。
3-2.输入训练样本{(xi,ti)|xi∈Rd,ti∈R,i=1,2,...,N},初始化训练样本的权重Dk(xi),令D1=diag(D1(x1),...,D1(xN))。其中,xi表示第i个样本,ti是对应的样本标签,N为总的训练样本数量,M为类别数量,r(ti)是属于ti类的样本数。
3-3.在k个特征提取块中对训练样本依次进行k次迭代,进行样本2次特征提取。在第k次迭代中,随机产生输入权重和偏置b(k)。
3-4.依次计算隐含层输出矩阵H(k)、输出权重β(k)、预测函数Ωk(x)以及属于第j类的样本权重
其中,σ(.)是非线性映射函数
3-5.更新样本权重Dk+1(xi)。
3-6.计算样本的决策权重ak。
其中,εk为第k个分类器的加权误差率:
3-7.随机生成投影权重矩阵且所有元素服从正态分布,并计算下一个特征提取块的输入X(k+1)。
3-8.分别调整网络结构参数,包括特征提取构建块数量k、隐含层节点数Lk、正则化参数Ck和随机位移步长γ,使得在保证训练时间与训练收敛的均衡性下达到最高的识别率。
3-9.经过3-2至3-8步骤的训练后,得到训练好的异常电量检测模型。
3-10.把测试样本集x投入训练好模型中,通过k次迭代对测试样本进行2次特征提取,依次计算每一次迭代中第k个特征提取块的输出o(k)和下一个特征提取块的输入X(k+1)。
o(k)=Ωk(x(k))
3-11.计算DWELM中第K个WELM分类器的输出o(K)。
o(K)=ΩK(x(K))
3-12.计算最后的测试异常类别输出o(x)。
本发明有益效果如下:
本发明的正常实验数据比例约为87%左右,而其他10种异常电量数据中每一种所占的比例几乎都低于2%,甚至有的部分异常不足于1%,明显属于一种典型的数据极不均衡问题。传统的基于均衡集分类算法或浅层的不均衡集处理算法在这种大规模的极不均衡数据的分类问题下,表征能力和泛化能力差,导致少数样本的识别率很低。而本发明采用的DWELM算法由EH-DrELM和改进的AdaBoost-ID两种算法结合而成,很好的解决了上述问题,而且大大提高了少数样本的识别率,证明了算法的有效性。其中,EH-DrELM比原始的ELM更好提高了表示能力(即提取特征或有用信息的能力),而且改进的AdaBoost-ID解决了原始AdaBoost算法中不适用于不平衡的多类数据问题,更适用于数据类别极度不均衡的异常用电量的检测。
DWELM算法中包含多个级联的特征提取块,能够在原来特征提取的基础上,更好的进一步提取样本的2次特征,有利于提高样本分类检测精度。同时,DWELM学习速度比传统人工神经网络更快且泛化性能更好,可以很快地实现模型的训练和测试。
本发明结合用电客户类别和电量异常审核规则来进行特征抽取,可以把源数据具有强烈的时间序列特点变成具有无序列特点,使得在后面的电量异常检测分类算法的选择上更加具有普适性。
附图说明
图1为发明流程示意图;
图2为本发明DWELM算法中EH-DrELM的基本结构。
具体实施方式
下面结合附图和具体实施方式对本发明作详细说明。
如图1所示,首先对用电数据进行预处理,对预处理后的数据进行特征提取,然后把特征提取后的训练集用DWELM算法进行用电异常检测建模,得到异常检测模型。最后把测试集投入到训练好的模型中进行特征提取和测试,得到电量异常的测试结果。
图2显示了DWELM算法中EH-DrELM的基本结构,由k个级联的特征提取块和一个分类器组成。k个级联的特征提取块可以在样本进行1次特征提取的基础上,对样本进行2次特征提取。
几类常见的典型电量异常检测方法的实现步骤,在发明内容内已有详细的介绍,即本发明的技术方案主要包括如下步骤:
1、数据预处理;
2、对预处理后的数据进行特征提取。
3、依据提取出的特征库,用DWELM算法构建异常电量的检测模型。
所述步骤1的数据预处理主要包括对相关用电数据的整合和用户分类。具体实现包括以下几个步骤:
1-1.把分布在不同数据源的用户的户号、用电客户类型、年月、总电量、峰电量、谷电量、总止度、尖止度、峰止度、谷止度、合同容量、有功抄表电量、无功抄表电量、光伏用户发电表电量、上网表电量及对应电量异常标签收集、整理、清洗,转换加载到一个新的数据源,同时剔除重复数据。
1-2.对整合后新数据按照用电客户类型划分成高压、低压居民、低压非居民和光伏用户这4种类别。
所述的步骤2对预处理后的用电数据进行特征提取;
2-1、首先把上月电量、本月电量、去年同期电量、尖电量、峰电量、谷电量、总电量、总止度、尖止度、峰止度、谷止度、合同容量、有功抄表电量、无功抄表电量、执行力调、光伏用户发电表电量和上网表电量分别记为xp、xc、xs、xse、xpe、xve、xte、xtd、xsd、xpd、xvd、xcc、xa、xr、xd、xg和xn,因此可得到电量同比(ECFL)和环比(ECFP)的计算公式为:
2-2.对上述4种用电客户类型一共进行了25维特征提取,分别记为f1、f2,…,f25。由于不同用电客户类型具有的电量异常种类不同,因此具有维度信息不完全一致。如下所述:
2-3.对于低压居民,只有f1~f5、f12和f14~f23,其中,f1=xp,f2=xc-200,f3=xc-100,f4=ECFL,f5=ECFP,f12=xs,f14=xt-xsd-xpd-xvd,f15=xse+xpe+xve,f16=xte,f17=xpe,f18=xve,f19=xse,f20=xcc*24*30*2,f21=xa,f22=xr,其余特征维度向量设置为0;
2-4.对于低压非居民,只有f1、f2、f6~f8、f12和f14~f23,其中,f6=xc-10000,f7~f8在低压非居民类别内的计算方法分别与f4~f5相同,其余特征维度向量设置为0;
2-5.对于高压居民,只有f1、f2、f9~f12、和f14~f23,其中,f9~f11在高压居民类别内的计算方法和f6、f4~f5一样,其余特征维度向量设置为0;
2-6.对于光伏用户,只有f13、f24~f25,其中f13=ECFP,f24=xg和f25=xn,其余特征维度向量设置为0;
所述的步骤3将样本提取后的特征库,用DWELM算法构建异常电量的检测模型。
3-1.采用已标定正常与异常用电数据类别的数据,构建分类模型。
3-2.输入训练样本{(xi,ti)|xi∈Rd,ti∈R,i=1,2,...,N},初始化训练样本的权重Dk(xi),令D1=diag(D1(x1),...,D1(xN))。其中,xi表示第i个样本,ti是对应的样本标签,N为总的训练样本数量,M为类别数量,r(ti)是属于ti类的样本数。
3-3.在k个特征提取块中对训练样本依次进行k次迭代,进行样本2次特征提取。在第k次迭代中,随机产生输入权重和偏置b(k)。
3-4.依次计算隐含层输出矩阵H(k)、输出权重β(k)、预测函数Ωk(x)以及属于第j类的样本权重
其中,σ(.)是非线性映射函数
3-5.更新样本权重Dk+1(xi)。
3-6.计算样本的决策权重ak。
其中,εk为第k个分类器的加权误差率:
3-7.随机生成投影权重矩阵且所有元素服从正态分布,并计算下一个特征提取块的输入X(k+1)。
3-8.分别调整网络结构参数,包括特征提取构建块数量k、隐含层节点数Lk、正则化参数Ck和随机位移步长γ,使得在保证训练时间与训练收敛的均衡性下达到最高的识别率。
3-9.经过3-2至3-8步骤的训练后,得到训练好的异常电量检测模型。
3-10.把测试样本集x投入训练好模型中,通过k次迭代对测试样本进行2次特征提取,依次计算每一次迭代中第k个特征提取块的输出o(k)和下一个特征提取块的输入X(k+1)。
o(k)=Ωk(x(k))
3-11.计算DWELM中第K个WELM分类器的输出o(K)。
o(K)=ΩK(x(K))
3-12.计算最后的测试异常类别输出o(x)。
为验证本发明专利的有效性,采用国网浙江电力公司营销部杭州市某区两年的用电大数据做实验测试。数据库包含正常用电(normal)以及10种异常电量类别,数据库总体样本数量为101812,正常样本88271(86.7%),10中异常样本分别为1378(1.35%)、695(0.68%)、693(0.68%)、1042(1.02%)、3899(3.83%)、776(0.76%)、1738(1.71%)、1425(1.40%)、805(0.79%)和1090(1.08%)。传统的不均衡数据集加权超限学习机算法(WELM)与提示加权超限学习机算法(BWELM)作为对比方法,用于反映本发明DWELM算法的优越性。每一个类别的具体测试准确率如表1所示,其中黑体部分为最优识别率。显而易见,本发明专利的算法能保证更高的用电异常检测率,优于对比的传统方法。
表1基于WELM、BWELM和DWELM算法的每一种异常识别率对比(%)
Normal | FH10 | FH09 | FH04 | FH11 | FH24 | FH28 | FH06 | FH08 | FH14 | FH22 | |
WELM | 69.58 | 98.46 | 98.79 | 97.48 | 98.03 | 100 | 96 | 100 | 90.28 | 100 | 98.52 |
BWELM | 81.9 | 98.88 | 100 | 96.2 | 99.62 | 100 | 99.51 | 100 | 94.84 | 97.52 | 100 |
本发明算法 | 89.15 | 100 | 100 | 100 | 100 | 100 | 99.54 | 100 | 99.09 | 100 | 100 |
Claims (3)
1.基于深度加权神经网络的异常用电检测方法,其特征在于包括如下步骤:
步骤1、数据预处理;
步骤2、对预处理后的数据进行特征提取,形成特征库;
步骤3、依据提取出的特征库,用DWELM算法构建异常电量的检测模型;
所述步骤1的数据预处理主要包括对相关用电数据的整合和用户分类;具体实现包括以下几个步骤:
1-1.把分布在不同数据源的用户的户号、用电客户类型、年月、总电量、峰电量、谷电量、总止度、尖止度、峰止度、谷止度、合同容量、有功抄表电量、无功抄表电量、光伏用户发电表电量、上网表电量及对应电量异常标签收集、整理、清洗,转换加载到一个新的数据源,同时剔除重复数据,形成新数据;
1-2.对整合后新数据按照用电客户类型划分成高压、低压居民、低压非居民和光伏用户这4种类别;
所述的步骤2对预处理后的用电数据进行特征提取;
2-1、首先把上月电量、本月电量、去年同期电量、尖电量、峰电量、谷电量、总电量、总止度、尖止度、峰止度、谷止度、合同容量、有功抄表电量、无功抄表电量、执行力调、光伏用户发电表电量和上网表电量分别记为xp、xc、xs、xse、xpe、xve、xte、xtd、xsd、xpd、xvd、xcc、xa、xr、xd、xg和xn,因此可得到电量同比(ECFL)和环比(ECFP)的计算公式为:
2-2.对上述4种用电客户类型一共进行了25维特征提取,分别记为f1、f2,…,f25;由于不同用电客户类型具有的电量异常种类不同,因此具有维度信息不完全一致,具体如下所述:
对于低压居民:只有f1~f5、f12和f14~f23,其中,f1=xp,f2=xc-200,f3=xc-100,f4=ECFL,f5=ECFP,f12=xs,f14=xt-xsd-xpd-xvd,f15=xse+xpe+xve,f16=xte,f17=xpe,f18=xve,f19=xse,f20=xcc*24*30*2,f21=xa,f22=xr,其余特征维度向量设置为0;
对于低压非居民:只有f1、f2、f6~f8、f12和f14~f23,其中,f6=xc-10000,f7~f8在低压非居民类别内的计算方法分别与f4~f5相同,其余特征维度向量设置为0;
对于高压居民:只有f1、f2、f9~f12、和f14~f23,其中,f9~f11在高压居民类别内的计算方法和f6、f4~f5一样,其余特征维度向量设置为0;
对于光伏用户:只有f13、f24~f25,其中f13=ECFP,f24=xg和f25=xn,其余特征维度向量设置为0。
2.根据权利要求1所述的基于深度加权神经网络的异常用电检测方法,其特征在于步骤2中的10种电量异常具体审核规则为:
(1)异常FH04的审核规则为:xp=0&xc>200;
(2)异常FH06的审核规则为:(xt-xsd-xpd-xvd>2)|(xse+xpe+xve>xte)|(xte=xpe&xte>0)|(xte=xve&xte>0)|(xte=xse&xte>0);
(3)异常FH08的审核规则为:xte>xcc*24*30*2;
(4)异常FH09的审核规则为:xc>100&|ECFL|>2&|ECFP|>2;
(5)异常FH14的审核规则为:(xd=1&xa=0&xr>0)|(xd=1&xa≠0&xr=0);
(6)异常FH10的审核规则为:xc>1000&|ECFL|>0.5&|ECFP|>0.5;
(7)异常FH11的审核规则为:xc>1000&|ECFL|>0.5&|ECFP|>0.5;
(8)异常FH22的审核规则为:xg<xn|xg=0;
(9)异常FH24的审核规则为:|ECFP|>0.3;
(10)异常FH28的审核规则为:xc>100&|ECFP|>2&xs=0。
3.根据权利要求2所述的基于深度加权神经网络的异常用电检测方法,其特征在于步骤3将样本提取后的特征库,用DWELM算法构建异常电量的检测模型,具体实现如下:
3-1.采用已标定正常与异常用电数据类别的数据,构建分类模型;
3-2.输入训练样本{(xi,ti|xi∈Rd,ti∈R,i=1,2,...,N},初始化训练样本的权重Dk(xi),令D1=diag(D1(x1),...,D1(xN));其中,xi表示第i个样本,ti是对应的样本标签,N为总的训练样本数量,M为类别数量,r(ti)是属于ti类的样本数;
3-3.在k个特征提取块中对训练样本依次进行k次迭代,进行样本2次特征提取;在第k次迭代中,随机产生输入权重和偏置b(k);
3-4.依次计算隐含层输出矩阵H(k)、输出权重β(k)、预测函数Ωk(x)以及属于第j类的样本权重
其中,σ(.)是非线性映射函数
3-5.更新样本权重Dk+1(xi);
3-6.计算样本的决策权重ak;
其中,εk为第k个分类器的加权误差率:
3-7.随机生成投影权重矩阵且所有元素服从正态分布,并计算下一个特征提取块的输入X(k+1);
3-8.分别调整网络结构参数,包括特征提取构建块数量k、隐含层节点数Lk、正则化参数Ck和随机位移步长γ,使得在保证训练时间与训练收敛的均衡性下达到最高的识别率;
3-9.经过步骤3-2至3-8的训练后,得到训练好的异常电量检测模型;
3-10.把测试样本集x投入训练好模型中,通过k次迭代对测试样本进行2次特征提取,依次计算每一次迭代中第k个特征提取块的输出o(k)和下一个特征提取块的输入X(k+1);
o(k)=Ωk(x(k))
3-11.计算DWELM中第K个WELM分类器的输出o(K);
o(K)=ΩK(x(K))
3-12.计算最后的测试异常类别输出o(x);
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910477053.5A CN110363384A (zh) | 2019-06-03 | 2019-06-03 | 基于深度加权神经网络的异常用电检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910477053.5A CN110363384A (zh) | 2019-06-03 | 2019-06-03 | 基于深度加权神经网络的异常用电检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110363384A true CN110363384A (zh) | 2019-10-22 |
Family
ID=68215143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910477053.5A Pending CN110363384A (zh) | 2019-06-03 | 2019-06-03 | 基于深度加权神经网络的异常用电检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110363384A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113011997A (zh) * | 2021-02-20 | 2021-06-22 | 上海电机学院 | 电网用户用电异常行为检测方法 |
CN113128612A (zh) * | 2021-04-26 | 2021-07-16 | 国网河北省电力有限公司营销服务中心 | 电力数据中异常值的处理方法及终端设备 |
CN114638555A (zh) * | 2022-05-18 | 2022-06-17 | 国网江西综合能源服务有限公司 | 基于多层正则化极限学习机的用电行为检测方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942453A (zh) * | 2014-05-07 | 2014-07-23 | 华北电力大学 | 一种针对非技术性损失的智能用电异常检测方法 |
CN106650797A (zh) * | 2016-12-07 | 2017-05-10 | 广东电网有限责任公司江门供电局 | 一种基于集成elm的配电网窃电嫌疑用户智能识别方法 |
CN106778841A (zh) * | 2016-11-30 | 2017-05-31 | 国网上海市电力公司 | 异常用电检测模型的建立方法 |
CN106779069A (zh) * | 2016-12-08 | 2017-05-31 | 国家电网公司 | 一种基于神经网络的异常用电检测方法 |
CN108985632A (zh) * | 2018-07-16 | 2018-12-11 | 国网上海市电力公司 | 一种基于孤立森林算法的用电数据异常检测模型 |
CN109146705A (zh) * | 2018-07-02 | 2019-01-04 | 昆明理工大学 | 一种用电特征指标降维与极限学习机算法进行窃电检测的方法 |
CN109377409A (zh) * | 2018-09-29 | 2019-02-22 | 重庆大学 | 一种基于bp神经网络的用户用电异常行为检测方法 |
CN109697453A (zh) * | 2018-09-30 | 2019-04-30 | 中科劲点(北京)科技有限公司 | 基于多模融合的半监督场景分类识别方法、系统及装置 |
-
2019
- 2019-06-03 CN CN201910477053.5A patent/CN110363384A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942453A (zh) * | 2014-05-07 | 2014-07-23 | 华北电力大学 | 一种针对非技术性损失的智能用电异常检测方法 |
CN106778841A (zh) * | 2016-11-30 | 2017-05-31 | 国网上海市电力公司 | 异常用电检测模型的建立方法 |
CN106650797A (zh) * | 2016-12-07 | 2017-05-10 | 广东电网有限责任公司江门供电局 | 一种基于集成elm的配电网窃电嫌疑用户智能识别方法 |
CN106779069A (zh) * | 2016-12-08 | 2017-05-31 | 国家电网公司 | 一种基于神经网络的异常用电检测方法 |
CN109146705A (zh) * | 2018-07-02 | 2019-01-04 | 昆明理工大学 | 一种用电特征指标降维与极限学习机算法进行窃电检测的方法 |
CN108985632A (zh) * | 2018-07-16 | 2018-12-11 | 国网上海市电力公司 | 一种基于孤立森林算法的用电数据异常检测模型 |
CN109377409A (zh) * | 2018-09-29 | 2019-02-22 | 重庆大学 | 一种基于bp神经网络的用户用电异常行为检测方法 |
CN109697453A (zh) * | 2018-09-30 | 2019-04-30 | 中科劲点(北京)科技有限公司 | 基于多模融合的半监督场景分类识别方法、系统及装置 |
Non-Patent Citations (1)
Title |
---|
WANG TIANLEI等: "Deep weighted extreme learning machine", 《COGNITIVE COMPUTATION》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113011997A (zh) * | 2021-02-20 | 2021-06-22 | 上海电机学院 | 电网用户用电异常行为检测方法 |
CN113128612A (zh) * | 2021-04-26 | 2021-07-16 | 国网河北省电力有限公司营销服务中心 | 电力数据中异常值的处理方法及终端设备 |
CN113128612B (zh) * | 2021-04-26 | 2022-11-29 | 国网河北省电力有限公司营销服务中心 | 电力数据中异常值的处理方法及终端设备 |
CN114638555A (zh) * | 2022-05-18 | 2022-06-17 | 国网江西综合能源服务有限公司 | 基于多层正则化极限学习机的用电行为检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106845717B (zh) | 一种基于多模型融合策略的能源效率评价方法 | |
CN111738462B (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN107862347A (zh) | 一种基于随机森林的窃电行为的发现方法 | |
Huang et al. | A clustering based grouping method of nearly zero energy buildings for performance improvements | |
CN106096805A (zh) | 一种基于熵权法特征选择的居民用电负荷分类方法 | |
CN104809658B (zh) | 一种低压配网台区线损的快速分析方法 | |
CN110363384A (zh) | 基于深度加权神经网络的异常用电检测方法 | |
CN110119755A (zh) | 基于Ensemble学习模型的电量异常检测方法 | |
Xiao et al. | Multistage decision support framework for sites selection of solar power plants with probabilistic linguistic information | |
CN106408008A (zh) | 一种基于负荷曲线距离和形状的负荷分类方法 | |
CN106845846A (zh) | 大数据资产评估方法 | |
CN110738232A (zh) | 一种基于数据挖掘技术的电网电压越限成因诊断方法 | |
CN111242161B (zh) | 一种基于智能学习的非侵入式非居民用户负荷辨识方法 | |
CN112149873A (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
CN110109971A (zh) | 一种低压台区用户用电负荷特性分析方法 | |
CN109376944A (zh) | 智能电表预测模型的构建方法及装置 | |
Liu et al. | A moving shape-based robust fuzzy K-modes clustering algorithm for electricity profiles | |
CN106777005A (zh) | 基于大数据技术改进聚类算法的用户用电行为分析方法 | |
CN109492022A (zh) | 基于语义的改进的k-means算法的搜索方法 | |
CN110244099A (zh) | 基于用户电压的窃电检测方法 | |
CN115659191A (zh) | 基于集成聚类和频繁项集树的光-荷典型场景集生成方法 | |
CN107248031A (zh) | 一种针对负荷曲线峰谷差的快速电力用户分类方法 | |
CN109146553A (zh) | 基于多密度聚类与多核svm的实时电价预测系统及其方法 | |
CN111798333A (zh) | 一种用能评估与用电安全分析方法和系统 | |
CN106022578A (zh) | 基于数据高维化和K-means聚类的居民用电峰谷平时段划分方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191022 |
|
RJ01 | Rejection of invention patent application after publication |