CN113988178A - 一种低压配电网窃电用户检测方法和装置 - Google Patents

一种低压配电网窃电用户检测方法和装置 Download PDF

Info

Publication number
CN113988178A
CN113988178A CN202111258989.2A CN202111258989A CN113988178A CN 113988178 A CN113988178 A CN 113988178A CN 202111258989 A CN202111258989 A CN 202111258989A CN 113988178 A CN113988178 A CN 113988178A
Authority
CN
China
Prior art keywords
user
data
detected
data set
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111258989.2A
Other languages
English (en)
Inventor
招景明
潘峰
杨雨瑶
宋强
李健
蔡永智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Measurement Center of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Measurement Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Measurement Center of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202111258989.2A priority Critical patent/CN113988178A/zh
Publication of CN113988178A publication Critical patent/CN113988178A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于编码器技术领域,公开了一种低压配电网窃电用户检测方法和装置,所述检测方法包括:获取待检测用户数据并对待检测用户数据进行预处理;对经过预处理的待检测用户数据进行特征提取,得到待检测用户特征数据集;将待检测用户特征数据集输入到预先训练好的Wide and Deep模型进行检测,得到窃电用户。有益效果:在获取待检测区域的待检测用户数据经过预处理和特征提取输入到预设的Wide and Deep模型可以高效准确的筛选出窃电用户,进而保证电网企业的经济利益。

Description

一种低压配电网窃电用户检测方法和装置
技术领域
本发明涉及编码器技术领域,特别是涉及一种低压配电网窃电用户检测方法和装置。
背景技术
在低压配电网的日常运行中,线损管理会对电网的负荷需求预测精度造成影响从而导致电网运行的安全事故。线损的主要构成有两个部分,分别为技术性线损和非技术性线损。非技术性线损指的电网输配电损失中剔除合理技术性线损后所剩余的无法计算得出的部分,而用户的违约用电行为特别是窃电就是造成非技术性线损的主要原因。
自2015年电改9号文发布以来,随着电力改革的持续进行,电网企业的经济效益受到了前所未有的冲击,在这样的背景下通过减少窃电行为来增加售电收入对电网公司来说已经成为了其迫切的需求。
因此,根据实际应用场景设计一套高效准确的窃电检测方法,是目前亟待解决的问题。
发明内容
本发明的目的是:根据实际应用场景提供一种低压配电网窃电用户检测方法和装置,高效准确的筛选出窃电用户,保证电网企业的经济效益。
为了实现上述目的,本发明提供了一种低压配电网窃电用户检测方法,包括:
获取待检测用户数据并对待检测用户数据进行预处理。
对经过预处理的待检测用户数据进行特征提取,得到待检测用户特征数据集。
将待检测用户特征数据集输入到预先训练好的Wide and Deep模型进行检测,得到窃电用户。
进一步的,所述对待检测用户数据进行预处理,具体为:
获取待检测区域的用户用电量数据,对极大异常值和空值进行数据修正。
进一步的,对经过预处理的待检测用户数据进行特征提取,得到待检测用户特征数据集,具体为:
将经过预处理的待检测用户数据输入堆栈降噪自编码器中进行数据处理,得到待检测用户特征数据集;其中,堆栈降噪自编码器包括由多个降噪自编码器堆叠而成,上一个降噪自编码器的输出为下一个降噪自编码器的输入,将最后一个降噪自编码器的输出作为待检测用户特征数据集。
进一步的,所述降噪自编码器的数据处理步骤包括:
将经过预处理的待检测用户数据记为数据集G,数据集G通过编码器的编码函数h变换为编码特征y,G与y的转换关系为:y=θ(G)=s(WG+b);其中,s是神经网络的激励函数,θ={W,b}为参数集合,W是参数权重,b是偏执值;
通过解码函数g计算得到数据集G的重构数据:
Figure BDA0003324404290000021
Figure BDA0003324404290000022
其中,
Figure BDA0003324404290000023
为重构数据集,W′为权重系数,b′为偏执系数,θ′={W′,b′}为解码函数g的参数集合。
进一步的,所述堆栈降噪自编码器的优化目标函数为:
Figure BDA0003324404290000024
参数θ和θ′以优化目标函数的值最小为目标进行优化,目标优化函数值最小时得到的y是获取了数据集G大部分特征的待检测用户特征数据集。
进一步的,降噪自编码器的优化目标函数为
Figure BDA0003324404290000031
其中,α为降噪维度重构代价权重,β为未降噪维度重构代价权重,G为原始输入,Gj为原始数据集G的第j个元素,n为原始数据集G的元素个数,z为重构数据集,其是通过在原始数据集G中随机选取若干元素置0,通过权利要求4所述的编码函数与解码函数计算得到的重构数据,zj为重构数据集的第j个元素。
进一步的,所述Wide and Deep模型的训练方法包括:
获取模型训练区域中带窃电标签的低压用户日用电量数据和正常用户日用电量数据;
对获取到的低压用户日用电量数据和正常用户日用电量数据中的极大异常值和空值进行数据修正,对日用电量零值数据不处理;
数据修正后得到窃电用户数据集和正常用户数据集;
将窃电用户数据集和正常用户数据集输入到堆栈降噪自编码器进行特征提取,得到第一训练特征集和第二训练特征集;
将第一训练特征集和第二训练特征集输入到Wide and Deep模型进行训练,得到可以用于窃电用户检测的模型。
进一步的,所述Wide and Deep模型具体为:
Wide模型为逻辑回归模型,Wide模型表达式为:y=wTx+b;
其中,y是预测值,x=[x1,x2,…,xd]是d个特征向量,w=[w1,w2,…,wd]为模型参数,b为预测偏差;
Deep模型为深度神经网络,包括输入层、隐含层和输出层。
进一步的,输入层的神经元获得信息后将信息输入到隐含层中;隐含层的神经元用于处理信息,应用Sigmoid作为激活函数;隐含层的输出形式为:f(W1X+b1),其中,f为Sigmoid函数,完整的深度神经网络为f(x)=f(b2+(S(b1+W1x)),b2、W2分别表示输入层至隐藏层的偏差、权重系数;b1、W1分别表示隐藏层至输出层的偏差、权重系数。
本发明还公开了一种窃电用户检测装置,包括:预处理模块、特征提取模块和检测模块。
所述预处理模块,用于获取待检测用户数据并对待检测用户数据进行预处理。
所述特征提取模块,用于对经过预处理的待检测用户数据进行特征提取,得到待检测用户特征数据集。
所述检测模块,用于将待检测用户特征数据集输入到预先训练好的Wide andDeep模型进行检测,得到窃电用户。
本发明实施例一种低压配电网窃电用户检测方法和装置与现有技术相比,其有益效果在于:在获取待检测区域的待检测用户数据经过预处理和特征提取输入到预设的Wideand Deep模型可以高效准确的筛选出窃电用户,进而保证电网企业的经济利益。
附图说明
图1是本发明一种低压配电网窃电用户检测方法的流程示意图;
图2是本发明一种窃电用户检测装置的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
因此众多的国内外学者开始探索研究基于数据驱动的窃电检测方法,主要通过寻找数据离群点的聚类方法和学习已有标签数据再进行检测的分类器两种技术路线实现窃电检测工作。聚类方法在实际应用中难以真正实现精确的识别,而对于分类方法而言目前主要存在的问题是没有同时实现对数据冷启动问题有较好拟合效果以及具备良好泛化能力的方法。同时,在特征工程中需要寻找到一种能适应数据高维特点来挖掘其深层特征且能解决过多极端数据的存在从而给模型拟合造成影响的问题。
去相关自编码器无法很好的适应窃电用户的存在大量0值等极端情况的数据特征,且在分类器上没有单一模型能同时兼顾高拟合能力和强泛化性能。
实施例1:
如图1所示,本发明公开了一种低压配电网窃电用户检测方法,应用于电网中窃电用户的检测,主要步骤包括:
步骤S1,获取待检测用户数据并对待检测用户数据进行预处理。
步骤S2,对经过预处理的待检测用户数据进行特征提取,得到待检测用户特征数据集;
步骤S3,将待检测用户特征数据集输入到预先训练好的Wide and Deep模型进行检测,得到窃电用户。
在步骤S1中,获取待检测用户数据并对待检测用户数据进行预处理。
在本实施例中,所述对待检测用户数据进行预处理,具体为:
获取待检测区域的用户用电量数据,对极大异常值和空值进行数据修正。
在本实施例中,由于许多窃电用户的明显特征是会出现大量日用电量零值,所以对于用电量为0的数据不处理,而对于极大异常值以及空值,采用传统的二次插值法进行数据修正工作。
在本实施例中,需要强调的是低压用户数据量大,目前所能获取的最小颗粒度数据为其日用电量数据,无法与专变用户一样通过电压电流等多维度数据进行窃电检测。
在现有技术中,基于数据驱动的窃电检测方法,主要通过寻找数据离群点的聚类方法和学习已有标签数据再进行检测的分类器两种技术路线实现窃电检测工作。聚类方法在实际应用中难以真正实现精确的识别,而对于分类方法而言目前主要存在的问题是没有同时实现对数据冷启动问题有较好拟合效果以及具备良好泛化能力的方法。同时,在特征工程中需要寻找到一种能适应数据高维特点来挖掘其深层特征且能解决过多极端数据的存在从而给模型拟合造成影响的问题。
在本实施例中,去相关自编码器无法很好的适应窃电用户的存在大量0值等极端情况的数据特征,且在分类器上没有单一模型能同时兼顾高拟合能力和强泛化性能。
在本实施例中,实际工程应用中由于低压用户数据维度高,若直接将数据输入分类器中会导致分类器无法学习到数据的深层特征。
因此在本发明中对待检测用户的数据提取方法进行了改进,具体参见步骤S2。
在步骤S2中,对经过预处理的待检测用户数据进行特征提取,得到待检测用户特征数据集,具体为:
将经过预处理的待检测用户数据输入堆栈降噪自编码器中进行数据处理,得到待检测用户特征数据集;其中,堆栈降噪自编码器包括由多个降噪自编码器堆叠而成,上一个降噪自编码器的输出为下一个降噪自编码器的输入,将最后一个降噪自编码器的输出作为待检测用户特征数据集。
在本实施中,对待检测用户数据进行特征提取和Wide and Deep模型训练过程中对带窃电标签的低压用户日用电量数据和正常用户日用电量数据进行特征提取的方法相同。
在本实施例中,所述降噪自编码器的数据处理步骤包括:
将经过预处理的待检测用户数据记为数据集G,数据集G通过编码器的编码函数h变换为编码特征y,G与y的转换关系为:y=hθ(G)=s(WG+b);其中,s是神经网络的激励函数,θ={W,b}为参数集合;W是参数权重,b是偏执值;
通过解码函数g计算得到数据集G的重构数据:
Figure BDA0003324404290000061
s(W′y+b′);其中,
Figure BDA0003324404290000062
为重构数据集,W′为权重系数,b′为偏执系数,θ′={W′,b′}为解码函数g的参数集合。
在本实施例中,原始数据集为G,编码函数为h,解码函数为g。G通过h函数得到编码特征y,再通过g函数得到重构数据集
Figure BDA0003324404290000063
因此,θ′={W′,b′}为解码函数g的参数集合,W′为权重系数,b′为偏执系数。
在本实施例中,编码特征y经过转换后得到的x为G的重构数据。
在本实施例中,此处使用的是Sigmoid函数作为激励函数。
在本实施例中,所述堆栈降噪自编码器的优化目标函数为:
Figure BDA0003324404290000071
参数θ和θ′以优化目标函数的值最小为目标进行优化,目标优化函数值最小时得到的y是获取了数据集G大部分特征的待检测用户特征数据集。
在本实施例中,降噪自编码器的优化目标函数为
Figure BDA0003324404290000072
Figure BDA0003324404290000073
其中,α为降噪维度重构代价权重,β为未降噪维度重构代价权重,G为原始输入,Gj为原始数据集G的第j个元素,n为原始数据集G的元素个数,z为重构数据集,其是通过在原始数据集G中随机选取若干元素置0,通过权利要求4所述的编码函数与解码函数计算得到的重构数据,zj为重构数据集的第j个元素。
在本实施中,目前的单一机器学习方法无法同时满足该问题所需要的高拟合能力和高泛化能力的需求。因此本发明的Wide and Deep模型结构采用逻辑回归模型与DNN模型联合训练的模式,整个模型的训练误差会同时反传播到两个模型中进行参数权重的调整以及布局比例的改变,利用两个模型互相之间的有点进行互补,wide模型专注于对稀疏特征的学习而deep模型则负责进行特征的映射来提高模型的泛化能力。
在本实施例中,所述Wide and Deep模型的训练方法包括:
获取模型训练区域中带窃电标签的低压用户日用电量数据和正常用户日用电量数据。
对获取到的低压用户日用电量数据和正常用户日用电量数据中的极大异常值和空值进行数据修正,对日用电量零值数据不处理。
数据修正后得到窃电用户数据集和正常用户数据集。
将窃电用户数据集和正常用户数据集输入到堆栈降噪自编码器进行特征提取,得到第一训练特征集和第二训练特征集。
将第一训练特征集和第二训练特征集输入到Wide and Deep模型进行训练,得到可以用于窃电用户检测的模型。
在本实施例中,所述Wide and Deep模型具体为:
Wide模型为逻辑回归模型,Wide模型表达式为:y=wTx+b;
其中,y是预测值,x=[x1,x2,…,xd]是d个特征向量,w=[w1,w2,…,wd]为模型参数,b为预测偏差。
在本实施例中,T为矩阵转置。
在本实施例中,特征集包括原始输入特征和叉乘特征,叉乘特征的表达式为:cki∈{0,1};其中是一个0/1的布尔变量,如果第i个特征是第k次变换Φk的一部分,则为1,否则为0。它在捕捉了二元特征之间的相互作用的同时给广义线性模型增加了非线性。
Deep模型为深度神经网络,包括输入层、隐含层和输出层。
在本实施中,隐含层的个数可以根据实际需求进行选择,本发明为了更好的适应数据的高维特征将隐层个数设置为50。
在本实施例中,输入层的神经元获得信息后将信息输入到隐含层中;隐含层的神经元用于处理信息,应用Sigmoid作为激活函数;隐含层的输出形式为:f(W1X+b1),其中,f为Sigmoid函数,完整的深度神经网络为f(x)=f(b2+(S(b1+W1x)),b2、W2分别表示输入层至隐藏层的偏差、权重系数;b1、W1分别表示隐藏层至输出层的偏差、权重系数。
在本实施例中,完整的深度神经网络包括输入层、隐藏层与输出层三层。输入层输入样本为X,输入层至隐藏层的映射关系为f(W1X+b1),即输入样本经过隐藏层后输出f(W1X+b1)。由于f为Sigmoid函数,所以隐藏层输出也表示为S(W1X+b1)。隐藏层至输出层在数学上是一个softmax逻辑回归过程,函数表示为f(W2X'+b2),其中,b2、W2分别表示输入层至隐藏层的偏差、权重系数;X'表示输出层的输入,即隐藏层的输出。根据上述分析,将输入层、隐藏层、输出层三层的函数关系合并,可得完整的深度神经网络为f(x)=f(b2+(S(b1+W1x))。b1、W1分别表示隐藏层至输出层的偏差、权重系数。
在本实施例中,在Deep模型中引入Batch Normalization解决梯度消失问题,将每个隐含层神经元输入值从非标准正态分布转化为均值为0方差为1的正态分布使得梯度增大,其计算公式为:
Figure BDA0003324404290000091
其中,x为输入向量,
Figure BDA0003324404290000092
是x(k)经过BN变换后的结果。
在本实施例中,在Deep模型中引入Dropout解决过拟合问题,通过在每一次训练过程中将一半的隐层节点值设置为0,简化网络结构减弱隐层节点间的共适应关系,避免模型在前向传播时过于依赖某些局部特征从而得到更强的泛化能力。
在步骤S3中,将待检测用户特征数据集输入到预先训练好的Wide and Deep模型进行检测,得到窃电用户。
在本实施中,预先根据窃电用户和正常用户训练后得到的检测模型可以对待检测地区的待检测用户数据进行快速准确的分析筛选,得到窃电用户。电网企业在根据筛选得到的窃电用户进一步的进行有针对的性的筛查,可以大幅减少筛查窃电用户的工作量,有效保障电网企业的经济效益。
实施例2:
参照图2本发明公开了一种窃电用户检测装置,包括:预处理模块101、特征提取模块102和检测模块103。
所述预处理模块101,用于获取待检测用户数据并对待检测用户数据进行预处理;
所述特征提取模块102,用于对经过预处理的待检测用户数据进行特征提取,得到待检测用户特征数据集;
所述检测模块103,用于将待检测用户特征数据集输入到预先训练好的Wide andDeep模型进行检测,得到窃电用户。
在本发明中,实施例2是在实施例1的基础上进行撰写的,包括和实施1相同的技术特征,区别在于,实施例2以装置的角度对本发明的检测方法进行保护。实施例2和实施1相同的技术特征或限定不再赘述。
综上,本发明实施例一种低压配电网窃电用户检测方法和装置与现有技术相比,其有益效果在于:
(1)在获取待检测区域的待检测用户数据经过预处理和特征提取输入到预设的Wide and Deep模型可以高效准确的筛选出窃电用户,进而保证电网企业的经济利益。
(2)使用堆栈降噪自编码器对数据集进行特征提取工作,不仅可以很好的挖掘出数据本身的深层特征,同时可以更好地应对窃电用户数据中大量用电量为0等极端情况。
(3)采用Wide and Deep模型作为分类器,结合了逻辑回归拟合性强且面对冷启动问题较为有效;DNN模型表现力强泛化能力强能有效地应对窃电检测。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。

Claims (10)

1.一种低压配电网窃电用户检测方法,其特征在于,包括:
获取待检测用户数据并对待检测用户数据进行预处理;
对经过预处理的待检测用户数据进行特征提取,得到待检测用户特征数据集;
将待检测用户特征数据集输入到预先训练好的Wide and Deep模型进行检测,得到窃电用户。
2.根据权利要求1所述的一种低压配电网窃电用户检测方法,其特征在于,所述对待检测用户数据进行预处理,具体为:
获取待检测区域的用户用电量数据,对极大异常值和空值进行数据修正。
3.根据权利要求1所述的一种低压配电网窃电用户检测方法,其特征在于,对经过预处理的待检测用户数据进行特征提取,得到待检测用户特征数据集,具体为:
将经过预处理的待检测用户数据输入堆栈降噪自编码器中进行数据处理,得到待检测用户特征数据集;其中,堆栈降噪自编码器包括由多个降噪自编码器堆叠而成,上一个降噪自编码器的输出为下一个降噪自编码器的输入,将最后一个降噪自编码器的输出作为待检测用户特征数据集。
4.根据权利要求3所述的一种低压配电网窃电用户检测方法,其特征在于,所述堆栈降噪自编码器的数据处理步骤包括:
将经过预处理的待检测用户数据记为数据集G,数据集G通过编码器的编码函数h变换为编码特征y,G与y的转换关系为:y=θ(G)=s(WG+b);其中,s是神经网络的激励函数,θ={W,b}为参数集合;W是参数权重,b是偏执值;
通过解码函数g计算得到数据集G的重构数据:
Figure FDA0003324404280000011
Figure FDA0003324404280000021
其中,
Figure FDA0003324404280000022
为重构数据集,W′为权重系数,b′为偏执系数,θ′={W′,b′}为解码函数g的参数集合。
5.根据权利要求4所述的一种低压配电网窃电用户检测方法,其特征在于,所述堆栈降噪自编码器的优化目标函数为:
Figure FDA0003324404280000023
参数θ和θ′以优化目标函数的值最小为目标进行优化,目标优化函数值最小时得到的y是获取了数据集G大部分特征的待检测用户特征数据集。
6.根据权利要求4所述的一种低压配电网窃电用户检测方法,其特征在于,降噪自编码器的优化目标函数为
Figure FDA0003324404280000024
Figure FDA0003324404280000025
其中,α为降噪维度重构代价权重,β为未降噪维度重构代价权重,G为原始输入,Gj为原始数据集G的第j个元素,n为原始数据集G的元素个数,z为重构数据集,其是通过在原始数据集G中随机选取若干元素置0,通过权利要求4所述的编码函数与解码函数计算得到的重构数据,zj为重构数据集的第j个元素。
7.根据权利要求1所述的一种低压配电网窃电用户检测方法,其特征在于,所述Wideand Deep模型的训练方法包括:
获取模型训练区域中带窃电标签的低压用户日用电量数据和正常用户日用电量数据;
对获取到的低压用户日用电量数据和正常用户日用电量数据中的极大异常值和空值进行数据修正,对日用电量零值数据不处理;
数据修正后得到窃电用户数据集和正常用户数据集;
将窃电用户数据集和正常用户数据集输入到堆栈降噪自编码器进行特征提取,得到第一训练特征集和第二训练特征集;
将第一训练特征集和第二训练特征集输入到Wide and Deep模型进行训练,得到可以用于窃电用户检测的模型。
8.根据权利要求7所述的一种低压配电网窃电用户检测方法,其特征在于,所述Wideand Deep模型具体为:
Wide模型为逻辑回归模型,Wide模型表达式为:y=wTx+b:
其中,y是预测值,x=[x1,x2,...,xd]是d个特征向量,w=[w1,w2,...,wd]为模型参数,b为预测偏差;
Deep模型为深度神经网络,包括输入层、隐含层和输出层。
9.根据权利要求8所述的一种低压配电网窃电用户检测方法,其特征在于,输入层的神经元获得信息后将信息输入到隐含层中;隐含层的神经元用于处理信息,应用Sigmoid作为激活函数;隐含层的输出形式为:f(W1X+b1),其中,f为Sigmoid函数,完整的深度神经网络为f(x)=f(b2+(S(b1+W1x)),b2、W2分别表示输入层至隐藏层的偏差、权重系数;b1、W1分别表示隐藏层至输出层的偏差、权重系数。
10.一种窃电用户检测装置,其特征在于,包括:预处理模块、特征提取模块和检测模块;
所述预处理模块,用于获取待检测用户数据并对待检测用户数据进行预处理;
所述特征提取模块,用于对经过预处理的待检测用户数据进行特征提取,得到待检测用户特征数据集;
所述检测模块,用于将待检测用户特征数据集输入到预先训练好的Wide and Deep模型进行检测,得到窃电用户。
CN202111258989.2A 2021-10-27 2021-10-27 一种低压配电网窃电用户检测方法和装置 Pending CN113988178A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111258989.2A CN113988178A (zh) 2021-10-27 2021-10-27 一种低压配电网窃电用户检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111258989.2A CN113988178A (zh) 2021-10-27 2021-10-27 一种低压配电网窃电用户检测方法和装置

Publications (1)

Publication Number Publication Date
CN113988178A true CN113988178A (zh) 2022-01-28

Family

ID=79742973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111258989.2A Pending CN113988178A (zh) 2021-10-27 2021-10-27 一种低压配电网窃电用户检测方法和装置

Country Status (1)

Country Link
CN (1) CN113988178A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114881120A (zh) * 2022-04-19 2022-08-09 国网江苏省电力有限公司南通供电分公司 基于深度自编码器和聚类的台区户变关系识别方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114881120A (zh) * 2022-04-19 2022-08-09 国网江苏省电力有限公司南通供电分公司 基于深度自编码器和聚类的台区户变关系识别方法和系统
CN114881120B (zh) * 2022-04-19 2023-12-26 国网江苏省电力有限公司南通供电分公司 基于深度自编码器和聚类的台区户变关系识别方法和系统

Similar Documents

Publication Publication Date Title
JP6718994B2 (ja) データの量子処理のためのシステムおよび方法
CN109934295B (zh) 一种基于超限隐特征学习模型的图像分类与重建方法
CN113468291B (zh) 基于专利网络表示学习的专利自动分类方法
CN112732921B (zh) 一种虚假用户评论检测方法及系统
CN113947161A (zh) 一种基于注意力机制的多标签文本分类方法及系统
CN111209974A (zh) 基于张量分解的异构大数据核心特征提取的方法及系统
CN115526236A (zh) 一种基于多模态对比学习的文本网络图分类方法
CN114117029B (zh) 一种基于多层次信息增强的解决方案推荐方法及系统
CN113988178A (zh) 一种低压配电网窃电用户检测方法和装置
CN113627544B (zh) 一种基于多源异构数据融合的机床铣刀状态识别方法
CN114896392A (zh) 工单数据的聚类方法、装置、电子设备及存储介质
Jiang et al. An intelligent recommendation approach for online advertising based on hybrid deep neural network and parallel computing
Zheng et al. RLSTM: a new framework of stock prediction by using random noise for overfitting prevention
CN112950414B (zh) 一种基于解耦法律要素的法律文本表示方法
Liu Empirical analysis of financial statement fraud of listed companies based on logistic regression and random forest algorithm
Zhang et al. Deep attentional factorization machines learning approach for driving safety risk prediction
CN109962915B (zh) 一种基于bqp网络的异常检测方法
Hui et al. Analysis of decision tree classification algorithm based on attribute reduction and application in criminal behavior
CN112765148A (zh) 一种基于改进svm多分类的网络入侵检测方法
CN111753898A (zh) 一种基于叠加卷积稀疏自编码机的表示学习方法
Wang et al. Stock Price Forecasting Based on Wavelet Filtering and Ensembled Machine Learning Model
Yin et al. Used-Car Price Evaluation Using Mean Encoding and PCA based DeepFM
CN117391314B (zh) 综合场站运营管理平台
Latha et al. Shrinkage Linear with Quadratic Gaussian Discriminant Analysis for Big Data Classification.
Ma et al. A data mining model of knowledge discovery based on the deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination