CN113435915B - 用户窃电行为检测方法、装置、设备及存储介质 - Google Patents

用户窃电行为检测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113435915B
CN113435915B CN202110797242.8A CN202110797242A CN113435915B CN 113435915 B CN113435915 B CN 113435915B CN 202110797242 A CN202110797242 A CN 202110797242A CN 113435915 B CN113435915 B CN 113435915B
Authority
CN
China
Prior art keywords
data
user
sample
day
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110797242.8A
Other languages
English (en)
Other versions
CN113435915A (zh
Inventor
招景明
杨雨瑶
潘峰
张捷
路韬
舒晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Measurement Center of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Measurement Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Measurement Center of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202110797242.8A priority Critical patent/CN113435915B/zh
Publication of CN113435915A publication Critical patent/CN113435915A/zh
Application granted granted Critical
Publication of CN113435915B publication Critical patent/CN113435915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种用户窃电行为检测方法、装置、设备及存储介质,该方法包括:获取正常用户的用电数据及窃电用户的标签用电数据,并进行数据预处理;对预处理后的标签数据进行数据扩充,得到样本数据;构建所述样本数据的特征集;对所述特征集进行降维处理,得到目标训练数据;利用分类器对所述目标训练数据进行学习,得到分类结果;根据所述分类结果,判断用户是否出现窃电行为。本发明通过对用电数据进行预处理,降低了异常数据的失真程度;通过进行样本扩充,解决了样本不平衡问题;通过降维处理避免了维度爆炸问题,且有效提高了运算速度。本发明提供的检测方法具有样本质量高、检测效率高、准确度高、方法易实施且适用性强的优点。

Description

用户窃电行为检测方法、装置、设备及存储介质
技术领域
本发明涉及窃电行为检测技术领域,具体涉及一种用户窃电行为检测方法、装置、设备及存储介质。
背景技术
在低压配电网的管理中,线损管理对于电网公司十分重要。线损会给电网带来大量的经济损失和安全隐患,而线损管理中的非技术性线损主要造成的原因就是用户的窃电行为。根据相关统计信息显示,我国的非技术性线损电量占全国总用电量的6%左右,而我国的电能需求量正在不断的攀升,非技术性线损所造成的经济损失越来越大。因此,通过研究窃电检测方法为电网公司的用电秩序稽查提供一套高效准确的方法,对电网管理工作至关重要。
目前,电网公司对于用户的窃电行为检测主要通过定期现场排查的方式进行,基于智能电表提供的海量、多维度的准实时数据,能够为分析用户用电行为,实时监测窃电行为提供良好的数据基础。而针对基于数据驱动的窃电检测方法,主要的技术方向有三类:分别是有监督学习中的分类和回归方法以及无监督学习中的聚类方法。在基于分类的方法中,由于实际样本存在严重的样本不平衡问题,使得该类方法在没有解决小样本问题时,往往只能适用于理想数据集。同时,现有分类方法在对数据进行多时间窗口的特征提取后会形成高维数据集,容易出现维度灾难的问题。
发明内容
本发明的目的在于提供一种用户窃电行为检测方法、装置、设备及存储介质,以解决现有的有监督学习的分类方法在进行窃电行为检测时存在的样本不均衡、数据处理复杂、方法局限性强、不易实施的技术问题。
为了克服上述现有技术中的缺陷,本发明提供了一种用户窃电行为检测方法,包括:
获取正常用户的用电数据及窃电用户的标签用电数据,并进行数据预处理;
对预处理后的标签数据进行数据扩充,得到样本数据;
构建所述样本数据的特征集;
对所述特征集进行降维处理,得到目标训练数据;
利用分类器对所述目标训练数据进行学习,得到分类结果;
根据所述分类结果,判断用户是否出现窃电行为。
进一步地,所述获取正常用户的用电数据及窃电用户的标签用电数据,并进行数据预处理,包括:
将用电量为0的数据作为正常数据,将用电量不为0且大于预设阈值的数据作为异常数据;
当连续出现异常数据的数量小于7时,利用二次插值法进行数据补齐。
进一步地,所述用户窃电行为检测方法,还包括:
当连续出现异常数据的数量大于或等于7时,基于临近相似日的处理方法对异常数据进行处理,包括:
获取电表采集的原始数据集:
Ln=(Gn+1-Gn)×B;
式中,Gn+1、Gn为异常点下电表所采集的第n+1天、第n天的正向有功总(kWh);B为该用户所用电表的综合倍率;Ln为第n天的用户用电量数据;
设缺失的数据点为Ln,Ln+1,…,Ln+m,选取的临近周期相似日的数据为G′n-1,G′n,…,G′n+m+1,对缺失点数据的计算公式为:
Figure BDA0003163197650000021
Figure BDA0003163197650000022
Figure BDA0003163197650000031
式中,Gn-1、Gn+m+1分别为异常点下电表所采集的第n-1天、第n+m+1天的正向有功总(kWh)。
进一步地,利用attentionGAN对预处理后的标签数据进行数据扩充,得到样本数据。
进一步地,所述构建所述样本数据的特征集,包括:
根据统计记录特征,用电相似度特征和时间序列特征,对所述样本数据的滑动时间窗口进行特征提取,得到所述样本数据的特征集。
进一步地,采用MDS对所述特征集进行降维处理,得到目标训练数据。
进一步地,所述分类器为基于GDBT构建的二分类器。
本发明还提供了一种用户窃电行为检测装置,包括:
预处理模块,用于获取正常用户的用电数据及窃电用户的标签用电数据,并进行数据预处理;
样本扩充模块,用于对预处理后的标签数据进行数据扩充,得到样本数据;
特征提取模块,用于构建所述样本数据的特征集;
降维处理模块,用于对所述特征集进行降维处理,得到目标训练数据;
训练模块,用于利用分类器对所述目标训练数据进行学习,得到分类结果;
判断模块,用于根据所述分类结果,判断用户是否出现窃电行为。
本发明还提供了一种终端设备,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上任一项所述的用户窃电行为检测方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行实现如上任一项所述的用户窃电行为检测方法。
相对于现有技术,本发明的有益效果在于:
1)本发明对于连续异常天数超过7天的异常数据集采用基于临近相似日的异常数据处理方法,能够降低异常数据的失真程度。
2)采用attentionGAN进行窃电样本的样本扩充工作,很好的解决了样本不平衡问题,为分类器的学习提供了良好的数据基础。
3)使用MDS降维方法对数据特征集进行降维避免了维度爆炸问题且能有效提高运算速度。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明某一实施例提供的用户窃电行为检测方法的流程示意图;
图2是本发明某一实施例提供的用户窃电行为检测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
第一方面:
请参阅图1,本发明某一实施例提供了一种用户窃电行为检测方法,包括:
S10、获取正常用户的用电数据及窃电用户的标签用电数据,并进行数据预处理;
在本步骤中,优先选取某个区域带窃电标签的低压用户日用电量数据以及同个区域内的正常用户日用电量数据,但由于窃电用户数据通常存在异常情况,因此需要对数据进行预处理操作,以辅助生成质量较好的数据样本;
具体地,数据预处理的过程包括:
1)将用电量为0的数据作为正常数据,将用电量不为0且大于预设阈值的数据作为异常数据。
需要说明的是,由于许多窃电用户的明显特征是会出现大量日用电量零值,所以对于用电量为0的数据不予处理,即直接将其剔除;而对于大于预设阈值的用电量,会把它定义为极大异常值。对于极大异常值以及空值,本实施例会针对不同的异常情况对应采用不同的数据修正方法。其中,预设阈值可以根据实际情况进行设置,在此不作任何限定。
2)当连续出现异常数据的数量小于7时,利用二次插值法进行数据补齐。
3)当连续出现异常数据的数量大于或等于7时,基于临近相似日的处理方法对异常数据进行处理,包括:
获取电表采集的原始数据集,即第n天的用户用电量数据Ln
Ln=(Gn+1-Gn)×B (1)
式中,Gn+1、Gn为异常点下电表所采集的第n+1天、第n天的正向有功总(kWh);B为该用户所用电表的综合倍率;Ln为第n天的用户用电量数据;
进一步地,设缺失的数据点为Ln,Ln+1,…,Ln+m,选取的临近周期相似日的数据为G′n-1,G′n,…,G′n+m+1,对缺失点数据的计算公式为:
Figure BDA0003163197650000061
Figure BDA0003163197650000062
Figure BDA0003163197650000063
式中,Gn-1、Gn+m+1分别为异常点下电表所采集的第n-1天、第n+m+1天的正向有功总(kWh)。
需要注意的是,当第x天存在数据缺失时,所选取的临近周期相似日一般为第x-7天即上周的同一类型日,但是经常会出现x-7天的数据也为缺失状态,所以本文选取相似日的逻辑为x-7、x+7、x-14、x+14依次类推。
S20、对预处理后的标签数据进行数据扩充,得到样本数据;
本步骤中,在得到处理后的数据集之后,采用attentionGAN实现窃电样本数据的样本增强,在卷积生成对抗网络中对生成器加入通道注意力机制,将公式(2)-(4)中得到的训练集数据和生成网络G输入Z,然后将生成的数据作为判别网络D的输入。
进一步地,生成样本数据又包括以下两步:
a)使用BCEloss函数作为判别模型的损失函数,使用Adm对判别网络的参数进行优化,使得判别网络尽可能地将D(x)作为x是真实数据的概率输出为1,将D(G(Z))输出为0,从而满足目标函数V(D,G)最大化。其中,判别器的损失函数为:
Figure BDA0003163197650000064
式中,Pdata(x)为真实数据的分布。
b)固定判别网络的参数,将随机分布数据Z输入生成网络G,在生成器上连接通道注意力模块,最终生成判别模型的损失函数为:
Figure BDA0003163197650000071
式中,yi'为真实数据的变量,
Figure BDA0003163197650000072
是输出层的预测值。
c)多次重复步骤a)-b),交替生成器和判别器的训练,直至损失函数收敛,形成稳定的网络模型,并生成的窃电样本数据。最后,将生成的窃电样本数据与原始样本数据组成新的窃电样本数据集,作为下一步待使用的样本数据。
S30、构建所述样本数据的特征集;
具体地,在进行分类器训练前,本步骤以7天为一个时间窗口从三个角度采用滑动窗口进行数据集的特征提取工作,三个特征维度分别是统计特征,时间序列特征以及相似度特征。其中,统计特征为零值出现天数在对应时间窗口内的占比;时间序列特征分别为:均值,方差,最大值,最小值,中位数,偏度以及峰度;相似度特征:引入皮尔逊相关系数来计算相邻时间窗口内用户的用电相似度,计算公式如下:
Figure BDA0003163197650000073
式中,Y表示相邻时间窗口的日用电量变量,X表示待计算窗口的日用电量变量,m表示变量样本数量。
最后,分别得到各个维度的样本数据特征后,构成样本的特征集。
S40、对所述特征集进行降维处理,得到目标训练数据;
本步骤中,使用MDS降维方法对样本特征集数据进行降维处理,降维表达式为:
distij=||zi-zj|| (8)
式中,distij为特征集中特征数据在第i个时刻与第j个时刻的欧式距离;zi表示第i个时刻的特征数据在低维空间中的映射;zj表示第j个时刻的特征数据在低维空间中的映射。
设B为降维后样本的内积矩阵,令
Figure BDA0003163197650000081
Figure BDA0003163197650000082
Figure BDA0003163197650000083
将降维后的样本中心化,则
Figure BDA0003163197650000084
Figure BDA0003163197650000085
进一步的,则有
Figure BDA0003163197650000086
Figure BDA0003163197650000087
Figure BDA0003163197650000088
式中,tr(·)表示矩阵的迹。
Figure BDA0003163197650000089
Figure BDA00031631976500000810
Figure BDA00031631976500000811
Figure BDA00031631976500000812
由以上各式,可得内积矩阵B
Figure BDA00031631976500000813
对其进行特征值分解
B=VΛVT (21)
Λ=diag(λ12,…,λd,) (22)
λ1≥λ2≥…≥λd, (23)
Λ=ΛT (24)
B=ZTZ=VΛVT (25)
Figure BDA0003163197650000091
Figure BDA0003163197650000092
保留前d‘个最大的特征值和特征向量,则可得出降维后的数据矩阵
Figure BDA0003163197650000093
S50、利用分类器对所述目标训练数据进行学习,得到分类结果;
本步骤中,得到降维后的数据集之后,使用GBDT分类器进行学习,首先初始化一个弱学习器F0(x):
Figure BDA0003163197650000094
其中,P(Y=1|x)是训练样本中Y=1的比例,利用先验信息来初始化学习器。
进一步地,建立M棵分类回归树m=1,2,...,M,对i=1,2,...,N,计算第m棵树对应的响应值(损失函数的负梯度,即伪残差):
Figure BDA0003163197650000095
其中,对于i=1,2,...,N,利用CART回归树拟合数据(xi,rm.i),得到第m棵回归树,其对应得叶子节点区域为Rm.j,其中j=1,2,...,Jm,且Jm为第m棵回归树叶子节点的个数,对于Jm个叶子节点区域j=1,2,...,Jm,计算出最佳拟合值:
Figure BDA0003163197650000096
然后,更新强学习器Fm(x):
Figure BDA0003163197650000097
进一步得到最终的强学习器FM(x):
Figure BDA0003163197650000101
最后,最终得分类模型可以表达为:
Figure BDA0003163197650000102
S60、根据所述分类结果,判断用户是否出现窃电行为。
本步骤中,通过步骤S50得到的分类器对待检测用户进行分类检测,判断用户是否窃电。
本发明实施例提供的方法通过对连续异常天数超过7天的异常数据集采用基于临近相似日的异常数据处理方法,能够降低异常数据的失真程度;通过采用attentionGAN进行窃电样本的样本扩充工作,很好的解决了样本不平衡问题,为分类器的学习提供了良好的数据基础;通过使用MDS降维方法对数据特征集进行降维避免了维度爆炸问题且能有效提高运算速度。本发明实施例具有样本质量高、检测效率高、准确度高、方法易实施且适用性强的优点。
第二方面:
请参与图2,本发明某一实施例还提供了一种用户窃电行为检测装置,包括:
预处理模块01,用于获取正常用户的用电数据及窃电用户的标签用电数据,并进行数据预处理;
样本扩充模块02,用于对预处理后的标签数据进行数据扩充,得到样本数据;
特征提取模块03,用于构建所述样本数据的特征集;
降维处理模块04,用于对所述特征集进行降维处理,得到目标训练数据;
训练模块05,用于利用分类器对所述目标训练数据进行学习,得到分类结果;
判断模块06,用于根据所述分类结果,判断用户是否出现窃电行为。
本发明实施例提供的装置,通过对连续异常天数超过7天的异常数据集采用基于临近相似日的异常数据处理方法,能够降低异常数据的失真程度;通过采用attentionGAN进行窃电样本的样本扩充工作,很好的解决了样本不平衡问题,为分类器的学习提供了良好的数据基础;通过使用MDS降维方法对数据特征集进行降维避免了维度爆炸问题且能有效提高运算速度。本发明实施例具有样本质量高、检测效率高、准确度高、方法易实施且适用性强的优点。
第三方面:
本发明某一实施例还提供了一种终端设备,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的用户窃电行为检测方法。
处理器用于控制该终端设备的整体操作,以完成上述的用户窃电行为检测方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该终端设备的操作,这些数据例如可以包括用于在该终端设备上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
终端设备可以被一个或多个应用专用集成电路(Application Specific1ntegrated Circuit,简称AS1C)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field ProgrammableGate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行如上述任一项实施例所述的用户窃电行为检测方法,并达到如上述方法一致的技术效果。
本发明某一实施例还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现如上述任一项实施例所述的用户窃电行为检测方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由终端设备的处理器执行以完成如上述任一项实施例所述的用户窃电行为检测方法,并达到如上述方法一致的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (9)

1.一种用户窃电行为检测方法,其特征在于,包括:
获取正常用户的用电数据及窃电用户的标签用电数据,并进行数据预处理;包括:
将用电量为0的数据作为正常数据,将用电量不为0且大于预设阈值的数据作为异常数据;
当连续出现异常数据的数量大于或等于7时,基于临近相似日的处理方法对异常数据进行处理,包括:
获取电表采集的原始数据集:
Lb=(Gb+1-Gb)×B;
式中,Gb+1、Gn为异常点下电表所采集的第n+1天、第n天的正向有功总(kWh);B为该用户所用电表的综合倍率;Ln为第n天的用户用电量数据;
设缺失的数据点为Ln,Ln+1,…,Ln+m,选取的临近周期相似日的数据为G′n-1,G′n,…,G′n+m+1,对缺失点数据的计算公式为:
Figure FDA0003808593510000011
Figure FDA0003808593510000012
Figure FDA0003808593510000013
式中,Gn-1、Gn+m+1分别为异常点下电表所采集的第n-1天、第n+m+1天的正向有功总(kWh);
对预处理后的标签数据进行数据扩充,得到样本数据;
构建所述样本数据的特征集;
对所述特征集进行降维处理,得到目标训练数据;
利用分类器对所述目标训练数据进行学习,得到分类结果;
根据所述分类结果,判断用户是否出现窃电行为。
2.根据权利要求1所述的用户窃电行为检测方法,其特征在于,所述获取正常用户的用电数据及窃电用户的标签用电数据,并进行数据预处理,还包括:
当连续出现异常数据的数量小于7时,利用二次插值法进行数据补齐。
3.根据权利要求1所述的用户窃电行为检测方法,其特征在于,利用attentionGAN对预处理后的标签数据进行数据扩充,得到样本数据。
4.根据权利要求1所述的用户窃电行为检测方法,其特征在于,所述构建所述样本数据的特征集,包括:
根据统计记录特征,用电相似度特征和时间序列特征,对所述样本数据的滑动时间窗口进行特征提取,得到所述样本数据的特征集。
5.根据权利要求1所述的用户窃电行为检测方法,其特征在于,采用MDS对所述特征集进行降维处理,得到目标训练数据。
6.根据权利要求1所述的用户窃电行为检测方法,其特征在于,所述分类器为基于GDBT构建的二分类器。
7.一种用户窃电行为检测装置,其特征在于,包括:
预处理模块,用于获取正常用户的用电数据及窃电用户的标签用电数据,并进行数据预处理;包括:
将用电量为0的数据作为正常数据,将用电量不为0且大于预设阈值的数据作为异常数据;
当连续出现异常数据的数量大于或等于7时,基于临近相似日的处理方法对异常数据进行处理,包括:
获取电表采集的原始数据集:
Ln=(Gn+1-Gn)×B;
式中,Gn+1、Gn为异常点下电表所采集的第n+1天、第n天的正向有功总(kWh);B为该用户所用电表的综合倍率;Ln为第n天的用户用电量数据;
设缺失的数据点为Ln,Ln+1,…,Ln+m,选取的临近周期相似日的数据为G′n-1,G′n,…,G′n+m+1,对缺失点数据的计算公式为:
Figure FDA0003808593510000031
Figure FDA0003808593510000032
Figure FDA0003808593510000033
式中,Gn-1、Gn+m+1分别为异常点下电表所采集的第n-1天、第n+m+1天的正向有功总(kWh);
样本扩充模块,用于对预处理后的标签数据进行数据扩充,得到样本数据;
特征提取模块,用于构建所述样本数据的特征集;
降维处理模块,用于对所述特征集进行降维处理,得到目标训练数据;
训练模块,用于利用分类器对所述目标训练数据进行学习,得到分类结果;
判断模块,用于根据所述分类结果,判断用户是否出现窃电行为。
8.一种终端设备,其特征在于,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6任一项所述的用户窃电行为检测方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行实现如权利要求1至6任一项所述的用户窃电行为检测方法。
CN202110797242.8A 2021-07-14 2021-07-14 用户窃电行为检测方法、装置、设备及存储介质 Active CN113435915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110797242.8A CN113435915B (zh) 2021-07-14 2021-07-14 用户窃电行为检测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110797242.8A CN113435915B (zh) 2021-07-14 2021-07-14 用户窃电行为检测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113435915A CN113435915A (zh) 2021-09-24
CN113435915B true CN113435915B (zh) 2023-01-20

Family

ID=77760489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110797242.8A Active CN113435915B (zh) 2021-07-14 2021-07-14 用户窃电行为检测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113435915B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107492043A (zh) * 2017-09-04 2017-12-19 国网冀北电力有限公司电力科学研究院 窃电分析方法及装置
CN108364016A (zh) * 2018-01-12 2018-08-03 华南理工大学 基于多分类器的渐进式半监督分类方法
CN108921424A (zh) * 2018-06-28 2018-11-30 广东电网有限责任公司 一种电力数据异常检测方法、装置、设备及可读存储介质
CN110045209A (zh) * 2019-05-10 2019-07-23 广东电网有限责任公司 用电数据异常的检测方法、装置、设备及可读存储介质
CN113011997A (zh) * 2021-02-20 2021-06-22 上海电机学院 电网用户用电异常行为检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107492043A (zh) * 2017-09-04 2017-12-19 国网冀北电力有限公司电力科学研究院 窃电分析方法及装置
CN108364016A (zh) * 2018-01-12 2018-08-03 华南理工大学 基于多分类器的渐进式半监督分类方法
CN108921424A (zh) * 2018-06-28 2018-11-30 广东电网有限责任公司 一种电力数据异常检测方法、装置、设备及可读存储介质
CN110045209A (zh) * 2019-05-10 2019-07-23 广东电网有限责任公司 用电数据异常的检测方法、装置、设备及可读存储介质
CN113011997A (zh) * 2021-02-20 2021-06-22 上海电机学院 电网用户用电异常行为检测方法

Also Published As

Publication number Publication date
CN113435915A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN109635928B (zh) 基于深度学习模型融合的电压暂降原因识别方法
CN109615129B (zh) 房地产客户成交概率预测方法、服务器及计算机存储介质
CN113702895B (zh) 一种电压互感器误差状态在线定量评估方法
Cheng et al. Enhanced state estimation and bad data identification in active power distribution networks using photovoltaic power forecasting
CN112381673B (zh) 一种基于数字孪生的园区用电信息分析方法及装置
Ma et al. Topology identification of distribution networks using a split-EM based data-driven approach
CN116167010B (zh) 具有智能迁移学习能力的电力系统异常事件快速识别方法
CN115563477B (zh) 谐波数据识别方法、装置、计算机设备和存储介质
CN112836720A (zh) 建筑运维设备异常诊断方法、系统及计算机可读存储介质
CN116451117A (zh) 一种基于联邦学习的电力数据异常检测方法
Yoon et al. Deep learning-based method for the robust and efficient fault diagnosis in the electric power system
CN112926686B (zh) 基于brb和lstm模型的电力大数据用电异常检测方法及装置
CN113538063A (zh) 基于决策树的电费异常数据分析方法、装置、设备及介质
CN113435915B (zh) 用户窃电行为检测方法、装置、设备及存储介质
CN112308341A (zh) 电力数据的处理方法和装置
CN116611003A (zh) 一种变压器故障诊断方法、装置、介质
CN115062686A (zh) 基于多角度特征的多元kpi时序异常检测方法和系统
CN114595952A (zh) 基于注意力网络改进卷积神经网络的窃电行为检测方法
Li et al. Semi-supervised learning for fault identification in electricity distribution networks
CN112579429A (zh) 一种问题定位方法和装置
CN116415510B (zh) 基于相空间重构和神经网络的断路器温升预测方法及系统
CN116340765B (zh) 一种窃电用户预测方法、装置、存储介质及电子设备
Chunshan et al. Study and application of data mining and NARX neural networks in load forecasting
Liu et al. Short-Term Load Prediction Based on Typical Daily Feature Selection and Time Convolutional Neural Network
Li et al. Abnormal line loss identification and category classification of distribution networks based on semi-supervised learning and hierarchical classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant