CN113744081B - 窃电行为分析方法 - Google Patents
窃电行为分析方法 Download PDFInfo
- Publication number
- CN113744081B CN113744081B CN202110969882.2A CN202110969882A CN113744081B CN 113744081 B CN113744081 B CN 113744081B CN 202110969882 A CN202110969882 A CN 202110969882A CN 113744081 B CN113744081 B CN 113744081B
- Authority
- CN
- China
- Prior art keywords
- electricity
- preset
- behavior
- group number
- stealing behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 238
- 238000004458 analytical method Methods 0.000 title claims abstract description 60
- 238000012549 training Methods 0.000 claims abstract description 89
- 238000000034 method Methods 0.000 claims abstract description 49
- 230000006399 behavior Effects 0.000 claims description 161
- 238000005070 sampling Methods 0.000 claims description 27
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 4
- 238000011835 investigation Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000011176 pooling Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种窃电行为分析方法。其中,该方法包括:将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;根据多组二分类结果确定目标对象是否存在窃电行为。本申请解决了由于相关技术中基于人工排查的等方法判断是否存在窃电行为造成的人力成本较高、效率低下以及判断结果不准确的技术问题。
Description
技术领域
本申请涉及电力领域,具体而言,涉及一种窃电行为分析方法。
背景技术
随着智能电网的发展,电力企业普遍建立数据中台对海量的电能量数据进行高效统一的管理,各国电力企业尝试将新一代硬件设备、人工智能与大数据技术结合,提升企业对电能量数据的治理与分析能力,以更好地服务用户与能源调配,提升电力企业的经济效益与服务水平。
窃电行为是电力企业面临的一大挑战,是导致电力企业遭受电能损失与经济效益损失的重要原因。窃电行为在造成大量损失的同时也会带来极大的安全隐患,为电网的安全运行带来了一定挑战。近年来随着电力企业对窃电行为的打击与监察力度的加强,采用了智能化的电能计量装置与信息传输采集系统,一定程度上降低了窃电行为的发生。然而目前电力企业对于窃电行为检测仍存在较大提升空间,电能损失与经济效益损失仍处于较高水平,与此同时,窃电手段越来越隐蔽,为电力企业打击窃电行为带来了困难。
目前对于窃电行为的检测,通常有以下几种方法:(1)通过专业人员人工排查的方法进行,这种方法判断准确,但是效率低且人力成本高;(2)使用智能计量装置,增加对零线电流的采集与分析,这种方法有效且准确,但是由于需要更新计量装置会产生较大的经济成本;(3)对用户每日用电量数据进行数据挖掘与分析,建立模型判断是否存在窃电现象,这种方法经济成本低且采集数据来源可靠便捷,但是对用户用电特征的建模与时间序列数据的处理提出了较高的要求。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种窃电行为分析方法,以至少解决由于相关技术中基于人工排查的等方法判断是否存在窃电行为造成的人力成本较高、效率低下以及判断结果不准确的技术问题。
根据本申请实施例的一个方面,提供了一种窃电行为分析方法,包括:将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;根据多组二分类结果确定目标对象是否存在窃电行为。
可选地,根据多组二分类结果确定目标对象是否存在窃电行为,包括:将二分类结果中发生窃电行为的样本标记为预定负数值;将二分类结果中发生非窃电行为的样本标记为预定正数值;基于标记结果对多组二分类结果进行求和,根据求和结果确定是否存在窃电行为。
可选地,根据求和结果确定是否存在窃电行为,包括:在求和结果大于目标数值的情况下,则确定不存在窃电行为;在求和结果小于目标数值的情况下,则确定存在窃电行为。
可选地,在将预定组数的训练集输入至预设模型之前,方法还包括:获取目标对象的用电量样本数据的标签分布,其中,标签分布用于指示目标对象的窃电行为占样本数量的第一比例;根据样本数量与第一比例确定第一数量的窃电行为样本数据集,以及第二数量的非窃电行为样本数据集;将第二数量与第一数量的比值取整,取整后的结果作为随机抽样的预定次数;对非窃电行为样本数据集进行预定次数的抽样,至少基于抽样结果得到预定组数的训练集。
可选地,对非窃电行为样本数据集进行预定次数的抽样,至少基于抽样结果得到预定组数的训练集,包括:从第二数量的非窃电行为数据集进行预定次数的随机抽样,得到抽样后的非窃电行为样本数据集;将抽样后的非窃电行为样本数据集与第一数量的窃电行为样本数据集进行组合处理得到二倍的第一数量,且窃电行为与非窃电行为占比相同的预定组数的训练集,其中,预定组数的组数值与预定次数的次数值相同。
可选地,获取目标对象的用电量样本数据的标签分布之前,方法还包括:采集目标对象的日常用电量数据;基于预设规则对日常用电量数据进行标记得到标签数据,基于标签数据确定标签分布。
根据本申请实施例的另一方面,还提供了一种窃电行为分析装置,包括:第一输入模块,用于将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;第二输入模块,用于将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;确定模块,用于根据多组二分类结果确定目标对象是否存在窃电行为。
可选地,确定模块,包括:第一标记模块,用于将二分类结果中发生窃电行为的样本标记为预定负数值;第二标记模块,用于将二分类结果中发生非窃电行为的样本标记为预定正数值;求和模块,用于基于标记结果对多组二分类结果进行求和,根据求和结果确定是否存在窃电行为。
根据本申请实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行任意一种窃电行为分析方法。
根据本申请实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行任意一种窃电行为分析方法。
在本申请实施例中,采用基于窃电行为分析模型对日用电量时间序列数据进行分析的方式,通过将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;达到了根据多组二分类结果确定目标对象是否存在窃电行为的目的,实现了基于分析模型测定用户是否存在窃电的技术效果,进而解决了由于相关技术中基于人工排查的等方法判断是否存在窃电行为造成的人力成本较高、效率低下以及判断结果不准确的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种可选的窃电行为分析方法的流程示意图;
图2是本申请实施例一种可选的基于tLeNet与时间序列分类的窃电行为检测方法框架示意图;
图3是本申请实施例一种可选的EasyEnsemble下采样生成训练集的示意图;
图4是本申请实施例一种可选的t-LeNet卷积神经网络结构示意图;
图5是根据本申请实施例的一种可选的窃电行为分析装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于本领域技术人员更好的理解,本申请相关实施例,现将本申请可能涉及的技术术语解释如下:
时间序列分类(Time Series Classification,TSC)是根据训练数据集并采用从中提取特征等方法,划分时间序列数据之间的类别的一种技术。对于窃电行为检测,基于用户每日用电量的数据集,对用户时间序列数据进行分类是一种实现思路,这可以达到窃电检测目的。
t-LeNet是一种卷积神经网络(CNN),是在LeNet的基础上,专门针对时间序列进行一定参数优化而产生的。t-LeNet包含输入层在内共有8层卷积神经网络,其卷积层可以使得原信号增强并降低噪音;池化层利用时间相关性原理,通过子采样以减少参数个数,在有效信息保留的前提下降低模型的过拟合程度。近年来相关研究表明t-LeNet相较于传统的CNN与LeNet在时间序列分类的问题上,具有更好的性能和效果。因此,尝试使用t-LeNet对用户日用电量进行学习与建模,得到窃电行为的分析模型进而进行窃电检测,是一种可行的窃电行为检测手段。
根据本申请实施例,提供了一种窃电行为分析方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的窃电行为分析方法,如图1所示,该方法包括如下步骤:
步骤S102,将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;
步骤S104,将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;
步骤S106,根据多组二分类结果确定目标对象是否存在窃电行为。
该窃电行为分析方法中,首先,可将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;然后,将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;最后,根据多组二分类结果确定目标对象是否存在窃电行为,达到了根据多组二分类结果确定目标对象是否存在窃电行为的目的,实现了基于分析模型测定用户是否存在窃电的技术效果,进而解决了由于相关技术中基于人工排查的等方法判断是否存在窃电行为造成的人力成本较高、效率低下以及判断结果不准确的技术问题。
本申请一些实施例中,可以根据多组二分类结果确定目标对象是否存在窃电行为,具体的,将二分类结果中发生窃电行为的样本标记为预定负数值;将二分类结果中发生非窃电行为的样本标记为预定正数值;基于标记结果对多组二分类结果进行求和,根据求和结果确定是否存在窃电行为。
本申请一些实施例中,可根据求和结果确定是否存在窃电行为,具体的,在求和结果大于目标数值的情况下,则确定不存在窃电行为;在求和结果小于目标数值的情况下,则确定存在窃电行为。
本申请一些可选的实施例中,在将预定组数的训练集输入至预设模型之前,可获取目标对象的用电量样本数据的标签分布,其中,标签分布用于指示目标对象的窃电行为占样本数量的第一比例;根据样本数量与第一比例确定第一数量的窃电行为样本数据集,以及第二数量的非窃电行为样本数据集;将第二数量与第一数量的比值取整,取整后的结果作为随机抽样的预定次数;对非窃电行为样本数据集进行预定次数的抽样,至少基于抽样结果得到预定组数的训练集。
本申请一些实施例中,对非窃电行为样本数据集进行预定次数的抽样,至少基于抽样结果得到预定组数的训练集,包括:从第二数量的非窃电行为数据集进行预定次数的随机抽样,得到抽样后的非窃电行为样本数据集;将抽样后的非窃电行为样本数据集与第一数量的窃电行为样本数据集进行组合处理得到二倍的第一数量,且窃电行为与非窃电行为占比相同的预定组数的训练集,其中,预定组数的组数值与预定次数的次数值相同。
需要说明的是,在获取目标对象的用电量样本数据的标签分布之前,可采集目标对象的日常用电量数据;基于预设规则对日常用电量数据进行标记得到标签数据,基于标签数据确定标签分布。
现结合具体实施例对本申请的相关实施例加以说明,图2是本申请一种可选的窃电行为分析系统结构示意图,如图2所示,该系统主要包括:
(1)窃电行为模型建立:首先获取用户用电量时间序列数据,使用EasyEnsemble下采样方法生成训练集,使用t-LeNet神经网络对训练集时间序列数据进行特征学习,通过反向传播算法使得损失函数(准确率)最小化,得到最优的窃电行为模型;
(2)窃电行为模型完善与补充:由于用电量数据是不断生成的,需要对窃电行为模型实时完善与补充。对于新增用户用电量的时间序列数据,通过更新训练样本集,分析其用户特征,进而调整窃电分析模型,最后补充完善窃电分析模型库;
(3)窃电行为自动化检测:利用得到的窃电行为模型,对多种渠道采集得到的用户用电量数据(来源于计量装置的实时采集数据或电力营销系统的历史数据等)进行时间序列分类,输出窃电检测结果。
具体的:1.用户日用电量数据的采集、筛选与预处理
通过多种渠道采集得到原始用户用电量数据(来源于计量装置的实时采集数据或电力营销系统的历史数据等),选择某一时间某一台区的用户用电量时间序列数据构成初始窃电行为数据集,通过专业技术人员标注的方法为每一个用户日用电量样本添加标签信息,不同于一般的二分类问题(将正例记为1,负例记为0),本方法对样本标签的定义方式为:
发生窃电行为的样本记为+1;
未发生窃电行为的样本记为-1。
这是为了后续使用EasyEnsemble下采样方法生成训练集并进行训练,会得到若干分类器及其结果,最终的窃电行为检测结果是通过若干分类器的算数求和结果的正负进行判断的,因此需要将标签改为+1和-1。
2.使用EasyEnsemble方法进行下采样
本方法使用用户用电量时间序列数据,进行窃电行为检测模型的构建,因此需要构造训练集对tLeNet神经网络进行训练。然而对于用户用电量时间序列数据集,其分类标签极不均衡,直接采用这样的数据进行tLeNet神经网络的训练和建模是不合适的,尤其是在窃电行为检测这类更关心少数类的场合下,数据分类不均衡会使得预测模型可能会无法做出准确的预测,最后的模型显然是趋向于预测多数集,使得检测效果大幅下降。
为了解决非均衡数据集训练的问题,本文使用EasyEnsemble下采样方法调整训练集数据结构,其原理是从多数集中随机抽样若干次,抽样得到与少数集样本数量相同的样本,并与少数集重新组合成一个新的数据集送入分类器进行训练。这样能得到若干组多数集与少数集比例为1:1的训练集,能够保证训练得到的模型具有良好的泛化性;并且多数集经过若干次抽样,相较于传统的下采样方法,多数集的特征信息能够得到充分利用。
图3是本申请一种可选的EasyEnsemble下采样生成训练集的流程示意图,如图3所示,该流程主要包括以下步骤:
(1)分析原始用户用电量数据的标签分布:计算窃电行为标签数量占整个样本的比例,划分原始用户用电量数据为窃电行为集P(少数集)与非窃电行为集N(多数集);
(2)确定使用EasyEnsemble下采样生成的训练集组数M:本方法使用式(1)确定下采样生成的训练集组数M的取值;
其中符号表示向下取整,绝对值符号表示集合包含的样本数量。
(3)从非窃电行为集中随机抽样M次,样本容量均与窃电行为集P的样本数量|P|一致,将抽样得到的样本与窃电行为集P组合,形成样本数量为2|P|,窃电与非窃电标签比为1:1的训练集Ti(i=1,2,…,M),则M组训练集{T1,T2,...,TM}即为EasyEnsemble下采样得到的训练集;
使用{T1,T2,...,TM}训练集分别送入t-LeNet进行训练并对窃电行为进行建模,最后合并分类结果。
3.使用t-LeNet构建窃电行为分析模型
由步骤2得到的下采样训练集,将日用电量时间序列数据送入tLeNet训练前,需要进行以下预处理操作:
(1)对数据标签进行独热编码(One Hot Encoder):令存在窃电的数据标签为+1,未存在窃电的数据标签为-1,那么相应的独热编码分别为(1,0)与(0,1)。对离散的标签进行独热编码后,使非偏序关系的变量取值不具有偏序性,这有助于特征之间距离的计算或相似度的计算,使得提升训练效果;
(2)将用户每日用电数据转为多变量数据:即将数据维度从1维提升到2维,通过添加哑元(dummy variables)的方式进行,目的是使得样本数据适应卷积层的二维卷积运算。
预处理后,对每一个下采样训练集,使用反向传播训练算法对t-LeNet神经网络进行训练,可选的,本申请使用的tLeNet神经网络的结构如图4所示,神经网络的具体层数与其参数设置如下表所示。
其中参数fliter表示输入通道数量;参数kernel size表示卷积核大小;参数padding='same'表示卷积运算前进行补0扩充,使得卷积层前后输入输出的大小保持一致;Pooling 1与Pooling 2是池化层,均为最大池化,属性pool size表示池化时缩小的比例因子;Dense层的属性units表示该层的输出维度,其中第8层的n表示样本数量,即最后一层的输出应与输入的样本数量保持一致;参数activation表示激活函数类型,'relu'与'softmax'分别表示ReLU激活函数与SoftMax激活函数,分别如式(2)与(3)所示。
ReLU(x)=max{0,x} (2)
其中式(3)的输入与输出分别是向量x=(x1,x2,...,xn)与S=(S1,S2,...,Sn)。
对步骤二EasyEnsemble下采样生成的M组训练集,分别使用反向传播训练算法,对t-LeNet卷积神经网络进行训练,使得准确率(损失函数)最小,得到M个分类器模型;M个分类器即为基于日用电量的窃电行为分析模型。反向传播训练算法如下所示。
向前传播阶段:
从样本集中取一个样本(X,Yp),将X输入网络;
计算相应的实际输出Op,即依据神经网络从输入层经过逐级变换,传送到输出层,得到输出结果,如式(4)所示:
Op=Fn(...(F2(F1(XpW(1))W(2))...)W(n)) (4)
向后传播阶段:
计算实际输出Op与相应的理想输出Yp的差;
按极小化误差的方法反向传播调整权矩阵。
对上述M组EasyEnsemble下采样训练集{T1,T2,...,TM}运行反向传播训练算法,得到M个分类器模型,则M个分类器即为基于日用电量的窃电行为分析模型,后续使用该模型进行窃电行为检测与分析。
4.时间序列分类与窃电行为判断
如图3所示,步骤3基于M组EasyEnsemble下采样训练集{T1,T2,...,TM},使用反向传播训练算法训练t-LeNet后,能够得到M个分类器。使用该t-LeNet分类器对日用电量时间序列数据(测试集)进行时间序列分类,使用正向传播算法进行时间序列分类,通过M个分类器得到M二分类结果(其中发生窃电行为的样本记为+1,未发生窃电行为的样本记为-1)。
对于测试集S={x1,x2,...,xn},某一个样本xi通过M个分类器能够得到M个二分类结果,对于该样本是否存在窃电行为,通过式(5)进行判断。
其中H(xi)表示对样本xi的窃电行为判断结果,hj(xi)表示第j个分类器对样本xi的分类结果,其取值为+1或-1。本申请对于样本xi窃电行为判断方法是,将M个二分类结果算数求和H(xi),若求和结果H(xi)<0则认定为发生窃电行为;若求和结果H(xi)≥0则认定未发生窃电行为。
5.实现窃电行为分析系统和装置
根据要实现的功能设计出基于下采样和t-LeNet的窃电行为分析系统和装置,根据确定的功能模块对应的计算机程序指令存储在存储介质中,并且利用处理器可以执行该指令。
图5是根据本申请实施例的一种窃电行为分析装置,如图5所示,该窃电行为分析装置包括:
第一输入模块40,用于将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;
第二输入模块42,用于将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;
确定模块44,用于根据多组二分类结果确定目标对象是否存在窃电行为。
该窃电行为分析装置中,第一输入模块40,用于将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;第二输入模块42,用于将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;确定模块44,用于根据多组二分类结果确定目标对象是否存在窃电行为,达到了根据多组二分类结果确定目标对象是否存在窃电行为的目的,实现了基于分析模型测定用户是否存在窃电的技术效果,进而解决了由于相关技术中基于人工排查的等方法判断是否存在窃电行为造成的人力成本较高、效率低下以及判断结果不准确的技术问题。
可选地,确定模块44,包括:第一标记模块440,用于将二分类结果中发生窃电行为的样本标记为预定负数值;第二标记模块442,用于将二分类结果中发生非窃电行为的样本标记为预定正数值;求和模块,用于基于标记结果对多组二分类结果进行求和,根据求和结果确定是否存在窃电行为。
根据本申请实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行任意一种窃电行为分析方法。
具体地,上述存储介质用于存储执行以下功能的程序指令,实现以下功能:
将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;根据多组二分类结果确定目标对象是否存在窃电行为。
根据本申请实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行任意一种窃电行为分析方法。
具体地,上述处理器用于调用存储器中的程序指令,实现以下功能:
将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;根据多组二分类结果确定目标对象是否存在窃电行为。
在本申请实施例中,采用基于窃电行为分析模型对日用电量时间序列数据进行分析的方式,通过将预定组数的训练集输入至预设模型,使用反向传播训练算法对预设模型进行训练,得到预设组数的日用电量窃电行为分析模型;将目标日用电量时间序列数据输入至预设组数的窃电行为分析模型,得到多组二分类结果,其中,多组二分类结果的组数与预设组数的组数相同;达到了根据多组二分类结果确定目标对象是否存在窃电行为的目的,实现了基于分析模型测定用户是否存在窃电的技术效果,进而解决了由于相关技术中基于人工排查的方法判断是否存在窃电行为造成的人力成本较高、效率低下的技术问题。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种窃电行为分析方法,其特征在于,包括:
将预定组数的训练集输入至预设模型,使用反向传播训练算法对所述预设模型进行训练,得到所述预定组数的日用电量窃电行为分析模型,其中,所述预定组数的训练集是基于EasyEnsemble下采样方法对目标对象的用电量样本数据进行处理所得,且所述用电量样本数据包括多个日用电量样本数据和对应的窃电行为标签,所述预定组数的日用电量窃电行为分析模型是基于t-LeNet神经网络对所述预定组数的训练集进行迭代训练所得;
将目标日用电量时间序列数据输入至所述预定组数的日用电量窃电行为分析模型,得到多组二分类结果,其中,所述多组二分类结果的组数与所述预定组数的组数相同;
根据多组二分类结果确定所述目标对象是否存在窃电行为。
2.根据权利要求1所述的方法,其特征在于,根据多组二分类结果确定所述目标对象是否存在窃电行为,包括:
将所述二分类结果中发生窃电行为的样本标记为预定负数值;
将所述二分类结果中发生非窃电行为的样本标记为预定正数值;
基于标记结果对所述多组二分类结果进行求和,根据求和结果确定是否存在窃电行为。
3.根据权利要求2所述的方法,其特征在于,根据求和结果确定是否存在窃电行为,包括:
在所述求和结果大于目标数值的情况下,则确定不存在窃电行为;
在所述求和结果小于目标数值的情况下,则确定存在窃电行为。
4.根据权利要求1所述的方法,其特征在于,在将预定组数的训练集输入至预设模型之前,所述方法还包括:
获取目标对象的用电量样本数据的标签分布,其中,所述标签分布用于指示所述目标对象的窃电行为占样本数量的第一比例;
根据所述样本数量与第一比例确定第一数量的窃电行为样本数据集,以及第二数量的非窃电行为样本数据集;
将所述第二数量与所述第一数量的比值取整,取整后的结果作为随机抽样的预定次数;
对所述非窃电行为样本数据集进行所述预定次数的抽样,至少基于抽样结果得到预定组数的训练集。
5.根据权利要求4所述的方法,其特征在于,对所述非窃电行为样本数据集进行所述预定次数的抽样,至少基于抽样结果得到预定组数的训练集,包括:
从所述第二数量的非窃电行为数据集进行所述预定次数的随机抽样,得到抽样后的非窃电行为样本数据集;
将所述抽样后的非窃电行为样本数据集与所述第一数量的窃电行为样本数据集进行组合处理得到二倍的所述第一数量,且所述窃电行为与所述非窃电行为占比相同的预定组数的训练集,其中,所述预定组数的组数值与所述预定次数的次数值相同。
6.根据权利要求4所述的方法,其特征在于,获取目标对象的用电量样本数据的标签分布之前,所述方法还包括:
采集所述目标对象的日常用电量数据;
基于预设规则对所述日常用电量数据进行标记得到标签数据,基于所述标签数据确定所述标签分布。
7.一种窃电行为分析装置,其特征在于,包括:
第一输入模块,用于将预定组数的训练集输入至预设模型,使用反向传播训练算法对所述预设模型进行训练,得到所述预定组数的日用电量窃电行为分析模型,其中,所述预定组数的训练集是基于EasyEnsemble下采样方法对目标对象的用电量样本数据进行处理所得,且所述用电量样本数据包括多个日用电量样本数据和对应的窃电行为标签,所述预定组数的日用电量窃电行为分析模型是基于t-LeNet神经网络对所述预定组数的训练集进行迭代训练所得;
第二输入模块,用于将目标日用电量时间序列数据输入至所述预定组数的日用电量窃电行为分析模型,得到多组二分类结果,其中,所述多组二分类结果的组数与所述预定组数的组数相同;
确定模块,用于根据多组二分类结果确定所述目标对象是否存在窃电行为。
8.根据权利要求7所述的装置,其特征在于,所述确定模块,包括:
第一标记模块,用于将所述二分类结果中发生窃电行为的样本标记为预定负数值;
第二标记模块,用于将所述二分类结果中发生非窃电行为的样本标记为预定正数值;
求和模块,用于基于标记结果对所述多组二分类结果进行求和,根据求和结果确定是否存在窃电行为。
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至6中任意一项所述窃电行为分析方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述窃电行为分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110969882.2A CN113744081B (zh) | 2021-08-23 | 2021-08-23 | 窃电行为分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110969882.2A CN113744081B (zh) | 2021-08-23 | 2021-08-23 | 窃电行为分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113744081A CN113744081A (zh) | 2021-12-03 |
CN113744081B true CN113744081B (zh) | 2024-05-28 |
Family
ID=78732347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110969882.2A Active CN113744081B (zh) | 2021-08-23 | 2021-08-23 | 窃电行为分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113744081B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105573997A (zh) * | 2014-10-09 | 2016-05-11 | 普华讯光(北京)科技有限公司 | 一种确定窃电嫌疑用户的方法及装置 |
CN106680557A (zh) * | 2017-01-05 | 2017-05-17 | 云南电网有限责任公司电力科学研究院 | 一种基于用户行为分析的防窃电方法 |
CN106817363A (zh) * | 2016-12-24 | 2017-06-09 | 国网江苏省电力公司信息通信分公司 | 基于神经网络的智能电表异常检测方法 |
CN107492043A (zh) * | 2017-09-04 | 2017-12-19 | 国网冀北电力有限公司电力科学研究院 | 窃电分析方法及装置 |
CN111126820A (zh) * | 2019-12-17 | 2020-05-08 | 国网山东省电力公司电力科学研究院 | 反窃电方法及系统 |
CN112101471A (zh) * | 2020-09-21 | 2020-12-18 | 国网辽宁省电力有限公司电力科学研究院 | 窃电概率预警分析方法 |
CN112098714A (zh) * | 2020-08-12 | 2020-12-18 | 国网江苏省电力有限公司南京供电分公司 | 一种基于ResNet-LSTM的窃电检测方法及系统 |
CN112614012A (zh) * | 2020-12-11 | 2021-04-06 | 国网北京市电力公司 | 用户窃电识别方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200097810A1 (en) * | 2018-09-25 | 2020-03-26 | Oracle International Corporation | Automated window based feature generation for time-series forecasting and anomaly detection |
-
2021
- 2021-08-23 CN CN202110969882.2A patent/CN113744081B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105573997A (zh) * | 2014-10-09 | 2016-05-11 | 普华讯光(北京)科技有限公司 | 一种确定窃电嫌疑用户的方法及装置 |
CN106817363A (zh) * | 2016-12-24 | 2017-06-09 | 国网江苏省电力公司信息通信分公司 | 基于神经网络的智能电表异常检测方法 |
CN106680557A (zh) * | 2017-01-05 | 2017-05-17 | 云南电网有限责任公司电力科学研究院 | 一种基于用户行为分析的防窃电方法 |
CN107492043A (zh) * | 2017-09-04 | 2017-12-19 | 国网冀北电力有限公司电力科学研究院 | 窃电分析方法及装置 |
CN111126820A (zh) * | 2019-12-17 | 2020-05-08 | 国网山东省电力公司电力科学研究院 | 反窃电方法及系统 |
CN112098714A (zh) * | 2020-08-12 | 2020-12-18 | 国网江苏省电力有限公司南京供电分公司 | 一种基于ResNet-LSTM的窃电检测方法及系统 |
CN112101471A (zh) * | 2020-09-21 | 2020-12-18 | 国网辽宁省电力有限公司电力科学研究院 | 窃电概率预警分析方法 |
CN112614012A (zh) * | 2020-12-11 | 2021-04-06 | 国网北京市电力公司 | 用户窃电识别方法及装置 |
Non-Patent Citations (4)
Title |
---|
Adaboost-based electricity theft detection;Yi-Ning Yang 等;《 2021 6th International Conference on Smart Grid and Electrical Automation (ICSGEA)》;20210712;第80-85页 * |
基于t-LeNet与时间序列分类的窃电行为检测;马晓琴 等;《华东师范大学学报(自然科学版)》;20210925(第5期);第104-114页 * |
基于嵌入式Linux电力网关设计与用电异常行为分析;王星;《中国优秀硕士论文全文数据库 工程科技Ⅱ辑》;20210115(第01期);第C042-2203页 * |
基于深度循环神经网络的异常用电检测方法;严勤 等;《中国测试》;20210731;第47卷(第7期);第99-104页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113744081A (zh) | 2021-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111738462B (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN110930198A (zh) | 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备 | |
CN113901977A (zh) | 一种基于深度学习的电力用户窃电识别方法及系统 | |
CN112308124B (zh) | 一种面向用电信息采集系统的智能防窃电方法 | |
CN107292249A (zh) | 一种基于结构化分段网络的时间动作检测方法 | |
CN117670066B (zh) | 基于智能决策的司库管理方法、系统、设备及存储介质 | |
CN117556369B (zh) | 一种动态生成的残差图卷积神经网络的窃电检测方法及系统 | |
CN112884008A (zh) | 一种电力信息采集系统运行状态的预测评估方法及装置 | |
CN116861331A (zh) | 一种融合专家模型决策的数据识别方法及系统 | |
CN114638633A (zh) | 异常流量检测的方法和装置、电子设备和存储介质 | |
CN112614004A (zh) | 用电信息的处理方法及装置 | |
CN117977028B (zh) | 基于车辆电池监测的智能充电方法及系统 | |
CN114611738A (zh) | 一种基于用户用电行为分析的负荷预测方法 | |
CN117113159A (zh) | 基于深度学习的电力用户侧负荷分类方法及系统 | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
CN112595918A (zh) | 一种低压集抄故障的检测方法及装置 | |
CN117495422A (zh) | 基于电力通信网建设的造价管理系统及其方法 | |
CN113744081B (zh) | 窃电行为分析方法 | |
CN116500335A (zh) | 基于一维特征和二维特征的智能电网窃电检测方法及系统 | |
CN115034812B (zh) | 基于大数据的钢铁行业销售量预测方法及装置 | |
CN115616408A (zh) | 电池热管理数据处理方法及系统 | |
CN115936926A (zh) | 一种基于smote-gbdt的不平衡窃电数据分类方法、装置、计算机设备和存储介质 | |
CN114915563A (zh) | 一种网络流量预测方法和系统 | |
CN114154617A (zh) | 一种基于vfl的低压居民用户异常用电识别方法及系统 | |
CN110658373A (zh) | 一种基于多重算法融合的配电网窃电监测方法、模型及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |