CN114266925B - 一种基于dlstm-rf的用户窃电检测方法及系统 - Google Patents

一种基于dlstm-rf的用户窃电检测方法及系统 Download PDF

Info

Publication number
CN114266925B
CN114266925B CN202111657488.1A CN202111657488A CN114266925B CN 114266925 B CN114266925 B CN 114266925B CN 202111657488 A CN202111657488 A CN 202111657488A CN 114266925 B CN114266925 B CN 114266925B
Authority
CN
China
Prior art keywords
dlstm
line loss
electricity stealing
model
loss rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111657488.1A
Other languages
English (en)
Other versions
CN114266925A (zh
Inventor
龚钢军
孟芷若
杨佳轩
袁琳琳
陆俊
武昕
苏畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN202111657488.1A priority Critical patent/CN114266925B/zh
Publication of CN114266925A publication Critical patent/CN114266925A/zh
Application granted granted Critical
Publication of CN114266925B publication Critical patent/CN114266925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于DLSTM‑RF的用户窃电检测方法及系统,包括:构建相关数据集,相关数据集用于作为DLSTM‑RF模型的输入数据,对DLSTM‑RF模型进行训练,生成用户窃电预测模型;构建DLSTM‑RF模型,DLSTM‑RF模型用于通过相关数据集,生成用户窃电预测模型;通过相关数据集,对DLSTM‑RF模型进行训练,生成用户窃电预测模型,用户窃电预测模型用于对电网系统中的信息进行分析和学习,找出窃电用户,并通过对窃电用户进行治理,降低不必要的电力生产;本发明通过检测用户的窃电信息并与碳排放信息的进行转换,实现从用电信息到减碳信息的跨越,为实现电网用户侧控碳提供了一定的参考。

Description

一种基于DLSTM-RF的用户窃电检测方法及系统
技术领域
本申请涉及窃电监测技术领域,具体而言,涉及一种基于 DLSTM-RF的用户窃电检测方法及系统。
背景技术
随着社会经济的飞速发展,全球的碳排放问题也日渐严峻。近年来,低碳结构性变革要求紧迫,我们现在所面临的减排总量大,时间紧的挑战。能源燃烧的二氧化碳排放是97亿吨,占比为 88%,电力行业约39亿吨,占比约35%。电力行业碳水平直接影响碳减排国际承诺的落实。
碳排放问题是制约着社会发展的全球性问题,我国低碳结构性变革要求紧迫,而电力行业碳水平直接影响碳减排国际承诺的落实。电网台区窃电是造成线损的主要原因之一。由于台区窃电量巨大,不仅造成了重大的经济损失,还额外造成了大量的碳排放。
目前所研究的窃电检测方法主要可分为状态检测和人工智能两类,其中人工智能的方法主要是利用机器学习和深度学习技术对智能电表获取的样本数据训练分类器,然后对非法用电行为进行判别,操作复杂度适中。但是,很多机器学习方法对于高维数据需要手动进行特征选择,包括最值、均值、方差、标准差等,手动特征提取既繁琐又耗时,且对智能表中的二维数据进行特征提取较为困难。相比之下,深度学习技术对于特征提取操作简单且判别准确率高,具有更大的优势及发展前景,越来越多的学者将其引入到窃电检测上来。
目前对于窃电检测已有一定的研究成果,基于用电信息采集系统的研究主要有两类:第一类是抽取、提炼用电负荷曲线,从中提取用电特征再对其进行分析。第二类是基于用户用电过程中产生的电参量记录,从与其有关的时间序列中选取征,将其描述为样本点后再进行分析。目前有基于深度学习的用户异常用电模式检测模型,构建了特征提取网络和多层特征匹配网络,具有较高的准确性,但是对于如何将用户的窃电信息和碳排放信息进行转换,实现从用电信息到减碳信息的跨越技术并没有相关报导,因此,急需一种可以将窃电信息和碳排放信息进行关联的技术方案,用于解决现有的技术问题。
发明内容
为了解决上述问题,本发明提供了一种基于DLSTM-RF的用户窃电检测方法,包括以下步骤:
构建相关数据集,相关数据集用于作为DLSTM-RF模型的输入数据,对DLSTM-RF模型进行训练,生成用户窃电预测模型,其中,相关数据集包括:
线损率,用于表示线路损耗的电能和供电量的比值;
平均线损率,用于表示多条线路的线损率的平均值;
线损率标准差,用于表示线损率的离散程度由线损率展现;
线损变化趋势,用于表示线损的变化趋势,通过变化趋势表示用户窃电漏电的可能性;
线损偏度系数,用于表示线路线损分布偏移中心位置的程度;
线损峰度系数,用于表示线损偏度系数的度量数据在中心聚集程度;
构建DLSTM-RF模型,DLSTM-RF模型用于通过相关数据集,生成用户窃电预测模型;
通过相关数据集,对DLSTM-RF模型进行训练,生成用户窃电预测模型,用户窃电预测模型用于对电网系统中的信息进行分析和学习,找出窃电用户,并通过对窃电用户进行治理,降低不必要的电力生产。
优选地,在构建相关数据集的过程中,平均线损率表示为:
Figure BDA0003446368360000031
其中,V1表示平均线损率,V1i表示第i天的线损率。
优选地,在构建相关数据集的过程中,线损率标准差越小表示大部分实际数据和平均线损率之间差异越小,线损率标准差表示为:
Figure BDA0003446368360000032
优选地,在构建相关数据集的过程中,如果变化趋势与线路线损成正比,则线损率越大代表用户窃电漏电的可能性越大;
线损变化趋势为:
Figure BDA0003446368360000033
其中,
Figure BDA0003446368360000034
为线损对象前半段时间内的线损率平均值,
Figure BDA0003446368360000035
为线损对象后半段时间内的线损率平均值,V3为线损率变化趋势。
优选地,在构建相关数据集的过程中,线损峰度系数为:
Figure BDA0003446368360000041
其中,V4是线损率的峰度系数,V1i是第i天线损率。
优选地,在构建相关数据集的过程中,线损偏度系数为:
Figure BDA0003446368360000042
其中,V5是线损率的偏度系数,V1mid是线损率的中位数,中位数表示线路线损分布的中心位置。
优选地,在对DLSTM-RF模型进行训练的过程中,还包括通过少类样本合成过采样方法对相关数据集进行预处理,预处理用于消除了数据比例失衡的问题,预处理的过程包括以下步骤:
基于相关数据集的少数类样本,以欧氏距离为标准,获取少数类样本与相关数据集的其他样本的距离,得到少数类样本的k近邻;
根据样本不平衡比例,通过设置采样比例,依据少数类样本,从 k近邻中随机选择若干个近邻样本进行处理后,进行归一化处理,生成DLSTM-RF模型的输入数据,其中,
若干个近邻样本的处理过程为:
cnew=c+rand(0,1)×(c(i)-c)
式中,cnew表示用于构建输入数据的新样本,c表示近邻样本,i 表示近邻样本的数量;
行归一化处理的过程为:
Figure BDA0003446368360000051
其中,max(V)和min(V)分别代表数据样本中的数据最大值和最小值。
优选地,在构建DLSTM-RF模型的过程中,DLSTM-RF模型由DLSTM 神经网络以及用于优化DLSTM神经网络的RF算法组成;
DLSTM神经网络的状态更新方式为:
Figure BDA0003446368360000052
Figure BDA0003446368360000053
Figure BDA0003446368360000054
Figure BDA0003446368360000055
Figure BDA0003446368360000056
其中,Υ为DLSTM神经网络的层数,b为偏移项,Wi,γ,Wf,γ,Wo,γ,Wc,γ表示与当前输入的负荷数据的连接权重,Vi,Υ,Vf,Υ,Vo,Υ,Vc,Υ表示与前一时刻输出的负荷数据的连接权重,下标i,f,o分别表示DLSTM神经网络的输入门、遗忘门、输出门,下标c表示DLSTM神经网络的外部状态,
Figure BDA0003446368360000057
表示内积运算,σ表示sigmod函数。
优选地,用户窃电检测方法还用于通过用户端,实现电信息和碳信息的转换,转换的过程为:
Tout=E·0.997(kg)
Coui=E·0.272(kg)
其中,E代表定位窃电用户后所减少的不必要的产电量;Tout代表减排的二氧化碳量;Cout代表减排的碳量。
本发明还提供了一种基于DLSTM-RF的用户窃电检测系统,包括:
数据采集与处理模块,用于通过采集某地指定时段相关历史数据,构建相关数据集,相关数据集用于作为DLSTM-RF模型的输入数据,对DLSTM-RF模型进行训练,生成用户窃电预测模型,其中,相关数据集包括:
线损率,用于表示线路损耗的电能和供电量的比值;
平均线损率,用于表示多条线路的线损率的平均值;
线损率标准差,用于表示线损率的离散程度由线损率展现;
线损变化趋势,用于表示线损的变化趋势,通过变化趋势表示用户窃电漏电的可能性;
线损偏度系数,用于表示线路线损分布偏移中心位置的程度;
线损峰度系数,用于表示线损偏度系数的度量数据在中心聚集程度;
窃电用户检测模块,用于构建DLSTM-RF模型,DLSTM-RF模型用于通过相关数据集,生成用户窃电预测模型;通过相关数据集,对 DLSTM-RF模型进行训练,生成用户窃电预测模型,用户窃电预测模型用于对电网系统中的信息进行分析和学习,找出窃电用户,并通过对窃电用户进行治理,降低不必要的电力生产;
碳排放数据转换模块,用于通过定位窃电用户后所减少的不必要的产电量,并将产电量转化为碳排放量。
与现有技术相比,本发明公开了以下技术效果:
本发明对数据集中窃电用户信息和普通用户信息量不对等的情况用SMOTE算法进行解决,从而避免预测结果偏向样本数较多的类别的情况。解决了因此导致预测模型的泛化能力降低,严重影响模型的性能的问题。
本发明利用DLSTM算法对用户的特征值进行自动提取,然后用 RF算法将窃电用户和普通用户进行分类,对两个算法进行融合,得到一种新的DLSTM-RF窃电用户预测模型。
本发明给出了用户的窃电信息和碳排放信息的转换公式,实现从用电信息到减碳信息的跨越,为实现电网用户侧控碳提供了一定的参考。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所述的LSTM神经元结构图;
图2为本发明实施例所述的DLSTM神经元结构图;
图3为本发明实施例所述的用户窃电检测模型原理图;
图4为本发明实施例所述的DLSTM-RF模型训练流程图。
具体实施方式
下为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1-4所示,本发明提供了一种基于DLSTM-RF的用户窃电检测方法,包括以下步骤:
构建相关数据集,相关数据集用于作为DLSTM-RF模型的输入数据,对DLSTM-RF模型进行训练,生成用户窃电预测模型,其中,相关数据集包括:
线损率,用于表示线路损耗的电能和供电量的比值;
平均线损率,用于表示多条线路的线损率的平均值;
线损率标准差,用于表示线损率的离散程度由线损率展现;
线损变化趋势,用于表示线损的变化趋势,通过变化趋势表示用户窃电漏电的可能性;
线损偏度系数,用于表示线路线损分布偏移中心位置的程度;
线损峰度系数,用于表示线损偏度系数的度量数据在中心聚集程度;
构建DLSTM-RF模型,DLSTM-RF模型用于通过相关数据集,生成用户窃电预测模型;
通过相关数据集,对DLSTM-RF模型进行训练,生成用户窃电预测模型,用户窃电预测模型用于对电网系统中的信息进行分析和学习,找出窃电用户,并通过对窃电用户进行治理,降低不必要的电力生产。
进一步优选地,在构建相关数据集的过程中,平均线损率表示为:
Figure BDA0003446368360000091
其中,V1表示平均线损率,V1i表示第i天的线损率。
进一步优选地,在构建相关数据集的过程中,线损率标准差越小表示大部分实际数据和平均线损率之间差异越小,线损率标准差表示为:
Figure BDA0003446368360000092
进一步优选地,在构建相关数据集的过程中,如果变化趋势与线路线损成正比,则线损率越大代表用户窃电漏电的可能性越大;
线损变化趋势为:
Figure BDA0003446368360000093
其中,
Figure BDA0003446368360000094
为线损对象前半段时间内的线损率平均值,
Figure BDA0003446368360000095
为线损对象后半段时间内的线损率平均值,V3为线损率变化趋势。
进一步优选地,在构建相关数据集的过程中,线损峰度系数为:
Figure BDA0003446368360000101
其中,V4是线损率的峰度系数,V1i是第i天线损率。
进一步优选地,在构建相关数据集的过程中,线损偏度系数为:
Figure BDA0003446368360000102
其中,V5是线损率的偏度系数,V1mid是线损率的中位数,中位数表示线路线损分布的中心位置。
进一步优选地,在对DLSTM-RF模型进行训练的过程中,还包括通过少类样本合成过采样方法对相关数据集进行预处理,预处理用于消除了数据比例失衡的问题,预处理的过程包括以下步骤:
基于相关数据集的少数类样本,以欧氏距离为标准,获取少数类样本与相关数据集的其他样本的距离,得到少数类样本的k近邻;
根据样本不平衡比例,通过设置采样比例,依据少数类样本,从 k近邻中随机选择若干个近邻样本进行处理后,进行归一化处理,生成DLSTM-RF模型的输入数据,其中,
若干个近邻样本的处理过程为:
cnew=c+rand(0,1)×(c(i)-c)
式中,cnew表示用于构建输入数据的新样本,c表示近邻样本,i 表示近邻样本的数量;
行归一化处理的过程为:
Figure BDA0003446368360000103
其中,max(V)和min(V)分别代表数据样本中的数据最大值和最小值。
进一步优选地,在构建DLSTM-RF模型的过程中,DLSTM-RF模型由DLSTM神经网络以及用于优化DLSTM神经网络的RF算法组成;
DLSTM神经网络的状态更新方式为:
Figure BDA0003446368360000111
Figure BDA0003446368360000112
Figure BDA0003446368360000113
Figure BDA0003446368360000114
Figure BDA0003446368360000115
其中,Υ为DLSTM神经网络的层数,b为偏移项,Wi,γ,Wf,γ,Wo,γ,Wc,γ表示与当前输入的负荷数据的连接权重,Vi,γ,Vf,γ,Vo,γ,Vc,γ表示与前一时刻输出的负荷数据的连接权重,下标i,f,o分别表示DLSTM神经网络的输入门、遗忘门、输出门,下标c表示DLSTM神经网络的外部状态,
Figure BDA0003446368360000116
表示内积运算,σ表示sigmod函数。
进一步优选地,用户窃电检测方法还用于通过用户端,实现电信息和碳信息的转换,转换的过程为:
Tout=E·0.997(kg)
Cout=E·0.272(kg)
其中,E代表定位窃电用户后所减少的不必要的产电量;Tout代表减排的二氧化碳量;Cout代表减排的碳量。
本发明还提供了一种基于DLSTM-RF的用户窃电检测系统,包括:
数据采集与处理模块,用于通过采集某地指定时段相关历史数据,构建相关数据集,相关数据集用于作为DLSTM-RF模型的输入数据,对DLSTM-RF模型进行训练,生成用户窃电预测模型,其中,相关数据集包括:
线损率,用于表示线路损耗的电能和供电量的比值;
平均线损率,用于表示多条线路的线损率的平均值;
线损率标准差,用于表示线损率的离散程度由线损率展现;
线损变化趋势,用于表示线损的变化趋势,通过变化趋势表示用户窃电漏电的可能性;
线损偏度系数,用于表示线路线损分布偏移中心位置的程度;
线损峰度系数,用于表示线损偏度系数的度量数据在中心聚集程度;
窃电用户检测模块,用于构建DLSTM-RF模型,DLSTM-RF模型用于通过相关数据集,生成用户窃电预测模型;通过相关数据集,对 DLSTM-RF模型进行训练,生成用户窃电预测模型,用户窃电预测模型用于对电网系统中的信息进行分析和学习,找出窃电用户,并通过对窃电用户进行治理,降低不必要的电力生产;
碳排放数据转换模块,用于通过定位窃电用户后所减少的不必要的产电量,并将产电量转化为碳排放量。
实施例1:随着“双碳”政策的提出以及电网的飞速发展,工业窃电行为会造成额外的碳排放,所以本发明从负荷端窃电展开研究。首先本发明就用户信息中,窃电用户信息和普通用户信息间信息量不平衡的问题进行了预处理,解决了比例大的样本造成过拟合,预测结果偏向样本数较多的类别,导致预测模型的泛化能力降低,严重影响模型的性能的问题。接着提出了一种深度长短期记忆神经网络 (DLSTM)和随机森林(RF)相融合的算法,先对DLSTM模型进行训练,在得到最优结果的基础上,修剪并保留模型参数,再通过RF算法对所提取的特征再次训练模型,最终得到DLSTM-RF窃电预测模型。最后将排除窃电用户后所减少的产电量与碳排放量进行转换,实现从电数据到碳排放数据的跨越。本发明为窃电用户的查找提供了一种精准有效的方法,同时也推动“双碳”目标的实现。
1、数据采集:
本发明采集某地指定时段相关历史数据来建立用户窃电预测模型。构建相关数据集,获取平均线损率、线损率标准差、线损变化趋势、线损峰度、线损偏度作为模型分析指标。
(1)平均线损率:
线损率是线路损耗的电能和供电量的比值;线损率是衡量电网经济效益的重要标准之一。平均线损率是指多条线路的线损率的平均值。
Figure BDA0003446368360000131
V1是平均线损率,V1i是第i天的线损率。
(2)线损率标准差:
线损率的离散程度由线损率展现,线损率标准差越小表示大部分实际数据和平均线损率之间差异越小;
Figure BDA0003446368360000141
V2为线损率标准差。
(3)线损变化趋势:
如果线损的变化趋势与线路线损成正比,线损率越大代表用户窃电漏电的可能性越大。
Figure BDA0003446368360000142
Figure BDA0003446368360000143
为线损对象前半段时间内的线损率平均值,
Figure BDA0003446368360000144
为线损对象后半段时间内的线损率平均值,V3为线损率变化趋势。
(4)线损峰度系数:
峰度系数用来线损偏度系数度量数据在中心聚集程度,记为V4,描述总体中所有取值分布形态陡缓程度的统计量。
Figure BDA0003446368360000145
V4是线损率的峰度系数,V1是平均线损率,V1i是第i天线损率。
(5)线损偏度系数
线损偏度系数反映线路线损分布偏移中心位置的程度,偏度系数是描述分布偏离对称性程度的一个特征数。偏度系数表现
Figure BDA0003446368360000146
V5是线损率的偏度系数,V1mid是线损率的中位数。
设所有特征变量的历史数据集为V,则该数据集可以表示为
V=[V1 V2 V3...Vk...Vm] (6)
其中,式(1)中Vk表示第k(1≤k≤m)个特征变量,m为负荷预测所考虑的特征变量维数,在本发明中m为5.
进一步构造相关数据集。例如式(1)中的第k个特征变量Vk可以进一步的表示为
Figure BDA0003446368360000151
其中,
Figure BDA0003446368360000152
表示第k个特征变量第j(1≤j≤n)个时间点的历史数据,n为特征变量Vk的时间长度。
2、数据预处理:
在电力系统中,工业窃电会导致大量的电力损耗,从而产生额外的碳排放。由于电力盗窃很难获得恶意窃电数据样本,恶意客户的窃电数据和诚实用户的用电数据比例严重失衡。这会对比例大的样本造成过拟合,预测结果偏向样本数较多的类别。因此导致预测模型的泛化能力降低,严重影响模型的性能。
为了解决这个问题,本发明采取少类样本合成过采样技术算法 (SMOTE),使待训练的数据集中窃电用户样本数量和正常用户样本数量相等。其算法基本原理:
1)对于少数类M中的每一个样本m,以欧氏距离为标准,计算它到少数类集中所有样本的距离,得到其k近邻;
2)根据样本不平衡比例设置一个采样比例以确定采样倍率s,对于每一个少数类样本m,从其k近邻中随机选择s个近邻样本,假设选择的近邻样本为c(1),c(2),…,c(s)
3)对于每一个随机选出的近邻样本c(i)(i=1,2,…,s),按如下公式构建新样本:cnew=c+rand(0,1)×(c(i)-c)。此外为了使网络快速收敛和避免数值问题,对用电量数据进行归一化处理,如式 (1)所示:
Figure BDA0003446368360000161
其中max(V)和min(V)分别代表数据样本中的数据最大值和最小值。通过上述方法对数据集进行处理,消除了数据比例失衡的问题。
3、基于DLSTM-RF的用户侧窃电检测方法:
3.1、DLSTM模型:
本发明采用的DLSTM神经网络,它是由多层LSTM神经网络进行顺序堆叠构成的神经网络。因为LSTM神经网络可以控制神经网络中传递的信息是否保存,并且可以控制将这些信息保存多少到记忆存储单元中。因为LSTM可以学习跨度较长的依赖关系,避免梯度爆炸等问题的出现。而为了使得挖掘的信息更加的全面,本发明采用了DLSTM 神经网络。
LSTM神经元结构图如下:
如图1所示,LSTM主要由输入门i(t)、遗忘门f(t)以及输出门 o(t)组成,其中t为时间节点。有多少新输入的数据存储在内部状态中主要是由输入门来决定的。有多少过去的信息需要丢弃主要由遗忘门控制的。在当前时刻内部状态中有多少信息需要输出到外部状态主要由输出门控制。另外,图中的当前时刻神经元的内部状态为h(t);当前时刻的外部状态为c(t);当前时刻的外部输入为x(t);激活层函数为σ。
DLSTM神经元的结构图如图2所示,该神经网络每一层网络的隐藏层的输入为上一层网络的输出。此时,假设DLSTM神经网络的层数为Υ,则Υ层DLSTM神经网络的状态更新方式如下表示:
Figure BDA0003446368360000171
Figure BDA0003446368360000172
Figure BDA0003446368360000173
Figure BDA0003446368360000174
Figure BDA0003446368360000175
其中,b为偏移项;Wi,Υ,Wf,Υ,Wo,Υ,Wc,Υ表示与当前输入的负荷数据的连接权重;Vi,Υ,Vf,Υ,Vo,Υ,Vc,Υ表示与前一时刻输出的负荷数据的连接权重;下标i,f,o分别对应上文中所提及的输入门、遗忘门、输出门,下标c对应外部状态;
Figure BDA0003446368360000176
表示内积运算;σ表示的是sigmod函数。
3.2、RF模型:
随着电力行业的不断发展,供电公司已经获取了大量的用户用电数据,通过分析这个历史数据可以很好的学习到用户的用电行为特征。利用窃电行为分析模型可以有效的对窃电用户进行定位,从而有效的减少窃电行为以及窃电行为带来的危害。
本发明在DLSTM窃电分析模型的基础上使用RF算法对模型进行优化。先采用DLSTM对智能电表的用户特征进行提取,修剪并保留模型参数,再通过随机森林算法对所提取的特征再次进行训练,从而得到DLSTM-RF模型;用户窃电检测模型原理图如图3所示。
4、碳排放数据转换
本发明使用DLSTM-RF模型对电网系统中的信息进行分析和学习,找出可疑窃电用户,对可疑窃电用户进行治理,可以有效的降低不必要的电力生产。电力生产的过程中会产生碳排放,所以本发明从用户端入手,实现电信息和碳信息的转换。
Tout=E·0.997(kg) (14)
Cout=E·0.272(kg) (15)
其中E代表定位窃电用户后所减少的不必要的产电量;Tout代表减排的二氧化碳量;Cout代表减排的碳量。
本发明对数据集中窃电用户信息和普通用户信息量不对等的情况用SMOTE算法进行解决,从而避免预测结果偏向样本数较多的类别的情况。解决了因此导致预测模型的泛化能力降低,严重影响模型的性能的问题。
本发明利用DLSTM算法对用户的特征值进行自动提取,然后用 RF算法将窃电用户和普通用户进行分类,对两个算法进行融合,得到一种新的DLSTM-RF窃电用户预测模型。
本发明给出了用户的窃电信息和碳排放信息的转换公式,实现从用电信息到减碳信息的跨越,为实现电网用户侧控碳提供了一定的参考。

Claims (9)

1.一种基于DLSTM-RF的用户窃电检测方法,其特征在于,包括以下步骤:
构建相关数据集,所述相关数据集用于作为DLSTM-RF模型的输入数据,对所述DLSTM-RF模型进行训练,生成用户窃电预测模型,其中,所述相关数据集包括:
线损率,用于表示线路损耗的电能和供电量的比值;
平均线损率,用于表示多条线路的所述线损率的平均值;
线损率标准差,用于表示所述线损率的离散程度由线损率展现,线损率标准差越小表示大部分实际数据和平均线损率之间差异越小;
线损变化趋势,用于表示线损的变化趋势,通过所述变化趋势表示用户窃电漏电的可能性;
线损偏度系数,用于表示线路线损分布偏移中心位置的程度;
线损峰度系数,用于表示所述线损偏度系数的度量数据在中心聚集程度;
构建所述DLSTM-RF模型,所述DLSTM-RF模型用于通过所述相关数据集,生成所述用户窃电预测模型;
通过所述相关数据集,对所述DLSTM-RF模型进行训练,生成所述用户窃电预测模型,所述用户窃电预测模型用于对电网系统中的信息进行分析和学习,找出窃电用户,并通过对所述窃电用户进行治理,降低不必要的电力生产;
在构建所述DLSTM-RF模型的过程中,所述DLSTM-RF模型由DLSTM神经网络以及用于优化所述DLSTM神经网络的RF算法组成;
所述DLSTM神经网络的状态更新方式为:
Figure DEST_PATH_IMAGE001
其中,γ为DLSTM神经网络的层数,b为偏移项,Wi,γ,Wf,γ,Wo,γ,Wc,γ表示与当前输入的负荷数据的连接权重;Vi,γ,Vf,γ,Vo,γ,Vc,γ表示与前一时刻输出的负荷数据的连接权重;下标i,f,o分别表示DLSTM神经网络的输入门、遗忘门、输出门,下标c表示DLSTM神经网络的外部状态,⊗表示内积运算,σ表示sigmod函数;
DLSTM窃电分析模型采用DLSTM神经网络;所述DLSTM神经网络是由多层LSTM神经网络进行顺序堆叠构成;所述LSTM神经网络用于控制神经网络中传递的信息是否保存,并且可以控制将这些所述信息保存多少到记忆存储单元中;所述LSTM神经网络的LSTM神经元结构包括输入门i(t)、遗忘门f(t)以及输出门o(t),其中t为时间节点;所述输入门i(t)用于决定内部状态中新输入的数据存储量;所述遗忘门f(t)用于控制需要丢弃的历史信息量;所述输出门o(t)用于控制当前时刻内部状态中需要输出到外部状态的信息量;基于所述DLSTM窃电分析模型提取智能电表的用户特征,获得模型参数;修剪并保留所述模型参数;基于随机森林算法RF再次训练所述智能电表的用户特征,构建所述DLSTM-RF模型。
2.根据权利要求1所述一种基于DLSTM-RF的用户窃电检测方法,其特征在于:
在构建相关数据集的过程中,所述平均线损率表示为:
Figure DEST_PATH_IMAGE002
其中,V1表示平均线损率,V1i表示第i天的线损率。
3.根据权利要求2所述一种基于DLSTM-RF的用户窃电检测方法,其特征在于:
在构建相关数据集的过程中,所述线损率标准差越小表示大部分实际数据和所述平均线损率之间差异越小,所述线损率标准差表示为:
Figure DEST_PATH_IMAGE003
4.根据权利要求3所述一种基于DLSTM-RF的用户窃电检测方法,其特征在于:
在构建相关数据集的过程中,如果所述变化趋势与所述线路线损成正比,则所述线损率越大代表用户窃电漏电的可能性越大;
所述线损变化趋势为:
Figure DEST_PATH_IMAGE004
其中,
Figure DEST_PATH_IMAGE005
为线损对象前半段时间内的线损率平均值,
Figure DEST_PATH_IMAGE006
为线损对象后半段时间内的线损率平均值,V3为线损率变化趋势。
5.根据权利要求4所述一种基于DLSTM-RF的用户窃电检测方法,其特征在于:
在构建相关数据集的过程中,所述线损峰度系数为:
Figure DEST_PATH_IMAGE007
其中,V4是线损率的峰度系数,V1i是第i天线损率。
6.根据权利要求5所述一种基于DLSTM-RF的用户窃电检测方法,其特征在于:
在构建相关数据集的过程中,所述线损偏度系数为:
Figure DEST_PATH_IMAGE008
其中,V5是线损率的偏度系数,V1mid是线损率的中位数,所述中位数表示线路线损分布的中心位置。
7.根据权利要求6所述一种基于DLSTM-RF的用户窃电检测方法,其特征在于:
在对所述DLSTM-RF模型进行训练的过程中,还包括通过少类样本合成过采样方法对所述相关数据集进行预处理,所述预处理用于消除了数据比例失衡的问题,所述预处理的过程包括以下步骤:
基于所述相关数据集的少数类样本,以欧氏距离为标准,获取所述少数类样本与所述相关数据集的其他样本的距离,得到所述少数类样本的k近邻;
根据样本不平衡比例,通过设置采样比例,依据所述少数类样本,从所述k近邻中随机选择若干个近邻样本进行处理后,进行归一化处理,生成所述DLSTM-RF模型的所述输入数据,其中,
若干个所述近邻样本的处理过程为:
cnew= c + rand(0,1)×(c(i)-c)
式中,cnew表示用干构建所述输入数据的新样本,c表示近邻样本,i表示近邻样本的数量;采取少类样本合成过采样技术算法(SMOTE),使待训练的数据集中窃电用户样本数量和正常用户样本数量相等;其算法基本原理:1)对于少数类M中的每一个样本m,以欧氏距离为标准,计算它到少数类集中所有样本的距离,得到其k近邻;2)根据样本不平衡比例设置一个采样比例以确定采样倍率s,对于每一个少数类样本m,从其k近邻中随机选择s个近邻样本,假设选择的近邻样本为c(1),c(2),…,c(s);3)对于每一个随机选出的近邻样本c(i)(i=1,2,…,s),按如下公式构建新样本:cnew=c+rand(0,1)×(c(i)-c);
所述行归一化处理的过程为:
Figure DEST_PATH_IMAGE009
其中,max(V)和min(V)分别代表数据样本中的数据最大值和最小值。
8.根据权利要求1所述一种基于DLSTM-RF的用户窃电检测方法,其特征在于:
所述用户窃电检测方法还用于通过用户端,实现电信息和碳信息的转换,所述转换的过程为:
Figure DEST_PATH_IMAGE010
其中,E代表定位窃电用户后所减少的不必要的产电量;Tout代表减排的二氧化碳量;Cout代表减排的碳量。
9.一种基于DLSTM-RF的用户窃电检测系统,其特征在于,包括:数据采集与处理模块,用于通过采集某地指定时段相关历史数据,构建相关数据集,所述相关数据集用于作为DLSTM-RF模型的输入数据,对所述DLSTM-RF模型进行训练,生成用户窃电预测模型,其中,所述相关数据集包括:
线损率,用于表示线路损耗的电能和供电量的比值;
平均线损率,用于表示多条线路的所述线损率的平均值;
线损率标准差,用于表示所述线损率的离散程度由线损率展现,线损率标准差越小表示大部分实际数据和平均线损率之间差异越小;
线损变化趋势,用于表示线损的变化趋势,通过所述变化趋势表示用户窃电漏电的可能性;
线损偏度系数,用于表示线路线损分布偏移中心位置的程度;
线损峰度系数,用于表示所述线损偏度系数的度量数据在中心聚集程度;
窃电用户检测模块,用于构建所述DLSTM-RF模型,所述DLSTM-RF模型用于通过所述相关数据集,生成所述用户窃电预测模型;通过所述相关数据集,对所述DLSTM-RF模型进行训练,生成所述用户窃电预测模型,所述用户窃电预测模型用于对电网系统中的信息进行分析和学习,找出窃电用户,并通过对所述窃电用户进行治理,降低不必要的电力生产;
碳排放数据转换模块,用于通过定位窃电用户后减少不必要的产电量,并将所述产电量转化为碳排放量;
DLSTM窃电分析模型采用DLSTM神经网络;所述DLSTM神经网络是由多层LSTM神经网络进行顺序堆叠构成;所述LSTM神经网络用于控制神经网络中传递的信息是否保存,并且可以控制将这些所述信息保存多少到记忆存储单元中;所述LSTM神经网络的LSTM神经元结构包括输入门i(t)、遗忘门f(t)以及输出门o(t),其中t为时间节点;所述输入门i(t)用于决定内部状态中新输入的数据存储量;所述遗忘门f(t)用于控制需要丢弃的历史信息量;所述输出门o(t)用于控制当前时刻内部状态中需要输出到外部状态的信息量;所述DLSTM神经网络每一层网络的隐藏层的输入为上一层网络的输出;假设所述DLSTM神经网络的层数为Υ,则Υ层所述DLSTM神经网络的状态更新方式如下表示:
Figure DEST_PATH_IMAGE011
其中,γ为DLSTM神经网络的层数,b为偏移项,Wi,γ,Wf,γ,Wo,γ,Wc,γ表示与当前输入的负荷数据的连接权重;Vi,γ,Vf,γ,Vo,γ,Vc,γ表示与前一时刻输出的负荷数据的连接权重;下标i,f,o分别表示所述DLSTM神经网络的输入门、遗忘门、输出门,下标c表示所述DLSTM神经网络的外部状态,⊗表示内积运算,σ表示sigmod函数;基于所述DLSTM窃电分析模型提取智能电表的用户特征,获得模型参数;修剪并保留所述模型参数;基于随机森林算法RF再次训练所述智能电表的用户特征,构建所述DLSTM-RF模型。
CN202111657488.1A 2021-12-30 2021-12-30 一种基于dlstm-rf的用户窃电检测方法及系统 Active CN114266925B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111657488.1A CN114266925B (zh) 2021-12-30 2021-12-30 一种基于dlstm-rf的用户窃电检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111657488.1A CN114266925B (zh) 2021-12-30 2021-12-30 一种基于dlstm-rf的用户窃电检测方法及系统

Publications (2)

Publication Number Publication Date
CN114266925A CN114266925A (zh) 2022-04-01
CN114266925B true CN114266925B (zh) 2022-09-30

Family

ID=80832057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111657488.1A Active CN114266925B (zh) 2021-12-30 2021-12-30 一种基于dlstm-rf的用户窃电检测方法及系统

Country Status (1)

Country Link
CN (1) CN114266925B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520357A (zh) * 2018-04-10 2018-09-11 北京中电普华信息技术有限公司 一种线损异常原因的判别方法、装置及服务器
CN109212519A (zh) * 2018-08-27 2019-01-15 西安电子科技大学 基于bf-dlstm的窄带雷达目标跟踪方法
CN109657874A (zh) * 2018-12-29 2019-04-19 安徽数升数据科技有限公司 一种基于长短时记忆模型的电力中长期负荷预测方法
CN111260249A (zh) * 2020-02-13 2020-06-09 武汉大学 一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置
CN112098714A (zh) * 2020-08-12 2020-12-18 国网江苏省电力有限公司南京供电分公司 一种基于ResNet-LSTM的窃电检测方法及系统
CN112698072A (zh) * 2020-12-11 2021-04-23 国网辽宁省电力有限公司鞍山供电公司 一种数据驱动的防窃电智能电表及窃电状态分析方法
WO2021100193A1 (ja) * 2019-11-22 2021-05-27 日本電信電話株式会社 腐食速度推定装置とその方法
CN113051837A (zh) * 2021-04-25 2021-06-29 华北电力大学 一种基于气象参数的dlstm电力负荷预测方法和装置
CN113377827A (zh) * 2021-04-30 2021-09-10 西安电子科技大学 一种基于Conv-LSTM网络的窃电检测方法和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108710516A (zh) * 2018-05-29 2018-10-26 Oppo广东移动通信有限公司 预测样本的采集方法、装置、存储介质及智能终端
CN109753989A (zh) * 2018-11-18 2019-05-14 韩霞 基于大数据与机器学习的电力用户窃电行为分析方法
FI129933B (en) * 2019-11-04 2022-11-15 Elisa Oyj Management of communication network prediction models

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520357A (zh) * 2018-04-10 2018-09-11 北京中电普华信息技术有限公司 一种线损异常原因的判别方法、装置及服务器
CN109212519A (zh) * 2018-08-27 2019-01-15 西安电子科技大学 基于bf-dlstm的窄带雷达目标跟踪方法
CN109657874A (zh) * 2018-12-29 2019-04-19 安徽数升数据科技有限公司 一种基于长短时记忆模型的电力中长期负荷预测方法
WO2021100193A1 (ja) * 2019-11-22 2021-05-27 日本電信電話株式会社 腐食速度推定装置とその方法
CN111260249A (zh) * 2020-02-13 2020-06-09 武汉大学 一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置
CN112098714A (zh) * 2020-08-12 2020-12-18 国网江苏省电力有限公司南京供电分公司 一种基于ResNet-LSTM的窃电检测方法及系统
CN112698072A (zh) * 2020-12-11 2021-04-23 国网辽宁省电力有限公司鞍山供电公司 一种数据驱动的防窃电智能电表及窃电状态分析方法
CN113051837A (zh) * 2021-04-25 2021-06-29 华北电力大学 一种基于气象参数的dlstm电力负荷预测方法和装置
CN113377827A (zh) * 2021-04-30 2021-09-10 西安电子科技大学 一种基于Conv-LSTM网络的窃电检测方法和系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Detection of electricity theft using data processing and LSTM method in distribution systems;BEHCET KOCAMAN 等;《Sadhana》;20201118;1-10 *
LSTM integrated with Boruta-random forest optimiser for soil moisture estimation under RCP4.5 and RCP8.5 global warming scenarios;A. A. Masrur Ahmed 等;《Stochastic Environmental Research and Risk Assessment》;20210112;1851-1881 *
基于Bagging二次加权集成的孤立森林窃电检测算法;李国成 等;《电力系统自动化》;20210902;1-19 *
基于IEEE14节点模型的电气参量分析与窃电指标判别;沈鑫 等;《软件》;20181231;第39卷(第12期);141-145 *
基于改进的灰色关联分析与LSTM的1000kV特高压线损预测;杨建华 等;《电工技术 高压与绝缘技术》;20201010;131-136 *
基于用电信息采集系统的防窃电方法及应用;程金;《中国优秀硕士论文全文数据库 工程科技Ⅱ辑》;20200215;摘要 *

Also Published As

Publication number Publication date
CN114266925A (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
CN111368904B (zh) 一种基于电力指纹的电器设备识别方法
CN110929918A (zh) 一种基于CNN和LightGBM的10kV馈线故障预测方法
CN111753893A (zh) 一种基于聚类和深度学习的风电机组功率集群预测方法
CN112087442B (zh) 基于注意力机制的时序相关网络入侵检测方法
CN113469253A (zh) 一种基于三元组孪生网络的窃电检测方法
CN111525587B (zh) 一种基于无功负荷态势的电网无功电压控制方法及系统
CN111273125A (zh) 基于rst-cnn的电力电缆沟道故障诊断方法
CN108520310A (zh) 基于G-L混合噪声特性v-支持向量回归机的风速预报方法
CN112016748A (zh) 一种稳控装置运行状态的动态分析与量化评估方法
CN114266925B (zh) 一种基于dlstm-rf的用户窃电检测方法及系统
CN117113202A (zh) 基于联合误差堆叠模型的电力回路能耗检测方法及设备
CN112363012A (zh) 一种电网故障预警装置及方法
CN111738483A (zh) 基于聚类和深层信念网络的电网降损优化方法及系统
Zhang et al. An abnormal behavior detection based on deep learning
CN110349050A (zh) 一种基于电网参数关键特征抽取的智能窃电判据方法及装置
CN115293249A (zh) 一种基于动态时序预测的电力系统典型场景概率预测方法
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
Chen et al. Accounting information disclosure and financial crisis beforehand warning based on the artificial neural network
Zhang et al. Intrusion detection model for industrial internet of things based on improved autoencoder
CN114861977A (zh) 一种面向不均衡电力数据的蒸馏集成模式感知算法及系统
Zhenhao et al. Prediction of wind power ramp events based on deep neural network
CN113191409A (zh) 标签数据扩充与深度学习的居民异常用电行为检测方法
Chen et al. Ensembling-mRBF-LSTM framework for prediction of abnormal traffic flows
Zhang et al. Construction and Application of VS-DBN Antitheft Diagnosis Model Based on Neural Architecture Search
CN117439146B (zh) 充电桩的数据分析控制方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant