CN114266925B

CN114266925B - 一种基于dlstm-rf的用户窃电检测方法及系统

Info

Publication number: CN114266925B
Application number: CN202111657488.1A
Authority: CN
Inventors: 龚钢军; 孟芷若; 杨佳轩; 袁琳琳; 陆俊; 武昕; 苏畅
Original assignee: North China Electric Power University
Current assignee: North China Electric Power University
Priority date: 2021-12-30
Filing date: 2021-12-30
Publication date: 2022-09-30
Anticipated expiration: 2041-12-30
Also published as: CN114266925A

Abstract

本发明公开了一种基于DLSTM‑RF的用户窃电检测方法及系统，包括：构建相关数据集，相关数据集用于作为DLSTM‑RF模型的输入数据，对DLSTM‑RF模型进行训练，生成用户窃电预测模型；构建DLSTM‑RF模型，DLSTM‑RF模型用于通过相关数据集，生成用户窃电预测模型；通过相关数据集，对DLSTM‑RF模型进行训练，生成用户窃电预测模型，用户窃电预测模型用于对电网系统中的信息进行分析和学习，找出窃电用户，并通过对窃电用户进行治理，降低不必要的电力生产；本发明通过检测用户的窃电信息并与碳排放信息的进行转换，实现从用电信息到减碳信息的跨越，为实现电网用户侧控碳提供了一定的参考。

Description

一种基于DLSTM-RF的用户窃电检测方法及系统

技术领域

本申请涉及窃电监测技术领域，具体而言，涉及一种基于 DLSTM-RF的用户窃电检测方法及系统。

背景技术

随着社会经济的飞速发展，全球的碳排放问题也日渐严峻。近年来,低碳结构性变革要求紧迫,我们现在所面临的减排总量大，时间紧的挑战。能源燃烧的二氧化碳排放是97亿吨，占比为 88％，电力行业约39亿吨，占比约35％。电力行业碳水平直接影响碳减排国际承诺的落实。

碳排放问题是制约着社会发展的全球性问题，我国低碳结构性变革要求紧迫，而电力行业碳水平直接影响碳减排国际承诺的落实。电网台区窃电是造成线损的主要原因之一。由于台区窃电量巨大，不仅造成了重大的经济损失，还额外造成了大量的碳排放。

目前所研究的窃电检测方法主要可分为状态检测和人工智能两类，其中人工智能的方法主要是利用机器学习和深度学习技术对智能电表获取的样本数据训练分类器，然后对非法用电行为进行判别，操作复杂度适中。但是，很多机器学习方法对于高维数据需要手动进行特征选择，包括最值、均值、方差、标准差等，手动特征提取既繁琐又耗时，且对智能表中的二维数据进行特征提取较为困难。相比之下，深度学习技术对于特征提取操作简单且判别准确率高，具有更大的优势及发展前景，越来越多的学者将其引入到窃电检测上来。

目前对于窃电检测已有一定的研究成果，基于用电信息采集系统的研究主要有两类：第一类是抽取、提炼用电负荷曲线，从中提取用电特征再对其进行分析。第二类是基于用户用电过程中产生的电参量记录，从与其有关的时间序列中选取征，将其描述为样本点后再进行分析。目前有基于深度学习的用户异常用电模式检测模型，构建了特征提取网络和多层特征匹配网络，具有较高的准确性，但是对于如何将用户的窃电信息和碳排放信息进行转换，实现从用电信息到减碳信息的跨越技术并没有相关报导，因此，急需一种可以将窃电信息和碳排放信息进行关联的技术方案，用于解决现有的技术问题。

发明内容

为了解决上述问题，本发明提供了一种基于DLSTM-RF的用户窃电检测方法，包括以下步骤：

构建相关数据集，相关数据集用于作为DLSTM-RF模型的输入数据，对DLSTM-RF模型进行训练，生成用户窃电预测模型，其中，相关数据集包括：

线损率，用于表示线路损耗的电能和供电量的比值；

平均线损率，用于表示多条线路的线损率的平均值；

线损率标准差，用于表示线损率的离散程度由线损率展现；

线损变化趋势，用于表示线损的变化趋势，通过变化趋势表示用户窃电漏电的可能性；

线损偏度系数，用于表示线路线损分布偏移中心位置的程度；

线损峰度系数，用于表示线损偏度系数的度量数据在中心聚集程度；

构建DLSTM-RF模型，DLSTM-RF模型用于通过相关数据集，生成用户窃电预测模型；

通过相关数据集，对DLSTM-RF模型进行训练，生成用户窃电预测模型，用户窃电预测模型用于对电网系统中的信息进行分析和学习，找出窃电用户，并通过对窃电用户进行治理，降低不必要的电力生产。

优选地，在构建相关数据集的过程中，平均线损率表示为：

其中，V₁表示平均线损率，V_1i表示第i天的线损率。

优选地，在构建相关数据集的过程中，线损率标准差越小表示大部分实际数据和平均线损率之间差异越小，线损率标准差表示为：

优选地，在构建相关数据集的过程中，如果变化趋势与线路线损成正比，则线损率越大代表用户窃电漏电的可能性越大；

线损变化趋势为：

其中，

为线损对象前半段时间内的线损率平均值，

为线损对象后半段时间内的线损率平均值，V₃为线损率变化趋势。

优选地，在构建相关数据集的过程中，线损峰度系数为：

其中，V₄是线损率的峰度系数，V_1i是第i天线损率。

优选地，在构建相关数据集的过程中，线损偏度系数为：

其中，V₅是线损率的偏度系数，V_1mid是线损率的中位数，中位数表示线路线损分布的中心位置。

优选地，在对DLSTM-RF模型进行训练的过程中，还包括通过少类样本合成过采样方法对相关数据集进行预处理，预处理用于消除了数据比例失衡的问题，预处理的过程包括以下步骤：

基于相关数据集的少数类样本，以欧氏距离为标准，获取少数类样本与相关数据集的其他样本的距离，得到少数类样本的k近邻；

根据样本不平衡比例，通过设置采样比例，依据少数类样本，从 k近邻中随机选择若干个近邻样本进行处理后，进行归一化处理，生成DLSTM-RF模型的输入数据，其中，

若干个近邻样本的处理过程为：

c_new＝c+rand(0，1)×(c⁽ⁱ⁾-c)

式中，c_new表示用于构建输入数据的新样本，c表示近邻样本，i 表示近邻样本的数量；

行归一化处理的过程为：

其中，max(V)和min(V)分别代表数据样本中的数据最大值和最小值。

优选地，在构建DLSTM-RF模型的过程中，DLSTM-RF模型由DLSTM 神经网络以及用于优化DLSTM神经网络的RF算法组成；

DLSTM神经网络的状态更新方式为：

其中，Υ为DLSTM神经网络的层数，b为偏移项，W_i，γ，W_f，γ，W_o，γ，W_c，γ表示与当前输入的负荷数据的连接权重，V_i，Υ，V_f，Υ，V_o，Υ，V_c，Υ表示与前一时刻输出的负荷数据的连接权重，下标i,f,o分别表示DLSTM神经网络的输入门、遗忘门、输出门，下标c表示DLSTM神经网络的外部状态，

表示内积运算，σ表示sigmod函数。

优选地，用户窃电检测方法还用于通过用户端，实现电信息和碳信息的转换，转换的过程为：

T_out＝E·0.997(kg)

C_oui＝E·0.272(kg)

其中，E代表定位窃电用户后所减少的不必要的产电量；T_out代表减排的二氧化碳量；C_out代表减排的碳量。

本发明还提供了一种基于DLSTM-RF的用户窃电检测系统，包括：

数据采集与处理模块，用于通过采集某地指定时段相关历史数据，构建相关数据集，相关数据集用于作为DLSTM-RF模型的输入数据，对DLSTM-RF模型进行训练，生成用户窃电预测模型，其中，相关数据集包括：

线损率，用于表示线路损耗的电能和供电量的比值；

平均线损率，用于表示多条线路的线损率的平均值；

线损率标准差，用于表示线损率的离散程度由线损率展现；

窃电用户检测模块，用于构建DLSTM-RF模型，DLSTM-RF模型用于通过相关数据集，生成用户窃电预测模型；通过相关数据集，对 DLSTM-RF模型进行训练，生成用户窃电预测模型，用户窃电预测模型用于对电网系统中的信息进行分析和学习，找出窃电用户，并通过对窃电用户进行治理，降低不必要的电力生产；

碳排放数据转换模块，用于通过定位窃电用户后所减少的不必要的产电量，并将产电量转化为碳排放量。

与现有技术相比，本发明公开了以下技术效果：

本发明对数据集中窃电用户信息和普通用户信息量不对等的情况用SMOTE算法进行解决，从而避免预测结果偏向样本数较多的类别的情况。解决了因此导致预测模型的泛化能力降低，严重影响模型的性能的问题。

本发明利用DLSTM算法对用户的特征值进行自动提取，然后用 RF算法将窃电用户和普通用户进行分类，对两个算法进行融合，得到一种新的DLSTM-RF窃电用户预测模型。

本发明给出了用户的窃电信息和碳排放信息的转换公式，实现从用电信息到减碳信息的跨越，为实现电网用户侧控碳提供了一定的参考。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例所述的LSTM神经元结构图；

图2为本发明实施例所述的DLSTM神经元结构图；

图3为本发明实施例所述的用户窃电检测模型原理图；

图4为本发明实施例所述的DLSTM-RF模型训练流程图。

具体实施方式

下为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

如图1-4所示，本发明提供了一种基于DLSTM-RF的用户窃电检测方法，包括以下步骤：

线损率，用于表示线路损耗的电能和供电量的比值；

平均线损率，用于表示多条线路的线损率的平均值；

线损率标准差，用于表示线损率的离散程度由线损率展现；

进一步优选地，在构建相关数据集的过程中，平均线损率表示为：

其中，V₁表示平均线损率，V_1i表示第i天的线损率。

进一步优选地，在构建相关数据集的过程中，线损率标准差越小表示大部分实际数据和平均线损率之间差异越小，线损率标准差表示为：

进一步优选地，在构建相关数据集的过程中，如果变化趋势与线路线损成正比，则线损率越大代表用户窃电漏电的可能性越大；

线损变化趋势为：

其中，

为线损对象前半段时间内的线损率平均值，

进一步优选地，在构建相关数据集的过程中，线损峰度系数为：

其中，V₄是线损率的峰度系数，V_1i是第i天线损率。

进一步优选地，在构建相关数据集的过程中，线损偏度系数为：

进一步优选地，在对DLSTM-RF模型进行训练的过程中，还包括通过少类样本合成过采样方法对相关数据集进行预处理，预处理用于消除了数据比例失衡的问题，预处理的过程包括以下步骤：

若干个近邻样本的处理过程为：

c_new＝c+rand(0，1)×(c⁽ⁱ⁾-c)

行归一化处理的过程为：

进一步优选地，在构建DLSTM-RF模型的过程中，DLSTM-RF模型由DLSTM神经网络以及用于优化DLSTM神经网络的RF算法组成；

DLSTM神经网络的状态更新方式为：

其中，Υ为DLSTM神经网络的层数，b为偏移项，W_i，γ，W_f，γ，W_o，γ，W_c，γ表示与当前输入的负荷数据的连接权重，V_i，γ，V_f，γ，V_o，γ，V_c，γ表示与前一时刻输出的负荷数据的连接权重，下标i,f,o分别表示DLSTM神经网络的输入门、遗忘门、输出门，下标c表示DLSTM神经网络的外部状态，

表示内积运算，σ表示sigmod函数。

进一步优选地，用户窃电检测方法还用于通过用户端，实现电信息和碳信息的转换，转换的过程为：

T_out＝E·0.997(kg)

C_out＝E·0.272(kg)

线损率，用于表示线路损耗的电能和供电量的比值；

平均线损率，用于表示多条线路的线损率的平均值；

线损率标准差，用于表示线损率的离散程度由线损率展现；

实施例1：随着“双碳”政策的提出以及电网的飞速发展，工业窃电行为会造成额外的碳排放，所以本发明从负荷端窃电展开研究。首先本发明就用户信息中，窃电用户信息和普通用户信息间信息量不平衡的问题进行了预处理，解决了比例大的样本造成过拟合，预测结果偏向样本数较多的类别，导致预测模型的泛化能力降低，严重影响模型的性能的问题。接着提出了一种深度长短期记忆神经网络 (DLSTM)和随机森林(RF)相融合的算法，先对DLSTM模型进行训练，在得到最优结果的基础上，修剪并保留模型参数，再通过RF算法对所提取的特征再次训练模型，最终得到DLSTM-RF窃电预测模型。最后将排除窃电用户后所减少的产电量与碳排放量进行转换，实现从电数据到碳排放数据的跨越。本发明为窃电用户的查找提供了一种精准有效的方法，同时也推动“双碳”目标的实现。

1、数据采集：

本发明采集某地指定时段相关历史数据来建立用户窃电预测模型。构建相关数据集，获取平均线损率、线损率标准差、线损变化趋势、线损峰度、线损偏度作为模型分析指标。

(1)平均线损率：

线损率是线路损耗的电能和供电量的比值；线损率是衡量电网经济效益的重要标准之一。平均线损率是指多条线路的线损率的平均值。

V₁是平均线损率，V_1i是第i天的线损率。

(2)线损率标准差：

线损率的离散程度由线损率展现，线损率标准差越小表示大部分实际数据和平均线损率之间差异越小；

V₂为线损率标准差。

(3)线损变化趋势：

如果线损的变化趋势与线路线损成正比，线损率越大代表用户窃电漏电的可能性越大。

为线损对象前半段时间内的线损率平均值，

(4)线损峰度系数：

峰度系数用来线损偏度系数度量数据在中心聚集程度，记为V₄，描述总体中所有取值分布形态陡缓程度的统计量。

V₄是线损率的峰度系数，V₁是平均线损率，V_1i是第i天线损率。

(5)线损偏度系数

线损偏度系数反映线路线损分布偏移中心位置的程度，偏度系数是描述分布偏离对称性程度的一个特征数。偏度系数表现

V₅是线损率的偏度系数，V_1mid是线损率的中位数。

设所有特征变量的历史数据集为V，则该数据集可以表示为

V＝[V₁ V₂ V₃...V_k...V_m] (6)

其中，式(1)中V_k表示第k(1≤k≤m)个特征变量，m为负荷预测所考虑的特征变量维数，在本发明中m为5.

进一步构造相关数据集。例如式(1)中的第k个特征变量V_k可以进一步的表示为

其中，

表示第k个特征变量第j(1≤j≤n)个时间点的历史数据，n为特征变量V_k的时间长度。

2、数据预处理：

在电力系统中，工业窃电会导致大量的电力损耗，从而产生额外的碳排放。由于电力盗窃很难获得恶意窃电数据样本，恶意客户的窃电数据和诚实用户的用电数据比例严重失衡。这会对比例大的样本造成过拟合，预测结果偏向样本数较多的类别。因此导致预测模型的泛化能力降低，严重影响模型的性能。

为了解决这个问题，本发明采取少类样本合成过采样技术算法 (SMOTE)，使待训练的数据集中窃电用户样本数量和正常用户样本数量相等。其算法基本原理：

1)对于少数类M中的每一个样本m，以欧氏距离为标准，计算它到少数类集中所有样本的距离，得到其k近邻；

2)根据样本不平衡比例设置一个采样比例以确定采样倍率s，对于每一个少数类样本m，从其k近邻中随机选择s个近邻样本，假设选择的近邻样本为c⁽¹⁾，c⁽²⁾，…，c^(s)；

3)对于每一个随机选出的近邻样本c⁽ⁱ⁾(i＝1，2，…，s)，按如下公式构建新样本：c_new＝c+rand(0，1)×(c⁽ⁱ⁾-c)。此外为了使网络快速收敛和避免数值问题，对用电量数据进行归一化处理，如式 (1)所示：

其中max(V)和min(V)分别代表数据样本中的数据最大值和最小值。通过上述方法对数据集进行处理，消除了数据比例失衡的问题。

3、基于DLSTM-RF的用户侧窃电检测方法：

3.1、DLSTM模型：

本发明采用的DLSTM神经网络，它是由多层LSTM神经网络进行顺序堆叠构成的神经网络。因为LSTM神经网络可以控制神经网络中传递的信息是否保存，并且可以控制将这些信息保存多少到记忆存储单元中。因为LSTM可以学习跨度较长的依赖关系，避免梯度爆炸等问题的出现。而为了使得挖掘的信息更加的全面，本发明采用了DLSTM 神经网络。

LSTM神经元结构图如下：

如图1所示，LSTM主要由输入门i^(t)、遗忘门f^(t)以及输出门 o^(t)组成，其中t为时间节点。有多少新输入的数据存储在内部状态中主要是由输入门来决定的。有多少过去的信息需要丢弃主要由遗忘门控制的。在当前时刻内部状态中有多少信息需要输出到外部状态主要由输出门控制。另外，图中的当前时刻神经元的内部状态为h^(t)；当前时刻的外部状态为c^(t)；当前时刻的外部输入为x^(t)；激活层函数为σ。

DLSTM神经元的结构图如图2所示，该神经网络每一层网络的隐藏层的输入为上一层网络的输出。此时，假设DLSTM神经网络的层数为Υ，则Υ层DLSTM神经网络的状态更新方式如下表示：

其中，b为偏移项；W_i，Υ，W_f，Υ，W_o，Υ，W_c，Υ表示与当前输入的负荷数据的连接权重；V_i，Υ，V_f，Υ，V_o，Υ，V_c，Υ表示与前一时刻输出的负荷数据的连接权重；下标i,f,o分别对应上文中所提及的输入门、遗忘门、输出门，下标c对应外部状态；

表示内积运算；σ表示的是sigmod函数。

3.2、RF模型：

随着电力行业的不断发展，供电公司已经获取了大量的用户用电数据，通过分析这个历史数据可以很好的学习到用户的用电行为特征。利用窃电行为分析模型可以有效的对窃电用户进行定位，从而有效的减少窃电行为以及窃电行为带来的危害。

本发明在DLSTM窃电分析模型的基础上使用RF算法对模型进行优化。先采用DLSTM对智能电表的用户特征进行提取，修剪并保留模型参数，再通过随机森林算法对所提取的特征再次进行训练，从而得到DLSTM-RF模型；用户窃电检测模型原理图如图3所示。

4、碳排放数据转换

本发明使用DLSTM-RF模型对电网系统中的信息进行分析和学习，找出可疑窃电用户，对可疑窃电用户进行治理，可以有效的降低不必要的电力生产。电力生产的过程中会产生碳排放，所以本发明从用户端入手，实现电信息和碳信息的转换。

T_out＝E·0.997(kg) (14)

C_out＝E·0.272(kg) (15)

其中E代表定位窃电用户后所减少的不必要的产电量；T_out代表减排的二氧化碳量；C_out代表减排的碳量。

Claims

1.一种基于DLSTM-RF的用户窃电检测方法，其特征在于，包括以下步骤：

构建相关数据集，所述相关数据集用于作为DLSTM-RF模型的输入数据，对所述DLSTM-RF模型进行训练，生成用户窃电预测模型，其中，所述相关数据集包括：

线损率，用于表示线路损耗的电能和供电量的比值；

平均线损率，用于表示多条线路的所述线损率的平均值；

线损率标准差，用于表示所述线损率的离散程度由线损率展现，线损率标准差越小表示大部分实际数据和平均线损率之间差异越小；

线损变化趋势，用于表示线损的变化趋势，通过所述变化趋势表示用户窃电漏电的可能性；

线损峰度系数，用于表示所述线损偏度系数的度量数据在中心聚集程度；

构建所述DLSTM-RF模型，所述DLSTM-RF模型用于通过所述相关数据集，生成所述用户窃电预测模型；

通过所述相关数据集，对所述DLSTM-RF模型进行训练，生成所述用户窃电预测模型，所述用户窃电预测模型用于对电网系统中的信息进行分析和学习，找出窃电用户，并通过对所述窃电用户进行治理，降低不必要的电力生产；

在构建所述DLSTM-RF模型的过程中，所述DLSTM-RF模型由DLSTM神经网络以及用于优化所述DLSTM神经网络的RF算法组成；

所述DLSTM神经网络的状态更新方式为：

其中，γ为DLSTM神经网络的层数，b为偏移项，W_i，γ，W_f，γ，W_o，γ，W_c，γ表示与当前输入的负荷数据的连接权重；V_i，γ，V_f，γ，V_o，γ，V_c，γ表示与前一时刻输出的负荷数据的连接权重；下标i，f，o分别表示DLSTM神经网络的输入门、遗忘门、输出门，下标c表示DLSTM神经网络的外部状态，⊗表示内积运算，σ表示sigmod函数；

DLSTM窃电分析模型采用DLSTM神经网络；所述DLSTM神经网络是由多层LSTM神经网络进行顺序堆叠构成；所述LSTM神经网络用于控制神经网络中传递的信息是否保存，并且可以控制将这些所述信息保存多少到记忆存储单元中；所述LSTM神经网络的LSTM神经元结构包括输入门i(t)、遗忘门f(t)以及输出门o(t)，其中t为时间节点；所述输入门i(t)用于决定内部状态中新输入的数据存储量；所述遗忘门f(t)用于控制需要丢弃的历史信息量；所述输出门o(t)用于控制当前时刻内部状态中需要输出到外部状态的信息量；基于所述DLSTM窃电分析模型提取智能电表的用户特征，获得模型参数；修剪并保留所述模型参数；基于随机森林算法RF再次训练所述智能电表的用户特征，构建所述DLSTM-RF模型。

2.根据权利要求1所述一种基于DLSTM-RF的用户窃电检测方法，其特征在于：

在构建相关数据集的过程中，所述平均线损率表示为：

其中，V₁表示平均线损率，V_1i表示第i天的线损率。

3.根据权利要求2所述一种基于DLSTM-RF的用户窃电检测方法，其特征在于：

在构建相关数据集的过程中，所述线损率标准差越小表示大部分实际数据和所述平均线损率之间差异越小，所述线损率标准差表示为：

。

4.根据权利要求3所述一种基于DLSTM-RF的用户窃电检测方法，其特征在于：

在构建相关数据集的过程中，如果所述变化趋势与所述线路线损成正比，则所述线损率越大代表用户窃电漏电的可能性越大；

所述线损变化趋势为：

其中，

为线损对象前半段时间内的线损率平均值，

5.根据权利要求4所述一种基于DLSTM-RF的用户窃电检测方法，其特征在于：

在构建相关数据集的过程中，所述线损峰度系数为：

其中，V₄是线损率的峰度系数，V_1i是第i天线损率。

6.根据权利要求5所述一种基于DLSTM-RF的用户窃电检测方法，其特征在于：

在构建相关数据集的过程中，所述线损偏度系数为：

其中，V₅是线损率的偏度系数，V_1mid是线损率的中位数，所述中位数表示线路线损分布的中心位置。

7.根据权利要求6所述一种基于DLSTM-RF的用户窃电检测方法，其特征在于：

在对所述DLSTM-RF模型进行训练的过程中，还包括通过少类样本合成过采样方法对所述相关数据集进行预处理，所述预处理用于消除了数据比例失衡的问题，所述预处理的过程包括以下步骤：

基于所述相关数据集的少数类样本，以欧氏距离为标准，获取所述少数类样本与所述相关数据集的其他样本的距离，得到所述少数类样本的k近邻；

根据样本不平衡比例，通过设置采样比例，依据所述少数类样本，从所述k近邻中随机选择若干个近邻样本进行处理后，进行归一化处理，生成所述DLSTM-RF模型的所述输入数据，其中，

若干个所述近邻样本的处理过程为：

c_new= c + rand(0，1)×(c⁽ⁱ⁾-c)

式中，c_new表示用干构建所述输入数据的新样本，c表示近邻样本，i表示近邻样本的数量；采取少类样本合成过采样技术算法(SMOTE)，使待训练的数据集中窃电用户样本数量和正常用户样本数量相等；其算法基本原理：1)对于少数类M中的每一个样本m，以欧氏距离为标准，计算它到少数类集中所有样本的距离，得到其k近邻；2)根据样本不平衡比例设置一个采样比例以确定采样倍率s，对于每一个少数类样本m，从其k近邻中随机选择s个近邻样本，假设选择的近邻样本为c⁽¹⁾，c⁽²⁾，…，c^(s)；3)对于每一个随机选出的近邻样本c⁽ⁱ⁾(i＝1，2，…，s)，按如下公式构建新样本：c_new=c+rand(0，1)×（c^（i）-c)；

所述行归一化处理的过程为：

其中，max（V）和min（V）分别代表数据样本中的数据最大值和最小值。

8.根据权利要求1所述一种基于DLSTM-RF的用户窃电检测方法，其特征在于：

所述用户窃电检测方法还用于通过用户端，实现电信息和碳信息的转换，所述转换的过程为：

9.一种基于DLSTM-RF的用户窃电检测系统，其特征在于，包括：数据采集与处理模块，用于通过采集某地指定时段相关历史数据，构建相关数据集，所述相关数据集用于作为DLSTM-RF模型的输入数据，对所述DLSTM-RF模型进行训练，生成用户窃电预测模型，其中，所述相关数据集包括：

线损率，用于表示线路损耗的电能和供电量的比值；

平均线损率，用于表示多条线路的所述线损率的平均值；

窃电用户检测模块，用于构建所述DLSTM-RF模型，所述DLSTM-RF模型用于通过所述相关数据集，生成所述用户窃电预测模型；通过所述相关数据集，对所述DLSTM-RF模型进行训练，生成所述用户窃电预测模型，所述用户窃电预测模型用于对电网系统中的信息进行分析和学习，找出窃电用户，并通过对所述窃电用户进行治理，降低不必要的电力生产；

碳排放数据转换模块，用于通过定位窃电用户后减少不必要的产电量，并将所述产电量转化为碳排放量；

DLSTM窃电分析模型采用DLSTM神经网络；所述DLSTM神经网络是由多层LSTM神经网络进行顺序堆叠构成；所述LSTM神经网络用于控制神经网络中传递的信息是否保存，并且可以控制将这些所述信息保存多少到记忆存储单元中；所述LSTM神经网络的LSTM神经元结构包括输入门i(t)、遗忘门f(t)以及输出门o(t)，其中t为时间节点；所述输入门i(t)用于决定内部状态中新输入的数据存储量；所述遗忘门f(t)用于控制需要丢弃的历史信息量；所述输出门o(t)用于控制当前时刻内部状态中需要输出到外部状态的信息量；所述DLSTM神经网络每一层网络的隐藏层的输入为上一层网络的输出；假设所述DLSTM神经网络的层数为Υ，则Υ层所述DLSTM神经网络的状态更新方式如下表示：

其中，γ为DLSTM神经网络的层数，b为偏移项，W_i，γ，W_f，γ，W_o，γ，W_c，γ表示与当前输入的负荷数据的连接权重；V_i，γ，V_f，γ，V_o，γ，V_c，γ表示与前一时刻输出的负荷数据的连接权重；下标i，f，o分别表示所述DLSTM神经网络的输入门、遗忘门、输出门，下标c表示所述DLSTM神经网络的外部状态，⊗表示内积运算，σ表示sigmod函数；基于所述DLSTM窃电分析模型提取智能电表的用户特征，获得模型参数；修剪并保留所述模型参数；基于随机森林算法RF再次训练所述智能电表的用户特征，构建所述DLSTM-RF模型。