CN117150409A

CN117150409A - 一种用电异常检测方法

Info

Publication number: CN117150409A
Application number: CN202311186329.7A
Authority: CN
Inventors: 王立宗; 董成哲; 张其祥; 李菊兰
Original assignee: Baoding Xinyuan Lyuwang Electric Power Technology Co ltd
Current assignee: Baoding Xinyuan Lyuwang Electric Power Technology Co ltd
Priority date: 2023-09-14
Filing date: 2023-09-14
Publication date: 2023-12-01

Abstract

本发明提供了一种用电异常检测方法，包括：获取需要检测的数据集，搭建用电异常检测判断模型，获取第一训练数据集，并对其进行预处理及数据采样，基于采样后的第一训练数据集对用电异常检测判断模型进行训练，将需要检测的数据集输入用电异常检测判断模型，判断此数据集是否发生异常，搭建用电异常检测识别模型，并获取第二训练数据集，基于第二训练数据集对用电异常检测识别模型进行训练，将判断发生异常的数据集输入训练后的用电异常检测识别模型中，对其进行识别，得到识别结果。本发明提供的用电异常检测方法，能够实现用电异常判断及异常类型识别，便于使用，省时省力。

Description

一种用电异常检测方法

技术领域

本发明涉及用电异常检测技术领域，特别是涉及一种用电异常检测方法。

背景技术

随着电力系统信息化技术的快速发展，电网信息系统产生了大量用电数据。在电网生产运行过程中，因数据传输干扰以及多源数据融合混叠，从而导致在对配电网数据进行量测时可能出现较大误差，即出现用电异常数据，进而降低了用电数据质量，影响电网运行状态和用户用电行为的准确分析。由此可见，对用电异常数据进行识别检测，就显得尤为重要。现有技术中往往需要通过人工经验来进行用电异常判断，费时费力，十分不便。因此，设计一种用电异常检测方法是十分有必要的。

发明内容

本发明的目的是提供一种用电异常检测方法，能够实现用电异常判断及异常类型识别，便于使用，省时省力。

为实现上述目的，本发明提供了如下方案：

一种用电异常检测方法，包括如下步骤：

步骤1：获取需要检测的数据集；

步骤2：搭建用电异常检测判断模型；

步骤3：获取第一训练数据集，并对其进行预处理及数据采样，基于采样后的第一训练数据集对用电异常检测判断模型进行训练；

步骤4：将需要检测的数据集输入用电异常检测判断模型，判断此数据集是否发生异常；

步骤5：搭建用电异常检测识别模型，并获取第二训练数据集，基于第二训练数据集对用电异常检测识别模型进行训练；

步骤6：将判断发生异常的数据集输入训练后的用电异常检测识别模型中，对其进行识别，得到识别结果。

可选的，步骤2中，搭建用电异常检测判断模型，具体为：

基于BP神经网络模型搭建用电异常检测判断模型。

可选的，步骤3中，获取第一训练数据集，并对其进行预处理，具体为：

每隔固定时间获取用户用电数据，包括电压、电流、电量、用户类型、表记编号及测量点编号，并对用户用电数据是否异常进行标注，得到第一训练原始数据集，对第一训练原始数据集进行数据缺失及数据冗余情况处理，处理完毕后，对第一训练原始数据集进行去中心化处理，得到第一训练数据集。

可选的，步骤3中，对第一训练数据集进行数据采样，具体为：

获取第一训练数据集，其中，第一训练数据集包括正常用电的正样本及异常用电的负样本，将数据集中的每条数据均看作一个向量，计算所有数据的欧氏距离，设置超参数k值，根据计算得到的欧氏距离从负样本的k个近邻中随机获取一个样本，基于SMOTE过采样算法生成新的样本，并重复此操作，直至第一训练数据集正样本及负样本数量均衡，遍历所有新生成的样本，重新计算所有样本的欧式距离，根据新计算的欧式距离可以得到所有的Tomek Link，分析所有计算出的Tomek Link，若属于同一类别，则保留此样本，否则，则删除样本，得到数据采样后的第一训练数据集。

可选的，步骤5中，搭建用电异常检测识别模型，具体为：

搭建LSTM模型，并在LSTM模型中加入时间门及概率门，对LSTM模型的损失函数进行调整，最终得到改进后的LSTM模型，将其作为用电异常检测识别模型。

可选的，步骤5中，获取第二训练数据集，基于第二训练数据集对用电异常检测识别模型进行训练，具体为：

获取第二训练数据集，其中，第二训练数据集中包括相邻的两个向量为时间先后关系，每个向量均包含时间戳及概率值信息，初始化LSTM模型的参数，将第二训练数据集输入LSTM模型中，在LSTM模型的细胞中计算时间门及概率门，并将最后一层的输出结果作为LSTM模型的输出，将LSTM模型的输出向量输入到全连接网络层中，通过softmax做激活函数完成多分类，并预测每个分类的概率，与真实的类别标签计算改进的交叉熵作为损失函数，并反向传播不断的优化模型，完成训练。

根据本发明提供的具体实施例，本发明公开了以下技术效果：本发明提供的用电异常检测方法，该方法包括获取需要检测的数据集，搭建用电异常检测判断模型，获取第一训练数据集，并对其进行预处理及数据采样，基于采样后的第一训练数据集对用电异常检测判断模型进行训练，将需要检测的数据集输入用电异常检测判断模型，判断此数据集是否发生异常，搭建用电异常检测识别模型，并获取第二训练数据集，基于第二训练数据集对用电异常检测识别模型进行训练，将判断发生异常的数据集输入训练后的用电异常检测识别模型中，对其进行识别，得到识别结果，该方法首先对数据集进行是否异常判断，若异常则对其进行异常检测识别，能够得到异常类型，便于使用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例用电异常检测方法流程示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示，本发明实施例提供的用电异常检测方法，包括如下步骤：

步骤1：获取需要检测的数据集；

步骤2：搭建用电异常检测判断模型；

步骤2中，搭建用电异常检测判断模型，具体为：

基于BP神经网络模型搭建用电异常检测判断模型；

BP(back propagation，反向传播)神经网络算法，是一种按照误差逆向传播算法训练的多层前馈神经网络，是目前应用最广泛的神经网络模型之一，已广泛应用到模式识别、函数拟合以及系统控制等多个领域之中。BP神经网络能通过对大量“输入-输出”模式的样本进行学习建立映射关系，而无需事前揭示描述这种映射关系的数学方程。BP神经网络采用最速下降法这一学习规则，通过经验泛化误差的反向传播来不断调整网络的连接权值以及阈值，使神经网络模型对数据样本进行逼近的误差平方和最小。

BP神经网络算法一般包括三层神经网络结构，分别为输入层、一个或多个隐含层和输出层，其中每一层中都包括多个神经元，即节点。BP神经网络中样本从输入层节点输入，依次经过各隐含层节点在输出层节点输出，其中每一层节点的输出只影响下一层节点的输出。BP神经网络的核心思想就是利用输出后的误差来估计输出层前一层的误差，再用这层误差来估计更前一层误差，如此获取所有各层误差估计。这里的误差估计可以理解为某种偏导数，根据这种偏导数来调整各层的连接权值，再用调整后的连接权值重新计算输出误差。直到输出的误差达到符合的要求或者迭代次数溢出设定值。

BP神经网络模型分为两个阶段，第一阶段(正向过程)输入信息从输入层输入，依次经过各隐含层到输出层，计算各神经单元的输出值；第二阶段(反向传播过程)输出误差逐层向前算出隐含层神经单元的误差，并用次误差来修正前层连接权值。

步骤3中，获取第一训练数据集，并对其进行预处理，具体为：

每隔固定时间获取用户用电数据，包括电压、电流、电量、用户类型、表记编号及测量点编号，其中，有效信息包括电压、电流及电量，可采用每隔15分钟采集一次数据，每天得到96个有效数据点，根据这些有效数据点的基本数据计算统计特征表示用户的用电情况，用户类型、表记编号及测量点编号用于让模型学习到一些用户级和测量点级别的信息，增强模型的泛化性能；

另外需要对用户用电数据是否异常进行标注，得到第一训练原始数据集；

对第一训练原始数据集进行数据缺失及数据冗余情况处理，首先筛选出所有的有缺失值的数据，对这些数据进行分析，对不同的缺失类型采用不同的方法处理，主要有以下几种方式：对于有部分相似数据分布的用户，可以用这部分相似的数据填充当前用户的缺失数据；对于有大量缺失值的用户直接删除这些用户数据；对于只有个别缺失值的用户，使用-1填充这些缺失值。然后还需要处理数据冗余的问题，数据冗余是指原始集合存在重复数据或者高度近似的数据，这样的数据相当于增大了同一样本的权重，需要删除冗余的数据，同时处理缺失值的第一种方法也会带来这种冗余问题，所以在这一步骤做了数据冗余的处理，提升模型的学习效率；

对第一训练原始数据集进行去中心化处理，使用极大极小化方法，利用下式做去中心化处理，

其中μ是均值，σ是标准差，计算后的数据服从标准正态分布。由于数据样本有多个维度，每个维度的量纲是不同的，处理后的数据特征具有相同的尺度，使模型的学习过程中不会对某些特征有偏重。对于非数值型的类目特征，做了重新编码，将原始编号映射到新的空间中重新编号；

处理完毕后，得到第一训练数据集。

步骤3中，对第一训练数据集进行数据采样，具体为：

步骤5中，搭建用电异常检测识别模型，具体为：

搭建LSTM模型，并在LSTM模型中加入时间门及概率门，对LSTM模型的损失函数进行调整，最终得到改进后的LSTM模型，将其作为用电异常检测识别模型；

在LSTM模型中加入时间门，本发明的用户用电数据点都是在某一时刻采集的，可以获取到时间戳信息，可以把此时间戳信息加入到模型中，对于每一个输入向量都与这个向量的时间戳计算出时间门特征，计算方法为：

T＝σ(Wx+σ(Qt))

其中x代表输入向量，t代表输入向量的时间戳，W是输入向量的参数矩阵，矩阵行的维度为输入向量的长度，列的维度为LSTM模型隐藏层的大小，Q是时间戳的参数向量，其维度同样是隐藏层的大小，σ是激活函数，输入向量与时间戳和参数矩阵计算后都需要输入到激活函数中，T是时间门的输出，是最终计算出来的向量，维度与隐藏层相同，在模型的训练过程中，会不断的优化参数矩阵W和参数向量Q，提升时间门的学习能力；

在LSTM模型中引入概率门，与上述时间门的计算相似，O和U分别代表输入向量的参数矩阵和异常概率的参数向量，T代表的是经过了时间门计算后的输入向量，此时该向量的长度已经变为了隐藏层的维度大小，计算公式如下

P＝σ(OT+σ(Up))

对LSTM模型的损失函数进行调整，对于每一条用户数据，它所属于的异常类别视作标签1，其他类别为标签0，为了提高模型的学习能力，使用交叉熵作为损失函数，但是在交叉熵计算中对负标签的计算需要乘以一个小于1的权重，损失函数如下：

其中p(lstm)表示模型最终对每种类别预测的概率，根据交叉熵的计算方法，负样本的损失函数需要乘以0，根据具体需求，将交叉熵损失函数中的0替换为了小于1的权重w。

步骤5中，获取第二训练数据集，基于第二训练数据集对用电异常检测识别模型进行训练，具体为：

获取第二训练数据集，其中，第二训练数据集中包括相邻的两个向量为时间先后关系，每个向量均包含时间戳及概率值信息，初始化LSTM模型的参数，将第二训练数据集输入LSTM模型中，在LSTM模型的细胞中计算时间门及概率门，并将最后一层的输出结果作为LSTM模型的输出，将LSTM模型的输出向量输入到全连接网络层中，通过softmax做激活函数完成多分类，并预测每个分类的概率，与真实的类别标签计算改进的交叉熵作为损失函数，并反向传播不断的优化模型，完成训练，其中softmax的计算公式为：

x_i表示第i类的预测值，e是指数函数的常数。

本发明提供的用电异常检测方法，该方法包括获取需要检测的数据集，搭建用电异常检测判断模型，获取第一训练数据集，并对其进行预处理及数据采样，基于采样后的第一训练数据集对用电异常检测判断模型进行训练，将需要检测的数据集输入用电异常检测判断模型，判断此数据集是否发生异常，搭建用电异常检测识别模型，并获取第二训练数据集，基于第二训练数据集对用电异常检测识别模型进行训练，将判断发生异常的数据集输入训练后的用电异常检测识别模型中，对其进行识别，得到识别结果，该方法首先对数据集进行是否异常判断，若异常则对其进行异常检测识别，能够得到异常类型，便于使用。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种用电异常检测方法，其特征在于，包括如下步骤：

步骤1：获取需要检测的数据集；

步骤2：搭建用电异常检测判断模型；

2.根据权利要求1所述的用电异常检测方法，其特征在于，步骤2中，搭建用电异常检测判断模型，具体为：

基于BP神经网络模型搭建用电异常检测判断模型。

3.根据权利要求2所述的用电异常检测方法，其特征在于，步骤3中，获取第一训练数据集，并对其进行预处理，具体为：

4.根据权利要求3所述的用电异常检测方法，其特征在于，步骤3中，对第一训练数据集进行数据采样，具体为：

获取第一训练数据集，其中，第一训练数据集包括正常用电的正样本及异常用电的负样本，将数据集中的每条数据均看作一个向量，计算所有数据的欧氏距离，设置超参数k值，根据计算得到的欧氏距离从负样本的k个近邻中随机获取一个样本，基于SMOTE过采样算法生成新的样本，并重复此操作，直至第一训练数据集正样本及负样本数量均衡，遍历所有新生成的样本，重新计算所有样本的欧式距离，根据新计算的欧式距离可以得到所有的TomekLink，分析所有计算出的Tomek Link，若属于同一类别，则保留此样本，否则，则删除样本，得到数据采样后的第一训练数据集。

5.根据权利要求4所述的用电异常检测方法，其特征在于，步骤5中，搭建用电异常检测识别模型，具体为：

6.根据权利要求5所述的用电异常检测方法，其特征在于，步骤5中，获取第二训练数据集，基于第二训练数据集对用电异常检测识别模型进行训练，具体为：