CN116819423A

CN116819423A - 关口电能计量装置运行状态异常检测方法及系统

Info

Publication number: CN116819423A
Application number: CN202310734950.6A
Authority: CN
Inventors: 张利花; 陈旭; 张超; 程志强; 张浩淼; 欧龙; 许寅哲; 闫瑜; 王涛; 苏迎春
Original assignee: Marketing Service Center Of State Grid Ningxia Electric Power Co ltd Metering Center Of State Grid Ningxia Electric Power Co ltd
Current assignee: Marketing Service Center Of State Grid Ningxia Electric Power Co ltd Metering Center Of State Grid Ningxia Electric Power Co ltd
Priority date: 2023-06-20
Filing date: 2023-06-20
Publication date: 2023-09-29

Abstract

本发明涉及一种关口电能计量装置运行状态异常检测方法及系统，该方法包括以下步骤：获取待检测关口电能计量装置所测得的数据，并由数据构造出三相电压特征数据和三相电流特征数据；将三相电压特征数据和三相电流特征数据输入预构建的SAE‑LSTM异常检测模型，输出得到检测结果；所述SAE‑LSTM异常检测模型由堆叠自编码器和长短期记忆网络构成，堆叠自编码器的输出作为长短期记忆网络的输入，长短期记忆网络的输出作为整个SAE‑LSTM异常检测模型的输出。本发明利用SAE‑LSTM异常检测模型进行自动检测，大大提高了检测效率，也避免了人工检测的安全问题，而且SAE‑LSTM异常检测模型是由大量数据训练而得，识别能力强，继而可以提高检测结果的准确性。

Description

关口电能计量装置运行状态异常检测方法及系统

技术领域

本发明涉及异常检测技术领域，尤其涉及一种关口电能计量装置运行状态异常检测方法及系统。

背景技术

关口电能计量装置是一种测量关口分界点电能量的流向及其大小的装置，通过评估其运行状况不仅能够发现是否存在故障，更关系着售电和购电双方的经济效益，因此检测关口电能计量装置的运行状态非常必要。关口电能计量装置的运行状态评估依赖于关口电能计量装置相关数据的异常事件检测和识别。目前关口电能计量装置的运行状态异常检测主要依靠人工现场检测，存在安全风险大、检测周期长、不能及时发现异常事件等问题。随着关口电能表数量不断攀升，人工检测需要的人力、物力也就更多，难以完全满足当前关口电能计量装置的管理要求，因此信息化、智能化程度更高的电能表运行状态检测变得至关重要。

发明内容

本发明的目的在于提供一种关口电能计量装置运行状态异常检测方法，通过智能化的检测手段提升检测效率及准确性。

为了实现上述发明目的，本发明实施例提供了以下技术方案：

一种关口电能计量装置运行状态异常检测方法，包括以下步骤：

获取待检测关口电能计量装置所测得的数据，并从数据中提取出三相电压数据和三相电流数据，并基于三相电压数据构造获得三相电压特征数据，基于三相电流数据构造获得三相电流特征数据；

将三相电压特征数据和三相电流特征数据输入预构建的SAE-LSTM异常检测模型，输出得到检测结果；所述SAE-LSTM异常检测模型由堆叠自编码器和长短期记忆网络构成，堆叠自编码器的输出作为长短期记忆网络的输入，长短期记忆网络的输出作为整个SAE-LSTM异常检测模型的输出。

本方案中，通过相应的传感器采集关口电能计量装置所测得的数据，再利用SAE-LSTM异常检测模型进行自动检测，只要输入数据即可输出得到检测结果，相比于人工检测，大大提高了检测效率，也避免了人工检测的安全问题，而且SAE-LSTM异常检测模型是由大量数据训练而得，识别能力强，继而可以提高检测结果的准确性。

SAE-LSTM异常检测模型中，堆叠自编码器的隐藏层为两层，两个隐藏层的单元数分别为16和64；长短期记忆网络的隐藏层为三层，三个隐藏层的单元数均为128。经过实验验证，采用这种结构的SAE-LSTM模型的准确率和F1值最高，即这种结构的SAE-LSTM模型的适应性更好，识别能力更强，检测结果的准确性更高。

SAE-LSTM异常检测模型的构建，包括以下步骤：

从电网采集各个变电站中各个关口电能计量装置所测得的原始数据，并提取原始数据中的三相电压数据和三相电流数据；

基于提取出的三相电压数据和三相电流数据构造样本数据集；

搭建堆叠自编码器和长短期记忆网络，并基于样本数据集进行训练，得到SAE-LSTM网络模型；

使用组合损失函数对SAE-LSTM网络模型进行微调；

采用贝叶斯优化算法寻找微调后的SAE-LSTM网络模型的最优参数。

一种关口电能计量装置运行状态异常检测系统，包括：

数据采集模块，用于采集关口电能计量装置所测得的数据，并从数据中提取出三相电压数据和三相电流数据；所述数据包括训练用数据和检测用数据；

模型构建模块，用于基于训练用数据构建SAE-LSTM异常检测模型；所述SAE-LSTM异常检测模型由堆叠自编码器和长短期记忆网络构成，堆叠自编码器的输出作为长短期记忆网络的输入，长短期记忆网络的输出作为整个SAE-LSTM异常检测模型的输出；

异常检测模块，用于基于检测用数据输入预构建的SAE-LSTM异常检测模型，输出得到检测结果。

相比现有技术，本发明所提供的方法具有以下优势：

通过SAE网络的编码可以获得数据的隐藏特征表示，而LSTM模型有效地捕捉了时间序列数据中的长期依赖关系，SAE-LSTM组合有效地利用了数据中的特征信息，模型在进行异常检测时考虑了数据的时间依赖性，从而提高了检测精度，适合应用在关口电能计量装置异常事件检测，完成对其运行状态的评估。

SAE-LSTM模型训练过程中加入稀疏惩罚参数防止了过拟合，从而增强了模型的鲁棒性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的关口电能计量装置运行状态异常检测方法的流程图。

图2为实施例中SAE-LSTM异常检测模型的结构图。

图3为实施例中构建SAE-LSTM网络模型的流程图。

图4a为信噪比为-20dB时的模拟数据生成图，图4b为信噪比为20dB的模拟数据生成图。

图5a为各模型的正确率结果图，图5b为各模型的F1值结果图。

图6为本发明实施例提供的关口电能计量装置运行状态异常检测系统的组成框图。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本实施例中提供的关口电能计量装置运行状态异常检测方法，包括以下步骤：

S10，获取待检测关口电能计量装置所测得的数据，并由数据构造出三相电压特征数据和三相电流特征数据。

具体的，从获得的数据中提取出三相电压数据和三相电流数据，并基于三相电压数据构造获得三相电压特征数据，基于三相电流数据构造获得三相电流特征数据。

本实施例中，三相电压特征为窗口内电压的均值、中位数和方差，三相电流特征为窗口内电流的均值、中位数和方差，因此，三相电压特征数据包括：A相电压的均值、中位数和方差，B相电压的均值、中位数和方差，C相电压的均值、中位数和方差，三相电流特征数据包括：A相电流的均值、中位数和方差，B相电流的均值、中位数和方差，C相电流的均值、中位数和方差。

S20，将三相电压特征数据和三相电流特征数据输入预构建的SAE-LSTM异常检测模型，输出检测结果。

如图2所示，SAE-LSTM异常检测模型由堆叠自编码器(StackedAutoencoder,SAE)和长短期记忆网络(LongShort-TermMemory,LSTM)构成，堆叠自编码器的输出作为长短期记忆网络的输入，长短期记忆网络的输出作为整个SAE-LSTM异常检测模型的输出。

本方案中，通过相应的传感器采集关口电能计量装置所测得的数据，再利用SAE-LSTM异常检测模型进行自动检测，只要输入电压电流特征数据即可输出得到检测结果，相比于人工检测，大大提高了检测效率，也避免了人工检测的安全问题，而且SAE-LSTM异常检测模型是由大量数据训练而得，识别能力强，继而可以提高检测结果的准确性。

如图3所示，对于SAE-LSTM异常检测模型的构建，包括以下步骤：

S101，从电网采集各个变电站中各个关口电能计量装置所测得的原始数据，并提取其中的三相电压数据和三相电流数据。

S102，基于提取出的三相电压数据和三相电流数据构造样本数据集。

本步骤中，基于不同的情况有不同的处理方式。针对于采集的原始数据量较少的情况，则需要先根据原始数据构造一些新数据作为补充，然后再进行数据预处理及基于滑动窗口技术得到特征数据，特征数据构成样本数据集。针对于采集的原始数据量较大的情况，则可以直接对原始数据进行预处理及基于滑动窗口技术得到特征数据，特征数据构成样本数据集。

针对于采集的原始数据量较少的情况，构造样本数据集包括以下处理流程：

步骤(1)，对提取出的三相电压数据和三相电流数据添加噪声，生成模拟数据。

由于原数据较为简单，无法体现出本发明构建网络的优势，为了能够将SAE-LSTM网络与其他网络进行比对，本实施例中采用添加噪声生成模拟数据的方法。具体的，设置参数为信噪比为-20～20dB、步长为4，即-20～20dB范围内，每4dB生成模拟数据，模拟数据中包含正常数据和异常数据，异常数据共有3类，分别为电压过压、失压和欠压，图4a为信噪比为-20dB时的模拟数据生成图，图4b为信噪比为20dB的模拟数据生成图。

图中，实线代表正常数据，虚线为异常数据，图中短点虚线为C相欠压，长短点虚线为B相过压，长点虚线为C相失压。从图中可以看出，当信噪比为-20dB时，生成的模拟数据分布在-1000V至1000V之间，与采集数据相差很大，而且异常数据几乎与原始数据重合，说明信号与噪声之间的区分度很低，模型的检测任务也会非常困难；信噪比为20dB时生成的模拟数据分布在50V至70V之间，与采集数据相差不大，而且信号与噪声之间的区分度要比信噪比为-20dB时的大很多，最为明显的就是C相失压异常，从图中很明显能看出异常类型3与其他类型数据在C相电压上相差很大，而信噪比为-20dB则无此差异。故信噪比为20dB时模型的检测任务要相对简单一些。

本实施例中将信噪比设置在-20-20dB，是因为信噪比很小时噪声强度要大于信号强度，模型很难进行异常检测，准确率均小于50％；如果信噪比很大，那么生成的模拟数据会和原始数据相似，基本没有噪声，信号和噪声的区分度很小，由于原始数据维度为6维，较为简单，不同模型(如后文表1所示)均能达到99％以上的准确率，无法比较模型之间的性能差异，所以设置信噪比-20-20dB可以涵盖从噪声较强的环境到信号较强的环境的各种条件，通过在这个范围内进行实验，可以更全面地分析SAE-LSTM网络模型的性能。

步骤(2)，对生成的模拟数据进行预处理，所述预处理包括缺失数据补齐和归一化。

由于人为操作或设备性能等多种因素，数据难以避免会存在部分丢失的现象，本实施例中采用拉格朗日插值法(Lagrangeinterpolation)填补缺失值，以下为拉格朗日插值法的具体公式：

公式(1)为n+1个点的拉格朗日基本多项式，公式(2)为n+1个点的拉格朗日插值多项式，其中为互不相同的自变量，公式的特点是取某一个自变量为1时，其余自变量为0。点的坐标为(Xn,Yn)，Xn表示自变量的位置，也就是横坐标，Yn就是函数在该位置的取值，即纵坐标。

针对本示例数据集，采用Z-score标准化方法进行归一化处理，Z-score标准化不仅简单，容易计算，还可以使具有非常大或非常小值的数据规范化处理，同时不受数量集的影响。以下是具体公式：

其中，是数据均值，是标准差，是标准分数。

步骤(3)，使用SMOTEBoost技术平衡正常数据和异常数据，正常数据作为正样本，异常数据作为负样本。

示例数据集中，正常数据与异常数据的数量比约为4：1，原始异常数据相对较少，因此本步骤采用SMOTEBoost的方法在异常数据点及其附近随机生成数据。

SMOTEBoost是一种集成方法，其结合了SMOTE和Boost的优势。相比于SMOTE方法，它可以将多个弱学习器集成一个强大的学习器，来提高分类器的鲁棒性和准确性。在不平衡数据集上SMOTEBoost也具有更好的性能。

SMOTEBoost算法的基本思想就是在每一轮分类学习过程中增加对少数类样本的权重，使得弱学习器能够更好地关注到少数类样本，并将人工模拟的新样本添加到数据集中，进而使原始数据中的类别不再严重失衡。以下为本实施例中SMOTE以及弱学习器权重更新的公式：

(5)

X_new为新产生的数据点，x为原数据点，-x为原数据点与其邻居数据点之间的距离，rand(0,1)为在0～1之间取值，

公式(4)为弱学习器的性能计算，公式(5)为弱学习器的权重计算。以下为使用SMOTEBoost算法平衡后的数据集，正样本和负样本的比例为1：1。

需要说明的是，如果采集数据或生成的模拟数据中正样本和负样本的比例满足应用要求，则无需采用SMOTEBoost算法来生成新的数据以均衡样本集中的正负样本数量。

步骤(4)，使用滑动窗口技术得到正样本和负样本的每个窗口内的特征。

滑动窗口是一种用于时间序列分析和序列数据处理的技术，它涉及很多领域，例如时间序列分析、图像处理和自然语言处理，用于提取特征或对数据子集执行计算。使用滑动窗口技术可以捕获三相电压和电流时间序列数据中的短期模式和依赖性，同时通过分析较小窗口内的序列，可以帮助降低模拟数据中的噪声并提高数据中的信噪比，有利于异常检测和实验评估。本次示例实验提取的特征包括窗口内数据的均值、中位数和方差。实现滑动窗口的具体步骤如下：

(a)创建滑动窗口函数，参数分别为是输入数据集的特征和滑动窗口的大小，它决定了每个子序列中包含多少个连续的数据点，这里输入数据集的特征为三相电压和三相电流，窗口大小为5，同时创建一个空列表，用于存储由滑动窗口创建的子序列。

(b)循环遍历输入数据特征，选择步长为5，确定窗口在每一步应移动多少个数据点。较小的步长会导致更多的重叠窗口和更高分辨率的分析，而较大的步长会减少计算时间并导致较少的重叠。

(c)对窗口内的数据点进行计算，在每一个窗口中得到每一相电压和电流的均值、中位数、方差，并存储每个窗口位置的计算结果。

(d)当遍历至循环末尾时，将少于滑动窗口数量的数据舍弃，结束遍历。

通过滑动窗口技术计算每个窗口中电压和电流的均值、中位数、方差作为SAE-LSTM网络模型输入的初始特征。需要注意的是，SAE-LSTM网络模型的输入数据为6维，即每一相电压或电流的特征数据作为1维数据，均值、中位数和方差共同构成1维数据，例如A相电压的均值、中位数和方差作为6维数据中的1维输入。

S103，搭建堆叠自编码器(Stacked Autoencoder,SAE)和长短期记忆网络(LongShort-Term Memory,LSTM)，得到SAE-LSTM网络模型，并基于样本数据集进行训练。

SAE模型由两个部分组成：编码器(encoder)和解码器(decoder)。编码器接收输入数据，并通过一系列线性层和激活函数，将输入数据映射到隐藏层表示。解码器接收编码器的输出，并将隐藏层表示映射回原始输入维度。SAE模型的训练过程旨在最小化重构误差，即最小化解码器的输出与输入之间的差异。

通过SAE模型提取输入数据的隐藏特征，以下为具体步骤：

1)编码器由一个全连接层组成，它的输入和输出大小分别是输入数据的维度和输出的隐藏层维度。

2)前向通道通过输入数据张量并将其传递给编码器，得到编码器编码后的隐藏特征。

3)训练过程采用均方误差(MeanSquaredError，MSE)作为损失函数。均方误差函数通过计算预测值和真实值之间的平方距离(即误差)来评估模型的质量。即预测值和真实值越接近，两者的均方差就越小。MSE函数的计算公式如下：

其中是样本大小，是实际数据值，是预测数据值。

4)训练过程优化器使用自适应矩估计优化算法Adam，用于更新模型的权重以最小化损失函数。

通过SAE网络提取输入数据的隐藏特征，需要经过数据类型转换才能得到符合LSTM网络输入要求的时间序列数据。具体的，对编码器得到的隐藏特征的重新整形到三个维度，第一个维度的大小为数据的总样本数，这样做是为了将所有样本堆叠在一起形成一个连续的序列，以便作为LSTM网络的输入；第二个维度表示序列的长度或时间步数，即每个样本被视为时间步的长度；第三个维度表示编码器最后一层的隐藏层维度，与LSTM网络的输入层维度相同，适用于将编码器的输出作为LSTM网络的输入。

LSTM网络包含多个LSTM层，每个层的输入维度与前一层的隐藏层维度相对应。在训练过程中，通过传递数据序列到LSTM层中，模型学习了输入序列的时序信息。最后，通过一个全连接层将LSTM网络的输出映射到分类目标的维度。以下为具体步骤：

1)创建一个LSTM层，参数为输入数据维度、隐藏层层数、堆叠的LSTM层数、输出数据的维度。然后构建一个全连接层，将隐藏层层数作为输入，输出大小为输出数据的维度。

2)前向通道共分为两个部分，向LSTM层输入数据张量，返回LSTM的输出。LSTM的输出经过全连接层得到最终输出张量，再通过激活函数，将输出转换为不同类别概率的概率向量。

3)损失函数和优化器分别选用BWL(bcewithlogitsloss)函数和Adam优化器，BWL函数在BCELoss函数的预测结果的基础上先经过Sigmoid函数，然后继续算损失loss，相比于单独的BCELoss函数，整合了Sigmoid函数，有数值稳定的优点。假设有N个batch，每个batch预测n个标签，则BWL函数的计算公式如下：

LOSS_n＝-[y_n·log(σ(x_n))+1-y_n·log(1-σ(x_n))]

x_n是模型输出，y_n是样本的目标标签，σ()是sigmod函数，将模型输出x_n转换为概率值，其中y_n·log(σ(x_n))表示当样本的目标标签y_n为1时的损失，(1-y_n)·log(1-σ(x_n))表示当样本的目标标签y_n为0时的损失。整个公式求和并取平均，即得到最终的损失值。

本步骤中，将样本数据输入SAE网络模型中，SAE网络模型会提取出特征(也就是SAE网络模型的输出)，再将特征作为LSTM网络模型的输入训练LSTM网络。以上两个过程结束后，再使用组合损失函数对SAE和LSTM两个网络模型分别进行微调。

通过使用SAE网络模型的编码器对训练数据和测试数据进行编码。编码器的输出被重新整形为适合LSTM网络的输入形状。然后，使用编码后的数据和相应的标签创建了数据集和数据加载器。这样，SAE网络模型通过编码器提取的特征被传递给LSTM网络，在LSTM网络中学习时间序列信息并进行分类。

S104，使用组合损失函数对SAE-LSTM网络模型进行微调。

为了防止SAE-LSTM网络模型出现过拟合问题，本实施例中加入弹性网络正则化(Elastic Net Regression)，同时应用L1范数和L2范数正则化来惩罚回归模型中的系数。弹性网络正则化结合了L1范数和L2范数惩罚这两种方法的优点，平衡了L1范数正则化的稀疏性和L2范数正则化的权重收缩的优势，具有更好的泛化性能。以下为组合损失函数的计算公式：

LOSS_com＝α.LOSS_SAE+(1-α)·LOSS_LSTM+LOSS₁+LOSS₂

LOSS₁＝λ·β·(W_en+W_de+W_ih+W_hh+W_fc)

LOSS₂＝λ·(1-β)·(W_en ²+W_de ²+W_ih ²+W_hh ²+W_fc ²)

α控制LOSS_SAE和LOSS_LSTM之间的权重，当α为1时，只有重构损失(指LOSS_SAE)起作用，而分类损失(LOSS_LSTM)没有影响。这意味着SAE-LSTM网络模型主要关注于重构输入数据，并尽量减小重构误差；当α为0时，只有分类损失起作用，而重构损失没有影响，这意味着SAE-LSTM网络模型主要关注于分类任务，并尽量优化分类准确性；当α取0-1之间的值时，重构损失和分类损失都会被考虑，SAE-LSTM网络模型会在平衡重构和分类任务之间进行优化。通过调整α的值，可以在重构和分类任务之间找到最佳的权衡，以满足具体的问题需求和性能要求。

λ决定了L1范数和L2范数正则化的重要性，β则控制L1范数正则化和L2范数正则化之间的权重，LOSS₁计算的是L1范数正则化项，用于惩罚SAE-LSTM网络模型参数的绝对值之和，通过计算不同权重矩阵的L1范数来度量参数的稀疏性。W_en和W_de分别代表SAE网络模块中编码器和解码器的权重矩阵，W_ih包含连接LSTM层输入与其隐藏状态的权重，负责将输入特征转换为LSTM单元内的隐藏状态表示；W_hh是LSTM网络中隐藏到隐藏相关联的权重矩阵，包含将先前隐藏状态连接到LSTM层中当前隐藏状态的权重，负责传递隐藏状态信息，使LSTM能够在输入时间序列中保持依赖性。W_fc是LSTM网络模型中全连接层的权重矩阵。每个权重矩阵的L1范数是其所有元素的绝对值之和。将这些范数加在一起，乘以λ和β，以对L1范数正则化项进行加权。这样做的目的是促使SAE-LSTM网络模型产生稀疏的参数，以减少冗余性并提高SAE-LSTM网络模型的泛化能力。

LOSS₂计算的是L2范数正则化项，用于惩罚模型参数的平方和。通过计算不同权重矩阵的L2范数的平方来度量参数的平滑性。每个权重矩阵的L2范数的平方是其所有元素的平方和。将这些平方和加在一起，乘以λ和1-β，以对L2范数正则化项进行加权。这样做的目的是促使SAE-LSTM网络模型产生平滑的参数，以减少过拟合现象并提高SAE-LSTM网络模型的泛化能力。

通过使用λ和β乘以正则化项，可以在权衡SAE-LSTM网络模型复杂性、重构任务和分类任务之间找到适当的平衡，有助于优化整体损失函数，以达到更好的模型性能和泛化能力。

S105，采用贝叶斯优化技术寻找SAE-LSTM网络模型的最优参数。

采用贝叶斯优化技术能够降低计算成本并提高效率。贝叶斯优化先使用代理模型对未知函数进行建模，然后使用获取函数来确定下一组超参数，以根据有关函数的当前知识进行采样，目标是尝试搜索空间的新区域达到平衡探索和围绕当前已知的最佳超参数优化搜索。使用贝叶斯优化技术寻找最佳学习率和组合损失函数中权重α，可以最大限度地提高SAE-LSTM网络模型在电压异常检测任务上的准确性。以下是实现贝叶斯优化技术的步骤：

(1)构建模型优化函数，将学习率和α作为输入参数。此函数构造神经网络模型，对其进行训练，并计算准确率分数。

(2)指定参数范围：学习率和α设置在一定范围内搜索。

(3)定义优化的初始点数和迭代数，使用8个初始点和50次迭代。

(4)使用优化器对象的最大化方法来执行优化。该方法使用高斯过程模型和采集函数探索参数空间，并找到最佳超参数值。

(5)最后从优化器的max属性中获取学习率和α的最佳参数值。

为了能够得到最优的SAE-LSTM异常检测模型，本实施例中选取了不同的隐藏层层数和隐藏层单元数进行实验。

神经网络由输入层、隐藏层和输出层构成，其中隐藏层的数量和每层中隐藏单元的数量在决定神经网络的容量和复杂性方面有着重要的作用，这些超参数的选择会影响模型学习复杂模式和对未见数据的泛化能力。

对于SAE网络模型，输入层与输出层的神经元节点数取决于输入数据的维度。本示例数据集经过提取和预处理后的数据特征维度为6，所以SAE网络模型的输入层与输出层神经元单元数均为6。神经网络中隐藏层的作用是学习输入数据的复杂特征，增加隐藏层单元的数量为神经网络提供了更多的表征能力，使其能够学习输入数据的更复杂和细微的特征。但是，如果隐藏层层数太多也可能导致模型训练时间过长、过拟合和梯度消失等问题。输入数据维度为6，为了提取数据的隐藏特征，选取的两种最优组合隐藏层单元数分别为64以及16、64。

对于LSTM网络模型，选取由SAE提取出的隐藏特征作为特征值，输出数据标签类型，故输出层单元数为4(正常、超压、失压、低压共4种类型)。对于隐藏层层数及隐藏层单元数选取，当隐藏层数大于3层时，网络计算量会成倍增加，因此，选择1～3层隐藏层数量进行研究。为了节约时间成本，初步设定训练次数为100次。由于计算机以二进制存储和运算数据，因此选择16为初始值，以2的倍数依次增加神经元节点数分别运行程序得到在测试集的正确率值。1～3层隐藏层的单元数均可设置从16～256，组合有很多种，经过实验，选出两种模型性能最优的组合，隐藏层单元数分别为128、128以及128、128、128。各种组合所得的模型的网络结构如下表1所示。

表1：各模型具体网络结构

model	SAE1-LSTM2	SAE2-LSTM2	SAE1-LSTM3	SAE2-LSTM3
					输入层	6	6	6	6
Hiddlen_SAE_1	64	16	16	16
					Hiddlen_SAE_2	-	64	-	64
Hiddlen_LSTM_1	128	128	128	128
					Hiddlen_LSTM_2	128	128	128	128
Hiddlen_LSTM_3	-	-	128	128
					输出层	4	4	4	4

信噪比设置为-20～20dB，步长为4，将表1中各神经网络模型的学习率和修改为得到的最佳参数值，由于数据变化具有趋势性和不确定性，设置每一个模型在每一个信噪比实验50次，取均值作为该次的实验结果。

正确率的计算公式如下：

宏F1中weighted-F1计算公式如下：

weighted-F1＝ω₁·F1₁+ω₂·F1₂+…+ω_N·F1_N

实验结果如图5a和图5b所示，图5a为各模型的正确率结果图，图5b为各模型的F1值结果图。从图中可以看出，对比SAE2-LSTM2和SAE2-LSTM3两个模型，正确率和F1值均相近，但SAE2-LSTM3模型的正确率和F1值均略高于SAE2-LSTM2的，说明增加LSTM隐藏层层数可以提高正确率；对比SAE1-LSTM2和SAE2-LSTM2两模型可知，增加SAE层数正确率没有显著变化，说明增加SAE的层数对模型性能提高的效果不明显。对比四个模型可明显看出，SAE2-LSTM3的正确率和F1值均为最高，模型性能最好。因此，SAE隐藏层层数为2层，隐藏层单元数分别为16、64，LSTM隐藏层层数为3层，隐藏层单元数分别为128、128、128的SAE2-LSTM3异常检测模型的性能更佳。

通过SAE网络模型的编码可以获得数据的隐藏特征表示，而LSTM网络模型有效地捕捉了时间序列数据中的长期依赖关系，训练过程中加入稀疏惩罚参数防止了过拟合，从而增强了模型的鲁棒性。SAE-LSTM组合有效地利用了数据中的特征信息，模型在进行异常检测时考虑了数据的时间依赖性，从而提高了检测精度，适合应用在关口电能计量装置异常事件检测，完成对其运行状态的评估。

如图6所示，基于相同的发明构思，本实施例中同时提供了一种关口电能计量装置运行状态异常检测系统，包括：

上述模型构建模块和异常检测模块中，先要基于滑动窗口技术，由三相电压数据和三相电流数据构造获得三相电压特征数据和三相电流特征数据，然后再由三相电压特征数据和三相电流特征数据进行模型循环或异常检测。

对于各个模块的具体处理方式请见上述方法实施例中的详细描述，此处不再赘述。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种关口电能计量装置运行状态异常检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的关口电能计量装置运行状态异常检测方法，其特征在于，SAE-LSTM异常检测模型中，堆叠自编码器的隐藏层为两层，两个隐藏层的单元数分别为16和64；长短期记忆网络的隐藏层为三层，三个隐藏层的单元数均为128。

3.根据权利要求1所述的关口电能计量装置运行状态异常检测方法，其特征在于，SAE-LSTM异常检测模型的构建，包括以下步骤：

使用组合损失函数对SAE-LSTM网络模型进行微调；

4.根据权利要求3所述的关口电能计量装置运行状态异常检测方法，其特征在于，基于提取出的三相电压数据和三相电流数据构造样本数据集，包括：

分别对三相电压数据和三相电流数据添加噪声，得到模拟数据；

对生成的模拟数据进行预处理，所述预处理包括缺失数据补齐和归一化；

使用滑动窗口对预处理后的模拟数据进行处理，得到每个窗口内的特征，所述特征包括窗口内数据的均值、中位数和方差，所有窗口内的特征构成样本数据集。

5.根据权利要求4所述的关口电能计量装置运行状态异常检测方法，其特征在于，在所述预处理后，如果正常数据和异常数据的比例没有达到预设值，则使用SMOTEBoost算法生成新的样本数据以平衡正常数据和异常数据。

6.根据权利要求3所述的关口电能计量装置运行状态异常检测方法，其特征在于，所述组合损失函数为：

LOSS_com＝α·LOSS_SAE+(1-α)·LOSS_LSTM+LOSS₁+LOSS₂

LOSS₁＝λ·β·(W_en+W_de+W_ih+W_hh+W_fc)

LOSS₂＝λ·(1-β)·(W_en ²+W_de ²+W_ih ²+W_hh ²+W_fc ²)

其中，W_en和W_de分别代表SAE网络模型中编码器和解码器的权重矩阵，W_ih包含连接LSTM层输入与其隐藏状态的权重，W_hh是LSTM网络模型中隐藏到隐藏相关联的权重矩阵，W_fc是LSTM网络模型中全连接层的权重矩阵，α、λ、β均为参数。

7.根据权利要求3所述的关口电能计量装置运行状态异常检测方法，其特征在于，在采用贝叶斯优化算法寻找微调后的SAE-LSTM网络模型的最优参数的步骤之后，还包括步骤：选取不同的隐藏层层数和隐藏层单元数构建多个SAE-LSTM网络模型，对多个SAE-LSTM网络模型进行实验，选择正确率和F1值最高的模型作为SAE-LSTM异常检测模型。

8.一种关口电能计量装置运行状态异常检测系统，其特征在于，包括：