CN113204894A

CN113204894A - 一种电能计量异常诊断模型的构建方法及应用

Info

Publication number: CN113204894A
Application number: CN202110589744.1A
Authority: CN
Inventors: 王非; 杨珺
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2021-08-03
Anticipated expiration: 2041-05-28
Also published as: CN113204894B

Abstract

本发明公开了一种电能计量异常诊断模型的构建方法及应用，通过构造不同的样本对来对训练数据进行增强，并采用两阶段的模型训练方法，首先以最小化模型的输出与对应样本标签之间的差异为目标对电能计量异常诊断模型进行预训练，并基于预训练阶段内模型的输出分布确定间隔阈值；然后以最大化正例对和负例对所对应的模型输出与间隔阈值之间的间隔为目标，对电能计量异常诊断模型进行多轮训练，并且在多轮训练过程中基于上一轮训练阶段内模型的输出分布更新间隔阈值，以用于下一轮训练阶段，大大提高了模型的准确率，能够在电力数据不足且样本分布不均匀的情况下，使模型在兼顾已知类别的识别性能的基础上具备对未知异常电力数据的感知能力。

Description

一种电能计量异常诊断模型的构建方法及应用

技术领域

本发明属于电能计量异常诊断领域，更具体地，涉及一种电能计量异常诊断模型的构建方法及应用。

背景技术

电力计量装置是分析电力设备运行状态的重要数据来源。一方面，电能计量数据的异常反映了电力设备故障或线路异常。鉴于电能计量设备分布广泛，检修人员难以短时间内巡检每一台设备，因此，可以通过对计量数据的异常诊断实现电力设备自动远程监控。一旦出现计量数据异常，可以快速定位异常设备或线路，避免因设备故障而引发安全事故。另一方面，电能计量数据发生异常会给电网带来不可估量的经济损失。因此，电能计量数据异常诊断具有重要意义。

电能计量装置数目众多，在地理位置上分布广泛，因设备更新、运行环境等变化，电力数据经常更新，且不同地区的数据特征差距较大，因此电能计量异常诊断面临以下挑战：

1)已标定的样本数少。对异常样本的标定通常来自电力领域的专家，根据自身多年经验实现对数据的判定及标记。随着海量数据的增长、计量装备的更新换代，数据标定对专家人力的需求异常庞大，根本无法满足当前的需求；

2)异常类型样本分布极度不均衡。例如“功率因数异常”经常发生，因此对应着大量的标签样本，而“失压”异常的样本数却极其有限。异常类型分布不平衡必然导致计量异常诊断模型出现严重的过拟合；

3)存在缺乏案例数据或未被发现的“未知”异常。这类异常在理论上存在，但由于出现的几率极低，导致在实际中几乎没有此类异常案例。例如计量装置异常引发变压器故障甚至爆炸，在实际中虽有发生但几率极低。甚至还有一部分未知异常，完全没有包含在已有的案例库中。但是，实际的计量异常诊断应用场景仍然要求具备对未知异常的检测和诊断能力，以避免不可预知的故障。

由于电力数据样本案例数不足且样本分布不均衡，部分类别没有实际案例或只有极少案例，无法使用传统的数据增强手段对数据集进行扩充。使用传统的监督学习方法训练得到的电能计量异常诊断模型容易陷入过拟合，且不具备对未知异常数据的感知能力。

发明内容

针对现有技术的以上缺陷或改进需求，本发明提供了一种电能计量异常诊断模型的构建方法及应用，其目的在于解决现有技术无法在电力数据不足且样本分布不均匀的情况下，使电能计量异常诊断模型在兼顾已知类别的识别性能的基础上具备对未知异常电力数据的感知能力的技术问题。

为了实现上述目的，本发明提供了一种电能计量异常诊断模型的构建方法，包括以下步骤：

S1、构建电能计量异常诊断模型；其中，电能计量异常诊断模型包括级联的嵌入层、度量层和分类器；

S2、对基类数据集进行处理，得到带有样本标签的训练集；其中，基类数据集为采集到的已知异常类别的电能计量异常数据所构成的数据集；训练集包括正例对和负例对；正例对为基类数据集中相同异常类别的样本所组成的样本对；负例对为基类数据集中不同异常类别的样本所组成的样本对；

S3、将训练集输入到电能计量异常诊断模型中，以最小化电能计量异常诊断模型的输出与对应样本标签之间的差异为目标对电能计量异常诊断模型进行预训练，并收集预训练阶段内电能计量异常诊断模型的输出；

S4、根据预训练阶段内电能计量异常诊断模型的输出分布，确定间隔阈值，并作为步骤S5中多轮训练阶段中间隔阈值的初始值；其中，间隔阈值用于间隔正例对与负例对所对应的电能计量异常诊断模型的输出；

S5、将训练集输入到电能计量异常诊断模型中，以最大化正例对和负例对所对应的电能计量异常诊断模型输出与间隔阈值之间的间隔为目标，对电能计量异常诊断模型进行多轮训练；其中，收集各轮训练阶段内电能计量异常诊断模型的输出；并基于上一轮训练阶段内电能计量异常诊断模型的输出分布，确定下一轮训练阶段的间隔阈值。

进一步优选地，样本对包括支撑集样本和待测样本；支撑集样本为基类数据集中某一异常类别的n个样本；训练集中的待测样本为基类数据集中异于对应支撑集样本的某一个样本。

进一步优选地，嵌入层用于提取输入样本的特征，得到待测样本和支撑集样本的特征向量；度量层用于计算待测样本与支撑集样本的特征向量之间的距离，得到距离向量；分类器用于将距离向量转换成待测样本与支撑集样本之间的相似程度，得到待测样本与支撑集样本属于同一类的概率，以对待测样本的异常类别进行分类；其中，输入样本包括支撑集和待测样本；支撑集包括支撑集样本；支撑集样本为基类数据集中某一异常类别的n个样本。

进一步优选地，嵌入层包括两个并列的共享网络结构和参数的卷积网络，分别对支撑集样本和待测样本进行特征提取，得到支撑集样本和待测样本的特征向量；其中，若n大于或等于2，嵌入层还用于对支撑集样本的特征向量按照其特征维度计算平均值，作为支撑集样本的特征向量；

度量层用于分别将待测样本的特征向量与支撑集样本的特征向量相减后取绝对值，得到待测样本与支撑集样本的特征向量之间的距离；

分类器包括级联的第一全连接层、第二全连接层和sigmoid激活层；其中，sigmoid激活层的输出为待测样本与支撑集样本属于同一类的概率。

进一步优选地，步骤S3中，对电能计量异常诊断模型进行预训练时所采用的损失函数为二进制交叉熵损失函数。

进一步优选地，步骤S5中采用阈值对比损失函数对电能计量异常诊断模型进行训练；其中，阈值对比损失函数的公式为：

loss_i＝y_i×max(margin+α-S_i，0)²+(1-y_i)×max(S_i-(margin-α)，0)²

其中，loss_i为第i个样本对所对应的阈值对比损失函数值；y_i为第i个样本对所对应的样本标签；margin为间隔阈值；α为置信分布间隔系数；S_i为第i个样本对所对应的电能计量异常诊断模型的输出。

进一步优选地，根据电能计量异常诊断模型的输出分布确定间隔阈值的方法包括：

采用无监督学习方法将电能计量异常诊断模型的输出划分为两簇，得到正例对和负例对所对应的电能计量异常诊断模型的输出的分布边界；将相邻的正例对所对应的分布边界和负例对所对应的分布边界的平均值作为间隔阈值。

第二方面，本发明提供了一种电能计量异常诊断方法，包括：

将测试样本输入到采用上述电能计量异常诊断模型的构建方法所构建的电能计量异常诊断模型中，得到待测样本与各支撑集样本属于同一类的概率，记所得概率的最大值为p；其中，测试样本包括待测样本和支撑集，支撑集包括k个异常类别不同的支撑集样本；支撑集样本为基类数据集中某一异常类别的n个样本；基类数据集为采集到的已知异常类别的电能计量异常数据所构成的数据集；k为基类数据集中的已知异常类别总数；

判断p是否大于置信区间阈值，若是，则判定待测样本的异常类别为已知异常类别，具体为p所对应的支撑集样本的异常类别；否则，判定待测样本的异常类别为未知异常类别；

其中，置信区间阈值为根据上述步骤S5中最后一轮训练阶段内的电能计量异常诊断模型的输出分布确定；具体为：采用无监督学习方法将电能计量异常诊断模型的输出划分为两簇，得到正例对和负例对所对应的电能计量异常诊断模型的输出的聚类中心；将正例对和负例对所对应的聚类中心的a％分位点作为置信区间阈值；a％为预设分位点。

进一步优选地，每检测到一个未知异常类别时，在确定到其具体异常类别后，将该未知异常类别的电能计量异常数据加入训练阶段所用的基类数据集中，重新执行上述步骤S2-S5对电能计量异常诊断模型进行训练。

第三方面，本发明还提供一种机器可读存储介质，所述机器可读存储介质存储有机器可执行指令，所述机器可执行指令在被处理器调用和执行时，所述机器可执行指令促使所述处理器实现如上所述的任一种电能计量异常诊断模型的构建方法和/或如上所述的电能计量异常诊断方法。

总体而言，通过本发明所构思的以上技术方案，能够取得以下有益效果：

1、本发明提供了一种电能计量异常诊断模型的构建方法，针对电能计量数据存在的有标签的计量异常样本数明显不足，且样本分布不均衡的问题，提出了一种小样本学习方法，通过构造不同的样本对来对训练数据进行增强，从而降低了模型过拟合的风险，使模型学习一种对比学习的能力，提高了电能计量异常诊断模型的准确率，能够在电力数据不足且样本分布不均匀的情况下，使电能计量异常诊断模型在兼顾已知类别的识别性能的基础上具备对未知异常电力数据的感知能力。

2、本发明所提供的电能计量异常诊断模型的构建方法，在训练时使用了一种阈值对比损失函数，该损失函数以最大化正例对与负例对所对应的电能计量异常诊断模型的输出之间的间隔为目标，并且把置信度判决规则中使用到的置信区间阈值嵌入损失函数作为间隔阈值。使用该损失函数训练模型，即可根据电能计量异常诊断模型的输出分布确定合适的置信区间阈值，从而达到识别未知异常数据的目的。

3、本发明提供了一种电能计量异常诊断方法，在采用上述电能计量异常诊断模型后，进一步对模型输出进行置信度判决，找到能够把正例对所对应的电能计量异常诊断模型的输出S_正与负例对所对应的电能计量异常诊断模型的输出S_负的分布划分开的分界点，即可同时保证基类和新类的分类性能，使模型能够辨别测试样例是否属于已知异常，从而达到辨别基类和新类的目的；本发明可以在小样本电力数据集上，实现在兼顾已知类别的识别性能的基础上较好地检测“未知”类型异常。

附图说明

图1为本发明实施例1所提供的一种电能计量异常诊断模型的构建方法流程图；

图2为本发明实施例1所提供的根据电能计量异常诊断模型的输出分布所确定的间隔阈值和置信区间阈值的示意图；

图3为本发明实施例1所提供的电能计量异常诊断模型两阶段训练过程的流程图；

图4为本发明实施例2所提供的一种电能计量异常诊断方法的流程图；

图5为本发明实施例2所提供的一种电能计量异常诊断方法的具体流程框图；

图6为本发明实施例2所提供的构建基类测试任务和新类测试任务的示意图；

图7为本发明实施例2所提供的电能计量异常诊断模型的结构示意图；

图8为本发明实施例2所提供的嵌入层中卷积模块的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

实施例1、

一种电能计量异常诊断模型的构建方法，如图1所示，包括以下步骤：

具体地，嵌入层用于提取输入样本的特征，得到待测样本和支撑集样本的特征向量；度量层用于计算待测样本与支撑集样本的特征向量之间的距离，得到距离向量；分类器用于将距离向量转换成待测样本与支撑集样本之间的相似程度，得到待测样本与支撑集样本属于同一类的概率，以对待测样本的异常类别进行分类；其中，输入样本包括支撑集和待测样本；支撑集包括支撑集样本；支撑集样本为基类数据集中某一异常类别的n个样本；n为正整数。需要说明的是，在训练模型之前，需要对收集到的原始电能计量异常数据进行数据预处理和数据建模，得到基类数据集，其中数据建模的方法不作限制，需根据电能计量场景自行调整。

优选地，嵌入层包括两个并列的共享网络结构和参数的卷积网络，分别对支撑集样本和待测样本进行特征提取，得到支撑集样本和待测样本的特征向量；其中，若n大于或等于2，嵌入层还用于对支撑集样本的特征向量按照其特征维度计算平均值，作为支撑集样本的特征向量；进一步地，若经过特征提取后得到的特征向量不是一维向量，嵌入层还需要经过特征降维，经过一层flatten层和全连接层得到一维向量。

度量层用于分别将待测样本的特征向量与支撑集样本的特征向量相减后取绝对值，得到待测样本与支撑集样本的特征向量之间的距离；具体地，本实施例中经过嵌入层之后得到的待测样本和支撑集样本的特征向量都是一维向量，故直接进行相减后取绝对值即可得到待测样本与支撑集样本的特征向量之间的距离。

分类器包括级联的第一全连接层、第二全连接层和sigmoid激活层；其中，sigmoid激活层的输出为表示待测样本与支撑集样本之间的相似程度的概率。

S2、对基类数据集进行处理，得到带有样本标签的训练集；基类数据集为采集到的已知异常类别的电能计量异常数据所构成的数据集；训练集包括正例对和负例对；正例对为基类数据集中相同异常类别的样本所组成的样本对，对应的样本标签为1；负例对为基类数据集中不同异常类别的样本所组成的样本对，对应的样本标签为0；

在一个可选实施方式中，样本对包括支撑集样本和待测样本；支撑集样本为基类数据集中某一异常类别的n个样本；训练集中的待测样本为基类数据集中异于对应支撑集样本的某一个样本，其异常类别可以与支撑集样本同类，也可以与支撑集样本不同类。本实施例中，一个样本对(包括正例对和负例对)均包含一个待测样本和由n个样本组成的支撑集样本；其中，正例对所对应的样本标签为0，负例对所对应的样本标签为1。

优选地，对电能计量异常诊断模型进行预训练时所采用的损失函数为二进制交叉熵损失函数。

本实施例中，预训练阶段可以包括多轮训练，每轮训练包括多次迭代；每轮训练中采集其最后一次迭代所得的电能计量异常诊断模型的输出。本实施例中预训练阶段的训练轮次取值为1，每轮的迭代次数取值为3000。

具体地，如图2所示，在一个可选实施方式中，根据电能计量异常诊断模型的输出分布确定间隔阈值(图2中间隔阈值记为lossmargin)的方法包括：

采用无监督学习方法将电能计量异常诊断模型的输出划分为两簇，得到正例对和负例对所对应的电能计量异常诊断模型的输出的分布边界；将相邻的正例对所对应的分布边界和负例对所对应的分布边界的平均值作为间隔阈值；本实施例中的间隔阈值为负例对所对应的上边界和正例对所对应的下边界的平均值。无监督学习方法优选为k-means聚类方法。

优选地，步骤S5中采用阈值对比损失函数对电能计量异常诊断模型进行训练；为了将正例对所对应的电能计量异常诊断模型的输出S_正与负例对所对应的电能计量异常诊断模型的输出S_负分离开，本发明提出了一种阈值对比损失函数；具体地，阈值对比损失函数的公式为：

loss_i＝y_i×max(margin+α-S_i，0)²+(1-y_i)×max(S_i-(margin-α)，0)²

其中，loss_i为第i个样本对所对应的阈值对比损失函数值；y_i为第i个样本对所对应的样本标签；margin为间隔阈值；α为置信分布间隔系数(要求S_正和S_负分布间隔至少为2α，在一个可选实施方式下，α设置为0.2)；S_i为第i个样本对所对应的电能计量异常诊断模型的输出。

进一步地，步骤S5中的训练被划分为N轮，每一轮训练中包括M次迭代；每经过一轮训练，根据上一轮训练阶段内的电能计量异常诊断模型输出的分布更新一次间隔阈值，其中，间隔阈值的计算方法与步骤S4中描述的方法一致。具体地，本实施例中N取值为3，M取值为3000。

需要说明的是，本发明中模型的训练阶段分为两个阶段：预训练阶段(对应步骤S3)和正式训练阶段(对应步骤S5)；本实施例中两阶段的训练过程流程图如图3所示。

进一步地，在各轮训练阶段中，用于训练的训练集所包含的正例对和负例对的数目相同。

实施例2、

一种电能计量异常诊断方法，如图4所示，包括：

将测试样本输入到采用实施例1中电能计量异常诊断模型的构建方法所构建的电能计量异常诊断模型中，得到待测样本与各支撑集样本属于同一类的概率，记所得概率的最大值为p；其中，测试样本包括待测样本和支撑集，支撑集包括k个异常类别不同的支撑集样本；支撑集样本为基类数据集中某一异常类别的n个样本；基类数据集为采集到的已知异常类别的电能计量异常数据所构成的数据集；k为基类数据集中的已知异常类别总数；

具体地，如图5所示为本实施例所提供的一种电能计量异常诊断方法的流程框图；其中，输入模型的测试样本包含一个待测样本和一个支撑集，其中，支撑集包括k种不同类型的支撑集样本，k为所有已知异常类型的数目，为大于或等于2的整数；待测样本与支撑集中的每类支撑集样本两两组队输入模型，得到一个k维的置信度向量(即所得概率所组成的向量)，表示模型预测的待测样本与支撑集中每类支撑集样本的相似程度。随后对所得置信度进行判决，得到分类结果。具体地，图5中的虚线箭头给出了测试样本输入电能计量异常诊断模型的具体流程。本实施例中，对于支撑集中每类支撑集样本中的多个样本，输入电能计量异常诊断模型的嵌入层后需要对得到的多个特征向量求均值，为了对齐特征向量，把待测样本的特征向量复制k次，把支撑集和待测样本的特征向量一起输入用于特征降维的flatten层和全连接层，再依次输入电能计量异常诊断模型的度量层和分类器得到置信度向量，为待测样本与支撑集中每类支撑集样本的相似程度，即待测样本与各支撑集样本属于同一类的概率。

对所得置信度进行判决是给电能计量异常诊断模型分类增加了一个条件，只有满足该条件才能进行下一步分类，如果不满足则直接划分为新类。即当p属于置信区间时，说明待测样本的预测结果为基类，即待测样本的异常类别为已知异常类别，具体为p所对应的支撑集样本的异常类别c_p；当p不属于置信区间时，说明待测样本的预测结果为新类new，即待测样本的异常类别为未知异常类别。这里的置信区间为(base_CI,1)，为用于基类和新类判决的置信区间；其中，base_CI为上述置信区间阈值；具体地，待测样本的异常类别的诊断结果如下：

其中，置信区间阈值根据实施例1步骤S5中最后一轮训练阶段内的电能计量异常诊断模型的输出分布确定；如图2所示，置信区间阈值记为base_CI margin，具体为：采用无监督学习方法将电能计量异常诊断模型的输出划分为两簇，得到正例对和负例对所对应的电能计量异常诊断模型的输出的聚类中心；将正例对和负例对所对应的聚类中心的a％分位点作为置信区间阈值；a％为预设分位点。预选地，a的取值范围在50～70之间；本实施例中，取值为60，即选择聚类中心的60％分位点为置信区间阈值。

需要说明的是，对所得置信度进行判决需要找到能够把模型的S_正和S_负分布划分开的分界点，即可同时保证基类和新类的分类性能。由于训练过程中的随机性，正例对和负例对分布的分界点应该是波动的，且在0.5附近波动。选择合适的分界点，即可在测试时保证基类和新类的精度。

在一种可选实施方式下，每检测到一个未知异常类别时，在确定到其具体异常类别后，将该未知异常类别的电能计量异常数据加入实施例1中训练阶段所述的基类数据集中，重新执行实施例1中所述的步骤S2-S5对电能计量异常诊断模型进行训练。

如图6所示，为了验证发明所提供的电能计量异常诊断方法的准确度，采集用于测试的电能计量异常数据集，对采集到的电能计量异常数据集按照异常类别的分布进行划分，将异常样本数大于预设样本数的电能计量异常类别数据作为基类测试集，其余的电能计量异常类别数据作为新类测试集；本实施例中，根据上述电能计量异常数据集中异常类别的分布，选择异常样本数相对较少的1～2类下的电能计量异常数据样本构成新类数据集，其余的电能计量异常数据样本构成基类数据集，构建基类测试任务和新类测试任务；基类测试任务都来自基类测试集，待测样本为基类测试集中的某一类，测试标签为k维的one-hot向量，其中，与待测样本相对应的支撑集索引对应为1。新类测试任务中支撑集也来自基类测试集，待测样本来自新类测试集，待测样本不与支撑集中的任一类对应，测试标签为k维的零向量。支撑集由k类基类样本组成，每类包含n个样本。测试时把待测样本与支撑集中的每类样本分别进行两两组队一起输入模型，模型需要分辨待测样本来自基类或新类，如果是基类，还需给出具体的类别。进一步地，将模型的测试结果与实际结果进行对比，对于基类测试任务预测为基类且模型输出的最大值索引与测试标签的最大值索引一致说明预测正确，对于新类测试任务只要预测为新类则预测正确。测试模型时分别构造设定数目的基类测试任务和新类测试任务，测试精度为总任务数中预测正确的任务数所占的比率。

相关技术方案同实施例1，这里不做赘述。

为了进一步说明本发明所提供的电能计量异常诊断模型和方法，下面结合一个具体的应用实例进行详述：

本应用实例使用中国某市变电站的电表计量异常数据进行实验。受电能计量场景的限制，已知的异常类型和异常数目有限，且每类样本数目分布极度不均匀，已知的异常类型有失压、失流、电流不平衡、电压不平衡、接线错误和功率因数异常共6类。

本应用实例使用的电能计量异常数据包含三相三线和三相四线的电力数据，两者的电气参数数目不同，其中三相四线包含A、B、C分相电压、电流、功率、功率因数、总功率和总功率因数共14个电气参数，三相三线包含A、C分相电压、电流、功率、功率因数、总功率和总功率因数共10个电气参数。本应用实例使用统一的电气异常指标把不同接线方式的电力数据合并为一个数据集。

数据建模的过程包括按照指定时间跨度分组、过滤缺失数据和规整有效数据。本应用实例使用的电力数据每15分钟进行一次采集，一天包含96个时间戳。首先以一天为时间跨度，对电力数据进行分组。随后需要对电力数据进行过滤，主要过滤一天之内不足96个时间点的数据、发生严重缺失或发生大量系统默认值填补的数据。最后是对所有样本进行统一规整。本应用实例使用统一的电气指标进行数据建模，可以统一不同接线方式的数据，并且能把不同类型的数据区分开。

表1为本应用实例用于数据建模使用的电力异常指标，对于三相三线的电力数据，所有涉及三相电气参数的计算均改为A、C两相。综上所述，数据集的样本尺寸为96×12，时间维度为96，电力异常指标有12个，如表1所示，最后需要对数据样本进行归一化。

表1

本应用实例将前述6种异常类型划分基类和新类，具体将失压和电流不平衡两类作为新类，其余4种类型为基类。对基类数据按照3:1的比例进行划分：每类样本的75％用于训练，25％用于测试。新类的所有样本都用于测试。数据的分布情况为基类训练集共计1815个样本，基类测试集共计605个样本，新类测试集共19个样本。

本应用实例使用的电能计量异常诊断模型的模型结构如图7所示，其中嵌入层包括三个卷积模块；如图8所示，每个卷积模块由一层二维卷积、归一化层、最大池化层和ReLU激活层组成，卷积层的卷积核大小为3×3，滤波器数目为64，padding为SAME模式，最大池化层的padding为VALID模式。支撑集中的各支撑集样本经过嵌入层后还需对每类特征向量求均值。度量层是对待测样本和支撑集中的各支撑集样本的特征向量进行相减并取绝对值操作(度量层使用的是将特征向量进行拼接的方式计算特征向量间的距离)。分类器由两层全连接层后接sigmoid激活层组成，其中倒数第二层全连接层的神经元数目为64，最后一层全连接的神经元数目为1。

训练过程中超参数设置包括：n取值为5，k取值为4，预训练阶段的总迭代次数为3000次，正式训练阶段的总迭代次数为9000次(每3000次迭代为一轮训练)，优化器为SGD优化器，学习率lr采用阶梯下降式学习率策略，其计算公式如下：

其中，lr₁和lr₂分别为0.1和0.002，c的值为5000，上式表示学习率从0.1开始经过10次下降，经过5000次迭代下降到0.002后保持不变。

正式训练阶段训练时，每经过3000次迭代(即一轮训练)，根据训练过程中收集到的模型输出S更新一次阈值对比损失函数中的损失函数的间隔阈值和置信区间阈值，具体为：

利用KMeans聚类的方法将上一阶段模型输出S划分为两簇，计算聚类中心和分布边界，选择正例对和负例对所对应的分布边界的均值作为间隔阈值，正例对和负例对所对应的聚类中心的60％分位点作为置信区间阈值。

使用准确率来衡量模型的性能，对基类和新类各构建500个测试任务，测试精度为500个测试任务中分类正确的测试任务所占的比率。

实验证明，使用本发明提出的方法构建电能计量异常诊断模型，在小样本电力数据集上基类测试精度为88％，新类测试精度为89％。本发明的主要贡献为提出了一种电能计量异常诊断模型识别新类的方法，该方法可以在兼顾已知类别的识别性能的基础上具备对未知异常电力数据的感知能力。

实施例3、

一种机器可读存储介质，所述机器可读存储介质存储有机器可执行指令，所述机器可执行指令在被处理器调用和执行时，所述机器可执行指令促使所述处理器实现如实施例1所述的电能计量异常诊断模型的构建方法和/或实施例2所述的电能计量异常诊断方法。

相关技术方案同实施例1和实施例2，这里不做赘述。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种电能计量异常诊断模型的构建方法，其特征在于，包括以下步骤：

S1、构建电能计量异常诊断模型；所述电能计量异常诊断模型包括级联的嵌入层、度量层和分类器；

S2、对基类数据集进行处理，得到带有样本标签的训练集；所述基类数据集为采集到的已知异常类别的电能计量异常数据所构成的数据集；所述训练集包括正例对和负例对；所述正例对为基类数据集中相同异常类别的样本所组成的样本对；所述负例对为基类数据集中不同异常类别的样本所组成的样本对；

S3、将所述训练集输入到所述电能计量异常诊断模型中，以最小化电能计量异常诊断模型的输出与对应样本标签之间的差异为目标对所述电能计量异常诊断模型进行预训练，并收集预训练阶段内电能计量异常诊断模型的输出；

S4、根据所述预训练阶段内电能计量异常诊断模型的输出分布，确定间隔阈值，并作为步骤S5中多轮训练阶段中间隔阈值的初始值；所述间隔阈值用于间隔正例对与负例对所对应的电能计量异常诊断模型的输出；

S5、将所述训练集输入到所述电能计量异常诊断模型中，以最大化正例对和负例对所对应的电能计量异常诊断模型输出与间隔阈值之间的间隔为目标，对所述电能计量异常诊断模型进行多轮训练；其中，收集各轮训练阶段内电能计量异常诊断模型的输出；并基于上一轮训练阶段内电能计量异常诊断模型的输出分布，确定下一轮训练阶段的间隔阈值。

2.根据权利要求1所述的电能计量异常诊断模型的构建方法，其特征在于，所述样本对包括支撑集样本和待测样本；所述支撑集样本为所述基类数据集中某一异常类别的n个样本；训练集中的待测样本为所述基类数据集中异于对应支撑集样本的某一个样本。

3.根据权利要求1所述的电能计量异常诊断模型的构建方法，其特征在于，所述嵌入层用于提取输入样本的特征，得到待测样本和支撑集样本的特征向量；所述度量层用于计算待测样本与支撑集样本的特征向量之间的距离，得到距离向量；所述分类器用于将所述距离向量转换成待测样本与支撑集样本之间的相似程度，得到待测样本与支撑集样本属于同一类的概率，以对待测样本的异常类别进行分类；其中，所述输入样本包括支撑集和待测样本；所述支撑集包括支撑集样本；所述支撑集样本为基类数据集中某一异常类别的n个样本。

4.根据权利要求3所述的电能计量异常诊断模型的构建方法，其特征在于，所述嵌入层包括两个并列的共享网络结构和参数的卷积网络，分别对所述支撑集样本和所述待测样本进行特征提取，得到所述支撑集样本和所述待测样本的特征向量；其中，若n大于或等于2，所述嵌入层还用于对所述支撑集样本的特征向量按照其特征维度计算平均值，作为所述支撑集样本的特征向量；

所述度量层用于分别将所述待测样本的特征向量与所述支撑集样本的特征向量相减后取绝对值，得到所述待测样本与所述支撑集样本的特征向量之间的距离；

所述分类器包括级联的第一全连接层、第二全连接层和sigmoid激活层；其中，sigmoid激活层的输出为所述待测样本与所述支撑集样本属于同一类的概率。

5.根据权利要求1-4任意一项所述的电能计量异常诊断模型的构建方法，其特征在于，所述步骤S3中，对所述电能计量异常诊断模型进行预训练时所采用的损失函数为二进制交叉熵损失函数。

6.根据权利要求5所述的电能计量异常诊断模型的构建方法，其特征在于，所述步骤S5中采用阈值对比损失函数对电能计量异常诊断模型进行训练；所述阈值对比损失函数的公式为：

loss_i＝y_i×max(margin+α-S_i，0)²+(1-y_i)×max(S_i-(margin-α)，0)²

7.根据权利要求6所述的电能计量异常诊断模型的构建方法，其特征在于，根据电能计量异常诊断模型的输出分布确定间隔阈值的方法包括：

采用无监督学习方法将所述电能计量异常诊断模型的输出划分为两簇，得到正例对和负例对所对应的电能计量异常诊断模型的输出的分布边界；将相邻的正例对所对应的分布边界和负例对所对应的分布边界的平均值作为间隔阈值。

8.一种电能计量异常诊断方法，其特征在于，包括：将测试样本输入到采用权利要求1-7任意一项所述的电能计量异常诊断模型的构建方法所构建的电能计量异常诊断模型中，得到待测样本与各支撑集样本属于同一类的概率，记所得概率的最大值为p；所述测试样本包括待测样本和支撑集，所述支撑集包括k个异常类别不同的支撑集样本；所述支撑集样本为基类数据集中某一异常类别的n个样本；所述基类数据集为采集到的已知异常类别的电能计量异常数据所构成的数据集；k为所述基类数据集中的已知异常类别总数；

判断p是否大于置信区间阈值，若是，则判定所述待测样本的异常类别为已知异常类别，具体为p所对应的支撑集样本的异常类别；否则，判定所述待测样本的异常类别为未知异常类别；

其中，所述置信区间阈值为根据权利要求1-7任意一项所述的电能计量异常诊断模型的构建方法中的步骤S5中最后一轮训练阶段内的电能计量异常诊断模型的输出分布确定；具体为：采用无监督学习方法将电能计量异常诊断模型的输出划分为两簇，得到正例对和负例对所对应的电能计量异常诊断模型的输出的聚类中心；将正例对和负例对所对应的聚类中心的a％分位点作为置信区间阈值；a％为预设分位点。

9.根据权利要求8所述的电能计量异常诊断方法，其特征在于，每检测到一个未知异常类别时，在确定其具体异常类别后，将该未知异常类别的电能计量异常数据加入权利要求1-7任意一项所述的电能计量异常诊断模型的构建方法中所述的基类数据集中，重新执行权利要求1-7任意一项所述的电能计量异常诊断模型的构建方法中的步骤S2-S5对所述电能计量异常诊断模型进行训练。

10.一种机器可读存储介质，其特征在于，所述机器可读存储介质存储有机器可执行指令，所述机器可执行指令在被处理器调用和执行时，所述机器可执行指令促使所述处理器实现如权利要求1-7任意一项所述的电能计量异常诊断模型的构建方法和/或如权利要求8-9任意一项所述的电能计量异常诊断方法。