CN116912637B

CN116912637B - 输变电缺陷识别的方法、装置、计算机设备和存储介质

Info

Publication number: CN116912637B
Application number: CN202311174427.9A
Authority: CN
Inventors: 胥明凯; 任志刚; 杨杰; 于光远; 韩显芳; 李琮; 瞿寒冰; 刘晓; 刘一男; 胡庆浩; 陈显达; 王淑颖; 王思源; 刘昭; 张雨薇
Original assignee: Institute of Automation of Chinese Academy of Science; Jinan Power Supply Co of State Grid Shandong Electric Power Co Ltd
Current assignee: Institute of Automation of Chinese Academy of Science; Jinan Power Supply Co of State Grid Shandong Electric Power Co Ltd
Priority date: 2023-09-13
Filing date: 2023-09-13
Publication date: 2023-12-22
Anticipated expiration: 2043-09-13
Also published as: CN116912637A

Abstract

本发明公开了一种输变电缺陷识别的方法、装置、计算机设备和存储介质，属于图像处理技术领域，应用于变电站场景的方法包括：获取变电站缺陷检测数据集，对变电站缺陷检测数据集进行图像预处理，生成样本集；利用训练集训练卷积神经网络，建立基于YoloV3模型的变电站缺陷识别模型；基于双门动态剪枝方法对变电站缺陷识别模型进行轻量化处理，获得轻量化变电站缺陷识别模型：利用验证集对轻量化变电站缺陷识别模型进行验证；实时采集变电站缺陷监测图像，并输入轻量化变电站缺陷识别模型进行变电站缺陷检测。本发明能够及时发现和鉴别变电站和输电线路缺陷，提高了变电站和输电线路运维自动化水平和电网运行安全，也适用于输电线路场景。

Description

输变电缺陷识别的方法、装置、计算机设备和存储介质

技术领域

本发明涉及一种输变电缺陷识别的方法、装置、计算机设备和存储介质，属于图像处理技术领域。

背景技术

目前，面对工业化和商业化的迅速发展，电力在我们的生活和工作中扮演着越来越重要的角色，保证电力设备顺利运行不断电成为重点保障。输电线路和变电站是电力系统的重要组成部分，其安全性直接关系到整个电力系统的稳定运行。因此对输电线路和变电站进行实时检测、及时预防电力线路和变电站故障的发生，直接关系到整个电力系统的稳定运行。

随着能源互联网建设的深入，人工智能技术在输变电智能巡视、电力作业安全管控、智能作业等领域得到了应用，但是应用程度还不深入。近年来，随着人工智能学科的飞速发展，深度卷积神经网络已经被广泛地应用在了在众多领域，例如计算机视觉、知识图谱、信息检索、语义理解、强化学习、语音识别等众多热门领域，在学术界和工业界掀起了一股又一股的深度学习的浪潮，并且解决了很多基于计算机的推理和认知领域的难题，并推动了医疗健康、交通运输、互联网、金融等行业的发展。

输电线路和变电站缺陷识别主要是根据输入的图像对输电线路和变电站场景中的一些缺陷和隐患进行检测和识别。目前在输变电缺陷识别方面，相比于传统计算机视觉算法，基于人工智能的缺陷检测技术具有较大的参数量和计算量，大部分缺陷识别应用采用前端图像采集、云端智能分析的方式，将计算量较大的缺陷识别网络放在云端服务器上进行处理，这样大大影响了现场检测效率和使用的便捷性。

发明内容

针对现有输电线路和变电站缺陷识别技术效率低的问题，本发明提出了一种输变电缺陷识别的方法、装置、计算机设备和存储介质，能够及时发现和鉴别输电线路和变电站缺陷，提高输电线路和变电站运维自动化水平和电网运行安全。

本发明解决其技术问题采取的技术方案是：

第一方面，本发明实施例提供的一种输变电缺陷识别的方法，所述输变电缺陷为变电站缺陷，应用于变电站场景对变电站缺陷进行检测，所述的方法包括以下步骤：

获取变电站缺陷检测数据集，对变电站缺陷检测数据集进行图像预处理，生成样本集，所述样本集包括训练集和验证集；

利用训练集训练卷积神经网络，建立基于YoloV3模型的变电站缺陷识别模型，所述卷积神经网络为包含多个卷积层的卷积神经网络；

基于双门动态剪枝方法对变电站缺陷识别模型进行轻量化处理，获得轻量化变电站缺陷识别模型：

利用验证集对轻量化变电站缺陷识别模型进行验证；

实时采集变电站缺陷监测图像，并输入轻量化变电站缺陷识别模型进行变电站缺陷检测。

作为本实施例一种可能的实现方式，所述获取变电站缺陷检测数据集，对变电站缺陷检测数据集进行图像预处理，生成样本集，包括：

根据预先制定好的变电站巡检线路，使用图像采集设备进行变电站图像采集；

对所述变电站缺陷检测数据集进行清洗操作和归一化处理；

采用清洗操作和归一化处理后的变电站缺陷检测数据集生成样本集，并对样本集进行人工标注。

作为本实施例一种可能的实现方式，所述基于双门动态剪枝方法对变电站缺陷识别模型进行轻量化处理，获得轻量化变电站缺陷识别模型，包括：

使用空间门动态剪枝的策略掩码生成方法得到变电站缺陷识别模型的空间注意力图、特征空间执行概率和空间策略掩码；

使用空间门动态剪枝的策略掩码真实标签生成方法得到变电站缺陷识别模型的空间策略掩码的真实标签；

使用通道门动态剪枝的策略掩码生成方法得到变电站缺陷识别模型的通道注意力图、特征通道执行概率和通道策略掩码；

使用通道门动态剪枝的策略掩码真实标签生成方法得到变电站缺陷识别模型的通道策略掩码的真实标签；

使用总体损失函数对变电站缺陷识别模型进行剪枝和训练，对深度卷积神经网络的加速与压缩，得到轻量化变电站缺陷识别模型；所述总体损失函数包含缺陷目标检测损失项、特征空间自监督正则项、特征通道自监督正则项、稀疏度正则项和剪枝率平滑正则项。

作为本实施例一种可能的实现方式，所述使用空间门动态剪枝的策略掩码生成方法得到变电站缺陷识别模型的空间注意力图、特征空间执行概率和空间策略掩码，包括：

计算第层空间注意力图/>：

其中，表示神经网络模型/>的第/>层维度为/>的特征，/>表示自适应平均池化操作，该操作的输出尺寸设置为/>，/>表示/>卷积操作，空间注意力图/>的维度为/>；所述计算第/>层空间注意力图/>的过程为：首先第/>层输出特征/>被分为尺寸为/>的小块，然后对/>进行/>操作得到维度为/>的空间特征，最后进行/>卷积操作；

计算第层特征空间执行的概率/>：

其中，表示Sigmoid函数；

计算空间门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ表示采样的缩放因子；

当特征空间对应的策略掩码的值小于0.5时，对该特征空间进行剪枝；否则不对该特征空间进行剪枝；

重复执行以上步骤直至神经网络所有层都被遍历为止。

作为本实施例一种可能的实现方式，所述使用空间门动态剪枝的策略掩码真实标签生成方法得到变电站缺陷识别模型的空间策略掩码的真实标签，包括：

计算空间门动态剪枝的第层空间策略掩码的真实标签/>：

将第层真实标签/>初始化为全1向量：

其中，表示空间注意力图/>的维度；

计算每个特征空间的激活值：

其中，表示自适应平均池化操作，该操作的输出尺寸设置为，/>表示/>卷积操作，卷积核权重设置为/>，表示绝对值操作，/>表示神经网络模型/>第/>层的输出特征；所述计算每个特征空间的激活值/>的过程为：首先对第/>输出特征进行/>卷积操作得到的维度为/>的空间特征，然后进行/>操作得到维度为/>的空间激活特征/>；

计算标准化后的激活值：

其中，的维度为/>，/>表示将/>个空间特征进行求和，/>表示标准化后的空间特征激活值；

对标准化后的激活值进行降序排序：

采用CUMSUM函数对进行累计求和得到/>：

得到重要性保存率大于的/>对应索引坐标/>：

)

其中，为剪枝率;

使用被剪枝的特征空间的索引来更新真实标签/>：

重复执行以上步骤直至神经网络所有层都被遍历为止。

作为本实施例一种可能的实现方式，所述使用通道门动态剪枝的策略掩码生成方法得到变电站缺陷识别模型的通道注意力图、特征通道执行概率和通道策略掩码，包括：

计算第层通道注意力图/>：

其中，表示神经网络模型/>的第/>层维度为/>的特征，/>表示全局平均池化操作，/>表示全连接操作，/>表示批归一化操作，/>表示RELU函数，通道注意力图/>的维度为/>；

计算第层特征通道执行的概率/>：

其中，表示Sigmoid函数；

计算通道门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ采样的缩放因子；

当特征通道对应的的值小于0.5时，对该特征空间进行剪枝；否则不对该特征空间进行剪枝；

重复执行以上步骤直至神经网络所有层都被遍历为止。

作为本实施例一种可能的实现方式，所述使用通道门动态剪枝的策略掩码真实标签生成方法得到变电站缺陷识别模型的通道策略掩码的真实标签，包括：

计算通道门动态剪枝的第层通道策略掩码的真实标签/>：

将第层真实标签/>初始化为全1向量：

其中，；

计算每个特征通道的激活值：

其中，表示全局最大池化操作，/>表示绝对值操作，/>表示神经网络模型/>第/>层的输出特征；

计算标准化后的激活值：

其中，的维度为c/>，/>表示将/>个通道特征进行求和，/>表示标准化后的通道特征激活值；

对激活值进行降序排序：

使用CUNSUM函数对进行累计求和得到/>：

得到重要性保存率大于的/>对应索引坐标，计算方法如下：

)

其中，为剪枝率;

使用被剪枝的特征通道的索引来更新真实标签/>，从而得到最终的真实标签：

重复执行以上步骤直至神经网络所有层都被遍历为止。

作为本实施例一种可能的实现方式，所述使用总体损失函数对变电站缺陷识别模型进行剪枝和训练，对深度卷积神经网络的加速与压缩，得到轻量化变电站缺陷识别模型，包括：

采用总体损失函数对神经网络进行剪枝和训练，直至总体损失函数收敛：

所述总体损失函数的计算公式为：

其中，缺陷目标检测损失项，/>表示特征空间自监督正则项，/>表示特征通道自监督正则项，/>表示稀疏度正则项，/>表示剪枝率平滑下界正则项，表示剪枝率平滑上界正则项。

第二方面，本发明实施例提供的一种输变电缺陷识别的装置，所述输变电缺陷为变电站缺陷，应用于变电站场景对变电站缺陷进行检测，所述的装置包括：

样本生成模块，用于获取变电站缺陷检测数据集，对变电站缺陷检测数据集进行图像预处理，生成样本集，所述样本集包括训练集和验证集；

模型建立模块，用于利用训练集训练卷积神经网络，建立基于YoloV3模型的变电站缺陷识别模型，所述卷积神经网络为包含多个卷积层的卷积神经网络；

轻量化处理模块，用于基于双门动态剪枝方法对变电站缺陷识别模型进行轻量化处理，获得轻量化变电站缺陷识别模型：

模型验证模块，用于利用验证集对轻量化变电站缺陷识别模型进行验证；

变电站缺陷检测模块，用于实时采集变电站缺陷监测图像，并输入轻量化变电站缺陷识别模型进行变电站缺陷检测。

作为本实施例一种可能的实现方式，所述基于双门动态剪枝方法包括基于自监督学习的空间门动态剪枝方法和基于自监督学习的通道门动态剪枝方法；所述基于自监督学习的空间门动态剪枝方法包括空间门动态剪枝的策略掩码生成方法和空间门动态剪枝的策略掩码真实标签生成方法；所述基于自监督学习的通道门动态剪枝方法包括通道门动态剪枝的策略掩码生成方法和通道门动态剪枝的策略掩码真实标签生成方法。

第三方面，本发明实施例提供的一种输变电缺陷识别的方法，所述输变电缺陷为输电线路缺陷，应用于输电线路场景对输电线路缺陷进行检测，所述的方法包括以下步骤：

获取输电线路缺陷检测数据集，对输电线路缺陷检测数据集进行图像预处理，生成样本集，所述样本集包括训练集和验证集；

利用训练集训练卷积神经网络，建立基于YoloV3模型的输电线路缺陷识别模型，所述卷积神经网络为包含多个卷积层的卷积神经网络；

基于双门动态剪枝方法对输电线路缺陷识别模型进行轻量化处理，获得轻量化输电线路缺陷识别模型：

利用验证集对轻量化输电线路缺陷识别模型进行验证；

实时采集输电线路缺陷监测图像，并输入轻量化输电线路缺陷识别模型进行输电线路缺陷检测。

作为本实施例一种可能的实现方式，所述获取输电线路缺陷检测数据集，对输电线路缺陷检测数据集进行图像预处理，生成样本集，包括：

根据预先制定好的输电线路巡检线路，使用部署有YOLOv3模型的无人机沿线进行输电线路图像采集；

对所述输电线路缺陷检测数据集进行清洗操作和归一化处理；

采用清洗操作和归一化处理后的输电线路缺陷检测数据集生成样本集，并对样本集进行人工标注。

第四方面，本发明实施例提供的一种输变电缺陷识别的装置，所述输变电缺陷为输电线路缺陷，应用于输电线路场景对输电线路缺陷进行检测，所述的装置包括：

样本生成模块，用于获取输电线路缺陷检测数据集，对输电线路缺陷检测数据集进行图像预处理，生成样本集，所述样本集包括训练集和验证集；

模型建立模块，用于利用训练集训练卷积神经网络，建立基于YoloV3模型的输电线路缺陷识别模型，所述卷积神经网络为包含多个卷积层的卷积神经网络；

轻量化处理模块，用于基于双门动态剪枝方法对输电线路缺陷识别模型进行轻量化处理，获得轻量化输电线路缺陷识别模型：

模型验证模块，用于利用验证集对轻量化输电线路缺陷识别模型进行验证；

输电线路缺陷检测模块，用于实时采集输电线路缺陷监测图像，并输入轻量化输电线路缺陷识别模型进行输电线路缺陷检测。

第五方面，本发明实施例提供的一种计算机设备，包括处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当所述计算机设备运行时，所述处理器与所述存储器之间通过总线通信，所述处理器执行所述机器可读指令，以执行如上述任意输变电缺陷识别的方法的步骤。

第六方面，本发明实施例提供的一种存储介质，该存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上述任意输变电缺陷识别的方法的步骤。

本发明实施例的技术方案可以具有的有益效果如下：

本发明采用基于双门动态剪枝方法对变电站缺陷识别模型（或输电线路缺陷识别模型）进行轻量化处理，通过自监督学习算法不断对深度卷积神经网络的各层特征进行自监督学习得到神经网络动态剪枝的策略掩码，从而对深度卷积神经网络进行动态剪枝，并且使用包含稀疏度正则项和剪枝率平滑正则项的总体损失函数进一步提升了深度卷积神经网络模型剪枝后的性能。

本发明是针对输变电缺陷识别模型轻量化设计的。其中自监督学习部分可以有效利用输变电场景（变电站场景或输电线路场景）中大量的无标注数据，提升剪枝效率；双门动态剪枝是根据空间门和通道门两种方式构建剪枝策略，可以有效捕捉不均匀类别缺陷数据的特征，能够提升占比较小的缺陷类别的精度，而且动态剪枝能够根据输入数据变化调整剪枝策略，从而实现对复杂变化的户外图像的适应，最终可以实现输变电缺陷识别的加速与压缩，并将其部署到前端识别装置上。本发明能够对输电线路和变电站进行实时检测，能够及时预防电力线路和变电站故障的发生，保证了整个电力系统的稳定运行。

本发明有效用于输电线路和变电站检修巡检过程中，不仅能够及时发现和鉴别设备缺陷，提升了缺陷识别的准确率，而且能够提高巡检工作效率和质量，提高了输电线路和变电站运维自动化水平和电网运行安全。

附图说明

图1是根据一示例性实施例示出的一种变电站缺陷识别的方法流程图；

图2是根据一示例性实施例示出的一种变电站缺陷识别的装置示意图；

图3是根据一示例性实施例示出的一种输电线路缺陷识别的方法流程图；

图4是根据一示例性实施例示出的一种输电线路缺陷识别的装置示意图；

图5是根据一示例性实施例示出的一种基于自监督学习的空间门动态剪枝方法的流程图；

图6是根据一示例性实施例示出的一种基于自监督学习的通道门动态剪枝方法的流程图。

具体实施方式

下面结合附图与实施例对本发明做进一步说明：

为能清楚说明本方案的技术特点，下面通过具体实施方式，并结合其附图，对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开，下文中对特定例子的部件和设置进行描述。此外，本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意，在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。

针对输变电缺陷识别模型的加速与压缩问题，学术界和工业界已经提出一些有效的算法。然而，输变电缺陷识别场景的标注数据相较于无标注数据规模较小，如何利用无标注数据进行模型轻量化是一个挑战。其次，由于输变电缺陷识别场景的数据存在缺陷类别分布不均匀的情况，部分类别的缺陷只有少量数据，导致很多深度网络加速压缩方法直接应用到缺陷识别模型上精度下降很多。最后，输变电缺陷识别场景下的很多图像是室外场景，受到天气、阳光直射、粉尘等因素影响，输入图像数据会受到大量的干扰，当前很多模型剪枝算法大多数都是对深度卷积神经网络进行静态的剪枝，并没有考虑到当输入数据受到干扰发生变化时，深度卷积神经网络的剪枝策略也需要相应地改变。因此，本发明提出了一种能够应用于变电站场景和输电线路场景的输变电缺陷识别的方法，即一种基于双门动态剪枝方法的输变电缺陷识别模型轻量化技术，通过使用基于自监督学习的双门动态剪枝方法，对输变电缺陷识别模型进行轻量化，将变电站缺陷检测模型和输电线路缺陷检测模型变小，从而将输变电缺陷识别模型部署到前端识别装置上，对变电站缺陷和输电线路缺陷进行检测。

如图1所示，本发明实施例提供的一种变电站缺陷识别的方法，应用于变电站场景对变电站缺陷进行检测，所述的方法包括以下步骤：

利用验证集对轻量化变电站缺陷识别模型进行验证；

由于变电站场景下的存在缺陷类别不均衡的现象，基于双门动态剪枝方法能够较好地捕捉不同类别缺陷下的需要剪枝的模型参数，因此，本发明使用基于自监督学习的双门动态剪枝方法对变电站缺陷检测模型进行轻量化，从而可以部署在前端装置上。本发明在将变电站缺陷检测模型变小的同时保留了不同类别缺陷检测的精度。

对所述变电站缺陷检测数据集进行清洗操作和归一化处理；

计算第层空间注意力图/>：

计算第层特征空间执行（未被剪枝）的概率/>：

其中，表示Sigmoid函数；

计算空间门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ表示采样的缩放因子；

重复执行以上步骤直至神经网络所有层都被遍历为止。

计算空间门动态剪枝的第层空间策略掩码的真实标签/>：

将第层真实标签/>初始化为全1向量：

其中，表示空间注意力图/>的维度；

计算每个特征空间的激活值：

计算标准化后的激活值：

对标准化后的激活值进行降序排序：

使用CUMSUM函数对进行累计求和得到/>：

得到重要性保存率大于的/>对应索引坐标/>：

)

其中，为剪枝率（即特征空间的重要性保存率）；

使用被剪枝的特征空间的索引来更新真实标签/>：

重复执行以上步骤直至神经网络所有层都被遍历为止。

计算第层通道注意力图/>：

计算第层特征通道执行（未被剪枝）的概率/>：

其中，表示Sigmoid函数；

计算通道门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ采样的缩放因子；

重复执行以上步骤直至神经网络所有层都被遍历为止。

计算通道门动态剪枝的第层通道策略掩码的真实标签/>：

将第层真实标签/>初始化为全1向量：

其中，；

计算每个特征通道的激活值：

计算标准化后的激活值：

对激活值进行降序排序：

使用CUNMSUM函数对进行累计求和得到/>：

得到重要性保存率大于的/>对应索引坐标，计算方法如下：

)

其中，为剪枝率；

重复执行以上步骤直至神经网络所有层都被遍历为止。

所述总体损失函数的计算公式为：

如图2所示，本发明实施例提供的一种变电站缺陷识别的装置，应用于变电站场景对变电站缺陷进行检测，所述的装置包括：

如图3所示，本发明实施例提供的一种输电线路缺陷识别的方法，应用于输电线路场景对输电线路缺陷进行检测，所述的方法包括以下步骤：

利用验证集对轻量化输电线路缺陷识别模型进行验证；

计算第层空间注意力图/>：

计算第层特征空间执行的概率/>：

其中，表示Sigmoid函数；

计算空间门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ表示采样的缩放因子；

重复执行以上步骤直至神经网络所有层都被遍历为止。

计算空间门动态剪枝的第层空间策略掩码的真实标签/>：

将第层真实标签/>初始化为全1向量：

其中，表示空间注意力图/>的维度；

计算每个特征空间的激活值：

计算标准化后的激活值：

对标准化后的激活值进行降序排序：

使用CUNSUM函数对进行累计求和得到/>：

得到重要性保存率大于的/>对应索引坐标/>：

)

其中，为剪枝率；

使用被剪枝的特征空间的索引来更新真实标签/>：

重复执行以上步骤直至神经网络所有层都被遍历为止。

计算第层通道注意力图/>：

计算第层特征通道执行的概率/>：

其中，表示Sigmoid函数；

计算通道门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ采样的缩放因子；

重复执行以上步骤直至神经网络所有层都被遍历为止。

计算通道门动态剪枝的第层通道策略掩码的真实标签/>：

将第层真实标签/>初始化为全1向量：

其中，；

计算每个特征通道的激活值：

计算标准化后的激活值：

对激活值进行降序排序：

使用CUMSUM函数对进行累计求和得到/>：

得到重要性保存率大于的/>对应索引坐标，计算方法如下：

)

其中，为剪枝率；

重复执行以上步骤直至神经网络所有层都被遍历为止。

所述总体损失函数的计算公式为：

如图4所示，本发明实施例提供的一种输电线路缺陷识别的装置，应用于输电线路场景对输电线路缺陷进行检测，所述的装置包括：

本发明所述基于双门动态剪枝方法包括基于自监督学习的空间门动态剪枝方法和基于自监督学习的通道门动态剪枝方法；所述基于自监督学习的空间门动态剪枝方法包括空间门动态剪枝的策略掩码生成方法和空间门动态剪枝的策略掩码真实标签生成方法；所述基于自监督学习的通道门动态剪枝方法包括通道门动态剪枝的策略掩码生成方法和通道门动态剪枝的策略掩码真实标签生成方法。

所述空间门动态剪枝的策略掩码生成方法可以分为空间注意力图生成过程、特征空间执行概率计算过程和空间策略掩码计算过程三个步骤顺序运行，其中空间注意力图生成过程是空间门动态剪枝的策略掩码生成方法的核心；空间门动态剪枝的空间策略掩码真实标签生成方法主要是通过对下一层特征做卷积操作和池化操作来获得特征空间的激活值，进而生成空间策略掩码的真实标签，具体可参照图5。

如图5所示，基于自监督学习的空间门动态剪枝方法如下：

假设神经网络模型的第/>层特征为/>（维度为/>），空间注意力图/>的计算方法如下：

第层特征空间执行（未被剪枝）的概率/>的计算方法如下：

其中，表示Sigmoid函数。

空间门动态剪枝的第层空间策略掩码的真实标签/>的计算流程如下（假设特征空间的重要性保存率，即剪枝率为/>）：

1.将第层真实标签/>初始化为全1向量，方法如下：

2. 计算每个特征空间的激活值，计算方法如下：/>

其中，表示自适应平均池化操作，该操作的输出尺寸设置为表示/>卷积操作，卷积核权重设置为/>，/>表示绝对值操作，/>表示神经网络模型/>第/>层的输出特征；所述计算每个特征空间的激活值/>的过程为：首先对第/>输出特征/>进行/>卷积操作得到的维度为的空间特征，然后进行/>操作得到维度为/>的空间激活特征；

3.计算标准化后的激活值，计算方法如下：

4.对激活值进行降序排序，计算方法如下：

5.使用CUMSUM函数对进行累计求和得到/>，计算方法如下：

6.得到重要性保存率大于的/>对应索引坐标，计算方法如下：

)

7.使用被剪枝的特征空间的索引来更新真实标签/>，从而得到最终的真实标签，计算方法如下：

空间门动态剪枝的策略掩码的计算方法如下：

其中，表示0~1的均匀采样。

当特征空间对应的的值大于等于0.5时，该特征空间不被剪枝，当特征空间对应的/>的值小于0.5时，该特征空间被剪枝。

所述通道门动态剪枝的策略掩码生成方法可以分为通道注意力图生成过程、特征通道执行概率计算过程和通道策略掩码计算过程三个步骤顺序运行，其中通道注意力图生成过程是通道门动态剪枝的策略掩码生成方法的核心；通道门动态剪枝的通道策略掩码真实标签生成方法主要是通过对下一层特征做池化操做来获得特征通道的激活值，进而生成通道策略掩码的真实标签，具体可参照图6。

如图6所示，基于自监督学习的通道门动态剪枝方法如下：

假设神经网络模型的第/>层特征为/>（维度为/>），通道注意力图/>的计算方法如下：/>

其中，表示全局平均池化操作，/>表示全连接操作，/>表示批归一化操作，表示RELU函数。空间注意力图/>的维度为/>。

第层特征的各通道执行（未被剪枝）的概率/>的计算方法如下：

其中，表示Sigmoid函数。

通道门动态剪枝的第层通道策略掩码的真实标签/>的计算流程如下（假设特征通道的重要性保存率，即剪枝率为/>）：

1.将第层真实标签/>初始化为全1向量，方法如下：

2. 计算每个特征通道的激活值，计算方法如下：

其中，表示全局最大池化操作，/>表示绝对值操作。

3. 计算标准化后的激活值，计算方法如下：

4.对激活值进行降序排序，计算方法如下：

5.使用CUMSUM函数对进行累计求和得到/>，计算方法如下：

6.得到重要性保存率大于的/>对应索引坐标，计算方法如下：

)

7.使用被剪枝的特征通道的索引来更新真实标签/>，从而得到最终的真实标签，计算方法如下：

通道门动态剪枝的策略掩码的计算方法如下：

其中，表示0~1的均匀采样。

当特征通道对应的的值大于等于0.5时，该特征通道不被剪枝，当特征通道对应的/>的值小于0.5时，该特征通道被剪枝。

所述损失函数的设计如下：

1.为了帮助模型进行基于自监督学习的空间门动态剪枝，本发明加入特征空间自监督正则项：

其中，表示交叉熵损失函数。

2.为了帮助模型进行基于自监督学习的通道门动态剪枝，本发明加入特征通道自监督正则项：

其中，表示交叉熵损失函数。

3.为了让模型的稀疏度可以调控，本发明在损失函数中加入稀疏度正则项，稀疏度正则项的计算方法如下：

其中，表示模型第/>层剪枝后的计算量，/>表示模型第/>层剪枝前的计算量，/>表示目标计算量。

4.为了提升模型动态剪枝的效果，本发明在损失函数中加入剪枝率平滑正则项，该正则项的主要目的是在训练过程中平滑地提高剪枝比例，剪枝率平滑正则项的计算方法如下：

其中，表示松紧系数，/>表示当前轮次，/>表示计算量的密度，/>表示模型第/>层的空间门动态剪枝策略掩码，/>表示模型第/>层的通道门动态剪枝策略掩码，/>表示上界正则化，/>表示下界正则化。

综合上述正则项后得到总体损失函数：

其中，缺陷目标检测损失项。

利用本发明所述方法对输电线路或变电站场景中的缺陷检测模型进行轻量化并部署到前端计算装置，从而进行缺陷检测任务：

数据集分为输电线路缺陷检测和变电站缺陷检测数据集两个部分，其训练集均为10000张，验证集均为1000张，测试集均为2000张；

本发明使用YoloV3作为待剪枝神经网络模型，设置目标计算量/>为0.4，设置松紧系数/>为0.05，初始化空间门动态剪枝率/>为0.9，初始化通道门动态剪枝率/>为0.9；

设置优化器为SGD，设置优化器的动量为0.9，设置优化器的衰减率为0.0005；

按照以上参数设定进行初始化；

重复执行以下两个步骤，直至总体损失函数收敛：

①逐层进行神经网络的前向传播，直至神经网络所有层都被遍历：

1)用空间门动态剪枝的策略掩码生成方法得到神经网络模型的空间注意力图、特征空间执行概率/>和空间策略掩码/>。

2)使用空间门动态剪枝的策略掩码真实标签生成方法得到神经网络模型的空间策略掩码的真实标签。

3)使用通道门动态剪枝的策略掩码生成方法得到神经网络模型的通道注意力图、特征通道执行概率/>和通道策略掩码/>。

4)使用通道门动态剪枝的策略掩码真实标签生成方法得到神经网络模型的通道策略掩码的真实标签。

5)计算神经网络模型的总体损失函数。

②将总体损失函数作为优化目标，进行神经网络的反向传播，并使用SGD优化器更新神经网络的权重。

使用最后得到的空间策略掩码和通道策略掩码/>对神经网络模型/>进行剪枝，得到最终的面向输电线路隐患分析场景的深度卷积神经网络模型/>或面向变电站缺陷检场景的深度卷积神经网络模型/>。

本发明实施例提供的一种计算机设备，包括处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当所述装置运行时，所述处理器与所述存储器之间通过总线通信，所述处理器执行所述机器可读指令，以执行如上述任意输变电缺陷识别的方法的步骤。

具体地，上述存储器和处理器能够为通用的存储器和处理器，这里不做具体限定，当处理器运行存储器存储的计算机程序时，能够执行上述输变电缺陷识别的方法。

本领域技术人员可以理解，所述计算机设备的结构并不构成对计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。

在一些实施例中，该计算机设备还可以包括触摸屏可用于显示图形用户界面（例如，应用程序的启动界面）和接收用户针对图形用户界面的操作（例如，针对应用程序的启动操作）。具体的触摸屏可包括显示面板和触控面板。其中显示面板可以采用LCD(LiquidCrystal Display，液晶显示器)、OLED(Organic Light-Emitting Diode，有机发光二极管)等形式来配置。触控面板可收集用户在其上或附近的接触或者非接触操作，并生成预先设定的操作指令，例如，用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作。另外，触控面板可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位、姿势，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成处理器能够处理的信息，再送给处理器，并能接收处理器发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板，也可以采用未来发展的任何技术实现触控面板。进一步的，触控面板可覆盖显示面板，用户可以根据显示面板显示的图形用户界面，在显示面板上覆盖的触控面板上或者附近进行操作，触控面板检测到在其上或附近的操作后，传送给处理器以确定用户输入，随后处理器响应于用户输入在显示面板上提供相应的视觉输出。另外，触控面板与显示面板可以作为两个独立的部件来实现也可以集成而来实现。

对应于上述应用程序的启动方法，本发明实施例还提供了一种存储介质，该存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上述任意输变电缺陷识别的方法的步骤。

本申请实施例所提供的应用程序的启动装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，前述描述的系统、装置和单元的具体工作过程，均可以参考上述方法实施例中的对应过程，在此不再赘述。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请提供的实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。

本申请是参照根据本申请实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

Claims

1.一种输变电缺陷识别的方法，所述输变电缺陷为变电站缺陷，应用于变电站场景对变电站缺陷进行检测，其特征在于，所述的方法包括以下步骤：

利用验证集对轻量化变电站缺陷识别模型进行验证；

实时采集变电站缺陷监测图像，并输入轻量化变电站缺陷识别模型进行变电站缺陷检测；

所述基于双门动态剪枝方法对变电站缺陷识别模型进行轻量化处理，获得轻量化变电站缺陷识别模型，包括：

使用总体损失函数对变电站缺陷识别模型进行剪枝和训练，对深度卷积神经网络的加速与压缩，得到轻量化变电站缺陷识别模型；所述总体损失函数包含缺陷目标检测损失项、特征空间自监督正则项、特征通道自监督正则项、稀疏度正则项和剪枝率平滑正则项；

所述使用空间门动态剪枝的策略掩码生成方法得到变电站缺陷识别模型的空间注意力图、特征空间执行概率和空间策略掩码，包括：

计算第层空间注意力图/>：

其中，表示神经网络模型/>的第/>层维度为/>的特征，/>表示自适应平均池化操作，该操作的输出尺寸设置为/>，/>表示/>卷积操作，空间注意力图/>的维度为/>；所述计算第/>层空间注意力图/>的过程为：首先第/>层输出特征/>被分为尺寸为/>的小块，然后对/>进行/>操作得到维度为的空间特征，最后进行/>卷积操作；

计算第层特征空间执行的概率/>：

其中，表示Sigmoid函数；

计算空间门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ表示采样的缩放因子；

重复执行以上步骤直至神经网络所有层都被遍历为止。

2.根据权利要求1所述的输变电缺陷识别的方法，其特征在于，所述获取变电站缺陷检测数据集，对变电站缺陷检测数据集进行图像预处理，生成样本集，包括：

对所述变电站缺陷检测数据集进行清洗操作和归一化处理；

3.根据权利要求1所述的输变电缺陷识别的方法，其特征在于，所述使用空间门动态剪枝的策略掩码真实标签生成方法得到变电站缺陷识别模型的空间策略掩码的真实标签，包括：

计算空间门动态剪枝的第层空间策略掩码的真实标签/>：

将第层真实标签/>初始化为全1向量：

其中，表示空间注意力图/>的维度；

计算每个特征空间的激活值：

其中，表示自适应平均池化操作，该操作的输出尺寸设置为/>，表示/>卷积操作，卷积核权重设置为/>，表示绝对值操作，/>表示神经网络模型/>第/>层的输出特征；所述计算每个特征空间的激活值/>的过程为：首先对第/>输出特征进行/>卷积操作得到的维度为/>的空间特征，然后进行/>操作得到维度为/>的空间激活特征/>；

计算标准化后的激活值：

对标准化后的激活值进行降序排序：

使用函数对/>进行累计求和得到/>：

得到重要性保存率大于的/>对应索引坐标/>：

)

其中，为剪枝率；

使用被剪枝的特征空间的索引来更新真实标签/>：

重复执行以上步骤直至神经网络所有层都被遍历为止。

4.根据权利要求1所述的输变电缺陷识别的方法，其特征在于，所述使用通道门动态剪枝的策略掩码生成方法得到变电站缺陷识别模型的通道注意力图、特征通道执行概率和通道策略掩码，包括：

计算第层通道注意力图/>：

计算第层特征通道执行的概率/>：

其中，表示Sigmoid函数；

计算通道门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ采样的缩放因子；

重复执行以上步骤直至神经网络所有层都被遍历为止。

5.根据权利要求1所述的输变电缺陷识别的方法，其特征在于，所述使用通道门动态剪枝的策略掩码真实标签生成方法得到变电站缺陷识别模型的通道策略掩码的真实标签，包括：

计算通道门动态剪枝的第层通道策略掩码的真实标签/>：

将第层真实标签/>初始化为全1向量：

其中，；

计算每个特征通道的激活值：

其中，表示全局最大池化操作，/>表示绝对值操作，/>表示神经网络模型/>第层的输出特征；

计算标准化后的激活值：

对激活值进行降序排序：

使用函数对/>进行累计求和得到/>：

得到重要性保存率大于的/>对应索引坐标，计算方法如下：

)

其中，为剪枝率;

重复执行以上步骤直至神经网络所有层都被遍历为止。

6.根据权利要求1所述的输变电缺陷识别的方法，其特征在于，所述使用总体损失函数对变电站缺陷识别模型进行剪枝和训练，对深度卷积神经网络的加速与压缩，得到轻量化变电站缺陷识别模型，包括：

所述总体损失函数的计算公式为：

其中，缺陷目标检测损失项，/>表示特征空间自监督正则项，/>表示特征通道自监督正则项，/>表示稀疏度正则项，/>表示剪枝率平滑下界正则项，/>表示剪枝率平滑上界正则项。

7.一种输变电缺陷识别的装置，所述输变电缺陷为变电站缺陷，应用于变电站场景对变电站缺陷进行检测，其特征在于，所述的装置包括：

变电站缺陷检测模块，用于实时采集变电站缺陷监测图像，并输入轻量化变电站缺陷识别模型进行变电站缺陷检测；

所述基于双门动态剪枝方法包括基于自监督学习的空间门动态剪枝方法和基于自监督学习的通道门动态剪枝方法；所述基于自监督学习的空间门动态剪枝方法包括空间门动态剪枝的策略掩码生成方法和空间门动态剪枝的策略掩码真实标签生成方法；所述基于自监督学习的通道门动态剪枝方法包括通道门动态剪枝的策略掩码生成方法和通道门动态剪枝的策略掩码真实标签生成方法；

计算第层空间注意力图/>：

计算第层特征空间执行的概率/>：

其中，表示Sigmoid函数；

计算空间门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ表示采样的缩放因子；

重复执行以上步骤直至神经网络所有层都被遍历为止。

8.一种输变电缺陷识别的方法，所述输变电缺陷为输电线路缺陷，应用于输电线路场景对输电线路缺陷进行检测，其特征在于，所述的方法包括以下步骤：

利用验证集对轻量化输电线路缺陷识别模型进行验证；

实时采集输电线路缺陷监测图像，并输入轻量化输电线路缺陷识别模型进行输电线路缺陷检测；

所述基于双门动态剪枝方法对输电线路缺陷识别模型进行轻量化处理，获得轻量化输电线路缺陷识别模型，包括：

使用空间门动态剪枝的策略掩码生成方法得到输电线路缺陷识别模型的空间注意力图、特征空间执行概率和空间策略掩码；

使用空间门动态剪枝的策略掩码真实标签生成方法得到输电线路缺陷识别模型的空间策略掩码的真实标签；

使用通道门动态剪枝的策略掩码生成方法得到输电线路缺陷识别模型的通道注意力图、特征通道执行概率和通道策略掩码；

使用通道门动态剪枝的策略掩码真实标签生成方法得到输电线路缺陷识别模型的通道策略掩码的真实标签；

使用总体损失函数对输电线路缺陷识别模型进行剪枝和训练，对深度卷积神经网络的加速与压缩，得到轻量化输电线路缺陷识别模型；所述总体损失函数包含缺陷目标检测损失项、特征空间自监督正则项、特征通道自监督正则项、稀疏度正则项和剪枝率平滑正则项；

所述使用空间门动态剪枝的策略掩码生成方法得到输电线路缺陷识别模型的空间注意力图、特征空间执行概率和空间策略掩码，包括：

计算第层空间注意力图/>：

计算第层特征空间执行的概率/>：

其中，表示Sigmoid函数；

计算空间门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ表示采样的缩放因子；

重复执行以上步骤直至神经网络所有层都被遍历为止。

9.根据权利要求8所述的输变电缺陷识别的方法，其特征在于，所述获取输电线路缺陷检测数据集，对输电线路缺陷检测数据集进行图像预处理，生成样本集，包括：

10.一种输变电缺陷识别的装置，所述输变电缺陷为输电线路缺陷，应用于输电线路场景对输电线路缺陷进行检测，其特征在于，所述的装置包括：

输电线路缺陷检测模块，用于实时采集输电线路缺陷监测图像，并输入轻量化输电线路缺陷识别模型进行输电线路缺陷检测；

计算第层空间注意力图/>：

计算第层特征空间执行的概率/>：

其中，表示Sigmoid函数；

计算空间门动态剪枝的策略掩码：

其中，表示0~1的均匀采样，τ表示采样的缩放因子；

重复执行以上步骤直至神经网络所有层都被遍历为止。

11.一种计算机设备，其特征在于，包括处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当所述计算机设备运行时，所述处理器与所述存储器之间通过总线通信，所述处理器执行所述机器可读指令，以执行如权利要求1-6和8-9任一所述的输变电缺陷识别的方法的步骤。

12.一种存储介质，其特征在于，该存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1-6和8-9任一所述的输变电缺陷识别的方法的步骤。