CN113221687A

CN113221687A - 一种压板状态识别模型的训练方法及压板状态识别方法

Info

Publication number: CN113221687A
Application number: CN202110462823.6A
Authority: CN
Inventors: 曾凯; 贾建梅; 陈宏君; 李响; 徐征宇; 张磊; 周磊; 张纲; 韩科文
Original assignee: NR Electric Co Ltd; NARI Group Corp
Current assignee: NR Electric Co Ltd; NARI Group Corp
Priority date: 2021-04-28
Filing date: 2021-04-28
Publication date: 2021-08-06
Anticipated expiration: 2041-04-28
Also published as: CN113221687B

Abstract

本发明公开一种压板状态识别模型的训练方法及压板状态识别方法，压板状态识别方法包括：获取变电站二次屏柜待识别压板图像信息；将获取到的图像信息输入预先训练的压板状态识别模型，得到压板状态识别模型输出的压板位置信息和压板状态分类信息，进而根据所述压板状态分类信息确定待识别压板的状态。压板状态识别模型采用MobilenetV3‑YOLOv5s目标检测网络，通过将YOLOv5的特征提取主干网络替换为MobilenetV3网络，以压板在多个压板状态下的图像为训练样本进行基础训练，并进一步经稀疏化训练、通道剪枝和模型蒸馏得到轻量化的最终模型文件，对计算机的硬件资源消耗较少，能够应用于计算性能一般的边缘终端设备中实现压板状态识别，并保障识别精度。

Description

一种压板状态识别模型的训练方法及压板状态识别方法

技术领域

本发明涉及变电站运行与维护技术领域，特别是一种基于深度学习的压板状态识别模型的训练方法，及压板状态识别方法。

背景技术

二次设备运行与维护水平的提升对变电站的安全、稳定、高效运行具有重要的意义。当前，二次保护屏柜压板管理是变电站日常巡检的重要内容，但是其信息化、智能化水平却相对较低，主要还是借助人工巡检的方式进行记录。总体而言无法与变电站总体智能化水平相匹配，难以满足变电站智能化管理的需求。

在人工智能技术蓬勃发展的机遇下，开展压板状态智能化识别的研究，将基于深度学习的目标检测技术应用在屏柜压板状态的识别上，有助于提升变电站智能运维水平，提升变电站整体运行的安全性和可靠性，具有重要的现实意义。

名词解释

知识蒸馏（Knowledge Distillation）指的是将预训练好的教师模型（TeacherModel）的知识通过蒸馏的方式迁移到学生模型（Student Model），使得学生模型能够获得教师模型的泛化能力。

发明内容

本发明的目的是提供一种压板状态识别模型的训练方法及压板状态识别方法，通过轻量化目标检测算法减少硬件资源消耗，能够应用于计算性能一般的边缘终端设备中实现压板状态识别，同时保障识别精度，满足智能化识别需求。本发明采用的技术方案如下。

一方面，本发明提供一种压板状态识别模型的训练方法，包括：

获取变电站二次屏柜压板在多个压板状态下的图像样本，得到初始样本库；

对初始样本库中的图像样本进行预处理，得到训练样本库；

获取训练样本库中各样本的人工标注信息，建立训练样本集和测试样本集，所述人工标注信息包括识别区域的坐标信息和压板状态分类信息；

利用训练样本集对预先构建的MobilenetV3-YOLOv5s目标检测网络进行训练，得到中间模型文件；所述MobilenetV3-YOLOv5s目标检测网络为将YOLOv5的特征提取主干网络替换为MobilenetV3网络的的神经网络；

利用测试集样本对所述中间模型文件进行验证，包括：若验证结果不符合设定要求，则获取对训练样本库中各样本进行优化标注的新的人工标注信息，基于新的人工标注信息建立训练样本集和测试样本集，利用当前训练样本集和测试样本集对中间模型文件进行迭代训练和验证，直至验证结果符合设定要求，则将中间模型文件作为最优基础模型文件；

利用最优基础模型文件的训练样本集和测试样本集训练CSPDarknet53-YOLOv5s目标检测网络，得到标准指导模型文件；

在最优基础模型的特征提取主干网络的BN层中γ参数引入L1正则化约束，利用当前训练样本集进行模型稀疏化训练，得到稀疏模型文件；

对所述稀疏模型文件迭代地进行通道剪枝和模型评估，直至得到模型评估结果符合设定要求的最佳剪枝率参数和相应的最佳剪枝模型文件；

将标准指导模型文件作为教师模型，将所述最佳剪枝模型文件作为学生模型，利用知识蒸馏方法对最佳剪枝模型文件进行微调训练，得到最终的压板状态识别模型。

通过以上方案，本发明能够实现一种基于深度学习的轻量化目标检测模型，在利用其进行变电站二次屏柜压板状态识别时，一方面能够保障识别结果的可靠性，满足智能化校对需求，另一方面，轻量化的模型文件可大大减少计算机硬件资源的损耗。

可选的，压板状态识别模型的训练方法中，训练所得的最终压板状态识别模型文件为pytorch格式的文件；

压板状态识别模型的训练方法还包括，将所得的压板状态识别模型文件转换为onnx格式模型文件。pytorch格式的文件可以通过格式转换在多种边缘终端进行部署应用。

优选的，针对基于X86架构的边缘终端，采用intel提供的深度学习加速组件OpenVINO对onnx格式的模型文件进行转换；针对基于ARM架构的边缘终端，将onnx格式模型文件转换为ncnn格式模型文件，利用适用于移动边缘端的NCNN框架部署模型应用接口。

可选的，压板状态识别模型的训练方法还包括，采用深度学习加速组件OpenVINO对模型进行量化处理，将参数精度由32位浮点型量化成16位浮点或INT8型。量化操作会导致模型识别精度降低，但是推理速度、参数量等会有进一步的压缩效果，可根据实际需要评估是否采用量化处理。

可选的，所述预处理包括通过数据增强处理扩充图像样本，所述数据增强处理包括：光学变换、几何变换、增加噪声或数据源扩充处理。光学变换处理包括亮度、对比度等随机调整处理；几何变换处理包括扩展、裁剪和镜像等随机操作；增加噪声表示在原始图像上增加一定的扰动；数据源扩充表示将检测目标替换背景扩充样本。

在模型训练过程中，所获取的人工标注信息为人工对训练样本库中图像的压板关键区域进行标注，所形成的符合YOLOv5算法规定的标注文件格式信息，基于标注后的训练样本图像，可采用随机数方法，按照4:1的比例建立训练、测试样本集。

第二方面，本发明提供一种压板状态识别模型的训练装置，其包括：

样本图像获取模块，被配置用于获取变电站二次屏柜压板在多个压板状态下的图像样本，得到初始样本库；

图像预处理模块，被配置用于对初始样本库中的图像样本进行预处理，得到训练样本库；

标注信息获取模块，被配置用于获取训练样本库中各样本的人工标注信息，建立训练样本集和测试样本集，所述人工标注信息包括识别区域的坐标信息和压板状态分类信息；

第一训练模块，被配置用于利用训练样本集对预先构建的MobilenetV3-YOLOv5s目标检测网络进行训练，得到中间模型文件；所述MobilenetV3-YOLOv5s目标检测网络为将YOLOv5的特征提取主干网络替换为MobilenetV3网络的的神经网络；

验证和迭代训练模块，被配置用于利用测试集样本对所述中间模型文件进行验证，包括：若验证结果不符合设定要求，则获取对训练样本库中各样本进行优化标注的新的人工标注信息，基于新的人工标注信息建立训练样本集和测试样本集，利用当前训练样本集和测试样本集对中间模型文件进行迭代训练和验证，直至验证结果符合设定要求，则将中间模型文件作为最优基础模型文件；

第二训练模块，被配置用于利用最优基础模型文件的训练样本集和测试样本集训练CSPDarknet53-YOLOv5s目标检测网络，得到标准指导模型文件；

稀疏化训练模块，被配置用于在最优基础模型的特征提取主干网络的BN层中γ参数引入L1正则化约束，利用当前训练样本集进行模型稀疏化训练，得到稀疏模型文件；

模型剪枝处理模块，被配置用于对所述稀疏模型文件迭代地进行通道剪枝和模型评估，直至得到模型评估结果符合设定要求的最佳剪枝率参数和相应的最佳剪枝模型文件；

以及，微调训练模块，被配置用于将标准指导模型文件作为教师模型，将所述最佳剪枝模型文件作为学生模型，利用知识蒸馏方法对最佳剪枝模型文件进行微调训练，得到最终的压板状态识别模型。

第三方面，本发明提供一种压板状态识别方法，包括：

获取变电站二次屏柜待识别压板图像信息；

将获取到的图像信息输入预先训练的压板状态识别模型，得到压板状态识别模型输出的压板位置信息和压板状态分类信息；其中，所述压板状态识别模型利用第一方面所述压板状态识别模型的训练方法训练所得；

根据所述压板状态分类信息确定待识别压板的状态。

第四方面，本发明提供一种压板状态识别装置，包括：

待识别压板图像获取模块，被配置用于获取变电站二次屏柜待识别压板图像信息；

压板状态识别模块，被配置用于将获取到的图像信息输入预先训练的压板状态识别模型，得到压板状态识别模型输出的压板位置信息和压板状态分类信息；其中，所述压板状态识别模型利用权利要求1-5任一项所述压板状态识别模型的训练方法训练所得；

以及，压板状态确定模块，被配置用于根据所述压板状态分类信息确定待识别压板的状态。

第五方面，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时，执行如权利要求7所述的压板状态识别方法。

有益效果

本发明基于MobilenetV3-YOLOv5s的目标检测算法训练得到中间模型文件，通过在标准的YOLOv5s算法的特征提取主干网络中采用MobilenetV3网络来替换官方的CSPDarknet53网络，并进行稀疏处理和模型通道剪枝，可以达到精简网络参数及模型大小的目的，降低算法对计算机硬件资源的消耗，使得模型能够适应用于计算性能一般的边缘终端设备中实现压板状态识别。同时，本发明利用模型蒸馏技术使得最终得到的模型文件具有较高的识别准确度，能够满足在边缘终端上对屏柜压板状态进行智能化识别的应用需求，免除人工校对带来的风险缺陷，大大提升变电站运维的智能化水平。

附图说明

图1所示为本发明压板状态识别模型训练方法的一种实施方式流程示意图。

具体实施方式

以下结合附图和具体实施例进一步描述。

实施例1

本实施例介绍压板状态识别模型的训练方法，如图1所示，压板状态识别模型的训练方法包括：

对初始样本库中的图像样本进行预处理，得到训练样本库；

以下对上述压板状态识别模型的训练方法进行具体介绍。

一、图像样本获取

样本数据是检测模型非常重要的一环，数据增强操作可以防止模型的过拟合，对模型的检测性能有较大的提升。

本实施例通过拍照设备采集的变电站二次屏柜压板图像样本，每张图片可以包括多个压板目标或者单个目标，样本数量至少4000张。采用光学变换、几何变换、增加噪声、数据源扩充等数据增强方法来随机处理图像样本数据，得到训练样本库。其中，光学变换包括亮度、对比度等方法；几何变换包括扩展、裁剪和镜像等操作；增加噪声表示在原始图像上增加一定的扰动，比如高斯噪声；数据源扩充表示将检测目标替换背景扩充样本。

二、图像样本标注

采用labelImg工具对图像中所有的压板关键区域进行人工标注，，单张图像中可能有多个压板目标，标注后形成标准的voc格式标注文件。如：采用python转换脚本，将voc格式标注文件转换成YOLOv5算法支持的标准标注文件。标注文件中包含关键识别区域的坐标信息和分类信息。

对于已标注的图像样本，可采用随机数方法，按照4:1的比例建立训练样本集和测试样本集。

三、目标检测网络的构建和迭代训练

本实施例在YOLOv5标准的CSPDarknet53-YOLOv5s目标检测算法基础上，将特征提取主干网络的CSPDarknet53替换成MobilenetV3的轻量化网络模型，进而可以精简网络参数及模型大小，达到更适合于在边缘计算终端中部署的目的。

yolo系列算法在实际测试中是one-stage目标检测方法中性能（精度）最好的方法之一。YOLOv5是yolo系列中最新最优秀的算法，它整合了大量的计算机视觉前沿技术，显著改善了yolo对象检测的性能，提升了模型训练的速度及模型应用的便利度。它针对不同的部署场景分成了YOLOv5s，YOLOv5m，YOLOv5l，YOLOv5x四种模型的网络结构，通过depth_multiple、width_multiple两个参数分别控制模型的深度以及卷积核的个数。

本实施例采用的YOLOv5s模型设置的depth_multiple参数值为0.33，width_multiple参数值为0.5，因此模型非常小，可以降低部署的硬件资源消耗。

Mobilenet是Google提出的一种小巧而高效的卷积神经网络模型，其核心是采用了深度可分离卷积网络，在准确度和性能之间做了折中，采用该网络不仅可以降低模型计算复杂度，而且可以大大降低模型大小，减少资源消耗。

本实施例将最新的MobilenetV3网络和YOLOv5s网络结合，基于MobilenetV3-YOLOv5s的目标检测算法训练得到中间模型文件，进一步的缩小了模型大小、降低了硬件资源的消耗。本实施例中，基于Mobilenet改进算法训练的轮次设置为200轮，得到中间模型文件。

然后利用测试集样本对中间模型文件进行测试和模型评估，评估指标可综合考虑深度学习模型评估中主流的mAP（多类别平均精度）、Precision（准确率）、Recall（召回率）、Flops（模型所需计算力）等指标。判断评估指标是否达到技术规范或推广应用的要求，如果未达到，则通过优化样本标注、图像数据增强处理等方式来重新建立训练、测试样本集。然后通过反复迭代训练、评估，得到最优的基础模型文件及对应的训练样本库。

四、模型的稀疏训练

对于训练得到基础模型文件，在MobilenetV3-YOLOv5s目标检测主干网络的BN层中γ参数引入L1正则化约束，训练得到稀疏化的模型文件。L1正则化可以实现对模型参数的限制，产生稀疏化的模型，同时增加模型的泛化能力。在YOLO算法的标准损失函数中引入L1正则化的表达式，实现对网络中BN层的缩放因子γ的约束，训练出来的模型许多通道的缩放因子γ都会趋近于0，因此可以将小缩放因子γ的通道直接剪除，实现模型的压缩，得到稀疏模型文件。

包含L1正则项的损失函数表示为：，其中Loss为不带正则项的网络损失函数、代表对BN层的缩放因子γ施加L1正则项、超参数λ表示稀疏率。本实施例中，稀疏率λ取0.01，稀疏训练的轮次设置为300轮。

五、模型通道剪枝

本实施例基于初始的剪枝率参数对稀疏模型文件进行通道剪枝，模型评估，调整剪枝率参数并迭代评估得到最佳的剪枝率参数及最佳的剪枝模型文件。

通道剪枝的大致原理是，统计所有参与剪枝层的bn参数L1值并进行排序，依据剪枝率确定参数阈值，将所有小于阈值的层全部减掉，如果有依赖则将依赖的对应部分也剪掉。如果一层中所有的层都需要被移除，那么就保留最大的一层通道(保证网络结构)。优选地，初始剪枝率可以设置为0.5。对剪枝后的模型在测试样本集中进行评估，与剪枝前的模型比较mAP等综合指标。剪枝率越大则综合指标下降越多，模型参数量也越少，消耗的硬件资源也越少；剪枝率越小则能保留原始网络中更多的参数，模型压缩效果越差，消耗的硬件资源也越大。剪枝率可以先以0.1的级差进行尝试性剪枝评估，到了临界值时再以0.01的级差进行微调，迭代剪枝并评估找到最佳的剪枝率，即牺牲最小的准确率指标为代价，剪除更多的层来提升模型性能，得到最佳的剪枝率参数及最佳的剪枝模型文件。

六、模型微调训练

本实施例中，首先以第三部分得到的最终训练样本库对标准的CSPDarknet53-YOLOv5s的目标检测网络进行训练，得到标准的指导模型文件。基于YOLOv5s标准算法训练的轮次设置为200轮。

然后对最佳的剪枝模型文件进行微调训练，并引入模型蒸馏技术，通过教师模型指导学生模型进行微调训练的方式，得到最终的轻量化的模型文件。微调的过程即在MobilenetV3-YOLOv5s目标检测算法中，设置最佳的剪枝模型文件为学生模型，设置标准的指导模型为教师模型，经过蒸馏训练过程，得到微调蒸馏后的模型文件，即最终轻量化的目标检测模型文件。

微调及蒸馏的目的在于恢复剪枝后的模型精度指标，保证剪枝前后的模型评估指标总体上相差不大。经过微调蒸馏训练后，剪枝后的模型文件参数量等保持不变、但是mAP等指标都有了一定程度的恢复。所述教师模型文件采用了相对复杂的主干网络结构，因此模型的参数量、文件大小都比所述学生模型文件更大，对硬件资源消耗也偏大，但是它能保留更多的网络信息，可以用来将学习到的知识迁移到学生模型中，以获得更佳的精度指标。本实施例中，微调训练的轮次设置为100轮。

七、模型的应用

本实施例最终训练得到的轻量化模型文件是pytorch格式的文件，可以通过格式转换在多种边缘终端进行部署应用。

应用时，可以将pytorch格式模型文件转换为通用的 onnx格式模型文件。onnx（开放神经网络交换）是一种针对深度学习所设计的开放式的通用文件格式，用于存储训练好的模型，它使得不同的人工智能框架（如Pytorch、TensorFlow、Mxnet等）可以采用相同格式存储模型数据并交互，支持模型在不同框架之间进行转移。

例如，针对基于X86架构的边缘终端，可以采用intel提供的深度学习加速组件OpenVINO将所述onnx格式的轻量化模型转化为组件所支持的模型文件，借助该加速组件提供的接口完成模型的部署应用；针对ARM架构的边缘终端，可以将onnx格式模型文件转换为ncnn格式模型文件，借助专为移动边缘端设计的NCNN框架完成模型的部署应用。

此外，本实施例还可以采用所述深度学习加速组件OpenVINO对模型进行量化处理，将参数精度由32位浮点型量化成16位浮点、甚至INT8型，所述量化操作会导致模型识别精度降低，但是推理速度、参数量等会有进一步的压缩效果，需根据实际需要评估是否采用量化处理。

实施例2

与前述实施例基于相同的发明构思，本实施例介绍一种一种压板状态识别模型的训练装置，其包括：

上述各功能模块的具体功能实现参考实施例1的相关内容。

实施例3

与前述实施例基于相同的发明构思，本实施例介绍一种压板状态识别方法，包括：

获取变电站二次屏柜待识别压板图像信息；

将获取到的图像信息输入预先训练的压板状态识别模型，得到压板状态识别模型输出的压板位置信息和压板状态分类信息；其中，所述压板状态识别模型利用实施例1介绍的压板状态识别模型的训练方法训练所得；

根据所述压板状态分类信息确定待识别压板的状态。

实施例4

与前述实施例基于相同的发明构思，本实施例介绍一种压板状态识别装置，包括：

压板状态识别模块，被配置用于将获取到的图像信息输入预先训练的压板状态识别模型，得到压板状态识别模型输出的压板位置信息和压板状态分类信息；其中，所述压板状态识别模型利用实施例1介绍的压板状态识别模型的训练方法训练所得；

本实施例上述各功能模块的具体功能实现参考实施例1和实施例3的相关内容。

实施例5

与前述实施例基于相同的发明构思，本实施例介绍一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时，执行实施例1介绍的压板状态识别方法。

综上实施例，本发明的压板识别模型采用剪枝、蒸馏、量化等技术对模型进行压缩优化，在保障模型识别准确度的基础上，大大降低了硬件资源的消耗，能够在计算性能较低的边缘终端设备中部署应用，满足了在边缘终端上对屏柜压板状态的识别需求。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

以上结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

1.一种压板状态识别模型的训练方法，其特征是，包括：

对初始样本库中的图像样本进行预处理，得到训练样本库；

2.根据权利要求1所述的压板状态识别模型的训练方法，其特征是，压板状态识别模型的训练方法中，训练所得的最终压板状态识别模型文件为pytorch格式的文件；

压板状态识别模型的训练方法还包括，将所得的压板状态识别模型文件转换为onnx格式模型文件。

3.根据权利要求2所述的压板状态识别模型的训练方法，其特征是，针对基于X86架构的边缘终端，采用intel提供的深度学习加速组件OpenVINO对onnx格式的模型文件进行转换；针对基于ARM架构的边缘终端，将onnx格式模型文件转换为ncnn格式模型文件，利用适用于移动边缘端的NCNN框架部署模型应用接口。

4.根据权利要求1或2所述的压板状态识别模型的训练方法，其特征是，压板状态识别模型的训练方法还包括，采用深度学习加速组件OpenVINO对模型进行量化处理，将参数精度由32位浮点型量化成16位浮点或INT8型。

5.根据权利要求1所述的压板状态识别模型的训练方法，其特征是，所述预处理包括通过数据增强处理扩充图像样本，所述数据增强处理包括：光学变换、几何变换、增加噪声或数据源扩充处理；

在模型训练过程中，所获取的人工标注信息为人工对训练样本库中图像的压板关键区域进行标注，所形成的符合YOLOv5算法规定的标注文件格式信息。

6.一种压板状态识别模型的训练装置，其特征是，包括：

7.一种压板状态识别方法，其特征是，包括：

获取变电站二次屏柜待识别压板图像信息；

将获取到的图像信息输入预先训练的压板状态识别模型，得到压板状态识别模型输出的压板位置信息和压板状态分类信息；其中，所述压板状态识别模型利用权利要求1-5任一项所述压板状态识别模型的训练方法训练所得；

根据所述压板状态分类信息确定待识别压板的状态。

8.一种压板状态识别装置，其特征是，包括：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时，执行如权利要求7所述的压板状态识别方法。