CN115424121B

CN115424121B - 一种基于计算机视觉的电力压板开关巡检方法

Info

Publication number: CN115424121B
Application number: CN202210912343.XA
Authority: CN
Inventors: 帅辉明; 高誌怡; 王梦彦; 刘晨曦; 陈琳琳; 朱娴; 刘飞宇
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2022-07-30
Filing date: 2022-07-30
Publication date: 2023-10-13
Anticipated expiration: 2042-07-30
Also published as: CN115424121A

Abstract

本发明公开了一种基于计算机视觉的电力压板开关巡检方法，包括：采集单帧图像，并获取所述单帧图像上多个压板开关的位置、开关状态、贴纸种类以及开关底部标签的种类；获取开关底部标签的文本信息，并构建YOLOv3算法将压板开关与其对应的标签、贴纸关联输出；采用校验算法判断巡检前后开关状态、标签贴纸信息是否变化；依据校验反馈结果完成对电力压板开关的巡检。无需手动录入开关数量信息，直接一站式拍摄加检测，即可准确得到结果；除了检测开关还有其标签种类，还对标签上的文字进行了OCR检测，可以直接获得文本内容，不必手动输入，减少了工人的工作量。

Description

一种基于计算机视觉的电力压板开关巡检方法

技术领域

本发明涉及电力压板开关巡检的技术领域，尤其涉及一种基于计算机视觉的电力压板开关巡检方法。

背景技术

目前业界内已经存在许多文献、方案解决电力系统巡检的问题，如文献[1]中设计了电力巡检机器人，但巡检机器人运用了多种复杂的传感器，涉及多个控制系统定位模块，不仅设备成本高，而且其运用的计算机视觉算法对变电站应用场景的局限性较大；文献[2]中将无人机应用到电力巡检中，其缺陷除了成本大以外，还会受到电磁环境等情况的影响，其普适性不高且实现难度较大；除此之外，如文献[3]中主要针对变电站的指示灯、空气开关等继电保护装置的状态进行研究，并没有将其各种装置对应的标签内容识别检测出来。

[1]吴昊,陈山,冯驰,罗涛,操昊鹏.电力巡检机器人终端视觉巡检技术[J].电力设备管理,2020(09):196-199.

[2]王瑞群,欧阳权,段朝伟,王志胜.基于强化学习的无人机全自主电力巡检[J].机械与电子,2021,39(12):34-38+43.

[3]潘成成.变电站继电保护装置的图像识别方法研究[D].广西大学,2020.

发明内容

本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊，而这种简化或省略不能用于限制本发明的范围。

鉴于上述现有存在的问题，提出了本发明。

因此，本发明解决的技术问题是：标签较小且繁多，对电力巡检这一特定场景下的文本检测与识别效果很不理想的问题。

为解决上述技术问题，本发明提供如下技术方案：采集单帧图像，并获取所述单帧图像上多个压板开关的位置、开关状态、贴纸种类以及开关底部标签的种类；获取开关底部标签的文本信息，并构建YOLOv3算法将压板开关与其对应的标签、贴纸关联输出；采用校验算法判断巡检前后开关状态、标签贴纸信息是否变化；依据校验反馈结果完成对电力压板开关的巡检。

作为本发明所述的基于计算机视觉的电力压板开关巡检方法的一种优选方案，其中：所述YOLOv3算法包括，

利用MobileNetv1神经网络对所述单帧图像进行特征提取；

将所述单帧图像划分为多个区域，并预测所述单帧图像的边界框和每个区域的概率值。

作为本发明所述的基于计算机视觉的电力压板开关巡检方法的一种优选方案，其中：所述开关底部标签的文本信息的获取包括，

利用MobileNetV3 Small网络作为backbone实现对单帧图像特征序列的提取；

使用RNN结构作为循环层来预测从卷积层获取的所述单帧图像特征序列的标签分布；

使用CTC作为转录层,将从循环层获取到的标签分布通过去重整合等操作转换成最终的识别结果。

作为本发明所述的基于计算机视觉的电力压板开关巡检方法的一种优选方案，其中：所述压板开关与其对应的标签、贴纸关联输出包括，

将所述文本信息划分为标签、开关和贴纸，并将所述文本信息存放在三个数组中；

每个数组中都包含位置、种类信息，此外开关数组中还包括标签、贴纸、贴纸位置这三个属性。

作为本发明所述的基于计算机视觉的电力压板开关巡检方法的一种优选方案，其中：所述压板开关与其对应的标签、贴纸关联输出还包括，

判断是否出现漏检的情况，并获取所有开关的位置信息。

作为本发明所述的基于计算机视觉的电力压板开关巡检方法的一种优选方案，其中：若未出现漏检，则遍历每一个所述开关数组，并设置第一个开关；

以所述第一个开关为基准，遍历所有的开关目标，若第一个开关在y轴上的中值是在这个目标的上边界和下边界的值之间，则这个目标是和第一个开关是同一排的开关，并根据这个目标的x坐标进行排序，活动的第一排开关的全部相对位置信息。

作为本发明所述的基于计算机视觉的电力压板开关巡检方法的一种优选方案，其中：还包括，

遍历所有的标签数组，计算每一个标签和开关底部中心的距离，将标签和距离这个标签最近的开关相关联，以此类推，把标签的信息并入开关数组；

遍历所有的贴纸数组，计算每一个贴纸和开关上部中心的距离，将贴纸和距离这个贴纸最近的开关相关联，以此类推，把贴纸的信息并入开关数组；

遍历开关时跳过已经有坐标的开关，获取到所有开关的位置信息。

作为本发明所述的基于计算机视觉的电力压板开关巡检方法的一种优选方案，其中：若出现漏检，则利用捡漏算法查找漏检情况；

若左边和右边相邻的开关间距大于一个开关搞的1.65倍，则认为中间存在漏检情况，要插入一个值为“null”的开关，表示未能成功检测，并提醒用户人工检查并手动添加信息，若不存在漏检的情况，则需要调整好规范角度重新拍摄。

作为本发明所述的基于计算机视觉的电力压板开关巡检方法的一种优选方案，其中：所述校验算法包括，

对巡检前后拍摄的单帧图像进行检测识别，并返回巡检前后每个开关、标签与贴纸的信息json识别结果，比较两个json文件中开关总数是否相同。

作为本发明所述的基于计算机视觉的电力压板开关巡检方法的一种优选方案，其中：所述校验算法还包括，

若开关总数相同，比较在两个json文件中行列坐标相同的开关的种类是否相同，判断巡检前后开关状态是否变化；检测完成后输出巡检前后开关状态、标签贴纸信息以及开关状态是否变化，实现开关检测自动校检；

若开关总数不同，则需巡检人员重新拍摄巡检后的图片，重新进行检测或人工校验。

本发明的有益效果：无需手动录入开关数量信息，直接一站式拍摄加检测，即可准确得到结果；除了检测开关还有其标签种类，还对标签上的文字进行了OCR检测，可以直接获得文本内容，不必手动输入，减少了工人的工作量。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。其中：

图1为本发明一个实施例提供的一种基于计算机视觉的电力压板开关巡检方法的基本流程示意图；

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合说明书附图对本发明的具体实施方式做详细的说明，显然所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明的保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

其次，此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例，也不是单独的或选择性的与其他实施例互相排斥的实施例。

本发明结合示意图进行详细描述，在详述本发明实施例时，为便于说明，表示器件结构的剖面图会不依一般比例作局部放大，而且所述示意图只是示例，其在此不应限制本发明保护的范围。此外，在实际制作中应包含长度、宽度及深度的三维空间尺寸。

同时在本发明的描述中，需要说明的是，术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一、第二或第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

本发明中除非另有明确的规定和限定，术语“安装、相连、连接”应做广义理解，例如：可以是固定连接、可拆卸连接或一体式连接；同样可以是机械连接、电连接或直接连接，也可以通过中间媒介间接相连，也可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

实施例1

参照图，为本发明的一个实施例，提供了一种基于计算机视觉的电力压板开关巡检方法，包括：

S1：采集单帧图像，并获取单帧图像上多个压板开关的位置、开关状态、贴纸种类以及开关底部标签的种类。

S2：获取开关底部标签的文本信息，并构建YOLOv3算法将压板开关与其对应的标签、贴纸关联输出。需要说明的是：

YOLOv3算法包括，

利用MobileNetv1神经网络对单帧图像进行特征提取；

将单帧图像划分为多个区域，并预测单帧图像的边界框和每个区域的概率值。

开关底部标签的文本信息的获取包括，

使用RNN结构作为循环层来预测从卷积层获取的单帧图像特征序列的标签分布；

针对RNN存在梯度消失的问题，无法获取更多的上下文信息，CRNN使用的LSTM神经单元作为RNN的单元，从而允许捕获长距离依赖。

RNN在进行时序分类时，会出现很多冗余信息，比如一个字母被连续识别两次，为了解决这个问题，CTC插入blank机制，即连续相同的字符若中间含有blank则不予以合并，来得以解决。

CRNN模型可完成端到端训练，只需垂直方向缩放到固定长度，同时可以识别任意长度的序列，训练速度快，模型复杂度低。

压板开关与其对应的标签、贴纸关联输出包括，

将文本信息划分为标签、开关和贴纸，并将文本信息存放在三个数组中；

压板开关与其对应的标签、贴纸关联输出还包括，

判断是否出现漏检的情况，并获取所有开关的位置信息。

若未出现漏检，则遍历每一个开关数组，并设置第一个开关；

以第一个开关为基准，遍历所有的开关目标，若第一个开关在y轴上的中值是在这个目标的上边界和下边界的值之间，则这个目标是和第一个开关是同一排的开关，并根据这个目标的x坐标进行排序，活动的第一排开关的全部相对位置信息。

还包括，

若出现漏检，则利用捡漏算法查找漏检情况；

S3：采用校验算法判断巡检前后开关状态、标签贴纸信息是否变化。需要说明的是：

校验算法包括，

校验算法还包括，

S4：依据校验反馈结果完成对电力压板开关的巡检。

无需手动录入开关数量信息，直接一站式拍摄加检测，即可准确得到结果；除了检测开关还有其标签种类，还对标签上的文字进行了OCR检测，可以直接获得文本内容，不必手动输入，减少了工人的工作量。

实施例2

参照图为本发明的第二个实施例，该实施例不同于第一个实施例的是，提供了一种基于计算机视觉的电力压板开关巡检方法的验证测试，为对本方法中采用的技术效果加以验证说明，以验证本方法所具有的真实效果。

YOLOv3算法使用一个单独神经网络作用在图像上，将图像划分多个区域并且预测边界框和每个区域的概率，其使用的特征提取网络是DarkNet-53，但DarkNet-53的内存需求大，计算量大，导致无法在移动设备以及嵌入式设备上运行，本发明将Darknet53替换为MobileNetv1，大大减少了目标检测网络运算量和模型尺寸，MobileNetv1网络结构表如表1所示。

表1：MobileNetv1网络结构表。

MobileNetv1引入了深度可分离卷积，作为传统卷积层的有效替代。深度可分卷积通过将空间滤波与特征生成机制分离开来，有效地分解了传统卷积。深度可分离卷积由两个单独的层定义：用于空间滤波的轻量级深度卷积和用于特征生成的1x1点卷积。深度可分离卷积将其分为两层，一层用于过滤(DW卷积)，另一层用于合并(PW卷积)。其网络结构是首先经过一个3*3的卷积层，接着通过一系列的深度可分离卷积(DW+PW卷积)，最后经过平均池化层、全连接层，以及经过softmax函数后得到最终的输出值，这种分解方法大大减少了计算量和模型尺寸。因此，本发明将YOLOv3的骨干网络Darknet53替换为MobileNetv1，大大减少了目标检测网络运算量和模型尺寸，这为之后在移动端部署提供便利。

本发明文本识别采用DB算法。DB(Differentiable Binarization)算法即可微分二值化处理，是基于分割的文本检测。其最关键的就是对二值化map的后处理过程，即将模型输出的概率图转化为文本框的过程。可微分二值化处理是将二值化操作插入到分割网络中进行联合优化，优化后的分割网络可以自适应的预测图像中每一个像素点的阈值，从而实现前景与背景的像素完全分离。且二值化阈值是通过网络学习得到，能够将二值化操作加入到网络里一起训练，这样最终的输出图对于阈值就有很强的鲁棒性，改善了传统分割方法采用固定阈值实现二值化map的操作所带来鲁棒性差的问题，同时提高了文本检测效果。

本发明的开关标签检测模型以DBNet模型为大题框架，以基于轻量级主干网络MobileNetv3 Large作为backbone，MobileNetv3是MobileNet的最新版，综合了MobileNetv1的深度可分离卷积、MobileNetv2的线性瓶颈的逆残差结构以及轻量级的注意力模型和利用h-swish代替swish作为激活函数这四个特点的轻量级网络。MobileNetv3的整体结构表如表2所示。

表2：MobileNetv3的整体结构表。

Input	Operator	exp size	#out	SE	NL	s
							224²×3	Conv2d	-	16	-	HS	2
112²×16	bneck，3×3	16	16	-	RE	1
							112²×16	bneck，3×3	64	24	-	RE	2
56²×24	bneck，3×3	72	24	-	RE	1
							56²×24	bneck，5×5	72	40	√	RE	2
28²×40	bneck，5×5	120	40	√	RE	1
							28²×40	bneck，5×5	120	40	√	RE	1
28²×40	bneck，3×3	240	80	-	HS	2
							14²×80	bneck，3×3	200	80	-	HS	1
14²×80	bneck，3×3	184	80	-	HS	1
							14²×80	bneck，3×3	184	80	-	HS	1
14²×80	bneck，3×3	480	112	√	HS	1
							14²×112	bneck，3×3	672	112	√	HS	1
14²×112	bneck，5×5	672	160	√	HS	2
							7²×160	bneck，5×5	960	160	√	HS	1
7²×160	bneck，5×5	960	160	√	HS	1
							7²×160	conv2d，1×1	-	960	-	HS	1
7²×960	pool，7×7	-	-	-	-	1
							7²×960	conv2d，1×1	-	1280	-	HS	1
7²×1280	conv2d，1×1	-	k	-	-	1

其中第一列Input表示输入尺寸，代表mobilenetV3每个特征层的shape变化；第二列Operator表示每次特征层即将经历的block结构，其中NBN表示不使用BN，conv2d 1x1相当于全连接层的作用，从MobileNetV3的结构中，可以看到特征提取经过了许多的bneck结构；第三列exp size表示bneck内逆残差结构上升后的通道数；第四列out表示bottleneck输出的channel个数即特征层的通道数；第五列SE表示是否使用SE模块(即是否在这一层引入注意力机制)；第六列NL表示激活函数的类别，HS即h-swish，RE表示RELU；第七列s表示每一次block结构所用的步长(s＝2，长宽变为原来一半)。

为了方便在移动端部署深度学习模型，出现了很多移动端深度学习工具，本发明使用paddle-lite移动端框架进行模型部署。

首先将目标检测YOLOv3模型和文字识别DB模型与CRNN模型在训练过程中得到的pdmodel文件转成naive_buffer格式的文件，然后搭建Android开关识别项目工程，在主程序中调用开关检测算法进行检测识别。开关检测算法在华为p40pro手机进行测试，如图1所示，对拍摄开关图进行检测识别，手机APP可以正确识别出每个开关、标签、贴纸的信息，并匹配关联标签得到存有其信息的json文件，一张图处理时间仅需200ms，可以达到工业中较理想的检测识别的效果。

使用Android Studio将算法封装成java文件，选择训练好的OCR模型，使用PaddleLite提供的opt工具优化该模型，使之优化后的模型更轻量级，耗费资源更少。并利用PaddleLite的JavaAPI、PaddleOCR和PaddleDetection检测模型完成端侧推理。

应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于计算机视觉的电力压板开关巡检方法，其特征在于，包括：

采集单帧图像，并获取所述单帧图像上多个压板开关的位置、开关状态、贴纸种类以及开关底部标签的种类；

获取开关底部标签的文本信息，并构建YOLOv3算法将压板开关与其对应的标签、贴纸关联输出；所述压板开关与其对应的标签、贴纸关联输出包括，将所述文本信息划分为标签、开关和贴纸，并将所述文本信息存放在三个数组中；每个数组中都包含位置、种类信息，此外开关数组中还包括标签、贴纸、贴纸位置这三个属性；

所述YOLOv3算法包括，利用MobileNetv1神经网络对所述单帧图像进行特征提取；将所述单帧图像划分为多个区域，并预测所述单帧图像的边界框和每个区域的概率值；

所述压板开关与其对应的标签、贴纸关联输出还包括，判断是否出现漏检的情况，并获取所有开关的位置信息；若未出现漏检，则遍历每一个所述开关数组并设置第一个开关；以所述第一个开关为基准，遍历所有的开关目标，若第一个开关在y轴上的中值是在这个目标的上边界和下边界的值之间，则这个目标是和第一个开关是同一排的开关，并根据这个目标的x坐标进行排序，活动的第一排开关的全部相对位置信息；还包括，遍历所有的标签数组，计算每一个标签和开关底部中心的距离，将标签和距离这个标签最近的开关相关联，以此类推，把标签的信息并入开关数组；遍历所有的贴纸数组，计算每一个贴纸和开关上部中心的距离，将贴纸和距离这个贴纸最近的开关相关联，以此类推，把贴纸的信息并入开关数组；遍历开关时跳过已经有坐标的开关，获取到所有开关的位置信息；

采用校验算法判断巡检前后开关状态、标签贴纸信息是否变化；所述校验算法包括，对巡检前后拍摄的单帧图像进行检测识别，并返回巡检前后每个开关、标签与贴纸的信息son识别结果，比较两个json文件中开关总数是否相同；若开关总数相同，比较在两个json文件中行列坐标相同的开关的种类是否相同，判断巡检前后开关状态是否变化；检测完成后输出巡检前后开关状态、标签贴纸信息以及开关状态是否变化，实现开关检测自动校检；如果开关总数不同，则需巡检人员重新拍摄巡检后的图片，重新进行检测或人工校验；依据校验反馈结果完成对电力压板开关的巡检；若出现漏检，则利用捡漏算法查找漏检情况；若左边和右边相邻的开关间距大于一个开关搞的1.65倍，则认为中间存在漏检情况，要插入一个值为“null”的开关，表示未能成功检测，并提醒用户人工检查并手动添加信息，若不存在漏检的情况，则需要调整好规范角度重新拍摄。

2.如权利要求1所述的基于计算机视觉的电力压板开关巡检方法，其特征在于：所述开关底部标签的文本信息的获取包括，

使用CTC作为转录层，将从循环层获取到的标签分布通过去重整合操作转换成最终的识别结果。