CN116403204B

CN116403204B - 一种圆形指针表智能读数的方法

Info

Publication number: CN116403204B
Application number: CN202310679158.5A
Authority: CN
Inventors: 刘涛
Original assignee: Nanjing Hanyuan Technology Co ltd
Current assignee: Nanjing Hanyuan Technology Co ltd
Priority date: 2023-06-09
Filing date: 2023-06-09
Publication date: 2023-08-25
Anticipated expiration: 2043-06-09
Also published as: CN116403204A

Abstract

本发明属于仪表读数技术领域，具体涉及一种圆形指针表智能读数的方法。区别于基于规则的图像处理和模式识别技术，采用圆形指针表目标检测、指针目标检测模型、文本检测+识别模型避免特征提取过程中积累的误差对检测精度的影响，且在没有任何先验条件的情况下，默认刻度示数间的刻度为均匀分布，通过定位指针位置和指针最近邻文本目标间形成的局部角度关系以及最近邻文本内容识别来计算指针读数，大大提升了检定的工作效率，减少人工读数引入的人为误差。

Description

一种圆形指针表智能读数的方法

技术领域

本发明属于仪表读数技术领域，具体涉及一种圆形指针表智能读数的方法。

背景技术

由于指针类仪表内部结构简单、制作成本低、抗干扰能力强、可靠性高，且具有防尘、防水、防冻特性，所以在现代工业过程中仍被广泛应用。

指针式仪表需要定期进行读数检定，但指针式仪表的读数大部分仍然是手工操作，存在效率低、耗时长、实时性差，以及易受读表人观察角度、疲劳等因素影响。

鉴于此，本发明为解决上述问题，设计一种圆形指针表智能读数的方法。

发明内容

发明目的：本发明的目的是针对目前技术中的不足，提供了一种圆形指针表智能读数的方法。

技术方案：为实现上述目的，本发明提供了一种圆形指针表智能读数的方法，确定指针读数包括以下步骤：

S1.输入图像，采用基于DBnet检测网络结构head模块新增分类预测分支的方式，使其适用于倾斜、形变的指针目标和表盘中心目标检测定位，提取出指针目标与表盘中心目标；

该新增分类分支采用两次转置卷积将输入特征图恢复到图像原尺寸大小，最终经过sigmod激活函数输出该特征图中每个像素输出预测概率最大的类别序号，通过寻找二值化目标特征图中的轮廓信息获得目标框，统计目标框区域内每个像素的序列号并去数量最大的序列号作为该目标框的类别输出，实现在像素水平上进行分类预测并输出分类特征图；

S2.由DBnet检测网络所提取出的表盘中心目标与指针目标，先判断是否存在表盘中心目标，存在则提取出与表盘中央区域的iou匹配程度高的面板中心目标确认为真实表盘中心并获取其中心坐标，去除误检的干扰；不存在则默认图像中心点坐标为真实表盘中心；

再通过检测所得指针目标框短边两中点与真实表盘中心坐标距离大小判断出该指针目标的近心端和远心端；

S3.采用以mobilenetV3为骨干网络的DBnet轻量化文本检测算法对圆形仪表中刻度示数文本区域提取，通过最小外接矩形算法对文本不规则四边形框进行定位后获得矩阵坐标；利用透视变换关系截取旋转文本框内容送入CRNN+CTC网络进行文本内容识别；

S4.将通过算法所得文本目标按照文本内容进行大小排序，确定刻度示数固定间距；

S5.确定最近邻文本目标；

S6.计算指针读数；先计算以表盘中心为顶点与一个最近邻文本目标T₁中心坐标、指针远心端坐标形成的夹角∠α占以表盘中心为顶点与最近邻两文本目标框T₁、T₂中心坐标形成的夹角∠β的比例，乘上两最近邻文本差值获得指针在两最近邻刻度文本见的示数，再加上最近邻文本中较小的值获得圆形指针表的读数，公式如下:

；

式中，Angle是读数数值，T₁、T₂分别为指针最近两端文本数值;α，β表示文本中心和指针间左右夹角值。

进一步的，所述步骤S3中，在提取不规则四边形框内图像时，首先计算变换矩阵，通过L2范数获取四边形最大宽边、高边来构建变换后的四点坐标，计算透视变换的映射矩阵Ｍ。

进一步的，最大宽边计算公式如下：

；

式中，width是倾斜数字文本目标的最小外接矩阵的宽，最小外接矩阵由四个点P0(x,y)、P1(x,y)、P2(x,y)、P3(x,y)构成；x代表对应点x坐标，y代表对应点y坐标；

最大高边计算公式如下：

；

height是倾斜数字文本目标的最小外接矩阵的长，最小外接矩阵由四个点P0(x,y)、P1(x,y)、P2(x,y)、P3(x,y)构成； x代表对应点x坐标,y代表对应点y坐标。

有益效果：1.区别于传统轮廓提取、霍夫直线检测等方法侧重指针轮廓信息来获取的指针，基于DBnet网络结构改进的指针、表盘中心目标检测算法结合指针、表盘中心本身存在的表征信息，从像素级进行目标框和目标分类的预测，对指针、面板中心检测的鲁棒性更高；

2.指针与表盘中心配对提出以指针近心端为顶点与指针远心端、表盘中心的夹角呈现钝角的结构特性，解决了一般指针检测出现的误检目标干扰读数问题；引入圆形指针表刻度示数存在固定差值规律保证根据指针远心端到文本目标距离最小寻找到的两最近邻文本目标非指针表盘存在的其他文本；

3.使用指针与最近邻文本的局部角度法，使指针表智能读数不再依赖于先验条件规定指针表量程，避免刻度线分割算法携带的标注工作量和应对反光、模糊等复杂场景下的不稳定性，应对反光导致的个别邻近文本丢失问题也能保证读数。

附图说明

图1为本发明圆形指针表指针读数方法流程图；

图2为本发明指针两端与表盘中心关系示意图；

图3为本发明透视变换截取文本示意图；

图4为本发明最近邻文本示意图；

图5为本发明表盘中心、最近邻文本、指针所成夹角示意图；

图6为本发明标准MobileNetV3 block网络结构图；

图7为本发明分辨率特征图；

图8为本发明crnn网络结构图。

实施方式

下面结合附图和具体实施方式，进一步阐明本发明，应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。需要说明的是，下面描述中使用的词语“前”、“后”、“左”、“右”、“上”和“下”指的是附图中的方向，词语“内”和“外”分别指的是朝向或远离特定部件几何中心的方向。

实施例1，根据图1-图8作进一步解释说明。

本发明提供一种圆形指针表智能读数的方法，确定指针读数包括以下步骤：

一.确认指针近心端、指针远心端和表盘中心；

1. 基于DBnet网络结构对指针、表盘中心进行检测；

指针、表盘中心此类非矩形小目标，容易在一般卷积下采样时丢失特征信息，因此利用分割的方法可以在像素水平上进行预测；DBnet(Differentiable BinarizationNetwork)检测网络区别于普通分割网络采用固定阈值输出二值化图，对每一个像素点进行自适应二值化，二值化阈值由网络学习所得，彻底将二值化操作加入网络训练，更好的分离出前景和后景，保证最终输出图阈值的鲁棒性，简化了一般分割算法复杂耗时的后处理过程。DBnet网络一般适用于不规则文本检测，因此默认检测结果为一类目标，为了更好的区分提取出的指针目标与表盘中心目标，采用基于DBnet检测网络结构head模块新增分类预测分支的方式，使其适用于倾斜、形变的指针目标和表盘中心目标检测定位。该新增分类分支采用两次转置卷积将输入特征图恢复到图像原尺寸大小，最终经过sigmod激活函数输出该特征图中每个像素输出预测概率最大的类别序号，通过寻找二值化目标特征图中的轮廓信息获得目标框，统计目标框区域内每个像素的序列号并去数量最大的序列号作为该目标框的类别输出，实现在像素水平上进行分类预测并输出分类特征图。

2. 确认指针近心端、指针远心端和表盘中心；

由DBnet检测网络所得检测结果，先判断是否存在面板中心目标，存在则提取出与表盘中央区域的iou匹配程度高的面板中心目标确认为真实表盘中心并获取其中心坐标，去除误检的干扰；不存在则默认图像中心点坐标为真实表盘中心。由于指针目标呈细长状，所以检测所得指针目标框短边两中点基本代表了指针的两端，通过短边两中点与真实表盘中心坐标距离大小判断出该指针目标的近心端和远心端。选取指针目标中以指针近心端为顶点与真实表盘中心、指针远心端形成夹角为钝角（如图2），同时近心端距离表盘中心较近的指针目标为真实指针。

二.获取最近邻文本目标；

1.考虑多模型使用造成的资源占用率高，采用以mobilenetV3为骨干网络的DBnet轻量化文本检测算法对圆形仪表中刻度示数文本使用不规则四边形框进行定位，通过透视变换获取旋转文本框内容并送入crnn网络进行文本内容识别。其中，提取不规则四边形框内图像首先计算变换矩阵，通过L2范数获取四边形最大宽边、高边(公式如下)来构建变换后的四点坐标，计算透视变换的映射矩阵Ｍ，并获得扭转图像（如图3所示）；

最大宽边计算公式如下：

；

式中，width是倾斜数字文本目标的最小外接矩阵的宽，最小外接矩阵由四个点P0(x,y)、P1(x,y)、P2(x,y)、P3(x,y)构成； x代表对应点x坐标，y代表对应点y坐标；

最大高边计算公式如下：

；

height是倾斜数字文本目标的最小外接矩阵的长，最小外接矩阵由四个点P0(x,y)、P1(x,y)、P2(x,y)、P3(x,y)构成；x代表对应点x坐标，y代表对应点y坐标。

MobileNetV3在嵌入式设备上具有低计算量、低复杂度以及高精度的特点，考虑SE模块在边缘推理增加开销用度，本文特征提取backbone阶段用标准卷积替代SE模块。

其中标准MobileNetV3 block如图6所示，每经过一层MobileNetV3 bolck 特征图分辨率降采样2倍，最终经过5个blocks处理后，获得1/2 ,1/4,1/8,1/16.1/32分辨率特征图（如图7所述）用做下游检测数字体和指针等目标特征。

CRNN是卷积循环神经网络，具有端到端地对不定长的文本序列进行识别能力，即不用先对单个文字进行切割，而是将文本识别转化为时序依赖的序列学习。本发明考虑场景中环境不确定性和字体方向性问题，采用双向LSTM模块构建CRNN网络单元，用于实现圆表表盘中的刻度数字，CRNN如图8所示。

2.将通过算法所得文本目标按照文本内容进行大小排序，默认文本内容干扰项小于正常刻度示数文本个数，因此统计排序后相邻文本差值取出现频率最高的差值作为刻度示数固定间距。

3.计算文本检测、识别算法所得文本目标中心坐标与真实指针远心端距离，取距离最近且文本内容差值与刻度示数固定间距呈倍数关系的两文本目标作为最近邻文本目标（如图4所示)。

三. 计算指针读数

先计算以表盘中心为顶点与一个最近邻文本目标T₁中心坐标、指针远心端坐标形成的夹角∠α占以表盘中心为顶点与最近邻两文本目标框T₁、T₂中心坐标形成的夹角∠β的比例，乘上两最近邻文本差值获得指针在两最近邻刻度文本见的示数，再加上最近邻文本中较小的值获得圆形指针表的读数，公式如下:

；

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种圆形指针表智能读数的方法，其特征在于：确定指针读数包括以下步骤：

新增分类分支采用两次转置卷积将输入特征图恢复到图像原尺寸大小，最终经过sigmod激活函数输出该特征图中每个像素输出预测概率最大的类别序号，通过寻找二值化目标特征图中的轮廓信息获得目标框，统计目标框区域内每个像素的序列号并去数量最大的序列号作为该目标框的类别输出，实现在像素水平上进行分类预测并输出分类特征图；

S5.确定最近邻文本目标；

S6.计算指针读数；先计算以表盘中心为顶点与一个最近邻文本目标T1中心坐标、指针远心端坐标形成的夹角∠α占以表盘中心为顶点与最近邻两文本目标框T₁、T₂中心坐标形成的夹角∠β的比例，乘上两最近邻文本差值获得指针在两最近邻刻度文本见的示数，再加上最近邻文本中较小的值获得圆形指针表的读数，公式如下:

；

式中，Angle是读数数值，T₁,T₂分别为指针最近两端文本数值;α，β表示文本中心和指针间左右夹角值。

2.根据权利要求1所述的一种圆形指针表智能读数的方法，其特征在于：所述步骤S3中，在提取不规则四边形框内图像时，首先计算变换矩阵，通过L2范数获取四边形最大宽边、高边来构建变换后的四点坐标，计算透视变换的映射矩阵Ｍ。

3.根据权利要求2所述的一种圆形指针表智能读数的方法，其特征在于：

最大宽边计算公式如下：

；

最大高边计算公式如下：

；

height是倾斜数字文本目标的最小外接矩阵的长，最小外接矩阵由四个点P0(x,y)、P1(x,y)、P2(x,y)、P3(x,y)构成；x代表对应点x坐标,y代表对应点y坐标。