CN110188746A

CN110188746A - 一种面向数字液晶的分割和识别方法

Info

Publication number: CN110188746A
Application number: CN201910321657.0A
Authority: CN
Inventors: 徐园园; 黄继鹏; 高阳
Original assignee: JIANGSU WANWEI AISI NETWORK INTELLIGENT INDUSTRY INNOVATION CENTER Co Ltd; Nanjing University
Current assignee: JIANGSU WANWEI AISI NETWORK INTELLIGENT INDUSTRY INNOVATION CENTER Co Ltd; Nanjing University
Priority date: 2019-04-19
Filing date: 2019-04-19
Publication date: 2019-08-30

Abstract

本发明提出了一种新的面向数字液晶的分割和识别方法。本发明定义了一种新的标定方法，能应用于显示屏有污渍和划痕的情况，通过标定准确分割数字表。本发明解决了无液晶数字集的问题，即对已有的数字集进行预处理，使其和待处理数字分布一致。本发明提出了卷积神经网络结构，适用于小尺寸、小数量级数字图片的识别。

Description

一种面向数字液晶的分割和识别方法

技术领域

本发明涉及一种新的面向数字液晶的分割和识别方法。

背景技术

计算机视觉在目标检测和识别等方面有很多应用，可以分为数字图像处理技术和卷积神经网络两大类技术。数字图像处理技术可以在无样本或者少量样本的情况下进行几何图形或者简单物体的检测。随着深度学习方法的流行，尤其是卷积神经网络，能够提取图像更高语义的特征，但是需要大量的样本，神经网络模型有较好的泛化性能，训练集充足情况下识别效果更好。

液晶数字表的自动识别在工业领域有很高的应用价值，但是数字的准确分割和数字识别是难点。不同的液晶数字表有不同的读数，小数点个数存在差异，整数部分也存在差异，甚至存在非数字字符。

图像处理技术可以进行图像增强和特征点匹配，SIFT特征点匹配可以实现检测和定位物体，但是对于复杂背景的图片或者无明显特征的物体检测效果不好，因此需要对图片进行预处理，去除干扰。由于每个数字的大小相同，可以根据预先标注信息进行自动分割。对每个数字图像进行图像增强、去噪、二值化，利用卷积神经网络模型进行数字识别。

卷积神经网络需要大量的样本，识别效果取决于训练样本和测试样本的分别是否一致。虽然液晶数字表图片较少，但是手写体数字识别和车牌数字识别技术已经比较成熟，并且有对应的数据集。将车牌数字集进行预处理，使其和分割数字一样尺寸，可以用来训练。

卷积神经网络主要包括卷积层、激活函数、池化层、全连接层、损失函数和优化方法，卷积核参数和学习率等参数需要根据识别效果自行设计。当训练数据集较小时，卷积神经网络很容易出现过拟合问题，可以利用批归一化、Dropout等方法来解决过拟合问题。

发明内容

发明目的：本发明针对液晶数字表，提出一种新的数字分割和识别方法，适用于各种类型的液晶数字表。数字分割方法能应用于有污渍和划痕的表盘，数字识别模型具有很强的抗噪能力，能有效进行数字识别。

技术方案：主要包括表盘定位、数字分割和数字识别。

(1)表盘定位：对输入图像进行图像增强，根据预存的表盘模板图片进行SIFT特征点匹配，根据特征信息检测和定位表盘，在输入图像上截取出匹配的液晶表盘；

(2)数字分割：标定表盘中显示屏的位置信息，截取显示屏区域保存，待识别数字的位置信息，小数点的位置信息；对输入图像由(1)定位到表盘并截取出表盘图片，根据标定信息从表盘图片中截取出显示屏区域，此时显示屏区域可能是倾斜的，将显示屏区域根据标定信息进行放缩和矫正，此时显示屏区域和预存的显示屏图片尺寸和图片方向都是一致的，文字也是相对应的，根据标定的数字位置进行分割，得到多个分割数字图片；

(3)数字识别：对(2)分割出来的数字进行图像增强和二值化处理，用训练好的卷积神经网络模型进行识别，最后根据标定信息得到最终读数。图像增强和二值化可以在输入图像上进行，也可以对每个分割数字进行。

数字识别的具体步骤包括：

(3.1)对数字进行图像增强、去噪；

(3.2)对数字图像进行自适应二值化；

(3.3)利用车牌数字集，对数字进行预处理，放缩成和分割图片一样尺寸，随机添加噪声；

(3.4)设计卷积神经网络模型，通过实验选择合适的网络结构和参数；

(3.5)对分割数字进行识别；

(3.6)根据标定信息，确定小数点位置，拼接单个数字和小数点，得到表盘读数。

有益效果

本发明的显著优点是数字分割准确，分割数字位于图片中间，几乎占据整张图片，减少了背景噪声；数字标定和数字分割方法能应用于有污渍和划痕的液晶表盘；在液晶表盘有划痕和污渍的情况下，卷积神经网络模型在测试集上的识别准确率为96％，对人眼可判断的数字，模型也能判断准确。

本发明中的数字识别模型，将车牌数字集作为训练样本，解决了训练样本少的难题，将车牌数字图片放缩成分割数字的尺寸，添加噪声使得车牌数字集的分布和表盘分割数字分布相似，实践证明，通过这种方法能取得较好的识别效果。

附图说明

图1是本发明的总体结构图。

图2是本发明的整体效果图。

图3液晶表盘标定方法。

图4图像增强和二值化效果图。

图5卷积神经网络结构图。

具体实施方式

图1给出了本发明的整体流程，本发明主要包括表盘定位、数字分割和数字识别。

(1)表盘定位是在输入图像上找出液晶表盘的位置，并截取出表盘图片，详细说明表盘定位的具体实现步骤：

(1.1)预存不同类型的数字液晶表模板图片，截取包含整个表盘的区域，为了得到多个稳定的特征点，截取时要尽可能保留边角区域；在表盘模板图片上标注显示屏区域的坐标，存成json文件格式；

(1.2)采用Sift算法得到输入图像的特征矩阵和对应模板图片的特征矩阵，计算特征距离得到表盘的位置，在输入图像中截取出表盘；

(2)数字分割包括数字标定和数字分割，数字标定记录表盘区域的数字位置信息，数字分割是根据数字标定信息分割数字，下面详细说明数字标定和数字分割的具体实现步骤：

(2.1)截取显示屏区域并保存，在(1.1)仪表模板图片上截取显示屏区域，注意截取时要保持显示屏是端正无倾斜的；将截取的显示屏的大小添加到json文件中；

(2.2)数字标定：在(2.1)中显示屏区域进行待识别数字的标定，为了分割数字和识别数字，需要标记每个数字的区域和小数点的位置，如图3所示，左边是显示屏，右边是标记信息，红色的点表示单个数字的坐标，黄色的点表示小数点的位置。右边“rectangle”记录液晶显示屏的宽和高，液晶显示屏的左上角坐标对应坐标原点；“widthSplit”记录数字的横坐标；“heightSplit”记录数字的纵坐标；“decimal”记录小数点的位置，默认从0开始。对于有多个读数的表盘，延纵轴方向的数字间隔较大，因此对每行数字，记录纵坐标方向的起点和终点位置，例如图3中的[4，29]表示第一行读数纵坐标的起点和终点位置，[32,61]表示第二行读数纵坐标的起点和终点位置。数字的横坐标只需要记录开始位置，注意小数点也要算作一个数字，因为有的数字表上小数点会单独占一个字符的位置。可以编写简单的小程序协助完成标定任务。

(2.3)数字分割：对输入图像根据(1)得到表盘图片，根据(2.1)的显示屏标注信息，在表盘图片上截取显示屏区域，将显示屏区域进行放缩和矫正，使其和预存的显示屏图片的尺寸和方向保持一致；对校正后的显示屏区域进行高斯模糊、图像增强、自适应二值化；根据(2.2)的数字标注信息，进行数字分割；

(3)数字识别：

(3.1)利用车牌数字集，对数字进行预处理，和分割图片一样尺寸，随机添加噪声。经过二值化后的数字图片放缩成28x28大小。

(3.2)设计卷积神经网络模型，通过实验选择合适的网络结构和参数，对分割数字进行识别。如图5所示，网络一共有4层CONV层，第一层CONV的输出通道数是16，卷积核大小是(3,3)，填充1圈保持尺寸不变。第二层CONV同第一层CONV设置一致，然后是最大池化层，接着第三层卷积层，输出通道数是32，第四层卷积层和第三层卷积层相同。最后两个全连接层，然后Softmax进行分类。

(3.3)卷积网络主要由CONV层和全连接层、Softmax组成，CONV主要是由深度学习的基本组件卷积层、批归一化层、激活层、池化层组成，详细信息如下：

a)卷积层：每一个CONV的卷积层都使用(3,3)大小的卷积核，填充padding为1；卷积的公式定义为：

三维张量表示卷积神经网络第l层的输入，(i^l,j^l,d^l)表示第l层上通道d第i行第j列位置的元素，第l层的卷积核f^l有D个，y是第l层的输入经过卷积操作之后的输出，

0≤i^l+1＜H^l-H+1＝H^l+1

0≤j^l+1＜W^l-W+1＝W^l+1

前两层卷积层的输出通道是16，后两层卷积层的输出通道是32。

b)激活层，激活层采用ReLU激活函数，避免梯度消失；

c)池化层，本发明中采用2x2，步长为2的最大池化层，对特征图进行下采样；

d)全连接层，网络中使用了两层全连接层，第一层全连接层的输入大小是32x5x5，输出大小是128维；第二层全连接层的输入是128维度，输出是11维；11维是0～9共10个数字加上非数字类型；

e)Softmax，将最后一层全连接层的输出结果转化为概率，用于计算交叉熵损失；

f)损失函数，采用交叉熵损失，定义为

N是训练样本总数，C是类别数11，y_i是第i个样本的真实标记，

h＝(h₁,h₂,…,h_c)是网络模型的预测结果；

g)优化器，采用Adam优化器，初始学习率为0.001，超参数weight_decay为0.00001，超参数batch size大小为128。

Claims

1.一种面向数字液晶表的分割和识别方法，其特征在于，表盘定位和数字标定方法，有如下步骤：

（1）、表盘定位: 对不同类型的表盘，截取表盘区域，存成模板图片；

（2）、显示屏区域标定：在(1)中的模板图片上标记显示屏区域的位置，并进行矫正，记录显示屏图片矫正之后的大小；

（3）、数字标定方法：在(2)中矫正之后的显示屏图片上，需要标记每个数字的位置区域坐标和小数点的位置，如图3所示，左边是显示屏，右边是标记信息。

2.权利1要求的表盘定位方法，其特征在于，步骤(1)中，对输入图片，利用SIFT特征匹配，找到液晶数字表的位置并截取。

3.权利1要求的数字标定方法，其特征在于，在步骤(2)中，对输入图像上截取的表盘图片，根据标注信息截取出显示屏区域，进行矫正和放缩到固定大小。

4.一种面向数字液晶表的分割和识别方法，其特征在于，数字分割流程，根据权利1的表盘定位和数字标定方法，对显示屏区域进行数字分割。

5.权利4要求的数字分割方法，其特征在于，能适应有污渍和划痕的表盘，对数字进行图像增强、去噪、阈值自适应二值化。

6.一种面向数字液晶表的分割和识别方法，其特征在于，数字识别方法，有如下步骤：

（a）、利用车牌数字集，对数字进行预处理，和分割图片一样尺寸，添加噪声，自适应二值化，和分割图片分布保持一致；

（b）、设计卷积神经网络模型，通过实验选择合适的网络结构和参数，对分割数字进行识别；

（c）、将已识别的液晶数字加入训练样本集，模型重新训练之后，在测试集上准确率提升。