CN115984862A

CN115984862A - 一种基于深度学习的远传式水表数字识别方法

Info

Publication number: CN115984862A
Application number: CN202310016561.XA
Authority: CN
Inventors: 张辉; 齐小龙; 朱晓阳; 齐杰; 朱成顺; 朱鹏程; 赵忠; 方喜峰
Original assignee: Jiangsu University of Science and Technology
Current assignee: Jiangsu University of Science and Technology
Priority date: 2023-01-06
Filing date: 2023-01-06
Publication date: 2023-04-18

Abstract

本发明公开了一种基于深度学习的远传式水表数字识别方法，包括：接收水表信息；解析用户水表数据；对水表图像进行预处理；对水表图像数据进行增强处理；制作数据集，对数据集进行数据标注、数据格式处理和数据分配；对深度学习网络模型进行训练和测试，得到水表数字识别模型；通过水表数字识别模型识别实时的水表图像，并按水表读数规则输出水表读数；分析实时获取的水表图像和读数结果，判断出识别错误和图像质量较差的图像，并做标注；将得到的水表表号、水表拍摄时间、水表读数结果和图像的标注信息，已约定好的数据格式传输给客户。本发明方法可以提高半字和全字的识别准确率，提高水表识别速度，并且能够适应复杂、多变的水表安装环境。

Description

一种基于深度学习的远传式水表数字识别方法

技术领域

本发明属于图像目标识别和分类技术领域，具体涉及一种基于深度学习的远传式水表数字识别方法。

背景技术

随着信息技术的人工智能的快速发展，越来越多的领域向智能化发展。一些智能化的产物逐渐出现在人们的日常生活中，比如无人驾驶、智能化工厂、智慧水务等。虽然近几年来智能化水表得到一定的发展，但是智能化水表普及率相对较低，且智能化水表的维护和管理等费用较高。目前一部分用户家里依然是老式的机械水表。为了解决传统的人工抄表效率低、漏查、记录错误等问题，对传统的机械水表的读数识别依然是一个重点的研究方向。目前，对传统的机械水表的图像识别已经取得了许多研究成果。例如：模板匹配法、深度学习的方法等。

对于基于模板匹配的水表读数识别方法的研究，该方法采用了传统的模板匹配来识别字符，虽然对识别中可能出现的半字识别精度较高，由于水表所处的环境较复杂，模板匹配方法存在局限性，使得水表读数的准确率不是很高；目前已有的深度学习的方法识别对全字准确率较高，但半字的识别准确率相对较低。

发明内容

发明目的：针对现有的水表识别中存在的准确率较低、对复杂的环境的适应性低、模型鲁棒性差等问题，提出一种基于深度学习的远传式水表读数识别的方法，该方法可以提高半字和全字的识别准确率，提高水表识别速度，并且能够适应复杂、多变的水表安装环境。

技术方案：为实现上述目的，本发明提供一种基于深度学习的远传式水表数字识别方法，包括如下步骤：

S1：接收传输的水表信息；

S2：解析用户水表数据，获取到水表表号、水表拍摄时间和水表图像；

S3：对水表图像进行预处理，过滤那些没有拍摄到水表字符区域或只拍到部分字符、水表字符人眼无法识别的水表图像；

S4：对预处理后的水表图像数据进行增强处理，对图像进行随机旋转和亮度调整，提高训练效果和模型的鲁棒性，进而提高模型识别的准确率；

S5：将增强处理后的水表图像数据按照水表特征制作数据集，对数据集进行数据标注、数据格式处理和数据分配；

S6：根据步骤S5处理后的数据集对深度学习网络模型进行训练和测试，得到水表数字识别模型参数；

S7：运用OpenCV函数库解析深度学习网络的DNN函数，解析水表数字识别模型参数，用程序搭建HTTP服务器，识别真实场景下的水表数据；

S8：分析步骤S7实时获取的水表图像和读数结果，判断出识别错误和图像质量较差的图像，并做标注；

S9：将得到的水表表号、水表拍摄时间、水表读数结果和图像的标注信息，已约定好的数据格式传输给客户。

进一步地，所述步骤S1中水表信息的传输方式为：通过加装摄像头拍摄得到水表信息图片，转码后保存在数据库，再将水表数据图片通过HTTP服务器传输给服务端HTTP服务器。

进一步地，所述步骤S2具体为：

和客户约定好数据传输形式，以便和客户端准确无误的通信；

和客户约定好数据传输的格式，以便准确无误的获取水表图图像、水表表号和水表拍摄时间；

解码数据，获取水表原始图像数据，并转码为图片保存。

进一步地，所述步骤S3具体为：

过滤水表数据集中人眼难以识别和水表数字字符缺失的水表图像，通过人工选取包含每种半字字符和全字字符的水表数据集。

进一步地，所述步骤S4具体为：

运用图像处理的方法，调整图像的亮度和在平面内的旋转角度，以适应不同的安装环境，进而提高模型的鲁棒性；

分析水表图像的像素数据，统一修改图像的大小，以适应水表数字网络识别模型的数据输入特征；

运用图像标注工具，标注水表图像，并将标注好的水表图像转换为适合水表数字网络识别模型的数据格式。

增强处理具体包括如下步骤：

步骤4.1：由于采集的数据集有限，为了使模型适应不同的环境光照条件和日出日落对拍照环境的影响，可以通过数据增强的方式来模拟不同的光照背景，具体实施如下公式：

图像亮度降低：

设图像大小为W×H，三通道图像中共有W×H×3个像素点，每个像素点有三个值分别设为V_b、V_g、V_r，后将图像转换为灰度图，设变换后的灰度图像为G，每一点的像素值变化公式如下：

G(xi,yi)＝aVr(xi,yi)+bVg(xi,yi)+cVb(xi,yi)(1)

其中a+b+c＝1；亮度调节比例为s，调节范围[0.6，0.9]，具体的亮度调整公式如下：

L(xi,yi)＝sG(xi,yi) (2)

通过上述公式遍历图像的所有像素点，将运算后的值重新赋值给对应位置。

图像亮度提高：

G(xi,yi)＝aVr(xi,yi)+bVg(xi,yi)+cVb(xi,yi) (3)

其中a+b+c＝1；亮度调节比例为s，调节范围[1.1，1.4]，具体的亮度调整公式如下：

L(xi,yi)＝sG(xi,yi) (4)

步骤4.2：为了适应水表的安装角度和增强模型的鲁棒性，将原始数据集通过旋转图像处理。图像的原点一般在左上角，这样计算出来的坐标会有负值，将图像原点平移到图像中心。记原图像的中像素点的横坐标和纵坐标分别为x、y，旋转后的像素点的横坐标和纵坐标分别为x_o、y_o，旋转角度记为α，原图像宽高为src_w、src_h，旋转后图像宽高为dst_w、dst_h，旋转公式如(3)式就所示：

进一步地，所述步骤S5具体包括：

A1：为了适应神经网络的数据集格式，统一将步骤S4得到的图片修改为统一的格式；

A2：将获取的数据集用数据集标注工具进行标注，将标注好的数据集按深度学习神经网络格式要求分配好数据集。

进一步地，所述步骤A2具体为：

A2-1：将数据集按数字字符类型用数据集标注工具进行标注，数字类型分为全字和半字，其中全字字符分为：0，1，2，3，4，5，6，7，8，9共十类，半字字符按照上下半字组合分为：01，12，23，34，45，56，67，78，89，90共十类，图像标注后将数据标写入xml文档，标注后的图片只显示每个字符的标注框，示例用每类标签的标签名在每个标注框的右下角标识；

A2-2：将得到的xml文档转换为神经网络模型所需要的txt文档格式，每个txt文档包括每张图片中每一类数字字符的类别和每个标签的位置信息；

A2-3：将得到的txt文档按照比例分配成测试集、训练集、训练验证集、验证集四个神经网络模型所需的数据格式的TXT文档。

进一步地，所述步骤S7中水表读数规则具体为：

获取水表识别网络预测后的每个字符预测框中心点的横坐标，并将横坐标像素值按从小到大排序；

按照水表读数规则，从左向右依次获取每个水表字符预测框的标签也即该字符区域的读数，若预测框的数字字符是全字，则该数字区域的读数就是该标签；若预测框的数字字符是半字，则该数字区域的读数取该标签的第一位。

进一步地，所述步骤S7具体包括如下过程：

B1：搭建识别平台，调用图像处理函数库解析网络模型模块，解析深度学习神经网络训练后的模型参数预测实时水表数据；

B2：根据水表图像平均灰度值和信息熵，过滤水表图像中光照条件差和图像质量低的图像；

B3：因所有水表数据集的数字字符位数都在四位以上，将预测到字符位数小于四位的数据集，判断为识别错误并将错误信息反馈给客户端；预测到字符位数大于等于四位时，则通过判断预测到相邻预测框左顶点的欧氏距离来排除预测错误的水表图像；若相邻预测框的左顶点的欧氏距离大于两倍的预测到的预测框的平均宽度，则判断为预测错误；若相邻预测框的左顶点的欧氏距离小于两倍的预测到的预测框的平均宽度，则判断为预测正确，预测到的预测框；

B4：将步骤B3预测正确的水表图像中的水表读数按预测框中心坐标的横坐标值从小到大排序；全字字符的读数对应的是预测框左上角的数字，半字字符的读数对应的是预测框左上角的组合数字的第一位。

进一步地，所述步骤S8具体为：

将实时获取的水表图像转为灰度图，并求出图像的平均灰度值，将高于指定灰度值的图像定义为光照条件差，并将此信息反馈客户端；将低于指定灰度值的图像定义为曝光，并将此信息反馈给客户端。

本发明针对现有的水表识别中存在的准确率较低、对复杂的环境的适应性低、模型鲁棒性差等问题，提出一种基于深度学习的远传式水表读数识别的方法，该方法提出一种新的数据标签策略，将全字和半字分别用对应的标签标注，通过该标签策略可以有效提高半字和全字的识别准确率；本方法通过数据增强的方法模拟水表的各种安装环境和安装角度的水表数据，并将模拟得到的数据和原始数据合并后训练深度学习网络型，此方法可以有效的提高水别读数识别的准确率，并且能够适应复杂、多变水表安装环境。

有益效果：本发明与现有技术相比，通过解析客户传输数据流，解析出某水表用户某一天、某一时间的图像数据信息，通过解码水表图像信息后转换为图片，节省了图片在远程传输过程中的时间，提高了数据传输的效率；采用基于深度学习的网络模型框架，通过数据增强和增加数据集的训练手段有效提高了在复杂环境下的水表识别准确率和识别速度；本发明提出了一种提高半字字符识别准确率的方法，该方法实现过程简单，识别速度快、精度高、准确率高，可以提高半字和全字的识别准确率，提高水表识别速度，并且能够适应复杂、多变的水表安装环境。

附图说明

图1是本发明方法的流程图；

图2是本发明所提到的图像标注后的图像示例；

图3是本发明所提到的图像增强后的图像示例；

图4是本发明所提到的预测框的图像实例。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

本发明提供一种基于深度学习的远传式水表数字识别方法，如图1所示，包括如下步骤：

S1：接收传输的水表信息；

S6：根据步骤S5处理后的数据集对深度学习网络模型进行训练和测试，得到水表数字识别模型；

基于上述方法，为了实现上述方案，本发明通过在传统的字轮式机械水表上加装摄像头、电源、通讯模块等，对拍摄得到的图片，转码后保存在数据库，再将水表数据通过HTTP服务器传输给服务端HTTP服务器。服务端通过解析数据后，获取特定时间的水表图像，经水表数字识别模型识别后，获得水表读数等信息，后将水表读数通过服务器反馈给客户端，即可在无需人工抄表、拍照存储后人工读数等费时、费力的去获取水表读数等信息的情况下，实时、准确、高效的识别多变安装环境下水表读数；且水表图像拍摄装置轻便易于改造和安装，不需要对管道改造，可大规模普及应用。

本实施例中将上述方法进行实例应用，参照图1，具体包括如下步骤：

步骤1：解析通过HTTP服务器客户端远程传输的JSON格式的水表用户数据，将数据流进一步解析为水表图像，解析得到的水表图像通过人工选取大量的包含每种半字字符和全字字符的水表数据集；

本实施例中步骤1具体包括：

步骤1.1：通过HTTP服务器传输JSON格式的数据，通过解析数据流获取水表用户的表号、水表拍摄时间和水表图像信息。通过解析水表图像信息，将数据流转化为图片保存；

JSON格式内容如下所示：

通讯数据格式：JSON

单次通讯数据量：(单次通讯数据量计算获得)

通讯端口和端口号：(和客户约定)

{“图片信息”：“(Base64编码的实时图像信息)”，

“水表表号”：“XXXXX”，

“水表拍摄时间”：“X年X月X日X时X刻X分”}

步骤1.2：采集大量的数据集，为了使训练好的模型有较高识别速度和精度，每一类数字字符的个数要在500个以上；

步骤1.3：选取的全字字符如图2中图(b)所示，水表中每一位数字字符的所有特征都可以看到；选取的半字字符如图2中图(a)所示，水表中某一位或几位数字字符是由相邻的两个数字字符中一个的上半部分和另一个数字字符的下半部分组成；

步骤1.4：为了提高的模型的鲁棒性，采集图像时应在多场景、多背景下采集水表数据集，采集时相机镜头平面与水表表盘平面应要保持在±25°之内；

步骤2：预处理：

对采集后的水表图片进行人工筛选，过滤那些没有拍摄到水表字符区域或只拍到部分字符、水表字符人眼无法识别的水表图像；

步骤3：增强处理：

对人工筛选后的水表图像进行数据增强处理，用于对原始图片进行随机旋转图片和改变图片的明暗变化，增强训练的效果，提高识别的准确率；

本实施例中步骤3具体包括：

步骤3.1：由于采集的数据集有限，为了使模型适应不同的环境光照条件和日出日落对拍照环境的影响，可以通过数据增强的方式来模拟不同的光照背景，具体实施如下公式：

图像亮度降低：

G(xi,yi)＝aVr(xi,yi)+bVg(xi,yi)+cVb(xi,yi) (1)

其中a＝0.299，b＝0.587，c＝0.114；亮度调节比例为s，调节范围[0.6，0.9]，具体的亮度调整公式如下：

L(xi,yi)＝sG(xi,yi) (2)

通过上述公式遍历图像的所有像素点，将运算后的值重新赋值给对应位置；

图像亮度提高：

G(xi,yi)＝aVr(xi,yi)+bVg(xi,yi)+cVb(xi,yi) (3)

其中a＝0.299，b＝0.587，c＝0.114；亮度调节比例为s，调节范围[1.1，1.4]，具体的亮度调整公式如下：

L(xi,yi)＝sG(xi,yi) (4)

通过上述公式遍历图像的所有像素点，将运算后的值重新赋值给对应位置，本实施例中数据增强后的示例如图3所示；

步骤3.2：为了适应水表的安装角度和增强模型的鲁棒性，将原始数据集通过旋转图像处理。图像的原点一般在左上角，这样计算出来的坐标会有负值，将图像原点平移到图像中心。记原图像的中像素点的横坐标和纵坐标分别为x、y，旋转后的像素点的横坐标和纵坐标分别为x_o、y_o，旋转角度记为α，原图像宽高为src_w、src_h，旋转后图像宽高为dst_w、dst_h，旋转公式如(3)式就所示：

步骤4：通过数据增强后的水表图像按照深度学习网络模型数据格式要求制作数据集，进行数据标注、数据格式处理和数据分配；

本实施例中步骤4具体包括：

步骤4.1：为了适应神经网络的数据集格式和水表数据的特征，统一将步骤1-3得到的图片修改为320×96；

步骤4.2：将上述步骤获取的数据集用数据集标注工具进行标注，通过python脚本将标注好的数据集按深度学习神经网络格式要求分配好数据集；

本实施例中步骤4.2具体包括：

步骤4.2.1：将上述步骤得到的数据集按数字字符类型用数据集标注工具进行标注。数字类型分为全字和半字，其中全字字符分为：0，1，2，3，4，5，6，7，8，9共十类，半字字符按照上下半字组合分为：01，12，23，34，45，56，67，78，89，90共十类。标注好的数据示例如图2所示，图像标注后将数据标写入xml文档，标注后的图片只显示每个字符的标注框，示例用每类标签的标签名在每个标注框的右下角标识。

步骤4.2.2：将上述步骤得到的xml文档转换为神经网络模型所需要的txt文档格式，每个txt文档包括每张图片中每一类数字字符的类别和每个标签的位置信息；

步骤4.2.3：将上述步骤得到的txt文档按照比例分配成测试集、训练集、训练验证集、验证集四个神经网络模型所需的数据格式的TXT文档；

步骤5：将制作好的数据集数据输入到深度学习模型训练；

步骤6：用训练好的模型识别测试数据，通过分析识别结果，不断调整训练策略和数据集数量，直到达到预期的准确率；

步骤7：将步骤6的得到的模型实时识别水表图像，按照水表特征和水表读数规则读数；

本实施例中步骤7具体包括：

步骤7.1：搭建HTTP服务器，调用OpenCV函数库的DNN模块解析深度学习神经网络训练后的模型参数预测实时水表数据；

步骤7.2：根据水表图像平均灰度值和信息熵，过滤水表图像中光照条件差和图像质量低的图像；

步骤7.3：因本实施例中所有水表数据集的数字字符位数都在四位以上，将预测到字符位数小于四位的数据集判断为识别错误并将错误信息反馈给客户端；预测到字符位数大于等于四位时，则通过判断相邻预测框左顶点的欧氏距离来排除预测错误的水表图像。若相邻预测框的左顶点的欧氏距离大于两倍的预测到的预测框的平均宽度，则判断为预测错误；若相邻预测框的左顶点的欧氏距离小于两倍的预测到的预测框的平均宽度，则判断为预测正确，预测到的预测框如图3所示。

步骤7.4：将步骤7.3预测正确的水表图像中的水表读数按预测框中心坐标的横坐标值从小到大排序。全字字符的读数对应的是预测框左上角的数字，半字字符的读数对应的是预测框左上角的组合数字的第一位，如图4中(1)实例水表的最后读数为‘05458’，图4中(3)实例水表的最后读数为‘375344’；

步骤8：分析上一步实时获取的水表图像和读数结果，判断出识别错误和图像质量较差的图像，并做标注；

步骤9：将以上步骤得到的水表表号、水表拍摄时间、水表读数结果和图像的标注信息，通过HTTP服务端服务器同样以JSON格式的数据流传输给客户端服务器。

本实施例中步骤9具体包括：

步骤9.1：步骤9中所提到的JSON格式内容如下所示：

{“水表读数”：“XXXXXX”，

“水表表号”：“XXXXXX”，

“水表拍摄时间”：“X年X月X日X时X刻X分”，

“标注编号”：“具体编号内容：识别错误、图像质量等”

}。

Claims

1.一种基于深度学习的远传式水表数字识别方法，其特征在于，包括如下步骤：

S1：接收传输的水表信息；

S3：对水表图像进行预处理；

S4：对预处理后的水表图像数据进行增强处理；

2.根据权利要求1所述的一种基于深度学习的远传式水表数字识别方法，其特征在于，所述步骤S1中水表信息的传输方式为：通过加装摄像头拍摄得到水表信息图片，转码后保存在数据库，再将水表数据图片通过HTTP服务器传输给服务端HTTP服务器。

3.根据权利要求1所述的一种基于深度学习的远传式水表数字识别方法，其特征在于，所述步骤S2具体为：

解码数据，获取水表原始图像数据，并转码为图片保存。

4.根据权利要求1所述的一种基于深度学习的远传式水表数字识别方法，其特征在于，所述步骤S3具体为：

5.根据权利要求1所述的一种基于深度学习的远传式水表数字识别方法，其特征在于，所述步骤S4具体为：

6.根据权利要求1所述的一种基于深度学习的远传式水表数字识别方法，其特征在于，所述步骤S5具体包括：

7.根据权利要求6所述的一种基于深度学习的远传式水表数字识别方法，其特征在于，所述步骤A2具体为：

8.根据权利要求1所述的一种基于深度学习的远传式水表数字识别方法，其特征在于，所述步骤S7中水表读数规则具体为：

9.根据权利要求8所述的一种基于深度学习的远传式水表数字识别方法，其特征在于，所述步骤S7具体包括如下过程：

10.根据权利要求1所述的一种基于深度学习的远传式水表数字识别方法，其特征在于，所述步骤S8具体为：