CN115439861A

CN115439861A - 一种基于ocr的水尺识别方法

Info

Publication number: CN115439861A
Application number: CN202211209402.3A
Authority: CN
Inventors: 张家东
Original assignee: Beijing Csvision Technology Co ltd
Current assignee: Beijing Csvision Technology Co ltd
Priority date: 2022-09-30
Filing date: 2022-09-30
Publication date: 2022-12-06

Abstract

本发明公开了一种基于OCR的水尺识别方法，包括如下步骤：取视频流解码获取水尺图像；根据水尺的颜色特征对彩色原图进行二值化处理；提取水尺图像中包含水尺ROI的图像，形成水尺数据集；确定水面在画面中的斜率；根据S4得到的水面的斜率，计算出水尺的角度，然后根据水尺角度旋转水尺使水尺垂直；切割出水尺每个字符获取连通域，并结合宽高和大小筛选图像中的数字。本发明采用轻量化深度学习模型Tesseract‑OCR，对水位线和刻度数字进行识别，从而识别水位线和字符之间的距离关系进而得出有效水位，能够控制误差在小数点后两位数字范围内，可以有效地避免当采用对E字符识别方法时环境对其产生的误差影响。

Description

一种基于OCR的水尺识别方法

技术领域

本发明涉及水利工程技术领域，具体来说，涉及一种基于OCR的水尺识别方法。

背景技术

在水利工程中，实时、准确地监测水位变化能够在水位变化时采取合理的水位控制措施，减少洪涝灾害的发生。水尺是测量水位变化的重要工具，通过摄像头对水尺进行实时监测是现有监测水位的主要方法之一。目前，常见的水尺刻度识别方法使用深度学习或者传统方法进行分析，在识别E字符时容易受到环境的影响，难以准确地识别出图像中水尺的刻度信息。

针对上述问题，目前还没有有效的解决办法。

为应对上述问题，本发明采用轻量化深度学习模型，对水位线和刻度数字进行识别，可以有效读取水尺读数。降低了算法的复杂度，提高了检测效率。

发明内容

针对相关技术中的上述技术问题，本发明提出一种基于OCR的水尺识别方法，能够克服现有技术的上述不足。

为实现上述技术目的，本发明的技术方案是这样实现的：

一种基于OCR的水尺识别方法，包括如下步骤：

S1 取视频流解码获取水尺图像；

S2 根据水尺的颜色特征对彩色原图进行二值化处理；

S3 提取水尺图像中包含水尺ROI的图像，形成水尺数据集；

S4 确定水面在画面中的斜率；

S5 根据S4得到的水面的斜率，计算出水尺的角度，然后根据水尺角度旋转水尺使水尺垂直；

S6 切割出水尺每个字符获取连通域，并结合宽高和大小筛选图像中的数字；

S7 将筛选出的数字独立小图送入OCR进行检测；

S8 确定水位位置，具体实现过程如下：

S81通过数十帧OCR检测确定水尺上数字所在位置和关系，得到两个相邻数字之间的平均像素距离，再通过两个相邻数字的现实距离/平均像素距离，得到每个像素代表的实际距离；

S82 通过数十帧OCR检测确定一个稳定的数字基准点，并记录其在画面的像素高度；

S83每帧通过水尺背板颜色的参数配置，确认背板在画面中的最低像素位置；

S84每帧通过水面颜色的参数配置，确认水面在画面中的最高像素位置；

S85每帧通过水尺背板最低像素位置和水面最高像素位置综合得出水面像素位置；

S86将每帧得到的水面像素位置与基准点像素位置相减，再乘以每个像素代表的实际距离，算出实际水位读数。

进一步地，步骤S2中的所述二值化处理是将256位的灰度图、或RGB的彩色图像转换成2位的黑白图像的过程。

进一步地，步骤S3中ROI为从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域。

进一步地，步骤S7的具体实现过程如下：

S71使用Tesseract-OCR模型，识别单独字符，对特殊字符字体进行独立额外训练；

S72 对于识别的不清晰的字符单独进行数据采集和标准化后，进行模型训练；

进一步地，所述Tesseract-OCR模型识别单独字符的速度在5ms之内。

本发明的有益效果：本发明采用轻量化深度学习模型Tesseract-OCR，对水位线和刻度数字进行识别，从而识别水位线和字符之间的距离关系进而得出有效水位，能够控制误差在小数点后两位数字范围内，可以有效地避免当采用对E字符识别方法时环境对其产生的误差影响。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例所述的基于OCR的水尺识别方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，根据本发明实施例所述的一种基于OCR的水尺识别方法，包括如下步骤：

S1 取视频流解码获取水尺图像；

S2 根据水尺的颜色特征对彩色原图进行二值化处理；

S3 提取水尺图像中包含水尺ROI的图像，形成水尺数据集；

S4 确定水面在画面中的斜率；

S7 将筛选出的数字独立小图送入OCR进行检测；

S8 确定水位位置，具体实现过程如下：

实施例中，步骤S2中的所述二值化处理是将256位的灰度图、或RGB的彩色图像转换成2位的黑白图像的过程。

实施例中，步骤S3中ROI为从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域。

实施例中，步骤S7的具体实现过程如下：

实施例中，所述Tesseract-OCR模型识别单独字符的速度在5ms之内。

为了方便理解本发明的上述技术方案，以下通过具体使用方式上对本发明的上述技术方案进行详细说明。

在具体使用时，根据本发明所述的一种基于水尺字符检测识别的水位识别方法，包括以下实现步骤：

步骤一，取视频流解码获取水尺图像；

步骤二，根据水尺的颜色特征对彩色原图中进行二值化处理；

步骤三，提取水尺图像中包含水尺ROI的图像，形成水尺数据集；

步骤四，确定水面在画面中的斜率；

步骤五，根据步骤四得到的水面的斜率，计算出水尺的角度，然后根据水尺角度，旋转水尺，使之垂直；

步骤六，切割出水尺每个字符，获取连通域，加以宽高和大小筛选图像中的数字。

步骤七，将筛选出的数字独立小图送入OCR进行检测。优点是OCR的检测目标明确，仅识别一个数字。运用场景需要数字清晰，与背景板差异大，不与其它字符连通，具体实现过程如下；

步骤七一，选用Tesseract-OCR模型，部署简单，准确度高，识别单独字符的速度在5ms之内，无需独立计算卡，对特殊字符字体可以独立额外训练；

步骤七二，对于识别不清晰的字符单独进行数据采集和标准化，进行模型训练；

步骤八，确定水位位置，具体实现过程如下：

步骤八一，通过数十帧OCR检测确定水尺上数字所在位置和关系，得到两个相邻数字之间的平均像素距离，再通过两个相邻数字的现实距离/平均像素距离，得到每个像素代表实际距离；

步骤八二，通过数十帧OCR检测确定一个稳定的数字基准点，并记录其在画面的像素高度；

步骤八三，每帧通过水尺背板颜色的参数配置，确认背板在画面中的最低像素位置；

步骤八四，每帧通过水面颜色的参数配置，确认水面在画面中的最高像素位置；

步骤八五，每帧通过水尺背板最低像素和水面最高像素综合得出水面像素位置;

步骤八六，将每帧得到的水面像素位置和基准点像素位置相减，再乘以每个像素代表的实际距离，算出实际水位读数。

综上所述，借助于本发明的上述技术方案，采用轻量化深度学习模型Tesseract-OCR，对水位线和刻度数字进行识别，从而识别水位线和字符之间的距离关系进而得出有效水位，能够控制误差在小数点后两位数字范围内，可以有效地避免当采用对E字符识别方法时环境对其产生的误差影响。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于OCR的水尺识别方法，其特征在于，包括如下步骤：

S1 取视频流解码获取水尺图像；

S2 根据水尺的颜色特征对彩色原图进行二值化处理；

S3 提取水尺图像中包含水尺ROI的图像，形成水尺数据集；

S4 确定水面在画面中的斜率；

S7 将筛选出的数字独立小图送入OCR进行检测；

S8 确定水位位置，具体实现过程如下：

2.根据权利要求1所述的基于OCR的水尺识别方法，其特征在于，步骤S2中的所述二值化处理是将256位的灰度图、或RGB的彩色图像转换成2位的黑白图像的过程。

3.根据权利要求1所述的基于OCR的水尺识别方法，其特征在于，步骤S3中ROI为从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域。

4.根据权利要求1所述的基于OCR的水尺识别方法，其特征在于，步骤S7的具体实现过程如下：

S72 对于识别的不清晰的字符单独进行数据采集和标准化后，进行模型训练。

5.根据权利要求4所述的基于OCR的水尺识别方法，其特征在于，所述Tesseract-OCR模型识别单独字符的速度在5ms之内。