CN115439861A - 一种基于ocr的水尺识别方法 - Google Patents

一种基于ocr的水尺识别方法 Download PDF

Info

Publication number
CN115439861A
CN115439861A CN202211209402.3A CN202211209402A CN115439861A CN 115439861 A CN115439861 A CN 115439861A CN 202211209402 A CN202211209402 A CN 202211209402A CN 115439861 A CN115439861 A CN 115439861A
Authority
CN
China
Prior art keywords
water gauge
water
ocr
image
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211209402.3A
Other languages
English (en)
Inventor
张家东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Csvision Technology Co ltd
Original Assignee
Beijing Csvision Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Csvision Technology Co ltd filed Critical Beijing Csvision Technology Co ltd
Priority to CN202211209402.3A priority Critical patent/CN115439861A/zh
Publication of CN115439861A publication Critical patent/CN115439861A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种基于OCR的水尺识别方法,包括如下步骤:取视频流解码获取水尺图像;根据水尺的颜色特征对彩色原图进行二值化处理;提取水尺图像中包含水尺ROI的图像,形成水尺数据集;确定水面在画面中的斜率;根据S4得到的水面的斜率,计算出水尺的角度,然后根据水尺角度旋转水尺使水尺垂直;切割出水尺每个字符获取连通域,并结合宽高和大小筛选图像中的数字。本发明采用轻量化深度学习模型Tesseract‑OCR,对水位线和刻度数字进行识别,从而识别水位线和字符之间的距离关系进而得出有效水位,能够控制误差在小数点后两位数字范围内,可以有效地避免当采用对E字符识别方法时环境对其产生的误差影响。

Description

一种基于OCR的水尺识别方法
技术领域
本发明涉及水利工程技术领域,具体来说,涉及一种基于OCR的水尺识别方法。
背景技术
在水利工程中,实时、准确地监测水位变化能够在水位变化时采取合理的水位控制措施,减少洪涝灾害的发生。水尺是测量水位变化的重要工具,通过摄像头对水尺进行实时监测是现有监测水位的主要方法之一。目前,常见的水尺刻度识别方法使用深度学习或者传统方法进行分析,在识别E字符时容易受到环境的影响,难以准确地识别出图像中水尺的刻度信息。
针对上述问题,目前还没有有效的解决办法。
为应对上述问题,本发明采用轻量化深度学习模型,对水位线和刻度数字进行识别,可以有效读取水尺读数。降低了算法的复杂度,提高了检测效率。
发明内容
针对相关技术中的上述技术问题,本发明提出一种基于OCR的水尺识别方法,能够克服现有技术的上述不足。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种基于OCR的水尺识别方法,包括如下步骤:
S1 取视频流解码获取水尺图像;
S2 根据水尺的颜色特征对彩色原图进行二值化处理;
S3 提取水尺图像中包含水尺ROI的图像,形成水尺数据集;
S4 确定水面在画面中的斜率;
S5 根据S4得到的水面的斜率,计算出水尺的角度,然后根据水尺角度旋转水尺使水尺垂直;
S6 切割出水尺每个字符获取连通域,并结合宽高和大小筛选图像中的数字;
S7 将筛选出的数字独立小图送入OCR进行检测;
S8 确定水位位置,具体实现过程如下:
S81通过数十帧OCR检测确定水尺上数字所在位置和关系,得到两个相邻数字之间的平均像素距离,再通过两个相邻数字的现实距离/平均像素距离,得到每个像素代表的实际距离;
S82 通过数十帧OCR检测确定一个稳定的数字基准点,并记录其在画面的像素高度;
S83每帧通过水尺背板颜色的参数配置,确认背板在画面中的最低像素位置;
S84每帧通过水面颜色的参数配置,确认水面在画面中的最高像素位置;
S85每帧通过水尺背板最低像素位置和水面最高像素位置综合得出水面像素位置;
S86将每帧得到的水面像素位置与基准点像素位置相减,再乘以每个像素代表的实际距离,算出实际水位读数。
进一步地,步骤S2中的所述二值化处理是将256位的灰度图、或RGB的彩色图像转换成2位的黑白图像的过程。
进一步地,步骤S3中ROI为从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域。
进一步地,步骤S7的具体实现过程如下:
S71使用Tesseract-OCR模型,识别单独字符,对特殊字符字体进行独立额外训练;
S72 对于识别的不清晰的字符单独进行数据采集和标准化后,进行模型训练;
进一步地,所述Tesseract-OCR模型识别单独字符的速度在5ms之内。
本发明的有益效果:本发明采用轻量化深度学习模型Tesseract-OCR,对水位线和刻度数字进行识别,从而识别水位线和字符之间的距离关系进而得出有效水位,能够控制误差在小数点后两位数字范围内,可以有效地避免当采用对E字符识别方法时环境对其产生的误差影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例所述的基于OCR的水尺识别方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,根据本发明实施例所述的一种基于OCR的水尺识别方法,包括如下步骤:
S1 取视频流解码获取水尺图像;
S2 根据水尺的颜色特征对彩色原图进行二值化处理;
S3 提取水尺图像中包含水尺ROI的图像,形成水尺数据集;
S4 确定水面在画面中的斜率;
S5 根据S4得到的水面的斜率,计算出水尺的角度,然后根据水尺角度旋转水尺使水尺垂直;
S6 切割出水尺每个字符获取连通域,并结合宽高和大小筛选图像中的数字;
S7 将筛选出的数字独立小图送入OCR进行检测;
S8 确定水位位置,具体实现过程如下:
S81通过数十帧OCR检测确定水尺上数字所在位置和关系,得到两个相邻数字之间的平均像素距离,再通过两个相邻数字的现实距离/平均像素距离,得到每个像素代表的实际距离;
S82 通过数十帧OCR检测确定一个稳定的数字基准点,并记录其在画面的像素高度;
S83每帧通过水尺背板颜色的参数配置,确认背板在画面中的最低像素位置;
S84每帧通过水面颜色的参数配置,确认水面在画面中的最高像素位置;
S85每帧通过水尺背板最低像素位置和水面最高像素位置综合得出水面像素位置;
S86将每帧得到的水面像素位置与基准点像素位置相减,再乘以每个像素代表的实际距离,算出实际水位读数。
实施例中,步骤S2中的所述二值化处理是将256位的灰度图、或RGB的彩色图像转换成2位的黑白图像的过程。
实施例中,步骤S3中ROI为从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域。
实施例中,步骤S7的具体实现过程如下:
S71使用Tesseract-OCR模型,识别单独字符,对特殊字符字体进行独立额外训练;
S72 对于识别的不清晰的字符单独进行数据采集和标准化后,进行模型训练;
实施例中,所述Tesseract-OCR模型识别单独字符的速度在5ms之内。
为了方便理解本发明的上述技术方案,以下通过具体使用方式上对本发明的上述技术方案进行详细说明。
在具体使用时,根据本发明所述的一种基于水尺字符检测识别的水位识别方法,包括以下实现步骤:
步骤一,取视频流解码获取水尺图像;
步骤二,根据水尺的颜色特征对彩色原图中进行二值化处理;
步骤三,提取水尺图像中包含水尺ROI的图像,形成水尺数据集;
步骤四,确定水面在画面中的斜率;
步骤五,根据步骤四得到的水面的斜率,计算出水尺的角度,然后根据水尺角度,旋转水尺,使之垂直;
步骤六,切割出水尺每个字符,获取连通域,加以宽高和大小筛选图像中的数字。
步骤七,将筛选出的数字独立小图送入OCR进行检测。优点是OCR的检测目标明确,仅识别一个数字。运用场景需要数字清晰,与背景板差异大,不与其它字符连通,具体实现过程如下;
步骤七一,选用Tesseract-OCR模型,部署简单,准确度高,识别单独字符的速度在5ms之内,无需独立计算卡,对特殊字符字体可以独立额外训练;
步骤七二,对于识别不清晰的字符单独进行数据采集和标准化,进行模型训练;
步骤八,确定水位位置,具体实现过程如下:
步骤八一,通过数十帧OCR检测确定水尺上数字所在位置和关系,得到两个相邻数字之间的平均像素距离,再通过两个相邻数字的现实距离/平均像素距离,得到每个像素代表实际距离;
步骤八二,通过数十帧OCR检测确定一个稳定的数字基准点,并记录其在画面的像素高度;
步骤八三,每帧通过水尺背板颜色的参数配置,确认背板在画面中的最低像素位置;
步骤八四,每帧通过水面颜色的参数配置,确认水面在画面中的最高像素位置;
步骤八五,每帧通过水尺背板最低像素和水面最高像素综合得出水面像素位置;
步骤八六,将每帧得到的水面像素位置和基准点像素位置相减,再乘以每个像素代表的实际距离,算出实际水位读数。
综上所述,借助于本发明的上述技术方案,采用轻量化深度学习模型Tesseract-OCR,对水位线和刻度数字进行识别,从而识别水位线和字符之间的距离关系进而得出有效水位,能够控制误差在小数点后两位数字范围内,可以有效地避免当采用对E字符识别方法时环境对其产生的误差影响。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于OCR的水尺识别方法,其特征在于,包括如下步骤:
S1 取视频流解码获取水尺图像;
S2 根据水尺的颜色特征对彩色原图进行二值化处理;
S3 提取水尺图像中包含水尺ROI的图像,形成水尺数据集;
S4 确定水面在画面中的斜率;
S5 根据S4得到的水面的斜率,计算出水尺的角度,然后根据水尺角度旋转水尺使水尺垂直;
S6 切割出水尺每个字符获取连通域,并结合宽高和大小筛选图像中的数字;
S7 将筛选出的数字独立小图送入OCR进行检测;
S8 确定水位位置,具体实现过程如下:
S81通过数十帧OCR检测确定水尺上数字所在位置和关系,得到两个相邻数字之间的平均像素距离,再通过两个相邻数字的现实距离/平均像素距离,得到每个像素代表的实际距离;
S82 通过数十帧OCR检测确定一个稳定的数字基准点,并记录其在画面的像素高度;
S83每帧通过水尺背板颜色的参数配置,确认背板在画面中的最低像素位置;
S84每帧通过水面颜色的参数配置,确认水面在画面中的最高像素位置;
S85每帧通过水尺背板最低像素位置和水面最高像素位置综合得出水面像素位置;
S86将每帧得到的水面像素位置与基准点像素位置相减,再乘以每个像素代表的实际距离,算出实际水位读数。
2.根据权利要求1所述的基于OCR的水尺识别方法,其特征在于,步骤S2中的所述二值化处理是将256位的灰度图、或RGB的彩色图像转换成2位的黑白图像的过程。
3.根据权利要求1所述的基于OCR的水尺识别方法,其特征在于,步骤S3中ROI为从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域。
4.根据权利要求1所述的基于OCR的水尺识别方法,其特征在于,步骤S7的具体实现过程如下:
S71使用Tesseract-OCR模型,识别单独字符,对特殊字符字体进行独立额外训练;
S72 对于识别的不清晰的字符单独进行数据采集和标准化后,进行模型训练。
5.根据权利要求4所述的基于OCR的水尺识别方法,其特征在于,所述Tesseract-OCR模型识别单独字符的速度在5ms之内。
CN202211209402.3A 2022-09-30 2022-09-30 一种基于ocr的水尺识别方法 Pending CN115439861A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211209402.3A CN115439861A (zh) 2022-09-30 2022-09-30 一种基于ocr的水尺识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211209402.3A CN115439861A (zh) 2022-09-30 2022-09-30 一种基于ocr的水尺识别方法

Publications (1)

Publication Number Publication Date
CN115439861A true CN115439861A (zh) 2022-12-06

Family

ID=84251017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211209402.3A Pending CN115439861A (zh) 2022-09-30 2022-09-30 一种基于ocr的水尺识别方法

Country Status (1)

Country Link
CN (1) CN115439861A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751187A (zh) * 2015-04-14 2015-07-01 山西科达自控股份有限公司 抄表图像自动识别方法
CN107367310A (zh) * 2017-07-11 2017-11-21 华南理工大学 一种基于计算机视觉的河流水位远程监测方法
US20180204360A1 (en) * 2017-01-13 2018-07-19 International Business Machines Corporation Automatic data extraction from a digital image
CN108921165A (zh) * 2018-06-21 2018-11-30 江苏南水水务科技有限公司 基于水尺图像的水位识别方法
CN109376740A (zh) * 2018-10-19 2019-02-22 天津天地伟业投资管理有限公司 一种基于视频的水尺读数检测方法
CN111476120A (zh) * 2020-03-26 2020-07-31 长江大学 一种无人机智能船舶水尺识别方法及装置
CN113239932A (zh) * 2021-05-21 2021-08-10 西安建筑科技大学 一种基于Tesseract-OCR的飞机主显示器PFD中空速标尺的识别方法
CN113971779A (zh) * 2021-10-29 2022-01-25 中国水利水电科学研究院 一种基于深度学习的水尺自动读数方法
CN114067095A (zh) * 2021-11-29 2022-02-18 黄河勘测规划设计研究院有限公司 基于水尺字符检测识别的水位识别方法
CN114359538A (zh) * 2022-01-04 2022-04-15 重庆邮电大学 一种水表读数定位与识别方法
CN114627461A (zh) * 2022-03-08 2022-06-14 长江水利委员会长江科学院 一种基于人工智能高精度识别水尺数据的方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751187A (zh) * 2015-04-14 2015-07-01 山西科达自控股份有限公司 抄表图像自动识别方法
US20180204360A1 (en) * 2017-01-13 2018-07-19 International Business Machines Corporation Automatic data extraction from a digital image
CN107367310A (zh) * 2017-07-11 2017-11-21 华南理工大学 一种基于计算机视觉的河流水位远程监测方法
CN108921165A (zh) * 2018-06-21 2018-11-30 江苏南水水务科技有限公司 基于水尺图像的水位识别方法
CN109376740A (zh) * 2018-10-19 2019-02-22 天津天地伟业投资管理有限公司 一种基于视频的水尺读数检测方法
CN111476120A (zh) * 2020-03-26 2020-07-31 长江大学 一种无人机智能船舶水尺识别方法及装置
CN113239932A (zh) * 2021-05-21 2021-08-10 西安建筑科技大学 一种基于Tesseract-OCR的飞机主显示器PFD中空速标尺的识别方法
CN113971779A (zh) * 2021-10-29 2022-01-25 中国水利水电科学研究院 一种基于深度学习的水尺自动读数方法
CN114067095A (zh) * 2021-11-29 2022-02-18 黄河勘测规划设计研究院有限公司 基于水尺字符检测识别的水位识别方法
CN114359538A (zh) * 2022-01-04 2022-04-15 重庆邮电大学 一种水表读数定位与识别方法
CN114627461A (zh) * 2022-03-08 2022-06-14 长江水利委员会长江科学院 一种基于人工智能高精度识别水尺数据的方法及系统

Similar Documents

Publication Publication Date Title
CN106529537B (zh) 一种数字仪表读数图像识别方法
CN102663360B (zh) 一种钢铁板坯编码自动识别方法以及钢铁板坯跟踪系统
CN113971779B (zh) 一种基于深度学习的水尺自动读数方法
US10311322B2 (en) Character information recognition method based on image processing
CN108596166A (zh) 一种基于卷积神经网络分类的集装箱箱号识别方法
CN110598693A (zh) 一种基于Faster-RCNN的船牌识别方法
CN112307919B (zh) 一种基于改进YOLOv3的单证图像中数字信息区域识别方法
CN106251333B (zh) 元件反件检测方法和系统
CN110909640A (zh) 水位线的确定方法及装置、存储介质、电子装置
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN111260645B (zh) 基于分块分类深度学习的篡改图像检测方法及系统
CN111539330A (zh) 一种基于双svm多分类器的变电站数显仪表识别方法
CN101697196A (zh) 摄像机铭牌序列号数字识别系统及方法
CN109271868B (zh) 基于密集连接卷积网络超球体嵌入的目标重识别方法
CN116704516B (zh) 一种用于水溶肥料包装的视觉检测方法
CN108709500B (zh) 一种电路板元件定位匹配方法
CN112348018A (zh) 基于巡检机器人的数显式仪表读数识别方法
CN114782770A (zh) 一种基于深度学习的车牌检测与车牌识别方法及系统
CN114241469A (zh) 一种面向电表轮换过程的信息识别方法和装置
CN113506276A (zh) 一种测量结构位移的标志物及方法
CN113538585A (zh) 基于无人机的高精度多目标智能识别定位追踪方法及系统
CN114529821A (zh) 一种基于机器视觉的海上风电安全监测与预警方法
CN116259008A (zh) 一种基于计算机视觉的水位实时监测方法
CN116993985A (zh) 一种基于CLIP实现Zero-Shot自动分割安全带的方法
CN115082922A (zh) 基于深度学习的水表数字图片处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20221206

RJ01 Rejection of invention patent application after publication