CN110287963B - 用于综合性能试验的ocr识别方法 - Google Patents

用于综合性能试验的ocr识别方法 Download PDF

Info

Publication number
CN110287963B
CN110287963B CN201910501843.2A CN201910501843A CN110287963B CN 110287963 B CN110287963 B CN 110287963B CN 201910501843 A CN201910501843 A CN 201910501843A CN 110287963 B CN110287963 B CN 110287963B
Authority
CN
China
Prior art keywords
picture
training
value
recognition
digital
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910501843.2A
Other languages
English (en)
Other versions
CN110287963A (zh
Inventor
王国举
刘慧林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Jiuwu Intelligent Technology Co ltd
Original Assignee
Suzhou Jiuwu Interchange Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Jiuwu Interchange Intelligent Technology Co ltd filed Critical Suzhou Jiuwu Interchange Intelligent Technology Co ltd
Priority to CN201910501843.2A priority Critical patent/CN110287963B/zh
Publication of CN110287963A publication Critical patent/CN110287963A/zh
Priority to PCT/CN2019/119451 priority patent/WO2020248513A1/zh
Application granted granted Critical
Publication of CN110287963B publication Critical patent/CN110287963B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图像识别领域,涉及一种用于综合性能试验的OCR识别方法。本发明时基于动态范围HSV、RGB六通道的颜色分割方法提取待识别文字,通过朴素贝叶斯分类器进行OCR快速训练与识别,识别特定区域环境中的屏幕上的文字,实现数字快速的分类和识别,识别准确率达到99%以上,识别速率为0.2‑0.3s/fps,其运行速度以及准确率相比传统的基于神经网络方法更快、更准确;不需要太高的硬件来支撑既可以达到较好的分类结果,极大地降低了硬件成本。

Description

用于综合性能试验的OCR识别方法
技术领域
本发明涉及图像识别领域,涉及一种用于综合性能试验的OCR识别方法。
背景技术
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
目前主流的OCR都是基于卷积神经网路(CNN)的方法来实现的,如CNN+RNN+CTC、CNN+RNN基于Attention的方法等,目前主要的方法虽然准确率很高,理论上经过训练可以实现任意文字的识别。但是基于神经网络的算法都需要较高的硬件配置,需要GPU的加速,并且实时性较差。
目前开源的OCR项目有tesseract(离线)、百度OCR API(在线)等,虽然他们通用型挺好,但是特定环境(显示器上文字)中的识别率还是很低,针对性不强,而且实时性也很差,基本是在1s以上,而且网络API弱申请次数太多还存在网络不稳定等情况,对于工业上的识别要求还有一段距离。
发明内容
本发明要解决的技术问题是提供一种在识别特定区域环境中的屏幕上的文字,实现数字快速的分类和识别的用于综合性能试验的OCR识别方法。
为了解决上述技术问题,本发明解决其技术问题所采用的技术方案是:
一种用于综合性能试验的OCR识别方法,具体步骤包括:
S1、获取图像信息,通过采用RGB与HSV六通道范围提取数字区域轮廓并对带有数字的图片进行分割处理,得到待识别图片数据集;
S2、将待识别图片数据集进行预处理后得到数字样本作为训练集,将训练集输入朴素贝叶斯分类器中训练,得到每个数字训练好的训练模型;
S3、将待识别图片数据集输入搭建好的训练模型,将训练模型输出的数字与每个数字训练模型做对比,概率最大的即为识别的最终数字。
优选的,步骤S2中,对待识别图片数据集预处理具体为:对待识别图片数据集进行裁剪后统一大小与格式,然后将图片灰度处理并二值化,使得每张图片的长宽一致,且每个像素值都为0或者255。
优选的,步骤S1中,对带有数字的图片进行分割处理具体为:通过设定RGB与HSV的阈值,通过形态学方法粗提取数字区域轮廓,再筛选出具有文字区域的图片,并分割带有数字的图片,分类排序后得到待识别图片数据集。
优选的,步骤S2中,将训练集输入朴素贝叶斯分类器中训练,通过训练集数据由发生频率总结出概率,得到每个数字的计算模型:
Figure BDA0002090495550000021
其中Mi为数字值为i的数学模型,Ni_jk为数值为i的数字在像素坐标为j的值上像素值为k的训练图片个数,Ni总为数字值为i的总训练图片个数。
优选的,步骤S1中,对获取的图像,计算其当前帧与上一帧间的对应像素值变化,检测当前帧与上一帧间的变化区域,并对动态区域的数值进行提取。
优选的,检测当前帧与上一帧间的变化区域,对当前帧的下两帧不进行识别处理,对第三帧图片通过RGB与HSV的阈值判定,小于阈值,则该图像作为待识别图片;反之,则该图像不作为待识别图片。
优选的,获取S1中未识别图像以及训练模型输出的数字判断异常值,对异常值进行存储,并将未识别图像以及数字异常值通过互联网报警信息发出。
本发明的有益效果:
本发明时基于动态范围HSV、RGB六通道的颜色分割方法提取待识别文字,通过朴素贝叶斯分类器进行OCR快速训练与识别,识别特定区域环境中的屏幕上的文字,实现数字快速的分类和识别,识别准确率达到99%以上,识别速率为0.2-0.3s/fps,其运行速度以及准确率相比传统的基于神经网络方法更快、更准确;不需要太高的硬件来支撑既可以达到较好的分类结果,极大地降低了硬件成本。
附图说明
图1是本发明的硬件结构示意图。
图2是本发明的OCR识别流程图。
图3是本发明的OCR识别流程示意图。
图4是本发明的数字提取流程图。
图5是本发明的按需分配流程图。
图6是本发明的帧间差分流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
参照图1-6所示,本发明用于实现OCR识别方法的硬件包括USB摄像头、PC机电脑、网络交换机与稳压直流电源等,USB摄像头与PC机电脑通讯连接,PC机电脑与交换机通讯连接,交换机连接互联网或者局域网。
本发明的应用环境是识别液晶显示器上的电压和电流信息,在7寸的屏幕上以1Hz的刷新率刷新屏幕上的电压电流,具体利用一台PC机电脑、五个USB摄像头识别10块屏幕,40个设备的电压电流信息。
本发明主要数据分析工具
Python(常用包:OpenCV,numpy,matplotlib等等)
C++(常用包:opencv等)
一种用于综合性能试验的OCR识别方法,具体步骤包括:
S1、获取图像信息,通过采用RGB与HSV六通道范围提取数字区域轮廓并对带有数字的图片进行分割处理,得到待识别图片数据集;
S2、将待识别图片数据集进行预处理后得到数字样本作为训练集,将训练集输入朴素贝叶斯分类器中训练,得到每个数字训练好的训练模型;
S3、将待识别图片数据集输入搭建好的训练模型,将训练模型输出的数字与每个数字训练模型做对比,概率最大的即为识别的最终数字。
本发明时基于动态范围HSV、RGB六通道的颜色分割方法提取待识别文字,通过朴素贝叶斯分类器进行OCR快速训练与识别,识别特定区域环境中的屏幕上的文字,实现数字快速的分类和识别,识别准确率达到99%以上,识别速率为0.2-0.3s/fps,其运行速度以及准确率相比传统的基于神经网络方法更快、更准确;不需要太高的硬件来支撑既可以达到较好的分类结果,极大地降低了硬件成本。
步骤S2中,对待识别图片数据集预处理具体为:对待识别图片数据集进行裁剪后统一大小与格式,然后将图片灰度处理并二值化,使得每张图片的长宽一致,且每个像素值都为0或者255。
步骤S1中,对带有数字的图片进行分割处理具体为:通过设定RGB与HSV的阈值,通过形态学方法粗提取数字区域轮廓,再筛选出具有文字区域的图片,并分割带有数字的图片,分类排序后得到待识别图片数据集。
首先在待识别环境中,利用项目相同的USB摄像头利用上述方法分割图片采集大量的数字数据,并分割保存,可用于模型学习字体;采集的数据大致为0到9数字各一万张。
步骤S2中,将训练集输入朴素贝叶斯分类器中训练,
朴素贝叶斯的原理:
假设各个条件是独立的,例如X和Y是相互独立的,那么:
P(X,Y)=P(X)P(Y)
条件概率的公式如下:
P(Y|X)=P(X,Y)/P(X)
P(X|Y)=P(X,Y)/P(Y)
全概率的公式:
Figure BDA0002090495550000051
其中,
Figure BDA0002090495550000052
贝叶斯公式:
Figure BDA0002090495550000053
通过电压电流数字的训练,也就是0到9十个数字,得到相应的灰度图模型,通过训练集数据由发生频率总结出概率,得到每个数字的计算模型:
Figure BDA0002090495550000054
其中Mi为数字值为i的数学模型,Ni_jk为数值为i的数字在像素坐标(一维化后)为j的值上像素值为k的训练图片个数,Ni总为数字值为i的总训练图片个数。
步骤S1中,对获取的图像,计算其当前帧与上一帧间的对应像素值变化,检测当前帧与上一帧间的变化区域,并对动态区域的数值进行提取。
上述方法为“按需分配的方法”,即合理的分配了多个摄像头获取图像数据之间处理中电脑计算资源的占用,使得多USB摄像头同时识别图片数据。
检测当前帧与上一帧间的变化区域,对当前帧的下两帧不进行识别处理,对第三帧图片通过RGB与HSV的阈值判定,小于阈值,则该图像作为待识别图片;反之,则该图像不作为待识别图片。
由于液晶屏的显示原理限制,在液晶屏刷新时会有残留的影像存在(液晶屏的延迟性),会干扰识别,针对这一现象,通过上述隔帧检测与阈值判断(帧间差分),修正由于液晶屏延时性产生的残影误差,保证识别的准确性。
获取S1中未识别图像以及训练模型输出的数字判断异常值,对异常值进行存储,并将未识别图像以及数字异常值通过互联网报警信息发出。
对未识别图像以及识别区域异常值的判断与处理,通过互联网的报警系统及时发出,保证系统正常运行。
本发明利用帧间差分与模式学习等方法来优化算法与异常值的判断。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims (1)

1.一种用于综合性能试验的OCR识别方法,用于识别液晶显示器上的电压和电流信息,其特征在于,具体步骤包括:
S1、同时获取多摄像头的图像信息,对获取的图像,计算其当前帧与上一帧间的对应像素值变化,检测当前帧与上一帧间的变化区域,并对动态区域的数值进行提取;其中,检测当前帧与上一帧间的变化区域,对当前帧的下两帧不进行识别处理,对第三帧图片通过RGB与HSV的阈值判定,小于阈值,则该图像作为待识别图片;反之,则该图像不作为待识别图片;
通过采用RGB与HSV六通道范围提取数字区域轮廓并对带有数字的图片进行分割处理,得到待识别图片数据集;对带有数字的图片进行分割处理具体为:通过设定RGB与HSV的阈值,通过形态学方法粗提取数字区域轮廓,再筛选出具有文字区域的图片,并分割带有数字的图片,分类排序后得到待识别图片数据集;
S2、将待识别图片数据集进行预处理后得到数字样本作为训练集,将训练集输入朴素贝叶斯分类器中训练,得到每个数字训练好的训练模型;对待识别图片数据集预处理具体为:对待识别图片数据集进行裁剪后统一大小与格式,然后将图片灰度处理并二值化,使得每张图片的长宽一致,且每个像素值都为0或者255;其中,将训练集输入朴素贝叶斯分类器中训练,通过训练集数据由发生频率总结出概率,得到每个数字的计算模型:
Figure FDA0003254347660000011
其中Mi为数字值为i的数学模型,Ni_jk为数值为i的数字在像素坐标为j的值上像素值为k的训练图片个数,Ni总为数字值为i的总训练图片个数;pixel_num为一帧图像中的像素总数;∏为连乘;
S3、将待识别图片数据集输入搭建好的训练模型,将训练模型输出的数字与每个数字训练模型做对比,概率最大的即为识别的最终数字;
还包括,获取S1中未识别图像以及训练模型输出的数字判断异常值,对异常值进行存储,并将未识别图像以及数字异常值通过互联网报警信息发出。
CN201910501843.2A 2019-06-11 2019-06-11 用于综合性能试验的ocr识别方法 Active CN110287963B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910501843.2A CN110287963B (zh) 2019-06-11 2019-06-11 用于综合性能试验的ocr识别方法
PCT/CN2019/119451 WO2020248513A1 (zh) 2019-06-11 2019-11-19 用于综合性能试验的ocr识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910501843.2A CN110287963B (zh) 2019-06-11 2019-06-11 用于综合性能试验的ocr识别方法

Publications (2)

Publication Number Publication Date
CN110287963A CN110287963A (zh) 2019-09-27
CN110287963B true CN110287963B (zh) 2021-11-23

Family

ID=68003639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910501843.2A Active CN110287963B (zh) 2019-06-11 2019-06-11 用于综合性能试验的ocr识别方法

Country Status (2)

Country Link
CN (1) CN110287963B (zh)
WO (1) WO2020248513A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287963B (zh) * 2019-06-11 2021-11-23 苏州玖物互通智能科技有限公司 用于综合性能试验的ocr识别方法
CN112287936A (zh) * 2020-09-24 2021-01-29 深圳市智影医疗科技有限公司 光学字符识别测试方法、装置、可读存储介质及终端设备
CN112257629A (zh) * 2020-10-29 2021-01-22 广联达科技股份有限公司 一种建筑图纸的文本信息识别方法及装置
CN113159086B (zh) * 2020-12-31 2024-04-30 南京太司德智能电气有限公司 一种高效的电力信号描述模型训练方法
CN113239932A (zh) * 2021-05-21 2021-08-10 西安建筑科技大学 一种基于Tesseract-OCR的飞机主显示器PFD中空速标尺的识别方法
CN113420170B (zh) * 2021-07-15 2023-04-14 宜宾中星技术智能系统有限公司 大数据图像的多线程存储方法、装置、设备和介质
CN113591066A (zh) * 2021-07-23 2021-11-02 广州绿怡信息科技有限公司 设备身份识别方法及装置
CN114778339B (zh) * 2022-04-11 2022-11-25 江苏鼎盛检测中心有限公司 一种基于大数据的可降低误差的高低温耐久测试分析方法
CN115063800B (zh) * 2022-08-16 2022-11-29 阿里巴巴(中国)有限公司 文本识别方法和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104966107A (zh) * 2015-07-10 2015-10-07 安徽清新互联信息科技有限公司 一种基于机器学习的信用卡卡号识别方法
CN106228157A (zh) * 2016-07-26 2016-12-14 江苏鸿信系统集成有限公司 基于图像识别技术的彩色图像文字段落分割与识别方法
CN108090489A (zh) * 2018-01-15 2018-05-29 兰州理工大学 基于计算机的依据字素分割的脱机手写维文单词识别方法
CN109344820A (zh) * 2018-08-06 2019-02-15 北京邮电大学 基于计算机视觉和深度学习的数字式电表读数识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007052171A2 (en) * 2005-09-01 2007-05-10 Zvi Haim Lev System and method for reliable content access using a cellular/wireless device with imaging capabilities
CN104866524A (zh) * 2015-04-10 2015-08-26 大连交通大学 一种商品图像精细分类方法
CN109598265B (zh) * 2017-09-30 2021-09-28 顺丰科技有限公司 一种文字识别方法、系统、设备、计算机可读存储介质
CN110287963B (zh) * 2019-06-11 2021-11-23 苏州玖物互通智能科技有限公司 用于综合性能试验的ocr识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104966107A (zh) * 2015-07-10 2015-10-07 安徽清新互联信息科技有限公司 一种基于机器学习的信用卡卡号识别方法
CN106228157A (zh) * 2016-07-26 2016-12-14 江苏鸿信系统集成有限公司 基于图像识别技术的彩色图像文字段落分割与识别方法
CN108090489A (zh) * 2018-01-15 2018-05-29 兰州理工大学 基于计算机的依据字素分割的脱机手写维文单词识别方法
CN109344820A (zh) * 2018-08-06 2019-02-15 北京邮电大学 基于计算机视觉和深度学习的数字式电表读数识别方法

Also Published As

Publication number Publication date
WO2020248513A1 (zh) 2020-12-17
CN110287963A (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
CN110287963B (zh) 用于综合性能试验的ocr识别方法
EP3309703B1 (en) Method and system for decoding qr code based on weighted average grey method
CN109241985B (zh) 一种图像识别方法及装置
CN106682629B (zh) 一种复杂背景下身份证号识别算法
CN112669344B (zh) 一种运动物体的定位方法、装置、电子设备及存储介质
CN104700092B (zh) 一种基于模板和特征匹配相结合的小字符数字识别方法
US9576210B1 (en) Sharpness-based frame selection for OCR
CN111860439A (zh) 一种无人机巡检图像缺陷检测方法、系统及设备
US9418316B1 (en) Sharpness-based frame selection for OCR
US20140301608A1 (en) Chemical structure recognition tool
CN109886978B (zh) 一种基于深度学习的端到端告警信息识别方法
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN110096945B (zh) 基于机器学习的室内监控视频关键帧实时提取方法
CN112561879B (zh) 模糊度评价模型训练方法、图像模糊度评价方法及装置
CN114972246A (zh) 一种基于深度学习的模切产品表面缺陷检测方法
US10115028B2 (en) Method and device for classifying an object in an image
Wu et al. Video surveillance object recognition based on shape and color features
WO2022121021A1 (zh) 一种身份证号码检测方法、装置、可读存储介质和终端
CN113221812A (zh) 人脸关键点检测模型的训练方法和人脸关键点检测方法
CN115294392B (zh) 基于生成网络模型的可见光遥感图像云去除方法及系统
CN116259008A (zh) 一种基于计算机视觉的水位实时监测方法
CN113822869B (zh) 一种基于机器视觉的透明软性包装袋静态检测方法及系统
CN108734158B (zh) 一种实时列车车号识别方法及装置
CN116246298A (zh) 一种空间占用人数统计方法、终端设备及存储介质
CN104268536A (zh) 一种图像人脸检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 215000 floor 6, building 5, building 3, Tianyun Plaza, No. 111, Wusongjiang Avenue, Guoxiang street, Wuzhong District, Suzhou City, Jiangsu Province

Patentee after: Suzhou Jiuwu interworking Intelligent Technology Co.,Ltd.

Address before: 1 / F, building B1, Dongfang Chuangzhi garden, 18 JinFang Road, Suzhou Industrial Park, 215000, Jiangsu Province

Patentee before: Suzhou Jiuwu Interchange Intelligent Technology Co.,Ltd.

CP03 Change of name, title or address
CP01 Change in the name or title of a patent holder

Address after: 215000 floor 6, building 5, building 3, Tianyun Plaza, No. 111, Wusongjiang Avenue, Guoxiang street, Wuzhong District, Suzhou City, Jiangsu Province

Patentee after: Suzhou Jiuwu Intelligent Technology Co.,Ltd.

Address before: 215000 floor 6, building 5, building 3, Tianyun Plaza, No. 111, Wusongjiang Avenue, Guoxiang street, Wuzhong District, Suzhou City, Jiangsu Province

Patentee before: Suzhou Jiuwu interworking Intelligent Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder