CN101510265A - 一种关联运动数字字符智能识别方法 - Google Patents

一种关联运动数字字符智能识别方法 Download PDF

Info

Publication number
CN101510265A
CN101510265A CNA2009100969052A CN200910096905A CN101510265A CN 101510265 A CN101510265 A CN 101510265A CN A2009100969052 A CNA2009100969052 A CN A2009100969052A CN 200910096905 A CN200910096905 A CN 200910096905A CN 101510265 A CN101510265 A CN 101510265A
Authority
CN
China
Prior art keywords
character
character image
image
digital
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009100969052A
Other languages
English (en)
Other versions
CN101510265B (zh
Inventor
何道远
戴华平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2009100969052A priority Critical patent/CN101510265B/zh
Publication of CN101510265A publication Critical patent/CN101510265A/zh
Application granted granted Critical
Publication of CN101510265B publication Critical patent/CN101510265B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种关联运动数字字符智能识别方法,包括如下步骤:1.采用基于边缘检测的图像分割技术提取数字字符图像;2.将数字字符图像像素值量化;3.采用垂直投影法分割数字字符图像得到各位数字字符图像;4.对各位数字字符图像分别识别,得到每一位数字字符的对应值;5.根据各位数字字符的对应值和数字字符图像的运动相关性,确定数字字符图像的读数。本发明方法通过分别识别和关联智能判断能准确快速的识别出仪表读数,广泛应用于机械仪表关联运动数字的时实识别。

Description

一种关联运动数字字符智能识别方法
技术领域
本发明涉及模式识别领域,尤其涉及一种关联运动数字字符智能识别方法。
背景技术
近年来字符识别技术已广泛应用于各个工程领域,字符识别的研究取得了巨大的成就,特别是对印刷体字符的识别。作为模式识别领域的一项传统课题,尽管对数字字符识别的研究已经有许多年的历史了,但由于在实际应用中,具体应用环境不同,解决的方法也各有不同。处理字符的方法,得到的字符图像的质量也都有差异,所以针对具体环境下的字符识别的方法各有差异。
目前,国内外对印刷体字符图像识别主要是针对完整字符图像的识别,即便所识别字符图像有所残缺也并不影响字符的主要特征,故常用的识别方法主要是基于特征提取的识别方法。该方法首先规定一种字符特征提取方法,事先将标准字符的特征提取出来建立数据集,对于识别上常采用BP神经网络方法,将字符的每个特征作为一个输入量输入经标准字符特征训练过的BP神经网络中,的到该字符识别结果。归根到底,该方法是一个分类方法,将字符按照事先规定好的方法将其分类到最相近的一类中,各个类之间也没什么联系,所以能够用来识别单个完整字符。
但对于连续运动的字符,由于图像中的字符从完全没有到整个出现连续变化,出现的字符往往不是一个完整的,单个字符的特征在半个字符中并不完全存在,故用上述类似的特征识别方法并不能解决字符连续变化时的识别问题。
发明内容
本发明克服现有数字字符识别技术中的不足,提供一种关联运动数字字符智能识别方法,在识别基础上提供人工智能判断,使其能够对关联运动数字进行准确、实时识别。
一种关联运动数字字符智能识别方法,包括如下步骤:
(1)采用基于边缘检测的图像分割技术提取数字字符图像,具体包括以下步骤:
1)输入包含运动数字字符的图像;
2)利用数字字符像素与背景像素的亮度差异,采用7*7对称算子H对输入包含运动数字字符的图像采用边缘检测的图像分割技术进行数字字符图像的提取;
    1  1     1    1     1  1  1
    1  0     0    0     0  0  1
    1  0     0    0     0  0  1
H= 1  0     0   -24.   0  0  1
    1  0     0    0     0  0  1
    1  0     0    0     0  0  1
    1  1     1    1     1  1  1
算子H在计算时具体指的是对每一像素点利用其周围24个点的像素灰度值总和减去该点自身灰度值的24倍,具体算子的计算方式是一种模板运算,将算子与图像进行卷积运算。
3)采用闭算子和开算子去除提取的数字字符图像的噪声块。
开算子为 1 . 1 1 1 , 闭算子为 1 1 1 1 1 . 1 1 1 1
(2)将数字字符图像像素值量化,具体包括以下步骤:
1)计算数字字符图像的灰度直方图;
2)根据直方图将灰度等级设置成4级。
3)根据灰度等级将数字字符图像的像素值量化。
原图像是256级的,量化是将图像处理成4级,这样既保留了足够的图像亮度信息,同时又能在对各位数字字符图像分别识别时能减少计算量,提高运算速度。
(3)采用垂直投影法分割数字字符图像得到各位数字字符图像;
将数字字符像素都投影到一维横坐标轴上,投影后连续黑色区域即为字符区域,白色区域即为判断字符分割的断点,检测横坐标轴上的断点,该断点为数字字符图像各位上各个字符的分割点。
(4)对各位数字字符图像分别识别,得到每一位数字字符的对应值,该对应值由整数部分和小数部分两个部分确定;
具体包括以下步骤:
1)建立一个0,1,2,3,4,5,6,7,8,9,0垂直循环的数字字符图像模板,并计算模板中各个字符垂直起始位置yis,终止位置yie和字符高度hi,其中i=0,1,...10;
2)通过模板匹配法求取数字字符图像与模板图像的最大相关位置(x,y);
模板匹配法为拿模板和图像中同样大小的一块区域去对比,然后平移到下一个像素仍然进行同样的操作,所有位置都计算完后找出差别最小的块。
3)设置循环计算出该最大相关位置y落在字符i-1和字符i的终止位置之间;
4)通过hy=y-yis计算y与字符i起始位置的高度差hy;通过式r=hy/hi计算与字符i的高度的比值r,当高度差hy小于0时,r=0,r是0到1的小数;
5)通过式C=i+r计算该字符实际对应值C,第1位(个位)的对应值为C1,第2位(百位)的对应值为C2......第n位的对应值为Cn,对应值为Cn是带小数的浮点数。
(5)根据各位数字字符的对应值和数字字符图像的运动相关性,确定数字字符图像的读数。由于实际读数时每一位上的读数都是整数,不会出现浮点数,故需要对各位数字字符对应的数值进行判定,确定其最终读数。
具体包括以下步骤:
设数字字符图像共有n位,最低位为个位,比个位高一位的为第2位,第n位为最高位,数字字符图像的最低位个位保持浮点读数不变(即取D1=C1);
当n等于1时,数字字符图像的读数即为个位的对应值;
当n大于1时,确定第n位的读数,包括以下步骤:
a.通过式 K = D 1 + 10 D 2 + . . . . . . + 10 i - 2 D i - 1 10 i - 1 ( i = n ) 计算得到第n位的K值;通过式 M = 5 10 i + 9 10 i - 1 + . . . . . . + 9 10 1 ( i = n ) 计算得到第n位的M值;
其中C1、C2......Cn指的是第(4)步处理后得到的数字字符各位的对应值,D1、D2......Dn是第(5)步计算之后各位的最终读数Dn
b.判断K是否大于M,若K小于M,则将第n位对应值加上0.5取整后再对10取余,得到第n位最终读数;
c.若K大于M,则继续判断第n位对应值的小数部分;若第n位对应值的小数部分大于0.15,则第n位对应值仅取整数部分,若第n位对应值的小数部分小于0.15,则将第n位对应值的整数部分减1加10后再对10取余,得到第n位的最终读数Dn
2)计算数字字符图像的读数f;
f=charn*10n-1+char(n-1)*10n-2+......+char1*100,其中charn为第n位的最终读数,char(n-1)为第n-1位的最终读数,char1为个位的最终读数。
本发明一种关联运动数字字符智能识别方法采用边缘检测的图像分割技术提取数字字符图像,不必为设定提取域值,算法简单易操作,效果优于传统的域值提取;采用4级灰度图匹配,图像处理后保留下来的亮度信息多于二值化后的信息;将处理后的数字字符图像在垂直模板中匹配后得到一个浮点数值,其精度高于整数;根据后一位读数确定前一位读数,利用运动数字的相关性能准确判断出该时刻各位数字字符的读数。本发明能对关联运动数字字符进行准确快速的识别,效果好,广泛应用于机械仪表关联运动数字的时实识别。
附图说明
图1是本发明方法的流程图;
图2是本发明中的垂直循环的数字字符图像模板示意图。
图3a、图3b、图3c是本发明方法中关联运动数字字符图像识别过程示意图;
图4是本发明采用垂直投影法分割数字字符图像后的其中一位数字字符示意图;
图5是利用图2中的模板对图4中一位数字字符进行匹配的示意图;
图6是对图5中匹配后的数字字符进行识别的流程图;
图7是利用本发明方法对关联运动数字的十位读数进行识别的流程图;
图8a、图8b是本发明方法中对数字字符像素进行投影前及投影后的效果示意图。
具体实施方式
下面结合附图对本发明作进一步描述。
本发明方法具体应用于机械仪表关联运动数字时实识别过程,通过分别识别和关联智能判断准确识别出仪表读数,包括如下步骤:
(1)采用基于边缘检测的图像分割技术提取数字字符图像,具体包括以下步骤:
1)如图3a所示,输入包含运动数字字符图像;
2)利用数字字符像素与背景像素的亮度差异,图3a中的数字字符图像采用7*7对称算子对输入包含运动数字字符的图像采用边缘检测的图像分割技术进行数字字符图像的提取,得到图3b的数字字符图像;
     1      1      1       1      1     1      1
     1      0      0       0      0     0      1
     1      0      0       0      0     0      1
H=  1      0      0      -24     0     0      1
     1      0      0       0      0     0      1
     1      0      0       0      0     0      1
     1      1      1       1      1     1      1
算子H在计算时将算子与图像进行卷积运算,对图3a中的数字字符图像的每一像素点利用其周围24个点的像素灰度值总和减去该点自身灰度值的24倍,进行数字字符图像的提取,得到图3b的数字字符图像;
3)采用闭算子和开算子去除提取的得到图3b的数字字符图像;的噪声块,得到图3c的数字字符图像。
开算子 1 1 1 1 , 闭算子 1 1 1 1 1 1 1 1 1
(2)将图3c的数字字符图像的像素值量化,具体包括以下步骤:
1)计算数字字符图像的灰度直方图。
2)根据直方图将灰度等级设置成4级。
3)根据灰度等级将数字字符图像的像素值量化。
图3c的数字字符图像是256级的,量化后将图像处理成4级,这样既保留了足够的图像亮度信息,同时又能在对各位数字字符图像分别识别时能减少计算量,提高运算速度。
(3)采用垂直投影法分割图3c的数字字符图像得到各位数字字符图像。
将数字字符像素都投影到一维横坐标轴上,投影后连续黑色区域即为字符区域,白色区域即为判断字符分割的断点检测横坐标轴上的断点,该断点为数字字符图像各位上各个字符的分割点。
数字字符像素投影到一维横坐标轴上即是对图像做垂直方向投影,投影前及投影后的效果分别参见图8a和图8b。
(4)对各位数字字符图像分别识别,得到每一位数字字符的对应值,该对应值由整数部分和小数部分两个部分确定;取图3c的数字字符图像的第3位进行说明,分割后的图3c的数字字符图像的第3位如图4所示。
如图6所示,具体包括以下步骤:
1)建立一个0,1,2,3,4,5,6,7,8,9,0垂直循环的数字字符图像模板,模板如图2所示;
计算模板中各个字符垂直起始位置yis,终止位置yie和字符高度hi,其中i=0,1,...10,示意图如图5所示。
2)通过模板匹配法求取数字字符图像与模板图像的最大相关位置(x,y);
拿模板和图像4中同样大小的一块区域去对比,然后平移到下一个像素仍然进行同样的操作,所有位置都计算完后找出差别最小的块所在的位置(x,y)。
3)设置循环计算出该最大相关位置y落在字符i-1和字符i的终止位置之间。
4)通过hy=y-yis计算y与字符i起始位置的高度差hy;通过式r=hy/hi计算与字符i的高度的比值r,当高度差hy小于0时,r=0,r是0到1的小数。
5)通过式C=i+r计算该字符实际对应值C,第1位(个位)的对应值为C1,第2位(百位)的对应值为C2......第n位的对应值为Cn
图3c的数字字符图像经上述计算得到个位数字字符对应值为0.0,第2位(十位)的对应值是9.75,第3位(百位)的对应值是4.62。
(5)根据各位数字字符的对应值和数字字符图像的运动相关性,确定数字字符图像的读数。由于实际读数时每一位上的读数都是整数,不会出现浮点数,故需要对各位数字字符对应的数值进行判定,确定其正确读数。
具体包括以下步骤:
1)根据各位数字字符的对应值确定数字字符图像各位上的读数
该数字字符图像共有3位,最低位为个位,第2为十位,第3位为最高位百位,保持数字字符图像个位浮点读数不变为0.0;
确定第2位的读数,如图7所示,包括以下步骤:
a.通过式 K = D 1 + 10 D 2 + . . . . . . + 10 i - 2 D i - 1 10 i - 1 ( i = n ) 计算得到值K为0;通过式 M = 5 10 i + 9 10 i - 1 + . . . . . . + 9 10 1 ( i = n ) 计算得到值M为0.95;
b.判断K是否大于M,若K小于M,则通过式D2=int(C2+0.5)%10计算得到第2位最终读数D2(即将第2位对应值C2加上0.5取整后再对10取余);
c.若K大于M,则继续判断第2位对应值的小数部分;
若第n位对应值的小数部分大于0.15(即C2-C2i>0.15,其中C2i为C2的整数部分),则第2位对应值仅取整数部分(即D2=C2i);
若第n位对应值的小数部分小于0.15(即C2-C2i<0.15,其中C2i为C2的整数部分),则将第2位对应值的整数部分减1加10后再对10取余(即D2=(C2i-1+10)%10),得到第2位的最终读数D2
图3c的数字字符图像经上述计算得到第2位(即十位)数字字符的最终读数为0。
同理,计算得到图3c的数字字符图像的第3位(即百位)数字字符的最终读数为5。
2)计算数字字符图像的读数f;
f=Dn*10n-1+Dn-1*10n-2+......+D1*100,其中Dn为第n位的最终读数,Dn-1为第n-1位的最终读数,D1为个位的最终读数,图3c的数字字符图像的读数f=500。

Claims (5)

1、一种关联运动数字字符智能识别方法,其特征在于,包括如下步骤:
(1)采用基于边缘检测的图像分割技术提取数字字符图像;
(2)将数字字符图像的像素值进行量化;
(3)采用垂直投影法分割数字字符图像得到各位数字字符图像;
(4)对各位数字字符图像分别进行识别,得到每一位数字字符的对应值;
(5)根据各位数字字符的对应值和数字字符图像的运动相关性,确定数字字符图像的读数。
2、如权利要求1所述的关联运动数字字符智能识别方法,其特征在于,步骤(1)所述的基于边缘检测的图像分割技术包括以下步骤:
1)输入包含运动数字字符的图像;
2)利用数字字符像素与背景像素的亮度差异,采用7*7对称算子对输入包含运动数字字符的图像采用边缘检测的图像分割技术进行数字字符图像的提取;
3)采用闭算子和开算子去除提取的数字字符图像的噪声块。
3.如权利要求1所述的关联运动数字字符智能识别方法,其特征在于,步骤(2)所述的量化包括以下步骤:
1)计算数字字符图像的灰度直方图;
2)根据直方图将灰度等级设置成4级;
3)根据灰度等级将数字字符图像的像素值量化。
4.如权利要求1所述的关联运动数字字符智能识别方法,其特征在于,步骤(4)所述的识别包括以下步骤:
1)建立一个0,1,2,3,4,5,6,7,8,9,0垂直循环的数字字符图像模板,并计算模板中各个字符垂直起始位置yis,终止位置yie和字符高度hi,其中i=0,1,...10;
2)通过模板匹配法求取数字字符图像与模板图像的最大相关位置(x,y);
3)设置循环计算出该最大相关位置y落在字符i-1和字符i的终止位置之间;
4)通过hy=y-yi,计算y与字符i起始位置的高度差hy;通过式r=hy/hi计算与字符i的高度的比值r,当高度差hy小于0时,r=0,r是0到1的小数;
5)通过式C=i+r计算该字符实际对应数值C。
5.如权利要求1所述的关联运动数字字符智能识别方法,其特征在于,步骤(5)中,根据各位数字字符的对应值和数字字符图像的运动相关性,确定数字字符图像的读数时,包括以下步骤:
1)设数字字符图像共有n位,最低位为个位,比个位高一位的为第2位,第n位为最高位,数字字符图像的最低位个位保持浮点读数不变;
当n等于1时,数字字符图像的读数即为个位的对应值;
当n大于1时,确定第n位的读数,包括以下步骤:
a.通过式 K = D 1 + 10 D 2 + . . . . . . + 10 t - 2 D i - 1 10 i - 1 ( i = n ) 计算得到第n位的K值;通过式 M = 5 10 i + 9 10 i - 1 + . . . . . . + 9 10 1 ( i = n ) 计算得到第n位的M值;
其中C1、C2......Cn指的是第(4)步处理后得到的数字字符各位的对应值,D1、D2......Dn是第(5)步计算之后各位的最终读数Dn
b.判断K是否大于M,若K小于M,则将第n位对应值加上0.5取整后再对10取余,得到第n位最终读数Dn
c.若K大于M,则继续判断第n位对应值的小数部分;若第n位对应值的小数部分大于0.15,则第n位对应值仅取整数部分,若第n位对应值的小数部分小于0.15,则将第n位对应值的整数部分减1加10后再对10取余,得到第n位的最终读数Dn
2)计算数字字符图像的读数f
f=Dn*10n-1+Dn-1*10n-2+......+D1*100,其中Dn为第n位的最终读数,Dn-1为第n-1位的最终读数,D1为个位的最终读数。
CN2009100969052A 2009-03-23 2009-03-23 一种关联运动数字字符智能识别方法 Expired - Fee Related CN101510265B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100969052A CN101510265B (zh) 2009-03-23 2009-03-23 一种关联运动数字字符智能识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100969052A CN101510265B (zh) 2009-03-23 2009-03-23 一种关联运动数字字符智能识别方法

Publications (2)

Publication Number Publication Date
CN101510265A true CN101510265A (zh) 2009-08-19
CN101510265B CN101510265B (zh) 2011-01-05

Family

ID=41002660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100969052A Expired - Fee Related CN101510265B (zh) 2009-03-23 2009-03-23 一种关联运动数字字符智能识别方法

Country Status (1)

Country Link
CN (1) CN101510265B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101936707A (zh) * 2010-04-14 2011-01-05 常州市计量测试技术研究所 计量表字轮图像的识别方法
CN103116753A (zh) * 2013-03-11 2013-05-22 杭州山科电子技术开发有限公司 一种计量表读数采集方法及装置
CN103310435A (zh) * 2012-03-21 2013-09-18 华中科技大学 将垂直投影和最优路径相结合对车牌字符进行分割的方法
CN106650735A (zh) * 2016-12-30 2017-05-10 亿嘉和科技股份有限公司 一种led字符自动定位识别方法
CN107193773A (zh) * 2017-04-20 2017-09-22 北京安云世纪科技有限公司 一种数据处理方法、装置及移动终端
CN112818993A (zh) * 2020-03-30 2021-05-18 深圳友讯达科技股份有限公司 一种用于摄像直读抄表器的字轮读数表端识别方法及设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101936707A (zh) * 2010-04-14 2011-01-05 常州市计量测试技术研究所 计量表字轮图像的识别方法
CN103310435A (zh) * 2012-03-21 2013-09-18 华中科技大学 将垂直投影和最优路径相结合对车牌字符进行分割的方法
CN103310435B (zh) * 2012-03-21 2016-04-06 华中科技大学 将垂直投影和最优路径相结合对车牌字符进行分割的方法
CN103116753A (zh) * 2013-03-11 2013-05-22 杭州山科电子技术开发有限公司 一种计量表读数采集方法及装置
CN103116753B (zh) * 2013-03-11 2014-03-12 杭州山科电子技术开发有限公司 一种计量表读数采集方法及装置
CN106650735A (zh) * 2016-12-30 2017-05-10 亿嘉和科技股份有限公司 一种led字符自动定位识别方法
CN106650735B (zh) * 2016-12-30 2019-10-01 亿嘉和科技股份有限公司 一种led字符自动定位识别方法
CN107193773A (zh) * 2017-04-20 2017-09-22 北京安云世纪科技有限公司 一种数据处理方法、装置及移动终端
CN112818993A (zh) * 2020-03-30 2021-05-18 深圳友讯达科技股份有限公司 一种用于摄像直读抄表器的字轮读数表端识别方法及设备

Also Published As

Publication number Publication date
CN101510265B (zh) 2011-01-05

Similar Documents

Publication Publication Date Title
CN115345885B (zh) 一种金属健身器材外观质量检测方法
CN107480611B (zh) 一种基于深度学习卷积神经网络的裂缝识别方法
CN101510265B (zh) 一种关联运动数字字符智能识别方法
CN112232349A (zh) 模型训练方法、图像分割方法及装置
Deb et al. An efficient method of vehicle license plate recognition based on sliding concentric windows and artificial neural network
US10311322B2 (en) Character information recognition method based on image processing
CN106096610A (zh) 一种基于支持向量机的文档图像二值化方法
CN109658391B (zh) 一种基于轮廓归并和凸包拟合的圆半径测量方法
CN106529550A (zh) 基于连通域分析的多维特征量提取方法及装置
CN111767874B (zh) 一种基于深度学习的路面病害检测方法
CN114049356B (zh) 一种结构表观裂缝检测方法、装置及系统
CN113963041A (zh) 一种图像纹理识别方法及系统
CN113205051A (zh) 基于高空间分辨率遥感影像的储油罐提取方法
CN116883408B (zh) 基于人工智能的积算仪壳体缺陷检测方法
CN115995056A (zh) 一种基于深度学习的桥梁病害自动识别方法
CN111104855B (zh) 一种基于时序行为检测的工作流识别方法
CN107230210A (zh) 一种遥感图像港口水面目标的快速分割方法
CN115797216A (zh) 一种基于自编码网络的碑文文字修复模型及修复方法
CN109902751B (zh) 融合卷积神经网络和半字模板匹配的表盘数字字符识别法
CN114359102A (zh) 一种基于注意力机制与边缘引导的图像深度修复取证方法
CN117496518A (zh) 基于文本检测和表格检测的电子卷宗图像智能矫正方法
CN113205016A (zh) 一种基于恒等残差型Unet与遥感水体指数的河湖岸线变化检测方法
CN117036243A (zh) 刨花板表面缺陷检测的方法、装置、设备和存储介质
CN112446914B (zh) 一种放顶煤过程中的煤矸石质量计算方法及系统
CN115240030A (zh) 一种基于深度卷积神经网络的齿轮磨削烧伤分割方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110105

Termination date: 20130323