CN110232382A - 一种表盘滚动数字字符的多位半字跳转判断与识别方法 - Google Patents
一种表盘滚动数字字符的多位半字跳转判断与识别方法 Download PDFInfo
- Publication number
- CN110232382A CN110232382A CN201910120801.4A CN201910120801A CN110232382A CN 110232382 A CN110232382 A CN 110232382A CN 201910120801 A CN201910120801 A CN 201910120801A CN 110232382 A CN110232382 A CN 110232382A
- Authority
- CN
- China
- Prior art keywords
- word
- image
- demarcation
- character
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/02—Recognising information on displays, dials, clocks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本发明涉及一种表盘滚动数字字符的多位半字跳转判断与识别方法,通过寻找五张二值图的第一个半字标签所在位置,若第一个半字标签所在位置是5,则最末尾一位数字发生跳转;若第一个半字标签所在位置小于5,则两位或两位以上的多位跳转,则将第一个半字进行半字识别,半字识别是通过对比半字二值图的中心分界线与双数字模板的中心分界线,找到半字二值图在双数字模板中的具体位置,并进行双数字模板切割,将半字二值图与切割后的双数字模板进行模板匹配,统计值为1的个数,重复执行i次找到距离最小的双数字模板的标签,为初始识别结果,再结合半字二值图中心分界线的位置确定最终识别结果。本发明的方法处理图片所需的操作步骤少识别正确率高。
Description
技术领域
本发明涉及图像处理与识别中的滚动数字字符图像识别技术领域,特别是一种表盘滚动数字字符的多位半字跳转判断与识别方法。
背景技术
表盘滚动数字字符应用于很多领域,比如家用水表、家用电表等,表盘滚动数字字符的识别方式也有很多,最简单的方法就是对表盘进行拍照采集图像,然后在经过图像处理,运用模式识别算法识别出对应的数字,即摄像式抄表系统。在该系统中,数字字符识别是整个系统的关键。但在摄像式抄表系统中,由于读数转盘进位不完全常常会出现上下双半字残缺字符。
发明内容
有鉴于此,本发明的目的是提出一种表盘滚动数字字符的多位半字跳转判断与识别方法,。
本发明采用以下方案实现:一种表盘滚动数字字符的多位半字跳转判断与识别方法,包括以下步骤:
步骤S1:获取五张分割后的并且具有半字或全字标签的数字字符二值图作为输入图像,并按顺序输入到步骤S2;
步骤S2:判断所述输入的五张二值图中是否有半字;若有半字,则进入步骤S3;若均为全字,则将各个全字字符二值化图像与全部的全字字符模板进行匹配,欧式距离最小的全字字符模板所对应的数字即为该全字字符二值化图像所对应的数字,从而实现全字字符识别;
步骤S3:令最高位的数字字符图像位置为1,最低位的数字字符图像位置为5;判断最高位的半字数字字符图像位置是否等于5,若等于5,则表示只有最后一位数字字符发生跳转,进入步骤S5识别最后一个半字,其余位置的数字字符进行全字识别;否则发生两位或两位以上的半字跳转,记第一位半字为字符图像I,进入步骤S4识别最高位半字,而比最高位半字位置更高的数字字符进行全字识别;
步骤S4:判断步骤S3中所述的字符图像I的中心分界线,若中心分界线在字符图像的上半部分,则之后所有的数字都取0;若在下半部分,则之后的所有数字都取9;同时,将第一个半字之前的数字进行步骤S6的全字识别,第一个半字进行步骤S5的半字识别;
步骤S5:令输入的半字二值图为图像M1,根据图像M1和双数字模板的中心分界线的位置,将图像M1与双数字模板进行模板匹配,识别得到最终结果;
步骤S6:令输入的全字二值图为图像N1,将全字图像与全字数字模板进行模板匹配,识别得到最终结果。
进一步地,所述输入图像的具体内容为:五张二值图按顺序排列,从左往右依次为1、2、3、4、5顺序;所述五张二值图中的每张图像均为经过图像处理,分割好的大小一致的二值图,图像尺寸为M×N;其中,M为所述输入图像的行数,N为所述输入图像的列数;所述五张二值图中的每张图像都带有全字或半字标签,若为半字,则标签为0;若为全字,则标签为1。
进一步地,所述步骤S4具体包括以下步骤:
步骤S41:对所述图像I取中心分界线,其中心分界线所在的行标记为l1;
步骤S42:判断分界线l1的位置,若则后面的数字识别结果全为0,否则后面的数字识别结果全为9。
进一步地,所述步骤S41具体包括以下步骤:
步骤S411:所述输入的五张二值图中半字二值图的尺寸为M×N,统计所述半字二值图每行的零元素的个数,记为Ai,其中i代表第i行;
步骤S412:当若Ai>0且Ai+1=0,则判定第i+1行为所述图像I中心分界线的上分界线,记为m1;若Ai+1>0且Ai=0,则判定第i行为所述图像I中心分界线的下分界线,记为m2;
步骤S413:由步骤S412得到所述图像I的中心分界线的上下分界线,计算出半字中心分界线,若m1+m2为奇数,则若m1+m2为偶数,则
进一步地,所述步骤S5具体包括以下步骤:
步骤S51:对所述半字二值图M1取中心分界线,其中心分界线所在的行标记为l2;
步骤S52:获取一双数字模板图像,所述双数字模板图像的中心分界线为l;找到所述半字二值图M1在所述双数字模板图像中的具体位置,并把该位置的图像截取出来;
步骤S53:将所述双数字模板图像与所述待识别的半字图像M1进行基于像素的模板匹配,重复k次,k为双数字模板的个数,距离最小的双数字模板的标签即为初始识别结果;
步骤S54:若则最终识别结果等于初始识别结果加1;若则最终识别结果等于初始识别结果。
进一步地,所述步骤S51具体包括以下步骤:
步骤S511:所述输入的五张二值图中半字二值图的尺寸为M×N,统计所述半字二值图每行的零元素的个数,记为Bq,其中q代表第q行;
步骤S512:当若Bq>0且Bq=0,则判定第q+1行为原始图像中心分界线的上分界线,记为n1;若Bq+1>0且Bq=0,则判定第q行为输入的半字图像M1中心分界线的下分界线,记为n2;
步骤S513:由步骤S512得到半字中心分界线的上下分界线,若n1+n2为奇数,则若n1+n2为偶数,则
进一步地,所述步骤S52具体包括以下步骤:
步骤S521:制作双数字模板图像,其中心分界线的行数记为l;
步骤S522:所述待识别的半字图像的中心分界线将图像一分为二,上半部分有l2行,下半部分有N-l2行;所述待识别半字图像在所述双数字模板中的位置是在第l-l2+1行至第l-l2+N行;
步骤S523:将所述双数字模板的l-l2+1~l-l2+N行截取出来。
进一步地,所述步骤S521具体包括以下步骤:
步骤S5211:制作0~9十个数字模板;
步骤S5212:根据数字的连贯性,将全字以01、12、23、34、45、56、67、78、89、90这十种方式以上下的顺序组合起来,并保证在同一竖直方向上,记为图像集A;
步骤S5213:将步骤S5212得到的图像集A的中心分界设置在相同的位置,并记中心分界线为l,记为图像集B;
步骤S5214:将步骤S5213得到的图像集B进行左右平移,以图像最左或右端像素值与图像最左或右端边框相切为准,得到双数字模板二值图,其个数为I;
步骤S5215:对得到的所述双数字模板二值图制作标签;
进一步地,所述步骤S53具体包括以下步骤:
步骤S531:将所述待识别半字二值图中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵B;
步骤S532:将所述双数字模板二值图中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵C;
步骤S533:将所述矩阵B和所述矩阵C两个矩阵逐点进行异或运算,相同为0,不同为1,将结果存储于一个M×N的矩阵D;
步骤S534:将所述矩阵D的所有值相加,得到所述待识别半字图像M1和双数字模板的距离d;
步骤S535:重复执行k次所述步骤S52~S53,找到最小的距离dmin,其双数字模板的标签即为最初识别结果。
进一步地,所述步骤S6具体包括以下步骤:
步骤S61:提供0~9的全字模板,全字模板的个数为k1;
步骤S62:将所述待识别全字二值图M1中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵B1;
步骤S63:将所述全字模板二值图中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵C1;
步骤S64:将所述矩阵B1和所述矩阵C1两个矩阵逐点进行异或运算,相同为0,不同为1,将结果存储于一个M×N的矩阵D1;
步骤S65:将所述矩阵D1的所有值相加,得到所述待识别全字图像N1和全字模板的距离d;
步骤S66:重复执行k1次所述步骤S63至S65,找到最小的距离dmin,其全字模板的标签即为识别结果。
与现有技术相比,本发明有以下有益效果:
本发明将判断表盘是否发生多位跳转,并进行将半字识别出来,然后输出识别结果。采用本发明的方法处理图片,所需的操作步骤少,识别正确率高。
附图说明
图1为本发明实施例的结构框图。
图2为本发明实施例中输入的五张按顺序的已有半字全字标签的分割好的二值图。
图3为本发明实施例中步骤S4多位半字跳转第一个半字后的图像识别的结构框图。
图4为本发明实施例中步骤S41求待识别半字中心分界线的结构框图。
图5为本发明实施例中图2(3)的图像经过水平投影后的效果图;
图6为本发明实施例中步骤S4半字识别的结构框图。
图7为本发明实施例中所有双数字模板截取9~40后行的效果图。
图8(1)为本发明实施例中图2(3)的二值图,图8(2)为本发明实施例中与图(1)距离最近的双数字模板的效果图;
图9为本发明实施例中步骤S521双数字模板制作的结构框图。
图10(1)为本发明实施例中0~9十个全字模板的效果图,图10(2)为本发明实施例中将十个全字模板两两拼接并对其后的效果图,图10(3)为本发明实施例中拼接后的双数字模板图中心分界线校对后的效果图。
图11为本发明实施例中制作的105张双数字模板的效果图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
在实际中采集的图像很可能出现两个字符及以上的多位跳转,如00319跳转至00320,这时候末尾两个字符同时出现跳转,由于表盘字轮制作工艺的差距,用单个半字识别的方法来进行识别可能不尽理想,最终结果可能为00319、00310、00320、00329,即水表的最后两位可能是双数字12和双数字09的随机组合,如果出现三位数或者四位数的跳转,随机组合的数量更多,这种情况下的识别错误率可能很高,所以在此一种表盘滚动数字字符的多位半字跳转判断与识别方法。
如图1所示,本实施例提供了一种表盘滚动数字字符的多位半字跳转判断与识别方法,包括以下步骤:
步骤S1:获取五张分割后的并且具有半字或全字标签的数字字符二值图作为输入图像,并按顺序输入到步骤S2;
步骤S2:判断所述输入的五张二值图中是否有半字;若有半字,则进入步骤S3;若均为全字,则将各个全字字符二值化图像与全部的全字字符模板进行匹配,欧式距离最小的全字字符模板所对应的数字即为该全字字符二值化图像所对应的数字,从而实现全字字符识别;
步骤S3:为方便实验,令最高位的数字字符图像位置为1,最低位的数字字符图像位置为5;判断最高位的半字数字字符图像位置是否等于5,若等于5,则表示只有最后一位数字字符发生跳转,进入步骤S5识别最后一个半字,其余位置的数字字符进行全字识别;否则发生两位或两位以上的半字跳转,记第一位半字为字符图像I,进入步骤S4识别最高位半字,而比最高位半字位置更高的数字字符进行全字识别;
步骤S4:判断步骤S3中所述的字符图像I的中心分界线,若中心分界线在字符图像的上半部分,则之后所有的数字都取0;若在下半部分,则之后的所有数字都取9(因为十位数上的跳转最后一位只可能从9跳转到0,所以要么是9要么是0);同时,将第一个半字之前的数字进行步骤S6的全字识别,第一个半字进行步骤S5的半字识别;
步骤S5:令输入的半字二值图为图像M1,根据图像M1和双数字模板的中心分界线的位置,将图像M1与双数字模板进行模板匹配,识别得到最终结果;
步骤S6:令输入的全字二值图为图像N1,将全字图像与全字数字模板进行模板匹配,识别得到最终结果。
在本实施例中,所述输入图像的具体内容为:五张二值图按顺序排列,从左往右依次为1、2、3、4、5顺序;所述五张二值图中的每张图像均为经过图像处理,分割好的大小一致的二值图,图像尺寸为M×N;其中,M为所述输入图像的行数,N为所述输入图像的列数;所述五张二值图中的每张图像都带有全字或半字标签,若为半字,则标签为0;若为全字,则标签为1。
在本实施例中,所述步骤S4具体包括以下步骤:
步骤S41:对所述图像I取中心分界线,其中心分界线所在的行标记为l1;
步骤S42:判断分界线l1的位置,若则后面的数字识别结果全为0,否则后面的数字识别结果全为9。
在本实施例中,所述步骤S41具体包括以下步骤:
步骤S411:所述输入的五张二值图中半字二值图的尺寸为M×N,统计所述半字二值图每行的零元素的个数,记为Ai,其中i代表第i行;
步骤S412:当若Ai>0且Ai+1=0,则判定第i+1行为所述图像I中心分界线的上分界线,记为m1;若Ai+1>0且Ai=0,则判定第i行为所述图像I中心分界线的下分界线,记为m2;
步骤S413:由步骤S412得到所述图像I的中心分界线的上下分界线,计算出半字中心分界线,若m1+m2为奇数,则若m1+m2为偶数,则
在本实施例中,所述步骤S5具体包括以下步骤:
步骤S51:对所述半字二值图M1取中心分界线,其中心分界线所在的行标记为l2;
步骤S52:获取一双数字模板图像,所述双数字模板图像的中心分界线为l;找到所述半字二值图M1在所述双数字模板图像中的具体位置,并把该位置的图像截取出来;
步骤S53:将所述双数字模板图像与所述待识别的半字图像M1进行基于像素的模板匹配,重复k次,k为双数字模板的个数,距离最小的双数字模板的标签即为初始识别结果;
步骤S54:若则最终识别结果等于初始识别结果加1;若则最终识别结果等于初始识别结果。
在本实施例中,所述步骤S51具体包括以下步骤:
步骤S511:所述输入的五张二值图中半字二值图的尺寸为M×N,统计所述半字二值图每行的零元素的个数,记为Bq,其中q代表第q行;
步骤S512:当若Bq>0且Bq=0,则判定第q+1行为原始图像中心分界线的上分界线,记为n1;若Bq+1>0且Bq=0,则判定第q行为输入的半字图像M1中心分界线的下分界线,记为n2;
步骤S513:由步骤S512得到半字中心分界线的上下分界线,若n1+n2为奇数,则若n1+n2为偶数,则
在本实施例中,所述步骤S52具体包括以下步骤:
步骤S521:制作双数字模板图像,其中心分界线的行数记为l;
步骤S522:所述待识别的半字图像的中心分界线将图像一分为二,上半部分有l2行,下半部分有N-l2行;所述待识别半字图像在所述双数字模板中的位置是在第l-l2+1行至第l-l2+N行;
步骤S523:将所述双数字模板的l-l2+1~l-l2+N行截取出来。
在本实施例中,所述步骤S521具体包括以下步骤:
步骤S5211:制作0~9十个数字模板;
步骤S5212:根据数字的连贯性,将全字以01、12、23、34、45、56、67、78、89、90这十种方式以上下的顺序组合起来,并保证在同一竖直方向上,记为图像集A;
步骤S5213:将步骤S5212得到的图像集A的中心分界设置在相同的位置,并记中心分界线为l,记为图像集B;
步骤S5214:将步骤S5213得到的图像集B进行左右平移,以图像最左或右端像素值与图像最左或右端边框相切为准,得到双数字模板二值图,其个数为I;
步骤S5215:对得到的所述双数字模板二值图制作标签;
在本实施例中,所述步骤S53具体包括以下步骤:
步骤S531:将所述待识别半字二值图中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵B;
步骤S532:将所述双数字模板二值图中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵C;
步骤S533:将所述矩阵B和所述矩阵C两个矩阵逐点进行异或运算,相同为0,不同为1,将结果存储于一个M×N的矩阵D;
步骤S534:将所述矩阵D的所有值相加,得到所述待识别半字图像M1和双数字模板的距离d;
步骤S535:重复执行k次所述步骤S52~S53,找到最小的距离dmin,其双数字模板的标签即为最初识别结果。
在本实施例中,所述步骤S6具体包括以下步骤:
步骤S61:提供0~9的全字模板,全字模板的个数为k1;
步骤S62:将所述待识别全字二值图M1中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵B1;
步骤S63:将所述全字模板二值图中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵C1;
步骤S64:将所述矩阵B1和所述矩阵C1两个矩阵逐点进行异或运算,相同为0,不同为1,将结果存储于一个M×N的矩阵D1;
步骤S65:将所述矩阵D1的所有值相加,得到所述待识别全字图像N1和全字模板的距离d;
步骤S66:重复执行k1次所述步骤S63至S65,找到最小的距离dmin,其全字模板的标签即为识别结果。
较佳的,本实施例通过寻找输入的按顺序排列且分割好的五张二值图的第一个半字标签所在位置,若第一个半字标签所在位置是5,则说明只有最末尾一位数字发生跳转;若第一个半字标签所在位置小于5,则说明发生了两位或两位以上的多位跳转,这时候将第一个半字进行半字识别,同时输出其中心分界线的横坐标,若中心分界线的横坐标位于该半字的上半部分,则第一位半字后的所有数字识别为9,否则第一位半字后的所有数字识别为0。所述半字识别模块是通过对比半字二值图的中心分界线与双数字模板的中心分界线,找到半字二值图在双数字模板中的具体位置,并进行双数字模板切割,然后将半字二值图与切割后的双数字模板进行模板匹配,即各个像素进行异或运算,统计值为1的个数,即半字二值图与切割好的双数字模板的距离,重复执行i次(i为双数字模板的个数),找到距离最小的双数字模板的标签,即为初始识别结果,再结合半字二值图的中心分界线的位置确定最终识别结果。
特别的,本实施例对带有半字标签的字符进行分析研究,利用双数字模板匹配法对半字数字字符进行识别,并在多位半字跳转中,利用半字数字字符中心分界线的位置确定之后半字数字的数值。
本实施例的双数字模板匹配实质上是基于像素的模板匹配,是将两张同尺寸的二值图一个个相应像素点对应,若相应像素点的值相同,则记为0,不同则记为1,即进行异或运算,遍历整张图后统计1的个数,最终结果即是两张二值图的距离,根据距离的大小来判断两幅图的相似度,距离越大,两幅图的相似度越低。
较佳的,本实施例的具体实施内容如下:步骤S1的输入图像如图2所示,有以下特征:
(1)五张图像已按顺序排列,依次从左往右为1、2、3、4、5顺序;
(2)每张图像均为已经过图像处理,分割好的大小一致的二值图,图像尺寸为32×24(其中,32为输入图像的行数,24为输入图像的列数);
(3)每张图像都带有全字或半字标签,若为半字,则标签为0,若为全字,则标签为1;
在本实施实例中,五个按12345顺序排列的图像所带有的半字全字标签为:11000,经过步骤S2判断,可进入步骤S3,由于第一个半字(即标签为0)在第三位,可进入步骤S4;
如图3所示,在本实施实例中,所述步骤S4主要包括以下步骤
步骤S41:对步骤S3的图像取中心分界线,其中心分界线所在的行标记为l1=21;
步骤S42:判断分界线l1的位置,本实施实例中则图2(4)(5)的识别结果为9,同时该半字的识别跳转到步骤S5;
如图4所示,在本实施实例中,所述步骤S41具体包括以下步骤:
步骤S411:步骤S3输入的半字二值图像的尺寸为32×24,统计S1的半字二值图每行的零元素的个数,记为Ai,其中i代表第i行;图2(3)的水平投影如图5所示;
步骤S412:当若若Ai>0且Ai+1=0,则判定i+1为原始图像中心分界线的上分界线,记为m1,本实施例中m1=19;若Ai+1>0且Ai=0,则判定第i行为原始图像中心分界线的下分界线,记为m2;本实施例中m2=22;
步骤S413:由步骤S412可知半字中心分界线的上下分界线,本实施例中m1+m2为奇数,
如图6所示,在本实施实例中,所述步骤S5具体包括以下步骤
步骤S51:对半字二值图取中心分界线,其中心分界线的所在行数标记为l2=21,具体操作步骤如S41所示;
步骤S52:根据双数字模板图像的中心分界线l=29与待识别半字图像的中心分界线l2=21找到待识别半字图像在双数字模板图像中的具体位置为第9~40行,并把该位置的图像截取出来,图7为截取后的所有双数字模板图;
步骤S53:将步骤S42得到的图像与待识别的半字图像进行基于像素的模板匹配,重复105次(105为双数字模板的个数),距离最小的双数字模板如图8(2)所示,其标签8即为最初识别结果;
步骤S54:在本实施例中,最终识别结果等于初始识别结果等于8;
在本实施例中,所述步骤S52具体包括以下步骤:
步骤S521:制作双数字模板,其中心分界线的行数记为l=29;
步骤S522:由步骤S51可知,待识别的半字中心分界线将图像一分为二,上半部分有l2=21行、下半部分有32-l2=11行,所以在本实施例中,待识别半字图像在双数字模板中的位置是第9至第40行;
步骤S523:将所有双数字模板的9~40行截取出来;
如图9所示,在本实施例中,所述步骤S521具体包括以下步骤:
步骤S5211:制作0~9十个数字模板,如图10(1)所示,尺寸大小为32×24;
步骤S5212:根据数字的连贯性,将全字以01、12、23、34、45、56、67、78、89、90这十种方式以上下的顺序组合起来,并保证在同一竖直方向上,如图10(2)所示,尺寸大小为64×24;
步骤S5213:观察待识别半字字符的上下分界线的间隔,本实施例中待识别半字的中间空白为3行,将步骤S5212得到的图像的中心分界控制在相同的位置,并记中心分界线为l=29,如图10(3)所示,尺寸大小为57×24;
步骤S5214:将步骤S5213得到的图形进行左右平移,以图像最左/右端像素值与图像最左/右端边框相切为准,得到一系列双数字模板二值图,其个数为105,如图11所示。
步骤S5215:给步骤S5214得到的双数字模板二值图制作标签,因为一个模板中有两个连续数字,所以统一采用较上的数字作为标签,如在01双数字中,取标签为0;
所述步骤S53具体包括以下步骤:
步骤S531:将待识别半字二值图总各个像素点的值提取出来,是构成一个32×24的矩阵B;
步骤S532:将步骤S52得到的切割好的双数字模板二值图中各个像素点的值提取出来,是构成一个32×24的矩阵C;
步骤S533:将B和C两个矩阵逐点进行异或运算,相同为0,不同为1,将结果存储于一个32×24的矩阵D;
步骤S534:将矩阵D的所有值相加,得到待识别半字图像和S3得到的图像的距离d;
步骤S535:重复执行105次(105为双数字模板的个数)S52~S534次,找到最小的距离dmin=71,其双数字模板的标签即为最初识别结果。
所述步骤S6就包括以下步骤:
步骤步骤S61:制作0~9的全字模板,全字模板的个数为10;
步骤S62:以图2(1)的全字待识别二值图为例,将所述二值图中各个像素点的值提取出来,构成一个32×24的矩阵B1;
步骤S63:将所述全字模板二值图中各个像素点的值提取出来,构成一个32×24的矩阵C1;
步骤S64:将所述矩阵B1和所述矩阵C1两个矩阵逐点进行异或运算,相同为0,不同为1,将结果存储于一个32×24的矩阵D1;
步骤S65:将所述矩阵D1的所有值相加,得到图2(1)的待识别全字二值图和全字模板的距离d;
步骤S66:重复执行10次所述步骤S63~S65,找到最小的距离dmin=42,其全字模板的标签0即为识别结果。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (10)
1.一种表盘滚动数字字符的多位半字跳转判断与识别方法,其特征在于:包括以下步骤:
步骤S1:获取五张分割后的并且具有半字或全字标签的数字字符二值图作为输入图像,并按顺序输入到步骤S2;
步骤S2:判断所述输入的五张二值图中是否有半字;若有半字,则进入步骤S3;若均为全字,则将各个全字字符二值化图像与全部的全字字符模板进行匹配,欧式距离最小的全字字符模板所对应的数字即为该全字字符二值化图像所对应的数字,从而实现全字字符识别;
步骤S3:令最高位的数字字符图像位置为1,最低位的数字字符图像位置为5;判断最高位的半字数字字符图像位置是否等于5,若等于5,则表示只有最后一位数字字符发生跳转,进入步骤S5识别最后一个半字,其余位置的数字字符进行全字识别;否则发生两位或两位以上的半字跳转,记第一位半字为字符图像I,进入步骤S4识别最高位半字,而比最高位半字位置更高的数字字符进行全字识别;
步骤S4:判断步骤S3中所述的字符图像I的中心分界线,若中心分界线在字符图像的上半部分,则之后所有的数字都取0;若在下半部分,则之后的所有数字都取9;同时,将第一个半字之前的数字进行步骤S6的全字识别,第一个半字进行步骤S5的半字识别;
步骤S5:令输入的半字二值图为图像M1,根据图像M1和双数字模板的中心分界线的位置,将图像M1与双数字模板进行模板匹配,识别得到最终结果;
步骤S6:令输入的全字二值图为图像N1,将全字图像与全字数字模板进行模板匹配,识别得到最终结果。
2.根据权利要求1所述的一种表盘滚动数字字符的多位半字跳转判断与识别方法,其特征在于:所述输入图像的具体内容为:五张二值图按顺序排列,从左往右依次为1、2、3、4、5顺序;所述五张二值图中的每张图像均为经过图像处理,分割好的大小一致的二值图,图像尺寸为M×N;其中,M为所述输入图像的行数,N为所述输入图像的列数;所述五张二值图中的每张图像都带有全字或半字标签,若为半字,则标签为0;若为全字,则标签为1。
3.根据权利要求1所述的一种表盘滚动数字字符的多位半字跳转判断与识别方法,其特征在于:所述步骤S4具体包括以下步骤:
步骤S41:对所述图像I取中心分界线,其中心分界线所在的行标记为l1;
步骤S42:判断分界线l1的位置,若则后面的数字识别结果全为0,否则后面的数字识别结果全为9。
4.根据权利要求3所述的一种表盘滚动数字字符的多位半字跳转判断与识别方法,其特征在于:所述步骤S41具体包括以下步骤:
步骤S411:所述输入的五张二值图中半字二值图的尺寸为M×N,统计所述半字二值图每行的零元素的个数,记为Ai,其中i代表第i行;
步骤S412:当若Ai>0且Ai+1=0,则判定第i+1行为所述图像I中心分界线的上分界线,记为m1;若Ai+1>0且Ai=0,则判定第i行为所述图像I中心分界线的下分界线,记为m2;
步骤S413:由步骤S412得到所述图像I的中心分界线的上下分界线,计算出半字中心分界线,若m1+m2为奇数,则若m1+m2为偶数,则
5.根据权利要求1所述的一种表盘滚动数字字符的多位半字跳转判断与识别方法,其特征在于:所述步骤S5具体包括以下步骤:
步骤S51:对所述半字二值图M1取中心分界线,其中心分界线所在的行标记为l2;
步骤S52:获取一双数字模板图像,所述双数字模板图像的中心分界线为l;找到所述半字二值图M1在所述双数字模板图像中的具体位置,并把该位置的图像截取出来;
步骤S53:将所述双数字模板图像与所述待识别的半字图像M1进行基于像素的模板匹配,重复k次,k为双数字模板的个数,距离最小的双数字模板的标签即为初始识别结果;
步骤S54:若则最终识别结果等于初始识别结果加1;若则最终识别结果等于初始识别结果。
6.根据权利要求5所述的一种表盘滚动数字字符的多位半字跳转判断与识别方法,其特征在于:所述步骤S51具体包括以下步骤:
步骤S511:所述输入的五张二值图中半字二值图的尺寸为M×N,统计所述半字二值图每行的零元素的个数,记为Bq,其中q代表第q行;
步骤S512:当若Bq>0且Bq=0,则判定第q+1行为原始图像中心分界线的上分界线,记为n1;若Bq+1>0且Bq=0,则判定第q行为输入的半字图像M1中心分界线的下分界线,记为n2;
步骤S513:由步骤S512得到半字中心分界线的上下分界线,若n1+n2为奇数,则若n1+n2为偶数,则
7.根据权利要求5所述的一种表盘滚动数字字符的多位半字跳转判断与识别方法,其特征在于:所述步骤S52具体包括以下步骤:
步骤S521:制作双数字模板图像,其中心分界线的行数记为l;
步骤S522:所述待识别的半字图像的中心分界线将图像一分为二,上半部分有l2行,下半部分有N-l2行;所述待识别半字图像在所述双数字模板中的位置是在第l-l2+1行至第l-l2+N行;
步骤S523:将所述双数字模板的l-l2+1~l-l2+N行截取出来。
8.根据权利要求7所述的一种表盘滚动数字字符的多位半字跳转判断与识别方法,其特征在于:所述步骤S521具体包括以下步骤:
步骤S5211:制作0~9十个数字模板;
步骤S5212:根据数字的连贯性,将全字以01、12、23、34、45、56、67、78、89、90这十种方式以上下的顺序组合起来,并保证在同一竖直方向上,记为图像集A;
步骤S5213:将步骤S5212得到的图像集A的中心分界设置在相同的位置,并记中心分界线为l,记为图像集B;
步骤S5214:将步骤S5213得到的图像集B进行左右平移,以图像最左或右端像素值与图像最左或右端边框相切为准,得到双数字模板二值图,其个数为I;
步骤S5215:对得到的所述双数字模板二值图制作标签;
9.根据权利要求5所述的一种表盘滚动数字字符的多位半字跳转判断与识别方法,其特征在于:所述步骤S53具体包括以下步骤:
步骤S531:将所述待识别半字二值图中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵B;
步骤S532:将所述双数字模板二值图中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵C;
步骤S533:将所述矩阵B和所述矩阵C两个矩阵逐点进行异或运算,相同为0,不同为1,将结果存储于一个M×N的矩阵D;
步骤S534:将所述矩阵D的所有值相加,得到所述待识别半字图像M1和双数字模板的距离d;
步骤S535:重复执行k次所述步骤S52~S53,找到最小的距离dmin,其双数字模板的标签即为最初识别结果。
10.根据权利要求1所述的一种表盘滚动数字字符的多位半字跳转判断与识别方法,其特征在于:所述步骤S6具体包括以下步骤:
步骤S61:提供0~9的全字模板,全字模板的个数为k1;
步骤S62:将所述待识别全字二值图M1中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵B1;
步骤S63:将所述全字模板二值图中各个像素点的值按各像素点所在的位置构成一个M×N的矩阵C1;
步骤S64:将所述矩阵B1和所述矩阵C1两个矩阵逐点进行异或运算,相同为0,不同为1,将结果存储于一个M×N的矩阵D1;
步骤S65:将所述矩阵D1的所有值相加,得到所述待识别全字图像N1和全字模板的距离d;
步骤S66:重复执行k1次所述步骤S63至S65,找到最小的距离dmin,其全字模板的标签即为识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910120801.4A CN110232382B (zh) | 2019-02-18 | 2019-02-18 | 一种表盘滚动数字字符的多位半字跳转判断与识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910120801.4A CN110232382B (zh) | 2019-02-18 | 2019-02-18 | 一种表盘滚动数字字符的多位半字跳转判断与识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110232382A true CN110232382A (zh) | 2019-09-13 |
CN110232382B CN110232382B (zh) | 2023-04-07 |
Family
ID=67860373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910120801.4A Active CN110232382B (zh) | 2019-02-18 | 2019-02-18 | 一种表盘滚动数字字符的多位半字跳转判断与识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110232382B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114445784A (zh) * | 2022-03-01 | 2022-05-06 | 武汉聚智惠仁信息技术有限公司 | 一种crrt屏幕参数实时采集的方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010045959A1 (en) * | 1997-04-30 | 2001-11-29 | Hitoshi Hayama | Image processing device |
CN103226706A (zh) * | 2013-05-17 | 2013-07-31 | 广东今盛投资有限公司 | 一种基于滚动匹配的水电气表读数自动识别方法 |
CN106228159A (zh) * | 2016-07-29 | 2016-12-14 | 深圳友讯达科技股份有限公司 | 一种基于图像识别的计量表抄表装置及其方法 |
CN108491844A (zh) * | 2018-02-07 | 2018-09-04 | 西安工程大学 | 基于图像处理的水表自动检测系统及其图像处理方法 |
-
2019
- 2019-02-18 CN CN201910120801.4A patent/CN110232382B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010045959A1 (en) * | 1997-04-30 | 2001-11-29 | Hitoshi Hayama | Image processing device |
CN103226706A (zh) * | 2013-05-17 | 2013-07-31 | 广东今盛投资有限公司 | 一种基于滚动匹配的水电气表读数自动识别方法 |
CN106228159A (zh) * | 2016-07-29 | 2016-12-14 | 深圳友讯达科技股份有限公司 | 一种基于图像识别的计量表抄表装置及其方法 |
CN108491844A (zh) * | 2018-02-07 | 2018-09-04 | 西安工程大学 | 基于图像处理的水表自动检测系统及其图像处理方法 |
Non-Patent Citations (2)
Title |
---|
DONGMEI SHU等: "Study of the Automatic Reading of Watt Meter Based on Image Processing Technology", 《2007 2ND IEEE CONFERENCE ON INDUSTRIAL ELECTRONICS AND APPLICATIONS》 * |
胡习林: "智能仪表直读装置中的图像处理及识别算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114445784A (zh) * | 2022-03-01 | 2022-05-06 | 武汉聚智惠仁信息技术有限公司 | 一种crrt屏幕参数实时采集的方法和系统 |
CN114445784B (zh) * | 2022-03-01 | 2023-01-10 | 武汉聚智惠仁信息技术有限公司 | 一种crrt屏幕参数实时采集的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110232382B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111523470B (zh) | 一种行人重识别方法、装置、设备及介质 | |
US10311322B2 (en) | Character information recognition method based on image processing | |
CN108830213A (zh) | 基于深度学习的车牌检测与识别方法和装置 | |
CN100377173C (zh) | 一种基于十六进制编码的构建二维码的方法 | |
CN104008401A (zh) | 一种图像文字识别的方法及装置 | |
US5708731A (en) | Pattern matching method with pixel vectors | |
CN110826534B (zh) | 一种基于局部主成分分析的人脸关键点检测方法及系统 | |
CN110232382A (zh) | 一种表盘滚动数字字符的多位半字跳转判断与识别方法 | |
CN115512220A (zh) | 一种基于改进Unet网络模型的遥感图像道路分割方法 | |
Hou et al. | Fe-fusion-vpr: Attention-based multi-scale network architecture for visual place recognition by fusing frames and events | |
US4628533A (en) | Pattern recognition apparatus | |
CN104636708A (zh) | 一种局部文档图像的比对方法及系统 | |
CN105447477A (zh) | 基于公式库的公式识别方法及装置 | |
Jiang et al. | Authentically distorted image quality assessment by learning from empirical score distributions | |
CN111881876A (zh) | 一种基于单阶无锚检测网络的考勤方法 | |
CN111753714A (zh) | 基于字符分割的多方向自然场景文本检测方法 | |
JPS60153574A (ja) | 文字読取方法 | |
CN109918997B (zh) | 一种基于多示例学习的行人目标跟踪方法 | |
CN109886276B (zh) | 一种表盘滚动数字字符的半字判断方法 | |
US7020334B2 (en) | Circuit for extracting connected component features from an image | |
JP2013097590A (ja) | 文字認識用コンピュータプログラム、文字認識装置及び文字認識方法 | |
Chen et al. | DBANet: A Dual Branch Attention-Based Deep Neural Network for Biological Iris Recognition | |
CN112561823B (zh) | 滤波方法 | |
CN110147844B (zh) | 一种固定比例图形的归类方法 | |
CN111488906B (zh) | 一种基于通道相关式PCANet的低分辨率图像识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Wu Linhuang Inventor before: Chen Zhifeng Inventor before: Wu Linhuang |
|
CB03 | Change of inventor or designer information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |