CN109086769B - 一种断裂粘连激光印刷数字串识别方法 - Google Patents
一种断裂粘连激光印刷数字串识别方法 Download PDFInfo
- Publication number
- CN109086769B CN109086769B CN201810796514.0A CN201810796514A CN109086769B CN 109086769 B CN109086769 B CN 109086769B CN 201810796514 A CN201810796514 A CN 201810796514A CN 109086769 B CN109086769 B CN 109086769B
- Authority
- CN
- China
- Prior art keywords
- serial number
- contour
- image
- character
- adopting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000007648 laser printing Methods 0.000 title claims abstract description 12
- 238000010606 normalization Methods 0.000 claims abstract description 8
- 238000009499 grossing Methods 0.000 claims abstract description 7
- 230000011218 segmentation Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 230000035772 mutation Effects 0.000 claims description 6
- 238000000926 separation method Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 3
- 238000003491 array Methods 0.000 claims description 2
- 230000000903 blocking effect Effects 0.000 claims description 2
- 238000012850 discrimination method Methods 0.000 claims description 2
- QNRATNLHPGXHMA-XZHTYLCXSA-N (r)-(6-ethoxyquinolin-4-yl)-[(2s,4s,5r)-5-ethyl-1-azabicyclo[2.2.2]octan-2-yl]methanol;hydrochloride Chemical compound Cl.C([C@H]([C@H](C1)CC)C2)CN1[C@@H]2[C@H](O)C1=CC=NC2=CC=C(OCC)C=C21 QNRATNLHPGXHMA-XZHTYLCXSA-N 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 abstract description 19
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 abstract description 8
- 229910052709 silver Inorganic materials 0.000 abstract description 8
- 239000004332 silver Substances 0.000 abstract description 8
- 230000008859 change Effects 0.000 abstract description 3
- 238000002474 experimental method Methods 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000005192 partition Methods 0.000 abstract 1
- 238000007639 printing Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000003628 erosive effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005286 illumination Methods 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000010339 dilation Effects 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 241000271039 Agkistrodon Species 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种断裂粘连激光印刷数字串识别方法,第一步:对网银盾分区提取序列号、二值化、去除断点和噪声、序列号分割、数字归一化、平滑轮廓等算法进行研究;第二步:采用4联通寻找法提取数字的连通域数量,对只有一个连通域的数字,分析字符3/4高度内的最大宽高比从而分离数字1;第三步:在前两步的基础上,结合数字轮廓的切线斜率突变特征进行分析,构造编码表对数字进行识别。实验采用Linux系统搭载Qt框架,用C++编程实现本文算法。实验测得该算法在没有污渍的情况下,断裂粘连激光印刷数字识别准确率可达100%,实验结果表明了该算法的可靠性和实用性。
Description
技术领域
本发明属于自动识别检测技术领域,涉及一种网银盾数字识别方法,具体涉及一种断裂粘连激光印刷数字串识别方法。
背景技术
目前常见的数字识别,分为印刷体数字识别和手写体数字识别两大类,其中印刷体数字又分为传统数字印刷和以喷墨、激光为代表的,可变数据印刷([文献1])。相对于印品质量较高的传统印刷,激光印刷的数字由于存在断点、字符粗细不一、浓淡不均、数字边缘较为粗糙、时有粘连等问题,在实际应用中正确切分,可靠地识别方法就成为保证识别率的关键因素。
实际应用中采用的数字识别方法主要有基于结构特征的方法和基于统计特征的方法。学者严国莉,根据印刷数字字符结构,抽取数字特征进行识别,并将该识别方法应用于身份证图像编号数字识别([文献2])。学者Omari SAKA研究开发了一个能根据不同的用户手写风格识别其手写数字的系统,该系统成功地设计和实现了一个高效无需求的神经网络,从而使系统能够理解不同用户手动编写的阿拉伯数字([文献3])。学者丘敏,根据神经网络的特点对汽车牌照进行应用型研究,研究了误差精度和学习速率与隐含节点数之间的关系,探讨了Hopfield网络与BP网络结合的方案在汽车牌照字符识别中的应用([文献4]),但以上算法大都存在识别的速度较慢,识别准确率有待提高等问题。
[文献1]Chen Jian-feng,Niu Shi-jun.Innovative application of digitalprinting on custom packaging[J].Today Printing,2017(10):32-35.[陈剑锋,牛世军.数字印刷在定制包装上的创新应用[J].今日印刷,2017(10):32-35.]
[文献2]YAN Guo-li,HUANG Shah,LI Dai-zhang,et al.Application of rapididentification of printed figures in ID number identification[J].ComputerEngineering,2003,29(1):178-179.[严国莉,黄山,李岱璋,等.印刷体数字快速识别算法在身份证编号数字识别中的应用[J].计算机工程,2003,29(1):178-179.]
[文献3]Omari S A K A,Sumari P,Al-Taweel S A,et al.Digital recognitionusing neural network[J].Journal of Computer Science,2009,5(6):427-434.
[文献4]Qiu Min,Mai Han-rong,Liao Xi-chun,et al.Application of neuralnetwork in vehicle license character recognition[J].Computer Engineering andDesign,2008,29(8):2041-2043[丘敏,麦汉荣,廖惜春,等.神经网络在汽车牌照字符识别中的应用[J].计算机工程与设计,2008,29(8):2041-2043.]
[文献5]JIN Hua-zhong,WAN Fang,YE Zhi-wei.An Improved WatershedAlgorithm and Its Application in Gravel Recognition of Imaging[J].Journal ofXi'an Shiyou University(Natural Science),2017,51(5).[靳华中,万方,叶志伟.结合路面深度影像梯度方向直方图和分水岭算法的裂缝检测[J].华中师范大学学报(自科版),2017,51(5).]
[文献6]Salman Amin Khan.Character Segmentation Heuristics for CheckAmount Verification[J].Massachusetts Institute of Technology,1998.
[文献7]Stoica I,Morris R,Karger D,et al.Chord:A scalable peer-to-peerlookup service for internet applications[M].ACM,2001.
[文献8]Elomaa T,Mannila H,Orponen P.Algorithms and Applications[M].pringer Berlin Heidelberg,2010.
[文献9]Jiang Wei-Da.A New Algorithm Connected Component LabelingBased on Objects[J].Modern Surveying&Mapping,2015.[蒋伟达.一种基于对象的连通区域标记方法[J].现代测绘,2015(4):16-17.]
[文献10]Bovet D,Cesati M,Oram A.Understanding the Linux kernel,ThirdEdition[J].208·Incremental Checkpointing for Grids,2002.
[文献11]LIU WenFeng,LI ChengYuan,LI ShanBeng.嵌入式Linux操作系统的研究[J].2004.[刘文峰,李程远,李善平.嵌入式Linux操作系统的研究[J].浙江大学学报(工学版),2004,38(4):447-452.]
[文献12]Wang Hao-nan,Liu Yi-cheng.Development of Qt based on EmbeddedLinux[J].Computer Development&Applications,2010.[王浩南,刘益成.基于嵌入式Linux系统下的Qt开发[J].电脑开发与应用,2010,23(1):11-13.]
[文献13]NI Gui-bo,Liang Xiao-zun.Digital pattern recognition based onstructure shape[J].Magazine,2010,09(5).[倪桂博,梁晓尊.基于结构形状的印刷体数字识别方法[J].软件导刊,2010,09(5).]
[文献14]Hao Zhang,Cai Jin-hui,Cai Hui et al.On-line inspection methodfor steel billet characters based on improved template matching[J].ComputerIntegrated Manufacturing Systems,2007,13(10):2076-2080.[张浩,蔡晋辉,才辉,等.基于改进模板匹配的在线钢坯标号识别方法[J].计算机集成制造系统,2007,13(10):2076-2080.]
[文献15]He Yun,Li Guo-he,Lin Ren-jie,et al.Digital identification andapplication of mobile phone with color-coded label[J].Computer Engineeringand Application,2015,51(23):164-168.[何云,李国和,林仁杰,等.面向彩印标签的手机数码识别及应用[J].计算机工程与应用,2015,51(23):164-168.]
发明内容
为了解决上述技术问题,本发明提供了一种断裂粘连激光印刷数字串识别方法。
本发明所采用的技术方案是:一种断裂粘连激光印刷数字串识别方法,其特征在于,包括以下步骤:
步骤1:对获得的包含序列号在内的图像进行预处理;
包括图像二值化、序列号边界确定和序列号去除断点;
步骤2:序列号分割;
包括单个字符的提取和字符归一化处理;
步骤3:序列号识别;
包括数字平滑处理、连通域提取、数字1的分离和数字识别。
本发明提出的断裂粘连激光印刷数字串识别方法,识别每个网银盾的速度最快可达0.15s/个,对没有污渍的网银盾,识别的准确率可达100%,对网银盾出厂前的检测具有很高的实际应用价值。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的二值化处理结果示意图;
图3为本发明实施例的对图像进行水平方向投影图;
图4为本发明实施例的对图像进行垂直方向投影图;
图5为本发明实施例的序列号去除断点效果图;
图6为本发明实施例的数字归一化后图像效果图;
图7为本发明实施例的数字识别过程中斜率突变检测效果图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种断裂粘连激光印刷数字串识别方法,包括以下步骤:
步骤1:对获得的包含序列号在内的图像进行预处理,包括图像二值化、序列号边界确定和序列号去除断点;
(1)图像二值化;
首先对识别区域进行限定,由于加工误差以及包装运输变形等原因,序列号的位置变动范围较大,因此设置较大的检测范围,从而保证序列号提取的准确性,再对检测范围内的图像进行二值化处理,处理结果如图2所示。
目前,常用的文档图像二值化算法,大致可分为全局阈值法和局部阈值法。局部阈值法多应用于背景照明高度不均匀的情景,这种方法在(x,y)的领域中以一个或多个指定像素的特性在图像的每一点(x,y)计算阈值,该方法在明暗不均的图像中有着很好的效果,然而耗时过长。本实施例采用上下均布的LED灯带作为光源,采用均光板对光源进行处理,得到分布均匀的光线,从而可以采用全局阈值法进行二值化。
相机每次拍照曝光时间不完全一致导致每次扫描得到的图像亮度不一,因此本实施例采用动态阈值处理法。由于图像呈现双峰模态可以采用经典的Otsu’s方法进行最佳全局阈值处理,得到二值化后的序列号。
图像直方图范围为[0,L],L为图像中所有可能的灰度级数,假定字符与空白部分分割的阈值为x∈[0,255]。
图像中字符所占比例:
从而图像中空白部分所占比例为:
图像全局灰度均值为:
图像字符部分灰度值为:
图像空白部分灰度均值为:
阈值处理后的最大类间方差为:
最优阈值是使类间方差达到最大值时的x。
(2)序列号边界确定;
对上述二值化处理后的区域采用统计法,0代表背景,1代表图元,提取统计得到的像素点1数目最大区域即为序列号,具体操作如下。首先对图像进行水平方向投影得到图3,取经验阈值5,计算每行图元点数量的平均值T1,去除像素点数量小于平均值的行,行间隔小于5的行,归并入同一区域,取像素点最多的区域记录其上下边界ET1、EB1,以ET1、EB1为上下边界进行图像的切分后,将新的区域进行垂直方向投影得到图4,取经验阈值20,挑出像素点数量大于平均值的列,列间隔小于20的列进行区域合并,取像素点最多的区域记录其左右边界EL1,ER1,为了避免由于图像轻微倾斜而导致的过度切分损失部分边缘像素,上下左右适当留白,ET1=ET1-2,EB1=EB1+2,EL1=EL1-5,ER1=ER1+5,至此完成序列号的边界提取。
(3)序列号去除断点;
为了消除数字顶端和底部可能出现的由于印刷质量引起的断点,本实施例采用了对序列号进行适当膨胀的方法。
膨胀是将与图元接触的背景点合并到图元中,使图像中的图元“变粗”的操作。A被B膨胀,定义为:
本实施例对二值化后的序列号进行了一次膨胀,采用以1为半径构造的菱形结构元素对序列号进行膨胀,很好的消除了序列号顶端和底部可能出现的断点,完成了序列号分割前处理,处理效果如图5。
步骤2:序列号分割;
包括单个字符的提取和字符归一化处理;
(1)单个字符的提取;
目前,一些学者已经提出了一些字符切分方法。基于分水岭算法([文献5])的图像分割方法易造成激光印刷数字过度分割,并且对噪声较为敏感,计算量较大。滴水算法(Drop Falling)([文献6])根据水滴运动所经过的路径轨迹来确定字符的分割路径,该方法对粘连字符有很好的切割效果,但对于倾斜以及有断点的字符会造成字符断裂。基于背景细化的切分算法([文献7])根据细化后的背景来构造切分路径,发现背景上的特征点往往指向粘连位置或是可以成为切分路径的起始点。该算法分为包括四个阶段:第一个阶段细化背景;第二个阶段以细化后的背景为基础提取特征点,特征点包括角点、端点和交叉点;第三阶段构造候选切分路径,通过搜索来连接背景上的一些特征点,从而构成从图像的顶部延伸到底部的所有路径;第四阶段对候选路径进行评价,选择最佳切分路径,然而该算法未考虑字符粘连的情况,不适于实际应用。
本实施例的方法中,对图像进行了预处理,消除断点和孤立点使得序列号具有较好的质量然而略有粘连,故采用粘连字符分割法,通过追踪搜索得到上下轮廓特征,分析序列号投影轮廓的凹凸值,结合数字间的空白间隔来对数字进行分割,从而保证了数字分割的可靠性。
提取序列号的上下轮廓特征的具体方法如下,先采用自上而下的扫描方法得到顶端轮廓,用一维数组Top(x)记录轮廓上边缘到图片底部的距离,再采用自下而上的扫描方法得到底部轮廓,用一维数组Bottom(x)记录轮廓下边缘到图片底部的距离,分别记录上下轮廓的纵坐标,得到数字的最大高度
H max=max(Top(i)-Bottom(i)) (8)
计算图像顶部轮廓相邻两点之间的斜率:
T(i)=Top(i+1)-Top(i) (9)
取检测阈值为Hmax/6,从左到右检测Top(i)是否为下凹轮廓,凹度累加值初始值为0,当T(i)为负时处于下凹状态,凹度累加值与T(i)相加,检查凹度累加值是否大于阈值Hmax/6,若满足阈值且T(i+1)>0可判定此点为局部最低点,记录凹轮廓局部最低点横坐标Concave(i)=x,凹度累加值归零,从左到右遍历完Top(x)后,取字符宽度为Concave(n)的中值作为字符宽度的平均值记为Wmean。
设定两个切分条件为:
0.5*Wmean<=Concave(i+1)-Concave(i)<=1.5*Wmean (10)
Top(Concave(i))>=0.5*Hmax (11)
若同时满足上述条件(10)、(11)则切分点记为cuti=Concave(i);若满足条件(10)不满足条件(11)且Top(Concave(i))<0.5*Hmax则说明发生粘连,取[Bottom(Concave(i))-10,Bottom(Concave(i))+10]中的最大值的横坐标作为切分点。最后统计切分区域,若切分区域不为12则程序报错,机器报警。
(2)字符归一化;
切分后的字符大小不一,且由于外包装加工误差,部分数字轻微倾斜,因此采用最近邻域插值法将图像进行归一化处理,保证归一化后仍是二值图像。归一化处理将不标准的图像加工为尺寸统一的标准图像,同时保证了所有字符的最大宽度均为W、最大高度统一为H,从而避免由于字符大小不一和倾斜带来的字符识别误差,提高识别的准确性,归一化后的结果如图6所示。
步骤3:序列号识别;
包括数字平滑处理、连通域提取、数字1的分离和数字识别。
(1)数字平滑处理;
数学形态学的主要内容是设计一整套变换规则来描述图像的基本结构或基本特征([文献8])。作为形态学图像处理基础的膨胀和腐蚀是许多算法的基础。膨胀是将与图元接触的背景点合并到图元中,使图像中的图元“变粗”的操作;腐蚀则是将与背景点接触的图元边界释放到背景中,使图元“变细”的操作。膨胀可以连接窄的断裂,填满小的孔洞,但图元面积会有所增加。腐蚀可以消除小且无意义的物体,使边界向内部收缩,但是以减少图元面积为代价。二者都会使图元面积发生较大变化,而开运算则较好的解决了这个问题。
开运算采取同一结构元素对图元先进行腐蚀后进行膨胀,除去所有不能包含结构元素的部分,用来消除小颗粒噪声、在纤细点处分离物体、平滑图元轮廓的同时并不明显改变其面积,实质上是数学形态的非线性滤波去噪的一个过程。
其中腐蚀运算的定义为:
此公式表明,A被B腐蚀是包含在A中的B由z平移的所有点z的集合。
开运算的定义为:
此公式表明,开运算得到的结果是,A先被B腐蚀,然后再用B膨胀的结果。
(2)连通域提取;
首先提取数字的连通域数量,采用4联通寻找法。4联通寻找法[9]是指,从区域上任一点出发,通过上、下、左、右四个方向上的移动组合,抵达区域的任意像素的方法,其中上、下、左、右四个方向上的像素分别记作Ii(x,y+1)、Ii(x,y-1)、Ii(x-1,y)、Ii(x+1,y)。
连通域具体算法如下:
1)二值图像前景像素为1,背景像素为0。记当前图像连通域数量最大值为Lmax=1,从上至下扫描图像,对像素值为0的像素点Ii(x,y)不做处理。
2)对第一个像素值为1的点进行搜索,考察Ii(x,y+1)、Ii(x,y-1)、Ii(x-1,y)、Ii(x+1,y)的值是否有至少一个值为Lmax,若有,Ii(x,y)=Lmax,否则Ii(x,y)=Lmax+1。
3)分别将Ii(x,y+1)、Ii(x,y-1)、Ii(x-1,y)、Ii(x+1,y)作为当前点对其进行2)中的搜索。
4)重复2)、3)直至完成所有点的遍历。
遍历字符Ii上的所有点之后可以得到字符Ii中的所有连通部分,以及字符Ii的连通域数量Lmax,从而将数字按照连通域的数量初步分类为:包含3个连通域的8,包含2个连通域的0、4、6、9,包含一个连通域的1、2、3、5、7。
(3)数字1的分离;
对于数字1,识别率最高的判别方法,是宽高比,提取序列号的左右轮廓特征,先采用自左向右的扫描方法得到左端轮廓,再采用自右向左的扫描方法得到右端轮廓,用一维数组Left(x),Right(x)分别记录左右轮廓的横坐标。
由于归一化之后,所有字符宽高比相等,故对只包含一个连通域的字符,取3/4的字符高度进行宽度遍历,得到字符在3/4的字符高度内的最大宽度aW=max{Right(i)-Left(i)},取经验阈值0.35,当aW/H<0.35时,字符为1。
(4)数字识别;
依次计算字符右轮廓、下轮廓、左上轮廓、左下轮廓中相邻两点之间的斜率,计算斜率突变次数,计算时去除急剧变化的首尾两端。
计算图像底部轮廓相邻两点之间的斜率:
B(i)=(Bottom(i+1)-Bottom(i))/1i=4,2,......H-4 (14)
计算图像右轮廓相邻两点之间的斜率:
R(i)=(Right(i+1)-Right(i))/1 i=4,2,......H-4 (15)
为了提高识别的精度,将左轮廓分为上下两部分。
计算图像左上轮廓相邻两点之间的斜率:
L1(i)=(Left(i+1)-Left(i))/1 i=4,2,......(H/2+1) (16)
计算图像左下轮廓相邻两点之间的斜率:
L2(i)=(Left(i+1)-Left(i))/1 i=(H/2),……(H-4) (17)
设置斜率阈值为0.14*H,当B(i)、R(i)、L1(i)、L2(i)中任意一个值大于0.14*H时记做发生了一次突变如图7所示,分别记录B(i)、R(i)、L1(i)、L2(i)的突变次数为Bb、Rb、L1、L2。
以上述原理为依据,对数字0—9进行编码,得到0—9的编码表如表1所示;
表1编码表
以下为本发明的试验过程及试验结果;
本实施例的实验平台硬件部分采用工业级无风扇整机,CPU采用英特尔低功耗基于SOC单芯片处理器,支持工业通信,显示支持双显示器输出,可以实现无线上网。扫描相机采用200万1080P高清USB摄像头模组高速120帧低照度OV2710,采用1/2.7OV2710 CMOSSensor,拥有很好的低照度,照度可达星光级0.05Lux,模组搭配1/2.7"3.6mm 1080P高清镜头。支持USB2.0 OTG协议,可接入OTG设备。实验平台内部采用LED灯条照明,采用PS光学板LED-扩散板使得光线分布均匀,整机封装保证内部光线不受外部光线影响,将右侧定位板去除加入红外线传感器即可检测每个待识别的网银盾是否移动到位,应用于工厂中的流水化检测,目前该产品已经处于工厂实测阶段。
系统采用性能稳定的多用户网络操作系统Linux[10],Linux是一款用户可以免费获得的操作系统,并可以根据自己的需要任意修改其源代码([文献11]),具有字符界面和图形界面。软件部分采用Qt框架,Qt是一个多平台的C++图形用户界面应用程序框架([文献12])。它提供给应用程序开发者建立图形用户界面应用程序所需的所有功能。C++实现了面向对象的程序设计,语言灵活,功能强大,严谨、精确和数理化,并且在高级语言当中,C++的处理运行速度是最快的。
(1)样本的选取;
本实施例对100个网银盾共1200个字符进行识别,对每个网银盾识别的序列号和包装盒上扫描得出的条码号进行对比,号码一致则判断为正确,否则判断为加工包装错误;数字切分结果不为12个也会判断出错,未识别出数字亦视为错误的一种。设置声音报警器,出现上述任意一种错误后,鸣笛报警提示当前的网银盾需要重新校验。
(2)实验过程;
具体识别过程如下:
1、初步提取识别区域。
2、统计法分离序列号,对序列号进行去除断点处理。
3、单个字符分割后进行字符的归一化处理。
4、数字平滑处理后,连通域的提取,对只有一个连通域的字符,提取字符高度的3/4计算最大宽高比,分离数字1,对剩余数字通过切线斜率判别法进行判断。
识别结果如表2所示。
表2识别结果
针对本次100个网银盾样本1200字符的识别准确率达到99%,第三组网银盾识别出错是由于加工后带上了少许金属粉尘挡住数字9导致识别无效,擦掉粉尘后识别正确,可以说本发明对网银盾的识别准确率可达到100%。
文献13中,作者着手于数字的形状结构根据宽高比、上横线长度、下横线长度、圈的位置和个数进行识别,识别速度较快,但该算法不适用于轻微倾斜有毛刺的数字。文献14采用投影法切分单个字符,引入隶属度概念从而改进了经典模板匹配方法,极大地增强了识别过程中的抗干扰能力,然而识别速度有待提高。文献15中,开发了可以应用于Android的彩印标签识别app,此方法基于统计学抽取数字码特征,同时利用特征提取方法建立数字码模式特征可对彩印标签进行实时识别,识别效果良好,正确识别率可达96.75%。
本发明主要对网银盾激光印刷的序列号部分进行识别,在识别区域限定,提取与分割序列号,和数字识别方面进行了系统性的分析。提出了一种基于连通域,3/4高度内的最大宽高比,以及切线斜率的数字识别方法,相对于之前的数字识别方法,计算量较小,识别速度快,准确率高,通过扩展可应用于其他激光印刷字体的识别。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (7)
1.一种断裂粘连激光印刷数字串识别方法,其特征在于,包括以下步骤:
步骤1:对获得的包含序列号在内的图像进行预处理;
包括图像二值化、序列号边界确定和序列号去除断点;
步骤2:序列号分割;
包括单个字符的提取和字符归一化处理;
其中,所述单个字符的提取是采用粘连字符分割法,提取序列号的上下轮廓特征,分析序列号上下轮廓的凹凸值,结合数字间的空白间隔来对数字进行分割;采用最近邻域插值法将图像进行归一化处理;
所述提取序列号的上下轮廓特征,首先采用自上而下的扫描方法得到顶端轮廓,用一维数组Top(x)记录轮廓上边缘到图片底部的距离;然后采用自下而上的扫描方法得到底部轮廓,用一维数组Bottom(x)记录轮廓下边缘到图片底部的距离,分别记录上下轮廓的纵坐标Top(i)和Bottom(i),得到数字的最大高度Hmax:
Hmax=max(Top(i)-Bottom(i))
计算图像顶部轮廓相邻两点之间的斜率:
T(i)=Top(i+1)-Top(i)
取检测阈值为Hmax/6,从左到右检测Top(i)是否为下凹轮廓,凹度累加值初始值为0,当T(i)为负时处于下凹状态,凹度累加值与T(i)相加,检查凹度累加值是否大于阈值Hmax/6,若满足阈值且T(i+1)>0可判定此点为局部最低点,记录凹轮廓局部最低点横坐标Concave(i)=x,凹度累加值归零,从左到右遍历完Top(x)后,取字符宽度为Concave(n)的中值作为字符宽度的平均值记为Wmean;
设定两个切分条件为:
条件1:0.5*Wmean<=Concave(i+1)-Concave(i)<=1.5*Wmean;
条件2:Top(Concave(i))>=0.5*Hmax;
若同时满足上述条件1和2,则切分点记为cuti=Concave(i);
若满足条件1不满足条件2,且Top(Concave(i))<0.5*Hmax,则说明发生粘连,取[Bottom(Concave(i))-10,Bottom(Concave(i))+10]中的最大值的横坐标作为切分点;
步骤3:序列号识别;
包括数字平滑处理、连通域提取、数字1的分离和数字识别;
其中,所述数字识别,依次计算字符右轮廓、下轮廓、左上轮廓、左下轮廓中相邻两点之间的斜率,计算斜率突变次数;
计算图像底部轮廓相邻两点之间的斜率:
B(i)=(Bottom(i+1)-Bottom(i))/1i=4,2,......H-4
计算图像右轮廓相邻两点之间的斜率:
R(i)=(Right(i+1)-Right(i))/1i=4,2,......H-4
将左轮廓分为上下两部分;
计算图像左上轮廓相邻两点之间的斜率:
L1(i)=(Left(i+1)-Left(i))/1i=4,2,......(H/2+1)
计算图像左下轮廓相邻两点之间的斜率:
L2(i)=(Left(i+1)-Left(i))/1i=(H/2),……(H-4)
设置斜率阈值为0.14*H,当B(i)、R(i)、L1(i)、L2(i)中任意一个值大于0.14*H时记做发生了一次突变,分别记录B(i)、R(i)、L1(i)、L2(i)的突变次数为Bb、Rb、L1b、L2b;
最后以上述原理为依据,对数字0—9进行编码,得到0—9的编码表。
2.根据权利要求1所述的断裂粘连激光印刷数字串识别方法,其特征在于:步骤1中,采用全局阈值法进行图像二值化;所述序列号边界确定,是对二值化处理后的区域采用统计法,0代表背景,1代表图元,提取统计得到的像素点1数目最大区域即为序列号;所述序列号去除断点,是对二值化后的序列号进行了一次膨胀,采用以1为半径构造的菱形结构元素对序列号进行膨胀,消除序列号顶端和底部可能出现的断点。
3.根据权利要求1或2所述的断裂粘连激光印刷数字串识别方法,其特征在于,步骤1中所述序列号边界确定,具体实现包括以下子步骤:
步骤1.1:对二值化处理后的区域进行水平方向投影,取经验阈值5,计算每行图元点数量的平均值T1,去除像素点数量小于平均值的行,行间隔小于5的行,归并入同一区域,取像素点最多的区域记录其上下边界ET1、EB1;
步骤1.2:以ET1、EB1为上下边界进行图像的切分后,将新的区域进行垂直方向投影;取经验阈值20;选择像素点数量大于平均值的列,列间隔小于20的列进行区域合并,取像素点最多的区域记录其左右边界EL1,ER1,至此完成序列号的边界提取。
4.根据权利要求3所述的断裂粘连激光印刷数字串识别方法,其特征在于:步骤1.2中,为了避免由于图像轻微倾斜而导致的过度切分损失部分边缘像素,上下左右边界进行留白处理,处理原则为:ET1=ET1-2,EB1=EB1+2,EL1=EL1-5,ER1=ER1+5。
5.根据权利要求1所述的断裂粘连激光印刷数字串识别方法,其特征在于:步骤3中,所述数字平滑处理,是采取同一结构元素对图元先进行腐蚀后进行膨胀,除去所有不能包含结构元素的部分。
6.根据权利要求1所述的断裂粘连激光印刷数字串识别方法,其特征在于:步骤3中,所述连通域提取,是采用4联通寻找法进行连通域提取。
7.根据权利要求1所述的断裂粘连激光印刷数字串识别方法,其特征在于:步骤3中,所述数字1的分离,采用宽高比判别方法,提取序列号的左右轮廓特征,先采用自左向右的扫描方法得到左端轮廓,首先再采用自右向左的扫描方法得到右端轮廓,用一维数组Left(x),Right(x)分别记录左右轮廓的横坐标;然后对只包含一个连通域的字符,取3/4的字符高度进行宽度遍历,得到字符在3/4的字符高度内的最大宽度aW=max{Right(i)-Left(i)},取经验阈值0.35,当aW/H<0.35时,字符为1;其中所有字符的最大宽度均为W、最大高度为H。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810796514.0A CN109086769B (zh) | 2018-07-19 | 2018-07-19 | 一种断裂粘连激光印刷数字串识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810796514.0A CN109086769B (zh) | 2018-07-19 | 2018-07-19 | 一种断裂粘连激光印刷数字串识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109086769A CN109086769A (zh) | 2018-12-25 |
CN109086769B true CN109086769B (zh) | 2021-11-02 |
Family
ID=64837942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810796514.0A Expired - Fee Related CN109086769B (zh) | 2018-07-19 | 2018-07-19 | 一种断裂粘连激光印刷数字串识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109086769B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114255467A (zh) * | 2020-09-22 | 2022-03-29 | 阿里巴巴集团控股有限公司 | 文本识别方法及装置、特征提取神经网络训练方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184399A (zh) * | 2011-03-31 | 2011-09-14 | 上海名图信息技术有限公司 | 基于水平投影和连通域分析的字符分割方法 |
CN102364496A (zh) * | 2011-11-24 | 2012-02-29 | 无锡慧眼电子科技有限公司 | 一种基于图像分析的汽车车牌自动识别方法及系统 |
CN104408455A (zh) * | 2014-11-27 | 2015-03-11 | 上海理工大学 | 粘连字符分割方法 |
CN104463124A (zh) * | 2014-12-11 | 2015-03-25 | 天津普达软件技术有限公司 | 一种奶盒喷打字符识别的方法 |
CN105894487A (zh) * | 2014-08-25 | 2016-08-24 | 武汉科技大学 | 钢材图像编号的提取与分割方法 |
EP3608835A1 (fr) * | 2018-08-10 | 2020-02-12 | Idemia Identity & Security France | Procede de traitement d'images d'empreintes |
-
2018
- 2018-07-19 CN CN201810796514.0A patent/CN109086769B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184399A (zh) * | 2011-03-31 | 2011-09-14 | 上海名图信息技术有限公司 | 基于水平投影和连通域分析的字符分割方法 |
CN102364496A (zh) * | 2011-11-24 | 2012-02-29 | 无锡慧眼电子科技有限公司 | 一种基于图像分析的汽车车牌自动识别方法及系统 |
CN105894487A (zh) * | 2014-08-25 | 2016-08-24 | 武汉科技大学 | 钢材图像编号的提取与分割方法 |
CN104408455A (zh) * | 2014-11-27 | 2015-03-11 | 上海理工大学 | 粘连字符分割方法 |
CN104463124A (zh) * | 2014-12-11 | 2015-03-25 | 天津普达软件技术有限公司 | 一种奶盒喷打字符识别的方法 |
EP3608835A1 (fr) * | 2018-08-10 | 2020-02-12 | Idemia Identity & Security France | Procede de traitement d'images d'empreintes |
Non-Patent Citations (1)
Title |
---|
"纸币序列号定位与分割方法研究";李朝;《计算技术与自动化》;20120630;第31卷(第2期);第74-77页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109086769A (zh) | 2018-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018018788A1 (zh) | 一种基于图像识别的计量表抄表装置及其方法 | |
CN105373794B (zh) | 一种车牌识别方法 | |
JP5379085B2 (ja) | スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム | |
TWI497422B (zh) | 車牌影像辨識系統及方法 | |
Gatos et al. | ICDAR2009 handwriting segmentation contest | |
Minetto et al. | SnooperText: A text detection system for automatic indexing of urban scenes | |
TWI384408B (zh) | 影像辨識以及輸出方法與其系統 | |
Minetto et al. | Snoopertext: A multiresolution system for text detection in complex visual scenes | |
CN115082419A (zh) | 一种吹塑箱包生产缺陷检测方法 | |
CN107103317A (zh) | 基于图像融合和盲反卷积的模糊车牌图像识别算法 | |
CN101122953A (zh) | 一种图片文字分割的方法 | |
CN116071763B (zh) | 基于文字识别的教辅图书智能校编系统 | |
CN112101108B (zh) | 一种基于图形极点位置特征的左右转交通标志识别方法 | |
Boussellaa et al. | Unsupervised block covering analysis for text-line segmentation of Arabic ancient handwritten document images | |
CN111259893A (zh) | 一种基于深度学习的智能工具管理方法 | |
Kasar et al. | Multi-script and multi-oriented text localization from scene images | |
Feild et al. | Scene text recognition with bilateral regression | |
CN109086769B (zh) | 一种断裂粘连激光印刷数字串识别方法 | |
Verma et al. | A novel approach for structural feature extraction: contour vs. direction | |
CN110046618B (zh) | 基于机器学习和最大极值稳定区域的车牌识别方法 | |
CN116580006A (zh) | 一种基于机器视觉的瓶装产品贴标质量检测方法 | |
JP6377214B2 (ja) | テキスト検出方法および装置 | |
Huang | A novel video text extraction approach based on Log-Gabor filters | |
JP2005250786A (ja) | 画像認識方法 | |
CN109086766B (zh) | 一种基于积分图的多阈值融合冠字号提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211102 |