CN104616009B - 一种字符切割识别方法 - Google Patents

一种字符切割识别方法 Download PDF

Info

Publication number
CN104616009B
CN104616009B CN201510083858.3A CN201510083858A CN104616009B CN 104616009 B CN104616009 B CN 104616009B CN 201510083858 A CN201510083858 A CN 201510083858A CN 104616009 B CN104616009 B CN 104616009B
Authority
CN
China
Prior art keywords
character
cutting point
character row
point template
cutting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510083858.3A
Other languages
English (en)
Other versions
CN104616009A (zh
Inventor
王卫锋
邱新华
王锟
其他发明人请求不公开姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdian Yuntong Financial Electronic Co Ltd
Original Assignee
Guangdian Yuntong Financial Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdian Yuntong Financial Electronic Co Ltd filed Critical Guangdian Yuntong Financial Electronic Co Ltd
Priority to CN201510083858.3A priority Critical patent/CN104616009B/zh
Publication of CN104616009A publication Critical patent/CN104616009A/zh
Priority to PCT/CN2015/082438 priority patent/WO2016127545A1/zh
Priority to RU2017131524A priority patent/RU2678485C1/ru
Priority to US15/549,126 priority patent/US10430681B2/en
Priority to EP15881706.4A priority patent/EP3258422A4/en
Priority to HK18105990.9A priority patent/HK1246907A1/zh
Application granted granted Critical
Publication of CN104616009B publication Critical patent/CN104616009B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明实施例公开了一种字符切割识别方法,用于解决现有切分方法对于复杂背景下的字符识别能力不高,抗脏污干扰能力差的问题。本发明实施例方法包括:采集图像数据,得到待识别图像;在所述待识别图像上定位字符行候选区域;获取预置的字符行先验信息,所述字符行先验信息包括字符个数、字符间距和字符大小;根据所述字符行先验信息获取对应的切分点模板;获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度;确定可信度最高的位置为最优切分位置;根据所述切分点模板和所述最优切分位置对所述字符行候选区域进行切分,得到若干单个字符区域;对所述单个字符区域进行字符识别,得到对应的识别结果。

Description

一种字符切割识别方法
技术领域
本发明涉及字符光学识别领域,尤其涉及一种字符切割识别方法。
背景技术
光学字符识别(Optical Character Recognition)是利用电子设备检测识别打印的字符。随着社会生产和生活的自动化、智能化程度越来越高,OCR的应用越来越广泛,例如各种包装上印刷检测系统、智能交通中车牌定位与字符识别系统、钞票识别中冠字号码识别、票据识别中的序列号识别、版面分析等等。因此开发高效光学字符识别系统具有重大的社会效益和经济效益。
在实际应用中,由于图像摄取的场景不一致性以及传感器、光照等因素的影响,经常出现图像背景复杂的情况,如底纹、印章和图案等。OCR的瓶颈不再是分类器的设计问题,而主要取决于字符切分的准确性,特别是粘连断裂字符行的切分问题,为此,需要采用更加高效的字符切分方法。
目前,一般的字符切分方法为基于图像的切分方法,以图像起始点为候选切分点,然后确定其他有效切分点,从有效切分点中筛选出目标切分点的方法,此方法利用单个字符的特性得到目标切分点,从而对切分后的字符进行识别。然而,该切分方法对于复杂背景下的字符识别能力不高,抗脏污干扰能力差。
发明内容
本发明实施例提供了一种字符切割识别方法,能够解决现有切分方法对于复杂背景下的字符识别能力不高,抗脏污干扰能力差的问题。
本发明实施例提供的一种字符切割识别方法,包括:
采集图像数据,得到待识别图像;
在所述待识别图像上定位字符行候选区域;
获取预置的字符行先验信息,所述字符行先验信息包括字符个数、字符间距和字符大小;
根据所述字符行先验信息获取对应的切分点模板;
获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度;
确定可信度最高的位置为最优切分位置;
根据所述切分点模板和所述最优切分位置对所述字符行候选区域进行切分,得到若干单个字符区域;
对所述单个字符区域进行字符识别,得到对应的识别结果。
可选地,所述获取预置的字符行先验信息具体包括:
根据所述待识别图像的类型获取预置的字符行先验信息;
或,根据所述字符行候选区域的方位特征获取预置的字符行先验信息。
可选地,所述根据所述字符行先验信息获取对应的切分点模板为:
根据所述字符行先验信息创建并初始化所述切分点模板;
或,根据所述字符行先验信息和预置的切分索引表获取到对应的切分点模板,所述切分索引表包括所述字符行先验信息与所述切分点模板的对应关系。
可选地,获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度具体包括:
记录下所述切分点模板遍历所述字符行候选区域时的位置信息;
获取所述位置信息对应的可信度。
可选地,所述获取所述位置信息对应的可信度具体包括:
获取所述字符行候选区域在字符切分点的左边界上的第一有效像素点的第一数量,所述切分点模板由若干个字符切分点组成,每个所述字符切分点与所述字符行上的一个字符对应,每个所述字符切分点均包括左边界和右边界,所述第一有效像素点为灰度值处于预设的第一阈值范围内的像素点;
根据所述第一数量和预设的第一权重得到第一评价值;
获取所述字符行候选区域在字符切分点的右边界上的第二有效像素点的第二数量,所述第二有效像素点为灰度值处于预设的第二阈值范围内的像素点;
根据所述第二数量和预设的第二权重得到第二评价值;
获取所述字符行候选区域在所述切分点模板范围内的第三有效像素点的第三数量,所述第三有效像素点为灰度值处于预设的第三阈值范围内的像素点;
根据所述第三数量和预设的第三权重得到第三评价值;
根据所述第一评价值、第二评价值和第三评价值获得所述位置信息对应的可信度。
可选地,根据所述字符行先验信息获取对应的切分点模板之后还包括:
获取所述待识别图像的二值化图像;
获取所述二值化图像水平方向的投影波形;
根据所述投影波形更新所述切分点模板的上边界和下边界。
可选地,根据所述投影波形更新所述切分点模板的上边界和下边界具体包括:
将所述投影波形中灰度值大于预设的第四阈值的最上方位置确定并更新为所述切分点模板的上边界;
将所述投影波形中灰度值大于预设的第五阈值的最下方位置确定并更新为所述切分点模板的下边界。
可选地,在所述待识别图像上定位字符行候选区域具体包括:
在所述待识别图像上定位字符行所在的感兴趣区域;
对所述感兴趣区域进行仿射变换和双线性插值,得到校正图像;
在所述校正图像上定位字符行候选区域。
可选地,对所述单个字符区域进行字符识别,得到对应的识别结果具体包括:
获取所述单个字符区域中的字符特征数据;
根据所述字符特征数据进行字符识别,得到识别结果。
可选地,所述字符特征数据为字符的轮廓特征数据。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,首先,采集图像数据,得到待识别图像;在所述待识别图像上定位字符行候选区域;获取预置的字符行先验信息,所述字符行先验信息包括字符个数、字符间距和字符大小;然后根据所述字符行先验信息获取对应的切分点模板;获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度;接着,确定可信度最高的位置为最优切分位置;根据所述切分点模板和所述最优切分位置对所述字符行候选区域进行切分,得到若干单个字符区域;最后,对所述单个字符区域进行字符识别,得到对应的识别结果。在本发明实施例中,通过引入切分点模板和确定最优切分位置,提升字符切分方法的抗脏污干扰能力,即便在复杂背景下,该字符切割识别方法仍能具备良好的识别能力,提高字符识别效率。
附图说明
图1为本发明实施例中一种字符切割识别方法第一实施例流程图;
图2为本发明实施例中一种字符切割识别方法第二实施例流程图;
图3为本发明实施例中一种字符切割识别方法第三实施例流程图;
图4为本发明实施例中待识别图像的示意图;
图5a、图5b为本发明实施例中定位得到的字符行候选区域的示意图;
图6为本发明实施例中切分点模板的结构示意图;
图7a为切分点模板的上边界和下边界更新前的示意图;
图7b、图7c为切分点模板的上边界和下边界更新后的示意图;
图8为利用投影波形给切分点模板上每个字符精确定位的示意图;
图9a、图9b为本发明实施例中一个字符切割识别方法字符切分的效果示意图;
图10为传统方法中字符切分的效果示意图。
具体实施方式
本发明实施例提供了一种字符切割识别方法,用于解决现有切分方法对于复杂背景下的字符识别能力不高,抗脏污干扰能力差的问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中一种字符切割识别方法的第一实施例包括:
101、采集图像数据,得到待识别图像;
首先,采集图像数据,得到待识别图像。
102、在该待识别图像上定位字符行候选区域;
在得到待识别图像之后,可以在该待识别图像上定位字符行候选区域。
103、获取预置的字符行先验信息;
另外,可以获取预置的字符行先验信息,该字符行先验信息包括字符个数、字符间距和字符大小。
104、根据该字符行先验信息获取对应的切分点模板;
在获取预置的字符行先验信息之后,可以根据该字符行先验信息获取对应的切分点模板。
105、获取该切分点模板遍历该字符行候选区域时不同位置上的可信度;
在根据该字符行先验信息获取对应的切分点模板之后,可以获取该切分点模板遍历该字符行候选区域时不同位置上的可信度。
106、确定可信度最高的位置为最优切分位置;
在获取到不同位置上的可信度之后,可以确定可信度最高的位置为最优切分位置。
107、根据该切分点模板和该最优切分位置对该字符行候选区域进行切分,得到若干单个字符区域;
在确定可信度最高的位置为最优切分位置之后,可以根据该切分点模板和该最优切分位置对该字符行候选区域进行切分,得到若干单个字符区域。
108、对该单个字符区域进行字符识别,得到对应的识别结果。
在得到若干单个字符区域之后,可以对该单个字符区域进行字符识别,得到对应的识别结果。
本实施例中,首先,采集图像数据,得到待识别图像;在该待识别图像上定位字符行候选区域;获取预置的字符行先验信息,该字符行先验信息包括字符个数、字符间距和字符大小;然后根据该字符行先验信息获取对应的切分点模板;获取该切分点模板遍历该字符行候选区域时不同位置上的可信度;接着,确定可信度最高的位置为最优切分位置;根据该切分点模板和该最优切分位置对该字符行候选区域进行切分,得到若干单个字符区域;最后,对该单个字符区域进行字符识别,得到对应的识别结果。在本实施例中,通过引入切分点模板和确定最优切分位置,提升字符切分方法的抗脏污干扰能力,即便在复杂背景下,该字符切割识别方法仍能具备良好的识别能力,提高字符识别效率。
为便于理解,下面对本发明实施例中的一种字符切割识别方法进行详细描述,请参阅图2,本发明实施例中一种字符切割识别方法的第二实施例包括:
201、采集图像数据,得到待识别图像;
首先,需要采集图像数据,得到待识别图像。该图像数据的来源可以是钞票、车票、票据、包装印刷、书籍版面等。
202、在该待识别图像上定位字符行候选区域;
在得到待识别图像之后,可以在该待识别图像上定位字符行候选区域。可以理解的是,在预先知道该待识别图像的类型或者来源时,可以很容易地定位所需识别的字符行位置。例如,该待识别图像为钞票(人民币)的正面,则该字符行候选区域的位置即为钞票的代码所在位置,位于该待识别图像的左下角。
203、获取预置的字符行先验信息;
另外,还需要获取预置的字符行先验信息,该字符行先验信息包括字符个数、字符间距和字符大小。具体可以是,根据该待识别图像的类型获取预置的字符行先验信息,或者,根据该字符行候选区域的方位特征获取预置的字符行先验信息。
需要说明的是,当得知该待识别图像的类型时,该字符行的规格是固定的,也即字符个数、字符间距和字符大小都是固定不变的,因此该字符行先验信息也可以对应获取到。例如,当该待识别图像为钞票的正面时,该字符行为钞票代码,而钞票代码的字符行先验信息是固有的,可以预置在系统中。另外,当得知该字符行候选区域的方位特征时,也可以轻松获取到对应的字符行先验信息。例如,在发票联上,存在“发票代码”、“发票号码”、“订单号”等字符行,此时若知道该字符行候选区域的方位特征,即知道该字符行处于整个待识别图像的大致那个位置上时,既可以得知该字符行是属于“发票代码”、“发票号码”、“订单号”等中的哪一个类型,从而可以得到对应的字符行先验信息。
204、根据该字符行先验信息获取对应的切分点模板;
在获取预置的字符行先验信息之后,可以根据该字符行先验信息获取对应的切分点模板。具体可以是,根据该字符行先验信息创建并初始化该切分点模板;或,根据该字符行先验信息和预置的切分索引表获取到对应的切分点模板,该切分索引表包括该字符行先验信息与该切分点模板的对应关系。
需要说明的是,若根据该字符行先验信息创建并初始化该切分点模板,由于该字符行先验信息包括字符个数、字符间距和字符大小,因此容易获得该切分点模板的长度和高度,从而创建出对应的切分点模板。另外,也可以是将该字符行先验信息中每个字符对应的字符切分点创建出来,然后将所有字符切分点按照字符行先验信息中排列的顺序排列起来得到对应的切分点模板。其中,从字符行先验信息中可以得知字符大小,该字符大小包括字符的高和宽,因而字符切分点的左右边界和上下边界便可定义出来。在将该字符切分点按照一定顺序进行排列时,需要按照该字符间距进行排列分布,以便使得创建出来的切分点模板与该字符行先验信息对应。
需要说明的是,若根据该字符行先验信息和预置的切分索引表获取到对应的切分点模板,则该切分索引表是预设在系统内的,该字符行先验信息对应的切分点模板也可以预先存储在系统内,在需要时直接查询调用即可。
205、获取该待识别图像的二值化图像;
在得到该待识别图像之后,可以获取该待识别图像的二值化图像。具体可以是,将该待识别图像中大于某预设阈值的像素点的数值定义为1,而小于该预设阈值的像素点的数值定义为0,则可得到该二值化图像。
206、获取该二值化图像水平方向的投影波形;
在获取该待识别图像的二值化图像之后,可以获取该二值化图像水平方向的投影波形。
207、根据该投影波形更新该切分点模板的上边界和下边界;
在获取该二值化图像水平方向的投影波形之后,可以根据该投影波形更新该切分点模板的上边界和下边界。具体可以是,将该投影波形中灰度值大于预设的第四阈值的最上方位置确定并更新为该切分点模板的上边界;将该投影波形中灰度值大于预设的第五阈值的最下方位置确定并更新为该切分点模板的下边界,从而使得该切分点模板的上边界和下边界更加贴近该字符行,为后续的抗脏污切分和准确的字符识别提供保障。
208、记录下该切分点模板遍历该字符行候选区域时的位置信息;
在确定下该切分点模板之后,可以记录下该切分点模板遍历该字符行候选区域时的位置信息。可以理解的是,该切分点模板可以在该字符行候选区域进行滑动直至遍历整个字符行候选区域,在该切分点模板遍历的过程中,其会出现在字符行候选区域的所有位置上,不同的位置对应产生不同的位置信息。
209、获取该位置信息对应的可信度;
在记录下该切分点模板遍历该字符行候选区域时的位置信息之后,可以获取该位置信息对应的可信度。
需要说明的是,本实施例中可信度的获取方法具体可以为:
获取该字符行候选区域在字符切分点的左边界上的第一有效像素点的第一数量,该切分点模板由若干个字符切分点组成,每个该字符切分点与该字符行上的一个字符对应,每个该字符切分点均包括左边界和右边界,该第一有效像素点为灰度值处于预设的第一阈值范围内的像素点;
根据该第一数量和预设的第一权重得到第一评价值;
获取该字符行候选区域在字符切分点的右边界上的第二有效像素点的第二数量,该第二有效像素点为灰度值处于预设的第二阈值范围内的像素点;
根据该第二数量和预设的第二权重得到第二评价值;
获取该字符行候选区域在该切分点模板范围内的第三有效像素点的第三数量,该第三有效像素点为灰度值处于预设的第三阈值范围内的像素点;
根据该第三数量和预设的第三权重得到第三评价值;
根据该第一评价值、第二评价值和第三评价值获得该位置信息对应的可信度。
通过加入了第一权重、第二权重和第三权重分别获得的第一评价值、第二评价值和第三评价值来综合得出该位置信息对应的可信度,使得该可信度能更准确有效地反应了切分点模板在该字符行候选区域的该位置信息的切分精确度和抗脏污能力。
210、确定可信度最高的位置为最优切分位置;
在获取所有位置信息对应的可信度之后,可以确定可信度最高的位置为最优切分位置。
211、根据该切分点模板和该最优切分位置对该字符行候选区域进行切分,得到若干单个字符区域;
在确定下可信度最高的位置为最优切分位置之后,可以根据该切分点模板和该最优切分位置对该字符行候选区域进行切分,得到若干单个字符区域。
212、对该单个字符区域进行字符识别,得到对应的识别结果。
在得到若干单个字符区域之后,可以对该单个字符区域进行字符识别,得到对应的识别结果。
本实施例中,通过加入了第一权重、第二权重和第三权重分别获得的第一评价值、第二评价值和第三评价值来综合得出该位置信息对应的可信度,使得该可信度能更准确有效地反应了切分点模板在该字符行候选区域的该位置信息的切分精确度和抗脏污能力;
进一步地,通过获取待识别图像二值化后的投影波形,并根据该投影波形更新切分点模板的上下边界,从而使得该切分点模板的上边界和下边界更加贴近该字符行,为后续的抗脏污切分和准确的字符识别提供保障。
上面第二实施例主要从提升抗脏污能力方面描述了一种字符切割识别方法,下面将从另一个角度对一种字符切割识别方法进行详细的描述,请参阅图3,本发明实施例中一种字符切割识别方法的第三实施例包括:
301、采集图像数据,得到待识别图像;
首先,需要采集图像数据,得到待识别图像。该图像数据的来源可以是钞票、车票、票据、包装印刷、书籍版面等。
302、在该待识别图像上定位字符行所在的感兴趣区域;
在得到待识别图像之后,可以在该待识别图像上定位字符行所在的感兴趣区域。可以理解的是,在预先知道该待识别图像的类型或者来源时,可以很容易地定位所需识别的字符行位置。例如,该待识别图像为钞票(人民币)的正面,则该字符行候选区域的位置即为钞票的代码所在位置,位于该待识别图像的左下角。
需要说明的是,此时在该待识别图像上定位出该感兴趣区域时,可以是粗定位,即不要求定位精确,只要能快速定位到字符行所在的大概位置即可。
303、对该感兴趣区域进行仿射变换和双线性插值,得到校正图像;
在定位出该感兴趣区域之后,可以对该感兴趣区域进行仿射变换和双线性插值,得到校正图像。可以理解的是,经过仿射变换和双线性插值校正的校正图像,更有利于字符的切分和识别。
304、在该校正图像上定位字符行候选区域;
在得到该校正图像之后,可以在该校正图像上定位字符行候选区域。需要说明的是,此时在该校正图像上定位字符行候选区域可以是精定位,即定位要求精确,尽可能使得字符行候选区域正好覆盖所需识别的字符行为佳,以便减少后期步骤中切分点模板的调整时间,提高效率。
305、获取预置的字符行先验信息;
另外,还需要获取预置的字符行先验信息,该字符行先验信息包括字符个数、字符间距和字符大小。具体可以是,根据该待识别图像的类型获取预置的字符行先验信息,或者,根据该字符行候选区域的方位特征获取预置的字符行先验信息。
需要说明的是,当得知该待识别图像的类型时,该字符行的规格是固定的,也即字符个数、字符间距和字符大小都是固定不变的,因此该字符行先验信息也可以对应获取到。例如,当该待识别图像为钞票的正面时,该字符行为钞票代码,而钞票代码的字符行先验信息是固有的,可以预置在系统中。另外,当得知该字符行候选区域的方位特征时,也可以轻松获取到对应的字符行先验信息。例如,在发票联上,存在“发票代码”、“发票号码”、“订单号”等字符行,此时若知道该字符行候选区域的方位特征,即知道该字符行处于整个待识别图像的大致那个位置上时,既可以得知该字符行是属于“发票代码”、“发票号码”、“订单号”等中的哪一个类型,从而可以得到对应的字符行先验信息。
306、根据该字符行先验信息获取对应的切分点模板;
在获取预置的字符行先验信息之后,可以根据该字符行先验信息获取对应的切分点模板。具体可以是,根据该字符行先验信息创建并初始化该切分点模板;或,根据该字符行先验信息和预置的切分索引表获取到对应的切分点模板,该切分索引表包括该字符行先验信息与该切分点模板的对应关系。
需要说明的是,若根据该字符行先验信息创建并初始化该切分点模板,由于该字符行先验信息包括字符个数、字符间距和字符大小,因此容易获得该切分点模板的长度和高度,从而创建出对应的切分点模板。另外,也可以是将该字符行先验信息中每个字符对应的字符切分点创建出来,然后将所有字符切分点按照字符行先验信息中排列的顺序排列起来得到对应的切分点模板。其中,从字符行先验信息中可以得知字符大小,该字符大小包括字符的高和宽,因而字符切分点的左右边界和上下边界便可定义出来。在将该字符切分点按照一定顺序进行排列时,需要按照该字符间距进行排列分布,以便使得创建出来的切分点模板与该字符行先验信息对应。
需要说明的是,若根据该字符行先验信息和预置的切分索引表获取到对应的切分点模板,则该切分索引表是预设在系统内的,该字符行先验信息对应的切分点模板也可以预先存储在系统内,在需要时直接查询调用即可。
307、获取该待识别图像的二值化图像;
在得到该待识别图像之后,可以获取该待识别图像的二值化图像。具体可以是,将该待识别图像中大于某预设阈值的像素点的数值定义为1,而小于该预设阈值的像素点的数值定义为0,则可得到该二值化图像。
308、获取该二值化图像水平方向的投影波形;
在获取该待识别图像的二值化图像之后,可以获取该二值化图像水平方向的投影波形。
309、根据该投影波形更新该切分点模板的上边界和下边界;
在获取该二值化图像水平方向的投影波形之后,可以根据该投影波形更新该切分点模板的上边界和下边界。具体可以是,将该投影波形中灰度值大于预设的第四阈值的最上方位置确定并更新为该切分点模板的上边界;将该投影波形中灰度值大于预设的第五阈值的最下方位置确定并更新为该切分点模板的下边界,从而使得该切分点模板的上边界和下边界更加贴近该字符行,为后续的抗脏污切分和准确的字符识别提供保障。
需要说明的是,该投影波形也可以通过梯度与第四阈值或第五阈值进行比较来确认该上下边界。比如:将该投影波形中梯度大于预设的第四阈值的最上方位置确定并更新为该切分点模板的上边界;将该投影波形中梯度大于预设的第五阈值的最下方位置确定并更新为该切分点模板的下边界。
310、记录下该切分点模板遍历该字符行候选区域时的位置信息;
在确定下该切分点模板之后,可以记录下该切分点模板遍历该字符行候选区域时的位置信息。可以理解的是,该切分点模板可以在该字符行候选区域进行滑动直至遍历整个字符行候选区域,在该切分点模板遍历的过程中,其会出现在字符行候选区域的所有位置上,不同的位置对应产生不同的位置信息。
311、获取该位置信息对应的可信度;
在记录下该切分点模板遍历该字符行候选区域时的位置信息之后,可以获取该位置信息对应的可信度。
需要说明的是,本实施例中可信度的获取方法具体可以为:
获取该字符行候选区域在字符切分点的左边界上的第一有效像素点的第一数量,该切分点模板由若干个字符切分点组成,每个该字符切分点与该字符行上的一个字符对应,每个该字符切分点均包括左边界和右边界,该第一有效像素点为灰度值处于预设的第一阈值范围内的像素点;
根据该第一数量和预设的第一权重得到第一评价值;
获取该字符行候选区域在字符切分点的右边界上的第二有效像素点的第二数量,该第二有效像素点为灰度值处于预设的第二阈值范围内的像素点;
根据该第二数量和预设的第二权重得到第二评价值;
获取该字符行候选区域在该切分点模板范围内的第三有效像素点的第三数量,该第三有效像素点为灰度值处于预设的第三阈值范围内的像素点;
根据该第三数量和预设的第三权重得到第三评价值;
根据该第一评价值、第二评价值和第三评价值获得该位置信息对应的可信度。
通过加入了第一权重、第二权重和第三权重分别获得的第一评价值、第二评价值和第三评价值来综合得出该位置信息对应的可信度,使得该可信度能更准确有效地反应了切分点模板在该字符行候选区域的该位置信息的切分精确度和抗脏污能力。
需要说明的是,本实施例中,该第一有效像素点、第二有效像素点和第三有效像素点可以分别是梯度处于预设的第一阈值、第二阈值和第三阈值范围内的像素点。
312、确定可信度最高的位置为最优切分位置;
在获取所有位置信息对应的可信度之后,可以确定可信度最高的位置为最优切分位置。
313、根据该切分点模板和该最优切分位置对该字符行候选区域进行切分,得到若干单个字符区域;
在确定下可信度最高的位置为最优切分位置之后,可以根据该切分点模板和该最优切分位置对该字符行候选区域进行切分,得到若干单个字符区域。
314、获取该单个字符区域中的字符特征数据;
在得到若干单个字符区域之后,可以获取该单个字符区域中的字符特征数据。该字符特征数据可以为字符的轮廓特征数据。
315、根据该字符特征数据进行字符识别,得到识别结果。
在获取该单个字符区域中的字符特征数据之后,可以根据该字符特征数据进行字符识别,得到识别结果。
本实施例中,通过仿射变换和双线性插值得到校正图像,为字符的切分和识别提供更有利的环境,减少后期步骤中切分点模板的调整时间,提高切分和识别的效率。
为便于理解,根据图3所描述的第三实施例,下面以一个实际应用场景对本发明实施例中的一种字符切割识别方法进行描述:
首先,采集图像数据,得到原始图像数据,如图4所示的待识别图像;
如图4所示,在该采集得到的原始图像上快速定位字符行所在的感兴趣区域R(r,c);
对该的感兴趣区域R(r,c)进行仿射变换和双线性插值得到校正图像pbi(r,c);
如图5a、图5b所示,在该校正图像上对字符区域进行精确定位,得到字符行候选区域pcandidate(r,c);
如图6所示,根据字符行的先验信息创建初始化切分点模板M=(m0,m1,m2,…m2i-1),其中,i∈[1,N],N为字符行所包含的字符个数,m2(i-1)、m2(i-1)+1分别表示字符切分点左、右边界的横坐标,切分点模板的A顶点个数及其坐标、hn、wn大小都由对应的字符大小来决定,图6所示切分点模板与图5a或图5b中的字符行一一对应,保存在存储器中。
将该的字符行候选区域pcandidate(r,c)中每个像素点的数据大于给定阈值的置为1,小于给定阈值的像素点的数据置为0,得到二值化图像pbinary(r,c)。
在该的二值化图像pbinary(r,c)计算字符总体上下边界框vStart,vEnd(如图7a、图7b、图7c所示),投影波形的上方中灰度值大于给定阈值Tw的位置确定为上边界起始位置,投影波形的下方中灰度值大于给定阈值Tw的位置确定为下边界结束位置。
记录下该切分点模板遍历字符行候选区域pcandidate(r,c)时的位置pos(r,c)。
计算位置pos(r,c)对应的可信度,该可信度是根据第一评价值、第二评价值、第三评价值综合计算得出,可信度的计算细节如下:在字符行候选区域pcandidate(r,c),将字符切分点左边界位置坐标垂直方向上的像素点作为第一特征属性点,第一特征属性点的灰度值在设定的阈值T1范围内的像素点的数量N1乘以给定的权重w1得到第一评价值eValue1,即eValue1=N1*w1;字符切分点右边界位置坐标垂直方向上的像素点作为第二特征属性点,第二特征属性点的灰度值在设定的阈值T2范围内的像素点的数量N2乘以给定的权重w2得到第二评价值eValue2,即eValue2=N2*w2;将字符行候选区域在切分点模板范围内的像素点作为第三特征属性点,第三特征属性点的灰度值在设定的阈值T3范围内的像素点的数量N3乘以给定权重w3得到第三评价值eValue3,即eValue3=N3*w3。第一评价值、第二评价值、第三评价值累加和计算得到该切分点模板在当前位置的可信度Ccur,即Ccur=eValue1+eValue2+eValue3。
在得出所有的位置pos(r,c)对应的可信度之后,确定可信度最高的位置作为最优切分位置。
根据最优切分位置M结合该的二值化图像pbinary(r,c)水平投影得到各个字符投影波形,如图8所示,i个字符投影波形上方首次灰度值大于给定阈值Tm的位置记录保存在Top(i)中,i个字符投影波形下方首次灰度值大于给定阈值Tm的位置记录保存在Buttom(i)中,如此得出每个字符的精确位置。如图9a和图9b所示,本方法所切割的单字符区域准确,受脏污干扰数字2、粘连的数字5以及断裂的数字7也都能很好的切割识别出来,与图10所示传统方法的分割效果和识别结果相比,本方法切割效果有明显的提升。
根据上述的最终切分点位置切割单字符,计算单个字符特征数据,特征数据可以是但不局限于字符的轮廓特征。
根据单个字符特征数据对单个字符进行分类识别。
综上描述可知,由于本发明充分考虑字符行先验信息,候选切分点模板引入克服了字符脏污、粘连、断裂的复杂情况的干扰,能准确快速分割出字符,提高了字符识别的效率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种字符切割识别方法,其特征在于,包括:
采集图像数据,得到待识别图像;
在所述待识别图像上定位字符行候选区域;
获取预置的字符行先验信息,所述字符行先验信息包括字符个数、字符间距和字符大小;
根据所述字符行先验信息获取对应的切分点模板;
获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度;
确定可信度最高的位置为最优切分位置;
根据所述切分点模板和所述最优切分位置对所述字符行候选区域进行切分,得到若干单个字符区域;
对所述单个字符区域进行字符识别,得到对应的识别结果;
获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度具体包括:
记录下所述切分点模板遍历所述字符行候选区域时的位置信息;
获取所述位置信息对应的可信度;
所述获取所述位置信息对应的可信度具体包括:
获取所述字符行候选区域在字符切分点的左边界上的第一有效像素点的第一数量,所述切分点模板由若干个字符切分点组成,每个所述字符切分点与所述字符行上的一个字符对应,每个所述字符切分点均包括左边界和右边界,所述第一有效像素点为灰度值处于预设的第一阈值范围内的像素点;
根据所述第一数量和预设的第一权重得到第一评价值;
获取所述字符行候选区域在字符切分点的右边界上的第二有效像素点的第二数量,所述第二有效像素点为灰度值处于预设的第二阈值范围内的像素点;
根据所述第二数量和预设的第二权重得到第二评价值;
获取所述字符行候选区域在所述切分点模板范围内的第三有效像素点的第三数量,所述第三有效像素点为灰度值处于预设的第三阈值范围内的像素点;
根据所述第三数量和预设的第三权重得到第三评价值;
根据所述第一评价值、第二评价值和第三评价值获得所述位置信息对应的可信度。
2.根据权利要求1所述的方法,其特征在于,所述获取预置的字符行先验信息具体包括:
根据所述待识别图像的类型获取预置的字符行先验信息;
或,根据所述字符行候选区域的方位特征获取预置的字符行先验信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述字符行先验信息获取对应的切分点模板为:
根据所述字符行先验信息创建并初始化所述切分点模板;
或,根据所述字符行先验信息和预置的切分索引表获取到对应的切分点模板,所述切分索引表包括所述字符行先验信息与所述切分点模板的对应关系。
4.根据权利要求1至3中任一项所述的方法,其特征在于,根据所述字符行先验信息获取对应的切分点模板之后还包括:
获取所述待识别图像的二值化图像;
获取所述二值化图像水平方向的投影波形;
根据所述投影波形更新所述切分点模板的上边界和下边界。
5.根据权利要求4所述的方法,其特征在于,根据所述投影波形更新所述切分点模板的上边界和下边界具体包括:
将所述投影波形中灰度值大于预设的第四阈值的最上方位置确定并更新为所述切分点模板的上边界;
将所述投影波形中灰度值大于预设的第五阈值的最下方位置确定并更新为所述切分点模板的下边界。
6.根据权利要求1至3中任一项所述的方法,其特征在于,在所述待识别图像上定位字符行候选区域具体包括:
在所述待识别图像上定位字符行所在的感兴趣区域;
对所述感兴趣区域进行仿射变换和双线性插值,得到校正图像;
在所述校正图像上定位字符行候选区域。
7.根据权利要求1至3中任一项所述的方法,其特征在于,对所述单个字符区域进行字符识别,得到对应的识别结果具体包括:
获取所述单个字符区域中的字符特征数据;
根据所述字符特征数据进行字符识别,得到识别结果。
8.根据权利要求7所述的方法,其特征在于,所述字符特征数据为字符的轮廓特征数据。
CN201510083858.3A 2015-02-13 2015-02-13 一种字符切割识别方法 Active CN104616009B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201510083858.3A CN104616009B (zh) 2015-02-13 2015-02-13 一种字符切割识别方法
PCT/CN2015/082438 WO2016127545A1 (zh) 2015-02-13 2015-06-26 一种字符切割识别方法
RU2017131524A RU2678485C1 (ru) 2015-02-13 2015-06-26 Способ сегментации и распознавания символов
US15/549,126 US10430681B2 (en) 2015-02-13 2015-06-26 Character segmentation and recognition method
EP15881706.4A EP3258422A4 (en) 2015-02-13 2015-06-26 Character segmentation and recognition method
HK18105990.9A HK1246907A1 (zh) 2015-02-13 2018-05-09 一種字符切割識別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510083858.3A CN104616009B (zh) 2015-02-13 2015-02-13 一种字符切割识别方法

Publications (2)

Publication Number Publication Date
CN104616009A CN104616009A (zh) 2015-05-13
CN104616009B true CN104616009B (zh) 2018-05-18

Family

ID=53150446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510083858.3A Active CN104616009B (zh) 2015-02-13 2015-02-13 一种字符切割识别方法

Country Status (6)

Country Link
US (1) US10430681B2 (zh)
EP (1) EP3258422A4 (zh)
CN (1) CN104616009B (zh)
HK (1) HK1246907A1 (zh)
RU (1) RU2678485C1 (zh)
WO (1) WO2016127545A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616009B (zh) * 2015-02-13 2018-05-18 广州广电运通金融电子股份有限公司 一种字符切割识别方法
CN105095860B (zh) * 2015-06-30 2018-05-29 小米科技有限责任公司 字符分割方法和装置
CN106339704A (zh) * 2015-07-14 2017-01-18 富士通株式会社 字符识别方法和字符识别设备
CN105512657B (zh) * 2015-08-20 2019-04-30 北京旷视科技有限公司 字符识别方法和设备
CN106022346B (zh) * 2016-05-24 2019-06-07 深圳怡化电脑股份有限公司 一种冠字号的切割方法和装置
CN106296969B (zh) * 2016-08-18 2019-04-12 深圳怡化电脑股份有限公司 纸币的识别方法和系统
CN108734845B (zh) * 2017-04-20 2021-01-01 深圳怡化电脑股份有限公司 检测纸币冠字号的方法及装置
CN109034158B (zh) * 2017-06-09 2021-03-26 杭州海康威视数字技术股份有限公司 一种车牌识别方法、装置及计算机设备
CN107437294B (zh) * 2017-08-01 2020-05-01 深圳怡化电脑股份有限公司 一种字符分割方法、装置、设备及存储介质
CN108446702B (zh) * 2018-03-14 2022-05-31 深圳怡化电脑股份有限公司 一种图像字符分割方法、装置、设备及存储介质
CN108460386B (zh) * 2018-03-19 2022-03-08 深圳怡化电脑股份有限公司 字符图像切割方法、装置、设备及存储介质
GB2572386B (en) * 2018-03-28 2021-05-19 Canon Europa Nv An image processing system and an image processing method
CN109308476B (zh) * 2018-09-06 2019-08-27 邬国锐 票据信息处理方法、系统及计算机可读存储介质
CN110942074B (zh) * 2018-09-25 2024-04-09 京东科技控股股份有限公司 字符切分识别方法、装置、电子设备、存储介质
CN109740606B (zh) * 2018-12-20 2021-02-05 上海众源网络有限公司 一种图像识别方法及装置
CN109726722B (zh) * 2018-12-20 2020-10-02 上海众源网络有限公司 一种字符分割方法及装置
CN109685070B (zh) * 2019-01-11 2023-01-24 上海大学(浙江·嘉兴)新兴产业研究院 一种图像预处理方法
CN110020655B (zh) * 2019-04-19 2021-08-20 厦门商集网络科技有限责任公司 一种基于二值化的字符去噪方法及终端
CN110503054B (zh) * 2019-08-27 2022-09-23 广东工业大学 文本图像的处理方法及装置
CN110587704B (zh) * 2019-08-29 2020-12-29 瀚德(中国)汽车密封系统有限公司 切断位置的确定方法、设备及系统
SG11202109513XA (en) * 2019-09-30 2021-09-29 Beijing Sensetime Technology Development Co Ltd Form recognition methods, form extraction methods and apparatuses thereof
CN111444773B (zh) * 2020-03-02 2022-06-03 武汉理工大学 一种基于图像的多目标分割识别方法及系统
CN111639636A (zh) * 2020-05-29 2020-09-08 北京奇艺世纪科技有限公司 一种字符识别方法及装置
CN112488108A (zh) * 2020-12-11 2021-03-12 广州小鹏自动驾驶科技有限公司 一种车位号识别方法、装置、电子设备及存储介质
CN114998922B (zh) * 2022-07-29 2022-11-04 成都薯片科技有限公司 一种基于格式模板的电子合同生成方法
CN117710987B (zh) * 2024-02-06 2024-06-11 武汉卓目科技有限公司 冠字号分割方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1085456B1 (en) * 1999-09-15 2006-11-22 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
CN101901333A (zh) * 2009-05-25 2010-12-01 汉王科技股份有限公司 文本图像中切分词的方法及使用该方法的识别装置
CN102750534A (zh) * 2012-06-26 2012-10-24 北京文通科技有限公司 一种字符切分的方法和装置
CN103049750A (zh) * 2013-01-11 2013-04-17 广州广电运通金融电子股份有限公司 字符识别方法
CN104200204A (zh) * 2014-09-02 2014-12-10 福建富士通信息软件有限公司 一种图片处理装置及方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143986A (ja) 1997-10-17 1999-05-28 Internatl Business Mach Corp <Ibm> ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体
DE602004000494T2 (de) * 2003-01-08 2006-09-07 Glory Ltd. Vorrichtung und Verfahren zum Lesen der Seriennummern von Banknoten
DE102004049209A1 (de) * 2004-10-08 2006-04-20 Giesecke & Devrient Gmbh Verfahren und Vorrichtung für die Bearbeitung von Banknoten
WO2009040922A1 (ja) * 2007-09-27 2009-04-02 Glory Ltd. 紙葉類処理装置
RU2582860C2 (ru) * 2012-03-22 2016-04-27 Глори Лтд. Система и способ считывания серийного номера бумажного листа
CN102722733A (zh) * 2012-05-31 2012-10-10 信帧电子技术(北京)有限公司 一种车牌类型的识别方法及装置
JP6151931B2 (ja) * 2013-02-21 2017-06-21 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
EP2963584B1 (en) * 2013-02-28 2020-07-15 Glory Ltd. Character recognition method and character recognition system
CN103390160A (zh) 2013-07-24 2013-11-13 佳都新太科技股份有限公司 一种基于连通域和模板的车牌字符切分算法
CN104616009B (zh) * 2015-02-13 2018-05-18 广州广电运通金融电子股份有限公司 一种字符切割识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1085456B1 (en) * 1999-09-15 2006-11-22 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
CN101901333A (zh) * 2009-05-25 2010-12-01 汉王科技股份有限公司 文本图像中切分词的方法及使用该方法的识别装置
CN102750534A (zh) * 2012-06-26 2012-10-24 北京文通科技有限公司 一种字符切分的方法和装置
CN103049750A (zh) * 2013-01-11 2013-04-17 广州广电运通金融电子股份有限公司 字符识别方法
CN104200204A (zh) * 2014-09-02 2014-12-10 福建富士通信息软件有限公司 一种图片处理装置及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
最大类间方差车牌字符分割的模板匹配算法;王兴玲;《计算机工程》;20061031;第32卷(第19期);193-195 *

Also Published As

Publication number Publication date
HK1246907A1 (zh) 2018-09-14
RU2678485C1 (ru) 2019-01-29
WO2016127545A1 (zh) 2016-08-18
US20180096216A1 (en) 2018-04-05
CN104616009A (zh) 2015-05-13
EP3258422A4 (en) 2018-02-21
EP3258422A1 (en) 2017-12-20
US10430681B2 (en) 2019-10-01

Similar Documents

Publication Publication Date Title
CN104616009B (zh) 一种字符切割识别方法
CN105678285B (zh) 一种自适应的道路鸟瞰图变换方法和道路车道检测方法
US9489586B2 (en) Traffic sign recognizing apparatus and operating method thereof
CN110443225B (zh) 一种基于特征像素统计的虚实车道线识别方法及其装置
CN105608417B (zh) 交通信号灯检测方法及装置
CN101334836B (zh) 一种融合色彩、尺寸和纹理特征的车牌定位方法
CN109685000A (zh) 一种基于视觉的车位检测方法及装置
CN104050654B (zh) 道路边缘检测方法和装置
US9607220B1 (en) Image-based vehicle speed estimation
CN111191611B (zh) 基于深度学习的交通标志标号识别方法
CN110334634A (zh) 一种车道线类别的检测方法和预警装置
CN108280450A (zh) 一种基于车道线的高速公路路面检测方法
CN102609686A (zh) 一种行人检测方法
CN103914680A (zh) 一种喷印字符图像识别与校验系统及方法
CN108171695A (zh) 一种基于图像处理的高速公路路面检测方法
CN103716687A (zh) 使用指纹以在视频中追踪移动对象的系统和方法
CN111914838A (zh) 一种基于文本行识别的车牌识别方法
Nassu et al. Rail extraction for driver support in railways
CN110992424B (zh) 基于双目视觉的定位方法和系统
CN106326821B (zh) 车牌定位的方法及装置
JP2014219801A (ja) 車両判別装置
CN109543613A (zh) 基于tof成像的车辆行驶速度及车牌识别系统及方法
CN109784265A (zh) 一种轨面语义分割方法及装置
CN104156701A (zh) 一种基于决策树和svm的车牌相似字符识别方法
CN110210467A (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant