CN104616009B

CN104616009B - 一种字符切割识别方法

Info

Publication number: CN104616009B
Application number: CN201510083858.3A
Authority: CN
Inventors: 王卫锋; 邱新华; 王锟; 其他发明人请求不公开姓名
Original assignee: Guangdian Yuntong Financial Electronic Co Ltd
Current assignee: Guangdian Yuntong Financial Electronic Co Ltd
Priority date: 2015-02-13
Filing date: 2015-02-13
Publication date: 2018-05-18
Anticipated expiration: 2035-02-13
Also published as: HK1246907A1; RU2678485C1; WO2016127545A1; US20180096216A1; CN104616009A; EP3258422A4; EP3258422A1; US10430681B2

Abstract

本发明实施例公开了一种字符切割识别方法，用于解决现有切分方法对于复杂背景下的字符识别能力不高，抗脏污干扰能力差的问题。本发明实施例方法包括：采集图像数据，得到待识别图像；在所述待识别图像上定位字符行候选区域；获取预置的字符行先验信息，所述字符行先验信息包括字符个数、字符间距和字符大小；根据所述字符行先验信息获取对应的切分点模板；获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度；确定可信度最高的位置为最优切分位置；根据所述切分点模板和所述最优切分位置对所述字符行候选区域进行切分，得到若干单个字符区域；对所述单个字符区域进行字符识别，得到对应的识别结果。

Description

一种字符切割识别方法

技术领域

本发明涉及字符光学识别领域，尤其涉及一种字符切割识别方法。

背景技术

光学字符识别(Optical Character Recognition)是利用电子设备检测识别打印的字符。随着社会生产和生活的自动化、智能化程度越来越高，OCR的应用越来越广泛，例如各种包装上印刷检测系统、智能交通中车牌定位与字符识别系统、钞票识别中冠字号码识别、票据识别中的序列号识别、版面分析等等。因此开发高效光学字符识别系统具有重大的社会效益和经济效益。

在实际应用中，由于图像摄取的场景不一致性以及传感器、光照等因素的影响，经常出现图像背景复杂的情况，如底纹、印章和图案等。OCR的瓶颈不再是分类器的设计问题，而主要取决于字符切分的准确性，特别是粘连断裂字符行的切分问题，为此，需要采用更加高效的字符切分方法。

目前，一般的字符切分方法为基于图像的切分方法，以图像起始点为候选切分点，然后确定其他有效切分点，从有效切分点中筛选出目标切分点的方法，此方法利用单个字符的特性得到目标切分点，从而对切分后的字符进行识别。然而，该切分方法对于复杂背景下的字符识别能力不高，抗脏污干扰能力差。

发明内容

本发明实施例提供了一种字符切割识别方法，能够解决现有切分方法对于复杂背景下的字符识别能力不高，抗脏污干扰能力差的问题。

本发明实施例提供的一种字符切割识别方法，包括：

采集图像数据，得到待识别图像；

在所述待识别图像上定位字符行候选区域；

获取预置的字符行先验信息，所述字符行先验信息包括字符个数、字符间距和字符大小；

根据所述字符行先验信息获取对应的切分点模板；

获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度；

确定可信度最高的位置为最优切分位置；

根据所述切分点模板和所述最优切分位置对所述字符行候选区域进行切分，得到若干单个字符区域；

对所述单个字符区域进行字符识别，得到对应的识别结果。

可选地，所述获取预置的字符行先验信息具体包括：

根据所述待识别图像的类型获取预置的字符行先验信息；

或，根据所述字符行候选区域的方位特征获取预置的字符行先验信息。

可选地，所述根据所述字符行先验信息获取对应的切分点模板为：

根据所述字符行先验信息创建并初始化所述切分点模板；

或，根据所述字符行先验信息和预置的切分索引表获取到对应的切分点模板，所述切分索引表包括所述字符行先验信息与所述切分点模板的对应关系。

可选地，获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度具体包括：

记录下所述切分点模板遍历所述字符行候选区域时的位置信息；

获取所述位置信息对应的可信度。

可选地，所述获取所述位置信息对应的可信度具体包括：

获取所述字符行候选区域在字符切分点的左边界上的第一有效像素点的第一数量，所述切分点模板由若干个字符切分点组成，每个所述字符切分点与所述字符行上的一个字符对应，每个所述字符切分点均包括左边界和右边界，所述第一有效像素点为灰度值处于预设的第一阈值范围内的像素点；

根据所述第一数量和预设的第一权重得到第一评价值；

获取所述字符行候选区域在字符切分点的右边界上的第二有效像素点的第二数量，所述第二有效像素点为灰度值处于预设的第二阈值范围内的像素点；

根据所述第二数量和预设的第二权重得到第二评价值；

获取所述字符行候选区域在所述切分点模板范围内的第三有效像素点的第三数量，所述第三有效像素点为灰度值处于预设的第三阈值范围内的像素点；

根据所述第三数量和预设的第三权重得到第三评价值；

根据所述第一评价值、第二评价值和第三评价值获得所述位置信息对应的可信度。

可选地，根据所述字符行先验信息获取对应的切分点模板之后还包括：

获取所述待识别图像的二值化图像；

获取所述二值化图像水平方向的投影波形；

根据所述投影波形更新所述切分点模板的上边界和下边界。

可选地，根据所述投影波形更新所述切分点模板的上边界和下边界具体包括：

将所述投影波形中灰度值大于预设的第四阈值的最上方位置确定并更新为所述切分点模板的上边界；

将所述投影波形中灰度值大于预设的第五阈值的最下方位置确定并更新为所述切分点模板的下边界。

可选地，在所述待识别图像上定位字符行候选区域具体包括：

在所述待识别图像上定位字符行所在的感兴趣区域；

对所述感兴趣区域进行仿射变换和双线性插值，得到校正图像；

在所述校正图像上定位字符行候选区域。

可选地，对所述单个字符区域进行字符识别，得到对应的识别结果具体包括：

获取所述单个字符区域中的字符特征数据；

根据所述字符特征数据进行字符识别，得到识别结果。

可选地，所述字符特征数据为字符的轮廓特征数据。

从以上技术方案可以看出，本发明实施例具有以下优点：

本发明实施例中，首先，采集图像数据，得到待识别图像；在所述待识别图像上定位字符行候选区域；获取预置的字符行先验信息，所述字符行先验信息包括字符个数、字符间距和字符大小；然后根据所述字符行先验信息获取对应的切分点模板；获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度；接着，确定可信度最高的位置为最优切分位置；根据所述切分点模板和所述最优切分位置对所述字符行候选区域进行切分，得到若干单个字符区域；最后，对所述单个字符区域进行字符识别，得到对应的识别结果。在本发明实施例中，通过引入切分点模板和确定最优切分位置，提升字符切分方法的抗脏污干扰能力，即便在复杂背景下，该字符切割识别方法仍能具备良好的识别能力，提高字符识别效率。

附图说明

图1为本发明实施例中一种字符切割识别方法第一实施例流程图；

图2为本发明实施例中一种字符切割识别方法第二实施例流程图；

图3为本发明实施例中一种字符切割识别方法第三实施例流程图；

图4为本发明实施例中待识别图像的示意图；

图5a、图5b为本发明实施例中定位得到的字符行候选区域的示意图；

图6为本发明实施例中切分点模板的结构示意图；

图7a为切分点模板的上边界和下边界更新前的示意图；

图7b、图7c为切分点模板的上边界和下边界更新后的示意图；

图8为利用投影波形给切分点模板上每个字符精确定位的示意图；

图9a、图9b为本发明实施例中一个字符切割识别方法字符切分的效果示意图；

图10为传统方法中字符切分的效果示意图。

具体实施方式

本发明实施例提供了一种字符切割识别方法，用于解决现有切分方法对于复杂背景下的字符识别能力不高，抗脏污干扰能力差的问题。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

请参阅图1，本发明实施例中一种字符切割识别方法的第一实施例包括：

101、采集图像数据，得到待识别图像；

首先，采集图像数据，得到待识别图像。

102、在该待识别图像上定位字符行候选区域；

在得到待识别图像之后，可以在该待识别图像上定位字符行候选区域。

103、获取预置的字符行先验信息；

另外，可以获取预置的字符行先验信息，该字符行先验信息包括字符个数、字符间距和字符大小。

104、根据该字符行先验信息获取对应的切分点模板；

在获取预置的字符行先验信息之后，可以根据该字符行先验信息获取对应的切分点模板。

105、获取该切分点模板遍历该字符行候选区域时不同位置上的可信度；

在根据该字符行先验信息获取对应的切分点模板之后，可以获取该切分点模板遍历该字符行候选区域时不同位置上的可信度。

106、确定可信度最高的位置为最优切分位置；

在获取到不同位置上的可信度之后，可以确定可信度最高的位置为最优切分位置。

107、根据该切分点模板和该最优切分位置对该字符行候选区域进行切分，得到若干单个字符区域；

在确定可信度最高的位置为最优切分位置之后，可以根据该切分点模板和该最优切分位置对该字符行候选区域进行切分，得到若干单个字符区域。

108、对该单个字符区域进行字符识别，得到对应的识别结果。

在得到若干单个字符区域之后，可以对该单个字符区域进行字符识别，得到对应的识别结果。

本实施例中，首先，采集图像数据，得到待识别图像；在该待识别图像上定位字符行候选区域；获取预置的字符行先验信息，该字符行先验信息包括字符个数、字符间距和字符大小；然后根据该字符行先验信息获取对应的切分点模板；获取该切分点模板遍历该字符行候选区域时不同位置上的可信度；接着，确定可信度最高的位置为最优切分位置；根据该切分点模板和该最优切分位置对该字符行候选区域进行切分，得到若干单个字符区域；最后，对该单个字符区域进行字符识别，得到对应的识别结果。在本实施例中，通过引入切分点模板和确定最优切分位置，提升字符切分方法的抗脏污干扰能力，即便在复杂背景下，该字符切割识别方法仍能具备良好的识别能力，提高字符识别效率。

为便于理解，下面对本发明实施例中的一种字符切割识别方法进行详细描述，请参阅图2，本发明实施例中一种字符切割识别方法的第二实施例包括：

201、采集图像数据，得到待识别图像；

首先，需要采集图像数据，得到待识别图像。该图像数据的来源可以是钞票、车票、票据、包装印刷、书籍版面等。

202、在该待识别图像上定位字符行候选区域；

在得到待识别图像之后，可以在该待识别图像上定位字符行候选区域。可以理解的是，在预先知道该待识别图像的类型或者来源时，可以很容易地定位所需识别的字符行位置。例如，该待识别图像为钞票(人民币)的正面，则该字符行候选区域的位置即为钞票的代码所在位置，位于该待识别图像的左下角。

203、获取预置的字符行先验信息；

另外，还需要获取预置的字符行先验信息，该字符行先验信息包括字符个数、字符间距和字符大小。具体可以是，根据该待识别图像的类型获取预置的字符行先验信息，或者，根据该字符行候选区域的方位特征获取预置的字符行先验信息。

需要说明的是，当得知该待识别图像的类型时，该字符行的规格是固定的，也即字符个数、字符间距和字符大小都是固定不变的，因此该字符行先验信息也可以对应获取到。例如，当该待识别图像为钞票的正面时，该字符行为钞票代码，而钞票代码的字符行先验信息是固有的，可以预置在系统中。另外，当得知该字符行候选区域的方位特征时，也可以轻松获取到对应的字符行先验信息。例如，在发票联上，存在“发票代码”、“发票号码”、“订单号”等字符行，此时若知道该字符行候选区域的方位特征，即知道该字符行处于整个待识别图像的大致那个位置上时，既可以得知该字符行是属于“发票代码”、“发票号码”、“订单号”等中的哪一个类型，从而可以得到对应的字符行先验信息。

204、根据该字符行先验信息获取对应的切分点模板；

在获取预置的字符行先验信息之后，可以根据该字符行先验信息获取对应的切分点模板。具体可以是，根据该字符行先验信息创建并初始化该切分点模板；或，根据该字符行先验信息和预置的切分索引表获取到对应的切分点模板，该切分索引表包括该字符行先验信息与该切分点模板的对应关系。

需要说明的是，若根据该字符行先验信息创建并初始化该切分点模板，由于该字符行先验信息包括字符个数、字符间距和字符大小，因此容易获得该切分点模板的长度和高度，从而创建出对应的切分点模板。另外，也可以是将该字符行先验信息中每个字符对应的字符切分点创建出来，然后将所有字符切分点按照字符行先验信息中排列的顺序排列起来得到对应的切分点模板。其中，从字符行先验信息中可以得知字符大小，该字符大小包括字符的高和宽，因而字符切分点的左右边界和上下边界便可定义出来。在将该字符切分点按照一定顺序进行排列时，需要按照该字符间距进行排列分布，以便使得创建出来的切分点模板与该字符行先验信息对应。

需要说明的是，若根据该字符行先验信息和预置的切分索引表获取到对应的切分点模板，则该切分索引表是预设在系统内的，该字符行先验信息对应的切分点模板也可以预先存储在系统内，在需要时直接查询调用即可。

205、获取该待识别图像的二值化图像；

在得到该待识别图像之后，可以获取该待识别图像的二值化图像。具体可以是，将该待识别图像中大于某预设阈值的像素点的数值定义为1，而小于该预设阈值的像素点的数值定义为0，则可得到该二值化图像。

206、获取该二值化图像水平方向的投影波形；

在获取该待识别图像的二值化图像之后，可以获取该二值化图像水平方向的投影波形。

207、根据该投影波形更新该切分点模板的上边界和下边界；

在获取该二值化图像水平方向的投影波形之后，可以根据该投影波形更新该切分点模板的上边界和下边界。具体可以是，将该投影波形中灰度值大于预设的第四阈值的最上方位置确定并更新为该切分点模板的上边界；将该投影波形中灰度值大于预设的第五阈值的最下方位置确定并更新为该切分点模板的下边界，从而使得该切分点模板的上边界和下边界更加贴近该字符行，为后续的抗脏污切分和准确的字符识别提供保障。

208、记录下该切分点模板遍历该字符行候选区域时的位置信息；

在确定下该切分点模板之后，可以记录下该切分点模板遍历该字符行候选区域时的位置信息。可以理解的是，该切分点模板可以在该字符行候选区域进行滑动直至遍历整个字符行候选区域，在该切分点模板遍历的过程中，其会出现在字符行候选区域的所有位置上，不同的位置对应产生不同的位置信息。

209、获取该位置信息对应的可信度；

在记录下该切分点模板遍历该字符行候选区域时的位置信息之后，可以获取该位置信息对应的可信度。

需要说明的是，本实施例中可信度的获取方法具体可以为：

获取该字符行候选区域在字符切分点的左边界上的第一有效像素点的第一数量，该切分点模板由若干个字符切分点组成，每个该字符切分点与该字符行上的一个字符对应，每个该字符切分点均包括左边界和右边界，该第一有效像素点为灰度值处于预设的第一阈值范围内的像素点；

根据该第一数量和预设的第一权重得到第一评价值；

获取该字符行候选区域在字符切分点的右边界上的第二有效像素点的第二数量，该第二有效像素点为灰度值处于预设的第二阈值范围内的像素点；

根据该第二数量和预设的第二权重得到第二评价值；

获取该字符行候选区域在该切分点模板范围内的第三有效像素点的第三数量，该第三有效像素点为灰度值处于预设的第三阈值范围内的像素点；

根据该第三数量和预设的第三权重得到第三评价值；

根据该第一评价值、第二评价值和第三评价值获得该位置信息对应的可信度。

通过加入了第一权重、第二权重和第三权重分别获得的第一评价值、第二评价值和第三评价值来综合得出该位置信息对应的可信度，使得该可信度能更准确有效地反应了切分点模板在该字符行候选区域的该位置信息的切分精确度和抗脏污能力。

210、确定可信度最高的位置为最优切分位置；

在获取所有位置信息对应的可信度之后，可以确定可信度最高的位置为最优切分位置。

211、根据该切分点模板和该最优切分位置对该字符行候选区域进行切分，得到若干单个字符区域；

在确定下可信度最高的位置为最优切分位置之后，可以根据该切分点模板和该最优切分位置对该字符行候选区域进行切分，得到若干单个字符区域。

212、对该单个字符区域进行字符识别，得到对应的识别结果。

本实施例中，通过加入了第一权重、第二权重和第三权重分别获得的第一评价值、第二评价值和第三评价值来综合得出该位置信息对应的可信度，使得该可信度能更准确有效地反应了切分点模板在该字符行候选区域的该位置信息的切分精确度和抗脏污能力；

进一步地，通过获取待识别图像二值化后的投影波形，并根据该投影波形更新切分点模板的上下边界，从而使得该切分点模板的上边界和下边界更加贴近该字符行，为后续的抗脏污切分和准确的字符识别提供保障。

上面第二实施例主要从提升抗脏污能力方面描述了一种字符切割识别方法，下面将从另一个角度对一种字符切割识别方法进行详细的描述，请参阅图3，本发明实施例中一种字符切割识别方法的第三实施例包括：

301、采集图像数据，得到待识别图像；

302、在该待识别图像上定位字符行所在的感兴趣区域；

在得到待识别图像之后，可以在该待识别图像上定位字符行所在的感兴趣区域。可以理解的是，在预先知道该待识别图像的类型或者来源时，可以很容易地定位所需识别的字符行位置。例如，该待识别图像为钞票(人民币)的正面，则该字符行候选区域的位置即为钞票的代码所在位置，位于该待识别图像的左下角。

需要说明的是，此时在该待识别图像上定位出该感兴趣区域时，可以是粗定位，即不要求定位精确，只要能快速定位到字符行所在的大概位置即可。

303、对该感兴趣区域进行仿射变换和双线性插值，得到校正图像；

在定位出该感兴趣区域之后，可以对该感兴趣区域进行仿射变换和双线性插值，得到校正图像。可以理解的是，经过仿射变换和双线性插值校正的校正图像，更有利于字符的切分和识别。

304、在该校正图像上定位字符行候选区域；

在得到该校正图像之后，可以在该校正图像上定位字符行候选区域。需要说明的是，此时在该校正图像上定位字符行候选区域可以是精定位，即定位要求精确，尽可能使得字符行候选区域正好覆盖所需识别的字符行为佳，以便减少后期步骤中切分点模板的调整时间，提高效率。

305、获取预置的字符行先验信息；

306、根据该字符行先验信息获取对应的切分点模板；

307、获取该待识别图像的二值化图像；

308、获取该二值化图像水平方向的投影波形；

309、根据该投影波形更新该切分点模板的上边界和下边界；

需要说明的是，该投影波形也可以通过梯度与第四阈值或第五阈值进行比较来确认该上下边界。比如：将该投影波形中梯度大于预设的第四阈值的最上方位置确定并更新为该切分点模板的上边界；将该投影波形中梯度大于预设的第五阈值的最下方位置确定并更新为该切分点模板的下边界。

310、记录下该切分点模板遍历该字符行候选区域时的位置信息；

311、获取该位置信息对应的可信度；

需要说明的是，本实施例中可信度的获取方法具体可以为：

根据该第一数量和预设的第一权重得到第一评价值；

根据该第二数量和预设的第二权重得到第二评价值；

根据该第三数量和预设的第三权重得到第三评价值；

需要说明的是，本实施例中，该第一有效像素点、第二有效像素点和第三有效像素点可以分别是梯度处于预设的第一阈值、第二阈值和第三阈值范围内的像素点。

312、确定可信度最高的位置为最优切分位置；

313、根据该切分点模板和该最优切分位置对该字符行候选区域进行切分，得到若干单个字符区域；

314、获取该单个字符区域中的字符特征数据；

在得到若干单个字符区域之后，可以获取该单个字符区域中的字符特征数据。该字符特征数据可以为字符的轮廓特征数据。

315、根据该字符特征数据进行字符识别，得到识别结果。

在获取该单个字符区域中的字符特征数据之后，可以根据该字符特征数据进行字符识别，得到识别结果。

本实施例中，通过仿射变换和双线性插值得到校正图像，为字符的切分和识别提供更有利的环境，减少后期步骤中切分点模板的调整时间，提高切分和识别的效率。

为便于理解，根据图3所描述的第三实施例，下面以一个实际应用场景对本发明实施例中的一种字符切割识别方法进行描述：

首先，采集图像数据，得到原始图像数据，如图4所示的待识别图像；

如图4所示，在该采集得到的原始图像上快速定位字符行所在的感兴趣区域R(r,c)；

对该的感兴趣区域R(r,c)进行仿射变换和双线性插值得到校正图像p_bi(r,c)；

如图5a、图5b所示，在该校正图像上对字符区域进行精确定位，得到字符行候选区域p_candidate(r,c)；

如图6所示，根据字符行的先验信息创建初始化切分点模板M＝(m₀,m₁,m₂,…m_2i-1)，其中，i∈[1,N]，N为字符行所包含的字符个数，m_2(i-1)、m_2(i-1)+1分别表示字符切分点左、右边界的横坐标，切分点模板的A顶点个数及其坐标、h_n、w_n大小都由对应的字符大小来决定，图6所示切分点模板与图5a或图5b中的字符行一一对应，保存在存储器中。

将该的字符行候选区域p_candidate(r,c)中每个像素点的数据大于给定阈值的置为1，小于给定阈值的像素点的数据置为0，得到二值化图像p_binary(r,c)。

在该的二值化图像p_binary(r,c)计算字符总体上下边界框vStart，vEnd(如图7a、图7b、图7c所示)，投影波形的上方中灰度值大于给定阈值T_w的位置确定为上边界起始位置，投影波形的下方中灰度值大于给定阈值T_w的位置确定为下边界结束位置。

记录下该切分点模板遍历字符行候选区域p_candidate(r,c)时的位置pos(r,c)。

计算位置pos(r,c)对应的可信度，该可信度是根据第一评价值、第二评价值、第三评价值综合计算得出，可信度的计算细节如下：在字符行候选区域p_candidate(r,c)，将字符切分点左边界位置坐标垂直方向上的像素点作为第一特征属性点，第一特征属性点的灰度值在设定的阈值T1范围内的像素点的数量N1乘以给定的权重w1得到第一评价值eValue1，即eValue1＝N1*w1；字符切分点右边界位置坐标垂直方向上的像素点作为第二特征属性点，第二特征属性点的灰度值在设定的阈值T2范围内的像素点的数量N2乘以给定的权重w2得到第二评价值eValue2，即eValue2＝N2*w2；将字符行候选区域在切分点模板范围内的像素点作为第三特征属性点，第三特征属性点的灰度值在设定的阈值T3范围内的像素点的数量N3乘以给定权重w3得到第三评价值eValue3，即eValue3＝N3*w3。第一评价值、第二评价值、第三评价值累加和计算得到该切分点模板在当前位置的可信度Ccur，即Ccur＝eValue1+eValue2+eValue3。

在得出所有的位置pos(r,c)对应的可信度之后，确定可信度最高的位置作为最优切分位置。

根据最优切分位置M结合该的二值化图像p_binary(r,c)水平投影得到各个字符投影波形，如图8所示，i个字符投影波形上方首次灰度值大于给定阈值T_m的位置记录保存在Top(i)中，i个字符投影波形下方首次灰度值大于给定阈值T_m的位置记录保存在Buttom(i)中，如此得出每个字符的精确位置。如图9a和图9b所示，本方法所切割的单字符区域准确，受脏污干扰数字2、粘连的数字5以及断裂的数字7也都能很好的切割识别出来，与图10所示传统方法的分割效果和识别结果相比，本方法切割效果有明显的提升。

根据上述的最终切分点位置切割单字符，计算单个字符特征数据，特征数据可以是但不局限于字符的轮廓特征。

根据单个字符特征数据对单个字符进行分类识别。

综上描述可知，由于本发明充分考虑字符行先验信息，候选切分点模板引入克服了字符脏污、粘连、断裂的复杂情况的干扰，能准确快速分割出字符，提高了字符识别的效率。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种字符切割识别方法，其特征在于，包括：

采集图像数据，得到待识别图像；

在所述待识别图像上定位字符行候选区域；

根据所述字符行先验信息获取对应的切分点模板；

确定可信度最高的位置为最优切分位置；

对所述单个字符区域进行字符识别，得到对应的识别结果；

获取所述切分点模板遍历所述字符行候选区域时不同位置上的可信度具体包括：

获取所述位置信息对应的可信度；

所述获取所述位置信息对应的可信度具体包括：

根据所述第一数量和预设的第一权重得到第一评价值；

根据所述第二数量和预设的第二权重得到第二评价值；

根据所述第三数量和预设的第三权重得到第三评价值；

2.根据权利要求1所述的方法，其特征在于，所述获取预置的字符行先验信息具体包括：

根据所述待识别图像的类型获取预置的字符行先验信息；

3.根据权利要求1所述的方法，其特征在于，所述根据所述字符行先验信息获取对应的切分点模板为：

根据所述字符行先验信息创建并初始化所述切分点模板；

4.根据权利要求1至3中任一项所述的方法，其特征在于，根据所述字符行先验信息获取对应的切分点模板之后还包括：

获取所述待识别图像的二值化图像；

获取所述二值化图像水平方向的投影波形；

根据所述投影波形更新所述切分点模板的上边界和下边界。

5.根据权利要求4所述的方法，其特征在于，根据所述投影波形更新所述切分点模板的上边界和下边界具体包括：

6.根据权利要求1至3中任一项所述的方法，其特征在于，在所述待识别图像上定位字符行候选区域具体包括：

在所述待识别图像上定位字符行所在的感兴趣区域；

在所述校正图像上定位字符行候选区域。

7.根据权利要求1至3中任一项所述的方法，其特征在于，对所述单个字符区域进行字符识别，得到对应的识别结果具体包括：

获取所述单个字符区域中的字符特征数据；

根据所述字符特征数据进行字符识别，得到识别结果。

8.根据权利要求7所述的方法，其特征在于，所述字符特征数据为字符的轮廓特征数据。