CN102915440A - 一种字符切分的方法及装置 - Google Patents
一种字符切分的方法及装置 Download PDFInfo
- Publication number
- CN102915440A CN102915440A CN201110221556XA CN201110221556A CN102915440A CN 102915440 A CN102915440 A CN 102915440A CN 201110221556X A CN201110221556X A CN 201110221556XA CN 201110221556 A CN201110221556 A CN 201110221556A CN 102915440 A CN102915440 A CN 102915440A
- Authority
- CN
- China
- Prior art keywords
- cut
- effective
- decipherment distance
- character
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
本发明实施例公开了一种字符切分的方法及装置,涉及文字识别领域,为提高字符识别的效率而发明。所述方法包括:将行字符图像进行过切分,得到行字符图像的候选切分点;根据预设的有效识别距离阈值从所述候选切分点中获取有效切分点;从所述有效切分点中获取目标切分点;利用所述目标切分点对所述行字符图像进行切分。本发明实施例主要用于字符识别中,通过预设的有效识别距离阈值从候选切分点中获取目标切分点,避免了对所有候选切分点组成的字符块进行识别,仅需要对上述目标切分点组成的字符块进行识别,节省了字符识别的时间,从而提高了字符识别的效率。因此,利用本发明实施例的技术方案,提高了字符识别的效率。
Description
技术领域
本发明涉及文字识别领域,尤其涉及一种字符切分的方法及装置。
背景技术
随着单字符识别准确率的提高,字符切分已经成为字符识别领域的关键问题。一般的,字符切分的准确率与字符识别的准确率直接相关,字符切分的错误会直接导致字符识别的错误。
常用的切分方法有:基于图像的切分方法和基于识别的切分方法。其中,基于图像的切分方法由于根据字符图像的高度、宽度、相邻图像的间隙等对字符进行切分,故比较适用于字符结构相对一致的东方语言文字,而对于字符高度、宽度不一致、并且容易出现粘连现象的西方语言,这种切分方法的准确性较低进而影响了字符识别的准确性;而基于识别的切分方法由于采用过切分技术,虽然提高了字符切分的准确性,但比较耗时,从而降低字符识别的效率。
发明内容
本发明实施例提供一种字符切分的方法及装置,提高了字符识别的效率。
本发明实施例采用如下技术方案:
一种字符切分的方法,包括:
将行字符图像进行过切分,得到行字符图像的候选切分点;
根据预设的有效识别距离阈值从所述候选切分点中获取有效切分点;
从所述有效切分点中获取目标切分点;
利用所述目标切分点对所述行字符图像进行切分。
一种字符切分的装置,包括:
获取单元,用于将行字符图像进行过切分,得到行字符图像的候选切分点;
有效切分点获取单元,用于根据预设的有效识别距离阈值从所述候选切分点中获取有效切分点;
目标切分点获取单元,用于从所述有效切分点中获取目标切分点;
切分单元,用于利用所述目标切分点对所述行字符图像进行切分。
本发明实施例提供的一种字符切分的方法及装置,由于通过预设的有效识别距离阈值从候选切分点中获取目标切分点,避免了对所有候选切分点组成的字符块进行识别,仅需要对上述目标切分点组成的字符块进行识别,节省了字符识别的时间,从而提高了字符识别的效率。因此,利用本发明实施例的技术方案,提高了字符识别的效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例二字符切分的方法的流程图;
图2为本发明实施例二中英文单词“reporter”被切分后的示意图;
图3为本发明实施例三字符切分的装置的示意图;
图4为本发明实施例三字符切分的装置的有效切分点获取单元的示意图;
图5为本发明实施例三字符切分的装置的目标切分点获取单元的示意图;
图6为本发明实施例三字符切分的装置的又一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为提高字符识别的效率,本发明实施例一提供了一种字符切分的方法,包括:
将行字符图像进行过切分,得到行字符图像的候选切分点;
根据预设的有效识别距离阈值从所述候选切分点中获取有效切分点;
从所述有效切分点中获取目标切分点;
利用所述目标切分点对所述行字符图像进行切分。
通过以上描述可以看出,由于通过预设的有效识别距离阈值从候选切分点中获取目标切分点,避免了对所有候选切分点组成的字符块进行识别,仅需要对上述目标切分点组成的字符块进行识别,节省了字符识别的时间,从而提高了字符识别的效率。因此,利用本发明实施例的技术方案,提高了字符识别的效率。
如图1所示,本发明实施例二提供了一种字符切分的方法,包括如下步骤:
步骤11、将行字符图像进行过切分,得到行字符图像的候选切分点。
在本实施例中,以所述行字符图像的左边界作为起始的切分点对所述行字符图像进行切分,从而获取所述行字符图像的候选切分点以及切分后的字符块。
以“reporter”这个英文单词为例,如图2所示,v1为起始的切分点,v2、v3、v4、......、v14分别为候选切分点。明显的,所述v1、v2、v3、v4、......、v14这14个切分点将所述“reporter”划分为13个字符块。
步骤12、根据预设的有效识别距离阈值从所述候选切分点中获取有效切分点。
这里为便于说明,将所述行字符图像的左边界和所述候选切分点都称为切分点。其中,任意两个切分点之间的字符构成了这两个切分点切分出来的字符块。其中,所述边具有权值,该权值可以表示与所述边对应的字符块的字符识别可信度。在本实施例中,所述权值包括所述字符块的识别距离。
此外,所述有效识别距离阈值Th_ValDis可以为可信阈值T0的1/3-2/3。其中,所述可信阈值表示识别引擎的经验统计阈值。一般的,当字符块的识别距离大于所述可信阈值时,该字符块的识别结果可能不准确。在本实施例中,可以将所述有效识别距离阈值Th_ValDis设置为T0/2。对于英文字符,由英文识别引擎得出的可信阈值T0为100,故Th_ValDis=50。
还可以设置宽高比阈值或高度阈值,所述宽高比阈值或所述高度阈值用于对所述字符块的合理性进行判断。一般地,当所述字符块的宽高比小于或等于所述宽高比阈值,或所述字符块的高度小于或等于所述高度阈值,那么所述字符块是合理的。对于英文字符,所述宽高比阈值的范围可以为0-1.5,所述高度阈值可以设置为所述行字符图像的行高的1/4。在本实施例中,仅通过宽高比阈值来判断所述字符块的合理性,并将所述宽高比阈值Th_W/H设置为1.5。
在本实施例中,首先,从所述候选切分点中选取起始切分点,将所述起始切分点的下一候选切分点作为待确认切分点。然后,利用所述待确认切分点与所述起始切分点以前的任意一个有效切分点组成待识别字符块,其中所述起始切分点以前的任意一个有效切分点为所述待识别字符块的左边界,所述待确认切分点为所述待识别字符块的右边界。接着,将所述待识别字符块的宽高比与所述宽高比阈值进行比较,若所述待识别字符块的宽高比小于或等于所述宽高比阈值,那么所述待识别字符块是合理的,进而获取所述待识别字符块的识别距离。进一步的,将所述待识别字符块的识别距离与所述有效识别距离阈值进行比较。若所述待识别字符块的识别距离小于或等于所述有效识别距离阈值,那么将所述待确认切分点作为有效切分点。
其中,所述起始切分点可以为任意切分点,既包括所述行字符图像的左边界v1,也可以包括候选切分点v2、v3......v14。
优选的,以所述行字符图像的左边界v1为第一个起始切分点,此时,v2为待确认切分点。具体的,如图2所示,还以所述“reporter”为例进行说明。
在由所述候选切分点v2、v3、v4、......、v14中获取有效切分点之前,首先设置由任意两个切分点连接的边的权值,如表1所示。此处,由任意两个切分点连接的边的权值T1一般远大于所述可信阈值T0。例如,可以将由任意两个切分点连接的边的权值T1都设置为1000。
表1
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | |
1 | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
2 | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
3 | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
4 | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
5 | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
6 | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
7 | - | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
8 | - | - | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
9 | - | - | - | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 |
10 | - | - | - | - | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 |
11 | - | - | - | - | - | - | - | - | - | - | - | 1000 | 1000 | 1000 |
12 | - | - | - | - | - | - | - | - | - | - | - | - | 1000 | 1000 |
13 | - | - | - | - | - | - | - | - | - | - | - | - | - | 1000 |
v1是所述行字符图像的左边界,直接将其作为有效切分点。然后,计算以v1为左边界的所有合理的待识别字符块的识别距离:
首先将v2作为待识别字符块的右边界,此处,所述待识别字符块为然后,将所述待识别字符块的宽高比与所述宽高比阈值Th_W/H进行比较。由于所述待识别字符块的宽高比为0.6,所述宽高比阈值Th_W/H为1.5,故所述待识别字符块的宽高比小于所述宽高比阈值Th_W/H,进而确定所述待识别字符块是合理的。进一步的,获取所述待识别字符块的识别距离,并将所述待识别字符块的对应边记录为(v1、v2)。此时,所述待识别字符块的识别距离为101,从而所述对应边(v1、v2)的权值A(v1、v2)也为101。
以此类推,分别计算以v1为左边界,v3、v4、v5......为右边界的待识别字符块的识别距离。当以v6为待识别字符块的右边界时,所述待识别字符块为“rep””。然后,将所述待识别字符块“rep”的宽高比与所述宽高比阈值Th_W/H进行比较。由于所述待识别字符块“rep”的宽高比为1.6,所述宽高比阈值Th_W/H为1.5,故所述待识别字符块“rep”的宽高比大于所述宽高比阈值Th_W/H,进而确定所述待识别字符块“rep”是不合理的。
此时,边(v1、v2)、(v1、v3)、(v1、v4)、(v1、v5)对应的待识别字符块的识别距离分别为101、30、289、428。不再计算以v1为左边界、分别以v6、v7、......、v14为右边界的其他字符块的识别距离。
接着,根据有效识别距离阈值Th_ValDis判断下一个有效切分点,并计算以该有效切分点为左边界的所有可能的字符块的识别距离:
所述起始切分点v1的下一个切分点是v2,即v2为待确认切分点。以v2为右边界,以v1为左边界的边为(v1、v2)。因为所述边(v1、v2)对应的待识别字符块的识别距离为101,所述有效识别距离阈值Th_ValDis为50,故所述边(v1、v2)对应的待识别字符块的识别距离大于所述有效识别距离阈值Th_ValDis,从而确定v2不是有效切分点。
接下来,以v2为第二个起始切分点,以v3为待确认切分点。以v3为右边界的边有(v1、v3)、(v2、v3),其中,v1是有效切分点,v2不是有效切分点,故只需要比较边(v1、v3)对应的待识别字符块的识别距离是否大于所述有效识别距离阈值即可。由于所述边(v1、v3)对应的待识别字符块的识别距离为30,所述有效识别距离阈值Th_ValDis为50,故所述边(v1、v3)对应的待识别字符块的识别距离小于所述有效识别距离阈值Th_ValDis,因此所述候选切分点v3是有效切分点。
接下来,以v3为第三个起始切分点,以v4为待确认切分点,按照上述过程判断v4是否为有效切分点。以此类推,以此判断其他候选切分点是否为有效切分点。进一步的,将确定有效切分点的过程中所获取的待识别字符块的图像、宽高比、识别结果、识别距离分别记录下来,再将其绘制为下表2。
表2
在本实施例中,当所述有效识别距离阈值Th_ValDis为50时,获取的最后一个有效切分点为v6,此时重新获取由所述候选切分点组成的各边的权值,如表3所示。
表3
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | |
1 | - | 101 | 30 | 289 | 428 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
2 | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
3 | - | - | - | 18 | 255 | 505 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
4 | - | - | - | - | 152 | 46 | 339 | 379 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
5 | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
6 | - | - | - | - | - | - | 133 | 99 | 432 | 385 | 1000 | 1000 | 1000 | 1000 |
7 | - | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
8 | - | - | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
9 | - | - | - | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 |
10 | - | - | - | - | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 |
11 | - | - | - | - | - | - | - | - | - | - | - | 1000 | 1000 | 1000 |
12 | - | - | - | - | - | - | - | - | - | - | - | - | 1000 | 1000 |
13 | - | - | - | - | - | - | - | - | - | - | - | - | - | 1000 |
步骤13、从所述有效切分点中获取目标切分点。
在此步骤中,根据所述有效切分点获取至少一条有效切分路径,然后获取所述有效切分路径的有效平均识别距离。进而从所述至少一条有效切分路径中获取有效平均识别距离最小的目标切分路径,并将组成所述目标切分路径的有效切分点作为目标切分点。具体的,可以根据所述有效识别路径中的所有非符号的字符块的识别距离的总和以及所述所有非符号的字符块的数量获取所述有效切分路径的有效平均识别距离。其中,所述符号可以包括标点符号,例如“;”、“!”等。
继续以所述“reporter”为例进行说明。具体的,由步骤12可以获取有效切分点为v1、v3、v4和v6,那么由所述有效切分点v1、v3、v4和v6组成的有效切分路径可以为{v1、v3、v4、v6}、{v1、v3、v4}、{v1、v4、v6}等。接着,获取上述所有有效切分路径的有效平均识别距离。
具体的,以有效切分路径{v1、v3、v4、v6}为例,该有效切分路径{v1、v3、v4、v6}的有效平均识别距离为[A(v1、v3)+A(v3、v4)+A(v4、v6)]/3。其中,A(v1、v3)表示由有效切分点v1、v 3切分出来的字符块的识别距离,A(v3、v4)表示由有效切分点v3、v4切分出来的字符块的识别距离,A(v4、v6)表示由有效切分点v4、v6切分出来的字符块的识别距离。若有效切分点v1、v3切分出来的字符块为符号时,那么所述有效切分路径{v1、v3、v4、v6}的有效平均识别距离为[A(v3、v4)+A(v4、v6)]/3。
进一步的,将平均识别距离最小的有效切分路径作为目标切分路径。此处,假设目标切分路径为{v1、v4、v6}。进而将组成所述目标切分路径{v1、v4、v6}的有效切分点v1、v4、v6作为目标切分点。
步骤14、将由相邻的目标切分点组成的字符块的识别距离与所述有效识别距离阈值进行比较。
在此步骤中,将由v1、v4组成的字符块的识别距离与所述有效识别距离阈值Th_ValDis进行比较,并将由v4、v6组成的字符块的识别距离与所述有效识别距离阈值Th_ValDis进行比较。
步骤15、若所述由相邻的目标切分点组成的字符块的识别距离大于所述有效识别距离阈值,调整所述有效识别距离阈值以获取准确的目标切分点。
因为由v1、v4组成的字符块的识别距离为289,所述有效识别距离阈值Th_ValDis为50,故所述由v1、v4组成的字符块的识别距离大于所述有效识别距离阈值Th_ValDis,进而确定由所述目标切分点v1、v4、v6组成的所述目标切分路径{v1、v4、v6}不准确,并且需要重新获取所述行字符图像的目标切分点。此时,需要重新调整所述有效识别距离阈值Th_ValDis。一般的,需要将所述有效识别距离阈值Th_ValDis调大。
此处,假设所述有效识别距离阈值Th_ValDis为100。接着按照步骤12-步骤15重新获取目标切分点。
在本实施例中,当Th_ValDis=100,将确定目标切分点的过程中所获取的待识别字符块的图像、宽高比、识别结果、识别距离分别记录下来,如下表4所示。
表4
同时,根据表4也可以重新获取由所述切分点组成的各边的权值,如表5所示。
表5
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | |
1 | - | 101 | 30 | 289 | 428 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
2 | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
3 | - | - | - | 18 | 255 | 505 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
4 | - | - | - | - | 152 | 46 | 339 | 379 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
5 | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
6 | - | - | - | - | - | - | 133 | 99 | 432 | 385 | 1000 | 1000 | 1000 | 1000 |
7 | - | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
8 | - | - | - | - | - | - | - | - | 385 | 96 | 370 | 1000 | 1000 | 1000 |
9 | - | - | - | - | - | - | - | - | - | 1000 | 1000 | 1000 | 1000 | 1000 |
10 | - | - | - | - | - | - | - | - | - | - | 93 | 394 | 375 | 1000 |
11 | - | - | - | - | - | - | - | - | - | - | - | 60 | 296 | 342 |
12 | - | - | - | - | - | - | - | - | - | - | - | - | 90 | 63 |
13 | 50 |
由表4可知,当Th_ValDis=100时,有效切分点为v1、v3、v4、v6、v8、v10、v11、v12、v13、v14。由上述有效切分点组成的有效切分路径可以{v1、v3、v4、v6、v8、v10、v11、v12、v13、v14}、{v1、v3、v4、v6、v8、v10、v11、v12、v14}、{v1、v3、v4、v6、v8、v12、v13、v14}等。进一步的,在上述有效切分路径中,经过分析得知有效切分路径{v1、v3、v4、v6、v8、v10、v11、v12、v14}的有效平均识别距离最小。此处,将有效识别路径{v1、v3、v4、v6、v8、v10、v11、v12、v14}作为目标切分路径。将组成该目标切分路径的有效切分点v1、v3、v4、v6、v8、v10、v11、v12、v14作为目标切分点。
进一步的,检验所述目标切分点v1、v3、v4、v6、v8、v10、v11、v12、v14的准确性。首先,将上述相邻的目标切分点组成的字符块的识别距离和所述Th_ValDis进行比较。当获知该目标切分路径中所有相邻的目标切分点组成的字符块的识别距离都小于所述Th_ValDis时,确定该目标识别路径是准确的目标识别路径,进而组成该目标识别路径的目标切分点也是准确的目标切分点。
步骤16、利用准确的目标切分点对所述行字符图像进行切分。
明显的,在本实施例中,由于候选切分点v2、v5、v7、v9、v13不是目标切分点,故没有对以上述候选切分点v2、v5、v7、v9、v13为起始边界的字符块进行识别。由于上述候选切分点v2、v5、v7、v9、v13占所有候选切分点v2、v3、v4、......、v14的5/13,故利用本发明实施例二提供的字符切分方法将字符识别效率提高了38%。
由以上描述可知,由于通过预设的有效识别距离阈值从候选切分点中获取目标切分点,避免了对所有候选切分点组成的字符块进行识别,仅需要对上述目标切分点组成的字符块进行识别,节省了字符识别的时间,从而提高了字符识别的效率。因此,利用本发明实施例的技术方案,提高了字符识别的效率。
如图3所示,本发明实施例三提供了一种字符切分的装置,包括:获取单元31,用于将行字符图像进行过切分,得到行字符图像的候选切分点;有效切分点获取单元32,用于根据预设的有效识别距离阈值从所述候选切分点中获取有效切分点;目标切分点获取单元33,用于从所述有效切分点中获取目标切分点;切分单元34,用于利用所述目标切分点对所述行字符图像进行切分。
其中,如图4所示,所述有效切分点获取单元32包括:待确认切分点获取模块321,用于从所述候选切分点中选取起始切分点,将所述起始切分点的下一候选切分点作为待确认切分点;待识别字符块获取模块322,用于利用所述待确认切分点与所述起始切分点以前的任意一个有效切分点组成待识别字符块,其中所述起始切分点以前的任意一个有效切分点为所述待识别字符块的左边界,所述待确认切分点为所述待识别字符块的右边界;识别距离获取模块323,用于获取所述待识别字符块的识别距离;比较模块324,用于并将所述待识别字符块的识别距离与所述有效识别距离阈值进行比较;有效切分点获取模块325,用于若所述待识别字符块的识别距离小于或等于所述有效识别距离阈值,将所述待确认切分点作为有效切分点。
进一步的,所述比较模块324还用于将所述待识别字符块的宽高比与预设的宽高比阈值进行比较,和/或将所述待识别字符块的高度与预设的高度阈值进行比较。所述识别距离获取模块323具体用于若所述待识别字符块的宽高比小于或等于所述宽高比阈值,和/或所述待识别字符块的高度小于或等于所述高度阈值,获取所述待识别字符块的识别距离。
在本实施例中,如图5所示,所述目标切分点获取单元33包括:有效切分路径获取模块331,用于根据所述有效切分点获取至少一条有效切分路径;有效平均识别距离获取模块332,用于获取所述有效切分路径的有效平均识别距离;目标切分路径获取模块333,用于从所述至少一条有效切分路径中获取有效平均识别距离最小的目标切分路径;目标切分点获取模块334,用于将组成所述目标切分路径的有效切分点作为目标切分点。
其中,所述有效平均识别距离获取模块332具体用于根据所述有效识别路径中的所有非符号的字符块的识别距离的总和以及所述所有非符号的字符块的数量获取所述有效切分路径的有效平均识别距离。
另外,在图3的基础上,如图6所示,所述字符切分装置还包括:比较单元61,用于将由相邻的目标切分点组成的字符块的识别距离与所述有效识别距离阈值进行比较;目标切分点检验单元62,用于若所述由相邻的目标切分点组成的字符块的识别距离大于所述有效识别距离阈值,那么所述目标切分点不准确,进而调整所述有效识别距离阈值以获取准确的目标切分点。
其中,所述字符切分装置的工作原理可以参照前述方法实施例的说明。
由以上描述可知,由于通过预设的有效识别距离阈值从候选切分点中获取目标切分点,避免了对所有候选切分点组成的字符块进行识别,仅需要对上述目标切分点组成的字符块进行识别,节省了字符识别的时间,从而提高了字符识别的效率。因此,利用本发明实施例的字符切分装置,提高了字符识别的效率。
综上所述,利用本发明实施例的技术方案,提高了字符识别的效率。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种字符切分的方法,其特征在于,包括:
将行字符图像进行过切分,得到行字符图像的候选切分点;
根据预设的有效识别距离阈值从所述候选切分点中获取有效切分点;
从所述有效切分点中获取目标切分点;
利用所述目标切分点对所述行字符图像进行切分。
2.根据权利要求1所述的方法,其特征在于,所述根据预设的有效识别距离阈值从所述候选切分点中获取有效切分点包括:
从所述候选切分点中选取起始切分点,将所述起始切分点的下一候选切分点作为待确认切分点;
利用所述待确认切分点与所述起始切分点以前的任意一个有效切分点组成待识别字符块,其中所述起始切分点以前的任意一个有效切分点为所述待识别字符块的左边界,所述待确认切分点为所述待识别字符块的右边界;
获取所述待识别字符块的识别距离,并将所述待识别字符块的识别距离与所述有效识别距离阈值进行比较,若所述待识别字符块的识别距离小于或等于所述有效识别距离阈值,将所述待确认切分点作为有效切分点。
3.根据权利要求2所述的方法,其特征在于,所述获取所述待识别字符块的识别距离之前,还包括:
将所述待识别字符块的宽高比与预设的宽高比阈值进行比较,和/或将所述待识别字符块的高度与预设的高度阈值进行比较;
所述获取所述待识别字符块的识别距离包括:
若所述待识别字符块的宽高比小于或等于所述宽高比阈值,和/或所述待识别字符块的高度小于或等于所述高度阈值,获取所述待识别字符块的识别距离。
4.根据权利要求1所述的方法,其特征在于,所述从所述有效切分点中获取目标切分点包括:
根据所述有效切分点获取至少一条有效切分路径;
获取所述有效切分路径的有效平均识别距离;
从所述至少一条有效切分路径中获取有效平均识别距离最小的目标切分路径;
将组成所述目标切分路径的有效切分点作为目标切分点。
5.根据权利要求4所述的方法,其特征在于,所述获取所述有效切分路径的有效平均识别距离包括:
根据所述有效识别路径中的所有非符号的字符块的识别距离的总和以及所述所有非符号的字符块的数量获取所述有效切分路径的有效平均识别距离。
6.根据权利要求1-5任一所述的方法,其特征在于,所述从所述有效切分点中获取目标切分点之后,还包括:
将由相邻的目标切分点组成的字符块的识别距离与所述有效识别距离阈值进行比较;
若所述由相邻的目标切分点组成的字符块的识别距离大于所述有效识别距离阈值,调整所述有效识别距离阈值以获取准确的目标切分点。
7.一种字符切分的装置,其特征在于,包括:
获取单元,用于将行字符图像进行过切分,得到行字符图像的候选切分点;
有效切分点获取单元,用于根据预设的有效识别距离阈值从所述候选切分点中获取有效切分点;
目标切分点获取单元,用于从所述有效切分点中获取目标切分点;
切分单元,用于利用所述目标切分点对所述行字符图像进行切分。
8.根据权利要求7所述的字符切分的装置,其特征在于,所述有效切分点获取单元包括:
待确认切分点获取模块,用于从所述候选切分点中选取起始切分点,将所述起始切分点的下一候选切分点作为待确认切分点;
待识别字符块获取模块,用于利用所述待确认切分点与所述起始切分点以前的任意一个有效切分点组成待识别字符块,其中所述起始切分点以前的任意一个有效切分点为所述待识别字符块的左边界,所述待确认切分点为所述待识别字符块的右边界;
识别距离获取模块,用于获取所述待识别字符块的识别距离;
比较模块,用于并将所述待识别字符块的识别距离与所述有效识别距离阈值进行比较;
有效切分点获取模块,用于若所述待识别字符块的识别距离小于或等于所述有效识别距离阈值,将所述待确认切分点作为有效切分点。
9.根据权利要求10所述的字符切分的装置,其特征在于,所述比较模块还用于将所述待识别字符块的宽高比与预设的宽高比阈值进行比较,和/或将所述待识别字符块的高度与预设的高度阈值进行比较;
所述识别距离获取模块具体用于若所述待识别字符块的宽高比小于或等于所述宽高比阈值,和/或所述待识别字符块的高度小于或等于所述高度阈值,获取所述待识别字符块的识别距离。
10.根据权利要求7所述的字符切分的装置,其特征在于,所述目标切分点获取单元包括:
有效切分路径获取模块,用于根据所述有效切分点获取至少一条有效切分路径;
有效平均识别距离获取模块,用于获取所述有效切分路径的有效平均识别距离;
目标切分路径获取模块,用于从所述至少一条有效切分路径中获取有效平均识别距离最小的目标切分路径;
目标切分点获取模块,用于将组成所述目标切分路径的有效切分点作为目标切分点。
11.根据权利要求10所述的字符切分的装置,其特征在于,有效平均识别距离获取模块具体用于根据所述有效识别路径中的所有非符号的字符块的识别距离的总和以及所述所有非符号的字符块的数量获取所述有效切分路径的有效平均识别距离。
12.根据权利要求7-11任一所述的字符切分的装置,其特征在于,还包括
比较单元,用于将由相邻的目标切分点组成的字符块的识别距离与所述有效识别距离阈值进行比较;
目标切分点检验单元,用于若所述由相邻的目标切分点组成的字符块的识别距离大于所述有效识别距离阈值,调整所述有效识别距离阈值以获取准确的目标切分点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110221556XA CN102915440A (zh) | 2011-08-03 | 2011-08-03 | 一种字符切分的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110221556XA CN102915440A (zh) | 2011-08-03 | 2011-08-03 | 一种字符切分的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102915440A true CN102915440A (zh) | 2013-02-06 |
Family
ID=47613801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110221556XA Pending CN102915440A (zh) | 2011-08-03 | 2011-08-03 | 一种字符切分的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102915440A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103500332A (zh) * | 2013-09-06 | 2014-01-08 | 优视科技有限公司 | 图片内文字显示方法及装置 |
CN106682671A (zh) * | 2016-12-29 | 2017-05-17 | 成都数联铭品科技有限公司 | 图像文字识别系统 |
CN107341429A (zh) * | 2016-04-28 | 2017-11-10 | 富士通株式会社 | 手写粘连字符串的切分方法、切分装置和电子设备 |
CN108710878A (zh) * | 2018-04-18 | 2018-10-26 | 武汉工程大学 | 一种铁路接触网支柱号牌字符分割方法及系统 |
CN111563495A (zh) * | 2020-05-09 | 2020-08-21 | 北京奇艺世纪科技有限公司 | 一种图像中字符的识别方法、装置及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6327385B1 (en) * | 1997-11-10 | 2001-12-04 | Nec Corporation | Character segmentation device and character segmentation system |
CN1916938A (zh) * | 2005-08-18 | 2007-02-21 | 富士通株式会社 | 识别距离调整装置和方法以及文本行识别装置和方法 |
CN101615251A (zh) * | 2008-06-24 | 2009-12-30 | 三星电子株式会社 | 字符识别设备中用于识别字符的方法和设备 |
CN101770576A (zh) * | 2008-12-31 | 2010-07-07 | 北京新岸线网络技术有限公司 | 字符提取方法和装置 |
CN102129560A (zh) * | 2010-01-18 | 2011-07-20 | 富士通株式会社 | 字符识别的方法和设备 |
-
2011
- 2011-08-03 CN CN201110221556XA patent/CN102915440A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6327385B1 (en) * | 1997-11-10 | 2001-12-04 | Nec Corporation | Character segmentation device and character segmentation system |
CN1916938A (zh) * | 2005-08-18 | 2007-02-21 | 富士通株式会社 | 识别距离调整装置和方法以及文本行识别装置和方法 |
CN101615251A (zh) * | 2008-06-24 | 2009-12-30 | 三星电子株式会社 | 字符识别设备中用于识别字符的方法和设备 |
CN101770576A (zh) * | 2008-12-31 | 2010-07-07 | 北京新岸线网络技术有限公司 | 字符提取方法和装置 |
CN102129560A (zh) * | 2010-01-18 | 2011-07-20 | 富士通株式会社 | 字符识别的方法和设备 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103500332A (zh) * | 2013-09-06 | 2014-01-08 | 优视科技有限公司 | 图片内文字显示方法及装置 |
CN103500332B (zh) * | 2013-09-06 | 2017-03-15 | 优视科技有限公司 | 图片内文字显示方法及装置 |
CN107341429A (zh) * | 2016-04-28 | 2017-11-10 | 富士通株式会社 | 手写粘连字符串的切分方法、切分装置和电子设备 |
CN106682671A (zh) * | 2016-12-29 | 2017-05-17 | 成都数联铭品科技有限公司 | 图像文字识别系统 |
CN108710878A (zh) * | 2018-04-18 | 2018-10-26 | 武汉工程大学 | 一种铁路接触网支柱号牌字符分割方法及系统 |
CN108710878B (zh) * | 2018-04-18 | 2021-11-26 | 武汉工程大学 | 一种铁路接触网支柱号牌字符分割方法及系统 |
CN111563495A (zh) * | 2020-05-09 | 2020-08-21 | 北京奇艺世纪科技有限公司 | 一种图像中字符的识别方法、装置及电子设备 |
CN111563495B (zh) * | 2020-05-09 | 2023-10-27 | 北京奇艺世纪科技有限公司 | 一种图像中字符的识别方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102915440A (zh) | 一种字符切分的方法及装置 | |
CN101833648B (zh) | 文本图像的校正方法 | |
CN1332348C (zh) | 印刷体阿拉伯字符集文本切分方法 | |
CN104951741A (zh) | 一种文字识别方法及装置 | |
CN103942797A (zh) | 基于直方图和超像素的场景图像文字检测方法及系统 | |
CN102541874A (zh) | 网页正文内容提取方法及装置 | |
CN107329950A (zh) | 一种基于无词典的中文地址分词方法 | |
CN103226696A (zh) | 车牌的识别系统及方法 | |
CN111025841B (zh) | 一种优化金属线光学邻近修正工艺窗口的方法 | |
CN102799676A (zh) | 一种递归多层次中文分词方法 | |
CN109792622B (zh) | 物理随机接入信道prach信号恢复的方法和频域prach滤波器 | |
DE102012100519B4 (de) | Detektion und Eliminierung von durch benachbarte identische Verwürfelungscodes verursachter Leistungsverschlechterung | |
CN104516859A (zh) | 一种文字修正方法及系统 | |
KR101795547B1 (ko) | 디지털 고도모델 생성방법 및 장치 | |
KR101717441B1 (ko) | 문자영상 내의 개인정보 보호장치 및 방법 | |
CN112446884B (zh) | 一种激光点云中输电线的定位方法、装置及终端设备 | |
CN107688564A (zh) | 新闻主体企业识别方法、电子设备及计算机可读存储介质 | |
CN110909659A (zh) | 版图关键区域提取方法及其提取系统 | |
CN104363126B (zh) | 路由器功能状态的统计方法、系统及其路由器 | |
KR102235539B1 (ko) | 비디오 품질을 평가하기 위한 방법 및 디바이스 | |
Bai et al. | Underline detection and removal in a document image using multiple strategies | |
CN102708371A (zh) | 基于分割线的漫画帧识别与自动排序方法 | |
CN112581478A (zh) | 基于质心的道路中心线提取方法 | |
WO2020225430A3 (en) | Computer implemented method for segmenting a binarized document | |
CN105306297A (zh) | 基于双参数Tsallis熵对的网络流量异常检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130206 |