CN101510252B

CN101510252B - 区域提取方法、字符识别方法以及字符识别装置

Info

Publication number: CN101510252B
Application number: CN200910007304XA
Authority: CN
Inventors: 武部浩明; 藤本克仁
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2008-02-12
Filing date: 2009-02-11
Publication date: 2012-05-30
Anticipated expiration: 2029-02-11
Also published as: US8300942B2; JP2009193159A; US20090202152A1; JP5125573B2; CN101510252A

Abstract

本发明涉及区域提取程序、字符识别程序以及字符识别装置。该区域提取方法包括以下步骤：获取表示单位区域之间的接续关系的字符点阵，所述单位区域是通过将图像中的字符串图案分割成被识别为与单个字符相对应的各个图案而获得的；针对所获取的字符点阵中的各个单位区域和定义了所述单位区域之间的规则接续关系的规则点阵中的各个单位区域的全部组合，来判定所述组合是否可能成立；生成连接在与被判定为可能成立的单元区域的组合相对应的节点之间的路径；基于与所述规则点阵或者所述字符点阵的一致程度来确定所生成的路径中的最优路径；以及从图像中提取所述字符点阵中的与所确定的最优路径相对应的单位区域。

Description

区域提取方法、字符识别方法以及字符识别装置

技术领域

本发明涉及字符识别方法以及用于字符识别的区域提取方法。

背景技术

在现有技术中，众所周知存在一种OCR(光学字符读取器(Optical Character Reader))，其用于通过扫描仪捕获诸如票据的文件以将所捕获的文件转换成图像数据，进而将图像数据中的图案识别为字符。在这种OCR中，会不正确地分离出被提取为与单个字符相对应的图案的区域，或者会不正确地识别出与各分离出的区域中的图案相对应的字符，因此，字符识别的结果并非总是可靠的。特别是，当图像数据的质量较差时，或者当在图像数据中包含由诸如数字字符之类的相似字符构成的词时，字符识别的准确性趋于下降。

例如，在日本特开平11-272804中提出的方法中，在与先前登记在词典中的词进行比较的同时，对字符识别的结果进行修改，由此提高字符识别的准确性。具体来说，当将具有层级结构且由多个词构成的词串(诸如地址)的字符识别的结果与登记在词典中的词进行比较时，通过考虑层级之间的接续来选择具有最高可靠性的词的组合，并因此将该词的组合确定为最终识别结果。

此外，例如，日本特开2002-312365提出通过考虑字符识别的结果中的多种可能性来检索最终的识别结果。具体来说，在对包含字符串的图案进行字符识别之后，对该字符识别的结果进行形态分析，并再次对被判断为名词或未登记的词的区域进行字符识别。然后将再次获得的字符识别结果作为候选添加到第一字符识别结果，并从多个候选中检索最终的识别结果。

通常，许多票据包括多个通过固定格式的规则表述来表示的信息，诸如日期和价格。在这些信息中，虽然即使不同票据的该格式相同，但在各票据中数字字符的数位数会改变，因此字符数也可能不同。因此，当对诸如票据的文件应用字符识别时，需要包括字符数变化的通配符，并且同时，需要正确识别由规则表述所表达的信息。

然而，当信息中的字符数变化时，即使格式是固定的，也存在难以执行准确的字符识别的问题。即，当信息中的字符数变化时，除了字符识别中的错误外，也可能错误地分割对应于单个字符的图案。因此，即使是通过规则表述来表达信息，在字符识别的准确度的提高方面也存在固定极限。在上述专利文献中描述的方法中，尽管在词典中登记的词或者通过再次执行字符识别所获得的结果是识别结果的候选，但也很可能增加了候选数量。特别是，当字符识别目标的信息例如是日期时，在该日期中包含许多相似的数字字符，同时识别结果的候选的数量被认为非常大；因此，需要从大量候选中选择最终识别结果，由此在识别准确度的提高上产生固定极限。

此外，当信息中的字符数变化时，即使在对应于该信息的区域中包含噪声，也不能有效地去除该噪声。即，当字符数固定时，可在执行字符识别的同时相对有效地去除字符串图案两端的噪声。然而，当信息中的字符数变化时，难以区分字符串图案的两端的污迹是噪声还是字符。

发明内容

根据本发明的各实施方式的一个方面，提供了一种区域提取方法，该区域提取方法包括以下步骤：获取表示单位区域之间的接续关系的字符点阵，所述单位区域是通过将图像中的字符串图案分割成被识别为与单个字符相对应的各个图案而获得的；针对所获取的字符点阵中的各个单位区域与定义了所述单位区域之间的规则接续关系的规则点阵中的各个单位区域的全部组合，来判定所述组合是否可能成立；生成连接在与被判定为可能成立的单元区域的组合相对应的节点之间的路径；基于与所述规则点阵或者所述字符点阵的一致程度来从所生成的路径中确定最优路径；以及从图像中提取字符点阵中的与所确定的最优路径相对应的单位区域。

本发明的各实施方式提供了一种字符识别装置，该字符识别装置包括：获取部，其获取表示单位区域之间的接续关系的字符点阵，所述单位区域是通过将图像中的字符串图案分割成被识别为与单个字符相对应的各个图案而获得的；判定部，其针对由所述获取部获取的所述字符点阵中的各个单位区域与定义了所述单位区域之间的规则接续关系的规则点阵中的各个单位区域的全部组合，来判定所述组合是否可能成立；生成部，其生成连接在与被所述判定部判定为可能成立的单元区域的组合相对应的节点之间的路径；确定部，其基于与所述规则点阵或者所述字符点阵的一致程度来确定由所述生成部生成的路径中的最优路径；提取部，其从图像中提取字符点阵中的与所述确定部确定的最优路径相对应的单位区域；以及识别部，其利用只包含所述规则点阵中的单位区域所属的类目中的字符的类目词典对所述提取部提取的单位区域中的图案应用字符识别。

附图说明

图1是示出根据一实施方式的字符识别装置的相关部件的构成的框图；

图2是示出根据一实施方式的规则点阵的示例的图；

图3是示出根据一实施方式的预处理结果的示例的图；

图4是示出根据一实施方式的字符点阵的示例的图；

图5是示出根据一实施方式的对应关系表的示例的图；

图6是示出根据一实施方式的最优路径的示例的图；

图7是示出根据一实施方式的目标区域的示例的图；

图8是示出根据一实施方式的字符识别装置的操作的流程图；

图9是示出根据一实施方式的对应关系表生成处理的流程图；

图10是示出根据一实施方式的路径生成处理的流程图；

图11是示出根据一实施方式的节点的连接的示例的图；

图12是示出根据一实施方式的节点的连接的另一示例的图；

图13是示出根据一实施方式的节点的连接的又一示例的图；以及

图14是示出根据一实施方式的字符识别结果的示例的图。

具体实施方式

稍后将描述的本实施方式的本质特征是针对字符点阵中的单位区域(其中，以点阵形式表达作为字符识别目标的字符串区域)和规则点阵中的单位区域(其中，以点阵形式来表述定义了信息格式的规则表述)的各组合来计算可靠性，并因此确定连接与具有高可靠性的组合相对应的节点的路径中的最优路径，由此提取与该最优路径相对应并将经历字符识别的区域。此后，参照附图详细描述本发明的一实施方式。

图1是示出根据一实施方式的字符识别装置100的相关部件的构成的框图。该字符识别装置100具有预处理部101、字符词典存储部102、规则点阵存储部103、类目词典存储部104、目标字符串提取部105、字符串区域放大部106、字符点阵生成部107、识别可靠性计算部108、路径生成部109、最优路径确定部100、目标区域提取部111以及类目识别部112。

预处理部101对包括由规则表述所表达的信息(例如日期)图案的票据应用字符识别(其中，利用了字符词典存储部102中存储的字符词典)，并获得由该票据的整个图像的字符串图案所表达的字符串。

字符词典存储部102存储有包括了票据图像中能够包含的全部字符的字符词典。即，在普通字符识别中，词典存储部102存储用于与图像中的图案进行比较的字符词典。

规则点阵存储部103存储有定义了票据中的规则表述的规则点阵。即，规则点阵存储部103存储了由规则表述所表达的信息中的单位区域的单个字符和定义了所述单位区域之间的接续关系的规则点阵。

具体来说，规则点阵存储部103，例如图2中所示，存储了日期中的单位区域e1到e11的单个字符和这些单位区域之间的接续关系。此后，利用图2的规则点阵作为一个主要示例进行描述。

在图2所示的示例中，单位区域e1到e4分别对应于表示年份的数字字符，而单位区域e5对应于字符“年(year)”。单位区域e6和e7对应于表示月份的数字字符，而单位区域e8对应于字符“月(month)”。单位区域e9和e10对应于表示日的数字字符，而单位区域e11对应于字符“日(day)”。例如，当由公元纪年来表达年份时，位数是4，因此所有的单位区域e1到e4对应于数字字符。当由年代名称来表达年份时，位数是2，因此仅单位区域e1和e2对应于数字字符。因此，当由年代名称来表达年份时，单位区域e5连接到单位区域e2。同样，因为月和日具有1或2个数字，所以单位区域e8或e11可以直接连接到单位区域e6或e9，或者单位区域e8或e11可以连接到单位区域e6和e7或e9和e10。

类目词典存储部104按类目对字符字典中包含的字符进行分类，并针对各类目存储其中包括字符的类目词典。即，词典存储部104存储分别属于不同类目的多个词典，诸如属于数字字符类的词典和属于日期中使用的字符类的词典。在图1中，尽管分开设置了字符词典存储部102和类目词典存储部104，但它们也可集成起来。此外，替代存储不同的词典作为字符词典和类目词典，也可存储用于字符和多个类目定义的一个词典。

目标字符串提取部105从作为预处理部101的字符识别的结果而获得的字符串中提取目标字符串，在该目标字符串中，至少一部分形式与规则点阵存储部103中存储的规则点阵中的形式一致。具体来说，例如当从图3的顶部所示的字符串图案获得图3的底部所示的预处理结果时，被识别为“9月24”的字符串201与图2所示的规则点阵中的单位区域e6、e8、e9以及e10之间的接续关系一致，因此，目标字符串提取部105提取字符串201。在目标字符串提取部105对目标字符串进行的提取中，可使用国际公开WO 2007/080642中所述的技术或者其他技术。

字符串区域放大部106对包含与目标字符串提取部105所提取的目标字符串相对应的图案的区域进行放大，并确定与由规则点阵所示的整个信息相对应的字符串区域。具体来说，在与目标字符串相对应的图案中，字符串区域放大部106计算该图案的单个字符的平均字符尺寸和与单个字符相对应的图案之间的平均字符间隔，并且以如它们之和的区域尺寸为单位，来对包含与目标字符串相对应的图案的区域进行放大。当放大的区域中包含与单个字符相对应的新图案时，字符串区域放大部106进一步放大该区域。此后，字符串区域放大部106继续放大该区域，直到被放大的区域中不包含与单个字符相对应的新图案为止，由此最终获得其中不存在相邻的与单个字符相对应的图案的字符串区域。

字符点阵生成部107对通过字符串区域放大部106获得的字符串区域中的图案应用字符识别(其中，利用字符词典存储部102中存储的字符词典)，并生成示出该字符串中的单位区域的单个字符和所述单位区域之间的接续关系的字符点阵。即，字符点阵生成部107将字符串区域中的图案分割成与单个字符相对应的单位区域，并对各单位区域中的图案应用字符识别。此时，当存在多个分割单位区域的候选时，字符点阵生成部107对各候选的单位区域中的图案应用字符识别。

具体来说，例如当将图4的顶部示出的字符串区域中的图案分割成单位区域时，针对表示“年”的图案，字符点阵生成部107针对将整个图案看成一个单位区域的候选和将该图案分割成单位区域202和203的候选执行字符识别。结果，例如如图4的中部所示，针对表示“年”的图案，字符点阵生成部107获得与一个字符“年”相对应的字符识别结果和与两个字符“午”和“三”相对应的字符识别结果。

然后，字符点阵生成部107将用于分割单位区域的各候选中的单位区域之间的接续关系看作字符点阵。具体来说，例如如图4的底部所示，字符点阵生成部107将用于分割单位区域的各候选中的单位区域r1到r14的单个字符和这些单位区域之间的接续关系生成为字符点阵。即，在图4的顶部示出的字符串区域的示例中，存在将表示“年”的图案分割成单位区域r5和r6的情况以及将该图案看作一个单位区域r14的情况。当将表示“年”的图案看作一个单位区域r14时，不是单位区域r5和r6而是单位区域r14连接到单位区域r4和r7。因此，字符点阵生成部107生成如图4的底部所示的字符点阵。

当字符点阵生成部107在单位区域中执行字符识别时，计算出表示各单位区域中的图案与字符的图案之间的相似度的距离值(例如，诸如马哈朗诺比斯距离(Mahalanobis distance)的值)作为字符识别结果。当该距离值较小时，单位区域中的图案与字符词典中包含的字符的图案彼此更为相似，因此可以说该字符识别的准确度较高。

识别可靠性计算部108针对字符点阵生成部107生成的字符点阵中单位区域中的所有字符识别结果计算表示字符识别的可靠性的识别可靠性，并且针对字符点阵中的单位区域和规则点阵中的单位区域的全部组合确定所述单位区域是否极有可能彼此相对应。

具体来说，针对上述示例中的字符点阵中的单位区域r1到r14，识别可靠性计算部104在假设单位区域r1到r14分别对应于规则点阵中的单位区域e1到e11的情况下辨别类目，并利用类目词典存储部104中存储的类目词典，限于所辨别出的类目，来执行字符识别。因此，例如当假设字符点阵中的单位区域r1和规则点阵中的单位区域e1彼此相对应时，单位区域e1对应于数字字符，因此识别可靠性计算部108将单位区域r1的图案限于数字字符类目，来执行字符识别。此时，识别可靠性计算部108计算表示各单位区域中的图案与字符的图案之间的相似度的距离值作为字符识别结果。

同样，当假设字符点阵中的单位区域r1与规则点阵中的单位区域e5彼此相对应时，单位区域e5对应于字符“年”，因此识别可靠性计算部108将单位区域r1的图案识别为“年”，并计算表示该相似度的距离值。

然后识别可靠性计算部108基于在使用字符点阵生成部107计算的字符词典的情况下的距离值与使用类目词典的情况下的距离值之比来判定单位区域的组合是否成立。即，识别可靠性计算部108将使用字符词典的情况下的距离值(dc)除以使用类目词典的情况下的距离值(d1)来计算识别可靠性(＝dc/d1)，并确定具有不小于预定阈值的识别可靠性的组合是否可能成立。

在上述情况下，如果字符点阵中的单位区域和规则点阵中的单位区域的组合成立，则认为字符识别结果在使用字符词典和使用类目词典这两种情况下是相同的。因此，各情况下的距离值是相同的(dc＝d1)，并且识别可靠性为1。同时，如果字符点阵中的单位区域和规则点阵中的单位区域的组合不成立，则认为字符词典中包含的字符更加相似于字符识别结果。因此，使用字符词典的情况下的距离值不大于使用类目词典的情况下的距离值(dc≤d1)。结果，识别可靠性不大于1，并且使用类目词典的情况下的字符识别结果的准确度越低(即，距离值d1越大)，识别可靠性越小。

识别可靠性计算部108根据识别可靠性确定规则点阵中的单位区域与字符点阵中的单位区域的全部组合是否可能成立，生成将可能成立的组合列为节点的对应关系表，并向路径生成部109输出该对应关系表。具体来说，例如如图5所示，识别可靠性计算部108向路径生成部109输出其中由节点(黑圈)表示可能成立的单位区域的组合的对应关系表。

在识别可靠性计算部108所生成的所述对应关系表中，路径生成部109执行顺序连接作为可能成立的单位区域的组合的节点路径生成处理。具体来说，路径生成部109根据路径生成条件来连接例如图5所示的对应关系表中的节点。在该条件下，提取连接到与新连接节点相对应的单位区域的预定数量的单位区域，并且针对由提取的单位区域所构成的节点，将具有最大连接数的节点连接到新连接节点。即，针对由与对应于新连接节点的规则点阵中的单位区域相邻的单位区域和与对应于新连接节点的字符点阵中的单位区域相邻的单位区域的组合所构成的节点，将通过最大数量节点的节点连接到所述新连接节点。

同时，当存在多个具有最大连接数的节点时，针对这些节点，将具有最大再现率的路径中所包含的节点连接到所述新连接节点。所述再现率表示再现了规则点阵中的接续关系的级别。稍后详细描述路径生成部109的路径生成处理。

当路径生成部109针对对应关系表上的全部节点完成了路径生成处理时，最优路径确定部110确定具有最大再现率(表示再现了规则点阵中的接续关系的级别)并具有最大匹配率(表示符合字符点阵中的接续关系的级别)的一条最优路径。即，最优路径确定部110在对应关系表上选择最优路径204，例如如图6所示。在这种情况下，在最优路径204中，连接规则点阵中的单位区域，使得e1→e2→e3→e4→e5→e6→e8→e9 →e10→e11，因此，完全再现了其中连接图2中所示的规则点阵中的单位区域使得e1→e2→e3→e4→e5→e6→e8→e9→e10→e11的接续关系。此外，在最优路径204中，连接字符点阵中的单位区域，使得r1→r2→r3→r4→r14→r8→r9→r10→r11→r12，因此，与其中连接图4的底部所示的字符点阵中的单位区域使得r1→r2→r3→r4→r14→r7→r8→r9→r10→r11→r12→r13的接续关系相比，可以发现除了单位区域r7和r13外的10个单位区域是匹配的。

最优路径确定部110基于各路径的再现率和匹配率来确定最优路径。然而，此时，最优路径确定部110选择具有最大再现率的路径作为最优路径。当存在多个具有最大再现率的路径时，最优路径确定部110将这些路径中具有最大匹配率的路径确定为最优路径。

目标区域提取部111提取包括与最优路径确定部110确定的最优路径相对应的字符点阵中的全部单位区域的区域作为最终进行字符识别的目标区域。具体来说，例如当确定如图7的顶部所示的最优路径时，如图7的中部所示，目标区域提取部111选择与最优路径相对应的字符点阵中的单位区域r1、r2、r3、r4、r14、r8、r9、r10、r11和r12，并且如图7的底部所示，提取包括所选择的单位区域的最小目标区域。因此，目标区域提取部111提取除图7的底部的噪声图案外的目标区域。

字符点阵生成部107到目标区域提取部111形成根据本实施方式的字符识别装置100中的区域提取部，该区域提取部从票据图像中的字符串区域提取将实际经历字符识别的区域。

类目识别部112对目标区域提取部111提取的目标区域中的图案应用字符识别(其中使用类目词典存储部104中存储的类目词典)，并输出识别结果。即，识别部112利用与目标区域中的图案所表示的信息的类目相对应的类目词典来执行限制了类目的字符识别。

接着，参照图8中所示的流程图来描述具有上述构造的字符识别装置100的操作。在以下描述中，根据需要适当参照图2到图7中示出的示例。

首先，当将票据图像输入到字符识别装置100时，预处理部101对整个票据图像执行字符识别(步骤S101)。作为预处理的结果，可以获得包括如图3底部所示的字符的字符识别结果，并且由目标字符串提取部105从通过预处理获得的字符识别结果中提取其中一部分与规则点阵一致的目标字符串(步骤S102)。在该示例中，由于目标字符串201：“9月24”与图2中所示的规则点阵中的单位区域e6、e8、e9以及e10之间的接续关系一致，因此提取该目标字符串201。

由字符串区域放大部106将票据图像上与目标字符串201相对应的区域放大到包括图4的顶部所示的整块信息的字符串区域(步骤S103)。即，以与单个字符相对应的图案占据的区域为单位，放大票据图像上与目标字符串201相对应的区域，并由字符串区域放大部106获得包括与目标字符串201邻近的全部图案的字符串区域。在这种情况下，作为一块信息并表示日期的图案包含在该字符串区域中。此外，如图4的顶部所示，字符串区域中包括除日期以外的噪声图案。

当获得包括一块信息的字符串区域时，由字符点阵生成部107对该字符串区域中的图案应用不限制类目的字符识别(步骤S104)。即，字符点阵生成部107将该字符串区域分割成包括与单个字符相对应的图案的单位区域，并且利用字符词典存储部102中存储的字符词典对各单位区域中的图案进行字符识别。此时，当存在多个用于分割单位区域的候选时，字符点阵生成部107基于各候选执行字符识别，并且如图4的中部所示，获得字符识别结果的多个候选。

然后，由字符点阵生成部107生成表示字符识别结果的所有候选中的单位区域之间的接续关系的字符点阵(步骤S105)。即，如图4的底部所示，由字符点阵生成部107生成表示各候选中分离的单位区域r1到r14之间的接续关系的字符点阵。同时，计算表示各单位区域r1到r14中的字符识别结果与字符词典中包含的字符之间的相似度的距离值。此后，将规则点阵与字符点阵进行相互比较，并且当规则点阵中的单位区域和字符点阵中的单位区域一一对应时，就找到了与各点阵中的接续关系相符合的单位区域的组合。

即，识别可靠性计算部108根据字符点阵中各单位区域中的字符识别结果来计算识别可靠性，基于该识别可靠性选择可能成立的单位区域的组合，并且执行指定所选择的组合作为节点的对应关系表生成处理(步骤S106)。在该对应关系表中，如图5所示，针对规则点阵中的单位区域和字符点阵中的单位区域的组合，与可能成立的组合相关联地记录由黑圈表示的节点。稍后详细描述识别可靠性计算部108进行的对应关系表生成处理。

然后，由路径生成部109执行连接对应关系表中的节点的路径生成处理(步骤S107)。路径生成处理从对应关系表的端头的节点开始，并通过确定连接到当前节点的在先节点来执行。连接节点使得更如实地再现规则点阵中的单位区域与字符点阵中的单位区域之间的接续关系。稍后详细描述路径生成部109进行的路径生成处理。

当针对对应关系表中的全部节点完成了路径生成处理时，最优路径确定部110从在对应关系表中生成的多个路径中确定最优路径(步骤S108)。即，最优路径确定部110确定具有与规则点阵和字符点阵一致的最高级别的最优路径。具体来说，最优路径确定部110选择具有最大再现率的路径作为最优路径。再现率表示由各路径表示的单位区域之间的接续关系再现了规则点阵中的单位区域之间的接续关系的比率。当存在多个具有最大再现率的路径时，最优路径确定部110选择具有最大匹配率的路径作为最优路径。匹配率表示由这些路径表示的单位区域之间的接续关系符合字符点阵中的单位区域之间的接续关系的比率。

当确定了对应关系表中的最优路径时，由目标区域提取部111提取包括与该最优路径相对应的字符点阵中的全部单位区域的目标区域(步骤S109)。即，例如当确定如图7的顶部所示的最优路径时，如图7的中部所示，目标区域提取部111选择字符点阵中的单位区域r1、r2、r3、r4、r14、r8、r9、r10、r11以及r12，并且如图7的底部所示提取包括所选择的单位区域的最小区域作为目标区域。

然后，类目识别部112对所述目标区域中的图案应用利用了关于日期的类目词典的字符识别(步骤S110)。此时，在图7的底部所示的目标区域中，由于消除了图4的顶部所示的字符串区域中包含的噪声图案205，所以能够提高字符识别的准确度。此外，由于从对应关系表中的最优路径提取了该目标区域，所以规则点阵表达的信息非常可能包含在该目标区域中，并且对该目标区域中的图案应用其中使用了与规则点阵相对应的类目词典的字符识别，由此能够进一步提高字符识别的准确度。

接着，参照图9所示的流程图来描述根据本实施方式的对应关系表生成处理。

由字符点阵生成部107生成字符点阵，并且当计算字符点阵中的各单位区域中的字符识别结果与字符词典中的字符之间的距离值时，由识别可靠性计算部108对各单位区域中的图案应用其中利用了类目词典的字符识别(步骤S201)。在这种情况下，利用关于与规则点阵相对应的类目的类目词典，并将各单位区域中的图案限制于例如数字字符，以进行字符识别，或者限制于字符“年月日”以进行字符识别。同时，计算表示各单位区域中针对类目的字符识别结果与类目词典中包含的字符之间的相似度的距离值。

然后，由识别可靠性计算部108选择出规则点阵中的单位区域和字符点阵中的单位区域的一个组合(步骤S202)。在这种情况下，假设选择了单位区域e1和单位区域r1的组合。当选择了该单位区域的组合时，识别可靠性计算部108计算关于该组合的识别可靠性(步骤S203)。具体来说，将利用了字符词典的字符识别的距离值除以利用了与单位区域e1相对应的类目的词典的字符识别的距离值，由此计算出识别可靠性。

随后，判定识别可靠性是否不小于预定阈值(步骤S204)。当识别可靠性不小于预定阈值时，确定该单位区域的组合为在对应关系表上构成的路径的组合(步骤S205)。当识别可靠性小于预定阈值时，确定该组合为不在对应关系表上构成的路径的组合(步骤S206)。当确定单位区域e1和单位区域r1的组合为构成路径的组合时，该组合为对应关系表上的节点。此后，利用单位区域的组合以类似(e1，r1)的坐标形式描述对应关系表上的该节点。

当完成了利用识别可靠性对单位区域e1和单位区域r1的组合是否是节点的判定时，确定是否完成了单位区域的全部组合的判定(步骤 S207)。此时，完成了仅针对单位区域e1和单位区域r1的组合的判定，但是没有完成针对全部组合的判定(步骤S207是“否”)；因此，选择出单位区域的另一组合(例如，单位区域e1和单位区域r2的组合)(步骤S202)。和上述情况一样，重复进行单位区域的组合是否是节点的判定，并且当完成了单位区域的所有组合的判定时(步骤S207为“是”)，完成了其中将可能成立的组合指定为节点的对应关系表(见图5)。

接着，参照图10所示的流程图描述根据本实施方式的路径生成处理。此后，假设要生成图5中所示的对应关系表，并且利用具体示例进行描述。

当识别可靠性计算部108生成对应关系表时，路径生成部109选择对应关系表的端头的一个节点(步骤S301)。在这种情况下，首先选择(e1，r1)。然后，确定是否存在(e1，r1)之前的节点(步骤S302)。不存在连接在单位区域e1和单位区域r1之前的单位区域，因此，确定不存在在先节点(步骤S302为“否”)，因此选择下一节点(e2，r1)(步骤S301)。然而，不存在连接在单位区域r1之前的单位区域，因此，确定不存在在先节点(步骤S302为“否”)，因此选择(e3，r1)。此后，以类似方式，直接到达具有在先节点的节点才确定在先节点的存在。

当选择(e2，r2)时，单位区域e1连接在单位区域e2之前，并且单位区域r1连接在单位区域r2之前。因此，确定存在在先节点(步骤S302为“是”)，并提取与连接在各单位区域之前的单位区域的预定数量相对应的在先节点(步骤S303)。当假设提取与连接在各单位区域之前的单位区域相对应的至多两个在先节点时，会提取出与单位区域e2之前的单位区域e1和单位区域r2之前的单位区域r1相对应的(e1，r1)。

当提取了在先节点时，将所提取的在先节点之一和当前选择的节点相互连接(步骤S304)；然而，在上述情况下，由于只有(e1，r1)被提取为在先节点，因此将(e1，r1)和(e2，r2)相互连接。

此后，确定是否完成了所有节点的选择和节点的连接(步骤S305)。当存在未选择的节点(步骤S305为“否”)时，重新连接该未选择的节点(步骤S301)。当选择了所有节点(步骤S305为“是”)时，确定连接了全部可连接节点，因此完成了路径生成处理。

这里，利用具体示例进一步描述在提取了在先节点的情况下的节点的连接。

反复进行节点的上述连接，并且当选择了图11中白色圆圈表示的(e4，r4)时，提取与单位区域e4之前的单位区域e2和e3以及单位区域r4之前的单位区域r2和r3相对应的四个在先节点(e2，r2)、(e2，r3)、(e3，r2)以及(e3，r3)。这些在先节点在图11中由虚线包围。

在上述情况下，(e4，r4)与具有最大连接数的在先节点连接。即，在(e2，r2)、(e2，r3)以及(e3，r2)分别连接到一个在先节点的同时，(e3，r3)连接到两个在先节点；因此，(e4，r4)连接到(e3，r3)。

此外，当选择了图12中由白色圆圈表示的(e6，r8)时，可以认为单位区域e4和e5在单位区域e6之前彼此连接，并且同时，可以认为单位区域e2和e5彼此连接(见图2)。类似的是，可以认为单位区域r6和r7在单位区域r8之前彼此连接，并且同时，可以认为单位区域r14和r7彼此连接(见图4的底部)。因此，当选择了(e6，r8)时，提取由图12中虚线包围的范围内的节点作为在先节点。

在上述情况下，由于图12中虚线包围的范围中只存在一个在先节点(e5，r14)，因此将(e6，r8)连接到(e5，r14)。

此外，当选择了图13中由白色圆圈表示的(e8，r9)时，可以认为单位区域e6和e7在单位区域e8之前彼此连接，并且同时，可以认为单位区域e5和e6彼此连接(见图2)。此外，单位区域r7和r8在单位区域r9之前彼此连接。因此，当选择了(e8，r9)时，提取由图13中虚线包围的范围内的节点作为在先节点。

提取了两个在先节点(e6，r8)和(e7，r8)，并且这些在先节点的各连接数是相同的。在这种情况下，将具有最大再现率的到达各在先节点的路径的在先节点连接到(e8，e9)。即，在到达(e6，r8)的路径中，单位区域被连接成e1→e2→e3→e4→e5→e6，因此完全再现了规则点阵中从单位区域e1到单位区域e6的接续关系。同时，在到达(e7，r8)的路径中，单位区域被连接成e1→e2→e3→e4→e5→e7，并且单位区域e6不包含在该接续关系中；因此，规则点阵中从单位区域e1到单位区域e7的接续关系的再现率小于(e6，r8)。因此，在这种情况下，(e8，r9)被连接到具有更大再现率的(e6，r8)。

节点顺次连接到在先节点，由此，考虑到字符识别准确度和点阵中的接续关系，生成用于连续连接规则点阵中的单位区域和字符点阵中的单位区域的组合的全部路径。选择具有最大再现率的路径作为这些路径中的最优路径，由此，可以获得规则点阵中的单位区域和字符点阵中的单位区域之间的最准确的对应关系。再现率是规则点阵中对应于路径所经过的节点的单位区域的数量与规则点阵中的接续关系中的单位区域的数量之比。例如，针对图6中所示的最优路径，考虑规则点阵中的接续关系中的10个单位区域，其中不包括单位区域e7，连接了与全部所述10个单位区域相对应的节点，因此再现率为1(＝10/10)。

当存在多个具有最大再现率的路径时，可以从这些路径中选择具有最大匹配率的路径作为最优路径。匹配率是字符点阵中对应于路径所经过的节点的单位区域的数量与字符点阵中的接续关系中的单位区域的数量之比。例如，针对图6中所示的最优路径，考虑字符点阵中的接续关系中的12个单位区域，其中不包括单位区域r5和r6，连接了与10个单位区域相对应的节点，因此再现率为0.83(≈10/12)。

如上所述，根据本实施方式，在考虑了字符点阵中的单位区域和规则点阵中的单位区域的全部组合的对应关系表上，将识别可靠性不小于预定阈值的组合作为节点，生成连接这些节点的路径，并确定具有最大再现率和最大匹配率的最优路径。因此，可以确定与规则点阵和字符点阵一致的单位区域的组合，由此，即使规则点阵中包含其中字符数变化的通配符，也能够准确地确定单位区域之间的对应关系。此外，通过确定最优路径来确定单位区域之间的对应关系，由此，提取包含字符点阵中的与最优路径相对应的单位区域的目标区域，并对目标区域中的图案应用类目字符识别；因此，可以对其中字符数变化并且由规则表述所表达的信息有效且准确地应用字符识别。

在上述实施方式中，在提取目标区域之后对该目标区域中的图案应用类目字符识别。在这种情况下，例如，如图14的顶部所示，也对该目标区域中的噪声图案301应用类目字符识别。因此，如图14的底部所示，噪声图案301被误识别为字符“月”；然而，由于该字符识别结果中的识别准确度被认为较低，所以由虚线包围的识别准确度不大于预定基准的区域可能是空白的。

此外，当最优路径确定部110确定最优路径时，可以获得规则点阵中的单位区域和字符点阵中的单位区域之间的对应关系，因此，可以针对各个单位区域执行类目字符识别。在这种情况下，如图7的中部所示，由于噪声图案不包括在与最优路径相对应的单位区域中，因此可以进一步提高字符识别准确度。

在上述实施方式中，尽管是由字符识别装置100执行提取目标区域的处理和字符识别处理，但这些处理也可以描述为计算机可读形式的程序，并且可以使计算机来执行这些程序。

上述实施方式只是示例，很明显，本领域的技术人员可以通过组合各实施方式的组成部分来对本发明进行修改或者变更。对于本领域的技术人员来说显而易见，可在不偏离所附权利要求中描述的本发明的精神和范围的情况下对上述实施方式作出各种修改。

本申请基于并要求2008年2月12日提交的在先日本专利申请2008-30887的优先权，在此通过引用并入其全部内容。

Claims

1.一种区域提取方法，所述方法包括以下步骤：

获取步骤，其获取表示单位区域之间的接续关系的字符点阵，所述单位区域是通过将图像中的字符串图案分割成被识别为与单个字符相对应的各个图案而获得的；

判定步骤，其针对在所述获取步骤中获取的所述字符点阵中的各个单位区域和定义了所述单位区域之间的规则接续关系的规则点阵中的各个单位区域的全部组合，来判定所述组合是否可能成立；

生成步骤，其生成连接在与所述判定步骤中被判定为可能成立的单元区域的组合相对应的节点之间的路径；

确定步骤，其基于与所述规则点阵的一致程度或者与所述规则点阵和所述字符点阵的一致程度来确定在所述生成步骤中生成的路径中的最优路径；以及

提取步骤，其从图像中提取所述字符点阵中的与在所述确定步骤中确定的所述最优路径相对应的单位区域。

2.如权利要求1所述的区域提取方法，其中，所述生成步骤还包括以下步骤：

节点提取步骤，其提取新连接到其他节点的新连接节点和在先节点，所述在先节点已经连接到其他节点，并在从在所述字符点阵所示的单位区域之间的接续关系以及所述规则点阵所示的单位区域之间的规则接续关系中与所述新连接节点相对应的单位区域开始的预定范围内的单位区域的组合内；以及

节点连接步骤，其将在所述节点提取步骤中提取的并且具有到所述在先节点的最大连接数量的在先节点连接到所述新连接节点。

3.如权利要求2所述的区域提取方法，其中，在所述节点连接步骤中，当存在多个具有最大连接数量的在先节点时，针对所述对应的多个在先节点，基于再现由所述规则点阵表示的单位区域之间的规则接续关系的再现率来相互连接包括在所述路径中的在先节点和新连接节点。

4.如权利要求1所述的区域提取方法，其中，在所述确定步骤中，基于再现由所述规则点阵表示的单位区域之间的规则接续关系的再现率来确定所述最优路径。

5.如权利要求4所述的区域提取方法，其中，在所述确定步骤中，当存在多个具有最大再现率的路径时，针对所述对应的多个路径，基于符合由所述字符点阵表示的单位区域之间的接续关系的匹配率来确定所述最优路径。

6.如权利要求1所述的区域提取方法，其中，所述判定步骤还包括以下步骤：

计算步骤，其针对所述单位区域的各组合中的所述字符点阵中的单位区域中的图案，来计算识别可靠性，该识别可靠性表示在利用包括全部字符的字符词典执行字符识别的情况下的字符识别准确度与在利用只包括所述规则点阵中的单位区域所属的类目中的字符的类目词典执行所述字符识别的情况下的字符识别准确度之比，

其中，将在所述计算步骤中计算出的识别可靠性满足预定标准的组合确定为可能成立。

7.一种字符识别方法，所述方法包括以下步骤：

获取步骤，其获取表示单位区域之间的接续关系的字符点阵，所述单位区域是通过将图像中的字符串图案分割成与被识别为与单个字符相对应的各个图案而获得的；

确定步骤，其基于与所述规则点阵的一致程度或者与所述规则点阵和所述字符点阵的一致程度来确定在所述生成步骤中生成的路径中的最优路径；

提取步骤，其从图像中提取所述字符点阵中的与在所述确定步骤中确定的最优路径相对应的单位区域；以及

识别步骤，其利用只包含所述规则点阵中的单位区域所属的类目中的字符的类目词典对在所述提取步骤中提取的单位区域中的图案应用字符识别。

8.一种字符识别装置，该字符识别装置包括：

获取装置，其获取表示单位区域之间的接续关系的字符点阵，所述单位区域是通过将图像中的字符串图案分割成被识别为与单个字符对应的各个图案而获得的；

判定装置，其针对由所述获取装置获取的所述字符点阵中的各个单位区域和定义了所述单位区域之间的规则接续关系的规则点阵中的各个单位区域的全部组合，来判定所述组合是否可能成立；

生成装置，其生成连接在与被所述判定装置判定为可能成立的单元区域的组合相对应的节点之间的路径；

确定装置，其基于与所述规则点阵的一致程度或者与所述规则点阵和所述字符点阵的一致程度来确定由所述生成装置生成的路径中的最优路径；

提取装置，其从图像中提取所述字符点阵中的与所述确定装置确定的最优路径相对应的单位区域；以及

识别装置，其利用只包含所述规则点阵中的单位区域所属的类目中的字符的类目词典对所述提取装置提取的单位区域中的图案应用字符识别。