CN102402682A

CN102402682A - 文字识别装置、区分装置、区分控制装置，以及文字识别方法

Info

Publication number: CN102402682A
Application number: CN2011102744008A
Authority: CN
Inventors: 浜村伦行; 前田匡哉; 入江文平; 朴英
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2010-09-16
Filing date: 2011-09-16
Publication date: 2012-04-04
Also published as: KR20120029351A; US20120072013A1; EP2431920A2

Abstract

本申请提供文字识别装置、区分装置、区分控制装置，以及文字识别方法。实施方式的文字识别装置具备检测部和识别部。上述检测部从图像检测各文字候补。上述识别部基于与多个不同的文字缺失的程度对应的多个文字识别词典来识别文字候补。

Description

文字识别装置、区分装置、区分控制装置,以及文字识别方法

相关申请的交叉引用

本申请基于2010年9月16日提交的在先的日本专利申请No.2010-208607、2010年9月16日提交的在先的日本专利申请No.2010-208493、2011年9月2日提交的在先的日本专利申请No.2011-191506，并要求其为优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及文字识别装置、区分装置、区分控制装置，以及文字识别方法。

背景技术

已知有读出图像中的文字的OCR(Optical character reader：光学字符阅读器)等的文字识别装置。

在带窗封口信函中，收件方住址位于窗口一端，有时出现构成收件方住址的文字的一部分隐匿，文字缺失的现象。提出了不限于封口信函的窗口的、用于识别这种缺失的文字的各种技术。

例如，提出了从未隐匿的行的文字的高度推断隐匿的行的文字的高度，利用推断结果识别文字的技术。另外，还提出了从没有下线的行的文字的高度推断除去下线时缺失的文字的高度，利用推断结果识别文字的技术。

但是，在上述的技术中文字识别精度还不够高了，期望更高精度的文字识别技术。

发明内容

本发明就是为了解决上述的课题而完成的。

根据本发明的一个方面，提供一种文字识别装置，包括：检测部，从图像检测各文字候补；识别部，基于与多个不同的文字缺失的程度对应的多个文字识别词典来识别各文字候补。

根据本发明的另一个方面，提供一种区分装置，包括如上所述的文字识别装置，还包括：区分部，基于各文字候补的识别结果对区分对象物进行区分。

根据本发明的另一个方面，提供一种区分控制装置，包括如上所述的文字识别装置，还包括：通信部，接收从区分处理部发送的图像，将与各文字候补的识别结果对应的区分信息发送到上述区分处理部，所述区分处理部从区分对象物读取上述图像并基于上述区分信息区分上述区分对象物。

根据本发明的另一个方面，提供一种文字识别方法，包括：从图像检测各文字候补的步骤；基于与多个不同的文字缺失的程度对应的多个文字识别词典来识别各文字候补的步骤。

根据本发明的另一个方面，提供一种文字识别装置，识别将多个文字成列状地记载的文字列，所述文字识别装置包括：隐匿文字列候补检测部，在上述文字列的一部分隐匿的状态下，检测有隐匿的可能性的文字部分作为隐匿文字列区域候补；确认部，对由上述隐匿文字列候补检测部检测到的隐匿文字列区域候补确认实际上是否有文字隐匿；识别部，基于上述确认部的确认结果进行对象文字列的识别处理。

根据本发明的另一个方面，提供一种文字识别方法，识别将多个文字成列状地记载的文字列，所述文字识别方法包括：在上述文字列的一部分被隐匿的状态下，检测有隐匿的可能性的文字部分作为隐匿文字列区域候补；对检测到的隐匿文字列区域候补确认实际上是否有文字隐匿；基于确认结果进行对象文字列的识别处理。

根据本发明的另一个方面，提供一种区分装置，基于区分信息区分处理由文字列显示着上述区分信息的物体，上述区分信息表示区分目的地，所述区分装置包括：传输部，传输上述物体；读取部，读取由上述传输部传输的上述物体的图像；文字识别部，从由上述读取部读取的图像识别表示上述区分信息的文字列；区分部，基于作为由上述文字识别部识别的区分信息的文字列，区分上述物体，上述文字识别部具备：隐匿文字列候补检测部，在上述文字列的一部分被隐匿的状态下，检测有隐匿可能性的文字部分作为隐匿文字列区域候补；确认部，对由上述隐匿文字列候补检测部检测出的隐匿文字列区域候补，确认实际上是否有文字隐匿；识别部，基于上述确认部的确认结果，进行对象文字列的识别处理。

附图说明

图1是表示第1种实施方式的区分系统(文字识别装置)之一例的方框图。

图2是表示第1种实施方式的区分系统的变形例子的方框图。

图3是表示第1种实施方式的文字列识别处理之一例的流程图。

图4是表示第1种实施方式的区分对象物之一例的图。

图5是表示第1种实施方式的文字候补检测之一例的图。

图6是表示涉及第1种实施方式的文字下端位置的推断之一例的图。

图7是表示第1种实施方式的文字识别候补的选出之一例的图。

图8是表示第2种实施方式的带窗封口信函等的带窗邮件之一例的平面图。

图9是模式化表示适用第2种实施方式的文字识别装置以及文字识别方法的区分装置的构成的方框图。

图10是说明第2种实施方式的文字识别处理流程的流程图。

图11是说明第2种实施方式的文字识别处理流程的流程图。

图12是说明在带窗邮件的窗口上文字列的一部分隐匿的情况和与之相对的轮廓跟踪情况的图。

图13是表示排他部分文字图之一例的图。

图14A以及图14B是说明在英文的使用文字中的排他部分文字的例子和非排他性的例子的图。

图15是说明采用连字符检测进行的文字列的缺损部分的高度推断之一例的图。

具体实施方式

实施方式的文字识别装置具备检测部和识别部。上述检测部从图像中检测各文字候补。上述识别部根据与多个不同的文字缺失的程度对应的多个文字识别词典识别文字候补。

(第1种实施方式)

以下，参照附图说明第1种实施方式。

图1是表示第1种实施方式的区分系统之一例的方框图。

如图1所示，区分系统1具备：传输部11、读取部12、识别部13、文字识别词典数据库14、排列验证部15、文字列验证部16、文字列数据库17、区分部18。而且，用传输部11、读取部12、区分部18构成区分处理部(区分装置)1A，另外，用识别部13、文字识别词典数据库14，排列验证部15、文字列验证部16、文字列数据库17构成文字识别处理部(文字识别装置)1B。

如图2所示，还能够构成区分系统1。即，区分系统1可以用多台区分处理部1A、1台文字识别处理部1B以及通信部1C构成。而且，用1台文字识别处理部1B 以及通信部1C构成区分控制处理部(区分控制装置)1D。通信部1C将来自多台区分处理部1A的信息(区分对象物的图像数据)发送到文字识别处理部1B，另外，将来自文字识别处理部1B的信息(从图像中读取并识别的收件方信息(区分信息))发送到多台区分处理部1A。如图2所示通过构成区分系统1，能够分散区分处理，集中判别处理(识别处理)，能够谋求提高整体处理效率。

传输部11用传输路径等构成，沿着传输路径传输信函以及包裹等的区分对象物。读取部12在传输路径的中途读取区分对象物的图像。例如，区分对象物是带窗封口信函，构成收件方的文字列的一部分在窗口一端隐匿。

文字识别词典数据库14存储与多个不同的文字缺失程度对应的多个文字识别词典。进而，文字识别词典数据库14还存储没有文字缺失的完整文字的文字识别词典。例如，文字识别词典数据库14存储文字识别词典D1、D2、...、DN的N个(N：自然数)的文字识别词典。

例如，文字识别词典D1(无缺失词典)是由无文字缺失的多个文字生成的文字识别词典。文字识别词典D2(1成缺失词典)是由缺失1％～20的多个文字生成的文字识别词典。文字识别词典D3(3成缺失词典)是由缺失21％～40％的多个文字生成的文字识别词典。文字识别词典D4(5成缺失词典)是从缺少41％～60％的多个文字生成的文字识别词典。

识别部13从图4所示的区分对象物的图像中检测各文字候补。例如，识别部13从区分对象物的图像中检测如同文字行以及如同文字列的图像，从这些如同文字行以及文字列的图像中检测如同多个文字的图像，从如同多个文字的图像中检测多个文字候补。

进而，识别部13根据存储在文字识别词典数据库14中的多个文字识别词典D1、D2、...、DN来识别各文字候补。即，识别部13能够识别记载在区分对象物中的收件方住址(由各文字候补构成的收件方住址)。

排列验证部15在恢复各文字候补的缺失时，验证下端(下侧)是否排列整齐(参照图6)。换句话说，排列验证部15在复原各文字候补的缺失时，验证下端(下侧)沿着文字的排列是否排列成一条直线。

文字列验证部16使用存储在文字列数据库17中的文字列数据(住址数据)，验证作为文字列数据(住址数据)是否存在的文字列。而且，文字列数据(住址数据)是有可能记载在区分对象物中的文字列图案。

区分部18根据与识别部13的文字识别结果对应的收件方信息(区分信息)区分由传输部11传输的区分对象物。

以下，参照图3说明第1种实施方式的文字列识别处理之一例。而且，在第1种实施方式中，说明英文文字列处理之一例。

首先，读取部12在传输路径的途中读入区分对象物的图像(S1)。图4是表示第1种实施方式的区分对象物之一例的图。如图4所示，例如，区分对象物是带窗封口信函，构成收件方的文字列“TARG”的一部分在窗口的一端隐匿。

接着，识别部13从图4所示的区分对象物的图像中抽出图5所示那样的各文字候补C1、C2、C3、C4(S2)。用图5所示的虚线的矩形包围的多个如同文字的图像区域是各文字候补C1、C2、C3、C4。

而且，识别部13也可以从一个如同文字的图像区域中抽出多个文字候补。例如，如图5所示，识别部13还可以从一个如同文字的图像区域中抽出多个文字候补C4a、C4b。

接着，识别部13根据多个文字识别词典D1、D2、...、DN选出与各文字候补C1、C2、C3、C4对应的1个以上的文字识别候补(S3)。而且识别部13对各文字候补选择出满足大于等于规定相似度的条件的1个以上的文字识别候补。例如，当对文字识别词典DM(1≤M≤N)规定文字候补完全一致的情况下，设该规定文字候补对于文字识别词典DM具有相似度1000。识别部13根据多个文字识别词典D1、D2、...、DN，对各文字候补选出满足相似度大于等于700的条件的1个以上的文字识别候补。

例如，如图7所示，识别部13选出与文字候补C1对应的文字识别候补C11、C12、C13，选出与文字候补C2对应的文字识别候补C21，选出与文字候补C3对应的文字识别候补C31、C32、C33，选出与文字识别候补C4对应的文字识别候补C41、C42。

即，文字识别候补C11对于文字识别词典D1(无缺失词典)与相似度950(1位)的“T”对应，文字识别候补C12对于文字识别词典D4(5成缺失词典)与相似度900(2位)的“I”对应，文字识别候补C13对于文字识别词典D2(1成缺失词典)与相似度850(3位)的“T”对应。

另外，文字识别候补C21对于文字识别词典D3(3成缺失词典)与相似度900(1位)的“A”对应。

另外，文字识别候补C31对于文字识别词典D3(3成缺失词典)与相似度900(1位)的“B”对应，文字识别候补C32对于文字识别词典D3(3成缺失词典)与相似度850(2位)的“R”对应，文字识别候补C33对于文字识别词典D1(无缺失词典)与相似度700(3位)的“D”对应。

另外，文字识别候补C41对于文字识别词典D3(3成缺失词典)与相似度850(1位)的“G”对应，文字识别候补C42对于文字识别词典D2(1成缺失词典)与相似度700(2位)的“E”对应。

而且，将与文字候补C1对应的1个以上的文字识别候补(文字识别候补C11、C12、C13)称为第1文字识别候补群G1，将与文字候补C2对应的1个以上的文字识别候补(文字识别候补C21)称为第2文字识别候补群G2，将与文字候补C3对应的1个以上的文字识别候补(文字识别候补C31、C32、C33)称为第3文字识别候补群G3，将与文字候补C4对应的1个以上的文字识别候补(文字识别候补C41、C42、C43)称为第4文字识别候补群G4。

接着，文字列验证部16从各文字识别候补群G1、G2、G3、G4中选出1个文字识别候补，生成1个以上的文字列候补(S4)。

例如，文字列验证部16从第1文字识别候补群G1中选择文字识别候补C11，从第2文字识别候补群G2中选择文字识别候补C21，从第3文字识别候补群G3中选择文字识别候补C31，从第4文字识别候补群G4中选择文字识别候补C41，生成第1文字列候补(TABG)。

同样，文字列验证部16从第1文字识别候补群G1中选择文字识别候补C12，从第2文字识别候补群G2中选择文字识别候补C21，从第3文字识别候补群G3中选择文字识别候补C31，从第4文字识别候补群G4中选择文字识别候补C41，生成第2文字列候补(IABG)。

同样，文字列验证部16从第1文字识别候补群G1中选择文字识别候补C11，从第2文字识别候补群G2中选择文字识别候补C21，从第3文字识别候补群G3中选择文字识别候补C32，从第4文字识别候补群G4中选择文字识别候补C41，生成第3文字列候补(TARG)。

同样，文字列验证部16从第1文字识别候补群G1中选择文字识别候补C12，从第2文字识别候补群G2中选择文字识别候补C21，从第3文字识别候补群G3中选择文字识别候补C32，从第4文字识别候补群G4中选择文字识别候补C42，生成第4文字列候补(IARE)。

同样，文字列验证部16从第1文字识别候补群G1中选择文字识别候补C13，从第2文字识别候补群G2中选择文字识别候补C21，从第3文字识别候补群G3中选择文字识别候补C32，从第4文字识别候补群G4中选择文字识别候补C42，生成第5文字列候补(TADE)。

同样，文字列验证部16从第1文字识别候补群G1中选择文字识别候补C13，从第2文字识别候补群G2中选择文字识别候补C21，从第3文字识别候补群G3中选择文字识别候补C33，从第4文字识别候补群G4中选择文字识别候补C42，生成第6文字列候补(TARE)。

接着，排列验证部15在复原各文字列候补的缺失时，验证下端(下侧)是否排列整齐(S5)。例如，构成第5文字列候补的文字识别候补C11(T)是根据文字识别词典D1(无缺失词典)选出的候补。因而，排列验证部15将文字识别候补C11推断为无缺失，如图6所示那样，推断文字识别候补C11的文字下端位置P1。

同样，构成第5文字列候补的文字识别候补C21(A)是根据文字识别词典D3(3成缺失词典)选出的候补。因而，排列验证部15将文字识别候补C21推断为3成缺失。如图6所示那样，推断文字识别候补C21的文字下端位置P2。

同样，构成第5文字列候补的文字识别候补C33(D)是根据文字识别词典D1(无缺失词典)选出的候补。因而，排列验证部15将文字识别候补C33推断为无缺失。如图6所示那样，推断文字识别候补C33的文字下端位置P3。

同样，构成第5文字列候补的文字识别候补C42(E)是根据文字识别词典D2(1成缺失词典)选出的候补。因而，排列验证部15将文字识别候补C41推断为1成缺失。如图6所示那样，推断文字识别候补C42的文字下端位置P4。

如图6所示，文字识别候补C11的文字下端位置P1、文字识别候补C21的文字下端位置P2、文字识别候补C33的文字下端位置P3、文字识别候补C42位置下端位置P4在文字列方向上不在一条直线上。因此，排列验证部15将第5文字列候补判断为不是适宜的文字列候补，废除第5文字列候补。如上所述，排列验证部15验证各文字列候补的排列，废除不适宜的文字列候补。换句话说，排列验证部15验证构成各文字列候补的文字识别候补的组合，废除不适宜的文字列候补。

接着，文字列验证部16根据存储在文字列数据库17中的文字列数据(住址数据)，用排列验证部15验证未删除的各文字列候补是否是适宜的文字列(S6)。换句话说，文字列验证部16根据存储在文字列数据库17中的文字列数据(住址数据)，验证构成各文字列候补的文字识别候补的组合，删除不适宜的文字列候补。例如，文字列验证部16在第4文字列候补(IARE)在文字列数据中不存在的情况下，将第4文字列候补判断为不是适宜的文字列候补，删除第4文字列候补。这样，文字列验证部16验证各文字列候补是否是适宜的文字列，删除不适宜的文字列候补。

接着，识别部13根据文字排列验证结果以及文字列的验证结果，输出与适宜的文字列候补对应的文字列识别结果(S7)。即，识别部13输出与由排列验证部15进行的文字列排列验证而未被删除的、另外由文字列验证部16进行的文字列验证而未被删除的适宜的文字列候补对应的文字列识别结果。换句话说，识别部13根据由排列验证部15完成的构成各文字列候补的文字识别候补的组合的验证结果、以及由文字列验证部16完成的构成各文字列候补的文字识别候补的组合的验证结果，输出与适宜的文字列候补对应的文字列识别结果。

另外，识别部13在选择出多个适宜的文字列候补的情况下，识别部13计算与选择出的多个适宜的文字列候补对应的各文字识别候补列的平均相似度，输出与具有最大平均相似度的文字列候补(最佳的文字列候补)对应的文字列识别结果。例如，识别部13当作为适宜的文字列候补选择出第1文字列候补和第2文字列候补的情况下，比较与第1文字列候补对应的各文字识别候补列(文字识别候补C11、C21、C31、C41)的平均相似度((950+900+900+850)/4＝900)，和与第2文字列候补对应的各文字识别候补列(文字识别候补C12、C21、C31、C41)的平均相似度((900+900+900+850)/4＝887.5)，输出与第1文字列候补(最佳文字列候补)对应的文字列识别结果。

而且，本发明并不限于在上述第1种实施方式中说明的文字列识别处理。例如，从多个适宜的文字列候补中选择最佳的文字列候补的方法并不限于在上述第1种实施方式中说明的方法。

在上述第1种实施方式中，说明了排列验证部15删除不适宜的文字列候补，进而文字列验证部16删除不适宜的文字列候补，识别部13从剩下的1个以上的适宜文字列候补中选择出最佳的文字列候补的情况。

但是，如下也能够选择出最佳的文字列。例如，排列验证部15根据文字排列验证效果，对各文字列候补给予文字排列评价值，文字列验证部16根据文字列的验证结果，对各文字列候补给予文字列评价值，识别部13根据各文字列候补的文字排列评价值和各文字列候补的文字列评价值，还能够综合从各文字列候补中选择出最佳的文字列候补。

另外，识别部13可以根据由排列验证部15进行的文字排列验证以及由文字列验证部16进行的文字列验证中的某一方的验证，从各文字列候补中选择出最佳的文字列候补。即，区分系统也可以把由排列验证部15进行的文字排列验证以及由文字列验证部16进行的文字列验证的双方的验证不作为必须的构成。

另外，识别部13也可以根据与各文字列候补对应的各文字识别候补列的相似度合计值，从各文字列候补中选择出最佳的文字列候补。另外，识别部13也可以根据相似度合计值、文字排列验证，以及文字列验证中的至少一个，从各文字列候补中选择出最佳的文字列候补。

另外，在上述的第1种实施方式中，说明了在文字列候补的生成(S4)之后，执行文字排列验证(S5)、文字列验证(S6)的情况。但是，也可以如下那样执行文字列识别处理。例如，可以生成文字列候补以满足文字排列验证的条件以及文字列验证的条件。

另外，在上述第1种实施方式中，说明了文字的下端隐匿的事件中的文字列识别处理。但是，也可以如下那样实现文字的上端、下端、右端，以及左端中的1个以上的端部隐匿的事件中的文字识别处理。

例如，文字识别词典数据库14存储文字识别词典D1、D21、D22、D23、D24、D31、D32、D33、D34、...、DN1、DN2、DN3、DN4((N×4)-3)个(N是自然数)的文字识别词典。

文字识别词典D1是从没有文字缺失的多个文字中生成的文字识别词典。文字识别词典D21(1成缺失词典)是由1％～20％文字的上端缺失的多个文字生成的文字识别词典。文字识别词典D22(1成缺失词典)是由1％～20％文字的下端缺失的多个文字生成的文字识别词典。文字识别词典D23(1成缺失词典)是由1％～20％文字的右端缺失的多个文字生成的文字识别词典。文字识别词典D24(1成缺失词典)是由1％～20％文字的左端缺失的多个文字生成的文字识别词典。

文字识别词典D31(3成缺失词典)是由21％～40％文字的上端缺失的多个文字生成的文字识别词典。文字识别词典D32(3成缺失词典)是由21％～40％文字的下端缺失的多个文字生成的文字识别词典。文字识别词典D33(3成缺失词典)是由21％～40％文字的右端缺失的多个文字生成的文字识别词典。文字识别词典D34(3成缺失词典)是由21％～40％文字的左端缺失的多个文字生成的文字识别词典。

识别部13根据文字识别词典D1、D21、D22、D23、D24、D31、D32、D33、D34、...、DN1、DN2、DN3、DN4，选择出与各文字候补对应的1个以上的文字识别候补。排列验证部15根据各文字候补的上端、下端、右端，以及左端中的1个以上的端部的检测结果验证各文字候补的排列。

根据上述方法，即使文字的某个方向隐匿或者不明的情况下，也能够实现高精度的文字列识别处理。

另外，在上述的第1种实施方式中，说明了排列验证部15推断各文字候补的缺失程度，验证文字列候补的排列，删除不适宜的文字列候补的情况。进而，排列验证部15还能够在推断各文字候补的缺失程度的同时，还推断各文字候补的大小，根据这些推断结果验证文字列候补的排列，删除不适宜的文字列候补。

如上所述，第1种实施方式的区分系统在隐匿的文字行的高度和其他的文字行的高度不同的情况下也能够高精度地识别文字列，并且在因文字的隐匿而引起的缺失大的情况下也能够高精度地识别文字列。另外，第1种实施方式的区分系统在文字隐匿程度对每个文字不同的情况下，也能够高精度地识别文字列。由此，第1种实施方式的区分系统能够高精度地对区分对象物进行区分。

如果采用上述的实施方式，则能够提供对缺失的文字的识别优异的文字识别装置以及文字识别方法。另外，如果采用上述至少一种实施方式，则能够提供对缺失的文字识别优异并且在区分精度上优异的区分装置以及区分控制装置。

(第2种实施方式)

以下，参照附图说明第2种实施方式。

例如，在带窗封口信函等的带窗邮件中，表示收件方信息的文字列位于窗口的一端，有时文字的一部分隐匿而不能看到。这种情况下的收件方信息的读取是个难题。作为解决这种课题的方法，例如以下所示的技术是公知的技术。

(1)使用未隐匿的行推断隐匿的行的文字的高度，在和样板匹配时进行补正。

另外，不限于邮件的窗口，提出了多种一般一部分缺失的文字的读取方法，例如，以下所示的技术是公知的。

(2)从没有下线的行推断除去下线时缺失的文字的高度，在和样板匹配时进行补正。

(3)推断在除去帐本的格线时缺失的文字的高度以及上下位置，在和样板匹配时进行补正。

(4)点状的缺损部分的复原方法。

(5)在帐本的识别中与格线重合的部分的复原方法。

但是，上述的方法不能说一定能够有效地解决课题。

即，上述(1)的方法当隐匿的行的高度和未隐匿的行的高度不同的情况下推断失败。上述(2)的方法当有下线的行的高度和没有下线行的文字的高度不同的情况下推断失败。上述(3)的方法只将已决定的大小的文字作为对象，不能适用于文字大小不明的对象。上述(4)的方法只能适用于缺失微小的情况，如由于窗口而产生的隐匿那样的缺失大的情况不能适用。上述(5)的方法只能适用于缺失详细的区域的情况，如由于窗口的隐匿那样缺失大的情况不能适用。

图8表示作为本实施方式的处理对象物体的带窗封口信函的带窗邮件之一例。该带窗邮件11在表面上具有玻璃纸等的窗口12，在该窗口12内作为区分信息的收件方信息13用由多个文字组成的文字列表示(记载)。图8的例子表示在窗口12的上端表示的收件方信息13的文字列的一部分隐匿的状况。

图9是模式化表示适用本实施方式的文字识别装置以及文字识别方法的区分装置的构成的图。

如图9所示，本实施方式的区分装置例如是根据其收件方信息13区分处理图8所示的带窗邮件11的装置，由以下部分构成：邮件供给部21、作为传输单元的传输路径22、作为区分单元的区分部23、作为读取单元的读取部24、作为识别单元的识别部25、词典部26、作为隐匿文字列候补检测·确认单元的隐匿文字列候补检测·确认部27、作为隐匿文字列高度推断单元的隐匿文字列高度推断部28、作为文字列验证单元的文字列验证部29以及数据库30。

邮件供给部21逐个提供处理的邮件(例如，图9所示的带窗邮件11)。传输路径22逐个传输由邮件供给部21提供的邮件11。区分部23根据识别部25的识别结果将用传输路径22传输来的邮件11按照不同收件方进行区分处理。

读取部24在传输路径22的途中光学读取由传输路径22传输的邮件11的窗口12所在面的图像。识别部25从用读取部24读取的图像中识别表示收件方信息13的文字列。

词典部26由多个文字识别词典26₁～26_N构成。文字识别词典26₁～26_N例如由1个完整文字词典和每种文字缺损率(例如，10％，20％，30％，40％)的缺损文字词典构成。在此，假设所谓完整文字词典是指没有因隐匿引起的缺损的文字图案的一般的文字词典，所谓缺损文字词典是指因隐匿左右上下以某一比例消失(缺损)的词典。

隐匿文字列候补检测·确认部27在文字列的一部分隐匿的状态下，检测有隐匿的可能性的文字部分作为隐匿文字列区域候补，确认该隐匿文字列区域候补是否是实际的隐匿文字列区域。隐匿文字列高度推断部28对于用隐匿文字列候补检测·确认部27检测出的隐匿文字列区域确认实际上是否有文字隐匿，当判断为有文字隐匿的情况下，对该对象文字列推断高度。

识别部25在进行文字识别时，由隐匿文字列候补检测·确认部27检测是否有收件方信息13隐匿的可能性的候补，用隐匿文字列高度推断部28推断隐匿的文字列部分的高度，使用与文字列的缺失比例(缺损比例)相当的文字识别词典求各个文字识别得分。

文字列检测部29使用从识别部25得到的文字识别得分(文字识别结果)进行和数据库30内的住址数据的匹配处理，将其结果作为最终的识别结果向区分部23输出。

本实施方式的特征在于，检测并确认文字列的隐匿候补，通过推断隐匿文字列的高度知道文字的缺失比例，因此，以下以上述2点为中心进行详细的说明。

以下，参照图10以及图11所示的流程图说明本实施方式的文字识别处理的流程。

如果输入由读取部24读取的邮件11上的图像后(S1)，隐匿文字列候补检测·确认部27对输入的图像进行窗口13(窗框)的候补(隐匿文字列区域候补)的检测(S2，S3)。在此的窗框候补检测的方法使用哪种方法都可以，但例如可以使用对微分图像适用哈夫(Hough)变换发现窗框的4条线段的方法、使用当邮件11的表面和窗框的部分有浓度差的情况下，将从浓度2值标条中检测适当大小标条的部分作为窗框候补的方法等。

当检测出窗框候补的情况下，一般隐匿文字列(以下，还称为缺损文字列)的近边处变成图12所示那样的状态。在图12中，31表示窗框的上端，32表示在窗框的上端31上文字的一部分缺损(隐匿)的缺损文字列，33表示轮廓跟踪的状态。

在窗框的左右上下端上分别进行轮廓跟踪(S4)，如果对各个方向成分投票，则缺损文字列不存在的端只是相同方向成分连续。例如，如果将投票方向成分的右方向设置为“0”，上方向设置为“1”，左方向设置为“2”，下方向设置为“3”，则当从窗框的边缘内部沿着右手方向探索的情况下，在窗框下端，上成分和下成分虽然有一些混合，但结果是几乎只投票右成分的“0”。同样，在窗框的右端上，其结果是几乎全部投票上成分，在上端上，其结果是几乎全部投票左成分。

在此，如图12所示当包含缺损文字列32的情况下，原本应该变成主要成分的方向多少混合有相反的方向。由此，判断为在轮廓跟踪方向成分中有异常(S5)。当有异常的情况下，将该部分判定为缺损文字列连续，作为实际的对象区域(隐匿文字列区域)(S6)。

在S2、S3中当未检测窗框候补的情况下，或者在S5中在窗框候补的方向成分中没有发现异常的情况下，对在邮件11中存在的文字列实施用完整文字词典进行的一般文字识别(S7)。在本实施方式中，所谓完整文字词典如上所述，是指作为没有缺损的图案的一般的文字词典，所谓缺损词典是指左右上下消失了某一比例的词典。该缺损比例例如只要具有在左右上下各自之上隔10％消失的词典等即可，用样板匹配进行各个文字识别而标准化的图像也可以，用各个分类的缺损图案进行学习的特征分类群的词典也可以。

S7中的完整文字词典中的文字识别的结果，如果有文字识别得分差的文字连续的部分(S8)，则判断为有缺损文字列连续的可能性并进入S6，判定为缺损文字列连续，作为实际的对象区域(隐匿文字列区域)。

在S8中，如果没有文字识别得分差的部分连续的状况，则进行一般的收件方信息的识别处理并结束。

在本例子中，假定检测出窗框并继续说明。当检测出窗框的情况下，因为窗框部分的边缘变成后段的处理的干扰的可能性高，所以只存储位置并消去外框边缘部分等情况会好。

在S6中当检测出缺损文字列区域的情况下，隐匿文字列高度推断部28进行以下说明的缺损文字列的高度的推断处理。而且，在本实施方式中，作为缺损文字词典用限定使用数字的情况进行说明，但也可以是其他的文字词典。

首先，在数字的缺损文字词典中，对各缺损比例的每种重复实施文字识别(S9)。当然，也可以对左右上下全部的候补进行识别，但如前面说明的那样当在轮廓跟踪的方向成分中检测出缺损文字列区域的情况下(与S5的流程对应)，因为知道在窗框的左右上下端的哪里看到异常，所以只要只在该方向上用缺损文字词典进行文字识别就可以。

即使是从文字识别得分的差的文字列连续这一判断中检测出缺损文字列区域(与S8的流程对应)，如果有在对象区域附近的文字列正确的文字识别连续进行的部分，因为能够推测在该方向上不存在缺损状态，所以能够推测为在和正确的文字识别连续的区域相反一侧上发生缺损状态。由此，和在轮廓跟踪的方向成分中实施的一样，能够确定优先使用缺损文字词典的方向。对缺损文字区域的文字重复实施的在各缺损比例下的文字识别得分暂时保持，在后段的处理中使用。

以下，使用图13所示那样的排他部分文字表34进行与其登录内容的比较。排他部分文字表34是在动作前预先制作的表，登录有作为对象语言的非数字文字不可能有的数字缺损图案。另外，如果以在英语中使用的文字为例子，则图14A所示那样的缺损数字的图案是作为其他的英语部分文字不可能存在的图案。即，图14A例如如果是英语的一般使用文字，则因为该图形只可能是数字“8”的下侧缺损了20％，所以变成排他部分文字。

在这种情况下，如图13所示，由于在排他部分文字表34中预先登录有下侧缺损20％的“8”，因而当实际识别下侧缺损20％的“8”的情况下，即使只用数字词典识别也肯定可以判断为是隐匿了20％的“8”。

另外，图14B例如如果是英语的一般使用文字，则该图形除了英语“E”的下侧缺损70％外，因为也有英语“F”的下侧缺损70％的可能性，所以不能成为排他部分文字。

这样，当用在排他部分文字表34中的比例的缺损文字高分识别的情况下(S10)，能够从识别词典的缺损比例中推断文字列的缺损部分的高度H1(参照图12)(S11)。当然，因为在识别处理中不存在所谓的100％，所以也可以设置需要3个以上用高分来识别的部分等、为了提高精度而转移到高度推断处理的限制。

在S10中当不能进行文字缺损部分的高度推断的情况下，在罗列了前面的数字识别得分时，核对是否有以同样比例连续取得高分的地方(S12)。因为数字以邮政编码和门牌号等中连续的居多，所以当在同样比例的缺损文字词典中连续出高分那样的情况可以判断为实际上缺损的地方。

在S12的判定中当高分连续的情况下，从识别词典的缺损比例中能够直接推断文字列的缺损部分的高度H1(参照图12)(S13)。

在S12的判定中当高分不连续的情况下，用文字识别确认在对象文字列中如同连字符的文字是否存在(S14)。当能够检测出如同连字符的文字的情况下，因为连字符一般记载在文字的中间高度上，所以如图15所示那样，可以根据连字符以外的其他文字高度推断文字列的缺损部分的高度H2(S15)。

即，图15的例子因为文字列的上侧缺损，所以能够推断从连字符到文字列的下端的高度H3，能够将该高度H3的一倍的位置推断为文字列的高度H4。而后，能够从该推断的文字列的高度H4和缺损的文字的高度H5推断(H2＝H4-H5)缺损部分的高度H2。

这是因为根据识别对象的语言、连字符推断高度微妙地变化，所以可以随时根据需要进行高度推断。这里的关键在于可以在连字符的识别中进行缺损部分的高度检测。

另外，例如，因为收件方信息的邮政编码和门牌号等数字和连字符的记载大多接近，所以即使未到在前面的S11和S13中进行缺损部分的高度推断的情况下，通过增加和连字符的识别结果的位置关系接近这一条件，可以进一步无误地进行高度推断。这样，在发现了连字符文字时也可以执行高度推断。

而且，对于S10～S15的3种高度推断处理，可以分别独立进行，也可以实施全部并付与优先顺序，还可以取各推断结果的平均值等，重新取得综合的缺损部分的高度推定值。

在S14的判定中，当不能检测如同连字符的文字的情况下，因为不能推断文字列的缺损部分的高度，所以进行一般的收件方信息的识别处理并结束(S16)。

在S11或者S13或者S15中，如果推断出文字列的缺损部分的高度，则接收到该高度的推断结果的识别部25从收到的高度推断结果中，确定使用什么缺损比例的缺损文字词典(S17)，从词典部26中选择已确定的缺损文字词典进行对象文字列的文字识别处理(S18)。

即，从高度推断结果中，判断对象文字列以原本哪个高度进行文字识别最佳，如果进行了判明，就仅缩小范围到该缺损情况的文字分类来进行文字识别。在这种情况下，可以预先具有全部文字分类的缺损文字词典，当进行样板匹配等的情况下也可以在知道缺损部分的高度后指定作为样板使用的范围来进行文字识别。

接着，文字列验证部29使用在S18中用指定的缺损文字词典得到的文字识别结果，进行和数据库30内的住址数据的匹配处理(S19)，将其结果作为最终的识别结果向区分部23输出(S20)。

如上所述如果采用上述实施方式，因为通过高度推断处理能够高精度地发现文字列隐匿的部分的高度，所以即使是隐匿的文字列的高度和其他的文字列的高度不同的情况下也能够有效地进行文字识别，并且即使因隐匿致使文字的缺失大的情况下也能够有效地进行文字识别，进而，即使隐匿程度对每个文字不同的情况下也可以进行文字识别，文字列的识别精度显著提高。因而，当在邮件区分装置等的节省人力的机器中使用的情况下，节省效果显著提高。

而且，在上述实施方式中，说明了适用于在根据收件方信息区分处理带窗邮件的区分装置的情况，但并不限于此，例如，只要是根据区分信息对钞票等的有价证券、小货物等的投递物等、显示用文字列表示区分目的地的区分信息的物体进行区分处理的区分装置就可以适用。

如果采用上述的实施方式，则即使在隐匿的文字列的高度和其他的文字列的高度不同的情况下也能够有效地进行文字识别，并且，即使是因隐匿致使文字的缺失大的情况下也能够有效地进行文字识别，进而，能够提供即使隐匿程度对每个文字不同的情况下也可以进行文字识别的文字识别装置、文字识别方法以及区分装置。

尽管描述了特定的实施例，这些实施例仅是通过举例的方式呈现的，并不试图限制本发明的范围。实际上这里描述的新颖的方法和系统可以通过各种其他形式体现。此外，在不脱离本发明精神的情况下，可以对这里描述的方法和系统的形式进行各种省略、替换和改变。所附的权利要求及其等效物试图覆盖将落入本发明的范围和精神内的这种形式和修改。

Claims

1.一种文字识别装置，包括：

检测部，从图像检测各文字候补；

识别部，基于与多个不同的文字缺失的程度对应的多个文字识别词典来识别各文字候补。

2.根据权利要求1所述的文字识别装置，其特征在于：上述识别部基于多个文字识别词典选出与各文字候补对应的1个以上的文字识别候补，组合文字识别候补生成多个文字列候补，基于文字识别候补的组合的验证结果选择最佳的文字列候补，输出与最佳的文字列候补对应的各文字候补的识别结果。

3.根据权利要求2所述的文字识别装置，其特征在于包括：

第1验证部，基于存储有多个文字列图案的文字列数据库，验证文字识别候补的组合，

上述识别部基于上述第1验证部的验证结果输出最佳的文字列候补。

4.根据权利要求2所述的文字识别装置，其特征在于包括：

第2验证部，推断各文字候补的文字缺失的程度，基于各文字候补的推断缺失程度，验证文字识别候补的组合，

上述识别部基于上述第2验证部的验证结果输出最佳的文字列候补。

5.根据权利要求4所述的文字识别装置，其特征在于：上述第2验证部推断各文字候补的上端、下端、右端以及左端中的一个端部的缺失程度。

6.根据权利要求1所述的文字识别装置，其特征在于：上述识别部对各文字候补选出1个以上的文字识别候补，组合文字识别候补生成多个文字列候补，基于各文字识别候补的相似度输出最佳的文字列候补。

7.一种区分装置，包括权利要求1所述的文字识别装置，还包括：

区分部，基于各文字候补的识别结果对区分对象物进行区分。

8.一种区分控制装置，包括权利要求1所述的文字识别装置，还包括：

通信部，接收从区分处理部发送的图像，将与各文字候补的识别结果对应的区分信息发送到上述区分处理部，所述区分处理部从区分对象物读取上述图像并基于上述区分信息区分上述区分对象物。

9.一种文字识别方法，包括：

从图像检测各文字候补的步骤；

基于与多个不同的文字缺失的程度对应的多个文字识别词典来识别各文字候补的步骤。

10.一种文字识别装置，识别将多个文字成列状地记载的文字列，所述文字识别装置包括：

隐匿文字列候补检测部，在上述文字列的一部分隐匿的状态下，检测有隐匿的可能性的文字部分作为隐匿文字列区域候补；

确认部，对由上述隐匿文字列候补检测部检测到的隐匿文字列区域候补确认实际上是否有文字隐匿；

识别部，基于上述确认部的确认结果进行对象文字列的识别处理。

11.根据权利要求10所述的文字识别装置，其特征在于包括：

隐匿文字列候补确认部，进行由上述隐匿文字列候补检测部检测到的隐匿文字列区域候补的轮廓跟踪，通过确认轮廓跟踪的方向成分的离散，确认上述检测到的隐匿文字列区域候补是否是实际的隐匿文字列区域。

12.根据权利要求10所述的文字识别装置，其特征在于包括：

隐匿文字列高度推断部，当由上述确认部判断为有文字隐匿的情况下，对上述对象文字列推断高度，

上述识别部基于由上述隐匿文字列高度推断部推断的文字列的高度进行文字列的识别处理。

13.根据权利要求12所述的文字识别装置，其特征在于：上述隐匿文字列高度推断部对对象文字列使用隐匿用部分文字识别词典进行文字识别，当能够连续得到高分的识别结果情况下，推断文字列的隐匿部分的高度。

14.根据权利要求13所述的文字识别装置，其特征在于：上述隐匿文字列高度推断部对使用了上述隐匿用部分文字识别词典的文字识别结果，通过对在对象语言的其他文字中不可能存在的部分文字预先进行匹配，作为文字列的隐匿高度推断的线索。

15.根据权利要求12所述的文字识别装置，其特征在于：上述隐匿文字列高度推断部通过检测文字列中的连字符，推断文字列的隐匿部分的高度。

16.一种文字识别方法，识别将多个文字成列状地记载的文字列，所述文字识别方法包括：

在上述文字列的一部分被隐匿的状态下，检测有隐匿的可能性的文字部分作为隐匿文字列区域候补；

对检测到的隐匿文字列区域候补确认实际上是否有文字隐匿；

基于确认结果进行对象文字列的识别处理。

17.一种区分装置，基于区分信息区分处理由文字列显示着上述区分信息的物体，上述区分信息表示区分目的地，所述区分装置包括：

传输部，传输上述物体；

读取部，读取由上述传输部传输的上述物体的图像；

文字识别部，从由上述读取部读取的图像识别表示上述区分信息的文字列；

区分部，基于作为由上述文字识别部识别的区分信息的文字列，区分上述物体，

上述文字识别部具备：

隐匿文字列候补检测部，在上述文字列的一部分被隐匿的状态下，检测有隐匿可能性的文字部分作为隐匿文字列区域候补；

确认部，对由上述隐匿文字列候补检测部检测出的隐匿文字列区域候补，确认实际上是否有文字隐匿；

识别部，基于上述确认部的确认结果，进行对象文字列的识别处理。

18.根据权利要求17所述的区分装置，其特征在于：上述物体是带窗邮件，是表示区分信息的文字列的一部分隐匿在上述窗口中的邮件。

19.根据权利要求17所述的区分装置，其特征在于包括：

20.根据权利要求17所述的区分装置，其特征在于包括：

上述识别部基于由上述隐匿文字列高度推断部推断的文字列的高度，进行文字列的识别处理。