CN101276327A

CN101276327A - 地址识别装置

Info

Publication number: CN101276327A
Application number: CNA2007100915392A
Authority: CN
Inventors: 黄开竹; 孙俊; 堀田悦伸; 藤本克仁; 直井聪; 龙翀; 庄丽; 朱小燕
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2007-03-27
Filing date: 2007-03-27
Publication date: 2008-10-01
Anticipated expiration: 2027-03-27
Also published as: CN101276327B; JP5251205B2; JP2008243208A

Abstract

本发明公开了地址识别装置。所述装置包括以下单元：关键字缺失判断单元，判断输入的地址图像中关键字是否缺失；整体地址识别单元，在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时，对所述关键字之间的地址区域进行整体识别；词语言地址识别单元，在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时，对所述输入的地址图像进行词语言地址识别；可靠性判断单元，对所述整体地址识别单元所识别出的地址的可靠性进行判断；其中，在所述可靠性判断单元判断出所述整体地址识别单元所识别出的地址不可靠时，由所述词语言地址识别单元对所述输入的地址图像进行词语言地址识别。

Description

地址识别装置

技术领域

本发明涉及地址识别的装置。更具体地，涉及一种识别任意间距区域内的手写字符地址的地址识别装置。

背景技术

传统上有两种对手写地址进行识别的方法。

第一种传统方法是首先从输入地址图像中提取单字符区域(即只含有一个字符的区域)，并从这些单字符区域中提取关键字符(在手写地址识别中，关键字符为能够表示行政区域的单一字符，例如省、区、州、市、县、镇、乡、村等)，检测由两个相邻关键字符所限定的地名区域。为了识别地名区域内的地名，该方法将该地名区域分割成独立的字符，然后逐个识别这些独立字符。

但是，这种传统的地址识别方法存在一定的缺陷，即，将地址分割成独立字符时常常出现错误。特别是当自由间距区内的地址相互连接紧密时，该方法尤其容易出错。而由于手写字符常常不太规范、形态各异，所以这种紧密连接的情况很常见。

第二种传统方法也是首先提取字符片断，并检测由两个相邻关键字符所限定的地名区域。它与第一种方法的不同之处在于，这种方法将地名区域内的地名作为整体来进行识别。比如输入地址图像的实际地址为“北京市朝阳区霄云路”，首先市，区，路这些关键地址被提取识别出来。然后这些关键字之间的图像(或第一个关键字之前的图像)被切分出来。即，“北京”，“朝阳”，“霄云”所对应的图像将被切分出来。并对这些图像整体识别。

这个传统方法的一个主要问题是，很大一部分实际地址中，关键字往往被省去。比如，地址条“北京市朝阳区霄云路”中的“市”或“区”可以被略去，而且并不会影响对地址的解读。在这种情况下，整体识别的方法会失败，因为地名区域也即关键字之间的图像区域将无法确定。

发明内容

本发明鉴于上述问题而提出。本发明的目的是提供对地址进行识别的地址识别装置，用以解决现有技术中的一个或更多个问题。

为了实现本发明的目的，根据本发明的第一方面，提供了一种地址识别装置，所述装置包括以下单元：关键字缺失判断单元，判断输入的地址图像中关键字是否缺失；整体地址识别单元，在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时，对所述关键字之间的地址区域进行整体识别；词语言地址识别单元，在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时，对所述输入的地址图像进行词语言地址识别。

根据本发明的第二方面，提供了一种确定字符图像中单字符区域的装置，所述装置包括以下单元：连通域分割单元，对所述字符图像进行连通域分割；候选单字符区域判断单元，判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域的宽度是否大于阈值，将大于阈值的每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域判断为候选单字符区域。

根据本发明的第三方面，提供了一种对地址图像中的地址进行识别的装置，所述装置包括以下单元：单字字符识别单元，识别所述地址图像中的每一个候选单字符区域，得到字符识别候选；识别候选阵列获得单元，获得由所有所述候选单字符区域的字符识别候选所组成的识别候选阵列；匹配单元，将地址字典中的地址与所述识别候选阵列进行匹配，将识别距离最小的地址识别为识别结果。

本发明在字符分割时，每个连通组件，每俩个相邻的连通组件及每三个相邻的连通组件，都将作为可能的字符区域被分别识别。基于词图搜索的方法则从得到的识别候选序列中搜索最优的识别地址。使用多个连通组件的组合提高了系统的鲁棒性，从而降低丢失正确字符的风险，提高地址识别的正确度。

本发明能够有效地识别存在关键字和不存在关键字的地址。

另外，本发明在基于词图搜索的地名匹配方法中，采用了一种加权词图的搜索方法。关键字与普通汉字相比往往能提供更多的信息。当关键字存在时，这种方法突出了关键字的作用，即，给予含关键字的地名以较大的权值。另外，中文地址中，低级地名一般不会缺失关键字。比如，北京市朝阳区霄云路中，“市”、“区”可能会被省去，但“路”一般不会被省去。考虑加权关键字能提高识别地址识别的效率和正确率。

应当理解，以上总体说明和以下详细说明都是说明性和示例性的，并旨在提供对所要求的本发明的进一步说明。

附图说明

所包含的附图用于提供对本发明的进一步理解，其被并入说明书并构成其一部分，附图说明了本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是依据本发明的一个实施例的地址识别装置的方框图；

图2示出了依据本发明一个实施例的地址识别方法的流程图；

图3是依据本发明的关键字缺失判断单元进行的候选单字符区域分割的示例性说明；

图4是依据本发明实施例的词语言地址识别单元的方框图；

图5是依据本发明的一种树形结构的地址词图示意图；

图6是依据本发明的词语言模型匹配单元的操作流程图；以及

图7示出了依据本发明一个实施例的地址识别装置的结构图。

具体实施方式

下面将参照附图详细说明本发明的地址识别装置和方法。在附图中，相同的附图标记代表相同或类似的部件。

图1是依据本发明的一个实施例的地址识别装置的方框图。如图1所示，依据本发明的地址识别装置包括关键字缺失判断单元11、整体地址识别单元12、判断单元13和词语言地址识别单元14。

图2示出了依据本发明一个实施例的地址识别方法的流程图。如图2所示，在步骤S201中，由关键字缺失判断单元11将输入的地址图像切分为可能的单一字符区域，并进行关键字是否缺失的确定。在判断出关键字不缺失(步骤S202，是)时，在步骤S203，整体地址识别单元12进行整体地址识别。然后，在步骤S204，判断单元13判断整体识别单元12在步骤S203的输出的地址的匹配距离是否超过一预设阈值。如果没有超过该阈值，说明整体识别单元识别结果可靠，于是输出该结果为最终识别结果。如果该匹配距离超过了该阈值，说明递归整体识别单元结果不可靠，输入的地址图像中仍有较大可能性缺失关键字，于是处理进行到步骤S205，由词语言地址识别单元14进行识别。

整体识别单元12在进行整体地址识别时，首先从候选单一字符区域中提取关键字，再依次提取关键字之间的地名区域，进行递归整体识别。整体识别的方法和步骤可以详见中国专利申请第200510089537.0号。现通过引用将该申请并如本文中，如同在本文中完全阐明一样。大略地说，所述整体地址识别步骤可以包括：提取步骤，提取所述地址区域的特征向量；匹配步骤，将所提取的特征向量与地名字典中的地名的特征向量相匹配，寻找所有可能候选地名。实践中，可以在所述地名字典中的地名的特征向量与所提取的特征向量的匹配距离小于预定阈值时就将该地名判断为可能候选地名。而如果在所述匹配步骤中获得多个可能候选地名时，按预定的规则对所述多个可能候选地名进行筛选。

当输入地址图像中存在关键字缺失时，整体识别的输出结果将会错误。但此时其匹配距离也会较大。因而，由判断单元13对整体识别单元的整体识别结果进行评价。判断单元13的存在进一步提高了本发明的地址识别方法的可靠性，避免了关键字缺失判断单元11的判断错误可能造成的影响。

下面结合图3说明关键字缺失判断单元11和步骤S201的操作。图3是依据本发明的关键字缺失判断单元11的候选单字符区域分割的示例性说明。

依据本发明的关键字缺失判断单元11首先进行候选单字符区域分割。具体地，首先从图像中分割连通域；然后判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否为候选单字符区域。

图3中假设输入的地址为“河北...”。作为示例性说明，仅对“河北”图像进行说明。如图3(a)，首先从图像中得到连通域A，B，C，D。其中A为俩个连通域组合而成。连通域是图像前景色(通常为黑色)像素点的集合，在此集合中，任何两个像素点都能通过该集合内的像素相连通。具体检测连通域的方法可参见连通域检测算法(参见Hypermedia ImageProcessing Reference，Bob Fisher，Simon Perkins，Ashley Walker and ErikWolfart.Depa rtment of Artificial Intelligence University of Edinburgh，UK.http://www.cee.hw.ac.uk/hipr/html/label.html)，连通域的合并可参见美国专利US 6,535,619B1中图11A，11B，11C及其说明。考虑汉字字符横向上最多只可能有三个独立结构，比如“树”由“木”，“又”，“寸”组成。如图3(b)所示，相邻的俩个连通域被组合作为候选单一字符区域，即，AB，BC，CD；如图3(c)所示，相邻的三个连通域也被组合作为候选单一字符区域，ABC，BCD。在上面的连通域组合过程中，当组合后的连通域宽度大于某一给定阈值Thc时则不进行组合连通域。在一个实施例中，当估计Thc时，首先从所有的连通域中得到平均高度，假定为Thh，对汉字而言，汉字的平均宽度和高度之比往往在一个稳定的范围内，则Thc可被设置为Thh×cof，其中cof通常为2～3。

如图3(d)所示，BCD的宽度大于Thc，即Width(BCD)＞Thc，则BCD不被判定为候选的单一字符区域。于是，最后的候选单一字符区域为，A，B，C，D，AB，BC，CD，ABC。

在确定了候选单字符区域之后，判断所确定的候选单字符区域中的单个字符是否为关键字。可以将所述候选单字符区域中的单个字符与关键字字典中的关键字进行比较，以确定其是否为关键字。在一个实施例中，当所述单个字符与关键字字典中的关键字的匹配距离小于预定阈值时，认为其为关键字。在一个实施例中，在判断出所述输入的图像中存在关键字时，还进行所识别出的关键字所组成的路径是否合法的判断。如“省...市”为合法，“市...省”为不合法。在本发明的一个实施例中，所述关键字符词典单元所保存的可能关键字符仅为包括如下汉字字符：省、市、区、弄、路、街、村、乡、镇、港、湾、县、道、里、同、巷、楼、州、旗、胡、庄、坊。在判断出存在关键字时，如上所示，进行步骤S203的整体识别。在判断出不存在关键字或关键字路径不符合预定规则(在某些实施例中)时，进行步骤S205的词语言地址识别。

图4是依据本发明实施例的词语言地址识别单元(词图搜索识别单元)13的方框图。如图4所示，依据一个实施例，本发明的词语言地址识别单元13包括地址词图存储单元302、单字字符识别单元301、候选阵列获得单元303、词语言模型匹配单元304。

在词语言地址识别单元13中，首先对输入的候选单一字符区域进行单字字符识别，于是每一候选单一字符区域都得到长度为N个的识别候选，通过候选阵列获得单元303简单地排列所有的候选单一字符区域的识别候选，而获得一识别候选阵列。匹配单元将存储在地址词图存储单元302当中的地名(如，北京或北京市，上海或上海市，湖北或湖北省等)与该识别候选阵列进行匹配，并从中计算出识别距离最小的地址列作为识别结果。

更具体地，图4中单字字符识别单元301用来识别候选单字区域。单字字符识别单元301识别每一个候选单字区域而得到字符识别候选。此时的候选单字区域就是前面所述的每一个连通域，每相邻的俩个和三个连通域，并利用给定的任一分类方法(比如模板匹配，二次判别分析，支撑向量机等)对所述各连通域进行了分类识别。所有候选单字区域的识别候选将会组合成一阵列(识别候选阵列)。这种组合候选阵列获得单元303完成。匹配单元304则将存储在地址词图存储单元302当中的地名(如，北京或北京市，上海或上海市，湖北或湖北省等)与该识别候选阵列进行匹配，并从中计算出识别距离最小的地址列作为识别结果。

图5是依据本发明的一种树形结构的地址词图示意图。在图5中，地名根据其隶属关系被组织成树形结构。E0代表根节点，连接一级地址，即直辖市，或省级地址，如E11示出了北京市，E12示出了上海市，E13示出了湖北省等。为了有效地识别关键字缺失的地址，该词图中的树形结构的各节点，既存储含关键字的地名，又存储不含关键字的地名，如E11中，北京和北京市都存储在节点中。依据隶属关系，中文地址最多只有四级结构，例如E13(湖北省)-E23(荆州市)-E33(沙市区)-E41(红门路)。

图6是依据本发明的匹配单元304的操作流程图。如图6所示，在步骤S1读入数据，即识别各候选单字区域得到识别候选阵列。假设候选单字区域共m个，表示为{A₁，A₂，...，A_m}，识别每个候选区域A_i共得到n个候选，表示为C_ij(0＜i＜m，0＜j＜n+1，i，j均为正整数)，每个识别候选的识别距离记为Dist(C_ij)。各候选按照识别距离由小到大进行排序，即如果j＞k，Dist(C_ij)＞Dist(C_ik)。

在步骤S2中，利用如下规则减少候选字符数目：

规则一：如果Dist(C_iq)＞Th_r1，从候选阵列中删除C_iq，C_i(q+1)...，C_in

规则二：如果[Dist(C_iq)-Dist(C_i1)]/Dist(C_i1)＞Th_r2，从候选阵列中删除C_iq，C_i(q+1)...，C_in

某候选的识别绝对距离越大，说明该候选为正确的单字识别结果的可能越小，规则一用于减少绝对距离大的识别候选。同理，规则二利用与第一识别候选的相对值来滤除那些不大可能为正确识别结果的候选单字。规则一和规则二能减少候选数目，从而提高系统的搜索速度和识别精度。

在步骤S3，将对识别候选阵列进行不缺失第一级地址的匹配。即首先将地址词图存储单元302里的所有第一级地址(T1，T2，T3，..，Tk)与前几个候选单字区域的识别候选进行匹配，得到候选地名X₁。具体而言，该候选词X₁由以下公式得到，

X₁＝argmax_Ti[logP(Ti)+logCF(Ti)]，

P(Ti)为地名Ti出现的概率，可以从大量的地址语料里通过计算Ti出现的频率来得到。

CF(Ti)为多个候选单字区域识别为Ti的置信度，其计算过程如下

假设Ti＝{T_i1，T_i2，...，T_ip}，这里T_ij，0＜j＜p+1，且j为正整数，表示地名Ti里的第j个字符，如Ti＝北京市，则，T_i1，＝北，T_i2，＝京，T_i3，＝市。假设，单字区域A_w1，A_w2，A_wp被匹配为Ti，{C_xk1，C_wk2，...，C_wkl}为识别A_wk所得的l个候选。如下所示地定义字符T_ik与A_wj的近似度Sim(T_ik，A_wj)：

Sim (T_{ik}, A_{wj}) = \{\begin{matrix} Dist (C_{wj 1}) / Dist (C_{wjb}), & &Exists; b, 0 < b < l, C_{wjb} = T_{ik} - - - (1) \\ δ_{c}, & &ForAll; b, 0 < b < l, C_{wjb} &NotEqual; T_{ik} - - - (2) \end{matrix}

上面的定义中，如果字符T_ik存在于A_wj的识别候选阵列中，则A_wj可能为字符T_ik。同时，如果A_wj识别为字符T_ik的距离越小，则A_wj越有可能识别为T_ik，Sim(T_ik，A_wj)则应该越大，这也是(1)所阐述的意思。如果字符T_ik不存在于A_wj的识别候选阵列中，则认为字符T_ik与A_wj的近似度很小，因此赋给Sim(T_ik，A_wj)一个很小的值δ_c，这也是(2)所阐述的意思。最后CF(Ti)定义如下：

CF (Ti) = W (T_{ip}) Π_{a = 1}^{p} Sim (T_{ia}, A_{wa}) - - - (3)

wk为一大于1的常数，wc为一小于1的常数。

公式(3)中，该地名Ti的置信度定义为其中各字符T_ia与字符图像的近似度的乘积的加权。同时，如果Ti的最后一个字为中有关键字，并且该关键字出现在字符图像的识别候选中，说明该候选字符图为一正确的地名的可能性很大，我们因此给予以较大权值wk，否则给予以较小权值wc。此处，“较大”、“较小”可以被分别理解为“大于”“小于”某一预定的值。

当第一级地名被匹配后，确定第二级地名的匹配。第二级地名匹配完成后，再进行下级地名匹配，并依此类推。直到匹配结束。第k级地名X_k由以下公式得到。

X_k＝argmax_Ti[logP(Ti|X₁...X_k-1)+logCF(Ti)](4)

其中P(Ti|X₁...X_k-1)表示前k-1级地址确定后，地名T_i出现的概率。该值定义如下

为地名T_i在语料库中出现的频率。CF(Ti)置信度由公式(3)计算而得。

即，在所述匹配中，所述第k级候选地名这样确定：计算前k-1级地址确定后，地名T_i的出现概率，将计算出的概率与地名图像被识别成该地名T_i的置信度相乘，将乘积最大的地名T_i确定为第k级候选地名，i是大于等于1的整数，T_i表示第k级候选地名的第i个候选。

所述地名的置信度为地名图像与识别出的所述地名T_i的近似度的加权；如果地名T_i中的最后一个候选识别区域被识别成关键字，则将所述近似度乘以较大的权值，如果地名T_i中的最后一个候选识别区域未被识别成关键字，则将所述近似度乘以较小的权值。

S4用来判断不缺失第一级地址的匹配S3结果是否足够好。具体而言，假设不缺失第一级地址的匹配结果为X₁...X_k，E_a＝logP(Xa|X₁...X_a-1)+logCF(Xa)，a＝1，...，k.则

Th_E为一给定阈值。

当

Π_{a = 1}^{k} E_{a} > {Th}_{E}

时，说明匹配结果X₁...X_k的总体可靠性较高，因此接受该匹配结果为最终的识别结果。

当

Π_{a = 1}^{k} E_{a} \leq {Th}_{E}

时，说明匹配结果X₁...X_k的总体可靠性较低，因此该匹配结果可能为不含第一级地址，比如“湖北省荆州市沙市区红门路”中的湖北省可能缺失。因此在步骤S5中进行缺失地址的匹配，首先进行缺失第一级地址的匹配。

在缺失第一级地址的匹配S5中，从地址词图存储单元302中的第二级地址开始与候选字符区域的识别候选阵列进行匹配，其匹配基本过程与S3一致。区别仅在于不从第一级地址开始。该步骤也会得到一匹配总体可靠性

在步骤S6中比较缺失地址匹配的总体可靠性与不缺失地址匹配的总体可靠性，取其中可靠性高的为最后识别结果。

当输入地址含有第一级地址时，采用S3-S4-S5-S6区分不缺失第一级地址匹配和缺失第一级地址的匹配的方法，S3将直接输出识别结果，而将不用进行缺失第一级地址的匹配，从而能提高系统的效率和精度。

注意在上面的说明中，根据实际情况，上面的框架应该被灵活应用。比如当输入地址中存在一，二级地址均缺失较为频繁的情况，参考上面的方框图，缺失地址匹配步骤可以进行缺失第一级和第二级地址的匹配。从而达到提高系统效率和精度的效果。

图7示出了依据本发明一个实施例的匹配单元的结构图。如图7所示，依据本发明一个实施例的匹配单元304包括：地址不缺失匹配单元701，用于进行上述地址不缺失匹配，即按隶属关系逐级将地址字典中的地址与识别候选阵列进行比较；判断单元702，用于判断所述地址不缺失匹配单元701的匹配结果是否足够好；地址缺失匹配单元703，用于在所述判断单元判断出所述匹配结果不够好时，进行地址缺失匹配，即只逐级进行隶属关系中的较下几级的匹配，所述较下几级是指从隶属关系中的第二级或第三级开始直至隶属关系中最后一级；确定单元704，用于选择所述地址不缺失匹配单元7021和地址缺失匹配单元7023的匹配结果中的较好者。

综上所述，本发明提供了这样的地址识别装置(或方法)，所述装置(或方法)包括以下单元(或步骤)：关键字缺失判断单元(步骤)，判断输入的地址图像中关键字是否缺失；整体地址识别单元(步骤)，在所述关键字缺失判断单元(步骤)判断出所述输入的地址图像中关键字不缺失时，对所述关键字之间的地址区域进行整体识别；词语言地址识别单元(步骤)，在所述关键字缺失判断单元(步骤)判断出所述输入的地址图像中关键字缺失时，对所述输入的地址图像进行词语言地址识别。

本发明还提供了一种确定字符图像中单字符区域的装置(方法)，所述装置(方法)包括以下单元(步骤)：连通域分割单元(步骤)，对所述字符图进行连通域分割；候选单字符区域判断单元(步骤)，判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否小于阈值，将小于所述阈值的每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域判断为候选单字符区域。

在一个实施例中，所述装置(方法)还包括以下单元(步骤)：可靠性判断单元(步骤)，对所述整体地址识别单元(步骤)所识别出的地址的可靠性进行判断；其中，在所述可靠性判断单元(步骤)判断出所述整体地址识别单元(步骤)所识别出的地址不可靠时，由所述词语言地址识别单元(步骤)对所述输入的地址图像进行词语言地址识别。

在一个实施例中，当所述整体地址识别单元(步骤)所识别出的地址的匹配距离大于预定阈值时，所述可靠性判断单元(步骤)判断所述整体地址识别单元(步骤)所识别出的地址不可靠。

在一个实施例中，所述关键字缺失判断单元(步骤)包括以下单元(步骤)：单个字符提取单元(步骤)，提取所述输入的地址图像中的候选单个字符；比较单元(步骤)，将所提取的各候选单个字符分别与关键字字符字典中的关键字进行比较；关键字判断单元(步骤)，当所述各候选单个字符与所述关键字字符字典中的所有关键字的匹配距离都大于特定阈值时或虽然存在匹配距离小于特定阈值的所述候选单个字符，但未出现合理的关键字次序时，判断所述输入的地址图像中关键字缺失。

在一个实施例中，所述单个字符提取单元(步骤)包括以下单元(步骤)：连通域分割单元(步骤)，从图像中分割出连通域；候选单字符区域判断单元(步骤)，判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否为候选单字符区域；字符提取单元(步骤)，针对所确定出的候选单字符区域进行字符提取。

在一个实施例中，所述候选单字符区域判断单元(步骤)通过判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域的宽度是否大于给定阈值而分别判断所述每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否为候选单字符区域。

在一个实施例中，所述整体字符识别单元(步骤)包括以下单元(步骤)：提取单元(步骤)，提取所述地址区域的特征向量；匹配单元(步骤)，将所提取的特征向量与地名字典中的地名的特征向量相匹配，寻找所有可能候选地名。

在一个实施例中，所述词语言地址识别单元(步骤)包括：识别候选阵列获得单元(步骤)，获得单字符识别区域的候选单字字符组成的识别候选阵列；匹配单元(步骤)，将地址字典中的地址与所述识别候选阵列进行匹配，将识别距离最小的地址作为识别结果。

在一个实施例中，所述匹配单元(步骤)包括地址不缺失匹配单元(步骤)，进行地址不缺失匹配，即按隶属关系逐级将地址字典中的地址与所述识别候选阵列进行匹配。

在一个实施例中，所述匹配单元(步骤)还包括：

判断单元(步骤)，判断所述地址不缺失匹配单元(步骤)所确定出的地址是否可靠；地址缺失匹配单元(步骤)，当所述判断单元(步骤)判断出所述地址不缺失匹配单元(步骤)所确定出的地址不可靠时，进行地址缺失匹配，即只逐级进行隶属关系中的较下几级的匹配，所述较下几级是指从隶属关系中的第二级或第三级开始直至隶属关系中最后一级；以及可靠性比较单元(步骤)，将所述地址不缺失匹配单元(步骤)所确定出的结果的可靠性与所述地址缺失匹配单元(步骤)所确定出的结果的可靠性进行比较，将可靠性高的作为匹配结果。

在一个实施例中，在所述匹配单元(步骤)中，所述第k级候选地名这样确定：计算确定出了前k-1级地址后，地名T_i的出现概率，将计算出的概率与地名图像被识别成该地名T_i的置信度相乘，将乘积最大的地名T_i确定为第k级候选地名，i是大于等于1的整数，T_i表示第k级候选地名的第i个候选。

在一个实施例中，所述地名的置信度为地名图像与识别出的所述地名T_i的近似度的加权；如果地名T_i中的最后一个候选识别区域被识别成关键字，则将所述近似度乘以较大的权值，如果地名T_i中的最后一个候选识别区域未被识别成关键字，则将所述近似度乘以较小的权值。

在一个实施例中，所述词语言地址识别单元(步骤)还包括候选字减少单元(步骤)，用于减少所述候选阵列中的候选单字字符。

在一个实施例中，所述候选字减少单元(步骤)根据以下规则之一减少候选单字字符，(1)如果候选单字字符的绝对识别距离大于第一阈值则将其从所述候选阵列中删除；(2)如果候选单字字符的相对识别距离大于第二阈值则将其从所述候选阵列中删除。

另外，本发明还提供了一种计算机程序，该计算机程序在被计算机执行时，可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的地址识别方法及其各组成单元。本发明还提供了存储所述程序的计算机可读存储介质。

另外，本发明还提供了一种计算机程序，该计算机程序在被计算机执行时，可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的地址识别装置及其各组成单元。本发明还提供了存储该程序的计算机可读存储介质。

另外，本发明还提供了一种计算机程序，该计算机程序在被计算机执行时，可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的确定字符图像中单字符区域的方法及其各组成步骤。本发明还提供了存储该程序的计算机可读存储介质。

另外，本发明还提供了一种计算机程序，该计算机程序在被计算机执行时，可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的确定字符图像中单字符区域的装置及其各组成单元。本发明还提供了存储该程序的计算机可读存储介质。

另外，本发明还提供了一种计算机程序，该计算机程序在被计算机执行时，可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的对地址图像中的地址进行识别的方法及其各组成步骤。本发明还提供了存储该程序的计算机可读存储介质。

另外，本发明还提供了一种计算机程序，该计算机程序在被计算机执行时，可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的对地址图像中的地址进行识别的装置及其各组成单元。本发明还提供了存储该程序的计算机可读存储介质。

所述的计算机可读存储介质可以是硬盘、闪存、软盘、磁盘、DVD、VCD、CD，闪存、ROM、RAM等本领域技术人员所知的所有可存储计算机可执行指令或计算机程序的存储介质。

前面对本发明实施例的描述是示例性和说明性的，并不是排他性的，也不是为了将本发明限制到所公开的确切形式。显然，对于本领域的普通技术人员，很多修改和变型是显而易见的。选择并说明这些实施例是为了最好地说明本发明的原理及其实际应用。从而使得本领域的其他技术人员能够理解用于各种实施例的本发明以及本发明适于特殊使用目的的变型。例如本发明也可应用于日语和韩文手写地名的识别。此外，在本文中使用匹配距离来判断相似程度，但判断相似程度也可使用匹配距离以外的方法，例如特征向量之间的余弦夹角，特征向量之间的街区距离等，因此本发明的匹配距离应作广泛的解释，是本领域技术人员所能想到的相似程度的定量表示。

Claims

1. 一种地址识别装置，所述装置包括以下单元：

关键字缺失判断单元，判断输入的地址图像中关键字是否缺失；

整体地址识别单元，在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时，对所述关键字之间的地址区域进行整体识别；

词语言地址识别单元，在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时，对所述输入的地址图像进行词语言地址识别；

可靠性判断单元，对所述整体地址识别单元所识别出的地址的可靠性进行判断；

其中，在所述可靠性判断单元判断出所述整体地址识别单元所识别出的地址不可靠时，由所述词语言地址识别单元对所述输入的地址图像进行词语言地址识别。

2. 根据权利要求1所述的装置，其中，当所述整体地址识别单元所识别出的地址的匹配距离大于预定阈值时，所述可靠性判断单元判断所述整体地址识别单元所识别出的地址不可靠。

3. 根据权利要求1所述的装置，其中，所述关键字缺失判断单元包括以下单元：

单个字符提取单元，提取所述输入的地址图像中的候选单个字符；

比较单元，将所提取的各候选单个字符分别与关键字字符字典中的关键字进行比较；以及

关键字判断单元，当所述各候选单个字符与所述关键字字符字典中的所有关键字的匹配距离都大于特定阈值时或虽然存在匹配距离小于特定阈值的所述候选单个字符，但未出现合理的关键字次序时，判断所述输入的地址图像中关键字缺失。

4. 根据权利要求3所述的装置，其中，所述单个字符提取单元包括以下单元：

连通域分割单元，从图像中分割出连通域；

候选单字符区域判断单元，判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否为候选单字符区域；以及

字符提取单元，针对所确定出的候选单字符区域进行字符提取。

5. 根据权利要求4所述的装置，其中，所述候选单字符区域判断单元通过判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域的宽度是否大于给定阈值而分别判断所述每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否为候选单字符区域。

6. 根据权利要求1所述的装置，其中，所述整体地址识别单元包括以下单元：

提取单元，提取所述地址区域的特征向量；

整体匹配单元，将所提取的特征向量与地名字典中的地名的特征向量相匹配，寻找所有可能候选地名。

7. 根据权利要求1所述的装置，其中，所述词语言地址识别单元包括：

识别候选阵列获得单元，识别各候选单字符区域，得到识别候选阵列；以及

匹配单元，将地址字典中的地址与所述识别候选阵列进行匹配，将识别距离最小的地址作为识别结果。

8. 根据权利要求7所述的装置，其中，所述匹配单元包括地址不缺失匹配单元，进行地址不缺失匹配，即按隶属关系逐级将地址字典中的地址与所述识别候选阵列进行匹配。

9. 根据权利要求8所述的装置，其中，所述匹配单元还包括：

判断单元，判断所述地址不缺失匹配单元所确定出的地址是否可靠；

地址缺失匹配单元，当所述判断单元判断出所述地址不缺失匹配单元所确定出的地址不可靠时，进行地址缺失匹配，即只逐级进行隶属关系中的较下几级的匹配，所述较下几级是指从隶属关系中的第二级或第三级开始直至隶属关系中最后一级；以及

可靠性比较单元，将所述地址不缺失匹配单元所确定出的结果的可靠性与所述地址缺失匹配单元所确定出的结果的可靠性进行比较，将可靠性高的作为匹配结果。

10. 根据权利要求7所述的装置，其中，在所述匹配单元中，第k级候选地名这样确定：计算在确定出了前k-1级地址后，地名T_i的出现概率，将计算出的概率与地名图像被识别成该地名T_i的置信度相乘，将乘积最大的地名T_i确定为第k级候选地名，i是大于等于1的整数，T_i表示第k级候选地名的第i个候选。

11. 根据权利要求10所述的装置，所述地名的置信度为地名图像与识别出的所述地名T_i的近似度的加权；如果地名T_i中的最后一个候选识别区域被识别成关键字，则将所述近似度乘以较大的权值，如果地名T_i中的最后一个候选识别区域未被识别成关键字，则将所述近似度乘以较小的权值。

12. 根据权利要求7所述的装置，其中，所述词语言地址识别单元还包括候选字减少单元，用于减少所述候选阵列中的候选单字字符。

13. 根据权利要求12所述的装置，其中，所述候选字减少单元根据以下规则之一减少候选单字字符，

(1)如果候选单字字符的绝对识别距离大于第一阈值则将其从所述候选阵列中删除；以及

(2)如果候选单字字符的相对识别距离大于第二阈值则将其从所述候选阵列中删除。

14. 一种确定字符图像中单字字符区域的装置，所述装置包括以下单元：

连通域分割单元，对所述字符图像进行连通域分割；

候选单字符区域判断单元，判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域的宽度是否小于阈值，将小于所述阈值的每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域判断为候选单字符区域。

15. 一种对地址图像中的地址进行识别的装置，所述装置包括以下单元：

单字字符识别单元，识别所述地址图像中的每一个候选单字符区域，得到字符识别候选；

识别候选阵列获得单元，获得由所有所述候选单字符区域的字符识别候选所组成的识别候选阵列；以及

匹配单元，将地址字典中的地址与所述识别候选阵列进行匹配，将识别距离最小的地址识别为识别结果。

16. 根据权利要求15所述的装置，其中，所述匹配单元包括地址不缺失匹配单元，该单元进行地址不缺失匹配，即按隶属关系逐级将地址字典中的地址与所述识别候选阵列进行匹配。

17. 根据权利要求16所述的装置，其中，所述匹配单元还包括：

地址缺失匹配单元，当所述判断单元判断出所述地址不缺失匹配单元所确定出的地址不可靠时，进行地址缺失匹配，即只逐级进行隶属关系中的较下几级的匹配，所述较下几级是指从隶属关系中的第二级或第三级开始直至隶属关系中最后一级，以及

可靠性比较单元，将所述地址不缺失匹配单元所确定出的地址的可靠性与所述地址缺失匹配单元所确定出的地址的可靠性进行匹配，将可靠性高的作为匹配结果。

18. 根据权利要求15所述的装置，其中，在所述匹配单元中，第k级候选地名这样确定：计算在前k-1级地址确定后，地名T_i的出现概率，将计算出的概率与地名图像被识别成该地名T_i的置信度相乘，将乘积最大的地名T_i确定为第k级候选地名，i是大于等于1的整数，T_i表示第k级候选地名的第i个候选。

19. 根据权利要求18所述的装置，所述地名的置信度为地名图像与识别出的所述地名T_i的近似度的加权；如果地名T_i中的最后一个候选识别区域被识别成关键字，则将所述近似度乘以较大的权值，如果地名T_i中的最后一个候选识别区域未被识别成关键字，则将所述近似度乘以较小的权值。

20. 根据权利要求15所述的装置，其中，所述装置还包括候选字减少单元，用于减少所述候选阵列中的候选单字字符。

21. 根据权利要求20所述的装置，其中，所述候选字减少单元根据以下规则之一减少候选单字字符，