CN101276327A - 地址识别装置 - Google Patents
地址识别装置 Download PDFInfo
- Publication number
- CN101276327A CN101276327A CNA2007100915392A CN200710091539A CN101276327A CN 101276327 A CN101276327 A CN 101276327A CN A2007100915392 A CNA2007100915392 A CN A2007100915392A CN 200710091539 A CN200710091539 A CN 200710091539A CN 101276327 A CN101276327 A CN 101276327A
- Authority
- CN
- China
- Prior art keywords
- address
- candidate
- unit
- place name
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本发明公开了地址识别装置。所述装置包括以下单元:关键字缺失判断单元,判断输入的地址图像中关键字是否缺失;整体地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时,对所述关键字之间的地址区域进行整体识别;词语言地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时,对所述输入的地址图像进行词语言地址识别;可靠性判断单元,对所述整体地址识别单元所识别出的地址的可靠性进行判断;其中,在所述可靠性判断单元判断出所述整体地址识别单元所识别出的地址不可靠时,由所述词语言地址识别单元对所述输入的地址图像进行词语言地址识别。
Description
技术领域
本发明涉及地址识别的装置。更具体地,涉及一种识别任意间距区域内的手写字符地址的地址识别装置。
背景技术
传统上有两种对手写地址进行识别的方法。
第一种传统方法是首先从输入地址图像中提取单字符区域(即只含有一个字符的区域),并从这些单字符区域中提取关键字符(在手写地址识别中,关键字符为能够表示行政区域的单一字符,例如省、区、州、市、县、镇、乡、村等),检测由两个相邻关键字符所限定的地名区域。为了识别地名区域内的地名,该方法将该地名区域分割成独立的字符,然后逐个识别这些独立字符。
但是,这种传统的地址识别方法存在一定的缺陷,即,将地址分割成独立字符时常常出现错误。特别是当自由间距区内的地址相互连接紧密时,该方法尤其容易出错。而由于手写字符常常不太规范、形态各异,所以这种紧密连接的情况很常见。
第二种传统方法也是首先提取字符片断,并检测由两个相邻关键字符所限定的地名区域。它与第一种方法的不同之处在于,这种方法将地名区域内的地名作为整体来进行识别。比如输入地址图像的实际地址为“北京市朝阳区霄云路”,首先市,区,路这些关键地址被提取识别出来。然后这些关键字之间的图像(或第一个关键字之前的图像)被切分出来。即,“北京”,“朝阳”,“霄云”所对应的图像将被切分出来。并对这些图像整体识别。
这个传统方法的一个主要问题是,很大一部分实际地址中,关键字往往被省去。比如,地址条“北京市朝阳区霄云路”中的“市”或“区”可以被略去,而且并不会影响对地址的解读。在这种情况下,整体识别的方法会失败,因为地名区域也即关键字之间的图像区域将无法确定。
发明内容
本发明鉴于上述问题而提出。本发明的目的是提供对地址进行识别的地址识别装置,用以解决现有技术中的一个或更多个问题。
为了实现本发明的目的,根据本发明的第一方面,提供了一种地址识别装置,所述装置包括以下单元:关键字缺失判断单元,判断输入的地址图像中关键字是否缺失;整体地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时,对所述关键字之间的地址区域进行整体识别;词语言地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时,对所述输入的地址图像进行词语言地址识别。
根据本发明的第二方面,提供了一种确定字符图像中单字符区域的装置,所述装置包括以下单元:连通域分割单元,对所述字符图像进行连通域分割;候选单字符区域判断单元,判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域的宽度是否大于阈值,将大于阈值的每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域判断为候选单字符区域。
根据本发明的第三方面,提供了一种对地址图像中的地址进行识别的装置,所述装置包括以下单元:单字字符识别单元,识别所述地址图像中的每一个候选单字符区域,得到字符识别候选;识别候选阵列获得单元,获得由所有所述候选单字符区域的字符识别候选所组成的识别候选阵列;匹配单元,将地址字典中的地址与所述识别候选阵列进行匹配,将识别距离最小的地址识别为识别结果。
本发明在字符分割时,每个连通组件,每俩个相邻的连通组件及每三个相邻的连通组件,都将作为可能的字符区域被分别识别。基于词图搜索的方法则从得到的识别候选序列中搜索最优的识别地址。使用多个连通组件的组合提高了系统的鲁棒性,从而降低丢失正确字符的风险,提高地址识别的正确度。
本发明能够有效地识别存在关键字和不存在关键字的地址。
另外,本发明在基于词图搜索的地名匹配方法中,采用了一种加权词图的搜索方法。关键字与普通汉字相比往往能提供更多的信息。当关键字存在时,这种方法突出了关键字的作用,即,给予含关键字的地名以较大的权值。另外,中文地址中,低级地名一般不会缺失关键字。比如,北京市朝阳区霄云路中,“市”、“区”可能会被省去,但“路”一般不会被省去。考虑加权关键字能提高识别地址识别的效率和正确率。
应当理解,以上总体说明和以下详细说明都是说明性和示例性的,并旨在提供对所要求的本发明的进一步说明。
附图说明
所包含的附图用于提供对本发明的进一步理解,其被并入说明书并构成其一部分,附图说明了本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是依据本发明的一个实施例的地址识别装置的方框图;
图2示出了依据本发明一个实施例的地址识别方法的流程图;
图3是依据本发明的关键字缺失判断单元进行的候选单字符区域分割的示例性说明;
图4是依据本发明实施例的词语言地址识别单元的方框图;
图5是依据本发明的一种树形结构的地址词图示意图;
图6是依据本发明的词语言模型匹配单元的操作流程图;以及
图7示出了依据本发明一个实施例的地址识别装置的结构图。
具体实施方式
下面将参照附图详细说明本发明的地址识别装置和方法。在附图中,相同的附图标记代表相同或类似的部件。
图1是依据本发明的一个实施例的地址识别装置的方框图。如图1所示,依据本发明的地址识别装置包括关键字缺失判断单元11、整体地址识别单元12、判断单元13和词语言地址识别单元14。
图2示出了依据本发明一个实施例的地址识别方法的流程图。如图2所示,在步骤S201中,由关键字缺失判断单元11将输入的地址图像切分为可能的单一字符区域,并进行关键字是否缺失的确定。在判断出关键字不缺失(步骤S202,是)时,在步骤S203,整体地址识别单元12进行整体地址识别。然后,在步骤S204,判断单元13判断整体识别单元12在步骤S203的输出的地址的匹配距离是否超过一预设阈值。如果没有超过该阈值,说明整体识别单元识别结果可靠,于是输出该结果为最终识别结果。如果该匹配距离超过了该阈值,说明递归整体识别单元结果不可靠,输入的地址图像中仍有较大可能性缺失关键字,于是处理进行到步骤S205,由词语言地址识别单元14进行识别。
整体识别单元12在进行整体地址识别时,首先从候选单一字符区域中提取关键字,再依次提取关键字之间的地名区域,进行递归整体识别。整体识别的方法和步骤可以详见中国专利申请第200510089537.0号。现通过引用将该申请并如本文中,如同在本文中完全阐明一样。大略地说,所述整体地址识别步骤可以包括:提取步骤,提取所述地址区域的特征向量;匹配步骤,将所提取的特征向量与地名字典中的地名的特征向量相匹配,寻找所有可能候选地名。实践中,可以在所述地名字典中的地名的特征向量与所提取的特征向量的匹配距离小于预定阈值时就将该地名判断为可能候选地名。而如果在所述匹配步骤中获得多个可能候选地名时,按预定的规则对所述多个可能候选地名进行筛选。
当输入地址图像中存在关键字缺失时,整体识别的输出结果将会错误。但此时其匹配距离也会较大。因而,由判断单元13对整体识别单元的整体识别结果进行评价。判断单元13的存在进一步提高了本发明的地址识别方法的可靠性,避免了关键字缺失判断单元11的判断错误可能造成的影响。
下面结合图3说明关键字缺失判断单元11和步骤S201的操作。图3是依据本发明的关键字缺失判断单元11的候选单字符区域分割的示例性说明。
依据本发明的关键字缺失判断单元11首先进行候选单字符区域分割。具体地,首先从图像中分割连通域;然后判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否为候选单字符区域。
图3中假设输入的地址为“河北...”。作为示例性说明,仅对“河北”图像进行说明。如图3(a),首先从图像中得到连通域A,B,C,D。其中A为俩个连通域组合而成。连通域是图像前景色(通常为黑色)像素点的集合,在此集合中,任何两个像素点都能通过该集合内的像素相连通。具体检测连通域的方法可参见连通域检测算法(参见Hypermedia ImageProcessing Reference,Bob Fisher,Simon Perkins,Ashley Walker and ErikWolfart.Depa rtment of Artificial Intelligence University of Edinburgh,UK.http://www.cee.hw.ac.uk/hipr/html/label.html),连通域的合并可参见美国专利US 6,535,619B1中图11A,11B,11C及其说明。考虑汉字字符横向上最多只可能有三个独立结构,比如“树”由“木”,“又”,“寸”组成。如图3(b)所示,相邻的俩个连通域被组合作为候选单一字符区域,即,AB,BC,CD;如图3(c)所示,相邻的三个连通域也被组合作为候选单一字符区域,ABC,BCD。在上面的连通域组合过程中,当组合后的连通域宽度大于某一给定阈值Thc时则不进行组合连通域。在一个实施例中,当估计Thc时,首先从所有的连通域中得到平均高度,假定为Thh,对汉字而言,汉字的平均宽度和高度之比往往在一个稳定的范围内,则Thc可被设置为Thh×cof,其中cof通常为2~3。
如图3(d)所示,BCD的宽度大于Thc,即Width(BCD)>Thc,则BCD不被判定为候选的单一字符区域。于是,最后的候选单一字符区域为,A,B,C,D,AB,BC,CD,ABC。
在确定了候选单字符区域之后,判断所确定的候选单字符区域中的单个字符是否为关键字。可以将所述候选单字符区域中的单个字符与关键字字典中的关键字进行比较,以确定其是否为关键字。在一个实施例中,当所述单个字符与关键字字典中的关键字的匹配距离小于预定阈值时,认为其为关键字。在一个实施例中,在判断出所述输入的图像中存在关键字时,还进行所识别出的关键字所组成的路径是否合法的判断。如“省...市”为合法,“市...省”为不合法。在本发明的一个实施例中,所述关键字符词典单元所保存的可能关键字符仅为包括如下汉字字符:省、市、区、弄、路、街、村、乡、镇、港、湾、县、道、里、同、巷、楼、州、旗、胡、庄、坊。在判断出存在关键字时,如上所示,进行步骤S203的整体识别。在判断出不存在关键字或关键字路径不符合预定规则(在某些实施例中)时,进行步骤S205的词语言地址识别。
图4是依据本发明实施例的词语言地址识别单元(词图搜索识别单元)13的方框图。如图4所示,依据一个实施例,本发明的词语言地址识别单元13包括地址词图存储单元302、单字字符识别单元301、候选阵列获得单元303、词语言模型匹配单元304。
在词语言地址识别单元13中,首先对输入的候选单一字符区域进行单字字符识别,于是每一候选单一字符区域都得到长度为N个的识别候选,通过候选阵列获得单元303简单地排列所有的候选单一字符区域的识别候选,而获得一识别候选阵列。匹配单元将存储在地址词图存储单元302当中的地名(如,北京或北京市,上海或上海市,湖北或湖北省等)与该识别候选阵列进行匹配,并从中计算出识别距离最小的地址列作为识别结果。
更具体地,图4中单字字符识别单元301用来识别候选单字区域。单字字符识别单元301识别每一个候选单字区域而得到字符识别候选。此时的候选单字区域就是前面所述的每一个连通域,每相邻的俩个和三个连通域,并利用给定的任一分类方法(比如模板匹配,二次判别分析,支撑向量机等)对所述各连通域进行了分类识别。所有候选单字区域的识别候选将会组合成一阵列(识别候选阵列)。这种组合候选阵列获得单元303完成。匹配单元304则将存储在地址词图存储单元302当中的地名(如,北京或北京市,上海或上海市,湖北或湖北省等)与该识别候选阵列进行匹配,并从中计算出识别距离最小的地址列作为识别结果。
图5是依据本发明的一种树形结构的地址词图示意图。在图5中,地名根据其隶属关系被组织成树形结构。E0代表根节点,连接一级地址,即直辖市,或省级地址,如E11示出了北京市,E12示出了上海市,E13示出了湖北省等。为了有效地识别关键字缺失的地址,该词图中的树形结构的各节点,既存储含关键字的地名,又存储不含关键字的地名,如E11中,北京和北京市都存储在节点中。依据隶属关系,中文地址最多只有四级结构,例如E13(湖北省)-E23(荆州市)-E33(沙市区)-E41(红门路)。
图6是依据本发明的匹配单元304的操作流程图。如图6所示,在步骤S1读入数据,即识别各候选单字区域得到识别候选阵列。假设候选单字区域共m个,表示为{A1,A2,...,Am},识别每个候选区域Ai共得到n个候选,表示为Cij(0<i<m,0<j<n+1,i,j均为正整数),每个识别候选的识别距离记为Dist(Cij)。各候选按照识别距离由小到大进行排序,即如果j>k,Dist(Cij)>Dist(Cik)。
在步骤S2中,利用如下规则减少候选字符数目:
规则一:如果Dist(Ciq)>Thr1,从候选阵列中删除Ciq,Ci(q+1)...,Cin
规则二:如果[Dist(Ciq)-Dist(Ci1)]/Dist(Ci1)>Thr2,从候选阵列中删除Ciq,Ci(q+1)...,Cin
某候选的识别绝对距离越大,说明该候选为正确的单字识别结果的可能越小,规则一用于减少绝对距离大的识别候选。同理,规则二利用与第一识别候选的相对值来滤除那些不大可能为正确识别结果的候选单字。规则一和规则二能减少候选数目,从而提高系统的搜索速度和识别精度。
在步骤S3,将对识别候选阵列进行不缺失第一级地址的匹配。即首先将地址词图存储单元302里的所有第一级地址(T1,T2,T3,..,Tk)与前几个候选单字区域的识别候选进行匹配,得到候选地名X1。具体而言,该候选词X1由以下公式得到,
X1=argmaxTi[logP(Ti)+logCF(Ti)],
P(Ti)为地名Ti出现的概率,可以从大量的地址语料里通过计算Ti出现的频率来得到。
CF(Ti)为多个候选单字区域识别为Ti的置信度,其计算过程如下
假设Ti={Ti1,Ti2,...,Tip},这里Tij,0<j<p+1,且j为正整数,表示地名Ti里的第j个字符,如Ti=北京市,则,Ti1,=北,Ti2,=京,Ti3,=市。假设,单字区域Aw1,Aw2,Awp被匹配为Ti,{Cxk1,Cwk2,...,Cwkl}为识别Awk所得的l个候选。如下所示地定义字符Tik与Awj的近似度Sim(Tik,Awj):
上面的定义中,如果字符Tik存在于Awj的识别候选阵列中,则Awj可能为字符Tik。同时,如果Awj识别为字符Tik的距离越小,则Awj越有可能识别为Tik,Sim(Tik,Awj)则应该越大,这也是(1)所阐述的意思。如果字符Tik不存在于Awj的识别候选阵列中,则认为字符Tik与Awj的近似度很小,因此赋给Sim(Tik,Awj)一个很小的值δc,这也是(2)所阐述的意思。最后CF(Ti)定义如下:
wk为一大于1的常数,wc为一小于1的常数。
公式(3)中,该地名Ti的置信度定义为其中各字符Tia与字符图像的近似度的乘积的加权。同时,如果Ti的最后一个字为中有关键字,并且该关键字出现在字符图像的识别候选中,说明该候选字符图为一正确的地名的可能性很大,我们因此给予以较大权值wk,否则给予以较小权值wc。此处,“较大”、“较小”可以被分别理解为“大于”“小于”某一预定的值。
当第一级地名被匹配后,确定第二级地名的匹配。第二级地名匹配完成后,再进行下级地名匹配,并依此类推。直到匹配结束。第k级地名Xk由以下公式得到。
Xk=argmaxTi[logP(Ti|X1...Xk-1)+logCF(Ti)](4)
其中P(Ti|X1...Xk-1)表示前k-1级地址确定后,地名Ti出现的概率。该值定义如下
即,在所述匹配中,所述第k级候选地名这样确定:计算前k-1级地址确定后,地名Ti的出现概率,将计算出的概率与地名图像被识别成该地名Ti的置信度相乘,将乘积最大的地名Ti确定为第k级候选地名,i是大于等于1的整数,Ti表示第k级候选地名的第i个候选。
所述地名的置信度为地名图像与识别出的所述地名Ti的近似度的加权;如果地名Ti中的最后一个候选识别区域被识别成关键字,则将所述近似度乘以较大的权值,如果地名Ti中的最后一个候选识别区域未被识别成关键字,则将所述近似度乘以较小的权值。
S4用来判断不缺失第一级地址的匹配S3结果是否足够好。具体而言,假设不缺失第一级地址的匹配结果为X1...Xk,Ea=logP(Xa|X1...Xa-1)+logCF(Xa),a=1,...,k.则
ThE为一给定阈值。
当 时,说明匹配结果X1...Xk的总体可靠性较高,因此接受该匹配结果为最终的识别结果。
当 时,说明匹配结果X1...Xk的总体可靠性较低,因此该匹配结果可能为不含第一级地址,比如“湖北省荆州市沙市区红门路”中的湖北省可能缺失。因此在步骤S5中进行缺失地址的匹配,首先进行缺失第一级地址的匹配。
在步骤S6中比较缺失地址匹配的总体可靠性与不缺失地址匹配的总体可靠性,取其中可靠性高的为最后识别结果。
当输入地址含有第一级地址时,采用S3-S4-S5-S6区分不缺失第一级地址匹配和缺失第一级地址的匹配的方法,S3将直接输出识别结果,而将不用进行缺失第一级地址的匹配,从而能提高系统的效率和精度。
注意在上面的说明中,根据实际情况,上面的框架应该被灵活应用。比如当输入地址中存在一,二级地址均缺失较为频繁的情况,参考上面的方框图,缺失地址匹配步骤可以进行缺失第一级和第二级地址的匹配。从而达到提高系统效率和精度的效果。
图7示出了依据本发明一个实施例的匹配单元的结构图。如图7所示,依据本发明一个实施例的匹配单元304包括:地址不缺失匹配单元701,用于进行上述地址不缺失匹配,即按隶属关系逐级将地址字典中的地址与识别候选阵列进行比较;判断单元702,用于判断所述地址不缺失匹配单元701的匹配结果是否足够好;地址缺失匹配单元703,用于在所述判断单元判断出所述匹配结果不够好时,进行地址缺失匹配,即只逐级进行隶属关系中的较下几级的匹配,所述较下几级是指从隶属关系中的第二级或第三级开始直至隶属关系中最后一级;确定单元704,用于选择所述地址不缺失匹配单元7021和地址缺失匹配单元7023的匹配结果中的较好者。
综上所述,本发明提供了这样的地址识别装置(或方法),所述装置(或方法)包括以下单元(或步骤):关键字缺失判断单元(步骤),判断输入的地址图像中关键字是否缺失;整体地址识别单元(步骤),在所述关键字缺失判断单元(步骤)判断出所述输入的地址图像中关键字不缺失时,对所述关键字之间的地址区域进行整体识别;词语言地址识别单元(步骤),在所述关键字缺失判断单元(步骤)判断出所述输入的地址图像中关键字缺失时,对所述输入的地址图像进行词语言地址识别。
本发明还提供了一种确定字符图像中单字符区域的装置(方法),所述装置(方法)包括以下单元(步骤):连通域分割单元(步骤),对所述字符图进行连通域分割;候选单字符区域判断单元(步骤),判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否小于阈值,将小于所述阈值的每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域判断为候选单字符区域。
在一个实施例中,所述装置(方法)还包括以下单元(步骤):可靠性判断单元(步骤),对所述整体地址识别单元(步骤)所识别出的地址的可靠性进行判断;其中,在所述可靠性判断单元(步骤)判断出所述整体地址识别单元(步骤)所识别出的地址不可靠时,由所述词语言地址识别单元(步骤)对所述输入的地址图像进行词语言地址识别。
在一个实施例中,当所述整体地址识别单元(步骤)所识别出的地址的匹配距离大于预定阈值时,所述可靠性判断单元(步骤)判断所述整体地址识别单元(步骤)所识别出的地址不可靠。
在一个实施例中,所述关键字缺失判断单元(步骤)包括以下单元(步骤):单个字符提取单元(步骤),提取所述输入的地址图像中的候选单个字符;比较单元(步骤),将所提取的各候选单个字符分别与关键字字符字典中的关键字进行比较;关键字判断单元(步骤),当所述各候选单个字符与所述关键字字符字典中的所有关键字的匹配距离都大于特定阈值时或虽然存在匹配距离小于特定阈值的所述候选单个字符,但未出现合理的关键字次序时,判断所述输入的地址图像中关键字缺失。
在一个实施例中,所述单个字符提取单元(步骤)包括以下单元(步骤):连通域分割单元(步骤),从图像中分割出连通域;候选单字符区域判断单元(步骤),判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否为候选单字符区域;字符提取单元(步骤),针对所确定出的候选单字符区域进行字符提取。
在一个实施例中,所述候选单字符区域判断单元(步骤)通过判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域的宽度是否大于给定阈值而分别判断所述每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否为候选单字符区域。
在一个实施例中,所述整体字符识别单元(步骤)包括以下单元(步骤):提取单元(步骤),提取所述地址区域的特征向量;匹配单元(步骤),将所提取的特征向量与地名字典中的地名的特征向量相匹配,寻找所有可能候选地名。
在一个实施例中,所述词语言地址识别单元(步骤)包括:识别候选阵列获得单元(步骤),获得单字符识别区域的候选单字字符组成的识别候选阵列;匹配单元(步骤),将地址字典中的地址与所述识别候选阵列进行匹配,将识别距离最小的地址作为识别结果。
在一个实施例中,所述匹配单元(步骤)包括地址不缺失匹配单元(步骤),进行地址不缺失匹配,即按隶属关系逐级将地址字典中的地址与所述识别候选阵列进行匹配。
在一个实施例中,所述匹配单元(步骤)还包括:
判断单元(步骤),判断所述地址不缺失匹配单元(步骤)所确定出的地址是否可靠;地址缺失匹配单元(步骤),当所述判断单元(步骤)判断出所述地址不缺失匹配单元(步骤)所确定出的地址不可靠时,进行地址缺失匹配,即只逐级进行隶属关系中的较下几级的匹配,所述较下几级是指从隶属关系中的第二级或第三级开始直至隶属关系中最后一级;以及可靠性比较单元(步骤),将所述地址不缺失匹配单元(步骤)所确定出的结果的可靠性与所述地址缺失匹配单元(步骤)所确定出的结果的可靠性进行比较,将可靠性高的作为匹配结果。
在一个实施例中,在所述匹配单元(步骤)中,所述第k级候选地名这样确定:计算确定出了前k-1级地址后,地名Ti的出现概率,将计算出的概率与地名图像被识别成该地名Ti的置信度相乘,将乘积最大的地名Ti确定为第k级候选地名,i是大于等于1的整数,Ti表示第k级候选地名的第i个候选。
在一个实施例中,所述地名的置信度为地名图像与识别出的所述地名Ti的近似度的加权;如果地名Ti中的最后一个候选识别区域被识别成关键字,则将所述近似度乘以较大的权值,如果地名Ti中的最后一个候选识别区域未被识别成关键字,则将所述近似度乘以较小的权值。
在一个实施例中,所述词语言地址识别单元(步骤)还包括候选字减少单元(步骤),用于减少所述候选阵列中的候选单字字符。
在一个实施例中,所述候选字减少单元(步骤)根据以下规则之一减少候选单字字符,(1)如果候选单字字符的绝对识别距离大于第一阈值则将其从所述候选阵列中删除;(2)如果候选单字字符的相对识别距离大于第二阈值则将其从所述候选阵列中删除。
另外,本发明还提供了一种计算机程序,该计算机程序在被计算机执行时,可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的地址识别方法及其各组成单元。本发明还提供了存储所述程序的计算机可读存储介质。
另外,本发明还提供了一种计算机程序,该计算机程序在被计算机执行时,可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的地址识别装置及其各组成单元。本发明还提供了存储该程序的计算机可读存储介质。
另外,本发明还提供了一种计算机程序,该计算机程序在被计算机执行时,可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的确定字符图像中单字符区域的方法及其各组成步骤。本发明还提供了存储该程序的计算机可读存储介质。
另外,本发明还提供了一种计算机程序,该计算机程序在被计算机执行时,可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的确定字符图像中单字符区域的装置及其各组成单元。本发明还提供了存储该程序的计算机可读存储介质。
另外,本发明还提供了一种计算机程序,该计算机程序在被计算机执行时,可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的对地址图像中的地址进行识别的方法及其各组成步骤。本发明还提供了存储该程序的计算机可读存储介质。
另外,本发明还提供了一种计算机程序,该计算机程序在被计算机执行时,可使计算机实现权利要求书中独立权利要求及从属权利要求中所记载的对地址图像中的地址进行识别的装置及其各组成单元。本发明还提供了存储该程序的计算机可读存储介质。
所述的计算机可读存储介质可以是硬盘、闪存、软盘、磁盘、DVD、VCD、CD,闪存、ROM、RAM等本领域技术人员所知的所有可存储计算机可执行指令或计算机程序的存储介质。
前面对本发明实施例的描述是示例性和说明性的,并不是排他性的,也不是为了将本发明限制到所公开的确切形式。显然,对于本领域的普通技术人员,很多修改和变型是显而易见的。选择并说明这些实施例是为了最好地说明本发明的原理及其实际应用。从而使得本领域的其他技术人员能够理解用于各种实施例的本发明以及本发明适于特殊使用目的的变型。例如本发明也可应用于日语和韩文手写地名的识别。此外,在本文中使用匹配距离来判断相似程度,但判断相似程度也可使用匹配距离以外的方法,例如特征向量之间的余弦夹角,特征向量之间的街区距离等,因此本发明的匹配距离应作广泛的解释,是本领域技术人员所能想到的相似程度的定量表示。
Claims (21)
1. 一种地址识别装置,所述装置包括以下单元:
关键字缺失判断单元,判断输入的地址图像中关键字是否缺失;
整体地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时,对所述关键字之间的地址区域进行整体识别;
词语言地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时,对所述输入的地址图像进行词语言地址识别;
可靠性判断单元,对所述整体地址识别单元所识别出的地址的可靠性进行判断;
其中,在所述可靠性判断单元判断出所述整体地址识别单元所识别出的地址不可靠时,由所述词语言地址识别单元对所述输入的地址图像进行词语言地址识别。
2. 根据权利要求1所述的装置,其中,当所述整体地址识别单元所识别出的地址的匹配距离大于预定阈值时,所述可靠性判断单元判断所述整体地址识别单元所识别出的地址不可靠。
3. 根据权利要求1所述的装置,其中,所述关键字缺失判断单元包括以下单元:
单个字符提取单元,提取所述输入的地址图像中的候选单个字符;
比较单元,将所提取的各候选单个字符分别与关键字字符字典中的关键字进行比较;以及
关键字判断单元,当所述各候选单个字符与所述关键字字符字典中的所有关键字的匹配距离都大于特定阈值时或虽然存在匹配距离小于特定阈值的所述候选单个字符,但未出现合理的关键字次序时,判断所述输入的地址图像中关键字缺失。
4. 根据权利要求3所述的装置,其中,所述单个字符提取单元包括以下单元:
连通域分割单元,从图像中分割出连通域;
候选单字符区域判断单元,判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否为候选单字符区域;以及
字符提取单元,针对所确定出的候选单字符区域进行字符提取。
5. 根据权利要求4所述的装置,其中,所述候选单字符区域判断单元通过判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域的宽度是否大于给定阈值而分别判断所述每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域是否为候选单字符区域。
6. 根据权利要求1所述的装置,其中,所述整体地址识别单元包括以下单元:
提取单元,提取所述地址区域的特征向量;
整体匹配单元,将所提取的特征向量与地名字典中的地名的特征向量相匹配,寻找所有可能候选地名。
7. 根据权利要求1所述的装置,其中,所述词语言地址识别单元包括:
识别候选阵列获得单元,识别各候选单字符区域,得到识别候选阵列;以及
匹配单元,将地址字典中的地址与所述识别候选阵列进行匹配,将识别距离最小的地址作为识别结果。
8. 根据权利要求7所述的装置,其中,所述匹配单元包括地址不缺失匹配单元,进行地址不缺失匹配,即按隶属关系逐级将地址字典中的地址与所述识别候选阵列进行匹配。
9. 根据权利要求8所述的装置,其中,所述匹配单元还包括:
判断单元,判断所述地址不缺失匹配单元所确定出的地址是否可靠;
地址缺失匹配单元,当所述判断单元判断出所述地址不缺失匹配单元所确定出的地址不可靠时,进行地址缺失匹配,即只逐级进行隶属关系中的较下几级的匹配,所述较下几级是指从隶属关系中的第二级或第三级开始直至隶属关系中最后一级;以及
可靠性比较单元,将所述地址不缺失匹配单元所确定出的结果的可靠性与所述地址缺失匹配单元所确定出的结果的可靠性进行比较,将可靠性高的作为匹配结果。
10. 根据权利要求7所述的装置,其中,在所述匹配单元中,第k级候选地名这样确定:计算在确定出了前k-1级地址后,地名Ti的出现概率,将计算出的概率与地名图像被识别成该地名Ti的置信度相乘,将乘积最大的地名Ti确定为第k级候选地名,i是大于等于1的整数,Ti表示第k级候选地名的第i个候选。
11. 根据权利要求10所述的装置,所述地名的置信度为地名图像与识别出的所述地名Ti的近似度的加权;如果地名Ti中的最后一个候选识别区域被识别成关键字,则将所述近似度乘以较大的权值,如果地名Ti中的最后一个候选识别区域未被识别成关键字,则将所述近似度乘以较小的权值。
12. 根据权利要求7所述的装置,其中,所述词语言地址识别单元还包括候选字减少单元,用于减少所述候选阵列中的候选单字字符。
13. 根据权利要求12所述的装置,其中,所述候选字减少单元根据以下规则之一减少候选单字字符,
(1)如果候选单字字符的绝对识别距离大于第一阈值则将其从所述候选阵列中删除;以及
(2)如果候选单字字符的相对识别距离大于第二阈值则将其从所述候选阵列中删除。
14. 一种确定字符图像中单字字符区域的装置,所述装置包括以下单元:
连通域分割单元,对所述字符图像进行连通域分割;
候选单字符区域判断单元,判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域的宽度是否小于阈值,将小于所述阈值的每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域判断为候选单字符区域。
15. 一种对地址图像中的地址进行识别的装置,所述装置包括以下单元:
单字字符识别单元,识别所述地址图像中的每一个候选单字符区域,得到字符识别候选;
识别候选阵列获得单元,获得由所有所述候选单字符区域的字符识别候选所组成的识别候选阵列;以及
匹配单元,将地址字典中的地址与所述识别候选阵列进行匹配,将识别距离最小的地址识别为识别结果。
16. 根据权利要求15所述的装置,其中,所述匹配单元包括地址不缺失匹配单元,该单元进行地址不缺失匹配,即按隶属关系逐级将地址字典中的地址与所述识别候选阵列进行匹配。
17. 根据权利要求16所述的装置,其中,所述匹配单元还包括:
判断单元,判断所述地址不缺失匹配单元所确定出的地址是否可靠;
地址缺失匹配单元,当所述判断单元判断出所述地址不缺失匹配单元所确定出的地址不可靠时,进行地址缺失匹配,即只逐级进行隶属关系中的较下几级的匹配,所述较下几级是指从隶属关系中的第二级或第三级开始直至隶属关系中最后一级,以及
可靠性比较单元,将所述地址不缺失匹配单元所确定出的地址的可靠性与所述地址缺失匹配单元所确定出的地址的可靠性进行匹配,将可靠性高的作为匹配结果。
18. 根据权利要求15所述的装置,其中,在所述匹配单元中,第k级候选地名这样确定:计算在前k-1级地址确定后,地名Ti的出现概率,将计算出的概率与地名图像被识别成该地名Ti的置信度相乘,将乘积最大的地名Ti确定为第k级候选地名,i是大于等于1的整数,Ti表示第k级候选地名的第i个候选。
19. 根据权利要求18所述的装置,所述地名的置信度为地名图像与识别出的所述地名Ti的近似度的加权;如果地名Ti中的最后一个候选识别区域被识别成关键字,则将所述近似度乘以较大的权值,如果地名Ti中的最后一个候选识别区域未被识别成关键字,则将所述近似度乘以较小的权值。
20. 根据权利要求15所述的装置,其中,所述装置还包括候选字减少单元,用于减少所述候选阵列中的候选单字字符。
21. 根据权利要求20所述的装置,其中,所述候选字减少单元根据以下规则之一减少候选单字字符,
(1)如果候选单字字符的绝对识别距离大于第一阈值则将其从所述候选阵列中删除;以及
(2)如果候选单字字符的相对识别距离大于第二阈值则将其从所述候选阵列中删除。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100915392A CN101276327B (zh) | 2007-03-27 | 2007-03-27 | 地址识别装置 |
JP2008084615A JP5251205B2 (ja) | 2007-03-27 | 2008-03-27 | 住所認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100915392A CN101276327B (zh) | 2007-03-27 | 2007-03-27 | 地址识别装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101276327A true CN101276327A (zh) | 2008-10-01 |
CN101276327B CN101276327B (zh) | 2010-06-23 |
Family
ID=39914393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007100915392A Expired - Fee Related CN101276327B (zh) | 2007-03-27 | 2007-03-27 | 地址识别装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5251205B2 (zh) |
CN (1) | CN101276327B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402682A (zh) * | 2010-09-16 | 2012-04-04 | 株式会社东芝 | 文字识别装置、区分装置、区分控制装置,以及文字识别方法 |
CN103186524A (zh) * | 2011-12-30 | 2013-07-03 | 高德软件有限公司 | 一种地名识别方法和装置 |
CN103854021A (zh) * | 2012-11-29 | 2014-06-11 | 北京千橡网景科技发展有限公司 | 词语识别方法及装置 |
WO2015027837A1 (zh) * | 2013-08-30 | 2015-03-05 | 深圳市华傲数据技术有限公司 | 一种通信地址补全的装置及方法 |
CN104731976A (zh) * | 2015-04-14 | 2015-06-24 | 海量云图(北京)数据技术有限公司 | 数据表中隐私数据的发现与分类方法 |
CN107430601A (zh) * | 2014-11-14 | 2017-12-01 | 大众汽车(中国)投资有限公司 | 用于导航系统的控制方法和控制装置 |
CN109013360A (zh) * | 2018-07-09 | 2018-12-18 | 安徽云图信息技术有限公司 | 一种快递入库分拣管理系统 |
CN110334162A (zh) * | 2019-05-09 | 2019-10-15 | 德邦物流股份有限公司 | 地址识别方法及装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107133215A (zh) * | 2017-05-20 | 2017-09-05 | 复旦大学 | 一种脱机手写中文规范地址识别方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2635155B2 (ja) * | 1989-03-20 | 1997-07-30 | 富士通株式会社 | ベた書き住所認識装置 |
JPH07271920A (ja) * | 1994-03-31 | 1995-10-20 | Toshiba Corp | 文字認識装置 |
JP3639126B2 (ja) * | 1998-01-22 | 2005-04-20 | 富士通株式会社 | 住所認識装置及び住所認識方法 |
JP2001283156A (ja) * | 2000-03-31 | 2001-10-12 | Glory Ltd | 住所認識装置、住所認識方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002183119A (ja) * | 2000-12-19 | 2002-06-28 | Riso Kagaku Corp | 宛名作成装置、宛名作成プログラム、及び宛名作成システム |
JP4136316B2 (ja) * | 2001-01-24 | 2008-08-20 | 富士通株式会社 | 文字列認識装置 |
CN1169073C (zh) * | 2001-02-23 | 2004-09-29 | 无敌科技(西安)有限公司 | 图文编辑方法以及系统 |
JP2006031099A (ja) * | 2004-07-12 | 2006-02-02 | Fujitsu Ltd | 文字認識をコンピュータに行なわせるためのコンピュータ実行可能なプログラム |
CN100555308C (zh) * | 2005-07-29 | 2009-10-28 | 富士通株式会社 | 地址识别装置和方法 |
-
2007
- 2007-03-27 CN CN2007100915392A patent/CN101276327B/zh not_active Expired - Fee Related
-
2008
- 2008-03-27 JP JP2008084615A patent/JP5251205B2/ja not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402682A (zh) * | 2010-09-16 | 2012-04-04 | 株式会社东芝 | 文字识别装置、区分装置、区分控制装置,以及文字识别方法 |
CN103186524B (zh) * | 2011-12-30 | 2016-04-13 | 高德软件有限公司 | 一种地名识别方法和装置 |
CN103186524A (zh) * | 2011-12-30 | 2013-07-03 | 高德软件有限公司 | 一种地名识别方法和装置 |
CN103854021A (zh) * | 2012-11-29 | 2014-06-11 | 北京千橡网景科技发展有限公司 | 词语识别方法及装置 |
WO2015027837A1 (zh) * | 2013-08-30 | 2015-03-05 | 深圳市华傲数据技术有限公司 | 一种通信地址补全的装置及方法 |
CN107430601A (zh) * | 2014-11-14 | 2017-12-01 | 大众汽车(中国)投资有限公司 | 用于导航系统的控制方法和控制装置 |
CN107430601B (zh) * | 2014-11-14 | 2021-11-09 | 大众汽车(中国)投资有限公司 | 用于导航系统的控制方法和控制装置 |
CN107430601B8 (zh) * | 2014-11-14 | 2022-03-22 | 大众汽车(中国)投资有限公司 | 用于导航系统的控制方法和控制装置 |
CN104731976A (zh) * | 2015-04-14 | 2015-06-24 | 海量云图(北京)数据技术有限公司 | 数据表中隐私数据的发现与分类方法 |
CN104731976B (zh) * | 2015-04-14 | 2018-03-30 | 海量云图(北京)数据技术有限公司 | 数据表中隐私数据的发现与分类方法 |
CN109013360A (zh) * | 2018-07-09 | 2018-12-18 | 安徽云图信息技术有限公司 | 一种快递入库分拣管理系统 |
CN110334162A (zh) * | 2019-05-09 | 2019-10-15 | 德邦物流股份有限公司 | 地址识别方法及装置 |
CN110334162B (zh) * | 2019-05-09 | 2021-11-09 | 德邦物流股份有限公司 | 地址识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101276327B (zh) | 2010-06-23 |
JP5251205B2 (ja) | 2013-07-31 |
JP2008243208A (ja) | 2008-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101276327B (zh) | 地址识别装置 | |
CN109800628B (zh) | 一种加强ssd小目标行人检测性能的网络结构及检测方法 | |
Velizhev et al. | Implicit shape models for object detection in 3D point clouds | |
CN101976258B (zh) | 基于对象分割和特征加权融合的视频语义提取方法 | |
CN100555308C (zh) | 地址识别装置和方法 | |
CN101645134B (zh) | 整体地名识别方法和整体地名识别装置 | |
CN104966090B (zh) | 实现面向图像理解的视觉单词生成和评价的系统及方法 | |
CN103020321B (zh) | 近邻搜索方法与系统 | |
CN112528664B (zh) | 基于多任务联合学习与地址层级结构知识的地址匹配方法 | |
CN103020038A (zh) | 一种网络舆情地域相关度的计算方法 | |
Harding et al. | Rejoinder to James Hamilton | |
CN109558591A (zh) | 中文事件检测方法及装置 | |
CN109033351A (zh) | 案情数据的归并方法及装置 | |
CN104598887A (zh) | 用于非规范格式手写中文地址的识别方法 | |
Gutierrez et al. | Homotopy based classification for author verification task | |
CN104102718A (zh) | 面向失衡数据集的簇边界采样与动态剪枝的失衡数据分类方法 | |
Pal et al. | Bangla and English city name recognition for Indian postal automation | |
Wang et al. | Southwestern Atlantic ocean fronts detected from the fusion of multi-source remote sensing data by a deep learning model | |
CN113010669B (zh) | 一种新闻分类方法和系统 | |
Ahmad et al. | A fusion of labeled-grid shape descriptors with weighted ranking algorithm for shapes recognition | |
CN102063428B (zh) | 互联网信息中重名人物的处理方法及系统 | |
Pham et al. | A deep learning approach for text segmentation in document analysis | |
Das et al. | Handwritten word spotting in Indic scripts using foreground and background information | |
CN104992161A (zh) | 一种基于部件识别的汉字部件分割与结构判定方法 | |
CN117009614B (zh) | 一种地理信息资源检索意图检测方法及计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100623 Termination date: 20180327 |