CN1167955A - 全地址读取装置 - Google Patents

全地址读取装置 Download PDF

Info

Publication number
CN1167955A
CN1167955A CN97100020A CN97100020A CN1167955A CN 1167955 A CN1167955 A CN 1167955A CN 97100020 A CN97100020 A CN 97100020A CN 97100020 A CN97100020 A CN 97100020A CN 1167955 A CN1167955 A CN 1167955A
Authority
CN
China
Prior art keywords
full address
address
read
result
postcode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN97100020A
Other languages
English (en)
Other versions
CN1092822C (zh
Inventor
场生松武志
永堀博之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN1167955A publication Critical patent/CN1167955A/zh
Application granted granted Critical
Publication of CN1092822C publication Critical patent/CN1092822C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

一种全地址读取装置包含一日文全地址读取器、一英文全地址读取器和一择取器。日文全地址读取器是在假定用日文格式在作为读取对象的邮件上书写邮政编码和地址的情况下读取全地址。英文全地址读取器是在假定用英文格式在作为读取对象的邮件上书写邮政编码和地址的情况下读取全地址。择取器判定日文和英文全地址读取器对同一读取对象的读取结果的可靠性水平,并从日文和英文全地址读取器的读取结果中选择和输出较高可靠性水平的读取结果。

Description

全地址读取装置
本发明涉及一种用来读取书写或打印在邮件上的邮政编码和地址的全地址读取装置,尤其涉及,即使是在用第一种语言的格式书写或打印邮政编码和地址的邮件与用第二种语言的格式书写或打印邮政编码和地址的邮件混杂在一起的情况下也能够以很高的识别率来读取全地址的全地址读取装置。
在现有技术中,已经有各种全地址读取装置可以用来读取书写或打印在邮件上的全地址(即,邮政编码和地址)。
例如,号码为4-205686的日本专利公开文件就公开了一种日文全地址读取装置,它用于当无法通过读取用日文格式书写或打印在邮件上的地址和邮政编码进行邮件分类时,就可以依据书写或打印在邮件上的指定地址的特定号码(如电话号码)存贮邮件。号码为2-181287的日本专利公开文件公开了一种英文全地址读取装置,在邮件上的邮政编码和地址是按照英文格式书写或打印的条件下,它可以读取组成地址的字符串,并通过读取出来的字符串识别出许多行政区、这些行政区的归属、和这些行政区的位置,从而依据识别的结果识别出地址。此外,还有各种现有的全地址读取装置已为人们所知。尽管如此,任何一种现有的全地址读取装置的读取对象只能是按日文格式书写或打印邮政编码和地址的邮件,或者是按英文格式书写或打印邮政编码和地址的邮件。也就是说,只有用某种特定的语言的格式书写或打印邮政编码和地址的邮件才能作为它的读取对象。
在任何一种现有的全地址读取装置中,存在的第一个问题是,当按日文(第一种语言)格式书写或打印邮政编码和地址的邮件与按英文(第二种语言)书写或打印邮政编码和地址的邮件混杂在一起的时候,识别率很低。其原因在于,任何现有的全地址读取装置的读取对象只能是按某种特定语言打印邮政编码和地址的邮件,而且只有用日文或英文书写或打印邮政编码和地址的邮件才能被读取。
第二个问题是当按日文格式书写或打印邮政编码和地址的邮件与按英文格式书写或打印邮政编码和地址的邮件混杂在一起的时候,识别差错率高。其原因在于,对于把按英文格式书写或打印邮政编码和地址的邮件作为读取对象的全地址读取装置,由直接邮政代办人在日文格式的邮件上标注的代号、街区号或类似的号码常常被误读作邮政编码;对于把按日文格式书写或打印邮政编码和地址的邮件作为读取对象的全地址读取装置,由直接邮政代办人在英文格式的邮件上标注的代号、街区号或类似的号码常被误读作邮政编码。
本发明的一个目的是提供一种全地址读取装置,它能够即使在采用第一种语言格式的邮件和采用第二种语言格式的邮件混杂在一起的时候也能以很低的识别差错率和很高的识别率读取全地址。
为实现本发明的上述目的,本发明提供的一种全地址读取装置包含有:用于在假定是按照第一种语言的格式在作为读取对象的邮件上书写邮政编码和地址的情况下读取全地址的第一种全地址读取装置;用于在假定是按照第二种语言的格式在作为读取对象的邮件上书写邮政编码和地址的情况下读取全地址的第二种全地址读取装置;用于判定由第一种和第二种全地址读取装置所产生的对同一读取对象的读取结果的可靠性水平,并从第一种和第二种全地址读取装置所产生的读取结果中选择并输出具有较高可靠性水平的读取结果。
附图的简要说明:
图1是表示本发明一项实施例全地址读取器的框图;
图2是表示图1中所示一个地址和邮政编码核对表5的视图;
图3A和图3B是表示图1中择取器4的工作过程的流程图;
图4是采用日文格式书写或打印的一个全地址视图;
图5是采用英文格式书写或打印的一个全地址的视图;
图6是当一个日文全地址读取器输出一个错误邮政编码时的一个全地址视图;
图7是当一个英文全地址读取器输出一个错误邮政编码时的一个全地址视图;
图8是当一个英文全地址读取器输出错误邮政编码和地址时的全地址视图。
下面结合附图对本发明作详细说明。
图1给出的是本发明的一个实施例,它包含有一个扫描仪1、一个日文全地址读取器2、一个英文全地址读取器3、一个择取器4,以及一个地址和邮政编码核对表5。
扫描仪1的作用是扫描书写或印刷着邮政编码和地址的作为读取对象的邮件表面,并输出邮件的图象信息。
日文全地址读取器2的作用是,在假定从扫描仪1输出的图象信息是一个按日文(第一种语言)格式书写邮政编码和地址的邮件的图象信息的情况下读取邮政编码和地址,并输出日文全地址读取结果。
英文全地址读取器3的作用是,在假定从扫描仪1输出的图象信息是一个按英文(第二种语言)格式书写邮政编码和地址的邮件的图象信息的情况下读取邮政编码和地址,并输出英文全地址读取结果。
择取器4的作用是,利用地址和邮政编码核对表5判定从日文全地址读取器2输出的日文全地址读取结果的可靠性水平和从英文全地址读取器3输出的英文全地址读取结果的可靠性水平,并把可靠性水平较高的读取结果作为全地址读取结果输出。择取器4包含有一个用来判定从日文全地址读取器2输出的读取结果的可靠性水平的第一判定单元4a、一个用来判定从英文全地址读取器3输出的读取结果的可靠性水平的第二判定单元4b、一个用来判定从日文全地址读取器2输出的读取结果与从英文全地址读取器3输出的读取结果是否相互矛盾并将一个判定结果输出给第一判定单元4a和第二判定单元4b的第三判定单元4c、以及用来比较从第一判定单元4a和第二判定单元4b输出的读取结果的可靠性水平并输出可靠性水平较高的读取结果的比较器4d。
地址和邮政编码核对表5(以下简称核对表)就是将地址和邮政编码对应着存贮的一个表。图2所示即是核对表5的内容。如图2所示,大都市和地区(行政区)的名称与分配给这些行政区的邮政编码对应着存贮在核对表5的上部的A段,城区和城市的名称与分配给它们的邮政编码相对应着存贮在核对表5中A段之后的B段。B段中每个城区或城市都隶属于A段中的行政区中的某一个。A段中所存贮的每个邮政编码又与B段中各城区和城市的名称对应存贮。
下面参照代表择取器4的工作流程的流程图(即图3A和3B)对该实施例的运行加以说明。扫描仪1对每件作为读取对象的邮件进行扫描并把邮件的图象信息同时输出给日文全地址读取器2和英文全地址读取器3。
一接收到来自扫描仪1的图象信息,日文全地址读取器2将在假定来自扫描仪1的图象信息是一个按日文格式书写或打印邮政编码和地址的邮件的图象信息的情况下读取其中的邮政编码和地址。日文全地址读取器2输出一个由邮政编码、行政区名称、城区或城市名组成的日文全地址读取结果。要注意即使图象信息表现为有不可读取的邮件,也会有输出。
一接收到来自扫描仪1的图象信息,英文全地址读取器3将在假定来自扫描仪1的图象信息是一个按英文格式书写或打印邮政编码和地址的邮件的图象信息的情况下读取其中的邮政编码和地址。英文全地址读取器3输出一个由邮政编码、行政区名称、城区或城市名组成的英文全地址读取结果。要注意即使图象信息表现出有不可读取的邮件,也会有输出。
择取器4一接收到来自日文全地址读取器2和英文全地址读取器3的日文和英文全地址读取结果,将按照图3A和图3B中的流程图进行处理。
择取器4中的判定单元4a利用从日文全地址读取器2中输出的日文全地址读取结果作为处理对象(步骤S1)来判定邮政编码和地址是否已被读取(步骤S2)。如果在步骤S2中,行政区的名称和城区/城市名都被读取了或者仅有城区/城市名称被读取,判定单元4a就判定地址已经被读取。但是,当行政区名称和城区/城市名均未被读取,或者除行政区名称外无任何其它信息被读取的时候,判定单元4a就判定地址未被读取。
当邮政编码和地址在步骤S2中均被读取出来,择取器4的第三判定单元4c将利用核对表5来检查日文全地址读取结果中的邮政编码和地址之间的关系是否相互矛盾(步骤S3)。步骤S3中的详细处理过程是这样的。首先判定在日文全地址读取结果中是否有行政区名称。如果有,这个日文全地址读取结果中的行政区名称将被用作关键词,在核对表5中从头开始查找该行政区名称所在的入口,然后再判定,在这个找到的入口所存贮的众多邮政编码中,是否存在一个与日文全地址读取结果中的邮政编码相一致的邮政编码。
如果不存在一致的邮政编码,第三判定单元4c就识别出在日文全地址读取结果中的邮政编码和地址之间存在矛盾。但是,如果存在一致的邮政编码,日文全地址读取结果中的城区/城市名将被用作关键词,在核对表5中查找存有该城区/城市名的入口,然后再判定,在所找到的入口所存贮的众多邮政编码中,是否存在一个与日文全地址读取结果中的邮政编码相一致的邮政编码。如果不存在,第三判定单元4c就识别出日文全地址读取结果中的邮政编码和地址之间的关系是矛盾的;否则,第三判定单元4c就识别出日文全地址读取结果中的邮政编码和地址之间的关系是不矛盾的。如果在日文全地址读取结果中没有行政区名称,就不进行利用行政区名称的处理过程,而是立即进行利用城区/城市名的处理过程。步骤S3中的详细运行已作以上描述。
如果日文全地址读取结果中的邮政编码和地址的关系是不矛盾的,择取器4中的第一判定单元4a就把日文全地址读取结果的可靠性水平定为一级(步骤S5)。如果在步骤S4中识别出所述关系是矛盾的,日文全地址读取结果的可靠性水平就被定为无效级(步骤S6)。
如果在步骤S2中,地址和邮政编码没有被同时读取,择取器4中的第一判定单元将判定是否仅有地址被读取了或仅有邮政编码被读取了(步骤S7和S9)。如果在步骤S7中判定仅有地址被读取,那么,第一判定单元4a将把日文全地址读取结果的可靠性水平定为二极(步骤S8);如果在步骤S9中判定仅有邮政编码被读取,那么,第一判定单元4a将把日文全地址读取结果的可靠性水平定为三级(步骤S10);如果在步骤S7和S9中判定地址和邮政编码均未被读取,那么,第一判定单元4a就把日文全地址读取结果的可靠性水平定为无效级(步骤S6)。在本实施例中,一级代表最高的可靠性水平,二级、三级、无效级所代表的可靠性水平依次降低。
如上所述,当日文全地址读取结果的可靠性水平被判定之后,择取器4中的第二判定单元4b和第三判定单元4c将对从英文全地址读取器3中输出的英文全地址读取结果进行与上述过程相同的处理,如图3B中的流程图所示,从而判定英文全地址读取结果的可靠性水平(步骤S11至S20)。值得一提的是,步骤S11至S20与步骤S1至S10是相同的,因此,有关的详细描述将被略去。
当英文全地址读取结果的可靠性水平在步骤S11至S20中被判定,比较器4d将对英文全地址读取结果的可靠性水平和日文全地址读取结果的可靠性水平进行比较(步骤S21)。在步骤S21中,如果英文和日文全地址读取结果的可靠性水平彼此不同,那么英文和日文全地址读取结果中具有较高可靠性水平的将被选中并被输出(步骤S22)。在步骤S21中,如果两个读取结果的可靠性水平相同,那么,不管这些读取结果的可靠性水平是多少,一个不可读取的全地址读取结果将被输出(步骤S23)。
下面将参照书写或打印在一件邮件上的全地址对该实施例的运行进一步做详细的说明。假定从扫描仪1输出的图象信息代表一个按日文(第一种语言)格式书写或打印的全地址。需要提及的是,图4中的日文地址和图5中的英文地址所指的是同一地址。
日文全地址读取器是在假定为从扫描仪1中输出的图象信息是一个按日文格式书写邮政编码和地址的邮件的图象信息的情况下读取邮政编码和地址。当日文全地址读取器2根据图象信息判定在书写全地址的整个区域的左上角书写或打印有三位数字(三位数字+破折号+两位数字)时,读取器2就把此图象信息作为邮政编码读取。
英文全地址读取器3是在假定为从扫描仪1中输出的图象信息是一个按英文格式书写邮政编码和地址的邮件的图象信息的情况下读取邮政编码和地址。当英文全地址读取器3根据图象信息判定在书写全地址的整个区域的右下角书写或打印有三位数字(三位数字+破折号+两位数字)时,读取器3就将此图象信息作为邮政编码读取。
在此情况下,由于按日文格式书写或打印在一个邮件上的邮政编码和地址被作为读取对象,从日文全地址读取器2和英文全地址读取器3中分别输出的日文全地址读取结果(A)和英文全地址读取结果(B)将是这样的。
日文全地址读取结果(A):
邮政编码:            183
行政区名称:          东京都(按日文识别)
城区或城市名称:      府中市(按日文识别)
英文全地址读取结果(B):
邮政编码:            不可读取
行政区名称:          不可读取
城区或城市名称:      不可读取
当日文全地址读取器2和英文全地址读取器3分别输出日文全地址读取结果(A)和英文全地址读取结果(B)时,择取器4中的第一判定单元4 a首先把日文全地址读取结果(A)作为处理对象来检查其可靠性水平(图3A中的步骤S1至S10)。此时,在日文全地址读取结果中,每一条信息,即邮政编码、行政区名称、和城区/城市名都已被读取(步骤S2:是),并且邮政编码和行政区名称之间的关系以及邮政编码和城区/城市名之间的关系无矛盾(步骤S4:否)。第一判定单元4a判定日文全地址读取结果(A)的可靠性水平为一级(步骤S5)。
择取器4中的第二判定单元4b把英文全地址读取结果(B)作为处理对象检查其可靠性水平(图3B中的步骤11至20)。此时,英文全地址读取结果(B)中的所有信息,即邮政编码、行政区名、和城区/城市名均为不可读取的信息(步骤S12:否,步骤S17:否,步骤S19:否)。第二判定单元4b判定英文全地址读取结果(B)的可靠性水平为无效级(步骤S16)。
因为日文和英文地址读取结果(A)和(B)的可靠性水平分别为一级和无效级,择取器4中的比较器4d把具有较高可靠性水平的日文全地址读取结果(A)作为全地址读取结果输出(步骤S22)。
下面介绍从扫描仪1中输出的如图5所示代表按英文(第二种语言)格式书写或打印的全地址图象信息。在此情况下,分别从日文全地址读取器2和英文全地址读取器3中输出的日文全地址读取结果(c)和英文全地址读取结果(D)是这样的。日文全地址读取结果(C):
邮政编码:           不可读取
行政区名称:         不可读取
城区/城市名称:      不可读取英文全地址读取结果(D):
邮政编码:           183
行政区名称:         TOKYO(按英文识别)
城区/城市名称:      FUTYU-CITY(按英文识别)
当日文和英文全地址读取器2和3分别输出日文和英文全地址读取结果(C)和(D),第一判定单元4a和第二判定单元4b分别获得日文全地址读取结果(C)和英文全地址读取结果(D)的可靠性水平(图3A和3B中的步骤S1至S20)。此时,在日文全地址读取结果(C)中,所有信息,即,邮政编码、行政区名称、和城区/城市名均为不可读取的信息(步骤S2:否,步骤S7:否,步骤S9:否)。第一判定单元4a判定日文全地址读取结果(C)的可靠性水平为无效级(步骤S6)。在英文全地址读取结果(D)中,所有信息,即,邮政编码、行政区名称、城区/城市名之间的关系无矛盾(步骤S14:否)。第二判定单元4b判定英文全地址读取结果(D)的可靠性水平为一级(步骤S15)。
因为日文和英文全地址读取结果(C)和(D)的可靠性水平分别为无效级和一级,择取器4中的比较器4d把具有较高可靠性水平的英文全地址读取结果(D)作为全地址读取结果输出(步骤S22)。
下面介绍一个从扫描仪1中输出的代表图6所示字符串的图象信息情形。参见图6,最后一行的字符串是由直接邮政代办人为了邮递整理汇集之便而添加的一个字符串,它不是一个全地址中的一部分。
日文全地址读取器2是在假定为从扫描仪1输出的图象信息是按照日文格式书写邮政编码和地址的邮件的图象信息的情况下读取邮政编码和地址。结果是,日文全地址读取器2输出一个如下的日文全地址读取结果(E)。
日文全地址读取结果(E):
邮政编码:          183
行政区名称:        东京都(按日文识别)
城区或城市名称:    府中市(按日文识别)
英文全地址读取器3是在假定为从扫描仪1输出的图象信息是按英文格式书写邮政编码和地址的邮件的图象信息的情况下读取邮政编码和地址。在此情况中,由于字符串“651-01”类似于一个书写或打印在全地址区域的右下角的邮政编码,所以英文全地址读取器3错误地把它作为一个邮政编码读取,结果是,英文全地址读取器3输出了一个如下的英文全地址读取结果(F)。英文全地址读取结果(F):
邮政编码:        654-01
行政区名称:      不可读取
城区或城市名称:  不可读取
当日文和英文全地址读取器2和3分别输出日文和英文全地址读取结果(E)和(F)时,第一和第二判定单元4a和4b分别获得日文和英文全地址读取结果(E)和(F)的可靠性水平(图3A和图3B中的步骤S1至S20)。在此情况中,在日文全地址读取结果(E)中,所有信息,即,邮政编码、行政区名称、城区/城市名均已被读取(步骤S2:是),并且邮政编码和行政区名称之间以及邮政编码和城区/城市称之间的关系无矛盾(步骤S4:否)。第一判定单元4a判定其可靠性水平=“一级”(步骤S5)。在英文全地址读取结果(F)中,只有邮政编码被读取(步骤S19:是),于是第二判定单元4b判定其可靠性水平=“三级”(步骤S20)。
由于日文和英文全地址读取结果(E)和(F)的可靠性水平分别为一级和三级,于是择取器4中的比较器4d把具有较高可靠性水平的日文全地址读取结果(E)作为全地址读取结果输出(步骤S22)。
下面描述的情形是,从扫描仪1输出的是图7所示表示按英文格式书写或印刷的全地址的图象信息。
日文全地址读取器2是在假定为从扫描仪1输出的图象信息是按日文格式书写邮政编码和地址的邮件的图象信息的条件下读取邮政编码和地址。在此情况中,位于全地址区左上角的字符串“BIO”在形状上与三位数字的邮政编码“810”非常相似,所以,日文全地址读取器2错误地把“BIO”读成邮政编码“810”。日文全地址读取器2输出如下的日文全地址读取结果(G)。日文全地址读取结果(G):
邮政编码:        810
行政区名称:      不可读取
城区或城市名称:  不可读取
英文全地址读取器3是在假定为从扫描仪1中输出的图象信息是按英文格式书写邮政编码和地址的邮件的图象信息的情况下读取邮政编码和地址,结果是,英文全地址读取器3输出如下的英文全地址读取结果(H)。英文全地址读取结果(H):
邮政编码:       183
行政区名称:     TOKYO(按英文识别)
城区或城市名称: FUTYU-CITY(按英文识别)
当日文和英文全地址读取器2和3分别输出日文和英文全地址读取结果(G)和(H)时,第一和第二判定单元4a和4b分别获得日文和英文全地址读取结果(G)和(H)的可靠性水平(图3A和图3B中的步骤S1至S20)。在此情况中,在日文全地址读取结果(G)中,只有邮政编码被读取(步骤S2:否,步骤S7:否,步骤S9:是),于是第一判定单元4a判定其可靠性水平=“三级”(步骤S10)。而在英文全地址读取结果(H)中,所有的信息,即,邮政编码、行政区名称、城区/城市名均被读取(步骤12:是),并且邮政编码和行政区名称之间的关系以及邮政编码和城区或城市名之间的关系无矛盾(步骤S14:否),于是第二判定单元4 b判定其可靠性水平=“一级”(步骤S15)。
由于日文和英文全地址读取结果(G)和(H)的可靠性水平分别为三级和一级,所以择取器4中的比较器4d把具有较高可靠性水平的英文全地址读取结果(H)作为全地址读取结果输出(步骤22)。
下面将要描述的情况是,从扫描仪1中输出的图象信息是图8所表示的字符串。参见图8,最下面一行的字符串是直接邮政代办人为邮递中的整理汇集之便而添加的字符串,它不是全地址中的一部分。
日文全地址读取器2是在假定为从扫描仪1中输出的图象信息是按日文格式书写地址和邮政编码的邮件的图象信息的情况下读取邮政编码和地址。结果是,日文全地址读取器2输出如下的日文全地址读取结果(I)  。
日文全地址读取结果(I):
邮政编码:       183
行政区名称:     东京都(按日文识别)
城区或城市名称: 府中市(按日文识别)
英文全地址读取器3是在假定为从扫描仪1中输出的图象信息是按英文格式书写邮政编码和地址的邮件的图象信息的情况下读取邮政编码和地址。在此情况下,由于字符串“0575-KOBE 175-36”类似于书写或印刷在全地址区右下角的英文格式的邮政编码,所以英文全地址读取器3分别把“KOBE”和“175-36”错误地读成城区或城市名和一个邮政编码,结果是,英文全地址读取器3输出如下的英文全地址读取结果(J)。英文全地址读取结果(J):
邮政编码:    175-36
行政区名称:      不可读取
城区或城市名称:  KOBE(按英文识别)
当日文和英文全地址读取器2和3分别输出日文和英文全地址读取结果(I)和(J)时,第一和第二判定单元4a和4b分别获得日文和英文全地址读取结果(I)和(J)的可靠性水平(图3A和图3B中的步骤S1至S20)。在此情况下,在日文全地址读取结果(I)中,所有信息,即,邮政编码、行政区名、城区或城市名均已被读取(步骤S2:是),并且在邮政编码和行政区名称之间的关系以及在邮政编码和城区或城市名称之间的关系无矛盾(步骤S4:否),于是第一判定单元4a判定其可靠性水平=“一级”(步骤S5)。在英文全地址读取结果(J)中,虽然邮政编码和城区或城市名都被读取(步骤1 2:是),但邮政编码和城区或城市名之间的关系有矛盾(步骤S14:是)。于是第二判定单元4b判定其可靠性水平=“无效级”  (步骤S16)。
由于日文和英文全地址读取结果(I)和(J)的可靠性水平分别为一级和无效级,择取器4中的比较器4d把具有较高可靠性水平的日文全地址读取结果(I)作为全地址读取结果输出(步骤S22)。
如上所述,根据本发明的技术方案,在日文和英文全地址读取结果当中,具有较高可靠性水平的那个读取结果被输出。所以,即使是按日文格式书写或打印邮政编码和地址的邮件与按英文格式书写或打印邮政编码和地址的邮件混杂在一起,也能以低差错识别率和高识别率读取全地址。
在两个读取结果当中,邮政编码和地址之间的关系没有矛盾的那个读取结果被判定为具有较高的可靠性水平。即使既用日文又用英文全地址读取器读取了邮政编码和地址,仍能以高概率选择出正确的邮政编码和地址。

Claims (8)

1.一种全地址读取装置,其特征在于,它包含有:
用于在假定是按照第一种语言的格式在作为读取对象的邮件上书写邮政编码和地址的情况下读取全地址的第一全地址读取装置(2);
用于在假定是按照第二种语言的格式在作为读取对象的邮件上书写邮政编码和地址的情况下读取全地址的第二全地址读取装置(3);以及
用于判定由所述第一和第二全地址读取装置产生的对同一读取对象的读取结果的可靠性水平以及选择并输出由所述第一和第二全地址读取装置产生的具有较高可靠性水平的读取结果的择取装置(4)。
2.如权利要求1所述的一种全地址读取装置,其特征在于,所述择取装置(4)包含有:
用于判定由所述第一全地址读取装置产生的读取结果的可靠性水平的第一判定装置(4a);
用于判定由所述第二全地址读取装置产生的读取结果的可靠性水平的第二判定装置(4b);以及
用于比较从所述第一和第二判定装置输出的可靠性水平、并输出具有较高可靠性水平读取结果的比较装置(4c)。
3.如权利要求2所述的一种全地址读取装置,其特征在于,
所述择取装置包含有用于判定由所述第一和第二全地址读取装置产生的读取结果是否相互矛盾的第三判定装置(4d);并且
所述第一和第二判定装置考虑到由所述第三判定装置产生的判定结果对读取结果的可靠性水平进行判定。
4.如权利要求3所述的一种全地址读取装置,其特征在于,
它还包括一个将邮政编码和地址一一对应存贮的核对表(5);并且
所述第三判定装置利用所述核对表判定邮政编码和地址的读取之间的关系是否相互矛盾。
5.如权利要求3所述的一种全地址读取装置,其特征在于,所述第一和第二判定装置各为由所述第一和第二全地址读取装置产生的读取结果定出从一级到无效级范围的一个可靠性水平,所述比较装置对两个定出的水平进行比较并选择出具有较高水平的读取结果。
6.如权利要求5所述的一种全地址读取装置,其特征在于,依据读取的邮政编码和地址两者,当所述第三判定装置判定读取结果不矛盾时,所述第一和第二判定装置各自定出第一级可靠性水平,当所述第三判定装置判定读取结果相互矛盾时,所述第一和第二判定装置各自定出无效级可靠性水平。
7.如权利要求5所述的一种全地址读取装置,其特征在于,当仅有地址被读取时,所述第一和第二判定装置各自定出第二级可靠性水平,当仅有邮政编码被读取时,定出第三级可靠性水平。
8.如权利要求1所述的一种全地址读取装置,其特征在于,当邮政编码和地址都未被读取时,所述第一和第二判定装置各自定出无效级可靠性水平。
CN97100020A 1996-02-29 1997-02-28 全地址读取装置 Expired - Fee Related CN1092822C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP069370/96 1996-02-29
JP8069370A JP2738383B2 (ja) 1996-02-29 1996-02-29 宛名読み取り装置
JP8069370 1996-02-29

Publications (2)

Publication Number Publication Date
CN1167955A true CN1167955A (zh) 1997-12-17
CN1092822C CN1092822C (zh) 2002-10-16

Family

ID=13400612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN97100020A Expired - Fee Related CN1092822C (zh) 1996-02-29 1997-02-28 全地址读取装置

Country Status (5)

Country Link
US (1) US5887072A (zh)
JP (1) JP2738383B2 (zh)
CN (1) CN1092822C (zh)
DE (1) DE19708280C2 (zh)
TW (1) TW377425B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915368A (zh) * 2014-03-13 2015-09-16 株式会社东芝 数据库管理装置以及地址识别装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10249285A (ja) * 1997-03-12 1998-09-22 Hitachi Ltd 紙葉類区分装置
US7120302B1 (en) 2000-07-31 2006-10-10 Raf Technology, Inc. Method for improving the accuracy of character recognition processes
DE10126835B4 (de) * 2001-06-01 2004-04-29 Siemens Dematic Ag Verfahren und Vorrichtung zum automatischen Lesen von Adressen in mehr als einer Sprache
US20030061022A1 (en) * 2001-09-21 2003-03-27 Reinders James R. Display of translations in an interleaved fashion with variable spacing
US20030225625A1 (en) * 2002-05-31 2003-12-04 Michael Chew Returns management systems and methods therefor
US7529716B1 (en) * 2002-06-20 2009-05-05 Welsh Thomas M Mail arbitrator
JP2007004584A (ja) * 2005-06-24 2007-01-11 Toshiba Corp 情報処理装置
KR101128507B1 (ko) * 2008-12-17 2012-03-28 한국전자통신연구원 영상 인식 기반 다국어 접수 정보 처리 방법 및 시스템

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57137976A (en) * 1981-02-18 1982-08-25 Nec Corp Zip code discriminating device
US5229932A (en) * 1988-08-23 1993-07-20 Pitney Bowes Inc. Method and apparatus for categorizing and certifying mail batches
JPH02181287A (ja) * 1989-01-05 1990-07-16 Toshiba Corp 住所認識装置
JPH04205686A (ja) * 1990-11-30 1992-07-27 Toshiba Corp 郵便物宛名読取装置
US5444797A (en) * 1993-04-19 1995-08-22 Xerox Corporation Method and apparatus for automatic character script determination
US5434932A (en) * 1994-07-28 1995-07-18 West Publishing Company Line alignment apparatus and process

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915368A (zh) * 2014-03-13 2015-09-16 株式会社东芝 数据库管理装置以及地址识别装置

Also Published As

Publication number Publication date
DE19708280C2 (de) 2001-04-19
CN1092822C (zh) 2002-10-16
DE19708280A1 (de) 1997-09-04
TW377425B (en) 1999-12-21
US5887072A (en) 1999-03-23
JP2738383B2 (ja) 1998-04-08
JPH09234429A (ja) 1997-09-09

Similar Documents

Publication Publication Date Title
CN1126608C (zh) 识别邮件发送信息的方法和装置
US7421126B2 (en) Method and system for searching form features for form identification
US8339619B2 (en) System and image processing method and apparatus for re-using and re-editing images
CN1320485C (zh) 图像检索装置和图像检索装置的关键词赋予方法
CN1149509C (zh) 图像处理设备和方法
CN1215432C (zh) 帐票识别方法
CN1092822C (zh) 全地址读取装置
CN1904906A (zh) 地址识别装置和方法
US20060291692A1 (en) Information processing apparatus having learning function for character dictionary
CN1867030A (zh) 以预定次序打印扫描文档的成像设备及其方法
US20050140679A1 (en) Image processing apparatus and image processing method
CN1145492A (zh) 使用四状态码的条码编码系统
CN102782703A (zh) 经历光学字符识别的图像的页面布局确定
CN1010512B (zh) 字符的识别方法
CN1141666C (zh) 利用标准笔划识别输入字符的在线字符识别系统
CN1740943A (zh) 一种文档加密方法
CN1158146C (zh) 利用记录所得的地址记录更新地址数据库的设备和方法
CN1959704A (zh) 二维条码符号转换为编码信息的方法
CN1173283C (zh) 文献图象处理装置和方法
CN1129331A (zh) 由字符图象直方图0-1图形表示识别字符的方法和装置
CN1077757C (zh) 字符发生方法及装置
JPH10181137A (ja) 画像形成装置及び方法
CN1691989A (zh) 处理邮件的方法和装置
US20010043742A1 (en) Communication document detector
CN1308889C (zh) 字符识别方法和装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20021016

Termination date: 20160228

CF01 Termination of patent right due to non-payment of annual fee