CN102193963A - 住所数据库的更新装置和住所数据库的更新方法 - Google Patents

住所数据库的更新装置和住所数据库的更新方法 Download PDF

Info

Publication number
CN102193963A
CN102193963A CN2011100507934A CN201110050793A CN102193963A CN 102193963 A CN102193963 A CN 102193963A CN 2011100507934 A CN2011100507934 A CN 2011100507934A CN 201110050793 A CN201110050793 A CN 201110050793A CN 102193963 A CN102193963 A CN 102193963A
Authority
CN
China
Prior art keywords
residence
information
image
database
accumulating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100507934A
Other languages
English (en)
Inventor
浜村倫行
前田匡哉
入江文平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN102193963A publication Critical patent/CN102193963A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种住所数据库的更新装置和住所数据库的更新方法,根据一个实施例,存储住所信息的住所数据库(19)的更新装置具有蓄积部(31)、显示部(32)、未登记数据输入部(33)和更新部(34)。蓄积部蓄积作为处理对象的图像中包含的全部住所信息中的、到中途为止的信息确定而其以外的信息未能确定的图像。显示部显示所述蓄积部中蓄积的图像。未登记数据输入部在所述显示部上显示了图像的状态下,输入没有登记在所述住所数据库中的住所信息的一部分信息。更新部利用由所述未登记数据输入部输入的信息来更新所述住所数据库。

Description

住所数据库的更新装置和住所数据库的更新方法
本申请基于并要求2010年3月17日提交的在先日本专利申请2010-61539号的优先权,该申请的全部内容通过引用结合在本申请中。
技术领域
这里所述的实施方式一般地涉及住所数据库的更新装置和住所数据库的更新方法。
背景技术
在纸张类处理装置中,包括根据住所信息对记载了住所信息的邮件或帐票等纸张类进行区分处理的装置。该纸张类处理装置读取记载了住所信息的纸张类的图像并对其进行字符识别,然后通过对字符识别结果与住所数据库中登记的住所信息进行匹配,来识别住所信息。因此,如果住所数据库有缺陷,则纸张类处理装置的住所信息的识别精度降低。另外,由于住所信息会由于搬家等发生变化,因此住所数据库需要定期维护。但是,住所数据库的构筑和更新处理花费成本。因此,希望能够有效地构筑、更新用于纸张类处理装置的住所数据库。
例如,在特开2007-41919号公报(专利文献1)中公开了如下技术:通过字符识别处理对记载在邮件上的字符信息进行识别,将该字符识别的结果提示给操作者,由操作者判断是否将字符识别的结果新登记到住所数据库中。
另外,在特开2009-146393号公报(专利文献2)中,与上述专利文献1同样,公开了如下技术:通过字符识别处理对记载在邮件上的字符信息进行识别,利用字符识别的结果,以各种条件更新住所数据库。
但是,在上述专利文献1、2中,如果字符识别处理没有正确地识别未登记在住所数据库中的部分,则无法准确地更新住所数据库。一般情况下,对于手写的住所信息,很难通过字符识别处理正确地识别住所数据库未登记的部分的所有字符。对于手写的住所信息,往往通过利用住所数据库进行后处理的识别方法或者如下的识别方法来提高识别精度:不仅仅个别地识别字符,而且通过对作为字符识别结果得到的字符串和住所数据库的住所信息中包含的单词进行匹配,来选择得分最高的住所数据库内的单词。但是,这些识别方法不能应用于上述的专利文献1和2。
发明内容
一般地,根据一个实施例,存储住所信息的住所数据库的更新装置具有蓄积部、显示部、未登记数据输入部和更新部。蓄积部蓄积作为处理对象的图像中包含的全部住所信息中的、到中途为止的信息确定而其以外的信息未能确定的图像。显示部显示所述蓄积部中蓄积的图像。未登记数据输入部在所述显示部上显示了图像的状态下,输入没有登记在所述住所数据库中的住所信息的一部分信息。更新部利用由所述未登记数据输入部输入的信息更新所述住所数据库。
附图说明
图1是概略地示出应用了住所数据库的更新装置的纸张类处理装置的结构的框图。
图2是示出作为处理对象的纸张类的一个例子的图。
图3是示出住所数据库的一个例子的图。
图4是示出蓄积部中蓄积的数据的例子的图。
图5是用于说明住所数据库的更新处理的流程图。
图6是用于说明向蓄积部蓄积图像的蓄积处理的流程图。
图7是用于说明蓄积数据的更新处理的流程图。
图8是用于说明未登记数据的登记处理的流程图。
具体实施方式
以下参照附图对实施例进行说明。
图1是概略地示出实施例所涉及的纸张类处理装置的结构例子的图。
纸张类处理装置1例如是对邮件或帐票等纸张类上记载的住所信息进行识别,并且根据该识别结果对该纸张类进行区分处理的装置。在图1中,纸张类处理装置1包括区分机主体3、视频编码系统(以下简称为VCS)4和住所数据库登记装置(以下简称为住所DB登记装置)5。区分机主体3、VCS 4以及住所DB登记装置5以能够相互通信的方式连接。
图1所示的纸张类处理装置的区分机主体3利用住所信息等对纸张类进行区分处理。区分机主体3具有住所识别部。区分机主体3参照存储在住所数据库中的住所信息,通过住所识别部进行纸张类上记载的住所信息的识别处理。纸张类处理装置的VCS 4是由操作者输入未能在区分机主体3中识别出住所信息的纸张类的住所信息的系统。纸张类处理装置的住所DB登记装置5具有作为住所数据库的更新装置的功能。住所DB登记装置5例如通过对未能在区分机主体3中识别出住所信息的部分的未登记数据或者在VCS 4中输入的住所信息中包含的未登记数据进行追加登记,来更新住所数据库。
区分机主体3在前表面上设置有操作面板10。操作面板10由操作者(操作人员)指定处理模式、指定处理开始以及显示本装置的动作状态等。
首先对区分机主体3进行说明。
区分机主体3具有供给纸张类P的供给部11。容纳在供给部11中的纸张类P例如图2所示,是记载了包括邮政编号、住所、收件人姓名等字符信息的住所信息的邮件。供给部11将纸张类P以规定的间隔逐张地供给至主搬运路径12。
在由供给部11供给的纸张类P上,有的除了住所信息外,还记载了表示纸张类P的住所信息的目的地条形码、或者对未能识别出住所信息的纸张类给予的作为识别信息的ID条形码。
在主搬运路径12上设置有条形码读取器(以下简称为BCR)13、扫描仪14、条形码写入器(以下简称为BCW)15和区分部16。这些各个部件在区分控制部17根据针对各纸张类的搬运状态等的处理状态而进行的控制下工作。
BCR 13读取在主搬运路径12上搬运的纸张类上印刷的ID条形码或目的地条形码等条形码。BCR 13具有读取条形码的图像的读取部和识别读取图像上的条形码的识别部。BCR 13的条形码识别结果被供给至区分控制部17。
扫描仪14光学地读取主搬运路径12上的纸张类的图像。扫描仪14与识别作为住所信息的字符信息的住所识别部18连接。住所识别部18从由扫描仪14读取的图像中提取象是住所信息的字符的图像,将提取的字符的图像识别为字符候选。住所识别部18利用象是住所信息的字符的识别结果和住所数据库(住所DB)19中登记的住所信息,决定作为住所信息的识别结果。住所识别部18将住所信息的识别结果供给至区分控制部17。
BCW 15根据需要在纸张类上印刷ID条形码或目的地条形码。例如,BCW 15对由住所识别部18识别出住所信息的纸张类,印刷将作为识别结果的住所信息转换成条形码而得到的目的地条形码。另外,BCW 15对未能由住所识别部18识别出住所信息的纸张类,印刷将由区分控制部17给出的识别信息(ID码)转换成条形码而得到的ID条形码。即,BCW 15在识别出住所信息的纸张类上印刷其识别结果作为目的地条形码,而在未能识别出住所信息的纸张类上印刷ID条形码。
即,上述目的地条形码是表示作为OCR识别结果的目的地信息本身的条形码,上述ID条形码是表示用于识别该纸张类的识别信息的条形码。上述ID条形码所表示的纸张类的识别信息是用于将在VCS 4中按键输入的住所信息与纸张类相对应的信息。换言之,印刷了上述ID条形码的纸张类是成为VCS 4的处理对象的纸张类。
在BCW 15的纸张类的搬运方向的下游侧,设置有根据住所信息对纸张类进行区分的区分部16。该区分部16由被划分成多层、多列的多个区分袋(未图示)构成。各个袋对应于每个区分目的地而设定,根据住所信息或机器码,将纸张类按顺序聚集在与住所信息对应的袋中。
另外,在区分部16中设置有聚集未能识别出区分目的地的纸张类的VCS排除袋(未图示)。聚集在该VCS排除袋中的纸张类在通过VCS 4输入了住所信息后,再次供给到供给部11,根据该纸张类的ID码和由VCS 4输入的住所信息而进行再次区分。区分控制部17根据作为区分信息的住所信息,将纸张类区分到区分部16的各个袋中。
住所数据库19存储作为识别对象的住所信息。在本实施例中,假设在住所数据库19中登记的住所信息是由多个层次的数据构成的信息。图3示出住所数据库19的一个例子。住所数据库19例如通过树结构(分层结构)存储了存在于纸张类(例如邮件)的处理对象地域中的所有住所信息。住所数据库19能够由住所DB登记装置5更新。例如,住所DB登记装置5可以对住所数据库19中所登记的住所信息仅追加登记下层的信息。另外,住所数据库19可以是能够由住所识别部18访问的存储装置。例如,住所数据库19也可以设置在区分机主体3的外部。
接着说明VCS 4。
VCS 4包括图像蓄积分配装置21和多个视频编码盘(以下简称为VCD)22等。图像蓄积分配装置21和VCD 22例如可以由具有显示部、键盘等的输入部、控制部和存储部等的计算机来实现。
图像蓄积分配装置21进行如下处理:向各个VCD 22配送未能在区分机主体3中识别出住所信息的纸张类的图像,以及向区分机主体3返回各VCD 22进行的住所信息的按键输入结果。图像蓄积分配装置21上连接有区分机主体3中的扫描仪14、区分控制部17、住所识别部18和住所数据库19以及住所DB登记装置5。
图像蓄积分配装置21将未能由住所识别部18识别出住所信息的纸张类的图像与该纸张类的识别信息(ID码)相对应地存储。图像蓄积分配装置21根据各VCD 22的工作状况将存储的纸张类的图像配送给各VCD 22。
VCD 22具有作为图像显示部的显示部23、作为住所输入部的输入部24和控制部25等。显示部23由显示装置构成。输入部24例如由键盘和指示设备等构成。控制部25由CPU(处理器)和存储器等构成。控制部25负责VCD 22整体的控制,具有控制VCD 22的各部件的功能。控制部25通过由CPU执行存储在存储器中的程序来实现各种处理。另外,控制部25还作为进行输入信息的判定等的判定部而起作用。
从图像蓄积分配装置21对VCD 22分配与该纸张类的识别信息(ID码)相对应的纸张类的图像。VCD 22的控制部25使图像显示部23显示从图像蓄积分配装置21分配的纸张类的图像。在显示了纸张类的图像的状态下,VCD 22的控制部25由操作者通过输入部24输入住所信息。VCD 22的控制部25将输入部24的输入结果作为输入(确定)的住所信息,与该纸张类的识别信息(ID码)相对应,返回给图像蓄积分配装置21。
另外,图像蓄积分配装置21将来自VCD 22的输入结果与该纸张类的识别信息(ID码)相对应,提供给区分机主体3的区分控制部17。由此,区分机主体3的区分控制部17能够根据给予纸张类的ID条形码取得按键输入的住所信息。
接着说明住所DB登记装置5。
住所DB登记装置5具有蓄积部31、蓄积图像显示部32、未登记数据输入部33、数据登记部34和控制部35。住所DB登记装置5例如由具有显示部、控制部、存储部和键盘等的计算机构成。
控制部35控制住所DB登记装置5的整体。控制部35由CPU(处理器)和存储器等构成。控制部35通过由CPU执行存储在存储器中的控制程序来实现各种处理。
蓄积部31由HDD等可重写的非易失性存储装置构成。蓄积部31存储例如由住所识别部18识别的住所信息的一部分和由VCS 4输入的住所信息的一部分。例如,对于从纸张类读取的图像识别出住所信息的一部分的情况下,蓄积部31将识别出来的部分的信息作为中途确定住所(确定信息)来蓄积。如果住所信息由多个层次的信息构成,则住所识别部18在到中途层为止的识别成功、而其以下的层的识别失败的情况下,蓄积部31将到识别成功的中途层的识别结果作为中途确定住所(确定信息)来蓄积。
图4示出蓄积部31中存储的信息的例子。在图4所示的例子中,蓄积部31存储中途确定住所(确定信息)41、图像42、累积次数(第1累积次数)43和累积次数(第2累积次数)44。中途确定住所41是成功识别到中途层的住所信息(未能识别出下层的住所信息的住所信息)。图像42是得到中途确定住所41的图像。第1累积次数43是得到中途确定住所41的次数。第2累积次数44是还识别出中途确定住所41的下层的信息的次数。第1累积次数43和第2累积次数44是针对作为规定期间的各月而合计的次数。
在图4的例子中,假设是识别出(确定)到“川崎市幸区小向○○町1-2-5△△公寓301”为止的信息的中途确定住所(确定信息)41。第1累积次数43是作为中途确定住所41而得到“川崎市 幸区 小向○○町1-2-5△△公寓301”的次数。第2累积次数44是得到包括作为中途确定住所41的“川崎市幸区小向○○町1-2-5△△公寓301”的住所信息整体(即,包括中途确定住所41和姓名等下层信息的住所信息整体)的次数。
蓄积图像显示部32显示蓄积在蓄积部31中的纸张类的图像等。蓄积图像显示部32由通过控制部35控制显示内容的显示装置构成。未登记数据输入部33针对蓄积图像显示部32上显示的图像输入在住所识别部18中识别失败的部分的住所信息等。未登记数据输入部33例如由键盘等构成。数据登记(更新)部34在住所数据库19中登记(更新)由未登记数据输入部33输入的住所信息。数据登记部34可以是通过由控制部35内的CPU执行程序而实现的功能。
以下对上述结构中的本实施例所涉及的住所数据库的更新处理的例子进行说明。
扫描仪14通过光学地读取记载了住所信息的纸张类(邮件、帐票等),取得包含住所信息的图像。图2是扫描仪14从纸张类P取得的图像的一个例子。
住所识别部18对扫描仪14取得的图像进行字符识别,将字符识别结果与住所数据库19中登记的住所信息进行匹配。由此,住所识别部18将扫描仪14取得的图像中的字符串作为住所信息的字符串进行识别处理。
图3示出住所数据库19的一个例子。例如,住所识别部18利用图3所示的住所数据库19对图2所示的图像进行了住所识别的情况下,住所识别部18对于到“川崎市幸区小向○○町1-2-5△△公寓301”为止的住所信息的识别成功。在图2所示的图像中,在“301”的下一层为“小向芝男”,因此,与作为图3所示的住所数据库19中的“301”的下一层的住所信息的“东京太郎”或“东京花子”都不匹配。因此,住所识别部18对于“301”以下层的住所信息的识别失败。
这样,在得到住所识别部18识别出中途层的信息而未能识别出其以后的下层的信息这样的识别结果的情况下,蓄积部31将到识别成功的中途层为止的住所信息作为中途确定住所,与该图像相对应地存储。另外,蓄积部31将对仅得到相同的中途确定住所的次数(未能识别出下层的次数)进行计数而得到的次数作为累积次数(第1累积次数)43而存储。
另外,蓄积部31将到中途层为止的识别结果(中途确定信息)相同、并且还识别出其以后的下层的信息的次数作为累积次数(第2累积次数)44而存储。即,蓄积部31将中途确定信息相同、并且未能识别出中途确定信息的下层的信息的次数作为第1累积次数43存储,而将中途确定信息相同、并且还识别出中途确定信息的下层的信息的次数作为第2累积次数44存储。另外,第1累积次数43和第2累积次数44在蓄积部31中存储针对每月等的每个规定期间进行计数而得到的累积次数。
例如,在图4的例子中,蓄积部31存储中途确定住所41、成为识别对象的图像42、仅识别出中途确定住所的每月的累积次数(第1累积次数)43和识别出中途确定住所的下层的信息的每月的累积次数(第2累积次数)44。在蓄积部31中,针对所有的中途识别住所,存储如图4所示的信息。
住所DB登记装置5的控制部35从蓄积在蓄积部31中的数据中,检测出住所数据库19中未登记的数据。例如,在图4所示的例子中,1月~3月的第1累积次数43(计数值)为10~15件,而4月的第1累积次数43(计数值)大幅增加为30件。这暗示有可能从4月起有新的人搬家到“川崎市 幸区 小向○○町1-2-5△△公寓301”。
另外,控制部35具有从蓄积在蓄积部31中的信息中检测出未登记数据的候选的检测功能。在未登记数据候选的检测中可以使用各种方法。例如,控制部35可以利用第1累积次数(未能识别出下层的次数)43的值来检测是否有未登记数据。另外,控制部35可以不是利用第1累积次数(未能识别出下层的次数)的值本身、而是利用其与第2累积次数(识别出下层的次数)的值之比来检测是否有未登记数据。另外,控制部35可以不是仅利用每月的变化、而是利用规定的总计期间(例如1年)中的第1累积次数或者第1累积次数与第2累积次数之比。
在检测出未登记数据的情况下,控制部35从蓄积部31中取出对应的图像并在蓄积图像显示部32上显示。控制部35可以在显示部32上显示具有作为未登记数据被检测出的中途确定住所的多个图像。操作者通过查看作为未登记数据而显示在显示部32上的多个图像,确认住所数据库19中未登记的数据的存在。
确认了是未登记数据的操作者通过未登记数据输入部33输入应在住所数据库19中登记(更新)的数据(未登记数据)。数据登记部34将由未登记数据输入部33输入的未登记数据作为中途确定住所的下层的住所信息而登记在住所数据库19中。
如上所述,作为住所数据库的更新装置的住所DB登记装置具有蓄积部、显示部、输入部、登记部和控制部。蓄积部将住所信息的一部分的识别成功、其余部分的识别失败的图像与识别结果(中途确定信息)相对应地存储。控制部在预定的定时从蓄积部所蓄积的图像中检测出在住所信息中包含未登记数据的可能性高的图像,并在显示部上显示。在显示部上显示了检测出的图像的状态下,通过未登记数据输入部输入了未能识别的信息(未登记数据)的情况下,登记部在住所数据库中登记(更新)所输入的未登记数据。由此,住所DB登记装置能够高效地构筑和更新在住所识别中使用的住所数据库。
以下说明本实施例涉及的住所数据库的更新处理的流程。
图5是用于说明纸张类处理装置中的住所数据库19的更新处理的流程图。
在区分机主体3中,当纸张类通过搬运路径12被搬运到扫描仪14的图像读取位置时,扫描仪14读取沿搬运路径12搬运的纸张类的图像(步骤S11)。由扫描仪14得到纸张类的图像后,住所识别部18利用住所数据库19对由扫描仪14读入的图像进行住所识别(步骤S12)。
住所识别部18针对由扫描仪读取的图像,在象是住所信息的区域中进行字符识别。住所识别部18对作为字符识别的结果而得到的信息与在住所数据库19中以树结构存储的住所信息进行匹配。作为匹配处理的结果,住所识别部18评价字符识别的结果是否匹配到住所数据库19中的住所信息的最下层的信息(步骤S13)。
在作为该评价的结果而判断为匹配到最下层的情况下(步骤S13:是),住所识别部18认为对于住所信息的所有层的识别成功,而将识别结果输出给住所DB登记装置5。住所DB登记装置5的控制部35利用作为从住所识别部18取得的识别结果的全部住所信息,对蓄积部31进行蓄积数据的更新处理(步骤S14)。步骤S14的蓄积数据的更新处理的详细情况将在后面说明。
步骤S14的蓄积数据的更新处理结束后,住所识别部18将全部住所信息的识别成功的识别结果发送给区分控制部17。区分控制部17根据来自住所识别部18的识别结果,对于对象物进行识别出全部住所信息的情况下的处理(后处理A)(步骤S15)。例如,如果处理对象物是邮件,则区分控制部17进行如下处理作为后处理A:利用作为住所识别部18的识别结果的全部住所信息,将邮件区分到对应于住所信息的区分袋中。
另外,在作为步骤S13中的评价的结果而判定字符识别的结果未能匹配到最下层的情况下(步骤S13:否),住所识别部18判定步骤S12中的字符识别的结果是否相对于住所数据库的住所信息匹配到中途层而其下层不匹配(步骤S16)。
在判定字符识别的结果匹配到中途层而其下层不匹配的情况下(步骤S16:是),住所识别部18将识别结果输出给住所DB登记装置5。住所DB登记装置5的控制部35认为在从住所识别部18接收的识别结果中未能确定(与住所数据库的住所信息不匹配)的下层信息有可能是住所数据库19中未登记的信息,而进行将该纸张类的图像存储(蓄积)在住所DB登记装置5的蓄积部31中的蓄积处理(步骤S17)。步骤S17的蓄积处理的详细情况将在后面说明。
另外,步骤S17的蓄积处理结束后,控制部35对住所DB登记装置5的蓄积部31进行蓄积数据的更新处理(步骤S18)。步骤S18的蓄积数据更新处理的详细情况将在后面说明。
在步骤S16中的判定结果是到中途层为止的信息不匹配的情况下,即不能识别住所信息的情况下,住所识别部18认为未能识别出象是住所信息的信息,而将未能识别出住所信息的纸张类的图像与该纸张类的ID码相对应地发送给VCS 4,前进到步骤S19。另外,在判定虽然匹配到中途层但其下层不匹配的情况下(步骤S16:是),区分机主体3的住所识别部18也将纸张类的图像和识别结果输出给VCS 4,并前进到步骤S19。
在VCS 4中,图像蓄积分配装置21蓄积从区分机主体3(住所识别部18)供给的、未能识别出住所信息的图像。图像蓄积分配装置21将蓄积的图像分配给各VCD 22。从图像蓄积分配装置21接收到图像的VCD 22的控制部25在图像显示部23上显示所接收的图像。在显示了图像的VCD 22中,操作者一边查看显示在图像显示部23上的图像,一边通过输入部24输入住所信息(步骤S20)。
例如,如果处理对象物是邮件,则操作者通过输入部24输入住所信息中的至少一部分上层的信息(例如可以用数字输入的邮政编号、住所信息中的街道、门牌号、房号等)。控制部25将在步骤S20中由操作者通过输入部24输入的住所信息的至少一部分信息(例如上层的信息)与住所数据库19中存储的住所信息进行对照。控制部25从住所数据库19所存储的住所信息中,列出接在操作者输入的信息之后的下层的信息(例如表示收件人的姓名的信息)。控制部25将列出的信息(例如收件人的姓名列表)在图像显示部23上进行列表显示。
这种情况下,操作者从图像显示部23上所显示的列表中,通过输入部24选择输入接在操作者所输入的信息之后的下层的信息(例如作为收件人的姓名)(步骤S21)。但是,在图像显示部23上所显示的列表中不存在与接在所输入的住所信息之后的下层的信息一致的信息(例如姓名)的情况下,操作者通过输入部24输入表示住所数据库19的住所信息中不存在下层的信息的消息。
在VCD 22中,控制部25利用在步骤S21中由操作者输入的判定结果,判断列表中是否存在下层的信息(即,住所数据库19中是否存在接在所输入的住所信息之后的下层的信息)(步骤S22)。
在该判断的结果判断为列表中存在下层的信息(存在于住所数据库中)的情况下(步骤S22:是),VCD 22进行对象物的住所信息已明了的情况下的处理(后处理B)(步骤S23)。例如,如果处理对象物是邮件,则VCD 22进行以下等的处理:将表示对应图像的对象物的信息与包含从列表中选择的信息的全部住所信息相对应,以组的形式在图像蓄积分配装置21中存储信息,并且经由图像蓄积分配装置21返回给区分机主体3。
另外,在判断为列表中存在下层的信息(存在于住所数据库19中)的情况下(步骤S22:是),VCD 22(或者接收到来自VCD 22的信息的控制部35)可以进行与上述步骤S14同样的、针对住所DB登记装置5的蓄积部31的蓄积数据的更新处理。
在步骤S22中的判断结果为列表中不存在下层的信息的情况下,即住所数据库19中不存在(未登记)所输入的住所信息中的下层的信息(例如姓名)的情况下,VCD 22(或者从VCD 22接收到包含未登记数据的住所信息的控制部35)进行向住所DB登记装置5的蓄积部31蓄积的蓄积处理(步骤S24)。步骤S24的蓄积处理的详细情况将在后面说明。另外,步骤S24的蓄积处理结束后,VCD 22进行对住所DB登记装置5的蓄积部31的蓄积数据的更新处理(步骤S25),并且前进到步骤S26。步骤S25的蓄积数据更新处理的详细情况将在后面说明。
作为步骤S26,纸张类处理装置1对于对象物进行住所信息未能确定的情况下的处理(后处理C)。例如,如果处理对象物是邮件,则VCD 22向区分机主体3输出表示该邮件的目的地不明(不能识别住所信息)的消息。由此,在区分机主体3中,将该邮件作为目的地不明的邮件进行区分处理。
以下对步骤S17、S24中的蓄积处理进行说明。
图6是用于说明步骤S17、S24中的蓄积处理的流程图。假定图6所示的步骤S17、S24中的蓄积处理由从区分机主体3或VCS 4接收到中途确定住所的住所DB登记装置5执行。
在接收了到中途层为止的信息确定而下层的信息不能确定的中途确定住所的情况下,控制部35针对蓄积部31判断是否登记了相同的中途确定住所(步骤S31)。作为该判断的结果而判断为中途确定住所没有登记的情况下(步骤S31:否),控制部35对蓄积部31新追加登记该中途确定住所(图4所示的中途确定住所41)(步骤S32)。
在步骤S32中的新的追加登记结束的情况下,或者在步骤S31中的判断结果是判断为已经登记的情况下(步骤S31:是),控制部35与该中途确定住所相对应地将图像(图4所示的图像42)登记在蓄积部31中(步骤S33)。另外,控制部35与该中途确定住所相对应地将第1累积次数(图4所示的累积次数43)“+1”(步骤S34),结束该蓄积处理。
以下说明步骤S14、S18、S25中的蓄积数据更新处理。
图7是用于说明步骤S14、S18、S25中的蓄积数据更新处理的流程图。假定图7所示的步骤S14、S18、S25中的蓄积数据更新处理由从区分机主体3或VCS 4接收到中途确定住所的住所DB登记装置5执行。
首先,控制部35从蓄积部31中检索与前方(上层)的信息一致的中途确定住所(步骤S41)。例如,对于上述例子来说,匹配到“川崎市 幸区 小向○○町1-2-5”、而其以后的下层的信息不能识别的情况下,控制部35检索的中途确定住所为“川崎市”、“川崎市 幸区”、“川崎市 幸区 小向○○町”等。
步骤S41中的检索结果是发现了前方的信息一致的中途确定住所的情况下(步骤S41:是),控制部35将与所发现的中途确定住所相对应的第2累积次数44(参照图4)“+1”(步骤S42),返回到步骤S41,继续检索是否存在其它前方一致的中途确定住所。步骤S41中的检索结果是没有发现前方一致的中途确定住所的情况下(步骤S41:否),控制部35结束对蓄积部31的蓄积数据的更新处理。
以下说明住所DB登记装置5中的作为住所数据库19的更新处理的未登记数据登记处理。
图8是用于说明未登记数据登记处理的流程图。
首先,控制部35从蓄积部31的图像中检测出记载了未登记数据的可能性高的图像(称为未登记数据候选)(步骤S51)。该未登记数据候选的检测方法可以考虑各种方法。
例如,控制部35可以将仅识别出中途确定住所的第1累积次数(例如图4所示的第1累积次数43)的值大于规定阈值的数据检测为未登记数据候选。另外,控制部35也可以将仅识别出中途确定住所的第1累积次数与确定了包括该第1累积次数的中途确定住所的全部住所信息的第2累积次数(例如图4所示的第2累积次数44)之比大于规定阈值的数据检测为未登记数据候选。
另外,控制部35也可以将在特定月份上述第1累积次数的值或者上述第1累积次数与第2累积次数之比的值大于规定阈值的数据检测为未登记数据候选。并且,控制部35还可以将从前一月份的增量大于规定阈值的数据检测为未登记数据候选。
另外,控制部35可以按照顺序从大到小地选择规定个数(例如n个)的数据作为未登记数据候选的检测结果。这种情况下,控制部35例如按照顺序选择第1累积次数(或者第1与第2累积次数之比)较大的n个数据。另外,控制部35可以按照顺序选择第1累积次数(或者第1与第2累积次数之比)较大的n个以内、且规定阈值以上的数据。上述阈值可以对所有数据通用,也可以针对住所信息的每个层分别设定,并且还可以针对各个中途确定住所分别设定。
另外,在图5所示的步骤S24中登记的图像是由操作者确认了该图像中的住所信息(对象物上的住所信息)包含不存在于住所数据库19中的住所信息的图像。而在图5所示的步骤S17中登记的图像是根据住所识别部18的识别结果判断为该图像中的住所信息(对象物上的住所信息)包含不存在于住所数据库19中的住所信息的图像。
考虑到在住所识别部18的住所识别处理中存在发生误识别的可能性,可以预测在步骤S24中保存在蓄积部31中的图像与在步骤S17中保存在蓄积部31中的图像相比,包含未登记数据的可能性高。即,对于在步骤S24中保存的图像和在步骤S17中保存的图像,可以分别在蓄积部31中合计(存储)第1累积次数和第2累积次数等,控制部35可以优先将在步骤S24中保存的图像检测为未登记数据候选。
在步骤S51中没有检测出记载了未登记数据的可能性高的图像的情况下(步骤S52:否),控制部35结束未登记数据登记处理。另外,在步骤S51中检测出记载了未登记数据的可能性高的图像的情况下(步骤S52:是),控制部35从蓄积部31中读出被判定为记载了未登记数据的可能性高的图像,并显示在蓄积图像显示部32上(步骤S53)。这种情况下,控制部35可以读出被保存为相同的中途确定住所的多个图像,蓄积图像显示部32可以在同一画面上显示多个图像。另外,控制部35可以根据操作者的操作,将蓄积图像显示部32显示的图像切换为相同的中途确定住所的其它图像。
在蓄积图像显示部32上显示了被判定为记载了未登记数据的可能性高的图像的状态下,控制部35接受通过未登记数据输入部33进行的、应在住所数据库19中登记的未登记数据的输入(步骤S54)。例如,操作者通过目视检查显示在蓄积图像显示部32上的图像,决定应在住所数据库19中登记的未登记数据。判断为有未登记数据的操作者通过未登记数据输入部33输入应在住所数据库19中登记的未登记数据。另外,判断为没有未登记数据的操作者通过未登记数据输入部33输入表示没有应在住所数据库19中登记的未登记数据的消息。
在没有向未登记数据输入部33输入未登记数据的情况下(步骤S55:否),控制部35返回到上述步骤S51。另外,在向未登记数据输入部33输入了未登记数据的情况下(步骤S55:是),控制部35通过数据登记部34将所输入的未登记数据作为接在住所数据库19中的中途确定信息之后的下层的住所信息而登记到住所数据库19中(步骤S56)。控制部35重复执行上述处理,直到不再有未登记数据候选。
在上述实施例中,作为在蓄积部31中蓄积仅确定了中途确定住所的图像的蓄积处理,执行蓄积从VCD 22的处理结果得到的中途确定住所的图像的蓄积处理(步骤S24)和蓄积从住所识别部18的处理结果得到的中途确定住所的图像的蓄积处理(步骤S17)。
然而,对于蓄积从VCD 22的处理结果得到的中途确定住所的图像的蓄积处理和蓄积从住所识别部18的处理结果得到的中途确定住所的图像的蓄积处理,不一定两者都需要执行。即,蓄积部31可以通过蓄积从VCD 22的处理结果得到的中途确定住所的图像的蓄积处理、或者蓄积从住所识别部18的处理结果得到的中途确定住所的图像的蓄积处理之中的某一个处理来更新。
例如,不执行蓄积从VCD 22的处理结果得到的中途确定住所的图像的蓄积处理的情况下的处理,可以通过在图5所示的流程图中省略步骤S24和S25的处理来实现。这种情况下,可以由从住所识别部18的处理结果得到并蓄积在蓄积部31中的中途确定住所的图像中检测未登记数据候选。
另外,不执行蓄积从住所识别部18的住所识别结果得到的中途确定住所的图像的蓄积处理的情况下的处理,可以通过在图5所示的流程图中省略步骤S16、S17和S18的处理来实现。这种情况下,可以由从VCD 22的处理结果得到并蓄积在蓄积部31中的中途确定住所的图像中检测未登记数据候选。
另外,在图5所示的流程图的步骤S16的处理中,可以对住所数据库的住所信息进一步限定用于判定是否匹配到中途的条件。例如,可以在识别到住所信息所包含的姓名之前的层、仅未能识别出姓名的情况下,控制部35判断为匹配到中途。另外,在步骤S20中,由操作者输入信息,因此得到正确的信息。因此,在图5所示的流程图中,在步骤S16中为“是”的情况下,也可以不前进到步骤S17,而直接前进到步骤S19。
另外,在图5所示的流程图的步骤S20和步骤S21中,也可以对姓名以外的数据判断是否是存在于住所数据库19中的住所信息。这种情况下,可以使得从步骤S16前进到步骤S17的条件更窄。
另外,在上述实施例中对住所DB登记装置5与区分机主体3成套的情况进行了说明。但是,区分机主体3与住所DB登记装置5不一定需要成套,可以将住所DB登记装置5设置在离开区分机主体3的远处。即,住所DB登记装置5与区分机主体3的住所识别部18只要各自能够访问住所数据库19即可。例如,可以是住所DB登记装置5经由网络与区分机主体3(或住所数据库19)连接的结构。并且,可以是一个住所DB登记装置5与多个区分机主体3或多个住所数据库9连接的结构。
以上说明了特定的实施方式,但这些实施方式仅以例子的方式提出,而并不用于限制本发明的范围。实际上,这里所述的新颖的实施方式能够以各种其它形式具体实施,而且,在不脱离本发明的精神的情况下,可以对这里所说明的实施方式的形式进行各种省略、替换和改变。所附的权利要求及其等同方案意在覆盖落入本发明的范围和精神内的上述形式或变形。

Claims (14)

1.一种存储住所信息的住所数据库的更新装置,具有:
蓄积部,蓄积作为处理对象的图像中包含的全部住所信息中的、到中途为止的信息确定而其以外的信息未能确定的图像;
显示部,显示所述蓄积部中蓄积的图像;
未登记数据输入部,在所述显示部上显示了图像的状态下,输入没有登记在所述住所数据库中的住所信息的一部分信息;和
更新部,利用由所述未登记数据输入部输入的信息来更新所述住所数据库。
2.如权利要求1所述的住所数据库的更新装置,还具有:
住所识别部,对作为处理对象的包含住所信息的图像进行字符识别,通过所述字符识别的结果与所述住所数据库中登记的住所信息的匹配,识别所述图像中包含的住所信息,
其中,所述蓄积部蓄积由所述住所识别部识别出所述处理对象的图像中包含的住所信息中的一部分信息而未能识别出其余信息的图像,
所述未登记数据输入部输入所述蓄积部中蓄积的图像中包含的住所信息中的、未能由所述住所识别部识别出的部分的信息。
3.如权利要求1或2所述的住所数据库的更新装置,其中,
所述蓄积部将所述图像中包含的全部住所信息中的、到中途为止确定的信息作为确定信息与所述图像相对应地存储。
4.如权利要求2所述的住所数据库的更新装置,还具有:
住所输入部,输入由所述住所识别部进行的住所识别失败的图像中包含的住所信息;和
判定部,判定由所述住所输入部输入的住所信息中是否包含所述住所数据库中未登记的信息,
其中,所述蓄积部蓄积由所述判定部判定为所述住所数据库中未登记的信息包含在所述住所输入部输入的住所信息中的图像。
5.如权利要求4所述的住所数据库的更新装置,其中,
将由所述住所输入部输入的住所信息中的、登记在所述住所数据库中的部分的信息作为确定信息,与所述图像相对应地存储在所述蓄积部中。
6.如权利要求1~5中的任意一项所述的住所数据库的更新装置,其中,
所述更新部经由网络与所述住所数据库连接。
7.如权利要求3或5所述的住所数据库的更新装置,其中,
所述蓄积部还存储所述确定信息的累积次数。
8.如权利要求7所述的住所数据库的更新装置,其中,
所述蓄积部针对预定的每个期间存储所述确定信息的累积次数。
9.如权利要求7或8所述的住所数据库的更新装置,其中,
所述蓄积部还存储包括所述确定信息进而其它部分也识别成功的累积次数。
10.如权利要求7~9中的任意一项所述的住所数据库的更新装置,其中,
所述显示部显示如下图像:该图像对应于所述累积次数最大或超过规定阈值的确定信息。
11.如权利要求10所述的住所数据库的更新装置,其中,
所述显示部显示如下图像:该图像对应于所述确定信息的累积次数与包括所述确定信息进而其它部分也识别成功的累积次数之比最大或超过规定阈值的确定信息。
12.如权利要求11所述的住所数据库的更新装置,其中,
所述显示部显示如下图像:该图像对应于针对所述确定信息的累积次数或者所述确定信息的累积次数与包括所述确定信息进而其它部分也识别成功的累积次数之比、从前一期间的增加程度超过规定阈值的确定信息。
13.如权利要求7~12中的任意一项所述的住所数据库的更新装置,其中,
所述显示部同时显示多个确定信息相同的图像。
14.一种存储住所信息的住所数据库的更新方法,
在存储装置中保存作为处理对象的图像中包含的全部住所信息中的、到中途为止的信息确定而其以外的信息未能确定的图像;
在显示部上显示所述存储装置中保存的图像;
在所述显示部上显示了图像的状态下,输入没有登记在所述住所数据库中的住所信息的一部分信息;
利用所述输入的信息更新所述住所数据库。
CN2011100507934A 2010-03-17 2011-03-03 住所数据库的更新装置和住所数据库的更新方法 Pending CN102193963A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010-061539 2010-03-17
JP2010061539A JP5433470B2 (ja) 2010-03-17 2010-03-17 住所データベース構築装置および住所データベース構築方法

Publications (1)

Publication Number Publication Date
CN102193963A true CN102193963A (zh) 2011-09-21

Family

ID=43982029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100507934A Pending CN102193963A (zh) 2010-03-17 2011-03-03 住所数据库的更新装置和住所数据库的更新方法

Country Status (5)

Country Link
US (1) US20110231451A1 (zh)
EP (1) EP2367124A1 (zh)
JP (1) JP5433470B2 (zh)
KR (1) KR20110104880A (zh)
CN (1) CN102193963A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015176241A (ja) * 2014-03-13 2015-10-05 株式会社東芝 データベース管理装置、および住所認識装置
US9293029B2 (en) * 2014-05-22 2016-03-22 West Corporation System and method for monitoring, detecting and reporting emergency conditions using sensors belonging to multiple organizations
JP2016159245A (ja) * 2015-03-03 2016-09-05 株式会社東芝 配達物処理装置、および配達物処理プログラム
US11626010B2 (en) * 2019-02-28 2023-04-11 Nortek Security & Control Llc Dynamic partition of a security system
JP7408327B2 (ja) 2019-09-20 2024-01-05 株式会社東芝 住所データベース生成装置及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0759596A2 (en) * 1995-08-23 1997-02-26 Pitney Bowes Inc. Apparatus and method for generating address change notice
CN1360524A (zh) * 1999-07-05 2002-07-24 Ptt邮政资产公司 利用记录所得的地址记录更新地址数据库的设备和方法
US6539098B1 (en) * 1999-09-24 2003-03-25 Mailcode Inc. Mail processing systems and methods
CN101132866A (zh) * 2005-02-08 2008-02-27 索利斯蒂克有限公司 通过光学字符识别ocr处理邮件的方法
EP1912177A1 (en) * 2006-10-13 2008-04-16 Bowe Bell + Howell Company Physical delivery location validation for enhancing mailstream composition

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748807A (en) * 1992-10-09 1998-05-05 Panasonic Technologies, Inc. Method and means for enhancing optical character recognition of printed documents
US5754671A (en) * 1995-04-12 1998-05-19 Lockheed Martin Corporation Method for improving cursive address recognition in mail pieces using adaptive data base management
JPH0957204A (ja) * 1995-08-24 1997-03-04 Toshiba Corp 郵便物の宛先自動読取システム
US5974147A (en) * 1996-11-07 1999-10-26 Pitney Bowes Inc. Method of verifying unreadable indicia for an information-based indicia program
US5889897A (en) * 1997-04-08 1999-03-30 International Patent Holdings Ltd. Methodology for OCR error checking through text image regeneration
US6028970A (en) * 1997-10-14 2000-02-22 At&T Corp Method and apparatus for enhancing optical character recognition
JPH11316802A (ja) * 1998-04-30 1999-11-16 Canon Inc 単語認識装置及びその住所地名登録方法並びに記録媒体
JP2000279894A (ja) * 1999-03-30 2000-10-10 Nec Corp 住所認識装置及び方法
US6557000B1 (en) * 1999-11-30 2003-04-29 Pitney Bowes Inc. Method of updating an addressee database in a mail sorting apparatus
US6741724B1 (en) * 2000-03-24 2004-05-25 Siemens Dematic Postal Automation, L.P. Method and system for form processing
JP4737861B2 (ja) * 2001-04-17 2011-08-03 株式会社東芝 配達物処理装置
DE50303053D1 (de) * 2002-09-03 2006-05-24 Siemens Ag Verfahren und vorrichtung zum lesen der adressen von sendungen
US7415131B2 (en) * 2002-12-24 2008-08-19 Siemens Energy & Automation, Inc. Method and system for image processing
US7801925B2 (en) * 2004-12-22 2010-09-21 United States Postal Service System and method for electronically processing address information
JP4706379B2 (ja) * 2005-08-04 2011-06-22 日本電気株式会社 住所認識装置
US7539326B2 (en) * 2005-12-23 2009-05-26 Pitney Bowes Inc. Method for verifying an intended address by OCR percentage address matching
KR20090033386A (ko) * 2006-08-14 2009-04-02 가부시끼가이샤 도시바 용지류 처리 장치 및 용지류 처리 방법
KR100926565B1 (ko) 2007-12-13 2009-11-12 한국전자통신연구원 주소 데이터베이스 구축 장치 및 그 방법
FR2932300B1 (fr) * 2008-06-10 2011-06-03 Neopost Technologies Systeme d'affranchissement permettant le traitement d'articles de courrier ayant une adresse incorrecte

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0759596A2 (en) * 1995-08-23 1997-02-26 Pitney Bowes Inc. Apparatus and method for generating address change notice
CN1360524A (zh) * 1999-07-05 2002-07-24 Ptt邮政资产公司 利用记录所得的地址记录更新地址数据库的设备和方法
US6539098B1 (en) * 1999-09-24 2003-03-25 Mailcode Inc. Mail processing systems and methods
CN101132866A (zh) * 2005-02-08 2008-02-27 索利斯蒂克有限公司 通过光学字符识别ocr处理邮件的方法
EP1912177A1 (en) * 2006-10-13 2008-04-16 Bowe Bell + Howell Company Physical delivery location validation for enhancing mailstream composition

Also Published As

Publication number Publication date
JP2011197823A (ja) 2011-10-06
KR20110104880A (ko) 2011-09-23
EP2367124A1 (en) 2011-09-21
US20110231451A1 (en) 2011-09-22
JP5433470B2 (ja) 2014-03-05

Similar Documents

Publication Publication Date Title
US20050281450A1 (en) System and method for correcting data in financial documents
EP0584607A2 (en) Data processing system for merger of sorting information and redundancy information to provide contextual predictive keying for postal addresses
JP6151141B2 (ja) 仕分装置および仕分方法
CN102193963A (zh) 住所数据库的更新装置和住所数据库的更新方法
JPH11226513A (ja) 郵便物宛先読取装置及び郵便物区分装置
JP4977368B2 (ja) 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
EP3779783A1 (en) Image processing device, image processing method, and storage medium storing program
JP2020064564A (ja) 学習サーバ、学習システム、及び追加学習プログラム
US20190362485A1 (en) Method of sorting baggage at an airport with optimized video-encoding
JP4706379B2 (ja) 住所認識装置
US8672140B2 (en) Method of storing a plurality of articles with information being scrutinized
CN113033271A (zh) 利用人工智能模块学习脸部辨识的处理方法
JP2008033851A (ja) 郵便自動区分機及び郵便自動区分方法
EP2849132A1 (en) Sensor information management device and sensor information management method
US6947574B1 (en) Method and system for interleaving OCR and ABL for automated mail sorting
EP2253389B1 (en) Apparatus and method for postal matter
US20100310171A1 (en) Method and apparatus for analysis of a database
JP2020198054A (ja) プログラム、情報処理システム、情報処理装置及び情報処理方法
JP4160206B2 (ja) 文字認識装置を利用したデータベース登録方法
US20120243728A1 (en) Bulk Region of Interest Learning
JP4457725B2 (ja) 帳票仕分装置及びプログラム
JP5558065B2 (ja) 区分装置、区分情報の認識方法および区分情報の認識プログラム
JP2019109729A (ja) 区分装置および区分システム
JP5684365B2 (ja) 紙葉類処理装置および紙葉類処理方法
KR20120019706A (ko) 우편물 주소 인식 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110921