CN102189080A - 集中信息处理装置以及集中信息处理系统 - Google Patents

集中信息处理装置以及集中信息处理系统 Download PDF

Info

Publication number
CN102189080A
CN102189080A CN2011100500070A CN201110050007A CN102189080A CN 102189080 A CN102189080 A CN 102189080A CN 2011100500070 A CN2011100500070 A CN 2011100500070A CN 201110050007 A CN201110050007 A CN 201110050007A CN 102189080 A CN102189080 A CN 102189080A
Authority
CN
China
Prior art keywords
mentioned
information
letter sorting
parameter value
tabulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100500070A
Other languages
English (en)
Inventor
前田匡哉
入江文平
浜村伦行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN102189080A publication Critical patent/CN102189080A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Electromagnetism (AREA)
  • General Health & Medical Sciences (AREA)
  • Toxicology (AREA)
  • Artificial Intelligence (AREA)
  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供一种集中信息处理装置以及集中信息处理系统。根据一个实施方式,集中信息处理装置包括:信息取得单元,取得由读取单元读取记载在纸张类的分拣信息而生成的图像数据、从由该图像数据进行了字符识别的结果的分数高的上位开始的多个位次的分拣地址和其分数的信息、对不能识别的图像数据教导后的分拣信息;识别率处理单元,根据各信息,提示针对每个分拣地址与识别率有关联的信息;变更参数值取得单元,取得新参数值;模拟执行单元,使用变更后的参数值,执行针对图像数据的字符识别处理的模拟;差分列表提示单元,生成差分列表并提示,并促使用户输入是否接受该模拟的结果;参数变更单元,从用户得到输入时,将参数值变更为新的参数值。

Description

集中信息处理装置以及集中信息处理系统
相关申请的交叉引用
本申请基于2010年3月17日提交的在先的日本专利申请No.2010-061538并要求其为优先权,其全部内容通过引用结合在本申请中。
技术领域
实施方式所述涉及即使不是熟练的使用者,也能够容易提高记载在由纸张类处理系统处理的纸张类上的字符的识别率的集中信息处理装置以及集中信息处理系统。
背景技术
在当前被使用的纸张类处理系统中,有利用光学式字符读取装置(OCR)读取记载在例如纸张类(明信片或书信等的邮件)上的住所、收件人姓名、邮政编码等的地址信息(分拣信息),进行纸张类分拣的系统。
将该光学地读取的字符图案自动地变换为对应的字符代码的读取是通过参照规定词典的图案匹配等的图像处理来进行的。
为了提高读取的性能,作为更新在识别中使用的权重参数来提高识别率的技术已知有许多种方法。
其中一种方法是,调整在从候补字符群中读出相应的收件人姓名时使用的知识数据库(词典类)内的参数。另外一种方法是,通过更新参数,根据时间序列的统计数据对特定住所的读取进行强化。
发明内容
实施方式提供一种集中信息处理装置,该集中信息处理装置包括:信息取得单元,取得:由读取单元读取记载在纸张类上的分拣信息而生成的图像数据、从由该图像数据进行了字符识别的结果的分数高的上位开始的多个位次的分拣地址和其分数的信息、以及针对不能识别的图像数据进行教导后的分拣信息;识别率处理单元,根据规定期间内的各个上述信息,提示针对每个分拣地址的与识别率有关联的信息;变更参数值取得单元,取得新的参数值,该新的参数值是通过变更构成上述分数的参数值而得到的;模拟执行单元,使用上述变更后的参数值,执行针对上述图像数据的字符识别处理的模拟;差分列表提示单元,生成差分列表并进行提示,并且促使用户进行是否接受该模拟的结果的输入,所述差分列表是表示在该模拟的结果中得到的新的分拣信息和原分拣信息不同的内容的列表;以及参数变更单元,在从用户得到接受模拟的结果的意思的输入时,将上述参数值变更为上述新的参数值。
实施方式提供一种集中信息处理系统,具有纸张类分拣机、视频编码系统和集中信息处理装置,上述集中信息处理装置具备:信息取得单元,从上述纸张类分拣机和视频编码系统取得:由上述纸张类分拣机的读取单元读取记载在纸张类上的分拣信息而生成的图像数据、从由该图像数据根据上述纸张类分拣机的读取单元的读取结果进行了字符识别的结果的分数高的上位开始的多个位次的分拣地址和其分数的信息、以及对于不能识别的图像数据利用视频编码系统进行教导后的分拣信息;识别率处理单元,根据规定期间内的各个上述信息,提示针对每个分拣地址的与识别率有关联的信息;变更参数值取得单元,取得新的参数值,该新的参数值是通过变更了构成上述分数的参数值而得到的;模拟执行单元,使用上述变更后的参数值,执行针对上述图像数据的字符识别处理的模拟;差分列表提示单元,生成差分列表并进行提示,并且促使用户进行是否接受该模拟的结果的输入,所述差分列表是表示在该模拟的结果中得到的新的分拣信息和原分拣信息不同的内容的列表;参数变更单元,在从用户得到接受模拟的结果的意思的输入时,将上述参数值变更为上述新的参数值;以及参数值输出单元,将上述新的参数值输出到上述纸张类分拣机。
附图说明
图1是表示实施方式的一种典型的集中信息处理系统的概略构成的框图。
图2A是表示实施方式的一种典型的集中信息处理装置的概略动作顺序的流程图。
图2B是表示实施方式的一种典型的集中信息处理装置的概略动作顺序的流程图。
图3是表示实施方式的一种典型的按地址识别的结果的图。
图4是示例实施方式的一种典型的按地址的权重参数文件的内容的图。
图5是表示实施方式的一种典型的权重参数变更设定画面的图。
图6是用于说明实施方式的一种典型的模拟过程的图。
图7是表示实施方式的一种典型的差分信息显示画面的图。
图8A是表示实施方式的一种典型的按地址的识别变化显示以及按地址的误读变化显示的图。
图8B是表示实施方式的一种典型的按地址的识别变化显示以及按地址的误读变化显示的图。
具体实施方式
一般地,关于一种实施方式,集中信息处理装置包括:信息取得单元,取得:由读取单元读取记载在纸张类上的分拣信息而生成的图像数据、从由该图像数据进行了字符识别的结果的分数高的上位开始的多个位次的分拣地址和其分数的信息、以及针对不能识别的图像数据进行教导后的分拣信息;识别率处理单元,根据规定期间内的各个上述信息,提示针对每个分拣地址的与识别率有关联的信息;变更参数值取得单元,取得新的参数值,该新的参数值是通过变更构成上述分数的参数值而得到的;模拟执行单元,使用上述变更后的参数值,执行针对上述图像数据的字符识别处理的模拟;差分列表提示单元,生成差分列表并进行提示,并且促使用户进行是否接受该模拟的结果的输入,所述差分列表是表示在该模拟的结果中得到的新的分拣信息和原分拣信息不同的内容的列表;以及参数变更单元,在从用户得到接受模拟的结果的意思的输入时,将上述参数值变更为上述新的参数值。
以下,参照各图说明本实施方式的集中处理系统。而且,在以下的说明中,虽然公开了将纸张类设为邮件,将分拣信息设为地址信息,将分拣地址设为地址的方式,但本申请发明并不限于该实施例。
图1是表示实施方式的一种典型的集中信息处理系统的概略构成的框图。在集中信息处理系统中包含集中信息处理装置1、输入输出装置2、通信路径3及邮件处理系统4。而且,邮件处理系统4具备邮件分拣机5以及视频编码系统(VCS)6。
集中信息处理装置1从邮件分拣机5以及视频编码系统6中经由通信路径3,取得邮件的处理信息,根据该处理信息帮助用户进行参数的调整。输入输出装置2对集中信息处理装置1输入用户的指示,显示来自集中信息处理装置1的输出内容。
邮件分拣机5用光学式字符读取装置(OCR)的识别部读取记载在明信片和书信等邮件上的收件人姓名或者邮政编码,利用与该读取的收件人姓名或者邮政编码对应的分拣信息,将邮件按照每个邮政编码或者每个配送区域进行分拣处理。
对于邮件分拣机5未能读取收件人姓名或者邮政编码的邮件、即对收件人姓名识别失败的邮件,在分拣处理中被剔除。被剔除的邮件的全部图像从邮件分拣机5送到视频编码系统6。视频编码系统6按照被剔除的顺序将全部图像显示在视频编码系统6的显示部上(未图示)。
操作者一边看着显示在视频编码系统6的显示部上的剔除邮件的收件人姓名图像(用OCR读取的原图像),一边全部手工输入未能用邮件分拣机5读取的收件人姓名或者邮政编码(编码处理)。邮件分拣机5利用与操作者输入的收件人姓名或者邮政编码对应的分拣信息,对邮件进行机械分拣处理。
集中信息处理装置1具备:输入输出接口10;发送接收处理部11;识别率处理部12;权重参数处理部13;差分信息处理部14;总计处理部15以及信息处理数据库16。
输入输出接口10是用于在与输入输出装置2、邮件处理系统4之间进行信息收发的接口。发送接收处理部11从邮件处理系统4中接收信息并蓄积,此外向邮件处理系统4发送在集中信息处理装置1中的处理结果。识别率处理部12取得在邮件处理系统4中的识别处理结果的数据,计算出识别率等统计数据。权重参数处理部13对变更了权重参数时的识别处理进行模拟。差分信息处理部14抽出伴随权重参数变更的识别结果的变化内容(差分)。总计处理部15对权重参数的变更结果进行总计并编辑。信息处理数据库16存储与上述各部的动作相关联的数据。
而且,图1所示的系统构成是假定以下说明的各处理在集中信息处理装置1中动作时的构成。因而,可以把集中信息处理装置1的功能搭载在邮件分拣机5或者视频编码系统6上,或者还可以分散地搭载这些功能。在本实施方式中,根据图1的构成进行说明。
图2A、图2B是表示实施方式的一种典型的集中信息处理装置的概略动作顺序的流程图。
在步骤S01、S02中,集中信息处理装置1从邮件分拣机5以及VCS6中接收各种数据。
作为从邮件分拣机5发送的数据,有用OCR读取各邮件得到的图像数据、用于确定各邮件的ID、对各图像数据的每个从分数高的上位开始到多个位次为止的识别结果等。另一方面,作为从VCS6发送的数据,有用于确定各邮件的ID、操作者通过手工输入教导(编码处理)后的住所结果等。在此,ID是对图像数据固有地分配的识别信息。图像数据只要是输入即使不是用OCR读取的全体数据而是仅抽出了住所区域部分的数据等的、操作者看到它而能够判断出正确住所的信息即可。此外,图像也可以压缩。
来自邮件分拣机5以及VCS6的数据发送时刻不必须是同时。从它们中分别发送的数据通过用于确定各邮件的ID而对应起来。其中,也可以在邮件分拣机5或者VSC6中暂时存储数据,然后成批接收全部的数据。
在步骤S03中,集中信息处理装置1的发送接收处理部11将发送的各数据整理为按照每个ID的数据,在一定期间蓄积在信息处理数据库。而且,关于蓄积期间,就蓄积容量以及对地址分散的强健性的观点考虑,例如可以任意决定为1周或1个月等。此外,对于贺新年、年终等季节性的邮件,也可以决定期间区别地进行蓄积。进而,在存在多个作为发送接收对象的邮件处理系统时,也可以针对该对象的每一个进行蓄积。
接着,对该所蓄积的数据开始信息处理。在步骤04中,识别率处理部12计算对邮件的每个地址的识别率。图3是表示按地址识别的结果的图。在此,“分拣数”是邮件分拣机5识别了地址的件数。“VSC数”是邮件分拣机5不能识别地址而剔除,通过在VCS6中的编码处理而分配给该地址的件数。如果采用该结果,则地址是“青森”的识别率是1500/1530=98%,地址是“岩手”的识别率是1000/1080=92.6%。而后,识别率处理部12将图3所示的识别结果以及算出的识别率显示在输入输出装置2上。
而且,在图3中虽然将地址以县为单位进行区别,但也可以使用住所楼层的某处。关于集中分拣的单位,操作者可以任意地指定。例如,既可以指定住所楼层中的任意一层,也可以指定任意多层,还可以只将处理局附近住所按照细分的地址单位进行指定而将远离的住所用上位住所楼层中集中进行指定等混合地指定。此外,并不限于地址,也可以是以邮政编码为单位,还可以是以姓氏为单位。
在步骤S05中,操作者根据显示的结果,判断是否需要进行按地址的权重参数的修正。在本实施方式的字符识别中将多个成为候补的字符分别评分(分数),根据其分数决定识别结果的字符。为了提高读取的性能,在邮件处理系统中,例如,设置对各个住所的识别分数等附加权重进行补正的结构(参数)。按地址的权重参数是关于地址的参数。根据图3的结果,在“岩手”是地址的情况下因为转送到VCS6的比率高(识别率低),所以进行想将“岩手”的按地址的权重参数作为调整对象进行分选等的判断。
而且,对操作者提示的显示内容只要是能够帮助缩小调整对象的作业,则不限于图3的内容,可以算出识别率自身并用折线图表示,还可以按照识别率顺序进行分类。此外,操作者不仅根据这种统计信息进行判断,也可以根据在感觉上想限制对特定的地址的误读等理由来缩小修正候补。进而,也可以不根据操作者的判断,自动地采用识别率低的至少一个候补。
当在步骤S05中为“是”的情况下,即当判断为需要进行按地址的权重参数的修正的情况下,执行下面的步骤处理。当不是的情况下(步骤S05中是“否”的情况下),因为不需要调整处理所以结束该处理。此时,各参数不被变更而维持原来的值。而且,当自动地抽出需要修正的参数的情况下,也可以选择识别率在阈值以下的参数。
接着,在步骤S06中,权重参数处理部13变更按地址的权重参数,实施字符识别模拟。图4是例示按地址的权重参数文件的内容的图。该按地址的权重参数是在计算总分数时使用的各要素数据内的一个。如上所述,以县为单位来区别地址,但也可以使用住所楼层的某处,也可以不限于地址而是以邮政编码为单位,还可以是以姓氏为单位。因而,在集中信息处理装置1的信息处理数据库16中,保存这些参数。而且,这些参数并不只是一种,例如也可以对于上述贺新年、年终等季节性的邮件使用其他的参数。
根据使用变更了该权重参数的新的权重参数的字符识别模拟结果,对按地址的分数进行最终的补正。在本实施方式中以在各地址的识别分数上加上权重参数作为最终识别结果的单纯加法方式为基础进行说明。
如上所述,因为地址是“岩手”时的当前状况的识别率低,所以在调整按岩手地址的权重参数时,从现行值(例如80)将权重参数变更为更大的数值(例如90)。该变更按以下那样的顺序执行。
权重参数处理部13将图5所示的权重参数变更设定画面25显示在输入输出装置2上。在该权重参数变更设定画面25上设有修正对象输入栏26、现行权重显示栏27、新设定权重输入栏28以及SIM执行按钮29。
操作者在修正对象输入栏26中输入要修正的地址。于是,权重参数处理部13检索按地址的权重参数文件,将被输入的地址中所设定的权重参数值显示在现行权重显示栏27上。此外,权重参数处理部13还将按地址的权重参数文件的内容(图4)也一并进行显示。
操作者参照所显示的按地址的权重参数文件的内容,和其他的地址的参数值进行比较,将新的权重参数值输入到新设定权重输入栏28。然后,当操作者按下SIM执行按钮29,则权重参数处理部13使用新的权重参数值执行模拟。
而且,图5所示的权重参数变更设定画面25也可以构成为对多个地址能够一次变更权重参数。
图6是用于说明实施方式的一种典型的模拟过程的图。上图显示由邮件分拣机5进行的字符识别处理结果,下图表示使用了变更后参数的模拟结果。
由邮件分拣机5进行的字符识别处理结果是在步骤S01中说明的从邮件分拣机5发送的数据,作为从每个ID的分数高的上位开始到多个位次的地址识别结果而被取得。在图6所示的例子中,某一邮件的由邮件分拣机5识别的识别结果是如“第1位:青森115分”,“第2位:秋田113分”,“第3位:岩手112分”,“最终识别输出:青森”那样。即,在该ID的图像中,因为将地址识别为“青森”、“秋田”、“岩手”时的分数分别是“115分”、“113分”、“112分”,所以表示将最高分数的“青森”作为识别结果来采用。
与此相对,在上述调整中将“岩手”的权重参数值加上10。当权重参数的补正是单纯加法方式的情况下,模拟结果为:“第1位:岩手122(=112+10)分”,“第2位:青森115分”,“第3位:秋田113分”,输出为:“最终识别输出:岩手”。
如在该例子中所示的单纯加法方式那样,当变更只对分数进行补正处理即可的参数的情况下,在模拟中识别处理本身并不是必需的,只需要从各位次的结果中选定最终识别结果的处理。而且,在选定最终识别结果的处理中,在第1位的识别分数大于等于100、以及与第2位的分数差大于等于2等的条件下,选定“岩手”作为最终识别结果。但是,该选定处理可以执行和在邮件分拣机5中进行的选定处理相同的算法。
而且,在本实施方式中,是将权重参数的值+10,但如果该权重变更量大也有可能带来字符识别的精度降低。因而,也可以设置将权重参数的变更量设置为原值的例如±20%以内等的限制。
在步骤S07中,差分信息处理部14比较原OCR结果和参数修正后的结果,只列表出识别结果不同的部分(差分)。
而后,对从邮件分拣机5接收到的全部的结果数据重复执行针对上述1张图像的差分输出处理,列表出因参数变更而最终结果不同的图像。另外,差分信息处理部14在发生差分的情况下,存储或者记录对象图像和伴随它的ID。
接着,在步骤S08中,差分信息处理部14将所发生的差分内容的列表以附带图像的方式显示在输入输出装置2上。图7是表示实施方式的一种典型的差分信息显示画面的图。在差分信息显示画面30上设有显示差分图像、判定结果等的列表的差分列表显示部31;总计按钮32;识别数显示栏33;误读数显示栏34;OK按钮35以及NG按钮36。
对差分列表显示部31的显示内容进行说明。
在写成“SIM差分图像”的部分的列上显示在步骤S07的处理中存储或者记录的图像。在写成“原结果”的部分的列上,显示邮件分拣机5处理过的最终结果输出、即表示与图6的上段的“最终识别输出”同样的内容的信息。不能确定地址的结果显示为“REJ”,但如果知道不能识别的信息,则可以不特意使用该字符串“REJ”,此外也可以通过对单元着色加以区分。在写成“新结果”的部分的列上显示变更了权重参数时的最终结果输出、即表示与图6的下段的“最终识别输出”相同内容的信息。该列的显示也和在“原结果”中显示的一样,不能确定地址的结果显示为“REJ”。
在写成“正确答案”的部分的列上显示成为该邮件的正确答案的地址。该部分是操作者从输入输出装置2手工输入的信息。即,操作者参照显示在“SIM差分图像”上的图像,读取地址并输入。此时,差分信息处理部14也可以自动采用从VCS6发送的编码处理结果。由此,由操作者进行的教导作业被高效化。已经在VCS6中通过人的手一边看图像一边输入正确答案的地址,通过对与显示在差分图像列表上的图像ID一致的ID的编码处理结果进行自动分选,能够在“正确答案”中反映出。对于已经在“正确答案”中被反映的栏(单元),可以对该单元附加颜色而易于判明、或者设为不能输入字符串,或者不进行显示。
在从步骤S09到步骤S10中,记载着自动反映VCS6的结果的处理顺序。
当在差分列表显示部31中有通过VCS6教导了正确答案的图像的情况下(步骤S09的“是”),在步骤S10中,差分信息处理部14自动地在相应的图像的正确答案显示部分上反映VCS结果。
另一方面,通过VCS6输入回答的邮件仅仅是在邮件分拣机5中不能确定地址的部分。因而,当在邮件分拣机5中进行了识别但它有错误的情况下,即发生了误读的情况下,将同样参照显示在“SIM差分图像”上的图像,操作者输入正确答案。
从步骤S11至步骤S12记载由操作者进行的正确答案输入的处理顺序。
当存在在差分列表显示部31的正确答案栏中没有输入信息的情形的情况下(步骤S11中为“否”),在步骤S12中,操作者一边看图像一边手工输入正确答案。差分信息处理部14作为该手工输入的GUI帮助操作。
在“正确答案”栏中用虚线圆括起来的收件人姓名是操作者一边看图像一边输入的内容。
接着,差分信息处理部14比较“正确答案”栏的内容和“原结果”和“新结果”,显示最终结果怎样变化。在位于“判定”的箭头根部的部分是进行“原结果”和“正确答案”的比较的内容,在位于箭头头部的部分是进行“新结果”和“正确答案”的比较的内容。
作为位于箭头根部的部分的判定方法可以是,当“原结果”或者“新结果”为“REJ”的情况下,判定为“REJ”,“原结果”以及“新结果”是“REJ”以外的字符串,当“原结果”和“正确答案”不同的情况下为“误读”,在一致的情况下为“正确答案”。
而且,在差分信息显示画面30上设置未图示的操作按钮,对于差分列表显示部31的显示,可以实现在指定字符串中的抽出功能、按照指定顺序的分类功能等。由此,因为能够谋求对差分信息显示画面30的作业的高效化,所以值得推荐。
此外,在差分信息显示画面30上设有未图示的操作按钮,可以通过操作者的操作,抽出“判定”内容是特定的内容、例如表示为“A→B”的内容并进行编辑显示。
对差分图像列表全部的单元能够输入正确答案,在每一张的判定内容全部被输出时,操作者按下总计按钮32。在步骤S13中,总计处理部15将差分列表的全部的新旧结果和正确答案进行比较,总计并显示识别结果是怎么变化的。总计处理部15在识别数显示栏33中显示在参数变更前后的正确答案的增减数,在误读数显示栏34中显示在参数变更前后的误读的增减数。如果应用上有效,则可以从这些值中求识别率和误读率,用求得的识别率和误读率来显示。
此外,因为如果误读特定地址的信件,则将发生配送延迟或浪费成本,所以有时需要进行想调整成极力避免这种现象等的判断。因而,也可以一并进行按地址的识别变化显示、按地址的误读变化显示等。图8A、图8B是表示实施方式的一种典型的按地址的识别变化显示以及按地址的误读变化显示的图。
图8A表示识别成功数和识别成功率的按地址的变化显示,图8B表示误读数和误读率的按地址的变化显示。此外,条形图部分表示每个地址的识别数或者误读数的变化,折线图部分表示每个地址的识别率或者误读率的变化。
在图8A、图8B中是按写在邮件上的地址进行显示,但是通过活用也可以按误读的SIM识别最终结果输出来划分。例如,有时当对误读为远处的住所而感到困难的情况下,这一划分法是有效的。此外,如果选择误读地址项目是“岩手”等,则当附加了显示误读了给“岩手”的信件的图像群等的功能,则还可以进一步分析误读主要原因等。
在到此之前的总计以及显示作业中,如果模拟结果作为整体满意,则当操作者进行了判断的情况下(步骤S14中“是”),操作者按下OK按钮35。在步骤S15中,总计处理部15采纳变更后的结果,作为正式的地址权重参数进行登记。当变更后的结果不满意的情况下(在步骤S14中是“否”),再次从判断是否需要修正按地址的权重参数的顺序(步骤S05)开始重复执行。
此外,在步骤S15中,当更新了最终被登记的参数的情况下,发送接收处理部11向邮件分拣机5配送变更后的参数。配送该参数后,邮件分拣机5根据更新后的参数来运转。
而且,对于变更后参数的配送,当将集中信息处理装置1设置在远离邮件处理系统的地方的情况下,还可以在遥控状态下配送,可以是任何通信方式。此外,既可以通过按时间段划分最初从分拣机向集中信息处理系统配送的数据,从而能够根据贺新年时期用和一般时期用而制成分别的按地址的权重参数,并在各个时间段进行运转,也可以通过将同一配送数据的收集时间分成白天和夜晚来蓄积,从而制成在各个处理局的应用中适用的按地址的权重参数。
而且,在本实施方式中,是用独立的集中信息处理装置1执行处理,但如果是能够蓄积邮件分拣机5和VCS6保有的数据的环境,则即使不设置独立的集中信息处理装置1也可以。例如,集中信息处理装置1的模拟作业部分可以通过从邮件处理系统4的操作板进行的操作来实施,即使作为邮件处理系统4的离线作业实施参数变更也没问题。此外,本实施例的参数变更作业结束后,因为蓄积的数据局部已完成教导回答,所以可以再利用,也可以为了用最新的邮件数等进行总计而废弃。
而且,在上述的实施方式中,集中信息处理装置1和一个邮件处理系统进行信息收发,但也可以经由通信线路而与设置在多个邮件处理局中的多个邮件处理系统远程进行信息收发。
此外,此时,有时邮件的收集和递送时刻会因地域而不同。因而,也可以根据集中信息处理装置1收集数据的时刻(时间段),在不同的文件中保存参数的值,并且分别管理该参数的值。
此外,在上述的实施方式中,是集中信息处理装置1和邮件处理系统通过通信路径在线进行信息收发,但也可以通过记录介质离线进行信息收发。
[效果]
如果采用以上说明的实施方式,则能够起到各种效果。
(1)能够一边利用纸张类分拣机以及视频编码系统的识别结果、教导结果,一边不进行识别处理自身而是确认变更后的影响的同时变更与识别结果有关的参数,提高识别精度。
(2)在参数变更的影响确认时,通过只显示结果的差分产生的图像和与之有关的信息,即使不确认在调整确认时不需要的图像也可以,所以还具备作业时间缩短的效果。进而,因为可以一边看差分图像一边进行调整,所以还具有调整成避免向外国等远方的误读等对使用者的应用能够细致定做的效果。
(3)由于还可以在遥控下进行调整,因而即使操作者不能偕同在现场,也可以远程定制各个纸张类分拣机。
(4)因为还能够取得在纸张类分拣机一侧能够识别的数据,所以对于在纸张类分拣机一侧误读的对象也能够确认通过调整产生的消减效果,还可以实现消减实际的误读。
而且,在上述各实施方式中说明的功能并不固定于使用硬件构成,还可以使用软件让计算机读入记载有各功能的程序来实现。此外,各功能也可以选择适宜的软件、硬件中的某一个来构成。
而且,本发明并不限于上述实施方式自身,在实施阶段在不脱离其主旨的范围中可以对构成要素进行变形并具体化。
虽然已经描述了某些实施例,但是这些实施例只是以示例的方式呈现,并不意图限制在本发明的范围,实际上,这里描述的新颖的方法和系统可以以各种其他形式实施;此外,可以在偏离本发明的精神的情况下,进行这里描述的方法和系统的形式方面的各种省略、替换和改变。所附的权利要求及其等同物旨在覆盖这些形式和改变,只要这些形式或改变落在本发明的范围和精神之内。

Claims (8)

1.一种集中信息处理装置,包括:
信息取得单元,取得:由读取单元读取记载在纸张类上的分拣信息而生成的图像数据、从由该图像数据进行了字符识别的结果的分数高的上位开始的多个位次的分拣地址和其分数的信息、以及针对不能识别的图像数据进行教导后的分拣信息;
识别率处理单元,根据规定期间内的各个上述信息,提示针对每个分拣地址的与识别率有关联的信息;
变更参数值取得单元,取得新的参数值,该新的参数值是通过变更构成上述分数的参数值而得到的;
模拟执行单元,使用上述变更后的参数值,执行针对上述图像数据的字符识别处理的模拟;
差分列表提示单元,生成差分列表并进行提示,并且促使用户进行是否接受该模拟的结果的输入,所述差分列表是表示在该模拟的结果中得到的新的分拣信息和原分拣信息不同的内容的列表;以及
参数变更单元,在从用户得到接受模拟的结果的意思的输入时,将上述参数值变更为上述新的参数值。
2.根据权利要求1所述的集中信息处理装置,
在上述与识别率有关联的信息中,针对每个分拣地址包含能够从上述图像数据识别的件数、因不能识别而被教导的件数。
3.根据权利要求1所述的集中信息处理装置,
在上述差分列表中包含上述图像数据、以及根据包含在该差分列表中的图像数据由用户教导后的分拣信息。
4.根据权利要求3所述的集中信息处理装置,
在上述差分列表中进一步包含由上述信息取得单元取得的原分拣信息,
该集中信息处理装置进一步具备误读判断单元,在上述差分列表的上述原分拣信息和用户教导后的上述分拣信息不同时,判断为上述原分拣信息是误读信息。
5.一种集中信息处理系统,具有纸张类分拣机、视频编码系统和集中信息处理装置,
上述集中信息处理装置具备:
信息取得单元,从上述纸张类分拣机和视频编码系统取得:由上述纸张类分拣机的读取单元读取记载在纸张类上的分拣信息而生成的图像数据、从由该图像数据根据上述纸张类分拣机的读取单元的读取结果进行了字符识别的结果的分数高的上位开始的多个位次的分拣地址和其分数的信息、以及对于不能识别的图像数据利用视频编码系统进行教导后的分拣信息;
识别率处理单元,根据规定期间内的各个上述信息,提示针对每个分拣地址的与识别率有关联的信息;
变更参数值取得单元,取得新的参数值,该新的参数值是通过变更了构成上述分数的参数值而得到的;
模拟执行单元,使用上述变更后的参数值,执行针对上述图像数据的字符识别处理的模拟;
差分列表提示单元,生成差分列表并进行提示,并且促使用户进行是否接受该模拟的结果的输入,所述差分列表是表示在该模拟的结果中得到的新的分拣信息和原分拣信息不同的内容的列表;
参数变更单元,在从用户得到接受模拟的结果的意思的输入时,将上述参数值变更为上述新的参数值;以及
参数值输出单元,将上述新的参数值输出到上述纸张类分拣机。
6.根据权利要求5所述的集中信息处理系统,
在上述差分列表中包含上述图像数据、以及根据包含在该差分列表中的图像数据由用户教导后的分拣信息。
7.根据权利要求6所述的集中信息处理系统,
在上述差分列表中进一步包含由上述信息取得单元取得的原分拣信息,
该集中信息处理系统进一步具备误读判断单元,在上述差分列表的上述原分拣信息和用户教导后的上述分拣信息不同时,判断为上述原分拣信息是上述纸张类分拣机的误读信息。
8.根据权利要求5所述的集中信息处理系统,
具备多个纸张类处理系统,该纸张类处理系统具有上述纸张类分拣机和上述视频编码系统,上述集中信息处理装置和各个纸张类处理系统进行上述信息以及数据的收发。
CN2011100500070A 2010-03-17 2011-03-02 集中信息处理装置以及集中信息处理系统 Pending CN102189080A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010-061538 2010-03-17
JP2010061538A JP5390440B2 (ja) 2010-03-17 2010-03-17 集中情報処理装置及び集中情報処理システム

Publications (1)

Publication Number Publication Date
CN102189080A true CN102189080A (zh) 2011-09-21

Family

ID=44212145

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100500070A Pending CN102189080A (zh) 2010-03-17 2011-03-02 集中信息处理装置以及集中信息处理系统

Country Status (5)

Country Link
US (1) US20110229018A1 (zh)
EP (1) EP2367141A2 (zh)
JP (1) JP5390440B2 (zh)
KR (1) KR101136169B1 (zh)
CN (1) CN102189080A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651278A (zh) * 2017-01-10 2017-05-10 上海万琛电子商务有限公司 一种基于物流分拣系统的数据处理方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5958090B2 (ja) * 2012-05-30 2016-07-27 沖電気工業株式会社 紙葉類処理装置及びプログラム
JP6242722B2 (ja) * 2014-03-13 2017-12-06 株式会社東芝 文字認識装置、区分機、およびプログラム
EP3258420A1 (en) 2016-06-16 2017-12-20 Kabushiki Kaisha Toshiba Delivery handling apparatus, delivery handling method, and delivery handling program
JP6914110B2 (ja) * 2016-06-16 2021-08-04 株式会社東芝 配達物処理装置、配達物処理方法、及び配達物処理プログラム
JP6783671B2 (ja) * 2017-01-13 2020-11-11 株式会社東芝 区分システム、認識支援装置、認識支援方法、および認識支援プログラム
US10929799B2 (en) * 2017-06-29 2021-02-23 Amazon Technologies, Inc. Identification of inaccurate addresses for package deliveries
CN111242554B (zh) * 2020-01-17 2023-10-17 秒针信息技术有限公司 拣货方式类型确定方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0957204A (ja) * 1995-08-24 1997-03-04 Toshiba Corp 郵便物の宛先自動読取システム
JPH11203411A (ja) * 1998-01-20 1999-07-30 Fuji Xerox Co Ltd 文書読み取り装置
JP2005288345A (ja) * 2004-03-31 2005-10-20 Toshiba Corp 紙葉類読取区分機
CN101132866A (zh) * 2005-02-08 2008-02-27 索利斯蒂克有限公司 通过光学字符识别ocr处理邮件的方法
US20090157733A1 (en) * 2007-12-13 2009-06-18 Electronics And Telecommunications Research Institute Apparatus for building address database and method thereof

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2991779B2 (ja) * 1990-06-11 1999-12-20 株式会社リコー 文字認識方法及び装置
JPH0528320A (ja) * 1991-07-19 1993-02-05 Nec Corp 紙葉類区分装置
JPH06111077A (ja) * 1992-09-28 1994-04-22 Matsushita Electric Ind Co Ltd 文書認識装置の評価装置
JP3232991B2 (ja) * 1995-12-13 2001-11-26 株式会社日立製作所 文字読取り方法及び住所読取り方法
KR970066985A (ko) * 1996-03-07 1997-10-13 김광호 화상신호 처리방법 및 그 장치
JP4574814B2 (ja) 2000-08-10 2010-11-04 株式会社東芝 情報処理装置、情報処理方法、紙葉類処理装置、および紙葉類処理方法
JP2002269494A (ja) 2001-03-07 2002-09-20 Toshiba Corp 紙葉類処理装置及び紙葉類処理方法
JP4733859B2 (ja) * 2001-06-07 2011-07-27 株式会社東芝 所在情報認識装置および区分装置
JP2004105921A (ja) * 2002-09-20 2004-04-08 Hitachi Ltd 紙葉類処理装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0957204A (ja) * 1995-08-24 1997-03-04 Toshiba Corp 郵便物の宛先自動読取システム
JPH11203411A (ja) * 1998-01-20 1999-07-30 Fuji Xerox Co Ltd 文書読み取り装置
JP2005288345A (ja) * 2004-03-31 2005-10-20 Toshiba Corp 紙葉類読取区分機
CN101132866A (zh) * 2005-02-08 2008-02-27 索利斯蒂克有限公司 通过光学字符识别ocr处理邮件的方法
US20090157733A1 (en) * 2007-12-13 2009-06-18 Electronics And Telecommunications Research Institute Apparatus for building address database and method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651278A (zh) * 2017-01-10 2017-05-10 上海万琛电子商务有限公司 一种基于物流分拣系统的数据处理方法

Also Published As

Publication number Publication date
JP2011194287A (ja) 2011-10-06
EP2367141A2 (en) 2011-09-21
US20110229018A1 (en) 2011-09-22
KR20110104876A (ko) 2011-09-23
KR101136169B1 (ko) 2012-04-17
JP5390440B2 (ja) 2014-01-15

Similar Documents

Publication Publication Date Title
CN102189080A (zh) 集中信息处理装置以及集中信息处理系统
AU714301B2 (en) Method for sorting items of mail in order of delivery
US20070272601A1 (en) Method and System for Sorting Incoming Mail
US9321083B2 (en) Method of sorting mailpieces using a sorting frame, with a virtual stack of mailpiece images being displayed
US20080154425A1 (en) Systems and methods for stamping packaged goods in the nature of cigarettes
CN112163600B (zh) 一种基于机器视觉的商品识别方法
WO2001014992A1 (en) Document classification apparatus
JP6783671B2 (ja) 区分システム、認識支援装置、認識支援方法、および認識支援プログラム
DE60222319T2 (de) Verfahren und Vorrichtung zur Verarbeitung von finanziellen Dokumenten
CN104826802A (zh) 分拣装置以及分拣设定信息的生成方法
KR20100126180A (ko) 지엽류 처리 장치 및 지엽류 처리 방법
CN113111821A (zh) 一种自动售货机货道控制方法及装置
US20140222192A1 (en) Method of merging non-machine-sortable postal articles with machine-sorted mail pieces
US8738659B1 (en) Method and apparatus for managing priority in standardized test and survey imaging
JPH0962758A (ja) 帳票認識処理システム
CN113360626B (zh) 一种智能客服机器人的多场景混合问答推荐方法
US20240185664A1 (en) Paper sheet processing system, paper sheet processing method, and program
JP2002056344A (ja) 情報処理装置、情報処理方法、紙葉類区分装置、および紙葉類区分方法
CA2547271C (en) Method and system for sorting mail
KR100828767B1 (ko) 지엽류 구분 장치, 지엽류 처리 시스템 및 지엽류 구분방법
JP2005288321A (ja) 区分装置、情報入力装置、及び区分システム
US8135495B2 (en) Systems and methods for processing packaged goods in the nature of cigarettes
CN109800014A (zh) 目标发布材料的处理方法、装置、存储介质和电子装置
CN115952262A (zh) 一种智能机器人自动问答系统
JP2003145054A (ja) 区分装置と区分装置の設定方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110921