CN1273542A - 识别邮件发送信息的方法和装置 - Google Patents

识别邮件发送信息的方法和装置 Download PDF

Info

Publication number
CN1273542A
CN1273542A CN98809865A CN98809865A CN1273542A CN 1273542 A CN1273542 A CN 1273542A CN 98809865 A CN98809865 A CN 98809865A CN 98809865 A CN98809865 A CN 98809865A CN 1273542 A CN1273542 A CN 1273542A
Authority
CN
China
Prior art keywords
video coding
task
univocality
result
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98809865A
Other languages
English (en)
Other versions
CN1126608C (zh
Inventor
本诺·尼斯旺德
于尔根·齐伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN1273542A publication Critical patent/CN1273542A/zh
Application granted granted Critical
Publication of CN1126608C publication Critical patent/CN1126608C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/20Arrangements for facilitating the visual reading of addresses, e.g. display arrangements coding stations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)
  • Character Input (AREA)

Abstract

本发明涉及采用自动OCR阅读和视频编码方法来识别邮件发送信息的方法和装置,其中,为了既快又省地阅读,在自动运行的阅读信息步骤中的任一步出现非单义结果时,识别过程暂停在当前步骤;从到此为止产生的单义的和非单义的结果和中间结果中,自动地将说明非单义和缺损结果和要执行的操作的视频编码任务发送到一个或多个视频编码台以得到单义的识别结果;利用代替非单义结果的单义编码结果,暂停的自动阅读步骤成功地结束,并开始随后的步骤。

Description

识别邮件发送信息 的方法和装置
本发明涉及如独立权利要求1和4前序部分所述的识别邮件发送信息的方法和装置。
在邮件分拣/发送时,所有可机器处理的邮件不可能都能完全自动处理。其中的原因是多方面的,从找不到地址块,到读出的地址中有机器不能分辨的矛盾之处。在这种情况下,电子阅读装置只能被迫中断处理过程,不能给出最终的结果。
当今公知的邮件综合处理的解决办法都基于以下两步处理原理,简述如下:第一步:
电子阅读装置从扫描器获得一个非压缩的二维/灰度图像,力求对邮件进行全面处理。在此可完成以下处理步骤。
·ROI-识别可能相关的信息区域
·区域中行的划分
·字符识别和单词划分
·采用地址分析的地址翻译-排列一个单词可能的含义
·地址相关-决定一种含义,基于与参考数据(字典)的比较确定分拣结果
其中,所有的处理步骤都给出侯选的含义。然而,若其中任一步给不出结果,或得到有相同概率的多个结果,以致最后不能确定单义的含义时,则处理过程最终结束。
这样的邮件将作为拒绝邮件发给机器控制器,然后启动视频编码系统进一步处理。第二步:
视频编码系统与电子阅读装置同时或在出现拒绝邮件后,获得一个压缩的二维图像,在机器控制器分配任务后,同样力求对邮件进行全面处理。此时可以考虑电子阅读装置的部分结果。
在对所有相关地址进行多级编码时,一个相同的编码流程首先是各编码台提高处理能力的必要的前提条件。在利用部分结果时只能有条件地使每封邮件的编码费用减小,因为由此引起的多个编码入口点破坏了均匀性。处理方法遵循以下格言:
“编码快于思考”
因此,除非利用大量的用户干预来限定编码器,从而输入最少的必要信息,否则必定给出不必要的信息,这应予以容许。由此,由于必要的编码时间也限定了在线能力(US-46 32 252)。
分拣机器的机械延迟传送带的长度对划分在线和离线处理起决定性作用。大体上有两种不同的系统可供使用。
1.采用短的延迟传送带(大约4-5秒)的机器只利用一个电子阅读装置对邮件进行在线处理。接在后面的编码系统进行离线处理(US-49 92 649)。
2.采用比较长的延迟传送带的机器也能在编码系统中对部分邮件进行在线处理(DE 43 24 255)。
其缺点是它对视频编码人员的处理能力要求较高。
在独立权利要求1和4中所给出的发明的目的是,利用自动OCR阅读器和视频编码台,尽可能快地读取邮件表面包含的发送信息且对视频编码人员的较低要求。
由此,在任一步处理步骤中出现非单义的结果时,自动OCR处理单元不是中断图像的处理,而是转到一种待命状态,而且为单义解决这一步处理,给每个视频编码台产生一个说明要执行操作的任务,因而对视频编码人员的要求较低。这样提高了总体阅读过程的处理速度,因而用相应的中间存储器就可以提高在线处理邮件的数量。
本发明的有利实施形式由各从属权利要求给出。
根据权利要求2和3所述,通过在视频编码台的屏幕上显示任务,以及给各视频编码台分配不同种类的任务,可以在编码处理能力很小时也能获得特别快的编码结果。
根据权利要求5和6有利的是,用任务编制器产生各视频编码台的任务,各任务编制器在OCR处理单元的关联文本存储器中搜索非单义的结果/中间结果,为单义地解决这个阅读问题而编制相应的任务,并将任务发送到各视频编码台,并在屏幕上显示。
根据权利要求7和8,有利形式是设置应答处理器,它将各视频编码台数据插入关联文本存储器,删除非单义的结果,并向OCR处理单元发送一个继续处理阅读过程的信号。
另外根据权利要求9,有利的是,在视频编码装置的输入端设置一个任务分配器,它根据在编码台数据库中存储的各视频编码台的任务权限和负荷信息,将到达的编码任务分配到各视频编码台。
根据权利要求10,有利的是,为了特别快和有效地进行工作,在本发明的装置前接入一种快速自动在线发送信息阅读器。若该阅读器在给定的短时间段内不能读出发送信息,该图像将继续传送给本发明的装置。
根据权利要求11,对多个图像并行处理也是有利的。
下面借助附图所示实施例对本发明作进一步说明,附图中:
图1是读取发送信息的处理步骤;
图2是翻译本发明流程的方框图;
图3是区域搜索时任务编制器的流程图;
图4是区域搜索时任务分配器的流程图;
图5是屏幕上显示的区域搜索的任务
图6是区域搜索时应答处理器的流程图;
图7是在字符识别和地址分析中对不明含义的地址行不能完全识别时任务编制器的流程图;
图8是对不明含义的地址行不能完全识别时任务分配器的流程图;
图9是对不明含义的地址行不能完全识别时的任务显示;
图10是对不明含义的地址行不能完全识别时应答处理器的流程图;
图11是地址相关时任务编制器的流程图;
图12是地址相关时任务分配器的流程图;
图13是地址相关时任务显示;
图14是地址相关时应答处理器的流程图。
要处理邮件的图像在扫描后送给自动阅读器。在此有利的是,根据系统的已知特性首先将一个快速自动在线阅读器作为主要的阅读器,它力求对邮件进行非交互的或不中断的处理。因而在邮件停留在机器中的时间内肯定得到一个结果,从而根据这个结果能马上对邮件进行分配。如果这次的阅读尝试失败,邮件的图像发送给带有一个OCR处理单元11的本发明的装置,该装置既利用剩余的机器时间,又能完全独立地产生一个机器继续运行的分配结果。这种OCR处理单元11由不同的功能组所组成,这些功能组一部分对邮件并行处理,而另一部分则串行处理。本例中邮件为送到接收人而编码,同时也应确定邮戳的有效性。下面将对本发明的装置的各功能组内部和功能组之间的流程进行描述。这些功能组通过一个由操作系统提供的套接字接口进行通信,这种套接字接口可以有选择地将单个功能组安插给一台计算机,还是安插给通过以太网相连的不同计算机。
OCR处理单元11力求对邮件进行全面处理。其中不同的处理步骤可以串行运行,也可以部分循环运行。
原则上每一步处理步骤为了获得单义结果都有各自的特殊问题,因而都是基于视频编码处理的候选者。它们所遇到的问题与描述现有技术时所述的问题是相同的。
图1示出的是OCR处理单元11中的不同处理步骤及其由此产生的编码步骤。其中可以独立处理的步骤采用并行进行,而相互依赖的步骤则串行进行。
根据图2,从OCR处理单元11中获得邮件数据,并按照图1所示的处理流程中规定的任务次序进行处理。在此,从输入数据和当前的部分结果/结果中生成一个邮件关联文本,存储在关联文本存储器12中。当部分结果不能简化为一个单义的结果时,OCR处理单元11的任务就首次失败。
这种状态下,OCR处理单元11中断识别和翻译过程,并保持在它的处理关联文本中。对此可以利用先进的多任务操作系统的标准机制。任务编制器13分析这个邮件关联文本,并由此对要解决的问题编制一个任务发给视频编码装置20。该任务的组成是:邮件的图像或图像片断、相关的属性数据和一个要执行的操作。
在视频编码装置20的入口有一个任务分配器21始终等候进行中的任务。这些任务中的要执行的操作得到分析后,从可用的一组编码台7中选出一个合适的编码台7用于解决问题。选择时考虑工作台的负荷状况和编码模式。若没有合适的编码台7可用,则给应答处理器14反馈一个任务反馈信息。
选定的编码台7收到任务数据,并在高分辨率的屏幕上给编码器显示邮件图像。该编码台7会输出所需的编码结果。这个结果会反馈给应答处理器14。
应答处理器14将应答数据插入邮件关联文本,删除非单义的数据,并准备继续执行OCR处理单元11的识别和翻译过程。
编码任务主要包括以下操作:
·确认
要求编码器确认自动阅读器输出的识别结果。阅读器的结果大多是正确的,但由于要保证的错误率和达到正确识别的概率,也会出现拒绝这些结果。通过编码器的快速确认,这些识别结果不再被拒绝,而且在在线时间内还能够用于分拣。
·选择
编码器从多个在自动识别过程中作为可能结果输出的候选者中进行选择。随后自动识别过程借助于所述判定帮助的反馈继续进行。可能要从各种差异极大的对象,例如从部分字符串、候选的相关图像区域(ROI)直到来自地址数据库的候选者中进行选择。
·关键词
编码器给出由OCR处理单元11标记的地址部分的摘要或全部字符串。这些输入给OCR处理单元11在识别这些地址成分时进行补充或改善相关性。
·人工ROI
编码器用光栅方法或触摸屏从邮件(大信件和包裹)的总图像中选出所需的相关图像区域(ROI),如接收者的地址标记。接着OCR处理单元11将它的识别任务转到人工评估ROI。
所有的操作都是简单和常规的,几乎不包含国家特征,这样大大降低必需的与用户有关的自适应性。OCR处理单元11能从它的当前关联文本出发寻求视频编码器的帮助,由此通过视频编码完整处理它的识别过程。为提高阅读和视频编码系统的效率,总有多个识别过程并行进行。为改善工作关联文本,减少编码时间,可选的方法是将不同的编码任务分配到各个编码台。这种交互式集成阅读和视频编码方法的优点总结如下:
·简单常规的编码策略和编码规则简化了视频编码器的学习过程,特别是在复杂的地址构成或深度编码时更是明显。
·大大降低对编码人员的编码能力的要求。这种情况同样适合在复杂的地址构成和/或深度编码时(如过程跟踪分拣中集成后发送)。
·自动阅读过程的最佳支持又一次提高在线编码速率和阅读和编码系统的效率。
下面借助选定的处理步骤的编码任务对工作过程作进一步说明。不能自动找出的地址
在处理大信件时经常出现的现象是,扫描得到的图像中除接收地址外还包含许多与地址块相似的附加信息,如邮票边的日戳。在这种情况下,搜索地址块时经常出现完全拒识,或者通过高强度的多个候选者的并行验证找到正确的地址,但这一点常常导致超过在线处理时间的限制。
OCR处理单元11首先力求辨识接收者地址块。
a)如果找到的特征不足以确定一个单义的或较少变化的含义,则冻结这个处理步骤,并开始以下处理:
·给视频编码装置20编制带有以下参数的任务:
·邮件图像包括图像属性采用TIFF格式
·所有要考虑图像区域的坐标描述
·确定询问的类型,在这种情况下:
为接收确认而询问是否选择一个图像区域
·视频编码装置20的一个任务分配器21选定一个合适可用的编码台7;
·编码台7显示邮件图像,并处理询问;
·编码器输入的结果反馈回发出请求的OCR处理单元11。
在收到应答后,邮件的处理过程在以前冻结的位置重新开始。
b)如果找到的特征不足以确定一个含义,则冻结这个处理步骤的关联文本,并开始以下处理:
·给视频编码装置20编制带有以下参数的任务:
·邮件图像包括图像属性采用TIFF格式
·确定询问的类型,在这种情况下:
为接收确认而询问是否输入一个图像区域
·视频编码装置20的任务分配器21选定一个合适可用的编码台7;
·编码台7显示邮件图像,并处理询问;
·编码器输入的结果反馈回发出请求的OCR处理单元11。
在收到应答后,邮件的处理过程在以前冻结的位置重新开始。
在大多数情况下,在用视频编码器获得正确地址块时,随后完全自动处理地址块的概率非常高,因为几乎所有大信件上的地址标签都是用机器写的。没有足够高概率的地址
在处理商务邮件地址时经常出现的现象是,尽管接收地址原则上是单义的,但自动比较的结果却是拒识的,因为书写方式没有一个能与地址数据库中可找到的地址有足够高的相关概率。
OCR处理单元11首先力求读取接收者地址块。
如果找到的特征不足以达到所要求的概率,则冻结这个处理步骤,并开始以下处理:
·给视频编码装置20编制带有以下参数的任务:
·邮件图像包括图像属性采用TIFF格式
·完全的接收地址
·确定询问的类型,在这种情况下:
询问是否确认接收者地址
·视频编码装置20的任务分配器21选定一个合适可用的编码台7;
·编码台7显示邮件图像,并处理询问;
·编码器输入的结果反馈回发出请求的OCR处理单元11。
在收到应答后,邮件的处理过程在以前冻结的位置重新开始。
从而原则上结束处理过程。读不出地址的邮件
基于当前的技术水平,在识别手写体时经常不能完全自动识别地址。
OCR处理单元11首先力求读取接收者地址块。
如果在处理过程中的任一步找到的特征不足以进行下一步处理,则冻结这个处理步骤,并开始以下处理:
·给视频编码装置20编制带有以下参数的任务:
·邮件图像包括图像属性采用TIFF格式
·不能处理的图像区域的坐标描述
·确定询问的类型,在这种情况下:
询问是否输入用坐标描述的地址部分
·视频编码装置20的任务分配器21选定一个合适可用的编码台7;
·编码台7显示邮件图像,并处理询问,
·编码器输入的结果反馈回发出请求的OCR处理单元11。
在收到应答后,邮件的处理过程在以前冻结的位置重新开始。
在多数情况下,通过清除空隙能够使自动处理过程达到完整的结果。如果不是这样,通常最好的做法是对邮件重复这一步骤。
下面对特定阅读流程的功能流程作进一步说明。区域搜索
处理开始时总是选择相关图像区域(ROI),即分析整个图像的几何特征区和色彩特征区,并由此先提出一种关于含义的假定。处理时该假定的组成包括:
·描述特征区位置和大小的坐标值
左下角的X/Y坐标对
左上角的X/Y坐标对
右下角的X/Y坐标对
左上角的X/Y坐标对
·假定的含义(如接收者地址块、邮资已付邮戳、发件者地址块)存储在一个数据库,以下称为邮件关联文本。
当出现非单义结果时,OCR处理单元11中负责区域搜索的功能组1促使任务编制器13对视频编码装置20指定进行单义编码。对这个邮件来说,功能组1自动进入一种等待状态,直到收到视频编码的结果。基于现代操作系统提供的并行处理的可能性,已经可以开始下一个邮件的处理。
图3示出的是任务编制器13的功能,它一直在关联文本存储器12中搜索多义的或不存在的区域,直到只留下单义的和不需再处理的区域。
接受区域搜索任务后110开始搜索多义的或不能找到的区域111。若发现具有相同含义的区域,则编制一个相应的选择任务112,并插入找到的相应区域的数据中113中。若找不到区域,则编制一个输入带有已找到含义115的区域的任务114。所有区域处理完毕,进行步骤116,将任务传给视频编码装置20。
在此基础上,即使发现邮戳是单义的,但仍存在具有与接收者地址有相似信息的不同图像区域,那么任务编制器13将此询问发给视频编码装置20。
视频编码装置20中对应的部分是任务分配器21,它不是分析整个任务,而是必须确定任务的种类,以便从它的编码台数据库22中的所有当前可用的编码台7中选出一个编码台,其操作人员应具有解决这个任务所需的能力。这个任务对这种方法的有效性非常重要,因为为了避免出现不必要的工作停顿,每个编码器都应获得足够的编码任务。
图4示出的是任务分配器21的功能。
出现找不到适合的编码台的情况,首先会在处理差异很大的编码任务的小型编码装置中导致处理时间的延长,因为在这种情况下,阅读器中的处理会在稍后的时刻出现中断,当合适的编码器重新可用时,处理过程重新开始。
编码过程本身是尽可能按人体因素设计的。图5表示的是编码台上数据的图形显示。通过数字块实现选择,从而编码器也可以承接基于其它键盘输入的编码任务。
编码器输入的结果,即区域编号,将用于将该区域的数据作为结果反馈给OCR处理单元11。若询问包含不同含义的区域,则根据其含义归类,并在多个步骤中处理。
区域搜索的应答处理器14删除邮件关联文本中的多义区域,插入结果区域。这样到此时对每个要处理的区域只有一个单义的结果。
图6给出的流程图示出的是应答处理器14的功能。在从视频编码装置20收到应答310后,将检验是否作为搜索结果输出区域。若不是这样,则在OCR处理单元11中继续进行区域搜索314,其中将产生处理过程中断。若在OCR处理单元11中成功完成区域搜索,则在关联文本存储器12中检验是否存在具有相同含义的相应的区域。若是,则删除这些数据312。若有关这个区域的数据不再存在于关联文本存储器中,则来自视频编码的数据插入关联文本存储器12中313。
在由区域搜索重新开始处理过程时,邮件关联文本按惯例传递给随后的处理单元。此例中指的既是邮戳识别又是字符处理(OCR),因为这两个单元不依赖于其它单元的处理结果。
在此邮戳识别对无需编码器干预的简单任务已足够,因为邮戳要么是非常清楚,足以从它的形状单义识别,要么特别模糊,用视频编码器进行干预也不能实质性地提高其结果。
字符处理过程识别单个字符,将字符组成词,再将词组成行,由此产生许多的候选者。这些数据(字符)以各种可能组合的词和行存入邮件关联文本中。
这其中包含的信息对罗马文字来讲在很多方面都需要考虑人体特性,因而不在此详细讨论。对于基于词或音节的文字(如中文),此处也可以考虑采用交互式处理。
字符处理的输出将邮件关联文本传递给地址翻译。地址翻译
这一处理单元力求确定每个单词的含义,由此构造一个一致的地址,以便能得出单义的发送信息。
在此,假定的含义分配给在邮件关联文本中的每个单词,这些含义必须相互补充,以获得一个完整的句法正确的地址。
这样给出的地址变型通过包含所有相关地的数据库来调整。地址的变型通过多步迭代获得,每个步骤中处理一个地址部分(如邮政编码和城市名)。
如果地址中的各单词不能得出单义的含义,则地址翻译系统将启动一个任务编制器13,该任务编制器13在邮件关联文本中搜索含义不明的地址部分,因为例如只能不完全确认地址中的字符。任务编制器13的功能在图7中用流程图描述。
接受输入字符的任务后120,开始在关联文本存储器中搜索不具有单义含义的地址部分121。若找到了,则给不明字符编制一个输入任务122,其中,插入区域数据和输入方法123。若确定了所有的不明地址部分并编制了相应的任务,则将总任务124继续传给视频编码装置20。
在视频编码装置20中对应的任务分配器21在接受任务220后确定任务的种类,以便在它的编码台数据库22中搜索可用的一个或多个视频编码台221,其操作人员应具有解决这个任务所需的能力;在多个编码台时选定编码台应有最小负荷222。若确定了相应的视频编码台,则给这个编码台发送一个任务225。若没有视频编码台可供使用,则形成一个反馈应答223,向OCR处理单元11发送过去224(见图8)。
出现找不到合适编码台的情况,首先会在处理差异很大的编码任务的小型编码系统中导致处理时间的延长,因为在这种情况下,阅读器中的处理会在稍后的时刻出现中断,当合适的编码器重新可用时,处理过程重新开始。
编码过程本身是尽可能按人体因素设计的。
图9表示的是编码台上数据的图形显示。通过标准键盘实现输入。输入方法(例如第一个单词的前3个字符和数字)通过询问确定,因为此方法依赖于应用数据库的存取方法。
这个输入的结果将反馈给阅读器。若询问包括多个区域,则处理过程用多个步骤实现。
地址翻译的应答处理器14删除邮件关联文本中不能识别区域的多义字符,插入结果字符。这样到此时对每个要处理的区域只有一个单义的结果。
图10中的流程图示出的是应答处理器14的功能。在从视频编码装置20收到应答后320,检验是否存在对任务的应答。若不是这样,则在OCR处理单元中继续地址翻译324,其中,出现处理过程中断。若成功完成视频编码,则在关联文本存储器12中搜索没有含义的区域。若找到这样的区域,则删除相应的字符322,将来自视频编码的字符数据插入邮件关联文本中323,再继续地址翻译324。
在由地址翻译重新开始处理过程时,若不能单义地定义地址或部分地址,则地址翻译中的判定器将在邮件关联文本中搜索地址或部分地址的所有可能的含义。基于不同的判定准则(例如每种可能性的概率、已定义的错误率)判定器力求得到一个单义的结果,或者列出可能的候选者名单。经判定器减少的可能的候选者名单将打上标记,启动相应的任务编制器。
图11中的流程图示出的是任务编制器13的功能。
在接受地址候选者的判定任务后130,在邮件关联文本中搜索具有相同地址/地址部分的已标记的各候选者。若找到了,则编制一个选择任务132。各候选者和区域将插入任务中133。若所有标记的候选者都找到了,则将一个相应的任务传给视频编码装置20中134。
在视频编码装置20中对应的任务分配器在接受任务230后确定任务的种类,以便在它的编码台数据库22中搜索可用的一个或多个视频编码台231,其操作人员应具有解决这个任务所需的能力。在多个编码台时,选定编码台应有最小负荷232。若确定了相应的视频编码台,则给这个编码台发送一个任务235。若没有视频编码台可供作用,则形成一个反馈应答233,向OCR处理单元11发送过去234(见图12)。
出现找不到合适编码台的情况,首先会在处理差异很大的编码任务的小型编码系统中导致处理时间的延长,因为在此情况下,阅读器中的处理会在稍后的时刻出现中断,当合适的编码器重新可用时,处理过程重新开始。
编码过程本身是尽可能按人体因素设计的。图13表示的是编码台上数据的图形显示。通过标准键盘实现输入。
编码输入的结果,即候选者的编号用于将这些候选者的数据作为结果反馈给阅读器。若任务包括选择不同的地址部分,则处理过程用多个步骤实现。
判定任务的应答处理器删除已处理地址部分的候选者,插入结果数据。
图14中的流程图表示的是其功能。在从视频编码装置20收到应答后330,检验是否存在对任务的应答。若不是这样,则在OCR处理单元中继续判定过程334,其中,出现处理过程中断。若成功完成视频编码,则在关联文本存储器12中搜索可能的地址部分331并将其删除332。然后将视频编码的地址部分插入关联文本存储器中333,再利用结果输出继续判定过程334。

Claims (11)

1.一种识别邮件发送信息的方法,借助于OCR对采集和存储的包含发送信息的邮件表面的图像进行自动阅读,其中,以同时运行和先后运行的步骤执行自动阅读,例如确定感兴趣的区域(1)(ROI);阅读邮票(2)、分行、分段、识别字符和单词(4)、利用地址分析和与地址数据库中的地址相比较进行地址翻译(5),其中,只有在前一步以单义的结果结束时,以及在一个带有视频编码台(7)的视频编码装置(20)中对不能自动单义地识别的发送信息进行编码时,才执行相应的下一个步骤,在视频编码台(7)的高分辨率显示器上显示发送来的包含发送信息的相应图像,其特征在于:在自动运行的阅读信息步骤(1-6)中的任一步出现非单义结果时,识别过程暂停在当前步骤;从到此为止产生的单义的和非单义的结果和中间结果中,自动地将说明非单义和缺损结果和要执行的操作的视频编码任务发送到一个或多个视频编码台(7)以得到单义的识别结果;利用代替非单义结果的单义编码结果,暂停的自动阅读步骤成功地结束,并开始随后的步骤。
2.根据权利要求1所述的方法,其特征在于:视频编码时在各个视频编码台(7)的屏幕上显示包含待阅读发送信息的图像、要解决的任务和至此为止产生的结果和/或部分结果。
3.根据权利要求1所述的方法,其特征在于:在视频编码装置中,每个视频编码台(7)只负责各种视频编码任务中的一部分,根据任务的类别及对此负责的视频编码台,并根据各视频编码台当前的负荷,将编码任务分配到各视频编码台。
4.一种识别邮件发送信息的装置,包括
·一个具有各种功能组的OCR自动处理单元(11),这些功能组例如用于确定感兴趣的区域(ROI)、分行、分段、识别字符和单词、地址分析、在相连接的一个地址数据库中进行地址比较,其中,在关联文本存储器(12)中存放结果、部分结果、发送信息分析的状态和输入数据,
·一个至少具有一个视频编码台(7)的视频编码装置(20),用于处理OCR处理单元(11)不能单义阅读的发送信息,
其特征在于:OCR自动处理单元(11)如此设计,以便在功能组出现非单义或错误的中间结果和/或结果时保持在各自的当前状态,并向视频编码装置(20)发送相应的对非单义的作业进行视频编码处理的任务请求,而OCR处理单元(11)在收到单义的视频编码结果后继续已中断的处理过程。
5.根据权利要求4所述的装置,其特征在于:至少有一个任务编制器(13)与OCR处理单元(11)相连接,它接收各阅读功能的任务信号,为各阅读功能在关联文本存储器(12)中搜索非单义的或没有找到的结果,由此,编制一个由附有已找到和/或要阅读的发送信息的邮件表面的图像、OCR处理单元(11)各功能组输出的非单义结果以及编码作业组成的任务,并将该任务发送到视频编码装置(20)。
6.根据权利要求4或5所述的装置,其特征在于:OCR处理单元(11)的每个功能组后面连接着与视频编码装置(20)相连的任务编制器(13)。
7.根据权利要求4所述的装置,其特征在于:至少有一个与视频编码装置(20)相连的应答处理器(14)与OCR处理单元(11)相连接,它将视频编码装置(20)的应答数据插入到关联文本存储器(12)中,删除非单义的结果,以及向视频编码单元(11)发送一个继续进行阅读过程的信号。
8.根据权利要求4或7所述的装置,其特征在于:OCR处理单元(11)中的每个功能组与一个与视频编码装置(20)相连的应答处理器(14)相连接。
9.根据权利要求4或7所述的装置,其特征在于:每个视频编码台(7)在确定发送信息时只对编码作业中的一部分负责,而所有的视频编码台(7)都通过一个任务分配器(21)与视频编码装置(20)的输入相连,其中,任务分配器(21)根据存储在一个相连接的编码台数据库中的各视频编码台(7)的作业权限和负荷状态信息,将视频编码任务分配到各视频编码台(7)。
10.根据权利要求4至9所述的装置,其特征在于:在自动OCR处理单元(11)前接入一个快速自动在线发送信息阅读器,其中,只有在出现非单义的阅读结果时,才将相应图像的阅读任务转发给自动OCR处理单元(11)。
11.根据权利要求4至10所述的装置,其特征在于:同时处理具有待确定发送信息的多幅图像。
CN98809865A 1997-11-04 1998-08-26 识别邮件发送信息的方法和装置 Expired - Fee Related CN1126608C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19748702.5 1997-11-04
DE19748702A DE19748702C1 (de) 1997-11-04 1997-11-04 Verfahren und Anordnung zum Erkennen von Verteilinformationen auf Sendungen

Publications (2)

Publication Number Publication Date
CN1273542A true CN1273542A (zh) 2000-11-15
CN1126608C CN1126608C (zh) 2003-11-05

Family

ID=7847587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98809865A Expired - Fee Related CN1126608C (zh) 1997-11-04 1998-08-26 识别邮件发送信息的方法和装置

Country Status (9)

Country Link
US (1) US6520407B1 (zh)
EP (1) EP1027174B3 (zh)
JP (1) JP3740366B2 (zh)
KR (1) KR100532800B1 (zh)
CN (1) CN1126608C (zh)
CA (1) CA2309453C (zh)
DE (2) DE19748702C1 (zh)
TW (1) TW438629B (zh)
WO (1) WO1999022883A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1300739C (zh) * 2005-01-25 2007-02-14 邮政科学上海研究所 信函校验识别方法
CN1332768C (zh) * 2003-10-10 2007-08-22 虹光精密工业(苏州)有限公司 邮件辨识处理系统与方法
CN100419780C (zh) * 2002-09-16 2008-09-17 索利斯蒂克有限公司 含有地址信息的图像的视频编码方法
CN100492394C (zh) * 2004-04-07 2009-05-27 索利斯蒂克有限公司 在邮件上延迟印刷身份码的方法
CN100492403C (zh) * 2001-09-27 2009-05-27 佳能株式会社 文字图像分行方法和装置以及文字图像识别方法和装置
CN101844135A (zh) * 2010-05-11 2010-09-29 上海邮政科学研究院 一种地址信息库驱动下的邮政信函按址分拣方法

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7966078B2 (en) 1999-02-01 2011-06-21 Steven Hoffberg Network media appliance system and method
JP3709305B2 (ja) * 1999-07-01 2005-10-26 日立オムロンターミナルソリューションズ株式会社 地名文字列照合方法、地名文字列照合装置、地名文字列認識装置及び郵便物区分システム
US6539098B1 (en) 1999-09-24 2003-03-25 Mailcode Inc. Mail processing systems and methods
AU3002501A (en) * 2000-02-07 2001-08-20 Crisplant A/S A parcel self-servicing machine
DE20218212U1 (de) * 2002-08-12 2003-12-24 Mit Management Intelligenter Technologien Gmbh Vorrichtung zur automatischen Adressblockmarkierung
DE10326145A1 (de) * 2003-06-06 2004-12-23 Böwe Bell + Howell GmbH Verfahren zum Sortieren von Briefen
US20040264564A1 (en) * 2003-06-26 2004-12-30 Senger Michael D. System and method for efficiently using video encoding resources
TWI256239B (en) * 2003-09-17 2006-06-01 Avision Inc Mail recognizing and processing system and method
US7590260B2 (en) * 2003-09-25 2009-09-15 Siemens Aktiengesellschaft Method and apparatus for video coding by validation matrix
FR2864664B1 (fr) * 2003-12-24 2008-08-15 Solystic Procede de traitement d'envois postaux avec prise en compte d'un surcroit d'erreur de distribution
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US8799303B2 (en) * 2004-02-15 2014-08-05 Google Inc. Establishing an interactive environment for rendered documents
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US7812860B2 (en) * 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US20060041484A1 (en) * 2004-04-01 2006-02-23 King Martin T Methods and systems for initiating application processes by data capture from rendered documents
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US20070300142A1 (en) * 2005-04-01 2007-12-27 King Martin T Contextual dynamic advertising based upon captured rendered text
US8621349B2 (en) * 2004-04-01 2013-12-31 Google Inc. Publishing techniques for adding value to a rendered document
WO2008028674A2 (en) 2006-09-08 2008-03-13 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US7894670B2 (en) * 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US20080313172A1 (en) * 2004-12-03 2008-12-18 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
US8081849B2 (en) * 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US8793162B2 (en) * 2004-04-01 2014-07-29 Google Inc. Adding information or functionality to a rendered document via association with an electronic counterpart
US20100185538A1 (en) * 2004-04-01 2010-07-22 Exbiblio B.V. Content access with handheld document data capture devices
US8713418B2 (en) * 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US9460346B2 (en) 2004-04-19 2016-10-04 Google Inc. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
DE102004030415A1 (de) * 2004-06-24 2006-01-19 Siemens Ag Verfahren zur automatischen Ermittlung operativer Leistungsdaten von Lesesystemen
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US20100092095A1 (en) * 2008-10-14 2010-04-15 Exbiblio B.V. Data gathering in digital and rendered document environments
US20110075228A1 (en) * 2004-12-03 2011-03-31 King Martin T Scanner having connected and unconnected operational behaviors
US8019649B2 (en) * 2005-04-18 2011-09-13 The Devereux Group Method of managing prospective business
DE102006016602B4 (de) * 2006-04-06 2007-12-13 Siemens Ag Verfahren zur Erkennung einer Postsendungsinformation
US7925046B2 (en) 2007-05-02 2011-04-12 Lockheed Martin Corporation Implicit video coding confirmation of automatic address recognition
FR2918782B1 (fr) * 2007-07-10 2009-10-30 Neopost Technologies Sa Procede d'affranchissement a correction d'erreurs.
US8005260B2 (en) 2008-05-15 2011-08-23 Graham Packaging Company L.P. Correcting video coding errors using an automatic recognition result
CN105930311B (zh) 2009-02-18 2018-10-09 谷歌有限责任公司 执行与再现文档关联的动作的方法、移动设备和可读介质
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
CN102349087B (zh) 2009-03-12 2015-05-06 谷歌公司 自动提供与捕获的信息例如实时捕获的信息关联的内容
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US8904517B2 (en) 2011-06-28 2014-12-02 International Business Machines Corporation System and method for contexually interpreting image sequences
US9449239B2 (en) 2014-05-30 2016-09-20 Apple Inc. Credit card auto-fill
US9565370B2 (en) 2014-05-30 2017-02-07 Apple Inc. System and method for assisting in computer interpretation of surfaces carrying symbols or characters
US9251431B2 (en) * 2014-05-30 2016-02-02 Apple Inc. Object-of-interest detection and recognition with split, full-resolution image processing pipeline
FR3081355B1 (fr) * 2018-05-24 2020-06-12 Solystic Procede de tri de bagages en aeroport avec videocodage optimise

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60147887A (ja) * 1984-01-12 1985-08-03 Toshiba Corp 郵便物区分装置
US4992649A (en) * 1988-09-30 1991-02-12 United States Postal Service Remote video scanning automated sorting system
US5031223A (en) 1989-10-24 1991-07-09 International Business Machines Corporation System and method for deferred processing of OCR scanned mail
US5387783A (en) * 1992-04-30 1995-02-07 Postalsoft, Inc. Method and apparatus for inserting and printing barcoded zip codes
US5446667A (en) * 1992-06-18 1995-08-29 Pitney Bowes Inc. Just-in-time mail delivery system and method
US5734568A (en) 1992-08-21 1998-03-31 International Business Machines Corporation Data processing system for merger of sorting information and redundancy information to provide contextual predictive keying for postal addresses
EP0589119A1 (en) * 1992-09-25 1994-03-30 International Business Machines Corporation System and method for improving processing of OCR scanned mail
DE4324255C2 (de) * 1993-07-20 1998-02-05 Siemens Ag Verfahren und Vorrichtung zum Sortieren von mit Adreßinformationen versehenen Sendungen
US5917925A (en) * 1994-04-14 1999-06-29 Moore; Lewis J. System for dispensing, verifying and tracking postage and other information on mailpieces
EP0726540B1 (en) 1995-02-08 2003-09-10 Kabushiki Kaisha Toshiba Apparatus and method for video coding
JP3441249B2 (ja) 1995-07-24 2003-08-25 株式会社東芝 コーディングシステム及び郵便物処理システム
US6156988A (en) * 1999-09-24 2000-12-05 Baker; Christopher A. Inter-departmental mail sorting system and method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100492403C (zh) * 2001-09-27 2009-05-27 佳能株式会社 文字图像分行方法和装置以及文字图像识别方法和装置
CN100419780C (zh) * 2002-09-16 2008-09-17 索利斯蒂克有限公司 含有地址信息的图像的视频编码方法
CN1332768C (zh) * 2003-10-10 2007-08-22 虹光精密工业(苏州)有限公司 邮件辨识处理系统与方法
CN100492394C (zh) * 2004-04-07 2009-05-27 索利斯蒂克有限公司 在邮件上延迟印刷身份码的方法
CN1300739C (zh) * 2005-01-25 2007-02-14 邮政科学上海研究所 信函校验识别方法
CN101844135A (zh) * 2010-05-11 2010-09-29 上海邮政科学研究院 一种地址信息库驱动下的邮政信函按址分拣方法
CN101844135B (zh) * 2010-05-11 2013-05-08 上海邮政科学研究院 一种地址信息库驱动下的邮政信函按址分拣方法

Also Published As

Publication number Publication date
EP1027174B1 (de) 2002-07-17
EP1027174B3 (de) 2011-10-05
EP1027174A1 (de) 2000-08-16
JP2001521821A (ja) 2001-11-13
JP3740366B2 (ja) 2006-02-01
CA2309453A1 (en) 1999-05-14
WO1999022883A1 (de) 1999-05-14
CA2309453C (en) 2004-04-20
KR100532800B1 (ko) 2005-12-05
US6520407B1 (en) 2003-02-18
DE19748702C1 (de) 1998-11-05
CN1126608C (zh) 2003-11-05
KR20010031815A (ko) 2001-04-16
TW438629B (en) 2001-06-07
DE59804832D1 (de) 2002-08-22

Similar Documents

Publication Publication Date Title
CN1126608C (zh) 识别邮件发送信息的方法和装置
CN1877598A (zh) 手机中使用图像识别进行名片信息的采集与录入的方法
CN1139884C (zh) 信息处理方法和装置
CN1168040C (zh) 邮件地址阅读器、分类机以及字符串识别方法
CN1054953C (zh) 带缺陷检测的文件图像处理器
CN1752992A (zh) 文字识别装置、文字识别方法及文字识别程序
CN1867030A (zh) 以预定次序打印扫描文档的成像设备及其方法
CN1163841C (zh) 在线手写中文字识别装置
CN1141666C (zh) 利用标准笔划识别输入字符的在线字符识别系统
CN1514985A (zh) 带变体的多重表格的识别、分离和压缩
CN1752991A (zh) 文字识别装置、文字识别方法及文字识别程序
CN1945599A (zh) 图像处理装置,图像处理方法和计算机程序产品
CN1120757C (zh) 识别信件发送信息的方法和装置
CN1916940A (zh) 模板优化的字符识别方法和系统
CN1041773C (zh) 由字符图象直方图0-1图形表示识别字符的方法和装置
US7181045B2 (en) Method and device for reading the addresses of items of mail
CN1360524A (zh) 利用记录所得的地址记录更新地址数据库的设备和方法
RU2597572C1 (ru) Устройство распознавания адреса, устройство сортировки, интегрированное устройство распознавания адреса и способ распознавания адреса
CN1691989A (zh) 处理邮件的方法和装置
CN1549192A (zh) 手写字体的计算机识别与自动输入方法
CN1077757C (zh) 字符发生方法及装置
CN1092822C (zh) 全地址读取装置
CN1894049B (zh) 通过验证矩阵进行视频编码的方法和设备
CN1896997A (zh) 字符串检索装置及使计算机执行字符串检索方法的程序
JPH0957204A (ja) 郵便物の宛先自動読取システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20031105

Termination date: 20150826

EXPY Termination of patent right or utility model