CN101313299A - 使用远程存储的模板的表单自动化处理 - Google Patents

使用远程存储的模板的表单自动化处理 Download PDF

Info

Publication number
CN101313299A
CN101313299A CNA2006800434131A CN200680043413A CN101313299A CN 101313299 A CN101313299 A CN 101313299A CN A2006800434131 A CNA2006800434131 A CN A2006800434131A CN 200680043413 A CN200680043413 A CN 200680043413A CN 101313299 A CN101313299 A CN 101313299A
Authority
CN
China
Prior art keywords
template
list
information
remote storage
storage location
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800434131A
Other languages
English (en)
Inventor
A·格瓦
E·卡宁
E·瓦莱奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101313299A publication Critical patent/CN101313299A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • G06K17/0003Automatic card files incorporating selecting, conveying and possibly reading and/or writing operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及使用远程存储的模板的表单自动化处理。一种用于处理表单的计算机实现方法,包括在具有本地存储器的计算机系统上接受符合模板的表单,其中该模板并未存储在本地存储器中。通过使用计算机系统,从表单中提取标识信息,该标识信息指示的是处于计算机系统外部并且存储有所述模板的远程存储位置的网络地址。响应于标识信息,通过经由广域网(WAN)与远程存储位置进行通信来检索该模板。响应于检索到的模板,对表单进行处理。

Description

使用远程存储的模板的表单自动化处理
技术领域
本发明一般涉及表单处理系统,尤其涉及使用远程存储的模板来自动化处理具有未知结构的表单的方法和系统。
背景技术
很多类型的组织都使用表单来从客户获取数据,以便提供服务以及运作其业务。通常,这类组织运行计算机化的数据库和其他计算机化的系统,以便存储或处理表单中传递的信息。一般来说,此类系统处理数量庞大的表单,并且将其转换成计算机可读信息。
某些应用使用的是由客户填写和提交的纸质表单。例如,国际商用机器公司(Armonk,New York)提供了一种自动从大量纸质表单中获取数据的智能表单处理(IFP)系统。关于IFP系统的其他细节可以在www2.clearlake.ibm.com/GOV/ifp得到。
发明内容
由此,根据本发明的一个实施例,在这里提供了一种用于处理纸质表单的计算机实现方法。该方法包括:在具有本地存储器的计算机系统上接受符合模板的已填写纸质表单,其中该模板并未存储在本地存储器中。使用该计算机系统,从已填写纸质表单中提取标识信息。该标识信息表示处于计算机系统外部并且存储有所述模板的远程存储位置的网络地址。响应于标识信息,通过经由广域网(WAN)与远程存储位置进行通信来检索该模板。响应于检索到的模板,对已填写纸质表单进行处理。
在一个实施例中,计算机系统与第一组织相关联,并且该远程存储位置与不同于第一组织的第二组织相关联。
在另一实施例中,提取标识信息的步骤包括下列各步骤中的至少一个:对打印在已填写表单上的图形编码图像进行解码;和使用光学字符识别(OCR)处理来识别文本信息。该图形编码图像可以包括对标识信息进行编码的条形码图像。
在还一实施例中,所述提取标识信息的步骤包括除了网络地址之外还提取用于标识模板的标识符的步骤,并且所述检索模板的步骤包括在远程存储位置中使用该标识符从存储在远程存储位置处的多个模板中选择所述模板的步骤。
在再一实施例中,所述模板包括模板信息,并且模板信息的一部分嵌入在已填写表单中。在这个实施例中,除了从远程存储位置检索模板之外,提取标识信息的步骤还包括从已填写表单中提取模板信息的所述部分的步骤。
在一个实施例中,提取标识信息的步骤包括:通过识别已填写表单中与模板的始发者相关的信息来确定远程存储位置的网络地址。
根据本发明的一个实施例,还提供了用于处理符合模板的纸质表单的另一种计算机实现方法。该方法包括:将模板信息编码到印制在纸质表单上的计算机可读符号中,其中该模板信息包括与模板字段相关联的几何信息以及与模板字段的期望内容相关联的内容相关信息中的至少一项。符合该模板的已填写纸质表单被接受。从已填写纸质表单中解码出计算机可读符号,以便提取模板信息。响应于所提取的模板信息,对已填写纸质表单进行处理。
根据本发明的另一实施例,提供了一种计算机可读表单。该表单包括印制有模板并且印制有计算机可读符号的页面,其中该计算机可读符号对模板信息进行编码,该模板信息包括与模板字段相关联的几何信息以及与模板字段的期望内容相关联的内容相关信息中的至少一项,由此,当接收到纸质表单的图像时,使得计算机能够从符号中提取模板信息,并使用该模板信息来重构模板。
根据本发明的一个实施例,还提供了一种用于处理纸质表单的设备。该设备包括被配置成接受符合模板的已填写纸质表单的输入设备。该设备还包括被配置成与广域网(WAN)进行通信的网络接口,以及处理器,其中该处理器被配置成从已填写纸质表单中提取标识信息。该标识信息指示的是处于设备外部并且存储有模板的远程存储位置的网络地址,以便响应于所述标识信息通过使用网络接口经由WAN与远程存储位置进行通信来检索模板,以及响应于检索到的模板来处理已填写纸质表单。
根据本发明的另一实施例,提供了一种用于处理纸质表单的系统。该系统包括一个或多个被配置成存储表单模板的远程服务器,以及表单处理器,该表单处理器被配置成接受符合模板的已填写纸质表单,以便从已填写纸质表单中提取标识信息,其中该模板并未存储在表单处理器本地。该标识信息表示从一个或多个存储有所述模板的远程服务器中选出的服务器的网络地址,由此响应于标识信息通过经由广域网(WAN)与选定服务器进行通信来检索模板,以及响应于检索到的模板来处理已填写纸质表单。
附图说明
从以下结合附图的实施例详述中可以更全面地理解本发明,在附图中:
图1是示意性地描述根据本发明实施例的纸质表单处理系统的框图;
图2是示意性地描述根据本发明实施例的纸质表单处理方法的流程图;以及
图3A和3B是用于根据本发明实施例的纸质表单处理的条形码图像。
具体实施方式
概述
对用于自动化处理纸质表单的已知方法和系统来说,通常,当提交表单时,这些方法和系统都会假设所处理表单的结构或模板是可以在表单处理系统本地得到的。在这些已知的方法和系统中,模板要么预先存储在系统的本地存储器中,要么与所提交的每一个表单一起被提供。但是,在某些应用中,在提交表单时,正在被处理的表单的模板是无法在系统本地得到的。
本发明的实施例提供了用于处理纸质表单的方法和系统,其中该纸质表单的模板被存储在表单处理系统外部的远程存储位置。举例来说,该远程位置可以包括表单始发者的网站。在表单中嵌入对模板进行标识的信息。标识信息通常表示可以找到相应模板的远程存储位置的网络地址。当提交已填写纸质表单来进行处理时,该系统将会提取标识信息,然后对远程存储的模板进行检索,以便在处理已填写表单的过程中加以使用。
与在本地存储模板的已知方法和系统不同,这里描述的方法和系统使得能够处理从不同来源发起并且符合种类广泛的模板的纸质表单,并且其中某些模板有可能随时间而改变。此外,如以下将表明的,通过使用远程存储的模板,还可以为表单始发者和接收方提供显著的操作灵活性。
系统描述
图1是示意性地描述根据本发明实施例的纸质表单处理系统20的框图。系统20接受手填和/或键入的不同格式的已填写纸质表单24。该系统提取表单中传达的信息,然后,可以将该信息存储在数据库中,显示给用户,提供给另一应用或系统,或者采用其他方式加以使用。
每一个纸质表单都符合相应的预定义模板26。该模板包含了模板信息,其中该模板信息通常定义的是表单的布局相关属性和内容相关属性。举例来说,模板信息可以包括表单字段名称,以及字段的位置坐标和大小。作为补充或备选,模板信息可以包括每一个字段中的期望字符类型、格式或范围,例如数字或字母数字字符、单个数字、整数或日期格式。
在某些实施例中,模板信息包括与在表单字段中填写的信息相关的有效性规则。例如在发票表单中,有效性规则可以规定:在TOTAL(总计)字段中填入的条目应该等于在SUBTOTAL(小计)字段中填入的条目加上8%的州税。如下所述,表单处理系统经常会使用模板信息来提高表单获取的效率和精度。
在某些应用中,表单模板可以存储并且保持在与表单处理系统不直接关联的远程位置,而不是在本地存储模板。例如,系统20可以包括发票处理应用,其中某个组织从多个供应方获取商品或服务。这些供应方将纸质发票提供给这个组织,该组织则对发票进行处理,以便支付其费用。这个组织使用了表单处理系统20来处理其接收到的发票。
在示例性发票处理应用中,每一个供应方都可以使用不同的发票模板。该组织可以接收来自多个供应方的类型广泛的不同发票格式。某些供应方可以使用一种以上的发票模板。某些供应方则有可能是过去未从其接收过发票的首次供应方。发票模板还有可能在未与接收组织协商的情况下被修改。
可以理解的是,在此类应用中,表单处理系统很难对从不同来源始发的类型广泛的动态模板保持本地跟踪。此外,在某些情况下,较为理想的是在几个表单处理系统中使用特定供应方的发票模板。如下所示,这些困难可以通过使用远程存储的模板来克服。在下文中将会进一步描述与使用远程存储的模板相关联的附加益处以及操作灵活性。
上述发票处理应用作为示例性应用而被选择,以便论证对于使用远程存储的模板来处理纸质表单的需要。这里描述的方法和系统可以在任何其他合适的表单处理应用中使用,例如在针对手填的彩票表单、信用卡便条(slip)、旅馆收据以及赢利说明等等的处理中使用。
通常,对表单处理系统进行训练以识别和使用可能变化的大量表单模板是不切实际的。某些已知的方法尝试在没有模板帮助的情况下自动识别表单字段。在例如美国专利6,886,136和6,640,009以及美国专利申请公报2002/0111961中对这类方法的实例进行了描述。但是,这些方法通常速度很慢,成本很高并且容易出现差错。下文中描述的方法和系统则使用了一种不同的用于对存储在表单处理系统外部的远程存储位置(如表单始发者或第三方的网站)的表单模板进行检索的方法。
系统20包括表单处理器28,该处理器执行与接受和处理已填写纸质表单相关联的功能。表单处理器28包括输入设备32,该设备获取已填写纸质表单,并且将其转换成具有适当的计算机可识别图形格式的表单图像。在某些实施例中,设备32包括文档扫描仪或传真机。在其他实施例中,已填写纸质表单已经以图形电子格式提交到系统20。在这类实施例中,设备32包括用于接受图形图像的合适的输入接口。系统20还可以包括几个不同的输入设备32,以使系统能以不同方式接受表单。
输入设备32产生的表单图像由光学字符识别(OCR)模块36进行处理,该模块将会提取填写在每一个表单中的信息,并且将其转换成已识别文本。为此目的,OCR模块36可以应用本领域已知的任何适当的OCR处理。在某些实施例中,OCR处理会在识别处理过程中使用模板信息。在很多情况下,模板信息使OCR模块能够提高识别处理的精度和速度。例如,该模板信息可以指引OCR模块只在表单的某些区域搜索文本,由此加速转换处理。另举一例,当模板信息定义了期望字符类型、值范围和/或有效性规则时,该信息将允许检测转换差错,由此提高识别精度。
在某些实施例中,特定表单的模板26保存在表单处理器28外部的远程存储位置,例如表单始发者的网站44。举个例子,保存在网站44的模板信息可以包含例如使用可扩展标记语言(XML)定义的表单字段描述。这类描述通常定义了每一个字段中的数据类型(例如数字、字母数字或布尔值)和允许值范围。模板信息可以包括每一个字段在表单上的位置坐标。此外,模板信息还可以采用印制在表单上的所有字段名称的准确格式来包含这些字段的名称,以便简化OCR模块对其实施的识别处理。作为补充或是备选,模板信息可以包括样本表单的高质量扫描图像,以及样本表单的电子表示(例如矢量表示)。另外如上所述,作为补充或备选,模板信息可以包括有效性规则列表。
表单处理器28包括网络接口40。在提交已填写纸质表单进行处理时,处理器28将会经由接口40与网站44进行通信,以便检索与所提交的表单相对应的模板26。通常,处理器28和网站44经由因特网之类的广域网(WAN)52进行通信。
一般来说,处理器28包含通用计算机,其中该计算机的软件将被编程,以便执行这里描述的功能。举例来说,该软件既可以以电子形式通过网络下载到计算机,也可以在CD-ROM之类的有形介质上被提供给计算机。此外,作为备选,处理器28的某些要素可以使用硬件或是软硬件部件的组合来实施。
通常,系统20可以包括任意数量的始发者网站44以及其他远程存储位置。每一个网站44都可以保持多个模板26,并且每一个模板都与始发者发布的特定类型的表单相对应。
在某些实施例中,网站44可以由第三方或标准化团体来运作。这类网站可以保持若干个始发者的模板以及多于一个的始发者使用的标准模板。例如,第三方组织可以提供一种在组织网站上张贴具有不同表单类型的模板的服务。该服务的用户将被准许访问这些远程存储的模板。
与使用本地存储的模板的方法和系统相比,通过保持远程存储的表单模板,可以为始发者和接收组织实现相当高的操作灵活性。处理器28可以处理类型广泛的不同表单,其中某些表单类型有可能会在没有在先训练的情况下随时间而发生变化。
始发者可以在任何时间对纸质表单和相关模板进行修改,而不用预先与接收组织进行协调。由此,模板很容易就可以保持最新。在某些情况下,表单始发者可以修改模板信息,而不修改已处于流通的纸质表单。
此外,远程存储模板的应用可以逐步引入,例如通过提供和/或使用仅仅一部分模板信息来引入。在某些实施例中,多个表单处理系统可以检索和使用远程存储的特定模板。
在某些实施例中,通过使用远程存储的模板,可以提供针对已处于流通的纸质表单的核实、验证和/或控制措施。举例来说,如果某种表单类型废弃,那么可以移除相应的模板,或者可以为模板信息添加一个废弃指示。在将已填写的废弃表单提交给系统20时,当处理器28试图检索其模板时,该处理器将被告知该表单已经废弃。举例来说,这种核实方法可以用于识别和拒绝伪造的支票。
表单处理方法描述
图2是示意性描述根据本发明实施例的纸质表单处理方法的流程图。在表单提交步骤60,该方法以表单处理器28接受已填写纸质表单24为开始。输入设备32将纸质表单转换成表单图像,并且将该图像提供给OCR模块36。在这个阶段,处理器28并不具有与表单始发者的标识或是关联于该表单的模板相关的先验信息。
在标识提取步骤62,处理器28分析已填写表单,并且从该表单中提取标识信息。该标识信息通常规定了可以找到表单模板的远程存储位置的网络地址。例如,该标识信息既可以采用统一资源定位符(URL)的形式来规定地址,也可以采用始发者网站44或是存储有相关模板的其他服务器的网际协议(IP)地址的形式来规定地址,还可以采用本领域已知的其他任何适当的形式来规定地址。
作为备选,当标识信息没有规定此类地址时,处理器28能够通过识别与表单始发者相关的信息来确定远程存储位置,其中举例来说,该信息可以是印制在表单上的公司名、标志、电话和/或传真号码。根据该标识,处理器能够确定模板的远程存储位置的网络地址。此外,该标识信息通常还包括用于标识特定表单模板的模板标识符或代码。
在某些实施例中,标识信息是以印制在表单上的相互约定的图形编码格式(例如条形码)来进行编码的。(在以下的图3A和3B中示出了例示性的一维和二维条形码图像)。该条形码可以印制在表单上的便利位置,在某些情况下被印制在表单的背面。其他已知的编码方法同样也可以用于这个目的,例如半色调编码或磁墨水字符识别(MICR)。
作为备选,标识信息可以作为文本信息并使用约定的公用术语印制在表单上,这种术语使得OCR模块能够容易地标识该信息。举例来说,在表单顶部可以印制一行文本,如“URL:www.orginatorname.com,FORM_ID:76543”。OCR模块36可以从该文本行中提取恰当的URL和模板标识符。一般来说,标识信息既可以由OCR模块提取(例如在使用条形码或文本信息时),也可以由输入设备提取(例如在使用MICR时)。
现在,在模板检索步骤64,处理器28将会使用所提取的标识信息来检索与所提交的表单相对应的模板。处理器28根据标识信息指示的地址来与恰当网站44进行通信。从该网站中,处理器28将会检索标识信息中指定的模板标识符所标识的模板。
然后,在表单处理步骤66,处理器28将会使用检索到的模板来处理所提交的表单。通常,OCR模块36使用模板信息来标识字段坐标。在这些坐标上,OCR模块将会识别已填写表单的文本条目,并且将其转换成已识别文本。然后,对照在检索到的模板中规定的字符类型、值范围和/或有效性规则来核实这些已识别文本。作为补充或备选,处理器28可以将其他任何适当的处理功能应用于所提交的表单。
在某些实施例中,处理器28可以选择使用仅仅一部分模板信息。
在某些情况下,只有一部分模板信息是远程存储于网站44中的。对处理器28来说,模板信息的其他部分有可能是预先已知的,或者这些信息有可能必须根据表单本身来确定。非常理想的是,如果部分使用和/或存储模板信息,则可以在与其他表单处理方法并行的情况下渐进地引入远程存储的模板。在某些实施例中,当在远程位置仅仅存储模板信息的一部分时,可以例如使用条形码将模板信息的其他部分编码和印制在表单上。
在某些实施例中,整个模板信息全都编码在印制于表单之上的计算机可读符号中。举例来说,该计算机可读符号可以包括二维条形码。在这些实施例中,处理器28对计算机可读符号进行解码以提取模板信息,而不用检索任何远程存储的信息。该符号可以印制在表单的正面或反面的任何便利位置。该模板信息可以包括模板标识符。
图3A和3B是根据本发明实施例的用于表单处理的条形码图像。图3A显示的是示例性一维条形码图像70。这种一维编码能够传递大约15字节的信息,由此主要用于对数字索引进行编码。
图3B示出了依照公知的PDF417标准的示例性二维条形码图像74。这种二维条形码的大小大约是1平方英寸,并且可以编码多达2710个字符或字节的信息。举例来说,如果较为理想的是只在远程存储模板信息的一部分,并且将模板信息的其他部分内置在表单自身当中,那么可以结合上文中的图2的方法一起来使用二维条形码。
举个例子,下文中的文本示出了可以编码在诸如图像74之类的二维条形码图像之中的模板定义:
TaxYear N 100,50,300,100
BB N 108,243,216,335
BC_EADDRESS C 96,459,305,513
BC_ECITY A 108,616,383,678
BC_ENAME A 96,784,228,882
BC_ESTATE A 102,997,398,1054
BC_EZIP N 96,1157,293,1238
BD N 106,1361,210,1447
W2_3RDPARTY_FLAG B 94,1579,273,1645
W2_FED_WHN 105,1794,380,1878
W2_MEDICARE_WA GES N 106,2013,404,2092
W2_MEDICARE_WH N 103,2230,251,2324
W2_PENSIONPLAN_FLA G B 96,2470,243,2536
W2_SS_WAGES N 90,2670,206,2728
W2_SS_WHN 104,2835,211,2924
W2_STA TUTORY_FLA G B 102,3026,300,3098
W2_WAGES N 98,3200,300,3289
在以上文本中,每一行都定义了表单中的某一个字段。第一列规定的是字段名。每一行中的第二个条目规定的是字段类型,其中N表示数字字段,A表示字母数字字段,B表示布尔值字段或标志。剩余的四个条目通过给出字段两个对角的坐标(以毫米为单位)而规定了字段在表单中的位置。例如,用TaxYear表示的字段是位于由纸质表单上的拐角坐标(100,50)和(300,100)所限定的矩形之中的数字字段。
虽然这里描述的实施例主要通过检索远程存储的模板来解决纸质表单处理的问题,但是,这里描述的方法和系统还可以用于处理符合模板的其他类型的纸质文档和对象。
这里描述的方法和系统还可以用于将电子表示的表单(E-form)从一种格式或标准转换成另一种格式或标准。这种转换既可以使用远程存储的转换模板来进行,也可以使用源和目标E-form的远程存储模板来进行。
由此可以预见,上述实施例是作为示例而被引证的,本发明并不局限于上文中具体示出和描述的内容。相反,本发明的范围不但包含了上述各种特征的组合和子组合,而且还包含了本领域技术人员在阅读上文的描述时所能想到并且在现有技术中并未公开的上述各种特征的变化和修改。

Claims (24)

1.一种用于处理表单的计算机实现方法,包括以下步骤:
在具有本地存储器的计算机系统上接受符合模板的表单;
使用该计算机系统从该表单中提取标识信息,该标识信息指示的是存储有模板的远程存储位置相对于该计算机系统的网络地址;
响应于标识信息,通过与远程存储位置进行通信来检索模板;以及
响应于检索到的模板,对表单进行处理。
2.根据权利要求1所述的方法,其中计算机系统与第一组织相关联,并且其中远程存储位置与不同于第一组织的第二组织相关联。
3.根据权利要求1所述的方法,其中提取标识信息的步骤包括以下各步骤中的至少一个:
对经过图形编码的图像进行解码;以及
使用光学字符识别(OCR)处理来识别文本信息。
4.根据权利要求3所述的方法,其中经过图形编码的图像包括用于对标识信息进行编码的条形码图像。
5.根据权利要求1所述的方法,其中提取标识信息的步骤包括:除了网络地址之外,还提取用于标识模板的标识符;并且其中检索模板的步骤包括:使用该标识符从存储在远程存储位置处的多个模板中选择远程存储位置中的模板。
6.根据权利要求1所述的方法,其中模板包括模板信息,其中所述模板信息的一部分被内置在表单中,并且其中提取标识信息的步骤包括:除了从远程存储位置检索模板之外,还从表单中提取所述模板信息的所述部分。
7.根据权利要求1所述的方法,其中提取标识信息的步骤包括:通过识别表单中与模板始发者相关的信息来确定远程存储位置的网络地址。
8.一种用于处理表单的计算机实现方法,包括:
将模板信息编码在与表单相关联的计算机可读符号中,其中该模板信息包括与模板字段相关联的几何信息以及与模板字段内容相关联的内容相关信息中的至少一项;
接受符合该模板的表单;
从表单中解码出计算机可读符号,以提取模板信息;以及
响应于所述提取的模板信息来处理表单。
9.根据权利要求8所述的方法,其中计算机可读符号包括条形码图像。
10.根据权利要求8所述的方法,其中模板信息还包括用于标识模板的标识符。
11.根据权利要求8所述的方法,其中对模板信息进行编码的步骤包括:将用于指示远程存储位置的网络地址的标识信息编码在计算机可读符号中,其中该远程存储位置存储了所述模板的至少一部分,并且其中对表单进行处理的步骤包括:通过经由广域网(WAN)与远程存储位置进行通信来检索所述模板的所述至少一部分。
12.一种计算机可读表单,包括印制有模板并且印制有计算机可读符号的页面,该计算机可读符号对模板信息进行编码,该模板信息包括与模板字段相关联的几何信息以及与模板字段内容相关联的内容相关信息中的至少一项,由此,当接收到表单的图像时,使得计算机能够从符号中提取模板信息,并使用该模板信息来重构模板。
13.根据权利要求12所述的表单,其中该计算机可读符号包括条形码图像。
14.根据权利要求12所述的表单,其中计算机可读符号还对标识模板的标识符进行编码。
15.根据权利要求12所述的表单,其中计算机可读符号还对用于指示远程存储位置的网络地址的标识信息进行编码,并且所述远程存储位置存储有所述模板的至少一部分,由此使得计算机能够从符号中提取标识信息并且通过借助广域网(WAN)与远程存储位置进行通信来检索所述模板的所述至少一部分。
16.一种用于处理表单的设备,其中该设备能够与被配置成接受表单的输入设备以及网络接口进行协作,并且该设备包括:
处理器,它被配置成:
从表单中提取标识信息,该标识信息指示的是远程存储位置的网络地址,
响应于标识信息,通过使用网络接口与远程存储位置进行通信来检索模板;以及
响应于检索到的模板来对表单进行处理。
17.根据权利要求16所述的设备,其中该设备与第一组织相关联,并且其中远程存储位置与不同于第一组织的第二组织相关联。
18.根据权利要求16所述的设备,其中该处理器被配置成通过执行下列各项中的至少一项来提取标识信息:
对与表单相关联的经过图形编码的图像进行解码;以及
使用光学字符识别(OCR)处理来识别文本信息。
19.根据权利要求18所述的设备,其中经过图形编码的图像包括用于对标识信息进行编码的条形码图像。
20.根据权利要求16所述的设备,其中所述处理器被配置成:
除了网络地址之外,还提取用于标识模板的标识符;以及
通过使用该标识符从存储在远程存储位置处的多个模板中选择远程存储位置中的模板,来检索该模板。
21.根据权利要求16所述的设备,其中所述模板包括模板信息,其中所述模板信息的一部分被内置在表单中,并且其中该处理器被配置成:除了从远程存储位置检索模板之外,还从表单中提取所述模板信息的所述部分。
22.根据权利要求16所述的设备,其中该处理器被配置成通过识别表单中与模板始发者相关的信息来确定远程存储位置的网络地址。
23.一种用于处理表单的系统,包括:
一个或多个远程服务器,它们被配置成存储表单模板;以及
表单处理器,它被配置成:
接受符合模板的表单;
从表单中提取标识信息,该标识信息指示的是一个或多个远程服务器中的选定服务器的网络地址;
响应于该标识信息,通过与选定服务器进行通信来检索模板;以及
响应于检索到的模板,对表单进行处理。
24.一种计算机程序,包括当所述程序在计算机上运行时适于执行权利要求1~11中任一权利要求中的所有步骤的程序代码装置。
CNA2006800434131A 2006-01-04 2006-12-05 使用远程存储的模板的表单自动化处理 Pending CN101313299A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/325,039 2006-01-04
US11/325,039 US8150156B2 (en) 2006-01-04 2006-01-04 Automated processing of paper forms using remotely-stored templates

Publications (1)

Publication Number Publication Date
CN101313299A true CN101313299A (zh) 2008-11-26

Family

ID=38115864

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800434131A Pending CN101313299A (zh) 2006-01-04 2006-12-05 使用远程存储的模板的表单自动化处理

Country Status (6)

Country Link
US (1) US8150156B2 (zh)
EP (1) EP1969491A2 (zh)
JP (1) JP5090369B2 (zh)
CN (1) CN101313299A (zh)
TW (1) TW200805085A (zh)
WO (1) WO2007077076A2 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102331914A (zh) * 2010-05-24 2012-01-25 株式会社Pfu 表单处理系统、ocr装置、表单制作装置及其处理方法
CN105488199A (zh) * 2015-11-27 2016-04-13 努比亚技术有限公司 混合表单处理方法、装置以及移动终端
CN105930313A (zh) * 2016-04-13 2016-09-07 平安科技(深圳)有限公司 处理通知信息的方法和装置
CN107040592A (zh) * 2017-03-31 2017-08-11 南京钧元网络科技有限公司 一种手持式一站式检测服务系统及方法
CN107423944A (zh) * 2017-03-31 2017-12-01 南京钧元网络科技有限公司 一种便携式一站式检测服务系统及方法
CN110210455A (zh) * 2019-06-18 2019-09-06 石家庄捷弘科技有限公司 一种打印内容格式化提取方法
US20220269852A1 (en) * 2021-02-24 2022-08-25 Think Research Corporation Systems, methods and devices for structured dynamic electronic forms

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050097046A1 (en) 2003-10-30 2005-05-05 Singfield Joy S. Wireless electronic check deposit scanning and cashing machine with web-based online account cash management computer application system
US7979569B2 (en) 2005-12-01 2011-07-12 Firestar Software, Inc. System and method for exchanging information among exchange applications
US8300261B2 (en) * 2006-02-24 2012-10-30 Avery Dennison Corporation Systems and methods for retrieving printable media templates
JP4810287B2 (ja) * 2006-04-13 2011-11-09 キヤノン株式会社 データ処理装置及びそのデータ登録方法
US20070288254A1 (en) * 2006-05-08 2007-12-13 Firestar Software, Inc. System and method for exchanging transaction information using images
JP4237215B2 (ja) * 2006-09-14 2009-03-11 シャープ株式会社 画像読取システム、サーバ装置、画像読取装置、および端末装置
US7873200B1 (en) 2006-10-31 2011-01-18 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US8708227B1 (en) 2006-10-31 2014-04-29 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
JP4626604B2 (ja) * 2006-10-31 2011-02-09 富士ゼロックス株式会社 情報処理装置及びプログラム、画像履歴管理装置及びプログラム、及び画像履歴管理システム
US10380559B1 (en) 2007-03-15 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for check representment prevention
US8950673B2 (en) * 2007-08-30 2015-02-10 Symbol Technologies, Inc. Imaging system for reading target with multiple symbols
US9058512B1 (en) 2007-09-28 2015-06-16 United Services Automobile Association (Usaa) Systems and methods for digital signature detection
US8108764B2 (en) * 2007-10-03 2012-01-31 Esker, Inc. Document recognition using static and variable strings to create a document signature
US9898778B1 (en) 2007-10-23 2018-02-20 United Services Automobile Association (Usaa) Systems and methods for obtaining an image of a check to be deposited
US9159101B1 (en) 2007-10-23 2015-10-13 United Services Automobile Association (Usaa) Image processing
US9892454B1 (en) 2007-10-23 2018-02-13 United Services Automobile Association (Usaa) Systems and methods for obtaining an image of a check to be deposited
US10380562B1 (en) 2008-02-07 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for mobile deposit of negotiable instruments
US10504185B1 (en) 2008-09-08 2019-12-10 United Services Automobile Association (Usaa) Systems and methods for live video financial deposit
US10956728B1 (en) 2009-03-04 2021-03-23 United Services Automobile Association (Usaa) Systems and methods of check processing with background removal
US8656273B1 (en) * 2009-07-07 2014-02-18 Intuit Inc. Unified data entry for generating multiple forms
US9779392B1 (en) 2009-08-19 2017-10-03 United Services Automobile Association (Usaa) Apparatuses, methods and systems for a publishing and subscribing platform of depositing negotiable instruments
US8699779B1 (en) 2009-08-28 2014-04-15 United Services Automobile Association (Usaa) Systems and methods for alignment of check during mobile deposit
JP5479083B2 (ja) * 2009-12-25 2014-04-23 キヤノン株式会社 画像処理装置及びその制御方法並びにプログラム
US20110205370A1 (en) * 2010-02-19 2011-08-25 Research In Motion Limited Method, device and system for image capture, processing and storage
EP2362327A1 (en) 2010-02-19 2011-08-31 Research In Motion Limited Method, device and system for image capture, processing and storage
US20110271173A1 (en) * 2010-05-03 2011-11-03 Xerox Corporation Method and apparatus for automatic filling of forms with data
US9129340B1 (en) 2010-06-08 2015-09-08 United Services Automobile Association (Usaa) Apparatuses, methods and systems for remote deposit capture with enhanced image detection
US8670618B2 (en) * 2010-08-18 2014-03-11 Youwho, Inc. Systems and methods for extracting pedigree and family relationship information from documents
US8724931B2 (en) * 2011-05-27 2014-05-13 Ebay Inc. Automated user information provision using images
US10552715B2 (en) 2011-10-15 2020-02-04 Jackson L. Crisp Personalized printed product and related method
US10380565B1 (en) 2012-01-05 2019-08-13 United Services Automobile Association (Usaa) System and method for storefront bank deposits
US8990112B2 (en) * 2012-03-01 2015-03-24 Ricoh Company, Ltd. Expense report system with receipt image processing
US10552810B1 (en) 2012-12-19 2020-02-04 United Services Automobile Association (Usaa) System and method for remote deposit of financial instruments
US9384180B2 (en) * 2013-04-10 2016-07-05 Xerox Corporation Methods and systems for processing filled forms
US11138578B1 (en) 2013-09-09 2021-10-05 United Services Automobile Association (Usaa) Systems and methods for remote deposit of currency
CN104516864A (zh) * 2013-09-30 2015-04-15 北大方正集团有限公司 一种报表生成方法及装置
US9286514B1 (en) 2013-10-17 2016-03-15 United Services Automobile Association (Usaa) Character count determination for a digital image
KR20160027419A (ko) * 2014-08-29 2016-03-10 삼성전자주식회사 정보에 기반하여 부가기능을 제공하는 방법
US9286283B1 (en) * 2014-09-30 2016-03-15 Coupa Software Incorporated Feedback validation of electronically generated forms
JP6488729B2 (ja) * 2015-01-29 2019-03-27 富士ゼロックス株式会社 記入フォーム提供装置、画像形成装置及びプログラム
US10402790B1 (en) 2015-05-28 2019-09-03 United Services Automobile Association (Usaa) Composing a focused document image from multiple image captures or portions of multiple image captures
US10120856B2 (en) * 2015-10-30 2018-11-06 International Business Machines Corporation Recognition of fields to modify image templates
US10713431B2 (en) * 2015-12-29 2020-07-14 Accenture Global Solutions Limited Digital document processing based on document source or document type
US11030752B1 (en) 2018-04-27 2021-06-08 United Services Automobile Association (Usaa) System, computing device, and method for document detection
JP7443012B2 (ja) * 2019-10-03 2024-03-05 キヤノン株式会社 メタデータを設定するための設定方法、プログラム、装置
US11900755B1 (en) 2020-11-30 2024-02-13 United Services Automobile Association (Usaa) System, computing device, and method for document detection and deposit processing
JP2022091577A (ja) * 2020-12-09 2022-06-21 株式会社リコー 情報処理装置、情報処理方法、プログラム、情報処理システム
US20220207268A1 (en) * 2020-12-31 2022-06-30 UiPath, Inc. Form extractor
CN117474502A (zh) * 2023-12-27 2024-01-30 国网浙江省电力有限公司金华供电公司 财务数据处理方法、系统及存储介质

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5060980A (en) * 1990-05-30 1991-10-29 Xerox Corporation Form utilizing encoded indications for form field processing
US5943137A (en) * 1991-07-22 1999-08-24 Cardiff Software, Inc. Unified method of creating and processing fax forms
US5317646A (en) * 1992-03-24 1994-05-31 Xerox Corporation Automated method for creating templates in a forms recognition and processing system
CA2129075C (en) * 1993-10-18 1999-04-20 Joseph J. Daniele Electronic copyright royalty accounting system using glyphs
US5754308A (en) * 1995-06-27 1998-05-19 Panasonic Technologies, Inc. System and method for archiving digital versions of documents and for generating quality printed documents therefrom
US6141659A (en) * 1998-05-12 2000-10-31 International Businss Machines Corporation Systems, methods and computer program products for retrieving documents from multiple document servers via a single client session
US6351259B2 (en) * 1999-05-27 2002-02-26 Wireless Note Systems, Inc. Kit for recording or transmitting information of a note in freehand
AU2001226366A1 (en) * 2000-01-11 2001-07-24 Workonce Wireless Corporation A method and system for form recognition and digitized image processing
US7054509B2 (en) * 2000-10-21 2006-05-30 Cardiff Software, Inc. Determining form identification through the spatial relationship of input data
JP2002163078A (ja) * 2000-11-29 2002-06-07 Canon Inc 情報処理装置、プリントシステム、情報処理方法及びプリント方法
TW535081B (en) * 2000-12-20 2003-06-01 Ibm Method and system of fulfilling requests for information from a network client
AU2002305477A1 (en) * 2001-05-10 2002-11-18 Ranco Incorporated Of Delaware System and method for performing diagnostics using a portable device
EP1280081A1 (de) * 2001-07-26 2003-01-29 Alcatel Verfahren zum Erbringen eines Dienstes zur Organisation von Begegnungen für Teilnehmer eines Kommunikationsnetzes, sowie Kommunikationsnetz, Diensterechner und Programmmodul hierfür
US20030023626A1 (en) * 2001-07-27 2003-01-30 Bretti Gregory J. Apparatus and method for creating customized business forms
US7426486B2 (en) * 2001-10-31 2008-09-16 Call-Tell Llc Multi-party reporting system and method
US7212301B2 (en) * 2001-10-31 2007-05-01 Call-Tell Llc System and method for centralized, automatic extraction of data from remotely transmitted forms
US7289685B1 (en) * 2002-04-04 2007-10-30 Ricoh Co., Ltd. Paper based method for collecting digital data
JP2003331216A (ja) * 2002-05-16 2003-11-21 Oki Electric Ind Co Ltd 帳票読取方法
AU2003282786A1 (en) * 2002-08-30 2004-03-19 Racom Products Modular analog wireless data telemetry system adapted for use with web based location information distribution method and method for developing and disseminating information for use therewith
US20040158740A1 (en) * 2003-02-04 2004-08-12 Fargo Electronics, Inc. Identification card production
US7391917B2 (en) 2003-02-13 2008-06-24 Canon Kabushiki Kaisha Image processing method
US20040237040A1 (en) * 2003-05-19 2004-11-25 Malkin Wayne Allan System and method of processing an electronic form using layered aspects
US7542160B2 (en) * 2003-08-29 2009-06-02 Hewlett-Packard Development Company, L.P. Rendering with substituted validation input
JP2005266848A (ja) * 2004-03-16 2005-09-29 Oki Electric Ind Co Ltd 帳票データ処理システム
US7492946B2 (en) * 2004-05-24 2009-02-17 Michael James Elder System, method and computer program for an integrated digital workflow for processing a paper form
US7920101B2 (en) * 2004-10-08 2011-04-05 Sharp Laboratories Of America, Inc. Methods and systems for imaging device display standardization

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102331914A (zh) * 2010-05-24 2012-01-25 株式会社Pfu 表单处理系统、ocr装置、表单制作装置及其处理方法
CN105488199A (zh) * 2015-11-27 2016-04-13 努比亚技术有限公司 混合表单处理方法、装置以及移动终端
CN105488199B (zh) * 2015-11-27 2019-02-12 努比亚技术有限公司 混合表单处理方法、装置以及移动终端
CN105930313A (zh) * 2016-04-13 2016-09-07 平安科技(深圳)有限公司 处理通知信息的方法和装置
CN107040592A (zh) * 2017-03-31 2017-08-11 南京钧元网络科技有限公司 一种手持式一站式检测服务系统及方法
CN107423944A (zh) * 2017-03-31 2017-12-01 南京钧元网络科技有限公司 一种便携式一站式检测服务系统及方法
CN110210455A (zh) * 2019-06-18 2019-09-06 石家庄捷弘科技有限公司 一种打印内容格式化提取方法
US20220269852A1 (en) * 2021-02-24 2022-08-25 Think Research Corporation Systems, methods and devices for structured dynamic electronic forms
US11822878B2 (en) * 2021-02-24 2023-11-21 Think Research Corporation Systems, methods and devices for structured dynamic electronic forms

Also Published As

Publication number Publication date
EP1969491A2 (en) 2008-09-17
JP5090369B2 (ja) 2012-12-05
US20070154098A1 (en) 2007-07-05
WO2007077076A2 (en) 2007-07-12
US8150156B2 (en) 2012-04-03
JP2009522675A (ja) 2009-06-11
WO2007077076A3 (en) 2008-01-17
TW200805085A (en) 2008-01-16

Similar Documents

Publication Publication Date Title
CN101313299A (zh) 使用远程存储的模板的表单自动化处理
US9378205B1 (en) System and method for managing and sharing pharmaceutical clinical trial regulatory documents
KR100980748B1 (ko) 혼합 미디어 환경을 생성 및 사용하는 시스템 및 방법
JP4829920B2 (ja) フォーム自動埋込方法及び装置、グラフィカルユーザインターフェース装置
EP0561606B1 (en) Method and system for labeling a document for storage, manipulation, and retrieval
US7240841B2 (en) Creating and using documents with machine-readable codes
US20010053252A1 (en) Method of knowledge management and information retrieval utilizing natural characteristics of published documents as an index method to a digital content store
US20130222860A1 (en) System and method for storing and retrieving digital content with physical file systems
JP2001184453A (ja) 帳票処理システムおよび帳票ファイリングシステム
US20110052075A1 (en) Remote receipt analysis
CN105825378A (zh) 一种订单支付方法、终端及服务器
CN104321738A (zh) 文档处理
WO2018176989A1 (zh) 信息推送方法和装置
US7623741B2 (en) System and method for transferring scanned imaging data to a personal imaging repository
JP4064152B2 (ja) 電子フォームの自動入力装置及び自動入力プログラム
CN1881213B (zh) 一种文档审计跟踪系统和方法
JP2005267571A (ja) マルチ言語対応機能を有するweb集荷システム
CN104424619B (zh) 信息处理设备和信息处理方法
CN111143404A (zh) 一种业务处理方法及装置
JP3325928B2 (ja) 電子メールシステム
CN102193623A (zh) 信息输入辅助设备和信息输入辅助方法
JP2006259947A (ja) 伝票を印刷するための情報処理方法
KR20220101450A (ko) 음성인식 애플리케이션을 활용한 큐알코드 스캔 주문 플랫폼 및 그 주문방법
JP7426008B1 (ja) 情報処理装置、情報処理方法及びプログラム
JP2006146830A (ja) 帳票処理システム、帳票処理方法および帳票処理プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20081126