CN101727572A - 使用文档特征来确保图像完整性 - Google Patents
使用文档特征来确保图像完整性 Download PDFInfo
- Publication number
- CN101727572A CN101727572A CN200810177822A CN200810177822A CN101727572A CN 101727572 A CN101727572 A CN 101727572A CN 200810177822 A CN200810177822 A CN 200810177822A CN 200810177822 A CN200810177822 A CN 200810177822A CN 101727572 A CN101727572 A CN 101727572A
- Authority
- CN
- China
- Prior art keywords
- image
- characteristic
- image file
- described image
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
可使用文档特征来验证档案中的图像完整性。本发明的实施例提供了一种通过确定文档特征来验证存储的文档图像的完整性的方法,所述文档特征也可以嵌入在图像文件中。在允许应用访问图像文件之前,可将来自图像分析的特征数据与存储的特征信息或嵌入的特征数据之一或二者进行比较。任选地,嵌入的数据可被加密。在示例性实施例中,所述数据可包括文档内容的光学字符识别的结果、描述所述图像的数据的长度、图像中特定颜色的像素的百分比或校验和。示例性的嵌入技术可包括那些使用标签图像文件格式(TTFF)首部、密写水印或图像伪影的技术。
Description
背景技术
金融机构已经建立了各种与证明货币交易的文档的交换相关的各种处理。在历史上,这样的文档已经利用磁性墨水进行了编码,以使得所述文档的信息能够被机器所读取。这样的文档由此被称为是磁性墨水字符识别(MICR)文档。MICR信息有时被称作MICR“代码线”,原因在于其以跨越支票底部的线出现。还研发了支票处理和分类系统,其中对支票或类似的MICR文档的图像进行电子捕获和存储。这样的图像可以被归档,使得利用从MICR读取得出的其伴随数据以及诸如捕获日期和时间之类的附加信息对其进行索引。
在高速支票处理中,会出现错误,为支票捕获的图像被存储并且利用不同帐户的MICR信息进行索引。典型地,这样的错误会由于分类和/或成像系统中一个支票的一半与另一个重叠的“背负(piggyback)”或在清除拥塞时未被正确恢复的图像而出现,由此导致正在被处理的图像和MICR代码线数据失去同步。现代银行通常为顾客提供在线银行系统,从而顾客能够检索其支票的存储图像。如果利用不正确的帐户信息对图像进行索引,则其会被不正确的顾客检索而导致隐私外泄(breach)。
为了检测各种缺陷,可商业获取的图像软件采用技术对图像进行算法分析并产生可重复的结果。这样的算法能够通过光学字符识别来确定图像数据的长度(例如,按照字节)、百分比黑色像素、校验和或图像中文档的内容(如果所述文档是支票,则诸如代码线)。这种分析的结果可被存储以便未来进行参考。
发明内容
本发明的实施例提供了一种在应用显示或使用图像或出于商业目的显示或使用图像之前,通过在图像文件中嵌入有关文档特征的数据并且将从其它来源得知的和/或在后续分析中确定的特征与嵌入数据相比校以进行匹配,来验证所存储文档图像的完整性的方法。
在一些实施例中,对捕获的文档图像进行分析来确定至少一个图像特征。可将描述至少一个图像特征的特征数据嵌入在表示所述图像的图像文件中,和/或可存储从所述分析得出的特征信息以用于后续参考。当应用为了显示或其它目的而请求使用图像文件时,在允许访问所述图像文件之前,可以将为所述图像存储的特征信息与嵌入的特征数据、通过后续分析新确定的特征数据之一(或这二者)进行比较。在一些实施例中,可以由请求所述图像的应用来执行验证。可基于所嵌入数据与所存储信息或根据图像分析新确定的特征数据的比较来进行该验证或任意其它验证。这样的比较在没有对所存储的特征信息的访问时是特别有用的。
根据所使用的文件格式,有多种方式将信息嵌入图像文件中。在一些实施例中,使用标签图像文件格式(TIFF),并且图像的信息被嵌入在TIFF首部中。密写水印和诸如周长带之类的图像伪影是本发明的实施例所能够使用的嵌入技术的其它示例。在一些实施例中,所述文档是诸如支票或类似的MICR编码文档之类的金融文档,并且所述特征可时应于文档的MICR代码线的光学字符识别。
任选地,所述特征数据可在嵌入到图像文件之前被加密。同样任选地,对于诸如支票之类的文档而言,可对所述文档进行分析来确定置信度得分,所述置信度得分表示在执行确定特征数据并将其嵌入图像文件的处理之前被存储来参考所述文档的标准代码线数据与图像中的代码线相匹配的可能性。如果置信度得分过低,则可中断所述处理,以避免将错误的文档放入余下的处理中的风险。
用来实施本发明的实施例的系统可包括图像管理平台,用于获取与所述图像相对应的图像文件,将图像的特征数据嵌入图像文件,并且提供例如与所存储的用于所述图像的特征信息的适当比较。示例实施例中的系统还可包括在功能上连接到所述图像管理平台的图像分析模块,被配置为请求所述图像文件并访问所述图像文件的至少一个应用,以及连接在所述图像管理平台和所述至少一个应用之间的消发送工具。
构成本发明的系统的计算资源与适当的计算机程序代码相结合能够通过维护以图像文件编码的存储介质来提供实施本发明实施例的手段,其中每个图像文件包括如图像数据所表示的图像本身,以及有关所述图像的嵌入信息。
附图说明
图1是用于本发明示例性实施例的高级别系统框图。
图2是图示根据至少一个示例性实施例的本发明的嵌入方法的流程图。
图3是图示本发明实施例的比较处理的细节的另一流程图。
图4是本发明至少一些实施例所使用的示例图像文件的示意性表示。
图5是图示本发明实施例所能够使用的方法的另一流程图。
图6是用于本发明使用图5的方法的实施例的详细系统框图。
具体实施方式
以下对各实施例的详细描述参见相应的附图,所述附图图示了本发明的特定实施例。具有不同结构和操作的其它实施例并未脱离本发明的范围。
如本领域技术人员将会意识到的,本发明可以作为方法、系统、计算机程序产品或以上的组合来实现。因此,本发明可采用全硬件实施方式、金软件实施方式(包括固件、常驻软件、微代码等)或通常在这里被称作“系统”的结合软件和硬件的实施方式的形式。此外,本发明可采用具有实现在介质中的计算机可用程序代码的计算机可用存储介质上的计算机程序产品的形式。
可利用任意适合的计算机可用或计算机可读介质。例如,所述计算机可用或计算机可读机制可以是电子的,磁的,光学的,电磁的,红外线的,或半导体系统、装置、设备或传播介质,但并不局限于此。计算机可读机制更为特定的示例(非排他性列表)可包括以下各项:具有一条或多条线路的电连接;诸如便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、紧密磁盘只读存储器(CD-ROM)、或其它光或磁存储设备之类的有形介质;或者那些诸如支持互联网或企业内部互联网的传输介质。要注意的是,由于能够例如通过纸或其它介质的光学扫描而电子获取程序并介质对其进行编译、解释或以适当方式进行处理,如果需要,还接着将其存储在计算机存储器中,所以所述计算机可用或可读介质甚至可以是其上印有程序的纸或其它适当介质。
在本文的上下文中,计算机可用或计算机可读介质可以是能够包含、存储、传输、传播或传送程序以便由指令执行系统、装置或设备使用或者结合它们使用的任意介质。所述计算机可用介质可包括具有以基带或作为载波的一部分实现的计算机可用程序代码的所传播数据信号。可使用任意的适当介质来传送所述计算机可用程序代码,包括互联网、有线线路、光纤电缆、射频(RF)或其它器件,但并不局限于此。
以下参考根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图图示和/或框图对本发明进行描述。将要理解的是,流程图图示和/或框图的每个框以及流程图图示和/或框图中框的组合可由计算机程序指令来实施。这些计算机程序指令可被提供给通用计算机、特殊用途计算机或其它可编程数据处理装置的处理器来产生机器,以使得经由计算机或其它可编程数据处理装置执行所述指令,创期于实施流程图和/或框图的一个或多个框中所指示的功能/动作的器件。
这些计算机程序指令还可被存储在计算机可读存储器中,其能够指示计算机或其它可编程数据处理装置以特定方式进行工作,以使得存储在计算机可读存储器中的指令产生制造的商品,其包括实施所述流程图和/或框图的一个或多个框中所指定的功能/动作的指令工具。
所述计算机程序指令还可以加载到计算机或其它可编程数据处理装置上以使得在所述计算机或其它可编程装置上执行一系列操作步骤来产生计算机实施的处理,以使得在所述计算机或其它可编程装置上执行的指令提供用于实施所述流程图和/或框图的一个或多个框中所指定的功能/动作的步骤。作为选择,计算机程序实施的步骤或动作可与操作者或人工实施的步骤或动作相结合以便于实施本发明的实施例。
术语“银行”和任意的类似术语在这里以其最为宽泛的含义来使用。对所讨论类型的交易和文档进行处理的金融机构可包括证券代理公司、信用合作社和在历史上不直接进行储蓄的其它类型的机构。甚至零售和其它服务行业以及制造业也可以对这里所公开的文档和/或数据进行处理。在这里使用诸如银行、“机构”或“金融机构”之类的术语意在包括所有这样的可能性。
这里涉及了许多术语来处理有关MICR编码文档的信息。该数据可存储在数据处理系统、计算机存储器和/或媒介中以便检索和操作。有多种方式来设计系统以容纳该信息的存储,以及诸如支票之类的文档的电子图像的存储。例如,该术语可涉及在通常已知的“支票图像管理系统”(CIMS)和“支票处理控制系统”(CPCS)中所存储的信息。这样的系统在银行业内是在金融数据处理领域中工作的人士所众所周知的。这样的数据处理系统在历史上已经由国际商业机器(IBM)公司所生产。今天,CIMS由美国德克萨斯州达拉斯的Carreker公司生产和销售。Carreker及其产品在金融服务业内是众所周知的。
索引信息也可以随电子图像一起存储在“图像现金运送单”(ICL)中以提供纸质文档的截切(truncation)。而且,这些系统和技术是金融信息技术领域的普通技术人员已知的。用于包含图像以及索引和理解所述图像所需的所有数据的现金运送单文件的一些已知的工业标准格式是美国国家标准化组织(ANSI)所发布的X9.37i格式和X9.100-180格式。
在一些示例实施例中所描述的支票图像可存储在短期图像档案和长期图像档案之一或二者中。出于这里所描述的示例性实施例的目的,短期档案是容纳图像及其相关索引/电子数据以提供临时存储工具的库,能够在移动到长期存储器之前由接口应用容易地从所述短期档案访问和修改图像和图像数据。该短期库能够驻留在主机计算机系统上或者基于客户端/服务器的环境中。长期图像档案是容纳图像及其相关索引/电子数据以其最终形式来提供图像和图像数据的永久存储的存储工具。术语“永久”调用了图像在被删除之前存在于档案中的时间周期;该时间周期将通过法律、顾客和行业参数来确定。长期工具/库可驻留在主机计算机系统上或基于客户端/服务器的环境中。
需要注意的是,本发明能够以包括能够被确定并嵌入用于文档本身的图像文件中的信息或文档特征的任意连续或索引文档来使用。这里所给出的示例性实施例涉及由典型的银行系统所处理的MICR编码的金融文档。在这样的情况下,所述文档的内容和至少一些所存储的信息对应于MICR代码线。然而,该环境仅是一种示例。当所存储的特征信息、有关文档的内容细节或来自后续分析的特征数据与所嵌入的特征数据不匹配时,本发明的实施例防止存储在文件中的任意类型文档的图像被用于商业目的。与在索引或系统中别处存储的有关文档特征的信息在这里可被称作“特征信息”,而嵌入数据或为来自算法分析的可能嵌入所产生的数据在这里可被称作“特征数据”。
图1表示根据本发明示例性实施例的高级别系统框图。系统100包括对通过企业的图像事务流程进行控制的图像管理平台102,其能够分派数据以及从可以请求图像的其它应用104和图像存储档案接收数据。在至少一些实施例中,这样的平台可以是具有适当的相关应用的主机计算机系统,在银行环境中,所述应用诸如之前提到的CPCS和CIMS。短期支票图像存储器106用于在图像被各种室内系统进行处理时存储所述图像和相关数据。
仍然参见图1,图像分析模块108包括(多个)分析算法并且可包括算子决策能力,这二者都用于对捕获设备110所创建的图像数据进行分析。提供了消息发送工具112以便在企业应用和平台之间进行通信。该消息发送工具可经由诸如安全企业内部互联网之类的安全的专用通信信道进行,或者经由本领域已知的公共互联网上的安全“管道”进行。长期图像档案114和相关的管理系统116提供长期的图像存储。该档案通常还提供在线银行顾客所回顾的图像。通常,如本领域中已知的,这样的档案由支票档案服务提供商进行维护。长期档案管理系统还具有相关的档案索引118,其中可以存储索引信息,并且在一些情况下可存储对应于所述图像的文档特征信息。在所述索引中存储的信息可被称作与所述档案中所存储的图像文件“相关联”地存储。
图2图示了示例性的嵌入和存档处理200的细节。与大多数流程图类似,图2将处理200表示为图示在示例性实施例中所执行的各个步骤或子处理的一系列处理框。图2中的处理200在框202开始。在框204,由诸如照相机或扫描仪之类的电子捕获设备捕获图像。在框206,对所述图像进行分析以便选择特征集,诸如字节长度、百分比黑色像素(或另一个选定颜色的像素)、文档内容(诸如通过光学字符识别(OCR))或校验和。在框208,将特征数据嵌入在数据对象中,所述数据对象在这种情况下为图像文件。任选地,要嵌入所述图像内的数据可以在嵌入之前在框210进行加密,以保护其不被包括可出于合法目的对所述图像进行处理的其它方的他人所访问。注意,在支票或其它金融文档的情况下,OCR所确定的数据可包括MICR代码线。
图2的示例中的加密可通过两个步骤的加密机制来完成。可首先使用例如基于日期而从密钥池中选择的私钥对所嵌入的数据进行加密。在所感兴趣的文档是支票的情况下,所述日期可以是入帐日期。这样的技术允许一系列密钥被用于数据加密。可接着使用基于图像大小从密钥池选择的单个私钥对该加密处理的结果再次进行加密。许多这些单个私钥可以是类似的。
仍然参见图2,在框208,可使用各种技术来嵌入数据。例如,标准的标签图像文件格式(TIFF)图像支持可被添加到标签目录的用户标签,允许在图像本身内保留用户特定信息。随后将参考图4讨论示例性TIFF数据嵌入技术的进一步细节。可使用其它数据嵌入技术,包括可见和近不可见的图像伪影,诸如像素的周长带或使用密写的数字水印覆盖。在框212,具有嵌入数据的图像被发送档案以便存储。在框214,所述图像被存储在图像档案中,并且所述特征信息被存储在所述档案的索引中。图2的处理200在框216结束。
图3图示了使用上述嵌入数据的示例性图像检索处理。处理300在图3的框302开始。在框304,由各种应用中的任意应用请求检索图像。在框306,从所述档案检索所述图像并且从档案索引检索描述信息。任选地,如果所述图像与改变图像的嵌入数据一起存储,则在框308将所述图像恢复到其原始状态。在框310,对所述图像进行分析以获取与存储时所获取的相同类型的特征数据。在框312,将来自档案索引的特征信息与所述分析结果相比较。在框314,如果所述数据与所述信息相匹配,则断定检索了正确的图像,并且所述图像及其嵌入的特征数据被提供到发起请求的应用。如果所述数据不匹配,则图像检索失败,并且所检索的图像不应被用于满足所述请求。框314的处理分支到框316,在那里向请求者或发起请求的应用通知所述问题。接着对于这样的图像的处理在框318结束。
仍然参见图3,在框320将所述图像发送到发起请求的应用。在框322,所述发起请求的应用针对与存储时相同的特征集对所接收的图像进行分析。在框324,提取所嵌入的特征数据。如果之前进行过加密,则可在框326对所述数据进行解密。在框328将所述分析结果与所嵌入的特征数据进行比较。如果在框330所述数据匹配,则在框332断定接收到正确的图像,并且所述应用可使用所述图像文件继续进行。对于当前图像的处理再次在框318结束。如果数据不匹配,则图像检索失败并且检索的图像不应由所述应用使用。处理从框330分支回到框316。
现在将给出说明如何在图像文件中嵌入数据的详细示例。出于该示例的目的,假设使用TIFF来存储金融文档的图像。TIFF被作为计算产业中的标准对待。TIFF规范由Adobe系统联合美国加利福尼亚的Mountain View发布。TIFF是用于存储和交换图像的基于标签的文件格式,其中图像还可包括标签形式的描述数据。TIFF首部中所包括的每个标签字段描述了后续图像数据的不同属性。
图4是可存储在计算机可读存储介质上的图像文件400的实施例的示意性图示。图像文件400包括首部402和图像数据404。在示例性实施例中,所述图像表示所处理的项目,例如支票,并且可以通过扫描进行获取。在本发明的示例性实施例中,如图4的首部402内的图例所示,首部402包括在所述首部的位置40000至40005中嵌入的特征数据。该数据可以以各种位置和方式置于所述图像文件内。这里所给出的细节仅是说明性示例。
如基于图4的进一步示例,假设本发明的实施例在支票内容的OCR结果形成特征数据的情况下使用。在TIFF规范版本6.0的注解中,跟随着如何布局所嵌入数据的一个示例。对于这些字段中的每一个而言,可保留破折号和所嵌入的空间以允许MICR线和印刷或印压在支票上的其它信息被精确地表示。前斜杠(/)可用作字段分隔符以指示一个字段的结束和下一字段的开始。
入帐日期:
Tag=40,000
Type=字节
N=8
格式为YYYYMMDD。
入帐序列号:
Tag=40,001
Type=字节
N=所述序列号中的字符数
任选地,可使用取决于入帐日期的可变密钥对该实施例中的入帐序列号进行加密。在一些实施例中,所述序列号的长度可达10个数位。
入帐量:
Tag=40,002
Type=字节
N=量字段中的字符数
任选地,可使用取决于入帐日期的可变密钥对入帐量字段进行加密。该字段将包含数字量,并且在至少一些实施例中,长度最大为10个数位。注意,所述量可以在MICR线上进行编码或不在MICR线上编码。作为数据校验过程的一部分,可根据MICR线的内容对该数值进行调节。
入帐账号:
Tag=40,003
Type=字节
N=帐号字段中的字符数
任选地,可使用取决于入帐日期的可变密钥对入帐帐号字段进行加密。示例性实施例中的该字段包含数字,并且在示例性实施例中,长度最大为14个数位。注意,所述限号可以在MICR线上进行编码或不在MICR线上编码。作为数据校验过程的一部分,可根据MICR线的内容对该数值进行调节。
入帐号由/中转编号(也称作“ABA号”)
Tag=40,004
Type=字节
N=ABA号字段中的字符数
任选地,在示例性实施例中可使用取决于入帐日期的可变密钥对该编号字段进行加密。在示例性实施例中,如果所述编号为“4×4”格式,则该字段包含具有嵌入破折号的数字ABA号。长度通常为9个数位。注意,ABA号可以在MICR线上进行编码或不在MICR线上编码。作为数据校验过程的一部分,可根据MICR线的内容对该数值进行调节。
MICR线:
Tag=40,005
Type=字节
N=表示MICR线的字符串的长度
任选地,可使用取决于入帐日期的可变密钥对MICR线字段进行加密。该字段包含处于支票上的实际MICR线,并且包含以下字段,这些字段全部是任选的并且可以在物理支票上出现(编码)或不在物理支票上出现(编码)。ABA字段是中转字段,并且Aux OnUs字段是指标准MICR的辅助OnUs字段,其被金融机构出于其自己的目的所使用。例如,辅助OnUs字段有时被作为帐单序列号使用。
-AuxOnUs
-外部处理控制字段(位置44)
-ABA
-OnUs
-量
作为以上的一种替换形式,可包括包含专用长度的字段的字节序列。例如,可嵌入以下字节序列以承载需要的数据。对于附加的所需信息可添加附加字段。
14字节-帐号
10字节-支票号码
10字节-序列号
11字节-量(分)
8字节-发布日期
8字节-支付日期“YYYYMMDD”
50字节-收款人姓名
10字节-银行编号
图5是示出本发明的一些示例性实施例可任选使用的处理的流程图。其中文档是在银行环境中被处理的支票,图5的处理可被用来在利用之前所描述的分析和嵌入进行处理之前,针对银行系统中所存储的MICR信息而对支票进行验证。处理500在框502开始。在框504,选择支票图像的种群以便由图像管理平台进行分析。该选择可基于工作类型、处理流程、数量、顾客类型或其它概况数据,旨在仅对必需的图像进行分析以满足顾客的要求。在框506,从短期支票图像存储器检索图像并提供给图像质量检查系统。
仍然参见图5,如“对于每个图像”循环框508所指示的,对于所选择图像的每个图像重复处理500的剩余部分。该表示并不意味着建议将根据可用的计算资源不对多个图像并行处理作为典型情形。在框510,利用代码线数据匹配软件对图像进行询问,产生包括匹配的相应置信度得分的数据。在框512,针对高置信度阈值对所述数据进行筛选(screen),所述高置信度得分阈值是高于预先设置的上限的数值。如果所述置信度得分高于该阈值,则根据本发明的示例性实施例进行数据嵌入和存档处理200。所述图像没有缺陷。如果在框516有更多图像要进行筛选,则在框518重复所述处理。否则所述处理在框520结束。
假设在图5的框512,所述置信度得分低于所述上限,则在框522针对可疑的置信度阈值筛选数据。在该实施例中,这样的数值下降到预先设置的极限以下,但是高于预先设置的阈值。这样的可疑图像被传送给操作员以在框524进行再检查,并且所述操作员可确定该图像是否与状码线数据不匹配。如果在框526不是,则在框514再次调用数据嵌入和存档处理。否则,如果所述图像有缺陷,则所述图像在框528成为异常处理的对象。
如图5的框528所示的异常处理可采用多种形式。在一些实施例中,可将描述所述缺陷的数据传送到档案系统,并且可将所述图像在图像档案中指定为不可检索而不进行进一步的处理。作为选择,可进行附加的人工投入,以便通过使该项目重新经过系统处理,基于图像的人工识别来手工校正数据等来尝试和修复所述问题。而且,对于当前图像的处理在框534结束。如果在框536没有更多图像进行处理,则处理在框538结束。如果还有更多图像,则处理在框540循环返回以处理下一图像。
仍然参见图5,如果正在处理的图像的置信度得分在框522不处于中间范围,则在框542确定所述得分是否低于预先确定的阈值。如果是,则能够安全地假设所述图像是有缺陷的,并且在框528进行适当的异常处理,而无需操作员进行再检查。否则,由于代码线数据匹配算法不能够对所述图像进行解释,所以不能计算置信度得分,并且在系统中在框544进行这样的指示。在这样的情况下,在框546再次向操作员显示所述图像,并且在框526进行之前所述的操作员决策处理。
应当注意的是,这里所使用的术语“阈值”和“极限”仅是出于便利,前者被用来表示在图5所示的处理的实施例中所使用的较低的置信度得分值,而后者被用于较高的置信度得分值。可通过工程决策来设置这些数值,以使得操作员对于给定操作的干涉减到最少。与实际置信度得分进行的比较是否包括或排除与所述极限和/或阈值相等的值同样是一种工程选择。还可以在本发明的范围之内研发一种仅使用一个截止值,并且通过接受更高比率的未标记的缺陷图像或被错误地指定为有缺陷的图像而完全消除操作员干涉的处理。
图6提供了本发明实施例可使用的示例性支票处理环境的细节。在图6的系统600中,进入纸质项目(在这种情况下是支票)在602示出。在例如为IBM3890高速读取器/分类器的高速分类器604对文档进行分类和读取。支票通过读取头捕获MICR数据并将其组织到存储字段中的捕获区域。对图像进行捕获并且将数据605经由连接608传送到计算机系统606。计算系统606作为图像管理平台。连接608可由各种类型的任意网络来提供,例如互联网协议(IP)网络或局域网(LAN)。在该示例中,计算系统606在存储介质610所表示的短期档案中存储图像和数据。根据本发明实施例的图像数据对象612(也被称作图像文件)被示意性表示为存储在短期档案存储介质610中。在其被成像后,纸质项目被归类到封袋(pocket)614中。被归类装盒的项目616接着被存储、转发到其它银行,或者在金融机构内进行适当传送。应当注意的是,在一些使用排他的基于图像处理的机构中,可能仅对归类项目616进行简单存储并最终销毁。
仍然参见图6,连接608还提供了通过外部器件(未示出)到长期存储档案618的连接。信息可经由诸如虚拟个人网络(VPN)连接或安全套接字层(SSL)连接之类的安全连接被转发到长期档案。不能过度强调图6的系统仅作为说明性示例提供。有多种文档分类系统可被用来提供适当的功能。大多数分类器典型的具有常规的文档转移机制,其将文档拉动到各个封袋中。所述分类器还捕获MICR数据,并且对文档的前面和背面进行扫描以捕获适当的图像,所述图像在后续被分析以获得特征数据。而且,所述长期档案可以不是外部的,而是处于企业内部,甚至直接连接到实现图像管理平台的计算机系统。虽然图6的计算平台606被示意性图示为“主机”计算机,但是假定这些设备近年来已经获得的处理能力,所述计算平台还可以是服务器、工作站或者甚至是桌面或手持计算机。
在图6中,另一存储介质620可包括执行本发明实施例的至少一部分的计算机程序代码624。还是在图6中,多个操作员终端628通过以太网330对接到计算机系统606。这些操作员终端被用来在如前所述的项目的置信度得分处于中间范围内的情况下再检查图像。具有其上驻留有计算机程序代码636的相关联存储介质634的服务器632也连接到以太网330。这些服务器和相关的计算机程序代码作为图像质量检查平台。在至少一些实施例中,服务器632实现为基于WindowsTM的平台,并且包括计算机程序代码来确定何时和如何将图像传送给操作员,并且经由适当的网络连接将具有校正数据的消息发送回计算机系统606。计算机程序代码624与系统中的其它计算机程序代码以及适当的硬件平台一起工作,来执行本发明示例性实施例的分析、数据嵌入和归档。该计算机程序代码还负责异常处理。
各种已知的OCR算法中的任意一种都可被应用于通过图6所示的服务器所进行的上述处理。可用的特定OCR产品已经被设计成对所印制的MICR字符进行光学确定和读取。如何将多于一种的算法的结果进行比较或者将算法的结果与所存储数值进行比较并进行与特定置信度间隔相关的确定也是已知的。一种实现其的方式是通过投票算法。光学字符识别是成熟技术,并且在数据处理领域中容易理解如何应用其来获取各种结果。多个不同的公司生产用于各种应用的OCR产品和系统。在典型应用中,60-80%的置信度得分可被用于下限,而95-98%的置信度得分可被用作上限,尤其是与诸如已知的E-13B字体之类的OCR兼容字体相匹配时更是如此。
以上所讨论的异常处理可包括在档案中设置图像不可检索的指示。可以以与典型的支票处理系统中所存储的其它信息相同的方式来指示图像的不可检索性和缺陷。正常情况下,MICR信息包括各种存储的数据字段,并且其在CIMS和CPCS习惯用语中被称作包括“用户字节”的“串”。例如,串指定项目为有效或为拒绝。在示例性CPCS系统中,被归类到封袋的良好项目在具有有效用户字节的CPCS内建立“I-String”。具有错误的项目可建立在相同的“I-String”上,但是具有其它类型的CPCS用户字节。这些存储的串可被用来指示何时以上述方式来检查图像,并且所述图像将在何时被下载到工作站以便由参考图像的操作员进行验证。用户字节可被定义为指示导致问题出现(例如,背负、图像质量问题、处理中断)的缺陷。用户字节还可定义何时在长期档案中应当将图像指定为不可检索。该数据可以以正常方式存储在图像管理平台中,并且然后可以自动生成消息并且将其发送到长期图像档案,以在包含MICR和与所存储图像相关的其它数据的数据结构中进行适当指示。所述信息可以分批的形式被存储并推送到所述档案中,或者与各个项目相关的消息可实时进行发送。这样的异常处理程序在于2006年10月26日提交的共同受让人的美国专利申请序列号11/553,269中有所描述。
以上所讨论的置信度数据是代码线识别和比校的结果。当图像质量检查平台对MICR字体的光学读取进行分析时,所述算法可能时字符不是100%确定。例如,所述算法可能不确定“8”是“8”-其可能是“3”。由于部分代码线的误读,在图像被标记为代码线缺陷之前,小百分比数字允许在OCR和MICR读取之间有所不同。所述算法在从0%到100%的置信度范围上对整体匹配计分。用户接着能够设置各个动作发生的阈值。为了提供用于问题管理和分析的分析数据,该置信度数据必须被顺序存储,以便所述图像事务管理平台来决定做什么。
附图中的流程图和框图图示了相据本发明各个实施例的系统、方法和计算机程序产品的可能实施方式的体系结构、功能和操作。在这点上,所述流程图或框图中的每个框可表示模块、分段、动作或部分代码,其包括用于实施(多个)指定的逻辑功能的一个或多个可执行指令或动作。还应当注意的是,在一些可选实施方式中,根据所涉及的功能,这里所描述的功能可能不按照所给出的次序发生。还将注意到的是,框图和/或流程图图示的每个框以及框图和/或流程图图示中框的组合可由基于硬件的特殊用途的系统来实施,或者由执行指定功能或动作的操作员来实施。
这里所使用的技术仅是为了描述特定实施例,并非意在对本发明进行限制。如这里所使用的,单数形式“一个”也意在包括复数形式,除非上下文另外明确指出。将要进一步理解的是,当在该说明书中使用时,术语“包括”和/或“包括着”表明存在所指出的特征、步骤、操作、元件和/或部件,但是并不排除存在或添加一个或多个其它特征、步骤、操作、元件、部件和/或其群组。此外,比较而言,诸如“以上”、“以下”、“较少”、“较大”的定量术语意在包含等价的概念,因此,“较少”不仅意味着严格的数学意义上的“小于”,而且意味着“小于或等于”。
虽然已经在这里图示和描述了特定实施例,但是本领域技术人员将意识到被计算为实现相同目的的任意配置方式可适于所示的特定实施例,并且本发明在其它环境中具有其它应用形式。该应用旨在覆盖本发明的任意适当形式或变化。以下权利要求绝非旨在将本发明的范围限制为这里所描述的特定实施例。
Claims (25)
1.一种计算机执行的确保文档档案中的多个图像的完整性的方法,所述方法包括:
对捕获的文档图像进行分析以确定至少一个图像特征;
与图像文件相关联地存储描述所述至少一个图像特征的特征信息;以及
响应于对所述图像的请求,将为所述图像存储的特征信息与根据后续分析新确定的特征数据和来自所述图像文件的嵌入特征数据中的至少一个进行比较,以便在允许对所述图像文件进行访问之前,验证所述图像文件的完整性。
2.如权利要求1所述的计算机执行的方法,进一步包括:
将所述特征数据嵌入所述图像文件;和
随后将来自所述图像文件的特征数据与存储的特征信息和根据后续分析新确定的特征数据之一进行比较,以进一步验证所述图像的完整性。
3.如权利要求2所述的计算机执行的方法,进一步包括在嵌入所述特征数据之前,对所述特征数据进行加密。
4.如权利要求2所述的计算机执行的方法,进一步包括在将所述特征数据嵌入所述图像文件之前,确定表示存储的代码线数据与所述图像中的代码线相匹配的可能性的置信度得分。
5.如权利要求2所述的计算机执行的方法,其中,所述图像的特征数据被嵌入标签图像文件格式(TIFF)首部、密写水印和图像伪影中的至少一个中。
6.如权利要求1所述的计算机执行的方法,其中,所述至少一个图像特征包括文档内容的光学字符识别结果、描述所述图像的数据的长度、图像中指定颜色的像素的百分比、以及校验和中的至少一个。
7.一种用于确保文档档案中的多个图像的完整性的计算机程序产品,所述计算机程序产品包括具有其中收录有计算机程序代码的计算机可读介质,所述计算机程序代码包括:
用于对捕获的文档图像进行分析以确定所述多个图像中的每一个的至少一个图像特征的指令;
用于与图像文件相关联地存储描述所述至少一个图像特征的特征信息的指令;以及
用于响应于对所述图像的请求,将为所述图像存储的特征信息与根据后续分析新确定的特征数据和来自所述图像文件的嵌入特征数据中的至少一个进行比较,以便在允许对所述图像文件进行访问之前验证所述图像文件的完整性的指令。
8.如权利要求7所述的计算机执行的方法,其中,所述计算机程序代码进一步包括用于对所述特征数据进行加密的指令。
9.如权利要求7所述的计算机执行的方法,其中,所述文档包括支票。
10.如权利要求7所述的计算机执行的方法,其中,所述计算机程序代码进一步包括用于使用标签图像文件格式(TIFF)首部、密写水印和图像伪影中的至少一个将所述特征数据嵌入所述图像文件的指令。
11.如权利要求7所述的计算机执行的方法,其中,所述至少一个图像特征包括文档内容的光学字符识别结果、描述所述图像的数据的长度、图像中指定颜色的像素的百分比、以及校验和中的至少一个。
12.如权利要求9所述的计算机执行的方法,其中,所述计算机程序代码进一步包括用于在将所述特征数据嵌入所述图像文件之前,确定表示存储的代码线数据与支票中的代码线相匹配的可能性的置信度得分的指令。
13.一种用于确保文档档案中的多个图像的完整性的装置,所述装置包括:
用于将描述至少一个图像特征的特征数据嵌入表示所述图像的图像文件中的部件;和
用于响应于对所述图像的请求,将来自所述图像文件的特征数据与存储的特征信息和根据后续分析新确定的特征数据中的至少一个进行比较,以便在允许对所述图像文件进行访问之前验证所述图像文件的完整性的部件。
14.如权利要求13所述的装置,进一步包括用于随后将来自所述图像文件的特征数据与存储的特征信息和根据后续分析新确定的特征数据中的另一个进行比较,以在请求所述图像文件的应用处进一步验证所述图像的完整性的部件。
15.如权利要求14所述的装置,进一步包括用于在嵌入所述特征数据之前对所述特征数据进行加密的部件。
16.如权利要求13所述的装置,进一步包括用于在将所述特征数据嵌入所述图像文件之前,确定表示存储的代码线数据与所述图像中的代码线相匹配的可能性的置信度得分的部件。
17.一种用于确保金融文档档案中的多个图像的完整性的系统,所述系统包括:
图像管理平台,其用来获取对应于所述图像的图像文件,对图像文件中的图像进行分析以获取图像特征数据,并且在允许对所述图像文件进行访问之前,将为所述图像存储的特征信息与分析得出的特征数据进行比较;
图像分析模块,其在功能上连接到所述图像管理平台以确定所述特征数据;
至少一个应用,其被配置成请求所述图像文件,并且服从于将为所述图像存储的特征信息与所述特征数据相比较的图像管理平台而访问所述图像文件;以及
消息发送工具,其连接在所述图像管理平台和所述至少一个应用之间。
18.如权利要求17所述的系统,进一步包括用来将所述图像文件提供给所述图像管理平台的短期图像档案。
19.如权利要求18所述的系统,进一步包括连接到所述消息发送工具的长期图像档案。
20.如权利要求19所述的系统,进一步包括长期图像档案索引。
21.如权利要求17所述的系统,其中,所述图像特征数据包括文档内容的光学字符识别结果、描述所述图像的数据的长度、图像中指定颜色的像素的百分比、以及校验和中的至少一个。
22.如权利要求17所述的系统,其中,所述图像管理平台进一步使用标签图像文件格式(TIFF)首部、密写水印和图像伪影中的至少一个,将所述图像的特征数据嵌入所述图像文件中。
23.一种利用文档档案的图像文件编码的计算机可读存储介质,所述图像文件包括:
图像数据;和
有关所述图像数据所定义的图像的嵌入特征数据,其中,所述嵌入特征数据被配置成与另外存储的有关图像的特征信息和后续确定的特征数据中的至少一个进行比较,以便在允许对所述图像文件进行访问之前验证所述图像文件的完整性。
24.如权利要求23所述的计算机可读存储介质,其中,所述图像文件为标签图像文件格式(TIFF),并且所述特征数据包括在TIFF首部中。
25.如权利要求24所述的计算机可读存储介质,其中,所述图像数据表示支票。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810177822A CN101727572A (zh) | 2008-10-20 | 2008-10-20 | 使用文档特征来确保图像完整性 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810177822A CN101727572A (zh) | 2008-10-20 | 2008-10-20 | 使用文档特征来确保图像完整性 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101727572A true CN101727572A (zh) | 2010-06-09 |
Family
ID=42448449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810177822A Pending CN101727572A (zh) | 2008-10-20 | 2008-10-20 | 使用文档特征来确保图像完整性 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101727572A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013020325A1 (en) * | 2011-08-10 | 2013-02-14 | Easy Printing Network Limited | A method for retrieving associated information using an image |
CN104487966A (zh) * | 2012-07-23 | 2015-04-01 | 惠普发展公司,有限责任合伙企业 | 文档分类 |
CN106033543A (zh) * | 2015-03-11 | 2016-10-19 | 株式会社理光 | 文档修改检测方法、文档原稿提供装置、文档复制件检测装置、以及文档修改检测系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1492338A (zh) * | 2003-10-10 | 2004-04-28 | 彤 刘 | 基于数字水印技术的数字图像复原方法 |
US6771795B1 (en) * | 2000-09-07 | 2004-08-03 | Sarnoff Corporation | Spatio-temporal channel for image watermarks or data |
CN1885341A (zh) * | 2006-07-07 | 2006-12-27 | 中山大学 | 一种用于图像认证的可逆水印方法 |
CN101059863A (zh) * | 2006-04-20 | 2007-10-24 | 刘瑞祯 | 一种认证水印的嵌入与检测方法及其系统和用途 |
-
2008
- 2008-10-20 CN CN200810177822A patent/CN101727572A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6771795B1 (en) * | 2000-09-07 | 2004-08-03 | Sarnoff Corporation | Spatio-temporal channel for image watermarks or data |
CN1492338A (zh) * | 2003-10-10 | 2004-04-28 | 彤 刘 | 基于数字水印技术的数字图像复原方法 |
CN101059863A (zh) * | 2006-04-20 | 2007-10-24 | 刘瑞祯 | 一种认证水印的嵌入与检测方法及其系统和用途 |
CN1885341A (zh) * | 2006-07-07 | 2006-12-27 | 中山大学 | 一种用于图像认证的可逆水印方法 |
Non-Patent Citations (2)
Title |
---|
SHUIHUA HAN ETC.: "Content-based image authentication:current status,issues,and challenges", 《INTERNATIONAL CONFERENCE ON SEMANTIC COMPUTING》 * |
陈明举等: "一种基于小波变换的图像完整性验证水印算法", 《信息与电子工程》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013020325A1 (en) * | 2011-08-10 | 2013-02-14 | Easy Printing Network Limited | A method for retrieving associated information using an image |
CN104487966A (zh) * | 2012-07-23 | 2015-04-01 | 惠普发展公司,有限责任合伙企业 | 文档分类 |
CN106033543A (zh) * | 2015-03-11 | 2016-10-19 | 株式会社理光 | 文档修改检测方法、文档原稿提供装置、文档复制件检测装置、以及文档修改检测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9652671B2 (en) | Data lifting for exception processing | |
US20190279170A1 (en) | Dynamic resource management associated with payment instrument exceptions processing | |
US8639062B2 (en) | Ensuring image integrity using document characteristics | |
US10229395B2 (en) | Predictive determination and resolution of a value of indicia located in a negotiable instrument electronic image | |
US20160379186A1 (en) | Element level confidence scoring of elements of a payment instrument for exceptions processing | |
CN108062668B (zh) | 基于后台图片加密识别的二维码支付方法与系统 | |
US11954934B2 (en) | Enhanced item validation and image evaluation system | |
Jha et al. | Automation of cheque transaction using deep learning and optical character recognition | |
JP5659505B2 (ja) | 真贋判定装置及び真贋判定方法 | |
US10049350B2 (en) | Element level presentation of elements of a payment instrument for exceptions processing | |
Dhanawade et al. | Open CV based information extraction from cheques | |
CN101727572A (zh) | 使用文档特征来确保图像完整性 | |
US20150120548A1 (en) | Data lifting for stop payment requests | |
US9823958B2 (en) | System for processing data using different processing channels based on source error probability | |
US20150120517A1 (en) | Data lifting for duplicate elimination | |
JP2007011656A (ja) | 文字認識システム及び文字認識方法 | |
US10115081B2 (en) | Monitoring module usage in a data processing system | |
Bogahawatte et al. | Online Digital Cheque Clearance and Verification System using Block Chain | |
US20240144728A1 (en) | Fraud detection for signed documents | |
Tornés et al. | Receipt Dataset for Document Forgery Detection | |
US11238686B2 (en) | Item validation and image evaluation system with feedback loop | |
US20240005684A1 (en) | Collecting images and metadata of fake identification documents in database and providing access thereto by other entities for variety of applications | |
US20230053464A1 (en) | Systems, Methods, and Devices for Automatically Converting Explanation of Benefits (EOB) Printable Documents into Electronic Format using Artificial Intelligence Techniques | |
krishna Dilipkumar | Medical Image Forgery Detection | |
US20210042713A1 (en) | Intelligent attribute spatial scanning system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1145101 Country of ref document: HK |
|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20100609 |
|
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1145101 Country of ref document: HK |