CN101925904A - 使用动态文档识别框架的文档验证 - Google Patents
使用动态文档识别框架的文档验证 Download PDFInfo
- Publication number
- CN101925904A CN101925904A CN2008801254120A CN200880125412A CN101925904A CN 101925904 A CN101925904 A CN 101925904A CN 2008801254120 A CN2008801254120 A CN 2008801254120A CN 200880125412 A CN200880125412 A CN 200880125412A CN 101925904 A CN101925904 A CN 101925904A
- Authority
- CN
- China
- Prior art keywords
- document
- doctype
- image
- data structure
- checker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012795 verification Methods 0.000 title claims description 44
- 238000000034 method Methods 0.000 claims abstract description 216
- 230000008569 process Effects 0.000 claims abstract description 138
- 238000012545 processing Methods 0.000 claims abstract description 35
- 230000008878 coupling Effects 0.000 claims description 41
- 238000010168 coupling process Methods 0.000 claims description 41
- 238000005859 coupling reaction Methods 0.000 claims description 41
- 238000012790 confirmation Methods 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 25
- 238000007639 printing Methods 0.000 claims description 20
- 230000014509 gene expression Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 4
- 239000012141 concentrate Substances 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 2
- 238000001429 visible spectrum Methods 0.000 claims 2
- 239000000463 material Substances 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 description 32
- 238000010586 diagram Methods 0.000 description 21
- 238000005516 engineering process Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000013480 data collection Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008034 disappearance Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000007650 screen-printing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000003703 image analysis method Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/20—Testing patterns thereon
- G07D7/202—Testing patterns thereon using pattern matching
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Technology Law (AREA)
- Image Analysis (AREA)
- Editing Of Facsimile Originals (AREA)
- Character Input (AREA)
- Collating Specific Patterns (AREA)
- Facsimile Image Signal Circuits (AREA)
- Facsimiles In General (AREA)
- Storage Device Security (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明所述的技术用于按照动态文档识别框架识别和验证安全性文档。例如,安全性文档验证设备包括接收文档捕捉图像的图像捕捉接口以及将多个文档类型对象按照所述动态文档识别框架存储在数据结构中的存储器。所述安全性文档验证设备还包括文档处理引擎,其通过选择性调用所述多个流程中的一个或多个而遍历所述数据结构,以将所述捕捉图像识别为所述多个文档类型对象中的一个。与传统识别技术相反,通过遍历按照所述动态文档识别框架存储的所述数据结构而执行的本识别方法可以更高效的方式提供更准确的识别结果,因为可以仅应用适用的流程来识别所述捕捉图像。在识别所述文档类型时,应用了一组一个或多个验证器来进一步确认其真实性。
Description
技术领域
本发明涉及使用灵活的文档验证框架对诸如护照、驾驶执照、出生证明或财务文档等安全性文档进行计算机辅助识别和验证。
背景技术
计算机辅助技术越来越广泛地用于从安全性文档捕获、识别、验证和提取信息。例如,ePassport阅读器等安全性文档阅读器更普遍地用于读取和确认安全性文档的真实性。安全性文档的例子包括护照、信用卡、身份证、驾驶执照、出生证明、商业票证和财务文档。对于某些安全性文档,ICAO(国际民用航空组织)提供了使用计算机辅助技术识别安全性文档的明确步骤。对于其它安全性文档,不存在指定计算机辅助技术可以使用的用于识别不符合ICAO的安全性文档的步骤的标准。
通常,在可确认给定安全性文档的真实性之前,必须首先识别安全性文档的类型。例如,某些现代的安全性文档阅读器支持多种不同类型的安全性文档,如由各州或各国颁发的护照。为了确认安全性文档是真实的护照,例如,首先必须确定待验证的护照是具体哪个国家的以及其版本。例如,与澳大利亚护照的验证相比,英国护照的验证可能需要不同算法的应用程序和/或对护照的不同部分进行分析。更具体地讲,为了验证不同的安全性文档,安全性文档阅读器可以采用多种算法,包括对文档大小、静态图像图案和/或从文档和/或存储介质特定位置(如条形码、机读区和RFID芯片)所采集的信息进行分析的算法。
首先识别安全性文档类型的方法对于不符合ICAO的文档可能存在巨大挑战。一种方法是要求操作人员在处理文档之前手动选择安全性文档的类型以确认其真实性。然而,这种方法劳动强度大,并且在处理大量安全性文档的环境下容易出错。
或者,可以应用某些计算机辅助技术尝试自动或半自动地识别安全性 00-文档的类型。然而,迄今为止此类技术在本质上通常是静态的(即硬性限定的)。也就是说,可以对文档验证系统进行静态的编程,以应用第一算法来对第一类安全性文档进行测试。如果该测试失败,该文档验证系统会应用第二算法来对第二类安全性文档进行测试。该静态流程顺序进行,直至安全性文档被识别或被拒绝为止。该静态方法的硬性本质和所需的大量处理时间无法很好地适合被设计成支持大量不同文档类型的文档验证系统,并且可能限制此类系统的扩展性。
发明内容
通常,本发明涉及用于按照可扩展的高效动态文档识别框架来识别和验证安全性文档(或更一般的制品)的技术。也就是说,描述了可在其中容易地定义不同类型安全性文档的可扩展的软件框架,并且该框架可易于放大以适应高效地识别和验证大量不同类型的安全性文档。此外,可以从一组可重复使用的共享文档识别软件模块中容易地添加和选择识别各文档类型所必需的算法。在一个实施例中,文档识别软件模块可以按逻辑划分为“分类器”、“校验器”和“验证器”。该文档识别框架包括一组按分层树形结构组织的节点,其横向结构基于可重复使用的文档识别软件模块的应用情况将文档分类成文档类型和子类型。
识别文档类型时,文档处理引擎会根据树形结构中各父节点处分类器的结果来选择性地遍历经过分层文档识别框架的路径。也就是说,一个或多个高效计算的分类器可以应用于分层文档识别框架中的各父节点,以确定是否遍历到该节点的任何子节点。分类器将未知文档的一般特性与表示子文档类型的子节点的特性进行比较。给定节点的分类器返回可包含零或表示可能的参照文档对象类型的多个子节点的子集(如以列表形式)。
当遍历分层文档识别框架时,计算能力更强大的校验器也可应用于子集的各子节点,以实施更多限制,从而进一步高度准确地确认安全性文档对于分类器所识别的子节点具有正确的特性。如本文所述,可以根据置信度或相似度确定子节点的评估顺序,并且可以选择相对于未知文档具有最高相似度的子节点。在一些实施例中,在可认为任何子节点可能会匹配未知文档之前,必须达到置信度水平或相似度的阈值。一旦进行了选择,子节点就将被视为父节点,并且以递归方式进行遍历流程,从而相对于新的父节点再次应用分类器和校验器。
到达叶节点时,此最终的父节点将被视为识别结果。此时,对所得的识别节点应用一组一个或多个验证器,以尝试确认安全性文档的真实性。验证器通常使用图像比较算法来将未知文档的任何安全性特征与一个或多个已知参照进行比较,以返回置信度水平或相似度。如果相似度超过真实性阈值,则认为未知文档经过校验是真实的。
这样,文档识别模块所定义算法的应用顺序(即框架被遍历的方式)根据正在识别的安全性文档的具体属性是动态的。此方法提供了可扩展的高效文档验证系统,其可容易地扩展以支持几百种甚至几千种不同类型的安全性文档。
例如,安全性文档的识别及后续验证可能涉及来自安全性文档的数据,如来自机读区(MRZ)、条形码、磁条、文本内容、加密图像或嵌入安全性文档内的射频识别(RFID)芯片的数据。根据本文所述的原理,安全性文档验证系统通过执行分层框架所定义的分类器和校验器遍历框架,以处理来自安全性文档的数据并且确定该安全性文档是否包含某些识别特性。框架的分层本质以及其使用可重复使用的文档分类器来识别文档类型的类别和子类别,使得即使在支持众多不同文档类型的情况下,也可快速而高效地识别安全性文档。因此本文所述的技术对于保持动态文档识别框架可能尤其有用,方法是缩小快速识别及后续确认安全性文档真实性所需的比较次数,尽管全球当前可用的安全性文档数量不断增加。
例如,本发明的技术可以内置在安全性文档验证设备中。该设备可以包括接收制品的捕捉图像的图像捕捉接口以及将多个文档类型对象存储在按照动态文档识别框架的数据结构中的存储器。安全性文档验证设备还包括文档处理引擎,文档处理引擎通过选择性调用这多个流程中的一个或多个而遍历数据结构,以将安全性文档识别为这多个文档类型对象中的一个。通常,数据结构包括树形数据结构,以在捕捉图像与文档类型对象之间进行显著更少的比较。此外,通过使用动态数据结构,例如树形数据结构,数据结构可以容易地扩展以涵盖数量不断增大的安全性文档,并且可以在工作时间中进行动态的调整以实时适应额外的数据结构。
在一个实施例中,一种方法包括接收未知文档的一个或多个捕捉图像,以及将多个文档类型对象存储在按照动态文档识别框架的数据结构中,其中这多个文档类型对象涉及多个用于从捕捉图像提取属性的递归流程,以将未知文档分类并验证为由文档类型对象中的一个所表示的文档类型。该方法还包括根据通过对捕捉图像应用这多个递归流程所提取的属性以可变的顺序遍历数据结构的文档类型对象,以及当遍历数据结构时将未知文档识别为这多个文档类型对象中的一个。
在另一个实施例中,安全性文档验证设备包括捕捉未知文档的一个或多个图像的图像捕捉接口以及将多个文档类型对象存储在按照动态文档识别框架的数据结构中的存储器,其中这多个文档类型对象涉及多个用于从捕捉图像提取属性的递归流程。该设备还包括根据通过对捕捉图像应用多个递归流程所提取的属性以可变的顺序遍历数据结构的文档类型对象的文档处理引擎,其中文档处理引擎遍历数据结构时将未知文档识别为多个文档类型对象中的一个。
在另一个实施例中,本发明涉及包含指令的计算机可读介质。指令使得可编程的处理器接收制品的捕捉图像,然后将多个文档类型对象存储在按照动态文档识别框架的数据结构中,其中这多个文档类型对象涉及多个流程。指令还使得处理器通过选择性调用这多个流程中的一个或多个而遍历数据结构,从而将捕捉图像识别为这多个文档类型对象中的一个。
附图和下文的具体实施方式详细描述了本发明的一个或多个实施例。根据本发明的具体实施方式、附图以及权利要求书,本发明的其它特征、目的和优点将显而易见。
附图说明
图1为示意图,示出了根据本发明的原理用于分析安全性文档12的示例性文档验证系统10。
图2为框图,示出了根据本发明的原理用于按照动态文档识别框架验证制品的示例性主机系统。
图3为流程图,示出了图1中文档验证系统的示例操作。
图4为流程图,更详细地示出了图2中主机系统的示例操作。
图5为框图,更详细地示出了图2中的文档识别框架。
图6为流程图,示出了遍历文档识别框架上时文档识别模块的示例操作。
图7A-7C为由文档识别框架的用户界面通过显示器提供给用户的窗口的屏幕截图。
图8A、8B为主机系统完成识别和后续验证之后由用户界面通过显示器提供给用户的窗口的屏幕截图。
图9为框图,更详细地示出了图2中主机系统的存储器结构的一部分。
图10为流程图,示出了遍历文档识别框架上以调用布局匹配识别流程时文档识别模块的示例操作。
图11A-11C为示例性图像,示出了文档识别模块执行布局匹配识别流程时捕捉图像的状态。
图12为流程图,示出了遍历文档识别框架上以调用Eigenimage文档匹配识别流程时文档识别模块的示例操作。
图13A-13C为示例性图像,示出了文档识别模块执行Eigenimage文档匹配流程时捕捉图像的状态。
图14A-14C为文档验证模块针对图像内特性示出捕捉图像和灰度变化曲线时的示例图像。
图15A-15D和16A-16C为文档验证模块示出样本打印技术实例及其分析结果时的示例图像。
图17A-17C显示在从206份没有使用符合ICAO的MRZ区的不同美国驾驶执照中识别和验证当前版本纽约州驾驶执照时系统具有的效率和高准确度。
具体实施方式
图1为示意图,示出了根据本发明的原理用于分析安全性文档12的示例性文档验证系统10。文档验证系统10包括连接到文档阅读器11(如ePassport文档阅读器)的主机系统20。文档阅读器11用作图像捕捉设备,以及确认安全性文档12是有效真实的安全性文档。如本文所述,文档阅读器11支持多种类型的安全性文档。作为验证的一部分,文档阅读器11首先识别插入设备中的安全性文档的具体类型。例如,安全性文档12可以是美国护照、美国各州的驾驶执照、美国各州的身份证、欧盟(E.U.)驾驶执照、欧盟身份证、世界各州或国家政府机构颁发的护照或身份证明文件、所有权文件、身份证和多种其它类型的文档。在识别安全性文档的类型之后,文档验证系统10可以进行验证以及从安全性文档12提取信息。
例如,文档验证系统10的计算机主机系统20可以用于指示文档阅读器11首先从安全性文档12的全部或一部分捕捉一个或多个图像的序列。接着,应用两段式流程,文档验证系统10首先识别安全性文档的类型,然后根据对捕捉图像数据的分析,可能结合从安全性文档获取的其它数据来确认安全性文档12是所识别类型的有效文档。例如,除了从安全性文档12捕捉的扫描图像数据,文档验证系统10还可以利用从一个或多个机读区(如条形码)接收的数据、从嵌入在文档内或固定在文档上的射频识别(RFID)芯片或由文档提供的其它信息来源接收到的数据。
如本文所述,计算机主机20为文档处理引擎提供操作环境,文档处理引擎利用可易于扩展和修改的动态文档识别框架来支持多种类型的安全性文档。也就是说,文档识别框架提供其中可对各种不同类型的安全性文档轻松添加、定义和使用识别算法的环境。必要时文档处理引擎可与框架进行交互,以调用各种算法进行分类并最终将安全性文档12识别为具体类型的文档,如特定机构颁发的并且具有后续验证所需的某些特性和布局特征的安全性文档。
文档验证系统10通过扫描受保护的文档以从安全性文档12的全部或一部分捕捉一个或多个图像的序列来开始识别安全性文档12的流程。接着,文档验证系统10遍历按照动态文档识别框架用于存储定义多个文档类型对象的数据的数据结构。多个文档类型对象以节点的形式分层设置,每个对象表示安全性文档类型的类别或子类别。每个对象可以涉及多个可执行的文档识别软件模块(即可执行的“分类器”、“校验器”和“验证器”)中的任一个(即包含其指针),这些文档识别软件模块提供分类、子分类以及最终识别和验证具体文档类型所必需的算法。例如,这些文档识别软件模块中的每一个通常执行能够确定文档的一个或多个属性的相关文档识别算法。根据具体的安全性文档12中是否存在所考虑的属性,处理引擎遍历文档框架以选择和应用后续分类器。示例性的文档识别软件模块包括Eigenimage文档匹配算法或文档布局匹配算法,二者均在下文中有更详细的描述。
遍历文档识别框架的数据结构时,文档验证系统10选择性地调用这多个文档识别软件模块中的一个或多个,以处理捕捉图像数据的部分和/或询问安全性文档12从而获得额外的数据。例如,识别文档类型时,文档验证系统10的文档处理引擎从分层文档识别框架的根节点开始,然后根据分类器在框架中各父节点处所定义算法的结果来选择性地遍历经过框架节点的路径。也就是说,一个或多个高效计算的分类器可以应用于分层文档识别框架内的各父节点,以确定是否遍历到该父节点的任何子节点的路径。这些分类器参考子节点所表示的子文档类型的特性,并且用于对路径选择进行一般比较。分类器将未知文档的一般特性与表示子文档类型的子节点特性进行比较。给定节点的分类器返回可包含零或表示可能的参照文档对象类型的多个子节点的子集(如以列表形式)。分类器可以按所链接索引的形式存储并且返回一组可能的参照文档对象类型。
遍历分层文档识别框架时,可以将与父节点、子节点或二者相关联的校验器应用于由更高级别的分类器所提取的属性,以进一步确认安全性文档对于分类器所选择的子节点具有正确的特性。校验器参考节点本身所表示的文档类型的特性,然后进一步用于识别流程,并且校验器指定的算法对此具体文档类型应用更严格的限制以得到正确的识别结果,这些算法可能比分类器指定的算法具有更强的计算能力。分类器和校验器相结合为平衡高速需求和准确度需求提供了有效而灵活的结构。如本文所述,可以根据置信度或相似度确定子节点的评估顺序,并且可以选择相对于未知文档具有最高相似度的子节点。在一些实施例中,在可认为任何子节点可能会匹配未知文档之前,必须达到置信度水平或相似度的阈值。一旦进行了选择,子节点就将被视为父节点,并且以递归方式继续进行遍历流程,以相对于新的父节点再次应用分类器和校验器。
到达叶节点(即在框架中没有任何子节点的节点)时,应用一组一个或多个验证器尝试确认安全性文档的真实性。验证器参考叶节点所表示的文档类型的特性,并且可比校验器或分类器所指定算法具有更强的计算能力,虽然这并非必需。验证器通常使用图像比较算法来将未知文档的任何安全性特征与一个或多个已知参照进行比较,以返回置信度水平或相似度。如果相似度超过真实性阈值,则认为未知文档经过确认是真实的。
这样,文档验证系统10遍历文档识别框架上并且选择性地调用文档识别软件模块以识别和最终验证未知文档。因此,动态文档识别框架所实现的流程是“动态的”,原因是该文档识别框架根据之前所调用的文档识别软件模块的结果指示文档验证系统10调用某些操作;分层结构内的开始点和流程的调用顺序根据正被识别的具体安全性文档而有所差别。也就是说,文档验证系统10可以例如随后应用第一、第二和第三操作来分析美国护照安全性文档12,但随后应用第一、第三和第五操作来分析美国驾驶执照安全性文档12,其中各操作单独确定安全性文档的仅一个或多个属性。就这一点而言,该技术不同于常规系统,常规系统不论进行验证的安全性文档12的类型如何,通常需要按预定顺序静态地应用完整的文档识别算法。正如下文将进一步描述的那样,此动态方面通过根据对捕捉图像自身的分析选择性地动态应用一组流程而有利于进行更高效和全面的安全性文档校验。
文档验证系统10可以将文档识别框架作为分层设置的树形数据结构存储在存储器、数据库或其它存储介质(图1中未示出)中。本文称为文档对象类型的数据结构用于表示树形数据结构内的各节点。父节点表示文档类型的类别或子类别,并可递归地被向下遍历进入分层结构的多个层。叶节点表示具体文档类型,如美国护照文档类型对象、美国驾驶执照文档类型对象或美国身份证文档类型对象。框架内的某些文档类型对象可以包括一个或多个已存储的图像或模板,以及一组清楚地描述一种文档类型区别于另一种类型的特定特性。例如,美国护照文档类型对象可能包括美国护照模板的图像以及一组限定机读区在美国护照模板图像底部的出现率的特性、描述图像在模板内位置的量度,以及在确定各种特性之间相对位置时指示的其它数据。
文档验证系统10可以遍历框架的数据结构,从而调用文档类型对象涉及的一个或多个可执行的分类器、校验器和验证器。取决于所调用的具体文档识别软件模块,文档验证系统10可以将文档类型对象与捕捉图像进行比较,或对图像数据和/或得自安全性文档的其它数据进行一些其它分析,以生成指示安全性文档12与类别、子类别或具体文档类型的匹配相似度的确定性值。如果确定性值超出针对与父节点相关的多个分类器和/或校验器的编程或计算出的最小确定性水平,文档验证系统10会从该父节点开始遍历多个经过框架的路径,直至安全性文档12在到达一个或多个叶节点时通过最终返回最大确定性值而被识别。
成功识别安全性文档12与多个所存储的文档类型对象中的一个相符之后,文档验证系统12会执行验证流程以确认安全性文档的真实性。例如,文档验证系统12可以分析捕捉图像,以确定安全性文档中是否存在一个或多个所存储的参照图像。如果安全性文档中存在参照图像,文档验证系统10可能提供安全性文档12已被正确验证的指示(如听觉或视觉指示)。如果捕捉图像中不存在参照图像,文档验证系统10会提供安全性文档12无法被自动验证并且可能被拒绝的指示。
在操作中,用户将安全性文档12放置在文档阅读器11的观察框架14上。观察框架14准确地将安全性文档12相对于文档验证系统10的其它元件布置。在图1的示例性实施例中,文档验证系统10包括用于照亮放置在观察框架14上的安全性文档12的光源。在一些实施例中,文档验证系统10可以包括不止一个光源,例如红外(IR)光源和/或紫外(UV)光源。文档验证系统10还包括用于从安全性文档12捕捉图像数据的图像捕捉设备。图像捕捉设备可以是CMOS图像传感器,例如具有像素阵列的电荷耦合装置(CCD)、相机、行扫描仪或其它光学输入装置。主机系统20可以与安全性阅读器11进行交互,从而发出命令以捕捉图像数据、询问RFID芯片或执行相对于安全性文档12的其它操作。光源的强度可以在最小值到最大值的强度范围内由主机系统20自动调节或根据用户输入进行调节。
用户将安全性文档12放置到观察框架14中之后,文档阅读器11会捕捉安全性文档12的一个或多个图像的序列。捕捉图像可以表示安全性文档12的全部或一部分,但通常捕捉图像表示安全性文档12的全部。图像捕捉设备11将捕捉图像数据传输到主机系统20以进行图像处理。由主机系统20处理过的捕捉图像可在与主机系统20相连的显示器(未示出)上显示以供检查。主机系统20可以包括例如计算机、笔记本电脑、移动个人数字助理(PDA)或具有分析捕捉图像的足够处理器和存储器资源的其它计算系统。在下文中,将对主机系统20的示例性配置和操作进行详细说明。
图2为示出示例性主机系统20的框图,该主机系统20可按照动态文档识别框架验证制品,例如图1中的安全性文档12,从而根据本发明的原理识别安全性文档12。主机系统20分析图像数据22和从文档阅读器11(图1)接收到的其它可选数据(如RFID数据),以动态地识别安全性文档12。
在此例中,主机系统20包括数据接口24,以从文档阅读器11接收数据(如图像和RFID数据)。数据接口24可以是例如用于与文档阅读器11进行通讯的串行或并行硬件接口。又如,数据接口24可以是通用串行总线(USB)接口。
如图2所示,文档识别框架34可以表示为具有多个节点的树形结构,其中节点表示安全性文档的类别、安全性文档的子类别或安全性文档的具体类型。文档识别框架34的各节点可以包括对一组文档识别软件模块41的一个或多个参照,文档识别软件模块包括分类器47、校验器48和验证器49,其中每个模块都包含定义用于检查安全性文档的一个或多个属性或特性的流程的可执行指令。例如,与父节点相关的其中一个分类器47可以确定在安全性文档的某个位置是否存在机读区(MRZ),从而将安全性文档的可能类型缩小到具体类别。与父节点或其子节点之一相关的其中一个检验器47还可处理MRZ,以便确认MRZ文本中是否存在文本标识符的具体序列。在这方面,检验器48确认文档树形分层结构中更高级别的分类器所提取的属性,例如是否存在文本标识符的以上具体序列,如“AU”,以进一步将可能的文档类型集缩小到澳大利亚文档。最终,在到达叶节点(即在框架中没有任何子节点的节点)时,应用该叶节点所涉及的一组一个或多个验证器49尝试确认安全性文档的真实性。
主机系统20包括提供布局编辑器30的用户界面28,用户(未示出)可由此编辑存储在数据库32中的数据。具体地讲,用户可以与布局编辑器30提供的图形用户界面进行交互,以编辑存储到数据库32的文档类型,从而扩展文档识别框架34以支持不同文档类型。例如,在某些情况下,用户可以与布局编辑器30进行交互,以手动指定用于插入文档识别框架34中的新文档类型对象。此时,用户可定义属性,用于定义类别、子类别或各个文档类型。此外,用户可以将待插入的文档对象与一个或多个新算法或现有算法相关联,从而存储为分类器47、校验器48和验证器49。
或者,主机系统20可以设置为“学习”模式,以在接收和处理图像数据和来自安全性文档新类型模板的其它数据22时,系统会自适应地更新文档识别框架34。在此模式下,主机系统20会处理数据并且将新文档类型对象自动插入与安全性文档新类型的任何已识别属性相符的文档识别框架34中。
因此,用户输入26可以与用户界面28进行交互,以指定编辑文档类型对象的命令,例如添加或移除与预定义文档类型对象相关的分类器47、校验器48和验证器49,从而手动或自动插入新文档类型对象,移除文档类型对象,重新排序文档识别框架的节点以区分分类器47、校验器48、验证器49的优先顺序的命令以及其它命令。这样,用户便可利用布局编辑器30来定制文档识别框架34,从而更快地识别安全性文档类型。
由数据接口24接收到的图像数据可以表示安全性文档12的全部或一部分的捕捉图像。如上文所述,图像数据可以包含一个或多个图像、文本、MRZ、条形码、水印或其它信息。主机系统20包括接收捕捉数据并且执行上述识别和后续验证流程的文档处理引擎36。在此例中,文档处理引擎36包括图像处理模块38和用以执行文档识别流程的文档识别模块40。文档处理引擎36还包括在识别后确认安全性文档真实性的文档验证模块42,以及从制品(如待校验和验证的安全性文档12)提取相关信息的数据收集模块44。具体地讲,数据收集模块44可以接合文档阅读器11来读取条形码、询问RFID芯片以及读取安全性文档12上的磁条,从而收集可能不包含在图像数据中的附加数据。
接收捕捉图像数据后,图像处理模块38可以调用图像预处理算法,以从捕捉图像数据生成质量更好的灰度图像、彩色图像或二进制图像。针对本文的目的,这些处理过的捕捉图像称为捕捉图像,而“捕捉图像”应解释为表示反映基础安全性文档12的任意图像,无论处理与否。图像处理模块38可以根据捕捉图像时所用光源的类型确定是否需要进行图像处理,如UV光源可能需要某些图像处理算法,或者根据捕捉图像的某些方面确定是否需要进行图像处理,如具有亮色文本的暗背景可能需要某些图像反转算法。一旦对图像数据进行了预处理,文档识别模块40就会进一步分析图像数据以及数据收集模块44获得的其它数据,以识别安全性文档的类型。
具体而言,在接收捕捉图像数据时,文档识别模块40遍历存储到数据库32的文档识别框架34,从而将安全性文档识别为文档识别框架34所支持的文档类型对象中的一个,或拒绝安全性文档。数据库32可以本地驻留在主机系统20的存储器或计算机可读介质中;然而,在其它实施例中,数据库32可以在主机系统20的远程并且通过网络连接或一些其它远程访问方法(如通过公共网络的虚拟专用网络)与主机系统20连接。数据库32可以包括任何类型的数据库,例如关系数据库,或者能够存储文档识别框架34的任何其它类型的存储器。
将文档识别框架34组织为树形数据结构以便于扩展。如下文更为详细的描述,文档识别模块40通过选择性调用多个分类器47、校验器48和验证器49而遍历文档识别框架34,以将安全性文档分类并且最终识别为存储在文档识别框架34中的多个文档类型对象中的一个。
遍历文档识别框架34之后,文档识别模块40可以将所识别的安全性文档类型传输到用户界面28,于是用户界面28可以通过显示器43将所选文档类型展示给用户,供用户确认。或者,可以不需要用户确认。在任何情况下,将安全性文档识别为具体文档类型对象之后,文档验证模块42开始进入验证阶段,如上文所述。在整个识别或验证阶段,数据收集模块44可以从数据库32请求的图像中提取信息。一旦得到验证,文档处理引擎36通常会将验证的结果传输到用户界面28,于是用户界面28将此结果展示到显示器43。显示器43可以包括液晶显示器(LCD)、平面显示器、等离子体显示器、阴极射线管(CRT)显示器或能够展示图形、文本和视频的任何其它显示器类型。
主机系统20还可以包括存储最近识别的文档类型对象的队列数据结构46(“队列46”)。因此,当例如将安全性文档12识别为美国护照文档类型对象时,文档处理引擎36可以将美国护照文档类型对象或其参照存储到队列46中。当接收到识别另一个安全性文档的请求时,遍历文档识别框架34以尝试其它可能之前,文档识别模块40可以首先尝试将安全性文档识别为队列46中所保存文档类型对象中的一个。在一些情况下,下一个识别的文档可以是同一文档的另一面。在这种情况下,文档处理引擎36会自动关联该信息并且将两组信息结合成一个输出。虽然在图2中分开显示,但队列46可以驻留在数据库32中。主机系统20可以包括能够存储队列数据结构的任何类型的存储器,例如随机存取存储器(RAM)、磁盘或硬盘、数字视频光盘(DVD)、光盘(CD)、只读闪存(ROM)和U盘。或者,文档处理引擎36可以改变文档识别框架的布置方式和/或遍历路径,以区分最近所识别的安全性文档类型的优先顺序。
图3为流程图,示出了图1中文档验证系统10的示例操作。首先,主机系统20将一个或多个文档类型对象存储到按照动态文档识别框架的数据结构,例如图2中的文档识别框架34。接着,用户将安全性文档12(如护照)置于图像捕捉设备11下方的观察框架14中(50)。主机系统20接收并存储安全性文档12的一个或多个捕捉图像的序列(52)。
一旦被存储,主机系统20就通过遍历文档识别框架34来识别捕获图像。主机系统20通过选择性地调用一个或多个文档识别软件模块41而遍历数据结构,以便将未知文档识别为存储在文档识别框架34中的多个文档类型对象中的一个(54)。动态文档识别框架指定准则以确保数据结构保持可扩展、灵活和高效。也就是说,动态文档识别框架指定用于遍历对象、编辑对象或从数据结构中删除对象、以及在数据结构中插入对象的协议,或更一般地说,指定用于保持文档类型数据结构32完整性的协议。
识别未知文档时(除非没有发现匹配且文档被拒绝),主机系统20可在验证流程中根据所识别的具体文档类型对象所特有的某些安全性特征的可用性来验证安全性文档(56)。例如,识别流程可能导致将安全性文档识别为美国护照文档类型对象。在验证流程中,主机系统20可以访问数据结构34内的美国护照文档类型对象,以确定涉及验证美国护照的安全性特征。主机系统20接着可以调用文档类型对象所涉及的正确流程来开始验证所有相关的安全性特征,方法例如读取MRZ、执行各种图像模板匹配算法,匹配算法包括搜索水印、反射徽章或其它此类标记以及扫描文本的一致性。一旦完成,主机系统20就可以通过显示器43向用户显示识别流程、验证流程或二者的结果以及其它所收集到的信息,或者生成任何其它合适的声音或视觉指示标记(58)。
图4为流程图,更详细地示出了图2中的主机系统20的示例操作。主机系统20通过分析安全性文档12的至少一幅捕捉图像来校验图1中的安全性文档12。如上文所述,主机系统20通过数据接口24接收安全性文档12的捕捉图像,以用于供文档处理图像引擎36进行预处理(60)。
文档处理引擎36包括图像处理模块38,其可确定捕捉图像是否需要进一步处理,从而有利于识别和验证流程(62)。在确定捕捉图像需要额外的图像处理时(“是”分支,64),图像处理模块38可以执行一个或多个图像加强算法以增强捕捉图像的质量(66),并且完成之后,将捕捉图像传输到文档识别模块40进行识别。如果不需要进一步的图像处理时(“否”分支,64),图像处理模块38直接将捕捉图像传输到文档识别模块40进行识别。
文档识别模块40通过从框架的根对象开始遍历文档识别框架34来启动识别流程(68)。一般来讲,文档识别模块40可以按照三层控制遍历文档识别框架34,以获得更高的性能。根据基于优先级的第一种遍历方法,文档识别模块40可以按照与存储在文档识别框架中的文档类型对象相关的优先级遍历文档识别框架34,其中优先级可以由用户预定义。根据基于队列的第二种遍历方法,文档识别模块40可以访问队列数据结构46以确定之前刚刚处理的文档类型对象,并且遍历这些存储在文档识别框架34中的文档类型对象。根据第三种动态遍历方法,文档识别模块40动态地遍历整个文档识别框架34。也就是说,文档识别模块40可以从文档识别框架34的根对象开始,调用在框架各父节点对象处所涉及的多个分类器47中的一个或多个。根据从调用这些分类器47接收的结果,文档识别模块40可以选择父节点的一个或多个子节点,向下遍历存储在文档识别框架34中的较低级对象。文档识别模块40可以应用与父节点或所选子节点相关的一个或多个校验器48,以确认安全性文档具有分类器所选路径的正确特性。
此遍历识别可以继续进行,直至文档识别模块40到达涉及与文档属性匹配的一组一个或多个分类器的叶节点,从而将捕捉图像识别为相对于存储在文档识别框架34中的多个文档类型对象为高于预定阈值的最佳匹配或满意匹配。
文档识别模块40可以应用(顺序或一前一后)任意前述遍历方法中的两种或多种。因此,文档识别模块40可以例如首先访问队列数据结构48,按照队列遍历数据结构,接着通过选择性地调用多个分类器47中的一个或多个动态地遍历数据结构34。
根据文档识别框架34的遍历,文档识别模块40将捕捉图像识别为存储在文档识别框架34中的多个文档类型对象中的一个(70)。如上文所述,动态地遍历文档识别框架34时,文档识别模块40可以计算确定性值并且将这些确定性值与其它确定性值或预指定的最小确定性值进行比较,以便正确地识别捕捉图像。一旦进行了识别,文档识别模块40就可以通过显示器43将所识别的文档类型对象与确定性值一起向用户显示以供确认(72)。
在完成识别并且用户确认之后,如果需要,文档识别模块40将捕捉图像与所识别的文档类型对象或其参照一起传输到文档验证模块42。文档验证模块42如上文所述进行验证流程,以确定安全图像12的真实性(74)并且通过显示器43显示此验证结果(76)。
图5为框图,更详细地示出了图2中的文档识别框架34。如图5所示,文档识别框架34包括树形数据结构;然而,文档识别框架34可以包括能够存储多个文档类型对象78A-78M(“文档类型对象78”)的其它数据结构类型。
在此例中,文档识别框架34包括根对象80、多个文档类型对象78和多个文档子类型对象82A-82M(“文档子类型对象82”)。此外,此树形结构可按子-子类型文档对象向下扩展,以及按相同构造更加递归地向下扩展。根对象80表示示例性树形文档识别框架34的根部,或更一般地说,如果按照上文所述的动态遍历方法独自遍历,即为文档识别模块40开始遍历的对象。根对象80保持将根对象80连接到各文档类型对象78的双向连接84A-84M(如指针)。文档类型对象78还保持将文档类型对象78连接到文档子类型对象82的双向连接84N-84Z。连接84A-84Z(“连接84”)可以包括指明根对象80、文档类型对象78和文档子类型对象82中的一个在数据库32中的存储位置的参照。通常,文档类型对象78和文档子类型对象表示安全性文档类别、子类别和各个文档类型(叶节点)基于安全性文档的通用物理属性、安全性特征或布局特性的分层组织结构。虽然所示示例具有三层结构,但可以重复任意数量的层级以分类并最终单独识别安全性文档的类型。
根对象80包括至少一个涉及图2中多个分类器47中的一个或多个的分类器对象86N。这些参照可以在所涉及的分类器47驻留的存储器中指定唯一的标识符、名称或位置地址。作为父节点,文档类型对象78包括多个分类器对象86,并且某些分类器可被复制。如图5所示,各文档类型对象78包括各自分类器对象86A-86M的参照。各分类器对象86A-86M(“分类器对象86”)涉及多个包含用于进行“分类器流程”的可执行软件的分类器47中的一个或多个,以评估待识别安全性文档的一个或多个特性或属性。各文档类型对象78还可以包括各自的优先级值88A-88M(“优先级值88”),虽然再次说明文档类型对象78不需要包括优先级值。如上文所述,优先级值88可以描述文档识别模块40遍历文档识别框架34的某一遍历顺序。
虽然在图5中未示出,文档类型对象78或文档子对象类型82中的任一个可以包含对校验器对象90A-90M的参照,可以应用对校验器对象90A-90M的参照来确认安全性文档对于分类器86所选择的路径而言具有正确特性。在到达叶节点时,应用一组一个或多个验证器来确认安全性文档的真实性。
文档子类型对象82表示叶节点,而且同样地,各文档子类型对象82包括涉及一个或多个验证器49的各自验证器对象93A-93M。此外,文档子类型对象82包括各自的模板数据91A-91M(“模板数据91”)以及一个或多个各自的最小确定性值92A-92M(“最小确定性值92”)。验证器对象93A-93M通过指针或唯一的标识符涉及多个验证器49中的一个或多个,用于进行比较或以其它方式确认是否存在父节点的各自分类器或潜在的任何校验器所收集的具体属性或特性,以便确认安全性文档12的类型。虽然在图5中未示出,但在一些实施例中,各文档子类型对象82可以包括多个校验器对象,其中这些多个校验器对象中的每一个都涉及一个或多个校验器流程。模板数据91通常定义任意模板图像、布局特性、安全性特征以及在分类和/或校验文档子类型对象82中的具体一个时可能需要的其它相关数据。通常,根据文档识别模块40在文档识别框架34中的当前位置,校验器48返回符合可能的文档类型或子类型对象的分类器流程的具体属性的确定性值。例如,如上文所述,文档节点的一组具体分类器47和各自的校验器可以返回可与待分析的当前安全性文档类型相对应的子文档类型对象78的分级集。文档识别模块40可以将返回的确定性值与各自的最小确定性值92中的一个进行比较。
为了识别当前的安全性文档12,文档识别模块40通常按照动态遍历方法遍历文档识别框架34。通过此动态方法,文档识别模块40从根对象80开始,以便调用由分类器对象86N涉及的分类器47。这些初始分类器47分析捕捉图像以及从安全性文档12获得的其它数据,然后返回由子节点表示的可能的文档类型对象的集,即文档类型对象78。该集可以指定文档类型对象78的任一个或多个。
在遍历到文档类型对象78中的一个上时,文档识别模块40会访问相关的分类器对象86A-86M,调用所涉及的分类器47,以及接收可能的属性或特性的集。然后对于各子文档对象,使用各自的校验器对象90A-90M与预期值进行比较并且生成相似性确定性因子,然后根据这些,在安全性文档和子文档类型之间分级匹配相似性,用于最终选择到文档子类型对象82的一条或多条路径。这样,便可垂直遍历框架34以进行分类、子分类并最终识别安全性文档。
可沿着树形结构向下重复遍历,直至到达表示具体安全性文档的叶节点。这些分类器47和校验器48可以返回一个或多个确定性值,文档识别模块40可以根据存储在正在遍历的文档子类型对象82中的公式计算这些确定性值的加权平均数。利用此加权平均数,文档识别模块40可以将加权平均数与和正在遍历的文档子类型对象82相关的最小确定性值92进行比较,以确认安全性文档12是否确实是该安全性文档的具体类型。如果加权平均数不符合或超出相关的最小确定性值92,文档识别模块40可能不再考虑与文档子类型对象82相关的整个分支,从而提高效率。文档标识模块40可以继续重复上述分类器对象86返回的可能的文档子类型的剩余集,直至放弃或存储确定性值供进一步考虑。
在分析完集内的所有文档子类型对象82之后,文档识别模块40可以将与剩余的文档子类型对象82相关的确定性值相互比较并且例如通过选择最大确定性值来识别最佳确定性值,从而结束对文档识别框架34的遍历。文档识别模块40可以将此所识别的确定性值以及相关的文档类型对象78或子类型对象82传输到用户界面28,以通过显示器43进行显示。可以要求用户认可此所识别的文档类型对象78或子类型对象82,或以其它方式确认文档识别模块40根据对捕捉图像的分析正确地识别出安全性文档12。
图6为流程图,示出了如图5所示按照动态遍历方法递归地遍历文档识别框架34时图2中文档识别模块40的示例操作。虽然下文所述涉及动态遍历方法,但文档识别模块40可以按照任何其它方法或其组合遍历文档识别框架34,包括按照存储在队列数据结构46中的文档类型对象78的参照、按照优先级88以及这些方法的任意组合遍历文档识别框架34。
文档识别模块40初始接收安全性文档12的捕捉图像以及任选的其它数据(如RFID数据),然后访问文档识别框架34的根对象80,以开始遍历文档识别模块40并且将根对象作为当前处理文档进行处理(94)。文档识别模块40可以例如访问与当前文档相关的分类器对象86A,从而调用分类器对象86A涉及的多个分类器47中的一个或多个,即分类器流程(95)。作为此调用的响应,文档识别模块40会计算可能的属性或特性集。文档识别模块40可以从此节点处的此文档对象接收可能的文档子类型对象集,并且该集通常包括一个或多个文档子类型对象78(96)。例如,可能的文档类型对象的一个示例集可以包括文档类型对象78A和78M。给定此可能的文档类型对象集,即“子类型集”,文档识别模块40继续按照类型集遍历文档识别框架34(96)。
文档识别模块40通过访问类型集中所返回的第一文档类型对象78A及其相关的分类器对象86向下移动一层文档识别框架34。如果文档类型对象78A的任何校验器确认分类器对象86所提取的属性(或如同本例中,不存在校验器对象),则文档识别框架34现在将文档类型对象78A作为当前文档处理并且使用分类器对象86A计算可能属性或特征的附加集(95)。然后文档识别模块40再向下移动一层,以检查其各子子文档82A-82D,即“子类型集”(96)。文档识别模块40接着按照此新的子类型集遍历文档识别框架34(96)。
文档识别模块40通过访问子类型集中所返回的第一文档子类型对象82A及其相关的分类器对象90A向下移动文档识别框架34。文档识别模块40调用相关的校验对象90A所涉及的一个或多个校验器48以及验证器对象92A所涉及的一个或多个验证器49(因为这是叶节点),然后接收确定性值集(97)。在确定该确定性值时,校验器48可以访问相关的模板数据91A。该确定性值反映与相关的模板数据91A比较时,相对于由一对所调用的分类器47和校验器48对捕捉图像执行的分析的相似性水平。例如,确定性值为100可以反映相关的模板数据91A与捕捉图像之间的完美匹配,而确定性值为80可以反映相关的模板数据91A与捕捉图像之间的足够匹配,但可能指示捕捉图像的一个或多个特性没有与相关的模板数据91完美匹配,零则表示完全不匹配。在一些实施例中,文档识别模块40将调用的校验器48所返回的各确定性值与最小确定性值92A进行比较,并且在失败时停止检查此子文档或从此节点开始的整个分支(98),或将子文档的组合确定性值设置为零。在其它实施例中,文档识别模块40将此带有捕捉图像的子文档的组合确定性值计算为从校验器48的所有调用返回的所有确定性值的加权平均数(102),并且将该加权平均数与最小确定性值92A进行比较,从而只存储超过最小确定性值92A的那些加权平均数(104)。
如果此子文档被确认达到最小确定性值,则检查节点是否为文档树形结构的分支节点并且具有子子文档,即父节点(106)。如果它在其下级具有一些子子文档,此子文档将作为当前文档处理,并且文档识别模块通过重复上文所述流程再向下移动一层文档树形结构(95)。这是以深度优先递归方式实现的,沿整个文档树形结构下移,直至到达叶节点。
一旦完成子类型集中的一个文档子类型对象82,文档识别模块40就可以确定是否已完成重复通过子类型集(108)。如果未完成重复通过子类型集,文档识别模块40会通过访问另一个文档子类型对象82、调用其相关校验器对象90所涉及的校验器48、接收确定性值、以及根据比较存储确定性值,而继续重复通过该子类型集(96-108)。如果已完成,文档识别模块40会通过计算得到的相关确定性值对所有子文档进行分级,以完成给定文档节点处的路径选择处理的循环(110)。下一步根据当前处理的文档是根文档还是父文档类型来确定返回结果的位置(112)。如果是子子文档,控制上移一层文档树并且返回其父文档(114),并且子子文档的确定性值与父文档合并。否则,文档识别模块40完成重复通过整个文档树,文档识别模块40根据存储的确定性值识别捕捉图像(116)。文档识别模块40可以将所有存储的确定性值相互比较然后选择最大的确定性值,从而将捕捉图像识别为属于与最大确定性值相关的文档子类型对象82。
在上文已对文档识别模块40遍历文档识别框架34的操作进行了说明。文档识别框架34通过动态文档识别框架存储文档类型对象78和文档子类型对象82。该框架是“动态的”,原因在于遍历的顺序随安全性文档的属性和特性而有所变化,并且该框架有利于通过布局编辑器30分别更新、删除和插入文档类型和子类型对象78、80。动态文档识别框架提供可能出现这些动态更新、删除和插入的协议,从而保持识别安全性文档12的可扩展的灵活框架。该框架的灵活性在于可以识别多种不同类型的制品,包括美国和外国护照、美国和外国驾驶执照、美国和外国身份证以及商业票据。该框架的可扩展性在于包括文档类型子类型的一个或多个文档类型可以快速添加到框架以及插入文档识别框架34中,下文将更为详细地说明。
图7A-7C为由布局编辑器30通过显示器43展示给用户的窗口118的屏幕截图。画面118包括文档选项卡119、表示为文档类型对象120的可扩展列表的识别框架34以及视图子窗口121。文档类型对象列表120包括一个或多个文本区域,每个区域涉及图5中的多个文档类型对象78中的一个。例如,文档类型对象78A可包括“Document-2Line44”文档类型,如图7A中列表120的第一项所示。因此,文档类型对象列表120显示可以由文档识别框架34定义的示例性组织分层结构。视图子窗口121通常显示存储到数据库32并且与文档类型对象列表120中所选的一个项目相关的任意相关模板数据91。
图7B显示用户选择此文档类型识别流程的项目130之后的窗口118。作为此选择的响应,布局编辑器30将弹出窗口132与窗口118重叠,其中弹出窗口132允许用户编辑与项目130相关的校验器对象90中的一个,以定义一个文档类型的识别流程。在此例中,弹出窗口132包括最小确定性值输入134、光源选择输入136、现有的校验器流程选择框138A和使用过的校验器流程选择框138B。用户可以通过与最小确定性输入134交互来将最小确定性值与此文档类型相关联,例如将最小确定性值92A与图5中的文档子类型对象82A相关联。用户还可以指定在通过光选择输入136捕捉安全性文档12的图像时要使用的参照光源,例如可见光、紫外线和红外线。用户也以可通过现有的校验器流程选择框138编辑校验器对象90A中的一个当前所涉及的校验器48。最后用户可通过使用过的校验器流程选择框138B将额外的校验器48与校验器对象90A相关联或移动到校验器对象90A。
图7C显示在用户选择当前校验器选项卡140来配置分类器47或校验器48中的一个的具体应用之后被弹出窗口132重叠的窗口118。如图7C所示,用户当前正在编辑“CDocVerifierDominantColor”流程,该流程分析捕捉图像的主色彩并且将该分析与参照输入142中所指定的参照进行比较。弹出窗口132包括参照输入142,使得用户可手动编辑这些参照。例如,主色彩流程将捕捉图像的分析结果与参照输入142中所定义的色彩范围进行比较,在参照输入中,指定品红百分比为0.007、红色百分比为15.021、黄色百分比为34.547等。用户可手以动编辑这些单独的百分比(如蓝色突出显示区域所示),或者用户可以选择学习按钮144,如果用户有可即刻扫描的物理模板,布局编辑器30将利用此前或即时扫描到系统中的模板图像得知这些参照。
弹出窗口132还包括权重输入146和具体最小确定性输入148。用户可以将权重值输入到权重输入146中,使得在计算多个调用的校验器48的加权平均数时,文档识别模块40在计算加权平均数时使用此指定的权重值。相似地,用户可以将具体的最小确定性输入到输入148中以便在遍历时使用,如上文图6中的步骤98所述。这样,用户便可以动态地配置分类器47和校验器48,将分类器47和校验器48与具体对象86、90相关联,然后通过配置权重和最小确定性值动态地修改框架34的遍历。
图8A、8B为主机系统20完成识别和随后的验证之后,通过显示器43由图2中的示范用户界面28展示给用户的窗口150的屏幕截图。此文档被识别为当前标准版本的美国纽约州驾驶执照的正面。窗口150包括识别置信度水平文本输出152,其通常表示文档识别模块40在识别流程中所计算出的加权确定性值。窗口150还包括显示验证结果的验证详细信息输出154以及在选择后提供识别流程结果的识别选项卡156。窗口150还提供其它相关信息,例如捕捉图像158和源自捕捉图像158分析结果的安全性文档详细信息160。
图8B所示为在用户选择识别选项卡156之后的窗口150。用户界面28在窗口150中提供文本输出162,文本输出162表示动态地遍历文档识别框架34的结果。从文本输出162的顶部开始,文档识别模块40首先遍历到标记有“2line44”的文档类型对象78中的一个并且访问其相关的分类器对象86,于是文档识别模块40调用涉及的分类器47。由于测试在“行计数”上失败(如文本输出162的第二行所示),因此结果返回没有可用的文档子类型对象82。
接着,文档识别模块40遍历到标记有“us_dl”的文档类型对象82(如文本输出162的第三行所示),然而按照文本输出162的第四行,相关的分类器对象86在“识别”通用美国驾驶执照时再次失败。最后,当遍历到标记有“us_dl_ny”的文档类型对象78时,文档识别模块40发现匹配(如文本输出162的第六行所示)并且接收文档子类型对象集。遍历此子类型集时,文档识别模块40调用如行7-13所示的涉及的分类器47和校验器48,每行返回一个“cf”值。“cf”值反映各校验器所确定的确定性值,“min_cf”值表示通过各校验器所需的最小确定性值。文本输出162的第6行显示所进行的“cf”值的加权平均数的比较结果、或通过确认捕捉图像被“识别为第14行中的[文档对象]us_dl_ny”以及为“具体的[子类型对象]标准前版本]”的确定性值。
图9为框图,更详细地示出了图2中主机系统20的存储器结构的一部分。在此限制性实例中,分类器47和校验器48包括布局匹配流程164A和Eigenimage文档匹配流程164B。如图9中所进一步所示,文档数据结构34包括根对象166、文档类型对象168和文档子类型对象170。文档类型对象168包括分类器对象172,文档子类型对象170包括校验器对象174、模板数据176和最小确定性值178。各对象168-174、模板数据176和最小确定性值178可以基本上类似于结合图5所述的那些对象。文档识别框架34可以包括各对象168-174、模板数据176和最小确定性值178中的多个,并且此分类结构还可递归地重复到多个层中,但为了方便图示,这些附加的对象未在图9中示出。
由于在文档识别模块40中使用了通用识别方法中的两个,布局匹配流程164A和Eigenimage文档匹配流程在缩小可能的候选者方面非常有效。这两种方法也非常容易配置为用于识别文档。将在下文详细讨论这两种方法。文档识别模块40并不仅限于这两种方法,并且提供灵活的编程结构来融入新方法。一些其它常用的识别方法包括文档大小、主色彩、空白、灰度柱状图、文本和条形码的OCR结果、模板匹配等等。
图10为流程图,示出了遍历文档识别模块40以调用图9中的布局匹配流程164A时,在图2中的文档识别模块40中所采用的处理步骤。该处理步骤的顺序可应用于参照图像数据以建立文档模板,或应用于捕捉的实时图像数据以识别文档类型(180)。可通过上文所述的布局编辑器30手动修改文档参照模板数据。可通过在某一光源下对亮背景或暗背景、图像或者灰色或彩色图像的平面上的关联暗区域进行分段或分类来分析文档布局。
在调用布局匹配流程164A时,文档识别模块40执行布局匹配流程164A以确定可能的文档子类型对象集,即子类型集。首先,在进行一些图像质量加强之后,图像会使用阈值转换为二进制图像(182),然后根据黑色像素的连接情况分段为多个区域(184)。接下来,隔离的区域根据一些特征分类为一些类别,例如文本、条形码、图片、磁条、指纹等(186),然后根据一些附加信息(例如大小、位置和方向)来表征各区域(188)。在大多数情况下,例如对于条形码、图片、磁条和静态文本,区域参照最好应为中心。但有时对于可变区域,例如名称和地址的动态文本,必须使用区域的左侧。文档是表示在具有类型和其它特性的区域对象树形结构中(190),可按范围将区域对象分组为以参照模板表示的分层结构,以便人们更容易理解。虽然文档的位置或其内容可由于打印偏移、扫描时文档的位移或其它原因而变化,区域对象的相对位置在确定文档类型时受到更严格的限制,但在阅读器扫描的应用环境中图像的移动和旋转受到限制。一旦针对捕捉图像图形化表示和连接不同的图像区域,文档识别模块40就可以进一步将多个所连接的区域与关联到存储在数据库中的多个文档类型对象中的一个的模板数据(例如图9中的模板数据176)进行比较(192)。一般来讲,模板数据176定义了多个预定义的连接图像区域以及多个预定义的连接图像区域之间的关系,文档识别模块40将已确定的连接区域和关系与那些预定义的连接区域和关系进行比较。最后,文档识别模块40根据比较结果通过一致的相似性确定性值(97),例如0至100,确定捕捉图像是否属于这些多个文档类型对象中当前正在进行比较的一个(即文档类型对象178)中194)。
图11A至图11C为示例性图像,示出了当图2中的文档识别模块40执行图9中的布局匹配流程164A时捕捉图像的状态。图11A示出了进行图像处理和二进制处理之后的捕捉图像194A(182)。虽然不要求执行布局匹配流程164A,但应用布局匹配流程164A的结果可以通过执行此类图像处理而得到极大的增强。图11B显示执行文档分段法之后的捕捉图像194B(184)。文档识别模块40在执行布局匹配流程164A时,将捕捉图像194B分段为多个连接的区域196A-196N。图11C所示为捕捉图像的图形化表示194C,其中多个连接区域196A-196N中的每一个均映射到节点198A-198N中的一个(190)。各节点198A-198N也可以指定其它节点之间的关系。
一旦图形化表示捕捉图像,文档识别模块40就可以将此图形化表示194C与模板数据(例如图9中的模板数据176)进行比较。根据布局匹配流程164A,文档识别模块40可以进行一个或多个不同的比较。例如,文档识别模块40可以简单地将图形化表示194C中存在的同类区域与模板数据176中存在的区域进行比较。作为另一种选择或除此区域类型比较之外,文档识别模块40还可以将图形化表示194C与存储在模板数据176中的图形化表示按照诸如大小和位置等一些额外的限制条件或更严格的区域空间关系进行比较。可通过例如按照动态编程算法的不精确图形匹配来快速执行这种图形化比较。在图形化表示比较的某些情况下,文档识别模块40可以在特定于图1中图像捕捉设备11和文档类型12环境的比较中插入限制,例如有限的平移和旋转限制、掩蔽的匹配限制、缺失或额外的区域限制、动态内容限制以及不精确的分段和打印偏移限制。应用这些限制中的一个或多个可以显著缩短执行布局匹配识别流程164A所需的时间。
有限的平移和旋转限制对区域或整个文档在进行比较之前可旋转的程度进行了限制。掩蔽的匹配限制可以过滤掉特定文档的某些区域,以减少所需比较的数量。缺失或额外的区域限制可以停止比较由于对捕捉图像内质量不好或干扰严重的图像进行自定义打印或不良图像处理而造成的缺失、合并或额外区域。动态内容限制可以减少针对包含诸如名称和地址文本区域等动态内容的区域需要测量的关系的数量。不精确分段和打印偏移限制可以组合两个或更多个不正确分段的文本区域,从而减少进行比较的区域的数量。
图12右侧的流程图示出了使用布局编辑器30训练eigenimage分类器47的操作步骤(200-208)。作为一种信息压缩方案,也称为PCA(主成分分析),Eigenimage法可以有效地将表达大量图像的复杂性降低为少量标准正交的特征图像,从而快速执行对象识别和其它工作。所关注的区域可为整个文档区域或最好不包括动态内容的部分。此外,文档预处理可用于减小任何动态内容的影响。
在任何情况下,第一步是收集所有可能的图像模板或选择性的典型图像模板(200)。所收集图像模板的模板数据可以归一化为零均值。接下来会形成数据矩阵,其中各列存储不同图像模板的图像数据(202)。各列中的各条目可以表示图像模板的同一部分或所有图像区域。根据此数据矩阵的协方差矩阵计算特征矢量集并且按各自的特征值排序(204)。可以利用来自模板初始图像数据的数据矩阵计算特征矢量,或通过转置此数据矩阵将特征矢量减少至更低的维数;这两种技术在数学层面上产生等同形式的结果。可以使用阈值仅选择具有足够大特征值(即超过预定义阈值的特征值)的特征矢量(206)。作为一个实例,可以应用取舍点,从而仅选择在最大特征值10%之内的特征值。这些所选特征值的每一个均可以作为各自的特征图像映射回去,如同利用转置的数据矩阵计算并存储它们。上文所述的流程可视为在数学方面简化流程,因为原始图像通常具有非常高的维数,并且原始图像被减少为更低的维数以更快地找到标准正交的特征矢量。然后将此特征矢量映射回原始图像的较高维数。特征图像形式的最终表示可能更易于最终应用捕捉图像,如下文所述。此所选标准正交的特征图像集可以视为原始图像数据集按最小二乘误差意义的最佳表示。
图12左侧的流程图示出了遍历文档识别框架34以调用图9中的Eigenimage文档匹配流程164B时,图2中文档识别模块40的操作步骤(210-216)。此处理步骤顺序可以:(i)应用于参照图像数据以建立文档模板及预计算存储在数据库中的各文档子类型对象的参照权重系数矢量,或(ii)应用于捕捉图像数据以识别文档类型(210)。
调用Eigenimage文档匹配流程164B时,文档识别模块40会执行Eigenimage文档匹配流程164B以计算由以上文所选标准正交特征图像表示的捕捉图像的权重系数矢量(212)。通过捕捉图像数据矢量(或参照图像数据)乘以由所选标准正交特征图像构造的数据矩阵以生成捕捉图像的权重系数矢量来实现这一点。也就是说,数据矩阵的各列表示特征图像中的一个,捕捉图像数据矢量相乘生成系数矢量,其中各系数为由标准正交特征值形成的多维空间中捕捉图像的表示。接下来,文档识别模块40将捕捉图像数据的权重系数矢量和与存储在数据库中的多个子类型对象中的一个(即各可能的参照文档类型)相关的各预计算的参照权重系数矢量进行比较(214)。如此计算出两个矢量相对于捕捉图像权重系数矢量和预计算的参照权重系数矢量的距离或相似性。通常文档识别模块40可以按照以下四种标准距离计算法中的一种计算此距离:1)Euclid距离,2)Hamming距离,3)NCC(归一化互相关性)以及4)Mahanalobis距离。基于此距离,文档识别模块40根据Eigenimage文档匹配流程164B确定制品是否属于当前正在比较的多个文档子类型对象中的一个,即文档子类型对象170(216),并且通常根据最近邻区(NN)进行分类。可以按各可能的参照文档类型对象的确定性值的形式进行确定,其中参照文档类型对象按统一比例(如0至100)表示距离。这样,确定性值表示捕捉图像的权重系数矢量与各可能的参照文档的各自权重系数矢量之间的距离是否小于预定义的阈值。
图13A至图13C为示例性图像,示出了当文档识别模块(例如图2中的文档识别模块40)执行Eigenimage文档匹配流程(例如图9中的Eigenimage文档匹配流程164B)时图13C中捕捉图像230的状态。图13A和图13B示出了识别此文档之前所用的示例性训练图像和结果。图13A示出了一组七个美国驾驶执照样本:加利福尼亚州和纽约州各两种类型,明尼苏达州、蒙大拿州及其它州各一种类型。在实际应用中,这组模板图像可以处理数百个或更多个图像。布局编辑器30计算其在图13B中所示的特征图像和数值。可选择此组七个特征图像仅使用其具有更高特征值的部分,以近似地表示原始的七个模板图像。随后,图13A中七个模板图像的每一个乘以由所选特征图像构造的矩阵,生成作为存储在数据库32中的此文档子类型模板数据的参照权重系数矢量。
如果有图13C中的新捕捉图像230,文档识别模块40就会调用图9中的Eigenimage文档匹配流程164B,图像数据乘以与上述相同的由所选特征图像构造的矩阵以生成权重系数矢量。Eigenimage文档匹配流程将此新的权重系数矢量与当前正在比较的多个文档子类型对象(即图13A中用于训练的七个美国驾驶执照)相关的各预计算的参照权重系数矢量进行比较。例如,文档识别模块40可以使用Hamming距离算法或其它算法确定新捕捉图像数据与七个模板图像数据之间的距离,以生成图13C所示的示例性结果232。
新捕捉图像数据的结果232示出了按照Hamming距离算法,距与由所选特征图像构成的多维空间中明尼苏达州文档子类型对象相关的模板数据的最短距离为518.21。相较于与其它六个文档子类型对象相关的距离,此相对小得多的距离表示在根据最近邻区(NN)的文档分类中具有更好的匹配。
在使用文档识别模块40识别具体文档类型之后,通过图2中的文档处理引擎36证明真实性的下一步骤是调用文档验证模块42来确认是否存在所需特征。在实践中,验证特征为可与上述识别特征互换的概念,其意味着图像分析方法可以应用于验证器、校验器或甚至分类器的实施中。基本准则是在最短时间内使用尽可能少特征以更低的正确文档类型拒绝率来进行识别,而仅以更低的假冒错误接受率从已识别文档中调用所谓验证流程的其它部分。
本文提供了三种方法作为用于获得所应用印刷技术特性的示例性验证方法,来识别假冒品。常见形式的假冒品使用替代形式的印刷技术(如复印)来复制原始文档。在实践中,文档验证模块42可使用除本文所提供的三种示例性技术之外的更多方法。
例如,凹版印刷为15世纪30年代发明于德国的原始文档印刷方法,至今仍广泛使用。此方法雕刻或切成凹板,凹板中注入油墨并且增大纸张压印区域的压力以产生具有3D效果的雕刻外观。假冒品常用的廉价替代形式是热图像(凸起的油墨),其用于如常用名片的印刷。
在使用例如3M文档阅读器的CCD相机的透视环境下进行观察时,可捕捉一些明显的3D视觉效果。与在3M名片样品中一样,图14A中的图像240由平面扫描器生成,而图14B中的图像244由图1中的文档阅读器11捕捉。如图14B所示,图像240示出了包括字符阴影的3D效果。
截取上述两个图像中沿着字母“M”右腿水平移动的灰度变化曲线,可在图14A中的图片242和图14B中的图片246上看到一些明显区别;在图14A的曲线242上,灰度水平沿着扫描器行程的变化始终是对称的,而如图14B的曲线246所示,来自CCD相机的情况并非如此。暗谷向相机初始位置的内侧偏移。通过测量整个视域,对于图14C中的3M名片,各谷所表示的不对称偏移量会变化,并且其可按距初始视域的偏移距离进行量化。在图示实例中,偏移的量度单位为密耳。
可以利用所谓的“Stereo from Shading(明暗重构立体视觉)”技术轻松应用该技术,通过测量图像的精确3D参数(例如行程升高的高度,其可根据图14C中斜率的陡峭程度来确定)确认是否存在不对称性。
另一种印刷技术为雕版,其在印刷表面上产生切口,并且因此产生与上述方法相反的光学效果。上述成形技术可同样地用于分析由此类印刷技术产生的图像和/或字符的3D特性。
将图像印刷到纸张或其它介质上时,除连续的图像(如照片或ID打印机)之外,其它两种最常用的复印技术通过二进制图像模拟连续的色调图像:半色调丝网印刷技术(振幅调制)使用不同大小的等距点,而随机丝网印刷技术(频率调制)以可变的位置和密度应用同样大小的点。这些印刷技术的样本如图15A中的样本图像250、252和254所示。
利用纹理分析的协方差矩阵法对于使用半色调丝网印刷的规则间距点是良好的测定流程,而高频干扰或边缘检测对于随机丝网印刷是理想的指示。
又如,通常可以使用多个丝网重现彩色图像,并且在半色调丝网印刷中,位于不同角度的CMYK四色版与玫瑰斑网点样式相结合,如图15B中的样本256以及图15B中的放大图像258所示。
图15C示出了一组样本图像260、262和264,其通过分解由彩色CCD相机捕捉的图像256的RGB版而生成。图15C中的一组图像示出了可进行类似处理的图15C中的样本图像260、262和264中的成角度的丝网。
由于在文档假冒中复制是最常见的情况之一,也可通过使用不同的丝印方法来改变扫描的文本,如分别使用连续色调、半色调和随机丝印法的图15D中图像266、268和270的比较。在这种情况下,行程宽度和边缘曲率的变化可以是对于原始文档复制流程中丝印方法所引起的字符变形的很好的测定方法。
除上述传统印刷技术之外,设计出了许多新方法,不仅限制将图像复制到介质上,还在微结构中携带其它信息,从而进一步有助于防止假冒。虽然这些方法中的大多数只能由其自身独有的算法进行解码,但在图像处理中仍可使用一些简单的特征提取方式以经济有效的解决方案来确认特征是否存在以用于验证目的。下文讨论了一些实例。
例如,一些公司对包含由人可读内容覆盖的机读代码的文档进行编码和解码,使得代码和人可读内容均可分辨。在操作中生成背景图像,其中背景图像包括根据灰度图像数据值编码的glyphtone单元,各半色调单元包括图16A所示的至少两个可分辨图案中的一个。
另一个最近提出的方法基于通过移动一些点而在规则的半色调丝网上进行相位调制,如图16B的图像280所示。在这种情况下,放置具有相同丝印频率的透镜状解码透镜使编码字母“SI”在图16B的图像282中可见。本文所述的技术可以轻松应用于此类图像。
另一种方法是将彩色或灰度图像平面转换为微型字符层,其中每一层均相对于另一层以不同的角度设置。如果为多层色彩(如图16C所示)并且具有重叠的放大图像,微型字符的宽度将根据灰度或色彩值进行宽度调制。本文所述的技术可以轻松应用于此类图像。
作为展示系统如何快速高效且高准确度地识别文档的例子,图17A至图17C展示了从一组没有使用符合ICAO的MRZ区的206份不同美国驾驶执照中识别和验证当前版本纽约州驾驶执照的流程。所调用和应用的用于提取和递归处理图像属性的已实施的分类器和校验器列于下表I中:
表I
分类器/校验器 | 光源 |
空白 | 红外线 |
单色 | 可见光 |
主色 | 可见光 |
布局区域匹配 | 红外线 |
Eigenimage文件匹配 | 可见光 |
徽标图案匹配 | 可见光 |
可见图案匹配 | 可见光 |
表I的右列示出了各自的光源。该列表按计算效率排序并且顺序执行。最后两项由文档中预期的两个图像图案匹配所限定。
图17B示出了在此例中在一次测试中各分类器或校验器所检查的文档对象数量。如所示的那样,测试开始时在所有206个候选者上所检查的空白分类器/校验器以及可见图案匹配分类器/校验器仅限制到正确文档类型的一种可能性。图17B中的曲线展示了该候选可能性如何在约200毫秒内有效地缩小范围。图17C示出了各操作的拒绝率,其表示相对于此文档类型在文档识别框架上的识别性能。鉴于徽标图案匹配分类器/校验器在从15个候选者中识别正确文档及否决其它14个候选者方面具有的最高性能为93%的拒绝率,它也是相对最耗时的操作。
图17A示出了在从分别来自红外线、可见光、紫外线和逆向反射的四个图像中搜索预期的安全图像图形时,将此文档识别为当前的纽约州驾驶执照之后所调用的部分成功验证结果。该结果与系统完成识别和后续验证之后在图8A中所示的结果类似。
已对本发明的多个实施例进行了说明。这些和其它实施例均在以下权利要求书的范围之内。
Claims (31)
1.一种方法,包括:
接收未知文档的一个或多个捕捉图像;
按照动态文档识别框架将多个文档类型对象存储在数据结构中,其中所述多个文档类型对象引用多个递归流程,用于从所述捕捉图像提取属性,以便将所述未知文档分类并验证为由所述文档类型对象中的一个表示的文档类型;
根据通过对所述捕捉图像应用所述多个递归流程而提取的所述属性,以可变的顺序遍历所述数据结构的所述文档类型对象;以及
在遍历所述数据结构时,将所述未知文档识别为所述多个文档类型对象中的一个。
2.根据权利要求1所述的方法,其中接收所述捕捉图像包括接收红外(IR)图像、可见光谱图像、紫外(UV)图像和逆向反射图像中的一个或多个。
3.根据权利要求1所述的方法,其中接收所述未知文档的所述捕捉图像包括接收护照、驾驶执照、出生证明、财务文档、商业票证、身份证和社会保险卡中的一种的捕捉图像。
4.根据权利要求1所述的方法,其中存储所述多个文档类型对象包括按照动态文档识别框架在树形数据结构中存储所述多个文档类型对象。
5.根据权利要求1所述的方法,其中存储所述多个文档类型对象包括以将子文档类型作为所述文档类型对象的下一级的递归方式按照所述动态文档识别框架在所述数据结构中存储多个文档类型和子类型对象。
6.根据权利要求1所述的方法,
其中存储所述多个文档类型对象包括存储引用所述多个流程中的一个或多个的分类器对象,并且
其中遍历所述数据结构包括遍历所述分类器对象,以:
调用由所述分类器对象引用的所述一个或多个流程以确定可能的参照文档类型对象集;以及
遍历所述集,以将所述捕捉图像识别为所述多个可能的参照文档类型对象中的一个。
7.根据权利要求6所述的方法,
其中存储所述多个文档类型对象包括存储最小确定性值和引用所述多个流程中的一个或多个的校验器对象,并且
其中遍历所述集包括遍历所述校验器对象,以:
调用所述多个流程中由所述分类器对象引用的所述一个或多个;
利用从调用所述多个流程中由所述分类器对象引用的所述一个或多个流程接收到的一个或多个返回值来计算确定性值,以处理由所述分类器对象从所述未知文档提取的属性,用于与所述引用的文档类型对象进行比较;以及
根据所述确定性值与最小确定性值的比较,选择性地从所述集中舍弃所述可能的参照文档类型对象中的一个或多个。
8.根据权利要求6所述的方法,
其中存储所述多个文档类型对象包括存储各引用所述多个流程中一个或多个流程的第一和第二校验器对象,并且
其中遍历所述集包括:
遍历所述第一校验器对象,以根据在调用由所述第一校验器对象引用的所述流程之后接收到的结果值来计算第一确定性值;
遍历所述第二校验器对象,以根据在调用由所述第二校验器对象引用的所述流程之后接收到的结果值来计算第二确定性值;以及
根据所述第一确定性值和所述第二确定性值之间的比较,将所述捕捉图像识别为所述多个可能的参照文档类型对象中的一个。
9.根据权利要求6所述的方法,其中存储所述多个文档类型对象包括:
存储多个优先级;以及
将所述优先级中的每一个与所述数据结构中所述多个文档类型对象中的一个相关联,并且
其中遍历所述数据结构包括按照与所述多个可能的参照文档类型对象中的每一个相关的优先级遍历所述数据结构。
10.根据权利要求6所述的方法,还包括在队列数据结构中存储最近校验的文档类型对象集,并且
其中遍历所述数据结构包括遍历所述数据结构中所述最近校验的文档类型对象集。
11.根据权利要求6所述的方法,其中遍历所述数据结构包括调用所述多个流程中的布局匹配识别流程,以:
分段及识别所述捕捉图像的多个连接区域;
通过对所述多个连接区域进行分类以及在所述多个连接区域之间建立一组关系来以图形方式表示所述捕捉图像;
将所述多个连接区域与所述多个文档类型对象中的一个相关的模板数据进行比较;以及
根据所述比较,确定所述捕捉图像是否属于当前正在比较的所述多个文档类型对象中的一个。
12.根据权利要求6所述的方法,其中遍历所述数据结构包括调用所述多个流程中的特征文档匹配流程,以:
计算所述多个可能的参照文档类型对象的所述特征图像和值,
选择一个或多个具有更大特征值并且存储在所述数据结构中的所述参照文档类型对象,
在学习阶段计算存储在所述数据结构中的所述多个可能的参照文档类型对象中每一个的参照权重系数矢量;
计算所述捕捉图像的权重系数矢量;
比较所述图像和文档权重系数矢量以计算距离;以及
根据所述距离,确定所述未知文档是否属于当前正在比较的所述多个可能的参照文档类型对象中的一个。
13.根据权利要求7所述的方法,
其中所述识别流程的结果包含一个或多个不同文档类型的候选者列表,
其中所述候选者列表根据所述确定性值进行排序,并且
其中所述识别流程的结果作为输入以确定子文档类型的后续处理。
14.根据权利要求1所述的方法,还包括:
应用自动方法,以得知来自样品图像的文档类型参照数据;
存储所述参照数据供所述数据结构的节点调用;以及
应用动态方法,以将所述未知文档分类为所述数据结构中所述文档中的一个,以实现所述数据结构的后续处理和遍历。
15.根据权利要求1所述的方法,其中确认所识别文档的真实性包括:
调用以下方法中的一个或多个:
第一方法,以评估所述未知文档的印刷方法来自凹版印刷术或雕版印刷术的可能性;
第二方法,以辨别用于印刷图像和文本的丝印方法;或
第三方法,以评估所述未知文档的印刷材料是否包括微结构;以及
根据所述可能性确定所述已识别的文档是否真实。
16.根据权利要求1所述的方法,还包括将所述未知文档识别并验证为结合有嵌入电子信息的安全性文档,所述嵌入电子信息包括射频识别(RFID)数据、电子护照数据、智能卡数据或磁条数据中的一种或多种。
17.根据权利要求1所述的方法,还包括向用户提供所述识别和验证流程的结果,其中提供包括以视觉或声音格式向用户提供反馈。
18.一种安全性文档验证设备,包括:
图像捕捉接口,其从未知文档捕捉一个或多个图像;
存储器,其将多个文档类型对象按照动态文档识别框架存储在数据结构中,其中所述多个文档类型对象引用多个用于从所述捕捉图像提取属性的递归流程;以及
文档处理引擎,其根据通过将所述多个递归流程应用于所述捕捉图像而提取的所述属性,以可变的顺序遍历所述数据结构的所述文档类型对象,其中所述文档处理引擎遍历所述数据结构时将所述未知文档识别为所述多个文档类型对象中的一个。
19.根据权利要求18所述的安全性文档验证设备,其中所述图像捕捉接口通过接收红外(IR)图像、可见光谱图像、紫外(UV)图像和逆向反射图像中的一个或多个来接收所述捕捉图像。
20.根据权利要求18所述的安全性文档验证设备,其中所述图像捕捉接口通过接收护照、驾驶执照、出生证明、财务文档、商业票证、身份证或社会保险卡中的一种的捕捉图像来接收所述未知文档的所述捕捉图像。
21.根据权利要求18所述的安全性文档验证设备,其中所述存储器通过将所述多个文档类型对象按照动态文档识别框架存储在树形数据结构中来存储所述多个文档类型对象。
22.根据权利要求18所述的安全性文档验证设备,其中所述存储器通过将多个文档类型和子类型对象按照所述动态文档识别框架存储在所述树形数据结构中作为父节点和子节点互连以用于按递归方式处理来存储所述多个文档类型对象。
23.根据权利要求18所述的安全性文档验证设备,其中所述文档处理引擎包括遍历所述数据结构的文档识别模块。
24.根据权利要求23所述的安全性文档验证设备,
其中所述存储器通过存储引用所述多个流程中的一个或多个的分类器对象来存储所述多个文档类型对象,并且
其中所述文档识别模块遍历所述数据结构,具体方式为:
调用由所述分类器对象引用的所述一个或多个流程以确定可能的参照文档类型对象集;以及
遍历所述集以将所述捕捉图像识别为所述多个文档类型对象中的一个。
25.根据权利要求24所述的安全性文档验证设备,
其中所述存储器通过存储最小确定性值和引用所述多个流程中一个或多个的校验器对象来存储所述多个文档类型对象,并且
其中所述文档识别模块遍历所述集,具体方式为访问所述校验器对象并且使所述文档识别模块:
调用由所述校验器节点引用的所述多个校验器流程;
利用从调用由所述校验器对象引用的所述流程接收到的一个或多个返回值来计算确定性值;以及
根据所述确定性值与所述最小确定性值之间的比较,选择性地从所述集中舍弃所述可能的参照文档类型对象中的一个或多个。
26.根据权利要求24所述的安全性文档验证设备,
其中所述存储器通过存储各引用多个校验器流程中的一个或多个的两个校验器对象来存储所述多个文档类型对象,并且
其中所述文档识别模块遍历所述集,具体方式为:
遍历所述第一校验器对象,从而引起所述文档识别模块根据在调用由所述第一校验器对象引用的所述校验器流程之后接收到的结果值来计算第一确定性值;
遍历所述第二校验器对象,从而引起所述文档识别模块根据在调用由所述第二校验器对象引用的所述校验器流程之后接收到的结果值来计算第二确定性值;以及
根据所述第一确定性值和所述第二确定性值之间的比较,将所述捕捉图像识别为所述参照文档类型对象的所述多个文档类型中的一个。
27.根据权利要求24所述的安全性文档验证设备,
其中所述存储器还存储多个优先级并且将所述多个优先级中的每一个与所述数据结构中所述多个文档类型对象中的一个相关联,并且
其中所述文档识别模块通过按照与所述多个文档类型对象中的每一个相关的优先级遍历所述数据结构而遍历所述数据结构。
28.根据权利要求24所述的安全性文档验证设备,
其中所述存储器还将最近校验的文档类型对象集存储在队列数据结构中,并且
其中所述文档识别模块通过首先遍历所述数据结构中最近校验的文档类型对象的所述集而遍历所述数据结构。
29.根据权利要求24所述的安全性文档验证设备,其中所述文档识别模块通过调用所述多个流程中的布局匹配识别流程而遍历所述数据结构,所述流程使所述文档识别模块:
分段及识别所述捕捉图像的多个连接区域;
通过对所述多个连接区域进行分类并且在所述多个连接区域之间建立一组关系来以图形方式表示所述捕捉图像;
将所述多个连接区域与存储在所述数据结构中的所述多个文档类型对象中的一个相关的模板数据进行比较;以及
根据所述比较,确定所述捕捉图像是否属于当前正在比较的所述多个文档类型对象中的一个。
30.根据权利要求24所述的安全性文档验证设备,其中所述文档识别模块通过调用所述多个流程中的特征图像文档匹配流程而遍历所述数据结构,以:
计算所述多个参照文档类型对象的所述特征图像和值,
选择所述参照文档类型对象中具有大特征值的一个或多个;
在学习阶段中,计算存储在所述数据结构中的所述多个参照文档类型对象中每一个的参照权重系数矢量;
计算所述捕捉图像的所述权重系数矢量;
比较所述图像和所述文档权重系数矢量以计算距离;以及
根据所述距离,确定所述未知文档是否属于当前正在比较的所述多个参照文档类型对象中的一个。
31.一种计算机可读媒体,其包含指令用于使可编程处理器:
接收未知文档的捕捉图像,
将多个文档类型对象按照动态文档识别框架存储在数据结构中,其中所述多个文档类型对象引用多个流程;以及
通过选择性调用所述多个流程中的一个或多个而遍历数据结构,以根据所述捕捉图像将未知文档识别为所述多个文档类型对象中的一个。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/955,136 US8540158B2 (en) | 2007-12-12 | 2007-12-12 | Document verification using dynamic document identification framework |
US11/955,136 | 2007-12-12 | ||
PCT/US2008/083163 WO2009075987A2 (en) | 2007-12-12 | 2008-11-12 | Document verification using dynamic document identification framework |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101925904A true CN101925904A (zh) | 2010-12-22 |
Family
ID=40751912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801254120A Pending CN101925904A (zh) | 2007-12-12 | 2008-11-12 | 使用动态文档识别框架的文档验证 |
Country Status (14)
Country | Link |
---|---|
US (1) | US8540158B2 (zh) |
EP (1) | EP2232399A4 (zh) |
JP (1) | JP2011510365A (zh) |
KR (1) | KR101515256B1 (zh) |
CN (1) | CN101925904A (zh) |
AU (1) | AU2008335637B2 (zh) |
BR (1) | BRPI0819426A2 (zh) |
CA (1) | CA2708588A1 (zh) |
IL (1) | IL206309A0 (zh) |
MX (1) | MX2010006496A (zh) |
NZ (1) | NZ586077A (zh) |
TW (1) | TWI484421B (zh) |
WO (1) | WO2009075987A2 (zh) |
ZA (1) | ZA201004858B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069898A (zh) * | 2015-07-15 | 2015-11-18 | 广州敦和信息技术有限公司 | 一种发票字条自动定位的方法及装置 |
CN106445822A (zh) * | 2016-09-23 | 2017-02-22 | 上海图聚智能科技股份有限公司 | 高扩展性的前后端数据校验方法 |
CN107463074A (zh) * | 2017-07-27 | 2017-12-12 | 珠海赛纳打印科技股份有限公司 | 成像方法及成像装置 |
CN108460344A (zh) * | 2018-02-07 | 2018-08-28 | 北京工业大数据创新中心有限公司 | 屏幕中的动态区域智能识别系统及智能识别方法 |
CN109799984A (zh) * | 2019-01-15 | 2019-05-24 | 深圳前海微众银行股份有限公司 | 人脸框绘制方法、装置、设备及计算机可读存储介质 |
Families Citing this family (109)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2635259C1 (ru) | 2016-06-22 | 2017-11-09 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способ и устройство для определения типа цифрового документа |
US7702673B2 (en) | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US8156427B2 (en) | 2005-08-23 | 2012-04-10 | Ricoh Co. Ltd. | User interface for mixed media reality |
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US8838591B2 (en) | 2005-08-23 | 2014-09-16 | Ricoh Co., Ltd. | Embedding hot spots in electronic documents |
US8086038B2 (en) | 2007-07-11 | 2011-12-27 | Ricoh Co., Ltd. | Invisible junction features for patch recognition |
US8176054B2 (en) | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US8510283B2 (en) | 2006-07-31 | 2013-08-13 | Ricoh Co., Ltd. | Automatic adaption of an image recognition system to image capture devices |
US8184155B2 (en) | 2007-07-11 | 2012-05-22 | Ricoh Co. Ltd. | Recognition and tracking using invisible junctions |
US8521737B2 (en) | 2004-10-01 | 2013-08-27 | Ricoh Co., Ltd. | Method and system for multi-tier image matching in a mixed media environment |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US8369655B2 (en) | 2006-07-31 | 2013-02-05 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US8332401B2 (en) | 2004-10-01 | 2012-12-11 | Ricoh Co., Ltd | Method and system for position-based image matching in a mixed media environment |
US8868555B2 (en) | 2006-07-31 | 2014-10-21 | Ricoh Co., Ltd. | Computation of a recongnizability score (quality predictor) for image retrieval |
US8949287B2 (en) | 2005-08-23 | 2015-02-03 | Ricoh Co., Ltd. | Embedding hot spots in imaged documents |
US7970171B2 (en) | 2007-01-18 | 2011-06-28 | Ricoh Co., Ltd. | Synthetic image and video generation from ground truth data |
US8385589B2 (en) | 2008-05-15 | 2013-02-26 | Berna Erol | Web-based content detection in images, extraction and recognition |
US8335789B2 (en) | 2004-10-01 | 2012-12-18 | Ricoh Co., Ltd. | Method and system for document fingerprint matching in a mixed media environment |
US8600989B2 (en) | 2004-10-01 | 2013-12-03 | Ricoh Co., Ltd. | Method and system for image matching in a mixed media environment |
US8156116B2 (en) | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US7812986B2 (en) * | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US8276088B2 (en) | 2007-07-11 | 2012-09-25 | Ricoh Co., Ltd. | User interface for three-dimensional navigation |
US8856108B2 (en) | 2006-07-31 | 2014-10-07 | Ricoh Co., Ltd. | Combining results of image retrieval processes |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US8825682B2 (en) | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US8989431B1 (en) | 2007-07-11 | 2015-03-24 | Ricoh Co., Ltd. | Ad hoc paper-based networking with mixed media reality |
US8144921B2 (en) | 2007-07-11 | 2012-03-27 | Ricoh Co., Ltd. | Information retrieval using invisible junctions and geometric constraints |
US8195659B2 (en) | 2005-08-23 | 2012-06-05 | Ricoh Co. Ltd. | Integration and use of mixed media documents |
US9020966B2 (en) | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
US8073263B2 (en) * | 2006-07-31 | 2011-12-06 | Ricoh Co., Ltd. | Multi-classifier selection and monitoring for MMR-based image recognition |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US9176984B2 (en) * | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US8676810B2 (en) | 2006-07-31 | 2014-03-18 | Ricoh Co., Ltd. | Multiple index mixed media reality recognition using unequal priority indexes |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US9138636B2 (en) | 2007-05-16 | 2015-09-22 | Eyecue Vision Technologies Ltd. | System and method for calculating values in tile games |
US8194933B2 (en) * | 2007-12-12 | 2012-06-05 | 3M Innovative Properties Company | Identification and verification of an unknown document according to an eigen image process |
US8540158B2 (en) | 2007-12-12 | 2013-09-24 | Yiwu Lei | Document verification using dynamic document identification framework |
US8983170B2 (en) | 2008-01-18 | 2015-03-17 | Mitek Systems, Inc. | Systems and methods for developing and verifying image processing standards for mobile deposit |
US9842331B2 (en) | 2008-01-18 | 2017-12-12 | Mitek Systems, Inc. | Systems and methods for mobile image capture and processing of checks |
US10528925B2 (en) | 2008-01-18 | 2020-01-07 | Mitek Systems, Inc. | Systems and methods for mobile automated clearing house enrollment |
US8385660B2 (en) | 2009-06-24 | 2013-02-26 | Ricoh Co., Ltd. | Mixed media reality indexing and retrieval for repeated content |
KR20120089452A (ko) | 2009-08-04 | 2012-08-10 | 아이큐 비젼 테크놀로지즈 리미티드 | 물체 추출 시스템 및 방법 |
US9595108B2 (en) | 2009-08-04 | 2017-03-14 | Eyecue Vision Technologies Ltd. | System and method for object extraction |
CN102034081B (zh) * | 2009-09-25 | 2016-06-22 | 神基科技股份有限公司 | 使用影像作为数据来源的计算器装置 |
CN106067983B (zh) | 2010-04-13 | 2019-07-12 | Ge视频压缩有限责任公司 | 解码数据流的方法、生成数据流的方法及解码器 |
BR122020008249B1 (pt) | 2010-04-13 | 2021-02-17 | Ge Video Compression, Llc | herança em amostra de arranjo em subdivisão multitree |
CN106231337B (zh) | 2010-04-13 | 2020-06-19 | Ge视频压缩有限责任公司 | 解码器、解码方法、编码器以及编码方法 |
EP3703369B1 (en) | 2010-04-13 | 2024-07-24 | GE Video Compression, LLC | Sample region merging |
US10891475B2 (en) | 2010-05-12 | 2021-01-12 | Mitek Systems, Inc. | Systems and methods for enrollment and identity management using mobile imaging |
CN101908241B (zh) * | 2010-08-03 | 2012-05-16 | 广州广电运通金融电子股份有限公司 | 有价文件识别方法及其识别系统 |
US9336452B2 (en) * | 2011-01-16 | 2016-05-10 | Eyecue Vision Technologies Ltd. | System and method for identification of printed matter in an image |
JP5703898B2 (ja) * | 2011-03-30 | 2015-04-22 | 富士通株式会社 | 帳票管理システム、帳票画像管理方法、及びプログラム |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
US8657195B2 (en) * | 2011-09-27 | 2014-02-25 | Symbol Technologies, Inc. | Document capture with imaging-based bar code readers |
US8996350B1 (en) | 2011-11-02 | 2015-03-31 | Dub Software Group, Inc. | System and method for automatic document management |
WO2014018001A1 (en) * | 2012-07-23 | 2014-01-30 | Hewlett-Packard Development Company, L.P. | Document classification |
US9208378B2 (en) * | 2012-09-28 | 2015-12-08 | Ncr Corporation | Methods of processing data from multiple image sources to provide normalized confidence levels for use in improving performance of a recognition processor |
US9536139B2 (en) * | 2013-03-15 | 2017-01-03 | Mitek Systems, Inc. | Systems and methods for assessing standards for mobile image quality |
JP6173044B2 (ja) * | 2013-05-27 | 2017-08-02 | 株式会社Pfu | 画像読取装置、圧縮率決定方法及びコンピュータプログラム |
US9171203B2 (en) | 2013-09-10 | 2015-10-27 | Dropbox, Inc. | Scanbox |
US9483629B2 (en) | 2013-09-26 | 2016-11-01 | Dragnet Solutions, Inc. | Document authentication based on expected wear |
US11074273B2 (en) | 2014-03-07 | 2021-07-27 | International Business Machines Corporation | Framework for continuous processing of a set of documents by multiple software applications |
FR3021434B1 (fr) * | 2014-05-23 | 2017-09-22 | Oberthur Technologies | Procede de controle d'un document identitaire |
KR101650865B1 (ko) * | 2014-09-30 | 2016-08-26 | 기산전자 주식회사 | 영상 처리를 통한 수표의 비교 방법 및 그 장치 |
WO2016061292A1 (en) * | 2014-10-17 | 2016-04-21 | SimonComputing, Inc. | Method and system for imaging documents in mobile applications |
JP6623597B2 (ja) * | 2015-07-27 | 2019-12-25 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP6875061B2 (ja) * | 2015-08-06 | 2021-05-19 | 日本電気株式会社 | 画像判定システム、画像判定方法、画像判定プログラム、画像判定プログラムを記録する記録媒体 |
WO2017059489A1 (en) * | 2015-10-06 | 2017-04-13 | Business And Personal Solutions Group Pty Ltd | Electronic document certification |
KR101697875B1 (ko) * | 2015-10-30 | 2017-01-18 | 아주대학교산학협력단 | 그래프 모델에 기반하는 문서 분석 방법 및 그 시스템 |
CA2954089A1 (en) * | 2016-01-08 | 2017-07-08 | Confirm, Inc. | Systems and methods for authentication of physical features on identification documents |
SG10201603768SA (en) | 2016-05-11 | 2017-12-28 | Mastercard Asia Pacific Pte Ltd | Method And System For Identifying A Payment Card Design |
US9626609B1 (en) * | 2016-05-20 | 2017-04-18 | Flexera Software Llc | Asset creation from hardware asset tags using a mobile device |
KR20190039673A (ko) | 2016-05-24 | 2019-04-15 | 모포트러스트 유에스에이, 엘엘씨 | 문서 이미지 품질 평가 |
MX2018014616A (es) | 2016-06-03 | 2019-05-20 | Veridas Digital Authentication Solutions S L | Metodo para autenticar un documento. |
US10225088B2 (en) * | 2016-07-25 | 2019-03-05 | International Business Machines Corporation | Deterministic verification of digital identity documents |
US10262010B2 (en) * | 2016-11-02 | 2019-04-16 | International Business Machines Corporation | Screen capture data amalgamation |
US11373076B2 (en) | 2017-02-20 | 2022-06-28 | 3M Innovative Properties Company | Optical articles and systems interacting with the same |
US20180314908A1 (en) * | 2017-05-01 | 2018-11-01 | Symbol Technologies, Llc | Method and apparatus for label detection |
WO2019064108A1 (en) | 2017-09-27 | 2019-04-04 | 3M Innovative Properties Company | PERSONAL PROTECTIVE EQUIPMENT MANAGEMENT SYSTEM USING OPTICAL PATTERNS FOR EQUIPMENT AND SECURITY MONITORING |
WO2019113576A1 (en) * | 2017-12-10 | 2019-06-13 | Walmart Apollo, Llc | Systems and methods for automated classification of regulatory reports |
US20190236348A1 (en) * | 2018-01-30 | 2019-08-01 | Ncr Corporation | Rapid landmark-based media recognition |
CN110309840B (zh) | 2018-03-27 | 2023-08-11 | 创新先进技术有限公司 | 风险交易识别方法、装置、服务器及存储介质 |
RU2715515C2 (ru) | 2018-03-30 | 2020-02-28 | Акционерное общество "Лаборатория Касперского" | Система и способ выявления изображения, содержащего идентификационный документ |
US10880299B2 (en) * | 2018-05-30 | 2020-12-29 | Jumio Corporation | Machine learning for document authentication |
US11462037B2 (en) | 2019-01-11 | 2022-10-04 | Walmart Apollo, Llc | System and method for automated analysis of electronic travel data |
CN109800736B (zh) * | 2019-02-01 | 2023-07-21 | 东北大学 | 一种基于遥感影像和深度学习的道路提取方法 |
US11631266B2 (en) | 2019-04-02 | 2023-04-18 | Wilco Source Inc | Automated document intake and processing system |
US10862854B2 (en) * | 2019-05-07 | 2020-12-08 | Bitdefender IPR Management Ltd. | Systems and methods for using DNS messages to selectively collect computer forensic data |
CN110287971B (zh) * | 2019-05-22 | 2023-11-14 | 平安银行股份有限公司 | 数据验证方法、装置、计算机设备及存储介质 |
JP6662484B2 (ja) * | 2019-08-14 | 2020-03-11 | 大日本印刷株式会社 | 特定装置、特定方法及びコンピュータプログラム |
US11393272B2 (en) | 2019-09-25 | 2022-07-19 | Mitek Systems, Inc. | Systems and methods for updating an image registry for use in fraud detection related to financial documents |
US20210097274A1 (en) * | 2019-09-30 | 2021-04-01 | UiPath, Inc. | Document processing framework for robotic process automation |
WO2021086837A1 (en) * | 2019-10-29 | 2021-05-06 | Woolly Labs, Inc. Dba Vouched | System and methods for authentication of documents |
KR102284781B1 (ko) * | 2020-05-19 | 2021-08-02 | (주)가온아이 | 문서의 스캔 이미지에 대한 보정이 가능한 전자 장치 및 그 동작 방법 |
KR102234580B1 (ko) * | 2020-06-07 | 2021-03-31 | 주식회사 플로이드 | 영상 분석 장치 및 방법 |
US12045169B2 (en) * | 2020-12-23 | 2024-07-23 | Advanced Micro Devices, Inc. | Hardware configuration selection using machine learning model |
US20220207268A1 (en) * | 2020-12-31 | 2022-06-30 | UiPath, Inc. | Form extractor |
KR102578043B1 (ko) * | 2021-07-07 | 2023-09-14 | 주식회사 에이치디정션 | 메디컬 자료 관리 시스템, 관리 방법 및 이를 위한 프로그램 |
US20230014904A1 (en) * | 2021-07-16 | 2023-01-19 | SparkCognition, Inc. | Searchable data structure for electronic documents |
CN114173355B (zh) * | 2021-10-25 | 2023-08-29 | 科大国创云网科技有限公司 | 一种设计运行态分离的网络指令动态执行方法及系统 |
TWI807467B (zh) * | 2021-11-02 | 2023-07-01 | 中國信託商業銀行股份有限公司 | 要項偵測模型建立方法、業務導向要項鍵值辨識系統及方法 |
US11797589B2 (en) * | 2021-11-17 | 2023-10-24 | Paypal, Inc. | Reducing overcollection of unstructured data |
CN114266267B (zh) * | 2021-12-20 | 2024-03-19 | 武汉烽火众智智慧之星科技有限公司 | 集合二维码、文档、证件、人脸的自动识别方法、装置及存储介质 |
US11977841B2 (en) | 2021-12-22 | 2024-05-07 | Bank Of America Corporation | Classification of documents |
US11651093B1 (en) * | 2022-02-24 | 2023-05-16 | LendingClub Bank, National Association | Automated fraudulent document detection |
EP4328879A1 (en) * | 2022-08-26 | 2024-02-28 | Alpvision SA | Systems and methods for predicting the authentication detectability of counterfeited items |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010021270A1 (en) * | 2000-03-10 | 2001-09-13 | Katsutoshi Kobara | Image collating apparatus and image collating method |
US20060017959A1 (en) * | 2004-07-06 | 2006-01-26 | Downer Raymond J | Document classification and authentication |
CN101095149A (zh) * | 2004-05-28 | 2007-12-26 | 索尼英国有限公司 | 图像比较 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5159667A (en) * | 1989-05-31 | 1992-10-27 | Borrey Roland G | Document identification by characteristics matching |
US6269169B1 (en) | 1998-07-17 | 2001-07-31 | Imaging Automation, Inc. | Secure document reader and method therefor |
US6496594B1 (en) | 1998-10-22 | 2002-12-17 | Francine J. Prokoski | Method and apparatus for aligning and comparing images of the face and body from different imagers |
WO2000046736A1 (en) * | 1999-02-05 | 2000-08-10 | Yoav Smith | Similarity measurement method for the classification of medical images into predetermined categories |
US6288842B1 (en) | 2000-02-22 | 2001-09-11 | 3M Innovative Properties | Sheeting with composite image that floats |
KR100445800B1 (ko) | 2001-01-05 | 2004-08-25 | 학교법인 인하학원 | 상관관계를 이용한 유사도 측정의 얼굴 인증 방법 |
US7043075B2 (en) * | 2001-09-27 | 2006-05-09 | Koninklijke Philips Electronics N.V. | Computer vision system and method employing hierarchical object classification scheme |
US20040036681A1 (en) * | 2002-08-23 | 2004-02-26 | International Business Machines Corporation | Identifying a form used for data input through stylus movement by means of a traced identifier pattern |
US6785405B2 (en) * | 2002-10-23 | 2004-08-31 | Assuretec Systems, Inc. | Apparatus and method for document reading and authentication |
US7580551B1 (en) | 2003-06-30 | 2009-08-25 | The Research Foundation Of State University Of Ny | Method and apparatus for analyzing and/or comparing handwritten and/or biometric samples |
WO2005038700A1 (en) | 2003-10-09 | 2005-04-28 | University Of York | Image recognition |
US7912291B2 (en) | 2003-11-10 | 2011-03-22 | Ricoh Co., Ltd | Features for retrieval and similarity matching of documents from the JPEG 2000-compressed domain |
US7672475B2 (en) | 2003-12-11 | 2010-03-02 | Fraudhalt Limited | Method and apparatus for verifying a hologram and a credit card |
KR20060013215A (ko) | 2004-08-06 | 2006-02-09 | 이병익 | 무선 통신망을 이용한 신분증 조회장치 및 방법 |
US8249344B2 (en) | 2005-07-01 | 2012-08-21 | Microsoft Corporation | Grammatical parsing of document visual structures |
US8233751B2 (en) | 2006-04-10 | 2012-07-31 | Patel Nilesh V | Method and system for simplified recordkeeping including transcription and voting based verification |
US8096584B2 (en) | 2006-07-24 | 2012-01-17 | 3M Innovative Properties Company | Document authentication using template matching with fast masked normalized cross-correlation |
US8045798B2 (en) * | 2007-08-30 | 2011-10-25 | Xerox Corporation | Features generation and spotting methods and systems using same |
US8194933B2 (en) | 2007-12-12 | 2012-06-05 | 3M Innovative Properties Company | Identification and verification of an unknown document according to an eigen image process |
US8540158B2 (en) | 2007-12-12 | 2013-09-24 | Yiwu Lei | Document verification using dynamic document identification framework |
-
2007
- 2007-12-12 US US11/955,136 patent/US8540158B2/en active Active
-
2008
- 2008-11-12 NZ NZ586077A patent/NZ586077A/xx not_active IP Right Cessation
- 2008-11-12 MX MX2010006496A patent/MX2010006496A/es active IP Right Grant
- 2008-11-12 WO PCT/US2008/083163 patent/WO2009075987A2/en active Application Filing
- 2008-11-12 BR BRPI0819426-2A patent/BRPI0819426A2/pt not_active IP Right Cessation
- 2008-11-12 CN CN2008801254120A patent/CN101925904A/zh active Pending
- 2008-11-12 AU AU2008335637A patent/AU2008335637B2/en not_active Ceased
- 2008-11-12 JP JP2010538020A patent/JP2011510365A/ja active Pending
- 2008-11-12 CA CA2708588A patent/CA2708588A1/en not_active Abandoned
- 2008-11-12 EP EP08860346.9A patent/EP2232399A4/en not_active Withdrawn
- 2008-11-12 KR KR1020107015201A patent/KR101515256B1/ko active IP Right Grant
- 2008-11-25 TW TW097145484A patent/TWI484421B/zh not_active IP Right Cessation
-
2010
- 2010-06-10 IL IL206309A patent/IL206309A0/en unknown
- 2010-07-09 ZA ZA2010/04858A patent/ZA201004858B/en unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010021270A1 (en) * | 2000-03-10 | 2001-09-13 | Katsutoshi Kobara | Image collating apparatus and image collating method |
CN101095149A (zh) * | 2004-05-28 | 2007-12-26 | 索尼英国有限公司 | 图像比较 |
US20060017959A1 (en) * | 2004-07-06 | 2006-01-26 | Downer Raymond J | Document classification and authentication |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069898A (zh) * | 2015-07-15 | 2015-11-18 | 广州敦和信息技术有限公司 | 一种发票字条自动定位的方法及装置 |
CN105069898B (zh) * | 2015-07-15 | 2018-03-30 | 广州敦和信息技术有限公司 | 一种发票字条自动定位的方法及装置 |
CN106445822A (zh) * | 2016-09-23 | 2017-02-22 | 上海图聚智能科技股份有限公司 | 高扩展性的前后端数据校验方法 |
CN107463074A (zh) * | 2017-07-27 | 2017-12-12 | 珠海赛纳打印科技股份有限公司 | 成像方法及成像装置 |
CN107463074B (zh) * | 2017-07-27 | 2019-08-20 | 珠海赛纳打印科技股份有限公司 | 成像方法及成像装置 |
CN108460344A (zh) * | 2018-02-07 | 2018-08-28 | 北京工业大数据创新中心有限公司 | 屏幕中的动态区域智能识别系统及智能识别方法 |
CN109799984A (zh) * | 2019-01-15 | 2019-05-24 | 深圳前海微众银行股份有限公司 | 人脸框绘制方法、装置、设备及计算机可读存储介质 |
CN109799984B (zh) * | 2019-01-15 | 2022-04-26 | 深圳前海微众银行股份有限公司 | 人脸框绘制方法、装置、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2009075987A3 (en) | 2009-08-13 |
JP2011510365A (ja) | 2011-03-31 |
WO2009075987A2 (en) | 2009-06-18 |
AU2008335637A1 (en) | 2009-06-18 |
IL206309A0 (en) | 2010-12-30 |
ZA201004858B (en) | 2011-03-30 |
MX2010006496A (es) | 2010-09-07 |
EP2232399A4 (en) | 2016-03-23 |
US20090152357A1 (en) | 2009-06-18 |
NZ586077A (en) | 2012-09-28 |
KR101515256B1 (ko) | 2015-04-24 |
US8540158B2 (en) | 2013-09-24 |
CA2708588A1 (en) | 2009-06-18 |
TW200929013A (en) | 2009-07-01 |
TWI484421B (zh) | 2015-05-11 |
EP2232399A2 (en) | 2010-09-29 |
AU2008335637B2 (en) | 2012-02-02 |
KR20100101141A (ko) | 2010-09-16 |
BRPI0819426A2 (pt) | 2015-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101925904A (zh) | 使用动态文档识别框架的文档验证 | |
CN101925905B (zh) | 根据特征图像流程识别和验证未知文档 | |
US11568400B2 (en) | Anomaly and fraud detection with fake event detection using machine learning | |
KR102125379B1 (ko) | 딥러닝 기반의 신분증 진위판단장치 및 신분증 진위판단방법 | |
Asghar et al. | Copy-move and splicing image forgery detection and localization techniques: a review | |
US10354472B2 (en) | Self-learning system and methods for automatic document recognition, authentication, and information extraction | |
CN110443159A (zh) | 数字识别方法、装置、电子设备及存储介质 | |
CN114862845A (zh) | 手机触摸屏的缺陷检测方法、装置、设备及存储介质 | |
JP5003051B2 (ja) | 郵便自動区分機及び郵便自動区分方法 | |
CN113159015A (zh) | 一种基于迁移学习的印章识别方法 | |
JP2003109007A (ja) | 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置 | |
US11995907B2 (en) | Distributed computer system for document authentication | |
CN109919626A (zh) | 一种高风险银行卡的识别方法及装置 | |
Bouma et al. | Authentication of travel and breeder documents | |
Şahinaslan et al. | A study on remote detection of Turkey digital identity card hologram element | |
CN116071835B (zh) | 人脸识别攻击事后筛查的方法、装置和电子设备 | |
KR102648354B1 (ko) | 인공 신경망을 이용한 영상 변환 시스템 및 그 방법 | |
KR102043428B1 (ko) | 패키지 박스의 인쇄 유사도 계산을 이용한 위품 판정 장치 | |
CN116052257A (zh) | 多模态人脸防伪检测方法、装置、计算机设备及存储介质 | |
Al Khiat et al. | Cash Currencies Recognition Using KNN Classifier |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20101222 |