CN106104572A - 用于识别文档处理和业务工作流整合的系统和方法 - Google Patents
用于识别文档处理和业务工作流整合的系统和方法 Download PDFInfo
- Publication number
- CN106104572A CN106104572A CN201580014141.1A CN201580014141A CN106104572A CN 106104572 A CN106104572 A CN 106104572A CN 201580014141 A CN201580014141 A CN 201580014141A CN 106104572 A CN106104572 A CN 106104572A
- Authority
- CN
- China
- Prior art keywords
- workflow
- data
- profile
- classification
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 321
- 230000008569 process Effects 0.000 title description 94
- 238000000605 extraction Methods 0.000 claims abstract description 49
- 230000005284 excitation Effects 0.000 claims abstract description 35
- 230000004044 response Effects 0.000 claims abstract description 33
- 239000000284 extract Substances 0.000 claims abstract description 28
- 238000004590 computer program Methods 0.000 claims abstract description 16
- 238000001514 detection method Methods 0.000 claims abstract description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 230000000875 corresponding effect Effects 0.000 description 73
- 230000000694 effects Effects 0.000 description 48
- 238000005516 engineering process Methods 0.000 description 39
- 238000013459 approach Methods 0.000 description 25
- 238000003860 storage Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 18
- 239000013598 vector Substances 0.000 description 18
- 239000002609 medium Substances 0.000 description 16
- 230000006870 function Effects 0.000 description 14
- 230000036541 health Effects 0.000 description 11
- 238000007726 management method Methods 0.000 description 11
- 238000011282 treatment Methods 0.000 description 11
- 230000010354 integration Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 238000003384 imaging method Methods 0.000 description 8
- 238000013396 workstream Methods 0.000 description 8
- 206010039203 Road traffic accident Diseases 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 125000004122 cyclic group Chemical group 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000002349 favourable effect Effects 0.000 description 5
- 230000000977 initiatory effect Effects 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 4
- 239000000654 additive Substances 0.000 description 4
- 230000000996 additive effect Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000012797 qualification Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010224 classification analysis Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000009223 counseling Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000011143 downstream manufacturing Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241001270131 Agaricus moelleri Species 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 241001553178 Arachis glabrata Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- SPNQRCTZKIBOAX-UHFFFAOYSA-N Butralin Chemical compound CCC(C)NC1=C([N+]([O-])=O)C=C(C(C)(C)C)C=C1[N+]([O-])=O SPNQRCTZKIBOAX-UHFFFAOYSA-N 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- XEGGRYVFLWGFHI-UHFFFAOYSA-N bendiocarb Chemical compound CNC(=O)OC1=CC=CC2=C1OC(C)(C)O2 XEGGRYVFLWGFHI-UHFFFAOYSA-N 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 230000004313 glare Effects 0.000 description 1
- 230000037308 hair color Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000003137 locomotive effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012120 mounting media Substances 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000036316 preload Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000001957 retinal vein Anatomy 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007616 round robin method Methods 0.000 description 1
- 231100000241 scar Toxicity 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Operations Research (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
一种方法,包括:利用移动设备接收或捕获包括身份文档(ID)的图像;将所述ID分类;基于所述ID分类建立提取模型;基于所述提取模型从所述ID中提取数据;基于所提取的数据建立ID简档;将所述ID简档存储到所述移动设备的存储器中;检测工作流中的预定激励;至少部分响应于检测到所述预定激励识别所存储的ID简档中的工作流相关数据;将来自所存储的ID简档的所述工作流相关数据提供给所述工作流;以及利用所述工作流相关数据驱动所述工作流的至少一部分。还公开了相关的系统和计算机程序产品。
Description
要求优先权
本申请要求申请号为14/220,029(于2014年3月19日提交的)美国专利申请的优先权的权益,其转而要求申请号为13/740,123(于2013年1月11日提交的)美国专利申请的优先权的权益,其转而要求申请号为61/586,062(于2012年1月12日提交的)美国临时申请和申请号为61/720,958(于2012年10月31日提交的)美国临时申请的优先权的权益。
技术领域
本发明涉及图像捕获和图像处理,并且具体地,涉及利用移动设备关于实施部分或全部工作流来捕获并处理身份文档(ID)的数字图像。
背景技术
本文中描绘的诸如信、支票、账单、发票等文档的数字图像通常利用耦连至计算机工作站(诸如膝上型或桌上型计算机)的扫描仪或多功能外围设备捕获并处理。能够实施这种捕获和处理的方法和系统在本领域是公知的,并且很好地适于采用它们的任务。
然而,在日常的活动、计算和业务越来越多地利用移动设备实施的时代,提供用于在移动平台(诸如智能手机、数码相机、平板电脑等)上部署并使用的类似的文档捕获和处理系统及方法会是非常有益的。
转变传统文档捕获和处理技术的主要挑战是利用目前可用于移动设备的硬件可实现的有限处理功率和图像分辨率。这些限制提出了重大挑战,因为处理在比传统扫描仪可实现的低得多的分辨率下捕获的图像是不可能的或不切实际的。
此外,移动设备上可用的有限的处理和内存使得扫描仪采用的传统图像处理算法在计算成本方面高得令人望而却步。尝试处理传统基于扫描仪的图像的处理算法成为现代移动平台上的实际应用程序花费了太多时间。
又一挑战由移动捕获部件(例如,移动电话、平板等的摄像头)的性质提出。传统扫描仪能够如实地在数字图像中表示物理文档,严格地在数字图像中维持物理文档的纵横比、尺寸和形状,移动捕获部件通常不能产生这样的结果。
具体地,由摄像头捕获的文档的图像呈现一系列新的处理问题,其是在处理扫描仪捕获的图像时所没遇到过的。这一部分是由于获取文档图像的方式以及制造设备的方式的固有差异。一些扫描仪工作的方式是使用传动机构,其在纸和传感器的线性阵列之间创建了相对运动。这些传感器随着其运动创建了文档的像素值,并且这些所捕获的像素值的序列形成图像。因此,这些在传感器本身中直到噪声一般是水平和垂直一致的,同一传感器提供了行中的所有像素。
相反,摄像头具有许多个非线性阵列的传感器,例如典型地布置为矩形。因而,所有这些个体传感器是独立的,渲染图像数据典型地不具有垂直和水平一致性。此外,摄像头引入了投影效果,其是拍照的角度的函数。例如,采用如扫描仪中的线性阵列,即使纸的传输并不完美正交于传感器的准线而是引入了一些倾斜,也没有如摄像头中的投影效果。此外,采用摄像头捕获,由于摄像头光学可能引入非线性失真。
利用摄像头或摄像头的阵列捕获图像和/或视频数据所特有的其他主要挑战可包括可变照明条件,例如,不均匀灯光条件,其可在图像中描绘的对象上产生阴影,存在镜面光,其可产生炫光等,如技术人员在阅读本公开时会理解的。
此外,利用摄像头捕获图像和/或视频数据引入了关于将兴趣对象从与平板扫描仪的典型背景(其展现了公知的并且相对不可变的特征,例如,扫描仪背景的单一背景纹理和颜色)相比相对复杂的背景区分开的挑战。结果是,分簇的背景使得页面分割与利用扫描仪生成的图像数据典型地遇到的情景相比困难并富有挑战性。
由于上面呈现的挑战,提供补偿和/或校正与利用移动设备的图像捕获和处理相关联的问题而经由有效的处理方法维持低计算成本的图像捕获和处理算法及其应用会是有益的。
而且,移动设备正在成为参与依赖于常常在财务文档上描绘的数据的多种交互性过程的主要接口。移动接口的主要优点在于可以利用移动设备方便地并且安全地使文档成像。例如,银行行业最近已见证了移动变革,移动技术使能更加关注收集周围的新服务和功能,诸如移动存支票和移动账单支付。这些应用利用移动设备的持续连接来向顾客和服务提供商提供前所未有的可访问性和服务质量,因此提高了财务交易记录管理的分辨率和准确性,并且由于移动设备的已知安全优点提高了财务交易的安全性。
时至今日,这些应用在范围上已限制为利用财务服务行业的非常狭窄方面所特有的协议和标准来简化交易。更加显著地,财务行业已能够将协议(诸如账户和路由号的通用格式、磁墨水字符识别(MICR)的近通用表现)用在财务交易(诸如支票、汇款单等)所用的文档上。
如在Nepomniachtchi等人的申请号为7,778,457;7,787,695;7,949,167;7,953,268;7,978,900;8,000,514;8,326,015;8,379,914;8,577,118和/或8,582,862的美国专利中所描述的,传统的移动财务服务包含移动图像处理和移动存支票方法,其很大程度上依赖于MICR字符。MICR字符用于进行图像处理操作,其对于确保适当的图像质量(诸如确保图像处于合适的大小和/或定向)用于后续的财务处理是必需的。MICR字符还用于进行财务处理方面,诸如将付款/存款路由到与在所成像的支票或汇款单上描绘的号码相对应的账户。
依赖于这种传统标准和特定于工业的实践允许那些标准和实践所应用于的非常有限范围内的高保真度和高性能,但不幸地将下面技术的可用性限制到仅那些狭窄的领域。移除对这种标准信息的依赖并使能移动技术更广泛的应用于现代图像捕获、处理和业务流整合会是非常有利的。例如,虽然身份文档普遍描绘识别信息,其在多种应用中是有用的,包括但当然并不限于财务交易,但是,多种类型的ID符合用于呈现此信息(例如,以类似于支票的MICR字符的方式呈现信息)的通用标准是相对少见的。事实上,即使是相同类型的ID,诸如驾驶证,也可描绘不同的信息或以取决于发布该ID的官方的非常不同的格式、方式和/或布局描绘相同信息。例如,考虑由不同州发布的驾驶证之间的差异,或根据雇主的雇员ID、根据区域的学校ID、根据分支机构的军队ID、根据提供者的保险卡等之间的差异。
因此,提供能够利用移动技术使用ID上描绘的身份信息并整合采用业务工作流成像、捕获和处理ID的系统、技术和计算机程序产品会是非常有益的。
于是,现在描述的系统和技术唯一提供了有利特征,其应用超出了财务交易的狭窄范围。下面公开的本发明的概念还消除了与依赖不可用于ID的通用标准(诸如MICR字符)相关联的限制。
发明内容
在一个实施例中,方法包括:利用移动设备接收或捕获包括身份文档(ID)的图像;至少部分基于所述图像将所述ID分类;至少部分基于所述ID分类从所述ID中提取数据;以及基于所提取的数据驱动工作流的至少一部分。
在另一实施例中,方法包括:利用移动设备接收或捕获包括身份文档(ID)的图像;将所述ID分类;基于所述ID分类建立提取模型;基于所述提取模型从所述ID中提取数据;基于所提取的数据建立ID简档;将所述ID简档存储到所述移动设备的存储器中;检测工作流中的预定激励;至少部分响应于检测到所述预定激励识别所存储的ID简档中的工作流相关数据;将来自所存储的ID简档的所述工作流相关数据提供给所述工作流;以及利用所述工作流相关数据驱动所述工作流的至少一部分。
在又一实施例中,计算机程序产品包括计算机可读存储介质,其具有存储在其中的计算机可读程序代码,所述计算机可读程序代码包括指令。所述指令配置为使得处理器:接收存储到移动设备中的或利用移动设备捕获的图像,所述图像包括身份文档(ID);将所述ID分类;基于所述ID分类建立提取模型;基于所述提取模型从所述ID中提取数据;基于所提取的数据建立ID简档;将所述ID简档存储到所述移动设备的存储器中;检测工作流中的预定激励;至少部分响应于检测到所述预定激励识别所存储的ID简档中的工作流相关数据;将来自所存储的ID简档的所述工作流相关数据提供给所述工作流;以及利用所述工作流相关数据驱动所述工作流的至少一部分。
本公开的发明性概念的其他方面和特征将从下面的详细说明中变得明显,其应理解为本质上是例示性的并且不限制为目前的公开。
附图说明
图1例示了根据一个实施例的网络体系架构。
图2示出了根据一个实施例的、可与图1的服务器和/或客户端相关联的代表性硬件环境。
图3是根据分层分类方案和/或重复分类过程的一个实施例的、同心、平行或重叠类别或分类的示意性表示。
图4是根据一个实施例的方法的流程图。
图5是根据一个实施例的方法的流程图。
图6是根据一个实施例的方法的流程图。
图7是根据一个实施例的方法的流程图。
图8是根据一个实施例的方法的流程图。
图9是根据一个实施例的方法的流程图。
具体实施方式
为了例示本发明的一般原理的目的进行下面的说明并且并不意味着限制本文中要求保护的发明性概念,而且,本文中描述的特定特征可以多种可能的组合和排列的每一种结合其他所描述的特征一起使用。
除了本文中特别限定以外,所有术语都给定它们最广泛可能的解释,包括由说明书隐含的意思,以及本领域技术人员理解的意思和/或字典、论文中限定的意思等。
还必须注意到,如在说明书和附属的权利要求中使用的,除非特别指定,单数形式“一”、“一个”和“该”包括复数指示对象。
一般工作流概念
本说明书阐述了配置为利用在移动、图像和视频捕获、图像和视频分析以及基于位置的服务和技术方面的新兴进步的新颖的并且有用的技术。这些公开呈现了从进行多种业务过程的移动设备的用户角度的示例性和新颖的实现方式。业务过程整个或部分具体化为可执行和/或能够经由移动设备相连接的工作流。工作流还唯一利用移动技术的图像和视频捕获/处理与基于位置的方面来增强关于产生、管理和实施一个或多个工作流的用户体验。
对于移动智能应用开发的用户体验包括工作流,以及形成工作流的任何组成操作(例如,活动和规则),和关于工作流的创建、实施和/或管理的相关联的系统、工具或技术。
例如,在一个实施例中,配置为发起、辅助或进行本申请的背景中的部分和/或整个工作流的移动应用可认为涵盖下面的一般情景。
用户将工作流限定为活动和规则集。工作流通过以固定顺序从一个活动移动到另一个或通过由激励确定的动态顺序来执行。规则在序列内的固定点或响应于激励被应用。用户还在来自开发平台的帮助下独立设计UI,或UI通过开发平台工具自动渲染,以与需要人类交互的活动相关联。
工作流经由活动、规则和UI定义限定移动用户体验,该体验提供移动UI和应用行为两者。过程定义可描述应用行为,因为移动开发平台揭露了本地移动服务和服务器服务的联合视图。过程执行并透明地协调直接在设备上的本地代码和驻留在服务器上的远程代码的执行。
在一个实施例中,用户发动移动应用。应用发起过程、采取第一活动并渲染所限定的UI。用户与UI交互并完成活动或提供激励,诸如“点击”UI按钮。在此时可以执行规则或可采取/实施下一个活动。在另一种情况下,可访问局部本地服务,诸如可使用从OS或服务器服务检索(诸如数据库查找)的设备位置。本地和/或远程服务的此规定对用户是透明的。
移动应用可整个或部分下载和/或在移动设备上实时运行。例如,应用可保持在在线资源库中。响应于用户请求、响应于移动应用的新发布在在线资源库中变得可用等,移动应用的实例可自动转移到移动设备。在优选的实施例中,将移动应用的新实例转移到移动设备并实例化那些新实例是对用户透明发生的过程并且无需要求来自在移动设备上操作移动应用的终端用户的任何交互或指令。
当然,根据本领域普通技术人员基于研究本申请后将实现的理解,现在描述的工作流的其他等同形式及其在移动设备上的实现方式也都理解为普遍落入本说明书的范围。
移动图像捕获和处理
如本文所讨论的,“图像处理”(并且具体地,利用移动设备的图像处理)应理解为可选地包括在于2013年1月11日提交的、申请号为13/740,123的相关美国专利申请中公开的任何的技术和/或科技。
这些技术包括但不限于利用移动设备捕获图像数据、配置为提高图像质量的图像处理算法,以及具体地关于文档的图像。例如,在多个实施例中的“图像处理”可包括页面检测、矩形化、歪斜校正、颜色转换(例如,从24位RGB颜色到8位灰度、1位黑白,或如本领域普通技术人员理解的其他颜色深度表示)、分辨率估计、照明校正、模糊检测等中的一个或多个,如相关的申请号为13/740,123的美国专利申请中所公开的,和/或如本领域普通技术人员在阅读本说明书时将理解的。
虽然主要参考利用所捕获的图像数据和/或以静止图像的形式例如数字照片的示范性实施例提供本说明书,但技术人员在阅读本说明书时也将理解,这些原理同样适用于使用数字视频数据。特别感兴趣的是配置为利用移动设备捕获和/或处理视频数据的技术和/或科技。
具有与移动技术、移动图像处理和工作流管理领域的相关发明性概念的前述关系,利用基于位置的服务、位置信息等的本公开的工作流的示范性发明原理可理解为包括下面的一般实施例。
一般实施例
在一个一般实施例中,方法包括利用移动设备接收或捕获包括身份文档(ID)的图像;至少部分基于所述图像将所述ID分类;至少部分基于所述ID分类从所述ID中提取数据;以及基于所提取的数据驱动工作流的至少一部分。
在另一一般实施例中,方法包括:利用移动设备接收或捕获包括身份文档(ID)的图像;将所述ID分类;基于所述ID分类建立提取模型;基于所述提取模型从所述ID中提取数据;基于所提取的数据建立ID简档;将所述ID简档存储到所述移动设备的存储器中;检测工作流中的预定激励;至少部分响应于检测到所述预定激励识别所存储的ID简档中的工作流相关数据;将来自所存储的ID简档的所述工作流相关数据提供给所述工作流;以及利用所述工作流相关数据驱动所述工作流的至少一部分。
在又一一般实施例中,计算机程序产品包括计算机可读存储介质,其具有存储在其中的计算机可读程序代码,所述计算机可读程序代码包括指令。所述指令配置为使得处理器:接收存储到移动设备中的或利用移动设备捕获的图像,所述图像包括身份文档(ID);将所述ID分类;基于所述ID分类建立提取模型;基于所述提取模型从所述ID中提取数据;基于所提取的数据建立ID简档;将所述ID简档存储到所述移动设备的存储器中;检测工作流中的预定激励;至少部分响应于检测到所述预定激励识别所存储的ID简档中的工作流相关数据;将来自所存储的ID简档的所述工作流相关数据提供给所述工作流;以及利用所述工作流相关数据驱动所述工作流的至少一部分。
通用计算概念和联网概念
现在转向附图。图1例示了根据一个实施例的网络体系架构100。如图1所示,提供了多个远程网络102,包括第一远程网络104和第二远程网络106。网关101可以耦合在远程网络102和邻近网络108之间。在本网络体系架构100的上下文中,网络104、106可以各自采用任何形式,包括但不限于LAN、WAN诸如因特网、公共交换电话网络(PSTN)、内部电话网络等。
在使用中,网关101用作从远程网络102到邻近网络108的入口点。这样,网关101可以起到路由器和交换机的作用,路由器能够为到达网关101的指定的数据包导向,交换机为指定的数据包提供进出网关101的实际路径。
进一步包括至少一个数据服务器114,其耦连至邻近网络108,并且经由网关101从远程网络102易访问。应注意到,一个或多个数据服务器114可以包括任何类型的计算设备/组件。耦连至每个数据服务器114的是多个用户设备116。这样的用户设备116可以包括台式计算机、膝上型计算机、手持式计算机、移动设备、打印机或任何其他类型的逻辑。应注意到,在一个实施例中,用户设备111还可以直接耦连至任何网络。
外围设备120或外围设备系列120,例如传真机、打印机、网络和/或本地存储单元或系统等,可以耦连至一个或多个网络104、106、108。应注意到,数据库和/或附加的部件可以与耦连至网络104、106、108的任何类型的网络元件一起被利用,或集成到其上被利用。在本说明书的上下文中,网络元件可以指的是任何网络部件。
根据一些方法,本文中描述的方法和系统可以用虚拟系统和/或诸如仿真IBM z/OS环境的UNIX系统、实际上主用MICROSOFT WINDOWS环境的UNIX系统、仿真IBM z/OS环境的MICROSOFT WINDOWS系统等仿真一个或多个其他系统的系统实现和/或在其上实现。在一些实施例中,此虚拟化和/或仿真可以通过使用VMWARE软件被加强。
在更多的方法中,一个或多个网络104、106、108可以表示通常称为“云”的系统集群。在云计算中,共享的资源,诸如处理功率、外围设备、软件、数据、服务器等,按要求关系被提供给云中的任何系统,由此允许跨许多计算系统访问和分配服务。云计算典型地包含在云中操作的系统之间的因特网连接,但还可以使用连接系统的其他技术。
图2示出了根据一个实施例的、与图1的用户设备116和/或服务器114相关联的有代表性的硬件环境。图2例示了具有诸如微处理器的中央处理单元(CPU)210和经由一个或多个总线212互连的多个其他单元的工作站的典型的硬件配置,根据若干实施例,所述总线212可以是多种类型的总线,诸如本地总线、并行总线、串行总线等。
图2中示出的工作站包括随机存取存储器(RAM)214,只读存储器(ROM)216,用于连接诸如硬盘存储单元220的外围设备到一个或多个总线212的I/O适配器218,用于连接键盘224、鼠标226、扬声器228、麦克风232和/或诸如触摸屏和数码相机(未示出)的其他用户接口设备到一个或多个总线212的用户接口适配器222,用于连接工作站到通信网络235(例如,数据处理网络)的通信适配器234和用于连接一个或多个总线212到显示设备238的显示器适配器236。
工作站可以具有常驻其上的操作系统,诸如MICROSOFT WINDOWS操作系统(OS)、MAC OS、UNIX OS等。将理解,优选的实施例还可以在除了所提到的那些以外的平台和操作系统上实现。优选的实施例可以利用JAVA、XML、C和/或C++语言,或其他编程语言,随着面向对象编程方法而写入。可以使用面向对象编程(OOP),其变得越来越多地用于开发复杂应用程序。
本文的说明被呈现以使得本领域的任何技术人员能够制作和使用本发明并且在本发明和它们的等同物的特定应用的上下文中被提供。对所公开的实施例的多种修改对本领域技术人员将是非常明显的并且本文中限定的一般原理可用于其他实施例和应用而不脱离本发明的精神和范围。因此,本发明并不意图被限制为所示出的实施例,而是符合与本文中所公开的原理和特征相一致的最广泛的范围。
具体地,本文所讨论的发明的多个实施例利用因特网实现为多个计算机系统之间的通信手段。本领域技术人员将认识到,本发明并不限制为使用因特网作为通信介质并且本发明的可替代方法可适应于使用专用内联网、局域网(LAN)、广域网(WAN)或其他通信手段。此外,可利用有线、无线(例如,射频)和光通信链接的多种组合。
本发明的一个实施例在其中执行的程序环境示例性合并了一个或多个通用计算机或专用设备诸如手持式计算机。这种设备(例如,处理器、存储器、数据存储、输入和输出设备)的细节是公知的并且为了简洁被省略。
还应理解,本发明的技术可利用多种科技实现。例如,本文描述的方法可用在计算机系统上运行的软件实现,或利用一个或多个处理器和逻辑(硬件和/或软件)用硬件实现,以实施方法、应用特定集成电路、可编程逻辑设备诸如现场可编程门阵列(FPGA)和/或它们的多种组合的操作。在一个示例性方法中,本文中描述的方法可通过驻居在存储介质上的一系列计算机可执行指令实现,所述存储介质诸如物理(例如,非暂态)计算机可读介质。此外,虽然本发明的特定实施例可利用面向对象的软件编程概念,本发明并不这样限制并且容易适于利用其它形式的引导计算机的操作。
本发明还可以计算机程序产品的形式提供,所述计算机程序产品包括计算机可读存储或信号介质,其具有在其上的计算机代码,所述计算机代码由计算设备(例如,处理器)和/或系统执行。计算机可读存储介质可包括能够在其上存储计算机代码用于由计算设备或系统使用的任何介质,包括光媒介诸如只读或可写入CD和DVD、磁存储器或介质(例如,硬盘驱动、磁带)、半导体存储器(例如,闪存和其他便携式存储卡等)、在芯片上编码的固件等。
计算机可读信号介质是不适于前述存储介质类别的计算机可读介质。例如,示例性的计算机可读信号介质例如经由物理网络或虚拟网络等通信或转移系统内的、系统之间的暂态信号。
将清楚的是,前面方法的多个特征可以任何方式组合,从上面呈现的说明创建多种组合。
对本领域技术人员还将清楚的是,本发明的方法可适当地在包括逻辑的逻辑装置中具体化,以实施本文中呈现的方法的多个步骤,并且这种逻辑可包括硬件部件或固件部件。
对本领域技术人员同样清楚的是,多种方法中的逻辑布置可适当地在包括逻辑的逻辑装置中具体化,以实施该方法的多个步骤,并且这种逻辑可包括诸如例如可编程逻辑阵列中的逻辑门的成分。这种逻辑布置可进一步在使能装置或部件中具体化,以利用例如虚拟硬件描述符语言在这种阵列中暂态地或永久地建立逻辑结构,其可利用固定的或可传输的载体介质存储。
将理解的是,上面描述的方法还可适当地全部或部分用在一个或多个处理器(未示出)上运行的软件执行,并且该软件可用作在任何合适的数据载体(也未示出)诸如计算机磁盘或计算机光盘上携带的计算机程序元件。传输数据的通道同样可包括所有说明的存储介质以及信号载体介质,诸如有线或无线信号介质。
本发明的实施例可适当地具体化为计算机程序产品,用于与计算机系统一起使用。这种实现方式可包括一系列计算机可读指令,其或者固定在有形介质上,诸如计算机可读介质,例如,磁盘、CD-ROM、ROM或硬盘,或者经由调制解调器或其他接口设备通过有形介质(包括但不限于光或类似通信线路)或利用无线技术(包括但不限于微波、红外线或其他传输技术)无形地可传输到计算机系统。计算机可读指令系列具体化了所有或部分前面本文中描述的功能。
本领域技术人员将理解,这种计算机可读指令可以用与许多计算机体系架构或操作系统一起使用的多种编程语言写入。而且,这种指令可利用任何存储技术,现在或将来包括但不限于半导体、磁或光来存储,或利用任何通信技术,现在或将来包括但不限于光、红外线或微波来传输。考虑到,这种计算机程序产品可分配为可移除介质,其具有随附的打印或电子文档,例如,盒装(shrink-wrapped)软件、用计算机系统预加载的(例如,在系统ROM或固定磁盘上),或通过网络(例如,因特网或万维网)从服务器或电子公告栏分配。
通信部件诸如输入/输出设备或I/O设备(包括但不限于键盘、显示器、定点设备等)可直接或通过中介I/O控制器耦连至系统。
通信部件诸如总线、接口、网络适配器等还可耦连至系统,以使能数据处理系统(例如主机)变成通过中介专用网络或公共网络耦连至其他数据处理系统或远程打印机或存储设备。调制解调器、线缆调制解调器和以太网卡仅仅是少许目前可用类型的网络适配器。
身份文档(ID)
本说明涉及并且属于以移动设备为媒介的身份文档的图像捕获和处理以与业务工作流相整合的领域。如本文所理解的,术语“身份文档”或“ID”应理解为包括任何类型的文档,其可为了证明、认证或证实所有或部分的实体身份的目的而呈现。ID包括一种或多种类型的识别信息,其通常根据ID类型和与ID相对应的实体类型而改变,但多种类型的ID可描绘识别信息的一种或多种普通类型。
在一个实施例中,本文考虑的ID的示例性形式应理解为包括但不限于政府发布的ID,诸如护照、军队ID、税务ID、社会安全卡、出生证明(由政府机构发布)、证件或许可证诸如捕猎证、职业证、驾驶证等。
在更多的实施例中,ID还可包括雇主发布的ID,诸如雇员ID、安全文档或徽章、工资名单文档、救济金文档、证书等。
ID还可进一步包括财务文档,诸如保险单、卡,和其他相关保险文档、描绘财务账户信息的文档(诸如财务报表)、与财务账户(诸如支票、信用卡、账单卡)相关联的标书等。
在另一实施例中,ID可附加地和/或可替代地包括医疗文档,诸如医生图表、处方、医疗分析或评估、基因序列或简档或包含基因信息的其他文档等,如本领域普通技术人员在阅读本说明书时会理解的。
在至少一些方法中,ID可识别多个实体、人类和/或非人类。例如,在医疗文档的情况下,处方可认为用于识别至少两个人类实体(患者、开处方的医生和/或配药的药剂师)和至少两个非人类实体(药物和配药的药房)。在多个实施例中,ID可因此被认为通常为了与一个或多个实体相关的不同目的而与任意数目的这些实体相对应,在附近的特定上下文中所述ID被认为与所述一个或多个实体相对应。在另一示例中,保险文档可认为与至少一个人类实体(投保人、被保的驾驶员(例如,如果不是主要的或指定的投保人))和至少一个非人类实体(车辆,例如经由VIN、车牌号、制造商/型号/年份等)相对应。
仍然在更多的实施例中,ID可附加地和/或可替代地包括照片,例如个人或个人面部的照片,其可单独使用或联合其他识别信息和/或ID使用、优选地,照片和一个或多个其他ID描绘ID所对应的个人的相同或相似的摄影图像,诸如利用移动设备捕获的驾驶证和面部照片。
在多种方法中,ID可包括描绘诸如下面所限定的识别信息的任何其他类型的文档,如本领域普通技术人员在阅读本说明书时会理解的。
而且,ID不必要具体化为物理文档,但是物理具体化的ID是优选的。在一些方法中,ID可以描绘识别信息的电子记录的形式或以描绘ID或识别信息的图像数据的形式存在。
在若干方法中,ID可包括单个文档或多个文档。每个ID还可包括每个文档的多个页面,例如ID(诸如驾驶证、信用卡等)的“前”面和“后”面,如本领域普通技术人员在阅读本说明书时会理解的。在多页面文档描绘相似或多余信息的实施例中,从文档的每个页面识别的信息可用作验证工具以确定从每个各自页面提取的数据的准确性,如本领域普通技术人员在阅读本说明书时会理解的。
识别信息
通常所说的,识别信息包括在ID上描绘的任何类型的信息并且其可单独使用或组合使用以确定、认证或证实ID所对应的实体。
若ID所对应的实体是人类,并且具体地ID包括描绘人类的图像数据时,示例性的识别信息可包括生物特征数据。如本文所理解的,“生物特征数据”可包括任何类型的特征,并且优选地包括单独或组合用于唯一识别生物实体的物理测量。示例性的物理数据可包括用于识别人类个人的特征,诸如指纹特征(诸如隆起线的数目和图案、隆起线之间的间距等)、眼睛特征(诸如视网膜静脉图案、虹膜纹等)、面部结构(诸如在个人面部上的多个特征之间测量的距离等),或任何其他特征,诸如生物特征识别领域普通技术人员在阅读本说明书时会理解的。
在一些方法中,ID所对应的“个人”可不必包括人类个人,但可替代地与非人类实体相对应,诸如法定实体(例如,“州”、未指定的监护人、管理员、执行者、受托人、债权人、债务人等)、公司实体(例如,公司、公司的代理商等)、财务实体(例如,账户、信托等)和/或其他非人类实体,诸如本领域普通技术人员在阅读本说明书时会理解的。
在更加优选的实施例中,与非人类实体相对应的ID可进一步与通常落入非人类实体的范围和控制内的预定的功能、角色或目的相对应。例如,在包含ID(诸如信用卡)的一个情景中,ID可与诸如“授权买方”、“授权付款人”等的预定的功能或角色相对应。
在其他情景中,ID可与非人类实体的部门相对应,诸如“应付账款”部门、“账单”部门、“财务”部门等,如本领域普通技术人员在阅读本说明书时会理解的。
仍在其他方法中,与非人类实体相对应的ID可进一步与预定的业务项目、创业、投资等。与此类型的示例性非人类实体相对应的ID可包括实体为客户管理例如信托职务内的一个或多个事件的情景。实体可代表客户维持账户,以及代表客户利用账户进行业务而进行支出、存款等。例如,在此面向项目的职务中与非人类实体相对应的ID的一个公共应用可包括代表客户管理账户并且利用客户账户进行法定业务/提供法定服务的代理人。代理人可利用识别必要的账户信息的包括信用卡、财务报表、支票等的ID来进行相应的业务和/或提供期望的服务。
类似的示例可包括与投保人相对应的管理账户的并且根据与投保人相对应的账户进行分配的承保人、管理遗产的男执行人/女执行人、管理信托账户的受托人、管理投资账户的投资公司等,如本领域普通技术人员在阅读本说明书时会理解的。
因此,本公开包含业务工作流和进行工作流的个人在工作流过程中可利用多个ID的相关情景。当然,从这些说明应理解,进行工作流的个人可取决于工作流的上下文利用与多个实体相对应的一个或多个ID。在一些方法中,在工作流中所用的ID可与进行工作流的个人实体相对应,可与关于工作流的一个或多个实体相对应,可与关于工作流的一个或多个对象或实体相对应等,如本领域普通技术人员会理解的。
优选地,在利用多个ID时,至少一个ID与特定人类实体相对应,并且至少一个其他ID与前述非人类实体之一相对应。例如,在一种方法中,关于医疗服务和/或支付规定的工作流因此可利用至少两个ID:第一ID与患者相对应(例如,驾驶证、病历表、电子健康记录等),并且第二ID与患者的保单相对应(例如,保险证、政策声明等)。当然,还可利用包含不止一个ID或多个ID和一个或多个附加文档的ID和情景的不同组合而不脱离目前公开的范围。
ID身份符
如本文所指的,“识别信息”包括可用于识别ID所对应的实体的信息,而ID识别信息或“ID身份符”包括识别身份文档或身份文档或记录本身的特征的而不是身份文档所对应的实体的任何信息。在多个实施例中,识别信息可包括文本信息和/或图像特征(即描述ID的部分或所有图像的数据,这种图像数据描述在ID上描绘的照片)。
例如,示例性的ID身份符包括与ID相关联的唯一身份符,诸如驾驶证号、社会保障号、ID号等,以及与ID相关联的日期,诸如发布日期、截止日期等,以及任何唯一设计或与ID相关联的设计,诸如唯一符号、图案、标志、徽章或印章、全息图以及与ID相关联的代码,诸如像信用卡验证(CCV)号或个人身份号码(PIN)的条形码或安全码等。当然,本领域普通技术人员在阅读本说明书时会认识到的任何其他形式的ID身份符也可包括在这些公开的范围内。
虽然ID号可认为与个人相对应,但在至少一些应用中,为了此公开的目的,ID号应认为与身份文档相对应并且不是专门与个人相对应。例如,在具有固定格式的编号系统(并且因此具有有限数目的可能组合)中,ID号可关于多个个人再循环或重复使用。因此,到身份文档和相应个人之间存在真正的一对一相互关系的程度,则ID号可认为还与个人相对应,但此应理解为包含在本文所考虑的更广泛情景(其中ID号与文档相对应,并且不必要与个人相对应)内的特殊情况。
传记或生物信息
ID还描绘在本文中通常理解为“传记信息”或“生物信息”的识别信息,其包括识别或描述身份文档所对应的实体的任何类型的信息,并且其通常是实体是谁或什么的不可变或个人特征。
示例性的生物信息包括诸如人的血型、种族、身高、体重、头发颜色、眼睛颜色(自然)、生理性别或社会性别。
传记信息还可包括社会、文化或经济状态信息,诸如婚姻状况(单身、已婚、离异等)、社会或经济阶级或等级、职业状态(例如,在职、失业、解雇等)、政治背景、宗教或宗派等。
地理信息
识别信息还应理解为包括地理信息,其通常传达关于与ID所对应的实体密切相关的一个或多个位置的信息。例如,地理信息可包括一个或多个地址,诸如常住地址(例如,用于驾驶证、保险证、税表或任何数目的不同类型的ID)、单位地址(例如,用于员工ID、军队ID等)、大使馆或领事馆地址(例如,用于护照),或与ID所对应的实体密切相关的类似位置的任何地址。
财务信息
在更多的实施例中,识别信息可包括财务信息,诸如信用分数、一个或多个账号、金融服务实体(例如,诸如银行、VISA、AMERICAL EXPRESS、PayPal等的服务或处理实体)。
ID还可描绘与关于ID提供的一个或多个服务相对应的财务信息,具体地在诸如保险证或多种形式的医疗识别的ID的情况下。例如,与关于ID提供的服务相对应的财务信息可包括共付医疗数额、保单号、保单截止日期、有效日期或持续时间、服务提供者(例如,承保人)、投保人姓名等,如本领域普通技术人员在阅读本说明书时会理解的。
法定信息
示例性的识别信息应理解为包括法定信息,诸如实体的法定名称、婚前姓、别名、头衔等。法定信息还可包括犯罪历史信息或突出的犯罪信息(诸如存在通缉令)。具体地在ID起到用于实体参与限制活动的证件作用的情况下,ID可描绘包括受限的法定信息,例如任何所要求的安全装备(诸如用于驾驶的校正透镜)的指示、对面向资源的证件的限制(诸如由特定捕猎证或进口许可证所允许的野禽的数目或重量)等,如本领域普通技术人员在阅读本说明书时会理解的。
多种形式的ID还可描绘关于安全或访问多个受限位置、信息等的所谓的“法定”信息。例如,员工ID可具有在其上描绘的安全放行等级,或与其整合在一起的、配置为通信安全放行信息的安全装置,例如配置为通信与员工安全放行相对应的访问码并且因此授权仅访问与员工安全放行等级相对应的区域的RFID芯片。
医疗信息
在至少一些实施例中,如本文所理解的,识别信息还包括医疗信息,诸如医保卡、驾驶证等。例如,医疗信息可包括诸如对紧急医疗服务的提供者有用的任何类型的信息,诸如个人的血型、任何个人易于过敏或药理敏感的清单、生理性别/社会性别、种族、姓名、终身保险意愿或指示的终止(诸如放弃抢救书或“DNR”书)等,如本领域普通技术人员在阅读本说明书时会理解的。
为了消除模糊的目的,虽然文本所阐述的多种类型的识别信息的常规定义之间会有一些重叠,但前面的定义应理解为本质上是相互排斥的。例如,虽然在常规定义下医疗保险单号可认为是“财务信息”和“医疗信息”类型两者,单如本文所限定的,保险单号是财务信息。
应进一步理解,虽然与附近各自所包含的多种类型的信息相互排斥,但在本公开的多个实施例中,多种类型的识别信息完全能够一起使用。例如,在业务工作流过程中使用的ID可描绘医疗信息和财务信息两者,并且一种或两种类型的识别信息可在工作流的一个或多个部分中单独或一起使用。
在相关的方法中,一些实施例可在进行业务工作流过程中利用多个ID。
再次参考附图,图4描绘了根据一个实施例的、概括例示了整合ID和/或识别信息到业务工作流的总体发明性过程的方法400。方法400可在任何环境中、利用任何数目的合适的资源实践,诸如在图1-2中所描绘的,等。
方法400包括操作402,在其中发起工作流。工作流优选地至少部分利用移动设备的处理器发起并运行,但在多个实施例中,工作流可利用任何数目的合适的资源,诸如桌上型工作站、移动设备、服务器等。而且,工作流可以任何合适的方式被实例化,例如工作流可响应于在实施独立的或相关的工作流过程中检测到预定的激励、响应于检测到满足触发条件等由用户实例化,如本领域普通技术人员在阅读本说明书时会理解的。
方法400还包括操作404,在其中接收包括ID的图像。再次,图像优选地在移动设备处接收,或可替代地利用移动设备捕获,但图像可在包含在进行工作流中的任意数目的位置或资源处接收。ID可以是本文所描述的任何类型,并且优选地描绘关于工作流的识别信息。
在操作406,方法400包括处理所接收的图像。在多种方法中,在处理操作过程中,由ID、ID图像的一部分(例如,仅描绘ID但省略背景纹理的部分)或两者生成包括识别信息的数据。数据可以任何合适的格式或方式生成,诸如表示ID的照片或图片部分的图像数据、表示在ID上描绘的识别信息的文本数据等。
方法400还包括操作408,在其中数据被提交给工作流。所提交的数据包括在操作406中生成的一些或全部数据。
继续参考图4,方法400包括操作410,在其中工作流的至少一部分利用一些或所有所提交的数据驱动。
在一些方法中,方法400可包括附加的和/或可替代的操作。例如,在一个实施例中方法400可选地包括检测实例化的工作流中的预定激励,并且响应于检测到预定激励,调用工作流的捕获接口或移动设备操作系统的捕获接口,并且利用所调用的捕获接口捕获图像。以此方式,现在描述的工作流可完全自给自足,包括用于完成下面的工作流对象的所有必要的捕获和处理功能。
而且,在附加的方法中,工作流包括活动和规则。优选地,活动包括财务活动(诸如购买商品或服务)、应用活动(例如,关于财务服务诸如贷款、证件诸如驾驶证、位置诸如就业或政府定位、应得权益诸如社会安全利益等)、报告活动(诸如报告与商务旅行相关联的支出)、追踪活动(诸如追踪包裹或服务的运输)和/或其他示例性工作流活动(诸如本领域普通技术人员在阅读本说明书时会理解的)中的一个或多个。优选地,工作流的活动至少部分依赖于由ID生成的数据。
再次参考附图,图5描绘了根据一个实施例的、概括例示了整合ID和/或识别信息到业务工作流中的总体发明性过程的方法500。方法500可在任何环境中、利用任何数目的合适的资源实践,诸如在图1-3中所描绘的,等。
方法500包括操作502,在其中利用移动设备捕获或接收一个或多个ID的至少一个图像。
方法500还包括操作504,在其中识别信息由一个或多个的ID确定。识别信息可利用任何合适的技术确定,诸如利用光学字符识别来辨别ID上的文本字符、利用面部识别来辨别人类面部或肖像的图片等,如本领域普通技术人员在阅读本说明书时会理解的。在其他实施例中,识别信息可由一个或多个ID利用查找操作确定,例如其中适合于用作ID身份符的唯一字符串(例如,驾驶证号、社会保障号、税ID号等)由ID(例如,利用OCR、条形码扫描等)确定并且用于检索可或不可在ID本身上描绘的附加识别信息。在一个示例性情景中,查找可利用唯一字符串是其密码的唯一ID身份符作为问题来查找包括识别信息值的数据库。当然,也可利用除数据库以外的其他数据结构而不脱离本说明书的范围。
在操作506中,方法500包括全部或部分基于所生成的数据建立ID简档。如关于多个示例性实施例贯穿这些说明进一步详细描述的,ID简档可以任何合适的形式或利用任何合适的技术来建立,并且优选地包括来自一个或多个ID的识别信息,更加优选地包括由其生成数据的多个ID中的至少两个。更加优选地,所建立的ID简档包括来自多个ID的识别信息和/或图像数据。
继续参考图5,方法500包括操作508,在其中ID简档被存储到存储器中,优选地存储到移动设备的存储器中。
在操作510中,调用配置为辅助业务交易的工作流。工作流可以任何合适的方式被调用,并且可配置为用任何合适的技术辅助业务交易,诸如下面关于下面有关数据提取的若干示例性实施例进一步详细描述的。
而且,方法500包括操作512并且检测工作流中的预定激励。而且,激励优选地与业务交易相关。例如,在一种方法中,激励包括呈现具有一个或多个字段的用户接口或利用依赖于特定业务交易(例如,账号,其中业务交易包括财务交易诸如销售,以及如下面进一步详细描述的)所需的交易数据的一个或多个计算的工作流。
响应于在操作512中检测到预定激励,方法500通过将ID简档的至少一部分提供给工作流并且随后利用所提供的一个或多个部分ID简档驱动一些或所有的工作流来继续进行。优选地,所提供的部分包括与工作流和/或下面的交易相关的识别信息。
现在已经描述了本文公开的关于ID业务工作流整合的一般发明性概念,下面的示例性情景例示了那些一般概念应用于若干实际情景。
如从下面的示例性实施例将变得清楚的,当与多种类型的业务工作流并且在不同上下文中整合时,使用ID可非常有利。示例性的情景意图本质上是示例性的并且不应认为限制本公开的范围。而是,本公开概念的任何等同的应用、排列、变化、组合或合成(如本领域普通技术人员在阅读本公开时会认识到的)都并入本文中。
业务工作流ID整合
如本文关于多个示例性情景所描述的,工作流可利用在其上描绘的ID/识别信息来合成或建立用于特定工作流的身份简档。ID简档可为了特定工作流而具体建立,或可以是以诸如与多个不同工作流类型兼容的方式建立的更加通用的ID简档。在优选的方法中,ID简档可在实施一个或多个工作流过程中建立,并被存储用于将来的召回和/或使用。
而且,所存储的ID简档可贯穿实施后面的工作流的过程而被修改。在一个示例性方法中,ID简档可被更新以更新过时的识别信息,诸如关于地址变化、关闭或开通账户等,如本领域普通技术人员在阅读本说明书时会理解的。
在一些方法中,ID简档可包括ID。例如,在一个工作流中,为了验证的目的将ID图像用作“简档图像”或“安全图像”,诸如本领域普通技术人员在阅读本说明书时会理解的。在多种方法中,可使用其他安全措施以确保来自ID的所存储的信息(包括ID本身)受到保护以避免未授权的访问。可使用本领域已知的任何合适的安全措施,诸如加密、密码验证、生物验证等。
在其他方法中,ID简档可包括对工作流有用的任何类型的信息,并且优选地包括在一个ID上或在多个ID上描绘的识别信息。更加优选地,ID简档中的识别信息包括诸如上面所限定的至少一个ID身份符。
而且,实体可具有与其相关联的多个ID简档,并且每个简档可针对预定工作流实例、特定工作流类型、下游应用等具体裁剪,如本领域普通技术人员在阅读本说明书时会理解的。例如,在一个示例性情景中,个人利用本公开的概念进行多个业务工作流,并且维持多个ID简档,每个ID简档与多个业务工作流的特定一个相对应。汽车ID简档可例如包含于实体的驾驶记录、驾驶证、汽车保险等相关的识别信息。类似地,财务ID简档可包括与实体的财务状况或活动相关的识别信息,例如可从信用报告、财务报表、报税等获得的识别信息。医疗ID简档可包括诸如可从医疗记录、配药记录、医保信息等获得的识别信息,如本领域普通技术人员在阅读本说明书时会理解的。
例如,ID常常描绘具有关于工作流活动的功用的信息,诸如肖像、姓名、出生日期、地址、一个或多个唯一识别符等。利用这个信息,可基于完成工作流中的多个活动所需的信息针对特定工作流建立身份简档。在一种方法中,包含财务交易的工作流包括基于ID建立包括姓和名的身份简档。工作流随后可利用该身份简档自动提供关于尝试进行任何财务交易的姓和名。
在更多的方法中,ID简档可关于进行特定工作流或工作流的实例而建立,并且ID简档可包括特定于该工作流和/或工作流实例的识别信息。例如,考虑涉及汽车事故的示例性情景。事故中涉及的、报告事故场景的个人,诸如驾驶员、执法人员、保险机构等,需要收集事故中涉及的所有方的识别信息。为了这样做,执法人员启动工作流(例如,经由安装在移动设备上的应用)并且捕获事故中涉及的每个个人驾驶员的驾驶证的图像。图像捕获操作可包括捕获附加的图像数据,包括一个或多个驾驶证的前面和后面、一个或多个汽车登记证、一个或多个保险证明等,如本领域普通技术人员在阅读本说明书时会理解的。
在更多的方法中,ID简档可包括除图像数据以外的或代替图像数据的其他类型的数据。例如,在一些方法中,音频数据可用作ID,例如,包括与实体相对应的个人嗓音(例如,个人的嗓音、表示非人类实体的人类代理人的嗓音等)的音频芯片。以此方式,为了本文公开的基于ID的工作流的目的,实体的任何特征都可用作区分标准(优选地为一个或多个不可变的物理特征,诸如嗓音、高度、可视外表、步态、指纹、识别标记(诸如疤痕、纹身、条形码、标签、标志)等,如本领域普通技术人员在阅读本说明书时会理解的)。
在上面示例性说明的上下文中,用于工作流的ID简档可包括所有多个所涉及方的识别信息,诸如从如上面所描述的每个驾驶员的多个ID获得的。ID简档可选地包括关于但不必是在事故中涉及的其他个人的识别信息,诸如一个或多个乘客、目击者等。工作流可包括合成针对每个相关个人收集的多个识别信息并且提交该信息用于在该工作流和/或其他工作流过程中处理和/或使用,所述其他工作流可独立于所进行的关于汽车事故的当前工作流或与其相关。
例如,在多种方法中,并行工作流可融入到单一工作流中用于联合处理(例如,并行工作流,与事故中涉及的驾驶员相对应的每个工作流可被融合用于由负责操控相关事件的单个实体、官方、代理机构等单独或统一处理,所述相关事件诸如违反交通案件、索赔、申请救济等)。
在更多方法中,附加的工作流可部分基于进行关于汽车事故的目前工作流过程中满足一个或多个触发条件而被启动。
一旦收集到相关的识别信息,ID简档,诸如可在工作流过程中通过合成前述识别信息而生成,被合成并提交给处理中心、数据资料库等。接收中心、资料库等可选地处理进来的数据提交,并且完成数据被原始提交所针对的工作流或发起附加的工作流(例如,基于所提交的数据和/或数据被原始提交所针对的工作流的结果等)。
例如,执法人员报告汽车事故的场景,收集所有涉及的驾驶员、目击者和乘客的识别信息,将识别信息合成到与工作流实例相关联的ID简档(例如,经由诸如工作流ID的唯一身份符),并且提交该ID简档用于存储和/或进一步处理。
在一些实施例中,处理可包括至少部分基于所提交的ID简档中的识别信息发起或影响附加的工作流。
例如,继续汽车事故场景,一旦执法人员提交实例化为事故发生的关于工作流的ID简档,则分析ID简档并且针对在ID简档中识别的一个或多个个人(例如,每个驾驶员)实例化多个附加的工作流。
附加的工作流可包括例如更新驾驶记录以反映事故的发生以及关于其已追究的任何控告或违规,在相关的交通运输管理局之前开始复核过程(例如,用于通过回滚交通教育程序等评估或质疑罚款、积分等的分配;发起提议以减少罚款、积分等,如本领域普通技术人员在阅读本说明书时会理解的)。
在另一类似的示例性情景中,汽车事故中的一个或多个驾驶员被控告违规行驶或其他民事或刑事犯罪。控告可由响应事故的相同的或相似的执法机构发布,并且因此利用包含在ID简档中的识别信息是有用的,所述识别信息关于报告事故被合成。例如,被控告的驾驶员之一请求陪审团审讯。在调度相关法律诉讼过程中,接触例如可在ID简档中反映的目击者是有用的,所述ID简档在由执法人员进行的事故报告工作流期间生成。因此,在一种方法中,与特定事故相关联的司法手续可利用关于事故收集和/或提交的ID简档信息。
因此司法手续可包括利用一个或多个工作流以收集必要信息和/或接触涉及方。例如,在一种方法中,一旦接收到陪审团审讯的请求,参与调度工作流的司法官员安排开庭日期,并向所有涉及方(例如,事故的所有驾驶员、乘客和目击者)派发开庭通知。在尤其优选的方法中,参与调度工作流的官员将汽车事故工作流ID简档输入到调度工作流,并且全部或部分基于所输入的ID简档,官员可向每个个人派发(或发起工作流或过程用于派发)通知,通知他们所安排的开庭日期并相应地要求/命令他们出席。
现在转回到业务工作流整合,在多种方法中,ID被整合到关于工作流的一个或多个活动或规则的业务工作流中。ID可被部分或全部整合,即关于哪个ID的活动或规则被整合可依赖于整个ID(例如,所处理的ID的图像)、ID的一部分(例如,所处理的ID图像的一部分,诸如描绘肖像的部分、唯一符号或身份符)和/或在ID上描绘的识别信息。ID或识别信息可由工作流直接使用,或可用作中间过程的一部分,所述中间过程配置为基于ID或识别信息分别收集、合成、演绎、推算或确定工作流所需要的信息。
财务交易工作流
在一种方法中,业务工作流包括财务交易,并且该财务交易至少部分依赖于ID。
如本文所理解的,当工作流或交易利用在其上描绘的部分或全部的ID和/或身份信息来进行至少一部分的工作流或交易时,工作流活动、规则、相关交易等“依赖”于ID。工作流可“依赖”于ID的多种方式在下面参考若干示例性实现方式描述。
例如,在一种方法中,工作流(优选地,工作流包括财务交易)依赖于ID作为一种形式的认证。工作流的认证部分可包括提交经处理的ID图像,可选地与关联于经处理图像的元数据一起。经处理的ID图像和/或相关联的元数据可与相应的认证数据进行比较。基于该比较,可影响工作流的进展,诸如通过允许或不允许财务交易。
有利地,本文描述的财务交易工作流并不限于依赖于诸如MICR字符的行业标准惯例来实现下面的财务交易或在关于财务交易的图像数据上实施的任何的图像处理操作。以此方式,现在描述的实施例与在移动财务服务相关领域中描述的那些是不同的。而是,现在公开的实施例以及它们的任何等同物(如技术人员在阅读本说明时会认识到的)配置为在多种多样的环境情况下捕获并处理多种类型ID的图像,并且配置为在包括一个或多个财务交易的业务工作流过程中利用那些ID图像数据。
例如,以及下面将关于这些公开的分类和提取方面进一步详细描述的,本技术配置为捕获一个ID或多个ID的图像,确定ID和/或在ID上描绘的识别信息的多个特点,并在进行工作流过程中利用所确定的信息。
根据包括财务交易的工作流的此示例,财务交易可为了认证目的至少部分依赖于ID,例如,作为认证数据的表格或源。
在多种方法中,认证数据可包括适合于与经处理的ID图像和/或相关联元数据进行比较以确定它们部分或完全匹配的任何数据和/或元数据。认证数据可包括一个或多个图像,诸如ID的另一图像;经处理ID图像的另一实例;ID图像的一部分等。认证数据可附加地和/或可替代地包括描述部分或所有的经处理ID图像的图像数据,诸如在本文描述的处理图像操作中所用的多种类型的图像数据。
在一些方法中,认证数据可进一步包括识别信息。认证数据可附加地和/或可替代地包括一个或多个唯一身份符。一个或多个唯一身份符可选地在ID或ID的一部分上描绘,优选地为描绘唯一图像数据(诸如面部照片、全息图、标志、水印、条形码等或它们的任意组合)的ID的一部分。可替代地,唯一身份符可优选地全部或部分基于在ID上描绘的识别数据、全部或部分基于图像数据而生成、重新生成等,如本领域普通技术人员在阅读本说明书时会理解的。在优选的方法中,唯一身份符利用加密算法生成,所述加密算法接受一个或多个的前述类型的认证数据作为输入(例如,作为种子值)。
为了将来方便并快速召回该工作流和/或其他工作流的实例,认证数据可被存储并与经处理图像相关联。相反地,认证数据可在实施业务工作流的后面实例或另一业务工作流的同时被检索。
在另一种方法中,工作流依靠ID作为数据源。工作流优选地实施本文所描述的分类和/或提取。利用ID分类、从ID提取的识别信息或至少部分基于ID分类和/或所提取的数据所确定的任何其他识别信息,工作流可确定发起、参与和/或完成一个或多个工作流活动和/或相关联交易的必要数据。说明基于ID的分类和提取的多个方面的示例性实施例将在下面进一步详细描述。
在一个示例性情景中,业务工作流包括为下列项的一个或多个提交应用:财务服务,例如贷款应用、新财务账户应用(例如,新银行账户、投资账户、信用额度等);证件(例如,实践限制活动、贸易或职业的证明,诸如钓鱼证、驾驶证、医生执照、教师资格证等);位置,例如工作应用、学校应用、用于政选的应用等;以及权益(例如,失业津贴、就业津贴、保险理赔或承包范围、社会安全、社会福利、老年保健医疗/医疗补助等)。而且,应用过程至少部分依赖于ID。
在另一示例性情景中,业务工作流是财务报告工作流(例如,支出报告、理赔请求、税务记录管理/归档等)。而且,财务报告共组了至少部分依赖于ID。
例如,在一种方法中,财务报告工作流包括配置为辅助为小业务所有者追踪可减税业务支出的活动和规则。小业务所有者发起财务报告工作流的支出追踪功能,并且关于其捕获ID的图像,例如描绘业务所有者的EIN的联邦税务员工身份卡。小业务所有者还可或可替代地使诸如社会保障卡或驾驶证的个人ID成像。小业务所有者还可或可替代地使描绘与小业务和/或小业务所有者(例如,W-2、1040、I-9、940、941、944,任何与其等同的州税表等,如本领域普通技术人员在阅读本说明书时会理解的)相对应的税务信息的标准税表成像,作为ID。不管ID的特殊表格,工作流至少部分依赖于ID来进行其财务报告部分。
例如,在一个实施例中,小业务所有者使与税务年度中发生的多项业务支出相对应的收据成像。在税务年度的结尾,小业务所有者提交收据图像连同纳税申报表提交过程所需的或有用的识别信息。在至少一些方法中,收据图像可连同经处理的ID图像一起提交。
在优选的方法中,小业务所有者可利用财务报告工作流确定在所成像的收据上描绘的多项支出的合格性。每项支出的合格性可至少部分利用ID或在其中描绘的识别信息来确定。例如,在一种方法中,工作流至少部分基于ID确定营业税简档,并且利用营业税简档确定哪项支出可能针对一项或多项扣除、信用卡或其他一个或多个税务收益是合格的。
在类似的方法中,财务报告工作流包括支出追踪功能。支出补偿功能,不是为了税务目的配置,而是配置为为了补偿目的帮助员工追踪业务相关的支出,诸如与就业相关的活动有关的教师或销售代表记录支出。
例如,员工调用财务报告工作流的支出补偿功能,并且在该过程中提交员工ID(优选地为雇主发行的ID,但包括任何合适形式的ID)的图像。在多个实施例中,图像可在实施财务报告工作流过程中捕获,或从存储器中检索。
至少全部或部分基于ID,例如基于在诸如员工姓名、工号等的ID上描绘的识别信息,工作流加载包括补偿合格信息的员工简档。利用补偿合格信息,工作流分析该员工提交的一项或多项支出,并且确定每项支出的合格性。然后根据雇主喜好和/或政策,该员工可申请补偿合格的支持,或补偿过程可自动发起。
仍然在另一示例性情景中,业务工作流包括追踪过程(例如,追踪装运/运送商品或服务,追踪员工表现,追踪顾客光顾等)并且该追踪过程至少部分依赖于ID。
为了说明,考虑包含商品和服务的提供者和预期接收者(诸如商人和顾客、专业人士和客户等)的多种情形,进行交易的多方的每一方都拥有ID。ID和追踪活动一起使用,以认真提供者/送货员和/或接收者的身份。
例如,在一种方法中,包裹被安排为运送。在到达分配设施、一个或多个中间目的地和/或预期接收者的送货地址时,送货员可“登记”到追踪活动。送货员将ID图像提供给工作流,优选地为员工ID,并且处理该图像。经处理的ID图像例如连同与送货员相对应的认证信息一起存储。
在“登记”期间,员工的唯一认证信息,其可选地包括ID或在其上描绘的识别信息,可用于生效追踪信息。例如,根据已知的方法,包裹可利用与包裹相关联的唯一身份符(即诸如通常用在运输标签上的追踪号)进行追踪。包裹级追踪可利用现在描述的员工级登记进行核实,例如通过将包裹级追踪数据与相应的登记数据进行比较,可选地利用与包裹所分派给的送货员相对应的识别信息,诸如可在与送货员相对应的员工ID上描绘的识别信息。
因此,“登记”可选地包括捕获下列项中的一个或多个:送货员的ID的图像;所运送包裹的图像;送货地址的图像等,如本领域普通技术人员在阅读本说明书时会理解的。可替代地,送货员可利用移动设备登录到可选地配置为辅助追踪包裹的追踪工作流,例如配置为扫描运输标签上的条形码的扫描仪、具有集成到其上的摄像头的手机或PDA并且配置为利用应用和集成到手机、PDA等中的摄像头追踪包裹。
包括ID的“登记”数据可与参考信息进行比较,以提高送货准确度和报告。例如,登记数据可与产销监管链文档、雇主维持的记录、卖方提供的记录等进行比较。以此方式,运输公司证实将包裹运送到预期地址是可能的,并且雇主追踪并维持与个别员工相关联的记录是可能的,例如为了评估表现的目的。
在相关的方法中,ID与预期的服务接收者或与业务工作流相关的应用过程中的候选人相对应。服务或应用过程包含会面,诸如之前为了财务咨询安排了会面或为了工作安排了面试的个人情况。与业务工作流相关的示例性会面可包括运送服务的任何会面,诸如法律服务、医疗服务、咨询服务等。根据附加的实施例,示例性会面还可包括例如关于应用过程的面谈。为了确保维持会面安排和/或证实在会面时间所有涉及方都出席(具体地服务提供者/面谈者/等,和/或服务接收者/候选者/等),工作流可包含“等级”过程,其要求或请求预期接收者证实关于会面的出席和/或身份。
以此方式,服务提供者确保提供有效服务是可能的,例如通过检测错过的会面、调节时间安排表冲突等。服务提供者还可期望追踪发生在服务提供者末端的时间安排问题。例如,提供者可期望追踪员工表现、提供奖励给顾客、员工、特殊私人或专业社团、组织等的成员,或在追踪工作流过程中从使用ID获益的任何其他等同活动,其会由意识到现在描述的发明性概念的技术人员领会。
在多种方法中,例如,员工表现可根据平均会面时间、错过会面的次数等进行追踪。在更多的方法中,奖励可包括补偿由于在服务提供者的控制下的情况发生的取消的、迟到的或重新安排的服务;响应于顾客安排和/或定时参加预定次数的会面的回报等,如本领域普通技术人员在阅读本公开时会理解的。
因此,ID可结合实施部分或所有的追踪工作流进行捕获和/或处理,并且经处理的ID图像关于追踪工作流而使用。ID可为了认证目的而使用,例如用作通过其雇主可追踪员工或顾客的唯一身份符。ID可附加地和/或可替代地用作辅助识别将个人与特定交易相关联的手段,诸如个人服务提供者、顾客等。
例如,在一种方法中,雇主希望追踪顾客满意度,并且同时追踪工作流提供给顾客选项以提交所接收的服务的评论。可通过允许评论多个雇主的一个或多个图像而在识别一个或多个特定个人渲染服务中帮助顾客,例如员工ID的图像或在员工ID上描绘的肖像。一旦选择特定图像,顾客可被导向到提交评论,并且那些评论可与相应的员工表现追踪简档相关联,用于关于表现评论、提升等的后续使用,如本领域普通技术人员在阅读本说明书时会理解的。
ID分类和工作流整合
前述情景通常阐述了工作流的示例性实施例,其中可应用本公开的面向ID的技术。应领会,示例性工作流的一些可进一步通过利用附加的ID分析并且基于附加的分析影响工作流的进展而辅助。
可选地,附加的ID分析可包括分类ID、从ID提取数据或两者。
在多种方法中,ID分类的示例性实施例可包括利用一种或多种独立的分析进行部分或全部工作流,其中ID可根据若干标准进行分类,或处于若干级别。
一些或全部的分类操作可包括依赖于分类和工作流的性质的独立的分析或相似的分析。在无数的方法中,分类可以循环的方式实施,每个循环优选地根据越来越多的特定级别的分辨率来分类ID,诸如在前面针对多级别ID分类的示例中所识别的。因此,在一些方法中,本公开的分类程序可包括根据多个级别的特异性循环分类文档,其中每个循环包括确定文档属于落入在前面的循环中文档被确定所属于的最宽类别内的特定子类别。
在一个一般示例中,第一循环可将文档分类为ID。第二循环可将ID分类为特定类型的ID,例如证件。第三循环可将证件分类为特定类型的证件,例如驾驶证或捕猎证。第四循环可根据进一步的子类别分类该类型的证件,诸如将驾驶证分类为商用驾驶证或非商用驾驶证;类似地,第四循环可根据证件所应用于的猎物或武器类型来分类捕猎证,例如,弓捕猎证、捕鱼证等。第五循环可更加进一步分类该证件,例如,根据发布官方或管辖权(典型地为州或州行政部门)分类在第四循环中所确定的多种类型的证件,例如将(非)商用驾驶证分类为马里兰(非)商用驾驶证,将弓捕猎证分类为维吉尼亚州弓捕猎证等,如本领域普通技术人员在阅读本说明书时会理解的。
而且,每个循环的分类可至少部分基于在先前的操作中所确定的分类结果,例如通过限定搜索空间或参数用于与所成像的文档进行比较以实施分类。因此,在前述示例中,一旦确定文档是ID,则第二循环可在更小的搜索空间(本文中也称为搜索“子空间”)中进行搜索,子空间仅包括ID子类别(例如,驾驶证、捕猎证、护照等。)类似地,第三循环可搜索仅包括驾驶证子类别(例如,商用、非商用、摩托车等)的空间,并且第四循环可在仅包括在以前确定的驾驶证子类别内的子类别的空间中搜索(例如,在由州限定的商用驾驶证分类中搜索)。第五循环可在仅包括在第四循环中确定的特定子类别的子集的仍然更小空间中搜索,例如在不同类型的马里兰商用驾驶证中搜索以确定特定马里兰商用驾驶证是否是学车驾驶证或完全驾驶证,特定马里兰商用驾驶证是否受到一个或多个特殊限制(例如,校正镜片)等,以及由此进行分类,诸如本领域普通技术人员在阅读本说明书时会理解的。
应进一步理解,关于循环分类过程的任意指定循环,所确定的在“第n个”循环中ID所属于的“子类别”可认为是为了“第n+1个”循环的目的所确定的ID所属于的“类别”。因此,在本公开的循环分类过程的一个实施例中,确定文档在第一分类循环中属于“身份文档”或“ID”类别。在第二分类循环中,确定ID属于多个ID子类别之一,例如,“驾驶证”、“护照”等。在第三循环中,分类包括确定例如驾驶证是否属于多个驾驶证子类别之一,例如,由特定州发布的驾驶证。在前面的示例中,类别“ID”可认为是关于第一分类循环的文档的更宽类别的子类别,但认为是关于第二分类循环的更宽类别,即“ID”是在第二分类循环中评估的包含多个ID子类别的宽类别。类似地,虽然“驾驶证”被认为是“ID”类别的子类别,但为了上面描述的第三分类循环的目的,“驾驶证”可认为是包含多个“州”子类别的类别。
因此,如本文中所涉及的,术语“子类别”可理解为包含共享至少一个共同特点(该共同特点也共用于子类别所属的“类别”或“分类”的成员)的多个成员,但其并不是子类别展现的所有成员。换句话说,子类别的所有成员都共享共同特点,其将子类别的每个成员与并未展现共同特点的其他子类别的成员们区分开。
分类可包括限定特定ID所属的多个分类。多个分类可具有本文中通常称为“同心”“并列”或“重叠”的若干相互关系之一。根据此一般范例,以及如图3中示意性示出的,一系列分类可以分级方式布置,每个子类别与其他子类别相关如下。
如在图3中示意性表明的,同心分类302、304、306、308和310系列300被认为是“同心的”,其中302是最宽的并且310是最窄的。310是类别308的子类别,308是类别306的子类别,306是类别304的子类别,以及304是类别302的子类别。而且,根据限定了母“类别”的哪个成员,特定子类别的每个以及所有成员都完全落入最宽的定义。
类似地,并且再次如图3所示,类别302、314、316和318是“并列”的。换句话说,并列分类312-318的每一个都落入单一宽“母”类别310内,但并列分类312-318中都没有共享各自分类的任何限定性特点(即,事实上每个类别的成员都可具有共同特征,但为了每个分类的特定定义的目的,在“并列”分类中没有两个特征共用——类比定义之间没有“重叠”)。
除了并列分类的成员关于彼此共享至少一个共同特征以及展现至少一个区别特征以外,“重叠”分类类似于“并列”分类。在图3中,分类312和320“重叠”。
在多个实施例中,特征可包括能够从所捕获/接收的图像得到的任何类型的信息。例如,优选地,特征可包括一个或多个的图像元素特点和文本元素特点。特征可以是基于图像的,诸如颜色信息、边缘信息、纹理信息、形状信息、柱状图信息等等。此外,特征可包括基于文本的特征,诸如集群、小数点(blob)或词袋,n元字符,词的表面形式诸如整个词等。在多种方法中,特征可包括文本位置特征和/或文本层次特征。
附加地和/或可替代地,分类可包括利用单个ID的多个单独分类的元素分类ID;例如,利用在ID上描绘的文本信息分类ID,并且利用图像数据诸如也在ID上描绘的面部照片分别分类ID。分类涉及使用多个元素的地方,可针对每个元素确定分类,并且然后分类结果可例如为了验证目的被比较和/或融合,以基于利用单个ID的个别元素完成的个别分类结果生成文档的整体分类。
在至少一些方法中,一个分类循环可影响后面的分类循环的参数,例如通过修改后面操作考虑的因子的清单、一个或多个因子的相对贡献(例如,经由权重分析或计算)、之前分类的对象可被进一步分类成的合格或可能的类别的清单等。
而且,循环分类可用于提高分类技术的性能或准确度,例如通过将在复杂计算中考虑多种因子的整体分类过程分成一系列更简单计算来提高准确度。以此方式,循环分类能够将多个成员分到比尝试同时考虑所有因子的整体分类过程更少模糊或不模糊的组。在多个实施例中,通过减少每个循环中所考虑的分类因子的数目、可能分类和/或可能类别成员,分类可利用更少的计算资源实施,以及完成更高的准确度和/或精确度。
本领域普通技术人员将领会,减少因子的数目、分类、合格类别成员等可变得不利于过去的某个阈值,其中多个类别包括每个类别的特点之间的足够“重叠”,其分级有效划分——所有成员可根据类别被分类,使得分类失去意义(因为所有成员属于)。为了避免此成问题的将成员归并为单个类别,多个分类之间所需要的分离度依赖于个别成员的性质(例如,类别的每个成员如何“变化”,如由该类别相比其他类别的多个唯一或区别特征所指示的)。因此,在一些方法中,分类可被训练、调整或建立以便避免引起分类粒度中“粗糙”问题的循环分类,这可让步性能以利用本文中所描述的分类将个别模型分解成多个类别。
当然,在附加的方法中,分类可用在整体工作流的多个阶段,并且可在工作流的每个阶段用于不同的目的。在相关方法中,具体地ID可以多个“级别”的特异性(例如,多个“同心”分类应用于特定ID)进行分类时,多个级别的分类可用在整体工作流的多个阶段中。
例如,在一个示例性工作流中国,用户认证操作可利用证件,其可选地可以员工ID的图像的形式提供。参与工作流的用户可发起认证操作,并且捕获ID的图像。工作流的第一分类阶段可包括基于图像数据将图像中描绘的文档分类为员工ID。工作流内的后续分类阶段可包括基于ID上描绘的文本信息(例如,安全码、图像等)分类将员工ID分类为授权类别。
分类可基于任意数目的ID特点,包括图像(并且优选地为经处理的图像)中描绘的ID特点,诸如适合于用在计算特征向量或特征矩阵中的特点。
如本文所理解的,“对象”包括表现在图像中的任何有形的东西,并且其可根据至少一个唯一特点进行描述,诸如颜色、大小、维度、形状、纹理,或有一个或多个代表性的特征,如本领域普通技术人员在阅读本说明书时会理解的。附加地,对象包括这种特点或根据这种特点的至少一个唯一组合进行分类。例如,在多个实施例中,对象可包括但决不限于人、动物、车辆、建筑、界标、文档、家具、植物等,如本领域普通技术人员在阅读本说明书时会理解的。
本公开范围内的对象特征可包括能够在数字图像中识别的任何特征,并且优选地为能够以数字格式(无论是标量、向量或其他)表达的任何特征,例如,包含一个或多个参考对象(具体地在一个或多个面向对象的州中,诸如地形、肖像等)、对象颜色简档或颜色体系、对象子区域颜色简档或颜色体系、文本位置等的子区域的位置,如本领域普通技术人员在阅读本说明书时会理解的。
第一特征向量和/或参考特征矩阵可包括多个特征向量,其中每个特征向量与相应的对象类别的特点相对应,例如特点的最小值、最大值、平均值等,特定位置(像素或截面)处的一个或多个颜色通道的亮度,在特定位置处存在特定符号或其他参考对象、维度、纵横比、像素密度(具体地黑色像素密度,而且是任何其他颜色通道的像素密度)等。
根据与本公开的范围相同的另一发明性实施例,方法可在任何合适的环境中实行。当然,可根据方法实施比下面描述的那些更多或更少的操作,如本领域普通技术人员在阅读本说明书时会领会的。
在第一操作中,基于由移动设备捕获的数字图像生成第一特征向量。
在第二操作中,第一特征向量与多个参考特征矩阵进行比较。
在第三操作中,数字图像中描绘的对象至少部分基于比较(例如,在第二操作中实施的比较)被分类为特定对象类别的成员。
在第四操作中,对象的一个或多个对象特征至少部分基于特定对象类别被确定。
例如,在一种方法中,多级别ID分类包括首先将在图像中描绘的文档分类为ID(例如,而不是其他类型的文档,诸如像支票或汇款单一样的财务文档),然后将ID分类为特定类型的ID(例如,驾驶证、信用卡、社会保障卡、税表、护照、军队ID、员工ID、保险卡等),然后作为ID类型内的认定类别的成员(例如,海军、陆军或空军军队ID类别;由诸如商用/私有的差异或根据州组建的驾驶证的类别;通过提供者组建的保险卡的类别;通过服务财务实体或银行组建的信用卡的类别;等)等等,如本领域普通技术人员在阅读本说明书时会理解的。
因而,在这些方法中,分类可包括N维特征空间比较。在至少一种方法中,N大于50,但当然,N可以是足够大以确保将对象稳健分类到单一、正确的对象类别中的任意值,本领域普通技术人员在阅读本说明书时会领会到该值根据许多因素而变化,诸如对象的复杂度、对象类别之间的相似性或差异性、对象类别的数目等。
如本文中理解的,“对象”包括表现在图像中的任意有形的东西,并且其可根据至少一个唯一特点进行描述,诸如颜色、大小、维度、形状、纹理,或有一个或多个代表性的特征,如本领域普通技术人员在阅读本说明书时会理解的。附加地,对象包括这种特点或根据这种特点的至少一个唯一组合进行分类。例如,在多个实施例中,对象可包括但决不限于人、动物、车辆、建筑、界标、文档、家具、植物等,如本领域普通技术人员在阅读本说明书时会理解的。
例如,在一个实施例中,其中尝试将在数字图像中描绘的对象分类为仅小数目的对象类别(例如,3-5个对象类别)之一,每个对象类别的特征为很大数目的明显不同的特征或特征向量(例如,每个对象类别与特征为非常不同的大小、形状、颜色简档和/或颜色体系的一个对象或多个对象相对应,并且容易区分的参考符号位于每个对象类别上的唯一位置等),N的相对低的数值可足够大以确保稳健分类。
另一方面,尝试将在数字图像中描绘的对象分类为大数目的对象类别(例如,30个或更多的对象类别)之一时,并且每个对象类别的特征为很大数目的类似特征或特征向量,以及仅有很少的不同的特征或特征向量,N的相对高的数值可以是优选的,以确保稳健分类。类似地,N的数值优选地被选择或确定,使得分类不仅稳健,而且计算上高效;即分类过程仅向实施分类计算的一个或多个设备或一个或多个系统引入了最小的处理开销。
实现分类稳健和处理开销之间所期望的平衡的N值将依赖于许多因素,诸如上面所描述的以及其他的,如本领域普通技术人员在阅读本说明书时会领会的。而且,确定合适的N值以实现期望的平衡可利用任何已知的方法或其等同物来完成,如技术人员在阅读本公开时理解的。
在具体的实现方式中,定向到根据州分类驾驶证并且从无数其他文档类型中辨别出驾驶证,确定625维比较(N=625)提供了优选稳健的分类,而不会将不满意的高开销引入到利用多种当代移动设备实施的处理中。
在这种特征空间区别的最简单示例中,想象二维特征空间,其一个特征沿纵坐标轴绘制,并且另一特征沿横坐标轴绘制,属于一个特定类别的对象的特征可以为特征向量具有在特征空间右下方集群的分配值,而对象的另一类别的特征可以为特征向量展现在特征空间的左上方集群的分配值,并且分类算法可通过识别每个集群之间的线来在两者之间进行区分,所述集群将特征空间分成两个类别——“左上”和“右下”。当然,因为特征空间中考虑的维度的数目增加,分类的复杂度快速增长,还提供了分类稳健度的显著提高,如本领域普通技术人员在阅读本说明书时会领会的。
总之,核心分类和数据提取可以任何方式实施,如分别在美国专利申请号13/802,226和14/209,825中公开的。
仍然参考附图,图6描绘了根据一个实施例的、一般例示了将ID分类技术和/或其移动实现方式整合到业务工作流中的总体发明性过程的方法600。方法600可在任何环境中、利用任意数目的合适资源(诸如图1-3中所描绘的等)来实践。
方法600包括操作602,其中包括ID的图像优选地利用移动设备来接收或捕获。
方法600还包括操作604,在其中ID被分类。分类可采用诸如本文中所描述的任何形式,但优选地分类至少部分基于比较特征向量数据。比较可包括将一个或多个特征向量与一个或多个参考特征向量、一个或多个参考特征矩阵相比较,和/或通过实施任何数目的预比较分析、计算、操作或变换特征向量(例如,在一种方法中,特征向量可经受加权过程,并且作为结果的乘积被比较,而不是比较特征向量本身)。在更多的方法中,本公开的技术可利用多个支持向量机(SVM)或SVM技术来生成、描述、操控等特征向量和/或矩阵。
在操作606中,方法600包括提供ID和ID分类给工作流,优选地工作流还在移动设备上实例化和/或可至少部分利用移动设备执行。ID和ID分类可以任何合适的方式提供给工作流,例如通过将一个或多个的ID和ID分类存储到存储器并且将相应的存储器位置与工作流相关联,通过与存储ID和/或ID分类的远程数据存储系统通信,经由相同工作流内的另一工作流或另一操作等,如技术人员在阅读这些说明时会理解的。
继续参考图6,方法600包括操作608,其中至少部分基于ID和ID分类驱动工作流的至少一部分。优选地,基于识别表示在ID中的信息驱动工作流和/或利用从ID获得的识别信息或其他信息(例如,ID身份符)确定工作流。工作流更加优选地还基于ID分类驱动,例如,确定从与ID分类相关、关于其或可用于其的多个工作流中选择工作流。
在多个实施例中,驱动工作流可包括将工作流向下引导到若干可能的替代路径之一,影响工作流活动的结果,影响工作流规则,限定工作流活动和/或规则等,如本领域普通技术人员在阅读本说明书时会理解的。
在一些方法中,方法600可选地包括一个或多个替代和/或附加的特征、功能或操作,诸如本文所描述的。
例如,在一个实施例中,方法600处理图像以识别其中描绘的多个文档,并且优选地识别多个附加文档中的每个ID。更加优选地,方法600的此实施例可包括分类每个所识别的ID并全部或部分基于其分类分析每个被分类的ID。
再次参考附图,并且现在已经阐述了关于本公开的概念的多个定义,根据一个实施例,一般ID分类工作流整合包括诸如图7中描绘的方法700中阐述的操作。方法700可利用任意数目的合适的资源在任何环境中实践,诸如在图1-3中描绘的等。
方法700包括操作702,其中优选地利用移动设备接收或捕获包括一个ID或多个ID的至少一个图像。
方法700还包括操作704,其中识别信息从至少一个的ID确定。在一些方法中,识别信息可从一个或多个ID直接确定,例如利用OCR操作等、利用查找操作,例如,如本文中关于ID身份符描述的并且其容量用作识别信息可以是相关数据库或其他类似数据结构中的一个值或多个值的“关键字(key)”。当然,识别信息可以任何合适的方式从一个或多个ID确定而不脱离本公开的范围。
在操作706中,方法700包括基于之前确定的识别信息建立ID简档。例如,虽然建立ID简档可包括组合、关联、相关或描述多条识别信息的任何合适的方式。优选地,ID简档以如下方式建立,该方式使得识别信息以依赖于上下文或上下文敏感的方式组合(例如,关联所有关于特定类型交易、工作流活动、业务过程等的多条识别信息,如本领域普通技术人员在阅读本说明书时会理解的)。ID简档可包括任意类型的识别信息以及关于工作流的一个或多个部分的其他信息。而且,在多个实施例中,ID简档可以特定于特定实体的方式建立,例如ID简档可专门关于被授权为代表公司实体起代理作用的多个人类个人,关于单个人类个人等。
继续参考图7,方法700包括操作708,其中ID简档被存储到存储器,优选地为移动设备的存储器。ID简档可以任何合适的格式存储,并且优选地结合与ID简档相关的至少一个工作流或工作流成分(例如,活动、规则、工具、操作等)存储。更加优选地,ID简档以足以辅助容易定位、调用和/或使用任何数目的能够全部或部分利用移动设备实施的工作流中包含的信息。例如,在一种方法中,ID简档可结合元数据存储,所述元数据包括与关于ID简档的一个或多个工作流或一个或多个工作流成分相对应的一个或多个身份符。在一些方法中,通过利用元数据那些工作流可选地调用相关ID简档或其部分。
方法700进一步包括操作710,其中配置为辅助业务交易的工作流被调用。如本文理解的,工作流可以任何合适的方式辅助业务交易,例如,通过提供业务交易所依赖的基本信息(例如,财务信息与财务交易的一方或多方相对应;医疗信息对于医疗诊断是必要的,或转诊对于定制医疗预约等,如本领域普通技术人员在阅读本说明书时会理解的)。而且,优选地工作流结合ID、ID简档和/或关于其的识别信息被调用。
在操作712中,方法700包括检测工作流中的预定激励。该激励与业务交易相关,并且优选地该激励包括指示、请求、要求、操作、计算等,其反映工作流如何依赖、要求特定知识或从特定知识获益,优选地知识包括诸如在如文本中描述的ID上描述的或与其相关联的识别信息。
例如,配置为辅助财务交易的工作流上下文中的预定激励可包括尝试依赖于实体的财务信息(例如,姓名、账户号、路由号、安全码、地址等)的操作,和/或显示包括关于要求或配置为接收、存储等实体的财务信息的一个或多个字段的用户接口。
在另一示例中,配置为辅助追踪操作的工作流可包括预定激励,诸如调用一个或多个预定用户接口或工作流操作,例如,“登录”或认证接口可指示发起追踪操作所应用于的情形(例如,一旦接收/收到,送货人登录到追踪应用和扫描包裹),而“退出”或离开接口可指示追踪操作所应用于的情形的终点,指示到达或完成中间目的地、检查站等,如本领域普通技术人员在阅读本说明书时会理解的。
在操作714中,至少部分响应于检测到预定激励,一些或所有的ID简档信息被提供给工作流。提供给工作流的ID简档信息的该部分可包括识别信息和/或其他信息,并且优选地,提供给工作流的ID简档的该部分还与预定激励相关。例如,优选的情景会包括配置为处理依赖于实体的核查账户号和路由号的财务交易的工作流。工作流包括用于核查和账户号的具有字段的用户接口。工作流还与包括一个或多个实体的账户号和核查号的一个或多个ID简档相关联。响应于呈现具有账户/路由号字段的用户接口,来自ID简档的账户号和/或路由号提供给工作流,所述ID简档与参与工作流的实体相对应(例如,如可由之前的认证接口指示的,其中用户被授权为起到代表公司实体的代理作用,和/或用户靠自己的能力“登录”到工作流)
因此,在操作716中,利用所提供的ID简档的部分驱动工作流的至少一部分。再次根据上面的账户号/路由号示例,工作流可利用账户号/路由号处理相关的财务交易。当然如本文所描述的“驱动”工作流的任何其他合适形式的还可用在操作716中而不脱离现在描述的实施例的范围。
在附加的方法中,一个或多个方法600和/或700可包括一个或多个的附加的和/或替代的操作和/或功能,诸如下面关于多个示例性实施例进一步详细描述的。
在一种方法中,分类可全部或部分基于利用如其中公开的特征向量、参考特征矩阵和特征向量比较的技术。
在附加的方法中,ID分类可包括实施一个或多个循环分类操作,每个循环优选地包括根据多个特定种类或类别分类ID,其可由一般类别、分类或种类归入。
例如,在一种方法中,ID分类可包括多个分类操作。在第一分类中,对描绘文档的图像分类,并且在图像中描绘的文档被分类为ID。
在第二分类中,ID经受附加的分类,并且根据多个ID归类之一对ID进行分类,诸如根据预期使用或为其的应用归类ID,包括财务ID、医疗ID、职业ID、许可ID等,和/或根据ID类型归类ID,诸如驾驶证、护照、捕猎许可、员工ID卡、社会保障卡等,如本领域普通技术人员在阅读本说明书时会理解的。
在第三和/或后续的分类中,ID仍可根据特定ID归类和/或ID类型内的多个类别之一进一步进行分类,诸如上面所描述的。原则上ID可根据任意数目的标准进行分类,并且可根据进一步限制ID分类的循环方法、根据下游的工作流的特定需求进行分类,所述工作流全部或部分依赖于ID和/或其中描绘的识别信息。
例如,在一种实现方法中,工作流包括接收文档的图像,以及处理该图像。经处理的图像经受分类操作,起确定文档是否被或是否应该被分类为ID。一旦确定文档分类为“ID”,则工作流可进一步包括分类ID,例如,将ID分类为证件。附加的分类可包括确定ID为车辆证(例如,而不是捕猎证、捕鱼证、执业证等)。在类似的方法中,车辆证可根据活动、行政实体,或关于证件的法律体,诸如将车辆证分类为一个或多个的驾驶证、商用驾驶证、非商业驾驶证、飞行员证、驾船证等;并且仍可根据证件所应用于的车辆类型进一步分类,诸如摩托车、非商用车辆、商用车辆、汽车、机车、船只、飞机等,如本领域普通技术人员在阅读本说明书时会理解的。
在更多的实施例中,示例性ID分类过程可包括确定ID与关于ID分类的多个ID类型中之一相对应。ID类型优选地包括ID类别被细分成的多个有用归类。更加优选地,关于可应用于的下游业务过程整合和/或工作流性能限定类型。例如,根据多个实施例的示例性类型可包括通过州分离驾驶证的类别,通过提供者分离保险文档的类别,通过银行或金融机构分离财务文档的类别,通过服务/处理实体(例如,VISA、AMEX等)分离财务文档类别,通过国家分离护照类别,通过国籍的国家和/或发布国家/官方分离移居文档等,如本领域普通技术人员在阅读本说明书时会理解的。
在更多的方法中,利用ID分类的分类技术和/或工作流可包含将一个或多个的ID分类与ID的图像相关联。优选地,关联为或反映了数据-元数据的相互关系,例如图像数据和在图像数据中描绘的ID分类之间的相互关系。更加优选地,数据和元数据两者都存储到本地存储器部件,诸如移动电话的存储器。更加优选地,数据和/或元数据以使得允许由一个或多个工作流轻松访问和利用的方式存储。例如,数据和/或元数据可以与工作流和/或与工作流相关联的软件(具体地图像处理软件)相兼容的格式存储。在这样的方法中,本文中描述的示例性发明概念可包括将多个数据与其他数据或过程(例如工作流操作等)相关联。例如,在一个实施例中,描绘ID的图像可与确定ID所属于的分类相关联。可选地,但优选地,分类与作为应用到图像数据的一个或多个元数据标签的图像相关联。
然而,在一些方法中,仅数据和元数据之一被存储,例如,在工作流仅为了分类目的依赖于图像数据,或在实施其成功的分类之后工作流并未进一步用于图像数据的情况下。在其他实施例中,工作流可包括确定在图像数据中描绘的ID的分类,并且一旦确定分类则丢弃图像数据。以此方式,处理图像数据一次,确定关于其的分类信息,并且随后存储和利用分类信息而不必保留图像是可能的。
在更多的方法中,本公开的分类技术可附加地和/或可替代地包括对包括对多个文档的一个或多个描绘的图像数据实施分类。在多种方法中,可在单个图像、多个图像、视频图像等中呈现描绘并且描绘可包括ID和不是ID的文档的描绘,以及多个每种类型文档的描绘。不管在图像数据中描绘的文档的数目和类型,其分类包括处理一个或多个图像以识别一个或多个图像中描绘的多个文档中的一个或多个的ID;并且分类每一个所识别的ID。
利用多个文档并且具体地多个ID的实施例从有利的性能获益以合成身份简档,其可包括比参与特定工作流或相关联的交易所需的更多的识别信息,但其因此还可应用于比仅需要识别信息的子集的特定工作流或相关交易更广泛的工作流或交易范围。
根据多种方法,身份简档可以任何合适的方式合成。例如,在一个实施例中,身份简档利用由ID确定的识别信息、利用由ID确定的非识别信息和/或利用至少部分基于ID确定的识别信息(例如,利用来自ID或ID集合的识别信息和/或非识别信息来查找工作流所必需的但并未在特定ID或ID集合上描绘的识别信息)、利用连同ID或ID集合存储的元数据(例如,其中元数据包括识别信息,和/或其中元数据可以类似于上面所描述的方式被用于查找工作流所必需的相关识别信息)来合成,如本领域普通技术人员在阅读本说明书时会理解的。
在更多的方法中,分类可包括分析每个经分类的ID,以确定来自其的至少一些识别信息。优选地,识别信息至少部分基于ID分类在分析过程中确定。
更加优选地,身份简档由从经分类ID的至少两个确定的识别信息合成,并且至少两个经分类ID的每个都包括识别信息可为了交叉验证的目的用作工具,以确保相应的身份简档中所包括的信息的一致性和/或准确度。
在任何事件中,不管用于合成指定身份简档的技术(例如,来自一个或多个ID的身份简档并且可选地包括识别信息而不是ID的一个或多个资源),来自身份简档的至少一些的识别信息在业务工作流过程中使用。因此,在一个实施例中,来自身份简档的识别信息可提交给业务工作流。
仍然在更多的实施例中,分析经分类的ID可包括利用ID分类来确定在ID上描绘的识别信息。例如,在一个实施例中,全部或部分基于该分类对ID进行分类,确定与该分类相对应的模板。在优选的方法中,模板可包括用于定位和/或识别在ID上描绘的多种类型的信息,具体地识别信息。本文中考虑的模板可包括用于定位和/或识别多种类型识别信息的任何合适形式的指令,诸如本领域普通技术人员在被告知这些公开时会是明显的。
例如,在一种方法中,模板包括提供在ID上描绘的识别信息的绝对位置的指令,诸如与描绘识别信息的一系列像素相对应的坐标信息。在其他方法中,模板包括提供在ID上描绘的识别信息的相对位置。模板可包括指令和/或知识:两种特定类型的识别信息一致位于物理接近ID处,和/或具有识别信息的特定相对布置,诸如多个识别信息垂直或水平布置为邻近其他信息,识别信息被布置在关于其他信息的ID的相同或相反的方面、侧面、边缘或角等,如本领域普通技术人员在阅读本说明书时会理解的。
在另一实施例中,工作流可将分类用作过滤器,以有效减少工作流中下游操作的计算成本。例如,在一种方法中,工作流包括检索与实体相对应的一个或多个记录,并且在工作流过程中利用那些记录以减少下游处理。示例性的示例可包括包含信用卡、背景核查、驾驶记录回顾等的工作流,如本领域普通技术人员在阅读本说明书时会理解的。
在一个实施例中,工作流分类ID,诸如驾驶证。基于将ID分类为由特定州发布的驾驶证,例如检索相关的驾驶记录、财务记录、犯罪记录等的下游操作可通过减少工作流必需搜索其内的相关记录的搜索空间来辅助。例如,通过确定ID是马里兰的驾驶证,后续的检索记录可搜索存储仅马里兰居民的记录的数据库而不是存储所有美国居民的记录的数据库。
前述的多种基于分类的搜索空间减少还可结合下面进一步详细描述的数据提取技术使用以获得很大的优势。例如,所提取的数据可以类似于上述情景的方式基于数据从其中提取的文档的分类与相对小或窄的搜索空间相比较。
在优选的方法中,分类可在进行相关业务工作流过程中使用。例如,在一个实施例中,响应于在业务工作流中检测到预定激励,业务工作流附加地包括实施分类。
在更多的实施例中,ID和/或ID分类可利用诸如上述的类似技术来验证。
ID数据提取和工作流整合
根据优选的实施例,本文中公开的数据提取技术与之前公开的ID业务工作流整合技术和/或ID分类技术中的一个或多个相组合。例如,在特别优选的实施例中,数据提取至少部分基于ID分类。更加优选地,将识别信息和/或所提取的数据整合到相关业务工作流中可至少部分基于ID分类。
仍然参考附图,图8描绘了根据一个实施例的方法800,其一般例示了将ID数据提取技术和/或其移动实现方式整合到业务工作流中的整体发明过程。方法800可在任何环境中、利用任意数目的合适资源实践,诸如在图1-2中描绘的等。
方法800包括操作802,其中包括ID的图像利用移动设备接收或捕获。
方法800还包括操作804,其中至少部分基于图像分类ID。在多种方法中,分类可以如在本文中描述的任何合适的方式在方法800的上下文内实施。
在操作806中,方法800包括至少部分基于ID分类从ID中提取数据。例如,在一种方法中,提取数据可包括全部或部分基于ID分类建立提取模型,并且利用提取模型从ID中提取数据。提取模型可包括如本文中和/或在上面涉及的相关应用中描述的任何特征、功能或细节而不脱离本公开的范围。
继续参考图8,方法800包括操作808,其中工作流的至少一部分至少部分基于所提取的数据被驱动。
再次参考配置为辅助财务交易的工作流的熟悉示例,在一种方法中,工作流可接收包括信用卡或借记卡的ID的图像。工作流可将ID分类为适当类型的卡,并且可进一步根据一个或多个附加的区别特征(例如,财务服务者,诸如VISA、American Express、Discover、MasterCard等)分类卡的类型。基于卡的分类建立提取模型。
在一些方法中,提取模型可描述一个或多个ID特征的统计分配性质,例如,跨ID的文本字段的分配、图像元素的分配(诸如图片、州印、全息图等)、在ID中描绘的线、边界、框或其他分隔符的分配等,如本领域普通技术人员在阅读本说明书时会理解的。
在其他实施例中,提取模型精确限定了ID的区域,其中数据会使能或辅助财务交易位于该区域,以及最佳参数在该区域从ID提取那些数据。利用提取模型,账号、安全码、账号持有人姓名、截止日期等可例如利用定制的OCR操作、对象识别操作、面部识别操作、图案识别操作等从ID以高准确度和保真度提取,如本领域普通技术人员在阅读本说明书时会理解的。然后所提取的数据可提供给工作流,并且用于驱动工作流,例如通过根据前述示例性情景完成财务交易。
在优选的方法中,实施数据提取并且完全能够操作而不用依赖任何对在实施传统OCR过程中生成/确定的文本数据或文本信息的操作。例如,即使在提取可选地利用OCR技术的实施例中,那些实施例不具有确定、利用或以任何方式利用由其确定的文本信息的能力。以此方式,数据提取可认为不包括OCR技术,其能够/配置为确定文本信息,并且如果有的话,而不是仅利用配置为确定位置信息的OCR技术。
再次参考附图,根据一个实施例,更加具体的ID数据提取工作流整合包括诸如在图9中描绘的方法900中阐述的操作。方法900可在任何环境中利用任何数目的合适资源(诸如在图1-3中描绘的资源等)来实践。
在优选的实施例中,方法900包括操作902-908,其基本上类似于上面参考附图8描述的操作802-808。具体地,在操作902中,包括一个或多个ID的至少一个图像利用移动设备接收或捕获。在操作904,分类一个或多个ID。在操作906,基于一个或多个ID分类建立提取模型。在操作908,基于提取模型从ID中提取数据。
在特别优选的实施例中,提取模型可基于以前收集和/或分析的数据而建立,并且分派给确定ID也属于的分类。在此方法中,一旦确定ID与特定分类相对应,则相关提取模型可被选择、输入、加载、应用等,并且如本文所描述的一般用于提取数据。
在描绘一个或多个ID(和/或单个多页面ID的多个页面)的一个或多个图像包括多个文档的实施例中,方法900可选地包括分类多个ID文档或单个ID的多个要素(例如,分类多页面ID的每个页面,或分类单个页面的多个要素,诸如照片和文本串)。多页面ID的原型示例为任何形式的ID,其包括前面和后面,例如驾驶证、信用卡或借记卡等。其他原型多页面ID可包括护照、财务报表、医疗记录等,如本文描述的并且技术人员在阅读所述说明书时会理解的。
每个文档、页面、要素等的分类可与其他一个或多个文档、一个或多个页面、一个或多个要素等的分类进行比较,并且全部或部分基于该比较,可确定一个或多个ID的整体分类。类似地,提取模型可基于多个文档、页面、要素等的任意数目的一个或多个分类而建立。
继续参考图9,方法900还包括并未关于图8和方法800指定的操作。例如,如图9所示,方法900包括操作910,其中基于所提取的数据建立ID简档。在一些方法中,可基于超出所提取数据的附加信息建立ID简档,优选地为附加的识别信息,其可全部或部分利用所提取的数据例如经由查找操作或基于在可选地与ID简档相关联的其他图像、工作流、操作等中存在的相同或类似信息而确定。如上注意到,ID简档可与单个实体、多个实体、特定业务过程或交易、特定工作流等相对应,如本领域普通技术人员在阅读本说明书时会理解的。
类似地,任意数目的身份子简档可至少部分基于所提取的数据被合成。例如,继续多个人类代理被授权为代表实体动作的情景,虽然ID简档可与实体相对应,但由其合成的每个子简档可与人类代理的单独一个相对应。在多种方法中,身份子简档可附加地和/或可替代地关于其中包含的识别信息的关联性、相关性、有关性等分解到特定类型的工作流、业务过程、交易等。
在优选的方法中,方法900还包括操作912。具体地,操作912包括将所建立的ID简档存储到存储器中,优选地为在操作902中用于接收和/或捕获一个或多个图像的移动设备的存储器。在实施例中,ID简档可存储到易失性存储器,其中来自其的识别信息关于工作流的特定实例或与其结合使用,优选地为至少一个图像在其中被接收或捕获的工作流的实例,其中从该至少一个图像中提取数据。
在更多的方法中,方法900包括操作914,其中检测工作流的预定激励。合适的刺激及其检测可包括任何合适的形式或类型,如本领域普通技术人员在阅读本说明书时会理解的。
在更多的方法中,方法900包括操作916。优选地,操作916包括响应于在操作914中检测到预定激励,识别来自所存储的ID简档的工作流相关数据。在多种方法中,数据可被识别并确定为单一操作或一系列操作中的工作流相关数据。
在一种方法中,确定工作流相关性包括将所识别的数据与其他工作流数据相比较,和/或将所识别数据的一个或多个特点与其他工作流数据的特点相比较(例如,为文本字符串的指示性符号或图案(诸如面值符号、数字符号等)的格式、存在或不在,或描绘照片、标志、标记等的ID部分的类似图像数据特点),并且确定所识别的数据基于由比较所确定的所识别数据和其他工作流数据之间的相似性是工作流相关的。当然,可利用用于确定数据是“相关”于工作流的其他技术而不脱离本公开的范围。
然而,在优选的方法中,关于工作流相关性的所提取数据的语义上下文在进行工作流之前被确定,并且相应的分类、提取等可利用此先验知识来提高分类、提取等的效率和准确度。
在一个实施例中,方法900还包括操作918,其中确定为工作流相关的数据被提供给确定数据与其相关的工作流。优选地,工作流相关数据从所存储的ID简档直接提供给工作流,例如通过将相关数据“加载”到工作流,将相关数据与工作流相关联(例如,利用元数据或文档指针/参考等),或提供工作流获取所存储的ID简档中的信息的任何其他合适的形式,诸如技术人员在阅读本说明书时会的。
在其他方法中,基于数据从其中提取的ID的分类确定数据为工作流相关。例如,在一些方法中,其中下面的交易、操作等依赖于识别的标准形式(例如,用于背景核查、权利应用、工作应用等)并且工作流将ID分类为下面的过程所依赖的一个或多个可接受(标准)形式的识别之一,则从ID提取的数据可基于ID分类(在多种方法中,单独地或结合一个或多个其他因素)确定为工作流相关。
在优选的方法中,方法900包含附加的操作920,其中工作流的一部分利用工作流相关数据驱动。工作流可以任何合适的方式驱动,诸如技术人员在阅读本说明书时会的。
在多种方法中,本公开的ID数据提取技术在进行多种业务工作流过程中使用是大大有利的。例如,在一般方法中,ID可选地利用移动设备的捕获部件进行成像。ID图像再次优选地至少部分利用移动设备处理器处理,而且包括用任何合适的或可用的处理资源实施的处理。经处理的ID图像经受分类分析,其确定文档确实是ID,并且优选地确定ID属于一个或多个分类。分类可包括落入更广泛分类范围内的嵌套(子)分类,诸如上面描述的并且如本领域普通技术人员在阅读本说明书时会理解的。
例如,继续上面讨论的ID情景,分类分析可确定图像描绘ID,并且ID属于“证件”类别、“车辆证件”子类别、进一步的子类别“驾驶证”并且又进一步子类别与特定州相对应,例如“马里兰的驾驶证”。
基于一个或多个的分类,不包括或结合任意数目的其他因素,诸如图像的多个特点,可选择或建立与成像的ID所属于的文档(ID)的类别相对应的提取模型。利用提取模型,从ID提取数据用于后面关于业务工作流使用。
例如,在一种方法中,业务工作流可全部或部分基于所提取的数据被调用。
在更多的方法中,工作流进展可全部或部分基于所提取的数据被支配或影响。例如,在一个实施例中,用户参与工作流以购买、注册、安排等一项或多项服务的条款,诸如送货服务、咨询服务等。在工作流过程中提示用户捕获他们的驾驶证的图像并且将图像提交给工作流。驾驶证描绘了用户的姓名、出生日期、地址和其他识别信息。ID被分类,并且基于ID被分类为驾驶证,建立(和/或检索)提取模型并用于从驾驶证提取数据。
在更多的方法中,形成对工作流影响基础的所提取的数据可基于与不必在ID上描绘的其他数据相关联可这样做。例如,继续上面描述的驾驶证情景,假设用户请求将驾驶证更新为所购买、安排等的特定服务。在一些方法中,工作流可提取包括驾驶证号的数据。
利用驾驶证号,可选地结合其他所提取的数据,诸如用户姓名等,工作流可检测特定证件更新过程上的与一个或多个拖延(例如,欠款、罚款、票、要点、判断、限制,或其他类型的保持,诸如本领域普通技术人员在阅读本说明书时会理解的)相关联。例如,工作流可与一个或多个数据库、系统、记录等进行通信,诸如由本地机动车部门(DMV)或机动车管理部门(MVA)所保持的那些,例如用于追踪相应地区的持证驾驶员。虽然ID并未指示关于驾驶证(其具有与其相关联的一个或多个拖延)的任何事情,但利用从驾驶证提取的数据工作流能够确定相关的拖延信息并且因此引导工作流的进展。
在一个示例性方法中,前述工作流可响应于确定没有拖延与特定驾驶证相关联而调用更新接口和/或发起更新交易。相反,工作流可调用任意数目的接口从而帮助用户解决或提出确定与特定驾驶证相关联的任何拖延。例如,在一个实施例中,工作流响应于确定证件具有与其相关联的未付余额而调用费用支付提交接口,以解决费用相关的拖延。工作流可辅助驾驶员提交任何必要的付款而不必发起独立的付款过程,例如通过登录到适当的网站、采用适当的形式邮寄支票等,如本领域普通技术人员在阅读本说明书时会理解的。
在另一实施例中,工作流可例如响应于确定证件具有与其相关联的一个或多个关于违反交通的拖延,诸如驾驶证上的要点,而调用驾驶员教育或交通学校程序应用过程。类似地,工作流可响应于确定判决应用于驾驶员,要求驾驶员在重新开始驾驶活动之前完成交通学校,来调用适当的付款接口和/或交通学校应用接口。
在另一示例性实施例中,用户参与财务交易工作流,例如提交州或联邦报税表。工作流包括捕获或提供ID的图像(诸如驾驶证)、报税表(诸如W-2)等。优选地工作流将所捕获的图像数据用作报税准备工作的相关识别信息源。在一种方法中,工作流包括确定个人纳税人(即实体)是否必须支付与参与特定活动或未能参与特定活动相关联的特定税费。该确定可直接从由ID提取的和/或在ID上描绘的识别信息进行或基于利用识别信息检索相关信息(诸如在查找过程中)而进行。响应于确定实体必须基于实体(未)参与相关活动支付税费,工作流可调用呈现机会给实体的接口,以修改行为并且避免在未来年支付税费。
在具体的示例中,与工作流交互以准备联邦报税的用户提交ID的图像(诸如驾驶证和/或税表的图像)给工作流。工作流包括分类一个或多个图像中的一个或多个ID,从其中提取税务相关数据,以及用适当的所提取的数据填充报税表的适当字段。此外,工作流配置为辅助用户最小化所需要的税费支付。结果是,工作流配置为推荐、提供和/或辅助参与可用于用户的可能节税策略中。
在前面的情景中,用户是学生或是自由职业者,并且因此没有健康保险。结果是,用户必须支付卫生保健税,其可至少部分基于用户提交(或未能提交)一种或多种形式的ID由工作流确定,所述ID包括驾驶证并且优选地包括医疗信息。例如,用户可未能提交提供保险证明以避免卫生保健税所必要的文档。可替代地和/或附加地,工作流可依赖于关于税务相关活动的一个或多个外部数据源。
在一种方法中,IRS维持反映卫生保健等级状态的数据库,或每个卫生保健提供者维持可用于顾客为了税务目的提供保险证明的登记数据。基于从用户ID提取的数据,工作流可与一个或多个数据源连接并且确定个人是否加入到合格医疗保险计划,并且为了征税目的向合适的实体提供其证明。如果用户并未加入到合格健康保险计划,工作流可除了提供保险信息的证明给报税表以外,还调用设计为辅助用户购买一个或多个合格健康保险计划策略并且因此在未来几年避免卫生保健税的健康保险注册接口。
当然,诸如上面参考分类和ID处理描述的其他示例性情景可用于本公开的数据提取概念和特征而具有相同的适用性。可从ID获得并在工作流过程中单独或组合使用(例如,作为“种子”或询问以确定、定位、发现、计算或获得关于该工作流、另一工作流或最优选地该工作流下的业务过程的附加信息)以确定、影响、修改、引导或完成等关于工作流的一个或多个活动、规则或业务过程的任何类型的数据应理解为包括在本公开的范围内。
根据现在描述的技术(并且其可对多个工作流有用)的适于提取的示例性形式的数据包括字符串,例如字母数字字符和/或符号的字符串;图像,具体地描绘个人或财产(诸如车辆)的照片的多个图像、唯一图像(诸如安全图像)等。
类似地,在另一实施例中,用户希望经由工作流进行财务交易,诸如存款到银行账户、提交付款用于购物等。工作流接收到文档的图像,并如上描述的将文档分类为ID。财务交易可要求一个或多个身份证明,诸如姓名、地址等。可替代地,用户可简单地希望通过捕获描绘数据的图像而不是手动输入数据来提供必要数据。
由于任意数目的原因,用户捕获和/或提交ID的图像给工作流。工作流处理图像,分类在其中描绘的任何文档(并且优选地为任何ID),并基于该分类建立提取模型。并至少部分基于所提取的数据提取数据,工作流可以任意数目的依赖上下文的方式进行。
例如,在一种方法中,用户所提交的ID描绘不同于与用户的财务账户相关联的记录地址的地址。响应于确定不相符,工作流可调用配置为辅助用户更新他们的地址的接口,所述更新或者在与用户的财务账户相关联的记录中,或通过请求改变关于所成像ID所提交/实施的地址。
在类似的方法中,用户可参与采购,并且在采购过程中提交ID或利用从ID提取的数据。例如,用户可指定期望的付款形式来完成交易,但交易可不能利用所期望的付款形式继续进行,例如因为那种付款形式可能不被卖方所接受、相关账户没有足够的余额、该种付款形式(例如,信用卡/借记卡)已到期等,如本领域普通技术人员在阅读本说明书时会理解的。
响应于确定所期望的付款形式不能用于本次交易,工作流可调用多个可能的接口、活动或新的工作流。例如,在一种方法中,其中该付款形式不被卖方接受(例如,卖方不接受特定付款形式,诸如支票或来自特定服务商的付款,诸如美国运通等),工作流可利用从ID提取的数据来定位一种或多种替代的付款形式。
替代的付款形式可与工作流易访问的用户简档相关联,并且简档基于在ID上描绘的识别信息定位并关于简档(例如,用户姓名)被使用。替代的付款形式可附加地和/或可替代地由工作流利用所提取的数据确定,以根据可用程序并利用诸如本领域普通技术人员在阅读本说明书时会理解的任何可用数据源定位用户可用的附加财务资源。不管工作流利用所提取的数据来定位和/或确定可替代付款形式的合格性的方式,工作流可提供所期望的付款形式不被卖方接受的指示给用户。工作流可替代地或附加地建议用于完成交易的一种或多种的替代的一个或多个付款形式,请求并接收指定替代付款形式之一的用户输入,并利用指定替代的付款形式来完成交易。
在另一实施例中,类似于上面,工作流可确定所提供的用于完成财务交易的一种付款形式到期了。结果是,工作流可利用从ID提取的数据来定位例如在诸如上面所描述的相关工作流简档中的和/或位于工作流外部但能够利用从ID提取的数据确定的相应的财务记录。
当然,如技术人员在阅读本说明书时将理解的,可在工作流过程中请求、接收和/或利用用户输入而不考虑检测工作流或下面的数据的任何特定问题。事实上,在一些方法中,例如为了验证工作流临界数据(例如,如从图像提取的)的准确性以提供工作流安全(例如,CAPTCHA-各种人类认证等,如技术人员在阅读本说明书时会理解的),请求用户输入是理所当然有利的。因此,用户输入可利用任何合适的技术如本文所描述的被征求、接收和/或并入到工作流中而不脱离本公开的范围。优选地,用户输入经由移动设备而接收,并且更加优选地经由移动设备的显示器而接收。
优选地,工作流配置为连接管理与到期的付款形式相对应的一个或多个用户财务账户的财务机构,并配置为向用户呈现配置为辅助请求更新付款的形式,或可替代地发布新的付款形式以代替到期的付款形式。更加优选地,工作流可建议依赖于与到期的付款形式相似或相同款项来源的替代的付款形式,例如工作流可建议用户提交来自与之前提供的尝试完成财务交易的到期借记卡相对应的相同账户的电子转账。
还可至少部分响应于检测到一个或多个预定条件或工作流激励来实施数据提取。在一个实施例中,数据提取响应于确定文档是ID并且描绘关于业务工作流的信息而进行。以此方式,在一些方法中,可响应于检测到ID和/或ID上的工作流相关数据,诸如可由ID分类所指示的,调用提取操作。
在多个实施例中,可在一个或多个工作流过程中提交多个ID,并且联合每个工作流或联合任意数目的工作流,身份简档可至少部分基于从多个ID的一个或多个中提取的数据被合成。身份简档可包括多个子简档。优选地,多个子简档的每个配置为用作通常被特定类型的业务过程所需要的识别信息源,例如,财务身份信息简档、医疗身份信息简档、职业身份信息简档等,如本领域普通技术人员在阅读本说明书时会理解的。
身份简档可保持在移动设备的存储中,或按照多个相关业务工作流中的用户活动所需、经由安全通信协议从移动设备远程检索。优选地,身份简档可与一个或多个身份简档信息由其合成的图像一起存储。在特别优选的方法中,身份简档数据或图像数据可与其他数据(例如,如元数据)联合存储。在更多的实施例中,所存储和/或检索的身份简档数据可联合检索身份简档数据在工作流过程中验证,如本领域普通技术人员在阅读本说明书时会理解的。验证可包括任何合适形式的确认ID简档是安全的——例如,密码认证、加密等。验证还可包括利用一个或多个计算工具确定ID简档中的数据是否已被篡改。例如,在一种方法中,验证可包括计算ID简档的哈希和(或校验和),并且联合ID简档存储所计算出的哈希值。为了确保从最后一个授权的用户访问开始ID简档保持不变,在检索之前计算所存储ID简档的哈希和。在一个实施例中,如果在检索之前所计算出的哈希和与计算出的和/或关联于所存储ID简档的哈希和一致,则ID简档未改变,并且证实了其数据。
在优选的方法中,任何前述示例性工作流至少部分利用移动设备实施,并且在特别优选的方法中利用在移动设备上运行的移动应用实施。因此,示例性的工作流理想地结合利用移动设备捕获ID的图像实施,所述捕获或者作为工作流的一部分或者作为与工作流过程一起进行的附加操作。
在任意前述情景的更加优选的实施例中,ID(和/或在其上描绘的、与其关联的或由其确定的任何有用的信息)经由在移动设备上运行的移动应用提交给工作流。以此方式,在移动设备上封装用户与工作流的整个交互、最大化用户便利性以及整个工作流过程的灵活性是可能的。当然,整个工作流不需要在用户或用户的移动设备(或ID从其被提交的其他设备)上进行或不需要利用存储在其上的数据或不需要其可访问。现在描述的情景还包括例如用户可准备一些数据用于提交给后端服务器或系统用于由自动化系统、人类或其一些组合进行附加处理的情景。
如上面详细描述的,用于处理识别文档的图像的本公开的系统、计算机程序产品和技术可包括本文所公开的任意数目的替代和/或组合特征。例如,参考方法形式的示例性实施例,本公开的发明性概念可包括下面特征的任何组合、排列、综合或子集。
方法可等同地具体化为系统或计算机程序产品,并且包括:利用移动设备接收或捕获包括身份文档(ID)的图像;至少部分基于所述图像将所述ID分类;至少部分基于所述ID分类从所述ID中提取数据;以及基于所提取的数据驱动工作流的至少一部分。方法还可选地包括基于所述ID分类建立提取模型;并且利用所述提取模型从所述ID中提取数据。方法可包括确定所提取的数据与所述工作流相关。所述确定至少部分基于下述项的一个或多个:ID分类;确定所提取的数据的该部分包括一个或多个预定字符串;以及确定所提取的数据的该部分包括一个或多个预定图像。该方法可包括基于所提取的数据的至少一些合成一个或多个身份子简档。每个身份子简档可包括关于预定类型的业务过程的识别信息。每个身份子简档可包括关于唯一实体的识别信息。该方法可包括利用所提取的数据定位工作流相关数据(例如,ID上的或在独立数据源(诸如数据库)中的数据),在这种情况下可响应于定位所述ID上的所述工作流相关数据或工作流相关数据可不必在所述ID上描绘实施所述提取。工作流可包括至少部分依赖于所提取的数据或利用所提取的数据确定的数据的财务交易。工作流可包括确定财务交易不能利用所提取的数据来完成;确定适于所述财务交易使用的一个或多个替代数据源;指定所述替代数据源之一用于关于所述财务交易使用;至少部分基于从所述指定的替代数据源的一个或多个获得的数据来完成所述财务交易;向用户显示所述财务交易不能利用所提取的数据完成的指示;请求指定所述替代数据源的一个或多个的用户输入;接收所述用户输入;至少部分基于所述用户输入利用所述指定的替代数据源完成所述财务交易;请求与所述财务交易相关的用户输入并且接收所述用户输入;其中所述财务交易至少部分依赖于所接收的用户输入。用户输入优选地经由移动设备显示器被接收,并且所述用户输入包括识别信息。可替代地和/或附加地,关于所述工作流的用户输入至少部分经由移动设备显示器被接收,并且所述提取和所述驱动的至少一个进一步至少部分基于所接收的用户输入。所述方法可包括在提取所述数据之前验证所述ID。其中所述图像包括多个文档,所述方法还可包括:对所述多个文档的至少两个进行分类;基于每个文档分类建立提取模型;以及基于所述提取模型从所分类文档的至少一些中提取所述数据。其中所述ID包括多页面文档,所述方法还可包括:利用所述移动设备接收或捕获一个或多个附加图像,每个附加图像包括所述ID的至少一个页面的至少一部分,其中所述分类进一步基于所述附加图像的一个或多个,以及其中数据从所述ID的至少两个页面被提取。
本公开的发明性概念还可具体化为系统,例如,在一个这样的实施例中,系统包括处理器和逻辑。该逻辑处于处理器中或可由处理器执行,并且配置为响应于其调用和/或执行,使得处理器实施一个或多个操作。
本文中公开的发明性概念作为示例呈现以在多个示例性情景、实施例和/或实现方式中例示其多个特征。应领会,通常公开的概念认为是模块,并且可以其任何组合、排列或综合实现。此外,本公开特征、功能和概念的任何修改、替代或等同也应视为在本公开的范围内,此会由本领域普通技术人员在阅读目前的说明时领会。
虽然上面已经描述了多个实施例,但应理解,它们仅作为示例呈现,并且不是限制。因此,本发明的实施例的宽度和范围不应被上述示范性实施例的任何一个限制,而是应仅根据下面的权利要求和它们的等同物进行限定。
Claims (25)
1.一种方法,包括:
利用移动设备接收或捕获包括身份文档(ID)的图像;
至少部分基于所述图像将所述ID分类;
至少部分基于所述ID分类从所述ID中提取数据;以及
基于所提取的数据驱动工作流的至少一部分。
2.如权利要求1所述的方法,进一步包括基于所述ID分类建立提取模型;以及
利用所述提取模型从所述ID中提取数据。
3.如权利要求1所述的方法,进一步包括确定所提取的数据与所述工作流相关。
4.如权利要求3所述的方法,所述确定至少部分基于下述项的一个或多个:
所述ID分类;
确定所提取的数据的部分包括一个或多个预定字符串;以及
确定所提取的数据的部分包括一个或多个预定图像。
5.如权利要求1所述的方法,其中所述图像包括多个文档,以及所述方法进一步包括:
对所述多个文档的至少两个进行分类;
基于每个文档分类建立提取模型;以及
基于所述提取模型从所分类文档的至少一些中提取所述数据。
6.如权利要求1所述的方法,其中所述ID包括多页面文档,以及所述方法进一步包括:
利用所述移动设备接收或捕获一个或多个附加图像,每个附加图像包括所述ID的至少一个页面的至少一部分,
其中所述分类进一步基于所述附加图像的一个或多个,以及
其中所述数据从所述ID的至少两个页面被提取。
7.如权利要求1所述的方法,进一步包括至少部分基于所提取的数据的一些或全部合成身份简档。
8.如权利要求7所述的方法,进一步包括基于所提取的数据的至少一些合成多个身份子简档。
9.如权利要求8所述的方法,其中每个身份子简档包括关于预定类型的业务过程的识别信息。
10.如权利要求8所述的方法,其中每个身份子简档包括关于唯一实体的识别信息。
11.如权利要求1所述的方法,进一步包括利用所述所提取的数据定位工作流相关数据,其中所述工作流相关数据不在所述ID上描绘。
12.如权利要求1所述的方法,进一步包括:
利用所述所提取的数据定位所述ID上的工作流相关数据,以及
响应于定位所述ID上的所述工作流相关数据,实施所述提取。
13.如权利要求1所述的方法,其中所述工作流包括至少部分依赖于所述所提取的数据或利用所述所提取的数据确定的数据的财务交易。
14.如权利要求13所述的方法,进一步包括:
确定所述财务交易不能利用所述所提取的数据来完成;
确定适于所述财务交易使用的一个或多个替代数据源;
指定所述替代数据源之一用于所述财务交易使用;以及
至少部分基于从所指定的替代数据源的一个或多个获得的数据来完成所述财务交易。
15.如权利要求14所述的方法,进一步包括:
向用户显示所述财务交易不能利用所述所提取的数据完成的指示;
请求指定所述替代数据源的一个或多个的用户输入;
接收所述用户输入;以及
至少部分基于所述用户输入利用所述所指定的替代数据源完成所述财务交易。
16.如权利要求13所述的方法,进一步包括:
请求与所述财务交易相关的用户输入;
接收所述用户输入;并且
其中所述财务交易至少部分依赖于所接收的用户输入。
17.如权利要求16所述的方法,其中所述用户输入经由移动设备显示器接收,以及其中所述用户输入包括识别信息。
18.如权利要求1所述的方法,进一步包括:接收与所述工作流相关的用户输入,
其中所述用户输入至少部分经由移动设备显示器被接收,并且
其中所述提取和所述驱动中的至少一个进一步至少部分基于所接收的用户输入。
19.如权利要求1所述的方法,进一步包括在提取所述数据之前验证所述ID。
20.一种方法,包括:
利用移动设备接收或捕获包括身份文档(ID)的图像;
将所述ID分类;
基于所述ID分类建立提取模型;
基于所述提取模型从所述ID中提取数据;
基于所提取的数据建立ID简档;
将所述ID简档存储到所述移动设备的存储器中;
检测工作流中的预定激励;
至少部分响应于检测到所述预定激励,识别所存储的ID简档中的工作流相关数据;
将来自所述所存储的ID简档的所述工作流相关数据提供给所述工作流;以及
利用所述工作流相关数据驱动所述工作流的至少一部分。
21.一种计算机程序产品,包括:计算机可读存储介质,其具有存储在其中的计算机可读程序代码,所述计算机可读程序代码包括指令,所述指令配置为使得处理器:
接收存储到移动设备中的或利用移动设备捕获的图像,所述图像包括身份文档(ID);
将所述ID分类;
基于所述ID分类建立提取模型;
基于所述提取模型从所述ID中提取数据;
基于所提取的数据建立ID简档;
将所述ID简档存储到所述移动设备的存储器中;
检测工作流中的预定激励;
至少部分响应于检测到所述预定激励识别所存储的ID简档中的工作流相关数据;
将来自所述所存储的ID简档的所述工作流相关数据提供给所述工作流;以及
利用所述工作流相关数据驱动所述工作流的至少一部分。
22.如权利要求21所述的计算机程序产品,进一步包括指令,其配置为使得所述处理器至少部分基于所述所提取的数据的一些或全部来合成身份简档。
23.如权利要求21所述的计算机程序产品,进一步包括指令,其配置为使得所述处理器基于所述所提取的数据的至少一些来合成多个身份子简档。
24.如权利要求23所述的计算机程序产品,其中每个身份子简档包括关于预定类型的业务过程的识别信息。
25.如权利要求23所述的计算机程序产品,其中每个身份子简档包括关于唯一实体的识别信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/220,029 | 2014-03-19 | ||
US14/220,029 US9058580B1 (en) | 2012-01-12 | 2014-03-19 | Systems and methods for identification document processing and business workflow integration |
PCT/US2015/021597 WO2015143237A1 (en) | 2014-03-19 | 2015-03-19 | Systems and methods for identification document processing and business workflow integration |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106104572A true CN106104572A (zh) | 2016-11-09 |
Family
ID=54145353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580014141.1A Pending CN106104572A (zh) | 2014-03-19 | 2015-03-19 | 用于识别文档处理和业务工作流整合的系统和方法 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP3120299A4 (zh) |
JP (1) | JP2017514211A (zh) |
CN (1) | CN106104572A (zh) |
WO (1) | WO2015143237A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108062654A (zh) * | 2017-08-23 | 2018-05-22 | 广州市知君信息科技有限公司 | 专利通知书处理方法及系统 |
CN108629160A (zh) * | 2017-03-17 | 2018-10-09 | 富士施乐株式会社 | 文档管理系统和处理设备 |
CN109547477A (zh) * | 2018-12-27 | 2019-03-29 | 石更箭数据科技(上海)有限公司 | 一种数据处理方法及其装置、介质、终端 |
CN113065154A (zh) * | 2021-03-19 | 2021-07-02 | 深信服科技股份有限公司 | 一种文档检测方法、装置、设备和存储介质 |
TWI734037B (zh) * | 2018-09-28 | 2021-07-21 | 愛探極溫度行銷有限公司 | 不動產持分與繼承計算管理系統 |
CN116523478A (zh) * | 2023-07-05 | 2023-08-01 | 北京码动摩登科技有限公司 | 一种保单数据管理方法、系统、设备及存储介质 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG10201603768SA (en) | 2016-05-11 | 2017-12-28 | Mastercard Asia Pacific Pte Ltd | Method And System For Identifying A Payment Card Design |
JP6879596B2 (ja) * | 2019-10-18 | 2021-06-02 | Assets name Innovation株式会社 | 人材マネジメントサーバ |
US20210201266A1 (en) * | 2019-12-31 | 2021-07-01 | DataInfoCom USA, Inc. | Systems and methods for processing claims |
CN114187605B (zh) * | 2021-12-13 | 2023-02-28 | 苏州方兴信息技术有限公司 | 一种数据集成方法、装置和可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090327250A1 (en) * | 2006-06-28 | 2009-12-31 | Sun Microsystems, Inc. | Method and apparatus for searching and resource discovery in a distributed enterprise system |
US20100209006A1 (en) * | 2009-02-17 | 2010-08-19 | International Business Machines Corporation | Apparatus, system, and method for visual credential verification |
US20120290421A1 (en) * | 2011-05-12 | 2012-11-15 | Spenzi, Inc. | Enabling a Merchant's Storefront POS (Point of Sale) System to Accept a Payment Transaction Verified by SMS Messaging with Buyer's Mobile Phone |
US20120308139A1 (en) * | 2011-05-31 | 2012-12-06 | Verizon Patent And Licensing Inc. | Method and system for facilitating subscriber services using mobile imaging |
US20130287265A1 (en) * | 2008-01-18 | 2013-10-31 | Mitek Systems | Systems and methods for mobile image capture and content processing of driver's licenses |
US20130287284A1 (en) * | 2008-01-18 | 2013-10-31 | Mitek Systems | Systems and methods for classifying payment documents during mobile image processing |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2476895A1 (en) * | 2002-02-19 | 2003-08-28 | Digimarc Corporation | Security methods employing drivers licenses and other documents |
US10402898B2 (en) * | 2011-05-04 | 2019-09-03 | Paypal, Inc. | Image-based financial processing |
-
2015
- 2015-03-19 CN CN201580014141.1A patent/CN106104572A/zh active Pending
- 2015-03-19 JP JP2016558135A patent/JP2017514211A/ja not_active Withdrawn
- 2015-03-19 WO PCT/US2015/021597 patent/WO2015143237A1/en active Application Filing
- 2015-03-19 EP EP15764687.8A patent/EP3120299A4/en not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090327250A1 (en) * | 2006-06-28 | 2009-12-31 | Sun Microsystems, Inc. | Method and apparatus for searching and resource discovery in a distributed enterprise system |
US20130287265A1 (en) * | 2008-01-18 | 2013-10-31 | Mitek Systems | Systems and methods for mobile image capture and content processing of driver's licenses |
US20130287284A1 (en) * | 2008-01-18 | 2013-10-31 | Mitek Systems | Systems and methods for classifying payment documents during mobile image processing |
US20100209006A1 (en) * | 2009-02-17 | 2010-08-19 | International Business Machines Corporation | Apparatus, system, and method for visual credential verification |
US20120290421A1 (en) * | 2011-05-12 | 2012-11-15 | Spenzi, Inc. | Enabling a Merchant's Storefront POS (Point of Sale) System to Accept a Payment Transaction Verified by SMS Messaging with Buyer's Mobile Phone |
US20120308139A1 (en) * | 2011-05-31 | 2012-12-06 | Verizon Patent And Licensing Inc. | Method and system for facilitating subscriber services using mobile imaging |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108629160A (zh) * | 2017-03-17 | 2018-10-09 | 富士施乐株式会社 | 文档管理系统和处理设备 |
CN108629160B (zh) * | 2017-03-17 | 2023-08-11 | 富士胶片商业创新有限公司 | 文档管理系统和处理设备 |
CN108062654A (zh) * | 2017-08-23 | 2018-05-22 | 广州市知君信息科技有限公司 | 专利通知书处理方法及系统 |
TWI734037B (zh) * | 2018-09-28 | 2021-07-21 | 愛探極溫度行銷有限公司 | 不動產持分與繼承計算管理系統 |
CN109547477A (zh) * | 2018-12-27 | 2019-03-29 | 石更箭数据科技(上海)有限公司 | 一种数据处理方法及其装置、介质、终端 |
CN113065154A (zh) * | 2021-03-19 | 2021-07-02 | 深信服科技股份有限公司 | 一种文档检测方法、装置、设备和存储介质 |
CN113065154B (zh) * | 2021-03-19 | 2023-12-29 | 深信服科技股份有限公司 | 一种文档检测方法、装置、设备和存储介质 |
CN116523478A (zh) * | 2023-07-05 | 2023-08-01 | 北京码动摩登科技有限公司 | 一种保单数据管理方法、系统、设备及存储介质 |
CN116523478B (zh) * | 2023-07-05 | 2023-09-01 | 北京码动摩登科技有限公司 | 一种保单数据管理方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2017514211A (ja) | 2017-06-01 |
WO2015143237A1 (en) | 2015-09-24 |
EP3120299A1 (en) | 2017-01-25 |
EP3120299A4 (en) | 2017-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10515407B2 (en) | Systems and methods for identification document processing and business workflow integration | |
US11321772B2 (en) | Systems and methods for identification document processing and business workflow integration | |
US9058515B1 (en) | Systems and methods for identification document processing and business workflow integration | |
US9058580B1 (en) | Systems and methods for identification document processing and business workflow integration | |
CN106104572A (zh) | 用于识别文档处理和业务工作流整合的系统和方法 | |
US11429712B2 (en) | Systems and methods for dynamic passphrases | |
US10997251B2 (en) | Smart device | |
US11928878B2 (en) | System and method for domain aware document classification and information extraction from consumer documents | |
US10198565B2 (en) | System and method for candidate profile screening | |
CN110427254A (zh) | 任务处理方法、装置、设备及计算机可读存储介质 | |
Birch | Digital identity management: perspectives on the technological, business and social implications | |
US11108767B2 (en) | Apparatus and system for obtaining and encrypting documentary materials | |
Siraj et al. | Framework of a mobile bank using artificial intelligence techniques | |
US20240031154A1 (en) | Apparatus and method for generating a token certificate associated with an assignment | |
Krysovatyy et al. | Classification Method of Fictitious Enterprises Based on Gaussian Naive Bayes | |
US20200193525A1 (en) | System and method for automatic verification of expense note | |
CA3103484A1 (en) | Systems and methods for dynamic passphrases | |
Dixon et al. | AI and Corporate Social Responsibility | |
Markham et al. | Open-Set: ID Card Presentation Attack Detection Using Neural Style Transfer | |
Khare et al. | Transforming KYC with AI: A Comprehensive Review of Artificial Intelligence-Based Identity Verification | |
Otuagoma et al. | DESIGN AND DEVELOPMENT OF A HOSPITAL BIOMETRIC DATA MANAGEMENT SYSTEM | |
US20240089247A1 (en) | Systems and methods for extracting discrete data from a data unit and managing access thereto using electronic digital certificates | |
US20240348603A1 (en) | Method and apparatus for creating encoded data and use of same for identity verification | |
Al Qudah | Application of Artificial Intelligence Technologies for Citizen Services In E-Government | |
US20240346852A1 (en) | Method and apparatus for creating encoded data and use of same for identity verification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20161109 |
|
WD01 | Invention patent application deemed withdrawn after publication |