CN105874471A

CN105874471A - 卡ocr图像的客户端侧过滤

Info

Publication number: CN105874471A
Application number: CN201480062565.0A
Authority: CN
Inventors: 王晓航; 亚历山德罗·比萨科; 格伦·贝恩特松; 玛利亚·纳齐夫; 贾斯汀·沙伊纳; 萨姆·谢赫; 马克·莱斯利·斯奈德; 丹尼尔·塔拉韦拉
Original assignee: Google LLC
Current assignee: Google LLC
Priority date: 2013-11-15
Filing date: 2014-10-14
Publication date: 2016-08-17
Anticipated expiration: 2034-10-14
Also published as: US8903136B1; CA2930543A1; EP3069300A4; EP3069300A1; US9626556B2; WO2015073154A1; CN105874471B; JP2016541049A; CA2930543C; US9740929B2; US20170185833A1; US20150139506A1; KR101746736B1; KR20160085343A

Abstract

本公开的技术包括计算机实现的方法、计算机程序产品和系统，用于在向用于光学字符识别(“OCR”)的系统传送之前过滤图像。用户计算设备从物理卡的数字扫描获得卡的第一图像并且分析第一图像的特征，所述分析足够确定第一图像是否有可能能够被OCR算法所使用。如果用户计算设备确定第一图像有可能能够被使用，则第一图像被传送到与OCR算法相关联的OCR系统。在确定第一图像不可能能够被使用后，分析来自物理卡的数字扫描的卡的第二图像。光学字符识别系统对被过滤的卡执行光学字符识别算法。

Description

卡OCR图像的客户端侧过滤

相关申请

本申请要求于2013年12月18日提交的题为“卡OCR图像的客户端过滤(Client Side Filtering of Card OCR Images)”的美国申请No.14/133,232的优先权，美国申请No.14/133,232又要求2013年11月15日提交的题为“卡OCR图像的客户端过滤(Client Side Filtering of CardOCR Images)”的美国临时申请No.61/904,801的优先权。在此通过引用将上述申请的全部内容完全结合进来。

技术领域

这里公开的技术属于提取金融卡信息，更具体在上传用于光学字符识别的图像之前利用用户设备过滤图像

背景技术

当消费者进行在线购买或者使用移动设备购买时，它们通常被强制将会员信息或信用卡信息输入到移动设备以用于奖励或支付。由于移动设备上的小屏幕尺寸和键盘接口，这样的输入通常比较麻烦而且易于出错。用户可以使用许多不同卡进行购买，诸如信用卡、借记卡、储值卡以及其他卡。对于在移动设备上试图处理移动支付来进行多个交易的商家来说，信息输入难度也加倍了。

用于从卡获得支付信息或其他卡数据的当前应用需要在扫描中对卡精确定位。通常，在用户计算设备的用户界面上呈现一个框。用户需要精确地将卡与框对准以便允许用户计算设备捕获卡的图像。

在某些系统中，用户设备上传多个图像以供系统处理。当没有获得充分结果时，系统可以请求附加的图像。为了获得有用的图像来上传，用户可以更改图像捕获设备的位置、改变照明、或者执行任何功能来改善图像。如果在捕获到好的图像之前用户设备正在将图像传送到系统，则上传多个图像所需的处理能力可能变得繁重。当前应用不允许用户计算设备过滤图像以减少传送无用图像的需要。

发明内容

本公开的技术包括计算机实现的方法、计算机程序产品和系统，用于在向用于光学字符识别(“OCR”)的系统传送之前过滤图像。用户计算设备从对物理卡的数字扫描获得卡的第一图像并且分析第一图像的特征，所述分析足够确定第一图像是否有可能能够被OCR算法所使用。如果用户计算设备确定第一图像有可能能够被使用，则第一图像被传送到与OCR算法相关联的OCR系统。在确定第一图像不可能能够被使用后，分析来自对物理卡的数字扫描的所述卡的第二图像。光学字符识别系统对所过滤的卡执行光学字符识别算法。

在考虑了图示的示例实施例的以下具体实施方式之后，示例实施例的这些和其他方面、目标、特征和优点对本领域普通技术人员将变得显而易见。

附图说明

图1是根据这里所公开的技术的某些示例实施例的描绘过滤卡OCR图像的系统的框图。

图2是根据某些示例实施例的描绘过滤卡OCR图像的方法的流程框图。

图3是根据某些示例实施例的描绘用于确定图像是否满足过滤要求的方法的流程框图。

图4是根据某些示例实施例的显示积分卡图像的用户计算设备的图示。

图5是根据某些示例实施例的描绘计算机器和模块的框图。

具体实施方式

概览

这里的实施例提供计算机实现的技术，用于允许用户计算设备在将图像上传到系统以用于使用光学字符识别(“OCR”)从积分卡、支付卡、或其他卡提取卡信息之前过滤图像。在将图像传送到OCR系统进行处理之前，用户计算设备确定所扫描的图像是否满足要求集合。例如，OCR应用可以确定图像是模糊还是清晰的，图像是否足够亮以进行数据提取，和/或图像的期望位置上是否存在文本。如果图像满足用于处理的要求，则图像被传送到OCR系统以经历OCR处理。对于附加的图像，过程可以重复，直到结果集合超过所配置的阈值。

在整个说明书中，一般术语“卡”将用来表示诸如磁条卡的任何类型的物理卡用具。在示例实施例中，“卡”所表示的不同类型的卡可以包括信用卡、借记卡、储值卡、积分卡、身份卡、或者表示用户的账户或其上的其他记录或其他信息的任何其他合适卡。这里描述的示例实施例可以应用于其他项目的图像，诸如收据、登机牌、票据、和其他合适项目。卡还可以是卡的图像或传真。例如卡可以是卡在显示屏上的显示或卡的印刷图像。

用户可以在进行诸如购买、购票入场、会员登记、或其他合适交易的交易时利用卡。为了将卡所表示的账户输入到数字钱包应用模块或为其他数字账户目的，用户可以获得卡信息。卡通常是包含账户信息及在卡上的其他数据的塑料卡。在许多卡的实施例中，顾客姓名、到期日期、以及卡号物理地凸印在卡上。凸印的信息可以从卡的前后都可见，尽管凸出的信息通常在卡的背面是相反的。

用户可能想要输入来自卡的信息到移动用户计算设备或其他计算设备中，例如以在线上或物理商户位置使用积分卡，来进行线上购买、在商户位置进行购买、添加信息到用户计算设备上的钱包应用、或者用于任何其他合适原因。在示例中，用户想要使用移动用户计算设备来使用在移动用户计算设备上执行的数字钱包应用模块进行购买交易。数字钱包应用模块可能需要输入特定用户支付账户的细节以利用该特定用户支付账户进行交易或者建立账户。由于移动设备上的小屏幕尺寸和键盘接口，这样的输入会很困难且易于出错。此外，商户系统可能需要捕获卡信息以进行交易或用于其他原因。

用户采用移动电话、数码相机、或其他用户计算设备来捕获与用户想要输入到用户计算设备中的账户相关联的卡的扫描。

用户计算设备上的OCR应用接收对卡的扫描。扫描，或数字扫描，可以是卡的视频、一系列卡的图像、或者来自任何其他合适扫描技术的数据。在某些实施例中，OCR应用可以接收单个图像用于处理，直到请求了后续图像。一个或多个图像可以从用户计算设备的相机模块获得，诸如从移动电话上的相机获得。图像可以从耦合到用户计算设备的任何数字图像设备或者任何其他合适数字成像设备获得。图像可以由用户计算设备上的OCR应用从用户存储设备的存储位置、从远程存储位置、或者从任何合适位置来访问。能够提供图像的所有源都将被称为“相机”。

OCR应用从相机接收卡的图像。OCR应用的功能可以由任何合适模块、硬件、软件、或操作在用户计算设备上的应用来执行。OCR应用的一些或全部功能可以由远程服务器或其他计算设备(诸如操作在OCR系统中的服务器)来执行。例如，用户计算设备上的数字钱包应用模块可以获得卡的图像并且将图像传送到OCR系统以用于处理。在另一示例中，一些OCR功能可以由用户计算设备进行，且另一些OCR功能由OCR系统或另一远程服务器进行。这里提供的示例可以指示许多功能由用户计算设备上的OCR应用以及由OCR系统来执行，但是一些或全部功能可以由任何合适计算设备来执行。

在一示例中，卡的图像呈现在用户计算设备的用户界面上作为金融卡的现场视频图像。OCR应用隔离并且存储来自相机的视频馈送的一个或多个图像。OCR应用可以将对卡的扫描存储为包括卡的多个图像的视频或其他合适格式。例如，用户可以在金融卡上悬停用户计算设备的相机功能并且在用户计算设备的用户界面上观察金融卡的表现。用户可以开动用户计算设备上的真实或虚拟按钮以捕获优选图像或图像组。OCR应用可以自动选择优选图像。在替选实施例中，OCR应用一次只存储一个图像。

在某些示例中，所述的一些或全部功能是在扫描是活动的时执行的。例如，用户可以在卡上悬停用户计算设备的相机且利用卡的现场图像来执行这里所述的方法。也就是，OCR应用捕获并利用来自相机的活动馈送的图像。

OCR应用确定图像是否满足要传送到OCR系统以进行处理的最小要求。可以用于过滤掉无用图像的图像特性的示例是图像的模糊度、图像的亮度、以及图像是否包含文本。

例如，OCR应用、相机模块、或用户计算设备、或其他计算设备对图像执行模糊检测。图像可以被识别为模糊、过于明亮、过于暗、或者以阻止获得高分辨率图像的方式被模糊。响应于对模糊度的检测，OCR应用或者用户计算设备的其他功能或相机，可以调整图像捕获方法以降低图像中的模糊。例如，OCR应用可以引导相机调整金融卡上的焦点。在另一示例中，OCR应用可以引导用户移动相机靠近或者远离金融卡。在另一示例中，OCR应用可以执行数字图像操纵以去除模糊。可以利用校正模糊图像的任何其他方法。

OCR应用确定图像是否足够亮以用于OCR系统辨识文字同时不包含太亮的区域。例如，图像的一些部分可能具有适当的亮度而图像的另外部分可能由于闪光、反射或其他光源而具有亮点。OCR应用可能需要整个图像具有适当亮度。

OCR应用确定图像是否包含文本。OCR应用可以进一步确定文本是否位于图像的期望区域中。例如，OCR应用可以预测信用卡号应该在卡底部包含指示用户账号的数字行。OCR应用可以在图像上运行分类以确定文本是否有可能包含在图像的预测区域中。

每个要求的特征水平可以被配置成获取所需的结果。例如，图像中增加亮度通常等价于更好的图像质量，因此OCR系统将更可能获得可接受的结果。因此，可配置阈值以上的亮度水平应该不太可能产生具有低置信水平的OCR结果。为每个特征配置的阈值被配置为优化将有用图像传送到OCR系统的可能性。在另一示例中，越不模糊，以及越清晰，图像就越不可能被OCR系统拒绝。任何其他要求可以类似地被配置为产生不可能被OCR系统拒绝的图像。

如果要求被满足，则OCR应用上传要被OCR系统处理的图像。OCR应用可以经由网络上的互联网连接、文本、电子邮件、或任何合适方式来传送图像。

OCR系统接收经过滤的图像并且对图像执行OCR处理。

OCR系统可以修剪图像以只显示来自卡的所需的信息。在一示例中，如果图像中的卡是信用卡，则OCR系统访问与信用卡的账号的所期望位置相关联的信息。所期望的位置可以从存储在用户计算设备上或另外合适位置处的卡布局的数据库中获得。例如，信用卡、驾驶证、积分卡、以及其他卡通常满足对于数据位置和卡布局的工业标准。工业标准可以存储在OCR应用中或者存储在由OCR应用可访问的位置中。

OCR系统对卡图像应用OCR算法以身份卡上的信息。信息可以是数字、字符、或者其他数据或信息。信息的每个实例将被称为“数字”。OCR算法可以表示识别在卡图像上表示的数字的任何处理、程序、方法、或其他方式。OCR系统提取数字并且可以在用户计算设备的用户界面上显示所提取的数字。OCR系统可以将数字的组分类为诸如账号、用户名、到期日、卡发行商、或其他合适数据的类别。OCR系统可以通过比较数字组的格式与数据库的格式来将数字组进行分类。例如，如果对数字组的OCR算法的结果是“10/15”，则OCR系统可以将该格式解释为与过期日相关联。

OCR系统确定OCR处理的结果的置信水平。在一示例中，OCR系统可以通过确定前两个数字候选之间的置信水平之差来确定每个数字的置信水平。也就是说，OCR系统可以确定数字满足“1”的许多特性且评估得分为特定数字80％。OCR系统可以确定相同数字满足“7”的许多特性且评估得分为特定数字60％。然后，OCR系统可以基于两个数字得分之差来评估特定置信水平。

OCR系统可以基于各个数字的置信水平或得分来确定卡上所有数据的置信水平。例如，OCR系统可以对数字得分取平均值、对数字得分求和、或者对数字得分执行任何其他合适动作。在卡图像包括20个数字的示例中，OCR系统可以确定10个数字的准确度的置信水平是90％，以及其他10个数字的准确度的置信水平为80％。OCR系统可以执行置信水平的取平均值并且确定整体置信水平为85％。

OCR应用、用户、OCR系统、支付处理系统、或任何合适方，确定用于OCR算法的结果阈值置信水平。例如，用户可以输入要求到OCR系统，OCR系统必须产生具有数字有90％可能准确的置信水平的结果。

如果OCR算法的结果等于或大于所配置的阈值，则OCR系统供应所提取的数据到数字钱包应用模块、终端销售点、支付处理系统、网站、或用户希望的任何合适应用或系统。所提取的数据可以由用户计算设备上的应用所使用。所提取的数据可以经由网络上的互联网连接传送、经由近场通信(“NFC”)技术、电子邮件、文本或以任何合适方式传送。

如果OCR算法的结果低于所配置的阈值，则OCR系统可以从OCR应用获得新图像。例如，OCR应用可以访问来自存储在用户计算设备中或另一适当位置中的扫描中的附加图像。OCR应用可以访问来自相机的现场扫描中的额外图像。在另一示例中，OCR应用可以再次扫描卡并且捕获附加图像以供分析。可以利用任何其他合适方法来获得附加图像。

OCR应用使用这里所述的处理来过滤图像。在识别了满足要求的新图像后，OCR应用将该新图像传送到OCR系统用于处理。

OCR系统将OCR算法应用于新图像。OCR应用可以继续请求新图像和处理图像的处理，直到满足或超过置信水平阈值。OCR系统可以重复这里所述的方法达所配置的尝试次数。例如，OCR系统可以尝试为5或10个附加图像获得匹配结果。OCR系统或OCR应用可以随后拒绝结果或者提供进一步指令给用户。

示例系统架构

现在转到附图，其中相似附图标记在整个附图中表示相似(但不必相同)的元素，详细描述示例实施例。

图1是根据某些示例实施例的描绘过滤卡OCR图像的计算系统的框图。如图1中所描绘，系统100包括网络计算设备110、120、140和170，其被配置为互相经由一个或多个网络105进行通信。在一些实施例中，与设备相关联的用户101必须安装应用和/或进行特征选择以获得这里所述的技术的益处。

每个网络105包括有线或无线电信装置，网络设备(包括设备110、120、140和170)可以经由有线或无线电信装置来交换数据。例如，每个网络105可以包括局域网(“LAN”)、广域网(“WAN”)、内联网、互联网、移动电话网、或者上述任何组合。在示例实施例的整个讨论中，应该理解，术语“数据”和“信息”在此可以互换使用以指代文本、图像、音频、视频、或可以存在于基于计算机的环境中的任何其他形式的信息。

每个网络计算设备110、120、140和170包括具有能够在网络105上发射和接收数据的通信模块的设备。例如，每个网络设备110、120、140和170可以包括服务器、桌面型计算机、膝上型计算机、平板计算机、具有在其中嵌入一个或多个处理器和/或与之耦合的电视、智能电话、手持计算机、个人数字助理(“PDA”)、或者任何其他有线或无线的处理器驱动的设备。在图1中描绘的示例实施例中，网络设备110、120、140和170分别由终端用户或消费者、OCR系统操作者、支付处理系统操作者、以及卡发行运营商来操作。

用户101可以使用通信应用112，其可以是例如web浏览器应用或单机应用，来经由分布式网络105观看、下载、上传或以其他方式访问文档或网页。

用户计算设备110可以采用通信模块112与OCR系统120的web服务器124或其他服务器通信。通信模块112可以允许设备经由网络105以外的技术通信。示例可包括蜂窝网络、无线电网络、或者其他通信网络。

用户设备110可以包括数字钱包应用模块111。数字钱包应用模块111可以包含用户设备110用于帮助用户101完成购买的任何应用、硬件、软件或处理。数字钱包应用模块111可以与通信应用112交互或者体现为通信应用112的伴随应用。作为伴随应用，数字钱包应用模块111在通信应用112内执行。也就是说，数字钱包应用模块111可以是嵌入到通信应用112中的应用程序。

用户设备110可以包括光学字符识别(“OCR”)应用115。OCR应用115可以与通信应用112交互或者体现为通信应用112的伴随应用且在通信应用112内执行。在示例实施例中，OCR应用115可以附加地或替选地体现为数字钱包应用模块111的伴随应用且在数字钱包应用模块111内执行。OCR应用115可以采用可以在数字钱包应用111中打开或可以在通信应用112中打开的软件界面。该界面可以允许用户101配置OCR应用115。

OCR应用115可以用来分析卡以及从卡提取信息或其他数据。OCR系统120或开发OCR算法或其他方法的其他系统可以包括计算机可读程序指令集合，例如，使用JavaScript，其使得OCR系统120能够与OCR应用115交互。

说明书描述的由OCR应用115执行的任何功能可以由支付处理系统140、OCR系统120、用户计算设备110、数字钱包应用模块111、商业系统(未示出)或者任何其他合适硬件或软件系统或应用来执行。在示例中，用户计算设备110上的OCR应用115可以获得卡102的图像并将图像传送到OCR系统120以提取卡102上的信息。

用户设备110包括可由OCR应用115、web浏览器应用112或任何合适计算设备或应用访问的数据存储单元113。示例数据存储单元113可以包括一个或多个有形计算机可读介质。数据存储单元113可以存储在用户设备110上或者可以逻辑耦合到用户设备110。例如，数据存储单元113可以包括板上闪速存储器和/或一个或多个可移动存储卡或可移动闪速存储器。

用户设备110可以包括相机114。相机可以是用户计算设备110的获得数字图像的任何模块或功能。相机114可以是用户计算设备110板上的或者以任何方式逻辑连接到用户计算设备110。相机114可以能够获得单独的图像或视频扫描。任何其他合适图像捕获设备可以由相机114来表示。

支付处理计算系统140包括可由web服务器144访问的数据存储单元147。示例数据存储单元147可以包括一个或多个有形计算机可读存储设备。支付处理系统140可操作用于进行用户101和商家系统(未示出)之间的支付。支付处理系统140进一步可操作用于管理用户101的支付账户、保持数据库以存储商家系统和用户101的交易、验证交易、以及其他合适功能。

用户101可以使用支付处理系统140上的web服务器144经由网站(未图示)和通信网络105来观看、注册、下载、上传、或者以其他方式访问支付处理系统140。用户101将一个或多个注册的金融卡账户，包括银行账户借记卡、信用卡、礼品卡、积分卡、优惠券、出价、预付出价、商店奖励卡、或者可用于进行购买或兑换增值服务的其他类型的金融账户，与用户101的支付账户相关联。

诸如银行或其他机构的卡发行商可以是正在被注册的金融账户的发行商。例如，卡发行商可以是信用卡发行商、借记卡发行商、储值卡发行商、提供账户的金融机构、或者金融账户的任何其他提供商。支付处理系统140还可以用作相关联金融账户的发行商。用户101的注册信息被保存在支付处理系统140的数据存储单元147中且可以由网络服务器144来访问。卡发行商采用卡发行商计算系统170来发行卡、管理用户账户、以及执行任何其他合适功能。卡发行商系统170可以替选地发行用于识别、访问、验证、票务的卡或者用于任何合适目的的卡。卡发行商系统170可以采用web服务器177来管理用户账户并发行卡102。卡发行商系统170包括数据存储单元174。示例数据存储单元177可以包括一个或多个有形计算机可读介质。数据存储单元177可以存储在卡发行商系统170上或者可以逻辑上耦合到卡发行商系统170。例如，数据存储单元177可以包括板上闪速存存储器和/或一个或多个可移动存储卡或可移动闪速存储器。

OCR计算系统120利用OCR系统web服务器124，其操作产生、管理、存储、或保持OCR算法、方法、处理或服务的系统。OCR系统web服务器124可以表示OCR系统120用来向用户计算设备110、商家、或任何合适部分提供OCR服务的计算机实现的系统。OCR系统web服务器124可以经由任何可用技术来与一个或多个支付处理系统140、用户设备110、或其他计算设备通信。这些技术可以包括但将不限于，经由网络105的互联网连接、电子邮件、文本、即时消息传递、或者其他合适通信技术。OCR系统120可以包括可由OCR系统120的web服务器124访问的数据存储单元127。数据存储单元127可以包括一个或多个有形计算机可读存储设备。

说明书中描述的由OCR系统120执行的任何功能可以由OCR应用115、用户计算设备110、或者任何其他合适硬件或软件系统或应用来执行。

用户101可以在进行交易时采用卡102，所述交易诸如支付、购票入场、会员签到、或者其他合适交易。用户101可以获得卡信息以便将卡102所表示的账户输入到计算设备110的数字钱包应用模块111中或者用于其他数字账户目的。卡102通常是塑料卡，在卡102上包含账户信息和其他数据。在许多卡102实施例中，顾客姓名、到期日、以及卡号物理地凸印在卡102上。凸印的信息可从卡102的前后两面看到，尽管凸印的信息通常在卡102的背面是相反的。

将认识到，所示的网络连接是示例性的，其可以使用建立计算机和设备之间的通信链路的其他机制。此外，从本公开受益的本领域普通技术人员将认识到，图1中所图示的卡发行商系统170可以具有几个其他合适计算机系统配置中的任何一个。例如，体现为移动电话或手持计算机的用户设备110可以不包括所有上述组件。

示例处理

下文关于示例操作环境100的组件来描述图2-3中所图示的示例方法。图2-3的示例方法还可以利用其他系统或者在其他环境中执行。

图2是根据某些示例实施例的描绘过滤卡光学字符识别(“OCR”)图像的方法200的流程框图。

参考图1和2，在框205，用户设备110上的OCR应用115开始对卡102的数字扫描。扫描可以从用户计算设备110的相机模块114获得，诸如从移动电话上的相机114获得。扫描可以从耦合到用户计算设备110的任何数字图像设备或者任何其他合适数字成像设备获得。图像可以由用户计算设备110上的OCR应用115从用户存储设备110上的存储位置、从远程存储位置、或者从任何合适位置来访问。能够提供扫描的所有源都将被称为“相机”。

OCR应用115的功能可以由任何合适模块、硬件、软件或操作在用户计算设备110上的应用来执行。OCR应用115的一些或全部功能可以由远程服务器或诸如操作在OCR系统120中的服务器124的其他计算设备来执行。例如，用户计算设备110上的数字钱包应用模块111可以获得卡102的图像并且将该图像传送到OCR系统120以用于处理。在另一示例中，一些OCR功能可以由用户计算设备110进行，并且OCR功能中的一些可由OCR系统120或另一远程服务器来进行。这里提供的示例可以指示许多功能由用户计算设备110上的OCR应用115执行，但是一些或全部功能可以由任何合适计算设备来执行。

卡102的图像呈现在用户计算设备110的用户界面上，例如作为卡102的现场视频图像。OCR应用115可以隔离并存储来自相机114的视频馈送的一个或多个图像。OCR应用115可以将对卡102的扫描存储为视频或包括卡102的多个图像的其他合适格式。例如，用户101可以在金融卡102上方悬停用户计算设备110的相机114且在用户计算设备110的用户界面上观察金融卡102的表现。用户101可以开动用户计算设备110上的真实或虚拟按钮以捕获优选图像、图像组、或数字扫描。OCR应用115可以自动地选择优选的图像。

在某些示例中，所述的一些或全部功能是在扫描是活动的时执行的。例如，用户101可以在卡上方悬停用户计算设备110的相机114且利用卡102的现场图像来执行这里所述的方法。也就是，OCR应用115捕获并利用来自相机114的活动馈送的图像。

在图4中呈现在用户计算设备110上显示的卡102的图示。

图4是根据某些示例实施例的显示积分卡的图像的用户计算设备110的图示。用户计算设备110被示出为移动智能电话。用户计算设备110被示出具有显示屏405作为用户界面。当用户101正在捕获卡102的图像时，卡102被示出显示在用户计算设备110上。

返回到图2，在框210，OCR应用115隔离卡102的图像以用于过滤。经隔离的图像可以从对卡102的扫描中提取。图像可以从存储的扫描或从卡102的现场扫描中提取。OCR应用115可以隔离卡102的第一图像。替选地，OCR应用115可以在相机114已经稳定了所配置的时间段之后隔离图像。替选地，OCR应用115可以在用户101提供指示之后隔离图像。OCR应用115根据任何配置的过程来隔离来自扫描的任何单个图像。

在框215，OCR应用115确定图像是否满足要被发送到OCR系统120用于进行OCR处理的要求集合。在图3的方法215中更加详细地描述框215。

图3是根据某些示例实施例的描绘用于确定图像是否满足过滤要求的方法215的流程框图。

在框305，OCR应用115评估图像质量和内容。对于图像质量的每个要求的特征水平可被配置成获取所需结果。例如，图像中增加亮度通常等价于更好的图像质量，因此OCR系统120将更可能获得可接受的结果。因此，可配置的阈值之上的亮度水平应该不太可能产生具有低置信水平的OCR结果。为每个特征配置的阈值被配置为优化将有用图像传送到OCR系统120的可能性。在另一示例中，越不模糊，以及越清晰，图像就越不可能被OCR系统120拒绝。任何其他要求可以类似地被配置为产生不可能被OCR系统120拒绝的图像。

在示例中，OCR应用115、相机模块114、或者用户计算设备110、或者其他计算设备，对图像执行模糊检测。图像可以被识别为模糊、过于明亮、过于暗、或者以阻止获得高分辨率图像的方式而被模糊。模糊检测可以由能够确定图像清晰度的任何图像处理程序、应用、或算法来执行。

在示例中，OCR应用115检测图像的亮度。OCR应用115确定图像是否足够亮以用于OCR系统120辨识文本同时不包含太亮的区域。例如，图像的一些部分可能具有适当亮度而图像的另一部分可能由于闪光、反射或其他光源而具有亮点。OCR应用115可以采用任何硬件或软件方法或处理来确定图像的亮度。

在示例中，OCR应用115确定在图像中是否指示文本。OCR应用115可以进一步确定文本是否位于图像的期望区域中。例如，OCR应用115可以预测信用卡号应该在卡底部包含指示用户账号的数字行。OCR应用115可以在图像上运行分类以确定文本是否有可能包含在图像的预测区域中。分类可以是将图像的边缘、行、或其他特性进行分类的任何算法或程序，所述图像可以指示文本。分类器可以确定图像的给定部分包含可能是文本的行。

OCR应用115可以确定分类结果的置信水平。例如，OCR应用115确定分类器指示图像包括适当量文本的可能性为80％。OCR应用115确定该置信水平是否大于所配置的阈值。

任何其他合适过滤要求可以被OCR应用115所利用。过滤要求可以与阻止传送可能被OCR系统120拒绝的图像的任何图像特征相关。

在框310，OCR应用115确定清晰度是否可接受。如果模糊的量低于阈值且图像被预测为足够清楚能够被OCR系统120接受的话，则方法215前进的框315。如果图像过于模糊，则方法215返回到图2的框210。

在框315，OCR应用115确定亮度是否可接受。如果亮度在最小和最大阈值内且图像被预测为足够亮能够被OCR系统120接受的话，则方法215前进到框320。如果图像过于亮、不够亮、包含亮点、或者以其他方式不可接受，则方法215返回到图2的框210。

在框320，OCR应用115确定在图像中是否指示文本。如果文本的量和/或位置被确定的概率低于阈值，则方法215前进到图2的框220。如果图像包含适当量文本的概率低于阈值，则方法215返回到图2的框210。

当方法215返回到框210时，OCR应用115隔离卡102的附加图像，如这里所述。附加图像被过滤，如方法215中所述。处理可以重复，直到图像被分析且确定满足要求。可接受的图像随后被传送到OCR系统120。在某些实施例中，OCR应用115经由用户设备110的用户界面通知用户101、相机114、或任何合适实体失败的原因。例如，如果图像被确定为模糊，则OCR应用115可以请求用户101调整相机114的位置。OCR应用115可以请求相机114调整卡102上的焦点。可以由OCR应用115发出任何合适请求或建议以改善后续图像。

返回到图2，在框220，OCR应用115将满足要求的图像传送到OCR系统120。OCR应用115可以经由网络上的互联网连接、文本、电子邮件、或任何合适方式来传送图像。

在框225，OCR系统120将OCR算法应用于图像。OCR系统120可以修剪图像以只显示来自卡102的所需信息。例如，如果图像中的卡102是信用卡，则OCR应用115访问与信用卡的账号的期望位置相关联的信息。期望位置可以从存储在用户计算设备110上或另一合适位置处的卡布局的数据库中获得。信用卡、驾驶卡、积分卡、和其他卡通常满足用于数据位置和卡布局的工业标准。工业标准可以存储在OCR系统120中或者可由OCR系统120访问的位置中。在某些环境下，数据位置可以由卡102的发行商来提供。

卡上的信息可以是数字、字符、或者其他数据或信息。信息或数据的每个实例将被称为“数字”。OCR算法可以表示识别在卡图像上所表示的数字的任何处理、程序、方法或其他形式。组可以被分类为诸如账号、用户名、到期日、卡发行商、或其他合适数据的类别。OCR系统120可以通过比较数字组的格式与数据库格式而将数字组分类。例如，如果OCR系统120对于数字组的结果为“10/15”，则OCR系统120可以将该格式解释为与到期日相关联。

在框230，OCR应用115将应用OCR算法的结果的置信水平与阈值相比较。在示例中，OCR系统120可以通过确定前两个数字候选之间的置信水平之差来确定每个数字的置信水平。也就是，OCR系统120可以确定数字满足“1”的许多特征且评定得分为特定数字80％。OCR系统120可以确定相同数字满足“7”的许多特性且评定得分为特定数字60％。然后，OCR系统120可以基于两个数字得分之差来评定特定置信水平。

OCR系统120可以基于各个数字的置信水平或得分来确定卡102上所有数据的置信水平。可以使用评定置信水平的任何方式。例如，OCR应用115可以使用机器学习算法来确定数字正确的可能性。机器学习算法可以由用户101、或OCR系统120的操作者、或任何合适人来利用结果的一些或所有验证或修正来更新。

例如，OCR系统120可以对数字得分取平均值、对数字得分求和、或者对数字得分执行任何其他合适动作。在卡图像包括20个数字的示例中，OCR系统120可以确定10个数字的准确度的置信水平为90％，以及其他10个数字的准确度的置信水平为80％。OCR系统120可以执行置信水平的取平均值且确定总体置信水平为85％。

OCR应用115、用户101、OCR系统120、支付处理系统、或者任何合适方，确定用于OCR算法115的结果的阈值置信水平。例如，用户101可以输入要求到OCR系统120中，OCR系统120必须产生90％可能准确的结果。

方法200确定OCR算法的结果的置信水平等于或大于所配置的阈值。如果结果等于或大于所配置的阈值，则方法200前进到框235。如果结果低于所配置的阈值，则方法200前进到框210。

当方法200返回到框210时，OCR应用115隔离卡102的附加图像，如这里所述。如方法215中所述，附加图像被过滤且新图像被传送到OCR系统120以用于处理。处理可以被重复，直到图像被确定满足置信水平阈值。

返回到框235，OCR系统120供应所提取的数据到OCR应用115、数字钱包应用模块111、销售终端点、支付处理系统140、网站、或用户101希望的任何合适应用或新系统。所提取的数据可以由用户计算设备110上的应用所使用。所提取的数据可以经由网络105上的互联网连接、经由近场通信(“NFC”)技术、电子邮件、文本或以任何合适方式传送。

其他示例实施例

图5描绘根据某些示例实施例的计算机器2000和模块2050。计算机器2000可以与各个计算机、服务器、移动设备、嵌入式系统、或者这里所呈现的计算系统中的任何一个相对应。模块2050可以包括配置成帮助计算机器2000执行这里所呈现的各种方法和处理功能一个或多个硬件或软件元件。计算机器2000可以包括诸如处理器2010、系统总线2020、系统存储器2030、存储介质20040、输入/输出接口2060、以及用来与网络2080通信的网络接口2070的各种内部组件或附接组件。

计算机器2000可以实现为常规计算机系统、嵌入式控制器、膝上型计算机、服务器、移动设备、智能电话、机顶盒、自助售货机、车辆信息系统、与电视相关联的一个或多个处理器、定制机器、任何其他硬件平台、或者其任何组合或多样性。计算机器2000可以是被配置成使用经由数据网络或总线系统互连的多个计算机器而起作用的分布式系统。

处理器2010可以被配置为执行代码或指令来执行这里所述的操作和功能、管理请求流和地址映射、并且执行计算并生成命令。处理器2010可以被配置成监视和控制计算机器2000中组件的操作。处理器2010可以是通用处理器、处理器核心、多处理器、可重新配置的处理器、微控制器、数字信号处理器(“DSP”)、专用集成电路(“ASIC”)、图形处理单元(“GPU”)、现场可编程门阵列(“FPGA”)、可编程逻辑设备(“PLD”)、控制器、状态机、门控逻辑、分立式硬件组件、任何其他处理单元、或者其任意组合或多样性。处理器2010可以是单个处理单元、多个处理单元、单个处理核新、多个处理核心、专用处理核心、协同处理器、或者其任何组合。根据某些示例实施例，处理器2010以及计算机器2000的其他组件可以是在一个或多个其他计算机器内执行的虚拟计算机器。

系统存储器2030可以包括非易失性存储器，诸如只读存储器(“ROM”)、可编程只读存储器(“PROM”)、可擦除可编程只读存储器(“EPROM”)、闪速存储器、或者能够在有电或没电情况下存储程序指令或数据的任何其他设备。系统存储器2030还可以包括易失性存储器，诸如随机存取存储器(“RAM”)、静态随机存取存储器(“SRAM”)、动态随机存取存储器(“DRAM”)、以及同步动态随机存取存储器(“SDRAM”)。也可以用其他类型的RAM实现系统存储器2030。系统存储器2030可以使用单个存储器模块或多个存储器模块来实现。尽管系统存储器2030被描绘为计算机器2000的一部分，本领域技术人员将认识到，在没有背离主题技术范围的情况下，系统存储器2030可以独立于计算机器2000。还应该认识到，系统存储器2030可以包括诸如存储介质2040的非易失性存储设备，或者结合诸如存储介质2040的非易失性存储设备而操作。

存储介质2040可以包括硬盘、软盘、压缩盘只读存储器(“CD-ROM”)、数字多功能盘(“DVD”)、蓝光盘、磁带、闪速存储器、其他非易失性存储器设备、固态驱动器(“SSD”)、任何磁存储设备、任何光存储设备、任何电存储设备、任何半导体存储设备、任何基于实体的存储设备、任何其他数据存储设备、或者任何其组合或多样性。存储介质2040可以存储一个或多个操作系统、应用程序和诸如模块2050的程序模块、数据、或任何其他信息。存储介质2040可以是计算机器2000的一部分或者连接到计算机器2000。存储介质2040还可以是与计算机器2000通信的诸如服务器、数据库服务器、云存储、附接网络的存储等的一个或多个其他计算机器的一部分。

模块2050可以包括被配置为帮助计算机器2000执行这里呈现的各种方法和处理功能的一个或多个硬件或软件元件。模块2050可以包括与系统存储器2030、存储介质2040或二者相关联作为软件或固件存储的一个或多个指令序列。存储介质2040因此可以表示在其上可以存储用来由处理器2010执行的指令或代码的机器或计算机可读介质的示例。机器或计算机可读介质可以通常指的是用来提供指令给处理器2010的任何媒介或介质。与模块2050相关联的这样的机器或计算机可读介质可以包括计算机软件产品。应该认识到，包括模块2050的计算机软件产品还可以与经由网络2080、任何信号承载媒介、或者任何其他通信或递送技术来递送模块2050到计算机器2000的一个或多个处理或方法相关联。模块2050还可以包括硬件电路或用于配置硬件电路的信息，诸如用于FPGA或其他PLD的微代码或配置信息。

输入/输出(“I/O”)接口2060可以被配置成耦合到一个或多个外部设备，以从一个或多个外部设备接收数据，以及发送数据到一个或多个外部设备。这样的外部设备以及各种内部设备还可以被称为外围设备。I/O接口2060可以包括电气和物理连接二者以用于操作地将各种外围设备耦合到计算机器2000或处理器2010。I/O接口2060可以被配置成传递数据、地址、以及外网设备、计算机器2000或处理器2010之间的控制信号。I/O接口2060可以被配置成实现任何标准接口，诸如小型计算机系统接口(“SCSI”)、串行连接SCSI(“SAS”)、光纤通道、外围组件互连(“PCI”)、PCIexpress(PCIe)、串行总线、并行总线、先进技术附连(“ATA”)、串行ATA(“SATA”)、通用串行总线(“USB”)、Thunderbolt、火线、各种视频总线等。I/O接口2060可以被配置为只实现一个接口或总线技术。替选地，I/O接口2060可以被配置为实现多个接口或总线技术。I/O接口2060可以被配置作为系统总线2020的一部分或全部或者结合系统总线2020而操作。I/O接口2060可以包括一个或多个缓冲器，用于缓冲一个或多个外部设备、内部设备、计算机器2000或处理器2010之间的传输。

I/O接口2060可以将计算机器2000耦合到各种输入设备，包括鼠标、触摸屏、扫描仪、电子数字转换器、传感器、接收器、触摸板、轨迹球、相机、麦克风、键盘、任何其他指示设备，或者任何组合。I/O接口2060可以将计算机器2000耦合到各种输出设备，包括视频显示器、扬声器、打印机、投影仪、触觉反馈设备、自动控制、机器人组件、致动器、电机、风扇、螺线管、阀门、泵、发射器、信号发射器、光源等等。

计算机器2000可以在联网环境中操作，其使用通过网络接口2070与跨网络2080的一个或多个其他系统或计算机器的逻辑连接。网络2080可以包括广域网(WAN)、局域网(LAN)、内联网、互联网、无线接入网、有线网、移动网、电话网、光网、或者其组合。网络2080可以是分组交换、电路交换、具有任何拓扑且可以使用任何通信协议。网络2080内的通信链路可以涉及各种数字或模拟通信介质，诸如光纤电缆、自由空间光缆、波导、电导体、无线链路、天线、射频通信等等。

处理器2010可以通过系统总线2020连接到计算机器2000的其他元件或者这里讨论的各种外围设备。应该认识到，系统总线2020可以在处理器2010内、在处理器2010外、或者二者均可。根据一些实施例，处理器2010、计算机器2000的其他元件、或者这里讨论的各种外围设备中的任何一个可以被集成到诸如芯片上系统(“SOC”)、封装上系统(“SOP”)或ASIC设备的单个设备中。

在这里讨论的系统收集有关用户的个人信息，或者可能利用个人信息的情况下，用户可以被提供机会来控制程序或特征是否收集用户信息(例如，有关用户社交网络、社交行为或活动、职业、用户偏好、或用户当前位置的信息)，或者控制是否和/或怎样从内容服务器接收可能与用户更加相关的内容。此外，某些数据在其被存储或使用之前可能通过一种或多种方式来处理，使得个人可识别的信息被移除。例如，用户的身份可能被处理使得没有用户的个人可识别信息可以被确定，或者获得位置信息的用户的地理位置可以被一般化(诸如到城市、邮编、或州一级)，使得用户的具体位置不能被确定。因此，用户可以对怎样收集有关用户的信息以及怎样由内容服务器使用该信息进行控制。

实施例可以包括体现这里描述和图示的功能计算机程序，其中，计算机程序被实现在包括在机器可读介质中存储的指令和执行指令的处理器的计算机系统中。但是，应该明白的是，可以由许多不同方式用计算机编程来实现实施例，且实施例不应该被解释为限制于计算机程序指令的任何一个集合。进一步，熟练程序员将能够基于所附流程图和申请文本中的相关描述来编写出这样的计算机程序来实现所公开实施例中的实施例。因此，程序代码指令的特定集合的公开不被认为是对怎样做出和使用实施例的充分理解所必需的。进一步，本领域技术人员将认识到，这里所述的实施例的一个或多个方面可以由硬件、软件或其组合来执行，如可以体现在一个或多个计算系统中。而且，对由计算机执行的动作的任何引用都不应该被解释为由单个计算机来执行，因为一个以上的计算机可以执行该动作。

可以利用执行这里所述的方法和处理功能的计算机硬件和软件来使用这里描述的示例实施例。这里描述的系统、方法和流程可以体现为可编程计算机、计算机可执行软件、或数字电路。软件可以存储在计算机可读介质上。例如，计算机可读介质可以包括软盘、RAM、ROM、硬盘、可移动介质、闪速存储器、记忆棒、光介质、磁光介质、CD-ROM等等。数字电路可以包括集成电路、门阵列、构建块逻辑、现场可编程门阵列(FPGA)等等。

前面呈现的实施例中所述的示例系统、方法和动作是说明性的，并且在替选实施例中，在不背离各种实施例的范围和精神的情况下，某些动作可以以不同次序、互相并行、整个忽略、和/或在不同示例实施例之间组合来执行，和/或某些附加动作可以被执行。因此，这样的替选实施例包括在这里所要求保护的发明中。

尽管上面已经详细描述了特定实施例，说明书仅仅用于说明性用途。因此，应该认识到，上述许多方面并非旨在是要求或必须的元素，除非明确陈述。除了上面描述的之外，公开示例实施例的方面的修改、以及相对应的等同元件或动作，都可以由从本公开中受益的本领域普通技术人员在不背离权利要求所限定的实施例的精神和范围的情况下做出，上述范围符合最宽泛解释由此包含这样的修改和等同结构。

Claims

1.一种用于过滤图像的计算机实现的方法，包括：

由一个或多个计算设备接收卡的数字扫描；

由所述一个或多个计算设备从所述卡的数字扫描获得所述卡的第一图像；

由所述一个或多个计算设备分析所述第一图像的特征，以确定所述第一图像是否有可能能够被光学字符识别算法使用；

响应于确定所述第一图像有可能是能够被使用的，由所述一个或多个计算设备将所述第一图像传送到与所述光学字符识别算法相关联的光学字符识别系统；

响应于确定所述第一图像不可能是能够被使用的，由所述一个或多个计算设备从所述卡的数字扫描获得所述卡的第二图像；以及

由所述一个或多个计算设备分析所述第二图像的特征，以确定所述第二图像是否有可能能够被所述光学字符识别算法使用。

2.如权利要求1所述的计算机实现的方法，进一步包括：响应于确定所述第二图像有可能是能够被使用的，由所述一个或多个计算设备将所述第二图像传送到与所述光学字符识别算法相关联的光学字符识别系统。

3.如权利要求1所述的计算机实现的方法，其中，一旦由所述一个或多个计算机设备从所述光学字符识别系统接收到关于所述光学字符识别算法产生了低于所配置的阈值置信水平的结果的指示，就获得所述第二图像。

4.如权利要求1所述的计算机实现的方法，其中，所述分析的步骤包括：

由所述一个或多个计算设备检测所述图像中的模糊；以及

一旦确定在所述图像中检测到的模糊的量低于所配置的阈值，就由所述一个或多个计算设备确定所述图像有可能能够被光学字符识别算法使用。

5.如权利要求1所述的计算机实现的方法，其中，所述分析的步骤包括：

由所述一个或多个计算设备检测所述图像中的亮度水平；以及

一旦确定在所述图像中检测到的所述亮度水平在所配置的阈值之间，就由所述一个或多个计算设备确定所述图像有可能能够被光学字符识别算法使用。

6.如权利要求1所述的计算机实现的方法，其中，所述分析的步骤包括：

由所述一个或多个计算设备检测所述图像中的文本；以及

一旦确定在所述图像中检测到的文本的量高于所配置的阈值，就由所述一个或多个计算设备确定所述图像有可能能够被光学字符识别算法使用。

7.如权利要求5所述的计算机实现的方法，进一步包括：一旦确定在所述图像中检测到的文本处于所述图像中与所配置的期望位置相对应的位置，就由所述一个或多个计算设备确定所述图像有可能能够被光学字符识别算法使用。

8.如权利要求1所述的计算机实现的方法，其中，所述卡是信用卡、借记卡、身份卡、积分卡、接入卡、或储值卡。

9.一种计算机程序产品，包括：

具有其上所体现的计算机可执行程序指令的非暂时性计算机可读存储设备，所述计算机可执行程序指令当由计算机执行时，致使所述计算机过滤图像，包括：

用于接收卡的数字扫描的计算机可读程序指令；

用于从所述卡的数字扫描获得所述卡的第一图像的计算机可读程序指令；

用于分析所述第一图像的特征以确定所述第一图像是否有可能能够被光学字符识别算法使用的计算机可读程序指令；

用于响应于确定所述第一图像有可能是能够被使用的而将所述第一图像传送到与所述光学字符识别算法相关联的光学字符识别系统的计算机可读程序指令；

用于响应于确定所述第一图像不可能是能够被使用的而从所述卡的数字扫描获得所述卡的第二图像的计算机可读程序指令；以及

用于分析所述第二图像的特征以确定所述第二图像是否有可能能够被所述光学字符识别算法使用的计算机可读程序指令。

10.如权利要求9所述的计算机程序产品，其中，一旦从所述光学字符识别系统接收到关于所述光学字符识别算法产生了低于所配置的阈值置信水平的结果的指示，就获得所述第二图像。

11.如权利要求9所述的计算机程序产品，其中，所述分析的步骤包括：

用于检测所述图像中的模糊的计算机可读程序指令；以及

用于一旦确定在所述图像中检测到的模糊的量低于所配置的阈值、就确定所述图像有可能能够被光学字符识别算法使用的计算机可读程序指令。

12.如权利要求9所述的计算机程序产品，其中，所述分析的步骤包括：

用于检测所述图像中的亮度水平的计算机可读程序指令；以及

用于一旦确定在所述图像中检测到的亮度水平在所配置的阈值之间、就确定所述图像有可能能够被光学字符识别算法使用的计算机可读程序指令。

13.如权利要求9所述的计算机程序产品，其中，所述分析的步骤包括：

用于检测所述图像中的文本的计算机可读程序指令；以及

用于一旦确定在所述图像中检测到的文本的量高于所配置的阈值、就确定所述图像有可能能够被光学字符识别算法使用的计算机可读程序指令。

14.如权利要求13所述的计算机程序产品，进一步包括：致使所述系统一旦确定在所述图像中检测到的文本处于所述图像中与所配置的期望位置相对应的位置、就确定所述图像有可能能够被光学字符识别算法使用的计算机可读程序指令。

15.一种用于过滤图像的系统，所述系统包括：

存储资源；

通信地耦合到所述存储资源的处理器，其中，所述处理器被配置为执行存储在所述存储资源中的计算机可读指令，所述计算机可读指令致使所述系统：

从卡的数字扫描获得所述卡的第一图像；

分析所述第一图像的特征以确定所述第一图像是否有可能能够被光学字符识别算法使用；

响应于确定所述第一图像有可能是能够被使用的，将所述第一图像传送到与所述光学字符识别算法相关联的光学字符识别系统；

响应于确定所述第一图像不可能是能够被使用的，从所述卡的数字扫描获得所述卡的第二图像；以及

分析所述第二图像的特征，以确定所述第二图像是否有可能能够被所述光学字符识别算法使用。

16.如权利要求15所述的方法，其中，一旦从所述光学字符识别系统接收到关于所述光学字符识别算法产生了低于所配置的阈值置信水平的结果的指示时，就获得所述第二图像。

17.如权利要求15所述的系统，其中，所述分析步骤包括计算机可读指令，所述计算机可读指令致使所述系统：

检测所述图像中的模糊；以及

一旦确定在所述图像中检测到的模糊的量低于所配置的阈值，就确定所述图像有可能能够被光学字符识别算法使用。

18.如权利要求15所述的系统，其中，所述分析步骤包括计算机可读指令，所述计算机可读指令致使所述系统：

检测所述图像中的亮度水平；以及

一旦确定在所述图像中检测到的亮度水平在所配置的阈值之间，就确定所述图像有可能能够被光学字符识别算法使用。

19.如权利要求15所述的系统，其中，所述分析步骤包括计算机可读指令，所述计算机可读指令致使所述系统：

检测所述图像中的文本；以及

一旦确定在所述图像中检测到的文本的量高于所配置的阈值，就确定所述图像有可能能够被光学字符识别算法使用。

20.如权利要求19所述的方法，进一步包括计算机可读指令，所述计算机可读指令致使所述系统：一旦确定在所述图像中检测到的文本处于所述图像中与所配置的期望位置相对应的位置，就确定所述图像有可能能够被光学字符识别算法使用。