CN110222687A - 复杂背景卡面信息识别方法及系统 - Google Patents

复杂背景卡面信息识别方法及系统 Download PDF

Info

Publication number
CN110222687A
CN110222687A CN201910468824.4A CN201910468824A CN110222687A CN 110222687 A CN110222687 A CN 110222687A CN 201910468824 A CN201910468824 A CN 201910468824A CN 110222687 A CN110222687 A CN 110222687A
Authority
CN
China
Prior art keywords
character information
image
character
block
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910468824.4A
Other languages
English (en)
Other versions
CN110222687B (zh
Inventor
陈果
李扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay com Co Ltd
Alipay China Network Technology Co Ltd
Original Assignee
Alipay China Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay China Network Technology Co Ltd filed Critical Alipay China Network Technology Co Ltd
Priority to CN201910468824.4A priority Critical patent/CN110222687B/zh
Publication of CN110222687A publication Critical patent/CN110222687A/zh
Application granted granted Critical
Publication of CN110222687B publication Critical patent/CN110222687B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本申请提供一种复杂背景卡面信息识别方法及系统。该方法包括:针对待识别卡面,基于复杂背景卡面的制作标准,初步定位字符信息所在区域;根据初步定位的字符信息所在区域,按照预设方向顺序进行检测,确定单个字符信息所在位置,并获取相应位置的字符信息图像;其中,每个字符信息图像对应一个单独的字符,且字符信息图像为:未进行前景与背景分割的卡图像区域;对获取的所述字符信息图像进行特征提取;根据所提取的特征,识别所述字符信息图像中的字符信息。

Description

复杂背景卡面信息识别方法及系统
技术领域
本申请涉及图像处理领域,尤其涉及一种复杂背景卡面信息识别方法及系统。
背景技术
随着互联网的发展,在线支付、手机支付等快捷支付已经越来越普遍。在此期间,需要银行卡用户直接输入卡信息的情况越来越多。使用图像捕捉设备获取银行卡卡面信息,辅助信息快速录入也已成为潮流趋势。
目前,光学字符识别技术可用于解码使用包括但不限于扫描仪和数码相机在内的各种类型的图像捕捉设备获得的诸如水平的文本行之类的字符的图像,用于读取银行卡卡片表面所印制之信息,如卡号,有效期,持卡人姓名及银行卡发卡组织等。光学字符识别方法,其基本计算流程为图像前景背景分割、二值化、细化、编码与识别。由于具有单调背景假设,传统的光学字符识别系统中,文字前景与背景的分割比较简便;在提取出的文字前景可进行二值化、细化、编码而后进行识别,整体上计算比较简便,计算量少。然而,此类方法主要适用于单调背景的文本识别,无法识别出复杂背景中的字符。因而,基于传统光学字符识别原理的识别技术有很大的局限性,其局限性主要是基于识别结果可靠程度比较低,其次传统光学字符识别方法主要针对单调背景文本文件设计,无法有效应用于通常具有复杂背景图案的银行卡的卡面信息识别,用户需要花费较多精力检查、校正识别结果,以保证所保存信息的正确性。
因此,需求一种能够从复杂背景卡面图像中准确识别出卡面信息的技术。
发明内容
本申请的主要目的在于提供一种复杂背景卡面信息识别方法及其系统,以解决实现复杂卡面背景下(如银行卡)的信息准确识别的问题。
根据本申请的一个方面的实施例,提供一种复杂背景卡面信息识别方法,包括:针对待识别卡面,基于复杂背景卡面的制作标准,初步定位字符信息所在区域;根据初步定位的字符信息所在区域,按照预设方向顺序进行检测,确定单个字符信息所在位置,并获取相应位置的字符信息图像;其中,每个字符信息图像对应一个单独的字符,且字符信息图像为:未进行前景与背景分割的卡面图像区域;对获取的所述字符信息图像进行特征提取;根据所提取的特征,识别所述字符信息图像中的字符信息。
根据本申请的另一方面的实施例,提供一种复杂背景卡面信息识别系统,包括:粗略定位单元,针对待识别卡面,基于复杂背景卡面的制作标准,初步定位字符信息所在区域;准确定位单元,根据初步定位的字符信息所在区域,按照预设方向顺序进行检测,确定单个字符信息所在位置,并获取相应位置的字符信息图像;其中,每个字符信息图像对应一个单独的字符,且字符信息图像为:未进行前景与背景分割的卡面图像区域;第一特征提取单元,对获取的所述字符信息图像进行特征提取;字符信息识别单元,根据所提取的特征,识别所述字符信息图像中的字符信息。
与现有技术相比,本申请提供一种基于复杂图像特征如Harris、SIFT特征、适用于复杂背景的卡面信息识别方法及其系统,克服了传统基于阈值分割的方法所面临的无法对复杂背景卡面信息进行有效准确识别的缺陷,提升了卡面信息识别准确度,实现高效率的复杂背景卡面信息的识别。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请一个实施例的复杂背景卡面信息识别方法的主要流程图;
图2是本申请一个实施例的识别方法中优选的预处理方法的流程图;
图3是本申请一个实施例的预处理方法中特征提取计算方式示意图;
图4是本申请一个实施例的识别方法中优选的字符定位方法的流程图;
图5是本申请一个实施例的字符定位方法中图像匹配滑动方向顺序图;
图6是本申请一个实施例的识别方法中优选的判断识别方法流程图;
图7是本申请一个实施例的复杂背景卡面信息识别系统的结构框图。
具体实施方式
本申请的主要思想在于基于复杂图像特征的、适用于复杂背景的卡面信息识别,其应用复杂图像特征如Harris与SIFT特征,通过采集大量经标记数据样本训练分类器如支持向量机、人工神经网络等获得训练后的具有能进行识别的一系列参数数据的分类器(以下称为识别器),该识别器被用于匹配通过上述识别器分割出的字符图像区域以获得相应的字符信息,从而解决了传统基于阈值分割的方法所面临的无法识别复杂背景信息的问题。
为使本申请的目的、技术方案和优点更加清楚,以下结合附图及具体实施例,对本申请作进一步地详细说明。
本申请并不做图片前景、背景分割,直接使用待识别字符候选区域整体作为文字前景计算其特征向量,并使用机器学习方法训练分类器以获得识别器;同时,为获得准确的字符候选区域,本申请的计算中需进行多次识别,且所使用的图像特征较大,计算相对复杂因而对运行平台的要求比较高。
图1示出了本申请一个实施例的复杂背景卡面信息识别方法的主要流程图100。
步骤S110,输入待识别的具有复杂背景卡片的卡面图像。
通常利用图像捕捉装置如摄像头、照相机、扫描仪等获取待识别的对象(如银行卡)的卡面图像。这些具有复杂背景的卡面图像上,有各种需要录入的信息,主要是字符信息,包括:数字、字母、文字、其他各种字符。
步骤S120,在该卡面图像上,定位关心信息/待识别的字符信息(如卡片的各种信息:卡号、数字、日期、姓名等等)的图像区域。
可以经过粗略定位到精确定位(或叫准确定位)的过程。
例如,定位待识别的银行卡的卡面图像上的字符(包括数字、卡号、文字等)信息所在的区域。
这里可以根据卡片,如银行卡制作标准,对银行卡卡号区域、有效日期区域、持卡人姓名区域等这些包括字符(数字、卡号)的区域,进行初步定位,如优选字符信息定位方法400所提及的粗略定位。
然后再进行准确定位,例如基于卡面纹理信息在初步定位结果周边进行快速进一步精确定位,从而获得卡面字符信息区域的准确定位。优选地,可以采用字符信息定位方法400提及的准确定位方式实现,其甚至能在精确定位过程中获得单个字符信息区域对应的字符信息图像。
步骤S130,基于对卡面图像上的字符信息区域的定位,对待识别的字符信息图像中的字符信息进行识别。
卡面信息主要是各种字符信息包括文字(如持卡人姓名、有效日期)、数字(如银行卡的卡号、日期号码)等。主要如下:
第一,获得单个的字符信息图像(每个单独的字符信息的图像)。
一种方式是在准确定位字符信息区域后,对于不同字符信息区域,可以进行字符信息的分割。分割方式例如:可以将卡号信息区域分割成21个子区域作为卡号备选区域、可以将有效日期区域分为月份和年份(月份与年份信息用反斜杠“/”分割)、可以将持卡人姓名分出其各个英文字母。这样能确定单个的字符信息区域,并获取单个的字符信息图像。
优选的另一种方式,可以在定位时就获得字符信息图像,例如:通过下述字符信息定位步骤400,定位出每个字符信息的准确位置,并在该准确定位过程中,就获得单个的字符信息图像,并将一系列的单个的字符信息图像提供以备识别使用。由此,可以接收已经获得的每个单独的字符信息图像。
第二,对获得的一系列字符信息图像(一系列单个的字符信息的图像),进行特征提取,优选地,可以采用下述预处理方法200中的特征提取方式,如对24*24像素标准图像的8*8像素逐点计算,获得如Harris等角点特征、SIFT有旋转不变性的特征(即复杂特征向量)。
第三,再根据这些特征(复杂特征向量),利用已经预先训练分类器得到的识别器,来进行判断以识别出对应图像区域中的字符信息。可以通过机器学习算法(神经网络、支持向量机SVM等分类器)预先对字符数据库进行训练,得到识别器(即带参数数据的分类器或称字符分类器),通过提取字符显著特征如上述Harris、SIFT等复杂特征向量,用识别器进行分类识别判断从而识别出字符信息。优选地,如利用下述优选的预处理方法200及字符信息的判断识别方法600。
步骤S140,对识别出的结果进行验证,采用算法来校验经识别器判断识别出的字符信息。优选地,对于银行卡卡片来说,可以使用银行卡卡号编码普遍采用的Luhn模十校验算法校验例如判断识别方法600中识别出的卡号以确认最终识别结果。校验成功则输出最终结果。校验失败时还可以提供出错信息。
如图2所示,为复杂背景卡面信息识别方法中可采用的优选预处理方法流程图200。
采集步骤S210,预先采集大量的图像数据样本并对这些图像数据样本进行分割和标记。由此能获得大量的分类好的单独的字符信息图像(样本图像)。
在对输入的待识别的图像上的信息进行识别之前,需要进行预处理,以便获得能对待识别的信息进行识别的样本(字符信息样本)数据库以及识别器(训练后带参数数据的分类器)。
具体一种方式,可以是预先采集大量的卡面(如:信用卡)图像数据样本,通常是带字符信息的图像,然后对这些图像数据样本进行分割,将分割后获得的单个字符信息图像(下称样本图像)进行标记。
通过该分割,可以将图像数据样本中的字符信息分开,形成单独的字符信息图像(样本图像)。而通过该标记,能将采集的样本图像中各个单独的字符信息图像,确定到其所属的字符信息类别中去。
该分割、标记(即图像数据样本分析)可以由人工或机器算法等方式,指定采集的分割后的样本图像(单独的字符信息图像)所属字符信息的类别。
这里,采集方式,可以通过图像捕捉/摄取装置来提供银行卡图像以进行图像数据样本采集。
例如:通过图像采集装置采集样本用的银行卡片的图像,这些卡片的卡面图像上包含诸如卡号、日期等字符信息(图像数据样本)。接下来可以对这些图像数据样本做分析(分割和标记),比如人工方式分析,具体的可以是使用图像编辑工具,如Photoshop等,可以在采集到的这些图像数据样本上找到数字字符所在区域,选取一个数字字符的范围,如第一位6,则将覆盖6这个数字的范围取出,另行保存为一个图像,即分割图像数据样本为单独的字符信息图像(样本图像),并将它的标记设定为6,即标记该作为样本图像的单独的字符信息图像所属字符信息类别。
归一化步骤S220,将获得的各个标记后的样本图像,进行归一化处理。
具体如,将一样本图像进行放大、矫正或缩小至标准大小的处理。优选地,全部样本图像都统一为24*24个像素大小。
归一化处理,可以包括样本图像的矫正与缩放等图像处理操作。通过缩放能够将图像大小归一化。这里,通过矫正,还可以进一步将采集(如拍摄)的图像存在比如旋转方向的情形将其旋转回到标准方向的情形(如人们习惯使用的字符信息方向)。
这里,进一步还可以将这些归一化后的样本图像,保存在适当的存储设备、数据库和/或缓存中。
特征提取步骤S230,在每个归一化后的样本图像上进行特征提取处理,对其进行特征向量描述。由此获得进行判断识别字符信息所需的样本图像的复杂向量特征,作为特征样本。
具体而言,在一标准图像上(即统一图像大小标准),这里,可以是进行过归一化处理的样本图像,如24*24个像素大小的图像,对该图像上的每个8*8像素的图像逐点计算其图像特征。提取的图像特征如:Harris特征(Harris角点检测算法即基于灰度图像的角点提取算法中使用的图像特征,如与角点有关的特征向量)、SIFT(Scale-invariant featuretransform尺度不变特征转换)特征(为SIFT提取影像中局部特征算法中使用的图像特征,如对尺度缩放、旋转、亮度变化无关的特征向量)、等等。
一个对24*24样本图像上每个8*8图像素的图像逐点提取上述复杂特征向量的方式,例如:可以是将一个8*8像素块与其相邻的8*8像素块构成一个大的图像区块如16*16的大区块进行;该大区块可以选取比如36最强维特征向量描述;同时,该区块可以在标准图像上如该24*24的图像上,按照8像素的步长,分别在横向、纵向移动,组合后最终针对该24*24标准的样本图像,可以得到高维特征向量描述的整个24*24的字符图案。
逐点计算,例如:横向、纵向分别按8像素步长移动,每个像素块(区块)有16*16个像素,所以横向、纵向分别有2个位置计算该36维的特征向量。特征向量的总长度为36*2*2=144。如图3所示。
进一步的,该高维特征向量(如上述例子中144维)还可以进行降维,降低维度后能提升下面将描述的识别处理过程中的识别速度。降维方法例如可以采用主元分析PCA等降低维度的算法。
这里,提取出归一化后的各个样本图像中的图像特征,优选地,是提取较复杂的图像特征,且尽量为方向不变的复杂特征向量,可以作为本申请下面将描述的识别处理过程中需要使用的各个样本图像的特征样本,尤其是在识别处理中,通过目标检测识别的方式进行光学识别,需要用到这类复杂的特征样本(如Harris特征、SIFT特征等方向不变的复杂特征向量),以在识别处理过程中克服复杂的卡面背景造成的影响。
这里,提取出图像的这些特征,将会作为特征样本在判断识别时的识别算法中使用,这些特征样本进一步可以保存到各种存储设备、缓存、数据库等中。
基于上述方式,本申请无需对卡面图像进行前景、背景的分割,直接使用待识别字符的卡面图像的候选区域的整体作为文字前景,计算其特征向量,也就是用到了更多的更复杂的图像特征,其在识别准确度、识别结果可靠程度上,都将高于传统的传统二值分割方法分分割前景、背景而识别前景的方式。
训练步骤S240,利用特征提取步骤S230中提取出的样本图像的特征,作为图像信息的识别处理中的特征样本,并以这些特征样本训练分类器,以获得相应的识别处理(如识别算法)所用的含参数数据的分类器即识别器。
分类器,如采用支持向量机SVM或人工神经网络。
而分类器训练,比如,训练支持向量机SVM或人工神经网络等分类器。
这里,基于提取的复杂特征向量,例如,在步骤S230中提取的多个样本图像的Harris特征,可以利用Harris特征进行分类器训练,可以得到一个包含参数数据的分类器即识别器。该识别器基于存有的特征样本,将用于对待识别的字符信息图像的判断识别处理。
如图4所示,为复杂背景卡面信息识别方法中可采用的优选的字符定位方法流程图400。
粗略定位步骤S410,对输入的需要识别的卡面(如银行卡)的卡面图像上的字符信息区域进行粗略定位。
这里,输入的需要识别的卡面图像,可以通过图像捕捉/摄取装置提供具有复杂背景的卡面(诸如银行卡)的图像。并且,需要识别的卡面,是具有复杂背景的卡片表面,如各种银行卡(信用卡)等。传统的光学字符识别系统,需要对文字(字符)前景和背景分割,也就只能对背景简单的卡面进行字符信息识别。卡面背景复杂的银行卡等卡面,其无法分割前景和背景,因而,是无法采用传统光学字符识别系统对其上的信息(文字、字符等)进行识别的。
具体而言,先对背景复杂的卡面的图像,进行粗略的字符信息位置区域的定位。可以使用经验信息,比如银行卡片的国际标准ISO7810、ISO7816等,来粗略的定位需要进行识别的卡面图像上的字符位置区域,比如:定位首位字符(卡号)的横向、纵向位置区域(或者末位字符/卡号的横向、纵向位置区域)。在这个位置区域的基础上,再进行下述的准确定位。
准确定位步骤S420(或称精确定位步骤),基于上述粗略定位的字符信息区域,进行准确字符信息区域定位。
这些卡面上的字符信息是待识别的卡面的图像中一系列待识别的字符(如数字、卡号、文字、字母、其他符号等)信息。
准确定位可以获得待识别卡面图像上的不同字符区域所在位置,进而定位到各个字符信息所在位置,还能获得每个字符信息所在区域并获得相应的一系列单个的字符信息的图像。以便识别处理中能利用检测到的这些单个字符信息的字符信息图像。
具体地,在上述粗略定位的字符信息区域的首字符位置附近,滑动识别器进行检测,将利用该识别器检测时的最大响应位置作为最终首位字符(例如:卡号、数字)所在的位置。
其中,该分类器优选地,可以是支持向量机和人工神经网络等分类器。
其中,检测优选地,可以从粗略定位的字符信息区域(如粗略定位的首位字符大致区域)的中间位置开始,然后按照图5所示图像匹配(识别器检测)滑动方向顺序图中的数字所显示的顺序,上下左右地对各个位置利用识别器进行检测(先在1指示的位置检测、再滑动到2指示的位置检测、接着滑到3指示的位置,……一直到9指示的位置),当识别器检测到某个位置时,输出大于某个阈值时即停止检测搜索,并输出首字符定位的位置。这样能减少检测次数、提高定位速度。
同样,还可以通过准确定位首字符的上述具体方式,来对最后一个(末尾)字符的位置进行准确定位。
并且,将首字符和末尾字符之间按照24*24像素大小均匀分配,可以获得多个中间字符信息所在区域。这样,沿横向滑动该识别器,就能逐步获得位于首字符和末尾字符之间的各个字符信息的位置。这些不同位置的字符信息也就能准确地被定位。
准确定位了这些字符信息所在位置,进而由识别器的检测(图像的匹配),也就能获得每个字符信息所在区域的相应的每个字符信息图像,从而,由首字符到末尾字符的一系列字符信息图像被取得。
类似的,复杂背景卡面上的如银行卡卡面上的其他字符信息所在区域,例如有效日期、姓名、卡种标识等等,也都可以采用上述方式进行准确定位,并可基于此去获取这些不同位置所在的字符信息图像。
如图6所示,为复杂背景卡面信息识别方法中可采用的优选的字符信息的判断识别方法流程图600。
接收步骤S610,接收根据定位字符信息区域得到字符信息图像。
输入的待识别的卡面的图像经过定位处理后,可以获得一系列字符信息所在区域、甚至获取到相应的一系列字符信息图像。接收这些待识别的字符信息图像。
优选地,采用字符信息定位方法400中的识别器检测的准确定位字符信息所在区域的方式,获得一系列单个的字符信息的字符信息图像。接收的即为这些字符信息图像。
特征提取步骤S620,基于得到的字符信息图像,进行图像特征的提取。
该图像特征提取步骤,可参见预处理方法200中的特征提取方式,分析出字符信息定位方法400中得到的一系列字符信息图像中的每一个(如单个的字符信息的图像),提取出方向不变的复杂特征向量(Harris特征、SIFT特征等)。
判断识别步骤S630,基于提取的复杂特征向量,将这些图像特征(复杂特征向量)送入识别器中进行识别。
优选地,如预处理方法200中运用复杂特征向量样本训练后得到的识别器,进行判断识别,确定待识别的单个的字符信息图像中对应的字符信息。如对卡号进行识别判断,则判断某个含有一数字字符的图像(有个像数字“1”的字符信息的图像)是否属于这个数字(是否表示数字“1”)。
这里,由于采用方向不变的复杂特征向量,通过目标检测方法进行光学字符信息识别(即识别算法),因而不受复杂卡面背景的影响。
这里,运用的不同的分类器,其训练得到的识别器分类判断次数不同。使用二类分类器,比如支持向量机SVM,对数字字符信息的进行分类判断时,待识别的数字字符信息图像需要通过10个数字字符的该识别器判断以确定是哪个数字(10次分类才能判断属于哪个数字)。而使用多类分类器,如人工神经网络,则对数字字符信息进行分类判断时,该待识别的数字字符信息图像做一次分类就可以判断出来,即通过1个识别器进行判断即可。
根据本申请的实施例,还提供对应于所述识别方法的一种复杂背景卡面的信息的识别系统700。如图7所示的一种复杂背景卡面的信息的识别系统结构框图。
优选地,该系统700包括:输入单元710,输入待识别的具有复杂背景卡片的卡面图像;定位单元720,输入单元710输入的该卡面图像上,定位关心信息/待识别的字符信息;字符信息判断识别单元730,基于定位单元720定位该卡面图像上的字符信息所属区域,对待识别的字符信息图像中的字符信息进行识别;验证单元740,对判断识别单元730识别出的结果进行验证;预处理单元750,以预先获得特征样本和利用特征样本训练分类器后得到的识别器(带有一系列参数数据的分类器),以应用于判断识别单元730的待识别字符信息图像特征提取和字符信息的判断识别。
输入单元710,优选地,通常利用图像捕捉装置如摄像头、照相机、扫描仪等获取待识别的对象(如银行卡)的卡面图像。这些具有复杂背景的卡面图像上,有各种需要录入的信息,主要是字符信息,包括:数字、字母、文字、其他各种字符。
定位单元720,实现如步骤S120的处理。优选地,可以包括粗略定位单元721和准确定位单元722,以实现字符信息定位方法400的处理。优选地,粗略定位单元721和准确定位单元722分别实现步骤S410和步骤S420的处理。
字符信息判断识别单元730,实现步骤S130的处理。优选地,可以包括接收图像信息单元731、第一特征提取单元732、判断识别单元733,实现判断识别方法600的处理。接收图像信息单元731,获取准确定位所得到的一系列字信息符图像,如利用方法400的处理得到字符信息图像(即方法600的步骤S610的处理);第一特征提取单元732,提取图像特征(步骤S620的处理,参照方法200中的图像特征提取步骤S230的处理)以提取出复杂特征向量;判断识别单元733,其利用方法200中的步骤S240训练得到的识别器以及步骤S230提取的特征样本,基于特征提取单元732提取的图像特征进行分类判断,以识别出字符图像信息所属字符信息(步骤S630的处理)。
验证单元740,优选地,实现验证步骤S140的处理。如,对于银行卡卡片来说,可以使用银行卡卡号编码普遍采用的Luhn模十校验算法校验例如判断识别单元733中识别出的卡号以确认最终识别结果。校验成功则输出最终结果。校验失败时还可以提供出错信息。
预处理单元750,优选地,实现预处理方法200的处理。优选地,可以包括:采集单元751以实现步骤S210处理、归一化单元752以实现步骤S220的处理、第二特征提取单元753以实现步骤S230的处理、以及训练单元754以实现步骤S240的处理。
由于本实施例的系统所实现的功能基本相应于前述图1至图6所示的方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
本申请采用了方向不变的复杂特征向量,并通过目标检测的方法进行光学字符识别,克服了复杂卡面背景造成的影响,并且,识别结果可靠程度得到提升,在复杂背景的卡面信息识别中应用,其正确性准确性高。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本说明书中的各个实施例一般采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块或单元。一般地,程序模块或单元可以包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。一般来说,程序模块或单元可以由软件、硬件或两者的结合来实现。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块或单元可以位于包括存储设备在内的本地和远程计算机存储介质中。
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其主要思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (18)

1.一种复杂背景卡面信息识别方法,包括:
针对待识别卡面,基于复杂背景卡面的制作标准,初步定位字符信息所在区域;
根据初步定位的字符信息所在区域,按照预设方向顺序进行检测,确定单个字符信息所在位置,并获取相应位置的字符信息图像;其中,每个字符信息图像对应一个单独的字符,且字符信息图像为:未进行前景与背景分割的卡面图像区域;
对获取的所述字符信息图像进行特征提取;
根据所提取的特征,识别所述字符信息图像中的字符信息。
2.根据权利要求1所述的方法,所述初步定位字符信息所在区域,包括:
初步定位字符信息所在区域时,粗略定位首位字符信息和/或末位字符信息所在位置。
3.根据权利要求2所述的方法,所述根据初步定位的字符信息所在区域,按照预设方向顺序进行检测,确定单个字符信息所在位置,包括:
在所述首位字符信息和/或末位字符信息所在位置附近,利用识别器按预设方向顺序滑动匹配以进行检测,获得准确的首位字符信息和/或末位字符信息的位置;
按统一图像大小标准,均匀分配由首位字符信息和/或末位字符信息的准确位置所确定的字符信息所在区域,对分配出的每个字符信息所在区域利用所述识别器所述预设方向顺序滑动匹配以进行检测,获得准确的每个字符信息的位置。
4.根据权利要求1所述的方法,对获取的所述字符信息图像进行特征提取包括:
基于定位所获取的一个或多个字符信息图像,对所述字符信息图像统一大小标准;
预设一像素块,对所述字符信息图像上的每个所述像素块的图像逐点计算图像特征,以获得所述字符信息图像的复杂特征向量。
5.根据权利要求4所述的方法,所述逐点计算图像特征包括:
所述像素块与其相邻的像素块形成区块,对所述区块选取36维的特征向量描述;
在所述字符信息图像上按8像素的步长分别沿横向、纵向移动,组合得到对所述字符信息图像的高维的特征向量描述。
6.根据权利要求1所述的方法,还包括以下预处理步骤:
采集具有复杂背景的卡面图像数据样本并进行分割和标记,以获得标记了分类的字符信息图像;
对所述标记了分类的字符信息图像,进行归一化处理,以获得统一大小标准的字符信息图像;
预设一像素块,对所述字符信息图像上的每个所述像素块的图像逐点计算图像特征,以获得所述字符信息图像的复杂特征向量;
利用所述复杂特征向量,进行分类器训练,以获得用于确定单个字符信息所在位置的识别器。
7.根据权利要求6所述的方法,预设一像素块,对所述字符信息图像上的每个所述像素块的图像逐点计算图像特征,以获得所述字符信息图像的复杂特征向量,包括:
所述像素块与其相邻的像素块形成区块,对所述区块选取36维的特征向量描述;
在所述字符信息图像上按8像素的步长分别沿横向、纵向移动,组合得到对所述字符信息图像的高维的特征向量描述。
8.根据权利要求4或6所述的方法,
字符信息图像的统一大小标准,是将所述字符图像统一为24*24像素标准图像;预设的一像素块为8*8像素块;所述复杂特征向量包括方向不变的特征向量。
9.根据权利要求1所述的方法,还包括:
输入步骤,利用图像捕捉方式输入待识别的所述卡面的图像;
验证步骤,对识别出的所述字符信息进行验证以确认最终识别结果。
10.一种复杂背景卡面信息识别系统,包括:
粗略定位单元,针对待识别卡面,基于复杂背景卡面的制作标准,初步定位字符信息所在区域;
准确定位单元,根据初步定位的字符信息所在区域,按照预设方向顺序进行检测,确定单个字符信息所在位置,并获取相应位置的字符信息图像;其中,每个字符信息图像对应一个单独的字符,且字符信息图像为:未进行前景与背景分割的卡面图像区域;
第一特征提取单元,对获取的所述字符信息图像进行特征提取;
字符信息识别单元,根据所提取的特征,识别所述字符信息图像中的字符信息。
11.根据权利要求10所述的系统,所述粗略定位单元,具体用于:
初步定位字符信息所在区域时,粗略定位首位字符信息和/或末位字符信息所在位置。
12.根据权利要求11所述的系统,所述准确定位单元,具体用于
在所述首位字符信息和/或末位字符信息所在位置附近,利用识别器按预设方向顺序滑动匹配以进行检测,获得准确的首位字符信息和/或末位字符信息的位置;
按统一图像大小标准,均匀分配由首位字符信息和/或末位字符信息的准确位置所确定的字符信息所在区域,对分配出的每个字符信息所在区域利用所述识别器所述预设方向顺序滑动匹配以进行检测,获得准确的每个字符信息的位置。
13.根据权利要求10所述的系统,第一特征提取单元包括:
基于定位所获取的一个或多个字符信息图像,对所述字符信息图像统一大小标准;
预设一像素块,对所述字符信息图像上的每个所述像素块的图像逐点计算图像特征,以获得所述字符信息图像的复杂特征向量。
14.根据权利要求13所述的系统,第一特征提取单元中,所述逐点计算图像特征包括:
所述像素块与其相邻的像素块形成区块,对所述区块选取36维的特征向量描述;
在所述字符信息图像上按8像素的步长分别沿横向、纵向移动,组合得到对所述字符信息图像的高维的特征向量描述。
15.根据权利要求10所述的系统,还包括:预处理单元,所述预处理单元包括:
采集单元,采集具有复杂背景的卡面图像数据样本并进行分割和标记,以获得标记了分类的字符信息图像;
归一化单元,对所述标记了分类的字符信息图像,进行归一化处理,以获得统一大小标准的字符信息图像;
第二特征提取单元,预设一像素块,对所述字符信息图像上的每个所述像素块的图像逐点计算图像特征,以获得所述字符信息图像的复杂特征向量;
训练单元,利用所述复杂特征向量,进行分类器训练,以获得用于确定单个字符信息所在位置的识别器。
16.根据权利要求15所述的系统,第二特征提取单元包括:
所述像素块与其相邻的像素块形成区块,对所述区块选取36维的特征向量描述;
在所述字符信息图像上按8像素的步长分别沿横向、纵向移动,组合得到对所述字符信息图像的高维的特征向量描述。
17.根据权利要求13或15所述的系统,
字符信息图像的统一大小标准,是将所述字符图像统一为24*24像素标准图像;预设的一像素块为8*8像素块;所述复杂特征向量包括方向不变的特征向量。
18.根据权利要求10所述的系统,还包括:
输入单元,利用图像捕捉方式输入待识别的所述卡面的图像;
验证单元,对识别出的所述字符信息进行验证以确认最终识别结果。
CN201910468824.4A 2013-06-03 2013-06-03 复杂背景卡面信息识别方法及系统 Active CN110222687B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910468824.4A CN110222687B (zh) 2013-06-03 2013-06-03 复杂背景卡面信息识别方法及系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310216817.8A CN104217203B (zh) 2013-06-03 2013-06-03 复杂背景卡面信息识别方法及系统
CN201910468824.4A CN110222687B (zh) 2013-06-03 2013-06-03 复杂背景卡面信息识别方法及系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201310216817.8A Division CN104217203B (zh) 2013-06-03 2013-06-03 复杂背景卡面信息识别方法及系统

Publications (2)

Publication Number Publication Date
CN110222687A true CN110222687A (zh) 2019-09-10
CN110222687B CN110222687B (zh) 2021-02-26

Family

ID=52098668

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201310216817.8A Active CN104217203B (zh) 2013-06-03 2013-06-03 复杂背景卡面信息识别方法及系统
CN201910468824.4A Active CN110222687B (zh) 2013-06-03 2013-06-03 复杂背景卡面信息识别方法及系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201310216817.8A Active CN104217203B (zh) 2013-06-03 2013-06-03 复杂背景卡面信息识别方法及系统

Country Status (2)

Country Link
CN (2) CN104217203B (zh)
HK (1) HK1202954A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796146A (zh) * 2019-10-11 2020-02-14 上海上湖信息技术有限公司 一种银行卡卡号识别方法、模型训练方法及装置
CN111860487A (zh) * 2020-07-28 2020-10-30 天津恒达文博科技股份有限公司 基于深度神经网络的碑文标注检测识别系统
CN114387601A (zh) * 2022-01-10 2022-04-22 长飞光纤光缆股份有限公司 一种基于权重策略的混合验证码的识别方法和系统

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809157B (zh) * 2015-03-25 2018-05-18 小米科技有限责任公司 号码识别方法及装置
CN106469293A (zh) * 2015-08-21 2017-03-01 上海羽视澄蓝信息科技有限公司 快速检测目标的方法及系统
KR101824600B1 (ko) * 2015-09-08 2018-03-14 에스케이플래닛 주식회사 단말장치를 이용한 신용카드 번호 및 유효기간 인식 시스템 및 방법
CN106527674A (zh) * 2015-09-14 2017-03-22 上海羽视澄蓝信息科技有限公司 一种车载单目摄像机人机交互方法、设备及系统
JP6804292B2 (ja) * 2016-12-28 2020-12-23 オムロンヘルスケア株式会社 端末装置
CN108876716B (zh) * 2017-05-11 2020-09-11 Tcl科技集团股份有限公司 超分辨率重建方法及装置
CN107256384A (zh) * 2017-05-22 2017-10-17 汕头大学 一种基于图像与信号处理的卡片识别与计数方法
CN107977665A (zh) * 2017-12-15 2018-05-01 北京科摩仕捷科技有限公司 一种发票中关键信息的识别方法及计算设备
CN108596180A (zh) * 2018-04-09 2018-09-28 深圳市腾讯网络信息技术有限公司 图像中的参数识别、参数识别模型的训练方法及装置
CN108764230A (zh) * 2018-05-30 2018-11-06 上海建桥学院 一种基于卷积神经网络的银行卡号自动识别方法
CN110619325B (zh) * 2018-06-20 2024-03-08 北京搜狗科技发展有限公司 一种文本识别方法及装置
CN111242932A (zh) * 2020-01-15 2020-06-05 中国银联股份有限公司 一种卡片样式的校验方法及装置
CN111814789A (zh) * 2020-07-15 2020-10-23 中国建设银行股份有限公司 一种卡号检测的方法、装置、设备及存储介质
CN114049646B (zh) * 2021-11-29 2024-09-06 中国平安人寿保险股份有限公司 一种银行卡识别方法、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060008150A1 (en) * 2004-07-07 2006-01-12 Samsung Electronics Co., Ltd. Apparatus for and method of feature extraction for image recognition
CN101038686A (zh) * 2007-01-10 2007-09-19 北京航空航天大学 一种基于信息融合的机读旅行证件识别方法
CN201054150Y (zh) * 2006-12-15 2008-04-30 华南理工大学 一种邮政信封自动识别系统
CN102147858A (zh) * 2011-03-31 2011-08-10 重庆大学 车牌字符识别方法
CN102324044A (zh) * 2011-09-09 2012-01-18 上海合合信息科技发展有限公司 卡片信息获取方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7570816B2 (en) * 2005-03-31 2009-08-04 Microsoft Corporation Systems and methods for detecting text
CN101373519B (zh) * 2007-08-20 2011-01-19 富士通株式会社 字符识别装置和方法
CN102163287B (zh) * 2011-03-28 2014-06-18 北京邮电大学 一种基于类Haar特征和支持向量机的车牌字符识别方法
CN103020647A (zh) * 2013-01-08 2013-04-03 西安电子科技大学 基于级联的sift特征和稀疏编码的图像分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060008150A1 (en) * 2004-07-07 2006-01-12 Samsung Electronics Co., Ltd. Apparatus for and method of feature extraction for image recognition
CN201054150Y (zh) * 2006-12-15 2008-04-30 华南理工大学 一种邮政信封自动识别系统
CN101038686A (zh) * 2007-01-10 2007-09-19 北京航空航天大学 一种基于信息融合的机读旅行证件识别方法
CN102147858A (zh) * 2011-03-31 2011-08-10 重庆大学 车牌字符识别方法
CN102324044A (zh) * 2011-09-09 2012-01-18 上海合合信息科技发展有限公司 卡片信息获取方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796146A (zh) * 2019-10-11 2020-02-14 上海上湖信息技术有限公司 一种银行卡卡号识别方法、模型训练方法及装置
CN111860487A (zh) * 2020-07-28 2020-10-30 天津恒达文博科技股份有限公司 基于深度神经网络的碑文标注检测识别系统
CN111860487B (zh) * 2020-07-28 2022-08-19 天津恒达文博科技股份有限公司 基于深度神经网络的碑文标注检测识别系统
CN114387601A (zh) * 2022-01-10 2022-04-22 长飞光纤光缆股份有限公司 一种基于权重策略的混合验证码的识别方法和系统

Also Published As

Publication number Publication date
HK1202954A1 (zh) 2015-10-09
CN110222687B (zh) 2021-02-26
CN104217203A (zh) 2014-12-17
CN104217203B (zh) 2019-08-23

Similar Documents

Publication Publication Date Title
CN104217203B (zh) 复杂背景卡面信息识别方法及系统
US11087125B2 (en) Document authenticity determination
US10635946B2 (en) Eyeglass positioning method, apparatus and storage medium
CN108205673B (zh) 用于集装箱码识别的方法和系统
US8744196B2 (en) Automatic recognition of images
WO2019169532A1 (zh) 车牌识别方法及云系统
CN106156766B (zh) 文本行分类器的生成方法及装置
US10489643B2 (en) Identity document validation using biometric image data
CN109766885B (zh) 一种文字检测方法、装置、电子设备及存储介质
CN108717543B (zh) 一种发票识别方法及装置、计算机存储介质
CN105512657B (zh) 字符识别方法和设备
CN110046085B (zh) 识别终端设备上显示的应用程序控件的方法及装置
CN109784385A (zh) 一种商品自动识别方法、系统、装置及存储介质
CN109389115B (zh) 文本识别方法、装置、存储介质和计算机设备
CN111079571A (zh) 证卡信息识别及其边缘检测模型训练方法、装置
CN111242124A (zh) 一种证件分类方法、装置及设备
CN108154132A (zh) 一种身份证文字提取方法、系统及设备和存储介质
Hartl et al. Real-time detection and recognition of machine-readable zones with mobile devices.
CN113011426A (zh) 一种识别证件的方法和装置
CN112001200A (zh) 识别码识别方法、装置、设备、存储介质和系统
CN114463767A (zh) 信用证识别方法、装置、计算机设备和存储介质
CN112001389A (zh) 一种多场景视频中文本信息识别方法、装置及电子设备
CN115984859A (zh) 一种图像文字识别的方法、装置及存储介质
Wicht et al. Camera-based sudoku recognition with deep belief network
US20230132261A1 (en) Unified framework for analysis and recognition of identity documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant