CN104966107A - 一种基于机器学习的信用卡卡号识别方法 - Google Patents

一种基于机器学习的信用卡卡号识别方法 Download PDF

Info

Publication number
CN104966107A
CN104966107A CN201510410378.3A CN201510410378A CN104966107A CN 104966107 A CN104966107 A CN 104966107A CN 201510410378 A CN201510410378 A CN 201510410378A CN 104966107 A CN104966107 A CN 104966107A
Authority
CN
China
Prior art keywords
credit card
card number
characteristic pattern
rect
vertical edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510410378.3A
Other languages
English (en)
Inventor
张卡
尼秀明
何佳
牧春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ANHUI QINGXIN INTERNET INFORMATION TECHNOLOGY Co Ltd
Original Assignee
ANHUI QINGXIN INTERNET INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANHUI QINGXIN INTERNET INFORMATION TECHNOLOGY Co Ltd filed Critical ANHUI QINGXIN INTERNET INFORMATION TECHNOLOGY Co Ltd
Priority to CN201510410378.3A priority Critical patent/CN104966107A/zh
Publication of CN104966107A publication Critical patent/CN104966107A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于机器学习的信用卡卡号识别方法,包括训练信用卡卡号分类器;基于分类器文件,检测待处理信用卡图像的卡号位置;对获得的信用卡卡号位置矩形区域进行倾斜校正;分割信用卡卡号数字:获得信用卡卡号数字的上下边界位置,获得信用卡卡号单个数字的左右边界位置;识别信用卡卡号数字。本发明采用图像处理和字符识别技术,实现信用卡的定位、字符分割和识别,自动读取信用卡的卡号,具有识别精度较高、成本低、速度快、主动读取等优点。

Description

一种基于机器学习的信用卡卡号识别方法
技术领域
本发明涉及银行卡识别技术领域,具体是一种基于机器学习的信用卡卡号识别方法。
背景技术
信用卡是商业银行向个人和单位发行的,具有消费信用的特制载体卡片,凭此卡片可以进行商场购物、网上支付和向银行存取现金。由于使用信用卡进行支付时,可以获得较多的优惠和积分,同时在卡里的金额不足时,还可以进行一定额度的透支,为人们的生活带来极大的便利。伴随着信用卡越来越普遍,如何快捷准确地读取信用卡的卡号信息变得越来越重要。
目前,信用卡卡号信息的读取,主要是通过pos机,直接读取卡片内置的卡号信息,这种方法的优点是读取信息的精准度高、使用范围广、对于卡片污迹和磨损具有很强的抵抗能力,然而,其缺点也很明显,需要专用的POS机器,设备成本较高,只适合于拥有实体店面的收款方。而对于普通大众使用而言,尤其是在网上购物支付和转账时,基本上还是采用人工填写卡号的方式,这个过程较为繁琐且易出现误填,极大地影响着人们生活的便利。因此,亟需一种快捷准确的信用卡卡号自动读取方法。
发明内容
本发明的目的在于针对普通大众读取信用卡卡号信息的不便,提供一种基于机器学习的信用卡卡号识别方法。
本发明的技术方案为:
一种基于机器学习的信用卡卡号识别方法,包括以下步骤:
(1)训练信用卡卡号分类器;
(2)基于分类器文件,检测待处理信用卡图像的卡号位置;
(3)对获得的信用卡卡号位置矩形区域进行倾斜校正;
(4)分割信用卡卡号数字,包括:
(41)获得信用卡卡号数字的上下边界位置;
(42)获得信用卡卡号单个数字的左右边界位置;
(5)识别信用卡卡号数字。
所述的基于机器学习的信用卡卡号识别方法,步骤(1),包括:
a、收集训练样本,将收集的信用卡图像上的卡号区域作为训练的正样本,其余区域作为训练的负样本;
b、基于haar特征和adaboost算法,训练信用卡卡号分类器。
所述的基于机器学习的信用卡卡号识别方法,步骤(3),包括:
a、按照以下公式将获得的信用卡卡号位置矩形区域的下边缘向下扩展,得到信用卡卡号位置扩展矩形区域:
rect d o w n . x = r e c t . x rect d o w n . y = r e c t . y rect d o w n . w i d t h = r e c t . w i d t h rect d o w n . h e i g h t = r e c t . h e i g h t + r e c t . w i d t h * 0.5
其中,(rect.x,rect.y)、(rectdown.x,rectdown.y)分别表示信用卡卡号位置矩形区域rect、信用卡卡号位置扩展矩形区域rectdown的左上角坐标,rect.width、rect.height分别表示信用卡卡号位置矩形区域rect的宽度、高度,rectdown.width、rectdown.height分别表示信用卡卡号位置扩展矩形区域rectdown的宽度、高度;
b、采用以下公式,获取所述信用卡卡号位置扩展矩形区域的水平边缘特征图:
Ex(i,j)=g(i-2,j)+g(i-1,j)+g(i+1,j)+g(i+2,j)-4*g(i,j)
其中,Ex(i,j)表示所述水平边缘特征图的第i行第j列位置的像素灰度值,g(i,j)表示所述信用卡卡号位置扩展矩形区域的第i行第j列位置的像素灰度值;
c、基于最大类间距二值化算法,对所述水平边缘特征图进行二值化处理,得到二值水平边缘特征图;
d、选取所述二值水平边缘特征图上面积最大的连通区域;
e、基于以下最小二乘法原理式,对选取的连通区域的前景目标点进行直线拟合,得到该连通区域的倾斜角度:
γ = arctan ( NΣx i y i - Σx i Σy i NΣx i 2 - ( Σx i ) 2 )
其中,γ表示所述连通区域的倾斜角度,xi、yi分别表示所述连通区域上前景目标点的横坐标、纵坐标,N表示所述连通区域上前景目标点的数量;
f、采用以下公式对信用卡卡号位置矩形区域进行旋转变换:
x = ( x 0 - a n c h o r _ x ) * cos γ - ( y 0 - a n c h o r _ y ) * sin γ + a n c h o r _ x y = ( x 0 - a n c h o r _ x ) * sin γ + ( y 0 - a n c h o r _ y ) * cos γ + a n c h o r _ y
其中,(x0,y0)表示旋转变换前的坐标值,(x,y)表示旋转变换后的坐标值,(anchor_x,anchor_y)表示图像旋转基点。
所述的基于机器学习的信用卡卡号识别方法,步骤(41)包括:
a、获取信用卡卡号数字区域,所述信用卡卡号数字区域指的是将倾斜校正后的信用卡卡号位置矩形区域的边缘向外扩展若干个像素而产生的一个新的矩形区域;
b、基于sobel边缘检测算子,获得所述信用卡卡号数字区域的垂直边缘特征图;
c、基于最大类间距二值化算法,对所述垂直边缘特征图进行二值化处理,得到二值垂直边缘特征图;
d、基于连通区域的面积和长宽比,去除所述二值垂直边缘特征图上的干扰区域;
e、采用以下公式获得去除干扰后的二值垂直边缘特征图的水平投影特征:
h [ i ] = h [ i ] + 1 b i n ( i , j ) = 255 h [ i ] b i n ( i , j ) = 0
其中,h[i]表示二值垂直边缘特征图的水平投影特征,即二值垂直边缘特征图上第i行所有前景目标点个数,bin(i,j)表示二值垂直边缘特征图上像素(i,j)处的灰度值;
f、采用以下公式获得去除干扰后的二值垂直边缘特征图的水平跳变数特征:
n [ i ] = n [ i ] + 1 b i n ( i , j - 1 ) + b i n ( i , j ) = 255 n [ i ] b i n ( i , j - 1 ) + b i n ( i , j ) ! = 255
其中,n[i]表示二值垂直边缘特征图的水平跳变数特征,即二值垂直边缘特征图上第i行所有灰度值发生跳变的像素个数,bin(i,j)表示二值垂直边缘特征图上像素(i,j)处的灰度值;
g、选取所述水平投影特征和水平跳变数特征同时发生突变的位置,作为信用卡卡号数字的上下边界位置。
所述的基于机器学习的信用卡卡号识别方法,步骤(42)包括:
a、获取信用卡卡号数字区域,所述信用卡卡号数字区域指的是将倾斜校正后的信用卡卡号位置矩形区域的边缘向外扩展若干个像素而产生的一个新的矩形区域;
b、基于sobel边缘检测算子,获得所述信用卡卡号数字区域的垂直边缘特征图;
c、基于最大类间距二值化算法,对所述垂直边缘特征图进行二值化处理,得到二值垂直边缘特征图;
d、基于连通区域的面积和长宽比,去除所述二值垂直边缘特征图上的干扰区域;
e、基于信用卡的尺寸规范标准和获得的信用卡卡号数字的上下边界位置,定义信用卡卡号数字位置模板;
f、将所述信用卡卡号数字位置模板在去除干扰后的二值垂直边缘特征图上进行遍历,采用以下公式计算当前遍历位置与所述信用卡卡号数字位置模板的匹配度:
S c o r e = S c o r e + 1 M ( i , j ) = E d g e ( i + p x , j + p y ) S c o r e M ( i , j ) ! = E d g e ( i + p x , j + p y )
其中,Score表示当前遍历位置与信用卡卡号数字位置模板的匹配度,M(i,j)表示信用卡卡号数字位置模板(i,j)处的灰度值,(px,py)表示当前遍历位置左上角坐标,Edge(i+px,j+py)表示二值垂直边缘特征图上相对于(px,py)点偏移(i,j)处的灰度值;
g、在匹配度最大的遍历位置直接获取信用卡卡号单个数字的左右边界位置。
所述的基于机器学习的信用卡卡号识别方法,步骤(5)包括:
a、按行优先顺序将每个待识别卡号数字的灰度图像串联成一维向量,得到每个待识别卡号数字的特征向量;
b、将每个待识别卡号数字的特征向量输入训练好的Bayes分类器,采用以下公式计算输入的特征向量属于某一类目标的概率:
p i = e ( - 0.5 * d ) d = ln | C o v | + ( x - u ) Cov - 1 ( x - u ) T
其中,x表示输入的待识别卡号数字的特征向量,u表示某一类目标的特征向量的各维元素的均值,Cov表示某一类目标的特征向量的各维元素的协方差矩阵;
c、选择最大概率值对应的类别作为待识别卡号数字的值。
由上述技术方案可知,本发明采用图像处理和字符识别技术,实现信用卡的定位、字符分割和识别,自动读取信用卡的卡号,具有识别精度较高、成本低、速度快、主动读取等优点。
附图说明
图1是本发明的方法流程图;
图2是本发明分割信用卡卡号数字的流程图;
图3是待处理的信用卡图像;
图4是获取信用卡卡号分类器正样本的示意图,其中矩形框选定的区域作为训练正样本;
图5是信用卡卡号位置倾斜校正后图像;
图6是信用卡卡号数字位置模板图;
图7是信用卡卡号数字分割效果图;
图8是信用卡卡号数字识别结果图像。
具体实施方式
下面结合附图和具体实施例进一步说明本发明。
本实施例针对的是符合我国银行卡卡片规范(QCUP_005-2011)标准的信用卡图像,如图3所示。
如图1所示,一种基于机器学习的信用卡卡号识别方法,包括以下顺序的步骤:
S1、训练信用卡卡号分类器,主要步骤如下:
S11、收集训练样本,主要是收集目前市面上常见的信用卡图片,如图4所示,选择卡号区域作为训练的正样本,卡片的其余区域作为训练的负样本。
S12、基于haar特征和adaboost算法,训练卡号分类器。具体学习算法参见文献:Rapid Object Detection using a Boosted Cascade ofSimple Features,Paul Viola,Michael Jones,IEEE CVPR(2001)。
S2、检测信用卡卡号位置,主要基于步骤S1获得的分类器文件,进行卡号位置检测;
S3、信用卡卡号位置倾斜校正,效果如图5所示,具体步骤如下:
S31、按照以下公式,将步骤S2获得的信用卡卡号位置矩形区域rect的下边缘直线向下扩展,得到信用卡卡号位置扩展矩形区域rectdown
rect d o w n . x = r e c t . x rect d o w n . y = r e c t . y rect d o w n . w i d t h = r e c t . w i d t h rect d o w n . h e i g h t = r e c t . h e i g h t + r e c t . w i d t h * 0.5
其中,rect.x、rect.y分别表示信用卡卡号位置矩形区域rect左上角的横坐标、纵坐标,rectdown.x、rectdown.y分别表示信用卡卡号位置扩展矩形区域rectdown左上角的横坐标、纵坐标,rect.width、rect.height分别表示信用卡卡号位置矩形区域rect的宽度、高度,rectdown.width、rectdown.height分别表示信用卡卡号位置扩展矩形区域rectdown的宽度、高度。
S32、基于以下公式,获得信用卡卡号位置扩展矩形区域图像的水平边缘特征图Ex(i,j):
Ex(i,j)=g(i-2,j)+g(i-1,j)+g(i+1,j)+g(i+2,j)-4*g(i,j)
其中,Ex(i,j)表示水平边缘特效特征图的第i行第j列位置的像素灰度值g(i,j)表示信用卡卡号位置扩展矩形区域图像的第i行第j列位置的像素灰度值。
S33、基于最大类间距二值化算法,获取信用卡卡号位置扩展矩形区域图像的二值水平边缘特征图;
S34、选择二值水平边缘特征图上面积最大的连通区域;
S35、基于以下最小二乘法原理式,对选择的连通区域的前景目标点进行直线拟合,获取该连通区域的倾斜角度γ:
γ = arctan ( NΣx i y i - Σx i Σy i NΣx i 2 - ( Σx i ) 2 )
其中,xi、yi分别表示连通区域上前景目标点的横坐标、纵坐标,N表示连通区域上前景目标点的数量。
S36、依据以下公式,对卡片进行倾斜校正:
x = ( x 0 - a n c h o r _ x ) * cos γ - ( y 0 - a n c h o r _ y ) * sin γ + a n c h o r _ x y = ( x 0 - a n c h o r _ x ) * sin γ + ( y 0 - a n c h o r _ y ) * cos γ + a n c h o r _ y
其中,(x0,y0)是旋转变换前的坐标值,(x,y)是旋转变换后的坐标值,(anchor_x,anchor_y)是图像旋转基点。
S4、信用卡卡号数字分割,如图2所示,具体步骤如下:
S41、获取信用卡卡号数字区域,主要方法是在倾斜校正后的信用卡卡号位置矩形区域的基础上,将该矩形区域的四条边缘各向外(即上边缘向上、下边缘向下、左边缘向左、右边缘向右)扩展15个像素,得到四条新的边缘直线,这四条新的边缘直线构成的矩形区域即是信用卡卡号数字区域。
S42、基于sobel边缘检测算子,获得信用卡卡号数字区域的垂直边缘特征图Edge(i,j)。
S43、基于最大类间距二值化算法,获取信用卡卡号数字区域的二值垂直边缘特征图。
S44、去除二值垂直边缘特征图上面积较小、长宽比异常的连通区域,得到去除干扰后的二值垂直边缘特征图;
S45、按照以下公式,获得去除干扰后的二值垂直边缘特征图的水平投影特征h[i]::
h [ i ] = h [ i ] + 1 b i n ( i , j ) = 255 h [ i ] b i n ( i , j ) = 0
其中,h[i]表示二值垂直边缘特征图的水平投影特征,即二值垂直边缘特征图上第i行所有前景目标点个数,bin(i,j)表示二值垂直边缘特征图上像素(i,j)处的灰度值。
S46、按照以下公式,获得去除干扰后的二值垂直边缘特征图的水平跳变数特征n[i]:
n [ i ] = n [ i ] + 1 b i n ( i , j - 1 ) + b i n ( i , j ) = 255 n [ i ] b i n ( i , j - 1 ) + b i n ( i , j ) ! = 255
其中,n[i]表示二值垂直边缘特征图上第i行所有灰度值发生跳变的像素个数,bin(i,j)表示二值垂直边缘特征图上像素(i,j)处的灰度值。
S47、获得信用卡卡号数字的上下边界位置,主要做法是选择水平投影特征h[i]和水平跳变数特征n[i]同时发生突变的位置。
S48、获得信用卡卡号单个数字的左右边界位置,具体步骤如下:
S481、基于信用卡的尺寸规范标准和步骤S47获得的信用卡卡号数字的上下边界位置,定义信用卡卡号数字位置模板M,如图6所示。
S482、在步骤S44获得的二值垂直边缘特征图上,基于信用卡卡号数字位置模板进行遍历,在每一个遍历位置,基于以下公式,计算当前遍历位置的匹配度Score:
S c o r e = S c o r e + 1 M ( i , j ) = E d g e ( i + p x , j + p y ) S c o r e M ( i , j ) ! = E d g e ( i + p x , j + p y )
其中,M(i,j)是信用卡卡号数字位置模板(i,j)处的灰度值,(px,py)是遍历位置左上角坐标,Edge(i+px,j+py)是去除干扰后的二值垂直边缘特征图上相对于(px,py)点偏移(i,j)处的灰度值。
S483、获得信用卡卡号数字的左右边界位置,主要方法是寻找遍历位置最大匹配度,此时对应的模板遍历位置就是最优的数字左右边界位置,效果如图7所示。
S5、识别信用卡卡号数字,效果如图8所示,具体步骤如下:
S51、获取卡号数字的特征向量x,主要是通过按行优先顺序将卡号数字灰度图像串联成一维向量,即是特征向量。
S52、将卡号数字的特征向量送入Bayes分类器,按照以下公式,计算输入的特征向量属于某一类的概率pi:
p i = e ( - 0.5 * d ) d = ln | C o v | + ( x - u ) Cov - 1 ( x - u ) T
其中,x是输入的特征向量,u、Cov是经过Bayes分类器训练得到的,u是某一类目标的特征向量的各维元素的均值,Cov是某一类目标的特征向量的各维元素的协方差矩阵,训练Bayes分类器是在整个识别过程之前进行的。
S53、选择最大概率值对应的类别作为待识别卡号数字的值。
以上所述实施方式仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明的权利要求书确定的保护范围内。

Claims (6)

1.一种基于机器学习的信用卡卡号识别方法,其特征在于,包括以下步骤:
(1)训练信用卡卡号分类器;
(2)基于分类器文件,检测待处理信用卡图像的卡号位置;
(3)对获得的信用卡卡号位置矩形区域进行倾斜校正;
(4)分割信用卡卡号数字,包括:
(41)获得信用卡卡号数字的上下边界位置;
(42)获得信用卡卡号单个数字的左右边界位置;
(5)识别信用卡卡号数字。
2.根据权利要求1所述的基于机器学习的信用卡卡号识别方法,其特征在于,步骤(1),包括:
a、收集训练样本,将收集的信用卡图像上的卡号区域作为训练的正样本,其余区域作为训练的负样本;
b、基于haar特征和adaboost算法,训练信用卡卡号分类器。
3.根据权利要求1所述的基于机器学习的信用卡卡号识别方法,其特征在于,步骤(3),包括:
a、按照以下公式将获得的信用卡卡号位置矩形区域的下边缘向下扩展,得到信用卡卡号位置扩展矩形区域:
rect d o w n . x = r e c t . x rect d o w n . y = r e c t . y rect d o w n . w i d t h = r e c t . w i d t h rect d o w n . h e i g h t = r e c t . h e i g h t + r e c t . w i d t h * 0.5
其中,(rect.x,rect.y)、(rectdown.x,rectdown.y)分别表示信用卡卡号位置矩形区域rect、信用卡卡号位置扩展矩形区域rectdown的左上角坐标,rect.width、rect.height分别表示信用卡卡号位置矩形区域rect的宽度、高度,rectdown.width、rectdown.height分别表示信用卡卡号位置扩展矩形区域rectdown的宽度、高度;
b、采用以下公式,获取所述信用卡卡号位置扩展矩形区域的水平边缘特征图:
Ex(i,j)=g(i-2,j)+g(i-1,j)+g(i+1,j)+g(i+2,j)-4*g(i,j)
其中,Ex(i,j)表示所述水平边缘特征图的第i行第j列位置的像素灰度值,g(i,j)表示所述信用卡卡号位置扩展矩形区域的第i行第j列位置的像素灰度值;
c、基于最大类间距二值化算法,对所述水平边缘特征图进行二值化处理,得到二值水平边缘特征图;
d、选取所述二值水平边缘特征图上面积最大的连通区域;
e、基于以下最小二乘法原理式,对选取的连通区域的前景目标点进行直线拟合,得到该连通区域的倾斜角度:
γ = arctan ( NΣx i y i - Σx i Σy i NΣx i 2 - ( Σx i ) 2 )
其中,γ表示所述连通区域的倾斜角度,xi、yi分别表示所述连通区域上前景目标点的横坐标、纵坐标,N表示所述连通区域上前景目标点的数量;
f、采用以下公式对信用卡卡号位置矩形区域进行旋转变换:
x = ( x 0 - a n c h o r _ x ) * cos γ - ( y 0 - a n c h o r _ y ) * sin γ + a n c h o r _ x y = ( x 0 - a n c h o r _ x ) * sin γ + ( y 0 - a n c h o r _ y ) * cos γ + a n c h o r _ y
其中,(x0,y0)表示旋转变换前的坐标值,(x,y)表示旋转变换后的坐标值,(anchor_x,anchor_y)表示图像旋转基点。
4.根据权利要求1所述的基于机器学习的信用卡卡号识别方法,其特征在于,步骤(41)包括:
a、获取信用卡卡号数字区域,所述信用卡卡号数字区域指的是将倾斜校正后的信用卡卡号位置矩形区域的边缘向外扩展若干个像素而产生的一个新的矩形区域;
b、基于sobel边缘检测算子,获得所述信用卡卡号数字区域的垂直边缘特征图;
c、基于最大类间距二值化算法,对所述垂直边缘特征图进行二值化处理,得到二值垂直边缘特征图;
d、基于连通区域的面积和长宽比,去除所述二值垂直边缘特征图上的干扰区域;
e、采用以下公式获得去除干扰后的二值垂直边缘特征图的水平投影特征:
h [ i ] = h [ i ] + 1 b i n ( i , j ) = 255 h [ i ] b i n ( i , j ) = 0
其中,h[i]表示二值垂直边缘特征图的水平投影特征,即二值垂直边缘特征图上第i行所有前景目标点个数,bin(i,j)表示二值垂直边缘特征图上像素(i,j)处的灰度值;
f、采用以下公式获得去除干扰后的二值垂直边缘特征图的水平跳变数特征:
n [ i ] = n [ i ] + 1 b i n ( i , j - 1 ) + b i n ( i , j ) = 255 n [ i ] b i n ( i , j - 1 ) + b i n ( i , j ) ! = 255
其中,n[i]表示二值垂直边缘特征图的水平跳变数特征,即二值垂直边缘特征图上第i行所有灰度值发生跳变的像素个数,bin(i,j)表示二值垂直边缘特征图上像素(i,j)处的灰度值;
g、选取所述水平投影特征和水平跳变数特征同时发生突变的位置,作为信用卡卡号数字的上下边界位置。
5.根据权利要求1所述的基于机器学习的信用卡卡号识别方法,其特征在于,步骤(42)包括:
a、获取信用卡卡号数字区域,所述信用卡卡号数字区域指的是将倾斜校正后的信用卡卡号位置矩形区域的边缘向外扩展若干个像素而产生的一个新的矩形区域;
b、基于sobel边缘检测算子,获得所述信用卡卡号数字区域的垂直边缘特征图;
c、基于最大类间距二值化算法,对所述垂直边缘特征图进行二值化处理,得到二值垂直边缘特征图;
d、基于连通区域的面积和长宽比,去除所述二值垂直边缘特征图上的干扰区域;
e、基于信用卡的尺寸规范标准和获得的信用卡卡号数字的上下边界位置,定义信用卡卡号数字位置模板;
f、将所述信用卡卡号数字位置模板在去除干扰后的二值垂直边缘特征图上进行遍历,采用以下公式计算当前遍历位置与所述信用卡卡号数字位置模板的匹配度:
S c o r e = S c o r e + 1 M ( i , j ) = E d g e ( i + p x , j + p y ) S c o r e M ( i , j ) ! = E d g e ( i + p x , j + p y )
其中,Score表示当前遍历位置与信用卡卡号数字位置模板的匹配度,M(i,j)表示信用卡卡号数字位置模板(i,j)处的灰度值,(px,py)表示当前遍历位置左上角坐标,Edge(i+px,j+py)表示二值垂直边缘特征图上相对于(px,py)点偏移(i,j)处的灰度值;
g、在匹配度最大的遍历位置直接获取信用卡卡号单个数字的左右边界位置。
6.根据权利要求1所述的基于机器学习的信用卡卡号识别方法,其特征在于,步骤(5)包括:
a、按行优先顺序将每个待识别卡号数字的灰度图像串联成一维向量,得到每个待识别卡号数字的特征向量;
b、将每个待识别卡号数字的特征向量输入训练好的Bayes分类器,采用以下公式计算输入的特征向量属于某一类目标的概率:
p i = e ( - 0.5 * d ) d = ln | C o v | + ( x - u ) Cov - 1 ( x - u ) T
其中,x表示输入的待识别卡号数字的特征向量,u表示某一类目标的特征向量的各维元素的均值,Cov表示某一类目标的特征向量的各维元素的协方差矩阵;
c、选择最大概率值对应的类别作为待识别卡号数字的值。
CN201510410378.3A 2015-07-10 2015-07-10 一种基于机器学习的信用卡卡号识别方法 Pending CN104966107A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510410378.3A CN104966107A (zh) 2015-07-10 2015-07-10 一种基于机器学习的信用卡卡号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510410378.3A CN104966107A (zh) 2015-07-10 2015-07-10 一种基于机器学习的信用卡卡号识别方法

Publications (1)

Publication Number Publication Date
CN104966107A true CN104966107A (zh) 2015-10-07

Family

ID=54220142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510410378.3A Pending CN104966107A (zh) 2015-07-10 2015-07-10 一种基于机器学习的信用卡卡号识别方法

Country Status (1)

Country Link
CN (1) CN104966107A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512657A (zh) * 2015-08-20 2016-04-20 北京旷视科技有限公司 字符识别方法和设备
CN105528607A (zh) * 2015-10-30 2016-04-27 小米科技有限责任公司 区域提取方法、模型训练方法及装置
CN106203415A (zh) * 2016-06-30 2016-12-07 三峡大学 一种基于数字图像处理的银行卡号自动识别装置
CN106407980A (zh) * 2016-11-03 2017-02-15 贺江涛 一种基于图像处理的银行卡号码识别方法
CN106446900A (zh) * 2016-09-27 2017-02-22 北京小米移动软件有限公司 数字切割方法及装置
CN107256404A (zh) * 2017-06-09 2017-10-17 王翔宇 一种涉案枪支枪号识别方法
CN107742120A (zh) * 2017-10-17 2018-02-27 北京小米移动软件有限公司 银行卡卡号的识别方法及装置
CN107798325A (zh) * 2017-08-18 2018-03-13 中国银联股份有限公司 卡片识别方法和设备、计算机存储介质
CN108604222A (zh) * 2015-12-28 2018-09-28 云脑科技有限公司 用于部署定制机器学习服务的系统和方法
CN109034149A (zh) * 2017-06-08 2018-12-18 北京君正集成电路股份有限公司 一种字符识别方法及装置
CN110287963A (zh) * 2019-06-11 2019-09-27 苏州玖物互通智能科技有限公司 用于综合性能试验的ocr识别方法
CN111199240A (zh) * 2018-11-16 2020-05-26 马上消费金融股份有限公司 银行卡识别模型的训练方法、银行卡识别方法以及装置
CN113239785A (zh) * 2021-05-11 2021-08-10 百安居信息技术(上海)有限公司 一种基于卷积神经网络的户型自动识别的方法、系统、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293634A (ja) * 1999-04-09 2000-10-20 Fujitsu Ltd 画像処理装置および画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
CN101329731A (zh) * 2008-06-06 2008-12-24 南开大学 图像中数学公式的自动识别方法
CN103870803A (zh) * 2013-10-21 2014-06-18 北京邮电大学 一种基于粗定位与精定位融合的车牌识别方法和系统
CN104156691A (zh) * 2014-07-02 2014-11-19 华南理工大学 一种基于图像处理的检测行人翻越闸机的监控方法
CN104573656A (zh) * 2015-01-09 2015-04-29 安徽清新互联信息科技有限公司 一种基于连通区域信息的车牌颜色判断方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293634A (ja) * 1999-04-09 2000-10-20 Fujitsu Ltd 画像処理装置および画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
CN101329731A (zh) * 2008-06-06 2008-12-24 南开大学 图像中数学公式的自动识别方法
CN103870803A (zh) * 2013-10-21 2014-06-18 北京邮电大学 一种基于粗定位与精定位融合的车牌识别方法和系统
CN104156691A (zh) * 2014-07-02 2014-11-19 华南理工大学 一种基于图像处理的检测行人翻越闸机的监控方法
CN104573656A (zh) * 2015-01-09 2015-04-29 安徽清新互联信息科技有限公司 一种基于连通区域信息的车牌颜色判断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
严曲: "身份证识别系统的原理及算法研究", 《优秀硕士学位论文全文数据库》 *
吴遹等: "一种机读旅行证件信息自动识别方法", 《计算机工程与应用》 *
水天一: "基于移动电话的信用卡卡号识别研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512657B (zh) * 2015-08-20 2019-04-30 北京旷视科技有限公司 字符识别方法和设备
CN105512657A (zh) * 2015-08-20 2016-04-20 北京旷视科技有限公司 字符识别方法和设备
CN105528607B (zh) * 2015-10-30 2019-02-15 小米科技有限责任公司 区域提取方法、模型训练方法及装置
CN105528607A (zh) * 2015-10-30 2016-04-27 小米科技有限责任公司 区域提取方法、模型训练方法及装置
WO2017071064A1 (zh) * 2015-10-30 2017-05-04 小米科技有限责任公司 区域提取方法、模型训练方法及装置
CN108604222B (zh) * 2015-12-28 2022-03-18 云脑科技有限公司 用于部署定制机器学习服务的系统和方法
CN108604222A (zh) * 2015-12-28 2018-09-28 云脑科技有限公司 用于部署定制机器学习服务的系统和方法
CN106203415A (zh) * 2016-06-30 2016-12-07 三峡大学 一种基于数字图像处理的银行卡号自动识别装置
CN106203415B (zh) * 2016-06-30 2019-12-10 三峡大学 一种基于数字图像处理的银行卡号自动识别装置
CN106446900A (zh) * 2016-09-27 2017-02-22 北京小米移动软件有限公司 数字切割方法及装置
CN106407980A (zh) * 2016-11-03 2017-02-15 贺江涛 一种基于图像处理的银行卡号码识别方法
CN109034149A (zh) * 2017-06-08 2018-12-18 北京君正集成电路股份有限公司 一种字符识别方法及装置
CN107256404A (zh) * 2017-06-09 2017-10-17 王翔宇 一种涉案枪支枪号识别方法
CN107798325A (zh) * 2017-08-18 2018-03-13 中国银联股份有限公司 卡片识别方法和设备、计算机存储介质
CN107798325B (zh) * 2017-08-18 2021-04-16 中国银联股份有限公司 卡片识别方法和设备、计算机存储介质
CN107742120A (zh) * 2017-10-17 2018-02-27 北京小米移动软件有限公司 银行卡卡号的识别方法及装置
CN111199240A (zh) * 2018-11-16 2020-05-26 马上消费金融股份有限公司 银行卡识别模型的训练方法、银行卡识别方法以及装置
CN110287963A (zh) * 2019-06-11 2019-09-27 苏州玖物互通智能科技有限公司 用于综合性能试验的ocr识别方法
CN110287963B (zh) * 2019-06-11 2021-11-23 苏州玖物互通智能科技有限公司 用于综合性能试验的ocr识别方法
CN113239785A (zh) * 2021-05-11 2021-08-10 百安居信息技术(上海)有限公司 一种基于卷积神经网络的户型自动识别的方法、系统、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN104966107A (zh) 一种基于机器学习的信用卡卡号识别方法
US10360689B2 (en) Detecting specified image identifiers on objects
KR102207533B1 (ko) 지폐 관리 방법 및 시스템
CN111178291B (zh) 一种停车支付系统以及停车支付方法
Patel et al. Automatic number plate recognition system (anpr): A survey
CN109657665B (zh) 一种基于深度学习的发票批量自动识别系统
CN104809715B (zh) 纸币图像倾斜校正与区域提取方法
CN103034848B (zh) 一种表单类型的识别方法
CN106815583B (zh) 一种基于mser和swt相结合的夜间车辆车牌定位方法
CN105139009A (zh) 一种基于边缘特征的信用卡卡号识别方法
CN102693409A (zh) 一种快速的图像中二维码码制类型识别方法
CN107563380A (zh) 一种基于mser和swt相结合的车辆车牌检测识别方法
CN108319958A (zh) 一种基于特征融合匹配的行驶证检测和识别方法
CN105404868A (zh) 一种基于交互平台的复杂背景中文本的快速检测方法
CN107195069A (zh) 一种人民币冠字号自动识别方法
CN104537376A (zh) 一种识别台标的方法及相关设备、系统
Edward V Support vector machine based automatic electric meter reading system
CN112395995A (zh) 一种根据移动财务票据自动填单及审核的方法及系统
CN103745197A (zh) 一种车牌检测方法及装置
Yamaguchi et al. Digit classification on signboards for telephone number recognition
CN108961262A (zh) 一种复杂场景下的条码定位方法
Fusek et al. Adaboost for parking lot occupation detection
CN107742357A (zh) 一种纸币冠字号的识别方法及装置
Hong et al. The image registration technique for high resolution remote sensing image in hilly area
CN115346206B (zh) 基于改进超分辨的深度卷积特征识别的车牌检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151007