CN105426892A - 图像识别的背景过滤方法 - Google Patents

图像识别的背景过滤方法 Download PDF

Info

Publication number
CN105426892A
CN105426892A CN201510979831.2A CN201510979831A CN105426892A CN 105426892 A CN105426892 A CN 105426892A CN 201510979831 A CN201510979831 A CN 201510979831A CN 105426892 A CN105426892 A CN 105426892A
Authority
CN
China
Prior art keywords
image
identification
horizontal line
pixel
prewitt operator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510979831.2A
Other languages
English (en)
Inventor
田硕
陆费汉平
姚滨晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Ctrip Business Co Ltd
Original Assignee
Shanghai Ctrip Business Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Ctrip Business Co Ltd filed Critical Shanghai Ctrip Business Co Ltd
Priority to CN201510979831.2A priority Critical patent/CN105426892A/zh
Publication of CN105426892A publication Critical patent/CN105426892A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/01Solutions for problems related to non-uniform document background
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/293Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种图像识别的背景过滤方法。所述背景过滤方法包括以下步骤:获取原始图像,使用加强的Prewitt算子对原始图像滤波后得到滤波后图像;将滤波后图像分为若干条横线,每一条横线的宽度均为一个像素的高度;计算每一条横线上灰度落入一预设灰度范围的像素点的数量作为横线的识别分数;根据每一条横线的识别分数进行滤波后图像的纵坐标识别,以得到待识别图像。本发明的图像识别的背景过滤方法能够针对浅色背景的凹凸字体的银行卡卡号进行有效、准确的纵坐标识别,从而提高后续的图像识别的准确性,并且具备更好的敏感度和抗干扰能力。

Description

图像识别的背景过滤方法
技术领域
本发明涉及一种图像识别,尤其是涉及一种图像识别的背景过滤方法。
背景技术
图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。图像识别经历了三个阶段的发展:文字识别,数字图像处理与识别,物体识别。文字识别的研究是从1950年开始的,一般是识别字母,数字和符号,从印刷文字识别到手写文字识别,应用非常广泛。
随着智能手机兴起,手机支付的行为越来越普及。但是用户在手机上输入银行卡卡号时,速度很慢,需要仔细的校对,用户体验很差。美国的PAYPAL、苹果公司,中国的阿里和腾讯等公司都在自己的手机支付软件上推出了银行卡号识别的方案。
其中,包括信用卡在内的银行卡识别的一般流程如下:纵坐标识别-Pattern识别-字符切分-字符识别-校验。银行卡号的识别中的第一步即是针对卡号所在银行卡的版面分析,识别卡号所在纵坐标,这一步的识别对于整个银行卡的识别过程而言至关重要。而通过这种纵坐标的识别,其目的就是希望能够适当地滤去背景,以使得后续的识别过程更为准确。
然而,目前仍然缺少一种能够针对浅色背景的凹凸字体的银行卡卡号的纵坐标识别方法,来进行准确的纵坐标识别,这也进而影响到了后续图像识别的准确性。
发明内容
本发明要解决的技术问题是为了克服现有技术中缺少一种能够针对浅色背景的凹凸字体的银行卡卡号的纵坐标识别方法,从而致使背景过滤后续的图像识别的准确性不够高的缺陷,提供一种图像识别的背景过滤方法。
本发明是通过下述技术方案来解决上述技术问题的:
一种图像识别的背景过滤方法,其特点在于,包括以下步骤:
步骤一、获取原始图像,使用加强的Prewitt算子对原始图像滤波后得到滤波后图像;
步骤二、将滤波后图像分为若干条横线,每一条横线的宽度均为一个像素的高度;
步骤三、计算每一条横线上灰度落入一预设灰度范围的像素点的数量作为横线的识别分数;
步骤四、根据每一条横线的识别分数进行滤波后图像的纵坐标识别,以得到待识别图像。
较佳地,步骤一的加强的Prewitt算子由下述公式定义:
若H1(i,j)>0且H2(i,j)>0,则P(i,j)=H1(i,j)+H2(i,j),否则P(i,j)=0,其中,H1(i,j)、H2(i,j)定义如下,
H1(i,j)=[f(i,j)+f(i,j-1)+f(i,j+1)]-[f(i-2,j)+f(i-2,j-1)+f(i-2,j+1)]
H2(i,j)=[f(i,j)+f(i,j-1)+f(i,j+1)]-[f(i+2,j)+f(i+2,j-1)+f(i+2,j+1)];
上述公式中,式中f(i,j)表示原始图像中坐标为(i,j)的像素点的灰度值,P(i,j)表示滤波后图像中坐标为(i,j)的像素点的灰度值,H1(i,j)和H2(i,j)分别表示坐标为(i,j)的像素点所对应的第一Prewitt算子和第二Prewitt算子。
本发明的技术方案,在已有的Prewitt算子的基础上做了限制和加强,使之得以有效、准确地用于背景过滤。这种限制和加强,实质上可以理解为通过组合3*3的矩阵构成5*5的矩阵,然后着眼于纵坐标的识别而从5*5的矩阵中去掉纵分量。去掉纵分量的加强Prewitt算子相当于两个3×3的横向Prewitt算子组合。添加约束条件为这两个Prewitt算子的计算结果都为正,才判定计算结果有效。
由于加强的Prewitt算子,采用5×5的方格,把正反各两组的Prewitt算子,分别放入相应的位置。因此,加强的Prewitt算子,对于垂直和水平的小于3像素的细线,具有明显更高的敏感度。在此基础上,在去掉纵向分量后,算子的抗干扰能力例如排除水波、横线等类型的图像造成的干扰的能力大大加强,提高了纵坐标识别的性能。进一步地,为了确保准确识别出竖的细线,加上横向的两个Prewitt算子都大于0的条件或者说约束条件。
较佳地,本发明的方法尤其适合针对原始图像为具有凹凸字体的卡片表面进行识别。
较佳地,所述凹凸字体相比于卡片表面的其他区域呈浅色。
较佳地,所述卡片为银行卡。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明的积极进步效果在于:本发明的图像识别的背景过滤方法能够针对浅色背景的凹凸字体的银行卡卡号进行有效、准确的纵坐标识别,从而提高后续的图像识别的准确性,并且具备更好的敏感度和抗干扰能力。
附图说明
图1为本发明一较佳实施例的图像识别的背景过滤方法的流程图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
本发明一较佳实施例的图像识别的背景过滤方法,其用于本发明的方法尤其适合针对原始图像为具有浅色凹凸字体的银行卡表面进行识别。参考图1所示,本实施例的背景过滤方法包括以下步骤:
步骤一、获取原始图像,使用加强的Prewitt算子对原始图像滤波后得到滤波后图像;
步骤二、将滤波后图像分为若干条横线,每一条横线的宽度均为一个像素的高度;
步骤三、计算每一条横线上灰度落入一预设灰度范围的像素点的数量作为横线的识别分数;
步骤四、根据每一条横线的识别分数进行滤波后图像的纵坐标识别,以得到待识别图像。
其中,步骤一的加强的Prewitt算子由下述公式定义:
若H1(i,j)>0且H2(i,j)>0,则P(i,j)=H1(i,j)+H2(i,j),否则P(i,j)=0,其中,H1(i,j)、H2(i,j)定义如下,
H1(i,j)=[f(i,j)+f(i,j-1)+f(i,j+1)]-[f(i-2,j)+f(i-2,j-1)+f(i-2,j+1)]
H2(i,j)=[f(i,j)+f(i,j-1)+f(i,j+1)]-[f(i+2,j)+f(i+2,j-1)+f(i+2,j+1)];
上述公式中,式中f(i,j)表示原始图像中坐标为(i,j)的像素点的灰度值,P(i,j)表示滤波后图像中坐标为(i,j)的像素点的灰度值,H1(i,j)和H2(i,j)分别表示坐标为(i,j)的像素点所对应的第一Prewitt算子和第二Prewitt算子。
本实施例采用如上所述的加强的Prewitt算子,采用5×5的方格,把正反各两组的Prewitt算子,分别放入相应的位置。因此,加强的Prewitt算子,对于垂直和水平的小于3像素的细线,具有明显更高的敏感度。在此基础上,在去掉纵向分量后,算子的抗干扰能力例如排除水波、横线等类型的图像造成的干扰的能力大大加强,提高了纵坐标识别的性能。进一步地,为了确保准确识别出竖的细线,加上横向的两个Prewitt算子都大于0的条件或者说约束条件。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (5)

1.一种图像识别的背景过滤方法,其特征在于,包括以下步骤:
步骤一、获取原始图像,使用加强的Prewitt算子对原始图像滤波后得到滤波后图像;
步骤二、将滤波后图像分为若干条横线,每一条横线的宽度均为一个像素的高度;
步骤三、计算每一条横线上灰度落入一预设灰度范围的像素点的数量作为横线的识别分数;
步骤四、根据每一条横线的识别分数进行滤波后图像的纵坐标识别,以得到待识别图像。
2.如权利要求1所述的背景过滤方法,其特征在于,步骤一的加强的Prewitt算子由下述公式定义:
若H1(i,j)>0且H2(i,j)>0,则P(i,j)=H1(i,j)+H2(i,j),否则P(i,j)=0,其中,H1(i,j)、H2(i,j)定义如下,
H1(i,j)=[f(i,j)+f(i,j-1)+f(i,j+1)]-[f(i-2,j)+f(i-2,j-1)+f(i-2,j+1)]
H2(i,j)=[f(i,j)+f(i,j-1)+f(i,j+1)]-[f(i+2,j)+f(i+2,j-1)+f(i+2,j+1)];
上述公式中,式中f(i,j)表示原始图像中坐标为(i,j)的像素点的灰度值,P(i,j)表示滤波后图像中坐标为(i,j)的像素点的灰度值,H1(i,j)和H2(i,j)分别表示坐标为(i,j)的像素点所对应的第一Prewitt算子和第二Prewitt算子。
3.如权利要求1所述背景过滤方法,其特征在于,原始图像为具有凹凸字体的卡片表面。
4.如权利要求3所述背景过滤方法,其特征在于,所述凹凸字体相比于卡片表面的其他区域呈浅色。
5.如权利要求3所述背景过滤方法,其特征在于,所述卡片为银行卡。
CN201510979831.2A 2015-12-23 2015-12-23 图像识别的背景过滤方法 Pending CN105426892A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510979831.2A CN105426892A (zh) 2015-12-23 2015-12-23 图像识别的背景过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510979831.2A CN105426892A (zh) 2015-12-23 2015-12-23 图像识别的背景过滤方法

Publications (1)

Publication Number Publication Date
CN105426892A true CN105426892A (zh) 2016-03-23

Family

ID=55505091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510979831.2A Pending CN105426892A (zh) 2015-12-23 2015-12-23 图像识别的背景过滤方法

Country Status (1)

Country Link
CN (1) CN105426892A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102721471A (zh) * 2012-07-02 2012-10-10 河北工业大学 一种光谱转换为色度的方法
CN104966077A (zh) * 2015-07-21 2015-10-07 携程计算机技术(上海)有限公司 银行卡的印刷体卡号的纵坐标的识别方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102721471A (zh) * 2012-07-02 2012-10-10 河北工业大学 一种光谱转换为色度的方法
CN104966077A (zh) * 2015-07-21 2015-10-07 携程计算机技术(上海)有限公司 银行卡的印刷体卡号的纵坐标的识别方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ADISORN LEELASANTITHAM: "A System for Checking Code Numbers Between on A Credit Card and A Paper of Personal Information", 《2009 INTERNATIONAL CONFERENCE ON COMPUTER TECHNOLOGY AND DEVELOPMENT》 *
水天一: "基于移动电话的信用卡卡号识别研究", 《中国优秀硕士学位论文全文数据库》 *

Similar Documents

Publication Publication Date Title
CN111402264B (zh) 图像区域分割方法、装置及其模型训练方法及计算机设备
CN109284758B (zh) 一种发票印章消除方法、装置和计算机存储介质
CN106650740B (zh) 一种车牌识别方法及终端
CN107832767A (zh) 集装箱箱号识别方法、装置及电子设备
CN103218605B (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
CN108009536A (zh) 扫描阅卷方法及系统
CN111160352A (zh) 一种基于图像分割的工件金属表面文字识别方法及系统
CN104809464A (zh) 一种指纹信息处理方法
CN110619333A (zh) 一种文本行分割方法、文本行分割装置及电子设备
CN105069788B (zh) 一种古建墙壁题记受污毛笔文字图像聚类分割方法
CN110570442A (zh) 一种复杂背景下轮廓检测方法、终端设备及存储介质
CN110427909B (zh) 一种移动端驾驶证检测方法、系统及电子设备和存储介质
CN109447117A (zh) 双层车牌识别方法、装置、计算机设备及存储介质
CN105117740A (zh) 字体识别方法及装置
CN103500323B (zh) 基于自适应灰度图像滤波的模板匹配方法
CN107977504B (zh) 一种非对称堆芯燃料管理计算方法、装置及终端设备
CN103455816B (zh) 一种笔画宽度提取方法、装置及一种文字识别方法、系统
CN109740554A (zh) 一种道路边缘线识别方法及系统
CN109145723A (zh) 一种印章识别方法、系统、终端装置及存储介质
CN104966109A (zh) 医疗化验单图像分类方法及装置
CN113393430A (zh) 用于风机叶片缺陷检测的热成像图像增强训练方法和装置
CN103761520B (zh) 基于笔划宽度的文档图像无参二值化方法
CN107766865A (zh) 池化方法、物体检测方法、装置、系统及计算机可读介质
CN112418089A (zh) 一种手势识别方法、装置及终端
CN111754419A (zh) 图像处理方法、训练方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160323