CN105528601A - 基于接触式传感器的身份证图像采集、识别系统及采集识别方法 - Google Patents

基于接触式传感器的身份证图像采集、识别系统及采集识别方法 Download PDF

Info

Publication number
CN105528601A
CN105528601A CN201610104273.XA CN201610104273A CN105528601A CN 105528601 A CN105528601 A CN 105528601A CN 201610104273 A CN201610104273 A CN 201610104273A CN 105528601 A CN105528601 A CN 105528601A
Authority
CN
China
Prior art keywords
character
image
card image
module
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610104273.XA
Other languages
English (en)
Inventor
尤新革
周春然
徐端全
黄山
涂云
江浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Shenzhen Huazhong University of Science and Technology Research Institute
Original Assignee
Huazhong University of Science and Technology
Shenzhen Huazhong University of Science and Technology Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology, Shenzhen Huazhong University of Science and Technology Research Institute filed Critical Huazhong University of Science and Technology
Priority to CN201610104273.XA priority Critical patent/CN105528601A/zh
Publication of CN105528601A publication Critical patent/CN105528601A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/147Details of sensors, e.g. sensor lenses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/34Smoothing or thinning of the pattern; Morphological operations; Skeletonisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Vascular Medicine (AREA)
  • Character Input (AREA)

Abstract

本发明提供了一种基于接触式传感器的身份证图像采集、识别系统及采集识别方法,本方法依次包括以下步骤:S1)终端控制系统开始采集,通过接触式传感器获取身份证图像,并将采集得到的身份证图像上传到终端;S2)终端通过图像分割算法提取身份证图像的有用信息区块;S3)对相应区块图像进行预处理,并在区块中进行字符分割;S4)对分割后的字符图像进行归一化处理然后提取字符特征,利用分类器对特征进行分类并最终识别身份证信息;S5)自动存储身份证图像和信息并打印出身份证图像。本方法可实现身份证图像的快速采集并准确识别身份证信息,进而支持银行,海关等终端系统快速地采集身份证图像并录入身份证信息。

Description

基于接触式传感器的身份证图像采集、识别系统及采集识别方法
技术领域
本发明涉及一种身份证图像采集、识别技术,尤其是一种基于接触式传感器的身份证图像采集、识别系统及采集识别方法;属于图像处理、机器学习、模式识别、数字信号处理技术领域
背景技术
身份证是我国居民身份的象征,记录了公民的基本个人信息和独一无二的身份证编号。目前,身份证登记大多采用人工录入的方式,这不但耗时,而且效率低下。因此,如何利用计算机技术,高速有效完整地录入个人信息、并进行相应的管理和验证,这已成为许多信息登记录入系统中急需解决的问题。
传统的身份证图像采集是用摄像头拍摄的,这需要给摄像头配备专门的光源,且需要给拍摄预留较大的空间,不仅导致该系统的机械机构复杂,体积大,而且适用性不强。因此,现有的身份证登记录入、识别系统在实际使用中存在以下几个问题:
1、采集的身份证图像质量不高,导致后期识别率低。
2、身份证图像的背景复杂:身份证的背景是由阴影网格线、激光防伪标识构成的,这对身份证有用信息的提取造成了很大的阻碍。
3、身份证上涉及的汉字非常多,而且结构复杂,这对汉字的识别也是一个挑战。
因此,如何进一步提高身份证图像采集质量,提高识别技术的可靠性已经成为相关研发部门和使用部门的一种期望。
发明内容
本发明的目的:旨在提供一种基于接触式传感器的身份图像采集、识别系统及采集识别方法,实现身份证图像的快速采集并准确识别身份证信息;进而支持银行,海关等终端系统快速地采集身份证图像并录入身份证信息。
本发明的上述发明目的通过以下技术方案实现:
这种基于接触式传感器的身份证图像采集、识别系统,包括图像采集模块、终端处理模块、打印机输出模块;图像采集模块首先通过上下两个CIS传感器同时采集身份证正、反面图像信息,然后将图像数据通过两个独立的CIS接口传输到图像采集电路,图像采集电路对原始数据进行处理并通过USB接口上传到终端处理模块;终端处理模块利用图像处理算法快速准确的识别身份证信息,并将身份证正、反面图像发送到打印输出模块、并经过打印机可以及时打印出身份证的正、反面图像。
所述的图像采集模块包括:CIS接口电路模块、模数转换模块、DDR、EPCS存储模块、FPGA模块、USB控制模块、USB接口及直流供电电路,所述的CIS接口电路模块的输入端分别与上、下CIS传感器电连接,并经CIS传感器电连接的输出端与FPGA模块电连接,所述的FPGA模块设有三个输出端,其中的两个输出端分别与DDR和EPCS存储模块建立双向数据连接关系,而另一个输出端则与USB控制模块连接,构成与USB接口连接的身份证图像输出接口;所述的直流供电电路则负责整个图像采集模块的供电电源。
所述的直流供电电路以5V直流电源为外接输入电源,该外接输入电源分成两支路,其中的一支路经一∏型滤波电路直接为CIS光源、模/数转换模块供电,其中的另一支路经TPS650243变换后分别分成四个支路构成分别向系统供电和向CIS传感器供电的3.3V电源、向FPGA模块内核和USB控制模块内核供电的1.2V电源,向FPGA模块、DDRSDRAM模块供电的1.8V电源,以及向FPGA模块供电的2.5V电源。
这种基于接触式传感器的身份证图像采集、识别系统及采集识别方法,中的采集、识别方法,包括以下步骤:
S1)终端控制系统开始采集,通过两接触式传感器CIS获取身份证图像,并将采集得到的身份证图像上传到终端处理模块;
S2)终端处理模块通过图像分割算法提取身份证图像的有用信息区块;
S3)对相应区块图像进行预处理,并在区块中进行字符分割;
S4)对分割后的字符图像进行归一化处理然后提取字符特征,利用分类器对特征进行分类并最终识别身份证信息;
S5)自动存储身份证图像和信息并打印出身份证图像。
进一步地,步骤S2中,对身份证有用信息区块的分割是通过一个分割模板去掉无用信息并提取出所需的身份证文字信息子图块。
进一步地,步骤S3中,对区块图像的预处理首先应用基于图像灰度期望值的二值化方法将图像二值化,然后应用基于形态学的噪声滤除方法进行图像去噪,最后对图像进行平滑处理。
进一步地,步骤S3中,字符文本的定位与分割包括字符的行分割和单个字符分割,该分割利用水平投影和垂直投影的方法实现。
进一步地,步骤S4中,对字符图像的归一化包括字符位置归一化以及尺寸大小归一化,然后提取字符的笔划密度特征,并训练最小二乘支持向量机(LSSVM)分类器对特征进行分类。
所述的二值化是把一幅具有多灰度级分布的图像转变为只有黑、白两个灰度级的二值图像;图像二值化与图像分割是相辅相成的,如果一幅图像中的目标已经从背景中分割出来,就可以把目标灰度级变为白,背景灰度级变为黑,也就完成了二值化;它是以图像灰度的数学期望为阈值的二值化方法;在数字图像中,每一个像素的值均属于一个有限的灰度级合集,设尺寸为MXN的图像中灰度级取值为L1,L2,…,LN,阈值可以用下面的公式来计算:
u t h r e s h o l d = Σ n = 1 N L n P ( L n ) = Σ n = 1 N L n h ( L n ) Σ m = 1 N h ( L m ) = Σ n = 1 N L n h ( L n ) / Σ n = 1 N h ( L n )
其中:P(Li)为图像中灰度Li出现的次数频率,
h(Ln)为图像中灰度Ln出现的次数。
根据以上技术方案提出的这种基于接触式传感器的身份图像采集、识别系统及采集识别方法,与现在普遍使用的身份证设别系统相比较,不仅可以同时采集被识别身份证两面的图像文字信息,而且可以及时将所采集的图像输出,因此不仅具有较快的识别功能,同时也具有优良的识别性能。
附图说明
图1为应用于本发明的身份证图像采集、识别系统的结构图;
图2为应用于本发明的身份证图像采集模块的结构图;
图3为应用于本发明的身份证图像采集模块电路的结构框图;
图4为应用于本发明的身份证图像采集模块电路的直流供电方案;
图5为身份证图像采集、识别系统的工作流程图;
图6为应用于本发明的身份证图像分割模板;
图7为应用于本发明的笔划特征提取的13点特征示意图。
具体实施方式
以下结合说明书附图进一步阐述本发明,并给出本发明的实施例。
如图1所示,这种基于接触式传感器的身份证图像采集、识别系统,通常包括以下几个节:图像采集、图像中字符的定位与分割、身份证字符识别、结果打印等。
这种基于接触式传感器的身份证图像采集、识别系统,包括图像采集模块、终端处理模块、打印机输出模块;图像采集模块首先通过上下两个CIS传感器同时采集身份证正、反面图像信息,然后将图像数据通过两个独立的CIS接口传输到图像采集电路,图像采集电路对原始数据进行处理并通过USB接口上传到终端处理模块;终端处理模块利用图像处理算法快速准确的识别身份证信息,并将身份证正、反面图像发送到打印输出模块、并景大印机可以及时打印出身份证的正、反面图像。
一、本系统各模块的设计与交互。
如图2所示,本身份证图像采集、识别系统包括图像采集模块、终端处理模块、打印机输出模块。
图像采集模块主要由硬件电路板和接触式传感器以及相应的机械结构组成,它是通过CIS接口电路模块从两个接触式传感器(CIS)获取图像,然后通过硬件电路板上的USB接口上传到终端进行处理。终端主要是进行图像处理以及信息的交互,它先对身份证图像进行预处理,然后通过图像分割算法提取身份证的有用信息区块,并对区块进行字符分割,对分割后的字符进行特征提取,利用分类器对特征进行分类并最终识别身份证信息。打印机模块通过USB接口与终端连接,终端将处理后的身份证图像传输到打印机并通知打印机进行打印。
二、图像采集模块的电路设计。
如图3所示,身份证图像采集模块的电路包括电源电路、CIS接口电路和USB数据传输电路。电源电路与两CIS接口电路和USB数据传输电路均相连,CIS接口电路接至USB数据传输电路,本发明所应用的是单通道的CIS传感器。CIS接口电路包括依次相连的CIS接口电路模块、模/数转换控制器和FPGA(现场可编程门阵列)器件及图像缓存。
模/数转换控制器采用一片HT82V26芯片,它支持三路输入,因为本发明中采用的是单通道的CIS传感器,所以它可同时对上下两路的CIS传感器采集的数据进行处理。FPGA模块采用ALTER公司的EP3C16F484C8N,其外接一片DDRSDRAM(双倍速率同步动态随机存储器)芯片和一片EPCS(串行存储器)芯片。USB数据传输电路采用赛普拉斯公司生产的型号为CYUSB3014的USB控制芯片。基于USB控制芯片内部集成的USB接口,实现对外USB通信。
电源电路接受5V的直流电源输入,通过电源管理芯片,可产生4路电源输出。分别是3.3V,1.8V,1.2V,2.5V。3.3V为整个系统提供直流供电。1.8V直流电压接至FPGA以及DDRSDRAM存储器。1.2V直流电压接至USB控制模块。在CIS接口电路方面,5V的直流电压为外部CIS传感器的光源供电,3.3V的直流电压为外部CIS传感器的内部逻辑电路供电
三、身份证图像有用信息区块的提取。
身份证是由国家统一监管制作的,所以它是一种具有规范格式的证件,它的总体布局是统一的。身份证有用信息基本分布在身份证的反面,反面左侧的个人信息按行排列、顺序依次为姓名,性别、民族,出生年月,住址,身份证号码。同时每一行的位置大致固定,所以我们可以根据公安部统一制定的身份证规格,设定一个身份证信息图块的分割模板,通过这个分割模板可以切掉身份证图像右侧的无用信息(头像区域),提取出所需的身份证文字信息子图块,通常每个子图块一般都会设定得比较大,它只是起到确定文字行大致区域的作用,从而降低背景噪声的干扰。分割模板如图4所示。
四、区块图像预处理的方法。
对区块图像的预处理是先将图像进行二值化,然后对图像进行去噪和平滑处理。
图像二值化处理方法是把一幅具有多灰度级分布的图像转变为只有黑、白两个灰度级的二值图像。图像二值化与图像分割是相辅相成的,如果一幅图像中的目标已经从背景中分割出来,我们就可以把目标灰度级变为白,背景灰度级变为黑,也就完成了二值化。
本发明应用基于图像灰度期望值的二值化方法。该方法是以图像灰度的数学期望为阈值的二值化方法。在数字图像中,每一个像素的值均属于一个有限的灰度级合集,设尺寸为MXN的图像中灰度级取值为L1,L2,…,LN,P(Li)为图像中灰度Li出现的次数频率,
h(Ln)为图像中灰度Ln出现的次数,则阈值可以用下面的公式来计算:
u t h r e s h o l d = Σ n = 1 N L n P ( L n ) = Σ n = 1 N L n h ( L n ) Σ m = 1 N h ( L m ) = Σ n = 1 N L n h ( L n ) / Σ n = 1 N h ( L n )
也即整幅图像的灰度平均值,该算法是一种适应性较广泛的全局阈值法,对于具有不同灰度的图像均可应用,摆脱了传统的基于直方图的阈值分割法对图像模型的假设,且计算简单。极大的提高了处理速度。
由于扫描仪的光照影响、身份证自身的打印质量及阴影网格线和激光防伪标识的干扰。二值图像中仍会残留一些麻点噪声、空洞、断点和毛刺,从而造成字符边界不光滑且存在突变点,这将影响后续的识别效果。因此我们需要对二值图像进行噪声的过滤和平滑处理。
本发明中应用基于形态学的噪声滤除方法,形态学是建立在集合论的基础上,可以成功地应用于二值图像中,其基本运算是通过集合的并、交和补等来定义的。因而在运算过程中需要两个集合:一是输入的图像;二是结构元素。结构元素其实也是一副图像,具有一定的几何形状,并通常包含原点,其尺寸相对地远小于所考察的图像。身份证图像是一个二维的点阵集合,可用二维矩阵A表示,A(x,y)表示像素点(x,y)处的灰度值,K表示对输入图像A运算的结构元素矩阵。本发明中应用图像的闭运算即先膨胀后腐蚀的过程。假设二值化后的身份证图像的灰度值为f(x,y),用0来表示背景像素(白像素),1表示字符像素(黑像素),用于形态封闭的结构算子K为一个3x3的窗口,原点P位于窗口的中心位置。先用算子K对图像进行膨胀,即检测图中每个白像素点P的8领域中是否存在黑像素,如果有则将P变为黑像素。然后对膨胀后的图像用K算子的反射(由于原点在窗口中心位置,所以K的反射等于自身)进行腐蚀,即检测膨胀处理后的图像的每个黑像素点(设为P)的8领域中是否存在白像素点,如果有则将P变为白像素,这样经过闭运算后,即可有效消除图像中的空洞、折点,从而减少后续识别的误差。
经过噪声处理后的二值图像,虽然小空洞明显减少,但图像中可能包含孤立的黑白像素点,字符边缘的毛刺现象依然存在,这些都会影响后面的字符分割和识别的准确度,因此还需要进一步消除毛刺。这样才能尽可能地减少噪声干扰,平滑笔划边缘、填补空洞、改善线条质量,降低后续处理的算法复杂度。
本发明中对一幅二值图像的平滑处理包括以下内容:
1)填充由黑像素包围的白像素;
2)填充边缘上的白像素凹洞;
3)消除孤立点;
4)消除边缘上的黑像素凸起。
本发明应用的具体方法是:在有噪声的图像中,开一个一定大小的窗口对准第(i,j)个像素,根据窗口内值为1的个数是否超过某一个设定的阈值,来确定平滑后的图像中第(i,j)个像素的值是1还是0,对于图像中的每个像素重复这一过程。经过上述平滑处理,基本消除了图像中的毛刺和空洞的影响,进一步的文本分割打下基础。
五、字符文本的定位与分割。
字符文本的定位与分割主要由两部分组成,即行分割和单个字符分割。字符文本经转换后以一个相当大的二值点阵表示,文本中的每个汉字是其中的一个子点阵,字符文本分割就是要按照顺序将每个子点阵抽取出来。首先,由于汉字文本行与行之间有较大的间隙,可将前面或后面连续有若干行空白的行作为行的起始或结束的地方,完成行分割;其次,将分离出来的每行汉字点阵(由若干点阵行组成)在垂直方向上进行搜索,将左边或者右边连续出现若干列空白的地方作为字符与字符之间的切割点,完成字符分割。
用水平投影方法进行文字行的水平方向定位,即对二值图像从上到下逐行扫描,同时计算每一扫描行的像素累加和。设二值化后图像的宽度为L;高度为H;则作水平方向投影,累加各行上的黑色像素点为:
P i x S u m ( i ) = Σ j = 0 L - 1 f ( i , j )
其中,PixSum(i)表示第i行上黑色像素点的累加和,f(i,j)表示各个像素点的值,若该点为背景像素则f(i,j)=0,若为目标像素则f(i,j)=1;i表示该像素点所在的行(0≤i<H),j表示该像素点所在的列。这样我们就可以得到一个水平方向的投影直方图,根据身份证上文字的排列特征,在包含有文字的行的位置上会产生明显的峰值,而文字的行与行之间虽然有干扰点的存在,但是在投影图中仍然会产生明显的峰值。利用文字行间的空白间隔造成的水平投影空隙,即可确定出各行之间上下边界的大致位置。
单个字符分割是指将字符串图像切割成为单个字符的过程。身份证上的字符主要是汉字和数字,以及新身份证上出现的字母“X”,这些字符的大小、字体及其间隔都有一定的规律,因此字符分割主要采用垂直投影的方法,并利用字符大小、间距等先验知识。在二值图像中,黑色像素点(字符)的值取为“1”,白色像素点(背景)的值为“0”。如果某一行或某一列没有出现字符笔划,则该行或该列的投影和一定为0,也就是说对前面分割出来的文字行图像做垂直方向上的投影时,可以很明显的看到相邻字符之间间隔的投影值正好处于波谷的位置,字符间隔的垂直投影值为0,根据这个特点就可以轻松地找到字符间隙,确定出字符的切割点。满足下式的j为投影值为0的列:
Σ i = 1 H e i g h t f ( i , j ) = 0
其中,Height为文字行的高度。
由于分割得到的待识别字符图像存在大小上的差异,为保证后续特征提取具有相同的前提条件,必须对字符图像进行归一化处理。为了解决这一问题,就要对字符图像进行归一化处理,它不仅仅是宽和高同比例的缩放,还要求保持字符的拓扑不变,能够最大限度的突出所提取特征。本发明主要用到了字符位置归一化以及尺寸大小归一化。
六、对字符图像做归一化处理然后提取字符特征,并利用支持向量机分类器对特征进行分类。
由于分割得到的待识别字符图像存在大小上的差异,为保证后续特征提取具有相同的前提条件,必须对字符图像进行归一化处理。为了解决这一问题,就要对字符图像进行归一化处理,它不仅仅是宽和高同比例的缩放,还要求保持字符的拓扑不变,能够最大限度的突出所提取特征。本发明主要用到了字符位置归一化以及尺寸大小归一化。
位置归一化即为了消除字符点阵位置上的偏差,需要将整个字符点阵图形移动到规定的位置上。本发明应用基于质心的位置归一化方法,首先需要计算出字符的质心,然后再把质心移动到指定的位置上来。因为质心的计算是全局性的,所以基于质心的位置归一化的抗干扰能力比较强。
分割后的字符图像尺寸通常不一致,在提取字符特征前要做大小归一化处理,使之成为相同尺寸大小的字符图像,以便消除字体大小的影响。本发明应用根据字符图像的边框按比例线型缩小或者放大为预设的尺寸。设原图像某像素坐标为(x,y)大小为X×Y,归一化后的图像为M×N,某像素点坐标为(m,n),坐标变换通过下式来计算:
m = x × M X
n = y × N Y
在归一化后,一些像素点的坐标因变换而偏离原坐标位置,引起图像部分信息丢失。为了解决这个问题,引入双线性插值法,利用插值点邻近的四个像素点的灰度值,计算插值点的灰度值,用以方便后续对字符图像提取字符特征。
本发明根据汉字的笔划来提取笔划密度特征是根据汉字的笔划来提取笔划密度特征。一条扫描线按某一个方向与字符像素点交叉的次数作为该方向的笔划密度。在字符X水平方向中间线,Y竖直方向的中间线和两条对角线方向计算它们根据这样方向得出的与字符像素交叉点的笔划密度,作为这个字符的特征值。笔划密度特征对字符的倾斜、放大或缩小等鲁棒性强。为了提高相似字符的识别率与提升字符的识别速度,降低特征提取的维数,增强特征提取的稳定性,本发明应用13点特征,具体方法如下。
首先将一个字符图像大小W×H(W、H分别为字符图像的行宽、列高)分割成8个相同大小子模块,分别统计8个子模块内白色像素值“0”的个数nm(m=1,2…,8),分别用下式可得到1至8点特征和第9点特征,如图7(a)(b)所示
n m = Σ i W 2 + i Σ j H 4 + j a i j , j = 1 , 2 , 3 , 4 ; j = 1 , 2
n9=Σnmm=1,2,…,8
其中,第9点特征是统计字符内所有的黑色像素值“1”总数。为了得到10至13点特征,取字符图像中两条将图像等分成三部分的水平线,根据下式计算两条水平线上的黑色像素值为“1”的个数
n h i = Σ i = 1 W a i , i = 1 , 2 , ... , W ; d = 1 , 2
以此得到第10点和第11点特征,同理取字符图像中两条将图像等分成三部分的竖直线,根据下式计算每列的黑色像素值为“1”的个数
n v i = Σ i = 1 H a j , j = 1 , 2 , ... , H ; v = 1 , 2
以此得到第12点和第13点特征,如图7(c)(d)所示。
对于支持向量机分类器的构建,本发明应用最小二乘支持向量机(LSSVM)算法。在设计LSSVM时,假设现在共有N个不同的文字字符,需预先对类的编号进行定义。在此选择该N个字符的unicode编码中作为字符图像特征向量所属的类别编号,构建出1xN类别向量T。本发明构建了输入数据为笔划特征的LSSVM字符分类器。
在训练LSSVM学习器时,需要对核函数、核函数参数、惩罚因子等参数进行初始化。鉴于高斯核函数实用性强且需要调整的参数只有一个带宽,本发明应用高斯核作为LSSVM核函数。惩罚因子及高斯参数的确定目前尚无明确的理论指导,需在实施中多次计算以确定最优的参数。LSSVM参数初始化完成后,便可以用特征向量组成的样本数据以及目标向量对LSSVM进行训练。
七、为系统增加自动打印功能。
本系统终端与打印机模块连接。在实际应用中,银行,海关等系统通常需要将客户的身份证正、反面图像打印并留存。身份证图像的自动打印将大大减少银行职员的工作量并节省客户的时间。本发明将终端通过USB接口与打印机模块进行连接,并将打印命令和打印数据通过USB接口进行传输。本系统完成了从图像采集、处理到输出的整套流程。
本发明提出的这种技术方案解决了以下及几个问题:
1.本系统各模块的设计与交互。
2.图像采集模块的电路设计。
3.身份证图像有用信息区块的提取。
4.区块图像预处理的方法。
5.字符文本的定位与分割。
6.对字符图像做归一化处理然后提取字符特征,并利用支持向量机分类器对特征进行分类。
7.为系统增加自动打印功能。
经实际使用表明:本发明提出这种基于接触式传感器的身份证图像采集、识别系统及其采集识别方法,可实现身份证图像的快速采集并准确识别身份证信息,进而支持银行,海关等终端系统快速地采集身份证图像并录入身份证信息。
以上仅仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润也应视为本发明的保护范围。

Claims (13)

1.一种基于接触式传感器的身份证图像采集、识别系统,其特征在于:包括图像采集模块、终端处理模块、打印机输出模块;图像采集模块首先通过上下两个CIS传感器同时采集身份证正、反面图像信息,然后将图像数据通过两个独立的CIS接口传输到图像采集电路,图像采集电路对原始数据进行处理并通过USB接口上传到终端处理模块;终端处理模块利用图像处理算法快速准确的识别身份证信息,并将身份证正、反面图像发送到打印输出模块、并经打印机可以及时打印出身份证的正、反面图像。
2.如权利要求1所述的一种基于接触式传感器的身份证图像采集、识别系统,其特征在于:所述的图像采集模块包括:CIS接口电路模块、模数转换模块、DDR、EPCS存储模块、FPGA模块、USB控制模块、USB接口及直流供电电路,所述的CIS接口电路模块的输入端分别与上、下CIS传感器电连接,并经CIS传感器电连接的输出端与、FPGA模块电连接,所述的FPGA模块设有三个输出端,其中的两个输出端分别与DDR和EPCS存储模块建立双向数据连接关系,而另一个输出端则与USB控制模块连接,构成与USB接口连接的身份证图像输出接口;所述的直流供电电路则负责整个图像采集模块的供电电源。
3.如权利要求1或2所述的一种基于接触式传感器的身份证图像采集、识别系统,其特征在于:所述的直流供电电路以5V直流电源为外接输入电源,该外接输入电源分成两支路,其中的一支路经一∏型滤波电路直接为CIS光源供电模/数转换控制器供电,其中的另一支路经TPS650243变换后分别分成四个支路构成分别向系统供电的3.3V电源、向FPGA模块内核和USB控制模块内核供电的1.2V电源,向FPGA模块、DDRSDRAM模块供电的1.8V电源,以及向FPGA模块供电的2.5V电源。
4.一种基于接触式传感器的身份证图像采集、识别方法,其身份证图像的采集依次包括以下步骤:
S1)终端控制系统开始采集,通过接触式传感器获取身份证上、下两面图像,并将采集得到的身份证图像上传到终端;
S2)终端通过图像分割算法提取身份证图像的有用信息区块;
S3)对相应区块图像进行预处理,并在区块中进行字符分割;
S4)对分割后的字符图像进行归一化处理然后提取字符特征,利用分类器对特征进行分类并最终识别身份证信息;
S5)自动存储身份证图像和信息并打印出身份证图像。
5.如要求4所述的一种基于接触式传感器的身份证图像采集、识别方法,其特征在于:步骤S2中,对身份证有用信息区块的分割是通过一个分割模板去掉无用信息并提取出所需
的身份证文字信息子图块。
6.如权利要求4所述的一种基于接触式传感器的身份证图像采集、识别方法,其特征在于:步骤S3中,对区块图像的预处理首先应用基于图像灰度期望值的二值化方法将图像进行二值化处理,然后应用基于形态学的噪声滤除方法进行图像去噪,最后对图像进行平滑处理。
7.如权利要求4所述的一种基于接触式传感器的身份证图像采集、识别方法,其特征在于:步骤S3中,字符文本的定位与分割包括字符的行分割和单个字符分割,该分割利用水平投影和垂直投影的方法实现。
8.如权利要求4所述的一种基于接触式传感器的身份证图像采集、识别方法,其特征在于:步骤S4中,对字符图像归一化包括字符位置归一化以及尺寸大小归一化,然后提取字符的笔划密度特征,并训练最小二乘支持向量机分类器对特征进行分类。
9.如权利要求6所述的一种基于接触式传感器的身份证图像采集、识别方法,其特征在于:所述的二值化是以图像灰度的数学期望为阈值的,在数字图像中,每一个像素的值均属于一个有限的灰度级合集,设尺寸为MXN的图像中灰度级取值为L1,L2,…,LN,阈值可以用下面的公式来计算:
u t h r e s h o l d = Σ n = 1 N L n P ( L n ) = Σ n = 1 N L n h ( L n ) Σ m = 1 N h ( L m ) = Σ n = 1 N L n h ( L n ) / Σ n = 1 N h ( L n )
其中:P(Li)为图像中灰度Li出现的次数频率,
h(Ln)为图像中灰度Ln出现的次数。
10.如权利要求7所述的一种基于接触式传感器的身份证图像采集、识别方法,其特征在于:所述的字符文本的定位方法如下:
首先进行汉字文本行分割,可将前面或后面连续有若干行空白的行作为行的起始或结束的地方,完成行分割;
其次,将分离出来的由若干点阵行组成的每行汉字点阵在垂直方向上进行搜索,将左边或者右边连续出现若干列空白的地方作为字符与字符之间的切割点,完成字符分割。
随后,用水平投影方法进行文字行的水平方向定位,即对二值图像从上到下逐行扫描,同时计算每一扫描行的像素累加和;设二值化后图像的宽度为L;高度为H;则作水平方向投影,累加各行上的黑色像素点为:
P i x S u m ( i ) = Σ j = 0 L - 1 f ( i , j )
其中,PixSum(i)表示第i行上黑色像素点的累加和,f(i,j)表示各个像素点的值,若该点为背景像素则f(i,j)=0,若为目标像素则f(i,j)=1;i表示该像素点所在的行(0≤i<H),j表示该像素点所在的列;
这样就可以得到一个水平方向的投影直方图,根据身份证上文字的排列特征,在包含有文字的行的位置上会产生明显的峰值,而文字的行与行之间虽然有干扰点的存在,但是在投影图中仍然会产生明显的峰值,利用文字行间的空白间隔造成的水平投影空隙,即可确定出各行之间上下边界的大致位置;由此实现字符文本的定位。
11.如权利要求7所述的一种基于接触式传感器的身份证图像采集、识别方法,其特征在于:所述的单个字符分割是指将字符串图像切割成为单个字符的过程;字符分割主要采用垂直投影的方法,并利用字符大小、间距等先验知识;在二值图像中定义:黑色的字符像素点的值取为“1”,白色背景像素点的值为“0”;如果某一行或某一列没有出现字符笔划,则该行或该列的投影和一定为0,也就是说对前面分割出来的文字行图像做垂直方向上的投影时,可以很明显的看到相邻字符之间间隔的投影值正好处于波谷的位置,字符间隔的垂直投影值为0,根据这个特点就可以轻松地找到字符间隙,确定出字符的切割点。满足下式的j为投影值为0的列:
Σ i = 1 H e i g h t f ( i , j ) = 0
其中,Height为文字行的高度;
考虑到分割得到的待识别字符图像存在大小上的差异,为保证后续特征提取具有相同的前提条件,必须对字符图像进行归一化处理。
12.如权利要11所述的一种基于接触式传感器的身份证图像采集、识别方法,其特征在于:所述的归一化处理包括:字符位置归一化以及字符尺寸大小归一化;字符位置归一化采用基于质心的位置归一化方法,首先需要计算出字符的质心,然后再把质心移动到指定的位置上来,将整个字符点阵图形移动到规定的位置上;所述的字符尺寸大小归一化根据字符图像的边框按比例线型缩小或者放大为预设的尺寸;在归一化后,一些像素点的坐标因变换而偏离原坐标位置,引起图像部分信息丢失。为了解决这个问题,引入双线性插值法,利用插值点邻近的四个像素点的灰度值,计算插值点的灰度值,方便后续对字符图像提取字符特征。
13.如权利要求12所述的一种基于接触式传感器的身份证图像采集、识别方法,其特征在于:所述的对字符图像提取字符特征是根据汉字的笔划来提取笔划密度特征的,其确定方法如下:
首先将一个字符图像大小W×H分割成8个相同大小子模块,分别统计8个子模块内白色像素值“0”的个数nm(m=1,2…,8),分别用下式可得到1至8点特征和第9点特征,
n m = Σ i W 2 + i Σ j H 4 + j a i j , j = 1 , 2 , 3 , 4 ; j = 1 , 2
n9=∑nmm=1,2,…,8
其中,W、H分别为字符图像的行宽、列高;第9点特征是统计字符内所有的黑色像素值“1”总数;为了得到10至13点特征,取字符图像中两条将图像等分成三部分的水平线,根据下式计算两条水平线上的黑色像素值为“1”的个数
n h i = Σ i = 1 W a i , i = 1 , 2 , ... , W ; d = 1 , 2
以此得到第10点和第11点特征,同理取字符图像中两条将图像等分成三部分的竖直线,根据下式计算每列的黑色像素值为“1”的个数
n v i = Σ i = 1 H a j , j = 1 , 2 , ... , H ; v = 1 , 2
以此得到第12点和第13点特征。
CN201610104273.XA 2016-02-25 2016-02-25 基于接触式传感器的身份证图像采集、识别系统及采集识别方法 Pending CN105528601A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610104273.XA CN105528601A (zh) 2016-02-25 2016-02-25 基于接触式传感器的身份证图像采集、识别系统及采集识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610104273.XA CN105528601A (zh) 2016-02-25 2016-02-25 基于接触式传感器的身份证图像采集、识别系统及采集识别方法

Publications (1)

Publication Number Publication Date
CN105528601A true CN105528601A (zh) 2016-04-27

Family

ID=55770815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610104273.XA Pending CN105528601A (zh) 2016-02-25 2016-02-25 基于接触式传感器的身份证图像采集、识别系统及采集识别方法

Country Status (1)

Country Link
CN (1) CN105528601A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956578A (zh) * 2016-05-23 2016-09-21 深圳华中科技大学研究院 一种基于身份证件信息的人脸验证方法
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN106529616A (zh) * 2016-10-14 2017-03-22 国政通科技股份有限公司 一种对身份证进行验证的方法
CN106534074A (zh) * 2016-10-14 2017-03-22 国政通科技股份有限公司 一种通过图像比对实现数据补全的方法
CN106547912A (zh) * 2016-11-25 2017-03-29 西安理工大学 身份证数据库中非二代身份证照片的识别和剔除方法
CN106599896A (zh) * 2016-11-08 2017-04-26 广州视源电子科技股份有限公司 一种字符分割方法和装置、及元件检测方法和装置
CN106599889A (zh) * 2016-12-17 2017-04-26 北京小米移动软件有限公司 一种识别字符的方法和装置
CN106846011A (zh) * 2016-12-30 2017-06-13 金蝶软件(中国)有限公司 营业执照识别方法和装置
CN107330429A (zh) * 2017-05-17 2017-11-07 北京捷通华声科技股份有限公司 一种证件条目的定位方法和装置
CN108563990A (zh) * 2018-03-08 2018-09-21 南京华科和鼎信息科技有限公司 一种基于cis图像采集系统的证照鉴伪方法及系统
CN108573260A (zh) * 2018-03-29 2018-09-25 广东欧珀移动通信有限公司 信息处理方法和装置、电子设备、计算机可读存储介质
CN108960210A (zh) * 2018-08-10 2018-12-07 武汉优品楚鼎科技有限公司 一种研报板式识别和分割的方法、系统及装置
CN109117839A (zh) * 2018-08-14 2019-01-01 惠龙易通国际物流股份有限公司 一种信息校验方法及装置
CN109447169A (zh) * 2018-11-02 2019-03-08 北京旷视科技有限公司 图像处理方法及其模型的训练方法、装置和电子系统
CN109727011A (zh) * 2018-05-22 2019-05-07 中国平安人寿保险股份有限公司 保费缴纳方法、装置、设备及计算机可读存储介质
CN110414517A (zh) * 2019-04-18 2019-11-05 河北神玥软件科技股份有限公司 一种用于配合拍照场景的快速高精度身份证文本识别算法
CN110502193A (zh) * 2019-07-19 2019-11-26 广州奔想智能科技有限公司 一种身份证打印方法、系统和存储介质
CN111639646A (zh) * 2020-05-18 2020-09-08 山东大学 一种基于深度学习的试卷手写英文字符识别方法及系统
CN111986117A (zh) * 2020-08-31 2020-11-24 南京大学 一种算术作业批改系统及方法
CN113313197A (zh) * 2021-06-17 2021-08-27 哈尔滨工业大学 一种全连接神经网络训练方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464960A (zh) * 2007-12-20 2009-06-24 北京思创银联科技有限公司 一种读取身份证信息并打印的设备和方法
CN105046808A (zh) * 2015-09-11 2015-11-11 华中科技大学 一种纸币多光谱高分辨率图像采集系统及采集方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464960A (zh) * 2007-12-20 2009-06-24 北京思创银联科技有限公司 一种读取身份证信息并打印的设备和方法
CN105046808A (zh) * 2015-09-11 2015-11-11 华中科技大学 一种纸币多光谱高分辨率图像采集系统及采集方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
宋韧: "基于图像处理和模式识别的身份证识别系统设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
李静 等: "二代身份证的自动分割方法研究", 《计算机工程与应用》 *
高永英 等: "一种基于灰度期望值的图象二值化算法", 《中国图象图形学报》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956578A (zh) * 2016-05-23 2016-09-21 深圳华中科技大学研究院 一种基于身份证件信息的人脸验证方法
CN105956578B (zh) * 2016-05-23 2019-05-14 深圳华中科技大学研究院 一种基于身份证件信息的人脸验证方法
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN106529616A (zh) * 2016-10-14 2017-03-22 国政通科技股份有限公司 一种对身份证进行验证的方法
CN106534074A (zh) * 2016-10-14 2017-03-22 国政通科技股份有限公司 一种通过图像比对实现数据补全的方法
WO2018086233A1 (zh) * 2016-11-08 2018-05-17 广州视源电子科技股份有限公司 一种字符分割方法和装置、及元件检测方法和装置
CN106599896A (zh) * 2016-11-08 2017-04-26 广州视源电子科技股份有限公司 一种字符分割方法和装置、及元件检测方法和装置
CN106547912A (zh) * 2016-11-25 2017-03-29 西安理工大学 身份证数据库中非二代身份证照片的识别和剔除方法
CN106599889A (zh) * 2016-12-17 2017-04-26 北京小米移动软件有限公司 一种识别字符的方法和装置
CN106846011A (zh) * 2016-12-30 2017-06-13 金蝶软件(中国)有限公司 营业执照识别方法和装置
CN107330429A (zh) * 2017-05-17 2017-11-07 北京捷通华声科技股份有限公司 一种证件条目的定位方法和装置
CN108563990A (zh) * 2018-03-08 2018-09-21 南京华科和鼎信息科技有限公司 一种基于cis图像采集系统的证照鉴伪方法及系统
CN108563990B (zh) * 2018-03-08 2022-03-29 南京华科和鼎信息科技有限公司 一种基于cis图像采集系统的证照鉴伪方法及系统
CN108573260A (zh) * 2018-03-29 2018-09-25 广东欧珀移动通信有限公司 信息处理方法和装置、电子设备、计算机可读存储介质
CN109727011A (zh) * 2018-05-22 2019-05-07 中国平安人寿保险股份有限公司 保费缴纳方法、装置、设备及计算机可读存储介质
CN108960210A (zh) * 2018-08-10 2018-12-07 武汉优品楚鼎科技有限公司 一种研报板式识别和分割的方法、系统及装置
CN109117839A (zh) * 2018-08-14 2019-01-01 惠龙易通国际物流股份有限公司 一种信息校验方法及装置
CN109447169A (zh) * 2018-11-02 2019-03-08 北京旷视科技有限公司 图像处理方法及其模型的训练方法、装置和电子系统
CN109447169B (zh) * 2018-11-02 2020-10-27 北京旷视科技有限公司 图像处理方法及其模型的训练方法、装置和电子系统
CN110414517A (zh) * 2019-04-18 2019-11-05 河北神玥软件科技股份有限公司 一种用于配合拍照场景的快速高精度身份证文本识别算法
CN110502193A (zh) * 2019-07-19 2019-11-26 广州奔想智能科技有限公司 一种身份证打印方法、系统和存储介质
CN111639646A (zh) * 2020-05-18 2020-09-08 山东大学 一种基于深度学习的试卷手写英文字符识别方法及系统
CN111639646B (zh) * 2020-05-18 2021-04-13 山东大学 一种基于深度学习的试卷手写英文字符识别方法及系统
CN111986117A (zh) * 2020-08-31 2020-11-24 南京大学 一种算术作业批改系统及方法
CN113313197A (zh) * 2021-06-17 2021-08-27 哈尔滨工业大学 一种全连接神经网络训练方法
CN113313197B (zh) * 2021-06-17 2022-06-10 哈尔滨工业大学 一种全连接神经网络训练方法

Similar Documents

Publication Publication Date Title
CN105528601A (zh) 基于接触式传感器的身份证图像采集、识别系统及采集识别方法
CN103761531B (zh) 基于形状轮廓特征的稀疏编码车牌字符识别方法
Mohammad et al. Optical character recognition implementation using pattern matching
CN111695392B (zh) 基于级联的深层卷积神经网络的人脸识别方法及系统
D’souza et al. Offline handwritten mathematical expression recognition using convolutional neural network
CN114419647B (zh) 一种表格信息提取方法及系统
CN104008401A (zh) 一种图像文字识别的方法及装置
CN104156706A (zh) 一种基于光学字符识别技术的中文字符识别方法
CN111626145B (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
Sonth et al. OCR based facilitator for the visually challenged
Pawar et al. Image to text conversion using tesseract
Choudhary et al. A new approach to detect and extract characters from off-line printed images and text
Yadav et al. A robust approach for offline English character recognition
CN109800750A (zh) 一种基于图像形态学用于规则排版的文本的文字区域标注方法
Bijalwan et al. Automatic text recognition in natural scene and its translation into user defined language
JP2011248702A (ja) 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体
Ntzios et al. An old greek handwritten OCR system based on an efficient segmentation-free approach
Aravinda et al. Template matching method for Kannada handwritten recognition based on correlation analysis
Verma et al. Enhanced character recognition using surf feature and neural network technique
Singh et al. A comprehensive survey on Bangla handwritten numeral recognition
Rajithkumar et al. Template matching method for recognition of stone inscripted Kannada characters of different time frames based on correlation analysis
Machhale et al. Implementation of number recognition using adaptive template matching and feature extraction method
Alam An approach to empirical optical character recognition paradigm using multi-layer perceptorn neural network
Sahu et al. Survey and analysis of devnagari character recognition techniques using neural networks
Zhu et al. Chip surface character recognition based on improved LeNet-5 convolutional neural network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160427

WD01 Invention patent application deemed withdrawn after publication