CN112837263B

CN112837263B - 一种复杂背景下的身份证信息定位方法

Info

Publication number: CN112837263B
Application number: CN202011520174.2A
Authority: CN
Inventors: 钟婧婷; 杨词慧; 邹伟军; 朱勤武; 缪小勇; 许兴淼; 鲍吴智达; 郭建勇
Original assignee: Shanghai Zhiyu Information Technology Co ltd
Current assignee: Shanghai Zhiyu Information Technology Co ltd
Priority date: 2020-12-21
Filing date: 2020-12-21
Publication date: 2022-03-22
Anticipated expiration: 2040-12-21
Also published as: CN112837263A

Abstract

本发明公开了一种复杂背景下的身份证信息定位方法，其特征在于，该方法包括以下步骤：图像纠偏；国徽面、人像面检测；边界检测；透视变换；信息定位。与现有技术相比，本发明的优点在于：该方法对于身份证图像拍摄背景和角度的不同，提供一种在复杂背景下裁剪身份证图像的方法，此方法裁剪精确度高，鲁棒性强，能极大提升信息定位的准确性，同时定位身份证信息区域的速度快，具有较好的应用前景。

Description

一种复杂背景下的身份证信息定位方法

技术领域

本发明属于计算机信息技术领域，具体涉及一种复杂背景下的身份证信息定位方法。

背景技术

身份证信息作为每个人重要的身份证明文件，在日常生活中起着重要作用。传统的身份证信息录入多采用人工输入的方式，这种方式不仅耗时耗力，而且开销大，不利于信息快速准确的输入。为了减少传统录入方式带来的不利影响，目前多采用拍摄身份证图像、自动识别身份证信息的方式实现对身份证信息的提取。如名称为“一种有背景的卡证图像信息识别方法”(公开号为CN110119741A)的专利文献，提供了一种多背景特征下身份证信息的识别与处理方法，它能够对不同纹理特征背景进行滤除。但是这种方法对背景有一定要求，如果背景干扰过多，噪声影响太大，则会导致信息识别的准确率下降。又如名称为“一种身份证信息读取方法及系统”(公开号为CN109783517A)的专利文献，通过OCR(OpticalCharacter Recognition,光学字符识别)技术识别模块，读取身份证信息。但这种方法仅适用于对裁剪好的身份证图像进行信息识别。

也有专利提出了对身份证图像中的身份证边界进行自动检测的方法，如名称为“证照图像裁剪方法及系统”(公开号为CN102592260A)的专利文献，先通过证照图像中瞳孔位置确定证照图像中人像的头顶、下巴与双耳位置；然后根据上述确定的头顶、下巴与双耳位置确定裁剪区域，并根据确定的裁剪区域对证照图像进行裁剪。该方法虽然可以找到身份证图像的边界位置，但仅用此方法定位边界，准确率不够高，会影响之后的信息区域定位。

发明内容

为解决上述技术问题，本发明提出一种复杂背景下的身份证信息定位方法，对不受背景约束的身份证图像进行信息定位。通过图像纠偏、身份证国徽面与人像面检测、边界检测、透视变换、信息区域预估等方法定位身份证各区域的信息。

本发明提出的一种复杂背景下的身份证信息定位方法，其特征在于，该方法包括以下步骤：

(1)图像纠偏。对输入的包含有身份证信息的原始图像I进行偏转角度检测，确定图像的偏转角度θ，并将原始图像I旋转-θ角度，得到纠偏结果图像I₁。

(2)国徽面、人像面检测。根据标准的国徽图像，采用图像匹配算法，对纠偏结果图像I1进行国徽检测，检测图像中是否含有国徽。如果有国徽，则返回检测到的国徽左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(x₁,y₁)、(x₂,y₂)、(x₃,y₃)、(x₄,y₄)，同时使用人脸识别算法对图像进行人脸检测，检测图像中是否含有人脸。如果有人脸，则返回人脸最小外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(m₁,n₁)、(m₂,n₂)、(m₃,n₃)、(m₄,n₄)。根据国徽检测和人脸检测的结果，判断纠偏结果图像I₁是国徽面还是人像面。

(3)边界检测。若纠偏结果图像I₁为国徽面，则采用国徽面边界检测算法对图像边界进行检测，获取身份证的四条边界线段l₁、l₂、l₃、l₄；若纠偏结果图像I₁为人像面，则采用人像面边界检测算法对图像边界进行检测，获取身份证的四条边界线段l₁、l₂、l₃、l₄。

(4)透视变换。将边界检测得到的身份证的四条边界线段l₁、l₂、l₃、l₄分别延长，每两条相邻线段相交于一点，得到相交的四个角点d₁、d₂、d₃、d₄。将标准身份证的四条边界线段分别延长，每两条相邻线段相交于一点，得到相交的四个角点f₁、f₂、f₃、f₄，根据d₁、d₂、d₃、d₄和f₁、f₂、f₃、f₄计算透视变换矩阵M，采用透视变换矩阵M对纠偏结果图像I₁进行透视变换，得到透视变换后的图像I₄。

(5)信息定位。若图像I₄为国徽面，则采用国徽面信息定位方法定位出信息区域的位置；若图像I₄为人像面，则采用人像面信息定位方法定位出信息区域的位置。

上述步骤中采用的图像匹配是指通过一定的匹配算法在两幅或多幅图像之间识别同名点的方法，参见H.Li,J.Qin,X.Xiang,L.Pan,W.Ma and N.N.Xiong,An EfficientImage Matching Algorithm Based on Adaptive Threshold and RANSAC,in IEEEAccess_,vol.6,pp.66963-66971,2018,doi:10.1109/ACCESS.2018.2878147。

上述步骤(1)对原始图像I进行偏转角度检测，确定图像的偏转角度θ，具体采用了以下方法：

(1.1)对输入的原始图像I进行角点检测，得到角点二值化图像I₂。

上述步骤中采用的角点检测是一种比较常用的图像特征提取方法，参见R.Deriche and G.Giraudon,Accurate corner detection:an analytical study,[1990]Proceedings of the Third International Conference on Computer Vision,Osaka,Japan,1990,pp.66-70,doi:10.1109/ICCV.1990.139495。

(1.2)将图像I₂沿顺时针方向旋转g次，第k次旋转k×a度，其中，0<a<＝30，g＝floor(180/a)，k＝1，2，...,g，floor(x)表示不大于x的最大整数，得到图像I_2，k。

(1.3)对旋转得到的每一幅图像I_2，k中的角点向y轴进行投影，得到角点投影图，在该图中，y轴每个坐标上的投影值表示的是图像I_2，k中与该坐标所对应的行方向上的角点的个数，将投影图中的最大投影值记为M_k。

(1.4)将每一个M_k和对应的角度k×a组成键值对，将所有的键值对组成一个键值对集合，在所有的M_k中找出最大值M_max，并在键值对集合中找出M_max所对应的角度max×a，max×a即为我们所要求的偏转角度θ。

上述步骤(2)中判断纠偏结果图像I₁是国徽面还是人像面的具体方法如下：

(2.1)以q表示图像中检测出国徽，

表示图像中未能检测到国徽，p表示图像中检测出人脸，

表示图像中检测不出人脸；

(2.2)如果纠偏结果图像I₁属于以下集合P，则将纠偏结果图像I₁判定为国徽面，否则，将纠偏结果图像I₁判定为人像面：

上述步骤(3)具体采用以下方法对纠偏结果图像I₁进行国徽面边界检测：

(3.1.1)根据步骤(2)检测到的国徽左上角顶点纵坐标y₁和左下角顶点纵坐标y₄的大小，对图像的旋转方向进行判断。如果y₁＞y₄，则图像旋转了180度，此时将图像顺时针旋转180度。

(3.1.2)计算国徽边框尺寸的最大阈值t_max和最小阈值t_min：

t_max＝max(h,w)*s*α (2)

t_min＝min(h,w)*s*β (3)

其中，h,w为原图像的高和宽，s表示标准身份证中国徽长度与身份证长度的比值，α、β分别为国徽尺寸范围系数。

(3.1.3)根据检测得到的国徽左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(x₁,y₁)、(x₂,y₂)、(x₃,y₃)、(x₄,y₄)，采用以下公式计算国徽每一条边的长度l_i，其中，i＝1,2,3,4。

其中，

j＝mod(i+1,4) (5)

mod是求余函数，mod(u,v)表示u除以v得到的余数。

(3.1.4)将国徽每一条边的长度l_i与最大阈值t_max和最小阈值t_min进行比较，其中，i＝1,2,3,4。如果l_i满足

t_min＜l_i＜t_max (6)

则国徽检测成功。

(3.1.5)根据检测得到的国徽左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(x₁,y₁)、(x₂,y₂)、(x₃,y₃)、(x₄,y₄)，计算身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(A₁,B₁)、(A₂,B₂)、(A₃,B₃)、(A₄,B₄)，计算公式如下：

其中，γ、ο、φ、κ分别为标准身份证中国徽左上角顶点到身份证上、右、下、左四条边界线的距离与国徽长度的比值。

(3.1.6)根据身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(A₁,B₁)、(A₂,B₂)、(A₃,B₃)、(A₄,B₄)，采用边界线检测方法检测得到身份证的四条边界线l₁、l₂、l₃、l₄。

上述步骤(3)具体采用以下方法对纠偏结果图像I₁进行人像面边界检测：

(3.2.1)使用滤波算法对纠偏结果图像I₁进行滤波去噪，得到滤波之后的图像I_d，对I_d进行轮廓检测，找到各个轮廓的外接矩形，选取长宽比在[hw_min,hw_max]范围内的矩形作为身份证号的候选区域，其中，hw_min和hw_max分别为身份证号长宽比的最小阈值和最大阈值。同时结合标准身份证中身份证号和人脸框的位置关系对身份证号区域进行进一步检测，如果轮廓的外接矩形左上角顶点的y坐标值s₁、左下角顶点的y坐标值s₂和人脸框左上角顶点的y坐标值n₁、左下角顶点的y坐标值n₄满足：

n₄＜s₁ (9)

n₄+2(n₄-n₁)＞s₂ (10)

则该轮廓的外接矩形是身份证号外接矩形框，并返回该身份证号外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(a₁,b₁)、(a₂,b₂)、(a₃,b₃)、(a₄,b₄)。

上述步骤中采用的滤波算法是一种比较常用的图像预处理方法，参见M.H.Ishak,N.N.Sofia Mohd Marzuki,M.F.Abdullah,Z.H.Che Soh,I.S.Isa and S.N.Sulaiman,Image Quality Assessment for Image Filtering Algorithm:Qualitative andQuantitative Analyses,2019 9th IEEE International Conference on ControlSystem,Computing and Engineering(ICCSCE),Penang,Malaysia,2019,pp.162-167,doi:10.1109/ICCSCE47578.2019.9068565.；轮廓检测是一种比较常用的目标边界检测方法，参见S.D.Lokmanwar and A.S.Bhalchandra,Contour detection based on gaussianfilter,2019 3rd International conference on Electronics,Communication andAerospace Technology(ICECA),Coimbatore,India,2019,pp.722-725,doi:10.1109/ICECA.2019.8822189。

(3.2.2)根据左眼、右眼的人脸特征点位置和身份证号左上角顶点坐标(a₁,b₁)，计算身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(p₁,q₁)、(p₂,q₂)、(p₃,q₃)、(p₄,q₄)，计算公式如下：

其中，(h₁,w₁)和(h₂,w₂)分别为左眼眼角坐标和右眼眼角坐标，c为标准身份证中左眼眼角到身份证下边界的距离与左眼眼角到身份证号外接矩形框上边界距离的比值。

(3.2.3)根据身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(p₁,q₁)、(p₂,q₂)、(p₃,q₃)、(p₄,q₄)，采用边界线检测方法得到身份证的四条边界线l₁、l₂、l₃、l₄。

上述(3.1.6)和(3.2.3)中提到的边界线检测方法，具体实施步骤如下：

(3.3.1)假设得到的身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标为(U₁,V₁)、(U₂,V₂)、(U₃,V₃)、(U₄,V₄)。

(3.3.2)分别连接(U₁,V₁)和(U₂,V₂)、(U₂,V₂)和(U₃,V₃)、(U₃,V₃)和(U₄,V₄)、(U₄,V₄)和(U₁,V₁)，得到身份证的四条预估边界线。计算身份证预估外部区域左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(U₁-d,V₁-d)、(U₂+d,V₂-d)、(U₃+d,V₃+d)、(U₄-d,V₄+d)，分别连接(U₁-d,V₁-d)和(U₁+d,V₁-d)、(U₁+d,V₁-d)和(U₁+d,V₁+d)、(U₁+d,V₁+d)和(U₁-d,V₁+d)、(U₁-d,V₁+d)和(U₁-d,V₁-d)，构成身份证预估外部区域S₁。其中，d为身份证预估外部区域的上边界线与身份证的预估上边界线之间的距离。计算身份证预估内部区域左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(U₁+d,V₁+d)、(U₂-d,V₂+d)、(U₃-d,V₃-d)、(U₄+d,V₄-d)，分别连接(U₁+d,V₁+d)和(U₂-d,V₂+d)、(U₂-d,V₂+d)和(U₃-d,V₃-d)、(U₃-d,V₃-d)和(U₄+d,V₄-d)、(U₄+d,V₄-d)和(U₁+d,V₁+d)，构成身份证预估内部区域S₂。身份证预估边界线周边区域S定义为：

(3.3.3)分别连接(U₁-d,V₁-d)和(U₂+d,V₂-d)、(U₂+d,V₂-d)和(U₃+d,V₂+d)、(U₃+d,V₂+d)和(U₃-d,V₁+d)、(U₃-d,V₁+d)和(U₁-d,V₁-d)，构成身份证预估边界线周边上区域S_u；分别连接(U₃-d,V₄-d)和(U₃+d,V₃-d)、(U₃+d,V₃-d)和(U₃+d,V₃+d)、(U₃+d,V₃+d)和(U₃-d,V₄+d)、(U₃-d,V₄+d)和(U₃-d,V₄-d)，构成身份证预估边界线周边下区域S_d；分别连接(U₁-d,V₁-d)和(U₁+d,V₁-d)、(U₁+d,V₁-d)和(U₄+d,V₄+d)、(U₄+d,V₄+d)和(U₃-d,V₄+d)、(U₃-d,V₄+d)和(U₁-d,V₁-d)，构成身份证预估边界线周边左区域S_l；分别连接(U₂-d,V₁-d)和(U₂+d,V₂-d)、(U₂+d,V₂-d)和(U₃+d,V₃+d)、(U₃+d,V₃+d)和(U₃-d,V₃+d)、(U₃-d,V₃+d)和(U₂-d,V₁-d)，构成身份证预估边界线周边右区域S_r。

分别在身份证预估边界线周边上区域S_u、身份证预估边界线周边下区域S_d、身份证预估边界线周边左区域S_l、身份证预估边界线周边右区域S_r进行直线检测，分别得到直线线段集合L_u、L_d、L_l、L_r。

上述步骤中采用的直线检测是一种常用的图像检测方法，参见L.Zhang andX.Huang,"A straight line detection method based on edge following and linesegments integration,"2015 6th IEEE International Conference on SoftwareEngineering and Service Science(ICSESS),Beijing,2015,pp.297-300,doi:10.1109/ICSESS.2015.7339059。

(3.3.4)对于直线线段集合L_u、L_d中的每一条直线线段l，判断其斜率k_s是否小于给定直线线段斜率阈值

即

其中，斜率k_s按以下公式计算：

其中，(u₁,v₁)、(u₂,v₂)为直线线段l上的任意两个点。如果直线线段l的斜率k_s小于给定直线线段斜率阈值

则在直线线段集合L_u或L_d中将直线线段l移除。

对于直线线段集合L_l、L_r中的每一条直线线段l，判断其斜率k_s是否大于给定直线线段斜率阈值ω，即

k_s＞ω (19)

如果直线线段l的斜率k_s大于给定直线线段斜率阈值ω，则在直线线段集合L_l或L_r中将直线线段l移除。

(3.3.4)采用直线线段拟合方法对直线线段集合L_u中的所有直线线段进行拟合，得到l_u，采用直线线段拟合方法对直线线段集合L_d中的所有直线线段进行拟合，得到l_d，采用直线线段拟合方法对直线线段集合L_l中的所有直线线段进行拟合，得到l_l，采用直线线段拟合方法对直线线段集合L_r中的所有直线线段进行拟合，得到l_r。这里的直线线段拟合方法具体如下：

a)取出直线线段集合中所有直线线段的两个端点，将这些端点组成点集Q；

b)采用最小二乘法对点集Q中的数据进行拟合，得到一条拟合直线线段。

其中，最小二乘法是一种常用的数据拟合方法，参见O.Bretscher,Linearalgebra with applications,3rd ed.New York:Prentice Hall,1995。

(3.3.5)将得到的四条直线线段l_u、l_d、l_l、l_r分别延长，直线线段L_l和直线线段l_u相交于点P₁，直线线段l_u和直线线段L_r相交于点P₂，直线线段L_r和直线线段L_d相交于点P₃，直线线段L_d和直线线段L_l相交于点P₄，分别连接点P₁和P₂、P₂和P₃、P₃和P₄、P₄和P₁，构成身份证的四条边界线。

上述步骤(5)具体采用了以下方法对图像I₄进行国徽面信息定位：

(5.1.1)对图像I₄进行轮廓检测，满足以下两个条件的两个轮廓为国徽面信息区域：

a)轮廓面积S_area＞S_I、宽高比e在[ts_min,ts_max]范围内；

b)轮廓满足集合L。

其中S_I为设定的信息区域轮廓面积阈值，ts_min和ts_max分别为宽高比的最小阈值和最大阈值，集合L表示为：

其中，(x,y)为轮廓上点的坐标，X₁和Y₁分别为图像I₄的左上角顶点的x、y坐标，X₂为图像I₄的右上角顶点的x坐标，Y₄为图像I₄的左下角顶点的y坐标。

上述步骤(5)具体采用了以下方法对图像I₄进行人像面信息定位：

(5.2.1)根据所得到的人脸最小外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(m₁,n₁)、(m₂,n₂)、(m₃,n₃)、(m₄,n₄)，以及身份证号外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(a₁,b₁)、(a₂,b₂)、(a₃,b₃)、(a₄,b₄)，估算只包含姓名、性别、出生、地址四个信息的信息区域S₃的左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(k₁,j₁)、(k₂,j₂)、(k₃,j₃)、(k₄,j₄)，计算方式如下：

其中，θ₁、θ₂、θ₃、θ₄分别为距离阈值。

(5.2.2)分别连接(k₁,j₁)和(k₂,j₂)、(k₂,j₂)和(k₃,j₃)、(k₃,j₃)和(k₄,j₄)、(k₄,j₄)和(k₁,j₁)，得到信息区域S₃的四条边界线，构成信息区域S₃。

(5.2.3)对信息区域S₃进行膨胀腐蚀和自适应二值化操作，再对其进行轮廓检测，得到一些轮廓区域。结合标准身份证中信息的位置从上到下分别定位姓名、性别、出生、地址四个信息区域的大致位置，得到姓名、性别、出生、地址四个信息区域左上角顶点坐标分别为(X_nlt,Y_nlt)、(X_slt,Y_slt)、(X_blt,Y_blt)、(X_alt,Y_alt)。同时，以地址框的左边界线x坐标X_alt为基准，分别确定姓名、性别、出生三个信息区域的左边界线x坐标X_nlt、X_slt、X_blt，公式如下所示：

上述步骤中使用的膨胀腐蚀是一种比较常用的图像形态学方法，参见AndreasKleefeld,Sophia Vorderwülbecke,Bernhard Burgeth,Anomalous diffusion,dilation_,and erosion in image processing[J].International Journal of ComputerMathematics,2018,95(6-7)。自适应二值化是一种常用的图像处理方法，参见XianfaChen,Kai Wang,Qingren Wang Nankai Institute of Machine Intelligence,NankaiUniversity,Tianjin,P.R.China."An Adaptive Binarization Method for Camerabased Document Image".Proceedings of 2010International Conference on ServicesScience,Management and Engineering(Volume 1).Ed.Xinfeng Zhu、JunwuZhu.Institute of Electrical and Electronics Engineers,Inc.,2010,531-534。

(5.2.4)人像面信息定位主要使用坐标定位方法，即确定左上角顶点坐标，同时根据标准身份证中的先验信息将长和宽设置为一固定值，估算右上角顶点坐标、右下角顶点坐标与左下角顶点坐标，公式如下：

其中，X_nlt和Y_nlt分别为姓名信息区域的左上角顶点的x、y坐标，X_alt和Y_alt分别为地址信息区域的左上角顶点的x、y坐标，X_nrt和Y_nrt分别为估算的姓名信息区域右上角顶点的x、y坐标，X_nrd和Y_nrd分别为估算的姓名信息区域右下角顶点的x、y坐标，X_nld和Y_nld分别为估算的姓名信息区域左下角顶点的x、y坐标，X_art和Y_art分别为估算的地址信息区域右上角顶点的x、y坐标，X_ard和Y_ard分别为估算的地址信息区域右下角顶点的x、y坐标，X_ald和Y_ald分别为估算的地址信息区域左下角顶点的x、y坐标，w_n、h_n分别为姓名信息区域长宽设置的固定值，w_a、h_a分别为地址信息区域长宽设置的固定值。X_slt和Y_slt分别为性别信息区域的左上角顶点的x、y坐标，X_blt和Y_blt分别为出生信息区域的左上角顶点的x、y坐标，X_srt和Y_srt分别为估算的性别信息区域右上角顶点的x、y坐标，X_srd和Y_srd分别为估算的性别信息区域右下角顶点的x、y坐标，X_sld和Y_sld分别为估算的性别信息区域左下角顶点的x、y坐标，X_brt和Y_brt分别为估算的出生信息区域右上角顶点的x、y坐标，X_brd和Y_brd分别为估算的出生信息区域右下角顶点的x、y坐标，X_bld和Y_bld分别为估算的出生信息区域左下角顶点的x、y坐标，w_s、h_s分别为性别信息区域长宽设置的固定值，w_b、h_b分别为出生信息区域长宽设置的固定值。其中，性别信息区域包括性别和民族信息，出生信息区域包括出生年、月、日信息。

(5.2.5)连接点(X_nlt,Y_nlt)和(X_nrt,Y_nrt)、(X_nrt,Y_nrt)和(X_nrd,Y_nrd)、(X_nrd,Y_nrd)和(X_nld,Y_nld)、(X_nld,Y_nld)和(X_nlt,Y_nlt)，得到姓名信息区域。连接点(X_alt,Y_alt)和(X_art,Y_art)、(X_art,Y_art)和(X_ard,Y_ard)、(X_ard,Y_ard)和(X_ald,Y_ald)、(X_ald,Y_ald)和(X_alt,Y_alt)，得到地址信息区域。连接点(X_slt,Y_slt)和(X_srt,Y_srt)、(X_srt,Y_srt)和(X_srd,Y_srd)、(X_srd,Y_srd)和(X_sld,Y_sld)、(X_sld,Y_sld)和(X_slt,Y_slt)，得到性别信息区域。连接点(X_blt,Y_blt)和(X_brt,Y_brt)、(X_brt,Y_brt)和(X_brd,Y_brd)、(X_brd,Y_brd)和(X_bld,Y_bld)、(X_bld,Y_bld)和(X_blt,Y_blt)，得到出生信息区域。

与现有技术相比，本发明的创新之处在于：该方法对于身份证图像拍摄背景和角度的不同，提供一种多边界检测算法结合使用的方法，此方法裁剪精确度高，鲁棒性强，能极大提升信息定位的准确性。同时充分利用特征之间的相对位置关系和先验信息预估边界线与信息位置，提升图像分割的准确率。

附图说明

下面结合附图和具体实施方式对本发明作进一步的详细说明。

图1是本发明实施例的方法流程图；

图2是包含有国徽面身份证信息的原始图像；

图3是包含有人像面身份证信息的原始图像；

图4是国徽面角点二值化图像；

图5是人像面角点二值化图像；

图6是国徽面边界检测图像；

图7是人像面边界检测图像；

图8是国徽面透视变换图像；

图9是人像面透视变换图像；

图10是国徽面信息区域图像；

图11是国徽面信息定位图像；

图12是人像面信息区域图像；

图13是人像面信息定位图像。

具体实施方式

下面将结合本发明实施例中的附图，对本发明的具体实施方式作进一步详细说明。需要注意的是，此处根据本发明一种复杂背景下的身份证信息定位方法的具体实施例仅作为举例，并不用于限定本发明。

本实施例结合包含有身份证信息的原始图像I，对身份证信息定位算法进行说明，如图2和图3所示。如图1方法流程图所示，本发明采用以下步骤对身份证图像进行信息定位：

(2)国徽面、人像面检测。根据标准的国徽图像，采用FLANN单应性匹配算法，对纠偏结果图像I₁进行国徽检测，检测图像中是否含有国徽。如果有国徽，则返回检测到的国徽左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(x₁,y₁)、(x₂,y₂)、(x₃,y₃)、(x₄,y₄)，同时使用Haar Cascade和HOG人脸识别算法对图像进行人脸检测，检测图像中是否含有人脸。如果有人脸，则返回人脸最小外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(m₁,n₁)、(m₂,n₂)、(m₃,n₃)、(m₄,n₄)。根据国徽检测和人脸检测的结果，判断纠偏结果图像I₁是国徽面还是人像面。

上述步骤中采用的FLANN单应性匹配算法是一种常用的匹配方法，参见Vijayan,Vineetha and Pushpalatha Kp.“FLANN Based Matching with SIFT Descriptors forDrowsy Features Extraction.”2019Fifth International Conference on ImageInformation Processing(ICIIP)(2019):600-605。Haar Cascade和HOG人脸识别算法是常用的人脸检测方法,分别参见Viola,P.and Michael J.Jones.“Rapid object detectionusing a boosted cascade of simple features.”Proceedings of the 2001IEEEComputer Society Conference on Computer Vision and Pattern Recognition.CVPR2001 1(2001):I-I.，和Dalal,N.and B.Triggs.“Histograms of oriented gradientsfor human detection.”2005IEEE Computer Society Conference on Computer Visionand Pattern Recognition(CVPR'05)1(2005):886-893vol.1。

(4)透视变换。将边界检测得到的身份证的四条边界线段l₁、l₂、l₃、l₄分别延长，每两条相邻线段相交于一点，得到相交的四个角点d₁、d₂、d₃、d₄。将标准身份证的四条边界线段分别延长，每两条相邻线段相交于一_点，得到相交的四个角点f₁、f₂、f₃、f₄，根据d₁、d₂、d₃、d₄和f₁、f₂、f₃、f_4计算透视变换矩阵M，采用透视变换矩阵M对纠偏结果图像I₁进行透视变换，得到透视变换后的图像I₄，如图8和图9所示。

上述步骤(1)中对原始图像I进行偏转角度检测，主要采用Good Feature ToTrack角点检测与水平投影结合的方法，具体方法如下：

(1.1)对输入的原始图像I采用Good Feature To Track方法进行角点检测，得到角点二值化图像I₂，如图4和图5所示。

上述步骤中采用的Good Feature To Track方法是一种常用的角点检测方法，参见Shi,J.and Carlo Tomasi.“Good features to track.”1994Proceedings of IEEEConference on Computer Vision and Pattern Recognition(1994):593-600。

(1.2)设置图像I₂沿顺时针方向旋转的次数g＝180，每次旋转的度数a＝1。将图像I₂沿顺时针方向旋转180次，则第k次旋转k×1度(k＝1，2，...,180)，得到图像I_2，k。

(1.4)将每一个M_k和对应的角度k×1组成键值对，将所有的键值对组成一个键值对集合，在所有的M_k中找出最大值M_max，并在键值对集合中找出M_max所对应的角度max×1，max×1即为我们所要求的偏转角度θ。

(2.1)以q表示图像中检测出国徽，

表示图像中未能检测到国徽，p表示图像中检测出人脸，

表示图像中检测不出人脸；

(2.2)如果纠偏结果图像I₁属于以下集合P，则将纠偏结果图像I₁判定为国徽面，否则，将纠偏结果图像I₁判定为人像面；

(3.1.2)设置标准身份证中国徽长度与身份证长度的比值s＝0.2，国徽尺寸范围系数α＝0.3，β＝1.3。计算国徽边框尺寸的最大阈值t_max和最小阈值t_min：

t_max＝max(h,w)*s*α (2)

t_min＝min(h,w)*s*β (3)

其中，h,_w为原图像的高和宽。

其中，

j＝mod(i+1,4) (5)

mod是求余函数，mod(u,v)表示u除以v得到的余数。

t_min＜l_i＜t_max (6)

则国徽检测成功。

(3.1.5)设置标准身份证中国徽左上角顶点到身份证四条边界线的距离与国徽长度的比值φ＝0.18、γ＝2.86、κ＝0.24、ο＝4.89。根据检测得到的国徽左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(x₁,y₁)、(x₂,y₂)、(x₃,y₃)、(x₄,y₄)，计算身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(A₁,B₁)、(A₂,B₂)、(A₃,B₃)、(A₄,B₄)，计算公式如下：

(3.1.6)根据身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(A₁,B₁)、(A₂,B₂)、(A₃,B₃)、(A₄,B₄)，采用边界线检测方法检测得到身份证的四条边界线l₁、l₂、l₃、l₄，如图6所示。

(3.2.1)设置身份证号长宽比的最小阈值hw_min＝15，身份证号长宽比的最大阈值hw_max＝17。使用高斯滤波算法对纠偏结果图像I₁进行滤波去噪，得到滤波之后的图像I_d，对I_d进行轮廓检测，找到各个轮廓的外接矩形，选取长宽比在[hw_min,hw_max]范围内的矩形作为身份证号的候选区域。同时结合标准身份证中身份证号和人脸框的位置关系对身份证号区域进行进一步检测，如果轮廓的外接矩形左上角顶点的y坐标值s₁、左下角顶点的y坐标值s₂和人脸框左上角顶点的y坐标值n₁、左下角顶点的y坐标值n₄满足：

n₄＜s₁ (9)

n₄+2(n₄-n₁)＞s₂ (10)

上述步骤中采用的高斯滤波算法是一种比较常用的图像预处理方法，参见Wüthrich,Manuel et al.“Robust Gaussian Filtering.”ArXiv abs/1509.04072(2015):n.pag。

(3.2.2)设置标准身份证中左眼眼角到身份证下边界的距离与左眼眼角到身份证号外接矩形框上边界距离的比值c∈[1.2,1.5]。根据左眼、右眼的人脸特征点位置和身份证号左上角顶点坐标(a₁,b₁)，计算身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(p₁,q₁)、(p₂,q₂)、(p₃,q₃)、(p₄,q₄)，计算公式如下：

其中，(h₁,w₁)和(h₂,w₂)分别为左眼眼角坐标和右眼眼角坐标。

(3.2.3)根据身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(p₁,q₁)、(p₂,q₂)、(p₃,q₃)、(p₄,q₄)，采用边界线检测方法得到身份证的四条边界线l₁、l₂、l₃、l₄，如图7所示。

₍3.3.2)设置身份证预估外部区域的上边界线与身份证的预估上边界线之间的距离d＝30。分别连接(U₁,V₁)和(U₂,V₂)、(U₂,V₂)和(U₃,V₃)、(U₃,V₃)和(U₄,V₄)、(U₄,V₄)和(U₁,V₁)，得到身份证的四条预估边界线。计算身份证预估外部区域左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(U₁-d,V₁-d)、(U₂+d,V₂-d)、(U₃+d,V₃+d)、(U₄-d,V₄+d)，分别连接(U₁-d,V₁-d)和(U₁+d,V₁-d)、(U₁+d,V₁-d)和(U₁+d,V₁+d)、(U₁+d,V₁+d)和(U₁-d,V₁+d)、(U₁-d,V₁+d)和(U₁-d,V₁-d)，构成身份证预估外部区域S₁。计算身份证预估内部区域左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(U₁+d,V₁+d)、(U₂-d,V₂+d)、(U₃-d,V₃-d)、(U₄+d,V₄-d)，分别连接(U₁+d,V₁+d)和(U₂-d,V₂+d)、(U₂-d,V₂+d)和(U₃-d,V₃-d)、(U₃-d,V₃-d)和(U₄+d,V₄-d)、(U₄+d,V₄-d)和(U₁+d,V₁+d)，构成身份证预估内部区域S₂。身份证预估边界线周边区域S定义为：

(3_.3.4)设置直线线段斜率阈值

对于直线线段集合L_u、L_d中的每一条直线线段l，判断其斜率k_s是否小于给定直线线段斜率阈值

即

其中，斜率k_s按以下公式计算：

则在直线线段集合L_u或L_d中将直线线段l移除。

设置直线线段斜率阈值ω＝1.4。对于直线线段集合L_l、L_r中的每一条直线线段l，判断其斜率k_s是否大于给定直线线段斜率阈值ω，即

k_s＞ω (19)

针对步骤(5)对图像I₄进行国徽面信息定位，具体采用了以下方法：

(5.1.1)设置信息区域轮廓面积阈值S_I＝800，宽高比的最小阈值ts_min＝4、宽高比的最大阈值ts_max＝20。对图像I₄进行轮廓检测，满足以下两个条件的两个轮廓为国徽面信息区域，如图11所示：

a)轮廓面积S_area＞S_I、宽高比e在[ts_min,ts_max]范围内；

b)轮廓满足集合L，如图10所示。

集合L表示为：

针对上述步骤(5)对图像I₄进行人像面信息定位，具体采用了以下方法：

(5.2.1)设置距离阈值θ₁＝10、θ₂＝10、θ₃＝10、θ₄＝10。根据所得到的人脸最小外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(m₁,n₁)、(m₂,n₂)、(m₃,n₃)、(m₄,n₄)，以及身份证号外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(a₁,b₁)、(a₂,b₂)、(a₃,b₃)、(a₄,b₄)，估算只包含姓名、性别、出生、地址四个信息的信息区域S₃的左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(k₁,j₁)、(k₂,j₂)、(k₃,j₃)、(k₄,j₄)，计算方式如下：

(5.2.2)分别连接(k₁,j₁)和(k₂,j₂)、(k₂,j₂)和(k₃,j₃)、(k₃,j₃)和(k₄,j₄)、(k₄,j₄)和(k₁,j₁)，得到信息区域S₃的四条边界线，构成信息区域S₃，如图12。

(5.2.4)设置姓名信息区域长、宽的固定值w_n＝185、h_n＝37，地址信息区域长、宽的固定值w_a＝343、h_a＝139，性别信息区域长、宽的固定值w_s＝204、h_s＝37，出生信息区域长、宽的固定值w_b＝278、h_b＝37。人像面信息定位主要使用坐标定位方法，即确定左上角顶点坐标，同时根据标准身份证中的先验信息将长和宽设置为一固定值，估算右上角顶点坐标、右下角顶点坐标与左下角顶点坐标，公式如下：

其中，X_nlt和Y_nlt分别为姓名信息区域的左上角顶点的x、y坐标，X_alt和Y_alt分别为地址信息区域的左上角顶点的x、y坐标，X_nrt和Y_nrt分别为估算的姓名信息区域右上角顶点的x、y坐标，X_nrd和Y_nrd分别为估算的姓名信息区域右下角顶点的x、y坐标，X_nld和Y_nld分别为估算的姓名信息区域左下角顶点的x、y坐标，X_art和Y_art分别为估算的地址信息区域右上角顶点的x、y坐标，X_ard和Y_ard分别为估算的地址信息区域右下角顶点的x、y坐标，X_ald和Y_ald分别为估算的地址信息区域左下角顶点的x、y坐标。X_slt和Y_slt分别为性别信息区域的左上角顶点的x、y坐标，X_blt和Y_blt分别为出生信息区域的左上角顶点的x、y坐标，X_srt和Y_srt分别为估算的性别信息区域右上角顶点的x、y坐标，X_srd和Y_srd分别为估算的性别信息区域右下角顶点的x、y坐标，X_sld和Y_sld分别为估算的性别信息区域左下角顶点的x、y坐标，X_brt和Y_brt分别为估算的出生信息区域右上角顶点的x、y坐标，X_brd和Y_brd分别为估算的出生信息区域右下角顶点的x、y坐标，X_bld和Y_bld分别为估算的出生信息区域左下角顶点的_x、_y坐标。其中，性别信息区域包括性别和民族信息，出生信息区域包括出生年、月、日信息。

(5.2.5)连接点(X_nlt,Y_nlt)和(X_nrt,Y_nrt)、(X_nrt,Y_nrt)和(X_nrd,Y_nrd)、(X_nrd,Y_nrd)和(X_nld,Y_nld)、(X_nld,Y_nld)和(X_nlt,Y_nlt)，得到姓名信息区域。连接点(X_alt,Y_alt)和(X_art,Y_art)、(X_art,Y_art)和(X_ard,Y_ard)、(X_ard,Y_ard)和(X_ald,Y_ald)、(X_ald,Y_ald)和(X_alt,Y_alt)，得到地址信息区域。连接点(X_slt,Y_slt)和(X_srt,Y_srt)、(X_srt,Y_srt)和(X_srd,Y_srd)、(X_srd,Y_srd)和(X_sld,Y_sld)、(X_sld,Y_sld)和(X_slt,Y_slt)，得到性别信息区域。连接点(X_blt,Y_blt)和(X_brt,Y_brt)、(X_brt,Y_brt)和(X_brd,Y_brd)、(X_brd,Y_brd)和(X_bld,Y_bld)、(X_bld,Y_bld)和(X_blt,Y_blt)，得到出生信息区域，如图13所示。

本发明针对的是复杂背景下的身份证图像边界检测，其核心在于结合多种边界检测方法将身份证图像从背景中分离出来。本发明的优点在于充分利用特征之间的相对位置关系和先验信息预估边界线与信息位置，能极大的提升图像分割的准确率与信息的定位的精确度。

以上所述为本发明的较佳实例，但本发明不应该局限于该实例和附图所公开的内容。所以凡是不脱离本发明所公开的精神下完成的等效或修改，都落入本发明保护的范围。

Claims

1.一种复杂背景下的身份证信息定位方法，其特征在于，该方法包括以下步骤：

(1)图像纠偏；对输入的包含有身份证信息的原始图像I进行偏转角度检测，确定图像的偏转角度θ，并将原始图像I旋转-θ角度，得到纠偏结果图像I₁；

(2)国徽面、人像面检测；根据标准的国徽图像，采用图像匹配算法，对纠偏结果图像I₁进行国徽检测，检测图像中是否含有国徽；如果有国徽，则返回检测到的国徽左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(x₁,y₁)、(x₂,y₂)、(x₃,y₃)、(x₄,y₄)；同时使用人脸识别算法对图像进行人脸检测，检测图像中是否含有人脸；如果有人脸，则返回人脸最小外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(m₁,n₁)、(m₂,n₂)、(m₃,n₃)、(m₄,n₄)；根据国徽检测和人脸检测的结果，判断纠偏结果图像I₁是国徽面还是人像面；

(3)边界检测；若纠偏结果图像I₁为国徽面，则采用国徽面边界检测算法对图像边界进行检测，获取身份证的四条边界线段l₁、l₂、l₃、l₄；若纠偏结果图像I₁为人像面，则采用人像面边界检测算法对图像边界进行检测，获取身份证的四条边界线段l₁、l₂、l₃、l₄；

(4)透视变换；将边界检测得到的身份证的四条边界线段l₁、l₂、l₃、l₄分别延长，每两条相邻线段相交于一点，得到相交的四个角点d₁、d₂、d₃、d₄；将标准身份证的四条边界线段分别延长，每两条相邻线段相交于一点，得到相交的四个角点f₁、f₂、f₃、f₄，根据d₁、d₂、d₃、d₄和f₁、f₂、f₃、f₄计算透视变换矩阵M，采用透视变换矩阵M对纠偏结果图像I₁进行透视变换，得到透视变换后的图像I₄；

(5)信息定位；若图像I₄为国徽面，则采用国徽面信息定位方法定位出信息区域的位置；若图像I₄为人像面，则采用人像面信息定位方法定位出信息区域的位置。

2.根据权利要求1所述的一种复杂背景下的身份证信息定位方法，其特征在于，上述步骤(1)对原始图像I进行偏转角度检测，确定图像的偏转角度θ，具体采用了以下方法：

第一步，对输入的原始图像I进行角点检测，得到角点二值化图像I₂；

第二步，将图像I₂沿顺时针方向旋转g次，第k次旋转k×a度，其中，0<a<＝30，g＝floor(180/a)，k＝1，2，...,g，floor(x)表示不大于x的最大整数，得到图像I_2，k；

第三步，对旋转得到的每一幅图像I_2，k中的角点向y轴进行投影，得到角点投影图，在该图中，y轴每个坐标上的投影值表示的是图像I_2，k中与该坐标所对应的行方向上的角点的个数，将投影图中的最大投影值记为M_k；

第四步，将每一个M_k和对应的角度k×a组成键值对，将所有的键值对组成一个键值对集合，在所有的M_k中找出最大值M_max，并在键值对集合中找出M_max所对应的角度max×a，max×a即为我们所要求的偏转角度θ。

3.根据权利要求1所述的一种复杂背景下的身份证信息定位方法，其特征在于，上述步骤(2)中判断纠偏结果图像I₁是国徽面还是人像面的具体方法如下：

第一步，以q表示图像中检测出国徽，

表示图像中未能检测到国徽，p表示图像中检测出人脸，

表示图像中检测不出人脸；

第二步，如果纠偏结果图像I₁属于以下集合P，则将纠偏结果图像I₁判定为国徽面，否则，将纠偏结果图像I₁判定为人像面：

4.根据权利要求1所述的一种复杂背景下的身份证信息定位方法，其特征在于，上述步骤(3)国徽面边界检测算法具体采用以下方法对纠偏结果图像I₁进行国徽面边界检测：

第一步，根据步骤(2)检测到的国徽左上角顶点纵坐标y₁和左下角顶点纵坐标y₄的大小，对图像的旋转方向进行判断；如果y₁＞y₄，则图像旋转了180度，此时将图像顺时针旋转180度；

第二步，计算国徽边框尺寸的最大阈值t_max和最小阈值t_min：

t_max＝max(h,w)*s*α (2)

t_min＝min(h,w)*s*β (3)

其中，h,w为原图像的高和宽，s表示标准身份证中国徽长度与身份证长度的比值，α、β分别为国徽尺寸范围系数；

第三步，根据检测得到的国徽左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(x₁,y₁)、(x₂,y₂)、(x₃,y₃)、(x₄,y₄)，采用以下公式计算国徽每一条边的长度l_i，其中，i＝1,2,3,4；

其中，

j＝mod(i+1,4) (5)

mod是求余函数，mod(u,v)表示u除以v得到的余数；

第四步，将国徽每一条边的长度l_i与最大阈值t_max和最小阈值t_min进行比较，其中，i＝1,2,3,4；如果l_i满足

t_min＜l_i＜t_max (6)

则国徽检测成功；

第五步，根据检测得到的国徽左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(x₁,y₁)、(x₂,y₂)、(x₃,y₃)、(x₄,y₄)，计算身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(A₁,B₁)、(A₂,B₂)、(A₃,B₃)、(A₄,B₄)，计算公式如下：

其中，γ、ο、φ、κ分别为标准身份证中国徽左上角顶点到身份证上、右、下、左四条边界线的距离与国徽长度的比值；

第六步，根据身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(A₁,B₁)、(A₂,B₂)、(A₃,B₃)、(A₄,B₄)，采用边界线检测方法检测得到身份证的四条边界线l₁、l₂、l₃、l₄。

5.根据权利要求1所述的一种复杂背景下的身份证信息定位方法，其特征在于，上述步骤(3)人像面边界检测算法具体采用以下方法对纠偏结果图像I₁进行人脸面边界检测：

第一步，使用滤波算法对纠偏结果图像I₁进行滤波去噪，得到滤波之后的图像I_d，对I_d进行轮廓检测，找到各个轮廓的外接矩形，选取长宽比在[hw_min,hw_max]范围内的矩形作为身份证号的候选区域，其中，hw_min和hw_max分别为身份证号长宽比的最小阈值和最大阈值；同时结合标准身份证中身份证号和人脸框的位置关系对身份证号区域进行进一步检测，如果轮廓的外接矩形左上角顶点的y坐标值s₁、左下角顶点的y坐标值s₂和人脸框左上角顶点的y坐标值n₁、左下角顶点的y坐标值n₄满足：

n₄＜s₁ (9)

n₄+2(n₄-n₁)＞s₂ (10)

则该轮廓的外接矩形是身份证号外接矩形框，并返回该身份证号外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(a₁,b₁)、(a₂,b₂)、(a₃,b₃)、(a₄,b₄)；

第二步，根据左眼、右眼的人脸特征点位置和身份证号左上角顶点坐标(a₁,b₁)，计算身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(p₁,q₁)、(p₂,q₂)、(p₃,q₃)、(p₄,q₄)，计算公式如下：

其中，(h₁,w₁)和(h₂,w₂)分别为左眼眼角坐标和右眼眼角坐标，c为标准身份证中左眼眼角到身份证下边界的距离与左眼眼角到身份证号外接矩形框上边界距离的比值；

第三步，根据身份证边界左上角顶点、右上角顶点、右下角顶点和左下角顶点的预估坐标(p₁,q₁)、(p₂,q₂)、(p₃,q₃)、(p₄,q₄)，采用边界线检测方法得到身份证的四条边界线l₁、l₂、l₃、l₄。

6.根据权利要求1所述的一种复杂背景下的身份证信息定位方法，其特征在于，上述步骤(5)国徽面信息定位方法具体采用了以下方法对图像I₄进行国徽面信息定位：

对图像I₄进行轮廓检测，满足以下两个条件的两个轮廓为国徽面信息区域：

a)轮廓面积S_area＞S_I、宽高比e在[ts_min,ts_max]范围内；

b)轮廓满足集合L；

7.根据权利要求1所述的一种复杂背景下的身份证信息定位方法，其特征在于，

上述步骤(5)人像面信息定位方法具体采用了以下方法对图像I₄进行人像面信息定位：

第一步，根据所得到的人脸最小外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(m₁,n₁)、(m₂,n₂)、(m₃,n₃)、(m₄,n₄)，以及身份证号外接矩形左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(a₁,b₁)、(a₂,b₂)、(a₃,b₃)、(a₄,b₄)，估算只包含姓名、性别、出生、地址四个信息的信息区域S₃的左上角顶点、右上角顶点、右下角顶点和左下角顶点的坐标(k₁,j₁)、(k₂,j₂)、(k₃,j₃)、(k₄,j₄)，计算方式如下：

其中，θ₁、θ₂、θ₃、θ₄分别为距离阈值；

第二步，分别连接(k₁,j₁)和(k₂,j₂)、(k₂,j₂)和(k₃,j₃)、(k₃,j₃)和(k₄,j₄)、(k₄,j₄)和(k₁,j₁)，得到信息区域S₃的四条边界线，构成信息区域S₃；

第三步，对信息区域S₃进行膨胀腐蚀和自适应二值化操作，再对其进行轮廓检测，得到一些轮廓区域；结合标准身份证中信息的位置从上到下分别定位姓名、性别、出生、地址四个信息区域的大致位置，得到姓名、性别、出生、地址四个信息区域左上角顶点坐标分别为(X_nlt,Y_nlt)、(X_slt,Y_slt)、(X_blt,Y_blt)、(X_alt,Y_alt)；同时，以地址框的左边界线x坐标X_alt为基准，分别确定姓名、性别、出生三个信息区域的左边界线x坐标X_nlt、X_slt、X_blt，公式如下所示：

第四步，人像面信息定位主要使用坐标定位方法，即确定左上角顶点坐标，同时根据标准身份证中的先验信息将长和宽设置为一固定值，估算右上角顶点坐标、右下角顶点坐标与左下角顶点坐标，公式如下：

其中，X_nlt和Y_nlt分别为姓名信息区域的左上角顶点的x、y坐标，X_alt和Y_alt分别为地址信息区域的左上角顶点的x、y坐标，X_nrt和Y_nrt分别为估算的姓名信息区域右上角顶点的x、y坐标，X_nrd和Y_nrd分别为估算的姓名信息区域右下角顶点的x、y坐标，X_nld和Y_nld分别为估算的姓名信息区域左下角顶点的x、y坐标，X_art和Y_art分别为估算的地址信息区域右上角顶点的x、y坐标，X_ard和Y_ard分别为估算的地址信息区域右下角顶点的x、y坐标，X_ald和Y_ald分别为估算的地址信息区域左下角顶点的x、y坐标，w_n、h_n分别为姓名信息区域长宽设置的固定值，w_a、h_a分别为地址信息区域长宽设置的固定值；X_slt和Y_slt分别为性别信息区域的左上角顶点的x、y坐标，X_blt和Y_blt分别为出生信息区域的左上角顶点的x、y坐标，X_srt和Y_srt分别为估算的性别信息区域右上角顶点的x、y坐标，X_srd和Y_srd分别为估算的性别信息区域右下角顶点的x、y坐标，X_sld和Y_sld分别为估算的性别信息区域左下角顶点的x、y坐标，X_brt和Y_brt分别为估算的出生信息区域右上角顶点的x、y坐标，X_brd和Y_brd分别为估算的出生信息区域右下角顶点的x、y坐标，X_bld和Y_bld分别为估算的出生信息区域左下角顶点的x、y坐标，w_s、h_s分别为性别信息区域长宽设置的固定值，w_b、h_b分别为出生信息区域长宽设置的固定值；其中，性别信息区域包括性别和民族信息，出生信息区域包括出生年、月、日信息；

第五步，连接点(X_nlt,Y_nlt)和(X_nrt,Y_nrt)、(X_nrt,Y_nrt)和(X_nrd,Y_nrd)、(X_nrd,Y_nrd)和(X_nld,Y_nld)、(X_nld,Y_nld)和(X_nlt,Y_nlt)，得到姓名信息区域；连接点(X_alt,Y_alt)和(X_art,Y_art)、(X_art,Y_art)和(X_ard,Y_ard)、(X_ard,Y_ard)和(X_ald,Y_ald)、(X_ald,Y_ald)和(X_alt,Y_alt)，得到地址信息区域；连接点(X_slt,Y_slt)和(X_srt,Y_srt)、(X_srt,Y_srt)和(X_srd,Y_srd)、(X_srd,Y_srd)和(X_sld,Y_sld)、(X_sld,Y_sld)和(X_slt,Y_slt)，得到性别信息区域；连接点(X_blt,Y_blt)和(X_brt,Y_brt)、(X_brt,Y_brt)和(X_brd,Y_brd)、(X_brd,Y_brd)和(X_bld,Y_bld)、(X_bld,Y_bld)和(X_blt,Y_blt)，得到出生信息区域。