CN110414523A

CN110414523A - 一种身份证识别方法、装置、设备及存储介质

Info

Publication number: CN110414523A
Application number: CN201910662371.9A
Authority: CN
Inventors: 杨良志; 白琳; 汪志新; 丁德平; 王向军; 鲍培培
Original assignee: Caixun Technology Co Ltd
Current assignee: Caixun Technology Co Ltd
Priority date: 2019-07-22
Filing date: 2019-07-22
Publication date: 2019-11-05

Abstract

本发明实施例公开了一种身份证识别方法、装置、设备及存储介质。该身份证识别方法包括：对待识别的初始身份证图像进行预处理，生成目标身份证图像；依据身份证信息在身份证上的位置分布，对所述目标身份证图像进行水平投影和垂直投影，根据投影结果对所述目标身份证图像进行字符分割；对分割得到的字符进行识别，根据识别结果生成身份证信息。本发明实施例实现了对身份证图像上字符信息的准确分割，进而提高了身份证信息的识别准确率。

Description

一种身份证识别方法、装置、设备及存储介质

技术领域

本发明实施例涉及信息处理技术，尤其涉及一种身份证识别方法、装置、设备及存储介质。

背景技术

当前，随着模式识别和图像处理技术的发展，基于图像处理的身份证信息识别技术越来越受到重视。并且对身份证中的信息快速准确提取在当前的业务中应用也越来越多。

针对身份证中的信息快速准确提取，目前常用的方法是：利用连通区域搜索的图像处理技术先对身份证图像上的字符连通区域进行识别，进而对识别出的连通区域进行单个字符分割，最后对分割得到的单个字符进行识别。

然而，通过连通区域进行搜索时，由于图像上噪声的影响会造成字符连通区域分割不正确的问题，进而降低了身份信息识别的准确率。

发明内容

本发明实施例提供一种身份证识别方法、装置、设备及存储介质，实现了对身份证图像上字符信息的准确分割，进而提高了身份证信息的识别准确率。

第一方面，本发明实施例提供了一种身份证识别方法，包括：

对待识别的初始身份证图像进行预处理，生成目标身份证图像；

依据身份证信息在身份证上的位置分布，对所述目标身份证图像进行水平投影和垂直投影，根据投影结果对所述目标身份证图像进行字符分割；

对分割得到的字符进行识别，根据识别结果生成身份证信息。

可选的，所述依据身份证信息在身份证上的位置分布，对所述目标身份证图像进行水平投影和垂直投影，根据投影结果对所述目标身份证图像进行字符分割，包括：

对所述目标身份证图像进行水平投影，根据投影结果对所述目标身份证图像上的身份证号区域和其他区域进行分割；

对所述身份证号区域进行垂直投影，根据投影结果对所述身份证号区域中的单个字符进行分割；

对所述其他区域分别进行垂直投影和水平投影，根据投影结果对所述其他区域进行字符分割。

可选的，所述对所述其他区域分别进行垂直投影和水平投影，根据投影结果对所述其他区域进行字符分割，包括：

对所述其他区域进行垂直投影，根据投影结果对所述其他区域上的身份证左侧信息区域和身份证右侧头像区域进行分割；

对所述身份证左侧信息区域进行水平投影，根据投影结果对所述身份证左侧信息区域上的信息行区域进行分割；

对所述信息行区域进行垂直投影，根据投影结果对所述信息行区域中的单个字符进行分割。

可选的，对分割得到的字符进行识别，根据识别结果生成身份证信息，包括：

将分割得到的单个字符图像输入字符识别网络模型中，输出字符识别结果；其中所述字符识别网络模型基于TensorFlow深度学习框架环境，利用训练样本对卷积神经网络初始模型进行训练得到；

按照字符的排列顺序，对所述字符识别结果进行组合，得到身份证信息。

可选的，所述对待识别的初始身份证图像进行预处理，生成目标身份证图像，包括：

对所述待识别的身份证图像依次作灰度化处理、高斯双边滤波、二值化处理和反转色处理，得到黑底白字的目标身份证图像。

第二方面，本发明实施例还提供了一种身份证识别装置，包括：

身份证图像预处理模块，用于对待识别的初始身份证图像进行预处理，生成目标身份证图像；

字符分割模块，用于依据身份证信息在身份证上的位置分布，对所述目标身份证图像进行水平投影和垂直投影，根据投影结果对所述目标身份证图像进行字符分割；

身份证信息生成模块，用于对分割得到的字符进行识别，根据识别结果生成身份证信息。

可选的，所述字符分割模块，包括：

水平投影分割单元，用于对所述目标身份证图像进行水平投影，根据投影结果对所述目标身份证图像上的身份证号区域和其他区域进行分割；

垂直投影分割单元，用于对所述身份证号区域进行垂直投影，根据投影结果对所述身份证号区域中的单个字符进行分割；

字符分割单元，用于对所述其他区域分别进行垂直投影和水平投影，根据投影结果对所述其他区域进行字符分割。

可选的，所述字符分割单元，具体用于：

第三方面，本发明实施例提供了一种计算机设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明任意实施例提供的身份证识别方法。

第四方面，本发明实施例提供了一种存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行本发明任意实施例提供的身份证识别方法。

本发明实施例通过采用预处理操作去除干扰因素，然后采用水平投影和垂直投影技术对身份证图像进行单个字符分割。根据对单个字符识别出的结果生成身份证信息，去除干扰因素对字符分割的影响，提高了字符分割的准确性，进而提高了字符识别的准确性，使得获取到的身份证信息更加可靠，提高了用户的体验感。

附图说明

图1是本发明实施例一中的一种身份证识别方法的流程图；

图2是本发明实施例二中的一种身份证识别方法的流程图；

图3是本发明实施例三中的一种身份证识别方法的流程图；

图4是本发明实施例四中的一种身份证识别方法的流程图；

图5是本发明实施例五中的一种身份证识别装置的结构示意图；

图6是本发明实施例六中的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种身份证识别方法的流程图。本实施例提供的技术方案适用于需要对身份证图像上的信息进行提取识别的情况。该方法可以由一种身份证识别装置来执行，该装置可以由硬件和/或软件实现。典型地，该装置配置于服务端。参见图1，本实施例提供的身份识别方法包括：

步骤110、对待识别的初始身份证图像进行预处理，生成目标身份证图像。

其中，初始身份证图像是未进行预处理的身份证图像。

目标身份证图像是经过预处理的，且可以进行投影操作的身份证图像。

具体地，待识别的初始身份证图像包括由客户端通过摄像头采集得到的身份证图像。

预处理包括对初始身份证图像进行去除干扰因素的操作。干扰因素包括会对后续字符分割造成影响的因素，例如，由于光照不均造成的身份证图像上存在反光现象等。

典型地，预处理操作可以是对所述待识别的身份证图像依次作灰度化处理、高斯双边滤波、二值化处理和反转色处理，得到黑底白字的目标身份证图像。

可选的，所述预处理操作之前还包括对采集的初始身份证图像进行尺寸处理，将图像尺寸统一为1024*1024像素，便于后续对身份证图像中字符分割。

对待识别的初始身份证图像进行预处理之前，所述方法还包括：

获取待识别的初始身份证图像和身份证信息识别指令；

解析所述身份证信息识别指令，根据解析结果触发执行对所述待识别的初始身份证图像进行预处理的操作。

具体地，获取待识别的初始身份证图像，包括：

采用HTTP的方式从移动客户端获取待识别的初始身份证图像；其中初始身份证图像由移动客户端通过摄像头采集得到。

可选的，身份证信息识别指令中包括对身份证信息整体进行识别的指令，或者对身份证信息部分进行识别的指令。

解析所述身份证信息识别指令，得到指令中所要识别的信息类型。身份证图像上可识别的信息类型包括：姓名、性别、民族、地址和身份证号码。

步骤120、依据身份证信息在身份证上的位置分布，对所述目标身份证图像进行水平投影和垂直投影，根据投影结果对所述目标身份证图像进行字符分割。

其中，水平投影是指模拟光线从图像文字一侧射向另一侧，穿过图像文字所在部分根据行像素和大小形成高低阴影峰谷，文字行间隙因没有像素而能够清晰显示出来，从而能够根据像素和大小获取文字行位置坐标，进而获取行信息区域。垂直投影与水平投影同理，模拟光线上下投射，获取文字列间隙，进而获取单个字符区域。

具体地，依据身份证信息在身份证上的位置分布，对所述目标身份证图像进行水平投影和垂直投影，根据投影结果对所述目标身份证图像进行字符分割，包括：

对目标身份证图像先作垂直投影，得到目标身份证图像上的列字符信息子图像，再对列字符信息子图像作水平投影得到列字符信息子图像中的单个字符。

步骤130、对分割得到的字符进行识别，根据识别结果生成身份证信息。

其中，分割得到的字符包括步骤120中利用水平投影和垂直投影对身份证图像进行字符分割的结果；识别结果中包括对分割出的单个字符的识别结果，根据对单个字符的识别结果结合字符所在位置判断其所属身份证信息的类型，最后将识别结果根据信息类型进行组合得到身份证信息。

本实施例的技术方案，通过采用预处理操作去除干扰因素，然后采用水平投影和垂直投影技术对身份证图像进行单个字符分割。根据对单个字符识别出的结果生成身份证信息，去除干扰因素对字符分割的影响，提高了字符分割的准确性。进而提高了字符识别的准确性，使得获取到的身份证信息更加可靠，提高了用户的体验感。

实施例二

图2为本发明实施例二提供的一种身份证识别方法的流程图，本实施例在上述技术方案的基础上进一步细化。其中，未在本实施例中详尽描述的内容详见实施例一。如图2所示，该方法具体包括：

步骤210、对待识别的初始身份证图像进行预处理，生成目标身份证图像。

步骤220、依据身份证信息在身份证上的位置分布，对所述目标身份证图像进行水平投影，根据投影结果对所述目标身份证图像上的身份证号区域和其他区域进行分割。

其中，身份证号区域是指身份证图像中身份证号所在区域。其他区域是指身份证图像上去除身份证号区域的剩余区域。

具体地，其他区域包括头像子区域、姓名子区域、性别子区域、民族子区域、出生时间子区域和地址子区域。

身份证号区域位于身份证图像的下方区域，对目标身份证图像进行水平投影后，得到目标身份证图像的上方区域和下方区域，其中，投影结果中的下方区域为身份证号区域，上方区域为其他区域。

步骤230、对所述身份证号区域进行垂直投影，根据投影结果对所述身份证号区域中的单个字符进行分割。

其中，根据水平投影得到的身份证号区域再进行垂直投影，得到列信息，列信息中包括了身份证号中每个字符的信息，实现了对身份证号中单个字符的分割。

步骤240、对所述其他区域分别进行垂直投影和水平投影，根据投影结果对所述其他区域进行字符分割。

具体地，对水平投影得到的身份证图像的上方区域即其他区域分别再进行垂直投影和水平投影。

其中，身份证右侧头像区域是指身份证图像中人脸头像的区域；身份证左侧信息区域是指身份证图像中除去身份证右侧头像区域和身份证号区域的剩余区域。

具体地，身份证左侧信息区域包括姓名子区域、性别子区域、民族子区域、出生时间子区域和地址子区域。

步骤250、将分割得到的单个字符图像输入字符识别网络模型中，输出字符识别结果，根据识别结果生成身份证信息。

本实施例的方案，通过根据身份证信息在图像上的位置分布，对身份证图像上的信息进行分区域投影分割操作，避免了干扰因素对字符分割的影响，使得字符分割结果的准确率提高。

实施例三

图3是本发明实施例三中的一种身份证识别方法的流程图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图3，本实施例提供的身份证识别方法包括：

步骤310、对待识别的初始身份证图像进行预处理，生成目标身份证图像。

步骤320、依据身份证信息在身份证上的位置分布，对所述目标身份证图像进行水平投影和垂直投影，根据投影结果对所述目标身份证图像进行字符分割。

步骤330、将分割得到的单个字符图像输入字符识别网络模型中，输出字符识别结果；其中所述字符识别网络模型基于TensorFlow深度学习框架环境，利用训练样本对卷积神经网络初始模型进行训练得到。

TensorFlow深度学习框架，是一款使用C++语言开发的开源数学计算软件，使用数据流图的形式进行计算。图中的节点代表数学运算，而图中的线条表示多维数据数组(tensor)之间的交互。TensorFlow灵活的架构可以部署在一个或多个CPU、GPU的台式及服务器中，或者使用单一的API应用在移动设备中。

可选的，训练样本中包括身份证图像上全部字符以及多种字符组合，且样本中包括每个字符加噪声以及旋转灯干扰因素得到的变形字符结果，利用上述所有的字符形成字符样本集。通过加上噪声以及变形的字符可以增加字符结果的识别准确率。

示例性的，字符样本集中需要包括数十万规模的样本集。根据本方法使用量的增大，不断收集图像数据，更新样本集，进而优化字符识别网络模型，使得模型识别准确率不断提高。

步骤340、按照字符的排列顺序，对所述字符识别结果进行组合，得到身份证信息。

具体，按照字符的排列顺序包括在步骤320中对字符进行分割后，将分割后的结果按照顺序存放至数组中。在利用训练得到的字符识别网络模型对分割出的单个字符进行识别时，依次顺序从字符存放数组中取出单个分割字符进行识别，对识别结果按照顺序进行组合，得到最后的识别结果，使得字符的组合顺序和身份证图像上保持一致，保证身份证信息的准确性。

可选的，上述身份证图像可以由客户端获得，发送至服务端，服务端中对获取到的身份证图像进行识别，并将识别结果组装成json格式通过HTTP返回客户端，完成识别过程。将整个主体识别过程部署在远程服务端，使得客户端所需占用空间减少，客户端和识别能力端即服务端分离，使得字符识别网络模型的大小不受移动设备存储空间的影响，进而可以训练处数据样本集庞大、精准的模型，提高字符识别准确率。

本实施例的方案，通过利用字符识别网络模型对分割的单个字符进行识别，并且通过不断扩充训练样本集提高字符识别的准确率，使得身份证信息识别的准确率提高，并且提高了用户的体验感。

实施例四

图4是本发明实施例四中的一种身份证识别方法的流程图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图4，本实施例提供的身份证识别方法包括：

(1)移动客户端通过摄像头采集初始身份证图像。

(2)对于前述(1)中获取的初始身份证图像采用HTTP的方式发送给服务端并发送识别指令。

(3)服务端对于(2)中的识别指令进行解析，并将初始身份证图像数据保存在服务器端。

(4)对前述(3)中的初始身份证图像数据做尺寸处理，按比例将图像大小缩放为1024*1024像素。

(5)对(4)中的经过尺寸处理后的身份证图像进行灰度化处理，获取身份证灰度图像。

(6)对(5)中的身份证灰度图像做高斯双边滤波处理，淡化背景因素影响。

(7)对(6)中高斯双边滤波处理后的身份证图像作二值化处理，并对二值化处理后的图像进行反转色，形成黑底白字身份证图像。

(8)对(7)中的黑底白字身份证图像分别进行水平投影和垂直投影，将身份证图像上的单个字符切割出来，水平投影和垂直投影的具体过程如下：

a.对黑底白字身份证图像作水平投影，切割出身份证图像下方的身份证号区域图像与身份证图像上方的上部信息区域图像；

b.对上部信息区域图像做垂直投影，切割出身份证图像上方部分的左侧信息区域图像与右侧头像区域图像；

c.对左侧信息区域图像做水平投影，切割出多个行信息条；

d.对身份证号区域图像和左侧信息区域图像切割出的行信息条分别做垂直投影，切割获得身份证图像上的单个字符图像。

(9)对于(8)中切割获得的单个字符图像，采用AI深度学习模型进行识别。

具体地，在采用AI深度学习模型进行识别之前，还包括：对前述(9)中提到AI深度学习模型的训练，需要预先准备足够数量的样本集。本实施例中所用的模型训练采用了6935种字符、数字和字母组合，每个字符加噪音及旋转等干扰因素得到数百种变形，最终形成数十万规模样本集。

设计一套合适的神经网络结构供TensorFlow学习框架构建深度学习网络。

采用TensorFlow深度学习框架对样本集进行训练，得到可用于预测的AI深度学习模型。

(10)服务端获取(9)中的字符识别结果，并组装成json格式返回给移动客户端，完成识别过程。

本实施例的方案，通过利用软件方法和系统实现在移动客户端上实现对身份证图像的信息识别，节约了需要借助硬件设备对图像信息识别的成本；并且本实施例通过将识别的主体部分部署在远程服务器上，节省了信息识别的移动客户端在移动设备上的所需占用空间，节省流量。

实施例五

图5为本发明实施例五提供的一种身份证识别装置的结构示意图，如图5所示，该身份证识别装置包括：身份证图像预处理模块510、字符分割模块520和身份证信息生成模块530。

其中，身份证图像预处理模块510，用于对待识别的初始身份证图像进行预处理，生成目标身份证图像。

字符分割模块520，用于依据身份证信息在身份证上的位置分布，对所述目标身份证图像进行水平投影和垂直投影，根据投影结果对所述目标身份证图像进行字符分割。

身份证信息生成模块530，用于对分割得到的字符进行识别，根据识别结果生成身份证信息。

可选的，所述字符分割模块，包括：水平投影分割单元、垂直投影分割单元和字符分割单元。

其中，水平投影分割单元，用于对所述目标身份证图像进行水平投影，根据投影结果对所述目标身份证图像上的身份证号区域和其他区域进行分割；

可选的，所述字符分割单元，具体用于：

可选的，身份证信息生成模块，包括：字符识别单元和结果组合单元。

其中，字符识别单元，用于将分割得到的单个字符图像输入字符识别网络模型中，输出字符识别结果；其中所述字符识别网络模型基于TensorFlow深度学习框架环境，利用训练样本对卷积神经网络初始模型进行训练得到；

结果组合单元，用于按照字符的排列顺序，对所述字符识别结果进行组合，得到身份证信息。

可选的，身份证图像预处理模块，包括：身份证图像预处理单元。

其中，身份证图像预处理单元，用于对所述待识别的身份证图像依次作灰度化处理、高斯双边滤波、二值化处理和反转色处理，得到黑底白字的目标身份证图像。

本发明实施例提供了一种身份证识别的装置，与上述实施例提出的一种身份证识别方法属于同一方面构思，未在本实施例中详尽描述的技术细节可参见上述实施例，并且本实施例与上述实施例具有相同的有益效果。

实施例六

图6为本发明实施例六提供的一种设备的结构示意图，如图6所示，该设备包括处理器60、存储器61、输入装置62和输出装置63；设备6中处理器60的数量可以是一个或多个，图6中以一个处理器60为例；设备6中的处理器60、存储器61、输入装置62和输出装置63可以通过总线或其他方式连接，图6中以通过总线连接为例。

存储器61作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的工件检测方法对应的程序指令/模块(例如，身份证图像预处理模块510、字符分割模块520和身份证信息生成模块530)。处理器60通过运行存储在存储器61中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的身份证识别方法。

存储器61可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器61可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器61可进一步包括相对于处理器60远程设置的存储器，这些远程存储器可以通过网络连接至服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置62可用于接收输入的数字或字符信息，以及产生与服务器的用户设置以及功能控制有关的键信号输入。输出装置63可包括显示屏等显示设备。

实施例七

本发明实施例七还提供一种包括计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种身份证识别方法，该方法包括：

当然，本发明实施例所提供的一种包括计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的身份证识别方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(RandomAccess Memory，RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述身份证识别装置的实施例中，所包括的各个模块和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能模块的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种身份证识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述依据身份证信息在身份证上的位置分布，对所述目标身份证图像进行水平投影和垂直投影，根据投影结果对所述目标身份证图像进行字符分割，包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述其他区域分别进行垂直投影和水平投影，根据投影结果对所述其他区域进行字符分割，包括：

4.根据权利要求1所述的方法，其特征在于，对分割得到的字符进行识别，根据识别结果生成身份证信息，包括：

5.根据权利要求1所述的方法，其特征在于，所述对待识别的初始身份证图像进行预处理，生成目标身份证图像，包括：

6.一种身份证识别装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述字符分割模块，包括：

8.根据权利要求7所述的装置，其特征在于，所述字符分割单元，具体用于：

9.一种计算机设备，其特征在于，所述服务器包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-5中任一所述的身份证识别方法。

10.一种包括计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-5中任一所述的身份证识别方法。