CN109344727A

CN109344727A - 身份证文本信息检测方法及装置、可读存储介质和终端

Info

Publication number: CN109344727A
Application number: CN201811042674.2A
Authority: CN
Inventors: 王友金
Original assignee: Suzhou Chuanglu World Information Technology Co Ltd
Current assignee: Suzhou Chuanglu World Information Technology Co Ltd
Priority date: 2018-09-07
Filing date: 2018-09-07
Publication date: 2019-02-15
Anticipated expiration: 2038-09-07
Also published as: CN109344727B

Abstract

一种身份证文本信息检测方法及装置、可读存储介质和终端，所述方法包括：获取待处理的图像信息；对所获取的图像进行预处理，得到预处理后的图像；对所述预处理后的图像进行身份证区域检测；对检测出的身份证区域进行目标信息角点检测；求出检测得到的目标信息角点的最小外接矩形并输出，作为身份证文本信息检测结果。上述的方案，可以提高身份证文本信息检测的准确性。

Description

身份证文本信息检测方法及装置、可读存储介质和终端

技术领域

本发明涉及信息检测技术领域，具体地涉及一种身份证文本信息检测方法及装置、可读存储介质和终端。

背景技术

在数字化时代，人们为了实现身份证等信息的自动录入，首先将身份证件拍成图片，再利用计算机视觉技术从图片中自动获取文本。

当前针对复杂场景的文本检测主要有两种技术途径：其一，是以人工特征和人的先验知识为代表的传统方法。此方法通常以人工设计特征，如方向梯度直方图（Histogramof Oriented Gradient，HOG）或宽笔画变换（Stroke Width Transforms，SWT）特征，然后配合传统机器学习算法，如K近邻（k-Nearest Neighbor, KNN）、支持向量机（(SupportVector Machine，SVM）和级联分类器（AdaBoost）进行文本和非文本分类；或者，以最大机制稳定区域（Maximally Stable Extremal Regions，MSER）为代表的特定设计的文本检测算法；其二，是以人工神经网络（Artificial Neural Network, ANN），尤其是DNN，给复杂场景文本检测带来了较大发展，其不需要人工特征，通过原始已标注图片训练便可生成一种端到端（end to end）的场景文本检测模型，来进行文本检测。

但是，传统复杂场景文本检测方法，经常出现较高的漏检率和误检率，存在检测准确性低的问题。

发明内容

本发明解决的技术问题是如何提高身份证文本信息检测的准确性。

为解决上述技术问题，本发明实施例提供了一种身份证文本信息检测方法，所述方法包括：

获取待处理的图像信息；

对所获取的图像进行预处理，得到预处理后的图像；

对所述预处理后的图像进行身份证区域检测；

对检测出的身份证区域进行目标信息角点检测；

求出检测得到的目标信息角点的最小外接矩形并输出，作为身份证文本信息检测结果。

可选地，所述对所获取的图像进行预处理，包括：

将所述图像进行缩放，得到预设尺寸的图像；

将所得到的预设尺寸的图像进行数据增强操作，得到所述预处理后的图像。

可选地，所述数据增强操作，包括仿射变换、随机裁剪和图像模糊中至少一种。

可选地，所述对所述预处理后的图像进行身份证区域检测，包括：

采用预设的基于YOLO目标检测算法的深度神经网络模型对所述预处理后的图像进行检测，得到对应的身份证区域。

可选地，所述对检测出的身份证区域进行目标信息角点检测，包括：

对所述身份证区域中的目标信息角点进行粗定位，得到对应的多个初次回归点；

对粗定位得到的多个初次回归点进行集成平均，得到集成平均后的多个回归点；

按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归，得到与所述目标信息区域一一对应的数个单独回归点组；

对所得到的与目标信息区域一一对应的数个单独回归点组进行集成，得到所述对应的多个目标信息角点。

可选地，所述对所述身份证区域中的目标信息角点进行粗定位，包括：

采用基于DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。

可选地，所述按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归，包括：

采用基于DCNN的卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归。

可选地，所述目标信息区域包括姓名、地址和证件号区域。

本发明实施例还提供了一种身份证文本信息检测装置，所述装置包括：

获取单元，适于获取待处理的图像信息；

预处理单元，适于对所获取的图像进行预处理，得到预处理后的图像；

第一检测单元，适于对所述预处理后的图像进行身份证区域检测；

第二检测单元，适于对检测出的身份证区域进行目标信息角点检测；

计算输出单元，适于求出检测得到的目标信息角点的最小外接矩形并输出，作为身份证文本信息检测结果。

可选地，所述预处理单元，适于将所述图像进行缩放，得到预设尺寸的图像；将所得到的预设尺寸的图像进行数据增强操作，得到所述预处理后的图像。

可选地，所述预处理单元对所得到的预设尺寸的图像进行数据增强操作，包括仿射变换、随机裁剪和图像模糊中至少一种。

可选地，所述第一检测单元，适于采用预设的基于YOLO目标检测算法的深度神经网络模型对所述预处理后的图像进行检测，得到对应的身份证区域。

可选地，所述第二检测单元，适于对所述身份证区域中的目标信息角点进行粗定位，得到对应的多个初次回归点；对粗定位得到的多个初次回归点进行集成平均，得到集成平均后的多个回归点；按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归，得到与所述目标信息区域一一对应的数个单独回归点组；对所得到的与目标信息区域一一对应的数个单独回归点组进行集成，得到所述对应的多个目标信息角点。

可选地，所述第二检测单元，适于采用DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。

可选地，第二检测单元，适于采用基于DCNN的卷积神经网络对所得到的集成平均后的多个回归点分别进行单独回归。

可选地，第二检测单元，适于分别采用对应的DCNN的子卷积神经网络对姓名、地址和证件号对应的角点进行单独回归。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令运行时执行上述任一项所述的身份证文本信息检测方法的步骤。

本发明实施例还提供了一种终端，包括存储器和处理器，所述存储器上储存有能够在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行上述任一项所述的身份证文本信息检测方法的步骤。

与现有技术相比，本发明实施例的技术方案具有以下有益效果：

上述的方案，通过首先对预处理后的图像进行身份证区域检测，再对检测出的身份证区域进行目标信息角点检测，并求出检测得到的目标信息角点的最小外接矩形并输出，作为身份证文本信息检测结果，不仅可以克服文本漏检和误检问题，且在针对身份证区域的二次检测中对目标信息角点进行检测，而非采用目标检测中常用的水平矩形框，使得检测出的目标区域更为准确，从而可以提高检测的准确性。

附图说明

图1是本发明实施例中的一种身份证文本信息检测方法的流程示意图；

图2是本发明实施例中的包含身份证图像的复杂场景图像的示意图；

图3是从所述包含身份证图像的复杂场景图像中分割出的身份证区域的图像的示意图；

图4是本发明实施例中检测得到的身份证区域的目标信息角点的示意图；

图5是本发明实施例中的一种身份证文本信息检测装置的结构示意图。

具体实施方式

本发明实施例中的技术方案通过首先对预处理后的图像进行身份证区域检测，再对检测出的身份证区域进行目标信息角点检测，并求出检测得到的目标信息角点的最小外接矩形并输出，作为身份证文本信息检测结果，不仅可以克服文本漏检和误检问题，且在针对身份证区域的二次检测中对目标信息角点进行检测，而非采用目标检测中常用的水平矩形框，使得检测出的目标区域更为准确，从而可以提高检测的准确性。

为使本发明的上述目的、特征和有益效果能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。

图1是本发明实施例的一种身份证文本信息检测方法的流程示意图。参见图1，本发明实施例的一种身份证文本信息检测方法，适于对复杂场景中的身份证文本区域进行检测，具体可以包括如下的操作：

步骤S101：获取待处理的图像信息。

在具体实施中，所述待处理的图像为复杂场景图像，其中包括有对应的身份证图像的信息。参见图2，其中示出的图像即为包括有对应的身份证图像的复杂场景图像。

步骤S102：对所获取的图像进行预处理，得到预处理后的图像；

在具体实施中，对所获取的图像进行预处理时，可以首先将所述图像进行缩放，得到预设尺寸的图像，如484*484等。接着，将所得到的预设尺寸的图像进行数据增强操作，得到所述预处理后的图像。

其中，所述数据增强操作，是指对图片进行随机的旋转、翻转、裁剪、随机设置图片的亮度和对比度以及对数据进行标准化等，如仿射变换、随机裁剪和图像模糊等。当然，还可以采用比以上更多或者更少的数据增强操作，本领域的技术人员可以根据实际的需要进行设置，在此不做限制。

步骤S103：对所述预处理后的图像进行身份证区域检测。

在具体实施中，当得到预处理后的图像时，可以采用预设的检测模型对所述预处理后的图像进行检测，以从所述预处理后的图像中分割出身份证区域的图像。参见图3，其中示出了通过对所述预处理后的图像进行检测所得到的身份证区域。

在本发明一实施例中，采用基于YOLO算法的深度神经网络模型对所述预处理后的图像进行检测，得到对应的身份证区域，以在目标信息所占的区域过小时，可以防止直接从整个复杂场景图像中查找目标信息而造成的漏检。其中，所述基于YOLO算法的深度神经网络模型的训练过程，具体可以包括：

首先，获取含有身份证区域标注信息的复杂背景下的身份证图像，作为训练样本，并将所获取的样本划分为训练集、验证集和测试集。接着，对所获取的上述的含有身份证区域标注信息的复杂背景下的身份证图像进行预处理，以剔除不含有有效身份证区域样本，并将图像的尺寸缩放到预设的大小，如484*484等，并通过仿射变换、随机裁剪、模糊等操作对所获取的样本进行数据增强。

随后，构建深度神经网络模型的网络结构。在本发明一实施例中，所构建的深度神经网络模型的网络结构包含24个卷积层和2个全连接层。其中，对于24个卷积层，主要使用1*1卷积进行信道缩减（channel reduction），然后紧跟3*3卷积。对于卷积层和全连接层，采用Leaky ReLU激活函数max(x， 0.1x)，最后一层采用线性激活函数。

在网络前期通过卷积神经网络（Convolutional Neural Network，CNN）提取样本图像的特征，并在最后一层全连接（Fully connected，FC）输出一个539的向量，通过重塑（reshape）获得一个7*7*11的多维矩阵。其中，所述7*7*11的多维矩阵中，7*7个单元格中的每个单元格均可以用于预测目标区域，之后的11位中的前5*2位中“2”表示前景和背景，“5”分别表示预测区域的中心点c_x和c_y，宽w、高h和前景的置信度×c，11位中的最后1位表示目标类别置信度。

步骤S104：对检测出的身份证区域进行目标信息角点检测。

在本发明一实施例中，所述对检测的身份证区域进行目标信息角点检测，可以分为以下两个阶段；

第一阶段，采用对所述身份证区域中的目标信息角点进行粗定位，得到对应的多个初次回归点p1~pn，并对粗定位得到的多个初次回归点进行集成平均，得到集成平均后的多个回归点mp1~mpn。在本发明一实施例中，采用基于DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。

第二阶段，按照目标信息区域对所得到的集成平均后的多个回归点mp1~mpn分别进行单独回归，得到与所述目标信息区域一一对应的数个单独回归点组。在本发明一实施例中，分别采用基于DCNN的卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归。例如，分别采用对应的子卷积神经网络对姓名、地址和证件号对应的角点进行单独回归，得到与姓名对应的角点np1~npn，与地址对应的角点ap1~apn，以及与证件号对应的角点ip1~ipn。

最后，对所得到的与目标信息区域一一对应的数个单独回归点组进行集成，得到所述对应的多个目标信息角点op1~opn。

参见图4，所述目标信息角点检测，即为对圆圈表示的姓名、地址、证件号的角点进行检测。

需要指出的是，图2至图4中的马赛克涂改标记用于表示非有用信息，是为了保护个人隐私。

步骤S105：求出检测得到的目标信息角点的最小外接矩形并输出，作为身份证文本信息检测结果。

在具体实施中，当得到所述多个目标信息角点op1~opn时，求出目标信息角点op1~opn的最小外接矩形，便是目标信息的真实区域，也即身份证文本信息的检测结果。

上述对本发明实施例中的身份证文本信息检测方法进行了详细的描述，下面将对上述的方法对应的装置进行介绍。

图5示出了本发明实施例还提供了一种身份证文本信息检测装置的结构示意图。如图5所示，一种身份证文本信息检测装置50可以包括获取单元51、预处理单元52、第一检测单元53、第二检测单元54和计算输出单元55，其中：

所述获取单元51，适于获取待处理的图像信息；

所述预处理单元52，适于对所获取的图像进行预处理，得到预处理后的图像；在具体实施中，所述预处理单元52，适于将所述图像进行缩放，得到预设尺寸的图像；将所得到的预设尺寸的图像进行数据增强操作，得到所述预处理后的图像。其中，所述预处理单元52对所得到的预设尺寸的图像进行数据增强操作，可以包括仿射变换、随机裁剪和图像模糊中至少一种。

所述第一检测单元53，适于对所述预处理后的图像进行身份证区域检测；在具体实施中，所述第一检测单元53，适于采用基于YOLO算法的深度神经网络模型对所述预处理后的图像进行检测，得到对应的身份证区域。

所述第二检测单元54，适于对检测出的身份证区域进行目标信息角点检测；在具体实施中，所述第二检测单元54，适于对所述身份证区域中的目标信息角点进行粗定位，得到对应的多个初次回归点；对粗定位得到的多个初次回归点进行集成平均，得到集成平均后的多个回归点；按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归，得到与所述目标信息区域一一对应的数个单独回归点组；对所得到的与目标信息区域一一对应的数个单独回归点组进行集成，得到所述对应的多个目标信息角点；在本发明一实施例中，所述第二检测单元54，适于采用基于DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。在本发明另一实施例中，第二检测单元54，适于采用基于DCNN的深卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归。其中，第二检测单元54，适于分别采用对应的DCNN的子卷积神经网络对姓名、地址和证件号对应的角点进行单独回归。

所述计算输出单元55，适于求出检测得到的目标信息角点的最小外接矩形并输出，作为身份证文本信息检测结果。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令运行时执行所述的身份证文本信息检测方法的步骤。其中，所述的身份证文本信息检测方法请参见前述部分的详细介绍，不再赘述。

本发明实施例还提供了一种终端，包括存储器和处理器，所述存储器上储存有能够在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行所述的身份证文本信息检测方法的步骤。其中，所述的身份证文本信息检测方法请参见前述部分的详细介绍，不再赘述。

采用本发明实施例中的上述方案，通过首先对预处理后的图像进行身份证区域检测，再对检测出的身份证区域进行目标信息角点检测，并求出检测得到的目标信息角点的最小外接矩形并输出，作为身份证文本信息检测结果，不仅可以克服文本漏检和误检问题，且在针对身份证区域的二次检测中对目标信息角点进行检测，而非采用目标检测中常用的水平矩形框，使得检测出的目标区域更为准确，从而可以提高检测的准确性。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于计算机可读存储介质中，存储介质可以包括：ROM、RAM、磁盘或光盘等。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims

1.一种身份证文本信息检测方法，其特征在于，包括：

获取待处理的图像信息；

对所获取的图像进行预处理，得到预处理后的图像；

对所述预处理后的图像进行身份证区域检测；

对检测出的身份证区域进行目标信息角点检测；

2.根据权利要求1所述的身份证文本信息检测方法，其特征在于，所述对所获取的图像进行预处理，包括：

将所述图像进行缩放，得到预设尺寸的图像；

3.根据权利要求2所述的身份证文本信息检测方法，其特征在于，所述数据增强操作，包括仿射变换、随机裁剪和图像模糊中至少一种。

4.根据权利要求1所述的身份证文本信息检测方法，其特征在于，所述对所述预处理后的图像进行身份证区域检测，包括：

采用基于YOLO目标检测算法的深度神经网络模型对所述预处理后的图像进行检测，得到对应的身份证区域。

5.根据权利要求1所述的身份证文本信息检测方法，其特征在于，所述对检测出的身份证区域进行目标信息角点检测，包括：

6.根据权利要求5所述的身份证文本信息检测方法，其特征在于，所述对所述身份证区域中的目标信息角点进行粗定位，包括：

7.根据权利要求5或6所述的身份证文本信息检测方法，其特征在于，所述按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归，包括：

8.根据权利要求7所述的身份证文本信息检测方法，其特征在于，所述采用基于DCNN的卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归，包括：

分别采用对应的DCNN的子卷积神经网络对姓名、地址和证件号对应的角点进行单独回归。

9.一种身份证文本信息检测装置，其特征在于，包括：

获取单元，适于获取待处理的图像信息；

10.根据权利要求9所述的身份证文本信息检测装置，其特征在于，所述预处理单元，适于将所述图像进行缩放，得到预设尺寸的图像；将所得到的预设尺寸的图像进行数据增强操作，得到所述预处理后的图像。

11.根据权利要求10所述的身份证文本信息检测装置，其特征在于，所述预处理单元对所得到的预设尺寸的图像进行数据增强操作，包括仿射变换、随机裁剪和图像模糊中至少一种。

12.根据权利要求9所述的身份证文本信息检测装置，其特征在于，所述第一检测单元，适于采用预设的基于YOLO算法的深度神经网络模型对所述预处理后的图像进行检测，得到对应的身份证区域。

13.根据权利要求9所述的身份证文本信息检测装置，其特征在于，所述第二检测单元，适于对所述身份证区域中的目标信息角点进行粗定位，得到对应的多个初次回归点；对粗定位得到的多个初次回归点进行集成平均，得到集成平均后的多个回归点；按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归，得到与所述目标信息区域一一对应的数个单独回归点组；对所得到的与目标信息区域一一对应的数个单独回归点组进行集成，得到所述对应的多个目标信息角点。

14.根据权利要求13所述的身份证文本信息检测装置，其特征在于，所述第二检测单元，适于采用基于DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。

15.根据权利要求13或14所述的身份证文本信息检测装置，其特征在于，第二检测单元，采用基于DCNN的卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归。

16.根据权利要求15所述的身份证文本信息检测装置，其特征在于，第二检测单元，适于分别采用对应的DCNN的子卷积神经网络对姓名、地址和证件号对应的角点进行单独回归。

17.一种计算机可读存储介质，其上存储有计算机指令，其特征在于，所述计算机指令运行时执行权利要求1至8任一项所述的身份证文本信息检测方法的步骤。

18.一种终端，其特征在于，包括存储器和处理器，所述存储器上储存有能够在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行权利要求1至8任一项所述的身份证文本信息检测方法的步骤。