CN109344727A - 身份证文本信息检测方法及装置、可读存储介质和终端 - Google Patents

身份证文本信息检测方法及装置、可读存储介质和终端 Download PDF

Info

Publication number
CN109344727A
CN109344727A CN201811042674.2A CN201811042674A CN109344727A CN 109344727 A CN109344727 A CN 109344727A CN 201811042674 A CN201811042674 A CN 201811042674A CN 109344727 A CN109344727 A CN 109344727A
Authority
CN
China
Prior art keywords
identity card
image
region
detection
target information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811042674.2A
Other languages
English (en)
Other versions
CN109344727B (zh
Inventor
王友金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Chuanglu World Information Technology Co Ltd
Original Assignee
Suzhou Chuanglu World Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Chuanglu World Information Technology Co Ltd filed Critical Suzhou Chuanglu World Information Technology Co Ltd
Priority to CN201811042674.2A priority Critical patent/CN109344727B/zh
Publication of CN109344727A publication Critical patent/CN109344727A/zh
Application granted granted Critical
Publication of CN109344727B publication Critical patent/CN109344727B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

一种身份证文本信息检测方法及装置、可读存储介质和终端,所述方法包括:获取待处理的图像信息;对所获取的图像进行预处理,得到预处理后的图像;对所述预处理后的图像进行身份证区域检测;对检测出的身份证区域进行目标信息角点检测;求出检测得到的目标信息角点的最小外接矩形并输出,作为身份证文本信息检测结果。上述的方案,可以提高身份证文本信息检测的准确性。

Description

身份证文本信息检测方法及装置、可读存储介质和终端
技术领域
本发明涉及信息检测技术领域,具体地涉及一种身份证文本信息检测方法及装置、可读存储介质和终端。
背景技术
在数字化时代,人们为了实现身份证等信息的自动录入,首先将身份证件拍成图片,再利用计算机视觉技术从图片中自动获取文本。
当前针对复杂场景的文本检测主要有两种技术途径:其一,是以人工特征和人的先验知识为代表的传统方法。此方法通常以人工设计特征,如方向梯度直方图(Histogramof Oriented Gradient,HOG)或宽笔画变换(Stroke Width Transforms,SWT)特征,然后配合传统机器学习算法,如K近邻(k-Nearest Neighbor, KNN)、支持向量机((SupportVector Machine,SVM)和级联分类器(AdaBoost)进行文本和非文本分类;或者,以最大机制稳定区域(Maximally Stable Extremal Regions,MSER)为代表的特定设计的文本检测算法;其二,是以人工神经网络(Artificial Neural Network, ANN),尤其是DNN,给复杂场景文本检测带来了较大发展,其不需要人工特征,通过原始已标注图片训练便可生成一种端到端(end to end)的场景文本检测模型,来进行文本检测。
但是,传统复杂场景文本检测方法,经常出现较高的漏检率和误检率,存在检测准确性低的问题。
发明内容
本发明解决的技术问题是如何提高身份证文本信息检测的准确性。
为解决上述技术问题,本发明实施例提供了一种身份证文本信息检测方法,所述方法包括:
获取待处理的图像信息;
对所获取的图像进行预处理,得到预处理后的图像;
对所述预处理后的图像进行身份证区域检测;
对检测出的身份证区域进行目标信息角点检测;
求出检测得到的目标信息角点的最小外接矩形并输出,作为身份证文本信息检测结果。
可选地,所述对所获取的图像进行预处理,包括:
将所述图像进行缩放,得到预设尺寸的图像;
将所得到的预设尺寸的图像进行数据增强操作,得到所述预处理后的图像。
可选地,所述数据增强操作,包括仿射变换、随机裁剪和图像模糊中至少一种。
可选地,所述对所述预处理后的图像进行身份证区域检测,包括:
采用预设的基于YOLO目标检测算法的深度神经网络模型对所述预处理后的图像进行检测,得到对应的身份证区域。
可选地,所述对检测出的身份证区域进行目标信息角点检测,包括:
对所述身份证区域中的目标信息角点进行粗定位,得到对应的多个初次回归点;
对粗定位得到的多个初次回归点进行集成平均,得到集成平均后的多个回归点;
按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归,得到与所述目标信息区域一一对应的数个单独回归点组;
对所得到的与目标信息区域一一对应的数个单独回归点组进行集成,得到所述对应的多个目标信息角点。
可选地,所述对所述身份证区域中的目标信息角点进行粗定位,包括:
采用基于DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。
可选地,所述按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归,包括:
采用基于DCNN的卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归。
可选地,所述目标信息区域包括姓名、地址和证件号区域。
本发明实施例还提供了一种身份证文本信息检测装置,所述装置包括:
获取单元,适于获取待处理的图像信息;
预处理单元,适于对所获取的图像进行预处理,得到预处理后的图像;
第一检测单元,适于对所述预处理后的图像进行身份证区域检测;
第二检测单元,适于对检测出的身份证区域进行目标信息角点检测;
计算输出单元,适于求出检测得到的目标信息角点的最小外接矩形并输出,作为身份证文本信息检测结果。
可选地,所述预处理单元,适于将所述图像进行缩放,得到预设尺寸的图像;将所得到的预设尺寸的图像进行数据增强操作,得到所述预处理后的图像。
可选地,所述预处理单元对所得到的预设尺寸的图像进行数据增强操作,包括仿射变换、随机裁剪和图像模糊中至少一种。
可选地,所述第一检测单元,适于采用预设的基于YOLO目标检测算法的深度神经网络模型对所述预处理后的图像进行检测,得到对应的身份证区域。
可选地,所述第二检测单元,适于对所述身份证区域中的目标信息角点进行粗定位,得到对应的多个初次回归点;对粗定位得到的多个初次回归点进行集成平均,得到集成平均后的多个回归点;按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归,得到与所述目标信息区域一一对应的数个单独回归点组;对所得到的与目标信息区域一一对应的数个单独回归点组进行集成,得到所述对应的多个目标信息角点。
可选地,所述第二检测单元,适于采用DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。
可选地,第二检测单元,适于采用基于DCNN的卷积神经网络对所得到的集成平均后的多个回归点分别进行单独回归。
可选地,第二检测单元,适于分别采用对应的DCNN的子卷积神经网络对姓名、地址和证件号对应的角点进行单独回归。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一项所述的身份证文本信息检测方法的步骤。
本发明实施例还提供了一种终端,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一项所述的身份证文本信息检测方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
上述的方案,通过首先对预处理后的图像进行身份证区域检测,再对检测出的身份证区域进行目标信息角点检测,并求出检测得到的目标信息角点的最小外接矩形并输出,作为身份证文本信息检测结果,不仅可以克服文本漏检和误检问题,且在针对身份证区域的二次检测中对目标信息角点进行检测,而非采用目标检测中常用的水平矩形框,使得检测出的目标区域更为准确,从而可以提高检测的准确性。
附图说明
图1是本发明实施例中的一种身份证文本信息检测方法的流程示意图;
图2是本发明实施例中的包含身份证图像的复杂场景图像的示意图;
图3是从所述包含身份证图像的复杂场景图像中分割出的身份证区域的图像的示意图;
图4是本发明实施例中检测得到的身份证区域的目标信息角点的示意图;
图5是本发明实施例中的一种身份证文本信息检测装置的结构示意图。
具体实施方式
本发明实施例中的技术方案通过首先对预处理后的图像进行身份证区域检测,再对检测出的身份证区域进行目标信息角点检测,并求出检测得到的目标信息角点的最小外接矩形并输出,作为身份证文本信息检测结果,不仅可以克服文本漏检和误检问题,且在针对身份证区域的二次检测中对目标信息角点进行检测,而非采用目标检测中常用的水平矩形框,使得检测出的目标区域更为准确,从而可以提高检测的准确性。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明实施例的一种身份证文本信息检测方法的流程示意图。参见图1,本发明实施例的一种身份证文本信息检测方法,适于对复杂场景中的身份证文本区域进行检测,具体可以包括如下的操作:
步骤S101:获取待处理的图像信息。
在具体实施中,所述待处理的图像为复杂场景图像,其中包括有对应的身份证图像的信息。参见图2,其中示出的图像即为包括有对应的身份证图像的复杂场景图像。
步骤S102:对所获取的图像进行预处理,得到预处理后的图像;
在具体实施中,对所获取的图像进行预处理时,可以首先将所述图像进行缩放,得到预设尺寸的图像,如484*484等。接着,将所得到的预设尺寸的图像进行数据增强操作,得到所述预处理后的图像。
其中,所述数据增强操作,是指对图片进行随机的旋转、翻转、裁剪、随机设置图片的亮度和对比度以及对数据进行标准化等,如仿射变换、随机裁剪和图像模糊等。当然,还可以采用比以上更多或者更少的数据增强操作,本领域的技术人员可以根据实际的需要进行设置,在此不做限制。
步骤S103:对所述预处理后的图像进行身份证区域检测。
在具体实施中,当得到预处理后的图像时,可以采用预设的检测模型对所述预处理后的图像进行检测,以从所述预处理后的图像中分割出身份证区域的图像。参见图3,其中示出了通过对所述预处理后的图像进行检测所得到的身份证区域。
在本发明一实施例中,采用基于YOLO算法的深度神经网络模型对所述预处理后的图像进行检测,得到对应的身份证区域,以在目标信息所占的区域过小时,可以防止直接从整个复杂场景图像中查找目标信息而造成的漏检。其中,所述基于YOLO算法的深度神经网络模型的训练过程,具体可以包括:
首先,获取含有身份证区域标注信息的复杂背景下的身份证图像,作为训练样本,并将所获取的样本划分为训练集、验证集和测试集。接着,对所获取的上述的含有身份证区域标注信息的复杂背景下的身份证图像进行预处理,以剔除不含有有效身份证区域样本,并将图像的尺寸缩放到预设的大小,如484*484等,并通过仿射变换、随机裁剪、模糊等操作对所获取的样本进行数据增强。
随后,构建深度神经网络模型的网络结构。在本发明一实施例中,所构建的深度神经网络模型的网络结构包含24个卷积层和2个全连接层。其中,对于24个卷积层,主要使用1*1卷积进行信道缩减(channel reduction),然后紧跟3*3卷积。对于卷积层和全连接层,采用Leaky ReLU激活函数max(x, 0.1x),最后一层采用线性激活函数。
在网络前期通过卷积神经网络(Convolutional Neural Network,CNN)提取样本图像的特征,并在最后一层全连接(Fully connected,FC)输出一个539的向量,通过重塑(reshape)获得一个7*7*11的多维矩阵。其中,所述7*7*11的多维矩阵中,7*7个单元格中的每个单元格均可以用于预测目标区域,之后的11位中的前5*2位中“2”表示前景和背景,“5”分别表示预测区域的中心点cx和cy,宽w、高h和前景的置信度×c,11位中的最后1位表示目标类别置信度。
步骤S104:对检测出的身份证区域进行目标信息角点检测。
在本发明一实施例中,所述对检测的身份证区域进行目标信息角点检测,可以分为以下两个阶段;
第一阶段,采用对所述身份证区域中的目标信息角点进行粗定位,得到对应的多个初次回归点p1~pn,并对粗定位得到的多个初次回归点进行集成平均,得到集成平均后的多个回归点mp1~mpn。在本发明一实施例中,采用基于DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。
第二阶段,按照目标信息区域对所得到的集成平均后的多个回归点mp1~mpn分别进行单独回归,得到与所述目标信息区域一一对应的数个单独回归点组。在本发明一实施例中,分别采用基于DCNN的卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归。例如,分别采用对应的子卷积神经网络对姓名、地址和证件号对应的角点进行单独回归,得到与姓名对应的角点np1~npn,与地址对应的角点ap1~apn,以及与证件号对应的角点ip1~ipn。
最后,对所得到的与目标信息区域一一对应的数个单独回归点组进行集成,得到所述对应的多个目标信息角点op1~opn。
参见图4,所述目标信息角点检测,即为对圆圈表示的姓名、地址、证件号的角点进行检测。
需要指出的是,图2至图4中的马赛克涂改标记用于表示非有用信息,是为了保护个人隐私。
步骤S105:求出检测得到的目标信息角点的最小外接矩形并输出,作为身份证文本信息检测结果。
在具体实施中,当得到所述多个目标信息角点op1~opn时,求出目标信息角点op1~opn的最小外接矩形,便是目标信息的真实区域,也即身份证文本信息的检测结果。
上述对本发明实施例中的身份证文本信息检测方法进行了详细的描述,下面将对上述的方法对应的装置进行介绍。
图5示出了本发明实施例还提供了一种身份证文本信息检测装置的结构示意图。如图5所示,一种身份证文本信息检测装置50可以包括获取单元51、预处理单元52、第一检测单元53、第二检测单元54和计算输出单元55,其中:
所述获取单元51,适于获取待处理的图像信息;
所述预处理单元52,适于对所获取的图像进行预处理,得到预处理后的图像;在具体实施中,所述预处理单元52,适于将所述图像进行缩放,得到预设尺寸的图像;将所得到的预设尺寸的图像进行数据增强操作,得到所述预处理后的图像。其中,所述预处理单元52对所得到的预设尺寸的图像进行数据增强操作,可以包括仿射变换、随机裁剪和图像模糊中至少一种。
所述第一检测单元53,适于对所述预处理后的图像进行身份证区域检测;在具体实施中,所述第一检测单元53,适于采用基于YOLO算法的深度神经网络模型对所述预处理后的图像进行检测,得到对应的身份证区域。
所述第二检测单元54,适于对检测出的身份证区域进行目标信息角点检测;在具体实施中,所述第二检测单元54,适于对所述身份证区域中的目标信息角点进行粗定位,得到对应的多个初次回归点;对粗定位得到的多个初次回归点进行集成平均,得到集成平均后的多个回归点;按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归,得到与所述目标信息区域一一对应的数个单独回归点组;对所得到的与目标信息区域一一对应的数个单独回归点组进行集成,得到所述对应的多个目标信息角点;在本发明一实施例中,所述第二检测单元54,适于采用基于DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。在本发明另一实施例中,第二检测单元54,适于采用基于DCNN的深卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归。其中,第二检测单元54,适于分别采用对应的DCNN的子卷积神经网络对姓名、地址和证件号对应的角点进行单独回归。
所述计算输出单元55,适于求出检测得到的目标信息角点的最小外接矩形并输出,作为身份证文本信息检测结果。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述的身份证文本信息检测方法的步骤。其中,所述的身份证文本信息检测方法请参见前述部分的详细介绍,不再赘述。
本发明实施例还提供了一种终端,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述的身份证文本信息检测方法的步骤。其中,所述的身份证文本信息检测方法请参见前述部分的详细介绍,不再赘述。
采用本发明实施例中的上述方案,通过首先对预处理后的图像进行身份证区域检测,再对检测出的身份证区域进行目标信息角点检测,并求出检测得到的目标信息角点的最小外接矩形并输出,作为身份证文本信息检测结果,不仅可以克服文本漏检和误检问题,且在针对身份证区域的二次检测中对目标信息角点进行检测,而非采用目标检测中常用的水平矩形框,使得检测出的目标区域更为准确,从而可以提高检测的准确性。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (18)

1.一种身份证文本信息检测方法,其特征在于,包括:
获取待处理的图像信息;
对所获取的图像进行预处理,得到预处理后的图像;
对所述预处理后的图像进行身份证区域检测;
对检测出的身份证区域进行目标信息角点检测;
求出检测得到的目标信息角点的最小外接矩形并输出,作为身份证文本信息检测结果。
2.根据权利要求1所述的身份证文本信息检测方法,其特征在于,所述对所获取的图像进行预处理,包括:
将所述图像进行缩放,得到预设尺寸的图像;
将所得到的预设尺寸的图像进行数据增强操作,得到所述预处理后的图像。
3.根据权利要求2所述的身份证文本信息检测方法,其特征在于,所述数据增强操作,包括仿射变换、随机裁剪和图像模糊中至少一种。
4.根据权利要求1所述的身份证文本信息检测方法,其特征在于,所述对所述预处理后的图像进行身份证区域检测,包括:
采用基于YOLO目标检测算法的深度神经网络模型对所述预处理后的图像进行检测,得到对应的身份证区域。
5.根据权利要求1所述的身份证文本信息检测方法,其特征在于,所述对检测出的身份证区域进行目标信息角点检测,包括:
对所述身份证区域中的目标信息角点进行粗定位,得到对应的多个初次回归点;
对粗定位得到的多个初次回归点进行集成平均,得到集成平均后的多个回归点;
按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归,得到与所述目标信息区域一一对应的数个单独回归点组;
对所得到的与目标信息区域一一对应的数个单独回归点组进行集成,得到所述对应的多个目标信息角点。
6.根据权利要求5所述的身份证文本信息检测方法,其特征在于,所述对所述身份证区域中的目标信息角点进行粗定位,包括:
采用基于DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。
7.根据权利要求5或6所述的身份证文本信息检测方法,其特征在于,所述按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归,包括:
采用基于DCNN的卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归。
8.根据权利要求7所述的身份证文本信息检测方法,其特征在于,所述采用基于DCNN的卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归,包括:
分别采用对应的DCNN的子卷积神经网络对姓名、地址和证件号对应的角点进行单独回归。
9.一种身份证文本信息检测装置,其特征在于,包括:
获取单元,适于获取待处理的图像信息;
预处理单元,适于对所获取的图像进行预处理,得到预处理后的图像;
第一检测单元,适于对所述预处理后的图像进行身份证区域检测;
第二检测单元,适于对检测出的身份证区域进行目标信息角点检测;
计算输出单元,适于求出检测得到的目标信息角点的最小外接矩形并输出,作为身份证文本信息检测结果。
10.根据权利要求9所述的身份证文本信息检测装置,其特征在于,所述预处理单元,适于将所述图像进行缩放,得到预设尺寸的图像;将所得到的预设尺寸的图像进行数据增强操作,得到所述预处理后的图像。
11.根据权利要求10所述的身份证文本信息检测装置,其特征在于,所述预处理单元对所得到的预设尺寸的图像进行数据增强操作,包括仿射变换、随机裁剪和图像模糊中至少一种。
12.根据权利要求9所述的身份证文本信息检测装置,其特征在于,所述第一检测单元,适于采用预设的基于YOLO算法的深度神经网络模型对所述预处理后的图像进行检测,得到对应的身份证区域。
13.根据权利要求9所述的身份证文本信息检测装置,其特征在于,所述第二检测单元,适于对所述身份证区域中的目标信息角点进行粗定位,得到对应的多个初次回归点;对粗定位得到的多个初次回归点进行集成平均,得到集成平均后的多个回归点;按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归,得到与所述目标信息区域一一对应的数个单独回归点组;对所得到的与目标信息区域一一对应的数个单独回归点组进行集成,得到所述对应的多个目标信息角点。
14.根据权利要求13所述的身份证文本信息检测装置,其特征在于,所述第二检测单元,适于采用基于DCNN的卷积神经网络对所述身份证区域中的目标信息角点进行粗定位。
15.根据权利要求13或14所述的身份证文本信息检测装置,其特征在于,第二检测单元,采用基于DCNN的卷积神经网络按照目标信息区域对所得到的集成平均后的多个回归点分别进行单独回归。
16.根据权利要求15所述的身份证文本信息检测装置,其特征在于,第二检测单元,适于分别采用对应的DCNN的子卷积神经网络对姓名、地址和证件号对应的角点进行单独回归。
17.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至8任一项所述的身份证文本信息检测方法的步骤。
18.一种终端,其特征在于,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行权利要求1至8任一项所述的身份证文本信息检测方法的步骤。
CN201811042674.2A 2018-09-07 2018-09-07 身份证文本信息检测方法及装置、可读存储介质和终端 Active CN109344727B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811042674.2A CN109344727B (zh) 2018-09-07 2018-09-07 身份证文本信息检测方法及装置、可读存储介质和终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811042674.2A CN109344727B (zh) 2018-09-07 2018-09-07 身份证文本信息检测方法及装置、可读存储介质和终端

Publications (2)

Publication Number Publication Date
CN109344727A true CN109344727A (zh) 2019-02-15
CN109344727B CN109344727B (zh) 2020-11-27

Family

ID=65304948

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811042674.2A Active CN109344727B (zh) 2018-09-07 2018-09-07 身份证文本信息检测方法及装置、可读存储介质和终端

Country Status (1)

Country Link
CN (1) CN109344727B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961040A (zh) * 2019-03-20 2019-07-02 深圳市华付信息技术有限公司 身份证区域定位方法、装置、计算机设备及存储介质
CN109961064A (zh) * 2019-03-20 2019-07-02 深圳市华付信息技术有限公司 身份证文本定位方法、装置、计算机设备及存储介质
CN110458238A (zh) * 2019-08-02 2019-11-15 南通使爱智能科技有限公司 一种证件圆弧点检测和定位的方法及系统
CN110796649A (zh) * 2019-10-29 2020-02-14 北京市商汤科技开发有限公司 目标检测方法及装置、电子设备和存储介质
CN110826561A (zh) * 2019-11-11 2020-02-21 上海眼控科技股份有限公司 车辆文本识别方法、装置和计算机设备
CN112257712A (zh) * 2020-10-29 2021-01-22 湖南星汉数智科技有限公司 一种火车票图像摆正方法、装置、计算机装置及计算机可读存储介质
CN112418158A (zh) * 2020-02-11 2021-02-26 支付宝实验室(新加坡)有限公司 适于检测身份证明卡的系统及与其关联的装置和处理方法
CN112651395A (zh) * 2021-01-11 2021-04-13 上海优扬新媒信息技术有限公司 图像的处理方法以及装置
CN112686247A (zh) * 2020-12-10 2021-04-20 广州广电运通金融电子股份有限公司 一种身份证号码检测方法、装置、可读存储介质和终端
CN110163193B (zh) * 2019-03-25 2021-08-06 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读存储介质和计算机设备
CN114925802A (zh) * 2021-12-27 2022-08-19 天翼数字生活科技有限公司 一种基于深度特征映射的集成迁移学习方法和系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060045322A1 (en) * 2004-08-26 2006-03-02 Ian Clarke Method and system for recognizing a candidate character in a captured image
US20090268264A1 (en) * 2008-04-23 2009-10-29 Murata Machinery, Ltd. Image processing apparatus, image scanning apparatus, and image processing method
CN102955941A (zh) * 2011-08-31 2013-03-06 汉王科技股份有限公司 身份信息录入方法和装置
CN103679168A (zh) * 2012-08-30 2014-03-26 北京百度网讯科技有限公司 文字区域检测方法及装置
CN106991390A (zh) * 2017-03-30 2017-07-28 电子科技大学 一种基于深度学习的手持人证比对系统及方法
CN107609549A (zh) * 2017-09-20 2018-01-19 北京工业大学 一种自然场景下证件图像的文本检测方法
CN107958201A (zh) * 2017-10-13 2018-04-24 上海眼控科技股份有限公司 一种车辆年检保险单表格的智能检测系统及方法
CN107977648A (zh) * 2017-12-20 2018-05-01 武汉大学 一种基于人脸识别的身份证清晰度的判别方法和系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060045322A1 (en) * 2004-08-26 2006-03-02 Ian Clarke Method and system for recognizing a candidate character in a captured image
US20090268264A1 (en) * 2008-04-23 2009-10-29 Murata Machinery, Ltd. Image processing apparatus, image scanning apparatus, and image processing method
CN102955941A (zh) * 2011-08-31 2013-03-06 汉王科技股份有限公司 身份信息录入方法和装置
CN103679168A (zh) * 2012-08-30 2014-03-26 北京百度网讯科技有限公司 文字区域检测方法及装置
CN106991390A (zh) * 2017-03-30 2017-07-28 电子科技大学 一种基于深度学习的手持人证比对系统及方法
CN107609549A (zh) * 2017-09-20 2018-01-19 北京工业大学 一种自然场景下证件图像的文本检测方法
CN107958201A (zh) * 2017-10-13 2018-04-24 上海眼控科技股份有限公司 一种车辆年检保险单表格的智能检测系统及方法
CN107977648A (zh) * 2017-12-20 2018-05-01 武汉大学 一种基于人脸识别的身份证清晰度的判别方法和系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
MIAO N.等: "Id Card Number Identification Based on Artificial Neural Network", 《2016 INTERNATIONAL CONFERENCE ON ROBOTS & INTELLIGENT SYSTEM (ICRIS)》 *
杨磊: "复杂背景图像中文本检测与定位研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
杨航: "身份证号码识别算法与研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
毛玉仁: "机器人视觉系统中的物体检测技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
罗斌 等: "复杂环境下基于角点回归的全卷积神经网络的车牌定位", 《数据采集与处理》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961040A (zh) * 2019-03-20 2019-07-02 深圳市华付信息技术有限公司 身份证区域定位方法、装置、计算机设备及存储介质
CN109961064A (zh) * 2019-03-20 2019-07-02 深圳市华付信息技术有限公司 身份证文本定位方法、装置、计算机设备及存储介质
CN110163193B (zh) * 2019-03-25 2021-08-06 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读存储介质和计算机设备
CN110458238A (zh) * 2019-08-02 2019-11-15 南通使爱智能科技有限公司 一种证件圆弧点检测和定位的方法及系统
WO2021082231A1 (zh) * 2019-10-29 2021-05-06 北京市商汤科技开发有限公司 目标检测方法及装置、电子设备和存储介质
CN110796649A (zh) * 2019-10-29 2020-02-14 北京市商汤科技开发有限公司 目标检测方法及装置、电子设备和存储介质
CN110796649B (zh) * 2019-10-29 2022-08-30 北京市商汤科技开发有限公司 目标检测方法及装置、电子设备和存储介质
CN110826561A (zh) * 2019-11-11 2020-02-21 上海眼控科技股份有限公司 车辆文本识别方法、装置和计算机设备
CN112418158A (zh) * 2020-02-11 2021-02-26 支付宝实验室(新加坡)有限公司 适于检测身份证明卡的系统及与其关联的装置和处理方法
CN112257712A (zh) * 2020-10-29 2021-01-22 湖南星汉数智科技有限公司 一种火车票图像摆正方法、装置、计算机装置及计算机可读存储介质
CN112257712B (zh) * 2020-10-29 2024-02-27 湖南星汉数智科技有限公司 一种火车票图像摆正方法、装置、计算机装置及计算机可读存储介质
CN112686247A (zh) * 2020-12-10 2021-04-20 广州广电运通金融电子股份有限公司 一种身份证号码检测方法、装置、可读存储介质和终端
CN112651395A (zh) * 2021-01-11 2021-04-13 上海优扬新媒信息技术有限公司 图像的处理方法以及装置
CN114925802A (zh) * 2021-12-27 2022-08-19 天翼数字生活科技有限公司 一种基于深度特征映射的集成迁移学习方法和系统

Also Published As

Publication number Publication date
CN109344727B (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN109344727A (zh) 身份证文本信息检测方法及装置、可读存储介质和终端
CN109284733B (zh) 一种基于yolo和多任务卷积神经网络的导购消极行为监控方法
US20180046650A1 (en) Efficient image matching for large sets of images
CN111310662B (zh) 一种基于集成深度网络的火焰检测识别方法及系统
CN109165589A (zh) 基于深度学习的车辆重识别方法和装置
CN108986152B (zh) 一种基于差分图像的异物检测方法及装置
Zhang et al. Salient object detection by lossless feature reflection
CN105488468A (zh) 一种目标区域的定位方法和装置
CN109087337B (zh) 基于分层卷积特征的长时间目标跟踪方法及系统
Gallo et al. Robust angle invariant GAS meter reading
CN110399826B (zh) 一种端到端人脸检测和识别方法
CN109255792B (zh) 一种视频图像的分割方法、装置、终端设备及存储介质
Chen et al. Multiple object tracking using edge multi-channel gradient model with ORB feature
CN111159150A (zh) 一种数据扩充方法及装置
CN111709305B (zh) 一种基于局部图像块的人脸年龄识别方法
CN104732534A (zh) 一种图像中显著目标的抠取方法及系统
CN106469293A (zh) 快速检测目标的方法及系统
Xie et al. A method of small face detection based on CNN
Hu et al. Fast face detection based on skin color segmentation using single chrominance Cr
CN115937492B (zh) 一种基于特征识别的变电设备红外图像识别方法
CN109784291B (zh) 基于多尺度的卷积特征的行人检测方法
Sikarwar et al. An edge based efficient method of face detection and feature extraction
CN116052230A (zh) 一种掌静脉识别方法、装置、设备及存储介质
Zhao et al. A traffic sign detection method based on saliency detection
Shri et al. Video Analysis for Crowd and Traffic Management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant