CN109961040A - 身份证区域定位方法、装置、计算机设备及存储介质 - Google Patents
身份证区域定位方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN109961040A CN109961040A CN201910214059.3A CN201910214059A CN109961040A CN 109961040 A CN109961040 A CN 109961040A CN 201910214059 A CN201910214059 A CN 201910214059A CN 109961040 A CN109961040 A CN 109961040A
- Authority
- CN
- China
- Prior art keywords
- card
- card image
- detection
- image
- identity card
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及身份证区域定位方法、装置、计算机设备及存储介质,该方法包括获取初始身份证图像;将初始身份证图像进行多次旋转处理,以得到多个二次身份证图像;将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度;利用最佳旋转角度对初始身份证图像进行处理,以得到身份证区域;对身份证区域按照检测框进行裁剪,以得到目标身份证区域;其中,检测网络模型是通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络所得的模型。本发明实现旋转框的检测,包括区域以及其旋转角度的检测,对硬件要求低且定位精度高。
Description
技术领域
本发明涉及身份证识别方法,更具体地说是指身份证区域定位方法、装置、计算机设备及存储介质。
背景技术
身份证是用于证明持有人身份的证件,多由各国或地区政府发行予公民。它将作为每个人独一无二的公民身份的证明工具,身份证上附有文本信息,文本信息一般表明了对应人员的身份信息。身份证区域定位算法是身份证识别算法中的重要组成部分,能否较为准确地确定身份证区域对之后的处理有着极大地影响。
目前对身份证区域定位的方法有三种,一是是利用传统图像识别方法进行区域定位,如先对图像进行去噪处理,再进行灰度化,二值化,轮廓提取,形态学变换等方法确定身份证区域位置,该方法精度低,不适合商用;二是利用物体检测网络来进行身份证区域定位,目标检测算法Faster RCNN、Yolo、SSD等经典物体检测网络是常用的手段,但这些网络只能检测矩形框,在旋转情况下只能检测到外接身份证的大致区域,无法精确判断出其旋转角度,一般还需要进行后续处理;第三种是利用语义分割网络如FCN、SegNet来进行身份证区域定位,该方法如训练得当能较为精准地确定身份证区域,但相应的其网络结构较为复杂,对硬件要求高,在移动端部署方面有诸多不利。
因此,有必要设计一种新的方法,实现旋转框的检测,包括区域以及其旋转角度的检测,对硬件要求低且定位精度高。
发明内容
本发明的目的在于克服现有技术的缺陷,提供身份证区域定位方法、装置、计算机设备及存储介质。
为实现上述目的,本发明采用以下技术方案:身份证区域定位方法,包括:
获取初始身份证图像;
将初始身份证图像按照基准角度进行旋转处理,以得到多个二次身份证图像;
将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度;
利用最佳旋转角度对初始身份证图像进行处理,以得到身份证区域;
对身份证区域按照检测框进行裁剪,以得到目标身份证区域;
其中,所述检测网络模型是通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络所得的模型。
其进一步技术方案为:所述检测网络模型是通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络所得的模型,包括:
获取水平方位的身份证图像;
对所述身份证图像进行水平的标注框的标注,以得到标注的身份证图像;
对标注后的身份证图像进行旋转增广,以得到初步处理图像;
对初步处理图像进行类别标签设置,以得到初始样本数据;
利用初始样本数据训练目标检测网络,以得到检测框;
判断所述检测框是否能紧贴身份证四个顶点;
若是,则输出当前的目标检测网络,以形成检测网络模型;
若否,则调整目标检测网络的参数,并返回所述利用初始样本数据训练目标检测网络,以得到检测框。
其进一步技术方案为:所述将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度,包括:
将多个二次身份证图像输入检测网络模型内,以得到多个检测框;
计算所有检测框的面积;
判断初始样本数据的旋转角度是否小于设定值;
若是,则获取所有检测框的面积中最小面积所对应的二次身份证图像,以形成标准身份证图像;
获取标准身份证图像所对应初始样本数据的旋转角度,以得到最佳旋转角度。
其进一步技术方案为:所述对身份证区域按照检测框进行裁剪,以得到目标身份证区域之后,还包括:
输出所述目标身份证区域至终端,以使目标身份证区域在终端显示。
本发明还提供了身份证区域定位装置,包括:
图像获取单元,用于获取初始身份证图像;
旋转处理单元,用于将初始身份证图像按照基准角度进行旋转处理,以得到多个二次身份证图像;
检测单元,用于将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度;
图像处理单元,用于利用最佳旋转角度对初始身份证图像进行处理,以得到身份证区域;
裁剪单元,用于对身份证区域按照检测框进行裁剪,以得到目标身份证区域。
其进一步技术方案为:所述检测单元包括:
输入子单元,用于将多个二次身份证图像输入检测网络模型内,以得到多个检测框;
计算子单元,用于计算所有检测框的面积;
角度判断子单元,用于判断初始样本数据的旋转角度是否小于设定值;
筛选子单元,用于若是,则获取所有检测框的面积中最小面积所对应的二次身份证图像,以形成标准身份证图像;
最佳角度获取子单元,用于获取标准身份证图像所对应初始样本数据的旋转角度,以得到最佳旋转角度;
裁剪单元,用于对身份证区域按照检测框进行裁剪,以得到目标身份证区域。
其进一步技术方案为:所述装置还包括:
输出单元,用于输出所述目标身份证区域至终端,以使目标身份证区域在终端显示。
本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
本发明与现有技术相比的有益效果是:本发明通过获取初始身份证图像,对初始身份证图像进行多次旋转扩增处理,再由检测网络模型进行获取检测框,由检测框的面积大小确定最佳旋转角度,并对初始身份证图像进行最小旋转角度的旋转和裁剪,以得到目标身份证区域,实现旋转框的检测,包括区域以及其旋转角度的检测,对硬件要求低且定位精度高。
下面结合附图和具体实施例对本发明作进一步描述。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的身份证区域定位方法的应用场景示意图;
图2为本发明实施例提供的身份证区域定位方法的流程示意图;
图3为本发明实施例提供的身份证区域定位方法的子流程示意图;
图4为本发明实施例提供的身份证区域定位方法的子流程示意图;
图5为本发明实施例提供的水平方位的身份证图像的示意图;
图6为本发明实施例提供的旋转后的身份证图像的示意图一;
图7为本发明实施例提供的旋转后的身份证图像的示意图二;
图8为本发明实施例提供的检测框面积与身份证图像旋转角度的关系示意图;
图9为本发明实施例提供的身份证图像的示意图一;
图10为本发明实施例提供的身份证图像的示意图二;
图11为本发明实施例提供的身份证图像的示意图三;
图12为本发明实施例提供的身份证图像的示意图四;
图13为本发明另一实施例提供的身份证区域定位方法的流程示意图;
图14为本发明实施例提供的身份证区域定位装置的示意性框图;
图15为本发明另一实施例提供的身份证区域定位装置的示意性框图;
图16为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的身份证区域定位方法的应用场景示意图。图2为本发明实施例提供的身份证区域定位方法的示意性流程图。该身份证区域定位方法应用于服务器中,该服务器与终端进行数据交互,由终端获取初始身份证图像后,由服务器对初始身份证图像进行处理并检测,以得到高精度的身份证区域。
图2是本发明实施例提供的身份证区域定位方法的流程示意图。如图2所示,该方法包括以下步骤S110至S150。
S110、获取初始身份证图像。
在本实施例中,初始身份证图像是指未经过任何处理的、由带有摄像功能的电子设备拍摄身份证所获得的图像。
S120、将初始身份证图像按照基准角度进行旋转处理,以得到多个二次身份证图像。
在本实施例中,基准角度是指初始身份证图像的旋转角度,初始化设置时一般为45°。
在本实施例中,二次身份证图像是经过初始身份证图像按照旋转角度进行旋转所得的图像,一般可以是正向旋转某个角度、反向旋转某个角度以及保持原有角度不旋转等。
S130、将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度。
在本实施例中,最佳旋转角度是指使得初始身份证图像旋转后形成竖直状态或者水平状态所对应的角度。
首先,需要训练一个检测网络模型,利用训练后的检测网络模型直接将检测框紧贴身份证的四个顶点,以初步断定身份证区域的所在位置,再根据多个检测框筛选最佳的检测框得出最佳旋转角度。
其中,检测网络模型是通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络所得的模型。具体地,请参阅图3,包括步骤S130a~S130h:
S130a、获取水平方位的身份证图像。
在本实施例中,水平方位的身份证图像是指身份证处于水平无旋转状态时所拍摄的图像。
S130b、对所述身份证图像进行水平的标注框的标注,以得到标注的身份证图像。
在本实施例中,为了搭建检测网络模型,则需要标注人员标注水平的标注框,以便于后续训练目标网络时作为参考来调整目标网络。
S130c、对标注后的身份证图像进行旋转增广,以得到初步处理图像。
在本实施例中,初步处理图像是指对标注后的身份证图像进行一定程度的旋转所得到的图像。
在本实施例中,初步处理图像是由标注后的身份证图像进行负180度至正180度的旋转增广。旋转后相应的标注取紧贴身份证四个顶点的矩形框,可通过求原标注旋转变换后的水平外接矩形得到。
S130d、对初步处理图像进行类别标签设置,以得到初始样本数据。
在本实施例中,初始样本数据是指带有标注以及类别标签的身份证图像。
具体地,类别标签设置方式如下:
旋转角度为正负45度(包括45度)的初步处理图像设为类0;
旋转角度为正负45度到正负90度(包括90度)的初步处理图像设为类1;
旋转角度为正负90度到正负135(包括135度)的初步处理图像设为类2;
旋转角度为正负135度到正负180度(不包括180度)的初步处理图像设为类3。
S130e、利用初始样本数据训练目标检测网络,以得到检测框。
制作好数据集后训练目标检测网络,该网络可以是任意物体检测网络,但一般选取结构较为简单,速度较快的目标检测网络如yolo系列、mobilenet等,只需要运行一个轻量的普通检测网络,对硬件要求不高,仅用普通检测网络就实现了旋转边框检测的效果。
S130f、判断所述检测框是否能紧贴身份证四个顶点;
S130g、若是,则输出当前的目标检测网络,以形成检测网络模型;
S130h、若否,则调整目标检测网络的参数,并返回步骤S130e。
检测网络模型是为了输出检测框,该检测框必须能紧贴身份证四个顶点,以使得身份证区域能够准确地定位出来,如图5至图7所示,检测框始终紧贴着身份证区域的四个顶点。
在一实施例中,请参阅图4,上述的步骤S130可包括步骤S131~S137。
S131、将多个二次身份证图像输入检测网络模型内,以得到多个检测框。
在本实施例中,检测框是指用于检测身份证区域的最小外接方框。
S132、计算所有检测框的面积。
对同一张身份证图像,在进行不同角度的旋转后送入到上述的检测网络模型所得到的检测框面积应是不一致的。当身份证水平或竖直放置时检测框面积应为最小。检测框面积与旋转角度关系如图8所示。
S133、判断初始样本数据的旋转角度是否小于设定值。
在本实施例中,设定值为1°,当然,可以按照实际情况设置其他度数。
S134、若是,则获取所有检测框的面积中最小面积所对应的二次身份证图像,以形成标准身份证图像。
标准身份证图像是指检测框面积最小所对应的身份证图像。
将二次身份证图像输入检测网络模型进行检测后,通过分析检测网络模型输出检测框的面积,调整初始身份证图像的旋转角度,直至检测框的面积为一个较小值为止。
S135、获取标准身份证图像所对应初始样本数据的旋转角度,以得到最佳旋转角度;
S136、若否,则获取面积最小的检测框所对应的二次身份证图像的旋转角度,以得到参考角度;
S137、对参考角度除以2,以得到基准角度,并返回所述步骤S120。
具体地,当旋转角度不小于1°时,以面积最小的检测框所对应的二次身份证图像的旋转角度为基准,将其除以2,得到一数值,也可以是除以其他数,按照实际情况而定,并以该数值作为基准角度,对初始身份证图像进行基准角度进行正向和方向旋转,以得到三张二次身份证图像,在进行检测框的获取,以此迭代若干次以获取最佳旋转角度。
S140、利用最佳旋转角度对初始身份证图像进行处理,以得到身份证区域。
身份证区域是指水平且无旋转的带有身份证内容和检测框的图像,当前的身份证区域处于如图9至图12所示的四种状态。
在本实施例中,一般二次身份证图像的个数为六个,也就是通过以上步骤,迭代6次即可得到最优旋转角度,可知若将初始身份证图像按此方向旋转即可变为水平或竖直方向。对单张身份证图片,检测网络总共需要检测大约18张左右的输入图片,可通过选择轻量检测网络来提升速度,同时考虑并行处理优化。
无需收集、标注旋转角度的样本,只需收集水平方向的样本进行标注,再进行旋转增广即可,数据采集简单。
S150、对身份证区域按照检测框进行裁剪,以得到目标身份证区域。
目标身份证区域是指水平无旋转状态下且仅具有身份证内容的区域。
利用检测框的大小对身份证区域进行裁剪,以得到仅具备身份证内容的区域。在本实施例中,上述的检测网络模型除了输出检测框之外,还可会输出该二次身份证区域所对应的类别标签,根据类别标签的提示做相应的旋转即可得到水平正向的身份证图像,再依据检测框进行裁剪即可得对齐后的身份证图像,以形成目标身份证区域,可供后续处理。
另外,上述的定位方法还可以应用于刚性检测目标,比如驾驶证,校园卡等目标的检测。
利用不同旋转角度下的检测框面积大小不一致的特点,通过不断调整旋转角度并选择相应的策略来得到最优旋转角度,同时结合检测网络的类别输出判断旋转图片此时的状态,做相应处理可得到对齐后的身份证裁剪图像。
上述的身份证区域定位方法,通过获取初始身份证图像,对初始身份证图像进行多次旋转扩增处理,再由检测网络模型进行获取检测框,由检测框的面积大小确定最佳旋转角度,并对初始身份证图像进行最小旋转角度的旋转和裁剪,以得到目标身份证区域,实现旋转框的检测,包括区域以及其旋转角度的检测,对硬件要求低且定位精度高。
图13是本发明另一实施例提供的一种身份证区域定位方法的流程示意图。如图13所示,本实施例的身份证区域定位方法包括步骤S210-S260。其中步骤S210-S250与上述实施例中的步骤S110-S150类似,在此不再赘述。下面详细说明本实施例中所增加的步骤S260。
S260、输出所述目标身份证区域至终端,以使目标身份证区域在终端显示。
将获取到的目标身份证区域输出,并在智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能和显示屏的终端上显示。
图14是本发明实施例提供的一种身份证区域定位装置300的示意性框图。如图14所示,对应于以上身份证区域定位方法,本发明还提供一种身份证区域定位装置300。该身份证区域定位装置300包括用于执行上述身份证区域定位方法的单元,该装置可以被配置于服务器中。
具体地,请参阅图14,该身份证区域定位装置300包括:
图像获取单元301,用于获取初始身份证图像;
旋转处理单元302,用于将初始身份证图像按照基准角度进行旋转处理,以得到多个二次身份证图像;
检测单元303,用于将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度;
图像处理单元304,用于利用最佳旋转角度对初始身份证图像进行处理,以得到身份证区域;
裁剪单元305,用于对身份证区域按照检测框进行裁剪,以得到目标身份证区域。
在一实施例中,所述检测单元303包括:
输入子单元,用于将多个二次身份证图像输入检测网络模型内,以得到多个检测框;
计算子单元,用于计算所有检测框的面积;
角度判断子单元,用于判断初始样本数据的旋转角度是否小于设定值;
筛选子单元,用于若是,则获取所有检测框的面积中最小面积所对应的二次身份证图像,以形成标准身份证图像;
最佳角度获取子单元,用于获取标准身份证图像所对应初始样本数据的旋转角度,以得到最佳旋转角度;
参考角度获取子单元,用于若否,则获取面积最小的检测框所对应的二次身份证图像的旋转角度,以得到参考角度;
基准角度获取子单元,用于对参考角度除以2,以得到基准角度。
在一实施例中,上述的装置还包括:
模型训练单元,用于通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络,以得到检测网络模型。
在一实施例中,模型训练单元包括:
水平图像获取子单元,用于获取水平方位的身份证图像;
标注子单元,用于对所述身份证图像进行水平的标注框的标注,以得到标注的身份证图像;
增广子单元,用于对标注后的身份证图像进行旋转增广,以得到初步处理图像;
标签设置子单元,用于对初步处理图像进行类别标签设置,以得到初始样本数据;
训练子单元,用于利用初始样本数据训练目标检测网络,以得到检测框;
判断子单元,用于判断所述检测框是否能紧贴身份证四个顶点;
网络输出子单元,用于若是,则输出当前的目标检测网络,以形成检测网络模型;
调整子单元,用于若否,则调整目标检测网络的参数,并返回所述利用初始样本数据训练目标检测网络,以得到检测框。
图15是本发明另一实施例提供的一种身份证区域定位装置300的示意性框图。如图15所示,本实施例的身份证区域定位装置300是上述实施例的基础上增加了区域输出单元306。
区域输出单元306,用于输出所述目标身份证区域至终端,以使目标身份证区域在终端显示。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述身份证区域定位装置300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述身份证区域定位装置300可以实现为一种计算机程序的形式,该计算机程序可以在如图16所示的计算机设备上运行。
请参阅图16,图16是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器。
参阅图16,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种身份证区域定位方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种身份证区域定位方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图16中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
获取初始身份证图像;
将初始身份证图像按照基准角度进行旋转处理,以得到多个二次身份证图像;
将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度;
利用最佳旋转角度对初始身份证图像进行处理,以得到身份证区域;
对身份证区域按照检测框进行裁剪,以得到目标身份证区域;
其中,所述检测网络模型是通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络所得的模型。
在一实施例中,处理器502在实现所述检测网络模型是通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络所得的模型步骤时,具体实现如下步骤:
获取水平方位的身份证图像;
对所述身份证图像进行水平的标注框的标注,以得到标注的身份证图像;
对标注后的身份证图像进行旋转增广,以得到初步处理图像;
对初步处理图像进行类别标签设置,以得到初始样本数据;
利用初始样本数据训练目标检测网络,以得到检测框;
判断所述检测框是否能紧贴身份证四个顶点;
若是,则输出当前的目标检测网络,以形成检测网络模型;
若否,则调整目标检测网络的参数,并返回所述利用初始样本数据训练目标检测网络,以得到检测框。
在一实施例中,处理器502在实现所述将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度步骤时,具体实现如下步骤:
将多个二次身份证图像输入检测网络模型内,以得到多个检测框;
计算所有检测框的面积;
判断初始样本数据的旋转角度是否小于设定值;
若是,则获取所有检测框的面积中最小面积所对应的二次身份证图像,以形成标准身份证图像;
获取标准身份证图像所对应初始样本数据的旋转角度,以得到最佳旋转角度。
在一实施例中,处理器502在实现所述判断初始样本数据的旋转角度是否小于设定值步骤之后,还实现如下步骤:
若否,则获取面积最小的检测框所对应的二次身份证图像的旋转角度,以得到参考角度;
对参考角度除以2,以得到基准角度。
在一实施例中,处理器502在实现所述对身份证区域按照检测框进行裁剪,以得到目标身份证区域步骤之后,还实现如下步骤:
输出所述目标身份证区域至终端,以使目标身份证区域在终端显示。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:
获取初始身份证图像;
将初始身份证图像按照基准角度进行旋转处理,以得到多个二次身份证图像;
将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度;
利用最佳旋转角度对初始身份证图像进行处理,以得到身份证区域;
对身份证区域按照检测框进行裁剪,以得到目标身份证区域;
其中,所述检测网络模型是通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络所得的模型。
在一实施例中,所述处理器在执行所述计算机程序而实现所述检测网络模型是通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络所得的模型步骤时,具体实现如下步骤:
获取水平方位的身份证图像;
对所述身份证图像进行水平的标注框的标注,以得到标注的身份证图像;
对标注后的身份证图像进行旋转增广,以得到初步处理图像;
对初步处理图像进行类别标签设置,以得到初始样本数据;
利用初始样本数据训练目标检测网络,以得到检测框;
判断所述检测框是否能紧贴身份证四个顶点;
若是,则输出当前的目标检测网络,以形成检测网络模型;
若否,则调整目标检测网络的参数,并返回所述利用初始样本数据训练目标检测网络,以得到检测框。
在一实施例中,所述处理器在执行所述计算机程序而实现所述将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度步骤时,具体实现如下步骤:
将多个二次身份证图像输入检测网络模型内,以得到多个检测框;
计算所有检测框的面积;
判断初始样本数据的旋转角度是否小于设定值;
若是,则获取所有检测框的面积中最小面积所对应的二次身份证图像,以形成标准身份证图像;
获取标准身份证图像所对应初始样本数据的旋转角度,以得到最佳旋转角度。
在一实施例中,所述处理器在执行所述计算机程序而实现所述判断初始样本数据的旋转角度是否小于设定值步骤之后,还实现如下步骤:
若否,则获取面积最小的检测框所对应的二次身份证图像的旋转角度,以得到参考角度;
对参考角度除以2,以得到基准角度。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对身份证区域按照检测框进行裁剪,以得到目标身份证区域步骤之后,还实现如下步骤:
输出所述目标身份证区域至终端,以使目标身份证区域在终端显示。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.身份证区域定位方法,其特征在于,包括:
获取初始身份证图像;
将初始身份证图像按照基准角度进行旋转处理,以得到多个二次身份证图像;
将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度;
利用最佳旋转角度对初始身份证图像进行处理,以得到身份证区域;
对身份证区域按照检测框进行裁剪,以得到目标身份证区域;
其中,所述检测网络模型是通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络所得的模型。
2.根据权利要求1所述的身份证区域定位方法,其特征在于,所述检测网络模型是通过水平方位的身份证图像进行处理后作为训练数据训练目标检测网络所得的模型,包括:
获取水平方位的身份证图像;
对所述身份证图像进行水平的标注框的标注,以得到标注的身份证图像;
对标注后的身份证图像进行旋转增广,以得到初步处理图像;
对初步处理图像进行类别标签设置,以得到初始样本数据;
利用初始样本数据训练目标检测网络,以得到检测框;
判断所述检测框是否能紧贴身份证四个顶点;
若是,则输出当前的目标检测网络,以形成检测网络模型;
若否,则调整目标检测网络的参数,并返回所述利用初始样本数据训练目标检测网络,以得到检测框。
3.根据权利要求1所述的身份证区域定位方法,其特征在于,所述将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度,包括:
将多个二次身份证图像输入检测网络模型内,以得到多个检测框;
计算所有检测框的面积;
判断初始样本数据的旋转角度是否小于设定值;
若是,则获取所有检测框的面积中最小面积所对应的二次身份证图像,以形成标准身份证图像;
获取标准身份证图像所对应初始样本数据的旋转角度,以得到最佳旋转角度。
4.根据权利要求3所述的身份证区域定位方法,其特征在于,所述判断初始样本数据的旋转角度是否小于设定值之后,还包括:
若否,则获取面积最小的检测框所对应的二次身份证图像的旋转角度,以得到参考角度;
对参考角度除以2,以得到基准角度,并返回所述步骤S120。
5.根据权利要求1至4任一项所述的身份证区域定位方法,其特征在于,所述对身份证区域按照检测框进行裁剪,以得到目标身份证区域之后,还包括:
输出所述目标身份证区域至终端,以使目标身份证区域在终端显示。
6.身份证区域定位装置,其特征在于,包括:
图像获取单元,用于获取初始身份证图像;
旋转处理单元,用于将初始身份证图像按照基准角度进行旋转处理,以得到多个二次身份证图像;
检测单元,用于将多个二次身份证图像输入检测网络模型内进行检测,以得到最佳旋转角度;
图像处理单元,用于利用最佳旋转角度对初始身份证图像进行处理,以得到身份证区域;
裁剪单元,用于对身份证区域按照检测框进行裁剪,以得到目标身份证区域。
7.根据权利要求6所述的身份证区域定位装置,其特征在于,所述检测单元包括:
输入子单元,用于将多个二次身份证图像输入检测网络模型内,以得到多个检测框;
计算子单元,用于计算所有检测框的面积;
角度判断子单元,用于判断初始样本数据的旋转角度是否小于设定值;
筛选子单元,用于若是,则获取所有检测框的面积中最小面积所对应的二次身份证图像,以形成标准身份证图像;
最佳角度获取子单元,用于获取标准身份证图像所对应初始样本数据的旋转角度,以得到最佳旋转角度。
8.根据权利要求7所述的身份证区域定位装置,其特征在于,所述装置还包括:
输出单元,用于输出所述目标身份证区域至终端,以使目标身份证区域在终端显示。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如权利要求1至5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910214059.3A CN109961040B (zh) | 2019-03-20 | 2019-03-20 | 身份证区域定位方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910214059.3A CN109961040B (zh) | 2019-03-20 | 2019-03-20 | 身份证区域定位方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109961040A true CN109961040A (zh) | 2019-07-02 |
CN109961040B CN109961040B (zh) | 2023-03-21 |
Family
ID=67024636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910214059.3A Active CN109961040B (zh) | 2019-03-20 | 2019-03-20 | 身份证区域定位方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109961040B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399873A (zh) * | 2019-07-11 | 2019-11-01 | 汉王科技股份有限公司 | 身份证图像获取方法、装置、电子设备及存储介质 |
CN110647880A (zh) * | 2019-08-12 | 2020-01-03 | 深圳市华付信息技术有限公司 | 一种移动端身份证图像遮挡判断方法 |
CN110738238A (zh) * | 2019-09-18 | 2020-01-31 | 平安科技(深圳)有限公司 | 一种证件信息的分类定位方法及装置 |
CN111027545A (zh) * | 2019-12-04 | 2020-04-17 | 深圳市新国都金服技术有限公司 | 卡证图片标志检测方法、装置、计算机设备及存储介质 |
CN111241947A (zh) * | 2019-12-31 | 2020-06-05 | 深圳奇迹智慧网络有限公司 | 目标检测模型的训练方法、装置、存储介质和计算机设备 |
CN111507957A (zh) * | 2020-04-15 | 2020-08-07 | 深圳前海环融联易信息科技服务有限公司 | 身份证图片转换方法、装置、计算机设备及存储介质 |
CN111860522A (zh) * | 2020-07-23 | 2020-10-30 | 中国平安人寿保险股份有限公司 | 身份证图片处理方法、装置、终端及存储介质 |
CN111950554A (zh) * | 2020-08-17 | 2020-11-17 | 深圳市丰巢网络技术有限公司 | 一种身份证识别方法、装置、设备及存储介质 |
CN112001318A (zh) * | 2020-08-25 | 2020-11-27 | 广东光速智能设备有限公司 | 一种身份证件信息采集方法及其系统 |
CN113808209A (zh) * | 2021-09-23 | 2021-12-17 | 深圳市优必选科技股份有限公司 | 定位识别方法、装置、计算机设备及可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729645A (zh) * | 2013-12-20 | 2014-04-16 | 湖北微模式科技发展有限公司 | 基于单目摄像头的二代证区域定位与提取的方法及装置 |
CN109101963A (zh) * | 2018-08-10 | 2018-12-28 | 深圳市碧海扬帆科技有限公司 | 证件图像自动正向的方法、图像处理装置和可读存储介质 |
CN109241968A (zh) * | 2018-09-25 | 2019-01-18 | 广东工业大学 | 图像内容倾斜角度预测网络训练方法及修正方法、系统 |
CN109345460A (zh) * | 2018-09-28 | 2019-02-15 | 百度在线网络技术(北京)有限公司 | 用于矫正图像的方法和装置 |
CN109344727A (zh) * | 2018-09-07 | 2019-02-15 | 苏州创旅天下信息技术有限公司 | 身份证文本信息检测方法及装置、可读存储介质和终端 |
CN109376735A (zh) * | 2018-08-31 | 2019-02-22 | 百度在线网络技术(北京)有限公司 | 身份信息提取方法、装置、电子设备与存储介质 |
-
2019
- 2019-03-20 CN CN201910214059.3A patent/CN109961040B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729645A (zh) * | 2013-12-20 | 2014-04-16 | 湖北微模式科技发展有限公司 | 基于单目摄像头的二代证区域定位与提取的方法及装置 |
CN109101963A (zh) * | 2018-08-10 | 2018-12-28 | 深圳市碧海扬帆科技有限公司 | 证件图像自动正向的方法、图像处理装置和可读存储介质 |
CN109376735A (zh) * | 2018-08-31 | 2019-02-22 | 百度在线网络技术(北京)有限公司 | 身份信息提取方法、装置、电子设备与存储介质 |
CN109344727A (zh) * | 2018-09-07 | 2019-02-15 | 苏州创旅天下信息技术有限公司 | 身份证文本信息检测方法及装置、可读存储介质和终端 |
CN109241968A (zh) * | 2018-09-25 | 2019-01-18 | 广东工业大学 | 图像内容倾斜角度预测网络训练方法及修正方法、系统 |
CN109345460A (zh) * | 2018-09-28 | 2019-02-15 | 百度在线网络技术(北京)有限公司 | 用于矫正图像的方法和装置 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399873A (zh) * | 2019-07-11 | 2019-11-01 | 汉王科技股份有限公司 | 身份证图像获取方法、装置、电子设备及存储介质 |
CN110647880A (zh) * | 2019-08-12 | 2020-01-03 | 深圳市华付信息技术有限公司 | 一种移动端身份证图像遮挡判断方法 |
CN110738238B (zh) * | 2019-09-18 | 2023-05-26 | 平安科技(深圳)有限公司 | 一种证件信息的分类定位方法及装置 |
CN110738238A (zh) * | 2019-09-18 | 2020-01-31 | 平安科技(深圳)有限公司 | 一种证件信息的分类定位方法及装置 |
CN111027545A (zh) * | 2019-12-04 | 2020-04-17 | 深圳市新国都金服技术有限公司 | 卡证图片标志检测方法、装置、计算机设备及存储介质 |
CN111241947A (zh) * | 2019-12-31 | 2020-06-05 | 深圳奇迹智慧网络有限公司 | 目标检测模型的训练方法、装置、存储介质和计算机设备 |
CN111507957A (zh) * | 2020-04-15 | 2020-08-07 | 深圳前海环融联易信息科技服务有限公司 | 身份证图片转换方法、装置、计算机设备及存储介质 |
CN111860522A (zh) * | 2020-07-23 | 2020-10-30 | 中国平安人寿保险股份有限公司 | 身份证图片处理方法、装置、终端及存储介质 |
CN111860522B (zh) * | 2020-07-23 | 2024-02-02 | 中国平安人寿保险股份有限公司 | 身份证图片处理方法、装置、终端及存储介质 |
CN111950554A (zh) * | 2020-08-17 | 2020-11-17 | 深圳市丰巢网络技术有限公司 | 一种身份证识别方法、装置、设备及存储介质 |
CN112001318A (zh) * | 2020-08-25 | 2020-11-27 | 广东光速智能设备有限公司 | 一种身份证件信息采集方法及其系统 |
CN113808209A (zh) * | 2021-09-23 | 2021-12-17 | 深圳市优必选科技股份有限公司 | 定位识别方法、装置、计算机设备及可读存储介质 |
CN113808209B (zh) * | 2021-09-23 | 2024-01-19 | 深圳市优必选科技股份有限公司 | 定位识别方法、装置、计算机设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109961040B (zh) | 2023-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109961040A (zh) | 身份证区域定位方法、装置、计算机设备及存储介质 | |
CN105184778B (zh) | 一种检测方法及装置 | |
CN105631049B (zh) | 一种识别诈骗短信的方法和系统 | |
CN108985199A (zh) | 商品取放操作的检测方法、装置及存储介质 | |
CN105303179A (zh) | 指纹识别方法、装置 | |
CN109086691A (zh) | 一种三维脸部活体检测方法、脸部认证识别方法及装置 | |
CN108875600A (zh) | 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质 | |
CN108875522A (zh) | 人脸聚类方法、装置和系统及存储介质 | |
CN104915673B (zh) | 一种基于视觉词袋模型的目标分类方法和系统 | |
CN106707293A (zh) | 用于车辆的障碍物识别方法和装置 | |
CN109544496A (zh) | 训练数据的生成方法、对象检测模型的训练方法和装置 | |
CN110490238A (zh) | 一种图像处理方法、装置及存储介质 | |
CN108875731A (zh) | 目标识别方法、装置、系统及存储介质 | |
CN109002790A (zh) | 一种人脸识别的方法、装置、设备和存储介质 | |
CN104867225A (zh) | 一种纸币的面向识别方法及装置 | |
CN109858476A (zh) | 标签的扩充方法和电子设备 | |
CN109993021A (zh) | 人脸正脸检测方法、装置及电子设备 | |
US20190102654A1 (en) | Generation of Training Data for Image Classification | |
CN112132812B (zh) | 证件校验方法、装置、电子设备及介质 | |
CN109064504A (zh) | 图像处理方法、装置和计算机存储介质 | |
CN109801308A (zh) | 粘连类圆形目标图像的分割方法 | |
CN110826610A (zh) | 一种用于智能检测人员着装是否规范的方法与系统 | |
CN110148117A (zh) | 基于电力图像的电力设备缺陷识别方法、装置与存储介质 | |
CN110493363A (zh) | 一种智能手机随机mac地址的辨别系统及方法 | |
US20210264612A1 (en) | Hardware Accelerator for Histogram of Oriented Gradients Computation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.) Patentee after: Shenzhen Huafu Technology Co.,Ltd. Address before: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.) Patentee before: SHENZHEN HUAFU INFORMATION TECHNOLOGY Co.,Ltd. |