CN110427909A - 一种移动端驾驶证检测方法、系统及电子设备和存储介质 - Google Patents

一种移动端驾驶证检测方法、系统及电子设备和存储介质 Download PDF

Info

Publication number
CN110427909A
CN110427909A CN201910734002.6A CN201910734002A CN110427909A CN 110427909 A CN110427909 A CN 110427909A CN 201910734002 A CN201910734002 A CN 201910734002A CN 110427909 A CN110427909 A CN 110427909A
Authority
CN
China
Prior art keywords
area
tested
picture
identified
caption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910734002.6A
Other languages
English (en)
Other versions
CN110427909B (zh
Inventor
王浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lianlian Yinjia Information Technology Co ltd
Original Assignee
Hangzhou Shield Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Shield Network Technology Co Ltd filed Critical Hangzhou Shield Network Technology Co Ltd
Priority to CN201910734002.6A priority Critical patent/CN110427909B/zh
Publication of CN110427909A publication Critical patent/CN110427909A/zh
Application granted granted Critical
Publication of CN110427909B publication Critical patent/CN110427909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种移动端驾驶证检测方法、系统及一种电子设备和计算机可读存储介质,该方法包括:获取待识别图片;确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点;判断所述顶点是否处于预设区域;如果是,则识别所述待检测区域中的文字标题,并检测所述待检测区域中是否包含人脸图像;若所述文字标题的内容与预设字符串匹配成功,且所述待检测区域包含人脸图像,则判定所述待识别图片为驾驶证图片。由上可知,本申请通过待识别图片中待检测区域边界以及顶点的检测,能够在确保待检测区域完整性的基础上进行后续的识别,避免了不必要的工作,提升了用户的体验。

Description

一种移动端驾驶证检测方法、系统及电子设备和存储介质
技术领域
本申请涉及证件识别技术领域,更具体地说,涉及一种移动端驾驶证检测方法、系统及一种电子设备和一种计算机可读存储介质。
背景技术
在银行、互联网金融、保险、租赁、共享等行业办理相关业务时,需要提供相关证件来证实身份,如身份证、银行卡、驾驶证、行驶证等证件。传统方式是通过人工录入证件编码,效率低、速度慢、用户体验差。随着近年来互联网实名制的不断推进,各类证件的实名制验证方式发展迅速,利用PC端进行证件识别的方式逐渐普及。然而这种方式下,可能会由于证件摆放位置或被遮挡导致证件缺损,影响证件的识别结果。
因此,如何解决上述问题是本领域技术人员需要重点关注的。
发明内容
本申请的目的在于提供一种移动端驾驶证检测方法、系统及一种电子设备和一种计算机可读存储介质,能够在确保待检测区域完整性的基础上进行后续的识别,避免了不必要的工作,提升了用户的体验。
为实现上述目的,本申请提供了一种移动端驾驶证检测方法,包括:
获取待识别图片;
确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点;
判断所述顶点是否处于预设区域;
如果是,则识别所述待检测区域中的文字标题,并检测所述待检测区域中是否包含人脸图像;
若所述文字标题的内容与预设字符串匹配成功,且所述待检测区域包含人脸图像,则判定所述待识别图片为驾驶证图片。
可选的,所述确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点,包括:
获取所述待识别图片上下左右方向的四个ROI区域;
利用LSD算法对每个所述ROI区域分别进行直线检测;
根据检测到的直线确定所述待检测区域的四条边界;
根据所述四条边界计算所述待检测区域的四个顶点。
可选的,所述根据检测到的直线确定所述待检测区域的四条边界,包括:
将检测到的直线转换为极坐标形式,并利用聚类条件对极坐标形式的直线进行聚类运算,得到聚类结果;
所述聚类条件为:
其中,θLH分别为θ的最小值和最大值;ρLH分别为ρ的最小值和最大值;i和t的区间为[0,n];n为直线的条数;
基于合并公式对所述聚类结果进行合并,得到多条直线;
所述合并公式为:
其中,(xi,yj),(xi,yj)为直线上两点;
利用过滤条件对合并后的多条直线进行过滤,将过滤后得到的直线确定为所述待检测区域的边界;
所述过滤条件为:
可选的,所述确定所述待识别图片中待检测区域的边界之前,还包括:
判断所述待识别图片的清晰度是否满足预设清晰度;
如果是,则启动所述确定所述待识别图片中待检测区域的边界的步骤。
可选的,所述识别所述待检测区域中的文字标题,包括:
对所述待检测区域中的文字区域进行定位;
提取所述文字区域内的文字标题并识别所述文字标题的内容。
可选的,所述对所述待检测区域中的文字区域进行定位,包括:
基于形态学运算对所述待检测区域中的文字区域进行定位。
可选的,所述提取所述文字区域内的文字标题并识别所述文字标题的内容,包括:
对所述文字区域进行自适应二值化,以提取得到所述文字区域的文字标题;
对所述文字标题进行高斯滤波,并利用预设模板对滤波后文字标题进行匹配,识别得到所述文字标题的内容。
为实现上述目的,本申请提供了一种移动端驾驶证检测系统,包括:
图片获取模块,用于获取待识别图片;
顶点确定模块,用于确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点;
顶点判断模块,用于判断所述顶点是否处于预设区域;
识别检测模块,用于如果所述顶点处于所述预设区域,则识别所述待检测区域中的文字标题,并检测所述待检测区域中是否包含人脸图像;
图片判断模块,用于若所述文字标题的内容与预设字符串匹配成功,且所述待检测区域包含人脸图像,则判定所述待识别图片为驾驶证图片。
为实现上述目的,本申请提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现前述公开的任一种所述移动端驾驶证检测方法的步骤。
为实现上述目的,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述公开的任一种所述移动端驾驶证检测方法的步骤。
通过以上方案可知,本申请提供的一种移动端驾驶证检测方法,包括:获取待识别图片;确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点;判断所述顶点是否处于预设区域;如果是,则识别所述待检测区域中的文字标题,并检测所述待检测区域中是否包含人脸图像;若所述文字标题的内容与预设字符串匹配成功,且所述待检测区域包含人脸图像,则判定所述待识别图片为驾驶证图片。由上可知,本申请在获取到待识别的图片后,首先确定待识别图片中待检测区域的边界,并确定出待检测区域的顶点,仅当待检测区域顶点处于预设区域后进一步识别待检测区域中的文字标题和图像,基于文字匹配结果和图像识别结果判断当前待识别图片是否为驾驶证图片,也就是说,本申请通过待识别图片中待检测区域边界以及顶点的检测,能够在确保待检测区域完整性的基础上进行后续的识别,避免了不必要的工作,提升了用户的体验。
本申请还公开了一种移动端驾驶证检测系统及一种电子设备和一种计算机可读存储介质,同样能实现上述技术效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种移动端驾驶证检测方法的流程图;
图2为本申请实施例公开的一种移动端驾驶证检测方法中确定待检测区域边界过程的流程图;
图3为本申请实施例公开的一种移动端驾驶证检测方法中识别待检测区域中文字标题过程的流程图;
图4为本申请实施例公开的待检测区域中的文字区域的示意图;
图5为本申请实施例公开的文字区域执行形态学顶帽运算后的效果示意图;
图6为本申请实施例公开的文字区域执行开运算后的效果示意图;
图7为本申请实施例公开的另一种移动端驾驶证检测方法的流程图;
图8为本申请实施例公开的一种移动端驾驶证检测系统的结构图;
图9为本申请实施例公开的一种电子设备的结构图;
图10为本申请实施例公开的另一种电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在现有技术中,随着近年来互联网实名制的不断推进,各类证件的实名制验证方式发展迅速,利用PC端进行证件识别的方式逐渐普及。然而这种方式下,可能会由于证件摆放位置或被遮挡导致证件缺损,影响证件的识别结果。
因此,本申请实施例公开了一种移动端驾驶证检测方法,能够在确保待检测区域完整性的基础上进行后续的识别,避免了不必要的工作,提升了用户的体验。
参见图1,本申请实施例公开的一种移动端驾驶证检测方法的流程图,如图1所示,包括:
S101:获取待识别图片;
本实施例中,首先获取待识别的图片。具体地,待识别图片可以是用户拍摄的图片,或从视频流截取的图片。本实施例对此不做具体限定。
S102:确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点;
本步骤中,需要对待识别图片中的待检测区域进行边界的确定,并基于确定好的区域的四条边界确定待检测区域的顶点。
具体地,上述过程可以具体包括:获取待识别图片上下左右方向的四个ROI区域;利用LSD算法对每个ROI区域分别进行直线检测;根据检测到的直线确定待检测区域的四条边界;根据四条边界计算所述待检测区域的四个顶点。
需要说明的是,ROI区域(region of interest,感兴趣区域),指从待处理图像中以方框、图等方式勾勒出需要处理的区域。本实施例中,将提取待识别图片四个方向的ROI区域,即可以提取顶部、左边、右边及底部的十分之一区域作为四个ROI区域。进一步利用LSD算法(line segment detector,直线段检测算法)对每个ROI区域进行直线的检测,从而得到边界并根据边界确定顶点。
S103:判断所述顶点是否处于预设区域;
本步骤中,判断上述确定的四个顶点是否处于预设区域。所述预设区域具体可以是移动端的可视范围内。
S104:如果是,则识别所述待检测区域中的文字标题,并检测所述待检测区域中是否包含人脸图像;
在得到顶点的判断结果后,若四个顶点均处于预设区域内,则可以对待检测区域中的文字标题和图像进行识别。
S105:若所述文字标题的内容与预设字符串匹配成功,且所述待检测区域包含人脸图像,则判定所述待识别图片为驾驶证图片。
本实施例中,在识别到文字标题和图像后,将判断文字标题的内容与预设字符串是否匹配成功,并检测该图像是否为人脸图像,仅当文字标题的内容与预设字符串匹配成功且该图像为人脸图像时,才可判定待识别图片为驾驶证图片,或者说待识别图片中包含驾驶证图片。其中,预设字符串可以为:驾驶证、机动车驾驶证或中华人民共和国机动车驾驶证。
在一种具体的实施方式中,本实施例基于机器学习算法进行人脸图像的检测,例如,可以预先利用adaboost+haar人脸检测算法对提取到的特征进行训练,得到人脸模型,进而基于该模型对预判的图像区域执行多尺度人脸检测,得到图像检测结果。由于haar特征可以描述图像的灰度变化,该特征对人的眼睛和人脸之间、鼻梁和脸颊、嘴唇周围区域等灰度变化明显的区域描述效果非常好,因此可以极大提高图像识别结果的准确度。
由上可知,本申请在获取到待识别的图片后,首先确定待识别图片中待检测区域的边界,并确定出待检测区域的顶点,仅当待检测区域顶点处于预设区域后进一步识别待检测区域中的文字标题和图像,基于文字匹配结果和图像识别结果判断当前待识别图片是否为驾驶证图片,也就是说,本申请通过待识别图片中待检测区域边界以及顶点的检测,能够在确保待检测区域完整性的基础上进行后续的识别,避免了不必要的工作,提升了用户的体验。
进一步地,本实施例针对上述根据检测到的直线确定待检测区域四条边界的过程进行详细的阐述和介绍,参见图2所示,该过程可以包括:
S201:将检测到的直线转换为极坐标形式,并利用聚类条件对极坐标形式的直线进行聚类运算,得到聚类结果;
所述聚类条件为:
其中,θLH分别为θ的最小值和最大值;ρLH分别为ρ的最小值和最大值;i和t的区间为[0,n];n为直线的条数。
S202:基于合并公式对所述聚类结果进行合并,得到多条直线;
所述合并公式为:
其中,(xi,yj),(xi,yj)为直线上两点;
S203:利用过滤条件对合并后的多条直线进行过滤,将过滤后得到的直线确定为所述待检测区域的边界;
所述过滤条件为:
本实施例中,首先需要将检测到的直线转化为极坐标形式进行聚类,并对聚类结果进行合并得到多条直线,根据方向对合并后的直线进行过滤,最终得到一条最优直线,得到待检测区域边界,即驾驶证的边界。
进一步地,本实施例针对上述识别待检测区域中文字标题的过程进行详细的阐述和介绍,参见图3所示,该过程具体可以包括:
S301:对所述待检测区域中的文字区域进行定位;
本步骤中,可以基于形态学运算对所述待检测区域中的文字区域进行定位。其中,形态学运算主要可以包括膨胀、腐蚀、开运算、闭运算、顶帽运算。
需要说明的是,膨胀操作可以使图像中物体区域变大,填充目标区域中的某些空洞,消除小颗粒噪声。膨胀公式为:表示使用结构B对结构A进行膨胀操作,滑动结构B到(x,y)处,如果结构B对应结t(src,el构A中的点存在一个为1,则(x,y)为1。腐蚀操作可以使得图像中物体边界变小,从而消除小的噪声点。腐蚀公式为:表示使用结构B腐蚀结构A、滑动结构B到(x,y)位置处、如果结构B对应的结构A中的点全部为0,则(x,y)为0。开运算为先腐蚀再膨胀,可以消除噪声,平滑大面积区域的边界。闭运算为先膨胀再腐蚀,可以消除断裂和空洞,平滑轮廓。顶帽运算即原图与开运算结构的差,可以获取图片中比周围区域更明亮的物体,公式为:dst=tophat(src,element)=src-open(src,element),其中,dst为顶帽运算结果,tophat为顶帽运算,src为原图,open为开运算,element对应元素结构B。
图4为待检测区域中的文字区域,本实施例中,首先对待检测区域中的文字区域执行形态学顶帽运算,执行结果如图5所示。进一步使用sobel算子对上述执行结果进行计算得到水平方向梯度,在二值化之后执行闭运算可以得到最终开运算后的效果图,如图6所示。参见图6,图中明亮处即为检测到的文字区域,对该区域执行宽高的阈值判断,过滤掉噪声。其中,sobel算子与图像进行卷积可以得到X方向梯度和Y方向梯度,根据梯度即可得到物体的边界。
S302:提取所述文字区域内的文字标题并识别所述文字标题的内容。
本步骤中,提取文字标题并识别内容的过程可以具体包括:对所述文字区域进行自适应二值化,以提取得到所述文字区域的文字标题;对所述文字标题进行高斯滤波,并利用预设模板对滤波后文字标题进行匹配,识别得到所述文字标题的内容。
具体地,本实施例首先对图像进行自适应二值化将文字提取出来,然后对标题进行高斯滤波,高斯滤波即使用高斯核对图像进行卷积。卷积结果能够平滑图像并且抑制噪声,从而减少图像背景中的噪点对垂直投影的影响。进而对文字区域执行垂直直方图投影,垂直直方图投影即沿垂直方向统计所有像素值为0的点的个数,由个数组成的直方图即为垂直直方图投影。如果某个位置对应的统计值为0,则该点为两个字中间的空白区域,从而达到分割文字的目的。由于图像可能存在倾斜,需要对图像进行旋转后再投影,多次投影得到最优分割图像。对于左右结构的文字,如和、机动、驾驶证等,可能会存在误分割情况,从而本实施例可以将水平距离在一定阈值范围的无法识别的文字合并组合为一个文字,使用模板匹配对该文字进行再次识别,从而解决误分割问题。
本申请实施例公开了另一种移动端驾驶证检测方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
参见图7,本申请实施例提供的另一种移动端驾驶证检测方法的流程图,如图7所示,包括:
S401:获取待识别图片;
S402:判断所述待识别图片的清晰度是否满足预设清晰度;
S403:如果是,则确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点;
S404:判断所述顶点是否处于预设区域;
S405:如果是,则识别所述待检测区域中的文字标题,并检测所述待检测区域中是否包含人脸图像;
S406:若所述文字标题的内容与预设字符串匹配成功,且所述待检测区域包含人脸图像,则判定所述待识别图片为驾驶证图片。
本实施例中,在获取到图片并进行识别之前,进一步对待识别图片的清晰度是否满足预设清晰度,仅仅当该图片的清晰度满足预设清晰度后,才进一步对图片进行识别,从而避免了对于模糊图片的不必要的识别,节省了工作时间。
下面对本申请实施例提供的一种移动端驾驶证检测系统进行介绍,下文描述的一种移动端驾驶证检测系统与上文描述的一种移动端驾驶证检测方法可以相互参照。
参见图8,本申请实施例提供的一种移动端驾驶证检测系统的结构图,如图8所示,包括:
图片获取模块100,用于获取待识别图片;
顶点确定模块200,用于确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点;
顶点判断模块300,用于判断所述顶点是否处于预设区域;
识别检测模块400,用于如果所述顶点处于所述预设区域,则识别所述待检测区域中的文字标题,并检测所述待检测区域中是否包含人脸图像;
图片判断模块500,用于若所述文字标题的内容与预设字符串匹配成功,且所述待检测区域包含人脸图像,则判定所述待识别图片为驾驶证图片。
关于上述模块100至500更加具体的工作过程可参考前述实施例公开的相应内容,在此不再进行赘述。
本申请还提供了一种电子设备,参见图9,本申请实施例提供的一种电子设备的结构图,如图9所示,包括:
存储器11,用于存储计算机程序;
处理器12,用于执行所述计算机程序时可以实现上述任一种实施例所提供的移动端驾驶证检测方法的步骤。
具体的,存储器11包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机可读指令,该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。处理器12在一些实施例中可以是一中央处理器(CentralProcessing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,为电子设备提供计算和控制能力,执行所述存储器11中保存的计算机程序时,可以实现上述实施例所公开的移动端驾驶证检测方法的步骤。
在上述实施例的基础上,作为优选实施方式,参见图10,所述电子设备还包括:
输入接口13,与处理器12相连,用于获取外部导入的计算机程序、参数和指令,经处理器12控制保存至存储器11中。该输入接口13可以与输入装置相连,接收用户手动输入的参数或指令。该输入装置可以是显示屏上覆盖的触摸层,也可以是终端外壳上设置的按键、轨迹球或触控板,也可以是键盘、触控板或鼠标等。
显示单元14,与处理器12相连,用于显示处理器12处理的数据以及用于显示可视化的用户界面。该显示单元14可以为LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。
网络端口15,与处理器12相连,用于与外部各终端设备进行通信连接。该通信连接所采用的通信技术可以为有线通信技术或无线通信技术,如移动高清链接技术(MHL)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术等。
图10仅示出了具有组件11-15的电子设备,本领域技术人员可以理解的是,图10示出的结构并不构成对电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本申请还提供了一种计算机可读存储介质,该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种实施例所提供的移动端驾驶证检测方法的步骤。
由上可知,本申请在获取到待识别的图片后,首先确定待识别图片中待检测区域的边界,并确定出待检测区域的顶点,仅当待检测区域顶点处于预设区域后进一步识别待检测区域中的文字标题和图像,基于文字匹配结果和图像识别结果判断当前待识别图片是否为驾驶证图片,也就是说,本申请通过待识别图片中待检测区域边界以及顶点的检测,能够在确保待检测区域完整性的基础上进行后续的识别,避免了不必要的工作,提升了用户的体验。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种移动端驾驶证检测方法,其特征在于,包括:
获取待识别图片;
确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点;
判断所述顶点是否处于预设区域;
如果是,则识别所述待检测区域中的文字标题,并检测所述待检测区域中是否包含人脸图像;
若所述文字标题的内容与预设字符串匹配成功,且所述待检测区域包含人脸图像,则判定所述待识别图片为驾驶证图片。
2.根据权利要求1所述的移动端驾驶证检测方法,其特征在于,所述确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点,包括:
获取所述待识别图片上下左右方向的四个ROI区域;
利用LSD算法对每个所述ROI区域分别进行直线检测;
根据检测到的直线确定所述待检测区域的四条边界;
根据所述四条边界计算所述待检测区域的四个顶点。
3.根据权利要求2所述的移动端驾驶证检测方法,其特征在于,所述根据检测到的直线确定所述待检测区域的四条边界,包括:
将检测到的直线转换为极坐标形式,并利用聚类条件对极坐标形式的直线进行聚类运算,得到聚类结果;
所述聚类条件为:
其中,θLH分别为θ的最小值和最大值;ρLH分别为ρ的最小值和最大值;i和t的区间为[0,n];n为直线的条数;
基于合并公式对所述聚类结果进行合并,得到多条直线;
所述合并公式为:
其中,(xi,yj),(xi,yj)为直线上两点;
利用过滤条件对合并后的多条直线进行过滤,将过滤后得到的直线确定为所述待检测区域的边界;
所述过滤条件为:
4.根据权利要求1所述的移动端驾驶证检测方法,其特征在于,所述确定所述待识别图片中待检测区域的边界之前,还包括:
判断所述待识别图片的清晰度是否满足预设清晰度;
如果是,则启动所述确定所述待识别图片中待检测区域的边界的步骤。
5.根据权利要求1至4任一项所述的移动端驾驶证检测方法,其特征在于,所述识别所述待检测区域中的文字标题,包括:
对所述待检测区域中的文字区域进行定位;
提取所述文字区域内的文字标题并识别所述文字标题的内容。
6.根据权利要求5所述的移动端驾驶证检测方法,其特征在于,所述对所述待检测区域中的文字区域进行定位,包括:
基于形态学运算对所述待检测区域中的文字区域进行定位。
7.根据权利要求5所述的移动端驾驶证检测方法,其特征在于,所述提取所述文字区域内的文字标题并识别所述文字标题的内容,包括:
对所述文字区域进行自适应二值化,以提取得到所述文字区域的文字标题;
对所述文字标题进行高斯滤波,并利用预设模板对滤波后文字标题进行匹配,识别得到所述文字标题的内容。
8.一种移动端驾驶证检测系统,其特征在于,包括:
图片获取模块,用于获取待识别图片;
顶点确定模块,用于确定所述待识别图片中待检测区域的边界,基于所述边界确定所述待检测区域的顶点;
顶点判断模块,用于判断所述顶点是否处于预设区域;
识别检测模块,用于如果所述顶点处于所述预设区域,则识别所述待检测区域中的文字标题,并检测所述待检测区域中是否包含人脸图像;
图片判断模块,用于若所述文字标题的内容与预设字符串匹配成功,且所述待检测区域包含人脸图像,则判定所述待识别图片为驾驶证图片。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述移动端驾驶证检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述移动端驾驶证检测方法的步骤。
CN201910734002.6A 2019-08-09 2019-08-09 一种移动端驾驶证检测方法、系统及电子设备和存储介质 Active CN110427909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910734002.6A CN110427909B (zh) 2019-08-09 2019-08-09 一种移动端驾驶证检测方法、系统及电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910734002.6A CN110427909B (zh) 2019-08-09 2019-08-09 一种移动端驾驶证检测方法、系统及电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN110427909A true CN110427909A (zh) 2019-11-08
CN110427909B CN110427909B (zh) 2023-04-28

Family

ID=68415213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910734002.6A Active CN110427909B (zh) 2019-08-09 2019-08-09 一种移动端驾驶证检测方法、系统及电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN110427909B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126098A (zh) * 2019-12-24 2020-05-08 京东数字科技控股有限公司 证件图像采集方法、装置、设备及存储介质
CN111553251A (zh) * 2020-04-24 2020-08-18 平安科技(深圳)有限公司 证件四角残缺检测方法、装置、设备及存储介质
CN111783775A (zh) * 2020-06-30 2020-10-16 京东数字科技控股有限公司 一种图像采集方法、装置、设备和计算机可读存储介质
CN113673500A (zh) * 2021-08-20 2021-11-19 深圳前海微众银行股份有限公司 证件图像识别方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122775A (zh) * 2017-03-29 2017-09-01 南京航空航天大学 一种基于特征匹配的安卓手机身份证字符识别方法
CN107563377A (zh) * 2017-08-30 2018-01-09 江苏实达迪美数据处理有限公司 一种利用边缘和文字区域的证件关键区域检测定位方法
CN108229506A (zh) * 2016-12-13 2018-06-29 上海安维尔信息科技股份有限公司 基于层次聚类和深度学习的箱号识别方法
CN108229299A (zh) * 2017-10-31 2018-06-29 北京市商汤科技开发有限公司 证件的识别方法和装置、电子设备、计算机存储介质
CN108427946A (zh) * 2018-03-16 2018-08-21 福州大学 复杂场景下基于内特征和文本域布局的驾驶证检测识别方法
CN108805130A (zh) * 2018-04-27 2018-11-13 淘然视界(杭州)科技有限公司 驾驶证信息自动识别方法、电子设备、存储介质及系统
CN109766885A (zh) * 2018-12-29 2019-05-17 北京旷视科技有限公司 一种文字检测方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229506A (zh) * 2016-12-13 2018-06-29 上海安维尔信息科技股份有限公司 基于层次聚类和深度学习的箱号识别方法
CN107122775A (zh) * 2017-03-29 2017-09-01 南京航空航天大学 一种基于特征匹配的安卓手机身份证字符识别方法
CN107563377A (zh) * 2017-08-30 2018-01-09 江苏实达迪美数据处理有限公司 一种利用边缘和文字区域的证件关键区域检测定位方法
CN108229299A (zh) * 2017-10-31 2018-06-29 北京市商汤科技开发有限公司 证件的识别方法和装置、电子设备、计算机存储介质
CN108427946A (zh) * 2018-03-16 2018-08-21 福州大学 复杂场景下基于内特征和文本域布局的驾驶证检测识别方法
CN108805130A (zh) * 2018-04-27 2018-11-13 淘然视界(杭州)科技有限公司 驾驶证信息自动识别方法、电子设备、存储介质及系统
CN109766885A (zh) * 2018-12-29 2019-05-17 北京旷视科技有限公司 一种文字检测方法、装置、电子设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126098A (zh) * 2019-12-24 2020-05-08 京东数字科技控股有限公司 证件图像采集方法、装置、设备及存储介质
CN111126098B (zh) * 2019-12-24 2023-11-07 京东科技控股股份有限公司 证件图像采集方法、装置、设备及存储介质
CN111553251A (zh) * 2020-04-24 2020-08-18 平安科技(深圳)有限公司 证件四角残缺检测方法、装置、设备及存储介质
CN111553251B (zh) * 2020-04-24 2024-05-07 平安科技(深圳)有限公司 证件四角残缺检测方法、装置、设备及存储介质
CN111783775A (zh) * 2020-06-30 2020-10-16 京东数字科技控股有限公司 一种图像采集方法、装置、设备和计算机可读存储介质
CN113673500A (zh) * 2021-08-20 2021-11-19 深圳前海微众银行股份有限公司 证件图像识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110427909B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN110427909A (zh) 一种移动端驾驶证检测方法、系统及电子设备和存储介质
US11113836B2 (en) Object detection method, device, apparatus and computer-readable storage medium
WO2018103608A1 (zh) 一种文字检测方法、装置及存储介质
TWI455015B (zh) 阻絕使用者內容的裝置、使用者偵測方法、及儲存其指令的機器可讀取儲存媒體
CN110598686B (zh) 发票的识别方法、系统、电子设备和介质
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
WO2019237549A1 (zh) 验证码识别方法、装置、计算机设备及存储介质
CN108182383B (zh) 一种车窗检测的方法及设备
CN102750535B (zh) 自动提取图像前景的方法和系统
CN110728234A (zh) 驾驶员人脸识别方法、系统、设备及介质
CN109993019A (zh) 基于连通域分析的二维码识别方法、系统及设备和介质
CN107844742B (zh) 人脸图像眼镜去除方法、装置及存储介质
US20160170492A1 (en) Technologies for robust two-dimensional gesture recognition
EP2528035A2 (en) Apparatus and method for detecting a vertex of an image
US20170169056A1 (en) Logo detection system for automatic image search engines
EP3859673A1 (en) Model generation
CN104156941A (zh) 一种确定图像上几何轮廓区域的方法及系统
CN108769803A (zh) 带边框视频的识别方法、裁剪方法、系统、设备及介质
CN109035256A (zh) 用户界面图像切割方法、装置、服务器和存储介质
CN112818952A (zh) 煤岩分界线的识别方法、装置及电子设备
CN106778574A (zh) 用于人脸图像的检测方法和装置
US20130259384A1 (en) Apparatus and method for recognizing hand shape using finger pattern
US9053383B2 (en) Recognizing apparatus and method, program, and recording medium
CN114627561A (zh) 动态手势识别方法、装置、可读存储介质及电子设备
CN106650735A (zh) 一种led字符自动定位识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200103

Address after: 310000 Room 203, floor 2, building 1, No.79 Yueda lane, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Lianlian Yinjia Information Technology Co.,Ltd.

Address before: 310000, Hangzhou, Zhejiang, Binjiang District C space building 6

Applicant before: HANGZHOU UDCREDIT NETWORK TECHNOLOGY CO.,LTD.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant