CN107578439B - 生成目标图像的方法、装置及设备 - Google Patents

生成目标图像的方法、装置及设备 Download PDF

Info

Publication number
CN107578439B
CN107578439B CN201710589943.6A CN201710589943A CN107578439B CN 107578439 B CN107578439 B CN 107578439B CN 201710589943 A CN201710589943 A CN 201710589943A CN 107578439 B CN107578439 B CN 107578439B
Authority
CN
China
Prior art keywords
image
sample
target
learning
learning result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710589943.6A
Other languages
English (en)
Other versions
CN107578439A (zh
Inventor
郑丹丹
吴燕萍
徐崴
李亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN202010440759.7A priority Critical patent/CN111612834B/zh
Priority to CN201710589943.6A priority patent/CN107578439B/zh
Publication of CN107578439A publication Critical patent/CN107578439A/zh
Application granted granted Critical
Publication of CN107578439B publication Critical patent/CN107578439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本说明书一个或多个实施例公开了一种生成目标图像的方法、装置及设备,用以实现生成目标图像的自动化和精确化。所述方法包括:获取原始图像;获取经深度学习得到的目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标图像。

Description

生成目标图像的方法、装置及设备
技术领域
本说明书涉及图像处理领域,尤其涉及一种生成目标图像的方法、装置及设备。
背景技术
随着科学技术的飞速发展,摄像技术广泛应用于各个领域,如用于对特定场景进行监控、对目标人物进行检索等。在对摄像头所采集的原始图像进行处理时,往往需要从原始图像中识别出目标物体或目标人物。尤其是在当今时代,每个人都会有大量的证件,且在很多场景应用中都需要对电子证件进行识别。
现有技术中,在证件电子化的过程中,通常采用直接拍摄证件照片、扫描证件、打印证件等方式获取电子证件。显然,通过直接拍摄或扫描、打印等方式所获取的电子证件均不够正式,无法体现证件的法律效应,且往往存在很多问题,如背景干扰、不够清晰、尺寸不合格等。
发明内容
本说明书一个或多个实施例的目的是提供一种生成目标图像的方法、装置及设备,用以实现生成目标图像的自动化和精确化。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
一方面,本说明书一个或多个实施例提供一种生成目标图像的方法,包括:
获取原始图像;
获取经深度学习得到的目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;
根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标图像。
可选地,在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位之前,所述方法还包括:
对所述原始图像进行质量检测,得到至少一个检测项对应的检测结果,所述检测项包括曝光度、是否模糊、是否被遮挡中的至少一项;
当所述至少一个检测项对应的检测结果均为检测通过时,确定所述原始图像满足预设质量要求;
当存在至少一个目标检测项对应的检测结果为检测未通过时,针对所述目标检测项对所述原始图像进行相应调整,以使所述调整后的原始图像满足所述预设质量要求;或者,重新获取所述原始图像,并对所述重新获取的原始图像进行质量检测,直至所述原始图像满足所述预设质量要求。
可选地,所述获取经深度学习得到的目标图像模型之前,所述方法还包括:
获取多个包含样本目标图像的样本原始图像,各所述样本原始图像中标记有所述样本目标图像对应的至少三个样本点的位置信息;
将各所述至少三个样本点的位置信息作为卷积神经网络的输入参数进行深度学习,得到所述目标图像模型。
可选地,所述卷积神经网络包括至少两个卷积层;将各所述至少三个样本点的位置信息作为卷积神经网络的输入参数进行深度学习,得到所述目标图像模型,包括:
将所述至少三个样本点的位置信息作为所述卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第一位置关系;
将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第二位置关系;
将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括所述至少三个点的信息;
根据所述第三学习结果生成所述目标图像模型。
可选地,所述至少三个样本点的位置信息包括:相对横坐标和相对纵坐标。
可选地,根据所述定位的至少三个点对所述原始图像进行处理,包括:
将所述定位的至少三个点依次连接形成闭合区域;
判断所述闭合区域是否符合与指定视角的所述目标图像相匹配的预设形状;
若是,则根据所述定位的至少三个点对所述原始图像进行处理;
若否,则针对所述原始图像进行透视变换,得到符合所述预设形状的原始图像;根据所述定位的至少三个点对所述透视变换之后的原始图像进行处理。
可选地,根据所述定位的至少三个点对所述原始图像进行处理,包括:
针对所述原始图像,沿所述闭合区域的边缘进行切割,得到所述闭合区域对应的图像;
确定所述闭合区域对应的图像为所述目标图像。
另一方面,本说明书一个或多个实施例提供一种生成电子证件的方法,包括:
获取原始图像;
获取经深度学习得到的电子证件模型,所述电子证件模型包括目标证件图像的边缘线交点的信息;
在所述原始图像中,根据所述电子证件模型对所述目标证件图像的边缘线交点进行定位;
根据所述定位的边缘线交点对所述原始图像进行处理,得到所述目标证件图像。
可选地,所述获取原始图像,包括:
拍摄目标证件,得到待检验图像;
根据预设的证件图像分类模型对所述待检验图像进行分类,所述证件图像分类模型包括证件图像和/或非证件图像的信息;
当所述待检验图像属于所述证件图像时,确定获取到包含所述目标证件图像的原始图像。
可选地,在所述原始图像中,根据所述电子证件模型对所述目标证件图像的边缘线交点进行定位之前,所述方法还包括:
对所述原始图像进行质量检测,得到至少一个检测项对应的检测结果,所述检测项包括曝光度、是否模糊、是否被遮挡中的至少一项;
当所述至少一个检测项对应的检测结果均为检测通过时,确定所述原始图像满足预设质量要求;
当存在至少一个目标检测项对应的检测结果为检测未通过时,针对所述目标检测项对所述原始图像进行相应调整,以使所述调整后的原始图像满足所述预设质量要求;或者,重新获取所述原始图像,并对所述重新获取的原始图像进行质量检测,直至所述原始图像满足所述预设质量要求。
可选地,所述获取经深度学习得到的电子证件模型之前,所述方法还包括:
获取多个包含样本目标证件图像的样本原始图像,各所述样本原始图像中标记有所述样本目标证件图像对应的样本边缘线交点的位置信息;
将各所述样本边缘线交点的位置信息作为卷积神经网络的输入参数进行深度学习,得到所述电子证件模型。
可选地,所述卷积神经网络包括至少两个卷积层;将各所述样本边缘线交点的位置信息作为卷积神经网络的输入参数进行深度学习,得到所述电子证件模型,包括:
将所述样本边缘线交点的位置信息作为所述卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第一位置关系;
将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第二位置关系;
将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括所述边缘线交点的信息;
根据所述第三学习结果生成所述电子证件模型。
可选地,所述样本边缘线交点的位置信息包括:相对横坐标和相对纵坐标。
可选地,根据所述定位的样本边缘线交点对所述原始图像进行处理,包括:
将所述定位的边缘线交点依次连接形成闭合区域;
判断所述闭合区域的形状是否符合与指定视角的所述目标证件图像相匹配的预设形状;
若是,则根据所述定位的边缘线交点对所述原始图像进行处理;
若否,则针对所述原始图像进行透视变换,得到符合所述预设形状的原始图像;根据所述定位的边缘线交点对所述透视变换之后的原始图像进行处理。
可选地,根据所述定位的边缘线交点对所述原始图像进行处理,包括:
针对所述原始图像,沿所述闭合区域的边缘进行切割,得到所述闭合区域对应的图像;
确定所述闭合区域对应的图像为所述目标证件图像。
再一方面,本说明书一个或多个实施例提供一种生成目标图像的装置,包括:
第一获取模块,获取原始图像;
第二获取模块,获取经深度学习得到的目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
定位模块,在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;
处理模块,根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标图像。
可选地,所述装置还包括:
学习模块,获取多个包含样本目标图像的样本原始图像,各所述样本原始图像中标记有所述样本目标图像对应的至少三个样本点的位置信息;将各所述至少三个样本点的位置信息作为卷积神经网络的输入参数进行深度学习,得到所述目标图像模型。
可选地,所述卷积神经网络包括至少两个卷积层;所述学习模块包括:
第一学习单元,将所述至少三个样本点的位置信息作为所述卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第一位置关系;
第二学习单元,将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第二位置关系;
映射单元,将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
第三学习单元,对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括所述至少三个点的信息;
生成单元,根据所述第三学习结果生成所述目标图像模型。
可选地,所述处理模块包括:
连接单元,将所述定位的至少三个点依次连接形成闭合区域;
判断单元,判断所述闭合区域是否符合与指定视角的所述目标图像相匹配的预设形状;
第一处理单元,若所述闭合区域符合与指定视角的所述目标图像相匹配的预设形状,则根据所述定位的至少三个点对所述原始图像进行处理;
第二处理单元,若所述闭合区域不符合与指定视角的所述目标图像相匹配的预设形状,则针对所述原始图像进行透视变换,得到符合所述预设形状的原始图像;根据所述定位的至少三个点对所述透视变换之后的原始图像进行处理。
再一方面,本说明书一个或多个实施例提供一种生成电子证件的装置,包括:
第一获取模块,获取原始图像;
第二获取模块,获取经深度学习得到的电子证件模型,所述电子证件模型包括目标证件图像的边缘线交点的信息;
定位模块,在所述原始图像中,根据所述电子证件模型对所述目标证件图像的边缘线交点进行定位;
处理模块,根据所述定位的边缘线交点对所述原始图像进行处理,得到所述目标证件图像。
可选地,所述装置还包括:
学习模块,获取多个包含样本目标证件图像的样本原始图像,各所述样本原始图像中标记有所述样本目标证件图像对应的样本边缘线交点的位置信息;将各所述样本边缘线交点的位置信息作为卷积神经网络的输入参数进行深度学习,得到所述电子证件模型。
可选地,所述卷积神经网络包括至少两个卷积层;所述学习模块包括:
第一学习单元,将所述样本边缘线交点的位置信息作为所述卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第一位置关系;
第二学习单元,将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第二位置关系;
映射单元,将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
第三学习单元,对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括所述边缘线交点的信息;
生成单元,根据所述第三学习结果生成所述电子证件模型。
再一方面,本说明书一个或多个实施例提供一种生成目标图像的设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取原始图像;
获取经深度学习得到的目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;
根据所述定位的至少三个点,对所述原始图像进行处理,得到所述目标图像。
再一方面,本说明书一个或多个实施例提供一种生成电子证件的设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取原始图像;
获取经深度学习得到的电子证件模型,所述电子证件模型包括目标证件图像的边缘线交点的信息;
在所述原始图像中,根据所述电子证件模型对所述目标证件图像的边缘线交点进行定位;
根据所述定位的边缘线交点对所述原始图像进行处理,得到所述目标证件图像。
再一方面,本说明书一个或多个实施例提供一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
获取原始图像;
获取经深度学习得到的目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;
根据所述定位的至少三个点,对所述原始图像进行处理,得到所述目标图像。
再一方面,本说明书一个或多个实施例提供一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
获取原始图像;
获取经深度学习得到的电子证件模型,所述电子证件模型包括目标证件图像的边缘线交点的特征信息;
在所述原始图像中,根据所述电子证件模型对所述目标证件图像的边缘线交点进行定位;
根据所述定位的边缘线交点对所述原始图像进行处理,得到所述目标证件图像。
采用本说明书一个或多个实施例的技术方案,首先获取原始图像,以及获取经深度学习得到的目标图像模型,并根据目标图像模型对目标图像的至少三个点进行定位,进而根据定位的至少三个点对原始图像进行处理,得到目标图像。可见,该技术方案能够通过对目标图像中的多个点的准确定位来进行目标图像的处理,进而获取到目标图像,使得目标图像的获取不依赖于对该目标图像的边缘线的定位,因此能够避免原始图像中存在其他不相关线段时无法准确定位边缘线的情况,从而实现了生成目标图像的自动化和精确化。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本说明书一实施例的一种生成目标图像的方法的示意性流程图;
图2是根据本说明书一实施例的一种学习目标图像模型方法的示意性流程图;
图3是根据本说明书一实施例的一种生成目标图像的方法中回归网络的示意性架构图;
图4是根据本说明书一实施例的一种生成电子证件的方法的示意性流程图;
图5是根据本说明书一实施例的一种生成电子证件的方法中透视变换的示意图;
图6是根据本说明书一实施例的一种生成目标图像的装置的示意性框图;
图7是根据本说明书一实施例的一种生成电子证件的装置的示意性框图;
图8是根据本说明书一实施例的一种生成目标图像的设备的示意性框图;
图9是根据本说明书一实施例的一种生成电子证件的设备的示意性框图。
具体实施方式
本说明书一个或多个实施例提供一种生成目标图像的方法、装置及设备。
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书一个或多个实施例保护的范围。
图1是根据本说明书一实施例的生成目标图像的方法的示意性流程图,如图1所示,该方法包括以下步骤S102-S108:
步骤S102,获取原始图像。
在一个实施例中,原始图像中包含目标图像,目标图像的图像轮廓为符合预设规则的规则图形。
其中,符合预设规则的规则图形包括由多条边缘线段依次连接而形成的、且每两条边缘线段之间能够相交为一个顶点的图形。每两条边缘线段之间相交而成的顶点被视为该规则图形的关键点。例如,目标图像的图像轮廓为三角形、正方形、长方形、平行四边形、五边形等。
步骤S104,获取经深度学习得到的目标图像模型,该目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息。
其中,与目标图像的图像轮廓相对应的至少三个点可以是目标图像的至少三个关键点,目标图像的关键点的数目与该目标图像的图像轮廓相对应。在一个实施例中,目标图像的关键点的数目与该目标图像的图像轮廓中的顶点(即每两条边缘线段之间相交而成的点)数目一致。例如,若目标图像的图像轮廓为三角形,则该目标图像包含三个关键点;若目标图像的图像轮廓为正方形或长方形,则该目标图像包含四个关键点。目标图像模型中包括的与目标图像的图像轮廓相对应的至少三个点的信息可以是目标图像的关键点的特征信息。
步骤S106,在原始图像中,根据目标图像模型对目标图像的至少三个点进行定位。
步骤S108,根据定位的至少三个点对原始图像进行处理,得到目标图像。
采用本说明书一个或多个实施例的技术方案,首先获取原始图像,以及获取经深度学习得到的目标图像模型,并根据目标图像模型对目标图像的至少三个点进行定位,进而根据定位的至少三个点对原始图像进行处理,得到目标图像。可见,该技术方案能够通过对目标图像中的多个点的准确定位来进行目标图像的处理,进而获取到目标图像,使得目标图像的获取不依赖于对该目标图像的边缘线的定位,因此能够避免原始图像中存在其他不相关线段时无法准确定位边缘线的情况,从而实现了生成目标图像的自动化和精确化。
在一个实施例中,执行步骤S106之前,即对目标图像的点进行定位之前,可先对原始图像进行质量检测。因此,上述方法还包括以下步骤:对原始图像进行质量检测,得到至少一个检测项对应的检测结果,检测项包括曝光度、是否模糊、是否被遮挡中的至少一项。
当各检测项对应的检测结果均为检测通过时,确定原始图像满足预设质量要求。此时,可直接对在原始图像中对目标图像的关键点进行定位。
当存在至少一个目标检测项对应的检测结果为检测未通过时,针对目标检测项对原始图像进行相应调整,以使调整后的原始图像满足预设质量要求;其中,目标检测项可以是曝光度、是否模糊、是否被遮挡中的至少一项。
例如,当目标检测项为曝光度时,说明曝光度对应的检测结果为检测未通过,如曝光度不够或者曝光过度,此时可自动调整原始图像的曝光度,以使原始图像的曝光度达到合适的曝光度。本实施例中,可预先设定标准曝光度,这样,在检测原始图像的曝光度时,即可将原始图像的曝光度与预设的标准曝光度进行比较,进而根据比较结果对原始图像的曝光度进行调整。
再例如,当目标检测项为是否模糊时,说明检测项“是否模糊”对应的检测结果为检测未通过,即原始图像较为模糊,此时可自动调整原始图像的清晰度,以使原始图像的清晰度达到合适的清晰度,例如,对原始图像进行去雾处理、提高清晰度等操作。本实施例中,可预先设定标准清晰度,这样,在检测原始图像的清晰度时,即可将原始图像的清晰度与预设的标准清晰度进行比较,进而根据比较结果判断原始图像是否模糊。
此外,当存在至少一个目标检测项对应的检测结果为检测未通过时,还可重新获取原始图像,并对重新获取的原始图像进行质量检测,直至原始图像满足预设质量要求。
针对调整后的原始图像或者重新获取的满足预设质量要求的原始图像,在执行步骤S106时,应在预设质量要求的原始图像中根据目标图像模型对目标图像的关键点进行定位。
在一个实施例中,学习目标图像模型的过程可包括以下步骤A1-A2:
步骤A1,获取多个包含样本目标图像的样本原始图像,各样本目标图像中标记有样本目标图像对应的至少三个样本点的位置信息。
该步骤中,样本目标图像中标记的样本点可以是样本目标图像的关键点,如样本目标图像的图像轮廓中包括的顶点(即每两条边缘线段之间相交的点)。样本原始图像中被标记的关键点的数目可与样本目标图像的图像轮廓中包括的顶点(即每两条边缘线段之间相交的点)数目一致。例如,若样本目标图像的图像轮廓为长方形,则该样本目标图像中被标记有四个关键点。
样本点的位置信息可包括相对横坐标和相对纵坐标。相对横坐标和相对纵坐标所基于的原点可任意设定,但需注意的是,在同一组样本原始图像中,各样本原始图像中被标记的样本点的位置信息所基于的原点应相同。
步骤A2,将多个样本原始图像中标记的各至少三个样本点的位置信息作为卷积神经网络的输入参数进行深度学习,得到目标图像模型。
本实施例中,卷积神经网络可包括多个卷积层。使用多层卷积层的优点在于,仅使用一层卷积学习到的特征往往是局部的,而使用多层卷积时,层数越高,学习的特征就越全局化,即越能学习到目标图像的整体特征。
当卷积神经网络包括多个卷积层时,学习目标图像模型的过程可包括如图2所示的步骤S202-S212:
步骤S202,获取多个包含样本目标图像的样本原始图像,各样本目标图像中标记有样本目标图像对应的至少三个样本点的位置信息。
步骤S204,将至少三个样本点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果。第一学习结果包括各样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第一位置关系。
其中,目标区域为样本目标图像所占区域中的一部分,可选择具有标识性的区域作为目标区域,例如,当样本目标图像为电子证件时,可将电子证件中的人物头像所在的区域作为目标区域。
步骤S206,将第一学习结果作为第二卷积层的输入参数进行学习,直至执行完至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果。第二学习结果包括各样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第二位置关系。
步骤S208,将第一学习结果和第二学习结果分别映射至卷积神经网络的样本标记空间的各结点上。
步骤S210,对各结点上的数据进行综合学习,得到第三学习结果,第三学习结果包括至少三个点的信息。
该步骤中,第三学习结果包括的至少三个点的信息可以是该至少三个点的特征信息。
步骤S212,根据第三学习结果生成目标图像模型。
在该实施例中,每个卷积层还可包括池化和dropout过程。其中,池化可减少各卷积层之间的连接,降低深度学习过程中的运算复杂程度,因此,通过池化可保证在学习特征的同时完成降维。dropout是指在深度学习过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。通过Dropout能够增加噪音,提升泛化能力,因此可以很好地减少过拟合现象。
图3示出了一实施例中卷积神经网络的回归网络架构图。在该实施例中,回归网络包括三个卷积层和两个全连接层。如图3所示,该回归网络包括卷积层320、卷积层330、卷积层340、全连接层350以及全连接层360。样本原始图像310中包含样本目标图像370。在卷积层320(即第一层卷积)中,包括卷积Cov1、池化pool1和dropout1,在卷积层330(即第二层卷积)中,包括卷积Cov2、池化pool2和dropout2,在卷积层340(即第三层卷积)中,包括卷积Cov3和dropout3。第四层为全连接层350,全连接层350用于将卷积层320、卷积层330以及卷积层340分别学习到的特征信息(即学习结果)映射到卷积神经网络的样本标记空间的各结点上。第五层为全连接层360,全连接层360对样本标记空间的各结点上的数据进行综合学习,最终得到样本目标图像对应的至少三个样本点的特征信息,生成目标图像模型。
按照上述深度学习的方式生成目标图像模型之后,即可在原始图像中根据目标图像模型对目标图像的至少三个点进行定位。
在一个实施例中,对目标图像的至少三个点进行定位之后,可按照如下步骤B1-B2对原始图像进行处理,以获得目标图像。
步骤B1,将定位的至少三个点依次连接形成闭合区域。
步骤B2,判断闭合区域是否符合与指定视角的目标图像相匹配的预设形状;若是,则根据定位的至少三个点对原始图像进行处理;若否,则针对原始图像进行透视变换,得到符合预设形状的原始图像;根据定位的至少三个点对透视变换之后的原始图像进行处理。
在根据定位的至少三个点对原始图像进行处理时,针对原始图像,沿将定位的至少三个点依次连接形成的闭合区域的边缘进行切割,即可得到闭合区域对应的图像,进而确定闭合区域对应的图像为目标图像。
该实施例中,可预先设定指定视角,指定视角的设定与目标图像的实际图像轮廓相关,其中,目标图像的实际图像轮廓可根据目标图像对应的实际物体来确定。当目标图像的实际图像轮廓确定之后,指定视角应位于与所确定的实际图像轮廓所在平面相垂直的直线上。例如,若目标图像的实际图像轮廓为长方形,则指定视角应位于与该长方形所在平面垂直的直线上。
基于上述对指定视角的确定,与指定视角的目标图像相匹配的预设形状应与该目标图像的实际图像轮廓相匹配。例如,若目标图像的实际图像轮廓为长方形,则预设形状为长方形。
该实施例中,当判定闭合区域不符合与指定视角的目标图像相匹配的预设形状时,按照预设形状对原始图像进行透视变换。例如,假设闭合区域为平行四边形,而预设形状为长方形,则说明闭合区域不符合与指定视角的目标图像相匹配的预设形状,此时应对原始图像进行透视变换,使得原始图像中的闭合区域符合长方形。具体的透视变换过程为现有技术,在此不再赘述。
由上述实施例可知,该技术方案通过对原始图像进行透视变换,可确保目标图像所在的闭合区域符合与指定视角的目标图像相匹配的预设形状,因此,能够避免因原始图像变形时导致目标图像获取不准确的情况。
图4是根据本说明书一实施例的生成电子证件的方法的示意性流程图,如图4所示,该方法包括以下步骤S402-S408:
步骤S402,获取原始图像。
在一个实施例中,原始图像中包含目标图像。
步骤S404,获取经深度学习得到的电子证件模型,电子证件模型包括与目标证件图像的图像轮廓相对应的至少三个点的信息。
其中,与目标证件图像的图像轮廓相对应的至少三个点可以是目标证件图像的至少三个关键点,目标证件图像的关键点的数目与该目标证件图像的图像轮廓相对应。例如,目标证件图像的图像轮廓为长方形,则该目标证件图像的关键点的数目为4。在该实施例中,目标证件图像的关键点可视为目标证件图像的边缘线交点。电子证件模型中包括的与目标证件图像的图像轮廓相对应的至少三个点的信息可以是目标证件图像的关键点的特征信息。
步骤S406,在原始图像中,根据电子证件模型对目标证件图像的至少三个点进行定位。
步骤S408,根据定位的至少三个点对原始图像进行处理,得到目标证件图像。
采用本说明书一个或多个实施例的技术方案,首先获取原始图像,以及获取经深度学习得到的电子证件模型,并根据电子证件模型对目标证件图像的至少三个点进行定位,进而根据定位的至少三个点对原始图像进行处理,得到目标证件图像。可见,该技术方案能够通过对目标证件图像中的多个点的准确定位来进行目标证件图像的处理,进而获取到目标证件图像,使得目标证件图像的获取不依赖于对该目标证件图像的边缘线的定位,因此能够避免原始图像中存在其他不相关线段时无法准确定位边缘线的情况,从而实现了生成目标证件图像的自动化和精确化。
在一个实施例中,可通过以下步骤C1-C3获取原始图像:
步骤C1,拍摄目标证件,得到待检验图像。
步骤C2,根据预设的证件图像分类模型对待检验图像进行分类,证件图像分类模型包括证件图像和/或非证件图像的信息。
步骤C3,当待检验图像属于证件图像时,确定获取到包含目标证件图像的原始图像。
该实施例中,需首先训练证件图像分类模型。具体训练方法如下:首先获取多个样本图像,包括多个样本证件图像和/或多个样本非证件图像,进而分别对各样本证件图像和/或各样本非证件图像的图像类型进行标注,其中,图像类型包括证件图像和/或非证件图像。在标注各样本证件图像和/或各样本非证件图像之后,即可以各样本证件图像和/或各样本非证件图像作为输入参数执行机器学习,最终学习到证件图像和/或非证件图像的信息(即特征信息),生成证件图像分类模型。利用证件图像分类模型,即可对拍摄得到的待检测图像进行分类。
在一个实施例中,执行步骤S406之前,即对目标证件图像的至少三个点进行定位之前,可先对原始图像进行质量检测。因此,上述方法还包括以下步骤:对原始图像进行质量检测,得到至少一个检测项对应的检测结果,检测项包括曝光度、是否模糊、是否被遮挡中的至少一项。
当各检测项对应的检测结果均为检测通过时,确定原始图像满足预设质量要求。此时,可直接对在原始图像中对目标证件图像的点进行定位。
当存在至少一个目标检测项对应的检测结果为检测未通过时,针对目标检测项对原始图像进行相应调整,以使调整后的原始图像满足预设质量要求;其中,目标检测项可以是曝光度、是否模糊、是否被遮挡中的至少一项。
例如,当目标检测项为曝光度时,说明曝光度对应的检测结果为检测未通过,如曝光度不够或者曝光过度,此时可自动调整原始图像的曝光度,以使原始图像的曝光度达到合适的曝光度。本实施例中,可预先设定标准曝光度,这样,在检测原始图像的曝光度时,即可将原始图像的曝光度与预设的标准曝光度进行比较,进而根据比较结果对原始图像的曝光度进行调整。
再例如,当目标检测项为是否模糊时,说明检测项“是否模糊”对应的检测结果为检测未通过,即原始图像较为模糊,此时可自动调整原始图像的清晰度,以使原始图像的清晰度达到合适的清晰度,例如,对原始图像进行去雾处理、提高清晰度等操作。本实施例中,可预先设定标准清晰度,这样,在检测原始图像的清晰度时,即可将原始图像的清晰度与预设的标准清晰度进行比较,进而根据比较结果判断原始图像是否模糊。
此外,当存在至少一个目标检测项对应的检测结果为检测未通过时,还可重新获取原始图像,并对重新获取的原始图像进行质量检测,直至原始图像满足预设质量要求。
针对调整后的原始图像或者重新获取的满足预设质量要求的原始图像,在执行步骤S406时,应在预设质量要求的原始图像中根据电子证件模型对目标证件图像的点进行定位。
在一个实施例中,学习电子证件模型的过程可包括以下步骤D1-D2:
步骤D1,获取多个包含样本目标证件图像的样本原始图像,各样本原始图像中标记有样本目标证件图像对应的至少三个样本点的位置信息。
该步骤中,样本目标证件图像中标记的样本点可以是样本目标证件图像的关键点,如样本目标证件图像的图像轮廓中包括的边缘线交点。样本原始图像中被标记的关键点的数目可与样本目标证件图像的图像轮廓中包括的边缘线交点数目一致。由于通常情况下,样本目标证件图像(如身份证的证件图像)的每两条边缘线段之间可相交为一个直角,因此,样本原始图像中被标记的关键点的数目可与样本目标证件图像中的直角数目一致。
样本点的位置信息可包括相对横坐标和相对纵坐标。相对横坐标和相对纵坐标所基于的原点可任意设定,但需注意的是,在同一组样本原始图像中,各样本原始图像中被标记的样本点的位置信息所基于的原点应相同。
步骤D2,将各至少三个样本点的位置信息作为卷积神经网络的输入参数进行深度学习,得到电子证件模型。
本实施例中,卷积神经网络可包括多个卷积层。使用多层卷积层的优点在于,仅使用一层卷积学习到的特征往往是局部的,而使用多层卷积时,层数越高,学习的特征就越全局化,即越能学习到目标证件图像的整体特征。
当卷积神经网络包括多个卷积层时,学习电子证件模型的过程可包括如下步骤:
步骤一、将至少三个样本点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果。第一学习结果包括各样本目标证件图像对应的至少三个样本点、边缘线、证件头像中的至少两项之间的第一位置关系。
步骤二、将第一学习结果作为第二卷积层的输入参数进行学习,直至执行完至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果。第二学习结果包括各样本目标证件图像对应的至少三个样本点、边缘线、证件头像中的至少两项之间的第二位置关系。
步骤三、将第一学习结果和第二学习结果分别映射至卷积神经网络的样本标记空间的各结点上。
步骤四、对各结点上的数据进行综合学习,得到第三学习结果,第三学习结果包括至少三个点的信息。
该步骤中,第三学习结果包括的至少三个点的信息可以是该至少三个点的特征信息。
步骤五、根据第三学习结果生成电子证件模型。
上述实施例中,样本目标证件图像对应的至少三个样本关键点可视为样本目标证件图像的样本边缘线交点。深度学习得到的电子证件模型中包括目标证件图像的边缘线交点的特征信息。
在该实施例中,每个卷积层还可包括池化和dropout过程。其中,池化可减少各卷积层之间的连接,降低深度学习过程中的运算复杂程度,因此,通过池化可保证在学习特征的同时完成降维。dropout是指在深度学习过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。通过Dropout能够增加噪音,提升泛化能力,因此可以很好地减少过拟合现象。
深度学习电子证件模型的回归网络架构图如图3所示。该回归网络架构图已在上述实施例中详细介绍,在此不再赘述。
按照上述深度学习的方式生成电子证件模型之后,即可在原始图像中根据电子证件模型对目标证件图像的至少三个点进行定位。
在一个实施例中,对目标证件图像的至少三个点进行定位之后,可按照如下步骤E1-E2对原始图像进行处理,以获得目标图像。
步骤E1,将定位的至少三个关键点依次连接形成闭合区域。
步骤E2,判断闭合区域的形状是否符合与指定视角的目标证件图像相匹配的预设形状;若是,则根据定位的至少三个点对原始图像进行处理;若否,则针对原始图像进行透视变换,得到符合预设形状的原始图像;根据定位的至少三个点对透视变换之后的原始图像进行处理。
在根据定位的至少三个点对原始图像进行处理时,针对原始图像,沿将定位的至少三个点依次连接形成的闭合区域的边缘进行切割,得到闭合区域对应的图像,进而确定闭合区域对应的图像为目标证件图像。
该实施例中,可预先设定指定视角,指定视角的设定与目标证件图像的实际图像轮廓相关,其中,目标证件图像的实际图像轮廓可根据证件本身来确定。由于通常情况下,证件本身为长方形,因此目标证件图像的实际图像轮廓也为长方形。这样,指定视角应位于与该长方形所在平面垂直的直线上。
该实施例中,目标证件图像的关键点可视为目标证件图像的边缘线交点。
基于上述对指定视角的确定,与指定视角的目标证件图像相匹配的预设形状应与该目标图像的实际图像轮廓相匹配。例如,若目标证件图像的实际图像轮廓为长方形,则预设形状为长方形。
该实施例中,当判定闭合区域不符合与指定视角的目标证件图像相匹配的预设形状时,按照预设形状对原始图像进行透视变换。例如,假设闭合区域为平行四边形,而预设形状为长方形,则说明闭合区域不符合与指定视角的目标证件图像相匹配的预设形状,此时应对原始图像进行透视变换,使得原始图像中的闭合区域符合长方形。具体的透视变换过程为现有技术,在此不再赘述。
图5示出了一实施例中对原始图像进行透视变换的示意图。如图5所示,第一原始图像510由于拍摄角度的问题,导致第一原始图像510中的目标证件图像520不符合预设形状(即长方形)。因此,应对第一原始图像510进行透视变换,透视变换后的第一原始图像510为图5中所示的第二原始图像530。由图5可看出,经透视变换之后得到的第二原始图像530中,目标证件图像540为长方形。
由上述实施例可知,该技术方案通过对原始图像进行透视变换,可确保目标证件图像所在的闭合区域符合与指定视角的目标证件图像相匹配的预设形状,因此,能够避免因原始图像变形时导致目标证件图像获取不准确的情况。
综上,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
以上为本说明书一个或多个实施例提供的生成目标图像的方法,基于同样的思路,本说明书一个或多个实施例还提供一种生成目标图像的装置、一种生成电子证件的装置。
图6是根据本说明书一实施例的生成目标图像的装置的示意性框图。如图6所示,该装置包括:
第一获取模块610,获取原始图像;
第二获取模块620,获取经深度学习得到的目标图像模型,目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
定位模块630,在原始图像中,根据目标图像模型对目标图像的至少三个点进行定位;
处理模块640,根据定位的至少三个点对原始图像进行处理,得到目标图像。
在一个实施例中,上述装置还包括:
学习模块,获取多个包含样本目标图像的样本原始图像,各样本原始图像中标记有样本目标图像对应的至少三个样本点的位置信息;将各至少三个样本点的位置信息作为卷积神经网络的输入参数进行深度学习,得到目标图像模型。
在一个实施例中,卷积神经网络包括至少两个卷积层;学习模块包括:
第一学习单元,将至少三个样本点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,第一学习结果包括各样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第一位置关系;
第二学习单元,将第一学习结果作为第二卷积层的输入参数进行学习,直至执行完至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,第二学习结果包括各样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第二位置关系;
映射单元,将第一学习结果和第二学习结果分别映射至卷积神经网络的样本标记空间的各结点上;
第三学习单元,对各结点上的数据进行综合学习,得到第三学习结果,第三学习结果包括至少三个点的信息;
生成单元,根据第三学习结果生成目标图像模型。
在一个实施例中,处理模块640包括:
连接单元,将定位的至少三个点依次连接形成闭合区域;
判断单元,判断闭合区域是否符合与指定视角的目标图像相匹配的预设形状;
第一处理单元,若闭合区域符合与指定视角的目标图像相匹配的预设形状,则根据定位的至少三个点对原始图像进行处理;
第二处理单元,若闭合区域不符合与指定视角的目标图像相匹配的预设形状,则针对原始图像进行透视变换,得到符合预设形状的原始图像;根据定位的至少三个点对透视变换之后的原始图像进行处理。
采用本说明书一个或多个实施例的装置,首先获取原始图像,以及获取经深度学习得到的目标图像模型,并根据目标图像模型对目标图像的至少三个点进行定位,进而根据定位的至少三个点对原始图像进行处理,得到目标图像。可见,该技术方案能够通过对目标图像中的多个点的准确定位来进行目标图像的处理,进而获取到目标图像,使得目标图像的获取不依赖于对该目标图像的边缘线的定位,因此能够避免原始图像中存在其他不相关线段时无法准确定位边缘线的情况,从而实现了生成目标图像的自动化和精确化。
图7是根据本说明书一实施例的生成电子证件的装置的示意性框图。如图7所示,该装置包括:
第一获取模块710,获取原始图像;
第二获取模块720,获取经深度学习得到的电子证件模型,电子证件模型包括目标证件图像的图像轮廓所对应的至少三个点的信息;
定位模块730,在原始图像中,根据电子证件模型对目标证件图像的至少三个点进行定位;
处理模块740,根据定位的至少三个点对原始图像进行处理,得到目标证件图像。
在该实施例中,目标证件图像的点可视为目标证件图像的边缘线交点。
在一个实施例中,上述装置还包括:
学习模块,获取多个包含样本目标证件图像的样本原始图像,各样本原始图像中标记有样本目标证件图像对应的至少三个样本点的位置信息;将各至少三个样本点的位置信息作为卷积神经网络的输入参数进行深度学习,得到电子证件模型。
在一个实施例中,卷积神经网络包括至少两个卷积层;学习模块包括:
第一学习单元,将至少三个样本点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,第一学习结果包括各样本目标证件图像对应的至少三个样本点、边缘线、证件头像中的至少两项之间的第一位置关系;
第二学习单元,将第一学习结果作为第二卷积层的输入参数进行学习,直至执行完至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,第二学习结果包括各样本目标证件图像对应的至少三个样本点、边缘线、证件头像中的至少两项之间的第二位置关系;
映射单元,将第一学习结果和第二学习结果分别映射至卷积神经网络的样本标记空间的各结点上;
第三学习单元,对各结点上的数据进行综合学习,得到第三学习结果,第三学习结果包括至少三个点的特征信息;
生成单元,根据第三学习结果生成电子证件模型。
采用本说明书一个或多个实施例的装置,首先获取原始图像,以及获取经深度学习得到的电子证件模型,并根据电子证件模型对目标证件图像的至少三个点进行定位,进而根据定位的至少三个点对原始图像进行处理,得到目标证件图像。可见,该技术方案能够通过对目标证件图像中的多个点的准确定位来进行目标证件图像的处理,进而获取到目标证件图像,使得目标证件图像的获取不依赖于对该目标证件图像的边缘线的定位,因此能够避免原始图像中存在其他不相关线段时无法准确定位边缘线的情况,从而实现了生成目标证件图像的自动化和精确化。
本领域的技术人员应可理解,图6中的生成目标图像的装置能够用来实现前文所述的生成目标图像的方法,图7中的生成电子证件的装置能够用来实现前文所述的生成电子证件的方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
基于同样的思路,本说明书一个或多个实施例还提供一种生成目标图像的设备,如图8所示。生成目标图像的设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对生成目标图像的设备中的一系列计算机可执行指令。更进一步地,处理器801可以设置为与存储器802通信,在生成目标图像的设备上执行存储器802中的一系列计算机可执行指令。生成目标图像的设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入输出接口805,一个或一个以上键盘806。
具体在本实施例中,生成目标图像的设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对图像生成设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取原始图像;
获取经深度学习得到的目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;
根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标图像。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
对所述原始图像进行质量检测,得到至少一个检测项对应的检测结果,所述检测项包括曝光度、是否模糊、是否被遮挡中的至少一项;
当所述至少一个检测项对应的检测结果均为检测通过时,确定所述原始图像满足预设质量要求;
当存在至少一个目标检测项对应的检测结果为检测未通过时,针对所述目标检测项对所述原始图像进行相应调整,以使所述调整后的原始图像满足所述预设质量要求;或者,重新获取所述原始图像,并对所述重新获取的原始图像进行质量检测,直至所述原始图像满足所述预设质量要求。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
获取多个包含样本目标图像的样本原始图像,各所述样本原始图像中标记有所述样本目标图像对应的至少三个样本点的位置信息;
将各所述至少三个样本点的位置信息作为卷积神经网络的输入参数进行深度学习,得到所述目标图像模型。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
将所述至少三个样本点的位置信息作为所述卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第一位置关系;
将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第二位置关系;
将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括所述至少三个点的信息;
根据所述第三学习结果生成所述目标图像模型。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
将所述定位的至少三个点依次连接形成闭合区域;
判断所述闭合区域是否符合与指定视角的所述目标图像相匹配的预设形状;
若是,则根据所述定位的至少三个点对所述原始图像进行处理;
若否,则针对所述原始图像进行透视变换,得到符合所述预设形状的原始图像;根据所述定位的至少三个点对所述透视变换之后的原始图像进行处理。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
针对所述原始图像,沿所述闭合区域的边缘进行切割,得到所述闭合区域对应的图像;
确定所述闭合区域对应的图像为所述目标图像。
基于同样的思路,本说明书一个或多个实施例还提供一种生成电子证件的设备,如图9所示。生成电子证件的设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器901和存储器902,存储器902中可以存储有一个或一个以上存储应用程序或数据。其中,存储器902可以是短暂存储或持久存储。存储在存储器902的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对生成电子证件的设备中的一系列计算机可执行指令。更进一步地,处理器901可以设置为与存储器902通信,在生成电子证件的设备上执行存储器902中的一系列计算机可执行指令。生成电子证件的设备还可以包括一个或一个以上电源903,一个或一个以上有线或无线网络接口904,一个或一个以上输入输出接口905,一个或一个以上键盘906。
具体在本实施例中,生成电子证件的设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对电子证件的生成设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取原始图像;
获取经深度学习得到的电子证件模型,所述电子证件模型包括与目标证件图像的图像轮廓相对应的至少三个点的信息;
在所述原始图像中,根据所述电子证件模型对所述目标证件图像的至少三个点进行定位;
根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标证件图像。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
拍摄目标证件,得到待检验图像;
根据预设的证件图像分类模型对所述待检验图像进行分类,所述证件图像分类模型包括证件图像和/或非证件图像的信息;
当所述待检验图像属于所述证件图像时,确定获取到包含所述目标证件图像的原始图像。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
获取多个包含样本目标证件图像的样本原始图像,各所述样本原始图像中标记有所述样本目标证件图像对应的至少三个样本点的位置信息;
将各所述至少三个样本点的位置信息作为卷积神经网络的输入参数进行深度学习,得到所述电子证件模型。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
将所述至少三个样本点的位置信息作为所述卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标证件图像对应的至少三个样本点、边缘线、证件头像中的至少两项之间的第一位置关系;
将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标证件图像对应的至少三个样本点、边缘线、证件头像中的至少两项之间的第二位置关系;
将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括所述至少三个点的信息;
根据所述第三学习结果生成所述电子证件模型。
本说明书一个或多个实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述生成目标图像的方法,并具体用于执行:
获取原始图像;
获取经深度学习得到的目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;
根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标图像。
本说明书一个或多个实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述生成电子证件的方法,并具体用于执行:
获取原始图像;
获取经深度学习得到的电子证件模型,所述电子证件模型包括与所述目标证件图像的图像轮廓相对应的至少三个点的信息;
在所述原始图像中,根据所述电子证件模型对所述目标证件图像的至少三个点进行定位;
根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标证件图像。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的权利要求范围之内。

Claims (14)

1.一种生成目标图像的方法,包括:
获取原始图像;
获取多个包含样本目标图像的样本原始图像,各所述样本原始图像中标记有所述样本目标图像对应的至少三个样本点的位置信息;
将所述至少三个样本点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第一位置关系,所述卷积神经网络包括至少两个卷积层;
将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第二位置关系;
将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括至少三个点的信息;
根据所述第三学习结果生成目标图像模型;
获取经深度学习得到的所述目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;
根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标图像。
2.根据权利要求1所述的方法,在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位之前,所述方法还包括:
对所述原始图像进行质量检测,得到至少一个检测项对应的检测结果,所述检测项包括曝光度、是否模糊、是否被遮挡中的至少一项;
当所述至少一个检测项对应的检测结果均为检测通过时,确定所述原始图像满足预设质量要求;
当存在至少一个目标检测项对应的检测结果为检测未通过时,针对所述目标检测项对所述原始图像进行相应调整,以使所述调整后的原始图像满足所述预设质量要求;或者,重新获取所述原始图像,并对所述重新获取的原始图像进行质量检测,直至所述原始图像满足所述预设质量要求。
3.根据权利要求1所述的方法,所述至少三个样本点的位置信息包括:相对横坐标和相对纵坐标。
4.根据权利要求1所述的方法,根据所述定位的至少三个点对所述原始图像进行处理,包括:
将所述定位的至少三个点依次连接形成闭合区域;
判断所述闭合区域是否符合与指定视角的所述目标图像相匹配的预设形状;
若是,则根据所述定位的至少三个点对所述原始图像进行处理;
若否,则针对所述原始图像进行透视变换,得到符合所述预设形状的原始图像;根据所述定位的至少三个点对所述透视变换之后的原始图像进行处理。
5.根据权利要求4所述的方法,根据所述定位的至少三个点对所述原始图像进行处理,包括:
针对所述原始图像,沿所述闭合区域的边缘进行切割,得到所述闭合区域对应的图像;
确定所述闭合区域对应的图像为所述目标图像。
6.一种生成电子证件的方法,包括:
获取原始图像;
获取多个包含样本目标证件图像的样本原始图像,各所述样本原始图像中标记有所述样本目标证件图像对应的样本边缘线交点的位置信息;
将所述样本边缘线交点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第一位置关系,所述卷积神经网络包括至少两个卷积层;
将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第二位置关系;
将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括边缘线交点的信息;
根据所述第三学习结果生成电子证件模型;
获取经深度学习得到的所述电子证件模型,所述电子证件模型包括目标证件图像的边缘线交点的信息;
在所述原始图像中,根据所述电子证件模型对所述目标证件图像的边缘线交点进行定位;
根据所述定位的边缘线交点对所述原始图像进行处理,得到所述目标证件图像。
7.根据权利要求6所述的方法,所述获取原始图像,包括:
拍摄目标证件,得到待检验图像;
根据预设的证件图像分类模型对所述待检验图像进行分类,所述证件图像分类模型包括证件图像和/或非证件图像的信息;
当所述待检验图像属于所述证件图像时,确定获取到包含所述目标证件图像的原始图像。
8.一种生成目标图像的装置,包括:
第一获取模块,获取原始图像;
学习模块,获取多个包含样本目标图像的样本原始图像,各所述样本原始图像中标记有所述样本目标图像对应的至少三个样本点的位置信息;将所述至少三个样本点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第一位置关系,所述卷积神经网络包括至少两个卷积层;将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第二位置关系;映射单元,将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括至少三个点的信息;根据所述第三学习结果生成目标图像模型;
第二获取模块,获取经深度学习得到的所述目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
定位模块,在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;
处理模块,根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标图像。
9.根据权利要求8所述的装置,所述处理模块包括:
连接单元,将所述定位的至少三个点依次连接形成闭合区域;
判断单元,判断所述闭合区域是否符合与指定视角的所述目标图像相匹配的预设形状;
第一处理单元,若所述闭合区域符合与指定视角的所述目标图像相匹配的预设形状,则根据所述定位的至少三个点对所述原始图像进行处理;
第二处理单元,若所述闭合区域不符合与指定视角的所述目标图像相匹配的预设形状,则针对所述原始图像进行透视变换,得到符合所述预设形状的原始图像;根据所述定位的至少三个点对所述透视变换之后的原始图像进行处理。
10.一种生成电子证件的装置,包括:
第一获取模块,获取原始图像;
学习模块,获取多个包含样本目标证件图像的样本原始图像,各所述样本原始图像中标记有所述样本目标证件图像对应的样本边缘线交点的位置信息;将所述样本边缘线交点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第一位置关系,所述卷积神经网络包括至少两个卷积层;将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第二位置关系;将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括边缘线交点的信息;根据所述第三学习结果生成电子证件模型;
第二获取模块,获取经深度学习得到的所述电子证件模型,所述电子证件模型包括目标证件图像的边缘线交点的信息;
定位模块,在所述原始图像中,根据所述电子证件模型对所述目标证件图像的边缘线交点进行定位;
处理模块,根据所述定位的边缘线交点对所述原始图像进行处理,得到所述目标证件图像。
11.一种生成目标图像的设备,其特征在于,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取原始图像;
获取多个包含样本目标图像的样本原始图像,各所述样本原始图像中标记有所述样本目标图像对应的至少三个样本点的位置信息;
将所述至少三个样本点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第一位置关系,所述卷积神经网络包括至少两个卷积层;
将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第二位置关系;
将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括至少三个点的信息;
根据所述第三学习结果生成目标图像模型;
获取经深度学习得到的所述目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;
根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标图像。
12.一种生成电子证件的设备,其特征在于,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取原始图像;
获取多个包含样本目标证件图像的样本原始图像,各所述样本原始图像中标记有所述样本目标证件图像对应的样本边缘线交点的位置信息;
将所述样本边缘线交点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第一位置关系,所述卷积神经网络包括至少两个卷积层;
将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第二位置关系;
将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括边缘线交点的信息;
根据所述第三学习结果生成电子证件模型;
获取经深度学习得到的所述电子证件模型,所述电子证件模型包括目标证件图像的边缘线交点的信息;
在所述原始图像中,根据所述电子证件模型对所述目标证件图像的边缘线交点进行定位;
根据所述定位的边缘线交点对所述原始图像进行处理,得到所述目标证件图像。
13.一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
获取原始图像;
获取多个包含样本目标图像的样本原始图像,各所述样本原始图像中标记有所述样本目标图像对应的至少三个样本点的位置信息;
将所述至少三个样本点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第一位置关系,所述卷积神经网络包括至少两个卷积层;
将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标图像对应的至少三个样本点、边缘线、目标区域中的至少两项之间的第二位置关系;
将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括至少三个点的信息;
根据所述第三学习结果生成目标图像模型;
获取经深度学习得到的所述目标图像模型,所述目标图像模型包括与目标图像的图像轮廓相对应的至少三个点的信息;
在所述原始图像中,根据所述目标图像模型对所述目标图像的至少三个点进行定位;
根据所述定位的至少三个点对所述原始图像进行处理,得到所述目标图像。
14.一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
获取原始图像;
获取多个包含样本目标证件图像的样本原始图像,各所述样本原始图像中标记有所述样本目标证件图像对应的样本边缘线交点的位置信息;
将所述样本边缘线交点的位置信息作为卷积神经网络的第一卷积层的输入参数进行学习,得到第一学习结果,所述第一学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第一位置关系,所述卷积神经网络包括至少两个卷积层;
将所述第一学习结果作为第二卷积层的输入参数进行学习,直至执行完所述至少两个卷积层中的各卷积层分别对应的学习操作,得到第二学习结果,所述第二学习结果包括各所述样本目标证件图像对应的样本边缘线交点、边缘线、证件头像中的至少两项之间的第二位置关系;
将所述第一学习结果和所述第二学习结果分别映射至所述卷积神经网络的样本标记空间的各结点上;
对所述各结点上的数据进行综合学习,得到第三学习结果,所述第三学习结果包括边缘线交点的信息;
根据所述第三学习结果生成电子证件模型;
获取经深度学习得到的所述电子证件模型,所述电子证件模型包括目标证件图像的边缘线交点的信息;
在所述原始图像中,根据所述电子证件模型对所述目标证件图像的边缘线交点进行定位;
根据所述定位的边缘线交点对所述原始图像进行处理,得到所述目标证件图像。
CN201710589943.6A 2017-07-19 2017-07-19 生成目标图像的方法、装置及设备 Active CN107578439B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010440759.7A CN111612834B (zh) 2017-07-19 2017-07-19 生成目标图像的方法、装置及设备
CN201710589943.6A CN107578439B (zh) 2017-07-19 2017-07-19 生成目标图像的方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710589943.6A CN107578439B (zh) 2017-07-19 2017-07-19 生成目标图像的方法、装置及设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202010440759.7A Division CN111612834B (zh) 2017-07-19 2017-07-19 生成目标图像的方法、装置及设备

Publications (2)

Publication Number Publication Date
CN107578439A CN107578439A (zh) 2018-01-12
CN107578439B true CN107578439B (zh) 2020-04-28

Family

ID=61050096

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201710589943.6A Active CN107578439B (zh) 2017-07-19 2017-07-19 生成目标图像的方法、装置及设备
CN202010440759.7A Active CN111612834B (zh) 2017-07-19 2017-07-19 生成目标图像的方法、装置及设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202010440759.7A Active CN111612834B (zh) 2017-07-19 2017-07-19 生成目标图像的方法、装置及设备

Country Status (1)

Country Link
CN (2) CN107578439B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108389167B (zh) * 2018-02-09 2020-04-21 广东天骄智能制造要素配置有限公司 图像处理方法、装置、计算机设备和存储介质
CN111754410B (zh) * 2019-03-27 2024-04-09 浙江宇视科技有限公司 一种图像处理方法、装置、电子设备及可读存储介质
CN110555897B (zh) * 2019-09-09 2022-12-16 上海联影医疗科技股份有限公司 一种图像生成的方法、装置、设备及存储介质
CN110765304A (zh) * 2019-10-22 2020-02-07 珠海研果科技有限公司 图像处理方法、装置、电子设备及计算机可读介质
CN111383176A (zh) * 2020-03-18 2020-07-07 北京七维视觉传媒科技有限公司 证件照片的生成方法、客户端及服务端
CN111385489B (zh) * 2020-03-20 2022-09-23 百度在线网络技术(北京)有限公司 一种短视频封面的制作方法、装置、设备和存储介质
CN111491106B (zh) * 2020-05-15 2021-12-14 Oppo(重庆)智能科技有限公司 拍摄图像的处理方法、装置、移动终端及存储介质
CN111860486B (zh) * 2020-07-27 2023-10-31 平安科技(深圳)有限公司 卡片识别方法、装置及设备
CN113920304A (zh) * 2021-09-29 2022-01-11 北京百度网讯科技有限公司 样本图像处理方法、装置、电子设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778464A (zh) * 2015-05-04 2015-07-15 中国科学院重庆绿色智能技术研究院 一种基于深度卷积神经网络的服装定位检测方法
CN105825243A (zh) * 2015-01-07 2016-08-03 阿里巴巴集团控股有限公司 证件图像检测方法及设备
CN106022232A (zh) * 2016-05-12 2016-10-12 成都新舟锐视科技有限公司 基于深度学习的车牌检测方法
CN106469304A (zh) * 2016-09-22 2017-03-01 西安理工大学 基于深度卷积神经网络的票据中手写签名位置定位方法
CN106650641A (zh) * 2016-12-05 2017-05-10 北京文安智能技术股份有限公司 一种交通信号灯定位识别方法、装置及系统
CN106778531A (zh) * 2016-11-25 2017-05-31 北京小米移动软件有限公司 人脸定位方法及装置
CN106780316A (zh) * 2017-01-25 2017-05-31 宇龙计算机通信科技(深圳)有限公司 一种图像裁剪方法、图像裁剪装置和移动终端
CN106803084A (zh) * 2017-03-02 2017-06-06 中科视拓(北京)科技有限公司 一种基于端到端循环网络的面部特征点定位方法
CN106845482A (zh) * 2017-01-23 2017-06-13 南京邮电大学盐城大数据研究院有限公司 一种车牌定位方法
CN106951867A (zh) * 2017-03-22 2017-07-14 成都擎天树科技有限公司 基于卷积神经网络的人脸识别方法、装置、系统及设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4613990B2 (ja) * 2008-07-31 2011-01-19 ソニー株式会社 画像処理装置、画像処理方法、プログラム
DE102012206851A1 (de) * 2012-04-25 2013-10-31 Robert Bosch Gmbh Verfahren und Vorrichtung zum Ermitteln einer im Lichtkegel eines projizierten Bildes ausgeführten Geste
JP6068896B2 (ja) * 2012-09-21 2017-01-25 株式会社ニコンシステム 画像処理装置およびプログラム
US9122914B2 (en) * 2013-05-09 2015-09-01 Tencent Technology (Shenzhen) Co., Ltd. Systems and methods for matching face shapes
CN104751477A (zh) * 2015-04-17 2015-07-01 薛笑荣 基于空间域和频域特征的并行sar图像分类方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825243A (zh) * 2015-01-07 2016-08-03 阿里巴巴集团控股有限公司 证件图像检测方法及设备
CN104778464A (zh) * 2015-05-04 2015-07-15 中国科学院重庆绿色智能技术研究院 一种基于深度卷积神经网络的服装定位检测方法
CN106022232A (zh) * 2016-05-12 2016-10-12 成都新舟锐视科技有限公司 基于深度学习的车牌检测方法
CN106469304A (zh) * 2016-09-22 2017-03-01 西安理工大学 基于深度卷积神经网络的票据中手写签名位置定位方法
CN106778531A (zh) * 2016-11-25 2017-05-31 北京小米移动软件有限公司 人脸定位方法及装置
CN106650641A (zh) * 2016-12-05 2017-05-10 北京文安智能技术股份有限公司 一种交通信号灯定位识别方法、装置及系统
CN106845482A (zh) * 2017-01-23 2017-06-13 南京邮电大学盐城大数据研究院有限公司 一种车牌定位方法
CN106780316A (zh) * 2017-01-25 2017-05-31 宇龙计算机通信科技(深圳)有限公司 一种图像裁剪方法、图像裁剪装置和移动终端
CN106803084A (zh) * 2017-03-02 2017-06-06 中科视拓(北京)科技有限公司 一种基于端到端循环网络的面部特征点定位方法
CN106951867A (zh) * 2017-03-22 2017-07-14 成都擎天树科技有限公司 基于卷积神经网络的人脸识别方法、装置、系统及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
证件照的质量预检测系统;樊田田;《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》;20151215;参见第1.3节、7.1节 *

Also Published As

Publication number Publication date
CN111612834A (zh) 2020-09-01
CN107578439A (zh) 2018-01-12
CN111612834B (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
CN107578439B (zh) 生成目标图像的方法、装置及设备
CN111737522B (zh) 视频匹配方法、基于区块链的侵权存证方法和装置
CN108875731B (zh) 目标识别方法、装置、系统及存储介质
US11699283B2 (en) System and method for finding and classifying lines in an image with a vision system
CN111950318A (zh) 一种二维码图像的识别方法、设备及存储介质
CN108875492B (zh) 人脸检测及关键点定位方法、装置、系统和存储介质
CN111160140B (zh) 一种图像检测方法及装置
CN112561850B (zh) 一种汽车涂胶检测方法、设备及存储介质
CN111754546A (zh) 一种基于多特征图融合的目标跟踪方法、系统及存储介质
CN112200851B (zh) 一种基于点云的目标检测方法、装置及其电子设备
CN113160161A (zh) 目标边缘处缺陷的检测方法和装置
CN109903246B (zh) 检测图像变化的方法及装置
CN113466839B (zh) 侧扫声呐海底线检测方法和装置
CN111967365A (zh) 影像连接点的提取方法和装置
CN115205224B (zh) 自适应特征增强的多源融合视觉检测方法、装置及介质
CN116071804A (zh) 人脸识别的方法、装置和电子设备
CN114065868B (zh) 文本检测模型的训练方法、文本检测方法及装置
CN113569873B (zh) 一种图像的处理方法、装置及设备
CN114998755A (zh) 在遥感图像中地标匹配的方法及装置
CN110717969B (zh) 一种阴影生成方法和装置
CN108268815B (zh) 图像场景理解的方法及装置
Correa-Tome et al. Fast similarity metric for real-time template-matching applications
CN117191805B (zh) 一种aoi检测头自动调焦方法和系统
CN117975044B (zh) 基于特征空间的图像处理方法及装置
CN117708784A (zh) 一种身份核验方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1248384

Country of ref document: HK

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20191209

Address after: P.O. Box 31119, grand exhibition hall, hibiscus street, 802 West Bay Road, Grand Cayman, Cayman Islands

Applicant after: Innovative advanced technology Co., Ltd

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Co., Ltd.

GR01 Patent grant
GR01 Patent grant