CN112669412A - 证件图片生成方法、装置、设备及存储介质 - Google Patents

证件图片生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112669412A
CN112669412A CN202011538787.9A CN202011538787A CN112669412A CN 112669412 A CN112669412 A CN 112669412A CN 202011538787 A CN202011538787 A CN 202011538787A CN 112669412 A CN112669412 A CN 112669412A
Authority
CN
China
Prior art keywords
certificate
picture
sample
data
generate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011538787.9A
Other languages
English (en)
Inventor
蔡壮壮
徐国强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN202011538787.9A priority Critical patent/CN112669412A/zh
Publication of CN112669412A publication Critical patent/CN112669412A/zh
Priority to PCT/CN2021/126108 priority patent/WO2022134831A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明涉及人工智能领域,公开了证件图片生成方法、装置、设备及存储介质,用于提高生成符合真实场景证件图片的准确率。证件图片生成方法包括:获取样本证件图片,样本证件图片包括样本文字数据和样本背景数据;采用图片相似度比对算法,基于样本证件图片生成证件背景数据和证件文字数据,证件文字数据包括文字语言数据和字体样式数据;将证件文字数据写入证件背景数据的随机位置中,生成初始证件图片;对初始证件图片进行预处理,生成多个预处理后的证件图片;采用预置的随机缩放函数分别对多个预处理后的证件图片进行多次随机缩放,生成多个目标证件图片组。此外,本发明还涉及区块链技术,样本证件图片可存储于区块链中。

Description

证件图片生成方法、装置、设备及存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种证件图片生成方法、装置、设备及存储介质。
背景技术
随着社会的发展,各个行业都涉及到证件图片,证件可以为身份证件图片、会员卡证件图片、工作证件图片和学生证件图片等。因此很多应用场景会用到模型识别证件图片。
在现有技术中,各类证件的检测识别算法越来越多,通常采用大量的证件图片来训练证件检测模型,进行证件识别,由于证件检测模型需要用到的训练数据,即证件图片具有较高的隐私性和较高安全性,获取的过程较为困难,因此采用造数的方式来生成证件图片。但是在生成证件图片时,无法满足多种语言和多种证件的生成需求,导致生成符合真实场景证件图片的准确率较低。
发明内容
本发明提供了一种证件图片生成方法、装置、设备及存储介质,用于提高生成符合真实场景证件图片的准确率。
本发明第一方面提供了一种证件图片生成方法,包括:获取样本证件图片,所述样本证件图片包括样本文字数据和样本背景数据;采用图片相似度比对算法,基于所述样本证件图片生成证件背景数据和证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据;将所述证件文字数据写入所述证件背景数据的随机位置中,生成初始证件图片;对所述初始证件图片进行预处理,生成多个预处理后的证件图片;采用预置的随机缩放函数分别对所述多个预处理后的证件图片进行多次随机缩放,生成多个目标证件图片组,所述多个预处理后的证件图片与所述多个目标证件图片组一一对应。
可选的,在本发明第一方面的第一种实现方式中,所述采用图片相似度比对算法,基于所述样本证件图片生成证件背景数据和证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据包括:从所述样本证件图片中提取样本文字数据和样本背景数据;采用图片相似度比对算法,在数据库中确定与所述样本背景数据相匹配的证件背景数据;对所述样本文字数据进行特征提取,生成样本文字向量;采用预置的线性回归模型对所述样本文字向量进行识别,确定证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据。
可选的,在本发明第一方面的第二种实现方式中,所述采用图片相似度比对算法,在数据库中确定与所述样本背景数据相匹配的证件背景数据包括:从所述样本背景数据中提取样本像素点、样本重心、样本投影和样本分块;基于所述样本像素点在数据库中确定多个像素点相似背景数据;基于所述样本重心在所述多个像素点相似背景数据中确定多个样本重心相似背景数据;基于所述样本投影在所述多个样本重心相似背景数据中确定多个样本投影相似背景数据;基于样本分块在所述多个样本投影相似背景数据中确定证件背景数据。
可选的,在本发明第一方面的第三种实现方式中,所述将所述证件文字数据写入所述证件背景数据的随机位置中,生成初始证件图片包括:采用预置的随机函数,在所述证件背景数据的中确定所述证件文字数据的坐标位置,生成文字坐标位置;在所述证件背景数据中截取所述文字坐标位置对应的证件背景数据,生成截取后的证件背景数据;将所述证件文字数据合并至所述截取后的证件背景数据中,生成初始证件图片。
可选的,在本发明第一方面的第四种实现方式中,所述对所述初始证件图片进行预处理,生成多个预处理后的证件图片包括:对所述初始证件图片进行图像增强,生成图像增强后的证件图片;对所述图像增强后的证件图片进行数据增强,生成数据增强后的证件图片;对所述数据增强后的证件图片进行随机变换,生成多个预处理后的证件图片。
可选的,在本发明第一方面的第五种实现方式中,所述对所述初始证件图片进行图像增强,生成图像增强后的证件图片包括:对所述初始证件图片进行亮度调整、色度调整和锐度调整,生成初次图像增强后的证件图片;对所述初次图像增强后的证件图片进行高斯模糊、高斯噪声处理和分辨率随机调整,生成图像增强后的证件图片。
可选的,在本发明第一方面的第六种实现方式中,所述对所述数据增强后的证件图片进行随机变换,生成多个预处理后的证件图片包括:对所述数据增强后的证件图片进行随机旋转,生成多个旋转后的证件图片;对所述多个旋转后的证件图片进行仿射变换,生成多个仿射变换后的证件图片;对所述多个仿射变换后的证件图片进行透视变换,生成多个预处理后的证件图片。
本发明第二方面提供了一种证件图片生成装置,包括:获取模块,用于获取样本证件图片,所述样本证件图片包括样本文字数据和样本背景数据;数据生成模块,用于采用图片相似度比对算法,基于所述样本证件图片生成证件背景数据和证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据;写入模块,用于将所述证件文字数据写入所述证件背景数据的随机位置中,生成初始证件图片;预处理模块,用于对所述初始证件图片进行预处理,生成多个预处理后的证件图片;随机缩放模块,用于采用预置的随机缩放函数分别对所述多个预处理后的证件图片进行多次随机缩放,生成多个目标证件图片组,所述多个预处理后的证件图片与所述多个目标证件图片组一一对应。
可选的,在本发明第二方面的第一种实现方式中,所述数据生成模块包括:提取单元,用于从所述样本证件图片中提取样本文字数据和样本背景数据;背景数据确定单元,用于采用图片相似度比对算法,在数据库中确定与所述样本背景数据相匹配的证件背景数据;特征提取单元,用于对所述样本文字数据进行特征提取,生成样本文字向量;识别单元,用于采用预置的线性回归模型对所述样本文字向量进行识别,确定证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据。
可选的,在本发明第二方面的第二种实现方式中,所述背景数据确定单元还可以具体用于:从所述样本背景数据中提取样本像素点、样本重心、样本投影和样本分块;基于所述样本像素点在数据库中确定多个像素点相似背景数据;基于所述样本重心在所述多个像素点相似背景数据中确定多个样本重心相似背景数据;基于所述样本投影在所述多个样本重心相似背景数据中确定多个样本投影相似背景数据;基于样本分块在所述多个样本投影相似背景数据中确定证件背景数据。
可选的,在本发明第二方面的第三种实现方式中,所述写入模块还可以具体用于:采用预置的随机函数,在所述证件背景数据的中确定所述证件文字数据的坐标位置,生成文字坐标位置;在所述证件背景数据中截取所述文字坐标位置对应的证件背景数据,生成截取后的证件背景数据;将所述证件文字数据合并至所述截取后的证件背景数据中,生成初始证件图片。
可选的,在本发明第二方面的第四种实现方式中,所述预处理模块包括:图像增强单元,用于对所述初始证件图片进行图像增强,生成图像增强后的证件图片;数据增强单元,用于对所述图像增强后的证件图片进行数据增强,生成数据增强后的证件图片;随机变换单元,用于对所述数据增强后的证件图片进行随机变换,生成多个预处理后的证件图片。
可选的,在本发明第二方面的第五种实现方式中,所述图像增强单元还可以具体用于:对所述初始证件图片进行亮度调整、色度调整和锐度调整,生成初次图像增强后的证件图片;对所述初次图像增强后的证件图片进行高斯模糊、高斯噪声处理和分辨率随机调整,生成图像增强后的证件图片。
可选的,在本发明第二方面的第六种实现方式中,随机变换单元还可以具体用于:对所述数据增强后的证件图片进行随机旋转,生成多个旋转后的证件图片;对所述多个旋转后的证件图片进行仿射变换,生成多个仿射变换后的证件图片;对所述多个仿射变换后的证件图片进行透视变换,生成多个预处理后的证件图片。
本发明第三方面提供了一种证件图片生成设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述证件图片生成设备执行上述的证件图片生成方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的证件图片生成方法。
本发明提供的技术方案中,获取样本证件图片,所述样本证件图片包括样本文字数据和样本背景数据;采用图片相似度比对算法,基于所述样本证件图片生成证件背景数据和证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据;将所述证件文字数据写入所述证件背景数据的随机位置中,生成初始证件图片;对所述初始证件图片进行预处理,生成多个预处理后的证件图片;采用预置的随机缩放函数分别对所述多个预处理后的证件图片进行多次随机缩放,生成多个目标证件图片组,所述多个预处理后的证件图片与所述多个目标证件图片组一一对应。本发明实施例中,采用图片相似度比对算法基于证件图片确定证件背景数据和证件文字数据,并将证件文字数据随机写入证件背景数据,生成初始证件图片,然后对初始证件图片进行预处理和随机缩放,生成多个目标证件图片组,解决了无法满足多种语言和多种证件的生成需求问题,也提高了生成符合真实场景证件图片的准确率。
附图说明
图1为本发明实施例中证件图片生成方法的一个实施例示意图;
图2为本发明实施例中证件图片生成方法的另一个实施例示意图;
图3为本发明实施例中证件图片生成装置的一个实施例示意图;
图4为本发明实施例中证件图片生成装置的另一个实施例示意图;
图5为本发明实施例中证件图片生成设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种证件图片生成方法、装置、设备及存储介质,用于提高生成符合真实场景证件图片的准确率。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中证件图片生成方法的一个实施例包括:
101、获取样本证件图片,样本证件图片包括样本文字数据和样本背景数据;
服务器获取包括样本文字数据和样本背景数据的样本证件图片,需要强调的是,为进一步保证上述样本证件图片的私密和安全性,上述样本证件图片还可以存储于一区块链的节点中。
样本证件图片可以为会员卡证件图片、身份证件图片、工作证件图片和学生证件图片等。不同证件图片的样本文字数据和样本背景数据不同,其中,样本文字数据包括样本文字语言和样本字体样式,样本文字语言指的是文字语言类型,该文字语言类型可以为中文类型、英文类型和法语类型等,样本字体样式包括宋体样式、楷体样式以及黑体样式等,样本背景数据包括线条数据、颜色数据等。
可以理解的是,本发明的执行主体可以为证件图片生成装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
102、采用图片相似度比对算法,基于样本证件图片生成证件背景数据和证件文字数据,证件文字数据包括文字语言数据和字体样式数据;
服务器基于样本证件图片生成证件背景数据和包括文字语言数据和字体样式数据的证件文本数据。不同样本证件图片的样本背景数据不同,服务器需要确定与样本背景数据相匹配的背景数据作为证件背景数据;不同民族证件或者不同国家证件的样本文字语言和样本字体样式不同,服务器参考样本文字语言确定文字语言数据,并参考样本字体样式确定字体样式数据。
例如,样本证件图片的样本背景数据为建筑物A1的图像数据、样本文字语言为中文以及样本字体样式为宋体,服务器则基于样本背景数据“建筑物A1的图像数据”确定证件背景数据A2,基于样本文字语言中文确定文字语言数据,最后基于样本字体样式确定字体样式数据A3,其中证件背景数据A2和字体样式数据A3组成证件文字数据。
103、将证件文字数据写入证件背景数据的随机位置中,生成初始证件图片;
服务器将证件文字数据写入证件背景数据的随机位置中,生成初始证件图片。
证件文字数据为有长度的文字数据,服务器将有长度的文本数据写入证件背景数据的随机位置中,生成初始证件图片,该位置的长度与证件文本数据的长度一致。
104、对初始证件图片进行预处理,生成多个预处理后的证件图片;
服务器对初始证件图片进行图像增强和数据增强等预处理,从而生成多个预处理后的证件图片。
在真实场景中,证件的表面存在各种各样的模糊问题、损坏和污渍问题以及拍摄角度倾斜问题,当得到初始证件图片时,服务器需要将初始证件图片进行图像增强、数据增强和随机变换,即预处理,从而生成与真实场景中的图片相似的图片,即预处理后的证件图片。
105、采用预置的随机缩放函数分别对多个预处理后的证件图片进行多次随机缩放,生成多个目标证件图片组,多个预处理后的证件图片与多个目标证件图片组一一对应。
服务器采用随机缩放函数将每个预处理后的证件图片随机缩放为包括多个目标证件图片的目标证件图片组,从而得到多个目标证件图片组。
服务器在对初始证件图片进行预处理之后,采用预置的随机缩放函数resize分别对多个预处理后的证件图片进行随机缩放,在本实施例中,缩小指的是对预处理后的证件图片的分辨率随机缩小1-3倍,放大指的是对预处理后的证件图片的分辨率随机放大1-3倍,基于每个预处理后的证件图片生成一个目标证件图片组,从而得到多个目标证件图片组。
本发明实施例中,采用图片相似度比对算法基于证件图片确定证件背景数据和证件文字数据,并将证件文字数据随机写入证件背景数据,生成初始证件图片,然后对初始证件图片进行预处理和随机缩放,生成多个目标证件图片组,解决了无法满足多种语言和多种证件的生成需求问题,也提高了生成符合真实场景证件图片的准确率。
请参阅图2,本发明实施例中证件图片生成方法的另一个实施例包括:
201、获取样本证件图片,样本证件图片包括样本文字数据和样本背景数据;
服务器获取包括样本文字数据和样本背景数据的样本证件图片,需要强调的是,为进一步保证上述样本证件图片的私密和安全性,上述样本证件图片还可以存储于一区块链的节点中。
样本证件图片可以为会员卡证件图片、身份证件图片、工作证件图片和学生证件图片等。不同证件图片的样本文字数据和样本背景数据不同,其中,样本文字数据包括样本文字语言和样本字体样式,样本文字语言指的是文字语言类型,该文字语言类型可以为中文类型、英文类型和法语类型等,样本字体样式包括宋体样式、楷体样式以及黑体样式等,样本背景数据包括线条数据、颜色数据等。
202、采用图片相似度比对算法,基于样本证件图片生成证件背景数据和证件文字数据,证件文字数据包括文字语言数据和字体样式数据;
服务器基于样本证件图片生成证件背景数据和包括文字语言数据和字体样式数据的证件文本数据。不同样本证件图片的样本背景数据不同,服务器需要确定与样本背景数据相匹配的背景数据作为证件背景数据;不同民族证件或者不同国家证件的样本文字语言和样本字体样式不同,服务器参考样本文字语言确定文字语言数据,并参考样本字体样式确定字体样式数据。
例如,样本证件图片的样本背景数据为建筑物A1的图像数据、样本文字语言为中文以及样本字体样式为宋体,服务器则基于样本背景数据“建筑物A1的图像数据”确定证件背景数据A2,基于样本文字语言中文确定文字语言数据,最后基于样本字体样式确定字体样式数据A3,其中证件背景数据A2和字体样式数据A3组成证件文字数据。
具体的,服务器从样本证件图片中提取样本文字数据和样本背景数据;样本背景数据为图片数据,在服务器中,图片数据的存储形式为矩阵,服务器采用图片相似度对比算法基于为矩阵的样本背景数据在数据库中确定相匹配的证件背景数据;然后服务器从样本文字数据中提取特征向量,生成样本文字向量,最后采用Logistic回归模型,即线性回归模型进行样本文字数据的识别,将样本文字向量输入Logistic回归模型中,首先生成目标样本文字语言和目标样本字体样式,然后服务器结合数据库在Logistic回归模型基于目标样本文字语言和目标样本字体确定文字语言数据和字体样式数据,即证件文字数据。
服务器采用图片相似度对比算法基于为矩阵的样本背景数据在数据库中确定相匹配的证件背景数据包括:
服务器从样本背景数据中提取样本像素点、样本重心、样本投影和样本分块;服务器基于样本像素点在数据库中确定多个像素点相似背景数据;服务器基于样本重心在多个像素点相似背景数据中确定多个样本重心相似背景数据;服务器基于样本投影在多个样本重心相似背景数据中确定多个样本投影相似背景数据;服务器基于样本分块在多个样本投影相似背景数据中确定证件背景数据。
需要说明的是,服务器在计算两张图片的相似度时,主要对像素点、重心、投影和分块进行对比,从而生成相似度。样本背景数据以矩阵的形式存在,该矩阵中的元素是由RGB三个参数构成的颜色值,这三个参数的取值范围为0~255,服务器首先将样本背景数据进行二值化,即二值化后的样本背景数据的三个参数为0或者255,其中参数0表示黑色像素,参数1表示白色像素,在二进制中,采用“1”来表示黑色像素,采用“0”表示白色像素,此时二值化后的样本背景数据的矩阵是由0和1组成的像素点矩阵。
服务器首先将数据库中的多个图片分别与二值化后的样本背景数据进行像素点对比,将数据库中像素点相似度高于像素点相似度阈值的图片数据确定为像素点相似背景数据,从而得到多个像素点相似背景数据;然后服务器将多个像素点相似背景数据与二值化后的样本背景数据进行重心对比,其中,重心为黑色像素点集中的区域,服务器分别计算二值化后的样本背景数据的多个黑色像素点的横坐标和纵坐标的和,并分别除以黑色像素点的个数,得到平均横坐标、平均纵坐标,采用平均横坐标除以横坐标的总长度、采用平均纵坐标处理纵坐标的总长度,得到样本重心,将多个像素点相似背景数据的中心与样本中心进行比对,得到重心相似度,并将大于重心相似度阈值的像素点相似背景数据确定为样本重心相似背景数据,得到多个样本重心相似背景数据;投影比对首先统计二值化后的样本背景数据中的黑色行像素点数量和黑色列像素点数量,生成对应的样本背景数据特征向量,然后分别计算样本重心相似背景数据的背景数据特征向量,并分别基于多个背景数据特征向量和样本背景数据特征向量计算欧式距离,将欧式距离大于距离阈值的样本重心相似背景数据确定为样本投影相似背景数据,生成多个样本投影相似背景数据;最后将二值化后的样本背景数据和多个样本投影相似背景数据分别划分为多个区块进行相似度比对,将相似度最大的样本投影相似背景数据确定为证件背景数据。
203、将证件文字数据写入证件背景数据的随机位置中,生成初始证件图片;
服务器将证件文字数据写入证件背景数据的随机位置中,生成初始证件图片。
证件文字数据为有长度的文字数据,服务器将有长度的文本数据写入证件背景数据的随机位置中,生成初始证件图片,该位置的长度与证件文本数据的长度一致。
具体的,服务器采用预置的随机函数,确定证件文字数据需要写入的坐标位置,得到文字坐标位置;然后服务器在证件背景数据中截取文字坐标位置对应的背景数据,得到截取后的证件背景数据,此时,证件文字数据的长度与对应的背景数据长度一致,直接将该证件文字数据合并至截取后的证件背景数据中,生成初始证件图片。
204、对初始证件图片进行图像增强,生成图像增强后的证件图片;
服务器对初始证件图片进行图像增强,本实施例中的图像增强并非使图片更加清晰,而是将初始证件图片进行模糊化,生成图片增强后的证件图片,从而提高图片增强后的证件图片与真实场景中的相似度。
具体的,服务器对初始证件图片进行亮度调整、色度调整和锐度调整,生成初次图像增强后的证件图片,以亮度调整进行说明,将初始证件图片的亮度调低或者调高,然后对色度和锐度分别调整之后,生成初次图像增强后的证件图片;对初次图像增强后的证件图片进行高斯模糊、高斯噪声处理和分辨率随机调整,生成图像增前后的证件图片。
205、对图像增强后的证件图片进行数据增强,生成数据增强后的证件图片;
服务器对图像增强后的证件图片进行数据增强,从而生成数据增强后的证件图片。其中数据增强处理包括在图像增强后的证件图片上添加光点、白带、折线、黑点、阴影、雨点以及调整颜色通道等,通过这些处理以提高图像增强后的证件图片的丰富性以及生成更加符合真实场景的图片。
206对数据增强后的证件图片进行随机变换,生成多个预处理后的证件图片;
服务器对数据增强后的证件图片进行随机变换,将一张数据增强后的证件图片随机变换为多张预处理后的证件图片,从而生成多个预处理后的证件图片。
具体的,服务器对数据增强后的证件图片进行多个随机旋转,每一次随机旋转都生成一个旋转后的证件图片,从而得到多个旋转后的证件图片;然后服务器对每个旋转后的证件图片进行仿射变换,即在向量空间进行线性变换和平移,生成另一个向量空间,从而生成多个放射变换后的证件图片;最后服务器对每个放射变换后的证件图片进行透视变换,采用透视变换便于识别字体倾斜的文字,从而生成多个预处理后的证件图片。
207、采用预置的随机缩放函数分别对多个预处理后的证件图片进行多次随机缩放,生成多个目标证件图片组,多个预处理后的证件图片与多个目标证件图片组一一对应。
服务器采用随机缩放函数将每个预处理后的证件图片随机缩放为包括多个目标证件图片的目标证件图片组,从而得到多个目标证件图片组。
服务器在对初始证件图片进行预处理之后,采用预置的随机缩放函数resize分别对多个预处理后的证件图片进行随机缩放,在本实施例中,缩小指的是对预处理后的证件图片的分辨率随机缩小1-3倍,放大指的是对预处理后的证件图片的分辨率随机放大1-3倍,基于每个预处理后的证件图片生成一个目标证件图片组,从而得到多个目标证件图片组。
本发明实施例中,采用图片相似度比对算法基于证件图片确定证件背景数据和证件文字数据,并将证件文字数据随机写入证件背景数据,生成初始证件图片,然后对初始证件图片进行预处理和随机缩放,生成多个目标证件图片组,解决了无法满足多种语言和多种证件的生成需求问题,也提高了生成符合真实场景证件图片的准确率。
上面对本发明实施例中证件图片生成方法进行了描述,下面对本发明实施例中证件图片生成装置进行描述,请参阅图3,本发明实施例中证件图片生成装置一个实施例包括:
获取模块301,用于获取样本证件图片,所述样本证件图片包括样本文字数据和样本背景数据;
数据生成模块302,用于采用图片相似度比对算法,基于所述样本证件图片生成证件背景数据和证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据;
写入模块303,用于将所述证件文字数据写入所述证件背景数据的随机位置中,生成初始证件图片;
预处理模块304,用于对所述初始证件图片进行预处理,生成多个预处理后的证件图片;
随机缩放模块305,用于采用预置的随机缩放函数分别对所述多个预处理后的证件图片进行多次随机缩放,生成多个目标证件图片组,所述多个预处理后的证件图片与所述多个目标证件图片组一一对应。
本发明实施例中,采用图片相似度比对算法基于证件图片确定证件背景数据和证件文字数据,并将证件文字数据随机写入证件背景数据,生成初始证件图片,然后对初始证件图片进行预处理和随机缩放,生成多个目标证件图片组,解决了无法满足多种语言和多种证件的生成需求问题,也提高了生成符合真实场景证件图片的准确率。
请参阅图4,本发明实施例中证件图片生成装置的另一个实施例包括:
获取模块301,用于获取样本证件图片,所述样本证件图片包括样本文字数据和样本背景数据;
数据生成模块302,用于采用图片相似度比对算法,基于所述样本证件图片生成证件背景数据和证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据;
写入模块303,用于将所述证件文字数据写入所述证件背景数据的随机位置中,生成初始证件图片;
预处理模块304,用于对所述初始证件图片进行预处理,生成多个预处理后的证件图片;
随机缩放模块305,用于采用预置的随机缩放函数分别对所述多个预处理后的证件图片进行多次随机缩放,生成多个目标证件图片组,所述多个预处理后的证件图片与所述多个目标证件图片组一一对应。
可选的,数据生成模块302包括:
提取单元3021,用于从所述样本证件图片中提取样本文字数据和样本背景数据;
背景数据确定单元3022,用于采用图片相似度比对算法,在数据库中确定与所述样本背景数据相匹配的证件背景数据;
特征提取单元3023,用于对所述样本文字数据进行特征提取,生成样本文字向量;
识别单元3024,用于采用预置的线性回归模型对所述样本文字向量进行识别,确定证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据。
可选的,背景数据确定单元3022还可以具体用于:
从所述样本背景数据中提取样本像素点、样本重心、样本投影和样本分块;
基于所述样本像素点在数据库中确定多个像素点相似背景数据;
基于所述样本重心在所述多个像素点相似背景数据中确定多个样本重心相似背景数据;
基于所述样本投影在所述多个样本重心相似背景数据中确定多个样本投影相似背景数据;
基于样本分块在所述多个样本投影相似背景数据中确定证件背景数据。
可选的,写入模块303还可以具体用于:
采用预置的随机函数,在所述证件背景数据的中确定所述证件文字数据的坐标位置,生成文字坐标位置;
在所述证件背景数据中截取所述文字坐标位置对应的证件背景数据,生成截取后的证件背景数据;
将所述证件文字数据合并至所述截取后的证件背景数据中,生成初始证件图片。
可选的,预处理模块304包括:
图像增强单元3041,用于对所述初始证件图片进行图像增强,生成图像增强后的证件图片;
数据增强单元3042,用于对所述图像增强后的证件图片进行数据增强,生成数据增强后的证件图片;
随机变换单元3043,用于对所述数据增强后的证件图片进行随机变换,生成多个预处理后的证件图片。
可选的,图像增强单元3041还可以具体用于:
对所述初始证件图片进行亮度调整、色度调整和锐度调整,生成初次图像增强后的证件图片;
对所述初次图像增强后的证件图片进行高斯模糊、高斯噪声处理和分辨率随机调整,生成图像增强后的证件图片。
可选的,随机变换单元3043还可以具体用于:
对所述数据增强后的证件图片进行随机旋转,生成多个旋转后的证件图片;
对所述多个旋转后的证件图片进行仿射变换,生成多个仿射变换后的证件图片;
对所述多个仿射变换后的证件图片进行透视变换,生成多个预处理后的证件图片。
本发明实施例中,采用图片相似度比对算法基于证件图片确定证件背景数据和证件文字数据,并将证件文字数据随机写入证件背景数据,生成初始证件图片,然后对初始证件图片进行预处理和随机缩放,生成多个目标证件图片组,解决了无法满足多种语言和多种证件的生成需求问题,也提高了生成符合真实场景证件图片的准确率。
上面图3和图4从模块化功能实体的角度对本发明实施例中的证件图片生成装置进行详细描述,下面从硬件处理的角度对本发明实施例中证件图片生成设备进行详细描述。
图5是本发明实施例提供的一种证件图片生成设备的结构示意图,该证件图片生成设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对证件图片生成设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在证件图片生成设备500上执行存储介质530中的一系列指令操作。
证件图片生成设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的证件图片生成设备结构并不构成对证件图片生成设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种证件图片生成设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述证件图片生成方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述证件图片生成方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种证件图片生成方法,其特征在于,所述证件图片生成方法包括:
获取样本证件图片,所述样本证件图片包括样本文字数据和样本背景数据;
采用图片相似度比对算法,基于所述样本证件图片生成证件背景数据和证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据;
将所述证件文字数据写入所述证件背景数据的随机位置中,生成初始证件图片;
对所述初始证件图片进行预处理,生成多个预处理后的证件图片;
采用预置的随机缩放函数分别对所述多个预处理后的证件图片进行多次随机缩放,生成多个目标证件图片组,所述多个预处理后的证件图片与所述多个目标证件图片组一一对应。
2.根据权利要求1所述的证件图片生成方法,其特征在于,所述采用图片相似度比对算法,基于所述样本证件图片生成证件背景数据和证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据包括:
从所述样本证件图片中提取样本文字数据和样本背景数据;
采用图片相似度比对算法,在数据库中确定与所述样本背景数据相匹配的证件背景数据;
对所述样本文字数据进行特征提取,生成样本文字向量;
采用预置的线性回归模型对所述样本文字向量进行识别,确定证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据。
3.根据权利要求2所述的证件图片生成方法,其特征在于,所述采用图片相似度比对算法,在数据库中确定与所述样本背景数据相匹配的证件背景数据包括:
从所述样本背景数据中提取样本像素点、样本重心、样本投影和样本分块;
基于所述样本像素点在数据库中确定多个像素点相似背景数据;
基于所述样本重心在所述多个像素点相似背景数据中确定多个样本重心相似背景数据;
基于所述样本投影在所述多个样本重心相似背景数据中确定多个样本投影相似背景数据;
基于样本分块在所述多个样本投影相似背景数据中确定证件背景数据。
4.根据权利要求1所述的证件图片生成方法,其特征在于,所述将所述证件文字数据写入所述证件背景数据的随机位置中,生成初始证件图片包括:
采用预置的随机函数,在所述证件背景数据的中确定所述证件文字数据的坐标位置,生成文字坐标位置;
在所述证件背景数据中截取所述文字坐标位置对应的证件背景数据,生成截取后的证件背景数据;
将所述证件文字数据合并至所述截取后的证件背景数据中,生成初始证件图片。
5.根据权利要求1所述的证件图片生成方法,其特征在于,所述对所述初始证件图片进行预处理,生成多个预处理后的证件图片包括:
对所述初始证件图片进行图像增强,生成图像增强后的证件图片;
对所述图像增强后的证件图片进行数据增强,生成数据增强后的证件图片;
对所述数据增强后的证件图片进行随机变换,生成多个预处理后的证件图片。
6.根据权利要求5所述的证件图片生成方法,其特征在于,所述对所述初始证件图片进行图像增强,生成图像增强后的证件图片包括:
对所述初始证件图片进行亮度调整、色度调整和锐度调整,生成初次图像增强后的证件图片;
对所述初次图像增强后的证件图片进行高斯模糊、高斯噪声处理和分辨率随机调整,生成图像增强后的证件图片。
7.根据权利要求5所述的证件图片生成方法,其特征在于,所述对所述数据增强后的证件图片进行随机变换,生成多个预处理后的证件图片包括:
对所述数据增强后的证件图片进行随机旋转,生成多个旋转后的证件图片;
对所述多个旋转后的证件图片进行仿射变换,生成多个仿射变换后的证件图片;
对所述多个仿射变换后的证件图片进行透视变换,生成多个预处理后的证件图片。
8.一种证件图片生成装置,其特征在于,所述证件图片生成装置包括:
获取模块,用于获取样本证件图片,所述样本证件图片包括样本文字数据和样本背景数据;
数据生成模块,用于采用图片相似度比对算法,基于所述样本证件图片生成证件背景数据和证件文字数据,所述证件文字数据包括文字语言数据和字体样式数据;
写入模块,用于将所述证件文字数据写入所述证件背景数据的随机位置中,生成初始证件图片;
预处理模块,用于对所述初始证件图片进行预处理,生成多个预处理后的证件图片;
随机缩放模块,用于采用预置的随机缩放函数分别对所述多个预处理后的证件图片进行多次随机缩放,生成多个目标证件图片组,所述多个预处理后的证件图片与所述多个目标证件图片组一一对应。
9.一种证件图片生成设备,其特征在于,所述证件图片生成设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述证件图片生成设备执行如权利要求1-7中任意一项所述的证件图片生成方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述证件图片生成方法。
CN202011538787.9A 2020-12-23 2020-12-23 证件图片生成方法、装置、设备及存储介质 Pending CN112669412A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011538787.9A CN112669412A (zh) 2020-12-23 2020-12-23 证件图片生成方法、装置、设备及存储介质
PCT/CN2021/126108 WO2022134831A1 (zh) 2020-12-23 2021-10-25 证件图片生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011538787.9A CN112669412A (zh) 2020-12-23 2020-12-23 证件图片生成方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112669412A true CN112669412A (zh) 2021-04-16

Family

ID=75408691

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011538787.9A Pending CN112669412A (zh) 2020-12-23 2020-12-23 证件图片生成方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN112669412A (zh)
WO (1) WO2022134831A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114463821A (zh) * 2022-02-15 2022-05-10 平安科技(深圳)有限公司 证件数据生成方法、装置、计算机设备及存储介质
WO2022134831A1 (zh) * 2020-12-23 2022-06-30 深圳壹账通智能科技有限公司 证件图片生成方法、装置、设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115410191B (zh) * 2022-11-03 2023-02-03 平安银行股份有限公司 文本图像识别方法、装置、设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729847B (zh) * 2017-10-20 2020-08-04 阿里巴巴集团控股有限公司 一种证件验证、身份验证方法和装置
CN110059689B (zh) * 2019-03-19 2024-05-03 平安科技(深圳)有限公司 样本集构建方法、装置、计算机设备和存储介质
CN111222517A (zh) * 2020-01-16 2020-06-02 深圳壹账通智能科技有限公司 测试样本生成方法、系统、计算机设备及存储介质
CN111310634B (zh) * 2020-02-10 2024-03-15 支付宝实验室(新加坡)有限公司 证件类型识别模板的生成方法、证件识别方法及装置
CN112669412A (zh) * 2020-12-23 2021-04-16 深圳壹账通智能科技有限公司 证件图片生成方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022134831A1 (zh) * 2020-12-23 2022-06-30 深圳壹账通智能科技有限公司 证件图片生成方法、装置、设备及存储介质
CN114463821A (zh) * 2022-02-15 2022-05-10 平安科技(深圳)有限公司 证件数据生成方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
WO2022134831A1 (zh) 2022-06-30

Similar Documents

Publication Publication Date Title
CN112669412A (zh) 证件图片生成方法、装置、设备及存储介质
US20160026861A1 (en) Methods and apparatus for capturing, processing, training, and detecting patterns using pattern recognition classifiers
US20170243097A1 (en) Method and apparatus for decoding or generating multi-layer color or code, method for recommending setting parameters in generation of multi-layer or code, and product comprising multi-layer color or code
US8532344B2 (en) Methods and apparatus for generation of cancelable face template
CN106447592B (zh) 每个特征描述符的在线个性化服务
KR20100134079A (ko) 이미지 내의 자동 얼굴 검출 및 식별 마스킹, 및 그 응용
EP4085369A1 (en) Forgery detection of face image
EP3642756B1 (en) Detecting artificial facial images using facial landmarks
CN111079571A (zh) 证卡信息识别及其边缘检测模型训练方法、装置
CN112102402B (zh) 闪光灯光斑位置识别方法、装置、电子设备及存储介质
CN110852311A (zh) 一种三维人手关键点定位方法及装置
CN112541443B (zh) 发票信息抽取方法、装置、计算机设备及存储介质
CN110717497A (zh) 图像相似度匹配方法、装置及计算机可读存储介质
Barni et al. Iris deidentification with high visual realism for privacy protection on websites and social networks
CN112232336A (zh) 一种证件识别方法、装置、设备及存储介质
CN111507165A (zh) 人脸识别方法、装置、电子设备及计算机可读存储介质
CN110059711A (zh) 图像的对齐方法、装置及设备
CN112581344A (zh) 一种图像处理方法、装置、计算机设备及存储介质
CN112580499A (zh) 文本识别方法、装置、设备及存储介质
CN115410191B (zh) 文本图像识别方法、装置、设备和存储介质
Emeršič et al. Towards accessories-aware ear recognition
Khuspe et al. Robust image forgery localization and recognition in copy-move using bag of features and SVM
CN113159037B (zh) 图片矫正方法、装置、计算机设备及存储介质
CN114241463A (zh) 签名验证方法、装置、计算机设备和存储介质
CN115526282A (zh) 水印加密方法、水印提取方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40050549

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination