CN112199976A - 证件图片生成方法及装置 - Google Patents
证件图片生成方法及装置 Download PDFInfo
- Publication number
- CN112199976A CN112199976A CN201910611720.4A CN201910611720A CN112199976A CN 112199976 A CN112199976 A CN 112199976A CN 201910611720 A CN201910611720 A CN 201910611720A CN 112199976 A CN112199976 A CN 112199976A
- Authority
- CN
- China
- Prior art keywords
- picture
- network model
- training
- certificate
- generator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 127
- 230000006870 function Effects 0.000 claims description 50
- 238000004891 communication Methods 0.000 claims description 15
- 125000004122 cyclic group Chemical group 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000001815 facial effect Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种证件图片生成方法及装置,其中,方法包括:采集人脸图片和证件图片作为样本数据以获取用于训练的训练样本;创建循环生成对抗网络模型,并利用训练样本对循环生成对抗网络模型进行训练;其中,循环生成对抗网络模型包括生成器网络模型和判别器网络模型;训练基于循环一致性损失函数和/或三元组损失函数训练调整循环生成对抗网络模型的训练参数;利用训练后的循环生成对抗网络模型中的生成器网络模型将人脸图片生成证件图片。基于循环生成对抗网络模型可以降低对样本数据的采集要求,采集的样本数据中人脸图片和证件图片可以不一一对应,节省了采集所花费的人力、财力和时间成本。
Description
技术领域
本发明涉及计算机视觉技术领域,具体涉及一种证件图片生成方法及装置。
背景技术
随着深度学习方法的快速发展和广泛应用,人脸和其证件图片对比技术的识别准确率已经得到质的提升,达到了可实际应用的级别。越来越多的生活和工作场景开始采用智能化识别真实人脸的技术来验证一个人的身份。而在许多应用场景下,所识别的人脸都是来自于用户和其所持有的证件上的照片,通过识别真实人脸和证件上的人脸照片的相似度来验证用户的身份。其基于人脸匹配识别技术,需要通过深度学习提取人脸特征将两张人脸进行对比判断是否是同一个人,并给出相应的置信度评分,即身份相似度验证。而此技术需要取决于人脸匹配识别模型的性能,人脸匹配识别模型需要大量证件图片和人脸真实照片作为训练集才能够保证其检测和识别的准确性。但由于证件图片涉及个人相关信息以及个人隐私,能够获取的证件图片数量并不多,导致无法使用大规模的数据集进行模型训练。
为获取证件图片,一般采用以下方案:
1)使用证件图片合成技术,利用相关证件图片背景和真实证件的照片人脸尺寸来模拟生成证件风格人脸图片。
2)向某些专业的数据收集和处理公司提出人脸照片的规格和要求,付费购买相关的数据集的使用权和所有权。
上述传统证件图片的获取方案存在以下问题:
1)模拟生成的证件图片风格比较单一,而实际应用场景下的证件图片会有图片不够清晰,图片的噪点多,图片拍摄时的角度不统一,图片的大小和图片分辨率不同,图片拍照的光照条件不同等特征。模拟生成的证件图片无法模拟出风格多种多样、与实际证件图片相应的证件图片。
2)购买专业图片数据集的价格昂贵,会耗费大量时间和浪费人力。专业的数据收集和处理公司按照要求的规格去采集和处理证件图片数据需要耗费大量时间和人力资源。由于人脸数据和证件图片数据涉及个人隐私,采集的难度较大,耗费大量的时间。
综上所述,依靠现有的技术方案虽然可以获取大量的证件图片,但是获取到的证件图片的风格无法保证与真实证件图片的风格相近,且存在证件图片的数据采集和处理的难度大,耗费的时间周期长,成本高等诸多缺点。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的证件图片生成方法及装置。
根据本发明的一个方面,提供了一种证件图片生成方法,其包括:
采集人脸图片和证件图片作为样本数据以获取用于训练的训练样本;
创建循环生成对抗网络模型,并利用训练样本对循环生成对抗网络模型进行训练;其中,循环生成对抗网络模型包括生成器网络模型和判别器网络模型;训练基于循环一致性损失函数和/或三元组损失函数训练调整循环生成对抗网络模型的训练参数;
利用训练后的循环生成对抗网络模型中的生成器网络模型将人脸图片生成证件图片。
根据本发明的另一方面,提供了一种证件图片生成装置,其包括:
采集模块,适于采集人脸图片和证件图片作为样本数据以获取用于训练的训练样本;
训练模块,适于创建循环生成对抗网络模型,并利用训练样本对循环生成对抗网络模型进行训练;其中,循环生成对抗网络模型包括生成器网络模型和判别器网络模型;训练基于循环一致性损失函数和/或三元组损失函数训练调整循环生成对抗网络模型的训练参数;
生成模块,适于利用训练后的循环生成对抗网络模型中的生成器网络模型将人脸图片生成证件图片。
根据本发明的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述证件图片生成方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述证件图片生成方法对应的操作。
根据本发明的证件图片生成方法及装置,采集人脸图片和证件图片作为样本数据以获取用于训练的训练样本;创建循环生成对抗网络模型,并利用训练样本对循环生成对抗网络模型进行训练;其中,循环生成对抗网络模型包括生成器网络模型和判别器网络模型;训练基于循环一致性损失函数和/或三元组损失函数训练调整循环生成对抗网络模型的训练参数;利用训练后的循环生成对抗网络模型中的生成器网络模型将人脸图片生成证件图片。在对循环生成对抗网络模型进行训练时,利用循环一致性损失函数可以对其所包括的生成器网络模型和判别器网络模型进行约束,且判别器网络模型可以对生成器网络模型进行判别,使生成器网络模型根据判别器网络模型进行调整,优化循环生成对抗网络模型。通过三元组损失函数可以保障生成的证件图片中人脸特征不变,使得生成的证件图片不失真。进一步,基于循环生成对抗网络模型可以降低对样本数据的采集要求,采集的样本数据中人脸图片和证件图片可以不一一对应,节省了采集所花费的人力、财力和时间成本。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的证件图片生成方法的流程图;
图2a-图2c示出了循环生成对抗网络模型内部循环迭代的示意图;
图3示出了根据本发明一个实施例的证件图片生成装置的功能框图;
图4示出了根据本发明一个实施例的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的证件图片生成方法的流程图。如图1所示,证件图片生成方法具体包括如下步骤:
步骤S101,采集人脸图片和证件图片作为样本数据以获取用于训练的训练样本。
在采集样本数据时,需采集人脸图片和证件图片作为样本数据。其中,人脸图片与证件图片可以为一一对应的图片,也可以为不一一对应的图片。人脸图片为包含人脸的图片,其具有人脸风格即可,如风景照、生活照等;证件图片为具有证件风格的图片,如一寸证件照、两寸证件照、签证照等。证件图片的证件风格可以统一,也可以不统一,此处不做限定。
采集样本数据时,需要对样本数据进行筛选,去除不具有人脸风格或不具有证件风格的图片。采集到的人脸图片的数量优选地与采集到证件图片的数量相同,如均为1000张。在采集到样本数据后,对样本数据进行预处理。具体的,预处理包括对样本数据进行图片尺寸归一化处理,如将人脸图片和证件图片的尺寸均归一化成256x256大小,方便后续对其进行比较等。在对样本数据预处理后,将预处理后的样本数据按照比例随机划分为训练样本和测试样本。如按照10%的比例随机抽取图片作为测试样本,抽取剩余的图片作训练样本,不同的样本可以分别放在不同的存储路径下。
步骤S102,创建循环生成对抗网络模型,并利用训练样本对循环生成对抗网络模型进行训练。
基于深度学习思想,创建循环生成对抗网络的网络模型,循环生成对抗网络模型包括生成器网络模型和判别器网络模型。生成器网络模型包括第一生成器和第二生成器;第一生成器用于将人脸图片生成具有证件风格的证件图片;第二生成器用于将证件图片生成具有人脸风格的人脸图片;判别器网络模型包括第一判别器和第二判别器;第一判别器用于生成的证件图片是否符合预设证件风格;第二判别器用于判断生成的人脸图片是否符合预设人脸风格。循环生成对抗网络为两个镜像对称的生成对抗网络,构成了一个环形网络。本实施例中主要基于循环生成对抗网络来将人脸图片生成证件图片,因此,在以下说明中会以生成证件图片为例进行重点说明。
在对循环生成对抗网络模型进行训练时,具体的:可以基于采集到的训练样本利用生成器网络模型可以生成各自对应风格的图片,利用判别器网络模型可以对生成器网络模型所生成的图片进行风格判定,将判定结果反馈给生成器网络模型进行训练参数调整。如先利用第一生成器可以将训练样本中的人脸图片生成对应的具有证件风格的第一证件图片,利用第二生成器可以将训练样本中的证件图片生成对应的具有人脸风格的第二人脸图片。如图2a所示,X代表人脸图片集合,Y代表证件图片集合。G为第一生成器,F为第二生成器。通过第一生成器G将X生成Y,通过第二生成器F将Y生成X。Dx为第一判别器,Dy为第二判别器,利用第一判别器的损失函数可以判断生成的第一证件图片是否符合预设证件风格,并对第一生成器的训练参数进行调整;利用第二判别器的损失函数可以判断生成的第二人脸图片是否符合预设人脸风格,并对第二生成器的训练参数进行调整。
第一判别器的损失函数为:
LGAN(G,Dy,X,Y)=Ey~Pdata(y)[logDy(y)]+Ex~Pdata(x)[log(1-Dy(G(x)))]
第二判别器的损失函数为:
LGAN(F,Dx,Y,X)=Ex~Pdata(x)[logDx(x)]+Ey~Pdata(y)[log(1-Dx(G(y)))]
循环生成对抗网络在训练时,生成器网络模型和判别器网络模型会不断进行“博弈”,如判别器网络模型会不断增强识别证件图片是否具有证件风格的能力,而生成器网络模型会根据判别器网络模型的反馈不断调整训练参数,以生成更加真实的证件图片。除此之外,循环生成对抗网络在训练时,利用第一生成器可以将训练样本中的人脸图片生成对应的具有证件风格的第一证件图片后,还利用第二生成器将生成的第一证件图片生成对应的具有人脸风格的第一人脸图片,如图2b所示,通过第一生成器G将人脸图片集合X中训练样本的某人脸图片x生成证件图片集合Y中的第一证件图片然后通过第二生成器F将第一证件图片生成人脸图片集合X中第一人脸图片x和属于同一个人脸图片集合X,两者的差别即生成器网络模型的损失loss计作同理,利用第二生成器可以将训练样本中的证件图片生成对应的具有人脸风格的第二人脸图片,利用第一生成器将生成的第二人脸图片生成对应的具有证件风格的第二证件图片。如图2c所示,通过第二生成器F将证件图片集合Y的训练样本的某证件照片y生成人脸图片集合X的第二人脸图片然后通过第一生成器G将第二人脸图片生成第二证件图片y和属于同一个证件图片集合Y,两者的差别即生成器网络模型的损失loss计作利用循环一致性损失函数对生成的第二人脸图片与训练样本中人脸图片进行比较,以及对第二证件图片与训练样本中的证件图片进行比较,可以根据生成器网络模型损失来调整第一生成器和第二生成器的训练参数。
循环一致性损失函数Cycle Consistency Loss为:
Lcyc(G,F)=Ex~Pdata(x)[||F(G(x))-x||1]+Ey~Pdata(y)[||G(F(y))-y||1]
通过循环一致性损失函数对x和y和做出约束。即在第一生成器G将x生成又将通过第二生成器F生成的过程中的x和以及第二生成器F将y生成又将通过第一生成器G生成的过程中的y和做出约束。从而保证了生成器网络模型在生成证件图片时,使生成的证件图片具有证件风格,同时保证生成的证件图片保留有人脸图片的人脸所独有的特征,避免生成器网络模型把所有训练样本中的人脸图片均生成为同一张图片,避免生成的证件图片失真。
循环生成对抗网络模型模型的最终损失函数:
L(G,F,Dx,Dy)=LGAN(G,Dy,X,Y)+LGAN(F,Dx,Y,X)+λLcyc(G,F)
循环生成对抗网络模型的最终损失函数是用来判断第一生成器G和第二生成器F生成图片的风格与所需转换的图片风格差距是否小于预设损失,判断第一判别器Dx和第二判别器Dy是否已经能非常清晰的判别生成的图片的真假(第一生成器或第二生成器生成的图片是否具有对应的风格),是否已经达到生成标准(如生成的证件图片中的人脸与真实证件图片中人脸的相似度高于预设阈值)。
进一步,循环生成对抗网络模型在训练时,还利用优化损失函数调整生成器网络模型和判别器网络模型的训练参数。
优化损失函数:
D(G(x))为判别器网络模型,其判断生成器网络模型生成的证件图片是否达到生成标准,即生成器网络模型生成的证件图片无限接近真实的证件照片。生成器网络模型需要D(G(x))尽可能得大,V(D,G)会变小,优化损失函数需要得到最小min_G。判别器网络模型的判别能力越强,D(x)越大,D(G(x))会越小,这时V(D,G)会变大,对于判别器网络模型,优化损失函数需得到最大max_D。优化损失函数需要同时优化生成器网络模型和判别器网络模型的训练参数,以获得较好的循环生成对抗网络模型。
进一步,循环生成对抗网络模型在训练时,还利用三元组损失函数调整生成器网络模型的训练参数以使其生成的图片与训练样本中包含的人脸特征匹配。具体的,三元组(triplet)损失函数:
生成器网络模型在生成证件图片的过程中可能会导致证件图片上的人脸与训练样本中人脸图片中的人脸有所差异,因此,还需要计算人脸的损失以便调整生成器网络模型,使生成的证件图片与人脸图片中的人脸尽量无差异。具体的,将生成的证件图片和对应的训练样本中的人脸照片都输入至人脸匹配识别模型(如facenet模型等,此处不一一列举),采用三元组(triplet)损失函数计算两张人脸间的差异。人脸匹配识别模型采用选择一个人脸作为anchor,positive是跟anchor属于同一个人的人脸,negative是跟anchor不一样的人的人脸,通过机器学习使anchor与positive的距离更近,而与negative的距离更远,此处,三张人脸的组合称为三元组(triplet)。三元组(triplet)损失函数公式中的||*||为欧式距离,表示的是positive和anchor之间的欧氏距离度量,表示的是negative和anchor之间的欧氏距离度量。三元组(triplet)损失直接反映了人脸识别的目标,即将人脸经转化为向量后,使得相同人脸的一对面部向量之间的距离更小,而来自不同人脸的一对面部向量之间的距离更大。根据三元组(triplet)损失函数计算第一证件图片的人脸特征参数与对应的训练样本中人脸图片的人脸特征参数的欧式距离度量,根据欧式距离度量调整生成器网络模型的训练参数,提高生成证件图片的准确度,直至得到最优生成器网络模型。
进一步,在得到训练后的循环生成对抗网络模型后,还可以利用测试样本对训练后的循环生成对抗网络模型进行测试,以检测训练后的循环生成对抗网络模型生成证件图片的准确度。
步骤S103,利用训练后的循环生成对抗网络模型中的生成器网络模型将人脸图片生成证件图片。
将需要生成证件图片的人脸图片输入至训练后的循环生成对抗网络模型中,由生成器网络模型的第一生成器将人脸图片生成具有证件风格的证件图片,同时,生成的证件图片保留输入的人脸图片中的人脸特征。
根据本发明提供的证件图片生成方法,采集人脸图片和证件图片作为样本数据以获取用于训练的训练样本;创建循环生成对抗网络模型,并利用训练样本对循环生成对抗网络模型进行训练;其中,循环生成对抗网络模型包括生成器网络模型和判别器网络模型;训练基于循环一致性损失函数和/或三元组损失函数训练调整循环生成对抗网络模型的训练参数;利用训练后的循环生成对抗网络模型中的生成器网络模型将人脸图片生成证件图片。在对循环生成对抗网络模型进行训练时,利用循环一致性损失函数可以对其所包括的生成器网络模型和判别器网络模型进行约束,且判别器网络模型可以对生成器网络模型进行判别,使生成器网络模型根据判别器网络模型进行调整,优化循环生成对抗网络模型。通过三元组损失函数可以保障生成的证件图片中人脸特征不变,使得生成的证件图片不失真。进一步,基于循环生成对抗网络模型可以降低对样本数据的采集要求,采集的样本数据中人脸图片和证件图片可以不一一对应,节省了采集所花费的人力、财力和时间成本。
图3示出了根据本发明一个实施例的证件图片生成装置的功能框图。如图3所示,证件图片生成装置包括如下模块:
采集模块310适于:采集人脸图片和证件图片作为样本数据以获取用于训练的训练样本。
训练模块320适于:创建循环生成对抗网络模型,并利用训练样本对循环生成对抗网络模型进行训练;其中,循环生成对抗网络模型包括生成器网络模型和判别器网络模型;训练基于循环一致性损失函数和/或三元组损失函数训练调整循环生成对抗网络模型的训练参数。
生成模块330适于:利用训练后的循环生成对抗网络模型中的生成器网络模型将人脸图片生成证件图片。
可选地,采集模块310进一步适于采集人脸图片和证件图片作为样本数据,并对样本数据进行预处理;预处理包括对样本数据进行图片尺寸归一化处理;将预处理后的样本数据按照比例随机划分为训练样本和测试样本。
可选地,生成器网络模型包括第一生成器和第二生成器;第一生成器用于将人脸图片生成具有证件风格的证件图片;第二生成器用于将证件图片生成具有人脸风格的人脸图片;判别器网络模型包括第一判别器和第二判别器;第一判别器用于生成的证件图片是否符合预设证件风格;第二判别器用于判断生成的人脸图片是否符合预设人脸风格。
可选地,训练模块320进一步适于:基于训练样本利用生成器网络模型生成对应风格的图片;利用判别器网络模型对生成的图片进行风格判定,将判定结果反馈给生成器网络模型进行训练参数调整;利用优化损失函数调整生成器网络模型和判别器网络模型的训练参数;利用三元组损失函数调整生成器网络模型的训练参数以使其生成的图片与训练样本中包含的人脸特征匹配。
可选地,训练模块320进一步适于:利用第一生成器将训练样本中的人脸图片生成对应的具有证件风格的第一证件图片;利用第二生成器将生成的第一证件图片生成对应的具有人脸风格的第一人脸图片;利用第二生成器将训练样本中的证件图片生成对应的具有人脸风格的第二人脸图片;利用第一生成器将生成的第二人脸图片生成对应的具有证件风格的第二证件图片;利用循环一致性损失函数对生成的第二人脸图片与训练样本中人脸图片进行比较,以及对第二证件图片与训练样本中的证件图片进行比较,以调整第一生成器和第二生成器的训练参数;利用第一判别器的损失函数判断生成的第一证件图片是否符合预设证件风格,并对第一生成器的训练参数进行调整;利用第二判别器的损失函数判断生成的第二人脸图片是否符合预设人脸风格,并对第二生成器的训练参数进行调整。
可选地,训练模块320进一步适于:利用三元组损失函数计算第一证件图片的人脸特征参数与对应的训练样本中人脸图片的人脸特征参数的差异度;根据差异度调整生成器网络模型的训练参数。
可选地,装置还包括测试模块340。测试模块340进一步适于:利用测试样本对训练后的循环生成对抗网络模型进行测试。
以上各模块的描述参照方法实施例中对应的描述,在此不再赘述。
本申请还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的证件图片生成方法。
图4示出了根据本发明一个实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图4所示,该电子设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:
处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器402,用于执行程序410,具体可以执行上述证件图片生成方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行上述任意方法实施例中的证件图片生成方法。程序410中各步骤的具体实现可以参见上述证件图片生成实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的证件图片生成装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种证件图片生成方法,其特征在于,方法包括:
采集人脸图片和证件图片作为样本数据以获取用于训练的训练样本;
创建循环生成对抗网络模型,并利用所述训练样本对所述循环生成对抗网络模型进行训练;其中,所述循环生成对抗网络模型包括生成器网络模型和判别器网络模型;所述训练基于循环一致性损失函数和/或三元组损失函数训练调整所述循环生成对抗网络模型的训练参数;
利用训练后的循环生成对抗网络模型中的生成器网络模型将人脸图片生成证件图片。
2.根据权利要求1所述的方法,其特征在于,所述采集人脸图片和证件图片作为样本数据以获取用于训练的训练样本进一步包括:
采集人脸图片和证件图片作为样本数据,并对所述样本数据进行预处理;所述预处理包括对所述样本数据进行图片尺寸归一化处理;
将预处理后的样本数据按照比例随机划分为训练样本和测试样本。
3.根据权利要求2所述的方法,其特征在于,所述生成器网络模型包括第一生成器和第二生成器;所述第一生成器用于将人脸图片生成具有证件风格的证件图片;所述第二生成器用于将证件图片生成具有人脸风格的人脸图片;所述判别器网络模型包括第一判别器和第二判别器;所述第一判别器用于生成的证件图片是否符合预设证件风格;所述第二判别器用于判断生成的人脸图片是否符合预设人脸风格。
4.根据权利要求3所述的方法,其特征在于,所述创建循环生成对抗网络模型,并利用所述训练样本对所述循环生成对抗网络模型进行训练进一步包括:
基于所述训练样本利用所述生成器网络模型生成对应风格的图片;利用所述判别器网络模型对生成的图片进行风格判定,将判定结果反馈给所述生成器网络模型进行训练参数调整;
利用优化损失函数调整所述生成器网络模型和所述判别器网络模型的训练参数;
利用三元组损失函数调整所述生成器网络模型的训练参数以使其生成的图片与所述训练样本中包含的人脸特征匹配。
5.根据权利要求4所述的方法,其特征在于,所述基于所述训练样本利用所述生成器网络模型生成对应风格的图片;利用所述判别器网络模型对生成的图片进行风格判定,将判定结果反馈给所述生成器网络模型进行训练参数调整进一步包括:
利用所述第一生成器将训练样本中的人脸图片生成对应的具有证件风格的第一证件图片;利用所述第二生成器将生成的第一证件图片生成对应的具有人脸风格的第一人脸图片;利用所述第二生成器将训练样本中的证件图片生成对应的具有人脸风格的第二人脸图片;利用所述第一生成器将生成的第二人脸图片生成对应的具有证件风格的第二证件图片;
利用循环一致性损失函数对生成的第二人脸图片与所述训练样本中人脸图片进行比较,以及对第二证件图片与训练样本中的证件图片进行比较,以调整所述第一生成器和所述第二生成器的训练参数;
利用所述第一判别器的损失函数判断生成的所述第一证件图片是否符合预设证件风格,并对所述第一生成器的训练参数进行调整;利用所述第二判别器的损失函数判断生成的所述第二人脸图片是否符合预设人脸风格,并对所述第二生成器的训练参数进行调整。
6.根据权利要求5所述的方法,其特征在于,所述利用三元组损失函数调整所述生成器网络模型的训练参数以使其生成的图片与所述训练样本中包含的人脸特征匹配进一步包括:
利用三元组损失函数计算所述第一证件图片的人脸特征参数与对应的训练样本中人脸图片的人脸特征参数的差异度;
根据所述差异度调整所述生成器网络模型的训练参数。
7.根据权利要求2-6中任一项所述的方法,其特征在于,所述方法还包括:
利用所述测试样本对训练后的循环生成对抗网络模型进行测试。
8.一种证件图片生成装置,其特征在于,装置包括:
采集模块,适于采集人脸图片和证件图片作为样本数据以获取用于训练的训练样本;
训练模块,适于创建循环生成对抗网络模型,并利用所述训练样本对所述循环生成对抗网络模型进行训练;其中,所述循环生成对抗网络模型包括生成器网络模型和判别器网络模型;所述训练基于循环一致性损失函数和/或三元组损失函数训练调整所述循环生成对抗网络模型的训练参数;
生成模块,适于利用训练后的循环生成对抗网络模型中的生成器网络模型将人脸图片生成证件图片。
9.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的证件图片生成方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的证件图片生成方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910611720.4A CN112199976A (zh) | 2019-07-08 | 2019-07-08 | 证件图片生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910611720.4A CN112199976A (zh) | 2019-07-08 | 2019-07-08 | 证件图片生成方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112199976A true CN112199976A (zh) | 2021-01-08 |
Family
ID=74004448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910611720.4A Pending CN112199976A (zh) | 2019-07-08 | 2019-07-08 | 证件图片生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112199976A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114022350A (zh) * | 2021-11-10 | 2022-02-08 | 中国工商银行股份有限公司 | 一种将生活照处理成证件照的方法及装置 |
CN114266937A (zh) * | 2021-12-20 | 2022-04-01 | 北京百度网讯科技有限公司 | 模型训练、图像处理方法,装置,设备以及存储介质 |
CN114463821A (zh) * | 2022-02-15 | 2022-05-10 | 平安科技(深圳)有限公司 | 证件数据生成方法、装置、计算机设备及存储介质 |
-
2019
- 2019-07-08 CN CN201910611720.4A patent/CN112199976A/zh active Pending
Non-Patent Citations (2)
Title |
---|
JUN-YAN ZHU等: "Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks", 《ARXIV》, pages 1 - 18 * |
Y.Z.Y.: "一代宗师__循环一致性生成对抗网络(CycleGAN)(八)", pages 1 - 5, Retrieved from the Internet <URL:https://blog.csdn.net/qq_42823043/article/details/89438539> * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114022350A (zh) * | 2021-11-10 | 2022-02-08 | 中国工商银行股份有限公司 | 一种将生活照处理成证件照的方法及装置 |
CN114266937A (zh) * | 2021-12-20 | 2022-04-01 | 北京百度网讯科技有限公司 | 模型训练、图像处理方法,装置,设备以及存储介质 |
CN114463821A (zh) * | 2022-02-15 | 2022-05-10 | 平安科技(深圳)有限公司 | 证件数据生成方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108875732B (zh) | 模型训练与实例分割方法、装置和系统及存储介质 | |
JP5506785B2 (ja) | 勾配ヒストグラムを用いた指紋表現 | |
TWI687879B (zh) | 伺服器、客戶端、用戶核身方法及系統 | |
CN108197618B (zh) | 用于生成人脸检测模型的方法和装置 | |
WO2020258667A1 (zh) | 图像识别方法及装置、非易失性可读存储介质、计算机设备 | |
EP3772036A1 (en) | Detection of near-duplicate image | |
EP3989104A1 (en) | Facial feature extraction model training method and apparatus, facial feature extraction method and apparatus, device, and storage medium | |
WO2019015466A1 (zh) | 人证核实的方法及装置 | |
WO2022206319A1 (zh) | 图像处理方法、装置、设备、存储介质计算机程序产品 | |
CN110428399B (zh) | 用于检测图像的方法、装置、设备和存储介质 | |
CN111476268A (zh) | 翻拍识别模型训练、图像识别方法、装置、设备及介质 | |
CN112199976A (zh) | 证件图片生成方法及装置 | |
US20190347472A1 (en) | Method and system for image identification | |
CN110163053A (zh) | 生成人脸识别的负样本的方法、装置及计算机设备 | |
CN106815803B (zh) | 图片的处理方法及装置 | |
JP2020526835A (ja) | 画像を投稿するためのユーザのアカウントを動的に識別する装置及び方法 | |
CN115860091B (zh) | 一种基于正交约束的深度特征描述符学习方法 | |
CN112306829A (zh) | 性能信息的确定方法及装置、存储介质、终端 | |
CN110414792B (zh) | 基于bim和大数据的部品集采管理系统及相关产品 | |
CN111368763A (zh) | 基于头像的图像处理方法、装置及计算机可读存储介质 | |
CN111062338B (zh) | 一种证照人像一致性比对方法及其系统 | |
CN111126617B (zh) | 一种选择融合模型权重参数的方法、装置及设备 | |
CN112560687A (zh) | 人脸识别方法 | |
CN112258481A (zh) | 一种门脸照翻拍检测方法 | |
CN116797500B (zh) | 图像处理方法、装置、存储介质、电子设备及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210108 |
|
RJ01 | Rejection of invention patent application after publication |