CN114022350A - 一种将生活照处理成证件照的方法及装置 - Google Patents
一种将生活照处理成证件照的方法及装置 Download PDFInfo
- Publication number
- CN114022350A CN114022350A CN202111325281.4A CN202111325281A CN114022350A CN 114022350 A CN114022350 A CN 114022350A CN 202111325281 A CN202111325281 A CN 202111325281A CN 114022350 A CN114022350 A CN 114022350A
- Authority
- CN
- China
- Prior art keywords
- image
- human body
- photo image
- life
- photo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012545 processing Methods 0.000 title claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 36
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 230000006870 function Effects 0.000 claims description 56
- 238000004590 computer program Methods 0.000 claims description 17
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000012423 maintenance Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 12
- 238000005070 sampling Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种将生活照处理成证件照的方法及装置,涉及图像处理技术领域,包括:采集样本数据,其中,样本数据包括人体的生活照图像和对应的证件照图像;对样本数据进行预处理,将人体的生活照图像中的人体与背景进行分割,提取人体部分的图像;建立对抗网络模型,搭建生成器、判别器和分类器;将人体部分的图像及证件照图像作为输入样本,对生成器、判别器和分类器进行迭代训练,根据损失函数值调节对抗网络模型的参数,直至损失函数值达到设定值,得到训练完成的对抗网络模型;获取待测生活照样本,输入至训练完成的模型进行处理,得到待测生活照样本对应的证件照。本发明可以提升人像采集工作的效率,提高生成图像真实性,降低运维成本。
Description
技术领域
本发明涉及图像处理技术领域,尤指一种将生活照处理成证件照的方法及装置。
背景技术
在现有技术中,针对企业的需要,在采集录入人像时,通常利用人工上传本人的符合要求的证件照片实现,采集录入系统进行简单的图像缩放操作,关于人像处理的智能算法应用不足;对此,现有技术提出了关于基于图像分割的证件照生成方法,使用传统的图像处理方式对照片进行处理,包括标记前景背景,直方图分割,前景背景混合等。
但是,现有的方案智能化程度低,需要人工成本大,具体体现在以下方面:当需要上传照片的人员没有可用的证件照,需要临时去照相店拍摄,这一过程十分的费时费力。对输入系统中的证件照有像素尺寸和文件大小要求,经常需要上传者本人进行照片尺寸和文件大小的调整。对于基于图像分割的证件照生成方法,操作复杂,生成的图像真实度低。
综上来看,亟需一种可以克服上述缺陷,能够更加方便、快捷、智能化的生成证件照的技术方案。
发明内容
为解决现有技术存在的问题,本发明提出了一种将生活照处理成证件照的方法及装置。本发明可以提升图像处理的易用性,有效的降低了人力成本,提升人像采集相关工作的效率,提高生成图像真实性,降低相关系统的运维成本。
在本发明实施例的第一方面,提出了一种将生活照处理成证件照的方法,该方法包括:
采集样本数据,其中,所述样本数据包括人体的生活照图像和对应的证件照图像;
对样本数据进行预处理,将人体的生活照图像中的人体与背景进行分割,提取人体部分的图像;
建立对抗网络模型,搭建生成器、判别器和分类器;
将所述人体部分的图像及证件照图像作为输入样本,对生成器、判别器和分类器进行迭代训练,根据损失函数值调节对抗网络模型的参数,直至损失函数值达到设定值,得到训练完成的对抗网络模型;
获取待测生活照样本,输入至训练完成的对抗网络模型进行处理,得到所述待测生活照样本对应的证件照。
在本发明实施例的第二方面,提出了一种将生活照处理成证件照的装置,包括:
样本数据采集模块,用于采集样本数据,其中,所述样本数据包括人体的生活照图像和对应的证件照图像;
预处理模块,用于对样本数据进行预处理,通过分割算法将人体的生活照图像中的人体与背景进行分割,提取人体部分的图像;
模型建立模块,用于建立对抗网络模型,搭建生成器、判别器和分类器;
模型训练模块,用于将所述人体部分的图像及证件照图像作为输入样本,对生成器、判别器和分类器进行迭代训练,根据损失函数值调节对抗网络模型的参数,直至损失函数值达到设定值,得到训练完成的对抗网络模型;
生活照处理模块,用于获取待测生活照样本,输入至训练完成的对抗网络模型进行处理,得到所述待测生活照样本对应的证件照。
在本发明实施例的第三方面,提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现将生活照处理成证件照的方法。
在本发明实施例的第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现将生活照处理成证件照的方法。
本发明提出的将生活照处理成证件照的方法及装置通过数据采集、数据预处理、对抗网络模型训练、生活照处理及生成证件照等多个处理过程,可以对用户上传的照片进行预处理和证件照图像生成,可以快速、方便的实现用户从上传生活照到生成证件照的端到端过程,降低了人力成本,提升生成证件照的真实度,并且可以优化证件照处理的过程,提升图像处理系统的易用性,降低运维成本,提高图像处理的智能化水平。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一实施例的将生活照处理成证件照的方法流程示意图。
图2是本发明一具体实施例的将生活照处理成证件照的方法流程示意图。
图3是本发明一具体实施例的对抗网络模型的架构关系示意图。
图4是本发明一实施例的将生活照处理成证件照的装置架构示意图。
图5是本发明一实施例的计算机设备结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种将生活照处理成证件照的方法及装置,涉及图像处理技术领域。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
图1是本发明一实施例的将生活照处理成证件照的方法流程示意图。如图1所示,该方法包括:
步骤S101,采集样本数据,其中,所述样本数据包括人体的生活照图像和对应的证件照图像;
步骤S102,对样本数据进行预处理,通过分割算法将人体的生活照图像中的人体与背景进行分割,提取人体部分的图像;
步骤S103,建立对抗网络模型,搭建生成器、判别器和分类器;
步骤S104,将所述人体部分的图像及证件照图像作为输入样本,对生成器、判别器和分类器进行迭代训练,根据损失函数值调节对抗网络模型的参数,直至损失函数值达到设定值,得到训练完成的对抗网络模型;
步骤S105,获取待测生活照样本,输入至训练完成的对抗网络模型进行处理,得到所述待测生活照样本对应的证件照。
参考图2,为本发明一具体实施例的将生活照处理成证件照的方法流程示意图。如图2所示,在步骤S102中,对样本数据进行预处理的具体流程为:
步骤S1021,对采集的人体的生活照图像进行筛选,筛选得到包含人体正脸的生活照图像。
在实际应用场景中,可以采用神经网络对生活照图像进行特征提取,剔除不包含人体正脸(例如图像中五官不完整,人脸不完整)的生活照图像,也可以采用人工进行筛选。
通过分割算法将人体的生活照图像中的人体与背景进行分割,提取人体部分的图像的具体流程为:
步骤S1022,通过UNet模型对采集到的生活照图像进行前景和背景的分割,提取人体部分的图像,其中,前景为生活照图像中的人体部分,背景为生活照图像中的背景部分。
更具体的,将所述生活照图像输入UNet模型,其中,UNet模型以卷积模块的编码解码器构成,利用编码解码器对生活照图像的原图像进行编码,对图像进行层层的特征提取,通过卷积结构提取生活照图像中的人体部分的信息;经过多层的反卷积,对提取到的特征进行解码,并加入编码过程中丢失的信息,生成与原图像尺寸相同的图像,分割出人体的轮廓,得到人体部分的图像。
在分割的过程中,前景为照片中的人体部分,背景为照片中的背景部分。在输入一张生活照后,可以分割出人体的轮廓,UNet模型结构以卷积模块为主体的编码-解码器,先对输入的图像进行层层的特征提取,可以看做是一个编码过程,卷积结构不断提取图像有用的信息,然后经过一层层的反卷积,对提取到的特征进行解码,并且加入编码过程中丢失的信息,最后生成与原图像尺寸相同的图像,从而实现语义分割。
分割得到的图像是本人去掉背景后的生活照,目的是为了降低背景对生产图像的干扰。
在本实施例的步骤S103中,针对将生活照处理成证件照的应用场景,本发明建立了相应的对抗网络模型,并为了适应该应用场景搭建生成器、判别器和分类器;其中,
生成器采用编码解码的形式,为全卷积结构,用于将输入的生活照图像先下采样到低维度,进一步上采样到原始分辨率,生成证件照图像;
判别器采用马尔科夫性的判别器,用于判断生成的证件照图像与生活照图像本人是否匹配;其中,输入包括两种类型:原始生活照图像及生成的证件照图像,原始生活照图像及真实的证件照图像;输出为0表示两者不匹配,输出1表示两者匹配;
分类器由多层卷积模块组成,用于对生成的证件照图像的类别进行判断,其中,所述分类器为二分类器,0表示是生成器生成的伪图像,1表示是真实的证件照图像。
参考图3,为本发明一具体实施例的对抗网络模型的架构关系示意图。由于步骤S102得到的图像只存在人体部分,其他像素值以白色[255,255,255]填充,将该图像作为生成对抗网络的输入,进行生活照与证件照片的转换过程。模型结构以Pix2Pix为基础进行改进,其中包括生成器,分类器,判别器三个部分。
生成器:生成器的结构与UNet模型结构相同,为编码-解码形式,是一种全卷积结构,先下采样到低维度,再上采样到原始分辨率,目的是生成本人的证件照片。输入生活照图像,通过图像的编码和解码过程,输出证件照图像。
分类器:搭建一个由4层卷积模块组成的简单的分类器进行生成证件照图像的类别判断,这是一个二分类器,0表示是生成器生成的伪图像,1表示是真实的证件照图像。
判别器,利用马尔科夫性的判别器(PatchGAN)判断生成的证件照图像与本人是否匹配。输入包括两种类型:原始生活照图像+生成的证件照图像、原始生活照图像+真实的证件照图像,输出0表示两者不匹配,输出1表示两者匹配。
判别器的目的是为了判别生成的图像与原图是否匹配(是否是同一个人);加上分类器是为了让生成的图像更加真实。因为如果分类结果为0,则视为伪图像,促使生成器生成更加真实的图像。
模型的损失函数由三部分组成,分别是cGAN的损失函数LcGAN(G,D)、生成器的损失函数LL1(G)(为了使得生产的图像与原图足够的相似,限制生成的内容不至于与原图毫无关系)、分类器的损失函数LC(C),本质上是一个交叉上损失函数。
具体的,损失函数的计算式为:
其中,G为生成器;D为判别器;C为分类器;E为期望;Pdata为生成器的分布;x'为输入的样本,包括真实的证件照图像和生成器生成的证件照图像;y为真实的证件照图像;为生成的证件照图像;G(x)为生成器输出的假的证件照图像,其中的x是人体的生活照图像;P为概率;ci为第i类,共有2类,0和1;M为2;
计算损失函数的加权和得到优化目标函数值,利用所述优化目标函数值优化所述对抗网络模型,计算式为:
G*=argminGmaxC,DLcGAN(G,D)+λLL1(G)+Lc(C); (4)
其中,G*为优化目标函数值。
在本实施例的步骤S104中,将所述人体部分的图像及证件照图像作为输入样本,对生成器、判别器和分类器进行迭代训练的过程为:
S1,将所述人体部分的图像作为输入样本输入生成器,训练生成器,得到生成的证件照图像:
S2,输入真实的证件照图像和人体的生活照图像,设置对应的标签值为1训练判别器,得到真实的证件照图像和人体的生活照图像的匹配程度概率:
sr=D(x,y);
其中,sr为人体的生活照图像和真实的证件照图像的匹配程度概率;D(x,y)为判别器输入人体的生活照图像与真实的证件照图像的判别结果。
S3,输入生成的证件照图像和人体的生活照图像,设置对应的标签值为0训练判别器,得到生成的证件照图像和人体的生活照图像的匹配程度概率:
判别器D是为了判断生成的证件照图像是否与生活照图像匹配,即判断是否是同一个人。判别器D的输入图像存在两种情况,一种是输入人体的生活照图像、真实的证件照图像;另一种是输入人体的生活照图像、生成的证件照图像。其中,真实的证件照图像直接是匹配的(设置标签为1),但是,一开始生成的证件照图像不一定匹配(设置标签为0),随着不断的训练,促使生成的证件照图像逐渐匹配。
S4,输入真实的证件照图像,设置对应的标签值为1,训练分类器,得到真实证件照图像的类别概率:
pr=C(y,1);
其中,pr为真实证件照图像的类别概率;C(y,1)为将真实的证件照图像输入至分类器,输出为1;
S5,输入生成的证件照图像,设置对应的标签值为0,训练分类器,得到生成证件照图像的类别概率:
S6,根据真实的证件照图像和人体的生活照图像的匹配程度概率、生成的证件照图像和人体的生活照图像的匹配程度概率,计算判别器的损失函数值:
LD=log(sr)+log(1-sf);
其中,LD为判别器的损失函数值;
S7,根据真实证件照图像的类别概率、生成证件照图像的类别概率,计算分类器的损失函数值:
其中,LC为分类器的损失函数值;prj、pfj根据真实证件照图像的类别概率pr、生成证件照图像的类别概率pf得到,分别为第j类的真实证件照图像的类别概率、生成证件照图像的类别概率,共有2类,0和1,;M为2;CE为交叉熵(Cross Entropy);
S8,根据判别器的损失函数值,更新判别器模型参数值:
其中,D'为判别器模型参数值;D”为更新后的判别器模型参数值;
S9,根据分类器的损失函数值,更新分类器模型参数值:
其中,C'为分类器模型参数值;C”为更新后的分类器模型参数值;
S10,根据生成的证件照图像和人体的生活照图像的匹配程度概率、生成证件照图像的类别概率,计算生成器的损失函数值:
其中,LG为生成器的损失函数值;
S11,根据生成器的损失函数值,更新生成器的模型参数值:
其中,G'为分类器模型参数值;G”为更新后的生成器模型参数值;α为学习率(learning rate)。
不断的迭代上述过程,直到损失函数(Loss)下降趋于平缓,不出现过拟合现象,则训练完成,得到训练完成的模型。
在一具体实施例中,训练参数可以设置如下:
输入图片尺寸(size):[256,256];
迭代次数(epoch):200;
模型的损失权重:100;
每次迭代的批处理图像数(batch size):1;
学习率(learning rate):0.0002;
对抗网络模型的优化器采用:Adam(momentum=0.5);
最后,将待测生活照样本输入至训练完成的模型,得到证件照的最终结果。
需要说明的是,尽管在上述实施例及附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
在介绍了本发明示例性实施方式的方法之后,接下来,参考图4对本发明示例性实施方式的将生活照处理成证件照的装置进行介绍。
将生活照处理成证件照的装置的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的术语“模块”或者“单元”,可以是实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
基于同一发明构思,本发明还提出了一种将生活照处理成证件照的装置,如图4所示,该装置包括:
样本数据采集模块410,用于采集样本数据,其中,所述样本数据包括人体的生活照图像和对应的证件照图像;
预处理模块420,用于对样本数据进行预处理,通过分割算法将人体的生活照图像中的人体与背景进行分割,提取人体部分的图像;
模型建立模块430,用于建立对抗网络模型,搭建生成器、判别器和分类器;
模型训练模块440,用于将所述人体部分的图像及证件照图像作为输入样本,对生成器、判别器和分类器进行迭代训练,根据损失函数值调节对抗网络模型的参数,直至损失函数值达到设定值,得到训练完成的对抗网络模型;
生活照处理模块450,用于获取待测生活照样本,输入至训练完成的对抗网络模型进行处理,得到所述待测生活照样本对应的证件照。
在本实施例中,所述预处理模块420具体用于:
对采集的人体的生活照图像进行筛选,筛选得到包含人体正脸的生活照图像。
通过UNet模型对采集到的生活照图像进行前景和背景的分割,提取人体部分的图像,其中,前景为生活照图像中的人体部分,背景为生活照图像中的背景部分。
更具体的,将所述生活照图像输入UNet模型,其中,UNet模型以卷积模块的编码解码器构成,利用编码解码器对生活照图像的原图像进行编码,对图像进行层层的特征提取,通过卷积结构提取生活照图像中的人体部分的信息;经过多层的反卷积,对提取到的特征进行解码,并加入编码过程中丢失的信息,生成与原图像尺寸相同的图像,分割出人体的轮廓,得到人体部分的图像。
在本实施例中,所述模型建立模块430具体用于:
搭建生成器,所述生成器采用编码解码的形式,为全卷积结构,用于将输入的生活照图像先下采样到低维度,进一步上采样到原始分辨率,生成证件照图像;
搭建判别器,所述判别器采用马尔科夫性的判别器,用于判断生成的证件照图像与生活照图像本人是否匹配;其中,输入包括两种类型:原始生活照图像及生成的证件照图像,原始生活照图像及真实的证件照图像;输出为0表示两者不匹配,输出1表示两者匹配;
搭建分类器,所述分类器由多层卷积模块组成,用于对生成的证件照图像的类别进行判断,其中,所述分类器为二分类器,0表示是生成器生成的伪图像,1表示是真实的证件照图像。
在本实施例中,所述模型训练模块440进行迭代训练过程为:
将所述人体部分的图像作为输入样本输入生成器,训练生成器,得到生成的证件照图像;
输入真实的证件照图像和人体的生活照图像,设置对应的标签值为1训练判别器,得到真实的证件照图像和人体的生活照图像的匹配程度概率;
输入生成的证件照图像和人体的生活照图像,设置对应的标签值为0训练判别器,得到生成的证件照图像和人体的生活照图像的匹配程度概率;
输入真实的证件照图像,设置对应的标签值为1,训练分类器,得到真实证件照图像的类别概率;
输入生成的证件照图像,设置对应的标签值为0,训练分类器,得到生成证件照图像的类别概率;
根据真实的证件照图像和人体的生活照图像的匹配程度概率、生成的证件照图像和人体的生活照图像的匹配程度概率,计算判别器的损失函数值;
根据真实证件照图像的类别概率、生成证件照图像的类别概率,计算分类器的损失函数值;
根据判别器的损失函数值,更新判别器模型参数值;
根据分类器的损失函数值,更新分类器模型参数值;
根据生成的证件照图像和人体的生活照图像的匹配程度概率、生成证件照图像的类别概率,计算生成器的损失函数值;
根据生成器的损失函数值,更新生成器的模型参数值。
应当注意,尽管在上文详细描述中提及了将生活照处理成证件照的装置的若干模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
基于前述发明构思,如图5所示,本发明还提出了一种计算机设备500,包括存储器510、处理器520及存储在存储器510上并可在处理器520上运行的计算机程序530,所述处理器520执行所述计算机程序530时实现前述将生活照处理成证件照的方法。
基于前述发明构思,本发明提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前述将生活照处理成证件照的方法。
本发明提出的将生活照处理成证件照的方法及装置通过数据采集、数据预处理、对抗网络模型训练、生活照处理及生成证件照等多个处理过程,可以对用户上传的照片进行预处理和证件照图像生成,可以快速、方便的实现用户从上传生活照到生成证件照的端到端过程,降低了人力成本,提升生成证件照的真实度,并且可以优化证件照处理的过程,提升图像处理系统的易用性,降低运维成本,提高图像处理的智能化水平。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (14)
1.一种将生活照处理成证件照的方法,其特征在于,包括:
采集样本数据,其中,所述样本数据包括人体的生活照图像和对应的证件照图像;
对样本数据进行预处理,将人体的生活照图像中的人体与背景进行分割,提取人体部分的图像;
建立对抗网络模型,搭建生成器、判别器和分类器;
将所述人体部分的图像及证件照图像作为输入样本,对生成器、判别器和分类器进行迭代训练,根据损失函数值调节对抗网络模型的参数,直至损失函数值达到设定值,得到训练完成的对抗网络模型;
获取待测生活照样本,输入至训练完成的对抗网络模型进行处理,得到所述待测生活照样本对应的证件照。
2.根据权利要求1所述的方法,其特征在于,对样本数据进行预处理,包括:
对采集的人体的生活照图像进行筛选,筛选得到包含人体正脸的生活照图像。
3.根据权利要求2所述的方法,其特征在于,将人体的生活照图像中的人体与背景进行分割,提取人体部分的图像,包括:
通过UNet模型对采集到的生活照图像进行前景和背景的分割,提取人体部分的图像,其中,前景为生活照图像中的人体部分,背景为生活照图像中的背景部分。
4.根据权利要求3所述的方法,其特征在于,通过UNet模型对采集到的生活照图像进行前景和背景的分割,提取人体部分的图像,包括:
将所述生活照图像输入UNet模型,其中,UNet模型以卷积模块的编码解码器构成,利用编码解码器对生活照图像的原图像进行编码,对图像进行层层的特征提取,通过卷积结构提取生活照图像中的人体部分的信息;经过多层的反卷积,对提取到的特征进行解码,并加入编码过程中丢失的信息,生成与原图像尺寸相同的图像,分割出人体的轮廓,得到人体部分的图像。
5.根据权利要求1所述的方法,其特征在于,所述生成器采用编码解码的形式,为全卷积结构,用于将输入的生活照图像先下采样到低维度,进一步上采样到原始分辨率,生成证件照图像;
所述判别器采用马尔科夫性的判别器,用于判断生成的证件照图像与生活照图像本人是否匹配;其中,输入包括两种类型:原始生活照图像及生成的证件照图像,原始生活照图像及真实的证件照图像;输出为0表示两者不匹配,输出1表示两者匹配;
所述分类器由多层卷积模块组成,用于对生成的证件照图像的类别进行判断,其中,所述分类器为二分类器,0表示是生成器生成的伪图像,1表示是真实的证件照图像。
6.根据权利要求5所述的方法,其特征在于,对生成器、判别器和分类器进行迭代训练的过程为:
将所述人体部分的图像作为输入样本输入生成器,训练生成器,得到生成的证件照图像;
输入真实的证件照图像和人体的生活照图像,设置对应的标签值为1训练判别器,得到真实的证件照图像和人体的生活照图像的匹配程度概率;
输入生成的证件照图像和人体的生活照图像,设置对应的标签值为0训练判别器,得到生成的证件照图像和人体的生活照图像的匹配程度概率;
输入真实的证件照图像,设置对应的标签值为1,训练分类器,得到真实证件照图像的类别概率;
输入生成的证件照图像,设置对应的标签值为0,训练分类器,得到生成证件照图像的类别概率;
根据真实的证件照图像和人体的生活照图像的匹配程度概率、生成的证件照图像和人体的生活照图像的匹配程度概率,计算判别器的损失函数值;
根据真实证件照图像的类别概率、生成证件照图像的类别概率,计算分类器的损失函数值;
根据判别器的损失函数值,更新判别器模型参数值;
根据分类器的损失函数值,更新分类器模型参数值;
根据生成的证件照图像和人体的生活照图像的匹配程度概率、生成证件照图像的类别概率,计算生成器的损失函数值;
根据生成器的损失函数值,更新生成器的模型参数值。
7.一种将生活照处理成证件照的装置,其特征在于,包括:
样本数据采集模块,用于采集样本数据,其中,所述样本数据包括人体的生活照图像和对应的证件照图像;
预处理模块,用于对样本数据进行预处理,通过分割算法将人体的生活照图像中的人体与背景进行分割,提取人体部分的图像;
模型建立模块,用于建立对抗网络模型,搭建生成器、判别器和分类器;
模型训练模块,用于将所述人体部分的图像及证件照图像作为输入样本,对生成器、判别器和分类器进行迭代训练,根据损失函数值调节对抗网络模型的参数,直至损失函数值达到设定值,得到训练完成的对抗网络模型;
生活照处理模块,用于获取待测生活照样本,输入至训练完成的对抗网络模型进行处理,得到所述待测生活照样本对应的证件照。
8.根据权利要求7所述的装置,其特征在于,所述预处理模块具体用于:
对采集的人体的生活照图像进行筛选,筛选得到包含人体正脸的生活照图像。
9.根据权利要求8所述的装置,其特征在于,所述预处理模块具体用于:
通过UNet模型对采集到的生活照图像进行前景和背景的分割,提取人体部分的图像,其中,前景为生活照图像中的人体部分,背景为生活照图像中的背景部分。
10.根据权利要求9所述的装置,其特征在于,所述预处理模块具体用于:
将所述生活照图像输入UNet模型,其中,UNet模型以卷积模块的编码解码器构成,利用编码解码器对生活照图像的原图像进行编码,对图像进行层层的特征提取,通过卷积结构提取生活照图像中的人体部分的信息;经过多层的反卷积,对提取到的特征进行解码,并加入编码过程中丢失的信息,生成与原图像尺寸相同的图像,分割出人体的轮廓,得到人体部分的图像。
11.根据权利要求7所述的装置,其特征在于,所述生成器采用编码解码的形式,为全卷积结构,用于将输入的生活照图像先下采样到低维度,进一步上采样到原始分辨率,生成证件照图像;
所述判别器采用马尔科夫性的判别器,用于判断生成的证件照图像与生活照图像本人是否匹配;其中,输入包括两种类型:原始生活照图像及生成的证件照图像,原始生活照图像及真实的证件照图像;输出为0表示两者不匹配,输出1表示两者匹配;
所述分类器由多层卷积模块组成,用于对生成的证件照图像的类别进行判断,其中,所述分类器为二分类器,0表示是生成器生成的伪图像,1表示是真实的证件照图像。
12.根据权利要求11所述的装置,其特征在于,所述模型训练模块进行迭代训练过程为:
将所述人体部分的图像作为输入样本输入生成器,训练生成器,得到生成的证件照图像;
输入真实的证件照图像和人体的生活照图像,设置对应的标签值为1训练判别器,得到真实的证件照图像和人体的生活照图像的匹配程度概率;
输入生成的证件照图像和人体的生活照图像,设置对应的标签值为0训练判别器,得到生成的证件照图像和人体的生活照图像的匹配程度概率;
输入真实的证件照图像,设置对应的标签值为1,训练分类器,得到真实证件照图像的类别概率;
输入生成的证件照图像,设置对应的标签值为0,训练分类器,得到生成证件照图像的类别概率;
根据真实的证件照图像和人体的生活照图像的匹配程度概率、生成的证件照图像和人体的生活照图像的匹配程度概率,计算判别器的损失函数值;
根据真实证件照图像的类别概率、生成证件照图像的类别概率,计算分类器的损失函数值;
根据判别器的损失函数值,更新判别器模型参数值;
根据分类器的损失函数值,更新分类器模型参数值;
根据生成的证件照图像和人体的生活照图像的匹配程度概率、生成证件照图像的类别概率,计算生成器的损失函数值;
根据生成器的损失函数值,更新生成器的模型参数值。
13.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一所述方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111325281.4A CN114022350A (zh) | 2021-11-10 | 2021-11-10 | 一种将生活照处理成证件照的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111325281.4A CN114022350A (zh) | 2021-11-10 | 2021-11-10 | 一种将生活照处理成证件照的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114022350A true CN114022350A (zh) | 2022-02-08 |
Family
ID=80063159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111325281.4A Pending CN114022350A (zh) | 2021-11-10 | 2021-11-10 | 一种将生活照处理成证件照的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114022350A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798369A (zh) * | 2020-06-29 | 2020-10-20 | 电子科技大学 | 一种基于循环条件生成对抗网络的人脸衰老图像合成方法 |
CN112199976A (zh) * | 2019-07-08 | 2021-01-08 | 中国移动通信集团浙江有限公司 | 证件图片生成方法及装置 |
CN112699717A (zh) * | 2019-10-23 | 2021-04-23 | 中国科学院遥感与数字地球研究所 | 基于gan网络的sar图像生成方法及生成装置 |
CN112819016A (zh) * | 2021-02-19 | 2021-05-18 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及存储介质 |
-
2021
- 2021-11-10 CN CN202111325281.4A patent/CN114022350A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112199976A (zh) * | 2019-07-08 | 2021-01-08 | 中国移动通信集团浙江有限公司 | 证件图片生成方法及装置 |
CN112699717A (zh) * | 2019-10-23 | 2021-04-23 | 中国科学院遥感与数字地球研究所 | 基于gan网络的sar图像生成方法及生成装置 |
CN111798369A (zh) * | 2020-06-29 | 2020-10-20 | 电子科技大学 | 一种基于循环条件生成对抗网络的人脸衰老图像合成方法 |
CN112819016A (zh) * | 2021-02-19 | 2021-05-18 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
张扬 等: ""基于改进生成对抗网络的动漫人物头像生成算法"", 《计算机科学》, vol. 48, no. 1, 31 January 2021 (2021-01-31), pages 182 - 189 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7379787B2 (ja) | フィーチャーピラミッドを融合した敵対的生成ネットワークによる画像ヘイズ除去方法 | |
CN113658051A (zh) | 一种基于循环生成对抗网络的图像去雾方法及系统 | |
CN112699786B (zh) | 一种基于空间增强模块的视频行为识别方法及系统 | |
CN108921942B (zh) | 对图像进行2d转制3d的方法及装置 | |
CN108629753A (zh) | 一种基于循环神经网络的人脸图像恢复方法及装置 | |
CN106709866A (zh) | 证件照去除网格水印的方法及装置、人脸验证方法及装置 | |
US20220414838A1 (en) | Image dehazing method and system based on cyclegan | |
CN113111716B (zh) | 一种基于深度学习的遥感影像半自动标注方法和装置 | |
CN112528782A (zh) | 水下鱼类目标检测方法及装置 | |
CN113095314B (zh) | 一种公式识别方法、装置、存储介质及设备 | |
CN114821204A (zh) | 一种基于元学习嵌入半监督学习图像分类方法与系统 | |
Lei et al. | NITES: A non-parametric interpretable texture synthesis method | |
CN111833282A (zh) | 一种基于改进的DDcGAN模型的图像融合方法 | |
CN114037699B (zh) | 一种病理图像分类方法、设备、系统及存储介质 | |
CN114299590A (zh) | 人脸补全模型的训练方法、人脸补全方法及系统 | |
CN112435179B (zh) | 模糊花粉颗粒图片处理方法、装置和电子设备 | |
CN111209886B (zh) | 一种基于深度神经网络的快速行人再识别方法 | |
Achar et al. | Indian currency recognition system using CNN and comparison with yolov5 | |
CN114022350A (zh) | 一种将生活照处理成证件照的方法及装置 | |
CN112288861B (zh) | 一种基于单张照片的人脸三维模型自动构建方法及系统 | |
Wyzykowski et al. | A Universal Latent Fingerprint Enhancer Using Transformers | |
CN111260570B (zh) | 基于循环一致性对抗网络的碑帖二值化背景噪声模拟方法 | |
CN114187668A (zh) | 一种基于正样本训练的人脸静默活体检测方法及装置 | |
Jahidul et al. | Further exploration of deep aggregation for shadow detection | |
CN105335762B (zh) | 一种基于Legendre矩不变量和PSO-LSSVM分类器的密级标识识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |