CN111860041A - 人脸转换模型训练方法、装置、设备及介质 - Google Patents
人脸转换模型训练方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN111860041A CN111860041A CN201910343205.2A CN201910343205A CN111860041A CN 111860041 A CN111860041 A CN 111860041A CN 201910343205 A CN201910343205 A CN 201910343205A CN 111860041 A CN111860041 A CN 111860041A
- Authority
- CN
- China
- Prior art keywords
- face
- image
- neural network
- loss
- face image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 131
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012549 training Methods 0.000 title claims abstract description 47
- 238000013528 artificial neural network Methods 0.000 claims abstract description 81
- 239000013598 vector Substances 0.000 claims abstract description 43
- 230000006870 function Effects 0.000 claims description 25
- 230000008859 change Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 6
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了人脸转换模型训练方法、装置、设备及介质,本发明实施例通过在人脸图像集中随机选取一个人脸图像输入至预设的人脸转换神经网络中,提取特征向量;基于特征向量和人脸转换神经网络中保存的目标人脸图像,生成换脸图像;计算与换脸图像和目标人脸图像的损失值;判断损失值是否达到预设条件;基于损失值调整人脸转换神经网络的参数;在剩余的人脸图像中随机选取一个人脸图像,输入至调整过参数的人脸转换神经网络中,提取特征向量;生成人脸转换模型。能够基于多个不同人物的人脸图像对人脸转换神经网络进行训练,进而能够得到人脸转换模型,该人脸转换模型能够提高人脸转换的处理速度。
Description
技术领域
本发明涉及数字图像处理技术领域,尤其涉及一种人脸转换模型训练方法、装置、设备及介质。
背景技术
人脸转换是计算机视觉领域中一个比较热门的应用,人脸转换一般可以用于视频合成、提供隐私服务、肖像更换或者其他有创新性的应用。
目前,人工智能(Artificial Intelligence,AI)技术在人脸转换上的应用得到了广泛的关注。其中,基于深度换脸(Deepfake)原理,通过训练神经网络模型实现点对点式人脸转换,即,仅能训练神经模型从A转换为B,其中,A和B是不会发生改变的。若A或B发生了改变,神经网络模型就需要重新进行训练学习。
因此,点对点式人脸转换在处理多个不同人脸的时候,处理速度慢,效率低。
发明内容
本发明实施例提供了一种人脸转换模型训练方法、装置、设备及介质,能够基于多个不同人物的人脸图像对人脸转换神经网络进行训练,进而能够得到人脸转换模型,该人脸转换模型能够提高人脸转换的处理速度。
第一方面,本发明实施例提供了一种人脸转换模型训练方法,方法包括:
获取人脸图像集;所述人脸图像集包括多个不同人物的人脸图像;
执行下述迭代操作:
S101,在所述人脸图像集中随机选取一个人脸图像输入至预设的人脸转换神经网络中,提取特征向量,执行S102;
S102,基于所述特征向量和所述人脸转换神经网络中保存的目标人脸图像,生成换脸图像,执行S103;
S103,计算与所述换脸图像和所述目标人脸图像的损失值,执行S104;
S104,判断所述损失值是否达到预设条件;若是,则执行S107;若否,则执行S105;
S105,基于损失值调整所述人脸转换神经网络的参数,执行S106;
S106,在剩余的人脸图像中随机选取一个人脸图像,输入至调整过参数的人脸转换神经网络中,提取特征向量,执行S102;
S107,生成人脸转换模型;其中所述预设的人脸转换神经网络由通用编码器和多个解码器构成。
根据本发明实施例的提供的人脸转换模型训练方法,所述人脸转换神经网络中保存有多个解码器;
所述基于所述特征向量和所述人脸转换神经网络中保存的目标人脸图像,生成换脸图像,包括:
将所述特征向量分别输入至解码器中;
基于每一个所述解码器中保存的目标人脸图像和所述特征向量,生成多个换脸图像;其中,每一个解码器中保存的目标人脸图像为不同目标人物的人脸图像。
根据本发明实施例的提供的人脸转换模型训练方法,所述人脸转换神经网络中保存有多个解码器;所述换脸图像与所述解码器一一对应;
所述计算与所述换脸图像和所述目标人脸图像的损失值,包括:
针对每一个解码器,计算该解码器对应的换脸图像与该解码器中保存的目标人脸图像的损失值。
根据本发明实施例的提供的人脸转换模型训练方法,所述人脸转换神经网络包括通用编码器;
所述基于损失值调整所述人脸转换神经网络的参数,包括:
计算得到每一个所述解码器得到的损失值后,使用所述损失值调整该损失值对应的解码器参数,并基于每一个所述解码器得到的损失值调整所述通用编码器参数。
根据本发明实施例的提供的人脸转换模型训练方法,所述人脸转换神经网络设计有多个损失函数;
所述损失函数至少包括生成对抗式网络损失函数(Generative AdversarialNets LOSS,GAN LOSS)、一点绝对损失函数L1 LOSS、视觉几何组损失函数(VisualGeometry Group LOSS,VGG LOSS)。
根据本发明实施例的提供的人脸转换模型训练方法,所述计算与所述换脸图像和所述目标人脸图像的损失值,包括:
使用所述GAN LOSS判断所述换脸图像与所述目标人脸图像是否一致;
使用所述L1 LOSS对所述换脸图像与所述目标人脸图像进行逐像素做差后,对所得到的差值进行求和;
使用所述VGG LOSS对所述换脸图像和所述目标人脸图像进行对比。
根据本发明实施例的提供的人脸转换模型训练方法,所述基于损失值调整所述人脸转换神经网络的参数,包括:
依次根据所述多个损失函数得到的损失值,调整所述人脸转换神经网络的参数。
第二方面,本发明实施例提供了一种人脸转换模型训练装置,装置包括:
获取模块,用于获取人脸图像集;所述人脸图像集包括多个不同人物的人脸图像;
迭代模块,用于执行下述迭代操作:
S101,在所述人脸图像集中随机选取一个人脸图像输入至预设的人脸转换神经网络中,提取特征向量,执行S102;
S102,基于所述特征向量和所述人脸转换神经网络中保存的目标人脸图像,生成换脸图像,执行S103;
S103,计算与所述换脸图像和所述目标人脸图像的损失值,执行S104;
S104,判断所述损失值是否达到预设条件;若是,则执行S107;若否,则执行S105;
S105,基于损失值调整所述人脸转换神经网络的参数,执行S106;
S106,在剩余的人脸图像中随机选取一个人脸图像,输入至调整过参数的人脸转换神经网络中,提取特征向量,执行S102;
S107,生成人脸转换模型;其中所述预设的人脸转换神经网络由通用编码器和多个解码器构成。
第三方面,本发明实施例提供了一种计算机设备,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-7任一项所述的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如第一方面的方法。
本发明实施例提供的人脸转换模型训练方法、装置、设备及介质,通过将人脸图像依次输入至人脸转换神经网络中,能够得到换脸图像,基于换脸图像和人脸转换神经网络中保存的目标人脸图像之间的损失值,调整人脸转换神经网络的参数,并将调整后的人脸转换神经网络用于下一张人脸图像的转换中,如此迭代,直至损失值是否达到预设条件,生成人脸转换模型,本发明实施例基于多个不同人物的人脸图像对人脸转换神经网络进行训练,进而能够得到人脸转换模型,该人脸转换模型能够提高人脸转换的处理速度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明一些实施例提供的一种人脸转换模型训练方法流程图;
图2示出了根据本发明一些实施例提供的一种人脸转换模型训练装置的结构图;
图3示出了根据本发明一些实施例提供的一种人脸转换模型训练设备的结构图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
参见图1所述,本发明实施例提供了一种人脸转换模型训练方法,包括:
S100:获取人脸图像集;所述人脸图像集包括多个不同人物的人脸图像。
在具体实施的时候,人脸图像集中每一张人脸图像作为替换图像,而人脸转换神经网络中保存的目标人脸图像是指被替换图像。在这里,获取的人脸图像集中包括的是多个不同人物的人脸图像。
将人脸图像集中不同人物的人脸图像依次输入至预设的人脸转换神经网络中,其中,人脸转换神经网络包括通用编码器和解码器,通用编码器用来提取人脸图像的特征,进而得到人脸图像的特征向量。通用编码器中保存有目标人脸图像,能够基于特征向量以及目标人脸图像进行特征融合,进而得到换脸图像。在这里,采用多个不同人物的人脸图像,使得通用编码器在训练结束后,能够应用于转换不同人物的人脸图像中,而不是仅仅局限于只适用于一个人的人脸转换。
执行下述迭代操作:
S101,在所述人脸图像集中随机选取一个人脸图像输入至预设的人脸转换神经网络中,提取特征向量,执行S102。
在具体实施的时候,人脸图像集中的人脸图像可以是人物的拍摄图像,例如,证件照、生活照等。可以在人脸图像集中随机选取一张人脸图像作为人脸转换神经网络的输入,并提取人脸图像中人脸的特征,如,人脸的表情、脸型和姿态,其中,人脸的姿态可以是人脸在图像中所处的角度,例如,人物的左右转头姿态、上下抬头姿态和人物在平面内的歪头姿态。
此外,也可以将人脸图像集作为一个序列输入至人脸神经网络中。
在这里,预设的人脸转换神经网络是由通用编码器和多个解码器构成的,其中,通用编码器是指在模型训练结束后,该通用编码器能够适用于多个不同人物的人脸图像的特征提取,进而实现训练完成后的人脸转换模型能够将多个不同人物的人脸图像换到其他人的人脸上,而不是分别训练不同人物的人脸图像所需要的编码器。
S102,基于所述特征向量和所述人脸转换神经网络中保存的目标人脸图像,生成换脸图像,执行S103。
在具体实施的时候,将特征向量与目标人脸图像进行糅合,则能够得到换脸图像,例如,提取到A某的特征向量,目标人物图像为B某,则能够得到A某的人脸换至B某人脸的换脸图像。此外,人脸转换神经网络中可以包括有多个解码器,每一个解码器对应保存有一个目标人脸图像。
具体地,人脸转换神经网络中保存有多个解码器;
所述基于所述特征向量和所述人脸转换神经网络中保存的目标人脸图像,生成换脸图像,包括:
将所述特征向量分别输入至解码器中;
基于每一个所述解码器中保存的目标人脸图像和所述特征向量,生成多个换脸图像;其中,每一个解码器中保存的目标人脸图像为不同目标人物的人脸图像。
在具体实施的时候,为了能够实现不同的人脸图像通过本发明实施例中训练得到的人脸转换模型转换成不同的目标人物的换脸图像,在本发明实施例的模型训练过程中,可以设置多个解码器,每一个解码器中都保存有不同的目标人物的目标人脸图像。当提取到一个人的特征向量后,将这个人的人脸图像分别输入至每一个解码器中,得到多个换脸图像,例如,目标人脸图像为甲某、乙某、丙某的人脸图像,而输入的人脸图像为A某的人脸图像,则将A某的特征向量分别输入至甲某、乙某、丙某对应的解码器中,分别得到A某换至甲某的换脸图像、A某换至乙某的换脸图像、A某换至丙某的换脸图像。
S103,计算与所述换脸图像和所述目标人脸图像的损失值,执行S104。
在具体实施的时候,得到换脸图像后,使用损失函数计算换脸图像与目标人脸图像的损失值。
具体地,人脸转换神经网络中保存有多个解码器;所述换脸图像与所述解码器一一对应;
所述计算与所述换脸图像和所述目标人脸图像的损失值,包括:
针对每一个解码器,计算该解码器对应的换脸图像与该解码器中保存的目标人脸图像的损失值。
在具体实施的时候,当得到人脸图像的特征向量后,每一个解码器都会对应输出一个换脸图像,即,换脸图像是与解码器一一对应的,因此,在计算损失值的时候,换脸图像要与对应的解码器中的目标人脸图像来计算损失函数。
为了能够更好地将神经网络的参数调整,每一个解码器都可以对应设置有多个损失函数。
具体地,人脸转换神经网络设计有多个损失函数;
所述损失函数至少包括生成对抗式网络损失函数GAN LOSS、一点绝对损失函数L1LOSS、视觉几何组损失函数VGG LOSS。
在具体实施的时候,一个解码器设置有多个损失函数,例如,GAN LOSS、L1 LOSS、VGG LOSS。对于一个解码器来说,使用所述GAN LOSS判断所述换脸图像与所述目标人脸图像是否一致,根据由GAN LOSS得到的损失值来调整解码器的参数以及通用编码器的参数;使用所述L1 LOSS对所述换脸图像与所述目标人脸图像进行逐像素做差后,对所得到的差值进行求和,由L1 LOSS得到的损失值来调整解码器的参数以及通用编码器的参数;使用所述VGG LOSS对所述换脸图像和所述目标人脸图像进行对比,由VGG LOSS得到的损失值来调整解码器的参数以及通用编码器的参数。此外,除了调整通用编码器和解码器的参数以外,还会根据各个损失值来调整每一个损失函数的权重。
S104,判断所述损失值是否达到预设条件;若是,则执行S107;若否,则执行S105。
在具体实施的时候,预设条件可以是观察计算得到的损失值是否逐渐趋近于零,在每一轮训练的时候,计算得到的损失值越来越趋近于0,则人脸转换神经网络的训练越成功。也可以将预设条件设置为损失值为0,当计算得到的损失值为0,则可以将该人脸转换神经网络作为人脸转换模型。
S105,基于损失值调整所述人脸转换神经网络的参数,执行S106。
在具体实施的时候,基于损失值调整人脸转换神经网络的参数,其中参数可以包括:人脸转换神经网络的层数以及感受野。
S106,在剩余的人脸图像中随机选取一个人脸图像,输入至调整过参数的人脸转换神经网络中,提取特征向量,执行S102。
在具体实施的时候,人脸图像集中的每一个人脸图像都会进行上述S102-S105实施方式进行实施。
S107,生成人脸转换模型。
示例:
人脸图像集为{A、B、C、D···},人脸转换神经网络中包括有多个解码器,分别对应的目标人脸图像为甲、乙、丙,每一个解码器都对应设置有多个损失函数,包括GAN LOSS、L1 LOSS、VGG LOSS。使用人脸转换神经网络提取A的特征向量,将A的特征向量输入至甲、乙、丙分别对应的解码器中,甲对应的解码器输出GAN LOSS对应损失值、L1 LOSS对应的损失值、VGG LOSS对应的损失值,使用这三个损失值调整解码器的参数以及通用编码器的参数,也即调整人脸转换神经网络的参数。使用调整过参数的人脸转换神经网络提取B的特征向量,将B的特征向量输入至甲、乙、丙分别对应的解码器中,甲对应的解码器输出GAN LOSS对应损失值、L1 LOSS对应的损失值、VGG LOSS对应的损失值,使用这三个损失值调整解码器的参数以及通用编码器的参数,也即再次调整了人脸转换神经网络的参数。使用再次调整过参数的人脸转换神经网络的参数提取C的特征向量,将C的特征向量输入至甲、乙、丙分别对应的解码器中,甲对应的解码器输出GAN LOSS对应损失值、L1 LOSS对应的损失值、VGGLOSS对应的损失值,使用这三个损失值调整解码器的参数以及通用编码器的参数,依次类推,直至观察到各个损失函数的损失值无限接近于0。
在应用上述人脸转换神经网络的时候,将多个不同人物的人脸图像输入至本发明实施例中训练好的人脸转换模型中,就能够得到对多个不同人物的换脸图像,无需针对每一个人单独训练一个模型才能与他人进行换脸。
本发明实施例提供的人脸转换模型训练方法,通过将人脸图像依次输入至人脸转换神经网络中,能够得到换脸图像,基于换脸图像和人脸转换神经网络中保存的目标人脸图像之间的损失值,调整人脸转换神经网络的参数,并将调整后的人脸转换神经网络用于下一张人脸图像的转换中,如此迭代,直至损失值是否达到预设条件,生成人脸转换模型,本发明实施例基于多个不同人物的人脸图像对人脸转换神经网络进行训练,进而能够得到人脸转换模型,该人脸转换模型能够提高人脸转换的处理速度。
参见图2所示,本发明实施例提供了一种人脸转换模型训练装置,装置包括:
获取模块,用于获取人脸图像集;所述人脸图像集包括多个不同人物的人脸图像;
迭代模块,用于执行下述迭代操作:
S101,在所述人脸图像集中随机选取一个人脸图像输入至预设的人脸转换神经网络中,提取特征向量,执行S102;
S102,基于所述特征向量和所述人脸转换神经网络中保存的目标人脸图像,生成换脸图像,执行S103;
S103,计算与所述换脸图像和所述目标人脸图像的损失值,执行S104;
S104,判断所述损失值是否达到预设条件;若是,则执行S107;若否,则执行S105;
S105,基于损失值调整所述人脸转换神经网络的参数,执行S106;
S106,在剩余的人脸图像中随机选取一个人脸图像,输入至调整过参数的人脸转换神经网络中,提取特征向量,执行S102;
S107,生成人脸转换模型。
另外,结合图1描述的本发明实施例的人脸转换模型训练方法可以由人脸转换模型训练设备来实现。图3示出了本发明实施例提供的人脸转换模型训练设备的硬件结构示意图。
人脸转换模型训练设备可以包括处理器301以及存储有计算机程序指令的存储器302。
具体地,上述处理器301可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器302可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器302可在数据处理装置的内部或外部。在特定实施例中,存储器302是非易失性固态存储器。在特定实施例中,存储器302包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现上述实施例中的任意一种人脸转换模型训练方法。
在一个示例中,人脸转换模型训练设备还可包括通信接口303和总线310。其中,如图3所示,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
通信接口303,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线310包括硬件、软件或两者,将人脸转换模型训练设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
另外,结合上述实施例中的人脸转换模型训练方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种人脸转换模型训练方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种人脸转换模型训练方法,其特征在于,所述方法包括:
获取人脸图像集;所述人脸图像集包括多个不同人物的人脸图像;
执行下述迭代操作:
S101,在所述人脸图像集中随机选取一个人脸图像输入至预设的人脸转换神经网络中,提取特征向量,执行S102;
S102,基于所述特征向量和所述人脸转换神经网络中保存的目标人脸图像,生成换脸图像,执行S103;
S103,计算与所述换脸图像和所述目标人脸图像的损失值,执行S104;
S104,判断所述损失值是否达到预设条件;若是,则执行S107;若否,则执行S105;
S105,基于损失值调整所述人脸转换神经网络的参数,执行S106;
S106,在剩余的人脸图像中随机选取一个人脸图像,输入至调整过参数的人脸转换神经网络中,提取特征向量,执行S102;
S107,生成人脸转换模型;其中所述预设的人脸转换神经网络由通用编码器和多个解码器构成。
2.根据权利要求1所述的方法,其特征在于,所述人脸转换神经网络中保存有多个解码器;
所述基于所述特征向量和所述人脸转换神经网络中保存的目标人脸图像,生成换脸图像,包括:
将所述特征向量分别输入至解码器中;
基于每一个所述解码器中保存的目标人脸图像和所述特征向量,生成多个换脸图像;其中,每一个解码器中保存的目标人脸图像为不同目标人物的人脸图像。
3.根据权利要求1所述的方法,其特征在于,所述人脸转换神经网络中保存有多个解码器;所述换脸图像与所述解码器一一对应;
所述计算与所述换脸图像和所述目标人脸图像的损失值,包括:
针对每一个解码器,计算该解码器对应的换脸图像与该解码器中保存的目标人脸图像的损失值。
4.根据权利要求3所述的方法,其特征在于,所述人脸转换神经网络包括通用编码器;
所述基于损失值调整所述人脸转换神经网络的参数,包括:
计算得到每一个所述解码器得到的损失值后,使用所述损失值调整该损失值对应的解码器参数,并基于每一个所述解码器得到的损失值调整所述通用编码器参数。
5.根据权利要求1所述的方法,其特征在于,所述人脸转换神经网络设计有多个损失函数;
所述损失函数至少包括生成对抗式网络损失函数GAN LOSS、一点绝对损失函数L1LOSS、视觉几何组损失函数VGG LOSS。
6.根据权利要求5所述的方法,其特征在于,所述计算与所述换脸图像和所述目标人脸图像的损失值,包括:
使用所述GAN LOSS判断所述换脸图像与所述目标人脸图像是否一致;
使用所述L1 LOSS对所述换脸图像与所述目标人脸图像进行逐像素做差后,对所得到的差值进行求和;
使用所述VGG LOSS对所述换脸图像和所述目标人脸图像进行对比。
7.根据权利要求5所述的方法,其特征在于,所述基于损失值调整所述人脸转换神经网络的参数,包括:
依次根据所述多个损失函数得到的损失值,调整所述人脸转换神经网络的参数。
8.一种人脸转换模型训练装置,其特征在于,所述装置包括:
获取模块,用于获取人脸图像集;所述人脸图像集包括多个不同人物的人脸图像;
迭代模块,用于执行下述迭代操作:
S101,在所述人脸图像集中随机选取一个人脸图像输入至预设的人脸转换神经网络中,提取特征向量,执行S102;
S102,基于所述特征向量和所述人脸转换神经网络中保存的目标人脸图像,生成换脸图像,执行S103;
S103,计算与所述换脸图像和所述目标人脸图像的损失值,执行S104;
S104,判断所述损失值是否达到预设条件;若是,则执行S107;若否,则执行S105;
S105,基于损失值调整所述人脸转换神经网络的参数,执行S106;
S106,在剩余的人脸图像中随机选取一个人脸图像,输入至调整过参数的人脸转换神经网络中,提取特征向量,执行S102;
S107,生成人脸转换模型;其中所述预设的人脸转换神经网络由通用编码器和多个解码器构成。
9.一种计算机设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910343205.2A CN111860041B (zh) | 2019-04-26 | 2019-04-26 | 人脸转换模型训练方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910343205.2A CN111860041B (zh) | 2019-04-26 | 2019-04-26 | 人脸转换模型训练方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111860041A true CN111860041A (zh) | 2020-10-30 |
CN111860041B CN111860041B (zh) | 2024-06-11 |
Family
ID=72951673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910343205.2A Active CN111860041B (zh) | 2019-04-26 | 2019-04-26 | 人脸转换模型训练方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860041B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112258388A (zh) * | 2020-11-02 | 2021-01-22 | 公安部第三研究所 | 一种公共安全视图脱敏测试数据生成方法、系统以及存储介质 |
CN112509154A (zh) * | 2020-11-26 | 2021-03-16 | 北京达佳互联信息技术有限公司 | 图像生成模型的训练方法、图像生成方法及装置 |
CN112734631A (zh) * | 2020-12-31 | 2021-04-30 | 北京深尚科技有限公司 | 基于微调模型的视频图像换脸方法、装置、设备及介质 |
CN113191940A (zh) * | 2021-05-12 | 2021-07-30 | 广州虎牙科技有限公司 | 图像处理方法、装置、设备及介质 |
CN113628103A (zh) * | 2021-08-26 | 2021-11-09 | 深圳万兴软件有限公司 | 基于多级损失的高细粒度卡通人脸生成方法及其相关组件 |
CN116051705A (zh) * | 2022-09-21 | 2023-05-02 | 北京数字力场科技有限公司 | 模型训练方法、3d服装渲染方法、电子设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170025162A (ko) * | 2015-08-27 | 2017-03-08 | 연세대학교 산학협력단 | 얼굴 영상의 얼굴 나이 변환 방법 및 그 장치 |
CN107330904A (zh) * | 2017-06-30 | 2017-11-07 | 北京金山安全软件有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN107437077A (zh) * | 2017-08-04 | 2017-12-05 | 深圳市唯特视科技有限公司 | 一种基于生成对抗网络的旋转面部表示学习的方法 |
CN107977928A (zh) * | 2017-12-21 | 2018-05-01 | 广东欧珀移动通信有限公司 | 表情生成方法、装置、终端及存储介质 |
CN108288072A (zh) * | 2018-01-26 | 2018-07-17 | 深圳市唯特视科技有限公司 | 一种基于生成对抗网络的面部表情合成方法 |
CN108596024A (zh) * | 2018-03-13 | 2018-09-28 | 杭州电子科技大学 | 一种基于人脸结构信息的肖像生成方法 |
CN108965740A (zh) * | 2018-07-11 | 2018-12-07 | 深圳超多维科技有限公司 | 一种实时视频换脸方法、装置、设备和存储介质 |
CN109063658A (zh) * | 2018-08-08 | 2018-12-21 | 吴培希 | 一种利用深度学习在多移动终端视频人物换脸的方法 |
CN109308725A (zh) * | 2018-08-29 | 2019-02-05 | 华南理工大学 | 一种移动端表情趣图生成的系统 |
CN109658420A (zh) * | 2018-11-21 | 2019-04-19 | 深圳艺达文化传媒有限公司 | 短视频的换脸方法及相关产品 |
US20190122329A1 (en) * | 2017-10-24 | 2019-04-25 | Vmaxx, Inc. | Face Replacement and Alignment |
-
2019
- 2019-04-26 CN CN201910343205.2A patent/CN111860041B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170025162A (ko) * | 2015-08-27 | 2017-03-08 | 연세대학교 산학협력단 | 얼굴 영상의 얼굴 나이 변환 방법 및 그 장치 |
CN107330904A (zh) * | 2017-06-30 | 2017-11-07 | 北京金山安全软件有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN107437077A (zh) * | 2017-08-04 | 2017-12-05 | 深圳市唯特视科技有限公司 | 一种基于生成对抗网络的旋转面部表示学习的方法 |
US20190122329A1 (en) * | 2017-10-24 | 2019-04-25 | Vmaxx, Inc. | Face Replacement and Alignment |
CN107977928A (zh) * | 2017-12-21 | 2018-05-01 | 广东欧珀移动通信有限公司 | 表情生成方法、装置、终端及存储介质 |
CN108288072A (zh) * | 2018-01-26 | 2018-07-17 | 深圳市唯特视科技有限公司 | 一种基于生成对抗网络的面部表情合成方法 |
CN108596024A (zh) * | 2018-03-13 | 2018-09-28 | 杭州电子科技大学 | 一种基于人脸结构信息的肖像生成方法 |
CN108965740A (zh) * | 2018-07-11 | 2018-12-07 | 深圳超多维科技有限公司 | 一种实时视频换脸方法、装置、设备和存储介质 |
CN109063658A (zh) * | 2018-08-08 | 2018-12-21 | 吴培希 | 一种利用深度学习在多移动终端视频人物换脸的方法 |
CN109308725A (zh) * | 2018-08-29 | 2019-02-05 | 华南理工大学 | 一种移动端表情趣图生成的系统 |
CN109658420A (zh) * | 2018-11-21 | 2019-04-19 | 深圳艺达文化传媒有限公司 | 短视频的换脸方法及相关产品 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112258388A (zh) * | 2020-11-02 | 2021-01-22 | 公安部第三研究所 | 一种公共安全视图脱敏测试数据生成方法、系统以及存储介质 |
CN112509154A (zh) * | 2020-11-26 | 2021-03-16 | 北京达佳互联信息技术有限公司 | 图像生成模型的训练方法、图像生成方法及装置 |
CN112509154B (zh) * | 2020-11-26 | 2024-03-22 | 北京达佳互联信息技术有限公司 | 图像生成模型的训练方法、图像生成方法及装置 |
CN112734631A (zh) * | 2020-12-31 | 2021-04-30 | 北京深尚科技有限公司 | 基于微调模型的视频图像换脸方法、装置、设备及介质 |
CN113191940A (zh) * | 2021-05-12 | 2021-07-30 | 广州虎牙科技有限公司 | 图像处理方法、装置、设备及介质 |
CN113628103A (zh) * | 2021-08-26 | 2021-11-09 | 深圳万兴软件有限公司 | 基于多级损失的高细粒度卡通人脸生成方法及其相关组件 |
CN113628103B (zh) * | 2021-08-26 | 2023-09-29 | 深圳万兴软件有限公司 | 基于多级损失的高细粒度卡通人脸生成方法及其相关组件 |
CN116051705A (zh) * | 2022-09-21 | 2023-05-02 | 北京数字力场科技有限公司 | 模型训练方法、3d服装渲染方法、电子设备及存储介质 |
CN116051705B (zh) * | 2022-09-21 | 2023-10-27 | 北京数字力场科技有限公司 | 模型训练方法、3d服装渲染方法、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111860041B (zh) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860041A (zh) | 人脸转换模型训练方法、装置、设备及介质 | |
CN109410974B (zh) | 语音增强方法、装置、设备及存储介质 | |
CN111062880A (zh) | 一种基于条件生成对抗网络的水下图像实时增强方法 | |
CN108764235B (zh) | 目标检测方法、设备及介质 | |
CN110570443B (zh) | 一种基于结构约束条件生成模型的图像线状目标提取方法 | |
EP1946244A2 (en) | Extracting a moving object boundary | |
CN111860044A (zh) | 人脸换脸方法、装置、设备及计算机存储介质 | |
CN105373810B (zh) | 一种用于建立动作识别模型的方法及系统 | |
CN112101072A (zh) | 人脸匹配方法、装置、设备及介质 | |
CN111986275A (zh) | 一种多模态半色调图像的逆半色调化方法 | |
CN111639545B (zh) | 一种人脸识别方法、装置、设备及介质 | |
CN113723344A (zh) | 视频的识别方法、装置、可读介质和电子设备 | |
CN113313086B (zh) | 特征向量转换模型处理方法、装置、服务器及存储介质 | |
CN115631343A (zh) | 基于全脉冲网络的图像生成方法、装置、设备及存储介质 | |
KR102674064B1 (ko) | 인공지능 기반의 시각지능을 활용한 비전 검사에 따른 불량 검출 통합 제어 시스템 | |
CN116245965A (zh) | 基于物理模型的太赫兹单像素实时成像方法及系统 | |
JPH0546583A (ja) | 動物体行動認識装置 | |
CN109003254B (zh) | 基于逻辑回归覆冰检测方法、装置、设备、系统及介质 | |
CN112383765B (zh) | 一种vr图像传输方法及装置 | |
CN112102148A (zh) | 基于神经网络的人物发型替换方法、装置、设备和介质 | |
CN111861948A (zh) | 图像处理方法、装置、设备及计算机存储介质 | |
CN113205013B (zh) | 物体识别方法、装置、设备及存储介质 | |
CN116634168B (zh) | 一种基于工业相机的图像无损处理方法及系统 | |
CN112766370A (zh) | 训练图像增强模型的方法、装置、设备及存储介质 | |
CN114596599A (zh) | 一种人脸识别活体检测方法、装置、设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |