CN110796089A - 用于训练换脸模型的方法和设备 - Google Patents
用于训练换脸模型的方法和设备 Download PDFInfo
- Publication number
- CN110796089A CN110796089A CN201911043178.3A CN201911043178A CN110796089A CN 110796089 A CN110796089 A CN 110796089A CN 201911043178 A CN201911043178 A CN 201911043178A CN 110796089 A CN110796089 A CN 110796089A
- Authority
- CN
- China
- Prior art keywords
- face
- sample set
- model
- template
- changing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 222
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000010801 machine learning Methods 0.000 claims abstract description 12
- 230000008859 change Effects 0.000 claims description 32
- 238000013145 classification model Methods 0.000 claims description 24
- 230000001815 facial effect Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 10
- 238000005259 measurement Methods 0.000 claims description 10
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 230000008921 facial expression Effects 0.000 claims description 5
- 238000012706 support-vector machine Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000004373 mandible Anatomy 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请实施例公开了用于训练换脸模型的方法和设备。该方法的一具体实施方式包括:接收用户发送的换脸模型训练请求,其中,换脸模型训练请求中包括用户提供的换脸前人脸样本集和指定的模板人脸标识;从模板人脸标识对应的预训练模型集中确定与换脸前人脸样本集匹配的预训练模型,其中,预训练模型集包括基于目标人脸样本集组和模板人脸标识对应的模板人脸样本集组预先训练过的模型;从模板人脸样本集组中确定与换脸前人脸样本集匹配的模板人脸样本集;利用机器学习方法,基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型。该实施方式节省了换脸模型的训练耗时,提高了换脸模型的训练效率。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于训练换脸模型的方法和设备。
背景技术
目前流行的深度换脸框架中,通常采用生成式对抗网络(GenerativeAdversarial Networks,GAN)的技术,能够得到令人满意的人脸生成效果。在通用的生成式对抗网络框架的模型训练上,虽然在足够的样本和算力基础上,能够保证生成高质量的人脸,但仍然存在训练时间漫长的问题,这将会影响深度换脸技术在实际应用中的前景以及用户体验。
发明内容
本申请实施例提出了用于训练换脸模型的方法和设备。
第一方面,本申请实施例提供了一种用于训练换脸模型的方法,包括:接收用户发送的换脸模型训练请求,其中,换脸模型训练请求中包括用户提供的换脸前人脸样本集和指定的模板人脸标识;从模板人脸标识对应的预训练模型集中确定与换脸前人脸样本集匹配的预训练模型,其中,预训练模型集包括基于目标人脸样本集组和模板人脸标识对应的模板人脸样本集组预先训练过的模型;从模板人脸样本集组中确定与换脸前人脸样本集匹配的模板人脸样本集;利用机器学习方法,基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型。
在一些实施例中,从模板人脸标识对应的预训练模型集中确定与换脸前人脸样本集匹配的预训练模型,包括:若用户的历史换脸记录中存在模板人脸标识对应的预训练模型,将模板人脸标识对应的预训练模型确定为与换脸前人脸样本集匹配的预训练模型。
在一些实施例中,从模板人脸标识对应的预训练模型集中确定与换脸前人脸样本集匹配的预训练模型,还包括:若用户的历史换脸记录中不存在模板人脸标识对应的预训练模型,识别换脸前人脸样本集的人脸属性信息;基于所识别的人脸属性信息,从预训练模型集中确定预训练模型。
在一些实施例中,人脸属性信息包括以下至少一种维度的信息:性别、年龄段、人种、脸部饰品、脸型。
在一些实施例中,识别换脸前人脸样本集的人脸属性信息,包括:将换脸前人脸样本集输入至预先训练的第一分类模型,得到换脸前人脸样本集的性别、年龄段、人种、脸部饰品中的至少一种维度的信息,其中,第一分类模型是基于卷积神经网络的分类模型。
在一些实施例中,识别换脸前人脸样本集的人脸属性信息,包括:提取换脸前人脸样本集的人脸脸型分类特征;将所提取的人脸脸型分类特征输入至预先训练的第二分类模型,得到换脸前人脸样本集的脸型,其中,第二分类模型是基于支持向量机的分类模型。
在一些实施例中,提取换脸前人脸样本集的人脸脸型分类特征,包括:提取换脸前人脸样本集的人脸特征点信息;基于所提取的人脸特征点信息,计算换脸前人脸样本集的人脸测量参数;将所提取的人脸特征点信息和所计算的人脸测量参数合并为换脸前人脸样本集的人脸脸型分类特征。
在一些实施例中,基于所识别的人脸属性信息,从预训练模型集中确定预训练模型,包括:从预训练模型集中确定与所识别的人脸属性信息匹配的预训练模型子集;计算换脸前人脸样本集与预训练模型子集中的预训练模型对应的目标人脸样本集的相似度;基于所计算的相似度,从预训练模型子集中确定预训练模型。
在一些实施例中,计算换脸前人脸样本集与预训练模型子集中的预训练模型对应的目标人脸样本集的相似度,包括:提取换脸前人脸样本集的平均人脸特征向量;计算所提取的平均人脸特征向量与预训练模型子集中的预训练模型对应的目标人脸样本集的平均人脸特征向量的余弦相似度。
在一些实施例中,从模板人脸样本集组中确定与换脸前人脸样本集匹配的模板人脸样本集,包括:提取换脸前人脸样本集的人脸丰富度特征;计算所提取的人脸丰富度特征与模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度;基于所计算的匹配度,从模板人脸样本集组中确定模板人脸样本集。
在一些实施例中,提取换脸前人脸样本集的人脸丰富度特征,包括:提取换脸前人脸样本集的人脸特征信息;对人脸特征信息进行直方图统计,得到换脸前人脸样本集的人脸丰富度特征。
在一些实施例中,人脸特征信息包括以下至少一种维度的信息:人脸特征点、人脸角度和人脸表情。
在一些实施例中,计算所提取的人脸丰富度特征与模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度,包括:利用直方图匹配方法,计算所提取的人脸丰富度特征与模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度。
在一些实施例中,基于所计算的匹配度,从模板人脸样本集组中确定模板人脸样本集,包括:若模板人脸样本集组中存在匹配度大于预设匹配度阈值的模板人脸样本集,从模板人脸样本集组中选取匹配度最高的模板人脸样本集;若模板人脸样本集组中不存在匹配度大于预设匹配度阈值的模板人脸样本集,从模板人脸样本集组中选取通用的模板人脸样本集。
在一些实施例中,预训练模型集通过如下步骤训练:获取多个目标人脸样本;按照人脸属性,将多个目标人脸样本划分为目标人脸样本集组,其中,同一目标人脸样本集中的目标人脸样本的人脸属性相似;对于目标人脸样本集组中的目标人脸样本集,基于该目标人脸样本集和与该目标人脸样本集匹配的模板人脸样本集对生成式对抗网络进行训练,得到预训练模型。
在一些实施例中,预训练模型包括生成模型和判别模型;以及利用机器学习方法,基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型,包括:将换脸前人脸样本集输入所确定的预训练模型的生成模型,得到换脸后人脸样本集;将换脸后人脸样本集和所确定的模板人脸样本集输入所确定的预训练模型的判别模型,得到判别结果,其中,判别结果用于表征换脸后人脸样本集和所确定的模板人脸样本集是真实样本集的概率;基于判别结果调整所确定的预训练模型的生成模型和判别模型的参数。
在一些实施例中,基于判别结果调整所确定的预训练模型的生成模型和判别模型的参数,包括:确定判别结果是否满足约束条件;若判别结果不满足约束条件,基于判别结果调整所确定的预训练模型的生成模型和判别模型的参数,以及再次基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练;若判别结果满足约束条件,确定换脸模型训练完成,以及将所确定的预训练模型的生成模型最后一次输出的换脸后人脸样本集发送给用户。
第二方面,本申请实施例提供了一种用于训练换脸模型的装置,包括:接收单元,被配置成接收用户发送的换脸模型训练请求,其中,换脸模型训练请求中包括用户提供的换脸前人脸样本集和指定的模板人脸标识;第一确定单元,被配置成从模板人脸标识对应的预训练模型集中确定与换脸前人脸样本集匹配的预训练模型,其中,预训练模型集包括基于目标人脸样本集组和模板人脸标识对应的模板人脸样本集组预先训练过的模型;第二确定单元,被配置成从模板人脸样本集组中确定与换脸前人脸样本集匹配的模板人脸样本集;训练单元,被配置成利用机器学习方法,基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型。
在一些实施例中,第一确定单元包括:第一确定子单元,被配置成若用户的历史换脸记录中存在模板人脸标识对应的预训练模型,将模板人脸标识对应的预训练模型确定为与换脸前人脸样本集匹配的预训练模型。
在一些实施例中,第一确定单元还包括:识别子单元,被配置成若用户的历史换脸记录中不存在模板人脸标识对应的预训练模型,识别换脸前人脸样本集的人脸属性信息;第二确定子单元,被配置成基于所识别的人脸属性信息,从预训练模型集中确定预训练模型。
在一些实施例中,人脸属性信息包括以下至少一种维度的信息:性别、年龄段、人种、脸部饰品、脸型。
在一些实施例中,识别子单元包括:第一分类模块,被配置成将换脸前人脸样本集输入至预先训练的第一分类模型,得到换脸前人脸样本集的性别、年龄段、人种、脸部饰品中的至少一种维度的信息,其中,第一分类模型是基于卷积神经网络的分类模型。
在一些实施例中,识别子单元包括:提取模块,被配置成提取换脸前人脸样本集的人脸脸型分类特征;第二分类模块,被配置成将所提取的人脸脸型分类特征输入至预先训练的第二分类模型,得到换脸前人脸样本集的脸型,其中,第二分类模型是基于支持向量机的分类模型。
在一些实施例中,提取模块进一步被配置成:提取换脸前人脸样本集的人脸特征点信息;基于所提取的人脸特征点信息,计算换脸前人脸样本集的人脸测量参数;将所提取的人脸特征点信息和所计算的人脸测量参数合并为换脸前人脸样本集的人脸脸型分类特征。
在一些实施例中,第二确定子单元包括:第一确定模块,被配置成从预训练模型集中确定与所识别的人脸属性信息匹配的预训练模型子集;计算模块,被配置成计算换脸前人脸样本集与预训练模型子集中的预训练模型对应的目标人脸样本集的相似度;第二确定模块,被配置成基于所计算的相似度,从预训练模型子集中确定预训练模型。
在一些实施例中,计算模块进一步被配置成:提取换脸前人脸样本集的平均人脸特征向量;计算所提取的平均人脸特征向量与预训练模型子集中的预训练模型对应的目标人脸样本集的平均人脸特征向量的余弦相似度。
在一些实施例中,第二确定单元包括:提取子单元,被配置成提取换脸前人脸样本集的人脸丰富度特征;计算子单元,被配置成计算所提取的人脸丰富度特征与模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度;第三确定子单元,被配置成基于所计算的匹配度,从模板人脸样本集组中确定模板人脸样本集。
在一些实施例中,提取子单元进一步被配置成:提取换脸前人脸样本集的人脸特征信息;对人脸特征信息进行直方图统计,得到换脸前人脸样本集的人脸丰富度特征。
在一些实施例中,人脸特征信息包括以下至少一种维度的信息:人脸特征点、人脸角度和人脸表情。
在一些实施例中,计算子单元进一步被配置成:利用直方图匹配方法,计算所提取的人脸丰富度特征与模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度。
在一些实施例中,第三确定子单元进一步被配置成:若模板人脸样本集组中存在匹配度大于预设匹配度阈值的模板人脸样本集,从模板人脸样本集组中选取匹配度最高的模板人脸样本集;若模板人脸样本集组中不存在匹配度大于预设匹配度阈值的模板人脸样本集,从模板人脸样本集组中选取通用的模板人脸样本集。
在一些实施例中,预训练模型集通过如下步骤训练:获取多个目标人脸样本;按照人脸属性,将多个目标人脸样本划分为目标人脸样本集组,其中,同一目标人脸样本集中的目标人脸样本的人脸属性相似;对于目标人脸样本集组中的目标人脸样本集,基于该目标人脸样本集和与该目标人脸样本集匹配的模板人脸样本集对生成式对抗网络进行训练,得到预训练模型。
在一些实施例中,预训练模型包括生成模型和判别模型;以及训练单元包括:生成子单元,被配置成将换脸前人脸样本集输入所确定的预训练模型的生成模型,得到换脸后人脸样本集;判别子单元,被配置成将换脸后人脸样本集和所确定的模板人脸样本集输入所确定的预训练模型的判别模型,得到判别结果,其中,判别结果用于表征换脸后人脸样本集和所确定的模板人脸样本集是真实样本集的概率;调整子单元,被配置成基于判别结果调整所确定的预训练模型的生成模型和判别模型的参数。
在一些实施例中,调整子单元进一步被配置成:确定判别结果是否满足约束条件;若判别结果不满足约束条件,基于判别结果调整所确定的预训练模型的生成模型和判别模型的参数,以及再次基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练;若判别结果满足约束条件,确定换脸模型训练完成,以及将所确定的预训练模型的生成模型最后一次输出的换脸后人脸样本集发送给用户。
第三方面,本申请实施例提供了一种计算机设备,该计算机设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本申请实施例提供的用于训练换脸模型的方法和设备,首先接收用户发送的换脸模型训练请求;之后从换脸模型训练请求中的模板人脸标识对应的预训练模型集中确定与换脸模型训练请求中的换脸前人脸样本集匹配的预训练模型;然后从模板人脸标识对应的模板人脸样本集组中确定与换脸模型训练请求中换脸前人脸样本集匹配的模板人脸样本集;最后利用机器学习方法,基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型。利用预训练模型训练换脸模型,避免了“零起点”训练,节省了换脸模型的训练耗时,提高了换脸模型的训练效率。进而为深度换脸技术在实际应用和体验效果上起到积极作用。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请一些实施例可以应用于其中的示例性系统架构;
图2是根据本申请的用于训练换脸模型的方法的一个实施例的流程图;
图3是根据本申请的用于训练换脸模型的方法的又一个实施例的流程图;
图4是适于用来实现本申请一些实施例的计算机设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于训练换脸模型的方法的实施例的示例性系统架构100。
如图1所示,系统架构100中可以包括设备101、102和网络103。网络103用以在设备101、102之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线目标通信链路或者光纤电缆等等。
设备101、102可以是支持网络连接从而提供各种网络服务的硬件设备或软件。当设备为硬件时,其可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机和服务器等等。这时,作为硬件设备,其可以实现成多个设备组成的分布式设备群,也可以实现成单个设备。当设备为软件时,可以安装在上述所列举的电子设备中。这时,作为软件,其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
在实践中,设备可以通过安装相应的客户端应用或服务端应用来提供相应的网络服务。设备在安装了客户端应用之后,其可以在网络通信中体现为客户端。相应地,在安装了服务端应用之后,其可以在网络通信中体现为服务端。
作为示例,在图1中,设备101体现为客户端,而设备102体现为服务端。具体地,设备101可以是安装有图像处理软件的客户端,设备102可以是图像处理软件的服务端。
需要说明的是,本申请实施例所提供的用于训练换脸模型的方法可以由设备102执行。
应该理解,图1中的网络和设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的网络和设备。
继续参考图2,其示出了根据本申请的用于训练换脸模型的方法的一个实施例的流程200。该用于训练换脸模型的方法可以包括以下步骤:
步骤201,接收用户发送的换脸模型训练请求。
在本实施例中,用于训练换脸模型的方法的执行主体(例如图1所示的设备102)可以接收用户发送的换脸模型训练请求。其中,换脸模型训练请求中可以包括用户提供的换脸前人脸样本集和指定的模板人脸标识。换脸前人脸样本集可以是用户想要替换掉人脸的样本集。换脸前人脸样本集可以是一张或多张换脸前人脸图像,也可以是换脸前人脸视频的多帧视频帧。模板人脸可以是用户想要替换成的人脸。模板人脸标识可以由字母、数字、符号等组成,是模板人脸的唯一标识。
通常,用户的终端设备(例如图1所示的设备101)上可以安装有图像处理软件。用户可以打开图像处理软件,进入主页面。主页面上可以设置有编辑按键。当用户点击编辑按键时,可以显示本地存储的图像列表和/或视频列表,以供用户选择。当用户从图像列表中选定一张或多张图像时,可以将用户选定的一张或多张图像确定为用户提供的换脸前人脸样本集。当用户从视频列表中选定视频时,可以将用户选定的视频的多帧视频帧确定为用户提供的换脸前人脸样本集。此外,在用户选定换脸前人脸样本集之后,会进入图像处理页面。换脸前人脸样本集可以展示在图像处理页面上。图像处理页面上还可以设置有换脸按键。当用户点击换脸按键时,可以显示可供替换的模板人脸列表。当用户从模板人脸列表中选定模板人脸时,可以将用户选定的模板人脸确定为用户指定的模板人脸,其标识就是用户指定的模板人脸标识。此外,在用户选定模板人脸之后,终端设备就可以向上述执行主体发送包括用户提供的换脸前人脸样本集和指定的模板人脸标识的换脸模型训练请求。
步骤202,从模板人脸标识对应的预训练模型集中确定与换脸前人脸样本集匹配的预训练模型。
在本实施例中,上述执行主体可以从用户指定的模板人脸标识对应的预训练模型集中确定与换脸前人脸样本集匹配的预训练模型。例如,上述执行主体可以从用户指定的模板人脸标识对应的预训练模型集中随机选取预训练模型。
在本实施例的一些可选的实现方式中,若用户的历史换脸记录中存在模板人脸标识对应的预训练模型,上述执行主体可以将模板人脸标识对应的预训练模型确定为与换脸前人脸样本集匹配的预训练模型。通常,在用户使用预训练模型训练换脸模型进行换脸之后,会生成一条历史换脸记录。其中,历史换脸记录中可以记录历史换脸过程中所指定的模板人脸标识和所使用的预训练模型标识。可见,若用户的历史换脸记录中存在用户指定的模板人脸标识对应的预训练模型标识,说明用户曾经使用过该模板人脸标识对应的预训练模型训练过换脸模型。此时,上述执行主体可以直接将该模板人脸标识对应的预训练模型确定为本次需要使用的预训练模型。
通常,一个模板人脸标识对应一个预训练模型集。同一预训练模型集可以用于训练同一模板人脸的不同人脸属性信息的换脸模型。同一模板人脸的预训练模型集可以包括基于同一目标人脸的目标人脸样本集组和同一模板人脸的模板人脸样本集组预先训练过的模型。一对目标人脸样本集和模板人脸样本集可以用于训练同一人脸属性信息的预训练模型。可见,同一目标人脸样本集中的目标人脸样本的人脸属性信息相似,同一模板人脸的样本集中的模板人脸样本的人脸属性相似。并且,用于训练同一预训练模型的目标人脸样本集和模板人脸的样本集的人脸属性信息也相似。
通常,人脸属性信息可以包括多个维度的信息,例如,人脸属性信息可以包括但不限于以下至少一种维度的信息:性别(如男、女)、年龄段(如青少年、中年、老年)、人种(如白种人、黄种人、黑种人)、脸部饰品(如是否佩戴脸部饰品)、脸型(如圆形脸型、三角形脸型、椭圆形脸型、方形脸型)等等。
在本实施例的一些可选的实现方式中,预训练模型集通过如下步骤训练:
首先,获取多个目标人脸样本。
这里,多个目标人脸样本可以是同一目标人脸的一批目标人脸样本。
然后,按照人脸属性,将多个目标人脸样本划分为目标人脸样本集组。
其中,同一目标人脸样本集中的目标人脸样本的人脸属性信息相似。例如,人脸属性信息为{男性,中年,黄种人,不戴眼镜,圆形脸型}的目标人脸样本属于一个目标人脸样本集。人脸属性信息为{男性,中年,黄种人,戴眼镜,圆形脸型}的目标人脸样本属于另一个目标人脸样本集。此外,每个目标人脸样本集上都会打上相应的标签,用于记录对应的人脸属性信息。
最后,对于目标人脸样本集组中的目标人脸样本集,基于该目标人脸样本集和与该目标人脸样本集匹配的模板人脸样本集对生成式对抗网络进行训练,得到预训练模型。
其中,同一模板人脸样本集中的模板人脸样本的人脸属性信息相似。并且,与该目标人脸样本集匹配的模板人脸样本集的人脸属性信息与该目标人脸样本集的人脸属性信息相似。例如,目标人脸样本集的人脸属性信息为{男性,中年,黄种人,不戴眼镜,圆形脸型},那么与该目标人脸样本集匹配的模板人脸样本集的人脸属性信息有很大的概率也为{男性,中年,黄种人,不戴眼镜,圆形脸型}。
步骤203,从模板人脸样本集组中确定与换脸前人脸样本集匹配的模板人脸样本集。
在本实施例中,上述执行主体可以从模板人脸样本集组中确定与换脸前人脸样本集匹配的模板人脸样本集。例如,上述执行主体可以从模板人脸样本集组中选取与换脸前人脸样本集的人脸属性信息相似的模板人脸样本集,并确定为与换脸前人脸样本集匹配的模板人脸样本集。
步骤204,利用机器学习方法,基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型。
在本实施例中,上述执行主体可以利用机器学习方法,基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型。具体地,上述执行主体可以将换脸前人脸样本集和所确定的模板人脸样本集作为输入,经过所确定的预训练模型的处理,得到相应的输出。若输出满足不约束条件,则调整所确定的预训练模型的参数,并再次输入换脸前人脸样本集和所确定的模板人脸样本集继续进行训练。若输出满足预设条件,则模型训练完成。
实践中,由于预训练模型是训练过的生成式对抗网络,因此预训练模型可以包括训练过的生成模型和训练过的判别模型。其中,生成模型主要用来学习真实图像分布从而让自身生成的图像更加真实,以骗过判别模型。判别模型则需要对接收到的图像进行真假判别。在整个过程中,生成模型努力地让生成的图像更加真实,而判别模型则努力地去识别出图像的真假,这个过程相当于一个二人博弈,随着时间的推移,生成模型和判别模型在不断地进行对抗,最终两个网络达到了一个动态均衡:生成模型生成的图像接近于真实图像分布,而判别模型识别不出真假图像。
在本实施例的一些可选的实现方式中,上述执行主体可以通过如下步骤训练换脸模型:
首先,将换脸前人脸样本集输入所确定的预训练模型的生成模型,得到换脸后人脸样本集。
然后,将换脸后人脸样本集和所确定的模板人脸样本集输入所确定的预训练模型的判别模型,得到判别结果。
其中,判别结果可以用于表征换脸后人脸样本集和所确定的模板人脸样本集是真实样本集的概率。
最后,基于判别结果调整所确定的预训练模型的生成模型和判别模型的参数。
这里,每得到一次判别结果,上述执行主体都会确定判别结果是否满足约束条件。若判别结果不满足约束条件,上述执行主体可以基于判别结果调整所确定的预训练模型的生成模型和判别模型的参数。随后,再次基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练。若判别结果满足约束条件,上述执行主体可以确定换脸模型训练完成,以及将所确定的预训练模型的生成模型最后一次输出的换脸后人脸样本集发送给用户。其中,生成模型最后一次输出的换脸后人脸样本集就是将换脸前人脸替换成模板人脸的样本集。
本申请实施例提供的用于训练换脸模型的方法,首先接收用户发送的换脸模型训练请求;之后从换脸模型训练请求中的模板人脸标识对应的预训练模型集中确定与换脸模型训练请求中的换脸前人脸样本集匹配的预训练模型;然后从模板人脸标识对应的模板人脸样本集组中确定与换脸模型训练请求中换脸前人脸样本集匹配的模板人脸样本集;最后利用机器学习方法,基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型。利用预训练模型训练换脸模型,避免了“零起点”训练,节省了换脸模型的训练耗时,提高了换脸模型的训练效率。进而为深度换脸技术在实际应用和体验效果上起到积极作用。
进一步参考图3,其示出了是根据本申请的用于训练换脸模型的方法的又一个实施例的流程300。该用于训练换脸模型的方法可以包括以下步骤:
步骤301,接收用户发送的换脸模型训练请求。
在本实施例中,步骤301的具体操作已在图2所示的实施例中步骤201中进行了详细的介绍,在此不再赘述。
步骤302,若用户的历史换脸记录中不存在模板人脸标识对应的预训练模型,识别换脸前人脸样本集的人脸属性信息。
在本实施例中,若用户的历史换脸记录中不存在模板人脸标识对应的预训练模型,用于训练换脸模型的方法的执行主体(例如图1所示的设备102)可以识别换脸前人脸样本集的人脸属性信息。通常,人脸属性信息可以包括多个维度的信息,例如,人脸属性信息可以包括但不限于以下至少一种维度的信息:性别(如男、女)、年龄段(如青少年、中年、老年)、人种(如白种人、黄种人、黑种人)、脸部饰品(如是否佩戴脸部饰品)、脸型(如圆形脸型、三角形脸型、椭圆形脸型、方形脸型)等等。
在本实施例的一些可选的实现方式中,上述执行主体可以将换脸前人脸样本集输入至预先训练的第一分类模型,得到换脸前人脸样本集的性别、年龄段、人种、脸部饰品中的至少一种维度的信息。由于性别、年龄段、人种、脸部饰品都属于分类问题,因此第一分类模型可以是采用基于卷积神经网络(Convolutional Neural Networks,CNN)的分类模型(如AlexNet,GoogleNet,ResNet等)进行训练得到的。
在本实施例的一些可选的实现方式中,上述执行主体可以首先提取换脸前人脸样本集的人脸脸型分类特征;然后将所提取的人脸脸型分类特征输入至预先训练的第二分类模型,得到换脸前人脸样本集的脸型。其中,第二分类模型可以是利用基于支持向量机(Support Vector Machine,SVM)的分类模型训练得到的。
在本实施例的一些可选的实现方式中,人脸脸型分类特征可以包括人脸特征点信息和人脸测量参数。此时,上述执行主体可以首先提取换脸前人脸样本集的人脸特征点信息;然后基于所提取的人脸特征点信息,计算换脸前人脸样本集的人脸测量参数;最后将所提取的人脸特征点信息和所计算的人脸测量参数合并为换脸前人脸样本集的人脸脸型分类特征。其中,提取人脸特征点信息的算法可以包括但不限于dlib、LBF等等。基于人脸特征点信息计算的人脸测量参数可以包括但不限于面宽(Wshape)、下颌宽(Wmandible)、形态面高(Hshape)等等。面宽可以等于左右颧点的欧氏距离。下颌宽可以等于左右下颌角点欧氏距离。形态面高可以等于鼻根点与颏下点间欧氏距离。
步骤303,基于所识别的人脸属性信息,从预训练模型集中确定预训练模型。
在本实施例中,上述执行主体可以基于所识别的人脸属性信息,从预训练模型集中确定预训练模型。例如,上述执行主体可以从预训练模型集中选取出与所识别的人脸属性信息最匹配的预训练模型。
在本实施例的一些可选的实现方式中,上述执行主体可以首先从预训练模型集中确定与所识别的人脸属性信息匹配的预训练模型子集;然后计算换脸前人脸样本集与预训练模型子集中的预训练模型对应的目标人脸样本集的相似度;最后基于所计算的相似度,从预训练模型子集中确定预训练模型。通常,上述执行主体可以首先提取换脸前人脸样本集的平均人脸特征向量;然后计算所提取的平均人脸特征向量与预训练模型子集中的预训练模型对应的目标人脸样本集的平均人脸特征向量的余弦相似度。其中,提取平均人脸特征向量的算法可以例如是人脸识别算法(如VggFace)。预训练模型对应的目标人脸样本集就是预先训练该预训练模型时使用的目标人脸样本集。
步骤304,提取换脸前人脸样本集的人脸丰富度特征。
在本实施例中,上述执行主体可以提取换脸前人脸样本集的人脸丰富度特征。
在本实施例的一些可选的实现方式中,上述执行主体可以首先提取换脸前人脸样本集的人脸特征信息;然后对人脸特征信息进行直方图统计,得到换脸前人脸样本集的人脸丰富度特征。其中,人脸特征信息可以包括但不限于以下至少一种维度的信息:人脸特征点、人脸角度和人脸表情等等。提取人脸特征信息的方法可以包括但不限于人脸检测、人脸特征点提取、人脸角度识别、人脸表情识别等等。
步骤305,计算所提取的人脸丰富度特征与模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度。
在本实施例中,上述执行主体可以计算所提取的人脸丰富度特征与模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度。其中,匹配度的取值通常在0到1之间,0表示完全不匹配,1表示完全匹配。需要说明的是,模板人脸样本集的人脸丰富度特征可以被预选提取,其提取方法与换脸前人脸样本集的人脸丰富度特征的提取方法相同,这里不再赘述。
在本实施例的一些可选的实现方式中,上述执行主体可以利用直方图匹配方法,计算所提取的人脸丰富度特征与模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度。
步骤306,基于所计算的匹配度,从模板人脸样本集组中确定模板人脸样本集。
在本实施例中,上述执行主体可以基于所计算的匹配度,从模板人脸样本集组中确定模板人脸样本集。例如,上述执行主体可以从模板人脸样本集组中选取匹配度最高的模板人脸样本集。
在本实施例的一些可选的实现方式中,上述执行主体可以将模板人脸样本集组中的模板人脸样本集的匹配度与预设匹配度阈值(如0.7)进行比较。若模板人脸样本集组中存在匹配度大于预设匹配度阈值的模板人脸样本集,上述执行主体可以从模板人脸样本集组中选取匹配度最高的模板人脸样本集。若模板人脸样本集组中不存在匹配度大于预设匹配度阈值的模板人脸样本集,上述执行主体可以从模板人脸样本集组中选取通用的模板人脸样本集。通常,模板人脸样本集组中会预先设定一个通用的模板人脸样本集。
步骤307,利用机器学习方法,基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型。
在本实施例中,步骤307的具体操作已在图2所示的实施例中步骤204中进行了详细的介绍,在此不再赘述。
从图3中可以看出,与图2对应的实施例相比,本实施例中的用于训练换脸模型的方法的流程300突出了基于人脸属性信息确定预训练模型和基于人脸丰富度特征确定模板人脸样本集的步骤。由此,本实施例描述的方案利用人脸属性识别算法细粒度匹配预训练模型,利用人脸丰富度检测算法选取模板人脸样本集,从而实现利用人脸丰富度特征最匹配的模板人脸样本集训练人脸属性信息最相似的预训练模型,提升了训练出的换脸模型的换脸效果,使换脸模型的输出更加逼真。
下面参考图4,其示出了适于用来实现本申请实施例的计算机设备(例如图1所示的设备102)的计算机系统400的结构示意图。图4示出的计算机设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统400包括中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有系统400操作所需的各种程序和数据。CPU 401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向目标的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或电子设备上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括接收单元、第一确定单元、第二确定单元和训练单元。其中,这些单元的名称在种情况下并不构成对该单元本身的限定,例如,接收单元还可以被描述为“接收用户发送的换脸模型训练请求的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的计算机设备中所包含的;也可以是单独存在,而未装配入该计算机设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该计算机设备执行时,使得该计算机设备:接收用户发送的换脸模型训练请求,其中,换脸模型训练请求中包括用户提供的换脸前人脸样本集和指定的模板人脸标识;从模板人脸标识对应的预训练模型集中确定与换脸前人脸样本集匹配的预训练模型,其中,预训练模型集包括基于目标人脸样本集组和模板人脸标识对应的模板人脸样本集组预先训练过的模型;从模板人脸样本集组中确定与换脸前人脸样本集匹配的模板人脸样本集;利用机器学习方法,基于换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (19)
1.一种用于训练换脸模型的方法,包括:
接收用户发送的换脸模型训练请求,其中,所述换脸模型训练请求中包括用户提供的换脸前人脸样本集和指定的模板人脸标识;
从所述模板人脸标识对应的预训练模型集中确定与所述换脸前人脸样本集匹配的预训练模型,其中,所述预训练模型集包括基于目标人脸样本集组和所述模板人脸标识对应的模板人脸样本集组预先训练过的模型;
从所述模板人脸样本集组中确定与所述换脸前人脸样本集匹配的模板人脸样本集;
利用机器学习方法,基于所述换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型。
2.根据权利要求1所述的方法,其中,所述从所述模板人脸标识对应的预训练模型集中确定与所述换脸前人脸样本集匹配的预训练模型,包括:
若所述用户的历史换脸记录中存在所述模板人脸标识对应的预训练模型,将所述模板人脸标识对应的预训练模型确定为与所述换脸前人脸样本集匹配的预训练模型。
3.根据权利要求2所述的方法,其中,所述从所述模板人脸标识对应的预训练模型集中确定与所述换脸前人脸样本集匹配的预训练模型,还包括:
若所述用户的历史换脸记录中不存在所述模板人脸标识对应的预训练模型,识别所述换脸前人脸样本集的人脸属性信息;
基于所识别的人脸属性信息,从所述预训练模型集中确定预训练模型。
4.根据权利要求3所述的方法,其中,所述人脸属性信息包括以下至少一种维度的信息:性别、年龄段、人种、脸部饰品、脸型。
5.根据权利要求4所述的方法,其中,所述识别所述换脸前人脸样本集的人脸属性信息,包括:
将所述换脸前人脸样本集输入至预先训练的第一分类模型,得到所述换脸前人脸样本集的性别、年龄段、人种、脸部饰品中的至少一种维度的信息,其中,所述第一分类模型是基于卷积神经网络的分类模型。
6.根据权利要求4或5所述的方法,其中,所述识别所述换脸前人脸样本集的人脸属性信息,包括:
提取所述换脸前人脸样本集的人脸脸型分类特征;
将所提取的人脸脸型分类特征输入至预先训练的第二分类模型,得到所述换脸前人脸样本集的脸型,其中,所述第二分类模型是基于支持向量机的分类模型。
7.根据权利要求6所述的方法,其中,所述提取所述换脸前人脸样本集的人脸脸型分类特征,包括:
提取所述换脸前人脸样本集的人脸特征点信息;
基于所提取的人脸特征点信息,计算所述换脸前人脸样本集的人脸测量参数;
将所提取的人脸特征点信息和所计算的人脸测量参数合并为所述换脸前人脸样本集的人脸脸型分类特征。
8.根据权利要求3所述的方法,其中,所述基于所识别的人脸属性信息,从所述预训练模型集中确定预训练模型,包括:
从所述预训练模型集中确定与所识别的人脸属性信息匹配的预训练模型子集;
计算所述换脸前人脸样本集与所述预训练模型子集中的预训练模型对应的目标人脸样本集的相似度;
基于所计算的相似度,从所述预训练模型子集中确定预训练模型。
9.根据权利要求8所述的方法,其中,所述计算所述换脸前人脸样本集与所述预训练模型子集中的预训练模型对应的目标人脸样本集的相似度,包括:
提取所述换脸前人脸样本集的平均人脸特征向量;
计算所提取的平均人脸特征向量与所述预训练模型子集中的预训练模型对应的目标人脸样本集的平均人脸特征向量的余弦相似度。
10.根据权利要求1所述的方法,其中,所述从所述模板人脸样本集组中确定与所述换脸前人脸样本集匹配的模板人脸样本集,包括:
提取所述换脸前人脸样本集的人脸丰富度特征;
计算所提取的人脸丰富度特征与所述模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度;
基于所计算的匹配度,从所述模板人脸样本集组中确定模板人脸样本集。
11.根据权利要求10所述的方法,其中,所述提取所述换脸前人脸样本集的人脸丰富度特征,包括:
提取所述换脸前人脸样本集的人脸特征信息;
对所述人脸特征信息进行直方图统计,得到所述换脸前人脸样本集的人脸丰富度特征。
12.根据权利要求11所述的方法,其中,所述人脸特征信息包括以下至少一种维度的信息:人脸特征点、人脸角度和人脸表情。
13.根据权利要求11所述的方法,其中,所述计算所提取的人脸丰富度特征与所述模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度,包括:
利用直方图匹配方法,计算所提取的人脸丰富度特征与所述模板人脸样本集组中的模板人脸样本集的人脸丰富度特征的匹配度。
14.根据权利要求10所述的方法,其中,所述基于所计算的匹配度,从所述模板人脸样本集组中确定模板人脸样本集,包括:
若所述模板人脸样本集组中存在匹配度大于预设匹配度阈值的模板人脸样本集,从所述模板人脸样本集组中选取匹配度最高的模板人脸样本集;
若所述模板人脸样本集组中不存在匹配度大于所述预设匹配度阈值的模板人脸样本集,从所述模板人脸样本集组中选取通用的模板人脸样本集。
15.根据权利要求1所述的方法,其中,所述预训练模型集通过如下步骤训练:
获取多个目标人脸样本;
按照人脸属性,将所述多个目标人脸样本划分为所述目标人脸样本集组,其中,同一目标人脸样本集中的目标人脸样本的人脸属性相似;
对于所述目标人脸样本集组中的目标人脸样本集,基于该目标人脸样本集和与该目标人脸样本集匹配的模板人脸样本集对生成式对抗网络进行训练,得到预训练模型。
16.根据权利要求15所述的方法,其中,预训练模型包括生成模型和判别模型;以及
所述利用机器学习方法,基于所述换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练,得到换脸模型,包括:
将所述换脸前人脸样本集输入所确定的预训练模型的生成模型,得到换脸后人脸样本集;
将所述换脸后人脸样本集和所确定的模板人脸样本集输入所确定的预训练模型的判别模型,得到判别结果,其中,所述判别结果用于表征所述换脸后人脸样本集和所确定的模板人脸样本集是真实样本集的概率;
基于所述判别结果调整所确定的预训练模型的生成模型和判别模型的参数。
17.根据权利要求16所述的方法,其中,所述基于所述判别结果调整所确定的预训练模型的生成模型和判别模型的参数,包括:
确定所述判别结果是否满足约束条件;
若所述判别结果不满足所述约束条件,基于所述判别结果调整所确定的预训练模型的生成模型和判别模型的参数,以及再次基于所述换脸前人脸样本集和所确定的模板人脸样本集对所确定的预训练模型进行训练;
若所述判别结果满足所述约束条件,确定所述换脸模型训练完成,以及将所确定的预训练模型的生成模型最后一次输出的换脸后人脸样本集发送给所述用户。
18.一种计算机设备,包括:
一个或多个处理器;
存储装置,其上存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-17中任一所述的方法。
19.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-17中任一所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043178.3A CN110796089B (zh) | 2019-10-30 | 2019-10-30 | 用于训练换脸模型的方法和设备 |
PCT/CN2020/123582 WO2021083069A1 (zh) | 2019-10-30 | 2020-10-26 | 用于训练换脸模型的方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043178.3A CN110796089B (zh) | 2019-10-30 | 2019-10-30 | 用于训练换脸模型的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110796089A true CN110796089A (zh) | 2020-02-14 |
CN110796089B CN110796089B (zh) | 2023-12-12 |
Family
ID=69442013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911043178.3A Active CN110796089B (zh) | 2019-10-30 | 2019-10-30 | 用于训练换脸模型的方法和设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110796089B (zh) |
WO (1) | WO2021083069A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111353392A (zh) * | 2020-02-18 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 换脸检测方法、装置、设备及存储介质 |
CN111783603A (zh) * | 2020-06-24 | 2020-10-16 | 有半岛(北京)信息科技有限公司 | 生成对抗网络训练方法、图像换脸、视频换脸方法及装置 |
CN112734631A (zh) * | 2020-12-31 | 2021-04-30 | 北京深尚科技有限公司 | 基于微调模型的视频图像换脸方法、装置、设备及介质 |
WO2021083069A1 (zh) * | 2019-10-30 | 2021-05-06 | 上海掌门科技有限公司 | 用于训练换脸模型的方法和设备 |
CN113763232A (zh) * | 2020-08-10 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 图像处理方法、装置、设备及计算机可读存储介质 |
CN115358916A (zh) * | 2022-07-06 | 2022-11-18 | 北京健康之家科技有限公司 | 换脸图像的生成方法、装置、计算机设备及可读存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113379594A (zh) * | 2021-06-29 | 2021-09-10 | 北京百度网讯科技有限公司 | 脸型变换模型训练、脸型变换方法及相关装置 |
CN113486785B (zh) * | 2021-07-01 | 2024-08-13 | 株洲霍普科技文化股份有限公司 | 基于深度学习的视频换脸方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509916A (zh) * | 2018-03-30 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 用于生成图像的方法和装置 |
CN108520220A (zh) * | 2018-03-30 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 模型生成方法和装置 |
CN109214343A (zh) * | 2018-09-14 | 2019-01-15 | 北京字节跳动网络技术有限公司 | 用于生成人脸关键点检测模型的方法和装置 |
CN109409198A (zh) * | 2018-08-31 | 2019-03-01 | 平安科技(深圳)有限公司 | Au检测模型训练方法、au检测方法、装置、设备及介质 |
CN110110611A (zh) * | 2019-04-16 | 2019-08-09 | 深圳壹账通智能科技有限公司 | 人像属性模型构建方法、装置、计算机设备和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5498341B2 (ja) * | 2010-09-30 | 2014-05-21 | 株式会社エクシング | カラオケシステム |
CN106534757B (zh) * | 2016-11-22 | 2020-02-28 | 香港乐蜜有限公司 | 人脸交换方法、装置、主播终端及观众终端 |
CN110796089B (zh) * | 2019-10-30 | 2023-12-12 | 上海掌门科技有限公司 | 用于训练换脸模型的方法和设备 |
-
2019
- 2019-10-30 CN CN201911043178.3A patent/CN110796089B/zh active Active
-
2020
- 2020-10-26 WO PCT/CN2020/123582 patent/WO2021083069A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509916A (zh) * | 2018-03-30 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 用于生成图像的方法和装置 |
CN108520220A (zh) * | 2018-03-30 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 模型生成方法和装置 |
CN109409198A (zh) * | 2018-08-31 | 2019-03-01 | 平安科技(深圳)有限公司 | Au检测模型训练方法、au检测方法、装置、设备及介质 |
CN109214343A (zh) * | 2018-09-14 | 2019-01-15 | 北京字节跳动网络技术有限公司 | 用于生成人脸关键点检测模型的方法和装置 |
CN110110611A (zh) * | 2019-04-16 | 2019-08-09 | 深圳壹账通智能科技有限公司 | 人像属性模型构建方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
邢恩旭等: "基于迁移学习的双层生成式对抗网络" * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021083069A1 (zh) * | 2019-10-30 | 2021-05-06 | 上海掌门科技有限公司 | 用于训练换脸模型的方法和设备 |
CN111353392A (zh) * | 2020-02-18 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 换脸检测方法、装置、设备及存储介质 |
CN111783603A (zh) * | 2020-06-24 | 2020-10-16 | 有半岛(北京)信息科技有限公司 | 生成对抗网络训练方法、图像换脸、视频换脸方法及装置 |
CN113763232A (zh) * | 2020-08-10 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 图像处理方法、装置、设备及计算机可读存储介质 |
CN112734631A (zh) * | 2020-12-31 | 2021-04-30 | 北京深尚科技有限公司 | 基于微调模型的视频图像换脸方法、装置、设备及介质 |
CN115358916A (zh) * | 2022-07-06 | 2022-11-18 | 北京健康之家科技有限公司 | 换脸图像的生成方法、装置、计算机设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021083069A1 (zh) | 2021-05-06 |
CN110796089B (zh) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110796089B (zh) | 用于训练换脸模型的方法和设备 | |
CN108898186B (zh) | 用于提取图像的方法和装置 | |
US11487995B2 (en) | Method and apparatus for determining image quality | |
WO2022161286A1 (zh) | 图像检测方法、模型训练方法、设备、介质及程序产品 | |
CN108717663B (zh) | 基于微表情的面签欺诈判断方法、装置、设备及介质 | |
US20190080148A1 (en) | Method and apparatus for generating image | |
CN107679466B (zh) | 信息输出方法和装置 | |
WO2020253127A1 (zh) | 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质 | |
CN108197618B (zh) | 用于生成人脸检测模型的方法和装置 | |
CN109993150B (zh) | 用于识别年龄的方法和装置 | |
CN108288051B (zh) | 行人再识别模型训练方法及装置、电子设备和存储介质 | |
CN112381782B (zh) | 人脸图像质量评估方法、装置、计算机设备及存储介质 | |
CN107609506B (zh) | 用于生成图像的方法和装置 | |
WO2021051598A1 (zh) | 文本情感分析模型训练方法、装置、设备及可读存储介质 | |
CN108898185A (zh) | 用于生成图像识别模型的方法和装置 | |
WO2021208601A1 (zh) | 基于人工智能的图像处理方法、装置、设备及存储介质 | |
US11126827B2 (en) | Method and system for image identification | |
CN110163096B (zh) | 人物识别方法、装置、电子设备和计算机可读介质 | |
CN113343826A (zh) | 人脸活体检测模型的训练方法、人脸活体检测方法及装置 | |
CN111814620A (zh) | 人脸图像质量评价模型建立方法、优选方法、介质及装置 | |
CN114612987B (zh) | 一种表情识别方法及装置 | |
CN110458078A (zh) | 一种人脸图像数据聚类方法、系统及设备 | |
CN111108508B (zh) | 脸部情感识别方法、智能装置和计算机可读存储介质 | |
CN114612743A (zh) | 深度学习模型的训练方法、目标对象识别方法和装置 | |
CN116258861A (zh) | 基于多标签学习的半监督语义分割方法以及分割装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |