CN111798546B - 一种基于生成对抗机制的多人表情迁移方法 - Google Patents
一种基于生成对抗机制的多人表情迁移方法 Download PDFInfo
- Publication number
- CN111798546B CN111798546B CN202010494513.8A CN202010494513A CN111798546B CN 111798546 B CN111798546 B CN 111798546B CN 202010494513 A CN202010494513 A CN 202010494513A CN 111798546 B CN111798546 B CN 111798546B
- Authority
- CN
- China
- Prior art keywords
- landmark
- migration
- expression
- reference person
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 77
- 238000013508 migration Methods 0.000 title claims abstract description 74
- 230000005012 migration Effects 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000007246 mechanism Effects 0.000 title claims abstract description 15
- 239000013598 vector Substances 0.000 claims abstract description 63
- 230000003068 static effect Effects 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims description 27
- 230000004913 activation Effects 0.000 claims description 24
- 230000004927 fusion Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000008921 facial expression Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 6
- 238000013135 deep learning Methods 0.000 abstract description 4
- 238000013461 design Methods 0.000 abstract description 3
- 238000012549 training Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/40—3D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
- G06V40/175—Static expression
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
技术领域
本发明涉及一种表情迁移方法,具体地,涉及一种基于生成对抗机制的多人表情迁移方法。
背景技术
表情迁移技术在很多场景下都有极大的应用潜力,比如电影制作,动画制作等。随着深度学习的发展及计算机算力的增加,许多基于深度学习的表情迁移方法都取得了不错的效果,能够实现不同人之间的表情迁移且生成逼真的迁移人脸图像。但已有的方法一般只能针对特定人物进行训练,当模型训练完毕后只能对该特定人物进行表情迁移及人脸生成,不能适用于同时针对多人表情迁移的场景,极大地限制了该方法的应用潜力。针对这一问题,亟待一种更普世的多人之间表情迁移方法,其能够在训练完毕后实现不同人(多人)之间的表情迁移,甚至可以在未知的人物上进行表情迁移。
发明内容
本发明针对目前的方法不能很好地使用一个模型实现多人之间表情迁移这一问题,提出了一种基于生成对抗机制的多人表情迁移方法。
为达到上述目的,本发明采取了如下的技术方案:
一种基于生成对抗机制的多人表情迁移方法,包括Landmark转换器(ψ)和人脸生成器所述Landmark转换器(ψ)是由多个全连接层、ReLU激活函数层组成,其中,参考人员静止状态下(面无表情面朝镜头方向)图像记为对应landmark向量记为待迁移表情图像对应landmark向量为对参考人员静止状态下landmark向量进行特征处理的网络结构对参考人员迁移表情landmark向量进行特征处理的网络结构其中经上述网络结构和网络结构的特征在通道层面进行拼接后送入网络结构
输入参考人员静止状态下landmark向量待迁移表情landmark向量分别经网络结构网络结构提取图像特征后由网络结构进一步进行特征融合,这样经过网络结构和后得到偏置landmark向量(lshift),其值代表每个landmark向量相对于参考人员静止状态landmark向量的偏移量,最后偏置landmark向量(lshift)通过和参考人员静止状态landmark向量相加输出参考人员表情迁移后的landmark向量从而完成在landmark向量几何空间上的表情迁移;
Landmark转换器(ψ)生成的参考人员表情迁移后的landmark向量在送入人脸生成器前需转换为参考人员表情迁移后的landmark图像其方式为以参考人员表情迁移后的landmark向量包含的每一个landmark坐标点为中心,在128*128大小的图像上画半径为2的实心圆;
所述人脸生成器是由多个卷积层、反卷积层、批归一化层和ReLU激活函数层组成,输入参考人员图像参考人员表情迁移后的landmark向量分别经网络结构网络结构提取图像特征后由网络结构进一步进行特征融合,最后经网络结构解码得到参考人员表情迁移后的图像
在进行前向推理时,输入参考人员静止状态landmark向量和迁移表情landmark 向量先通过Landmark转换器(ψ)生成参考人员表情迁移后的landmark向量并将之转化为landmark图像形式然后和参考人员图像一起送入人脸生成器生成参考人员表情迁移后的图像
作为优选地,所述Landmark转换器(ψ)在训练时,除了采用L1损失函数,还额外使用对抗思路设计了landmark真假鉴别器(DTF)和身份鉴别器(DS)去进一步增强网络回归landmark的准确性。
作为优选地,所述landmark真假鉴别器(DTF)由6层全连接和激活函数组成,身份鉴别器(DS)由6层全连接和激活函数组成。
作为优选地,所述图像鉴别器(DTF)由6层卷积层和激活函数组成。
与现有技术相比,本发明具有如下有益效果:
本发明方法基于Py-Torch深度学习框架,先在几何空间对人员表情的landmark进行转换,然后使用对抗生成模型设计思想将转换后的landmark与参考图像结合并生成真实的目标图像。其中landmark定义为面部的106个关键点,如左眼左眼角或右嘴角。这样的设计不仅使得我们可以实现多人之间人脸表情迁移,同时还将人脸的几何特征和纹理特征解耦开来,具有更高的可编辑特性。
附图说明:
图1为本发明整体系统流程示意图;
图2为本发明中Landmark转换器(ψ)的流程示意图;
图4为本发明应用在RaFD数据集上的效果示意图;
图5为本发明应用Multi-PIE数据集上的效果示意图。
具体实施方式:
以下结合说明书附图及具体实施例来对本发明作进一步的描述。
如图1~3所示,本发明提供一种基于生成对抗机制的多人表情迁移方法,包括Landmark转换器(ψ)和人脸生成器所述Landmark转换器(ψ)是由多个全连接层、ReLU激活函数层组成,其中,参考人员静止状态下(面无表情面朝镜头方向)图像记为对应landmark向量记为待迁移表情图像对应landmark向量为对参考人员静止状态下landmark向量进行特征处理的网络结构对参考人员迁移表情 landmark向量进行特征处理的网络结构其中经上述网络结构和网络结构的特征在通道层面进行拼接后送入网络结构
输入参考人员静止状态下landmark向量待迁移表情landmark向量分别经网络结构网络结构提取图像特征后由网络结构进一步进行特征融合,这样经过网络结构和后得到偏置landmark向量(lshift),其值代表每个landmark向量相对于参考人员静止状态landmark向量的偏移量,最后偏置landmark向量(lshift)通过和参考人员静止状态landmark向量相加输出参考人员表情迁移后的landmark向量从而完成在landmark向量几何空间上的表情迁移;
Landmark转换器(ψ)生成的参考人员表情迁移后的landmark向量在送入人脸生成器前需转换为参考人员表情迁移后的landmark图像其方式为以参考人员表情迁移后的landmark向量包含的每一个landmark坐标点为中心,在128*128大小的图像上画半径为2的实心圆;
所述人脸生成器是由多个卷积层、反卷积层、批归一化层和ReLU激活函数层组成,输入参考人员图像参考人员表情迁移后的landmark向量分别经网络结构网络结构提取图像特征后由网络结构进一步进行特征融合,最后经网络结构解码得到参考人员表情迁移后的图像
在进行前向推理时,输入参考人员静止状态landmark向量和迁移表情landmark 向量先通过Landmark转换器(ψ)生成参考人员表情迁移后的landmark向量并将之转化为landmark图像形式然后和参考人员图像一起送入人脸生成器生成参考人员表情迁移后的图像
所述Landmark转换器(ψ)在训练时,除了采用L1损失函数,还额外使用对抗思路设计了landmark真假鉴别器(DTF)和身份鉴别器(DS)去进一步增强网络回归landmark的准确性。
所述landmark真假鉴别器(DTF)由6层全连接和激活函数组成,身份鉴别器(DS) 由6层全连接和激活函数组成。
所述图像鉴别器(DTF)由6层卷积层和激活函数组成。
所述Landmark转换器(ψ)在训练时需要大于60个id的同步(具有相同的表情)landmark数据,且每个id的landmark数据不少于24个。
本发明一种基于生成对抗机制的多人表情迁移方法能够生成高真实度的表情迁移图像,由于人脸生成器采用全卷机网络结构,故其输出分辨率不受限制。考虑到算力代价及应用效果,该方法通常生成512*512分辨率的图像。
本发明方法不同于其他的方法,在表情迁移人脸图像生成过程中将人脸的几何信息和纹理信息进行了解耦,具有更灵活的应用价值,比如可以通过对landmark中的嘴巴开合程度操作,从而控制生成图像中人脸的嘴巴开合程度。
本发明方法不同于已有的单人表情迁移方法,其仅适用一个模型即可实现多人之间的表情迁移,大大降低了网络训练的算力成本以及应用的存储成本。
如图4所示,在RaFD数据集上的效果,第一列为参考人员图像,第一行为不同的待迁移表情人员图像,其余为生成的表情迁移后的参考人员图像。
如图5所示,在Multi-PIE数据集上的效果,第一行为参考人员图像,第一列为不同的待迁移表情人员图像,其余为生成的表情迁移后的参考人员图像。
本实施例中其余未记载的内容可以参考前文人脸表情的迁移方法的相关描述,在此不作赘述。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (7)
输入参考人员静止状态下landmark向量待迁移表情landmark向量分别经网络结构网络结构提取图像特征后由网络结构进一步进行特征融合,这样经过网络结构和后得到偏置landmark向量(lshift),其值代表每个landmark向量相对于参考人员静止状态landmark向量的偏移量,最后偏置landmark向量(lshift)通过和参考人员静止状态landmark向量相加输出参考人员表情迁移后的landmark向量从而完成在landmark向量几何空间上的表情迁移;
Landmark转换器(ψ)生成的参考人员表情迁移后的landmark向量在送入人脸生成器前需转换为参考人员表情迁移后的landmark图像其方式为以参考人员表情迁移后的landmark向量包含的每一个landmark坐标点为中心,在128*128大小的图像上画半径为2的实心圆;
所述人脸生成器是由多个卷积层、反卷积层、批归一化层和ReLU激活函数层组成,输入参考人员图像参考人员表情迁移后的landmark向量分别经网络结构网络结构提取图像特征后由网络结构进一步进行特征融合,最后经网络结构解码得到参考人员表情迁移后的图像
在进行前向推理时,输入参考人员静止状态landmark向量和迁移表情landmark向量先通过Landmark转换器(ψ)生成参考人员表情迁移后的landmark向量并将之转化为landmark图像形式然后和参考人员图像一起送入人脸生成器生成参考人员表情迁移后的图像
2.根据权利要求1中所述的一种基于生成对抗机制的多人表情迁移方法,其特征在于,所述Landmark转换器(ψ)在训练时,除了采用L1损失函数,还额外使用对抗思路设计了landmark真假鉴别器(DTF)和身份鉴别器(DS)去进一步增强网络回归landmark的准确性。
4.根据权利要求2中所述的一种基于生成对抗机制的多人表情迁移方法,其特征在于,所述landmark真假鉴别器(DTF)由6层全连接和激活函数组成,身份鉴别器(DS)由6层全连接和激活函数组成。
7.根据权利要求5中所述的一种基于生成对抗机制的多人表情迁移方法,其特征在于,所述图像鉴别器(DTF)由6层卷积层和激活函数组成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010494513.8A CN111798546B (zh) | 2020-06-03 | 2020-06-03 | 一种基于生成对抗机制的多人表情迁移方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010494513.8A CN111798546B (zh) | 2020-06-03 | 2020-06-03 | 一种基于生成对抗机制的多人表情迁移方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111798546A CN111798546A (zh) | 2020-10-20 |
CN111798546B true CN111798546B (zh) | 2022-04-26 |
Family
ID=72806202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010494513.8A Active CN111798546B (zh) | 2020-06-03 | 2020-06-03 | 一种基于生成对抗机制的多人表情迁移方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111798546B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010016678A (ja) * | 2008-07-04 | 2010-01-21 | Casio Comput Co Ltd | 画像合成装置、画像合成プログラム及び画像合成方法 |
CN108710829A (zh) * | 2018-04-19 | 2018-10-26 | 北京红云智胜科技有限公司 | 一种基于深度学习的表情分类及微表情检测的方法 |
CN109508669A (zh) * | 2018-11-09 | 2019-03-22 | 厦门大学 | 一种基于生成式对抗网络的人脸表情识别方法 |
CN110084121A (zh) * | 2019-03-27 | 2019-08-02 | 南京邮电大学 | 基于谱归一化的循环生成式对抗网络的人脸表情迁移的实现方法 |
WO2020001082A1 (zh) * | 2018-06-30 | 2020-01-02 | 东南大学 | 一种基于迁移学习的人脸属性分析方法 |
CN110706152A (zh) * | 2019-09-25 | 2020-01-17 | 中山大学 | 基于生成对抗网络的人脸光照迁移方法 |
-
2020
- 2020-06-03 CN CN202010494513.8A patent/CN111798546B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010016678A (ja) * | 2008-07-04 | 2010-01-21 | Casio Comput Co Ltd | 画像合成装置、画像合成プログラム及び画像合成方法 |
CN108710829A (zh) * | 2018-04-19 | 2018-10-26 | 北京红云智胜科技有限公司 | 一种基于深度学习的表情分类及微表情检测的方法 |
WO2020001082A1 (zh) * | 2018-06-30 | 2020-01-02 | 东南大学 | 一种基于迁移学习的人脸属性分析方法 |
CN109508669A (zh) * | 2018-11-09 | 2019-03-22 | 厦门大学 | 一种基于生成式对抗网络的人脸表情识别方法 |
CN110084121A (zh) * | 2019-03-27 | 2019-08-02 | 南京邮电大学 | 基于谱归一化的循环生成式对抗网络的人脸表情迁移的实现方法 |
CN110706152A (zh) * | 2019-09-25 | 2020-01-17 | 中山大学 | 基于生成对抗网络的人脸光照迁移方法 |
Non-Patent Citations (1)
Title |
---|
基于条件生成式对抗网络的面部表情迁移模型;陈军波等;《计算机工程》;20200415(第04期);第228-235 * |
Also Published As
Publication number | Publication date |
---|---|
CN111798546A (zh) | 2020-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12067690B2 (en) | Image processing method and apparatus, device, and storage medium | |
CN115205949B (zh) | 图像生成方法以及相关设备 | |
CN112949535B (zh) | 一种基于生成式对抗网络的人脸数据身份去识别方法 | |
CN112164130B (zh) | 基于深度对抗网络的视频-动画风格迁移方法 | |
CN115187706B (zh) | 一种人脸风格迁移的轻量化方法、系统、存储介质和电子设备 | |
CN116634242A (zh) | 语音驱动的说话视频生成方法、系统、设备和存储介质 | |
CN114187165A (zh) | 图像处理方法和装置 | |
Wang et al. | (2+ 1) D-SLR: an efficient network for video sign language recognition | |
WO2023024653A1 (zh) | 图像处理方法、图像处理装置、电子设备以及存储介质 | |
CN111798546B (zh) | 一种基于生成对抗机制的多人表情迁移方法 | |
CN116311455A (zh) | 一种基于改进Mobile-former的表情识别方法 | |
Tze et al. | Cartoonized Anonymization of Sign Language Videos | |
CN117808934A (zh) | 一种数据处理方法及相关设备 | |
CN113436302B (zh) | 一种人脸动画合成方法及系统 | |
CN112463936B (zh) | 一种基于三维信息的视觉问答方法及系统 | |
Serra et al. | Easy generation of facial animation using motion graphs | |
CN115578298A (zh) | 一种基于内容感知的深度肖像视频合成方法 | |
Wang et al. | [Retracted] Convolution‐Based Design for Real‐Time Pose Recognition and Character Animation Generation | |
Sun et al. | Robust pose transfer with dynamic details using neural video rendering | |
CN113763236A (zh) | 一种商业短视频根据地域动态调整脸部特征的方法 | |
CN112132915B (zh) | 一种基于生成对抗机制的多样化动态延时视频生成方法 | |
Zhao et al. | Generating diverse gestures from speech using memory networks as dynamic dictionaries | |
Yang et al. | Shapeediter: a stylegan encoder for face swapping | |
Liu et al. | Confusable facial expression recognition with geometry-aware conditional network | |
CN116030167B (zh) | 虚拟人物的驱动方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |