CN110728219B - 基于多列多尺度图卷积神经网络的3d人脸生成方法 - Google Patents
基于多列多尺度图卷积神经网络的3d人脸生成方法 Download PDFInfo
- Publication number
- CN110728219B CN110728219B CN201910930936.7A CN201910930936A CN110728219B CN 110728219 B CN110728219 B CN 110728219B CN 201910930936 A CN201910930936 A CN 201910930936A CN 110728219 B CN110728219 B CN 110728219B
- Authority
- CN
- China
- Prior art keywords
- scale
- convolution
- encoder
- self
- graph convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明属于计算机视觉和计算机图形学领域,为一种变分自编码器神经网络去学习3D人脸的高维表示,并同时完成重建任务。利用变分自编码器的生成能力来生成更具有多样性的3D人脸数据。本发明采取的技术方案是,基于多列多尺度图卷积神经网络的3D人脸生成方法,步骤如下:利用基于图卷积结构的多尺度变分编码器框架,将输入的面部三维网格Mesh通过多尺度编码器编码到一个固定维度的中间向量,然后再通过使用解码器就将中间特征向量解析成原始的面部Mesh;其中,所述编码器包含三个部分,多尺度图卷积算法、选择融合、自注意力机制以及网络结构。本发明主要应用于图像处理。
Description
技术领域
本发明属于计算机视觉和计算机图形学领域,特别涉及使用深度学习的方法去表示3D人脸与生成。
背景技术
人脸包含丰富的信息,如个人身份,情感和意图,因此在人类视觉感知中占据非常重要的位置。3D人脸重建有助于从图像中解决面部的姿势,表情和缺失特征,并且在计算机视觉和图形中具有广泛的应用,例如,人脸识别,人脸动画和人脸跟踪。然而,由于人脸具有高度可变化性,尤其复杂表情会导致非线性变化,因此获得精确的面部三维模式具有很大的挑战。
传统方法使用激光扫描仪或深度相机来使用基于融合的方法重建3D面部(R.A.Newcombe et al.,“KinectFusion:Real-time dense surface mapping andtracking,”in Proc.IEEE International Symposium on Mixed and AugmentedReality,2011,pp.127–136.),但它们无法实现动画,编辑和生成。为了解决这个问题,许多工作提出了参数化人脸模型(Volker Blanz and Thomas Vetter,“A morphable modelfor the synthesis of 3D faces,”in CGIT,1999,pp.187–194.)和混合形状(John PLewis,Ken Anjyo,Taehyun Rhee,Mengjie Zhang,Frederic H Pighin,and ZhigangDeng,“Practice and theory of blendshape facial models,”in Eurographics(Stateof the Art Reports),2014.)来表示面部形状和表情,并且有几种方法使用这些模型从扫描的深度网格中成功地重建了面部形状(Pei-Lun Hsieh,Chongyang Ma,Jihun Yu,andHao Li,“Unconstrained realtime facial performance capture,”in CVPR,2015,pp.1675–1683.)。然而,使用线性表示的重建形状通常是平滑的而没有丰富的细节。综上,对3D人脸进行高效且准确的表示以及重建是比较重要的,将为面部识别、身份验证等方向提供技术支持。
发明内容
为了能够对3D人脸数据进行有效的高维特征表示,以及通过高维特征进行重建,本发明旨在提出一种变分自编码器神经网络去学习3D人脸的高维表示,并同时完成重建任务。利用变分自编码器的生成能力来生成更具有多样性的3D人脸数据。本发明采取的技术方案是,基于多列多尺度图卷积神经网络的3D人脸生成方法,步骤如下:利用基于图卷积结构的多尺度变分编码器框架,将输入的面部三维网格Mesh通过多尺度编码器编码到一个固定维度的中间向量,然后再通过使用解码器就将中间特征向量解析成原始的面部Mesh;其中,所述编码器包含三个部分,多尺度图卷积算法、选择融合、自注意力机制以及网络结构。
编码器具体包括以下部分:
2-1)多尺度图卷积算法:使用图卷积网络来处理网格数据,同时进行对节点特征信息与结构信息进行端到端学习,由于三维图结构数据的特征,样本数据通常包含不同尺度的特征,因此使用具有不同尺度滤波器来捕获图结构数据的特征,滤波器的感受野范围通过图卷积中切比雪夫多项式的阶数K决定,不同的K值控制多尺度图卷积尺度;
2-2)选择融合:在多尺度卷积之后,得到三种类型的特征图,分别表示为不同尺度的特征信息,利用自动学习融合参数的选择性融合方法集成所述三种类型的特征图,具体是,将每个特征图乘以一个可学习的参数wi,并将其总和约束为一:
公式解析:其中i对应于第i个尺度,是每个尺度的特征映射;
2-3)自注意力机制。网络借鉴了人类的注意力机制,引入自注意力模块,通过使用该模块令中间隐向量考虑非局部的上下文信息的影响,从而具有更好的表达能力,在深度神经网络中使用自注意力通用模块:
t(Zj)=WZZj
公式解析:潜在向量Z可以被看作维度是C×1的特征图,O∈R1×C是与Z相同大小的模块输出,利用1×1的卷积生成A和B两个特征图,{A,B}∈R1×C,函数t计算位置j处的输入表示,只考虑线性嵌入的形式:
t(Zj)=WZZj
其中,WZ是可学习的权重,h是用于计算关系分数的函数,使用具有归一化指数函数softmax的高斯函数Gaussion:
然后在注意力图和Zj之间执行矩阵乘法,结果到R1×C,推断出每个位置的结果特征是所有位置和原始特征的特征的加权和;
2-4)网络结构:网络分为编码器和解码器部分,编码器由3行并列的多尺度图卷积构成,每行尺度网络中包含四个图卷积层,每个图卷积层都采用批规范化以及修正线性单元ReLU激活函数,每层卷积都采用下采样;编码器最后一层将特征映射到隐层空间,隐层空间向量经过融合层和自注意力层后输入到解码器中,解码器首先使用一个全连接层将特征映射到Mesh空间,接着3行并列的4层图卷积,每层图卷积都是用了批规范化和ReLU激活函数,采用上采样,整个解码器部分相当于编码器的逆过程。
与已有技术相比,本发明的技术特点与效果:
为自注意模块添加残差连接以使其更有效,该残差模块能够有效地在特征图的内部表示中找到全局的远程依赖。
首先,本发明是在三维Mesh的基础上,相比传统的重建方法,本发明方法主要具有以下特点:
1、提出了一种新的多列多尺度图卷积变分网络架构(MGCN),它用于人脸Mesh的分层多尺度表示。其模型依赖于图数据网格的顶点连接关系,并且还可以通过有效地对网格的顶点进行采样来生成分层网格表示。利用并列富尺度图卷积网络架构,以有效地捕获网格上不同尺度的信息,并学习更好的潜在空间表示。三列对应于具有不同大小(大,中,小)的感受野的滤波器,因此每个列图卷积学习的特征适应于诸如眼睛,鼻子和嘴的面部网格的大小变化。
2、提出了一种基于多列图卷积网络的可学习特征融合方法。结合自注意机制使融合更加智能化。该方法进一步增强了低维潜在空间中三维人脸的潜在表示。
3、变分编码器使用Mesh原始数据而无需复杂的数据嵌入过程,易于训练,并且重建精度很高。实验结果表明,与现有技术相比,我们的方法在重建误差方面取得了更好的结果。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例是网络结构模型示意。
图2为本发明实施例是基于Coma数据集(Anurag Ranjan,Timo Bolkart,SoubhikSanyal,and Michael J Black,“Generating 3D faces using convolutional meshautoencoders,”in ECCV.Springer,2018,pp.725–741.)上获得的重建结果与其它方法的对比示意图。从上至下依次是输入的Mesh的真值,Anurag等人(Anurag Ranjan,TimoBolkart,Soubhik Sanyal,and Michael J Black,“Generating 3D faces usingconvolutional mesh autoencoders,”in ECCV.Springer,2018,pp.725–741.)重建出来的结果,本发明所估计重建的结果,Anurag等人的方法的误差可视化图,本发明的误差可视化图。
图3为所提出的是本发明的变分生成效果示意图,图示中的人脸都是网络随机生成的Mesh。
具体实施方式
为了能够对3D人脸数据进行有效的高维特征表示,以及通过高维特征进行重建,本发明采用的技术方案是设计一种变分自编码器神经网络去学习3D人脸的高维表示,并同时完成重建任务。利用变分自编码器的生成能力来生成更具有多样性的3D人脸数据。具体来说,我们的方法主要包括以下步骤:
1)变分自编码器的设计。设计了一种基于图卷积结构的多尺度变分编码器框架,将输入的面部Mesh通过多尺度编码器编码到一个固定维度的中间向量,然后再通过使用解码器就将中间特征向量解析成原始的面部Mesh。
变分自编码器是一个深度卷积网络,它主要包含三个部分,多尺度图卷积算法、选择融合、自注意力机制以及网络结构,具体包括以下部分:
2-1)多尺度图卷积算法。传统的卷积神经网络不能处理非欧氏空间数据,例如Mesh这种不规则的图数据,因此我们使用图卷积网络来处理网格数据。它能同时对节点特征信息与结构信息进行端到端学习,是目前图数据学习任务的最佳选择。由于三维图结构数据的特征,样本数据通常包含不同尺度的特征,因此使用具有不同尺度滤波器来捕获图结构数据的特征,滤波器的感受野范围可以通过图卷积中切比雪夫多项式的阶数(K)决定。不同的K值表示图卷积过程中涉及的节点范围,因此可以控制图的卷积尺度。
2-2)选择融合。在多尺度卷积之后,可以得到三种类型的特征图,分别表示为不同尺度的特征信息。如何有效地集成它们是提高整个网络性能的关键。最简单的方法是直接连接它们,但是特征信息对整体的贡献在每个尺度上是不相等的。因此,我们提出了一种自动学习融合参数的选择性融合方法。我们将每个特征图乘以一个可学习的参数wi,并将它们的总和约束为一:
公式解析:其中i对应于第i个尺度,wi是每个尺度的可学习参数,是每个尺度的特征映射。wi可以看作是不同尺度特征的重要性。这些权重在训练期间得到优化,这决定了不同尺度的重要性,利用生成更好的潜在向量。
2-3)自注意力机制。网络借鉴了人类的注意力机制,引入自注意力模块,通过使用该模块令中间隐向量考虑非局部的上下文信息的影响,从而具有更好的表达能力。我们在深度神经网络中使用自注意力通用模块:
公式解析:潜在向量Z可以被看作维度是C×1的特征图,O∈R1×C是与Z相同大小的模块输出,我们利用1×1的卷积生成A和B两个特征图,{A,B}∈R1×C。函数t计算位置j处的输入表示。我们只考虑线性嵌入的形式:
t(Zj)=WZZj
WZ是可学习的权重,h是用于计算关系分数的函数,我们使用具有softmax的Gaussion函数:
然后我们在注意力图和Zj之间执行矩阵乘法,结果到R1×C。可以推断出每个位置的结果特征是所有位置和原始特征的特征的加权和。此外,我们还为自注意模块添加了残差连接以使其更有效。该残差模块能够有效地在特征图的内部表示中找到全局的远程依赖。通过自我关注,我们可以更好地探索潜在的空间生成能力。
2-4)网络结构。网络分为编码器和解码器部分,编码器由3行并列的多尺度图卷积构成,每行的感受野范围即K值依次为2,6,10,每行尺度网络中包含四个图卷积层,特征数量设定为(1256,314,79,20),每层都是用了批规范化以及ReLU激活函数。每层卷积都是用了下采样,倍率分别为[4,4,4,4]。编码器的每层输特征维度为1256×16,314×16,79×16和20×32,最后一层将特征映射到64维度的潜层空间。隐层空间向量经过融合层和自注意力层后输入到解码器中,解码器首先使用一个全连接层将64维度的特征映射到Mesh空间,接着3行并列的4层图卷积,每层图卷积都是用了批规范化和ReLU激活函数,上采样倍率为[4,4,4,4],整个解码器部分相当于编码器的逆过程。每层的输出特征维度为79×32,314×32,1256×16和5023×16。编码器生成的64维度特征会和高斯分布的数据进行Kullback-Leibler(相对熵)变分损失函数的计算,以使得编码器生成的数据尽可能逼近高斯分布空间。
3)训练。我们设定潜层空间维度为64,训练Mesh的顶点数为5023,使用的是1领域的顶点集合,整体数据集训练400次,学习率设定为0.0001,每批次填充16个Mesh数据,使用的Adam(深度学习优化算法)优化器。该网络使用TensorFlow(深度学习框架)深度学习框架进行训练,运行在英伟达GTX1080Ti显卡。
Claims (1)
1.一种基于多列多尺度图卷积神经网络的3D人脸生成方法,其特征是,步骤如下:利用基于图卷积结构的多尺度变分编码器框架,将输入的面部三维网格Mesh通过多尺度编码器编码到一个固定维度的中间向量,然后再通过使用解码器就将中间特征向量解析成原始的面部Mesh;其中,所述编码器包含三个部分,多尺度图卷积算法、选择融合、自注意力机制;其中:
1)多尺度图卷积算法:使用图卷积网络来处理网格数据,同时进行对节点特征信息与结构信息进行端到端学习,由于三维图结构数据的特征,样本数据通常包含不同尺度的特征,因此使用具有不同尺度滤波器来捕获图结构数据的特征,滤波器的感受野范围通过图卷积中切比雪夫多项式的阶数K决定,不同的K值控制多尺度图卷积尺度;
2)选择融合:在多尺度卷积之后,得到三种类型的特征图,分别表示为不同尺度的特征信息,利用自动学习融合参数的选择性融合方法集成所述三种类型的特征图,具体是,将每个特征图乘以一个可学习的参数wm,并将其总和约束为一:
公式解析:其中m对应于第m个尺度,是每个尺度的特征映射;
3)自注意力机制,网络借鉴了人类的注意力机制,引入自注意力模块,通过使用该模块令中间隐向量考虑非局部的上下文信息的影响,从而具有更好的表达能力,在深度神经网络中使用自注意力通用模块:
t(Zj)=WZZj
公式解析:潜在向量Z可以被看作维度是1×C的特征图,O∈R1×C是与Z相同大小的模块输出,利用1×1的卷积生成A和B两个特征图,{A,B}∈R1×C;函数t计算位置j位置的输入表示,只考虑线性嵌入的形式:
t(Zj)=WZZj
其中,WZ是可学习的权重,h是用于计算关系分数的函数,使用具有归一化指数函数softmax的高斯函数Gaussion:
然后在注意力图和Zj之间执行矩阵乘法,结果到R1×C,推断出每个位置的结果特征是所有位置和原始特征的加权和;
网络结构分为编码器和解码器部分,编码器由3行并列的多尺度图卷积构成,每行尺度网络中包含四个图卷积层,每个图卷积层都采用批规范化以及修正线性单元ReLU激活函数,每层卷积都采用下采样;编码器最后一层将特征映射到隐层空间,隐层空间向量经过融合层和自注意力层后输入到解码器中,解码器首先使用一个全连接层将特征映射到Mesh空间,接着3行并列的4层图卷积,每层图卷积都是用了批规范化和ReLU激活函数,采用上采样,整个解码器部分相当于编码器的逆过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910930936.7A CN110728219B (zh) | 2019-09-29 | 2019-09-29 | 基于多列多尺度图卷积神经网络的3d人脸生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910930936.7A CN110728219B (zh) | 2019-09-29 | 2019-09-29 | 基于多列多尺度图卷积神经网络的3d人脸生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110728219A CN110728219A (zh) | 2020-01-24 |
CN110728219B true CN110728219B (zh) | 2023-09-26 |
Family
ID=69219585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910930936.7A Active CN110728219B (zh) | 2019-09-29 | 2019-09-29 | 基于多列多尺度图卷积神经网络的3d人脸生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110728219B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111292415B (zh) * | 2020-02-25 | 2022-03-29 | 华南理工大学 | 一种基于球坐标位置图的单视图三维人脸重建方法 |
CN111340197B (zh) * | 2020-03-11 | 2023-09-05 | 湖南莱博赛医用机器人有限公司 | 一种神经网络系统的构建方法、系统及相关装置 |
CN111582036B (zh) * | 2020-04-09 | 2023-03-07 | 天津大学 | 可穿戴设备下基于形状和姿态的跨视角人物识别方法 |
CN111507521B (zh) * | 2020-04-15 | 2023-12-01 | 北京智芯微电子科技有限公司 | 台区电力负荷预测方法及预测装置 |
CN111724458B (zh) * | 2020-05-09 | 2023-07-04 | 天津大学 | 一种语音驱动的三维人脸动画生成方法及网络结构 |
CN111626154B (zh) * | 2020-05-14 | 2023-04-07 | 闽江学院 | 一种基于卷积变分编码器的人脸跟踪方法 |
CN112069877B (zh) * | 2020-07-21 | 2022-05-03 | 北京大学 | 一种基于边缘信息和注意力机制的人脸信息识别方法 |
CN111950635B (zh) * | 2020-08-12 | 2023-08-25 | 温州大学 | 一种基于分层特征对齐的鲁棒特征学习方法 |
CN112085850B (zh) * | 2020-09-10 | 2024-06-21 | 京东方科技集团股份有限公司 | 人脸重建方法及相关设备 |
CN112132430B (zh) * | 2020-09-14 | 2022-09-27 | 国网山东省电力公司电力科学研究院 | 一种配电主设备分布式状态传感器可靠性评估方法及系统 |
CN112785684B (zh) * | 2020-11-13 | 2022-06-14 | 北京航空航天大学 | 一种基于局部信息加权机制的三维模型重建方法 |
CN112818860B (zh) * | 2021-02-02 | 2022-06-07 | 北京航空航天大学 | 基于端到端多任务多尺度神经网络的实时三维人脸重建方法 |
WO2022236802A1 (zh) * | 2021-05-14 | 2022-11-17 | 中国科学院深圳先进技术研究院 | 一种物体模型的重建方法、装置、终端设备和存储介质 |
CN117597703B (zh) * | 2021-07-01 | 2024-09-10 | 谷歌有限责任公司 | 用于图像分析的多尺度变换器 |
CN116310150B (zh) * | 2023-05-17 | 2023-09-01 | 广东皮阿诺科学艺术家居股份有限公司 | 一种基于多尺度特征融合的家具多视图三维模型重建方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108492248A (zh) * | 2018-01-30 | 2018-09-04 | 天津大学 | 基于深度学习的深度图超分辨率方法 |
CN108875674A (zh) * | 2018-06-29 | 2018-11-23 | 东南大学 | 一种基于多列融合卷积神经网络的驾驶员行为识别方法 |
CN109146799A (zh) * | 2018-07-11 | 2019-01-04 | 天津大学 | 基于多张图的摩尔纹去除方法 |
CN109255755A (zh) * | 2018-10-24 | 2019-01-22 | 上海大学 | 基于多列卷积神经网络的图像超分辨率重建方法 |
CN109344736A (zh) * | 2018-09-12 | 2019-02-15 | 苏州大学 | 一种基于联合学习的静态图像人群计数方法 |
CN110059582A (zh) * | 2019-03-28 | 2019-07-26 | 东南大学 | 基于多尺度注意力卷积神经网络的驾驶员行为识别方法 |
CN110222218A (zh) * | 2019-04-18 | 2019-09-10 | 杭州电子科技大学 | 基于多尺度NetVLAD和深度哈希的图像检索方法 |
CN110288697A (zh) * | 2019-06-24 | 2019-09-27 | 天津大学 | 基于多尺度图卷积神经网络的3d人脸表示与重建方法 |
-
2019
- 2019-09-29 CN CN201910930936.7A patent/CN110728219B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108492248A (zh) * | 2018-01-30 | 2018-09-04 | 天津大学 | 基于深度学习的深度图超分辨率方法 |
CN108875674A (zh) * | 2018-06-29 | 2018-11-23 | 东南大学 | 一种基于多列融合卷积神经网络的驾驶员行为识别方法 |
CN109146799A (zh) * | 2018-07-11 | 2019-01-04 | 天津大学 | 基于多张图的摩尔纹去除方法 |
CN109344736A (zh) * | 2018-09-12 | 2019-02-15 | 苏州大学 | 一种基于联合学习的静态图像人群计数方法 |
CN109255755A (zh) * | 2018-10-24 | 2019-01-22 | 上海大学 | 基于多列卷积神经网络的图像超分辨率重建方法 |
CN110059582A (zh) * | 2019-03-28 | 2019-07-26 | 东南大学 | 基于多尺度注意力卷积神经网络的驾驶员行为识别方法 |
CN110222218A (zh) * | 2019-04-18 | 2019-09-10 | 杭州电子科技大学 | 基于多尺度NetVLAD和深度哈希的图像检索方法 |
CN110288697A (zh) * | 2019-06-24 | 2019-09-27 | 天津大学 | 基于多尺度图卷积神经网络的3d人脸表示与重建方法 |
Non-Patent Citations (2)
Title |
---|
CIRESAND.C.Multi-column deep neural networks for image classification for image classification.IEEE Conference on Computer Vision and Pattern Recogniton.2012,3642-3649. * |
张红颖.多特征融合的尺度自适应相关滤波跟踪算法.系统工程与电子技术.2019,第41卷(第5期),951-957. * |
Also Published As
Publication number | Publication date |
---|---|
CN110728219A (zh) | 2020-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110728219B (zh) | 基于多列多尺度图卷积神经网络的3d人脸生成方法 | |
CN111047548B (zh) | 姿态变换数据处理方法、装置、计算机设备和存储介质 | |
Singer et al. | Text-to-4d dynamic scene generation | |
Tao et al. | Bayesian tensor approach for 3-D face modeling | |
CN110852941B (zh) | 一种基于神经网络的二维虚拟试衣方法 | |
CN112215050A (zh) | 非线性3dmm人脸重建和姿态归一化方法、装置、介质及设备 | |
CN110288697A (zh) | 基于多尺度图卷积神经网络的3d人脸表示与重建方法 | |
CN112132739B (zh) | 3d重建以及人脸姿态归一化方法、装置、存储介质及设备 | |
CN113077554A (zh) | 一种基于任意视角图片的三维结构化模型重建的方法 | |
CN116385667B (zh) | 三维模型的重建方法、纹理重构模型的训练方法以及装置 | |
CN114339409A (zh) | 视频处理方法、装置、计算机设备及存储介质 | |
Xu et al. | AutoSegNet: An automated neural network for image segmentation | |
CN118229632A (zh) | 显示屏缺陷检测方法、模型训练方法、装置、设备及介质 | |
CN110675311A (zh) | 一种素描序约束下的素描生成的方法、装置及存储介质 | |
Song et al. | WAFP-Net: Weighted attention fusion based progressive residual learning for depth map super-resolution | |
CN116758212A (zh) | 基于自适应去噪算法的3d重建方法、装置、设备及介质 | |
CN113592021B (zh) | 一种基于可变形和深度可分离卷积的立体匹配方法 | |
Yan et al. | Mvoxti-dnerf: Explicit multi-scale voxel interpolation and temporal encoding network for efficient dynamic neural radiance field | |
CN116978057A (zh) | 图像中人体姿态迁移方法、装置、计算机设备和存储介质 | |
CN116883524A (zh) | 图像生成模型训练、图像生成方法、装置和计算机设备 | |
Xiao et al. | Multi-dimensional graph interactional network for progressive point cloud completion | |
Kang et al. | Eyeglass Remover Network based on a Synthetic Image Dataset. | |
Parekh et al. | Image Super-Resolution using GAN-A study | |
CN116363329B (zh) | 基于CGAN与LeNet-5的三维图像生成方法及系统 | |
Li et al. | Guiding 3D Digital Content Generation with Pre-Trained Diffusion Models. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |