CN116385698B - 网格重建模型的训练方法、网格重建方法及装置 - Google Patents
网格重建模型的训练方法、网格重建方法及装置 Download PDFInfo
- Publication number
- CN116385698B CN116385698B CN202310595248.6A CN202310595248A CN116385698B CN 116385698 B CN116385698 B CN 116385698B CN 202310595248 A CN202310595248 A CN 202310595248A CN 116385698 B CN116385698 B CN 116385698B
- Authority
- CN
- China
- Prior art keywords
- sample
- grid
- spherical
- original
- reconstruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 115
- 238000012549 training Methods 0.000 title claims abstract description 114
- 238000003062 neural network model Methods 0.000 claims abstract description 104
- 238000006243 chemical reaction Methods 0.000 claims abstract description 10
- 238000013507 mapping Methods 0.000 claims description 126
- 238000005070 sampling Methods 0.000 claims description 107
- 238000012545 processing Methods 0.000 claims description 59
- 230000004927 fusion Effects 0.000 claims description 54
- 230000009466 transformation Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 19
- 230000015654 memory Effects 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 24
- 238000005516 engineering process Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 238000013473 artificial intelligence Methods 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 10
- 230000001133 acceleration Effects 0.000 description 9
- 210000000887 face Anatomy 0.000 description 8
- 238000012512 characterization method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 239000004973 liquid crystal related substance Substances 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 238000009877 rendering Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000037303 wrinkles Effects 0.000 description 4
- 210000001061 forehead Anatomy 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- RKTYLMNFRDHKIL-UHFFFAOYSA-N copper;5,10,15,20-tetraphenylporphyrin-22,24-diide Chemical compound [Cu+2].C1=CC(C(=C2C=CC([N-]2)=C(C=2C=CC=CC=2)C=2C=CC(N=2)=C(C=2C=CC=CC=2)C2=CC=C3[N-]2)C=2C=CC=CC=2)=NC1=C3C1=CC=CC=C1 RKTYLMNFRDHKIL-UHFFFAOYSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000003746 surface roughness Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
- G06T17/20—Finite element generation, e.g. wire-frame surface description, tesselation
- G06T17/205—Re-meshing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
Abstract
本申请公开了一种网格重建模型的训练方法、网格重建方法及装置,属于计算机技术领域。方法包括:获取样本原始网格,样本原始网格包括多个样本原始顶点的位置信息;通过神经网络模型对样本原始网格进行球面参数化,得到样本球面网格,样本球面网格包括的任一个样本球面子网格是通过对样本原始网格中一个样本原始子网格进行球面转化得到的;通过神经网络模型基于样本球面网格确定样本重建网格,样本重建网格包括多个样本重建顶点的位置信息;基于各个样本原始顶点的位置信息和各个样本重建顶点的位置信息,对神经网络模型进行训练得到网格重建模型。本申请可以训练得到网格重建模型,通过网格重建模型重建出逼真度较高的网格。
Description
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种网格重建模型的训练方法、网格重建方法及装置。
背景技术
随着计算机技术的发展,三维(Three-Dimensional,3D)建模技术也随之发展,3D建模技术是通过建模软件在虚拟的三维空间中构建出物体的三维模型,该三维模型称为网格。一般情况下,网格包括多个顶点和多个三角面,其中,这些三角面是通过这些顶点拓扑连接形成,一个三角面包括三个顶点。
一般情况下,网格中的顶点均匀分布,使得各个三角面的面积相差较小,导致网格无法体现出物体中凹凸区域的细节。基于此,如何重建出逼真度较高的网格成为一个亟需解决的问题。
发明内容
本申请提供了一种网格重建模型的训练方法、网格重建方法及装置,可以训练得到网格重建模型,通过网格重建模型重建出逼真度较高的网格,所述技术方案包括如下内容。
第一方面,提供了一种网格重建模型的训练方法,所述方法包括:
获取样本原始网格,所述样本原始网格包括多个样本原始顶点的位置信息;
通过神经网络模型对所述样本原始网格进行球面参数化,得到样本球面网格,所述样本球面网格包括至少一个样本球面子网格,任一个样本球面子网格是通过对所述样本原始网格中一个样本原始子网格进行球面转化得到的;
通过所述神经网络模型基于所述样本球面网格确定样本重建网格,所述样本重建网格包括多个样本重建顶点的位置信息;
基于各个样本原始顶点的位置信息和各个样本重建顶点的位置信息,对所述神经网络模型进行训练,得到网格重建模型,所述网格重建模型用于对目标原始网格进行重建得到目标重建网格。
第二方面,提供了一种网格重建方法,所述方法包括:
获取目标原始网格,所述目标原始网格包括多个目标原始顶点的位置信息;
通过网格重建模型对所述目标原始网格进行球面参数化,得到目标球面网格,所述目标球面网格包括至少一个目标球面子网格,任一个目标球面子网格是通过对所述目标原始网格中一个目标原始子网格进行球面转化得到的,所述网格重建模型是按照第一方面所述的网格重建模型的训练方法训练得到的;
通过所述网格重建模型基于所述目标球面网格确定目标重建网格,所述目标重建网格包括多个目标重建顶点的位置信息。
第三方面,提供了一种网格重建模型的训练装置,所述装置包括:
获取模块,用于获取样本原始网格,所述样本原始网格包括多个样本原始顶点的位置信息;
参数化模块,用于通过神经网络模型对所述样本原始网格进行球面参数化,得到样本球面网格,所述样本球面网格包括至少一个样本球面子网格,任一个样本球面子网格是通过对所述样本原始网格中一个样本原始子网格进行球面转化得到的;
确定模块,用于通过所述神经网络模型基于所述样本球面网格确定样本重建网格,所述样本重建网格包括多个样本重建顶点的位置信息;
训练模块,用于基于各个样本原始顶点的位置信息和各个样本重建顶点的位置信息,对所述神经网络模型进行训练,得到网格重建模型,所述网格重建模型用于对目标原始网格进行重建得到目标重建网格。
在一种可能的实现方式中,所述神经网络模型包括球面映射网络;
所述参数化模块,用于通过所述球面映射网络对所述样本原始网格进行球面参数化,得到所述样本球面网格;或者,对所述样本原始网格进行下采样得到样本稀疏网格,通过所述球面映射网络对所述样本稀疏网格进行球面参数化,得到所述样本球面网格。
在一种可能的实现方式中,所述获取模块,还用于获取参考原始网格,所述参考原始网格包括多个参考原始顶点的位置信息;
所述装置还包括:
计算模块,用于基于各个参考原始顶点的位置信息,计算各个参考原始顶点的球坐标;
所述参数化模块,还用于通过初始映射网络对所述参考原始网格进行球面参数化,得到参考球面网格,所述参考球面网格包括至少一个参考球面子网格,任一个参考球面子网格是通过对所述参考原始网格中一个参考原始子网格进行球面转化得到的;
所述训练模块,还用于基于所述各个参考原始顶点的球坐标和所述参考球面网格,对所述初始映射网络进行训练,得到所述球面映射网络。
在一种可能的实现方式中,所述神经网络模型包括编码网络和解码网络;
所述确定模块,用于通过所述编码网络对所述样本球面网格进行编码处理,得到球面网格特征;通过所述解码网络对所述球面网格特征和所述样本球面网格进行解码处理,得到所述样本重建网格。
在一种可能的实现方式中,所述样本球面网格包括凹凸区域和平坦区域;
所述确定模块,用于对所述凹凸区域进行傅里叶映射处理,得到傅里叶映射处理后的凹凸区域;通过所述编码网络对所述平坦区域和所述傅里叶映射处理后的凹凸区域进行编码处理,得到所述球面网格特征。
在一种可能的实现方式中,所述样本球面网格是通过球面映射网络对样本稀疏网格进行球面参数化得到的,所述样本稀疏网格包括多个采样顶点的位置信息,一个采样顶点是一个样本原始顶点;所述球面网格特征包括所述多个采样顶点的特征;
所述确定模块,用于将所述多个采样顶点的特征进行融合,得到样本融合特征;通过所述解码网络对所述样本融合特征和所述样本球面网格进行解码处理,得到所述样本重建网格。
在一种可能的实现方式中,所述多个采样顶点包括至少一个集合,任一个集合包括至少一个采样顶点;
所述确定模块,用于对于任一个集合,基于所述任一个集合中各个采样顶点的特征,确定参考点的特征,将所述参考点的特征和所述任一个集合中各个采样顶点的特征进行融合,得到所述任一个集合对应的融合特征,所述参考点是所述任一个集合中各个采样顶点构成的几何形体的中心点;基于各个集合对应的融合特征,确定所述样本融合特征。
在一种可能的实现方式中,所述确定模块,用于确定所述参考点的特征和所述任一个集合中各个采样顶点的特征之间的特征差异;将所述参考点的特征和所述特征差异进行融合,得到所述任一个集合对应的融合特征。
在一种可能的实现方式中,所述训练模块,用于对于任一个样本原始顶点,基于所述任一个样本原始顶点的位置信息和所述任一个样本原始顶点对应的样本重建顶点的位置信息,确定所述任一个样本原始顶点和对应样本重建顶点之间的第一距离;基于各个样本原始顶点和对应样本重建顶点之间的第一距离,确定第一损失;基于所述第一损失对所述神经网络模型进行训练,得到所述网格重建模型。
在一种可能的实现方式中,所述训练模块,用于基于所述各个样本原始顶点的位置信息,确定所述各个样本原始顶点的第一信息差异,任一个样本原始顶点的第一信息差异用于描述所述任一个样本原始顶点和位置相邻的样本原始顶点之间的位置信息差异;基于所述各个样本重建顶点的位置信息,确定所述各个样本重建顶点的第二信息差异,任一个样本重建顶点的第二信息差异用于描述所述任一个样本重建顶点和位置相邻的样本重建顶点之间的位置信息差异;基于所述各个样本原始顶点的第一信息差异和所述各个样本重建顶点的第二信息差异,确定第二损失;基于所述第二损失对所述神经网络模型进行训练,得到所述网格重建模型。
在一种可能的实现方式中,所述训练模块,用于对于任一个样本原始顶点,从所述多个样本原始顶点中采样出与所述任一个样本原始顶点位置相邻的相邻原始顶点;基于所述任一个样本原始顶点的位置信息和所述相邻原始顶点的位置信息,确定所述任一个样本原始顶点的第一信息差异。
在一种可能的实现方式中,所述训练模块,用于对于任一个样本重建顶点,从所述多个样本重建顶点中采样出与所述任一个样本重建顶点位置相邻的相邻重建顶点;基于所述任一个样本重建顶点的位置信息和所述相邻重建顶点的位置信息,确定所述任一个样本重建顶点的第二信息差异。
第四方面,提供了一种网格重建装置,所述装置包括:
获取模块,用于获取目标原始网格,所述目标原始网格包括多个目标原始顶点的位置信息;
参数化模块,用于通过网格重建模型对所述目标原始网格进行球面参数化,得到目标球面网格,所述目标球面网格包括至少一个目标球面子网格,任一个目标球面子网格是通过对所述目标原始网格中一个目标原始子网格进行球面转化得到的,所述网格重建模型是按照第一方面所述的网格重建模型的训练方法训练得到的;
确定模块,用于通过所述网格重建模型基于所述目标球面网格确定目标重建网格,所述目标重建网格包括多个目标重建顶点的位置信息。
在一种可能的实现方式中,所述确定模块,用于通过所述网格重建模型对所述目标球面网格进行编码处理,得到目标网格特征;通过所述网格重建模型对所述目标网格特征和所述目标球面网格进行解码处理,得到所述目标重建网格。
第五方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述电子设备实现上述第一方面所述的网格重建模型的训练方法或者实现上述第二方面所述的网格重建方法。
第六方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现上述第一方面所述的网格重建模型的训练方法或者实现上述第二方面所述的网格重建方法。
第七方面,还提供了一种计算机程序或计算机程序产品,所述计算机程序或计算机程序产品中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一种第一方面所述的网格重建模型的训练方法或者实现上述第二方面所述的网格重建方法。
本申请提供的技术方案至少带来如下有益效果:
本申请提供的技术方案中,通过神经网络模型对样本原始网格进行球面参数化,实现了对样本原始网格中各个样本原始子网格进行球面转化,得到样本球面网格中各个样本球面子网格。通过球面转化,实现了对于平坦区域,增加顶点之间的距离,从而增加面片面积,对于凹凸区域,减小顶点之间的距离,从而减小面片面积。在通过神经网络模型基于样本球面网格确定样本重建网格时,样本重建网格中位于平坦区域的顶点之间的距离大,面片面积大,而样本重建网格中位于凹凸区域的顶点之间的距离小,面片面积小,从而提高了样本重建网格的逼真度。通过对神经网络模型进行训练得到网格重建模型,实现了方便快捷地对目标原始网格进行重建,提高重建得到的目标重建网格的逼真度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网格重建模型的训练方法或者网格重建方法的实施环境示意图;
图2是本申请实施例提供的一种网格重建模型的训练方法的流程图;
图3是本申请实施例提供的一种网格重建方法的流程图;
图4是本申请实施例提供的一种对网格进行重建的框架图;
图5是本申请实施例提供的一种网格重建的示意图;
图6是本申请实施例提供的另一种网格重建的示意图;
图7是本申请实施例提供的一种网格重建模型的训练装置的结构示意图;
图8是本申请实施例提供的一种网格重建装置的结构示意图;
图9是本申请实施例提供的一种终端设备的结构示意图;
图10是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1是本申请实施例提供的一种网格重建模型的训练方法或者网格重建方法的实施环境示意图,如图1所示,该实施环境包括终端设备101和服务器102。其中,本申请实施例中的网格重建模型的训练方法或者网格重建方法可以由终端设备101执行,也可以由服务器102执行,或者由终端设备101和服务器102共同执行。
终端设备101可以是智能手机、游戏主机、台式计算机、平板电脑、膝上型便携计算机、智能电视、智能车载设备、智能语音交互设备、智能家电等。服务器102可以为一台服务器,或者为多台服务器组成的服务器集群,或者为云计算平台和虚拟化中心中的任意一种,本申请实施例对此不加以限定。服务器102可以与终端设备101通过有线网络或无线网络进行通信连接。服务器102可以具有数据处理、数据存储以及数据收发等功能,在本申请实施例中不加以限定。终端设备101和服务器102的数量不受限制,可以是一个或多个。
本申请各可选实施例可以基于人工智能(Artificial Intelligence,AI)技术实现。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
在计算机技术领域中,常常通过建模软件在虚拟的三维空间中构建出物体的网格。网格包括多个顶点和多个三角面,这些三角面通过这些顶点拓扑连接形成。由于网格中的顶点均匀分布,使得三角面的面积之间相差较小,导致网格无法体现出物体凹凸区域的细节。基于此,如何重建出逼真度较高的网格成为一个亟需解决的问题。
本申请实施例提供了一种网格重建模型的训练方法,该方法可应用于上述实施环境中,可以训练得到网格重建模型,通过网格重建模型重建出逼真度较高的网格。以图2所示的本申请实施例提供的一种网格重建模型的训练方法的流程图为例,为便于描述,将执行本申请实施例中的网格重建模型的训练方法的终端设备101或者服务器102称为电子设备,该方法可以由电子设备来执行。如图2所示,该方法包括如下步骤。
步骤201,获取样本原始网格,样本原始网格包括多个样本原始顶点的位置信息。
本申请实施例中,样本原始网格是通过建模软件构建得到的任意物体的三维模型。其中,本申请实施例不对建模软件的类型、功能等进行限定。此外,物体可以是真实存在的物体,例如,物体为建筑物、电器等,物体也可以是虚构的物体,例如,物体为虚构生物等。
样本原始网格包括第一数量的样本原始顶点,每一个样本原始顶点存在其对应的数据。一个样本原始顶点的数据包括该样本原始顶点的位置信息、该样本原始顶点的属性信息等。
可选地,样本原始顶点的位置信息表征样本原始顶点在三维空间的位置,可以使用三维坐标系描述三维空间,该三维坐标系包括横轴(即x轴)、纵轴(即y轴)和竖轴(即z轴)。这种情况下,样本原始顶点的位置信息包括样本原始顶点在横轴的坐标(即横坐标,也称为x坐标)、样本原始顶点在纵轴的坐标(即纵坐标,也称为y坐标)和样本原始顶点在竖轴的坐标(即竖坐标,也称为z坐标),可以将样本原始顶点的位置信息称为样本原始顶点的三维(Three-Dimensional,3D)坐标。
可选地,样本原始顶点的属性信息用于描述样本原始顶点的纹理、样本原始顶点的颜色、样本原始顶点所属样本原始网格的部位等属性。例如,样本原始顶点的属性信息包括三原色(Red-Green-Blue,GRB)信息,和/或,在样本原始网格为面部网格的情况下,样本原始网格包括眼部、唇部、鼻子等部位,样本原始顶点的属性信息包括样本原始顶点属于眼部、唇部、鼻子等任一个部位的信息。
可以理解的是,样本原始网格还可以为虚构生物、建筑物、电器等任意物体的网格,而不同物体的网格对应不同的部位。例如,在样本原始网格为水杯网格的情况,水杯网格包括杯体、杯盖、把手等部位,此时,样本原始顶点的属性信息包括样本原始顶点属于杯体、杯盖、把手等任一个部位的信息。
在本申请实施例中,样本原始网格包括的各个样本原始顶点拓扑连接后形成多个样本原始几何面,一个样本原始几何面可以为三角面、四角面、圆面、扇面等任一种,任两个样本原始几何面的形状可以相同或者不同。其中,一个样本原始几何面包括至少一个样本原始顶点。例如,三角面包括三个样本原始顶点,且这三个样本原始顶点为三角面的三个顶点;圆面包括多个样本原始顶点,且这些样本原始顶点位于圆面边缘。
在示例性实施例中,样本原始网格可以表示为:M=(V,F)。其中,M表征样本原始网格。V表征包括样本原始网格中各个样本原始顶点的集合,如果样本原始网格包括N(N为正整数)个样本原始顶点,则集合V={v1,…,vN},其中,v1,…,vN表征第1个至第N个样本原始顶点,N为正整数。F表征包括样本原始网格中各个样本原始几何面的集合,如果样本原始几何面为三角面,则集合,表征每一个样本原始几何面包括集合V中的三个样本原始顶点。
步骤202,通过神经网络模型对样本原始网格进行球面参数化,得到样本球面网格,样本球面网格包括至少一个样本球面子网格,任一个样本球面子网格是通过对样本原始网格中一个样本原始子网格进行球面转化得到的。
样本原始网格包括至少一个样本原始子网格,一个样本原始子网格包括连续的至少一个样本原始几何面。由于一个样本原始几何面包括至少一个样本原始顶点,因此,一个样本原始子网格包括至少一个样本原始顶点。
通常情况下,样本原始子网格包括多个样本原始几何面,一部分样本原始顶点位于样本原始子网格的表面边缘,这部分样本原始顶点用于确定样本原始子网格的大小、轮廓等,而另一部分样本原始顶点位于样本原始子网格的表面内部,这部分样本原始顶点用于确定样本原始子网格的表面凹凸形状。通常情况下,样本原始子网格中各个样本原始几何面的形状、面积等相差较小,导致样本原始子网格中的各个样本原始顶点近似均匀地分布在样本原始子网格中。
例如,当样本原始网格对应面部时,样本原始子网格可以对应脸颊。一部分样本原始顶点位于脸颊的表面边缘,这部分样本原始顶点用于确定脸颊的轮廓、大小等,另一部分样本原始顶点位于脸颊的表面内部,这部分样本原始顶点用于确定脸颊的表面凹凸形状。
本申请实施例中,通过神经网络模型对样本原始网格进行球面参数化,可以实现对任一个样本原始子网格进行球面转化,得到对应的样本球面子网格,其中,该样本球面子网格和样本原始子网格对应物体的同一个部位。该样本球面子网格是球面形状的网格,包括至少一个样本球面顶点,一个样本球面顶点位于任一个样本原始子网格对应的样本球面子网格的表面边缘。通过各个样本球面顶点确定样本球面子网格的大小、轮廓等,而样本球面子网格本身是球面,因此,样本球面子网格本身可以描述样本球面子网格的表面凹凸形状。
接上例,样本原始子网格对应脸颊,通过神经网络模型将样本原始子网格转化为样本球面子网格之后,样本球面子网格也对应脸颊。其中,样本球面顶点位于脸颊的表面边缘,这部分样本球面顶点用于确定脸颊的轮廓、大小等。样本球面子网格本身是一个球面,通过该球面描述脸颊的表面凹凸形状。
本申请实施例中,通过对样本原始子网格进行球面转化得到样本球面子网格,实现了将样本原始子网格包括的各个样本原始几何面合并为样本球面子网格对应的球面,将近似均匀分布在样本原始子网格中的各个样本原始顶点,调整成分布在样本球面子网格的表面边缘的样本球面顶点。其中,样本球面子网格的表面边缘中顶点之间的距离小,导致面片面积小,而样本球面子网格的表面内部中顶点之间的距离大,导致面片面积大。由于不同样本球面子网格对应不同的球面,导致样本球面子网格之间容易形成凹凸区域,通过减小样本球面子网格的表面边缘中顶点之间的距离,实现了减小凹凸区域中顶点之间的距离,从而减小面片面积。又由于样本球面子网格本身属于平坦区域,通过增大样本球面子网格的表面内部中顶点之间的距离,实现了增大平坦区域中顶点之间的距离,从而增大面片面积。
综上,本申请实施例实现了对于平坦区域,增加顶点之间的距离,从而增加面片面积,对于凹凸区域,减小顶点之间的距离,减小面片面积,为提高网格逼真度奠定了基础。
需要说明的是,本申请实施例不对神经网络模型的结构、大小等做限定。可选地,神经网络模型为初始网络模型,初始网络模型包括球面映射网络、编码网络和解码网络,各网络的功能在下文有对应描述,在此不再赘述。或者,按照步骤201至步骤204的实现原理,对初始网络模型进行训练得到神经网络模型。
在一种可能的实现方式中,神经网络模型包括球面映射网络。本申请实施例不对球面映射网络的结构、大小等做限定,示例性地,球面映射网络为多层感知机(Multi-LayerPerceptron,MLP)、深度神经网络(Deep Neural Network,DNN)、全连接神经网络(FullyConnected Neural Network,FCNN)等中的任一项。这种情况下,步骤202包括步骤A1或者步骤A2(图中未示出)。
步骤A1,通过球面映射网络对样本原始网格进行球面参数化,得到样本球面网格。
本申请实施例中,球面映射网络基于共形映射的原理,将样本原始网格映射为样本球面网格。其中,共形映射是一种规范坐标和网格之间进行一对一映射的双射函数,共形映射可以表示为F:S2→M,F表征共形映射,S2表征单位球面,M表征网格。共形映射通过在网格上应用球形共形参数来实现,可以保证角度平滑、方向平滑、非退化和全局单射映射,从而使得映射前的单位球面和映射后的网格没有发生形变。
下面描述共形映射的实现原理。假设网格M是一个闭合流形网格,当网格M不是球面时,可以通过分裂网格M得到多个子网格,这些子网格记为{M1,…,MK},K(正整数)为子网格的数量,即网格M={M1,…,MK}。通过分裂网格得到子网格,使得子网格是一个球面。当子网格为球面时,该子网格为球面子网格,即子网格Mi为球面子网格Mgi,i∈{1,…,K}。当网格M是球面时,网格M本身为球面子网格。也就是说,任意的网格M均可以用一个或者多个球面子网格来表示,即M={Mg1,…,MgK}。此外,基于一般性(即事务的普遍性)可以得出,共形映射Fi:S2→Mgi,即将一个单位球面映射为任一个球面子网格。由于可以将单位球面映射为球面子网格,而任意的网格均可以用球面子网格表征,因此,可以将单位球面映射为任意的网格,即共形映射可以表示为F:S2→M。
本申请实施例中,将样本原始网格输入球面映射网络,通过球面映射网络基于共形映射的实现原理,将样本原始网格中的各个样本原始子网格映射为对应的球面,而一个样本原始子网格对应的球面为一个样本球面子网格。因此,通过球面映射网络可以得到各个样本原始子网格对应的样本球面子网格,从而得到样本球面网格,样本球面网格包括各个样本球面子网格。
上文已提及,共形映射通过应用球形共形参数来实现,而球形共形参数包括两个数字参数,分别为倾角和方位角。其中,倾角也叫极角,是球面上一点与球心之间的连线和天顶方向形成的夹角。方位角是球面上一点与球心之间的连线投影在与天顶方向正交的参考平面上时,该投影线与参考方向的夹角,参考方向与天顶方向垂直。基于此,样本球面网格中任一个样本球面顶点存在对应的球形共形参数。也就是说,通过任一个样本球面顶点的倾角和方位角来描述该样本球面顶点在样本球面网格中的位置。
可选地,共形映射可以表示为。其中,θ表征样本球面顶点的倾角,/>表征样本球面顶点的方位角,v表征样本球面顶点对应的样本原始顶点的3D坐标。基于此,本申请实施例中,通过球面映射网络,基于共形映射的实现原理,将部分样本原始顶点的3D坐标映射为对应样本球面顶点的倾角和方位角,从而得到样本球面网格。即,j∈{1,…,N},N表征样本原始顶点的数量。
步骤A2,对样本原始网格进行下采样得到样本稀疏网格,通过球面映射网络对样本稀疏网格进行球面参数化,得到样本球面网格。
本申请实施例中,可以随机确定下采样参数,或者,获取指定的下采样参数,基于下采样参数对样本原始网格进行随机下采样处理。其中,下采样参数用于描述从第五数量的样本原始顶点中采样出第六数量的样本原始顶点,第五数量小于第一数量,且第五数量大于第六数量。也就是说,对样本原始网格进行随机下采样处理时,按照从第五数量的样本原始顶点中采样出第六数量的样本原始顶点的方式,总共采样出“第一数量×第六数量/第五数量”个样本原始顶点,采样出的这些样本原始顶点可以被称为样本稀疏顶点。样本稀疏顶点是下文提及的采样顶点。各个样本稀疏顶点拓扑连接后形成多个样本稀疏几何面,各个样本稀疏几何面形成样本稀疏网格。其中,样本稀疏网格与样本原始网格的原理相类似,样本稀疏几何面与样本原始几何面的原理相类似,样本稀疏顶点与样本原始顶点的原理相类似,可以见步骤201的描述,在此不再赘述。
接着,通过球面映射网络,基于共形映射的实现原理,将样本稀疏网格中的各个样本稀疏子网格映射为对应的球面,一个样本稀疏子网格对应的球面为一个样本球面子网格,得到样本球面网格。其中,球面映射网络是将样本稀疏网格中全部或者部分样本稀疏顶点的3D坐标映射为对应样本球面顶点的倾角和方位角,从而得到样本球面网格。
可选地,一个样本稀疏几何面为一个样本稀疏子网格,这种情况下,球面映射网络将该样本稀疏子网格转化为对应的样本球面子网格时,将样本稀疏子网格中各个样本稀疏顶点的3D坐标映射为对应样本球面顶点的倾角和方位角。
可以理解的是,通过球面映射网络对样本稀疏网格进行球面参数化得到样本球面网格的实现原理与步骤A1的实现原理相类似,可以见步骤A1的描述,在此不再赘述。
通过对样本原始网格进行下采样,实现了降低顶点数量和几何面数量,简化网格,因此,样本稀疏网格的复杂度低。在通过球面映射网络对样本稀疏网格进行球面参数化时,能提高处理提高,节约处理时间。
在一种可能的实现方式中,需要先训练得到球面映射网络,再基于球面映射网络得到样本球面网格。其中,球面映射网络的训练步骤如下述步骤B1至步骤B4(图中未示出)所示,且步骤B1至步骤B4在步骤A1之前执行,或者,步骤B1至步骤B4在步骤A2之前执行。
步骤B1,获取参考原始网格,参考原始网格包括多个参考原始顶点的位置信息。其中,步骤B1的实现原理与步骤201的实现原理相类似,在此不再赘述。
步骤B2,基于各个参考原始顶点的位置信息,计算各个参考原始顶点的球坐标。
本申请实施例中,可以基于位置信息和球坐标之间的换算公式,将任一个参考原始顶点的位置信息,换算成该参考原始顶点的球坐标。本申请实施例中,球坐标包括倾角和方位角。可选地,位置信息和球坐标之间的换算公式如下公式(1)所示。
θ=arctan(sqrt(x2+y2))/z, θ∈[0,π]
公式(1)
其中,参考原始顶点的球坐标包括θ和,θ表征一个参考原始顶点的倾角,/>表征该参考原始顶点的方位角。参考原始顶点的位置信息包括x,y和z,x为参考原始顶点在横轴的坐标,y为参考原始顶点在纵轴的坐标,z为参考原始顶点在竖轴的坐标。arctan表征反正切函数。sqrt表征平方根函数。π表征180度。
步骤B3,通过初始映射网络对参考原始网格进行球面参数化,得到参考球面网格,参考球面网格包括至少一个参考球面子网格,任一个参考球面子网格是通过对参考原始网格中一个参考原始子网格进行球面转化得到的。
本申请实施例中,初始映射网络的原理和球面映射网络的原理相类似,可以见步骤A1的描述,在此不再赘述。通过初始映射网络,基于共形映射的实现原理,将参考原始网格中各个参考原始子网格映射为对应参考球面子网格。其中,在将一个参考原始子网格映射为对应参考球面子网格时,将参考原始子网格中至少一个参考原始顶点的位置信息(即3D坐标)映射为对应参考球面顶点的球坐标(包括倾角和方位角),从而得到参考球面子网格,参考球面子网格包括这些参考球面顶点的球坐标。参考球面网格包括各个参考球面子网格,因此,参考球面网格包括多个参考球面顶点的球坐标。
可以理解的是,步骤B3的实现原理与步骤A1的实现原理相类似,可以见步骤A1的描述,在此不再赘述。
步骤B4,基于各个参考原始顶点的球坐标和参考球面网格,对初始映射网络进行训练,得到球面映射网络。
本申请实施例中,参考球面网格包括多个参考球面顶点的球坐标。可以基于各个参考球面顶点的球坐标和各个参考原始顶点的球坐标,计算初始映射网络的损失。其中,初始映射网络的损失的计算方式与神经网络模型的损失的计算方式相类似,可以见步骤205的描述,在此不再赘述。
可以基于初始映射网络的损失,对初始映射网络进行训练,得到训练后的初始映射网络。如果训练后的初始映射网络满足第一训练结束条件,则将训练后的初始映射网络作为球面映射网络。如果训练后的初始映射网络不满足第一训练结束条件,则将训练后的初始映射网络作为下一次训练的初始映射网络,按照步骤B1至步骤B4的实现原理,对初始映射网络进行下一次训练,直至训练后的初始映射网络满足第一训练结束条件,将训练后的初始映射网络作为球面映射网络为止。
本申请实施例不对训练后的初始映射网络满足第一训练结束条件做限定。示例性地,训练后的初始映射网络满足第一训练结束条件是指:训练后的初始映射网络的训练次数达到设定次数,或者,训练后的初始映射网络对应的损失在设定范围内等。
通过训练得到球面映射网络,实现了通过球面映射网络快速地确定样本球面网格,提高处理提高,节约处理时间。
步骤203,通过神经网络模型基于样本球面网格确定样本重建网格,样本重建网格包括多个样本重建顶点的位置信息。
本申请实施例中,通过神经网络模型对样本球面网格进行网格重建,得到样本重建网格。样本重建网格是物体的三维模型,其中,样本原始网格对应的物体和样本重建网格对应的物体相同或者不同。
样本重建网格包括第一数量的样本重建顶点,每一个样本重建顶点存在其对应的数据。一个样本重建顶点的数据包括该样本重建顶点的位置信息、该样本重建顶点的属性信息等。其中,样本重建顶点的位置信息表征样本重建顶点在三维空间的位置,例如,样本重建顶点的位置信息包括样本重建顶点在横轴的坐标(即横坐标)、样本重建顶点在纵轴的坐标(即纵坐标)和样本重建顶点在竖轴的坐标(即竖坐标),可以将样本重建顶点的位置信息称为样本重建顶点的3D坐标。样本重建顶点的属性信息描述样本重建顶点的纹理、颜色、所属样本重建网格的部位等属性。
在本申请实施例中,样本重建网格包括的各个样本重建顶点拓扑连接后形成多个样本重建几何面,一个样本重建几何面可以为三角面、四角面、圆面、扇面等任一种,任两个样本重建几何面的形状可以相同或者不同。其中,一个样本重建几何面包括至少一个样本重建顶点。
可以理解的是,样本重建网格的内容与样本原始网格的内容相类似,可以见步骤201的描述,在此不再赘述。
由于样本球面网格具有平坦区域中顶点之间的距离大、面片面积大,而凹凸区域中顶点之间的距离小、面片面积小的特点,因此,基于样本球面网格重建出的样本重建网格也具有平坦区域中顶点之间的距离大、面片面积大,而凹凸区域中顶点之间的距离小、面片面积小的特点,使得样本重建网格能更好的展示出凹凸区域的细节,提高逼真度。由于平坦区域的面片面积大,因此,计算机对平坦区域进行图形渲染等处理时,可以减小处理时间,提高处理速度。
在一种可能的实现方式中,神经网络模型包括编码网络和解码网络。可选地,编码网络串联在球面映射网络之后,解码网络串联在编码网络之后。本申请实施例不对编码网络、解码网络的类型、大小等做限定,示例性地,编码网络、解码网络包括卷积网络、空洞卷积网络、激活网络、全连接网络、归一化网络等至少一种网络。
示例性地,步骤203包括步骤C1至步骤C2(图中未示出)。
步骤C1,通过编码网络对样本球面网格进行编码处理,得到球面网格特征。
本申请实施例中,可以将编码网络的参数与样本球面网格进行运算,以此实现通过编码网络对样本球面网格进行编码处理,得到球面网格特征。
可选地,编码网络为卷积网络,卷积网络包括至少一个卷积核,一个卷积核可以通过二次项核函数来描述。在通过编码网络对样本球面网格进行编码处理时,将样本球面网格和二次项核函数进行卷积处理,得到球面网格特征。
本申请实施例中,编码网络可以描述为如下所示的公式(2)。
zg=eng(M) 公式(2)
其中,zg表征球面网格特征。eng()是编码网络对应的函数,其中,eng=CONV(MESH,kern),CONV表征卷积处理,MESH表征样本球面网格,kern表征二次项核函数。M表征样本球面网格。
可选地,样本球面网格包括凹凸区域和平坦区域。本申请实施例中,可以对样本球面网格进行划分,得到凹凸区域和平坦区域。凹凸区域是曲率变化幅度大于阈值的区域,而平坦区域是曲率变化幅度不大于阈值的区域。
例如,样本球面网格对应面部,面部包括脸颊、额头、皱纹等。其中,脸颊、额头等的曲率变化幅度不大于阈值,因此,样本球面网格中脸颊、额头等对应的区域为平坦区域;而皱纹等的曲率变化幅度大于阈值,因此,样本球面网格中皱纹等对应的区域为凹凸区域。
这种情况下,步骤C1包括步骤C11至步骤C12(图中未示出)。
步骤C11,对凹凸区域进行傅里叶映射处理,得到傅里叶映射处理后的凹凸区域。
本申请实施例中,凹凸区域包括多个样本球面顶点的球坐标,一个样本球面顶点的球坐标包括该样本球面顶点的倾角和方位角。可以基于凹凸区域中各个样本球面顶点的倾角和方位角,对凹凸区域进行傅里叶映射处理,得到傅里叶映射处理后的凹凸区域。
可选地,按照如下所示的公式(3)对凹凸区域进行傅里叶映射处理。
公式(3)
其中,ξ(p)表征傅里叶映射处理后的凹凸区域。p表征凹凸区域中任一个样本球面顶点的球坐标,,θ表征该样本球面顶点的倾角,/>表征该样本球面顶点的方位角。sin表征正弦符号,cos表征余弦符号。L是超参数,超参数L可以为任意的正整数,例如,L=10。
通过对凹凸区域进行傅里叶映射处理,实现了对凹凸区域中各个样本球面顶点的球坐标进行傅里叶映射处理。相较于位置信息,球坐标更适用于傅里叶映射。在本申请实施例中,凹凸区域的曲率变化幅度大于阈值,而对于曲率变化幅度较大的区域,构成该区域的几何形体会出现高频变化的现象。相较于凹凸区域,傅里叶映射处理后的凹凸区域更能体现出几何形体的高频变化,从而更准确地表达出凹凸区域。
步骤C12,通过编码网络对平坦区域和傅里叶映射处理后的凹凸区域进行编码处理,得到球面网格特征。
本申请实施例中,可以将编码网络的参数与平坦区域进行运算,以此实现通过编码网络对平坦区域进行编码处理,得到平坦区域的特征。可选地,平坦区域的特征zg1=eng(M1),eng()是编码网络对应的函数,M1表征平坦区域。可以理解的是,通过编码网络对平坦区域进行编码处理的方式,可以见步骤C1的描述,二者实现原理相同,在此不再赘述。
同样地,将编码网络的参数与傅里叶映射处理后的凹凸区域进行运算,以此实现通过编码网络对傅里叶映射处理后的凹凸区域进行编码处理,得到凹凸区域的特征。由于傅里叶映射处理后的凹凸区域能更好的表达出几何形体的高频变化,准确性更高,因此,凹凸区域的特征具有较优的表达能力。可选地,凹凸区域的特征zg2=eng(M2),eng()是编码网络对应的函数,M2表征傅里叶映射处理后的凹凸区域。可以理解的是,通过编码网络对傅里叶映射处理后的凹凸区域进行编码处理的方式,可以见步骤C1的描述,二者实现原理相同,在此不再赘述。
接下来,将平坦区域的特征和凹凸区域的特征进行拼接,得到球面网格特征,且该球面网格特征的表达能力较高。
步骤C2,通过解码网络对球面网格特征和样本球面网格进行解码处理,得到样本重建网格。
本申请实施例中,样本球面网格包括各个样本球面顶点的球坐标。可以将球面网格特征和样本球面网格中各个样本球面顶点的球坐标进行拼接,得到拼接信息,通过解码网络将拼接信息映射为样本重建网格,以此实现通过解码网络对球面网格特征和样本球面网格进行解码处理。可选地,解码网络可以描述为如下所示的公式(4)。
公式(4)
其中,v表征样本重建网格。f表征解码网络对应的隐函数。表征拼接信息,zg表征球面网格特征,/>表征样本球面网格中各个样本球面顶点的球坐标,θ表征倾角,/>表征方位角。
可以理解的是,样本球面顶点的球坐标用于确定样本球面子网格的大小、轮廓等,而样本球面子网格本身可以描述样本球面子网格的表面凹凸形状,相当于样本球面顶点的球坐标对应样本球面子网格上的任意点,因此,球坐标是一种连续化坐标。而编码网格、解码网格可以对球坐标进行处理,因此,编码网络和解码网络都是连续化表示。
在一种可能的实现方式中,样本球面网格是通过球面映射网络对样本稀疏网格进行球面参数化得到的,样本稀疏网格包括多个采样顶点的位置信息,一个采样顶点是一个样本原始顶点。需要说明的是,这部分内容可以见步骤A1、步骤A2的描述,在此不再赘述。
可选地,样本球面网格包括各个采样顶点对应的样本球面顶点的球坐标。在通过编码网络对样本球面网格进行编码处理得到球面网格特征时,球面网格特征包括各个采样顶点对应的样本球面顶点的特征。
需要说明的是,由于样本球面网格是对样本稀疏网格进行球面参数化得到的,因此,样本稀疏网格是一个网格在三维坐标系的表现形式,而样本球面网格是该网格在球坐标系的表现形式。也就是说,样本稀疏网格和样本球面网格是同一网格在不同坐标系的不同表现形式。由于采样顶点是样本稀疏网格中的顶点,样本球面顶点是样本球面网格中的顶点,而一个采样顶点对应一个样本球面顶点,因此,采样顶点和样本球面顶点是同一顶点在不同坐标系的不同表现形式。也就是说,样本球面顶点的特征可以表征样本球面顶点,也可以表征样本球面顶点对应的采样顶点,同样地,采样顶点的特征可以表征采样顶点,也可以表征采样顶点对应的样本球面顶点,即样本球面顶点的特征相当于采样顶点的特征。基于此,球面网格特征包括多个采样顶点的特征。
在本申请实施例中,步骤C2包括步骤C21至步骤C22(图中未示出)。
步骤C21,将多个采样顶点的特征进行融合,得到样本融合特征。
本申请实施例不对采样顶点的特征融合方式进行限定。可选地,神经网络模型包括特征融合网络,特征融合网络串联在编码网络之后,且解码网络串联在特征融合网络之后。通过特征融合网络将多个采样顶点的特征进行融合,得到样本融合特征。
可选地,多个采样顶点包括至少一个集合,任一个集合包括至少一个采样顶点,这种情况下,步骤C21包括步骤C211至步骤C212(图中未示出)。可以理解的是,本申请实施例是将多个采样顶点划分为至少一个集合中的采样顶点,且不对划分方式做限定。一个集合包括至少一个采样顶点,一个采样顶点可以属于至少一个集合。例如,一个集合包括采样顶点A和采样顶点B,另一个集合包括采样顶点A和采样顶点C。
步骤C211,对于任一个集合,基于任一个集合中各个采样顶点的特征,确定参考点的特征,将参考点的特征和任一个集合中各个采样顶点的特征进行融合,得到任一个集合对应的融合特征,参考点是任一个集合中各个采样顶点构成的几何形体的中心点。
本申请实施例不对集合中各个采样顶点构成的几何形体做限定,示例性地,该几何形体为三角形、正方形等任意的多边形。该几何形体的中心点为集合对应的参考点,其中,当几何形体为三角形时,三角形的中心点可以为三角形的重心、内心、外心、垂心等。
可以基于任一个集合中各个采样顶点的位置信息,确定该集合对应的参考点的位置信息。示例性地,一个采样顶点的位置信息包括横坐标、纵坐标和竖坐标,计算集合中各个采样顶点的横坐标的平均值、集合中各个采样顶点的纵坐标的平均值、集合中各个采样顶点的竖坐标的平均值,将三个平均值依次作为集合对应的参考点的横坐标、纵坐标和竖坐标,从而得到集合对应的参考点的位置信息。
首先,基于集合对应的参考点的位置信息和集合中各个采样顶点的位置信息,确定参考点与各个采样顶点之间的权重。
可选地,对于集合中的任一个采样顶点,计算集合对应的参考点和集合中除该采样顶点之外的各个采样顶点构成的几何形体(记为第一几何形体)的面积,并计算集合中各个采样顶点构成的几何形体(记为第二几何形体)的面积,将第一几何形体的面积和第二几何形体的面积之间的比值,作为参考点与该采样顶点之间的权重。
例如,集合中包括采样顶点A至C,采样顶点A至C构成三角形ABC,三角形ABC的重心(即集合对应的参考点)为O。对于采样顶点A,参考点O、采样顶点B、采样顶点C构成三角形OBC,此时,参考点O与采样顶点A之间的权重为:三角形OBC的面积与三角形ABC的面积之比。基于同样的原理,参考点O与采样顶点B之间的权重为:三角形OAC的面积与三角形ABC的面积之比;参考点O与采样顶点C之间的权重为:三角形OAB的面积与三角形ABC的面积之比。
接着,基于任一个集合中各个采样顶点的特征、参考点与各个采样顶点之间的权重进行加权求和运算,得到参考点的特征。可选地,集合包括三个采样顶点时,参考点的特征表示为如下所示的公式(5)。
公式(5)
其中,表征集合对应的参考点的特征。zl1表征集合中第一个采样顶点的特征,λ1表征参考点与第一个采样顶点之间的权重。zl2表征集合中第二个采样顶点的特征,λ2表征参考点与第二个采样顶点之间的权重。zl3表征集合中第三个采样顶点的特征,λ3表征参考点与第三个采样顶点之间的权重。
之后,将集合对应的参考点的特征和集合中各个采样顶点的特征进行融合,得到集合对应的融合特征。本申请实施例不对特征融合方式做限定,下面给出了两种可能的融合方式,在应用时,可以有其他的融合方式。
在第一种可能的实现方式中,将集合对应的参考点的特征、集合中各个采样顶点的特征进行求和、求平均等运算,得到的运算结果为集合对应的融合特征。
在第二种可能的实现方式中,步骤C211中“将参考点的特征和任一个集合中各个采样顶点的特征进行融合,得到任一个集合对应的融合特征”,包括:确定参考点的特征和任一个集合中各个采样顶点的特征之间的特征差异;将参考点的特征和特征差异进行融合,得到任一个集合对应的融合特征。
本申请实施例中,对于集合中的任一个采样顶点,将参考点的特征减去该采样顶点的特征,得到参考点和该采样顶点之间的特征差异。将参考点和各个采样顶点之间的特征差异、参考点的特征进行融合,得到集合对应的融合特征。可选地,集合包括三个采样顶点,按照如下所示的公式(6)计算集合对应的融合特征。
公式(6)
其中,zl表征集合对应的融合特征。表征集合对应的参考点的特征。zl1表征集合中第一个采样顶点的特征。zl2表征集合中第二个采样顶点的特征。zl3表征集合中第三个采样顶点的特征。λ为超参数。⊕表征直和运算。
步骤C212,基于各个集合对应的融合特征,确定样本融合特征。其中,可以将各个集合对应的融合特征进行拼接,得到样本融合特征。或者,将各个集合对应的融合特征进行求和、求平均等运算,得到的运算结果作为样本融合特征。
在本申请实施例中,对于任一个集合,将集合中各个采样顶点的特征和各个采样顶点构成的几何形体的中心点的特征进行融合,得到集合对应的融合特征,使得集合对应的融合特征能更好的表达出几何形体,提高针对局部区域的特征表达能力。接着,基于各个集合对应的融合特征确定样本融合特征,该样本融合特征能更好的表达出各个局部区域,从而更好的表达出样本球面网格,有利于提高样本重建网格的准确性。
步骤C22,通过解码网络对样本融合特征和样本球面网格进行解码处理,得到样本重建网格。
本申请实施例中,样本球面网格包括各个样本球面顶点的球坐标。可以将样本融合特征和样本球面网格中各个样本球面顶点的球坐标进行拼接,得到拼接信息,通过解码网络将拼接信息映射为样本重建网格,以此实现通过解码网络对样本融合特征和样本球面网格进行解码处理。可选地,解码网络可以描述为如下所示的公式(7)。
公式(7)
其中,v表征样本重建网格。f表征解码网络对应的隐函数。表征拼接信息,z1表征样本融合特征,/>表征样本球面网格中各个样本球面顶点的球坐标,θ表征倾角,/>表征方位角。
步骤204,基于各个样本原始顶点的位置信息和各个样本重建顶点的位置信息,对神经网络模型进行训练,得到网格重建模型,网格重建模型用于对目标原始网格进行重建得到目标重建网格。
本申请实施例中,可以基于各个样本原始顶点的位置信息和各个样本重建顶点的位置信息,确定神经网络模型的损失。基于神经网络模型的损失对神经网络模型进行训练,得到训练后的神经网络模型。如果训练后的神经网络模型满足第二训练结束条件,则将训练后的神经网络模型作为网格重建模型。如果训练后的神经网络模型不满足第二训练结束条件,则将训练后的神经网络模型作为下一次训练的神经网络模型,按照步骤201至步骤204的实现原理,对神经网络模型进行下一次训练,直至训练后的神经网络模型满足第二训练结束条件,将训练后的神经网络模型作为网格重建模型为止。
本申请实施例不对训练后的神经网络模型满足第二训练结束条件做限定。示例性地,训练后的神经网络模型满足第二训练结束条件是指:训练后的神经网络模型对应的训练次数达到设定次数,或者,训练后的神经网络模型对应的损失在设定范围内。
在一种可能的实现方式中,步骤204包括步骤D1至步骤D3(图中未示出)。
步骤D1,对于任一个样本原始顶点,基于任一个样本原始顶点的位置信息和任一个样本原始顶点对应的样本重建顶点的位置信息,确定任一个样本原始顶点和对应样本重建顶点之间的第一距离。
本申请实施例中,位置信息包括横坐标、纵坐标和竖坐标。一个样本原始顶点对应
一个样本重建顶点。按照距离公式,基于样本原始顶点的三个坐标、对应样本重建顶点的三
个坐标,计算样本原始顶点和对应样本重建顶点之间的第一距离。其中,样本原始顶点v和
对应样本重建顶点之间的第一距离为:,其中,|| ||表征距离符号。
步骤D2,基于各个样本原始顶点和对应样本重建顶点之间的第一距离,确定第一损失。
可以将各个样本原始顶点和对应样本重建顶点之间的第一距离进行求和、求平均
等运算,得到第一损失。其中,第一损失可以表示为:,Lrec表征第一损失,V表
征样本原始网格中的各个样本原始顶点,表征样本重建网格中的各个样本重建顶点,||
||表征距离符号。
步骤D3,基于第一损失对神经网络模型进行训练,得到网格重建模型。
本申请实施例中,可以将第一损失作为神经网络模型的损失,或者,基于第一损失和下文提及的第二损失,确定神经网络模型的损失。基于神经网络模型的损失对神经网络模型进行训练,得到网格重建模型,其中,训练方式可以见步骤204的描述,在此不再赘述。
通过确定第一损失,可以使用第一损失表达样本原始网格和样本重建网格中顶点位置的误差。通过第一损失训练神经网络模型,使得模型可以朝着使样本原始网格和样本重建网格中顶点位置的误差小的方向更新,使模型输出的重建网格越来越靠近原始网格,提高重建网格的准确性和逼真度。
在另一种可能的实现方式中,步骤204包括步骤D4至步骤D7(图中未示出)。
步骤D4,基于各个样本原始顶点的位置信息,确定各个样本原始顶点的第一信息差异,任一个样本原始顶点的第一信息差异用于描述任一个样本原始顶点和位置相邻的样本原始顶点之间的位置信息差异。
本申请实施例中,可以基于各个样本原始顶点的位置信息,确定任一个样本原始顶点的第一信息差异,通过第一信息差异来描述在样本原始网格中样本原始顶点和位置相邻的样本原始顶点之间位置信息的差异。
可选地,步骤D4包括:对于任一个样本原始顶点,从多个样本原始顶点中采样出与任一个样本原始顶点位置相邻的相邻原始顶点;基于任一个样本原始顶点的位置信息和相邻原始顶点的位置信息,确定任一个样本原始顶点的第一信息差异。
本申请实施例中,样本原始网格中的各个样本原始顶点拓扑连接,也就是说,在样本原始网格中,一个样本原始顶点与至少一个样本原始顶点连接,通过这种方式形成拓扑结构。对于任一个样本原始顶点,可以从样本原始网格中采样与该样本原始顶点连接的至少一个样本原始顶点,采样出的这些样本原始顶点为相邻原始顶点。由于任一个样本原始顶点的相邻原始顶点和该样本原始顶点连接,因此,相邻原始顶点和该样本原始顶点位置相邻。
在采样出任一个样本原始顶点的至少一个相邻原始顶点之后,可以先计算各个相邻原始顶点的位置信息的平均值,该平均值作为基准点的位置信息,其中,基准点是各个相邻原始顶点构成的几何形体的中心点。然后,将该样本原始顶点的位置信息减去基准点的位置信息,得到该样本原始顶点的第一信息差异。
可选地,样本原始顶点的第一信息差异为:。其中,表征第i个
样本原始顶点的位置信息。表征一个集合,该集合包含第i个样本原始顶点的各个相邻原
始顶点,表征第i个样本原始顶点的相邻原始顶点的数量。表征第j个相邻原始顶点
的位置信息。表征基准点的位置信息。其中,样本原始顶点的第一信息差异也
称为拉普拉斯项。
步骤D5,基于各个样本重建顶点的位置信息,确定各个样本重建顶点的第二信息差异,任一个样本重建顶点的第二信息差异用于描述任一个样本重建顶点和位置相邻的样本重建顶点之间的位置信息差异。
可选地,步骤D5包括:对于任一个样本原始顶点,从多个样本原始顶点中采样出与任一个样本原始顶点位置相邻的相邻原始顶点;基于任一个样本原始顶点的位置信息和相邻原始顶点的位置信息,确定任一个样本原始顶点的第一信息差异。
可以理解的是,步骤D5的实现方式与步骤D4的实现方式相类似,在此不再赘述。
步骤D6,基于各个样本原始顶点的第一信息差异和各个样本重建顶点的第二信息差异,确定第二损失。
本申请实施例中,对于任一个样本原始顶点,基于该样本原始顶点的第一信息差异和对应样本重建顶点的第二信息差异,确定该样本原始顶点和对应样本重建顶点之间的第二距离。对各个样本原始顶点和对应样本重建顶点之间的第二距离进行求和、求平均等运算,得到第二损失。
可选地,按照如下所示的公式(8)计算第二损失,第二损失也称为拉普拉斯损失。
公式(8)
其中,表征第二损失。表征第i个样本原始顶点的第一信息差
异。表征第i个样本重建顶点的第二信息差异。
表征第i个样本原始顶点和对应样本重建顶点之间的第二距离。M表征样本原始顶点的数
量,即第一数量。
步骤D7,基于第二损失对神经网络模型进行训练,得到网格重建模型。
本申请实施例中,可以将第二损失作为神经网络模型的损失,或者,基于第一损失和上文提及的第一损失,确定神经网络模型的损失。基于神经网络模型的损失对神经网络模型进行训练,得到网格重建模型,其中,训练方式可以见步骤204的描述,在此不再赘述。
本申请实施例中,通过计算各个样本原始顶点的第一信息差异和各个样本重建顶点的第二信息差异,实现了计算顶点和位置相邻的顶点之间的位置信息差异,约束网格局部区域的误差。通过第一信息差异和第二信息差异计算第二损失,通过第二损失训练神经网络模型,使得模型可以朝着使样本重建网格中局部区域的误差小的方向更新,且模型可以朝着使样本重建网格中局部区域和样本原始网格中局部区域之间的误差小的方向更新,使模型输出的重建网格越来越靠近原始网格,提高重建网格的准确性。
可选地,可以对第一损失和第二损失进行加权计算,得到神经网络模型的损失。即,神经网络模型的损失为:L=Lrec+γLlap。其中,L表征神经网络模型的损失,Lrec表征第一损失,Llap表征第二损失,γ为第二损失的权重,第一损失的权重为1。本申请实施例不对第一损失的权重、第二损失的权重进行限定,也就是说,第一损失的权重为0至1之间的任意数据,第二损失的权重也为0至1之间的任意数据。可选地,第二损失的权重为0.05,即γ=0.05。
需要说明的是,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关地区的相关法律法规和标准。例如,本申请中涉及到的样本原始网格等都是在充分授权的情况下获取的。
上述方法中,通过神经网络模型对样本原始网格进行球面参数化,实现了对样本原始网格中各个样本原始子网格进行球面转化,得到样本球面网格中各个样本球面子网格。通过球面转化,实现了对于平坦区域,增加顶点之间的距离,从而增加面片面积,对于凹凸区域,减小顶点之间的距离,从而减小面片面积。在通过神经网络模型基于样本球面网格确定样本重建网格时,样本重建网格中位于平坦区域的顶点之间的距离大,面片面积大,而样本重建网格中位于凹凸区域的顶点之间的距离小,面片面积小,从而提高了样本重建网格的逼真度。通过对神经网络模型进行训练得到网格重建模型,实现了方便快捷地对目标原始网格进行重建,提高重建得到的目标重建网格的逼真度。
本申请实施例还提供了一种网格重建方法,该方法可应用于上述实施环境中,可以重建出逼真度较高的网格。以图3所示的本申请实施例提供的一种网格重建方法的流程图为例,为便于描述,将执行本申请实施例中的网格重建方法的终端设备101或者服务器102称为电子设备,该方法可以由电子设备来执行。如图3所示,该方法包括如下步骤。
步骤301,获取目标原始网格,目标原始网格包括多个目标原始顶点的位置信息。
可以理解的是,目标原始网格和样本原始网格相类似,目标原始顶点和样本原始顶点相类似,因此,步骤301的实现原理和步骤201的实现原理相类似,可以见步骤201的描述,在此不再赘述。
步骤302,通过网格重建模型对目标原始网格进行球面参数化,得到目标球面网格,目标球面网格包括至少一个目标球面子网格,任一个目标球面子网格是通过对目标原始网格中一个目标原始子网格进行球面转化得到的。
其中,网格重建模型是按照前述方法实施例中网格重建模型的训练方法训练得到的。
可以理解的是,目标原始网格和样本原始网格相类似,目标原始子网格和样本原始子网格相类似,目标球面网格和样本球面网格相类似,目标球面子网格和样本球面子网格相类似,因此,步骤302的实现原理和步骤202的实现原理相类似,可以见步骤202的描述,在此不再赘述。
步骤303,通过网格重建模型基于目标球面网格确定目标重建网格,目标重建网格包括多个目标重建顶点的位置信息。
可以理解的是,网格重建模型和神经网络模型相类似,目标球面网格和样本球面网格相类似,目标重建网格和样本重建网格相类似,目标重建顶点和样本重建顶点相类似,因此,步骤303的实现原理和步骤203的实现原理相类似,可以见步骤203的描述,在此不再赘述。
可选地,步骤303包括:通过网格重建模型对目标球面网格进行编码处理,得到目标网格特征;通过网格重建模型对目标网格特征和目标球面网格进行解码处理,得到目标重建网格。
可以理解的是,网格重建模型包括编码网络和解码网络。通过网格重建模型的编码网络对目标球面网格进行编码处理得到目标网格特征,其中,目标网格特征的确定方式和球面网格特征的确定方式相类似。通过网格重建模型的解码网络对目标网格特征和目标球面网格进行解码处理得到目标重建网格,其中,目标重建网格的确定方式和样本重建网格的确定方式相类似。因此,本部分内容可以步骤C1至步骤C2的描述,在此不再赘述。
需要说明的是,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关地区的相关法律法规和标准。例如,本申请中涉及到的目标原始网格等都是在充分授权的情况下获取的。
上述方法中,通过网格重建模型对目标原始网格进行球面参数化,实现了对目标原始网格中各个目标原始子网格进行球面转化,得到目标球面网格中各个目标球面子网格。通过球面转化,实现了对于平坦区域,增加顶点之间的距离,从而增加面片面积,对于凹凸区域,减小顶点之间的距离,从而减小面片面积。在通过网格重建模型基于目标球面网格确定目标重建网格时,目标重建网格中位于平坦区域的顶点之间的距离大,面片面积大,而目标重建网格中位于凹凸区域的顶点之间的距离小,面片面积小,从而提高了目标重建网格的逼真度。
上述从方法步骤的角度阐述了本申请实施例的网格重建模型的训练方法和网格重建方法,下面来系统全面的阐述。一般情况下,需要先对神经网络模型进行训练得到网格重建模型,再基于网格重建模型进行网格重建。基于此,本申请实施例涉及两个过程,分别为网格重建模型的训练过程(对应训练得到网格重建模型)和网格重建模型的应用过程(对应基于网格重建模型进行网格重建)。
本申请实施例中,神经网络模型包括球面映射网络、编码网络和解码网络。由于对神经网络模型进行训练得到网格重建模型,因此,网格重建模型的结构和神经网络模型的结构相同,但网格重建模型的参数和神经网络模型的参数不同。也就是说,网格重建模型也包括球面映射网络、编码网络和解码网络,且网格重建模型包括的球面映射网络和神经网络模型包括的球面映射网络的参数不同,网格重建模型包括的编码射网络和神经网络模型包括的编码网络的参数不同,网格重建模型包括的解码网络和神经网络模型包括的解码网络的参数不同。
请参见图4,图4是本申请实施例提供的一种对网格进行重建的框架图。本申请实施例中,可以通过建模软件构建得到任意物体的三维模型,该三维模型为原始网格。其中,在网格重建模型的训练过程中,该原始网格对应上文提及的样本原始网格,而在网格重建模型的应用过程中,该原始网格对应上文提及的目标原始网格。原始网格的内容可以见步骤201的描述,在此不再赘述。
接着,通过球面映射网络对原始网格进行球面参数化,得到球面网格。其中,在网格重建模型的训练过程中,该球面网格对应上文提及的样本球面网格,而在网格重建模型的应用过程中,该球面网格对应上文提及的目标球面网格。球面参数化的内容可以见步骤202的描述,在此不再赘述。
然后,通过编码网络对球面网格进行编码处理,得到网格特征。其中,在网格重建模型的训练过程中,该网格特征对应上文提及的球面网格特征,而在网格重建模型的应用过程中,该网格特征对应上文提及的目标网格特征。编码处理的内容可以见步骤C1的描述,在此不再赘述。
之后,通过解码网络对网格特征进行解码处理,得到重建网格。其中,在网格重建模型的训练过程中,该重建网格对应上文提及的样本重建网格,而在网格重建模型的应用过程中,该重建网格对应上文提及的目标重建网格。解码处理的内容可以见步骤C2的描述,在此不再赘述。
需要说明的是,在网格重建模型的训练过程中,还需要基于样本原始网格和样本重建网格,对神经网络模型进行训练得到网格重建模型,这个步骤的内容可以见步骤204的描述,在此不再赘述。
基于上述对网格进行重建的框架,本申请实施例有以下两种网格重建方式,下面分别进行阐述。
首先,描述第一种网格重建方式。请参见图5,图5是本申请实施例提供的一种网格重建的示意图。本申请实施例中,可以获取原始网格,通过球面映射网络对原始网格进行球面参数化,得到球面网格,球面网格包括多个球面顶点的球坐标。其中,在网格重建模型的训练过程中,球面顶点对应上文提及的样本球面顶点,而在网格重建模型的应用过程中,球面顶点对应目标球面顶点。
本申请实施例中,编码网络为卷积网络。通过卷积网络对球面网格进行编码处理,得到网格特征。由于本申请实施例是对原始网格进行球面参数化得到球面网格,并对球面网格进行编码处理,因此,网格特征可以描述原始网格,可以将该网格特征称为全局特征。
之后,将全局特征和球面网格中各个球面顶点的球坐标进行拼接,得到拼接信息。通过解码网络对拼接信息进行解码处理之后,得到重建网格。
接着,描述第二种网格重建方式。请参见图6,图6是本申请实施例提供的另一种网格重建的示意图。本申请实施例中,可以获取原始网格,原始网格包括多个原始顶点。其中,在网格重建模型的训练过程中,原始顶点对应上文提及的样本原始顶点,而在网格重建模型的应用过程中,原始顶点对应目标原始顶点。接着,对原始网格包括的各个原始顶点进行随机下采样,得到稀疏点云,稀疏点云包括多个采样顶点(对应上文提及的样本稀疏顶点)。可以通过球面映射网络对稀疏点云进行球面参数化,得到各个采样顶点对应的球面顶点的球坐标。接着,将各个球面顶点拓扑连接,得到球面网格。
需要说明的是,可以直接将稀疏点云中的各个采样顶点拓扑连接,形成稀疏网格(对应上文提及的样本稀疏网格)。然后,通过球面映射网络对稀疏网格进行球面参数化,得到球面网格。
球面网格包括多个球面顶点的球坐标。由于各个球面顶点拓扑连接,因此,球面网格包括多个三角面,一个三角面的三个顶点为三个球面顶点。也就是说,球面网格包括各个三角面和各个球面顶点的球坐标。
然后,通过编码网络对球面网格进行编码处理,得到网格特征。由于本申请实施例是对原始网格进行随机下采样之后,基于下采样得到的稀疏点云确定网格特征,因此,网格特征可以描述稀疏网格,也就是说,网格特征描述的是原始网格的局部信息,因此,可以将该网格特征称为局部特征。局部特征包括各个采样顶点的特征。
接着,从局部特征中提取一个三角面(对应上文提及的一个集合)的三个顶点的特征,也就是三个采样顶点的特征。其中,第一个采样顶点的特征为zl1,第二个采样顶点的特征为zl2,第三个采样顶点的特征为zl3。基于三个采样顶点的特征,按照公式(5)确定参考点的特征。按照公式(6)将三个采样顶点的特征和参考点的特征进行融合,得到该三角面对应的融合特征。通过这种方式,得到各个三角面对应的融合特征。
之后,将各个三角面对应的融合特征和球面网格中各个球面顶点的球坐标进行拼接,得到拼接信息。通过解码网络对拼接信息进行解码处理之后,得到重建网格。
本申请实施例提供的网格重建模型的训练方法、网格重建方法可以应用在游戏、影视、直播等领域中,下面以在游戏领域的应用为例进行说明,在影视、直播等领域的应用和在游戏领域的应用相类似,在此不再赘述。
在游戏领域中,通常需要通过三维建模技术建模出虚拟人、虚拟地图、虚拟怪物等物体的网格。这些网格中的顶点近似于均匀分布,面片的面积、形状等相差较小,导致网格无法体现出物体中凹凸区域的细节。基于此,需要通过网格重建方法对网格进行重建,以重建出逼真度较高的网格。下面以物体是虚拟人为例进行说明,虚拟地图、虚拟怪物等物体网格的重建原理和虚拟人网格的重建原理相类似,在此不再赘述。
本申请实施例中,需要通过虚拟人网格训练得到网格重建模型。首先,通过三维建模技术建模出虚拟人的原始网格(对应样本原始网格)。接着,通过神经网络模型对虚拟人的原始网格进行球面参数化,得到虚拟人的球面网格(对应样本球面网格),并基于虚拟人的球面网格确定虚拟人的重建网格(对应样本重建网格)。其中,虚拟人的重建网格的确定方式可以见图2、图4至图5的相关描述,在此不再赘述。之后,基于虚拟人的原始网格中各个原始顶点的位置信息和虚拟人的重建网格中各个重建顶点的位置信息,对神经网络模型进行训练,得到网格重建模型,其中,网格重建模型的训练方式可以见步骤204的描述,在此不再赘述。
对于任意游戏,可以先通过三维建模技术建模出该游戏中任意虚拟人的原始网格(对应目标原始网格)。接着,通过网格重建模型对该虚拟人的原始网格进行球面参数化,得到该虚拟人的球面网格(对应目标球面网格),并基于该虚拟人的球面网格确定该虚拟人的重建网格(对应目标重建网格)。通过重建出虚拟人的重建网格,使得重建网格中凹凸区域(比如皱纹区域、耳部区域等)的顶点距离小,面片面积小,能更好的表现出凹凸区域的细节。虽然重建网格中平坦区域(比如脸颊区域、胸膛区域等)的顶点距离大,面片面积大,但依旧能很好地表现出平坦区域的细节。也就是说,虚拟人的重建网格能更好的表现出虚拟人,提高逼真度。
一般来说,玩家的游戏体验与游戏的渲染速度、游戏中虚拟人的逼真度息息相关。通过重建游戏中虚拟人的网格,提高游戏中虚拟人的逼真度,可以提高玩家的游戏体验。此外,虚拟人的重建网格中平坦区域的面片面积大,能加快计算机对平坦区域的渲染速度,而虚拟人的重建网格中平坦区域的面积远大于凹凸区域的面积,使得虚拟人的重建网格的渲染速度快,从而提高了玩家的游戏体验。
图7所示为本申请实施例提供的一种网格重建模型的训练装置的结构示意图,如图7所示,该装置包括下述内容。
获取模块701,用于获取样本原始网格,样本原始网格包括多个样本原始顶点的位置信息;
参数化模块702,用于通过神经网络模型对样本原始网格进行球面参数化,得到样本球面网格,样本球面网格包括至少一个样本球面子网格,任一个样本球面子网格是通过对样本原始网格中一个样本原始子网格进行球面转化得到的;
确定模块703,用于通过神经网络模型基于样本球面网格确定样本重建网格,样本重建网格包括多个样本重建顶点的位置信息;
训练模块704,用于基于各个样本原始顶点的位置信息和各个样本重建顶点的位置信息,对神经网络模型进行训练,得到网格重建模型,网格重建模型用于对目标原始网格进行重建得到目标重建网格。
在一种可能的实现方式中,神经网络模型包括球面映射网络;
参数化模块702,用于通过球面映射网络对样本原始网格进行球面参数化,得到样本球面网格;或者,对样本原始网格进行下采样得到样本稀疏网格,通过球面映射网络对样本稀疏网格进行球面参数化,得到样本球面网格。
在一种可能的实现方式中,获取模块701,还用于获取参考原始网格,参考原始网格包括多个参考原始顶点的位置信息;
装置还包括:
计算模块,用于基于各个参考原始顶点的位置信息,计算各个参考原始顶点的球坐标;
参数化模块702,还用于通过初始映射网络对参考原始网格进行球面参数化,得到参考球面网格,参考球面网格包括至少一个参考球面子网格,任一个参考球面子网格是通过对参考原始网格中一个参考原始子网格进行球面转化得到的;
训练模块704,还用于基于各个参考原始顶点的球坐标和参考球面网格,对初始映射网络进行训练,得到球面映射网络。
在一种可能的实现方式中,神经网络模型包括编码网络和解码网络;
确定模块703,用于通过编码网络对样本球面网格进行编码处理,得到球面网格特征;通过解码网络对球面网格特征和样本球面网格进行解码处理,得到样本重建网格。
在一种可能的实现方式中,样本球面网格包括凹凸区域和平坦区域;
确定模块703,用于对凹凸区域进行傅里叶映射处理,得到傅里叶映射处理后的凹凸区域;通过编码网络对平坦区域和傅里叶映射处理后的凹凸区域进行编码处理,得到球面网格特征。
在一种可能的实现方式中,样本球面网格是通过球面映射网络对样本稀疏网格进行球面参数化得到的,样本稀疏网格包括多个采样顶点的位置信息,一个采样顶点是一个样本原始顶点;球面网格特征包括多个采样顶点的特征;
确定模块703,用于将多个采样顶点的特征进行融合,得到样本融合特征;通过解码网络对样本融合特征和样本球面网格进行解码处理,得到样本重建网格。
在一种可能的实现方式中,多个采样顶点包括至少一个集合,任一个集合包括至少一个采样顶点;
确定模块703,用于对于任一个集合,基于任一个集合中各个采样顶点的特征,确定参考点的特征,将参考点的特征和任一个集合中各个采样顶点的特征进行融合,得到任一个集合对应的融合特征,参考点是任一个集合中各个采样顶点构成的几何形体的中心点;基于各个集合对应的融合特征,确定样本融合特征。
在一种可能的实现方式中,确定模块703,用于确定参考点的特征和任一个集合中各个采样顶点的特征之间的特征差异;将参考点的特征和特征差异进行融合,得到任一个集合对应的融合特征。
在一种可能的实现方式中,训练模块704,用于对于任一个样本原始顶点,基于任一个样本原始顶点的位置信息和任一个样本原始顶点对应的样本重建顶点的位置信息,确定任一个样本原始顶点和对应样本重建顶点之间的第一距离;基于各个样本原始顶点和对应样本重建顶点之间的第一距离,确定第一损失;基于第一损失对神经网络模型进行训练,得到网格重建模型。
在一种可能的实现方式中,训练模块704,用于基于各个样本原始顶点的位置信息,确定各个样本原始顶点的第一信息差异,任一个样本原始顶点的第一信息差异用于描述任一个样本原始顶点和位置相邻的样本原始顶点之间的位置信息差异;基于各个样本重建顶点的位置信息,确定各个样本重建顶点的第二信息差异,任一个样本重建顶点的第二信息差异用于描述任一个样本重建顶点和位置相邻的样本重建顶点之间的位置信息差异;基于各个样本原始顶点的第一信息差异和各个样本重建顶点的第二信息差异,确定第二损失;基于第二损失对神经网络模型进行训练,得到网格重建模型。
在一种可能的实现方式中,训练模块704,用于对于任一个样本原始顶点,从多个样本原始顶点中采样出与任一个样本原始顶点位置相邻的相邻原始顶点;基于任一个样本原始顶点的位置信息和相邻原始顶点的位置信息,确定任一个样本原始顶点的第一信息差异。
在一种可能的实现方式中,训练模块704,用于对于任一个样本重建顶点,从多个样本重建顶点中采样出与任一个样本重建顶点位置相邻的相邻重建顶点;基于任一个样本重建顶点的位置信息和相邻重建顶点的位置信息,确定任一个样本重建顶点的第二信息差异。
上述装置中,通过神经网络模型对样本原始网格进行球面参数化,实现了对样本原始网格中各个样本原始子网格进行球面转化,得到样本球面网格中各个样本球面子网格。通过球面转化,实现了对于平坦区域,增加顶点之间的距离,从而增加面片面积,对于凹凸区域,减小顶点之间的距离,从而减小面片面积。在通过神经网络模型基于样本球面网格确定样本重建网格时,样本重建网格中位于平坦区域的顶点之间的距离大,面片面积大,而样本重建网格中位于凹凸区域的顶点之间的距离小,面片面积小,从而提高了样本重建网格的逼真度。通过对神经网络模型进行训练得到网格重建模型,实现了方便快捷地对目标原始网格进行重建,提高重建得到的目标重建网格的逼真度。
应理解的是,上述图7提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图8所示为本申请实施例提供的一种网格重建装置的结构示意图,如图9所示,该装置包括下述内容。
获取模块801,用于获取目标原始网格,目标原始网格包括多个目标原始顶点的位置信息;
参数化模块802,用于通过网格重建模型对目标原始网格进行球面参数化,得到目标球面网格,目标球面网格包括至少一个目标球面子网格,任一个目标球面子网格是通过对目标原始网格中一个目标原始子网格进行球面转化得到的,网格重建模型是按照是上述网格重建模型的训练方法训练得到的;
确定模块803,用于通过网格重建模型基于目标球面网格确定目标重建网格,目标重建网格包括多个目标重建顶点的位置信息。
在一种可能的实现方式中,确定模块803,用于通过网格重建模型对目标球面网格进行编码处理,得到目标网格特征;通过网格重建模型对目标网格特征和目标球面网格进行解码处理,得到目标重建网格。
上述装置中,通过网格重建模型对目标原始网格进行球面参数化,实现了对目标原始网格中各个目标原始子网格进行球面转化,得到目标球面网格中各个目标球面子网格。通过球面转化,实现了对于平坦区域,增加顶点之间的距离,从而增加面片面积,对于凹凸区域,减小顶点之间的距离,从而减小面片面积。在通过网格重建模型基于目标球面网格确定目标重建网格时,目标重建网格中位于平坦区域的顶点之间的距离大,面片面积大,而目标重建网格中位于凹凸区域的顶点之间的距离小,面片面积小,从而提高了目标重建网格的逼真度。
应理解的是,上述图8提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图9示出了本申请一个示例性实施例提供的终端设备900的结构框图。该终端设备900包括有:处理器901和存储器902。
处理器901可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器901可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器901可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器901还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器902可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器902中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器901所执行以实现本申请中方法实施例提供的网格重建模型的训练方法或者网格重建方法。
在一些实施例中,终端设备900还可选包括有:外围设备接口903和至少一个外围设备。处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。具体地,外围设备包括:射频电路904、显示屏905、摄像头组件906、音频电路907和电源908中的至少一种。
外围设备接口903可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器901和存储器902。在一些实施例中,处理器901、存储器902和外围设备接口903被集成在同一芯片或电路板上;在一些其他实施例中,处理器901、存储器902和外围设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路904用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路904将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路904包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路904还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏905用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时,显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时,显示屏905还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏905可以为一个,设置在终端设备900的前面板;在另一些实施例中,显示屏905可以为至少两个,分别设置在终端设备900的不同表面或呈折叠设计;在另一些实施例中,显示屏905可以是柔性显示屏,设置在终端设备900的弯曲表面上或折叠面上。甚至,显示屏905还可以设置成非矩形的不规则图形,也即异形屏。显示屏905可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件906用于采集图像或视频。可选地,摄像头组件906包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件906还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器901进行处理,或者输入至射频电路904以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端设备900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器901或射频电路904的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路907还可以包括耳机插孔。
电源908用于为终端设备900中的各个组件进行供电。电源908可以是交流电、直流电、一次性电池或可充电电池。当电源908包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端设备900还包括有一个或多个传感器909。该一个或多个传感器909包括但不限于:加速度传感器911、陀螺仪传感器912、压力传感器913、光学传感器914以及接近传感器915。
加速度传感器911可以检测以终端设备900建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器911可以用于检测重力加速度在三个坐标轴上的分量。处理器901可以根据加速度传感器911采集的重力加速度信号,控制显示屏905以横向视图或纵向视图进行用户界面的显示。加速度传感器911还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器912可以检测终端设备900的机体方向及转动角度,陀螺仪传感器912可以与加速度传感器911协同采集用户对终端设备900的3D动作。处理器901根据陀螺仪传感器912采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器913可以设置在终端设备900的侧边框和/或显示屏905的下层。当压力传感器913设置在终端设备900的侧边框时,可以检测用户对终端设备900的握持信号,由处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在显示屏905的下层时,由处理器901根据用户对显示屏905的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
光学传感器914用于采集环境光强度。在一个实施例中,处理器901可以根据光学传感器914采集的环境光强度,控制显示屏905的显示亮度。具体地,当环境光强度较高时,调高显示屏905的显示亮度;当环境光强度较低时,调低显示屏905的显示亮度。在另一个实施例中,处理器901还可以根据光学传感器914采集的环境光强度,动态调整摄像头组件906的拍摄参数。
接近传感器915,也称距离传感器,通常设置在终端设备900的前面板。接近传感器915用于采集用户与终端设备900的正面之间的距离。在一个实施例中,当接近传感器915检测到用户与终端设备900的正面之间的距离逐渐变小时,由处理器901控制显示屏905从亮屏状态切换为息屏状态;当接近传感器915检测到用户与终端设备900的正面之间的距离逐渐变大时,由处理器901控制显示屏905从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图9中示出的结构并不构成对终端设备900的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图10为本申请实施例提供的服务器的结构示意图,该服务器1000可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器1001和一个或多个的存储器1002,其中,该一个或多个存储器1002中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器1001加载并执行以实现上述各个方法实施例提供的网格重建模型的训练方法或者网格重建方法,示例性的,处理器1001为CPU。当然,该服务器1000还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1000还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,该存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一种网格重建模型的训练方法或者网格重建方法。
可选地,上述计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-OnlyMemory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行,以使电子设备实现上述任一种网格重建模型的训练方法或者网格重建方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (28)
1.一种网格重建模型的训练方法,其特征在于,所述方法包括:
获取样本原始网格,所述样本原始网格包括多个样本原始顶点的位置信息;
通过神经网络模型对所述样本原始网格进行球面参数化,得到样本球面网格,所述样本球面网格包括至少一个样本球面子网格,任一个样本球面子网格是通过对所述样本原始网格中一个样本原始子网格进行球面转化得到的;
通过所述神经网络模型基于所述样本球面网格确定样本重建网格,所述样本重建网格包括多个样本重建顶点的位置信息;
基于各个样本原始顶点的位置信息,确定所述各个样本原始顶点的第一信息差异,任一个样本原始顶点的第一信息差异用于描述所述任一个样本原始顶点和位置相邻的样本原始顶点之间的位置信息差异;
基于各个样本重建顶点的位置信息,确定所述各个样本重建顶点的第二信息差异,任一个样本重建顶点的第二信息差异用于描述所述任一个样本重建顶点和位置相邻的样本重建顶点之间的位置信息差异;
基于所述各个样本原始顶点的第一信息差异和所述各个样本重建顶点的第二信息差异,确定第二损失;
基于所述第二损失对所述神经网络模型进行训练,得到网格重建模型,所述网格重建模型用于对目标原始网格进行重建得到目标重建网格。
2.根据权利要求1所述的方法,其特征在于,所述神经网络模型包括球面映射网络;
所述通过神经网络模型对所述样本原始网格进行球面参数化,得到样本球面网格,包括:
通过所述球面映射网络对所述样本原始网格进行球面参数化,得到所述样本球面网格;
或者,对所述样本原始网格进行下采样得到样本稀疏网格,通过所述球面映射网络对所述样本稀疏网格进行球面参数化,得到所述样本球面网格。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取参考原始网格,所述参考原始网格包括多个参考原始顶点的位置信息;
基于各个参考原始顶点的位置信息,计算各个参考原始顶点的球坐标;
通过初始映射网络对所述参考原始网格进行球面参数化,得到参考球面网格,所述参考球面网格包括至少一个参考球面子网格,任一个参考球面子网格是通过对所述参考原始网格中一个参考原始子网格进行球面转化得到的;
基于所述各个参考原始顶点的球坐标和所述参考球面网格,对所述初始映射网络进行训练,得到所述球面映射网络。
4.根据权利要求1所述的方法,其特征在于,所述神经网络模型包括编码网络和解码网络;
所述通过所述神经网络模型基于所述样本球面网格确定样本重建网格,包括:
通过所述编码网络对所述样本球面网格进行编码处理,得到球面网格特征;
通过所述解码网络对所述球面网格特征和所述样本球面网格进行解码处理,得到所述样本重建网格。
5.根据权利要求4所述的方法,其特征在于,所述样本球面网格包括凹凸区域和平坦区域;
所述通过所述编码网络对所述样本球面网格进行编码处理,得到球面网格特征,包括:
对所述凹凸区域进行傅里叶映射处理,得到傅里叶映射处理后的凹凸区域;
通过所述编码网络对所述平坦区域和所述傅里叶映射处理后的凹凸区域进行编码处理,得到所述球面网格特征。
6.根据权利要求4所述的方法,其特征在于,所述样本球面网格是通过球面映射网络对样本稀疏网格进行球面参数化得到的,所述样本稀疏网格包括多个采样顶点的位置信息,一个采样顶点是一个样本原始顶点;所述球面网格特征包括所述多个采样顶点的特征;
所述通过所述解码网络对所述球面网格特征和所述样本球面网格进行解码处理,得到所述样本重建网格,包括:
将所述多个采样顶点的特征进行融合,得到样本融合特征;
通过所述解码网络对所述样本融合特征和所述样本球面网格进行解码处理,得到所述样本重建网格。
7.根据权利要求6所述的方法,其特征在于,所述多个采样顶点包括至少一个集合,任一个集合包括至少一个采样顶点;
所述将所述多个采样顶点的特征进行融合,得到样本融合特征,包括:
对于任一个集合,基于所述任一个集合中各个采样顶点的特征,确定参考点的特征,将所述参考点的特征和所述任一个集合中各个采样顶点的特征进行融合,得到所述任一个集合对应的融合特征,所述参考点是所述任一个集合中各个采样顶点构成的几何形体的中心点;
基于各个集合对应的融合特征,确定所述样本融合特征。
8.根据权利要求7所述的方法,其特征在于,所述将所述参考点的特征和所述任一个集合中各个采样顶点的特征进行融合,得到所述任一个集合对应的融合特征,包括:
确定所述参考点的特征和所述任一个集合中各个采样顶点的特征之间的特征差异;
将所述参考点的特征和所述特征差异进行融合,得到所述任一个集合对应的融合特征。
9.根据权利要求1所述的方法,其特征在于,所述基于所述第二损失对所述神经网络模型进行训练,得到网格重建模型,包括:
对于任一个样本原始顶点,基于所述任一个样本原始顶点的位置信息和所述任一个样本原始顶点对应的样本重建顶点的位置信息,确定所述任一个样本原始顶点和对应样本重建顶点之间的第一距离;
基于各个样本原始顶点和对应样本重建顶点之间的第一距离,确定第一损失;
基于所述第一损失和所述第二损失确定神经网络模型的损失;
基于所述神经网络模型的损失对所述神经网络模型进行训练,得到所述网格重建模型。
10.根据权利要求1所述的方法,其特征在于,所述基于各个样本原始顶点的位置信息,确定所述各个样本原始顶点的第一信息差异,包括:
对于任一个样本原始顶点,从所述多个样本原始顶点中采样出与所述任一个样本原始顶点位置相邻的相邻原始顶点;
基于所述任一个样本原始顶点的位置信息和所述相邻原始顶点的位置信息,确定所述任一个样本原始顶点的第一信息差异。
11.根据权利要求1所述的方法,其特征在于,所述基于各个样本重建顶点的位置信息,确定所述各个样本重建顶点的第二信息差异,包括:
对于任一个样本重建顶点,从所述多个样本重建顶点中采样出与所述任一个样本重建顶点位置相邻的相邻重建顶点;
基于所述任一个样本重建顶点的位置信息和所述相邻重建顶点的位置信息,确定所述任一个样本重建顶点的第二信息差异。
12.一种网格重建方法,其特征在于,所述方法包括:
获取目标原始网格,所述目标原始网格包括多个目标原始顶点的位置信息;
通过网格重建模型对所述目标原始网格进行球面参数化,得到目标球面网格,所述目标球面网格包括至少一个目标球面子网格,任一个目标球面子网格是通过对所述目标原始网格中一个目标原始子网格进行球面转化得到的,所述网格重建模型是按照权利要求1至11任一项所述的网格重建模型的训练方法训练得到的;
通过所述网格重建模型基于所述目标球面网格确定目标重建网格,所述目标重建网格包括多个目标重建顶点的位置信息。
13.根据权利要求12所述的方法,其特征在于,所述通过所述网格重建模型基于所述目标球面网格确定目标重建网格,包括:
通过所述网格重建模型对所述目标球面网格进行编码处理,得到目标网格特征;
通过所述网格重建模型对所述目标网格特征和所述目标球面网格进行解码处理,得到所述目标重建网格。
14.一种网格重建模型的训练装置,其特征在于,所述装置包括:
获取模块,用于获取样本原始网格,所述样本原始网格包括多个样本原始顶点的位置信息;
参数化模块,用于通过神经网络模型对所述样本原始网格进行球面参数化,得到样本球面网格,所述样本球面网格包括至少一个样本球面子网格,任一个样本球面子网格是通过对所述样本原始网格中一个样本原始子网格进行球面转化得到的;
确定模块,用于通过所述神经网络模型基于所述样本球面网格确定样本重建网格,所述样本重建网格包括多个样本重建顶点的位置信息;
训练模块,用于基于各个样本原始顶点的位置信息,确定所述各个样本原始顶点的第一信息差异,任一个样本原始顶点的第一信息差异用于描述所述任一个样本原始顶点和位置相邻的样本原始顶点之间的位置信息差异;
所述训练模块,还用于基于各个样本重建顶点的位置信息,确定所述各个样本重建顶点的第二信息差异,任一个样本重建顶点的第二信息差异用于描述所述任一个样本重建顶点和位置相邻的样本重建顶点之间的位置信息差异;
所述训练模块,还用于基于所述各个样本原始顶点的第一信息差异和所述各个样本重建顶点的第二信息差异,确定第二损失;
所述训练模块,还用于基于所述第二损失对所述神经网络模型进行训练,得到网格重建模型,所述网格重建模型用于对目标原始网格进行重建得到目标重建网格。
15.根据权利要求14所述的装置,其特征在于,所述神经网络模型包括球面映射网络;
所述参数化模块,用于通过所述球面映射网络对所述样本原始网格进行球面参数化,得到所述样本球面网格;或者,对所述样本原始网格进行下采样得到样本稀疏网格,通过所述球面映射网络对所述样本稀疏网格进行球面参数化,得到所述样本球面网格。
16.根据权利要求15所述的装置,其特征在于,所述获取模块,还用于获取参考原始网格,所述参考原始网格包括多个参考原始顶点的位置信息;
所述装置还包括:
计算模块,用于基于各个参考原始顶点的位置信息,计算各个参考原始顶点的球坐标;
所述参数化模块,还用于通过初始映射网络对所述参考原始网格进行球面参数化,得到参考球面网格,所述参考球面网格包括至少一个参考球面子网格,任一个参考球面子网格是通过对所述参考原始网格中一个参考原始子网格进行球面转化得到的;
所述训练模块,还用于基于所述各个参考原始顶点的球坐标和所述参考球面网格,对所述初始映射网络进行训练,得到所述球面映射网络。
17.根据权利要求14所述的装置,其特征在于,所述神经网络模型包括编码网络和解码网络;
所述确定模块,用于通过所述编码网络对所述样本球面网格进行编码处理,得到球面网格特征;通过所述解码网络对所述球面网格特征和所述样本球面网格进行解码处理,得到所述样本重建网格。
18.根据权利要求17所述的装置,其特征在于,所述样本球面网格包括凹凸区域和平坦区域;
所述确定模块,用于对所述凹凸区域进行傅里叶映射处理,得到傅里叶映射处理后的凹凸区域;通过所述编码网络对所述平坦区域和所述傅里叶映射处理后的凹凸区域进行编码处理,得到所述球面网格特征。
19.根据权利要求17所述的装置,其特征在于,所述样本球面网格是通过球面映射网络对样本稀疏网格进行球面参数化得到的,所述样本稀疏网格包括多个采样顶点的位置信息,一个采样顶点是一个样本原始顶点;所述球面网格特征包括所述多个采样顶点的特征;
所述确定模块,用于将所述多个采样顶点的特征进行融合,得到样本融合特征;通过所述解码网络对所述样本融合特征和所述样本球面网格进行解码处理,得到所述样本重建网格。
20.根据权利要求19所述的装置,其特征在于,所述多个采样顶点包括至少一个集合,任一个集合包括至少一个采样顶点;
所述确定模块,用于对于任一个集合,基于所述任一个集合中各个采样顶点的特征,确定参考点的特征,将所述参考点的特征和所述任一个集合中各个采样顶点的特征进行融合,得到所述任一个集合对应的融合特征,所述参考点是所述任一个集合中各个采样顶点构成的几何形体的中心点;基于各个集合对应的融合特征,确定所述样本融合特征。
21.根据权利要求20所述的装置,其特征在于,所述确定模块,用于确定所述参考点的特征和所述任一个集合中各个采样顶点的特征之间的特征差异;将所述参考点的特征和所述特征差异进行融合,得到所述任一个集合对应的融合特征。
22.根据权利要求14所述的装置,其特征在于,所述训练模块,用于对于任一个样本原始顶点,基于所述任一个样本原始顶点的位置信息和所述任一个样本原始顶点对应的样本重建顶点的位置信息,确定所述任一个样本原始顶点和对应样本重建顶点之间的第一距离;基于各个样本原始顶点和对应样本重建顶点之间的第一距离,确定第一损失;基于所述第一损失和所述第二损失确定神经网络模型的损失;基于所述神经网络模型的损失对所述神经网络模型进行训练,得到所述网格重建模型。
23.根据权利要求14所述的装置,其特征在于,所述训练模块,用于对于任一个样本原始顶点,从所述多个样本原始顶点中采样出与所述任一个样本原始顶点位置相邻的相邻原始顶点;基于所述任一个样本原始顶点的位置信息和所述相邻原始顶点的位置信息,确定所述任一个样本原始顶点的第一信息差异。
24.根据权利要求14所述的装置,其特征在于,所述训练模块,用于对于任一个样本重建顶点,从所述多个样本重建顶点中采样出与所述任一个样本重建顶点位置相邻的相邻重建顶点;基于所述任一个样本重建顶点的位置信息和所述相邻重建顶点的位置信息,确定所述任一个样本重建顶点的第二信息差异。
25.一种网格重建装置,其特征在于,所述装置包括:
获取模块,用于获取目标原始网格,所述目标原始网格包括多个目标原始顶点的位置信息;
参数化模块,用于通过网格重建模型对所述目标原始网格进行球面参数化,得到目标球面网格,所述目标球面网格包括至少一个目标球面子网格,任一个目标球面子网格是通过对所述目标原始网格中一个目标原始子网格进行球面转化得到的,所述网格重建模型是按照权利要求1至11任一项所述的网格重建模型的训练方法训练得到的;
确定模块,用于通过所述网格重建模型基于所述目标球面网格确定目标重建网格,所述目标重建网格包括多个目标重建顶点的位置信息。
26.根据权利要求25所述的装置,其特征在于,所述确定模块,用于通过所述网格重建模型对所述目标球面网格进行编码处理,得到目标网格特征;通过所述网格重建模型对所述目标网格特征和所述目标球面网格进行解码处理,得到所述目标重建网格。
27.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述电子设备实现如权利要求1至11任一所述的网格重建模型的训练方法或者实现如权利要求12至13任一所述的网格重建方法。
28.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现如权利要求1至11任一所述的网格重建模型的训练方法或者实现如权利要求12至13任一所述的网格重建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310595248.6A CN116385698B (zh) | 2023-05-25 | 2023-05-25 | 网格重建模型的训练方法、网格重建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310595248.6A CN116385698B (zh) | 2023-05-25 | 2023-05-25 | 网格重建模型的训练方法、网格重建方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116385698A CN116385698A (zh) | 2023-07-04 |
CN116385698B true CN116385698B (zh) | 2023-09-08 |
Family
ID=86980885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310595248.6A Active CN116385698B (zh) | 2023-05-25 | 2023-05-25 | 网格重建模型的训练方法、网格重建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116385698B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090091575A (ko) * | 2008-02-25 | 2009-08-28 | 주식회사 마크애니 | 구면 파라미터기법을 이용한 3 차원 메쉬 모델의 워터마킹장치 및 방법 |
CN109816789A (zh) * | 2018-12-14 | 2019-05-28 | 合肥阿巴赛信息科技有限公司 | 一种基于深度神经网络的三维模型参数化方法 |
CN110009743A (zh) * | 2019-02-22 | 2019-07-12 | 南京航空航天大学 | 一种场景理解的网格曲面重建方法 |
KR20210026542A (ko) * | 2019-08-30 | 2021-03-10 | 주식회사 에일론 | 기하학적 이미지를 이용한 인공신경망 기반 단백질 결합 화합물의 생물학적 활성 예측 시스템 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10891789B2 (en) * | 2019-05-30 | 2021-01-12 | Itseez3D, Inc. | Method to produce 3D model from one or several images |
-
2023
- 2023-05-25 CN CN202310595248.6A patent/CN116385698B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090091575A (ko) * | 2008-02-25 | 2009-08-28 | 주식회사 마크애니 | 구면 파라미터기법을 이용한 3 차원 메쉬 모델의 워터마킹장치 및 방법 |
CN109816789A (zh) * | 2018-12-14 | 2019-05-28 | 合肥阿巴赛信息科技有限公司 | 一种基于深度神经网络的三维模型参数化方法 |
CN110009743A (zh) * | 2019-02-22 | 2019-07-12 | 南京航空航天大学 | 一种场景理解的网格曲面重建方法 |
KR20210026542A (ko) * | 2019-08-30 | 2021-03-10 | 주식회사 에일론 | 기하학적 이미지를 이용한 인공신경망 기반 단백질 결합 화합물의 생물학적 활성 예측 시스템 |
Non-Patent Citations (1)
Title |
---|
网格参数化研究进展;郭凤华 等;软件学报;第112-121页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116385698A (zh) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109978989B (zh) | 三维人脸模型生成方法、装置、计算机设备及存储介质 | |
CN110276840B (zh) | 多虚拟角色的控制方法、装置、设备及存储介质 | |
WO2020125785A1 (zh) | 毛发渲染方法、装置、电子设备和存储介质 | |
CN112870707B (zh) | 虚拟场景中的虚拟物体展示方法、计算机设备及存储介质 | |
CN112634416B (zh) | 虚拟形象模型的生成方法、装置、电子设备及存储介质 | |
CN116091676B (zh) | 虚拟对象的面部渲染方法及点云特征提取模型的训练方法 | |
CN112245926B (zh) | 虚拟地形的渲染方法、装置、设备及介质 | |
CN111738914B (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN112907716B (zh) | 虚拟环境中的云朵渲染方法、装置、设备及存储介质 | |
CN113705302A (zh) | 图像生成模型的训练方法、装置、计算机设备及存储介质 | |
CN113436348B (zh) | 三维模型处理方法、装置、电子设备及存储介质 | |
CN115082607A (zh) | 虚拟角色头发渲染方法、装置、电子设备和存储介质 | |
CN116672706B (zh) | 光照渲染方法、装置、终端和存储介质 | |
CN112884873B (zh) | 虚拟环境中虚拟物体的渲染方法、装置、设备及介质 | |
CN112950753B (zh) | 虚拟植物显示方法、装置、设备及存储介质 | |
CN112206519B (zh) | 实现游戏场景环境变化的方法、装置、存储介质及计算机设备 | |
CN116385698B (zh) | 网格重建模型的训练方法、网格重建方法及装置 | |
CN116212374A (zh) | 模型处理方法、装置、计算机设备和存储介质 | |
CN113350792B (zh) | 虚拟模型的轮廓处理方法、装置、计算机设备及存储介质 | |
CN115409928A (zh) | 水体效果渲染方法、装置、电子设备和存储介质 | |
CN111596925B (zh) | 自动生成代码的方法、装置、计算机设备及介质 | |
CN113694525A (zh) | 获取虚拟形象的方法、装置、设备及存储介质 | |
CN116402880B (zh) | 含油面积确定方法、装置、设备及存储介质 | |
CN114519779B (zh) | 动作生成模型训练方法、装置、设备和存储介质 | |
CN117218247A (zh) | 脸部模型的生成方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40090379 Country of ref document: HK |