CN115809696A - 虚拟形象模型训练方法及装置 - Google Patents

虚拟形象模型训练方法及装置 Download PDF

Info

Publication number
CN115809696A
CN115809696A CN202211547438.2A CN202211547438A CN115809696A CN 115809696 A CN115809696 A CN 115809696A CN 202211547438 A CN202211547438 A CN 202211547438A CN 115809696 A CN115809696 A CN 115809696A
Authority
CN
China
Prior art keywords
image
model
avatar
reconstruction
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211547438.2A
Other languages
English (en)
Other versions
CN115809696B (zh
Inventor
曹佳炯
丁菁汀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202211547438.2A priority Critical patent/CN115809696B/zh
Publication of CN115809696A publication Critical patent/CN115809696A/zh
Application granted granted Critical
Publication of CN115809696B publication Critical patent/CN115809696B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本说明书实施例提供了虚拟形象模型训练方法及装置,其中,一种虚拟形象模型训练方法包括:根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像;基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成;其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。

Description

虚拟形象模型训练方法及装置
技术领域
本文件涉及虚拟化技术领域,尤其涉及一种虚拟形象模型训练方法及装置。
背景技术
虚拟世界提供了对真实世界的模拟,甚至能够提供在真实世界难以实现的场景,因此虚拟世界越来越多地应用在各种场景。在虚拟世界场景中,用户通过特定的身份ID登录三维虚拟世界,通过虚拟世界中虚拟的用户角色进行活动,在虚拟世界中从事与物理世界类似的各种行为活动,甚至在虚拟世界中从事在物理世界中无法进行的行为活动,通常,在虚拟世界中存在不同的用户角色,这些用户角色各自进行不同的活动。
发明内容
本说明书一个或多个实施例提供了一种虚拟形象模型训练方法,包括:根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像。基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书一个或多个实施例提供了一种虚拟形象处理方法,包括:根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像。将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象。其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书一个或多个实施例提供了一种虚拟形象模型训练装置,包括:样本构建模块,被配置为根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像。模型训练模块,被配置为基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书一个或多个实施例提供了一种虚拟形象处理装置,包括:图像采集模块,被配置为根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像。图像重建模块,被配置为将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象。其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书一个或多个实施例提供了一种虚拟形象模型训练设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像。基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书一个或多个实施例提供了一种虚拟形象处理设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像。将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象。其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书一个或多个实施例提供了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像。基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书一个或多个实施例提供了另一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像。将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象。其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图;
图1为本说明书一个或多个实施例提供的一种虚拟形象模型训练方法处理流程图;
图2为本说明书一个或多个实施例提供的一种应用于虚拟世界场景的虚拟形象模型训练方法处理流程图;
图3为本说明书一个或多个实施例提供的一种虚拟形象处理方法处理流程图;
图4为本说明书一个或多个实施例提供的一种应用于虚拟世界场景的虚拟形象处理方法处理流程图;
图5为本说明书一个或多个实施例提供的一种虚拟形象模型训练装置示意图;
图6为本说明书一个或多个实施例提供的一种虚拟形象处理装置示意图;
图7为本说明书一个或多个实施例提供的一种虚拟形象模型训练设备的结构示意图;
图8为本说明书一个或多个实施例提供的一种虚拟形象处理设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
本说明书提供的一种虚拟形象模型训练方法实施例:
本实施例提供的虚拟形象模型训练方法,可应用于服务器,根据在物理世界采集的多视角图像构建样本图像,基于样本图像进行模型训练获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。具体的,在进行模型训练的过程中,根据样本图像进行图像重建获得的第一重建形象和对应的预设形象,样本图像进行图像重建获得的第二重建形象,第二重建形象进行关键视角检测获得的关键视角,进行参数更新,以此,通过在模型训练的过程中,引入关键视角,避免在重建形象上直接进行处理,减少计算量,提升模型训练效率,通过在虚拟世界的接入设备部署虚拟形象模型进行虚拟形象生成,实现离线场景下的虚拟形象生成。
参照图1,本实施例提供的虚拟形象模型训练方法,具体包括步骤S102至步骤S104。
步骤S102,根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像。
本实施例中,虚拟世界是指基于去中心化协作实现并且具有开放经济系统的虚拟的拟真世界。具体的,物理世界(真实世界)中的用户可通过接入设备接入虚拟世界,以在虚拟世界中进行行为活动,比如用户通过接入设备进行游戏交互的游戏虚拟世界,再比如用户通过接入设备进行在线会议的会议虚拟世界;所述虚拟世界的接入设备,可以是连接虚拟世界的VR(Virtual Reality,虚拟现实)设备、AR(Augmented Reality,增强现实)设备等,比如连接虚拟世界的头戴式VR设备。所述物理世界,是指与虚拟世界对应的世界,即真实存在的世界,可选的,所述物理世界包括真实世界。
虚拟形象是指从用户的图像出发,采用图像重建技术对用户的图像进行重建获得的用于在虚拟世界内展示用户形象的三维数字图像(三维数字形象),或者,从用户的图像出发,采用图像重建技术对用户的图像进行重建获得的虚拟世界内的与用户具有数字孪生关系或者身份映射的数字孪生形象。比如,在采集到用户在物理世界(真实世界)的多个视角的用户图像的基础上,通过将多个视角的用户图像输入神经辐射场NERF(NeuralRadiance Fields)模型进行图像重建,获得虚拟世界内的三维数字形象、数字孪生形象或者身份映射形象。
所述多视角图像采集,是指从多个视角针对用户采集图像。所述多视角图像,是指在物理世界(真实世界)中从多个采集视角出发针对用户进行图像采集获得的图像,可以针对用户的全身采集图像,也可以针对用户的某个身体部位(比如头部)采集图像。可选的,所述用户的多视角图像,包括在物理世界(真实世界)中针对用户采集的至少一个视角的用户图像,比如针对用户从前、后、左、右四个视角出发进行图像采集,采集获得的四张用户图像即为该用户的多视角图像;可选的,所述多视角图像,通过虚拟世界的接入设备集成或者配置的图像传感器进行采集。
所述样本图像,包括对待训练模型进行模型训练的样本图像,为了保证样本图像的有效性,并且提升模型训练的精确性,可选的,所述样本图像,在对所述多视角图像进行图像预处理后获得;所述图像预处理包括:对多视角图像进行图像评估,并根据图像评估结果进行图像筛选,和/或,对多视角图像进行图像清洗。
实际应用中,由于虚拟世界的接入设备的计算能力有限,无法部署高精度的复杂模型,只能基于简单模型进行虚拟形象生成,导致生成的虚拟形象的形象质量较差,针对于此,可在服务器训练高精度的虚拟形象模型,在此基础上,将虚拟形象模型部署于虚拟世界的接入设备,提升虚拟形象的生成效率和生成的虚拟形象的精确度。
具体实施时,获取在物理世界针对用户进行多视角图像采集获得的多视角图像,并根据多视角图像构建样本图像,通过多视角图像构建的样本图像,提升样本图像的有效性,有助于提升模型训练的精确度。
此外,上述步骤S102可被替换为根据在物理世界针对用户采集的多视角图像构建样本图像,并与本实施例提供的其他处理步骤组成新的实现方式;或者,也可被替换为根据在物理世界采集的多视角图像构建样本图像,并与本实施例提供的其他处理步骤组成新的实现方式。
步骤S104,基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
上述根据在物理世界针对用户采集的多视角图像,构建样本图像,本步骤中,基于样本图像进行模型训练获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
具体实施时,将样本图像输入待训练模型进行模型训练获得虚拟形象模型,将虚拟形象模型部署于虚拟世界的接入设备,基于用户针对虚拟形象的申请请求,向用户生成虚拟世界的虚拟形象,提升虚拟形象的生成效率,适用离线场景下的虚拟形象生成。
可选的,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
其中,所述待训练模型进行的图像重建,包括:从样本图像中提取图像特征,基于图像特征进行三维重建。所述预设形象包括第一重建形象对应的真实形象,即样本图像对应的真实形象。所述第一重建形象,是指基于样本图像进行图像重建的图像重建结果,包括对样本图像进行图像重建的虚拟形象。
在具体的执行过程中,在获得第二重建形象的过程中,为了提升第二重建形象的获取效率,可引入图像重建模型,可选的,所述第二重建形象,基于图像重建模型对所述样本图像进行图像重建获得。本实施例提供的一种可选实施方式中,图像重建模型,采用如下方式训练:将所述样本图像输入第二待训练模型进行图像重建,获得第三重建形象;
根据所述第三重建形象和所述样本图像对所述第二待训练模型进行参数更新。
可选的,第二待训练模型包括待训练教师模型,图像重建模型包括教师模型。通过图像重建模型对样本图像进行图像重建获得的第二重建形象对待训练模型进行辅助训练,达到对待训练模型进行简化的目的,实现虚拟形象模型的轻量化。
具体的,在第二待训练模型的训练过程中,为了提升训练获得的图像重建模型的处理精度,可在获得第三重建形象在目标视角的目标视角图像以及确定样本图像中目标视角对应的目标图像之后,构建目标视角图像的第一特征分布数据和目标图像的第二特征分布数据,以此来评价图像重建模型生成的重建形象的表面分布数据的损失,本实施例提供的一种可选实施方式中,在根据第三重建形象和样本图像对第二待训练模型进行参数更新的过程中,执行如下操作:
计算所述第三重建形象在目标视角的目标视角图像和所述样本图像中所述目标视角对应的目标图像的第一损失,以及计算所述目标视角图像的第一特征分布数据和所述目标图像的第二特征分布数据的第二损失;
基于所述第一损失和所述第二损失对所述第二待训练模型进行参数更新。
其中,所述目标视角,是指第三重建形象的旋转视角,可选的,目标视角包括第三重建形象从某一方向顺时针或者逆时针旋转至另一方向时的旋转角度,比如将第三重建形象面向正北方向时(面向真实用户)的视角作为0度,按照顺时针计算,第三重建形象从正北方向旋转至西北45度的目标视角为135度。该目标视角可以是一者,也可以是多者。
所述目标视角图像,是指第三重建形象在目标视角的图像,沿用上例,目标视角为0度,目标视角图像为第三重建形象在0度时的图像即第三重建形象在正北方向的图像。目标图像是指样本图像中目标视角对应的图像,比如目标视角为0度,目标图像即指样本图像中0度对应的图像。可选的,特征分布数据包括纹理特征分布数据、轮廓特征分布数据和/或形态特征分布数据。
具体的,计算第三重建形象在目标视角的目标视角图像和样本图像中目标视角对应的目标图像的第一损失的过程,可通过计算所述目标视角图像的图像特征和目标图像的图像特征的差值作为第一损失的方式实现;计算目标视角图像的第一特征分布数据和目标图像的第二特征分布数据的第二损失的过程,可通过计算第一特征分布数据和第二特征分布数据的差值作为第二损失的方式实现;基于第一损失和第二损失对第二待训练模型进行参数更新的过程,可通过计算第一损失和第二损失之和作为第一训练损失,根据第一训练损失对第二待训练模型进行参数更新的方式实现。
例如,目标视角为0度,计算第三重建形象在0度的目标视角图像和样本图像中0度对应的目标图像之间的第一损失,计算目标视角图像的纹理特征分布数据和目标图像的纹理特征分布数据的第二损失,基于第一损失和第二损失进行参数更新,通过引入特征分布数据对待训练模型输出的重建形象进行约束,以训练获得高精度的图像重建模型。
为了提升特征分布数据的获取效率,可引入特征分布构建模型进行构建,本实施例提供的一种可选实施方式中,第一特征分布数据和第二特征分布数据,采用如下方式获得:将所述目标视角图像和所述目标图像输入特征分布构建模型进行特征分布构建,获得所述第一特征分布数据和所述第二特征分布数据;或者,对目标视角图像进行特征分布构建获得第一特征分布数据,以及对目标图像进行特征分布构建获得第二特征分布数据。
其中,特征分布数据是指目标视角图像中形象的表面特征的特征数据和/或目标图像中形象的表面特征的特征数据。比如,特征分布数据为表征目标视角图像中形象的表面特征的法向图,相应的,可根据目标视角图像的第一法向图和目标图像的第二法向图计算第二损失,具体可根据第一法向图的第一向量和第二法向图的第二向量计算第二损失,第一法向图和第二法向图可在对目标视角图像和目标图像进行法向图构建后获得。
参见上述基于样本图像对第二待训练模型进行模型训练的训练方式,重复上述训练过程对第二待训练模型进行训练,并可借助特征分布构建模型对第二待训练模型进行调参,直至损失函数收敛,在损失函数收敛后即完成训练,获得图像重建模型,需要补充的是,图像重建模型可采用NERF网络架构。
例如,在从第二待训练模型出发训练获得图像重建模型的过程中,构建的损失函数为:
Figure BDA0003976448670000071
其中,Loss1为第二待训练模型的训练损失,第二待训练模型的训练损失基于第二待训练模型的第一损失和第二损失计算获得,LossNERF为第一损失,第一损失根据第三重建形象在目标视角的目标视角图像和样本图像中目标视角对应的目标图像确定,Projtheta(E(x))代表目标视角图像,D(Projtheta(E(x)))代表目标视角图像的第一特征分布数据,xtheta代表目标图像,D(xtheta)代表目标图像的第二特征分布数据,||D(Projtheta(E(x)))-D(xtheta)||2表示对D(Projtheta(E(x)))-D(xtheta)求二范数或者表示D(Projtheta(E(x)))与D(xtheta)的欧氏距离,
Figure BDA0003976448670000072
表示对D(Projtheta(E(x)))-D(xtheta)求二范数获得的结果的平方,或者D(Projtheta(E(x)))与D(xtheta)的欧氏距离的平方。
在具体的执行过程中,为了提升关键视角的获取效率,可引入视角检测模型,可选的,所述关键视角,基于视角检测模型对所述第二重建形象进行关键视角检测获得。本实施例提供的一种可选实施方式中,所述视角检测模型,采用如下方式训练:
将样本虚拟形象输入编码器进行关键视角检测,获得第一预设数目的目标关键视角;根据所述样本虚拟形象和所述目标关键视角对所述编码器进行参数更新。通过检测目标关键视角,避免在重建形象和样本虚拟形象上直接进行处理,降低计算难度,提升模型训练效率。
其中,所述目标关键视角,包括重建形象的旋转视角中能够基于关键视角的视角图像得到各个视角的视角图像的关键角度,比如关键视角为10个,可以基于10张关键视角的视角图像得到360张各个视角的视角图像,即关键视角的视角图像可包含重建形象的形象关键信息。
可选的,所述样本虚拟形象从第二待训练模型输出获得;具体的,在对视角检测模型进行模型训练的过程中,一方面,为了提升模型训练效率,降低模型训练难度,可采取“并行”的方式对图像重建模型和视角检测模型同时进行模型训练,在对图像重建模型和视角检测模型同时进行模型训练的过程中,可执行如下操作:将样本图像输入第二待训练模型进行图像重建,获得第三重建形象;根据第三重建形象和样本图像对第二待训练模型进行参数更新,以及将第三重建形象输入编码器进行关键视角检测;根据检测获得的目标关键视角和第三重建形象对编码器进行参数更新。此外,在对图像重建模型和视角检测模型同时进行模型训练的过程中,也可执行如下操作:将样本图像输入第二待训练模型进行图像重建,获得第三重建形象;根据第三重建形象和样本图像对第二待训练模型进行参数更新,以及将第三重建形象输入编码器进行关键视角检测;根据检测获得的目标关键视角、第三重建形象和参数更新后的第二待训练模型的模型参数对编码器进行参数更新。
另一方面,为了提升训练获得的视角检测模型的处理精度,也可采用“串行”的方式对图像重建模型和视角检测模型进行模型训练,即在图像重建模型训练完成后,对视角检测模型进行模型训练,即在对视角检测模型进行模型训练的样本虚拟形象,可根据基于第二待训练模型对样本图像进行图像重建的重建结果进行构建,即根据第二待训练模型在模型训练中对样本图像的图像重建结果,构建样本虚拟形象,以用于进行图像重建模型的模型训练;
为了提升样本虚拟形象的有效性,在根据第二待训练模型在模型训练中对样本图像的图像重建结果,构建样本虚拟形象的过程中,可对图像重建结果进行预处理,根据预处理结果构建样本虚拟形象;可选的,预处理包括:对图像重建结果进行质量评估,并根据质量评估结果从图像重建结果中筛选目标重建结果,和/或,对图像重建结果进行清洗处理。
在此基础上,本实施例提供的一种可选实施方式中,在根据样本虚拟形象和目标关键视角对编码器进行参数更新的过程中,执行如下操作:
根据分解图像和所述样本虚拟形象在预设视角的第一视角图像,计算训练损失;可选的,所述分解图像基于所述目标关键视角和所述样本虚拟形象获得;
基于所述训练损失对所述编码器进行参数更新。
具体的,根据分解图像和样本虚拟形象在预设视角的第一视角图像,计算训练损失的过程,可通过计算分解图像的图像特征和第一视角图像的图像特征的差值作为训练损失的方式实现。
进一步,本实施例提供的一种可选实施方式中,上述分解图像,通过对样本虚拟形象在目标关键视角的第二视角图像进行图像分解处理后获得,具体通过如下方式获得:
确定所述样本虚拟形象在所述目标关键视角的第二视角图像;
基于所述第二视角图像进行图像分解处理,获得第二预设数目的所述分解图像;可选的,所述第一预设数目小于所述第二预设数目。
具体的,基于第二视角图像进行图像分解处理的过程,可通过按照第二预设数目对第二视角图像进行图像分解处理的方式实现,或者,也可通过将第二视角图像输入解码器进行图像分解处理的方式实现。
需要说明的是,第一预设数目和第二预设数目可预先进行设置,第一预设数数目可小于第二预设数目。比如,目标关键视角为10个角度,确定样本虚拟形象在10个角度的10张第二视角图像,基于10张第二视角图像进行图像分解处理,获得360张分解图像。
参见上述基于样本虚拟形象对编码器进行模型训练获得视角检测模型的训练过程,重复上述训练过程进行模型训练,并可借助解码器对编码器进行调参,直至损失函数收敛,在损失函数收敛后即完成训练,获得视角检测模型。
例如,在从编码器出发训练获得视角检测模型的过程中,构建的损失函数为:
Figure BDA0003976448670000091
其中,Loss2为编码器的训练损失,编码器的训练损失根据分解图像和样本虚拟形象在预设视角的第一视角图像,Proji(x3D)表示样本虚拟形象在i视角的第一视角图像,i的取值范围为1至360,D(x)表示分解图像中i视角对应的目标分解图像,||Proji(x3D)-D(x)||2表示对Proji(x3D)-D(x)求二范数或者表示Proji(x3D)与D(x)的欧氏距离,
Figure BDA0003976448670000092
Figure BDA0003976448670000093
表示对Proji(x3D)-D(x)求二范数获得的结果的平方,或者Proji(x3D)与D(x)的欧氏距离的平方。
此外,除上述提供的通过对编码器进行参数更新来实现对视角检测模型的模型训练的训练方式之外,还可通过下述提供的两种视角检测模型的模型训练方式中任意一种训练方式进行模型训练:
将样本虚拟形象输入编码器进行关键视角检测,获得第一预设数目的目标关键视角;
确定样本虚拟形象在目标关键视角的第二视角图像,并将第二视角图像输入解码器进行图像分解处理,获得第二预设数目的分解图像;
根据分解图像和样本虚拟形象在预设视角的第一视角图像对编码器和解码器进行参数更新,并将训练完成后的编码器作为视角检测模型;
或者,
将样本虚拟形象输入编码器进行关键视角检测,获得第一预设数目的目标关键视角;
确定样本虚拟形象在目标关键视角的第二视角图像,并对第二视角图像进行图像分解处理,获得第二预设数目的分解图像;
根据分解图像和样本虚拟形象在预设视角的第一视角图像对编码器进行参数更新。
实际应用中,若直接基于样本图像进行图像重建获得的重建形象进行模型训练,导致模型训练过程中模型计算量较大,针对于此,为了减少模型计算量,减低模型训练难度,并且加快模型收敛的速度,可在获得第二重建形象的基础上,对第二重建形象进行关键视角检测获得关键视角,基于关键视角进行待训练模型的模型训练,通过包含重建形象的形象关键信息的关键视角在保留重建形象的关键的同时减少计算量。本实施例提供的一种可选实施方式中,在根据第一重建形象和对应的预设形象,样本图像进行图像重建获得的第二重建形象,以及第二重建形象进行关键视角检测获得的关键视角,对待训练模型进行参数更新的过程中,执行如下操作:
根据所述第一重建形象在所述关键视角的第三视角图像和所述第二重建形象在所述关键视角的第四视角图像,计算图像损失,以及根据所述第一重建形象和所述预设形象计算形象损失;
基于所述图像损失和所述形象损失进行所述参数更新。
其中,预设形象包括第一重建形象对应的真实形象,即样本图像对应的真实形象。所述关键视角,包括第二重建形象的旋转视角中能够基于关键视角的视角图像得到各个视角的视角图像的关键角度,比如关键视角为10个,可以基于10张关键视角的视角图像得到360张各个视角的视角图像,即关键视角的视角图像可包含第二重建形象的形象关键信息,可选的,所述关键视角,基于视角检测模型对第二重建形象进行关键视角检测获得。
具体的,基于图像损失和形象损失进行参数更新的过程,可通过计算图像损失和形象损失之和作为训练损失,并基于该训练损失进行参数更新的方式实现;根据第一重建形象在关键视角的第三视角图像和第二重建形象在关键视角的第四视角图像,计算图像损失的过程,可通过计算第三视角图像和第四视角图像的图像差异数据作为图像损失的方式实现;根据第一重建形象和预设形象计算形象损失的过程,可通过计算第一重建形象和预设形象的形象差异数据作为形象损失的方式实现。
此外,在基于图像损失和形象损失进行参数更新的基础上,还可对参数更新后的模型参数中目标模型参数进行参数裁剪,进一步对模型进行简化;比如目标模型参数为0的参数,即将参数为0的模型参数进行裁剪。
在上述根据第一重建形象在关键视角的第三视角图像和第二重建形象在关键视角的第四视角图像,计算图像损失的过程中,为了提升参数更新的精细化,可通过构建由特征点和图像特征两个维度的因子组成图像损失的方式,训练出能够针对不同用户灵活化生成虚拟形象的虚拟形象模型,本实施例提供的一种可选实施方式中,在根据第一重建形象在关键视角的第三视角图像和第二重建形象在关键视角的第四视角图像,计算图像损失的过程中,执行如下操作:
根据所述第三视角图像的第一特征点和所述第四视角图像的第二特征点,计算特征点损失,以及计算所述第三视角图像的第一图像特征和所述第四视角图像的第二图像特征的特征损失;
基于所述特征点损失和所述特征损失计算所述图像损失。
可选的,第一特征点包括第三视角图像中第一形象的关键部位位置,比如左手、右膝盖、脖子,第一特征点在对第三视角图像进行特征点检测后获得或者在将第三视角图像输入特征点检测模型进行特征点检测后获得;第二特征点包括第四视角图像中第二形象的关键部位位置,比如左手、右膝盖、脖子,第二特征点在对第四视角图像进行特征点检测后获得或者在将第四视角图像输入特征点检测模型进行特征点检测后获得。
所述第一图像特征在对第三视角图像进行图像特征提取后获得,所述第一图像特征基于图像特征提取模型对第三视角图像进行图像特征提取获得;第二图像特征在对第四视角图像进行图像特征提取后获得,所述第一图像特征基于图像特征提取模型对第四视角图像进行图像特征提取获得。此处的图像特征提取模型可采用ImageNet架构实现。
具体的,根据第三视角图像的第一特征点和第四视角图像的第二特征点,计算特征点损失的过程,可通过计算第一特征点和第二特征点的特征点差值作为特征点损失的方式实现;基于特征点损失和特征损失计算图像损失的过程,可通过将特征点损失和特征损失之和作为图像损失的方式实现。
在上述计算第三视角图像的第一图像特征和第四视角图像的第二图像特征的特征损失的过程中,本实施例提供的一种可选实施方式中,执行如下操作:
对所述第一图像特征和所述第二图像特征进行相似度计算,获得相似度指标;
根据所述相似度指标计算所述特征损失。
其中,相似度指标是指表征第一图像特征和第二图像特征之间的相似度的指标,比如计算第一图像特征和第二图像特征的KL(Kullback-Leibler divergence,KL散度),来表征第一图像特征和第二图像特征的相似度。
具体的,根据相似度指标计算特征损失的过程,可通过将相似度指标作为特征损失的方式实现。
例如,在基于样本图像对待训练模型进行模型训练的过程中,构建的损失函数为:
Figure BDA0003976448670000111
其中,Loss3为待训练模型的训练损失,待训练模型的训练损失基于图像损失和形象损失确定,图像损失基于特征点损失和特征损失计算获得,Proji(x3D-teacher)表示第二重建形象在关键视角i的第四视角图像,Proji(x3D-student)表示第一重建形象在关键视角i的第三视角图像,P(Proji(x3D-teacher))表示第四视角图像的第二特征点,P(Proji(x3D-student)表示第三视角图像的第一特征点,
Figure BDA0003976448670000112
表示特征点损失,KL(I(Proji(x3D-teacher)),I(Proji(x3D-student))表示第三视角图像的第一图像特征和第四视角图像的第二图像特征的KL分布的相似度,Losstotal表示第一重建形象和预设形象的形象损失。
实际应用中,在基于样本图像对待训练模型进行模型训练,获得虚拟形象模型的基础上,可将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成,本实施例提供的一种可选实施方式中,所述虚拟形象生成,包括:根据访问用户针对所述虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像;将所述多视角图像输入通过所述接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象;在此之后,可将访问用户在虚拟世界的虚拟形象进行展示。
此外,上述步骤S104可被替换为基于样本图像对待训练模型进行模型蒸馏训练、模型简化训练或者模型裁剪训练,获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成,并与本实施例提供的其他处理步骤组成新的实现方式。
综上所述,本实施例提供的虚拟形象模型训练方法,根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像,基于样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成,具体的,在基于样本图像对待训练模型进行模型训练的过程中,将样本图像输入待训练模型进行图像重建,获得第一重建形象,根据第一重建形象和对应的预设形象,样本图像进行图像重建获得的第二重建形象,以及第二重建形象进行关键视角检测获得的关键视角,对待训练模型进行参数更新,以此,通过在模型训练的过程中,引入关键视角,避免在重建形象上直接进行处理,减少计算量,提升模型训练效率,通过在虚拟世界的接入设备部署虚拟形象模型进行虚拟形象生成,实现离线场景下的虚拟形象生成。
下述以本实施例提供的一种虚拟形象模型训练方法在虚拟世界场景的应用为例,对本实施例提供的虚拟形象模型训练方法进行进一步说明,参见图2,应用于虚拟世界场景的虚拟形象模型训练方法,具体包括如下步骤。
步骤S202,根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像。
步骤S204,将样本图像输入待训练模型进行图像重建,获得第一重建形象。
步骤S206,根据第三视角图像的第一特征点和第四视角图像的第二特征点,计算特征点损失,以及计算第三视角图像的第一图像特征和第四视角图像的第二图像特征的特征损失。
可选的,第三视角图像为第一重建形象在关键视角的视角图像;第四视角图像为第二重建形象在关键视角的视角图像。
步骤S208,根据特征点损失和特征损失计算图像损失,并根据第一重建形象和对应的预设形象计算形象损失。
步骤S210,根据图像损失和形象损失对待训练模型进行参数更新。
步骤S212,若参数更新后的待训练模型满足收敛条件,将参数更新后的待训练模型作为虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
本说明书提供的一种虚拟形象处理方法实施例如下:
本实施例提供的虚拟形象处理方法,可应用于虚拟世界的接入设备,根据访问用户针对虚拟世界的虚拟形象的申请请求,采集访问用户的多视角图像,并将多视角图像输入虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得访问用户在虚拟世界的虚拟形象,通过多视角图像提升生成的虚拟形象的精确度,并通过部署在接入设备的虚拟形象模型生成虚拟形象,来提升虚拟形象的生成效率,并实现在离线场景下的虚拟形象生成。
参照图3,本实施例提供的虚拟形象模型训练方法,具体包括步骤S302至步骤S304。
步骤S302,根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像。
本实施例中,虚拟世界是指基于去中心化协作实现并且具有开放经济系统的虚拟的拟真世界。具体的,物理世界(真实世界)中的用户可通过接入设备接入虚拟世界,以在虚拟世界中进行行为活动,比如用户通过接入设备进行游戏交互的游戏虚拟世界,再比如用户通过接入设备进行在线会议的会议虚拟世界;所述虚拟世界的接入设备,可以是连接虚拟世界的VR(Virtual Reality,虚拟现实)设备、AR(Augmented Reality,增强现实)设备等,比如连接虚拟世界的头戴式VR设备。所述物理世界,是指与虚拟世界对应的世界,即真实存在的世界,可选的,所述物理世界包括真实世界。
虚拟形象是指从用户的图像出发,采用图像重建技术对用户的图像进行重建获得的用于在虚拟世界内展示用户形象的三维数字图像(三维数字形象),或者,从用户的图像出发,采用图像重建技术对用户的图像进行重建获得的虚拟世界内的与用户具有数字孪生关系或者身份映射的数字孪生形象。比如,在采集到用户在物理世界(真实世界)的用户图像的基础上,通过将用户图像输入图神经网络GNN(Graph Neural Network)进行图像重建,获得虚拟世界内的三维数字形象、数字孪生形象或者身份映射形象。
所述多视角图像,是指在物理世界(真实世界)中从多个采集视角出发针对用户进行图像采集获得的图像,可以针对用户的全身采集图像,也可以针对用户的某个身体部位(比如头部)采集图像。可选的,所述用户的多视角图像,包括在物理世界(真实世界)中针对用户采集的至少一个视角的用户图像,比如针对用户从前、后、左、右四个视角出发进行图像采集,采集获得的四张用户图像即为该用户的多视角图像;可选的,所述多视角图像,通过虚拟世界的接入设备集成或者配置的图像传感器进行采集。所述访问用户是指访问虚拟世界,并针对虚拟形象提交申请请求的用户。
具体实施时,虚拟世界的接入设备获取访问用户针对虚拟世界的虚拟形象的申请请求,根据该申请请求,采集访问用户的多视角图像,具体可通过虚拟世界的接入设备集成或者配置的图像传感器针对访问用户采集多视角图像。
步骤S304,将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象。
上述根据访问用户针对虚拟世界的虚拟形象的申请请求,采集访问用户的多视角图像,本步骤中,基于多视角图像进行图像重建,获得访问用户在虚拟世界的虚拟形象,具体将多视角图像输入虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得访问用户在虚拟世界的虚拟形象。其中,所述图像重建包括:从多视角图像中提取图像特征,并基于图像特征进行三维图像重建。
具体的,采用如下方式获得虚拟形象模型:根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像;基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
可选的,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象:根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
实际应用中,由于虚拟世界的接入设备的计算能力有限,无法部署高精度的复杂模型,只能基于简单模型进行虚拟形象生成,导致生成的虚拟形象的形象质量较差,针对于此,可在服务器训练高精度的虚拟形象模型,在此基础上,将虚拟形象模型部署于虚拟世界的接入设备,提升虚拟形象的生成效率和虚拟形象的精确度。
为了提升生成虚拟形象的效率,可在服务器提前训练获得虚拟形象模型,将虚拟形象模型部署于虚拟世界的接入设备,一方面,可提升虚拟形象生成的效率,无需将采集的多视角图像发送至服务器在服务器进行虚拟形象生成,以此提升虚拟形象的生成效率,另一方面将虚拟形象模型部署于虚拟世界的接入设备之后,在离线场景下也可利用接入设备部署的虚拟形象模型生成用户的虚拟形象,提升用户体验,此处的离线场景是指网络处于离线状态。
具体在模型训练过程中,服务器获取在物理世界针对用户进行多视角图像采集获得的多视角图像,并根据多视角图像构建样本图像,通过多视角图像构建的样本图像,提升样本图像的有效性,有助于提升模型训练的精确度。
上述服务器根据在物理世界针对用户采集的多视角图像,构建样本图像,在此之后,服务器基于样本图像进行模型训练获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
具体实施时,服务器将样本图像输入待训练模型进行模型训练获得虚拟形象模型,将虚拟形象模型部署于虚拟世界的接入设备,基于用户针对虚拟形象的申请请求,向用户生成虚拟世界的虚拟形象,提升虚拟形象的生成效率,适用离线场景。
可选的,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
其中,所述待训练模型进行的图像重建,包括:从样本图像中提取图像特征,基于图像特征进行三维重建。所述预设形象包括第一重建形象对应的真实形象,即样本图像对应的真实形象。所述第一重建形象,是指基于样本图像进行图像重建的图像重建结果,包括对样本图像进行图像重建的虚拟形象。
在具体的执行过程中,服务器在获得第二重建形象的过程中,为了提升第二重建形象的获取效率,可引入图像重建模型,可选的,所述第二重建形象,基于图像重建模型对样本图像进行图像重建获得。具体的,所述图像重建模型,采用如下方式训练:
将所述样本图像输入第二待训练模型进行图像重建,获得第三重建形象;
根据所述第三重建形象和所述样本图像对所述第二待训练模型进行参数更新。
可选的,第二待训练模型包括待训练教师模型,图像重建模型包括教师模型。
具体的,在第二待训练模型的训练过程中,为了提升训练获得的图像重建模型的处理精度,服务器可在获得第三重建形象在目标视角的目标视角图像以及确定样本图像中目标视角对应的目标图像之后,构建目标视角图像的第一特征分布数据和目标图像的第二特征分布数据,以此来评价图像重建模型生成的重建形象的表面分布数据的损失,服务器在根据第三重建形象和样本图像对第二待训练模型进行参数更新的过程中,可执行如下操作:
计算所述第三重建形象在目标视角的目标视角图像和所述样本图像中所述目标视角对应的目标图像的第一损失,以及计算所述目标视角图像的第一特征分布数据和所述目标图像的第二特征分布数据的第二损失;
基于所述第一损失和所述第二损失对所述第二待训练模型进行参数更新。
其中,所述目标视角,是指第三重建形象的旋转视角,可选的,目标视角包括第三重建形象从某一方向顺时针或者逆时针旋转至另一方向时的旋转角度,比如将第三重建形象面向正北方向时(面向真实用户)的视角作为0度,按照顺时针计算,第三重建形象从正北方向旋转至西北45度的目标视角为135度。该目标视角可以是一者,也可以是多者。
所述目标视角图像,是指第三重建形象在目标视角的图像,沿用上例,目标视角为0度,目标视角图像为第三重建形象在0度时的图像即第三重建形象在正北方向的图像。目标图像是指样本图像中目标视角对应的图像,比如目标视角为0度,目标图像即指样本图像中0度对应的图像。特征分布数据包括纹理特征分布数据、轮廓特征分布数据和/或形态特征分布数据。
具体的,服务器计算第三重建形象在目标视角的目标视角图像和样本图像中目标视角对应的目标图像的第一损失的过程,可通过计算所述目标视角图像的图像特征和目标图像的图像特征的差值作为第一损失的方式实现;服务器计算目标视角图像的第一特征分布数据和目标图像的第二特征分布数据的第二损失的过程,可通过计算第一特征分布数据和第二特征分布数据的差值作为第二损失的方式实现;服务器基于第一损失和第二损失对第二待训练模型进行参数更新的过程,可通过计算第一损失和第二损失之和作为第一训练损失,根据第一训练损失对第二待训练模型进行参数更新的方式实现。
例如,目标视角为0度,服务器计算第三重建形象在0度的目标视角图像和样本图像中0度对应的目标图像之间的第一损失,计算目标视角图像的纹理特征分布数据和目标图像的纹理特征分布数据的第二损失,基于第一损失和第二损失进行参数更新,通过引入特征分布数据对待训练模型输出的重建形象进行约束,以训练获得高精度的图像重建模型。
为了提升特征分布数据的获取效率,可引入特征分布构建模型进行构建,第一特征分布数据和第二特征分布数据,服务器可采用如下方式获得:将所述目标视角图像和所述目标图像输入特征分布构建模型进行特征分布构建,获得所述第一特征分布数据和所述第二特征分布数据;或者,对目标视角图像进行特征分布构建获得第一特征分布数据,以及对目标图像进行特征分布构建获得第二特征分布数据。
其中,特征分布数据是指目标视角图像中形象的表面特征的特征数据和/或目标图像中形象的表面特征的特征数据。比如,特征分布数据为表征目标视角图像中形象的表面特征的法向图,相应的,服务器可根据目标视角图像的第一法向图和目标图像的第二法向图计算第二损失,具体可根据第一法向图的第一向量和第二法向图的第二向量计算第二损失,第一法向图和第二法向图可在对目标视角图像和目标图像进行法向图构建后获得。
参见上述服务器基于样本图像对第二待训练模型进行模型训练的训练方式,在服务器重复上述训练过程对第二待训练模型进行训练,并可借助特征分布构建模型对第二待训练模型进行调参,直至损失函数收敛,在损失函数收敛后即完成训练,获得图像重建模型,需要补充的是,图像重建模型可采用NERF网络架构。
例如,在从第二待训练模型出发训练获得图像重建模型的过程中,服务器构建的损失函数为:
Figure BDA0003976448670000161
其中,Loss1为第二待训练模型的训练损失,第二待训练模型的训练损失基于第二待训练模型的第一损失和第二损失计算获得,LossNERF为第一损失,第一损失根据第三重建形象在目标视角的目标视角图像和样本图像中目标视角对应的目标图像确定,Projtheta(E(x))代表目标视角图像,D(Projtheta(E(x)))代表目标视角图像的第一特征分布数据,xtheta代表目标图像,D(xtheta)代表目标图像的第二特征分布数据,||D(Projtheta(E(x)))-D(xtheta)||2表示对D(Projtheta(E(x)))-D(xtheta)求二范数或者表示D(Projtheta(E(x)))与D(xtheta)的欧氏距离,
Figure BDA0003976448670000162
表示对D(Projtheta(E(x)))-D(xtheta)求二范数获得的结果的平方,或者D(Projtheta(E(x)))与D(xtheta)的欧氏距离的平方。
在具体的执行过程中,为了提升关键视角的获取效率,可引入视角检测模型,可选的,所述关键视角,基于视角检测模型对所述第二重建形象进行关键视角检测获得。本实施例提供的一种可选实施方式中,所述视角检测模型,采用如下方式训练:
将样本虚拟形象输入编码器进行关键视角检测,获得第一预设数目的目标关键视角;根据所述样本虚拟形象和所述目标关键视角对所述编码器进行参数更新。通过检测目标关键视角,避免在重建形象和样本虚拟形象上直接进行处理,降低计算难度,提升模型训练效率。
其中,所述目标关键视角,包括重建形象的旋转视角中能够基于关键视角的视角图像得到各个视角的视角图像的关键角度,比如关键视角为10个,可以基于10张关键视角的视角图像得到360张各个视角的视角图像,即关键视角的视角图像可包含重建形象的形象关键信息。
可选的,所述样本虚拟形象从第二待训练模型输出获得;具体的,服务器在对视角检测模型进行模型训练的过程中,一方面,为了提升模型训练效率,可采取“并行”的方式对图像重建模型和视角检测模型同时进行模型训练,在对图像重建模型和视角检测模型同时进行模型训练的过程中,可执行如下操作:将样本图像输入第二待训练模型进行图像重建,获得第三重建形象;根据第三重建形象和样本图像对第二待训练模型进行参数更新,以及将第三重建形象输入编码器进行关键视角检测;根据检测获得的目标关键视角和第三重建形象对编码器进行参数更新。此外,在对图像重建模型和视角检测模型同时进行模型训练的过程中,也可执行如下操作:将样本图像输入第二待训练模型进行图像重建,获得第三重建形象;根据第三重建形象和样本图像对第二待训练模型进行参数更新,以及将第三重建形象输入编码器进行关键视角检测;根据检测获得的目标关键视角、第三重建形象和参数更新后的第二待训练模型的模型参数对编码器进行参数更新。
另一方面,为了提升训练获得的视角检测模型的处理精度,也可采用“串行”的方式对图像重建模型和视角检测模型进行模型训练,即在图像重建模型训练完成后,对视角检测模型进行模型训练,即在对视角检测模型进行模型训练的样本虚拟形象,可根据基于第二待训练模型对样本图像进行图像重建的重建结果进行构建,即获取第二待训练模型的模型训练中对样本图像的图像重建结果,构建样本虚拟形象,以用于进行图像重建模型的模型训练。
在此基础上,本实施例提供的一种可选实施方式中,服务器在根据样本虚拟形象和目标关键视角对编码器进行参数更新的过程中,执行如下操作:
根据分解图像和所述样本虚拟形象在预设视角的第一视角图像,计算训练损失;所述分解图像基于所述目标关键视角和所述样本虚拟形象获得;
基于所述训练损失对所述编码器进行参数更新。
具体的,服务器根据分解图像和样本虚拟形象在预设视角的第一视角图像,计算训练损失的过程,可通过计算分解图像的图像特征和第一视角图像的图像特征的差值作为训练损失的方式实现。
进一步,本实施例提供的一种可选实施方式中,上述分解图像,在对样本虚拟形象在目标关键视角的第二视角图像进行图像分解处理后获得,具体通过如下方式获得:
确定所述样本虚拟形象在所述目标关键视角的第二视角图像;
基于所述第二视角图像进行图像分解处理,获得第二预设数目的所述分解图像;可选的,所述第一预设数目小于所述第二预设数目。
具体的,基于第二视角图像进行图像分解处理的过程,可通过按照第二预设数目对第二视角图像进行图像分解处理的方式实现,或者,也可通过将第二视角图像输入解码器进行图像分解处理的方式实现。
需要说明的是,第一预设数目和第二预设数目可预先进行设置,第一预设数数目可小于第二预设数目。比如,目标关键视角为10个角度,确定样本虚拟形象在10个角度的10张第二视角图像,基于10张第二视角图像进行图像分解处理,获得360张分解图像。
参见上述服务器基于样本虚拟形象对编码器进行模型训练获得视角检测模型的训练过程,在服务器重复上述训练过程进行模型训练,并可借助解码器对编码器进行调参,直至损失函数收敛,在损失函数收敛后即完成训练,获得视角检测模型。
例如,在从编码器出发训练获得视角检测模型的过程中,服务器构建的损失函数为:
Figure BDA0003976448670000181
其中,Loss2为编码器的训练损失,编码器的训练损失根据分解图像和样本虚拟形象在预设视角的第一视角图像,Proji(x3D)表示样本虚拟形象在i视角的第一视角图像,i的取值范围为1至360,D(x)表示分解图像中i视角对应的目标分解图像,||Proji(x3D)-D(x)||2表示对Proji(x3D)-D(x)求二范数或者表示Proji(x3D)与D(x)的欧氏距离,
Figure BDA0003976448670000182
Figure BDA0003976448670000183
表示对Proji(x3D)-D(x)求二范数获得的结果的平方,或者Proji(x3D)与D(x)的欧氏距离的平方。
此外,除上述提供的通过对编码器进行参数更新来实现对视角检测模型的模型训练的训练方式之外,服务器还可通过下述提供的两种视角检测模型的模型训练方式中任意一种训练方式进行模型训练:
将样本虚拟形象输入编码器进行关键视角检测,获得第一预设数目的目标关键视角;
确定样本虚拟形象在目标关键视角的第二视角图像,并将第二视角图像输入解码器进行图像分解处理,获得第二预设数目的分解图像;
根据分解图像和样本虚拟形象在预设视角的第一视角图像对编码器和解码器进行参数更新,并将训练完成后的编码器作为视角检测模型;
或者,
将样本虚拟形象输入编码器进行关键视角检测,获得第一预设数目的目标关键视角;
确定样本虚拟形象在目标关键视角的第二视角图像,并对第二视角图像进行图像分解处理,获得第二预设数目的分解图像;
根据分解图像和样本虚拟形象在预设视角的第一视角图像对编码器进行参数更新。
实际应用中,若直接基于样本图像进行图像重建获得的重建形象进行模型训练,导致模型训练过程中模型计算量较大,针对于此,为了减少模型计算量,并且加快模型收敛的速度,可在获得第二重建形象的基础上,对第二重建形象进行关键视角检测获得关键视角,基于关键视角进行待训练模型的模型训练。服务器在根据第一重建形象和对应的预设形象,样本图像进行图像重建获得的第二重建形象,以及第二重建形象进行关键视角检测获得的关键视角,对待训练模型进行参数更新的过程中,可执行如下操作:
根据所述第一重建形象在所述关键视角的第三视角图像和所述第二重建形象在所述关键视角的第四视角图像,计算图像损失,以及根据所述第一重建形象和所述预设形象计算形象损失;
基于所述图像损失和所述形象损失进行所述参数更新。
其中,预设形象包括第一重建形象对应的真实形象,即样本图像对应的真实形象。所述关键视角,包括第二重建形象的旋转视角中能够基于关键视角的视角图像得到各个视角的视角图像的关键角度,比如关键视角为10个,可以基于10张关键视角的视角图像得到360张各个视角的视角图像,即关键视角的视角图像可包含第二重建形象的形象关键信息,可选的,所述关键视角,基于视角检测模型对第二重建形象进行关键视角检测获得。
具体的,服务器基于图像损失和形象损失进行参数更新的过程,可通过计算图像损失和形象损失之和作为训练损失,并基于该训练损失进行参数更新的方式实现;服务器根据第一重建形象在关键视角的第三视角图像和第二重建形象在关键视角的第四视角图像,计算图像损失的过程,可通过计算第三视角图像和第四视角图像的图像差异数据作为图像损失的方式实现;服务器根据第一重建形象和预设形象计算形象损失的过程,可通过计算第一重建形象和预设形象的形象差异数据作为形象损失的方式实现。
此外,服务器在基于图像损失和形象损失进行参数更新的基础上,还可对参数更新后的模型参数中目标模型参数进行参数裁剪;比如目标模型参数为0的参数,即将参数为0的模型参数进行裁剪。
在上述服务器根据第一重建形象在关键视角的第三视角图像和第二重建形象在关键视角的第四视角图像,计算图像损失的过程中,为了提升参数更新的精细化,可通过构建由特征点和图像特征两个维度的因子组成图像损失的方式,训练出能够针对不同用户灵活化生成虚拟形象的虚拟形象模型,服务器在根据第一重建形象在关键视角的第三视角图像和第二重建形象在关键视角的第四视角图像,计算图像损失的过程中,可执行如下操作:
根据所述第三视角图像的第一特征点和所述第四视角图像的第二特征点,计算特征点损失,以及计算所述第三视角图像的第一图像特征和所述第四视角图像的第二图像特征的特征损失;
基于所述特征点损失和所述特征损失计算所述图像损失。
可选的,第一特征点包括第三视角图像中第一形象的关键部位位置,比如左手、右膝盖、脖子,第一特征点在对第三视角图像进行特征点检测后获得或者在将第三视角图像输入特征点检测模型进行特征点检测后获得;第二特征点包括第四视角图像中第二形象的关键部位位置,比如左手、右膝盖、脖子,第二特征点在对第四视角图像进行特征点检测后获得或者在将第四视角图像输入特征点检测模型进行特征点检测后获得。
所述第一图像特征在对第三视角图像进行图像特征提取后获得,所述第一图像特征基于图像特征提取模型对第三视角图像进行图像特征提取获得;第二图像特征在对第四视角图像进行图像特征提取后获得,所述第一图像特征基于图像特征提取模型对第四视角图像进行图像特征提取获得。此处的图像特征提取模型可采用ImageNet架构实现。
具体的,服务器根据第三视角图像的第一特征点和第四视角图像的第二特征点,计算特征点损失的过程,可通过计算第一特征点和第二特征点的特征点差值作为特征点损失的方式实现;服务器基于特征点损失和特征损失计算图像损失的过程,可通过将特征点损失和特征损失之和作为图像损失的方式实现。
在上述服务器计算第三视角图像的第一图像特征和第四视角图像的第二图像特征的特征损失的过程中,可执行如下操作:
对所述第一图像特征和所述第二图像特征进行相似度计算,获得相似度指标;
根据所述相似度指标计算所述特征损失。
其中,相似度指标是指表征第一图像特征和第二图像特征之间的相似度的指标,比如计算第一图像特征和第二图像特征的KL(Kullback-Leibler divergence,KL散度),来表征第一图像特征和第二图像特征的相似度。
具体的,服务器根据相似度指标计算特征损失的过程,可通过将相似度指标作为特征损失的方式实现。
例如,在基于样本图像对待训练模型进行模型训练的过程中,服务器构建的损失函数为:
Figure BDA0003976448670000201
其中,Loss3为待训练模型的训练损失,待训练模型的训练损失基于图像损失和形象损失确定,图像损失基于特征点损失和特征损失计算获得,Proji(x3D-teacher)表示第二重建形象在关键视角i的第四视角图像,Proji(x3D-student)表示第一重建形象在关键视角i的第三视角图像,P(Proji(x3D-teacher))表示第四视角图像的第二特征点,P(Proji(x3D-student)表示第三视角图像的第一特征点,
Figure BDA0003976448670000202
表示特征点损失,KL(I(Proji(x3D-teacher)),I(Proji(x3D-student))表示第三视角图像的第一图像特征和第四视角图像的第二图像特征的kl分布的相似度,Losstotal表示第一重建形象和预设形象的形象损失。
需要补充的是,本实施例中的虚拟形象模型的模型训练过程,与上述方法实施例中的虚拟形象模型的模型训练过程是类似的,因此,阅读本实施例中的虚拟形象模型的模型训练过程,请参照上述方法实施例中提供的虚拟形象模型的模型训练方法的相应内容。
综上所述,本实施例提供的虚拟形象处理方法,获取访问用户针对虚拟世界的虚拟形象的申请请求,响应于该申请请求,采集访问用户的多视角图像,并将多视角图像输入通过虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得访问用户在虚拟世界的虚拟形象,以此,通过在接入设备部署的虚拟形象模型生成虚拟形象,实现离线场景下的虚拟形象生成,由于无需将采集的多视角图像向服务器发送以生成虚拟形象,提升虚拟形象的生成效率。
下述以本实施例提供的一种虚拟形象处理方法在虚拟世界场景的应用为例,对本实施例提供的虚拟形象处理方法进行进一步说明,参见图4,应用于虚拟世界场景的虚拟形象处理方法,具体包括如下步骤。
步骤S402,获取访问用户针对虚拟世界的虚拟形象的申请请求。
步骤S404,响应于申请请求,采集访问用户的多视角彩色图像。
步骤S406,将多视角彩色图像输入通过虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得访问用户在虚拟世界的虚拟形象。
本说明书提供的一种虚拟形象模型训练装置实施例如下:
在上述的实施例中,提供了一种虚拟形象模型训练方法,与之相对应的,还提供了一种虚拟形象模型训练装置,下面结合附图进行说明。
参照图5,其示出了本实施例提供的一种虚拟形象模型训练装置示意图。
由于装置实施例对应于方法实施例,所以描述得比较简单,相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例提供一种虚拟形象模型训练装置,包括:
样本构建模块502,被配置为根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像;
模型训练模块504,被配置为基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成;
其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书提供的一种虚拟形象处理装置实施例如下:
在上述的实施例中,提供了一种虚拟形象处理方法,与之相对应的,还提供了一种虚拟形象处理装置,下面结合附图进行说明。
参照图6,其示出了本实施例提供的一种虚拟形象处理装置示意图。
由于装置实施例对应于方法实施例,所以描述得比较简单,相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例提供一种虚拟形象处理装置,包括:
图像采集模块602,被配置为根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像;
图像重建模块604,被配置为将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书提供的一种虚拟形象模型训练设备实施例如下:
对应上述描述的一种虚拟形象模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种虚拟形象模型训练设备,该虚拟形象模型训练设备用于执行上述提供的虚拟形象模型训练方法,图7为本说明书一个或多个实施例提供的一种虚拟形象模型训练设备的结构示意图。
本实施例提供的一种虚拟形象模型训练设备,包括:
如图7所示,虚拟形象模型训练设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器701和存储器702,存储器702中可以存储有一个或一个以上存储应用程序或数据。其中,存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括虚拟形象模型训练设备中的一系列计算机可执行指令。更进一步地,处理器701可以设置为与存储器702通信,在虚拟形象模型训练设备上执行存储器702中的一系列计算机可执行指令。虚拟形象模型训练设备还可以包括一个或一个以上电源703,一个或一个以上有线或无线网络接口704,一个或一个以上输入/输出接口705,一个或一个以上键盘706等。
在一个具体的实施例中,虚拟形象模型训练设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对虚拟形象模型训练设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像;
基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成;
其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书提供的一种虚拟形象处理设备实施例如下:
对应上述描述的一种虚拟形象处理方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种虚拟形象处理设备,该虚拟形象处理设备用于执行上述提供的虚拟形象处理方法,图8为本说明书一个或多个实施例提供的一种虚拟形象处理设备的结构示意图。
本实施例提供的一种虚拟形象处理设备,包括:
如图8所示,虚拟形象处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括虚拟形象处理设备中的一系列计算机可执行指令。更进一步地,处理器801可以设置为与存储器802通信,在虚拟形象处理设备上执行存储器802中的一系列计算机可执行指令。虚拟形象处理设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入/输出接口805,一个或一个以上键盘806等。
在一个具体的实施例中,虚拟形象处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对虚拟形象处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像;
将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
本说明书提供的一种存储介质实施例如下:
对应上述描述的一种虚拟形象模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种存储介质。
本实施例提供的存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像;
基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成;
其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
需要说明的是,本说明书中关于一种存储介质的实施例与本说明书中关于一种虚拟形象模型训练方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应方法的实施,重复之处不再赘述。
本说明书提供的另一种存储介质实施例如下:
对应上述描述的一种虚拟形象处理方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种存储介质。
本实施例提供的存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像;
将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
需要说明的是,本说明书中关于另一种存储介质的实施例与本说明书中关于一种虚拟形象处理方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应方法的实施,重复之处不再赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪30年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Comell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本文件的实施例而已,并不用于限制本文件。对于本领域技术人员来说,本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本文件的权利要求范围之内。

Claims (21)

1.一种虚拟形象模型训练方法,包括:
根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像;
基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成;
其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
2.根据权利要求1所述的虚拟形象模型训练方法,所述关键视角,基于视角检测模型对所述第二重建形象进行关键视角检测获得;
其中,所述视角检测模型,采用如下方式训练:
将样本虚拟形象输入编码器进行关键视角检测,获得第一预设数目的目标关键视角;
根据所述样本虚拟形象和所述目标关键视角对所述编码器进行参数更新。
3.根据权利要求2所述的虚拟形象模型训练方法,所述根据所述样本虚拟形象和所述目标关键视角对所述编码器进行参数更新,包括:
根据分解图像和所述样本虚拟形象在预设视角的第一视角图像,计算训练损失;所述分解图像基于所述目标关键视角和所述样本虚拟形象获得;
基于所述训练损失对所述编码器进行参数更新。
4.根据权利要求3所述的虚拟形象模型训练方法,所述分解图像,通过如下方式获得:
确定所述样本虚拟形象在所述目标关键视角的第二视角图像;
基于所述第二视角图像进行图像分解处理,获得第二预设数目的所述分解图像;所述第一预设数目小于所述第二预设数目。
5.根据权利要求1所述的虚拟形象模型训练方法,所述第二重建形象,基于图像重建模型对所述样本图像进行图像重建获得;
其中,所述图像重建模型,采用如下方式训练:
将所述样本图像输入第二待训练模型进行图像重建,获得第三重建形象;
根据所述第三重建形象和所述样本图像对所述第二待训练模型进行参数更新。
6.根据权利要求5所述的虚拟形象模型训练方法,所述根据所述第三重建形象和所述样本图像对所述第二待训练模型进行参数更新,包括:
计算所述第三重建形象在目标视角的目标视角图像和所述样本图像中所述目标视角对应的目标图像的第一损失,以及计算所述目标视角图像的第一特征分布数据和所述目标图像的第二特征分布数据的第二损失;
基于所述第一损失和所述第二损失对所述第二待训练模型进行参数更新。
7.根据权利要求6所述的虚拟形象模型训练方法,所述第一特征分布数据和所述第二特征分布数据,采用如下方式获得:
将所述目标视角图像和所述目标图像输入特征分布构建模型进行特征分布构建,获得所述第一特征分布数据和所述第二特征分布数据。
8.根据权利要求1所述的虚拟形象模型训练方法,所述根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新,包括:
根据所述第一重建形象在所述关键视角的第三视角图像和所述第二重建形象在所述关键视角的第四视角图像,计算图像损失,以及根据所述第一重建形象和所述预设形象计算形象损失;
基于所述图像损失和所述形象损失进行所述参数更新。
9.根据权利要求8所述的虚拟形象模型训练方法,所述根据所述第一重建形象在所述关键视角的第三视角图像和所述第二重建形象在所述关键视角的第四视角图像,计算图像损失,包括:
根据所述第三视角图像的第一特征点和所述第四视角图像的第二特征点,计算特征点损失,以及计算所述第三视角图像的第一图像特征和所述第四视角图像的第二图像特征的特征损失;
基于所述特征点损失和所述特征损失计算所述图像损失。
10.根据权利要求9所述的虚拟形象模型训练方法,所述计算所述第三视角图像的第一图像特征和所述第四视角图像的第二图像特征的特征损失,包括:
对所述第一图像特征和所述第二图像特征进行相似度计算,获得相似度指标;
根据所述相似度指标计算所述特征损失。
11.根据权利要求1所述的虚拟形象模型训练方法,所述虚拟形象生成,包括:
根据访问用户针对所述虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像;
将所述多视角图像输入通过所述接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象。
12.一种虚拟形象处理方法,包括:
根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像;
将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
13.根据权利要求1所述的虚拟形象处理方法,所述关键视角,基于视角检测模型对所述第二重建形象进行关键视角检测获得;
其中,所述视角检测模型,采用如下方式训练:
将样本虚拟形象输入编码器进行关键视角检测,获得第一预设数目的目标关键视角;
根据所述样本虚拟形象和所述目标关键视角对所述编码器进行参数更新。
14.根据权利要求13所述的虚拟形象处理方法,所述根据所述样本虚拟形象和所述目标关键视角对所述编码器进行参数更新,包括:
根据分解图像和所述样本虚拟形象在预设视角的第一视角图像,计算训练损失;所述分解图像基于所述目标关键视角和所述样本虚拟形象获得;
基于所述训练损失对所述编码器进行参数更新。
15.根据权利要求14所述的虚拟形象处理方法,所述分解图像,通过如下方式获得:
确定所述样本虚拟形象在所述目标关键视角的第二视角图像;
基于所述第二视角图像进行图像分解处理,获得第二预设数目的所述分解图像;所述第一预设数目小于所述第二预设数目。
16.一种虚拟形象模型训练装置,包括:
样本构建模块,被配置为根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像;
模型训练模块,被配置为基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成;
其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
17.一种虚拟形象处理装置,包括:
图像采集模块,被配置为根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像;
图像重建模块,被配置为将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
18.一种虚拟形象模型训练设备,包括:
处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像;
基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成;
其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
19.一种虚拟形象处理设备,包括:
处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像;
将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
20.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
根据在物理世界针对用户进行多视角图像采集获得的多视角图像,构建样本图像;
基于所述样本图像对待训练模型进行模型训练,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成;
其中,所述模型训练,包括:将所述样本图像输入所述待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
21.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
根据访问用户针对虚拟世界的虚拟形象的申请请求,采集所述访问用户的多视角图像;
将所述多视角图像输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建,获得所述访问用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型,采用如下方式训练:将样本图像输入待训练模型进行图像重建,获得第一重建形象;根据所述第一重建形象和对应的预设形象,所述样本图像进行图像重建获得的第二重建形象,以及所述第二重建形象进行关键视角检测获得的关键视角,对所述待训练模型进行参数更新。
CN202211547438.2A 2022-12-01 2022-12-01 虚拟形象模型训练方法及装置 Active CN115809696B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211547438.2A CN115809696B (zh) 2022-12-01 2022-12-01 虚拟形象模型训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211547438.2A CN115809696B (zh) 2022-12-01 2022-12-01 虚拟形象模型训练方法及装置

Publications (2)

Publication Number Publication Date
CN115809696A true CN115809696A (zh) 2023-03-17
CN115809696B CN115809696B (zh) 2024-04-02

Family

ID=85484935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211547438.2A Active CN115809696B (zh) 2022-12-01 2022-12-01 虚拟形象模型训练方法及装置

Country Status (1)

Country Link
CN (1) CN115809696B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117876610A (zh) * 2024-03-12 2024-04-12 之江实验室 针对三维构建模型的模型训练方法、装置、存储介质

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111354079A (zh) * 2020-03-11 2020-06-30 腾讯科技(深圳)有限公司 三维人脸重建网络训练及虚拟人脸形象生成方法和装置
CN112116589A (zh) * 2020-09-30 2020-12-22 腾讯科技(深圳)有限公司 虚拟形象的评测方法、装置、设备及计算机可读存储介质
CN113112580A (zh) * 2021-04-20 2021-07-13 北京字跳网络技术有限公司 一种虚拟形象的生成方法、装置、设备及介质
CN113628326A (zh) * 2021-08-10 2021-11-09 广州虎牙科技有限公司 多视角三维重建方法、装置、电子设备和可读存储介质
CN114821675A (zh) * 2022-06-29 2022-07-29 阿里巴巴达摩院(杭州)科技有限公司 对象的处理方法、系统和处理器
CN114842121A (zh) * 2022-06-30 2022-08-02 北京百度网讯科技有限公司 贴图生成模型训练和贴图生成方法、装置、设备及介质
CN114863002A (zh) * 2022-05-25 2022-08-05 Oppo广东移动通信有限公司 虚拟形象生成方法及装置、终端设备、计算机可读介质
CN114863214A (zh) * 2022-05-16 2022-08-05 北京字跳网络技术有限公司 图像生成模型训练、图像生成方法、装置、介质及设备
CN115147558A (zh) * 2022-08-31 2022-10-04 北京百度网讯科技有限公司 三维重建模型的训练方法、三维重建方法及装置
CN115222862A (zh) * 2022-06-29 2022-10-21 支付宝(杭州)信息技术有限公司 虚拟人衣物生成方法、装置、设备、介质及程序产品
CN115222875A (zh) * 2022-06-01 2022-10-21 支付宝(杭州)信息技术有限公司 模型的确定方法、局部场景重建方法、介质、设备及产品
CN115346028A (zh) * 2022-08-17 2022-11-15 支付宝(杭州)信息技术有限公司 虚拟环境主题处理方法及装置
CN115345980A (zh) * 2022-10-18 2022-11-15 北京百度网讯科技有限公司 个性化纹理贴图的生成方法及装置
CN115359219A (zh) * 2022-08-16 2022-11-18 支付宝(杭州)信息技术有限公司 虚拟世界的虚拟形象处理方法及装置
CN115359220A (zh) * 2022-08-16 2022-11-18 支付宝(杭州)信息技术有限公司 虚拟世界的虚拟形象更新方法及装置
CN115358777A (zh) * 2022-08-16 2022-11-18 支付宝(杭州)信息技术有限公司 虚拟世界的广告投放处理方法及装置
CN115357938A (zh) * 2022-09-20 2022-11-18 支付宝(杭州)信息技术有限公司 虚拟形象处理方法及装置
CN115374298A (zh) * 2022-09-20 2022-11-22 支付宝(杭州)信息技术有限公司 基于索引的虚拟形象数据处理方法及装置
CN115374141A (zh) * 2022-09-20 2022-11-22 支付宝(杭州)信息技术有限公司 虚拟形象的更新处理方法及装置
CN115393514A (zh) * 2022-08-26 2022-11-25 北京百度网讯科技有限公司 三维重建模型的训练方法、三维重建方法、装置、设备

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111354079A (zh) * 2020-03-11 2020-06-30 腾讯科技(深圳)有限公司 三维人脸重建网络训练及虚拟人脸形象生成方法和装置
CN112116589A (zh) * 2020-09-30 2020-12-22 腾讯科技(深圳)有限公司 虚拟形象的评测方法、装置、设备及计算机可读存储介质
CN113112580A (zh) * 2021-04-20 2021-07-13 北京字跳网络技术有限公司 一种虚拟形象的生成方法、装置、设备及介质
CN113628326A (zh) * 2021-08-10 2021-11-09 广州虎牙科技有限公司 多视角三维重建方法、装置、电子设备和可读存储介质
CN114863214A (zh) * 2022-05-16 2022-08-05 北京字跳网络技术有限公司 图像生成模型训练、图像生成方法、装置、介质及设备
CN114863002A (zh) * 2022-05-25 2022-08-05 Oppo广东移动通信有限公司 虚拟形象生成方法及装置、终端设备、计算机可读介质
CN115222875A (zh) * 2022-06-01 2022-10-21 支付宝(杭州)信息技术有限公司 模型的确定方法、局部场景重建方法、介质、设备及产品
CN115222862A (zh) * 2022-06-29 2022-10-21 支付宝(杭州)信息技术有限公司 虚拟人衣物生成方法、装置、设备、介质及程序产品
CN114821675A (zh) * 2022-06-29 2022-07-29 阿里巴巴达摩院(杭州)科技有限公司 对象的处理方法、系统和处理器
CN114842121A (zh) * 2022-06-30 2022-08-02 北京百度网讯科技有限公司 贴图生成模型训练和贴图生成方法、装置、设备及介质
CN115359219A (zh) * 2022-08-16 2022-11-18 支付宝(杭州)信息技术有限公司 虚拟世界的虚拟形象处理方法及装置
CN115359220A (zh) * 2022-08-16 2022-11-18 支付宝(杭州)信息技术有限公司 虚拟世界的虚拟形象更新方法及装置
CN115358777A (zh) * 2022-08-16 2022-11-18 支付宝(杭州)信息技术有限公司 虚拟世界的广告投放处理方法及装置
CN115346028A (zh) * 2022-08-17 2022-11-15 支付宝(杭州)信息技术有限公司 虚拟环境主题处理方法及装置
CN115393514A (zh) * 2022-08-26 2022-11-25 北京百度网讯科技有限公司 三维重建模型的训练方法、三维重建方法、装置、设备
CN115147558A (zh) * 2022-08-31 2022-10-04 北京百度网讯科技有限公司 三维重建模型的训练方法、三维重建方法及装置
CN115357938A (zh) * 2022-09-20 2022-11-18 支付宝(杭州)信息技术有限公司 虚拟形象处理方法及装置
CN115374298A (zh) * 2022-09-20 2022-11-22 支付宝(杭州)信息技术有限公司 基于索引的虚拟形象数据处理方法及装置
CN115374141A (zh) * 2022-09-20 2022-11-22 支付宝(杭州)信息技术有限公司 虚拟形象的更新处理方法及装置
CN115345980A (zh) * 2022-10-18 2022-11-15 北京百度网讯科技有限公司 个性化纹理贴图的生成方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117876610A (zh) * 2024-03-12 2024-04-12 之江实验室 针对三维构建模型的模型训练方法、装置、存储介质

Also Published As

Publication number Publication date
CN115809696B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
JP7373554B2 (ja) クロスドメイン画像変換
Tretschk et al. Demea: Deep mesh autoencoders for non-rigidly deforming objects
WO2018009473A1 (en) Motion capture and character synthesis
CN115359219B (zh) 虚拟世界的虚拟形象处理方法及装置
WO2017142766A1 (en) Determining depth from structured light using trained classifiers
CN117372631B (zh) 一种多视角图像生成模型的训练方法、应用方法
CN117078790B (zh) 图像生成方法、装置、计算机设备和存储介质
CN114742956B (zh) 模型处理方法、装置、设备及计算机可读存储介质
CN115809696A (zh) 虚拟形象模型训练方法及装置
CN113762461A (zh) 使用可逆增强算子采用有限数据训练神经网络
CN115357938A (zh) 虚拟形象处理方法及装置
Chen et al. Circle: Convolutional implicit reconstruction and completion for large-scale indoor scene
CN113593001A (zh) 目标对象三维重建方法、装置、计算机设备和存储介质
US20230298243A1 (en) 3d digital avatar generation from a single or few portrait images
CN115775024B (zh) 虚拟形象模型训练方法及装置
CN116959109A (zh) 人体姿态图像的生成方法、装置、设备和存储介质
US20220398283A1 (en) Method for fast and better tree search for reinforcement learning
GB2512302A (en) Animation of a virtual object
Bhardwaj et al. SingleSketch2Mesh: generating 3D mesh model from sketch
CN115358777A (zh) 虚拟世界的广告投放处理方法及装置
CN115482557A (zh) 人体图像生成方法、系统、设备及存储介质
CN115359220A (zh) 虚拟世界的虚拟形象更新方法及装置
CN116228850A (zh) 物体姿态估计方法、装置、电子设备及可读存储介质
CN117593619B (zh) 图像处理方法、装置、电子设备及存储介质
CN114612510B (zh) 图像处理方法、装置、设备、存储介质及计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant