CN115775024B - 虚拟形象模型训练方法及装置 - Google Patents
虚拟形象模型训练方法及装置 Download PDFInfo
- Publication number
- CN115775024B CN115775024B CN202211580264.XA CN202211580264A CN115775024B CN 115775024 B CN115775024 B CN 115775024B CN 202211580264 A CN202211580264 A CN 202211580264A CN 115775024 B CN115775024 B CN 115775024B
- Authority
- CN
- China
- Prior art keywords
- image
- model
- avatar
- loss
- reconstruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 268
- 238000000034 method Methods 0.000 title claims abstract description 159
- 238000012545 processing Methods 0.000 claims abstract description 147
- 230000004927 fusion Effects 0.000 claims description 177
- 230000008569 process Effects 0.000 claims description 92
- 238000011156 evaluation Methods 0.000 claims description 80
- 238000003860 storage Methods 0.000 claims description 27
- 238000001514 detection method Methods 0.000 claims description 26
- 230000008451 emotion Effects 0.000 claims description 18
- 238000003672 processing method Methods 0.000 claims description 16
- 238000005520 cutting process Methods 0.000 claims description 10
- 230000004393 visual impairment Effects 0.000 claims description 5
- 238000013210 evaluation model Methods 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 31
- 230000006870 function Effects 0.000 description 27
- 238000004364 calculation method Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 10
- 230000006872 improvement Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000003542 behavioural effect Effects 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008909 emotion recognition Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
本说明书实施例提供了虚拟形象模型训练方法及装置,其中,一种虚拟形象模型训练方法包括:根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型;基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得;对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
Description
技术领域
本文件涉及虚拟化技术领域,尤其涉及一种虚拟形象模型训练方法及装置。
背景技术
随着虚拟化技术的不断发展,虚拟世界逐渐成为各领域的热门话题。虚拟世界是对物理世界的模拟,在虚拟世界场景中,用户可通过特定的身份标识登录虚拟世界,在虚拟世界中从事与物理世界类似的各种行为活动,甚至在虚拟世界中从事在物理世界中无法进行的行为活动,在虚拟世界场景中,用户通常利用各自的用户角色进行活动。
发明内容
本说明书一个或多个实施例提供了一种虚拟形象模型训练方法,包括:根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型。基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得。对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
本说明书一个或多个实施例提供了一种虚拟形象处理方法,包括:获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求。响应于所述申请请求,采集所述设备用户在物理世界的图像数据。将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象。其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得。
本说明书一个或多个实施例提供了一种虚拟形象模型训练装置,包括:模型训练模块,被配置为根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型。反向传播模块,被配置为基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得。模型裁剪模块,被配置为对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
本说明书一个或多个实施例提供了一种虚拟形象处理装置,包括:请求获取模块,被配置为获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求。图像数据采集模块,被配置为响应于所述申请请求,采集所述设备用户在物理世界的图像数据。图像重建模块,被配置为将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象。其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得。
本说明书一个或多个实施例提供了一种虚拟形象模型训练设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型。基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得。对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
本说明书一个或多个实施例提供了一种虚拟形象处理设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求。响应于所述申请请求,采集所述设备用户在物理世界的图像数据。将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象。其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得。
本说明书一个或多个实施例提供了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型。基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得。对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
本说明书一个或多个实施例提供了另一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求。响应于所述申请请求,采集所述设备用户在物理世界的图像数据。将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象。其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图;
图1为本说明书一个或多个实施例提供的一种虚拟形象模型训练方法处理流程图;
图2为本说明书一个或多个实施例提供的一种应用于虚拟世界场景的虚拟形象模型训练方法处理流程图;
图3为本说明书一个或多个实施例提供的一种虚拟形象处理方法处理流程图;
图4为本说明书一个或多个实施例提供的一种应用于虚拟世界场景的虚拟形象处理方法处理流程图;
图5为本说明书一个或多个实施例提供的一种虚拟形象模型训练装置示意图;
图6为本说明书一个或多个实施例提供的一种虚拟形象处理装置示意图;
图7为本说明书一个或多个实施例提供的一种虚拟形象模型训练设备的结构示意图;
图8为本说明书一个或多个实施例提供的一种虚拟形象处理设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
本说明书提供的一种虚拟形象模型训练方法实施例:
本实施例提供的虚拟形象模型训练方法,根据基于第一样本图像训练获得的第一模型生成第二样本图像,并对基于第二样本图像进行模型训练获得的第二模型进行模型裁剪处理获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。具体的,根据第一样本图像对第一待训练模型进行模型训练获得第一模型,基于基准虚拟形象和将初始图像输入第一模型得到的虚拟形象,在第一模型构建第二样本图像,通过第二样本图像进行模型训练获得第二模型,来实现对第一模型的轻量化从而得到第二模型,降低模型计算量,在此基础上,进一步对基于第二样本图像进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成,以此,通过对第二模型进行模型裁剪,得到轻量化的第二模型,降低模型计算量,提升模型处理效率,进而通过虚拟世界的接入设备部署轻量化的虚拟形象模型,提升虚拟形象生成的效率,并且能够实现在离线场景下进行虚拟形象生成。
参照图1,本实施例提供的虚拟形象模型训练方法,具体包括步骤S102至步骤S106。
步骤S102,根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型。
本实施例中,虚拟世界是指基于去中心化协作实现并且具有开放经济系统的虚拟的拟真世界。具体的,物理世界(真实世界)中的用户可通过接入设备接入虚拟世界,以在虚拟世界中进行行为活动,比如用户通过接入设备进行游戏交互的游戏虚拟世界,再比如用户通过接入设备进行在线会议的会议虚拟世界;所述虚拟世界的接入设备,可以是连接虚拟世界的VR(Virtual Reality,虚拟现实)设备、AR(Augmented Reality,增强现实)设备等,比如连接虚拟世界的头戴式VR设备。所述物理世界,是指与虚拟世界对应的世界,即真实存在的世界,可选的,所述物理世界包括真实世界。
虚拟形象是指从用户的图像出发,采用图像重建技术对用户的图像进行重建获得的用于在虚拟世界内展示用户形象的三维数字图像(三维数字形象),或者,从用户的图像出发,采用图像重建技术对用户的图像进行重建获得的虚拟世界内的与用户具有数字孪生关系或者身份映射的数字孪生形象。比如,在采集到用户在物理世界(真实世界)的用户图像的基础上,通过将用户图像输入图神经网络GNN(Graph Neural Network)进行图像重建,获得虚拟世界内的三维数字形象、数字孪生形象或者身份映射形象。
所述第一样本图像,是指通过虚拟世界的接入设备集成或者配置的图像传感器采集获得的图像,可选的,所述第一样本图像,通过虚拟世界的接入设备集成或者配置的图像传感器进行采集,所述第一样本图像包括采用图像传感器采集的彩色图像,比如采用可见光传感器采集的RGB(Red Green Blue)图像。所述第一模型,是指用于构建虚拟形象模型的第一模型,可选的,所述第一模型包括教师模型。
具体实施时,为了实现在虚拟世界的接入设备部署虚拟形象模型以生成虚拟形象,可先训练获得第一模型,将该第一模型作为训练第二模型的指导模型,进一步从第二模型获得虚拟形象模型,提升虚拟形象模型的训练效率和有效性,在训练获得第一模型的过程中,本实施例提供的一种可选实施方式中,在根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型的过程中,执行如下操作:
对多个预测形象进行形象融合获得融合预测形象,并将所述第一样本图像输入所述第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象;
基于所述融合预测形象、所述目标预测形象和所述第一样本图像对所述第一重建网络进行参数更新。
其中,多个预测形象在对第一样本图像进行多次图像重建后获得,所述多个预测形象的形象数目基于所述图像重建的重建次数确定,即多个预测形象的形象数目与图像重建的重建次数对应。
具体的,在对多个预测形象进行形象融合的过程中,为了提升训练效率,还可在模型训练过程中针对第一待训练模型引入融合网络,通过引入的融合网络对多个预测形象进行形象融合,所述对多个预测形象进行形象融合获得融合预测形象的过程,可通过将多个预测形象输入融合网络进行形象融合获得融合预测形象的方式实现,或者,也可通过按照多个预测形象的形象像素进行像素融合获得融合预测形象的方式实现。
可选的,所述多个预测形象在将所述第一样本图像输入所述第一待训练模型中的多个图像网络进行图像重建后获得;所述多个预测形象的形象数目基于所述多个图像网络的网络数目确定,即多个预测形象的形象数目与多个图像网络的网络数目对应;其中,多个图像网络的网络数目可预先设置,也可根据实际训练场景确定,本实施例在此不作具体限定。
需要补充的是,所述多个图像网络中任意两个图像网络的网络结构可相同,也可不同,为了提升第一模型生成的虚拟形象的多样性,可选的,多个图像网络中任意两个图像网络的网络结构不同,比如1个图像网络的网络结构为U-net(卷积神经网络),另1个图像网络的网络结构为3D-GNN(3D图神经网络),通过不同的网络结构提升多个预测形象的多样化,提升融合预测形象的多样化,进一步提升第一模型生成的虚拟形象的多样性。
在具体的执行过程中,为了提升第一模型的模型精度,通过构建的损失函数计算的训练损失更新第一重建网络的网络参数,直至损失函数收敛得到第一模型,具体的,在上述基于融合预测形象、目标预测形象和第一样本图像对第一重建网络进行参数更新的过程中,可基于融合预测形象、目标预测形象和第一样本图像构建训练损失,基于训练损失对第一重建网络进行参数更新。
本实施例提供的一种可选实施方式中,在基于融合预测形象、目标预测形象和第一样本图像对第一重建网络进行参数更新的过程中,执行如下操作:
基于所述目标预测形象和所述第一样本图像对应的真实形象计算第一形象损失,基于所述融合预测形象和所述目标预测形象计算第二形象损失,以及基于所述融合预测形象和所述真实形象确定融合损失;
根据所述第一形象损失、所述第二形象损失和所述融合损失进行所述参数更新。
可选的,所述第一样本图像对应的真实形象,通过虚拟世界的接入设备集成或者配置的深度传感器进行采集,所述真实形象包括真实三维形象。
具体的,可计算目标预测形象和真实形象的第一形象差值,并计算融合预测形象和目标预测形象的第二形象差值,并基于融合预测形象和真实形象确定融合损失,根据第一形象差值、第二形象差值和融合损失构建训练损失,基于训练损失对第一重建网络进行参数更新。
在基于融合预测形象和真实形象确定融合损失的过程中,本实施例提供的一种可选实施方式中,采用如下方式确定融合损失:
对所述融合预测形象进行形象部位划分,获得多个形象部位;
按照所述多个形象部位中各形象部位的部位权重,计算所述融合预测形象的融合权重;
基于所述融合预测形象和所述真实形象计算融合形象损失,并将所述融合权重和所述融合形象损失之和作为所述融合损失。
可选的,所述各形象部位的部位权重基于各形象部位的部位概率确定,所述各形象部位的部位权重与各形象部位的部位概率正相关。例如,对融合预测形象进行形象部位划分,获得的多个形象部位包括手、臂膀、腿,手的部位概率为m,臂膀的部位概率为n,腿的部位概率为o,手、臂膀和腿的部位概率之间的大小关系为m>n>o,由于手的部位概率m最大,所以手的部位权重最大,臂膀的部位权重处于中间,腿的部位权重最小。
具体的,按照多个形象部位中各形象部位的部位权重,计算融合预测形象的融合权重的过程,可通过计算多个形象部位中各形象部位的部位权重之和作为融合预测形象的融合权重的方式实现,也可通过确定多个形象部位中各形象部位的部位权重的分配系数,按照形象部位计算部位权重与分配系数的乘积,并将各形象部位对应的乘积的加和作为融合权重的方式实现,还可通过计算多个形象部位中各形象部位的部位权重的加和的平均值作为融合权重的方式实现;
基于融合预测形象和真实形象计算融合形象损失的过程,可通过计算融合预测形象和真实形象的形象差值作为融合形象损失的方式实现;
基于融合权重和融合形象损失计算融合损失的过程,可通过计算融合权重和融合形象损失的加和作为融合损失或者计算融合权重和融合形象损失的加和的平均值作为融合损失的方式实现。
参见上述基于第一样本图像对第一待训练模型进行模型训练的训练方式,重复上述训练过程对第一待训练模型中的第一重建网络进行训练,并可借助多个图像网络和/或融合网络对第一重建网络进行调参,直至损失函数收敛,在损失函数收敛后即完成训练,并将训练完成的第一重建网络作为第一模型。
例如,在从第一待训练模型中的第一重建网络出发训练获得第一模型的过程中,构建的损失函数为:
Loss1=Lossreconstruction+Losscis+Lossmerge)+LossKD
其中,Loss1为第一待训练模型的训练损失,第一待训练模型的训练损失根据第一形象损失、融合损失和第二形象损失计算获得,Lossreconstruction为第一形象损失,Losscis为融合权重,Lossmerge为融合形象损失,(Losscis+Lossmerge)为融合损失,融合损失基于融合权重和融合形象损失计算获得,LossKD为第二形象损失。
需要说明的是,由于实际中从物理世界采集的图像数据和真实形象涉及用户隐私,所以为了保障用户隐私安全,在获取到用户的授权指令后,可采集第一样本图像和对应的真实形象,并且,在第一样本图像和对应的真实形象涉及用户隐私的基础上,无法大规模进行采集,采集的第一样本图像和对应的真实形象的数量级别也会较小,第一样本图像和第一样本图像对应的真实形象的数量级别可小于第二样本图像的数量级别。
除上述提供的对第一重建网络进行训练获得第一模型的实现方式之外,还可采用下述提供的三种训练方式中的任意一种进行训练获得第一模型:
将多个预测形象输入融合网络进行预测形象融合获得融合预测形象,并将所述第一样本图像输入所述第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象;
基于所述融合预测形象和所述目标预测形象对所述第一重建网络和融合网络进行参数更新;
将参数更新后的网络参数满足收敛条件的第一重建网络作为第一模型;在此基础上,此处提供的训练方式可与本实施例提供的其他处理步骤组成新的实现方式;
或者,
将第一样本图像输入待训练模型中的多个图像网络进行图像重建获得多个预测形象,并将多个预测形象输入融合网络进行预测形象融合获得融合预测形象;
将所述第一样本图像输入所述第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象,并基于融合预测形象和目标预测形象对第一重建网络进行参数更新;在此基础上,此处提供的训练方式可与本实施例提供的其他处理步骤组成新的实现方式;
或者,
将第一样本图像输入待训练模型中的多个图像网络进行图像重建获得多个预测形象,并将多个预测形象输入融合网络进行预测形象融合获得融合预测形象;
将所述第一样本图像输入所述第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象,并基于融合预测形象和目标预测形象对第一重建网络和融合网络进行参数更新;
将参数更新后的网络参数满足收敛条件的第一重建网络作为第一模型;在此基础上,此处提供的训练方式可与本实施例提供的其他处理步骤组成新的实现方式。
步骤S104,基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像。
上述基于第一样本图像对第一待训练模型进行模型训练获得第一模型,本步骤中,通过第一模型生成第二待训练模型的训练数据,具体的,以在第一模型对初始图像进行图像重建获得的虚拟形象和基准虚拟形象为依据,在第一模型进行反向传播处理,从而获得第二样本图像。
本实施例所述基准虚拟形象,是指用于与虚拟形象进行对比的对比基准或者对比依据,可选的,所述基准虚拟形象包括:将第一样本图像输入第一模型进行图像重建获得的虚拟形象,或者,在虚拟世界中采集的虚拟形象,或者,对在虚拟世界中采集的虚拟形象进行形象预处理后获得的虚拟形象;其中,所述形象预处理包括随机裁剪、随机旋转和/或叠加噪声。
上述与基准虚拟形象共同在第一模型进行反向传播处理的虚拟形象,可在对初始图像进行图像重建后获得,为了提升图像重建效率,可选的,所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得。所述初始图像包括随机生成的图像或者对随机生成的图像进行噪声叠加获得的图像。所述图像重建包括三维图像重建,所述图像重建包括从初始图像中提取图像特征,基于图像特征进行三维图像重建。
需要说明的是,本实施例中,基于第一模型生成训练第二待训练模型的第二样本图像,为了增强对第二待训练模型进行模型训练获得的第二模型的模型性能,第二样本图像的数量可尽可能高,可选的,第二样本图像的数量级别高于第一样本图像的数量级别。
具体实施时,为了提升第二样本图像的有效性,以进一步通过第二样本图像对第二待训练模型进行模型训练获得第二模型,提升第二模型的模型精度,可在基于基准虚拟形象和虚拟形象在第一模型进行反向传播处理的过程中,根据基于基准虚拟形象和虚拟形象计算的形象差异数据对初始图像进行参数调整,即所述第二样本图像,在根据形象差异数据对初始图像进行图像参数调整后获得;所述形象差异数据基于基准虚拟形象和虚拟形象计算获得。本实施例提供的一种可选实施方式中,在基于基准虚拟形象和虚拟形象在第一模型进行反向传播处理,获得第二样本图像的过程中,执行如下操作:
基于所述基准虚拟形象和所述虚拟形象计算形象差异数据;
根据所述形象差异数据对所述初始图像进行图像参数调整,获得所述第二样本图像。
其中,所述形象差异数据是指基准虚拟形象和虚拟形象之间的形象差异值,可选的,所述形象差异数据包括基准虚拟形象和虚拟形象的形象差距,此处的形象差距可用欧式距离表示。
具体的,基于基准虚拟形象和虚拟形象计算形象差异数据,可通过将基准虚拟形象和虚拟形象输入差异计算模型进行形象差异计算,获得形象差异数据的方式实现;通过基于形象差异数据对初始图像进行图像参数调整,来获得基准虚拟形象对应的第二样本图像,即在第一模型对基准虚拟形象进行反向传播处理获得的第二样本图像,从而提升第二样本图像的有效性。
需要补充的是,步骤S104可被替换为在所述第一模型对基准虚拟形象进行反向传播处理,获得第二样本图像,并与本实施例提供的其他处理步骤组成新的实现方式。具体此处进行反向传播处理的实现过程,与基于基准虚拟形象和虚拟形象在第一模型进行反向传播处理获得第二样本图像的实现过程类似,本实施例在此不再赘述。
步骤S106,对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
上述在第一模型对基准虚拟形象进行反向传播处理获得第二样本图像,本步骤中,对基于第二样本图像进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成,具体的,第二模型在基于第二样本图像对第二待训练模型进行模型训练后获得。
实际应用中,虚拟形象模型在生成虚拟形象的过程中,可能存在针对不同的用户,生成同样的虚拟形象,在此情况下,无法针对不同的用户灵活化地生成对应的虚拟形象,生成的虚拟形象不具有针对性,导致用户的体验感较差,针对于此,为了实现虚拟形象模型生成的虚拟形象的多样性和灵活性,可在基于第二样本图像对第二待训练模型进行模型训练获得第二模型的过程中,针对每一轮模型训练所需的样本图像进行形象特征检测,以此来评价每一轮模型训练所需的样本图像的图像损失,防止每一轮模型训练的样本图像的模式塌陷,进而提升基于样本图像进行模型训练获得的第二模型的灵活性,从而提升虚拟形象模型的灵活性。
本实施例提供的一种可选实施方式中,所述第二待训练模型的训练损失包括图像损失;
可选的,所述图像损失基于所述第二样本图像确定,具体所述图像损失根据所述第二样本图像在至少一个形象特征维度的形象特征数据和所述第二样本图像确定或者根据第二样本图像在至少一个形象特征维度的形象特征数据的数据方差和第二样本图像的图像方差确定,所述图像损失,采用如下方式计算获得:
计算所述第二样本图像在至少一个形象特征维度的形象特征数据的数据方差,以及计算所述第二样本图像的图像方差;
基于所述数据方差和所述图像方差计算所述图像损失。
其中,所述形象特征维度包括下述至少一项:姿态特征维度、情绪类别维度、关键部位位置维度、形象完整度维度;所述形象特征数据,包括下述至少一项:第二样本图像中目标形象的姿态特征数据、目标形象的情绪类别、目标形象的关键部位位置数据、目标形象的形象完整度。例如,姿态特征数据为目标形象是正向或者反向的数据,情绪类别为目标形象的情绪类别是正面情绪或者负面情绪,关键部位位置数据为目标形象的左手位置数据,形象完整度为目标形象的完整度或者残缺率。关键部位位置可以是关键特征点,形象完整度是指目标形象的完整程度。
在此基础上,本实施例提供的一种可选实施方式中,所述形象特征数据,通过如下方式获得:将所述第二样本图像输入所述第二待训练模型中的特征检测网络进行形象特征检测,获得所述形象特征数据;可选的,所述形象特征检测,包括下述至少一项:
对所述第二样本图像中的目标形象进行姿态特征检测,对所述目标形象进行情绪类别检测,检测所述目标形象的关键部位位置,检测所述目标形象的形象完整度。
其中,情绪类别包括正面情绪或者负面情绪,检测目标形象的关键部位位置的过程,可通过检测目标形象的关键部位点或者检测目标形象的关键特征点的方式实现。
此外,所述形象特征数据也可通过如下方式获得:对第二样本图像进行形象特征检测获得形象特征数据,或者,对第二样本图像中的目标形象进行形象特征检测获得形象特征数据。
除上述提供的第二待训练模型的训练损失包括图像损失之外,第二待训练模型的训练损失还可包括形象对比损失,可选的,形象对比损失包括形象损失和/或对比损失,以此来评价第二待训练模型的拟合能力,本实施例提供的一种可选实施方式中,所述第二待训练模型的训练损失还包括形象对比损失;
可选的,所述形象对比损失,采用如下方式计算获得:基于所述基准虚拟形象和第一预测形象对所述第二样本图像进行图像参数更新,并将更新获得的第三样本图像输入所述第二待训练模型中的第二重建网络进行图像重建,获得第二预测形象;
根据所述第二预测形象、第三预测形象和所述基准虚拟形象计算所述形象对比损失;
可选的,所述第一预测形象在将所述第二样本图像输入所述第一模型后获得;所述第三预测形象在将所述第三样本图像输入所述第一模型后获得。
具体的,在基于第二样本图像对第二待训练模型中的第二重建网络进行一轮模型训练(包括对第二重建网络进行参数更新)之后,若对第二重建网络进行参数调整后的网络参数不满足收敛条件,即参数更新后的网络参数不满足收敛条件,基于基准虚拟形象和第一预测形象对第二样本图像进行图像参数更新,将参数更新获得的第三样本图像输入第二重建网络进行图像重建获得第二预测形象,并以第二预测形象、第三预测形象和基准虚拟形象为依据计算形象对比损失。
在上述根据第二预测形象、第三预测形象和基准虚拟形象计算形象对比损失的过程中,本实施例提供的一种可选实施方式中,采用如下方式计算形象对比损失:
计算所述第二预测形象和所述基准虚拟形象的形象损失,并计算所述第二预测形象和所述第三预测形象的对比损失;
基于所述形象损失和所述对比损失计算所述形象对比损失。
其中,所述形象损失包括第二预测形象和基准虚拟形象的形象差异数据,所述对比损失包括第二预测形象和第三预测形象的形象差异数据。
具体的,基于形象损失和对比损失计算形象对比损失的过程,可通过将形象损失和对比损失之和作为形象对比损失,或者,将形象损失与第一分配权重的乘积和对比损失与第二分配权重的乘积之和作为形象对比损失的方式实现。
上述详细说明了第二待训练模型的训练损失的组成部分,第二待训练模型的训练损失包括图像损失和/或形象对比损失,训练损失可以是图像损失、形象对比损失二者中的任意一者,也可以是图像损失与形象对比损失之和或者差值,还可以是图像损失与第一分配权重的乘积和形象对比损失与第二分配权重的乘积之和或者差值,下述对基于第二样本图像对第二待训练模型进行模型训练的过程提供的两种实现方式进行详细说明。
(1)实现方式一
在基于第二样本图像对第二待训练模型进行模型训练的过程中,若前一轮模型训练后的模型参数不满足收敛条件,对前一轮的样本图像进行图像参数更新,并基于参数更新后的样本图像进行下一轮的模型训练,为了防止模型训练获得的第二模型的模式塌陷,可对每一轮的样本图像在至少一个形象特征维度进行形象特征检测,并计算相应的损失值,具体可采用如下方式对第二待训练模型进行模型训练:
基于所述基准虚拟形象和第一预测形象对所述第二样本图像进行图像参数更新,并将更新获得的第三样本图像输入所述第二待训练模型中的第二重建网络进行图像重建,获得第二预测形象;
基于第二预测形象、第三预测形象、基准虚拟形象和第三样本图像对第二重建网络进行参数更新;
或者,
基于所述基准虚拟形象和第一预测形象对所述第二样本图像进行图像参数更新,并对更新获得的第三样本图像进行形象特征检测,获得至少一个形象特征维度的形象特征数据;
将所述第三样本图像输入所述第二待训练模型中的第二重建网络进行图像重建,获得第二预测形象;
基于所述第二预测形象、第三预测形象、基准虚拟形象和第三样本图像对第二重建网络进行参数更新。
可选的,所述第一预测形象在将所述第二样本图像输入所述第一模型后获得;所述第三预测形象在将所述第三样本图像输入所述第一模型后获得。
在基于第二预测形象、第三预测形象、基准虚拟形象和第三样本图像对第二重建网络进行参数更新的过程中,根据第三样本图像的图像方差与第三样本图像在至少一个形象特征维度的形象特征数据的数据方差计算图像损失,并根据第二预测形象、第三预测形象和基准虚拟形象计算形象对比损失,基于图像损失和形象对比损失构建的训练损失对第二重建网络进行参数更新,在根据第二预测形象、第三预测形象和基准虚拟形象计算形象对比损失的过程中,计算第二预测形象和基准虚拟形象的形象损失,并计算第二虚拟形象和第三虚拟形象的对比损失,基于形象损失和对比损失计算形象对比损失,具体计算形象对比损失的实现过程,与上述第二待训练模型的训练损失包括的形象比对损失的计算过程类似,本实施例在此不再赘述。
参见上述基于第二样本图像对第二待训练模型进行模型训练的训练方式,重复上述训练过程对第二待训练模型中的第二重建网络进行训练,并可借助特征检测网络对第二重建网络进行调参,直至损失函数收敛,在损失函数收敛后即完成训练,并将训练完成的第二重建网络作为第二模型。
例如,在从第二待训练模型中的第二重建网络出发训练获得第二模型的过程中,构建的损失函数为:
Loss2=Losspattern+Lossvariance)+(LossL2+LossKD)
其中,Loss2为第二待训练模型的训练损失,第二待训练模型的训练损失根据图像损失和形象对比损失计算获得,(Losspattern+Lossvariance)为图像损失,(LossL2+LossKD)为形象对比损失,图像损失根据第三样本图像在至少一个形象特征维度的形象特征数据的数据方差和第三样本图像的图像方差计算获得,Losspattern为第三样本图像在至少一个形象特征维度的形象特征数据的数据方差,Lossvariance为第三样本图像的图像方差,形象对比损失根据形象损失和对比损失计算获得,LossL2为形象损失,具体为第二预测形象和基准虚拟形象的形象损失,LossKd为对比损失,具体为第二虚拟形象和第三虚拟形象的对比损失。
(2)实现方式二
在基于第二样本图像对第二待训练模型进行模型训练的过程中,也可仅通过形象对比损失来评价模型的拟合能力,具体可采用如下方式对第二待训练模型进行模型训练:
基于所述基准虚拟形象和第一预测形象对所述第二样本图像进行图像参数更新,并将更新获得的第三样本图像输入所述第二待训练模型中的第二重建网络进行图像重建,获得第二预测形象;
根据所述第二预测形象、第三预测形象和所述基准虚拟形象进行第二重建网络的参数更新;
可选的,所述第一预测形象在将所述第二样本图像输入所述第一模型后获得;所述第三预测形象在将所述第三样本图像输入所述第一模型后获得。
上述根据第二预测形象、第三预测形象和基准虚拟形象进行第二重建网络的参数更新的过程,可通过根据第二预测形象、第三预测形象和基准虚拟形象计算训练损失,并通过训练损失对第二重建网络进行参数更新的方式实现。
此外,除上述提供的两种对第二待训练模型进行模型训练的实现方式之外,也可基于基准虚拟形象和第一预测形象对第二样本图像进行图像参数更新,基于参数更新获得的第三样本图像在至少一个形象特征维度的形象特征数据和第三样本图像计算图像损失,并通过图像损失对第二待训练模型中的第二重建网络进行参数更新。
在基于上述对第二待训练模型进行模型训练的训练方式获得第二模型的基础上,为了进一步对第二模型进行模型简化,提升第二模型的模型适应力,提升基于第二模型生成虚拟形象的便捷性和效率,可进一步对第二模型进行模型裁剪处理,本实施例提供的一种可选实施方式中,在对基于第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理的过程中,执行如下操作:
对所述第二模型的模型参数进行参数更新处理;
确定参数更新后的模型参数中的目标模型参数,并对所述目标模型参数进行参数裁剪。
例如,目标模型参数为参数是0的参数,确定参数更新后的模型参数中为0的模型参数,将参数为0的模型参数进行裁剪或者剪切或者剪枝。
在对第二模型的模型参数进行参数更新处理的过程中,为了提升参数更新的精确度,并确保训练获得的虚拟形象模型生成的虚拟形象的局部质量一致性,可基于第二中间模型输出的重建结果的部位评估分对局部质量的一致性进行把控,本实施例提供的一种可选实施方式中,通过如下方式对第二模型的模型参数进行参数更新处理:
将第二中间模型对所述第二样本图像的第一重建结果输入形象评估模型进行形象评估,输出所述第一重建结果中多个形象部位的部位评估分;
根据所述第二中间模型的特定模型参数、所述部位评估分、所述第一重建结果和第二重建结果对所述第二中间模型进行参数更新;
可选的,所述第二中间模型在对所述第二模型的目标模型参数进行参数裁剪后获得;所述第二重建结果在将所述第二样本图像输入所述第二模型进行图像重建后获得。
其中,所述部位评估分包括第一重建结果中目标形象的多个形象部位的质量评分,比如左手的质量评分为x分;所述特定模型参数包括第二中间模型的模型参数中的特定模型参数,比如第二中间模型的模型参数中的非0参数;所述第一重建结果包括将第二样本图像输入第二中间模型进行图像重建后获得的预测形象,所述第二重建结果包括将第二样本图像输入第二模型进行图像重建后获得的预测形象。
在此基础上,本实施例提供的一种可选实施方式中,在根据第二中间模型的特定模型参数、部位评估分、第一重建结果和第二重建结果对第二中间模型进行参数更新的过程中,执行如下操作:
确定所述特定模型参数的参数数目,计算目标评估分中每两个评估分的差值,以及计算所述第一重建结果和所述第二重建结果的重建损失;所述目标评估分从所述部位评估分中随机选择获得;
基于所述参数数目、所述差值和所述重建损失进行所述参数更新。
其中,基于参数数目、每两个评估分的差值和重建损失进行参数更新,包括将参数数目、每两个评估分的差值的平均值和重建损失三者之和作为训练损失,基于训练损失对第二中间模型进行参数更新。
例如,模型参数中的特定模型参数为非0参数,确定非0参数的参数数目为b,所有的部位评估分为c、d、e、f、g,从部位评估分中随机选择目标评估分为c、d、e,c、d、e的大小关系为c>d>e,计算目标评估分中每两个评估分的差值的平均值[(c-d)+(c-e)+(d-e)]/3,计算第一重建结果和第二重建结果的重建损失h,训练损失为b+[(c-d)+(c-e)+(d-e)]/3+h,基于该训练损失对第二中间模型进行参数更新。
参见上述对第二模型进行模型裁剪处理的方式,重复上述模型裁剪处理过程对第二模型进行模型裁剪处理,直至进行模型参数更新后的模型参数满足收敛条件,即将该模型参数对应的模型作为虚拟形象模型。
例如,在对第二模型进行模型裁剪处理的过程中,即相当于对第二模型进行进一步模型训练,构建的损失函数为:
Loss3=Losssparse+Lossquality+Lossreconstruction
其中,Loss3为训练损失,此处的训练损失根据特定模型参数的参数数目、目标评估分中每两个评估分的差值和重建损失计算获得,Losssparse为特定模型参数的参数数目,Lossquality为目标评估分中每两个评估分的差值的平均值,Lossreconstruction为重建损失,目标评估分从第二样本图像的第一重建结果中多个形象部位的部位评估分中随机抽选获得,重建损失根据第一重建结果和第二样本图像在第二模型的第二重建结果计算获得。
此外,上述对第二模型的模型参数进行参数更新处理的实现过程,可被替换为对第二样本图像在第二模型的图像重建结果进行形象评估,获得图像重建结果中多个形象部位的部位评估分;根据从部位评估分中随机选择的目标评估分和第二模型的特定模型参数的参数数目,对第二模型进行参数更新,并与本实施例提供的其他处理步骤组成新的实现方式;
或者,也可被替换为对第二样本图像在第二模型的图像重建结果进行形象评估,获得图像重建结果中多个形象部位的部位评估分;根据部位评估分对第二模型进行参数更新,即根据从部位评估分中随机选择的目标评估分对第二模型进行参数更新,并与本实施例提供的其他处理步骤组成新的实现方式。
需要说明的是,此处根据部位评估分对第二模型进行参数更新,即是根据从部位评估分中随机选择的目标评估分中每两个评估分的差值对第二模型进行参数更新。
实际应用中,在对第二模型进行模型裁剪处理获得虚拟形象模型的基础上,可将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成,本实施例提供的一种可选实施方式中,所述虚拟形象生成,包括:根据所述接入设备的设备用户针对虚拟形象的申请请求,采集所述设备用户在所述物理世界的图像数据;将所述图像数据输入所述虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象。
需要说明的是,步骤S106可被替换为对基于第二样本图像进行模型训练获得的第二模型进行模型裁剪处理获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成,并与本实施例提供的其他处理步骤组成新的实现方式。
综上所述,本实施例提供的虚拟形象模型训练方法,可应用于服务器,首先,根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型;
其次,基于基准虚拟形象和将初始图像输入第一模型得到的虚拟形象,在第一模型构建第二样本图像,在此过程中,通过基准虚拟形象和虚拟形象的形象差异数据,对初始图像进行图像参数调整,获得第二样本图像,以此获得基准虚拟形象通过反向传播获得的第二样本图像;
再通过在第一模型构建的第二样本图像进行模型训练获得第二模型,来实现对第一模型的简化从而得到第二模型,降低模型计算量;
在此基础上,进一步对基于第二样本图像进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成;以此,通过对第二模型进行模型裁剪,实现对第二模型进行模型简化,降低模型计算量,提升模型处理效率,进而实现在接入设备进行模型部署,提升虚拟形象生成的效率,并且实现在离线场景下的虚拟形象生成。
下述以本实施例提供的一种虚拟形象模型训练方法在虚拟世界场景的应用为例,对本实施例提供的虚拟形象模型训练方法进行进一步说明,参见图2,应用于虚拟世界场景的虚拟形象模型训练方法,具体包括如下步骤。
步骤S202,根据从物理世界采集的第一样本彩色图像对第一待训练模型进行模型训练,获得第一模型。
步骤S204,将初始彩色图像输入第一模型进行图像重建获得虚拟形象。
步骤S206,基于基准虚拟形象和虚拟形象计算形象差异数据,并根据形象差异数据对初始彩色图像进行图像参数调整,获得第二样本彩色图像。
步骤S208,基于第二样本彩色图像对第二待训练模型进行模型训练,获得第二模型。
步骤S210,对第二模型的目标模型参数进行参数裁剪,获得第二中间模型。
步骤S212,将第二中间模型对第二样本彩色图像的第一重建结果输入形象评估模型进行形象评估,输出第一重建结果中多个形象部位的部位评估分。
步骤S214,根据第二中间模型的特定模型参数、部位评估分、第一重建结果和第二重建结果对第二中间模型进行参数更新。
步骤S216,确定参数更新后的模型参数中的目标模型参数,并对目标模型参数进行参数裁剪。
步骤S218,若参数裁剪后的第二中间模型满足收敛条件,将该第二中间模型作为虚拟形象模型。
本说明书提供的一种虚拟形象处理方法实施例如下:
本实施例提供的虚拟形象处理方法,可应用于虚拟世界的接入设备,根据虚拟世界的接入设备的设备用户针对虚拟世界的虚拟形象的申请请求,采集设备用户在物理世界的图像数据,并将图像数据输入虚拟形象模型进行图像重建处理,获得设备用户在虚拟世界的虚拟形象,以此根据设备用户的多样化需求,向对应的设备用户生成虚拟形象,提升生成的虚拟形象的灵活性。
参照图3,本实施例提供的虚拟形象处理方法,具体包括步骤S302至步骤S306。
步骤S302,获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求。
本实施例中,虚拟世界是指基于去中心化协作实现并且具有开放经济系统的虚拟的拟真世界。具体的,物理世界(真实世界)中的用户可通过接入设备接入虚拟世界,以在虚拟世界中进行行为活动,比如用户通过接入设备进行游戏交互的游戏虚拟世界,再比如用户通过接入设备进行在线会议的会议虚拟世界;所述虚拟世界的接入设备,可以是连接虚拟世界的VR(Virtual Reality,虚拟现实)设备、AR(Augmented Reality,增强现实)设备等,比如连接虚拟世界的头戴式VR设备。所述物理世界,是指与虚拟世界对应的世界,即真实存在的世界,可选的,所述物理世界包括真实世界。
虚拟形象是指从用户的图像出发,采用图像重建技术对用户的图像进行重建获得的用于在虚拟世界内展示用户形象的三维数字图像(三维数字形象),或者,从用户的图像出发,采用图像重建技术对用户的图像进行重建获得的虚拟世界内的与用户具有数字孪生关系或者身份映射的数字孪生形象。比如,在采集到用户在物理世界(真实世界)的用户图像的基础上,通过将用户图像输入图神经网络GNN(Graph Neural Network)进行图像重建,获得虚拟世界内的三维数字形象、数字孪生形象或者身份映射形象。
具体实施时,获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求,申请请求是指设备用户对设备用户在虚拟世界的虚拟形象的申请请求。
步骤S304,响应于所述申请请求,采集所述设备用户在物理世界的图像数据。
上述获取虚拟世界的接入设备的设备用户针对虚拟世界的虚拟形象的申请请求,本步骤中,采集设备用户在物理世界的图像数据。
可选的,所述图像数据,通过虚拟世界的接入设备集成或者配置的图像传感器进行采集,所述图像数据包括彩色图像数据,比如通过虚拟世界的接入设备集成或者配置的可见光传感器采集的彩色图像数据,彩色图像数据可以是RGB图像数据。
步骤S306,将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象。
上述采集设备用户在物理世界的图像数据,本步骤中,将图像数据输入虚拟形象模型进行图像重建处理,获得设备用户在虚拟世界的虚拟形象。
具体实施时,所述图像重建处理,包括:从所述图像数据中提取图像特征,并基于图像特征进行三维图像重建,获得设备用户在虚拟世界的虚拟形象。
实际应用中,为了提升生成虚拟形象的效率,可提前训练获得虚拟形象模型,将虚拟形象模型部署于虚拟世界的接入设备,一方面,可提升虚拟形象生成的效率,无需将采集的图像数据发送至服务器在服务器进行虚拟形象生成,以此提升虚拟形象的生成效率,另一方面将虚拟形象模型部署于虚拟世界的接入设备之后,在离线场景下也可利用接入设备部署的虚拟形象模型生成用户的虚拟形象,提升用户体验,此处的离线场景是指网络处于离线状态。
在具体的执行过程中,所述虚拟形象模型可通过如下方式训练获得:根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型;基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得;对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
所述第一样本图像,是指通过虚拟世界的接入设备集成或者配置的图像传感器采集获得的图像,可选的,所述第一样本图像,通过虚拟世界的接入设备集成或者配置的图像传感器进行采集,所述第一样本图像包括采用图像传感器采集的彩色图像,比如采用可见光传感器采集的RGB图像。所述第一模型,是指用于构建虚拟形象模型的第一模型,可选的,所述第一模型包括教师模型。
具体实施时,为了实现在虚拟世界的接入设备部署虚拟形象模型以生成虚拟形象,可在服务器先训练获得第一模型,将该第一模型作为训练第二模型的指导模型,进一步从第二模型获得虚拟形象模型,提升虚拟形象模型的训练效率和有效性,在训练获得第一模型的过程中,服务器在根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型的过程中,可执行如下操作:
对多个预测形象进行形象融合获得融合预测形象,并将所述第一样本图像输入第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象;
基于融合预测形象、目标预测形象和第一样本图像对第一重建网络进行参数更新。
其中,多个预测形象在对第一样本图像进行多次图像重建后获得,所述多个预测形象的形象数目基于所述图像重建的重建次数确定,即多个预测形象的形象数目与图像重建的重建次数对应。
具体的,服务器在对多个预测形象进行形象融合的过程中,为了提升训练效率,还可在模型训练过程中针对第一待训练模型引入融合网络,通过引入的融合网络对多个预测形象进行形象融合,所述对多个预测形象进行形象融合获得融合预测形象的过程,可通过将多个预测形象输入融合网络进行形象融合获得融合预测形象的方式实现,或者,也可通过按照多个预测形象的形象像素进行像素融合获得融合预测形象的方式实现。
可选的,所述多个预测形象在将所述第一样本图像输入所述第一待训练模型中的多个图像网络进行图像重建后获得;所述多个预测形象的形象数目基于所述多个图像网络的网络数目确定,即多个预测形象的形象数目与多个图像网络的网络数目对应;其中,多个图像网络的网络数目可预先设置,也可根据实际训练场景确定,本实施例在此不作具体限定。
需要补充的是,所述多个图像网络中任意两个图像网络的网络结构可相同,也可不同,为了提升第一模型生成的虚拟形象的多样性,可选的,多个图像网络中任意两个图像网络的网络结构不同,比如1个图像网络的网络结构为U-net(卷积神经网络),另1个图像网络的网络结构为3D-GNN(3D图神经网络),通过不同的网络结构提升多个预测形象的多样化,提升融合预测形象的多样化,进一步提升第一模型生成的虚拟形象的多样性。
在具体的执行过程中,为了提升第一模型的模型精度,通过构建的损失函数计算的训练损失更新第一重建网络的网络参数,直至损失函数收敛得到第一模型,具体的,在上述基于融合预测形象和目标预测形象对第一重建网络进行参数更新的过程中,可基于融合预测形象和目标预测形象构建训练损失,基于训练损失对第一重建网络进行参数更新。
服务器在基于融合预测形象、目标预测形象和第一样本图像对第一重建网络进行参数更新的过程中,可执行如下操作:
基于目标预测形象和第一样本图像对应的真实形象计算第一形象损失,基于融合预测形象和目标预测形象计算第二形象损失,以及基于融合预测形象和真实形象确定融合损失;
根据第一形象损失、第二形象损失和融合损失进行参数更新。
可选的,所述第一样本图像对应的真实形象,通过虚拟世界的接入设备集成或者配置的深度传感器进行采集,所述真实形象包括真实三维形象。
具体的,服务器可计算目标预测形象和真实形象的第一形象差值,并计算融合预测形象和目标预测形象的第二形象差值,并基于融合预测形象和真实形象确定融合损失,根据第一形象差值、第二形象差值和融合损失构建训练损失,基于训练损失对第一重建网络进行参数更新。
在基于融合预测形象和真实形象确定融合损失的过程中,可采用如下方式确定融合损失:对所述融合预测形象进行形象部位划分,获得多个形象部位;
按照所述多个形象部位中各形象部位的部位权重,计算所述融合预测形象的融合权重;
基于所述融合预测形象和所述真实形象计算融合形象损失,并将所述融合权重和所述融合形象损失之和作为所述融合损失。
可选的,所述各形象部位的部位权重基于各形象部位的部位概率确定,所述各形象部位的部位权重与各形象部位的部位概率正相关。例如,对融合预测形象进行形象部位划分,获得的多个形象部位包括手、臂膀、腿,手的部位概率为m,臂膀的部位概率为n,腿的部位概率为o,手、臂膀和腿的部位概率之间的大小关系为m>n>o,由于手的部位概率m最大,所以手的部位权重最大,臂膀的部位权重处于中间,腿的部位权重最小。
具体的,服务器按照多个形象部位中各形象部位的部位权重,计算融合预测形象的融合权重的过程,可通过计算多个形象部位中各形象部位的部位权重之和作为融合预测形象的融合权重的方式实现,也可通过确定多个形象部位中各形象部位的部位权重的分配系数,按照形象部位计算部位权重与分配系数的乘积,并将各形象部位对应的乘积的加和作为融合权重的方式实现,还可通过计算多个形象部位中各形象部位的部位权重的加和的平均值作为融合权重的方式实现;
基于融合预测形象和真实形象计算融合形象损失的过程,可通过计算融合预测形象和真实形象的形象差值作为融合形象损失的方式实现;
基于融合权重和融合形象损失计算融合损失的过程,可通过计算融合权重和融合形象损失的加和作为融合损失或者计算融合权重和融合形象损失的加和的平均值作为融合损失的方式实现。
参见上述基于第一样本图像对第一待训练模型进行模型训练的训练方式,重复上述训练过程对第一待训练模型中的第一重建网络进行训练,并可借助多个图像网络和/或融合网络对第一重建网络进行调参,直至损失函数收敛,在损失函数收敛后即完成训练,并将训练完成的第一重建网络作为第一模型。
例如,在从第一待训练模型中的第一重建网络出发训练获得第一模型的过程中,构建的损失函数为:
Loss1=Lossreconstruction+Losscis+Lossmerge)+LossKD
其中,Loss1为第一待训练模型的训练损失,第一待训练模型的训练损失根据第一形象损失、融合损失和第二形象损失计算获得,Lossreconstruction为第一形象损失,Losscis为融合权重,Lossmerge为融合形象损失,(Losscis+Lossmerge)为融合损失,融合损失基于融合权重和融合形象损失计算获得,LossKD为第二形象损失。
需要说明的是,由于实际中物理世界的用户图像和真实形象涉及用户隐私,所以为了保障用户隐私安全,在获取到用户的授权指令后,服务器可采集第一样本图像和对应的真实形象,并且,在第一样本图像和对应的真实形象涉及用户隐私的基础上,无法大规模进行采集,采集的第一样本图像和对应的真实形象的数量级别也会较小,第一样本图像和第一样本图像对应的真实形象的数量级别可小于第二样本图像的数量级别。
除上述提供的对第一重建网络进行训练获得第一模型的实现方式之外,还可采用下述提供的三种训练方式中的任意一种进行训练获得第一模型:
将多个预测形象输入融合网络进行预测形象融合获得融合预测形象,并将所述第一样本图像输入所述第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象;
基于所述融合预测形象和所述目标预测形象对所述第一重建网络和融合网络进行参数更新;
将参数更新后的网络参数满足收敛条件的第一重建网络作为第一模型;在此基础上,此处提供的训练方式可与本实施例提供的其他处理步骤组成新的实现方式;
或者,
将第一样本图像输入待训练模型中的多个图像网络进行图像重建获得多个预测形象,并将多个预测形象输入融合网络进行预测形象融合获得融合预测形象;
将所述第一样本图像输入所述第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象,并基于融合预测形象和目标预测形象对第一重建网络进行参数更新;在此基础上,此处提供的训练方式可与本实施例提供的其他处理步骤组成新的实现方式;
或者,
将第一样本图像输入待训练模型中的多个图像网络进行图像重建获得多个预测形象,并将多个预测形象输入融合网络进行预测形象融合获得融合预测形象;
将所述第一样本图像输入所述第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象,并基于融合预测形象和目标预测形象对第一重建网络和融合网络进行参数更新;
将参数更新后的网络参数满足收敛条件的第一重建网络作为第一模型;在此基础上,此处提供的训练方式可与本实施例提供的其他处理步骤组成新的实现方式。
上述服务器基于第一样本图像对第一待训练模型进行模型训练获得第一模型,在此之后,服务器通过第一模型生成第二待训练模型的训练数据,具体的,以在第一模型对初始图像进行图像重建获得的虚拟形象和基准虚拟形象为依据,在第一模型进行反向传播处理,从而获得第二样本图像。
本实施例所述基准虚拟形象,是指用于与虚拟形象进行对比的对比基准或者对比依据,可选的,所述基准虚拟形象包括:将第一样本图像输入第一模型进行图像重建获得的虚拟形象,或者,在虚拟世界中采集的虚拟形象,或者,对在虚拟世界中采集的虚拟形象进行形象预处理后获得的虚拟形象;其中,所述形象预处理包括随机裁剪、随机旋转和/或叠加噪声。
上述与基准虚拟形象共同在第一模型进行反向传播处理的虚拟形象,可在对初始图像进行图像重建后获得,为了提升图像重建效率,可选的,所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得。所述初始图像包括随机生成的图像或者对随机生成的图像进行噪声叠加获得的图像。所述图像重建包括三维图像重建,所述图像重建包括从初始图像中提取图像特征,基于图像特征进行三维图像重建。
需要说明的是,本实施例中,服务器基于第一模型生成训练第二待训练模型的第二样本图像,为了增强对第二待训练模型进行模型训练获得的第二模型的模型性能,第二样本图像的数量可尽可能高,可选的,第二样本图像的数量级别高于第一样本图像的数量级别。
具体实施时,为了提升第二样本图像的有效性,以进一步通过第二样本图像对第二待训练模型进行模型训练获得第二模型,提升第二模型的模型精度,可在基于基准虚拟形象和虚拟形象在第一模型进行反向传播处理的过程中,根据基于基准虚拟形象和虚拟形象计算的形象差异数据对初始图像进行参数调整,即所述第二样本图像,在根据形象差异数据对初始图像进行图像参数调整后获得;所述形象差异数据基于基准虚拟形象和虚拟形象计算获得。服务器在基于基准虚拟形象和虚拟形象在第一模型进行反向传播处理,获得第二样本图像的过程中,可执行如下操作:
基于所述基准虚拟形象和所述虚拟形象计算形象差异数据;
根据所述形象差异数据对所述初始图像进行图像参数调整,获得所述第二样本图像。
其中,所述形象差异数据是指基准虚拟形象和虚拟形象之间的形象差异值,可选的,所述形象差异数据包括基准虚拟形象和虚拟形象的形象差距,此处的形象差距可用欧式距离表示。
具体的,服务器基于基准虚拟形象和虚拟形象计算形象差异数据,可通过将基准虚拟形象和虚拟形象输入差异计算模型进行形象差异计算,获得形象差异数据的方式实现;通过基于形象差异数据对初始图像进行图像参数调整,来获得基准虚拟形象对应的第二样本图像,即在第一模型对基准虚拟形象进行反向传播处理获得的第二样本图像,从而提升第二样本图像的有效性。
需要补充的是,上述服务器基于基准虚拟形象和虚拟形象在第一模型进行反向传播处理,获得第二样本图像可被替换为在所述第一模型对基准虚拟形象进行反向传播处理,获得第二样本图像,并与本实施例提供的其他处理步骤组成新的实现方式。具体此处进行反向传播处理的实现过程,与基于基准虚拟形象和虚拟形象在第一模型进行反向传播处理获得第二样本图像的实现过程类似,本实施例在此不再赘述。
上述服务器在第一模型对基准虚拟形象进行反向传播处理获得第二样本图像,在此之后,服务器对基于第二样本图像进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成,具体的,第二模型在基于第二样本图像对第二待训练模型进行模型训练后获得。
实际应用中,虚拟形象模型在生成虚拟形象的过程中,可能存在针对不同的用户,生成同样的虚拟形象,在此情况下,无法针对不同的用户灵活化地生成对应的虚拟形象,生成的虚拟形象不具有针对性,导致用户的体验感较差,针对于此,为了实现虚拟形象模型生成的虚拟形象的多样性和灵活性,可在基于第二样本图像对第二待训练模型进行模型训练获得第二模型的过程中,针对每一轮模型训练所需的样本图像进行形象特征检测,以此来评价每一轮模型训练所需的样本图像的图像损失,防止每一轮模型训练的样本图像的模式塌陷,进而提升基于样本图像进行模型训练获得的第二模型的灵活性,从而提升虚拟形象模型的灵活性。
本实施例提供的一种可选实施方式中,所述第二模型在对第二待训练模型进行模型训练后获得;所述第二待训练模型的训练损失包括图像损失;
可选的,所述图像损失,采用如下方式计算获得:
计算所述第二样本图像在至少一个形象特征维度的形象特征数据的数据方差,以及计算所述第二样本图像的图像方差;
基于所述数据方差和所述图像方差计算所述图像损失。
其中,所述形象特征维度包括下述至少一项:姿态特征维度、情绪类别维度、关键部位位置维度、形象完整度维度;所述形象特征数据,包括下述至少一项:第二样本图像中目标形象的姿态特征数据、目标形象的情绪类别、目标形象的关键部位位置数据、目标形象的形象完整度。例如,姿态特征数据为目标形象是正向或者反向的数据,情绪类别为目标形象的情绪类别是正面情绪或者负面情绪,关键部位位置数据为目标形象的左手位置数据,形象完整度为目标形象的完整度或者残缺率。关键部位位置可以是关键特征点,形象完整度是指目标形象的完整程度。
本实施例提供的一种可选实施方式中,上述提到的所述形象特征数据,通过如下方式获得:将所述第二样本图像输入所述第二待训练模型中的特征检测网络进行形象特征检测,获得所述形象特征数据;可选的,所述形象特征检测,包括下述至少一项:
对所述第二样本图像中的目标形象进行姿态特征检测,对所述目标形象进行情绪类别检测,检测所述目标形象的关键部位位置,检测所述目标形象的形象完整度。
其中,情绪识别包括目标形象的情绪为正向或者负向,检测目标形象的关键部位位置的过程,可通过检测目标形象的关键部位点或者检测目标形象的关键特征点的方式实现。
此外,所述形象特征数据也可通过如下方式获得:对第二样本图像进行形象特征检测获得形象特征数据,或者,对第二样本图像中的目标形象进行形象特征检测获得形象特征数据。
除上述提供的第二待训练模型的训练损失包括图像损失之外,第二待训练模型的训练损失还可包括形象对比损失,可选的,形象对比损失包括形象损失和/或对比损失,以此来评价第二待训练模型的拟合能力,具体的,所述第二待训练模型的训练损失还包括形象对比损失;
可选的,所述形象对比损失,采用如下方式计算获得:基于所述基准虚拟形象和第一预测形象对所述第二样本图像进行图像参数更新,并将更新获得的第三样本图像输入所述第二待训练模型中的第二重建网络进行图像重建,获得第二预测形象;
根据所述第二预测形象、第三预测形象和所述基准虚拟形象计算所述形象对比损失;
可选的,所述第一预测形象在将所述第二样本图像输入所述第一模型后获得;所述第三预测形象在将所述第三样本图像输入所述第一模型后获得。
具体的,在基于第二样本图像对第二待训练模型中的第二重建网络进行一轮模型训练(包括对第二重建网络进行参数更新)之后,若对第二重建网络进行参数调整后的网络参数不满足收敛条件,即参数更新后的网络参数不满足收敛条件,服务器可基于基准虚拟形象和第一预测形象对第二样本图像进行图像参数更新,将参数更新获得的第三样本图像输入第二重建网络进行图像重建获得第二预测形象,并以第二预测形象、第三预测形象和基准虚拟形象为依据计算形象对比损失。
在上述根据第二预测形象、第三预测形象和基准虚拟形象计算形象对比损失的过程中,可选的,采用如下方式计算形象对比损失:
计算所述第二预测形象和所述基准虚拟形象的形象损失,并计算所述第二预测形象和所述第三预测形象的对比损失;
基于所述形象损失和所述对比损失计算所述形象对比损失。
其中,所述形象损失包括第二预测形象和基准虚拟形象的形象差异数据,所述对比损失包括第二预测形象和第三预测形象的形象差异数据。
具体的,基于形象损失和对比损失计算形象对比损失的过程,可通过将形象损失和对比损失之和作为形象对比损失,或者,将形象损失与第一分配权重的乘积和对比损失与第二分配权重的乘积之和作为形象对比损失的方式实现。
上述详细说明了第二待训练模型的训练损失的组成部分,第二待训练模型的训练损失包括图像损失和/或形象对比损失,训练损失可以是图像损失、形象对比损失二者中的任意一者,也可以是图像损失与形象对比损失之和或者差值,还可以是图像损失与第一分配权重的乘积和形象对比损失与第二分配权重的乘积之和或者差值,下述对基于第二样本图像对第二待训练模型进行模型训练的过程提供的两种实现方式进行详细说明。
(1)实现方式一
在服务器基于第二样本图像对第二待训练模型进行模型训练的过程中,若前一轮模型训练后的模型参数不满足收敛条件,对前一轮的样本图像进行图像参数更新,并基于参数更新后的样本图像进行下一轮的模型训练,为了防止模型训练获得的第二模型的模式塌陷,可对每一轮的样本图像在至少一个形象特征维度进行形象特征检测,并计算相应的损失值,具体可采用如下方式对第二待训练模型进行模型训练:
基于所述基准虚拟形象和第一预测形象对所述第二样本图像进行图像参数更新,并将更新获得的第三样本图像输入所述第二待训练模型中的第二重建网络进行图像重建,获得第二预测形象;
基于第二预测形象、第三预测形象、基准虚拟形象和第三样本图像对第二重建网络进行参数更新;
或者,
基于所述基准虚拟形象和第一预测形象对所述第二样本图像进行图像参数更新,并对更新获得的第三样本图像进行形象特征检测,获得至少一个形象特征维度的形象特征数据;
将所述第三样本图像输入所述第二待训练模型中的第二重建网络进行图像重建,获得第二预测形象;
基于所述第二预测形象、第三预测形象、基准虚拟形象和第三样本图像对第二重建网络进行参数更新。
可选的,所述第一预测形象在将所述第二样本图像输入所述第一模型后获得;所述第三预测形象在将所述第三样本图像输入所述第一模型后获得。
在服务器基于第二预测形象、第三预测形象、基准虚拟形象和第三样本图像对第二重建网络进行参数更新的过程中,根据第三样本图像的图像方差与第三样本图像在至少一个形象特征维度的形象特征数据的数据方差计算图像损失,并根据第二预测形象、第三预测形象和基准虚拟形象计算形象对比损失,基于图像损失和形象对比损失构建的训练损失对第二重建网络进行参数更新,在根据第二预测形象、第三预测形象和基准虚拟形象计算形象对比损失的过程中,计算第二预测形象和基准虚拟形象的形象损失,并计算第二虚拟形象和第三虚拟形象的对比损失,基于形象损失和对比损失计算形象对比损失,具体计算形象对比损失的实现过程,与上述第二待训练模型的训练损失包括的形象比对损失的计算过程类似,本实施例在此不再赘述。
参见上述基于第二样本图像对第二待训练模型进行模型训练的训练方式,重复上述训练过程对第二待训练模型中的第二重建网络进行训练,并可借助特征检测网络对第二重建网络进行调参,直至损失函数收敛,在损失函数收敛后即完成训练,并将训练完成的第二重建网络作为第二模型。
例如,在服务器从第二待训练模型中的第二重建网络出发训练获得第二模型的过程中,构建的损失函数为:
Loss2=Losspattern+Lossvariance)+(LossL2+LossKD)
其中,Loss2为第二待训练模型的训练损失,第二待训练模型的训练损失根据图像损失和形象对比损失计算获得,(Losspattern+Lossvariance)为图像损失,(LossL2+LossKD)为形象对比损失,图像损失根据第三样本图像在至少一个形象特征维度的形象特征数据的数据方差和第三样本图像的图像方差计算获得,Losspattern为第三样本图像在至少一个形象特征维度的形象特征数据的数据方差,Lossvariance为第三样本图像的图像方差,形象对比损失根据形象损失和对比损失计算获得,LossL2为形象损失,具体为第二预测形象和基准虚拟形象的形象损失,LossKD为对比损失,具体为第二虚拟形象和第三虚拟形象的对比损失。
(2)实现方式二
在服务器基于第二样本图像对第二待训练模型进行模型训练的过程中,也可仅通过形象对比损失来评价模型的拟合能力,具体可采用如下方式对第二待训练模型进行模型训练:
基于所述基准虚拟形象和第一预测形象对所述第二样本图像进行图像参数更新,并将更新获得的第三样本图像输入所述第二待训练模型中的第二重建网络进行图像重建,获得第二预测形象;
根据所述第二预测形象、第三预测形象和所述基准虚拟形象进行第二重建网络的参数更新;
可选的,所述第一预测形象在将所述第二样本图像输入所述第一模型后获得;所述第三预测形象在将所述第三样本图像输入所述第一模型后获得。
上述根据第二预测形象、第三预测形象和基准虚拟形象进行第二重建网络的参数更新的过程,可通过根据第二预测形象、第三预测形象和基准虚拟形象计算训练损失,并通过训练损失对第二重建网络进行参数更新。
此外,除上述提供的两种对第二待训练模型进行模型训练的实现方式之外,服务器也可基于基准虚拟形象和第一预测形象对第二样本图像进行图像参数更新,基于参数更新获得的第三样本图像在至少一个形象特征维度的形象特征数据和第三样本图像计算图像损失,并通过图像损失对第二待训练模型中的第二重建网络进行参数更新。
在基于上述对第二待训练模型进行模型训练的训练方式获得第二模型的基础上,为了进一步对第二模型进行模型简化,提升第二模型的模型适应力,提升基于第二模型生成虚拟形象的便捷性和效率,服务器可进一步对第二模型进行模型裁剪处理,具体在对基于第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理的过程中,服务器可执行如下操作:
对所述第二模型的模型参数进行参数更新处理;
确定参数更新后的模型参数中的目标模型参数,并对所述目标模型参数进行参数裁剪。
例如目标模型参数为参数是0的参数,确定参数更新后的模型参数中为0的模型参数,将参数为0的模型参数进行裁剪或者剪切或者剪枝。
在对第二模型的模型参数进行参数更新处理的过程中,为了提升参数更新的精确度,并确保训练获得的虚拟形象模型生成的虚拟形象的局部质量一致性,可基于第二中间模型输出的重建结果的部位评估分对局部质量的一致性进行把控,具体服务器可通过如下方式对第二模型的模型参数进行参数更新处理:
将第二中间模型对所述第二样本图像的第一重建结果输入形象评估模型进行形象评估,输出所述第一重建结果中多个形象部位的部位评估分;
根据所述第二中间模型的特定模型参数、所述部位评估分、所述第一重建结果和第二重建结果对所述第二中间模型进行参数更新;
可选的,所述第二中间模型在对所述第二模型的目标模型参数进行参数裁剪后获得;所述第二重建结果在将所述第二样本图像输入所述第二模型进行图像重建后获得。
其中,所述部位评估分包括第一重建结果中目标形象的多个形象部位的质量评分,比如左手的质量评分为x分;所述特定模型参数包括第二中间模型的模型参数中的特定模型参数,比如第二中间模型的模型参数中的非0参数;所述第一重建结果包括将第二样本图像输入第二中间模型进行图像重建后获得的预测形象,所述第二重建结果包括将第二样本图像输入第二模型进行图像重建后获得的预测形象。
在根据第二中间模型的特定模型参数、部位评估分、第一重建结果和第二重建结果对第二中间模型进行参数更新的过程中,服务器可执行如下操作:
确定所述特定模型参数的参数数目,计算目标评估分中每两个评估分的差值,以及计算所述第一重建结果和所述第二重建结果的重建损失;所述目标评估分从所述部位评估分中随机选择获得;
基于所述参数数目、所述差值和所述重建损失进行所述参数更新。
其中,基于参数数目、每两个评估分的差值和重建损失进行参数更新,包括将参数数目、每两个评估分的差值的平均值和重建损失三者之和作为训练损失,基于训练损失对第二中间模型进行参数更新。
例如,模型参数中的特定模型参数为非0参数,确定非0参数的参数数目为b,所有的部位评估分为c、d、e、f、g,从部位评估分中随机选择目标评估分为c、d、e,c、d、e的大小关系为c>d>e,计算目标评估分中每两个评估分的差值的平均值[(c-d)+(c-e)+(d-e)]/3,计算第一重建结果和第二重建结果的重建损失h,训练损失为b+[(c-d)+(c-e)+(d-e)]/3+h,基于该训练损失对第二中间模型进行参数更新。
参见上述对第二模型进行模型裁剪处理的方式,服务器重复上述模型裁剪处理过程对第二模型进行模型裁剪处理,直至进行模型参数更新后的模型参数满足收敛条件,即将该模型参数对应的模型作为虚拟形象模型。
例如,在对第二模型进行模型裁剪处理的过程中,即相当于对第二模型进行进一步模型训练,构建的损失函数为:
Loss3=Losssparse+Lossquality+Lossreconstruction
其中,Loss3为训练损失,此处的训练损失根据特定模型参数的参数数目、目标评估分中每两个评估分的差值和重建损失计算获得,Losssparse为特定模型参数的参数数目,Lossquality为目标评估分中每两个评估分的差值的平均值,Lossreconstruction为重建损失,目标评估分从第二样本图像的第一重建结果中多个形象部位的部位评估分中随机抽选获得,重建损失根据第一重建结果和第二样本图像在第二模型的第二重建结果计算获得。
此外,上述对第二模型的模型参数进行参数更新处理的实现过程,可被替换为对第二样本图像在第二模型的图像重建结果进行形象评估,获得图像重建结果中多个形象部位的部位评估分;根据从部位评估分中随机选择的目标评估分和第二模型的特定模型参数的参数数目,对第二模型进行参数更新,并与本实施例提供的其他处理步骤组成新的实现方式;
或者,也可被替换为对第二样本图像在第二模型的图像重建结果进行形象评估,获得图像重建结果中多个形象部位的部位评估分;根据部位评估分对第二模型进行参数更新,即根据从部位评估分中随机选择的目标评估分对第二模型进行参数更新,并与本实施例提供的其他处理步骤组成新的实现方式。
需要说明的是,此处根据部位评估分对第二模型进行参数更新,即是根据从部位评估分中随机选择的目标评估分中每两个评估分的差值对第二模型进行参数更新。
需要说明的是,上述服务器对基于第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成可被替换为对基于第二样本图像进行模型训练获得的第二模型进行模型裁剪处理获得虚拟形象模型,以将虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
下述以本实施例提供的一种虚拟形象处理方法在虚拟世界场景的应用为例,对本实施例提供的虚拟形象处理方法进行进一步说明,参见图4,应用于虚拟世界场景的虚拟形象处理方法,具体包括如下步骤。
步骤S402,获取虚拟世界的接入设备的设备用户针对虚拟世界的三维虚拟形象的申请请求。
步骤S404,采集设备用户在物理世界的彩色图像数据。
步骤S406,将彩色图像数据输入通过接入设备部署的虚拟形象模型进行图像重建处理,获得设备用户在虚拟世界的三维虚拟形象。
本说明书提供的一种虚拟形象模型训练装置实施例如下:
在上述的实施例中,提供了一种虚拟形象模型训练方法,与之相对应的,还提供了一种虚拟形象模型训练装置,下面结合附图进行说明。
参照图5,其示出了本实施例提供的一种虚拟形象模型训练装置示意图。
由于装置实施例对应于方法实施例,所以描述得比较简单,相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例提供一种虚拟形象模型训练装置,包括:
模型训练模块502,被配置为根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型;
反向传播模块504,被配置为基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得;
模型裁剪模块506,被配置为对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
本说明书提供的一种虚拟形象处理装置实施例如下:
在上述的实施例中,提供了一种虚拟形象处理方法,与之相对应的,还提供了一种虚拟形象处理装置,下面结合附图进行说明。
参照图6,其示出了本实施例提供的一种虚拟形象处理装置示意图。
由于装置实施例对应于方法实施例,所以描述得比较简单,相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例提供一种虚拟形象处理装置,包括:
请求获取模块602,被配置为获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求;
图像数据采集模块604,被配置为响应于所述申请请求,采集所述设备用户在物理世界的图像数据;
图像重建模块606,被配置为将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得。
本说明书提供的一种虚拟形象模型训练设备实施例如下:
对应上述描述的一种虚拟形象模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种虚拟形象模型训练设备,该虚拟形象模型训练设备用于执行上述提供的虚拟形象模型训练方法,图7为本说明书一个或多个实施例提供的一种虚拟形象模型训练设备的结构示意图。
本实施例提供的一种虚拟形象模型训练设备,包括:
如图7所示,虚拟形象模型训练设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器701和存储器702,存储器702中可以存储有一个或一个以上存储应用程序或数据。其中,存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括虚拟形象模型训练设备中的一系列计算机可执行指令。更进一步地,处理器701可以设置为与存储器702通信,在虚拟形象模型训练设备上执行存储器702中的一系列计算机可执行指令。虚拟形象模型训练设备还可以包括一个或一个以上电源703,一个或一个以上有线或无线网络接口704,一个或一个以上输入/输出接口705,一个或一个以上键盘706等。
在一个具体的实施例中,虚拟形象模型训练设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对虚拟形象模型训练设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型;
基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得;
对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
本说明书提供的一种虚拟形象处理设备实施例如下:
对应上述描述的一种虚拟形象处理方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种虚拟形象处理设备,该虚拟形象处理设备用于执行上述提供的虚拟形象处理方法,图8为本说明书一个或多个实施例提供的一种虚拟形象处理设备的结构示意图。
本实施例提供的一种虚拟形象处理设备,包括:
如图8所示,虚拟形象处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括虚拟形象处理设备中的一系列计算机可执行指令。更进一步地,处理器801可以设置为与存储器802通信,在虚拟形象处理设备上执行存储器802中的一系列计算机可执行指令。虚拟形象处理设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入/输出接口805,一个或一个以上键盘806等。
在一个具体的实施例中,虚拟形象处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对虚拟形象处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求;
响应于所述申请请求,采集所述设备用户在物理世界的图像数据;
将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得。
本说明书提供的一种存储介质实施例如下:
对应上述描述的一种虚拟形象模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种存储介质。
本实施例提供的存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
根据从物理世界采集的第一样本图像对第一待训练模型进行模型训练,获得第一模型;
基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得;
对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
需要说明的是,本说明书中关于一种存储介质的实施例与本说明书中关于一种虚拟形象模型训练方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应方法的实施,重复之处不再赘述。
本说明书提供的另一种存储介质实施例如下:
对应上述描述的一种虚拟形象处理方法,基于相同的技术构思,本说明书一个或多个实施例还提供另一种存储介质。
本实施例提供的存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求;
响应于所述申请请求,采集所述设备用户在物理世界的图像数据;
将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得。
需要说明的是,本说明书中关于另一种存储介质的实施例与本说明书中关于一种虚拟形象处理方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应方法的实施,重复之处不再赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪30年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本文件的实施例而已,并不用于限制本文件。对于本领域技术人员来说,本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本文件的权利要求范围之内。
Claims (22)
1.一种虚拟形象模型训练方法,包括:
对多个预测形象进行形象融合获得融合预测形象,并将从物理世界采集的第一样本图像输入第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象;
基于所述融合预测形象、所述目标预测形象和所述第一样本图像对所述第一重建网络进行参数更新,以对第一待训练模型进行模型训练,获得第一模型;
基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得;
对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
2.根据权利要求1所述的虚拟形象模型训练方法,所述第二待训练模型的训练损失包括图像损失;
其中,所述图像损失,采用如下方式计算获得:
计算所述第二样本图像在至少一个形象特征维度的形象特征数据的数据方差,以及计算所述第二样本图像的图像方差;
基于所述数据方差和所述图像方差计算所述图像损失。
3.根据权利要求2所述的虚拟形象模型训练方法,所述形象特征数据,通过如下方式获得:
将所述第二样本图像输入所述第二待训练模型中的特征检测网络进行形象特征检测,获得所述形象特征数据;
其中,所述形象特征检测,包括下述至少一项:
对所述第二样本图像中的目标形象进行姿态特征检测,对所述目标形象进行情绪类别检测,检测所述目标形象的关键部位位置,检测所述目标形象的形象完整度。
4.根据权利要求1所述的虚拟形象模型训练方法,所述基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像,包括:
基于所述基准虚拟形象和所述虚拟形象计算形象差异数据;
根据所述形象差异数据对所述初始图像进行图像参数调整,获得所述第二样本图像。
5.根据权利要求1所述的虚拟形象模型训练方法,所述对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,包括:
对所述第二模型的模型参数进行参数更新处理;
确定参数更新后的模型参数中的目标模型参数,并对所述目标模型参数进行参数裁剪。
6.根据权利要求5所述的虚拟形象模型训练方法,所述对所述第二模型的模型参数进行参数更新处理,包括:
将第二中间模型对所述第二样本图像的第一重建结果输入形象评估模型进行形象评估,输出所述第一重建结果中多个形象部位的部位评估分;
根据所述第二中间模型的特定模型参数、所述部位评估分、所述第一重建结果和第二重建结果对所述第二中间模型进行参数更新;
其中,所述第二中间模型在对所述第二模型的目标模型参数进行参数裁剪后获得;所述第二重建结果在将所述第二样本图像输入所述第二模型进行图像重建后获得。
7.根据权利要求6所述的虚拟形象模型训练方法,所述根据所述第二中间模型的特定模型参数、所述部位评估分、所述第一重建结果和第二重建结果对所述第二中间模型进行参数更新,包括:
确定所述特定模型参数的参数数目,计算目标评估分中每两个评估分的差值,以及计算所述第一重建结果和所述第二重建结果的重建损失;所述目标评估分从所述部位评估分中随机选择获得;
基于所述参数数目、所述差值和所述重建损失进行所述参数更新。
8.根据权利要求1所述的虚拟形象模型训练方法,所述多个预测形象在将所述第一样本图像输入所述第一待训练模型中的多个图像网络进行图像重建后获得;
其中,所述多个预测形象的形象数目基于所述多个图像网络的网络数目确定。
9.根据权利要求2所述的虚拟形象模型训练方法,所述第二待训练模型的训练损失还包括形象对比损失;
其中,所述形象对比损失,采用如下方式计算获得:
基于所述基准虚拟形象和第一预测形象对所述第二样本图像进行图像参数更新,并将更新获得的第三样本图像输入所述第二待训练模型中的第二重建网络进行图像重建,获得第二预测形象;
根据所述第二预测形象、第三预测形象和所述基准虚拟形象计算所述形象对比损失;
其中,所述第一预测形象在将所述第二样本图像输入所述第一模型后获得;所述第三预测形象在将所述第三样本图像输入所述第一模型后获得。
10.根据权利要求9所述的虚拟形象模型训练方法,所述根据所述第二预测形象、第三预测形象和所述基准虚拟形象计算所述形象对比损失,包括:
计算所述第二预测形象和所述基准虚拟形象的形象损失,并计算所述第二预测形象和所述第三预测形象的对比损失;
基于所述形象损失和所述对比损失计算所述形象对比损失。
11.根据权利要求1所述的虚拟形象模型训练方法,所述基于所述融合预测形象、所述目标预测形象和所述第一样本图像对所述第一重建网络进行参数更新,包括:
基于所述目标预测形象和所述第一样本图像对应的真实形象计算第一形象损失,基于所述融合预测形象和所述目标预测形象计算第二形象损失,以及基于所述融合预测形象和所述真实形象确定融合损失;
根据所述第一形象损失、所述第二形象损失和所述融合损失进行所述参数更新。
12.根据权利要求11所述的虚拟形象模型训练方法,所述基于所述融合预测形象和所述真实形象确定融合损失,包括:
对所述融合预测形象进行形象部位划分,获得多个形象部位;
按照所述多个形象部位中各形象部位的部位权重,计算所述融合预测形象的融合权重;
基于所述融合预测形象和所述真实形象计算融合形象损失,并基于所述融合权重和所述融合形象损失计算所述融合损失。
13.根据权利要求1所述的虚拟形象模型训练方法,所述虚拟形象生成,包括:
根据所述接入设备的设备用户针对虚拟形象的申请请求,采集所述设备用户在所述物理世界的图像数据;
将所述图像数据输入所述虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象。
14.一种虚拟形象处理方法,包括:
获取虚拟世界的接入设备的设备用户针对所述虚拟世界的虚拟形象的申请请求;
响应于所述申请请求,采集所述设备用户在物理世界的图像数据;
将所述图像数据输入通过所述虚拟世界的接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得,所述第一模型是对多个预测形象进行形象融合获得融合预测形象,并将所述第一样本图像输入第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象,并基于所述融合预测形象、所述目标预测形象和所述第一样本图像对所述第一重建网络进行参数更新以对第一待训练模型进行模型训练后获取的模型。
15.根据权利要求14所述的虚拟形象处理方法,所述第二模型在对第二待训练模型进行模型训练后获得;所述第二待训练模型的训练损失包括图像损失;
其中,所述图像损失,采用如下方式计算获得:
计算所述第二样本图像在至少一个形象特征维度的形象特征数据的数据方差,以及计算所述第二样本图像的图像方差;
基于所述数据方差和所述图像方差计算所述图像损失。
16.根据权利要求15所述的虚拟形象处理方法,所述形象特征数据,通过如下方式获得:
将所述第二样本图像输入所述第二待训练模型中的特征检测网络进行形象特征检测,获得所述形象特征数据;
其中,所述形象特征检测,包括下述至少一项:
对所述第二样本图像中的目标形象进行姿态特征检测,对所述目标形象进行情绪类别检测,检测所述目标形象的关键部位位置,检测所述目标形象的形象完整度。
17.一种虚拟形象模型训练装置,包括:
模型训练模块,被配置为对多个预测形象进行形象融合获得融合预测形象,并将从物理世界采集的第一样本图像输入第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象;基于所述融合预测形象、所述目标预测形象和所述第一样本图像对所述第一重建网络进行参数更新,以对第一待训练模型进行模型训练,获得第一模型;
反向传播模块,被配置为基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得;
模型裁剪模块,被配置为对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
18.一种虚拟形象处理装置,包括:
请求获取模块,被配置为获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求;
图像数据采集模块,被配置为响应于所述申请请求,采集所述设备用户在物理世界的图像数据;
图像重建模块,被配置为将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得,所述第一模型是对多个预测形象进行形象融合获得融合预测形象,并将所述第一样本图像输入第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象,并基于所述融合预测形象、所述目标预测形象和所述第一样本图像对所述第一重建网络进行参数更新以对第一待训练模型进行模型训练后获取的模型。
19.一种虚拟形象模型训练设备,包括:
处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
对多个预测形象进行形象融合获得融合预测形象,并将从物理世界采集的第一样本图像输入第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象;
基于所述融合预测形象、所述目标预测形象和所述第一样本图像对所述第一重建网络进行参数更新,以对第一待训练模型进行模型训练,获得第一模型;
基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得;
对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
20.一种虚拟形象处理设备,包括:
处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求;
响应于所述申请请求,采集所述设备用户在物理世界的图像数据;
将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得,所述第一模型是对多个预测形象进行形象融合获得融合预测形象,并将所述第一样本图像输入第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象,并基于所述融合预测形象、所述目标预测形象和所述第一样本图像对所述第一重建网络进行参数更新以对第一待训练模型进行模型训练后获取的模型。
21.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
对多个预测形象进行形象融合获得融合预测形象,并将从物理世界采集的第一样本图像输入第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象;
基于所述融合预测形象、所述目标预测形象和所述第一样本图像对所述第一重建网络进行参数更新,以对第一待训练模型进行模型训练,获得第一模型;
基于基准虚拟形象和虚拟形象在所述第一模型进行反向传播处理,获得第二样本图像;所述虚拟形象在将初始图像输入所述第一模型进行图像重建后获得;
对基于所述第二样本图像对第二待训练模型进行模型训练获得的第二模型进行模型裁剪处理,获得虚拟形象模型,以将所述虚拟形象模型部署于虚拟世界的接入设备进行虚拟形象生成。
22.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
获取虚拟世界的接入设备的设备用户针对在所述虚拟世界的虚拟形象的申请请求;
响应于所述申请请求,采集所述设备用户在物理世界的图像数据;
将所述图像数据输入通过所述接入设备部署的虚拟形象模型进行图像重建处理,获得所述设备用户在所述虚拟世界的虚拟形象;
其中,所述虚拟形象模型对基于第二样本图像训练获得的第二模型进行模型裁剪处理后获得;所述第二样本图像在基于第一样本图像训练获得的第一模型进行反向传播处理后获得,所述第一模型是对多个预测形象进行形象融合获得融合预测形象,并将所述第一样本图像输入第一待训练模型中的第一重建网络进行图像重建,获得目标预测形象,并基于所述融合预测形象、所述目标预测形象和所述第一样本图像对所述第一重建网络进行参数更新以对第一待训练模型进行模型训练后获取的模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211580264.XA CN115775024B (zh) | 2022-12-09 | 2022-12-09 | 虚拟形象模型训练方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211580264.XA CN115775024B (zh) | 2022-12-09 | 2022-12-09 | 虚拟形象模型训练方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115775024A CN115775024A (zh) | 2023-03-10 |
CN115775024B true CN115775024B (zh) | 2024-04-16 |
Family
ID=85391809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211580264.XA Active CN115775024B (zh) | 2022-12-09 | 2022-12-09 | 虚拟形象模型训练方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115775024B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116843805B (zh) * | 2023-06-19 | 2024-03-19 | 上海奥玩士信息技术有限公司 | 一种包含行为的虚拟形象生成方法、装置、设备及介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111354079A (zh) * | 2020-03-11 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 三维人脸重建网络训练及虚拟人脸形象生成方法和装置 |
US10853970B1 (en) * | 2019-03-22 | 2020-12-01 | Bartec Corporation | System for estimating a three dimensional pose of one or more persons in a scene |
CN113705316A (zh) * | 2021-04-13 | 2021-11-26 | 腾讯科技(深圳)有限公司 | 获取虚拟图像的方法、装置、设备及存储介质 |
US11256958B1 (en) * | 2018-08-10 | 2022-02-22 | Apple Inc. | Training with simulated images |
CN114140563A (zh) * | 2021-12-03 | 2022-03-04 | 北京达佳互联信息技术有限公司 | 虚拟对象的处理方法及装置 |
CN114140603A (zh) * | 2021-12-08 | 2022-03-04 | 北京百度网讯科技有限公司 | 虚拟形象生成模型的训练方法和虚拟形象生成方法 |
CN114266695A (zh) * | 2021-12-24 | 2022-04-01 | 阿里巴巴(中国)有限公司 | 图像处理方法、图像处理系统及电子设备 |
CN114373034A (zh) * | 2022-01-10 | 2022-04-19 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备、存储介质及计算机程序 |
CN114445562A (zh) * | 2022-02-17 | 2022-05-06 | 北京大甜绵白糖科技有限公司 | 三维重建方法及装置、电子设备和存储介质 |
CN114494566A (zh) * | 2020-11-09 | 2022-05-13 | 华为技术有限公司 | 图像渲染方法和装置 |
CN114611705A (zh) * | 2020-11-23 | 2022-06-10 | 华为技术有限公司 | 数据处理方法、机器学习的训练方法及相关装置、设备 |
CN114820905A (zh) * | 2022-06-24 | 2022-07-29 | 北京百度网讯科技有限公司 | 虚拟形象生成方法、装置、电子设备及可读存储介质 |
CN114863214A (zh) * | 2022-05-16 | 2022-08-05 | 北京字跳网络技术有限公司 | 图像生成模型训练、图像生成方法、装置、介质及设备 |
CN115249306A (zh) * | 2022-09-13 | 2022-10-28 | 腾讯科技(深圳)有限公司 | 图像分割模型训练方法、图像处理方法、装置及存储介质 |
CN115359219A (zh) * | 2022-08-16 | 2022-11-18 | 支付宝(杭州)信息技术有限公司 | 虚拟世界的虚拟形象处理方法及装置 |
CN115439606A (zh) * | 2022-08-31 | 2022-12-06 | 华为技术有限公司 | 三维重建方法、图形界面、系统及相关装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3234925A1 (en) * | 2014-12-16 | 2017-10-25 | Metail Limited | Methods for generating a 3d virtual body model of a person combined with a 3d garment image, and related devices, systems and computer program products |
US10482575B2 (en) * | 2017-09-28 | 2019-11-19 | Intel Corporation | Super-resolution apparatus and method for virtual and mixed reality |
US11908149B2 (en) * | 2019-10-10 | 2024-02-20 | Andrew Thomas Busey | Pattern-triggered object modification in augmented reality system |
CN111199579B (zh) * | 2020-01-02 | 2023-01-24 | 腾讯科技(深圳)有限公司 | 一种目标物的三维模型构建方法、装置、设备及介质 |
CA3157926A1 (en) * | 2020-03-06 | 2021-09-10 | Marc Eder | Systems and methods for building a virtual representation of a location |
-
2022
- 2022-12-09 CN CN202211580264.XA patent/CN115775024B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11256958B1 (en) * | 2018-08-10 | 2022-02-22 | Apple Inc. | Training with simulated images |
US10853970B1 (en) * | 2019-03-22 | 2020-12-01 | Bartec Corporation | System for estimating a three dimensional pose of one or more persons in a scene |
CN111354079A (zh) * | 2020-03-11 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 三维人脸重建网络训练及虚拟人脸形象生成方法和装置 |
CN114494566A (zh) * | 2020-11-09 | 2022-05-13 | 华为技术有限公司 | 图像渲染方法和装置 |
CN114611705A (zh) * | 2020-11-23 | 2022-06-10 | 华为技术有限公司 | 数据处理方法、机器学习的训练方法及相关装置、设备 |
CN113705316A (zh) * | 2021-04-13 | 2021-11-26 | 腾讯科技(深圳)有限公司 | 获取虚拟图像的方法、装置、设备及存储介质 |
CN114140563A (zh) * | 2021-12-03 | 2022-03-04 | 北京达佳互联信息技术有限公司 | 虚拟对象的处理方法及装置 |
CN114140603A (zh) * | 2021-12-08 | 2022-03-04 | 北京百度网讯科技有限公司 | 虚拟形象生成模型的训练方法和虚拟形象生成方法 |
CN114266695A (zh) * | 2021-12-24 | 2022-04-01 | 阿里巴巴(中国)有限公司 | 图像处理方法、图像处理系统及电子设备 |
CN114373034A (zh) * | 2022-01-10 | 2022-04-19 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备、存储介质及计算机程序 |
CN114445562A (zh) * | 2022-02-17 | 2022-05-06 | 北京大甜绵白糖科技有限公司 | 三维重建方法及装置、电子设备和存储介质 |
CN114863214A (zh) * | 2022-05-16 | 2022-08-05 | 北京字跳网络技术有限公司 | 图像生成模型训练、图像生成方法、装置、介质及设备 |
CN114820905A (zh) * | 2022-06-24 | 2022-07-29 | 北京百度网讯科技有限公司 | 虚拟形象生成方法、装置、电子设备及可读存储介质 |
CN115359219A (zh) * | 2022-08-16 | 2022-11-18 | 支付宝(杭州)信息技术有限公司 | 虚拟世界的虚拟形象处理方法及装置 |
CN115439606A (zh) * | 2022-08-31 | 2022-12-06 | 华为技术有限公司 | 三维重建方法、图形界面、系统及相关装置 |
CN115249306A (zh) * | 2022-09-13 | 2022-10-28 | 腾讯科技(深圳)有限公司 | 图像分割模型训练方法、图像处理方法、装置及存储介质 |
Non-Patent Citations (3)
Title |
---|
3D model reconstruction with common hand-held cameras;Maoteng Zheng et al;Virtual Reality;20160917;第20卷;221–235 * |
三维模型建模方法的总结及其应用;卢婧宇等;电子技术与软件工程;20181017(第19期);216-218 * |
在真实的VR场景中嵌入虚拟三维对象;陈贺璋;;电视技术;20180505(第05期);57-61 * |
Also Published As
Publication number | Publication date |
---|---|
CN115775024A (zh) | 2023-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109271933A (zh) | 基于视频流进行三维人体姿态估计的方法 | |
US20220222796A1 (en) | Image processing method and apparatus, server, and storage medium | |
CN111598111B (zh) | 三维模型生成方法、装置、计算机设备及存储介质 | |
CN115359219B (zh) | 虚拟世界的虚拟形象处理方法及装置 | |
CN111738280A (zh) | 一种图像识别方法、装置、设备及可读存储介质 | |
US20220335685A1 (en) | Method and apparatus for point cloud completion, network training method and apparatus, device, and storage medium | |
CN115775024B (zh) | 虚拟形象模型训练方法及装置 | |
CN115359220B (zh) | 虚拟世界的虚拟形象更新方法及装置 | |
CN115131849A (zh) | 图像生成方法以及相关设备 | |
CN113781164B (zh) | 虚拟试衣模型训练方法、虚拟试衣方法和相关装置 | |
WO2022096944A1 (en) | Method and apparatus for point cloud completion, network training method and apparatus, device, and storage medium | |
CN113240789B (zh) | 虚拟对象构建方法及装置 | |
CN115809696B (zh) | 虚拟形象模型训练方法及装置 | |
CN110570375A (zh) | 一种图像处理方法、装置、电子设置以及存储介质 | |
CN115374141B (zh) | 虚拟形象的更新处理方法及装置 | |
CN117292007A (zh) | 图像生成方法及装置 | |
Soliman et al. | Artificial intelligence powered Metaverse: analysis, challenges and future perspectives | |
CN115499635B (zh) | 数据压缩处理方法及装置 | |
CN115810073A (zh) | 虚拟形象生成方法及装置 | |
CN115937365A (zh) | 用于人脸重建的网络训练方法、装置、设备及存储介质 | |
CN111915701A (zh) | 一种基于人工智能的按钮图像生成方法和装置 | |
CN115564803B (zh) | 一种动画处理方法、装置、设备、存储介质及产品 | |
CN115953706B (zh) | 虚拟形象处理方法及装置 | |
CN116246009B (zh) | 虚拟形象处理方法及装置 | |
CN115731375B (zh) | 虚拟形象的更新方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |