CN112200895B

CN112200895B - 一种基于深度学习的数字人布料实时解算方法

Info

Publication number: CN112200895B
Application number: CN202011413233.6A
Authority: CN
Inventors: 赵锐; 侯志迎
Original assignee: Jiangsu Yuanli Digital Technology Co ltd
Current assignee: Jiangsu Yuanli Digital Technology Co ltd
Priority date: 2020-12-07
Filing date: 2020-12-07
Publication date: 2021-04-16
Anticipated expiration: 2040-12-07
Also published as: CN112200895A

Abstract

本发明提供一种基于深度学习的数字人布料实时解算方法，包括以下步骤：S1：训练神经网络，训练自动编码器和全连接网络将骨骼信息映射到布料网格顶点的编码；S2：在训练完上述两个神经网络后，给定一组输入骨骼信息，首先经过全连接网络，得到布料网格顶点的编码，再经过自动编码器中的解码环节，得到输出布料网格顶点，该输出即为布料的解算结果。本发明实时计算出布料的网格顶点信息，有效避免人物模型与布料模型穿插的问题，进一步提高布料制作效率。

Description

一种基于深度学习的数字人布料实时解算方法

技术领域

本发明属于动画制作技术领域，具体涉及一种基于深度学习的数字人布料实时解算方法。

背景技术

在目前的影视动画制作流程中，衣物布料的动画数据是通过建立数学物理模型模拟布料在真实场景中的动做解算出最终效果，即布料网格顶点在每一帧的三维坐标数值。建模仿真意味着计算出每一帧的网格顶点的三维坐标都要耗费大量的资源，因此目前数字人布料普遍采用离线解算的方式，即事先根据人物骨骼动画解算出每一帧布料的网格顶点信息，写入缓存，在需要使用时再调出；

由于建模仿真的解算过程的性质决定，布料的具体大小形状必须根据人物模型的改动做出相应的改动，不然会导致出现布料与人物模型穿插的现象，还需要人工手动精修。

当布料动画解算完毕后，如果后期人物骨骼动画被修改，那么其对应的布料动画需要重新计算，生成新的缓存，布料制作效率低。

发明内容

本发明的目的是提供一种基于深度学习的数字人布料实时解算方法，实时计算出布料的网格顶点信息，有效避免人物模型与布料模型穿插的问题，进一步提高布料制作效率；

本发明提供了如下的技术方案：

一种基于深度学习的数字人布料实时解算方法，包括以下步骤：

S1：训练神经网络，包括以下步骤：

S101：先用一个自动编码器来编码布料的网格顶点的三维坐标，该自动编码器网络先将高维度的网格顶点的三维坐标

编码成一组低维度的隐式变量

，再将低维度的隐式变量

解码还原成高维度的网格顶点的三维坐标

，其中低维度的隐式变量

即为自动编码器对高维度的网格顶点

的编码，训练时，通过第一最小化损失函数

让神经网络在解码后的输出

应当与编码前的输入

趋于相同；

S102：在训练完S101中的自动编码器之后，用隐式变量

代替布料的网格顶点

，之后再用全连接网络将骨骼信息

映射到布料网格顶点的编码

，在训练时，给定一组数据对，通过第二最小化损失函数

其中，

，

，

让骨骼信息

经过全连接网络后的输出

与布料网格顶点

所对应的编码

趋于相同；

S2：在训练完上述S101和S102两个神经网络后，给定一组输入骨骼信息

，首先经过S102中的全连接网络，得到布料网格顶点的编码

，再经过S101中的解码环节，得到输出布料网格顶点

，该输出即为布料的解算结果；

优选的，所述自动编码器包括编码过程和解码过程，所述编码过程由若干层神经网络组成，将高维度的输入数据

映射到低维度的隐式变量

，实现降维或数据压缩的功能；所述解码过程也由若干层神经网络组成，将低维度的隐式变量

映射到高维度的重构

，且重构

应当与输入数据

趋于相同，实现增维或数据重构的功能；

优选的，全连接神经网络由若干全连接层构成，每一层

都是由输入到输出的非线性映射：

其中，

是第

层的权重，

是第

层的偏差，

是第

层的输入，

是第

层的输出，同时也第

层的输入，

是第

层的非线性函数；

每一层的权重

和偏差

均为可训练的变量，通过最小化损失函数来更新其值；

如果将每一层

所表示的函数记为

，且令

，那么一个包含

层的全连接神经网络可表示为

其中，

是第

层的输入，同时也是整个神经网络的输入，

是第

层的输出，同时也是整个神经网络的输出；

优选的，训练S102中的全连接神经网络时，要求S101中的自动编码器已训练完毕且固定其网络参数，故将经自动编码器生成的布料网格顶点的编码

视为常量，只需更新S102中全连接神经网络的参数使得

与

趋于相同；

本发明的有益效果是：深度神经网络可将输入端的骨骼信息映射到输出端的布料网格顶点的三维坐标，其相对轻量级的计算量能够实时计算出布料的网格顶点信息；将数字人的皮肤网格与布料的网格作为一个整体，使得数字人的骨骼能同时驱动人物皮肤网格以及布料的网格顶点的三维坐标，有效避免人物模型与布料模型穿插的问题；由于本方法能够实时解算布料，故不会出现后期人物动画被修改时需要重新计算对应的布料动画的情况，进一步提高布料制作效率。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明神经网络结构图；

图2是本发明布料解算流程图。

具体实施方式

一种基于深度学习的数字人布料实时解算方法，用神经网络取代繁杂的建模仿真，大幅降低计算成本。由于数字人所需要的动作并不复杂，故可将数字人的皮肤网格与布料网格作为一个整体，以避免解可能带来的穿插问题，无须人工手动精修；

将数字人的皮肤网格与布料网格作为一个整体，使得数字人的骨骼能够驱动布料的网格顶点的三维坐标。从骨骼到布料的网格顶点的映射关系可被视为一个复杂的非线性函数，为此使用神经网络来学习这种映射关系。将数字人的骨骼信息（旋转和平移）作为神经网络的输入，通过训练，得出对应布料的网格顶点的三维坐标。由于布料的网格顶点通常包含大量参数，直接将骨骼信息映射到网格顶点很容易导致过拟合。为了解决上述问题，训练过程经过如下改进：

a)先用一个自动编码器来编码布料的网格顶点的三维坐标。该网络先将高维度的网格顶点的三维坐标

编码成一组低维度的隐式变量

，再将低维度的隐式变量

解码还原成高维度的网格顶点的三维坐标

（如图1所示）。其中低维度的隐式变量

即为自动编码器对高维度的网格顶点

的编码。训练时，通过最小化损失函数

让神经网络在解码后的输出

应当与编码前的输入

相接近；

b)在训练完a）中的自动编码器之后，可以用隐式变量

代替布料的网格顶点

；

之后再用一个全连接网络将骨骼信息

映射到布料网格顶点的编码

（如图1所示）。在训练时，给定一组数据对（骨骼信息

，布料网格顶点

），通过最小化损失函数

其中

让骨骼信息

经过全连接网络后的输出

与布料网格顶点

所对应的编码

相接近。【注：训练b）中的全连接神经网络时，要求a）中的自动编码器已训练完毕且固定其网络参数，故可将经自动编码器生成的布料网格顶点的编码

视为常量。只需更新b）中全连接神经网络的参数使得

与

相接近。】

在训练完上述两个神经网络后，给定一组输入骨骼信息

，首先经过b）中的全连接网络，得到布料网格顶点的编码

，再经过a）中的解码环节，得到输出布料网格顶点

，该输出即为布料的解算结果（如图2所示）；

其中，自动编码器（auto-encoder）是一种特殊的神经网络结构。它主要包含两个过程：即编码（encoding）和解码（decoding）过程；

编码过程由若干层神经网络组成，通常将高维度的输入数据

映射到低维度的隐式变量

，实现降维/数据压缩的功能。假设输入数据

是个一维向量，编码过程可用若干全连接层来表示，逐层降低输出向量的长度。假设输入数据

是个长度为5000的一维向量，编码由4个全连接层构成，那么

通过这些神经网络时，每一层网络输出的向量长度逐渐降低，例如5000 -> 1024 -> 512 -> 256 -> 128，最终输出一个长度为128的向量，该向量即为编码的输出：隐式变量

；

解码过程也由若干层神经网络组成，通常将低维度的隐式变量

映射到高维度的重构

，且通常重构

应当与输入数据

相似，实现增维/数据重构的功能。假设隐式变量

是一个一维向量，解码过程可用若干全连接层来表示，通常与编码过程所采用的神经网络相对称，逐层增加输出向量的长度。假设隐式变量

是个长度为128的一维向量，解码由4个全连接层构成，那么

通过这些神经网络时，每一层网络输出的向量长度逐渐增加，例如128 -> 256 -> 512 -> 1024 -> 5000，最终输出一个长度为5000的向量，该向量即为解码的输出：重构

；

全连接神经网络（fully-connected network）是一种最常见的神经网络结构。它通常由若干全连接层构成，每一层

都是由输入到输出的非线性映射

其中

是第

层的权重，

是第

层的偏差，

是第

层的输入，

是第

层的输出（同时也第

层的输入），

是第

层的非线性函数，例如

；

每一层的权重

和偏差

均为可训练的变量，可以通过最小化损失函数来更新其值；

如果将每一层

所表示的函数记为

，且令

，那么一个包含

层的全连接神经网络可表示为

其中

是第

层的输入（同时也是整个神经网络的输入），

是第

层的输出（同时也是整个神经网络的输出）；

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。