CN110728636A

CN110728636A - 一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型、方法及装置

Info

Publication number: CN110728636A
Application number: CN201910876687.8A
Authority: CN
Inventors: 唐睿; 徐冰; 张骏飞
Original assignee: Hangzhou Group's Nuclear Information Technology Co Ltd
Current assignee: Hangzhou Group's Nuclear Information Technology Co Ltd
Priority date: 2019-09-17
Filing date: 2019-09-17
Publication date: 2020-01-24
Also published as: WO2021051893A1; US20220335574A1

Abstract

本发明公开了一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型及其构建方法，包括：构建训练样本，构建生成式对抗网络，包括去噪网络和判别网络，其中，去噪网络用于输入的噪声渲染图和辅助特征进行去噪，输出去噪渲染图，判别网络用于对输入的去噪渲染图和噪声渲染图对应的目标渲染图进行分类，输出分类结果；利用训练样本对生成式对抗网络的网络参数进行调优，以网络参数确定的去噪网络作为蒙特卡洛渲染图去噪模型，还公开了一种蒙特卡洛渲染图的去噪方法和装置，能够实现对含有噪声的蒙特卡洛渲染图的去噪。

Description

一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型、方法及装置

技术领域

本发明属于图像去噪声领域，具体涉及一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型、方法及装置。

背景技术

基于蒙特卡洛积分(Monte-Carlo Simulation)的渲染技术，由于渲染图的方差收敛需要大量的采样，因此，耗费大量的时间和计算资源。为了节省计算资源和降低渲染时间，一般采用较低采样率进行渲染得到一张有噪点的渲染图后，再采用一定的去噪技术对渲染图进行降噪，以得到一张无噪点、视觉表现较佳的渲染图。

目前，比较前沿的对蒙特卡洛渲染图去噪技术多基于深度学习。用的最多的是采用卷积神经网络对蒙特卡洛渲染图进行去噪，具体以蒙特卡洛渲染图和目标无噪点图片的L1范数/L2范数损失函数作为优化回归的目标，对卷积神经网络进行训练，训练好的卷积神经模型即可以实现对蒙特卡洛渲染图去噪。

Disney的“Bako S,Vogels T,McWilliams B,et al.Kernel-predictingconvolutional networks for denoising Monte Carlo renderings[J].ACMTransactions on Graphics(TOG),2017,36(4):97.”以及Nvidia的“Chaitanya C R A,Kaplanyan A S,Schied C,et al.Interactive reconstruction of Monte Carlo imagesequences using a recurrent denoising autoencoder[J].ACM Transactions onGraphics(TOG),2017,36(4):98.”由于以像素级的loss作为优化目标，很难准确地描述真实的人眼视觉感受，所以即便在这个优化目标上做到标准很高，往往会得到相对模糊或者还原度较低的高频细节，使得去噪后的蒙特卡洛渲染图在细节处缺乏真实感，甚至有些高频细节较多的地方会显得比较脏。例如对室内渲染图进行去噪后，会使得室内渲染图中吊顶的墙角和踢脚线等这些高频细节较多的地方比较脏。

因此，迫切地需要一种对蒙特卡洛渲染图的去噪技术，该去噪技术既能做到对低频细节取得良好去噪效果，还能够较好地保留高频细节。

发明内容

本发明的目的是提供一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型及其建立方法，建立的蒙特卡洛渲染图去噪模型能够实现对含有噪声的蒙特卡洛渲染图的去噪，在对低频细节取得良好去噪效果的同时，还能够明显提升对高频细节的保留，以获得在视觉上更加真实的渲染图。

本发明的另一目的是提供一种特卡洛渲染图的去噪方法和装置，该去噪方法和装置利用上述构建的蒙特卡洛渲染图去噪模型，能够实现对蒙特卡洛渲染图的去噪，在对低频细节取得良好去噪效果的同时，还能够明显提升对高频细节的保留，以获得在视觉上更加真实的渲染图。

为实现上述发明目的，提供以下技术方案：

第一实施方式提供了一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型的构建方法，包括以下步骤：

获取含有噪声的蒙特卡洛渲染图作为噪声渲染图，获取生成噪声渲染图时的辅助特征，以噪声渲染图和对应的辅助特征，以及噪声渲染图对应的目标渲染图作为一个训练样本；

构建生成式对抗网络，所述生成式对抗网络包括去噪网络和判别网络，其中，所述去噪网络用于输入的噪声渲染图和辅助特征进行去噪，输出去噪渲染图，所述判别网络用于对输入的去噪渲染图和噪声渲染图对应的目标渲染图进行分类，输出分类结果；

利用训练样本对所述生成式对抗网络的网络参数进行调优，调优结束后，以网络参数确定的去噪网络作为蒙特卡洛渲染图去噪模型。

第二实施方式提供了一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型，所述蒙特卡洛渲染图去噪模型通过第一实施方式提供的构建方法构建获得。

优选地，所述蒙特卡洛渲染图去噪模型为蒙特卡洛渲染图去噪模型M_d，其为利用diffuse路径渲染流程渲染得到的蒙特卡洛渲染图P_d、生成该蒙特卡洛渲染图P_d时的辅助特征，以及蒙特卡洛渲染图P_d对应的目标渲染图作为训练样本训练得到；

所述蒙特卡洛渲染图去噪模型为蒙特卡洛渲染图去噪模型M_s，其为利用specular路径渲染流程渲染得到的蒙特卡洛渲染图P_s、生成该蒙特卡洛渲染图P_s时的辅助特征，以及蒙特卡洛渲染图P_s对应的目标渲染图作为训练样本训练得到。

第三实施方式提供了一种蒙特卡洛渲染图的去噪方法，包括以下步骤：

根据路径追踪第一次光线和物体相交交点处的材质区别，将渲染引擎的渲染流程拆分为diffuse路径渲染流程和specular路径渲染流程；

分别利用diffuse路径渲染流程和specular路径渲染流程进行渲染，得到含有噪声的蒙特卡洛渲染图P_d和蒙特卡洛渲染图P_s，同时生成蒙特卡洛渲染图P_d和蒙特卡洛渲染图P_s对应的辅助特征；

将蒙特卡洛渲染图P_d以及对应的辅助特征输入至所述的蒙特卡洛渲染图去噪模型M_d中，获得去噪渲染图P_d’；

将蒙特卡洛渲染图P_s以及对应的辅助特征输入至所述蒙特卡洛渲染图去噪模型M_s中，获得去噪渲染图P_s’；

融合去噪渲染图P_d’和去噪渲染图P_s’，得到最终去噪渲染图。

第四实施方式提供了一种对蒙特卡洛渲染图的去噪装置，包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序，所述计算机存储器中存有所述的蒙特卡洛渲染图去噪模型M_s和蒙特卡洛渲染图去噪模型M_d；

所述计算机处理器执行所述计算机程序时实现以下步骤：

分别利用diffuse路径渲染流程和specular路径渲染流程进行渲染，得到低采样率的蒙特卡洛渲染图P_d和蒙特卡洛渲染图P_s，同时生成蒙特卡洛渲染图P_d和蒙特卡洛渲染图P_s对应的辅助特征；

调用蒙特卡洛渲染图去噪模型M_d对将蒙特卡洛渲染图P_d以及对应的辅助特征进行去噪，获得去噪渲染图P_d’；

调用蒙特卡洛渲染图去噪模型M_s对蒙特卡洛渲染图P_s以及对应的辅助特征进行去噪，获得去噪渲染图P_s’；

本发明具有的有益效果为：

所述蒙特卡洛渲染图去噪模型，具有更强的去噪能力，去噪后获得的去噪渲染图能够带给人类视觉感受上更好的降噪效果。

所述特卡洛渲染图的去噪方法和装置由于利用了蒙特卡洛渲染图去噪模型，可以实现采用较低的采样率达到高采样率才能达到的渲染效果，同时去噪的时间只在一秒的数量级，远远小于多采样所需要的渲染时间(几百到几千秒的数量级)，极大地节约渲染时间和计算成本，从而可以减少服务器的使用，降低整个渲染服务的产业成本，节约资源。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动前提下，还可以根据这些附图获得其他附图。

图1是生成式对抗网络的结构示意图；

图2是生成式对抗网络的训练过程示意图；

图3是对对蒙特卡洛渲染图的去噪方法流程示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不限定本发明的保护范围。

当采用低采样率对模型进行蒙特卡洛渲染时，获得的蒙特卡洛渲染图往往都存在很多噪点，为了去除蒙特卡洛渲染图中的噪点，以下实施方式提供了一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型及其建立方法，还提供了一种利用该蒙特卡洛渲染图去噪模型的去噪方法，以及调用该蒙特卡洛渲染图去噪模型的去噪装置。

一个实施方式，提供了一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型的建立方法，如图1所示和图2所示，具体包括以下过程：

建立训练样本集

首先，采用低采样率对模型进行蒙特卡洛渲染渲染，得到含有噪声的蒙特卡洛渲染图作为噪声渲染图，然后，采用高采样率对同样模型进行蒙特卡洛渲染，得到含有极少噪声的蒙特卡洛渲染图，并以含有极少噪声的蒙特卡洛渲染图作为目标渲染图，当然，也可以采用其他的方式对噪声渲染图进行去噪，以获得图像质量满足需求的目标渲染图，目标渲染图的获取方式在此不做限定。

本实施方式构建的蒙特卡洛渲染图去噪模型能够实现的目标就是对输入的噪声渲染图进行去噪操作，输出图像质量达到目标渲染图的去噪渲染图。

为了提升蒙特卡洛渲染图去噪模型的去噪能力，本发明还考虑增加其他辅助特征作为蒙特卡洛渲染图去噪模型的输入，这样蒙特卡洛渲染图去噪模型在去噪的时候能够综合结合噪声渲染图的特征和辅助特征，多次提取能够提升图像质量的特征点，形成去噪渲染图。因此，在采用低采样率对模型进行蒙特卡洛渲染渲染，获得含有噪声的蒙特卡洛渲染图作为噪声渲染图时，提取噪声渲染图对应的辅助特征，该些辅助特征Auxiliary Feature包括但不限于法线图Normal Buffer，深度图Depth Buffer，材质纹理图Albedo Buffer。

因此，以噪声渲染图和对应的辅助特征，以及噪声渲染图对应的目标渲染图作为一个训练样本，以此构建训练样本集。

构建生成式对抗网络

单纯的采用卷积神经网络对噪声渲染图去噪，获得的去噪渲染图在细节处缺乏真实感，为了提升去噪时对高频细节的保留，本实施方式通过对抗学习来构建蒙特卡洛渲染图去噪模型，具体地，构建的生成式对抗网络包括去噪网络Denoising Net和判别网络Critic Net，其中，Denoising Net去噪网络用于输入的噪声渲染图和辅助特征进行去噪，输出去噪渲染图，判别网络Critic Net用于对输入的去噪渲染图和噪声渲染图对应的目标渲染图进行分类，输出分类结果。

具体地，去噪网络包括：

辅助图特征提取子网络，该辅助图特征提取子网络为包括至少一个卷积层的卷积神经网络，用于对输入的辅助特征进行融合，输出辅助特征图；

渲染图特征提取子网络，该渲染图特征提取子网络为包括至少一个卷积层的卷积神经网络，用于提取噪声渲染图的特征，输出噪声特征图；

特征融合子网络，该特征融合子网络为采用残差思想，利用卷积层对辅助特征图和噪声特征图进行融合提取的神经网络。

对于辅助图特征提取子网络Encoder Net，具体可以为至少2个卷积层Conv和激活层RelU依次连接的卷积神经网络，举例说明，辅助特征融合网络Encoder Net可以为如图1(c)所示的卷积神经网络，具体包括依次连接的Conv k3n128s1，Leaky RelU，Convk1n128s1，Leaky RelU，Conv k1n128s1，Leaky RelU，Conv k1n128s1，Leaky RelU以及Convk1n32s1，其中，Conv k3n128s1表示卷积核为3*3，通道数为128，步长为1的卷积层，其他卷积层解释类似，在此不再赘述。

具体地，特征融合子网络可以包括：

特征融合单元，该特征融合单元用于对辅助特征图和噪声特征图进行结合，输出调制特征图，具体包括依次连接的多个辅助特征调制模块CFM ResBlock、辅助特征调制节CFM以及卷积层，其中，辅助特征调制模块CFM Block和辅助特征调制节CFM的输入为辅助特征图和上一层的输出，第一个辅助特征调制模块CFM ResBlock的输入为噪声特征图和辅助特征图，卷积层的输入为辅助特征调制节CFM的输出，输出为调制特征图；

输出单元，该输出单元用于对特征提取单元输出的噪声特征图和调制单元输出的调制特征图进行特征融合，即输入为噪声特征图和调制特征图叠加后的特征图，输出为去噪渲染图。

具体地，辅助特征调制模块CFM ResBlock包括辅助特征调制节CFM、卷积层、激活层以及叠加操作，其中，辅助特征调制节CFM用于对于辅助特征和上一次输出的特征进行调制，也就是辅助特征调制节CFM的输入包括辅助特征图和上一层的输出特征，叠加操作用于对辅助特征调制模块CFM ResBlock的输入和最后的卷积层的输出进行叠加。

举例说明，如图1(b)所示，辅助特征调制模块CFM ResBlock包括依次连接的辅助特征调制节CFM、Convk3n64s1、ReLU、辅助特征调制节CFM、Conv k3n64s1以及叠加操作

其中，辅助特征调制节CFM的输入包括辅助特征图和上一层的输出特征，叠加操作

用于叠加辅助特征调制模块CFM ResBlock的输入和Conv k3n64s1的输出。

其中，辅助特征调制节CFM包括卷积层、点乘操作以及叠加操作，其中，卷积层的输入为辅助特征图，点乘操作用于对卷积层的输出和上一层的输出进行点乘操作，叠加操作用于对卷积层的输出和点乘操作进行叠加，输出特征图。

举例说明，如图1(b)所示，辅助特征调制节CFM包括Conv k1n32s1、Leaky ReLU、Conv k1n64s1、点乘操作⊙以及叠加操作

其中，Conv k1n32s1、Leaky ReLU、Convk1n64s1三层依次连接，Conv k1n32s1的输入为辅助特征图，点乘操作⊙是指将上一层的输出与Conv k1n64s1的输出γ进行点乘，叠加操作

是指将点乘操作的结果与Conv k1n64s1的输出β进行叠加。

具体地，融合单元包括卷积层和激活层，用于对对特征提取单元输出的噪声特征图和调制单元输出的调制特征图进行特征融合，输出去噪特征图。举例说明，如图1(a)所示，融合单元包括依次连接的Conv k3n64s1、ReLU、Conv k3n3s1以及ReLU。

判别网络Critic Net为卷积层、BN、激活层以及全连接层组成的网络。举例说明，如图1(d)所示，判别网络Critic Net包括依次连接的Conv、Leaky ReLU、多个连续的提取单元、全连接层Dense(100)、Leaky ReLU以全连接层Dense(1)，其中，提取单元包括连续的Conv、BN以及Leaky ReLU，全连接层Dense(100)中的100表示输出维度为100。

生成式对抗网路的训练

在构建完生成式对抗网络后，即利用训练样本集对生成式对抗网络进行对抗训练，优化生成式对抗网络的网络参数。去噪网络Denoising Net的作用在于对噪声渲染图进行去噪，生成去噪渲染图，目的在于使得判别网络Critic Net无法分辨出去噪渲染图和目标渲染图；而判别网络CriticNet的作用在于尽可能区分去噪渲染图和目标渲染图的视觉质量。因此，在训练时，利用Critic Net的预测输出与实际标签的差值反向传递更新生成式对抗网络中的参数，以实现对生成式对抗网络的对抗训练，整个训练基于对抗性过程使得去噪网络DenoisingNet和判别网络CriticNet的能力同时得到提升。

当参数调优结束后，提取参数确定的去噪网络Denoising Net作为蒙特卡洛渲染图去噪模型。

该蒙特卡洛渲染图去噪模型能够实现对含有噪声的蒙特卡洛渲染图的去噪，在对低频细节取得良好去噪效果的同时，还能够明显提升对高频细节的保留，以获得在视觉上更加真实的渲染图。

在上述蒙特卡洛渲染图去噪模型构建的基础上，还可以通过改变训练样本训练上述构建的生成式对抗网络，以获得能够处理其他输入图像的蒙特卡洛渲染图去噪模型。

众所周知，蒙特卡洛渲染是对传统的逆向光线追踪的改进，其主要还是基于光线追踪原理，因此，在渲染时，根据路径追踪第一次光线和物体相交交点处的材质区别，可以将渲染引擎的渲染流程拆分为diffuse路径渲染流程和specular路径渲染流程，利用diffuse路径渲染流程和specular路径渲染流程单独进行渲染，既可以获得含有噪声的蒙特卡洛渲染图P_d和蒙特卡洛渲染图P_s。

在此基础上，即可以获得的对蒙特卡洛渲染图P_d进行去噪的蒙特卡洛渲染图去噪模型M_d和对蒙特卡洛渲染图P_s进行去噪的蒙特卡洛渲染图去噪模型M_s。

具体地，利用diffuse路径渲染流程渲染得到的蒙特卡洛渲染图P_d作为噪声渲染图P_d(也就是Noisy Diffuse)，以噪声渲染图P_d、生成噪声渲染图P_d时的辅助特征(Auxiliary feature)，以及噪声渲染图P_d对应的目标渲染图作为训练样本，对上述生成式对抗网络进行对抗训练，对抗训练结束后，提取去噪网络Denoising Net和辅助特征融合网络Encoder Net作为蒙特卡洛渲染图去噪模型M_d。

利用specular路径渲染流程渲染得到的蒙特卡洛渲染图P_s作为噪声渲染图P_s(也就是Noisy Specular)，以噪声渲染图P_s、生成噪声渲染图P_s时的辅助特征，以及噪声渲染图P_s对应的目标渲染图作为训练样本，对上述生成式对抗网络进行对抗训练，对抗训练结束后，提取去噪网络Denoising Net和辅助特征融合网络Encoder Net作为蒙特卡洛渲染图去噪模型M_s。

另外一实施方式，提供了一种蒙特卡洛渲染图的去噪方法，如图3所示，包括以下步骤：

S101，根据路径追踪第一次光线和物体相交交点处的材质区别，将渲染引擎的渲染流程拆分为diffuse路径渲染流程和specular路径渲染流程；

S102，分别利用diffuse路径渲染流程和specular路径渲染流程进行渲染，得到含有噪声的蒙特卡洛渲染图P_d和蒙特卡洛渲染图P_s，同时生成蒙特卡洛渲染图P_d和蒙特卡洛渲染图P_s对应的辅助特征；

S103，将蒙特卡洛渲染图P_d以及对应的辅助特征输入至上述蒙特卡洛渲染图去噪模型M_d中，获得去噪渲染图P_d’；

S104，将蒙特卡洛渲染图P_s以及对应的辅助特征输入至上述蒙特卡洛渲染图去噪模型M_s中，获得去噪渲染图P_s’；

S105，融合去噪渲染图P_d’和去噪渲染图P_s’，得到最终去噪渲染图。

该去噪方法中，蒙特卡洛渲染图P_d和蒙特卡洛渲染图P_s对应的辅助特征AuxiliaryFeature包括但不限于法线图Normal Buffer，深度图Depth Buffer，材质纹理图AlbedoBuffer。

所述蒙特卡洛渲染图去噪模型M_d和蒙特卡洛渲染图去噪模型M_s按照上述构建方法构建获得，此处不再赘述。

该去噪方法由于利用了蒙特卡洛渲染图去噪模型M_d和M_s，可以实现采用较低的采样率达到高采样率才能达到的渲染效果，同时去噪的时间只在一秒的数量级，远远小于多采样所需要的渲染时间(几百到几千秒的数量级)，极大地节约渲染时间和计算成本，从而可以减少服务器的使用，降低整个渲染服务的产业成本，节约资源。

另一个实施方式，提供了一种对蒙特卡洛渲染图的去噪装置，包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序，所述计算机存储器中存有上述蒙特卡洛渲染图去噪模型M_s和蒙特卡洛渲染图去噪模型M_d；

所述计算机处理器执行所述计算机程序时实现以下步骤：

该去噪装置由于利用了蒙特卡洛渲染图去噪模型M_d和M_s，可以实现采用较低的采样率达到高采样率才能达到的渲染效果，同时去噪的时间只在一秒的数量级，远远小于多采样所需要的渲染时间(几百到几千秒的数量级)，极大地节约渲染时间和计算成本，从而可以减少服务器的使用，降低整个渲染服务的产业成本，节约资源。

以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明，应理解的是以上所述仅为本发明的最优选实施例，并不用于限制本发明，凡在本发明的原则范围内所做的任何修改、补充和等同替换等，均应包含在本发明的保护范围之内。

Claims

1.一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型的构建方法，包括以下步骤：

构建生成式对抗网络，所述生成式对抗网络包括

去噪网络和判别网络，其中，所述去噪网络用于输入的噪声渲染图和辅助特征进行去噪，输出去噪渲染图，所述判别网络用于对输入的去噪渲染图和噪声渲染图对应的目标渲染图进行分类，输出分类结果；

2.如权利要求1所述的基于生成式对抗网络的蒙特卡洛渲染图去噪模型的构建方法，其特征在于，所述去噪网络包括：

3.如权利要求2所述的基于生成式对抗网络的蒙特卡洛渲染图去噪模型的构建方法，其特征在于，所述特征融合子网络包括：

4.如权利要求1所述的基于生成式对抗网络的蒙特卡洛渲染图去噪模型的构建方法，其特征在于，所述判别网络为卷积层、BN、激活层以及全连接层组成的网络。

5.一种基于生成式对抗网络的蒙特卡洛渲染图去噪模型，其特征在于，所述蒙特卡洛渲染图去噪模型通过权利要求1～4任一项所述的构建方法构建获得。

6.如权利要求5所示的基于生成式对抗网络的蒙特卡洛渲染图去噪模型，其特征在于，

所述蒙特卡洛渲染图去噪模型为蒙特卡洛渲染图去噪模型M_d，其为利用diffuse路径渲染流程渲染得到的蒙特卡洛渲染图P_d、生成该蒙特卡洛渲染图P_d时的辅助特征，以及蒙特卡洛渲染图P_d对应的目标渲染图作为训练样本训练得到；

7.一种蒙特卡洛渲染图的去噪方法，包括以下步骤：

将蒙特卡洛渲染图P_d以及对应的辅助特征输入至权利要求6所述的蒙特卡洛渲染图去噪模型M_d中，获得去噪渲染图P_d’；

将蒙特卡洛渲染图P_s以及对应的辅助特征输入至权利要求6所述的蒙特卡洛渲染图去噪模型M_s中，获得去噪渲染图P_s’；

8.一种对蒙特卡洛渲染图的去噪装置，包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序，其特征在于，

所述计算机存储器中存有权利要求6所述的蒙特卡洛渲染图去噪模型M_s和蒙特卡洛渲染图去噪模型M_d；

所述计算机处理器执行所述计算机程序时实现以下步骤：