CN113947547B - 基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法 - Google Patents
基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法 Download PDFInfo
- Publication number
- CN113947547B CN113947547B CN202111215215.1A CN202111215215A CN113947547B CN 113947547 B CN113947547 B CN 113947547B CN 202111215215 A CN202111215215 A CN 202111215215A CN 113947547 B CN113947547 B CN 113947547B
- Authority
- CN
- China
- Prior art keywords
- neural network
- convolutional neural
- scale
- color
- specular reflection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 90
- 230000009467 reduction Effects 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000009877 rendering Methods 0.000 title claims abstract description 62
- 238000010586 diagram Methods 0.000 claims abstract description 55
- 238000005070 sampling Methods 0.000 claims abstract description 43
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 16
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 20
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 13
- 239000003086 colorant Substances 0.000 claims description 7
- 230000005855 radiation Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000011423 initialization method Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 description 8
- 238000011160 research Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,涉及图像降噪技术领域。其包括获取数据集后对其中图像数据预处理得到漫反射组件和镜面反射组件;构建多尺度核预测卷积神经网络模型,对其网络参数初始化得到初始化的核预测卷积神经网络模型;将漫反射组件和镜面反射组件输入初始化的多尺度核预测卷积神经网络模型,使用Adam算法根据L1损失函数计算的误差对其训练得到训练好的多尺度核预测卷积神经网络模型;使用训练好的模型对低采样数下蒙特卡洛渲染得到的噪点图的漫反射组件和镜面反射组件进行降噪,对降噪结果数据相加得到降噪图。用蒙特卡洛渲染方法渲染图像时只需要少数采样得到噪点图再利用本发明方法降噪得到降噪图。
Description
技术领域
本发明涉及图像降噪技术领域,具体涉及一种基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法。
背景技术
照片级渲染效果一直是电影、游戏等领域追求的目标,而蒙特卡洛路径追踪正是一种能够达到高质量渲染效果的渲染算法,此算法在图像的每个像素上通过大量采样光线并模拟光线在三维场景中的反射、折射等光线传输过程完成对渲染方程中积分的估计。这种算法是基于物理的并且无偏的,但是这种估计方法的误差是随采样数的增加线性减少的,而大量采样会消耗巨大的计算成本和时间成本,少量采样只能得到含有大量噪声的图像。为了降低渲染成本,针对低采样数下渲染图像的降噪的研究越来越多,其中既有图像后处理方面的降噪方法又有充分利用渲染过程中得到的辅助特征来进一步提高降噪质量的蒙特卡洛降噪方法。目前,图像后处理方面的降噪研究已经相对成熟,但是对带有蒙特卡洛噪声的图像与对普通图像进行降噪是不同的,普通图像的噪声是复杂多样的,蒙特卡洛渲染的图像噪声类型单一,而且具有更多的辅助特征可以用来加强降噪,比如深度、法线以及反照率等。通用的蒙特卡洛降噪方法已经证明能够在大幅降低采样率的情况下获得高质量的图像。针对蒙特卡洛降噪,主要有基于回归模型的降噪方法和基于深度学习的降噪方法。为了提高降噪质量,基于回归模型的降噪方法的研究中模型的阶数越来越高,但是仍旧存在容易过度拟合输入噪声的现象。
鉴于深度学习在图像处理、语音识别、自然语言处理等各个领域的成功应用,基于深度学习的蒙特卡洛降噪方法研究也成为了现今真实感渲染领域的研究热点。基于深度学习的蒙特卡洛降噪方法致力于通过学习已有的蒙特卡洛渲染得到的噪点图和无噪声的高质量渲染图之间复杂的非线性关系来得到一种降噪模型。基于深度学习的降噪方法将低样本数下渲染得到的噪点图及其辅助特征作为网络输入,但是这些辅助特征中不仅包含利于降噪的场景的丰富的细节信息还包含冗余信息。因此蒙特卡洛降噪关注的重点是如何最大程度地提取噪点图及其辅助特征中的有效信息并应用到降噪过程中。Bako等首次提出一种利用核预测卷积神经网络进行降噪的KPCN架构,该网络将低样本数渲染图及提取的部分辅助特征作为输入数据,并将输入数据分成漫反射数据和镜面反射数据两部分然后分别交由两个单独的卷积神经网络进行训练,最终识别出噪点图与参考图之间的关系。这种方法仍旧存在明显的不足就是在细节处相对模糊,缺乏真实感。Xu等提出了基于生成对抗网络的蒙特卡洛降噪方法,以渲染过程中的辅助特征作为条件在噪点图基础上重建图像,但是训练得到的模型会放大低对比度的特征并且不能对烟雾等一些分布式效果进行良好的降噪。
综上所述,现有的这些基于深度学习的蒙特卡洛降噪方法都显示出了一定的降噪价值,但是它们往往也会降低渲染图像的质量,造成结果图模糊、丢失部分细节信息,甚至部分地方仍旧有残留的噪声。
发明内容
本发明的目的在于提供一种基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法。
本发明的技术方案为:
一种基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,该方法包括如下步骤:
步骤1:获取数据集,并对该数据集中的图像数据进行预处理得到漫反射组件和镜面反射组件;
所述数据集包括低采样数下通过蒙特卡洛渲染得到的若干噪点图和高采样数下通过蒙特卡洛渲染得到的若干参考图;
步骤2:构建多尺度核预测卷积神经网络模型并对其网络参数进行初始化得到初始化的核预测卷积神经网络模型;
步骤3:将漫反射组件和镜面反射组件输入初始化的多尺度核预测卷积神经网络模型,使用Adam学习率算法根据L1损失函数计算的误差进行训练得到训练好的多尺度核预测卷积神经网络模型;
步骤4:使用训练好的多尺度核预测卷积神经网络模型对低采样数下蒙特卡洛渲染得到的噪点图的漫反射组件和镜面反射组件进行降噪,并对降噪结果相加得到最终的降噪图。
进一步地,根据所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,所述数据集中的每个图像中都包含漫反射颜色cdiffuse、镜面反射颜色cspecular、颜色方差、辅助特征以及对应的辅助特征方差,其中所述颜色方差包括漫反射颜色方差和镜面反射颜色方差/>所述辅助特征包括法线fnormal、反照率falbedo和深度fdepth。
进一步地,根据所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,所述步骤1进一步包括如下步骤:
步骤1.1:对蒙特卡洛渲染图进行重要性采样得到采样后的数据集;
步骤1.2:对采样后的数据集进行预处理得到漫反射组件和镜面反射组件。
进一步地,根据所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,所述对蒙特卡洛渲染图进行重要性采样的方法为:首先采用随机投掷飞镖法在蒙特卡洛渲染图上均匀采样得到预设数量和大小的块patches,然后选择基于颜色方差和法线方差的pdf函数作为重要性指标对均匀采样得到的这些块patches进行重要性采样;所述pdf函数的计算方式为分别计算每个像素处的颜色方差和法线方差然后相加,最后将函数值范围映射到0到1。
进一步地,根据所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,所述对采样后的数据集进行预处理包括:将漫反射颜色除以反照率与一个极小数的和得到辐射照度颜色;针对镜面反射颜色数据进行了对数变换得到对数变换后的镜面反射颜色,以减小镜面反射颜色的变化范围;根据对漫反射颜色和镜面反射颜色进行的预处理,对数据集中的颜色方差进行相应的变换;将辅助特征中深度fdepth的数据范围映射到0~1范围。
进一步地,根据所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,所述多尺度核预测卷积神经网络模型由结构相同的输入数据为漫反射组件的漫反射多尺度卷积神经网络模型和输入数据为镜面反射组件的镜面反射多尺度卷积神经网络模型组成;所述漫反射多尺度卷积神经网络模型和镜面反射多尺度卷积神经网络模型均由1层卷积核大小为5*5的卷积层、输入通道数和输出通道数相同的8个多尺度残差块和8层卷积核大小为5*5的卷积层顺序串联构成。
进一步地,根据所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,所述多尺度残差块是一个二分支网络,其输入数据用Mn-1表示,输出数据用Mn表示,其不同的分支使用包含不同大小卷积核的卷积层,然后经过一层激活层Relu得到处理结果L1、L2,将L1、L2拼接后再通过两个不同大小卷积核的卷积层和一层激活层Relu后得到L3、L4,最后将L3、L4拼接并输入到一个卷积核大小为1*1的卷积层,输出数据用S表示,这样就得到了输入通道数和输出通道数相同的多尺度残差块,最后利用一个跳跃连接实现多尺度残差块的残差学习,即Mn=Mn-1+S。
进一步地,根据所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,使用Xavier初始化方法对多尺度核预测卷积神经网络模型的网络参数进行初始化获得初始化的核预测卷积神经网络模型。
进一步地,根据所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,所述步骤3包括如下步骤:
步骤3.1:将漫反射组件输入漫反射多尺度卷积神经网络模型Diffuse MSCN得到预测核1,将镜面反射组件输入镜面反射多尺度卷积神经网络模型Specular MSCN得到预测核2;
步骤3.2:使用预测核1对漫反射组件中的辐射照度颜色进行卷积运算得到降噪的辐射照度颜色,以及使用预测核2对镜面反射组件中的对数变换后的镜面反射颜色进行卷积运算得到降噪的对数变换后的镜面反射颜色;
步骤3.3:选择L1损失函数衡量训练过程中降噪结果数据与参考图数据的误差;
步骤3.4:基于步骤3.3计算得到的降噪结果数据与参考图数据的误差对多尺度核预测卷积神经网络模型使用Adam学习率算法进行训练,实现自适应地调整学习率,最后得到训练好的多尺度核预测卷积神经网络模型。
进一步地,根据所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,所述步骤4包括如下步骤:
步骤4.1:对低采样数下蒙特卡洛渲染得到的噪点图进行预处理得到漫反射组件和镜面反射组件,然后将漫反射颜色组件和镜面反射颜色组件输入训练好的多尺度核预测卷积神经网络模型,得到降噪的辐射照度颜色和降噪的对数变换后的镜面反射颜色;
步骤4.2:对降噪的辐射照度颜色和降噪的对数变换后的镜面反射颜色进行与步骤4.1中所述预处理相反的逆处理操作,并将逆处理操作获得的两部分颜色相加得到降噪图。
通过本发明所构思的以上技术方案较现有技术具有以下有益效果:通过对数据集进行重要性采样和预处理实现低重要性数据的清除和数据范围的转换,提高后续网络训练的质量和收敛速度;多尺度残差块使得网络能够在平衡计算量的基础上提高网络的多尺度特征学习能力;残差学习的方式能够学习噪点图、辅助特征以及参考图之间的非线性映射关系,拟合更加复杂的特征输入并且避免了深度网络中易出现的梯度消失或者梯度爆炸现象。综上所述,本发明方法的提出使得在使用蒙特卡洛渲染方法渲染图像时无需大量采样,只需要进行少数采样得到一个噪点图然后以降噪的方式得到一个降噪图,这有助于提高渲染效率,非常适用于真实感渲染等研究领域。
附图说明
图1为本发明基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法的总体流程图。
图2为本发明中多尺度核预测卷积神经网络模型的结构示意图。
图3为本发明中多尺度残差块的结构示意图。
图4(a)为一实施例噪点图;(b)为利用KPCN对图(a)进行降噪获得的降噪图;(c)为利用本发明方法对图(a)进行降噪获得的降噪图;(d)为与图(a)对应的参考图;(e)为另一实施例噪点图;(f)为利用KPCN对图(e)进行降噪获得的降噪图;(g)为利用本发明方法对图(e)进行降噪获得的降噪图;(h)为与图(e)对应的参考图;。
具体实施方式
为了使本发明的目的、技术方案及优势更加清晰,下面结合附图和具体实施例对本发明做进一步详细说明。此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明的核心思路是:构建并训练得到一个多尺度核预测卷积神经网络模型用来实现对低采样数下通过蒙特卡洛渲染得到的噪点图的降噪。此多尺度核预测卷积神经网络模型引入了一种具有多尺度特征融合特点和能够实现残差学习的多尺度残差块,通过在同一网络层利用两个不同大小的卷积核来对噪点图的不同尺度上的特征进行提取和融合同时利用跳层连接实现残差学习;此多尺度核预测卷积神经网络模型采用了深度网络,使得神经网络能够学习更复杂的非线性关系,拟合更加复杂的特征输入,使得多尺度核预测卷积神经网络模型能够更好地对噪点图进行降噪。
本实施方式的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,流程如图1所示,包括以下步骤:
步骤1:获取数据集,并对该数据集中的图像数据进行预处理得到漫反射组件和镜面反射组件;所述数据集中包括低采样数下通过蒙特卡洛渲染得到的若干噪点图和高采样数下通过蒙特卡洛渲染得到的噪点很少的若干参考图,其中图像大小为w*h,每个图像中都包含漫反射颜色cdiffuse、镜面反射颜色cspecular、颜色方差、辅助特征以及对应的辅助特征方差;其中颜色方差包括漫反射颜色方差和镜面反射颜色方差/>辅助特征包括法线fnormal、反照率falbedo和深度fdepth。
本实施方式获取的是迪士尼提供的深度学习降噪数据集Deep LearningDenoising Dataset,本实施方式对该数据集中的图像数据进行的预处理包括如下步骤:
步骤1.1:对蒙特卡洛渲染图进行重要性采样得到采样后的数据集;
采用随机投掷飞镖法(dart-throwing algorithm)在蒙特卡洛渲染图上均匀采样得到n_samples个64*64的块patches。随机投掷飞镖法在采样区域内不断投掷随机的采样点,然后计算当前采样点和已有的采样点的距离,若距离大于等于一个阈值就中标并将当前采样点纳入到采样点集合;若距离小于阈值则丢弃并重新投掷,直到采样点铺满整个区域。其中阈值计算公式如下所示:
其中r代表阈值,n_samples代表均匀采样数,pi表示π。本实施方式中图像大小w*h为1920*1080,并将n_samples设置为400,为了确保能够得到400个块patches,在采用随机投掷飞镖法的时候如若出现丢弃采样点的情况,以适当的比例rate缩小r,其中rate=0.96,此时r=rate*r,这样便可以在拒绝过多次采样点的选择后就接受此采样点。
然后对均匀采样得到的这些块patches进行重要性采样,选择基于颜色方差和法线方差的pdf函数作为重要性指标。因为颜色可以使得采样区域有很多噪声、细节或者纹理,而法线可以使得目标区域具有一定的几何复杂度。此pdf函数的计算方式为分别计算每个像素处的颜色方差和法线方差然后相加,最后将函数值范围映射到0到1,得到此pdf函数之后,便可以对之前均匀采样得到的n_samples个样本进行重要性选择,这样就得到采样后的数据集。
步骤1.2:对采样后的数据集进行预处理得到漫反射组件和镜面反射组件;
本实施方式中通过将漫反射颜色除以反照率和一个极小数的和得到辐射照度颜色;镜面反射颜色的数据变化范围较大,一个图像中的值可以跨越几个数量级,因此本实施方式中针对镜面反射颜色数据进行了对数变换得到对数变换后的镜面反射颜色,减小了镜面反射颜色的变化范围。处理公式如下:
其中,cdiffuse表示漫反射颜色,cspecular表示镜面反射颜色,falbedo表示辅助特征中的反照率,表示Hadamard除法,∈=0.00316,/>表示辐射照度颜色,/>表示对数变换后的镜面反射颜色。
由于本实施方式中对漫反射颜色和镜面反射颜色进行了预处理,因此本实施方式也对数据集中的颜色方差进行了相应的变换。通常如果应用一个变换h到一个随机变量X上,那么这个变换后数据的方差近似等于:其中μx和/>分别为变量X的均值和方差,h′表示对变量X求导。因此颜色方差的处理公式如下:
其中,表示cdiffuse的方差,/>表示cspecular的方差,/>表示的方差,/>表示/>的方差。
此外,由于辅助特征中深度fdepth的取值范围是任意的,因此本实施方式中将其数据范围映射到了0~1范围。
经过上述预处理后,对初始颜色(漫反射颜色或镜面反射颜色)、预处理后颜色(辐射照度颜色或者对数变换后的镜面反射颜色)、法线、反照率、预处理后深度以及相应的梯度和方差进行组合得到漫反射组件和镜面反射组件,其中初始颜色、预处理后颜色以及对应的梯度,法线、反照率以及对应的梯度均为3通道,其它数据为1通道,共28通道。
步骤2:构建多尺度核预测卷积神经网络模型并对网络参数进行初始化得到初始化的核预测卷积神经网络模型。模型的构建和初始化具体步骤如下:
步骤2.1:构建多尺度核预测卷积神经网络模型;
本实施方式所构建的多尺度核预测卷积神经网络模型如图2所示由均融合了多尺度残差块的漫反射多尺度卷积神经网络模型Diffuse Multi-Scale ConvulationalNetwork(Diffuse MSCN)和镜面反射多尺度卷积神经网络模型Specular Multi-ScaleConvulational Network(Specular MSCN)组成。两个模型的区别仅在输入数据分别是漫反射组件或镜面反射组件,下面具体解释漫反射多尺度卷积神经网络模型的构建。漫反射组件输入到漫反射多尺度卷积神经网络模型后,首先经过一层卷积核大小为5*5的卷积层,输入通道数为28(步骤1得到的28通道的漫反射组件),输出通道数为100;然后经过8个多尺度残差块,所述多尺度残差块如图3所示,其输入数据用Mn-1表示,输出数据用Mn表示,多尺度残差块是一个二分支网络,不同的分支使用包含不同大小卷积核(5*5和3*3)的卷积层,然后经过一层激活层Relu得到处理结果L1、L2,将L1、L2拼接后再通过两个不同卷积核大小的卷积层和一层激活层Relu后得到L3、L4,最后将L3、L4拼接并输入到一个卷积核大小为1*1且输出通道数为100的卷积层,输出数据用S表示,这样就得到了输入通道数和输出通道数相同的多尺度残差块,最后利用一个跳跃连接实现多尺度残差块的残差学习,即Mn=Mn-1+S;最后经过8层卷积核大小为5*5的卷积层,其中最后一层的卷积层输入通道数为100,输出通道数为441,即输出21*21的预测核,其余卷积层的输入通道数和输出通道数均为100。
步骤2.2:使用Xavier初始化方法初始化多尺度核预测卷积神经网络模型的网络参数并对训练超参进行初始化得到初始化的核预测卷积神经网络模型,具体初始化设置如下:
本发明中采用的网络参数初始化方法为Xavier方法,它为了保证前向传播和反向传播时每一层的方差一致,在正向传播时,每层的激活值的方差保持不变;在反向传播时,每层的梯度值的方差保持不变。根据每层的输入个数和输出个数来决定参数随机初始化的分布范围,是一个通过该层的输入和输出参数个数得到的分布范围内的均匀分布。此方法为了使得每一层的方差尽可能相等,使得网络中的信息更好地流动,将每一层权重初始化为如下范围内的均匀分布。
其中j代表第j层卷积层,n代表该卷积层共有n个参数。
对于训练超参,本实施方式中将学习率初始设置为e-4,batchsize设置为4,patchsize设置为64*64。
步骤3:将漫反射组件和镜面反射组件输入初始化的多尺度核预测卷积神经网络模型,使用Adam(Adaptive Moment Estimation)学习率算法根据L1损失函数计算的误差进行训练得到训练好的多尺度核预测卷积神经网络模型。
步骤3.1:将漫反射组件输入漫反射多尺度卷积神经网络模型Diffuse MSCN得到预测核1,将镜面反射组件输入镜面反射多尺度卷积神经网络模型Specular MSCN得到预测核2。
步骤3.2:分别使用预测核1和预测核2对漫反射组件中的辐射照度颜色和镜面反射组件中的对数变换后的镜面反射颜色进行卷积运算,得到降噪的辐射照度颜色和降噪的对数变换后的镜面反射颜色,即降噪结果数据。
步骤3.3:选择L1损失函数衡量训练过程中降噪结果数据与参考图数据的误差,它是一个非负值函数,损失函数越小,模型的鲁棒性就越好。L1损失函数的表示如下所示:
其中y代表参考图数据,代表降噪结果数据,i代表网络的第i层,m代表网络的总层数,y(i)表示网络的第i层参考图数据,/>表示网络的第i层降噪结果数据。
步骤3.4:基于步骤3.3计算得到的降噪结果数据与参考图数据的误差对多尺度核预测卷积神经网络模型使用Adam学习率算法进行训练,实现自适应的调整学习率,最后得到训练好的多尺度核预测卷积神经网络模型。
步骤4:使用训练好的多尺度核预测卷积神经网络模型对低采样数下蒙特卡洛渲染得到的噪点图的漫反射组件和镜面反射组件进行降噪,并对降噪结果相加得到降噪图,包括如下步骤:
步骤4.1:采用与所述步骤1中所述对图像数据进行预处理相同的方法对低采样数下蒙特卡洛渲染得到的噪点图进行预处理得到漫反射组件和镜面反射组件,然后将漫反射组件和镜面反射组件输入训练好的多尺度核预测卷积神经网络模型,进而在经过DiffuseMSCN和Specular MSCN后输出两个预测核,最后分别使用两个预测核对漫反射组件中的辐射照度颜色和镜面反射组件中的对数变换后的镜面反射颜色进行卷积运算,得到降噪的辐射照度颜色和降噪的对数变换后的镜面反射颜色;
步骤4.2:对降噪的辐射照度颜色和降噪的对数变换后的镜面反射颜色进行与步骤1中预处理相反的逆处理操作,然后将两部分颜色相加得到降噪图;
逆处理公式如下所示:
cdiffuse_real=cdiffuse_predict⊙(falbedo+∈)
其中⊙代表Hadamard乘法,∈=0.00316,cdiffuse_predict和cspecular_predict分别代表经过步骤4.1处理后得到的降噪的辐射照度颜色和降噪的对数变换后的镜面反射颜色,cdiffuse_real和cdiffuse_real即代表经过逆处理后得到的真正降噪结果值。
最后只需要将cdiffuse_real和cdiffuse_real相加即可得到最终降噪图。
为验证本发明方法的有效性,将Bako等提出的核预测卷积神经网络(KernelPredicting Convolutional Network,即KPCN)与本发明方法进行实验对比,以结构相似性(Structural Similarity,SSIM)作为衡量降噪图与参考图相似性的衡量指标,SSIM越大,表明降噪效果越好,实验对比结果如图4所示,其中图4(a)为一实施例噪点图;(b)为利用KPCN对图(a)进行降噪获得的降噪图;(c)为利用本发明方法对图(a)进行降噪获得的降噪图;(d)为与图(a)对应的参考图;(e)为另一实施例噪点图;(f)为利用KPCN对图(e)进行降噪获得的降噪图;(g)为利用本发明方法对图(e)进行降噪获得的降噪图;(h)为与图(e)对应的参考图。通过分别计算KPCN与本发明方法得到的降噪图与参考图的SSIM,得到图(b)与图(d)的SSIM为0.6576,图(c)与图(d)的SSIM为0.6666,图(f)与图(h)的SSIM为0.6608,图(g)与图(h)的SSIM为0.6615,可以发现本发明方法得到的降噪图与参考图的SSIM比KPCN方法得到的降噪图与参考图的SSIM值更大,表明本发明方法得到的降噪图与参考图更加相似,同时观察图(b)可以发现KPCN存在降噪结果过度模糊的现象,图(c)更加接近于参考图;观察图(f)和图(g)可以发现在细节处图(g)的颜色分布更加接近于参考图。
上述内容仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内所做的任何修改、等同替换和改进,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,其特征在于,该方法包括如下步骤:
步骤1:获取数据集,并对该数据集中的图像数据进行预处理得到漫反射组件和镜面反射组件;
所述数据集包括低采样数下通过蒙特卡洛渲染得到的若干噪点图和高采样数下通过蒙特卡洛渲染得到的若干参考图;
步骤2:构建多尺度核预测卷积神经网络模型并对其网络参数进行初始化得到初始化的核预测卷积神经网络模型;
步骤3:将漫反射组件和镜面反射组件输入初始化的多尺度核预测卷积神经网络模型,使用Adam学习率算法根据L1损失函数计算的误差进行训练得到训练好的多尺度核预测卷积神经网络模型;
所述L1损失函数的表示如下所示:
其中y代表参考图数据,代表降噪结果数据,i代表网络的第i层,m代表网络的总层数,y(i)表示网络的第i层参考图数据,/>表示网络的第i层降噪结果数据;
步骤4:使用训练好的多尺度核预测卷积神经网络模型对低采样数下蒙特卡洛渲染得到的噪点图的漫反射组件和镜面反射组件进行降噪,并对降噪结果相加得到最终的降噪图;
所述步骤1进一步包括如下步骤:
步骤1.1:对蒙特卡洛渲染图进行重要性采样得到采样后的数据集;
步骤1.2:对采样后的数据集进行预处理得到漫反射组件和镜面反射组件;
所述对蒙特卡洛渲染图进行重要性采样的方法为:首先采用随机投掷飞镖法在蒙特卡洛渲染图上均匀采样得到预设数量和大小的块patches,然后选择基于颜色方差和法线方差的pdf函数作为重要性指标对均匀采样得到的这些块patches进行重要性采样;所述pdf函数的计算方式为分别计算每个像素处的颜色方差和法线方差然后相加,最后将函数值范围映射到0到1;
所述多尺度核预测卷积神经网络模型由结构相同的输入数据为漫反射组件的漫反射多尺度卷积神经网络模型和输入数据为镜面反射组件的镜面反射多尺度卷积神经网络模型组成;
所述漫反射多尺度卷积神经网络模型和镜面反射多尺度卷积神经网络模型均由1层卷积核大小为5*5的卷积层、输入通道数和输出通道数相同的8个多尺度残差块和8层卷积核大小为5*5的卷积层顺序串联构成;
所述步骤3包括如下步骤:
步骤3.1:将漫反射组件输入漫反射多尺度卷积神经网络模型Diffuse MSCN得到预测核1,将镜面反射组件输入镜面反射多尺度卷积神经网络模型Specular MSCN得到预测核2;
步骤3.2:使用预测核1对漫反射组件中的辐射照度颜色进行卷积运算得到降噪的辐射照度颜色,以及使用预测核2对镜面反射组件中的对数变换后的镜面反射颜色进行卷积运算得到降噪的对数变换后的镜面反射颜色;
步骤3.3:选择L1损失函数衡量训练过程中降噪结果数据与参考图数据的误差;
步骤3.4:基于步骤3.3计算得到的降噪结果数据与参考图数据的误差对多尺度核预测卷积神经网络模型使用Adam学习率算法进行训练,实现自适应地调整学习率,最后得到训练好的多尺度核预测卷积神经网络模型。
2.根据权利要求1所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,其特征在于,所述数据集中的每个图像中都包含漫反射颜色cdiffuse、镜面反射颜色cspecular、颜色方差、辅助特征以及对应的辅助特征方差,其中所述颜色方差包括漫反射颜色方差和镜面反射颜色方差/>所述辅助特征包括法线fnormal、反照率falbedo和深度fdepth。
3.根据权利要求1所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,其特征在于,所述对采样后的数据集进行预处理包括:将漫反射颜色除以反照率与一个极小数0.00316的和得到辐射照度颜色;针对镜面反射颜色数据进行了对数变换得到对数变换后的镜面反射颜色,以减小镜面反射颜色的变化范围;根据对漫反射颜色和镜面反射颜色进行的预处理,对数据集中的颜色方差进行相应的变换;将辅助特征中深度fdepth的数据范围映射到0~1范围。
4.根据权利要求3所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,其特征在于,所述多尺度残差块是一个二分支网络,其输入数据用Mn-1表示,输出数据用Mn表示,其不同的分支使用包含不同大小卷积核的卷积层,然后经过一层激活层Relu得到处理结果L1、L2,将L1、L2拼接后再通过两个不同大小卷积核的卷积层和一层激活层Relu后得到L3、L4,最后将L3、L4拼接并输入到一个卷积核大小为1*1卷积层,输出数据用S表示,这样就得到了输入通道数和输出通道数相同的多尺度残差块,最后利用一个跳跃连接实现多尺度残差块的残差学习,即Mn=Mn-1+S。
5.根据权利要求1所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,其特征在于,使用Xavier初始化方法对多尺度核预测卷积神经网络模型的网络参数进行初始化获得初始化的核预测卷积神经网络模型。
6.根据权利要求5所述的基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法,其特征在于,所述步骤4包括如下步骤:
步骤4.1:对低采样数下蒙特卡洛渲染得到的噪点图进行预处理得到漫反射组件和镜面反射组件,然后将漫反射组件和镜面反射组件输入训练好的多尺度核预测卷积神经网络模型,得到降噪的辐射照度颜色和降噪的对数变换后的镜面反射颜色;
步骤4.2:对降噪的辐射照度颜色和降噪的对数变换后的镜面反射颜色进行与步骤4.1中所述预处理相反的逆处理操作,并将逆处理操作获得的两部分颜色相加得到降噪图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111215215.1A CN113947547B (zh) | 2021-10-19 | 2021-10-19 | 基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111215215.1A CN113947547B (zh) | 2021-10-19 | 2021-10-19 | 基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113947547A CN113947547A (zh) | 2022-01-18 |
CN113947547B true CN113947547B (zh) | 2024-04-09 |
Family
ID=79331485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111215215.1A Active CN113947547B (zh) | 2021-10-19 | 2021-10-19 | 基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113947547B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115797226B (zh) * | 2023-01-09 | 2023-04-25 | 腾讯科技(深圳)有限公司 | 图像降噪方法、装置、计算机设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242862A (zh) * | 2020-01-09 | 2020-06-05 | 西安理工大学 | 多尺度融合并行稠密残差卷积神经网络图像去噪方法 |
CN112184575A (zh) * | 2020-09-16 | 2021-01-05 | 华为技术有限公司 | 图像渲染的方法和装置 |
KR20210085373A (ko) * | 2019-12-30 | 2021-07-08 | 서경대학교 산학협력단 | 이미지 잡음제거용 뉴럴 네트워크에서 데이터 학습 방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10672109B2 (en) * | 2018-03-29 | 2020-06-02 | Pixar | Multi-scale architecture of denoising monte carlo renderings using neural networks |
-
2021
- 2021-10-19 CN CN202111215215.1A patent/CN113947547B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210085373A (ko) * | 2019-12-30 | 2021-07-08 | 서경대학교 산학협력단 | 이미지 잡음제거용 뉴럴 네트워크에서 데이터 학습 방법 |
CN111242862A (zh) * | 2020-01-09 | 2020-06-05 | 西安理工大学 | 多尺度融合并行稠密残差卷积神经网络图像去噪方法 |
CN112184575A (zh) * | 2020-09-16 | 2021-01-05 | 华为技术有限公司 | 图像渲染的方法和装置 |
Non-Patent Citations (3)
Title |
---|
基于分治采样的实时复杂光源照明;姚春晖;王斌;雍俊海;;计算机辅助设计与图形学学报;20110115(第01期);全文 * |
基于改进causality graph的分布式可伸缩事件关联机制;郭楠, 高天寒, 赵宏;通信学报;20040425(第04期);全文 * |
改进深度残差卷积神经网络的LDCT图像估计;高净植;刘;张权;桂志国;;计算机工程与应用;20180815(第16期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113947547A (zh) | 2022-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | An underwater image enhancement benchmark dataset and beyond | |
CN108986050B (zh) | 一种基于多分支卷积神经网络的图像和视频增强方法 | |
CN109754391B (zh) | 一种图像质量评价方法、装置及电子设备 | |
CN111507993A (zh) | 一种基于生成对抗网络的图像分割方法、装置及存储介质 | |
CN110148088B (zh) | 图像处理方法、图像去雨方法、装置、终端及介质 | |
CN112884668A (zh) | 基于多尺度的轻量级低光图像增强方法 | |
CN111179196B (zh) | 一种基于分而治之的多分辨率深度网络图像去高光方法 | |
Fan et al. | Multi-scale depth information fusion network for image dehazing | |
Sun et al. | Underwater image enhancement with reinforcement learning | |
Huang et al. | Color correction and restoration based on multi-scale recursive network for underwater optical image | |
Xu et al. | Deep retinex decomposition network for underwater image enhancement | |
CN115170915A (zh) | 一种基于端到端注意力网络的红外与可见光图像融合方法 | |
CN112651468A (zh) | 一种多尺度轻量化图像分类方法及其存储介质 | |
CN113947547B (zh) | 基于多尺度核预测卷积神经网络的蒙特卡洛渲染图降噪方法 | |
CN113592018A (zh) | 基于残差密集网络和梯度损失的红外光与可见光图像融合方法 | |
Zhou et al. | MSAR‐DefogNet: Lightweight cloud removal network for high resolution remote sensing images based on multi scale convolution | |
CN117197627B (zh) | 一种基于高阶退化模型的多模态图像融合方法 | |
Dwivedi et al. | Single image dehazing using extended local dark channel prior | |
Wang et al. | Adaptive feature fusion network based on boosted attention mechanism for single image dehazing | |
Luo et al. | A fast denoising fusion network using internal and external priors | |
CN116844008A (zh) | 一种注意力机制引导的内容感知无参考图像质量评价方法 | |
Liu et al. | Non-homogeneous haze data synthesis based real-world image dehazing with enhancement-and-restoration fused CNNs | |
CN108665455B (zh) | 图像显著性预测结果的评价方法和装置 | |
Guan et al. | DiffWater: Underwater Image Enhancement Based on Conditional Denoising Diffusion Probabilistic Model | |
Fu et al. | Jointly adversarial networks for wavelength compensation and dehazing of underwater images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |