CN108876764A

CN108876764A - 渲染图像获取方法、装置、系统和存储介质

Info

Publication number: CN108876764A
Application number: CN201810490256.3A
Authority: CN
Inventors: 马里千
Original assignee: Beijing Megvii Technology Co Ltd
Current assignee: Beijing Megvii Technology Co Ltd
Priority date: 2018-05-21
Filing date: 2018-05-21
Publication date: 2018-11-23

Abstract

本发明提供了一种渲染图像获取方法、装置、系统和存储介质，该方法包括：获取用于特定视觉任务训练的真实图像，并利用真实图像基于对抗学习训练渲染模型直到训练结束，渲染模型包括渲染器和分类器，分类器用于区分输入图像是真实的还是渲染得到的；获取渲染模型训练结束时渲染器采用的渲染参数作为最佳渲染参数，并采用渲染器基于最佳渲染参数生成用于特定视觉任务训练的最佳渲染图像。根据本发明实施例的渲染图像获取方法、装置、系统和存储介质利用对抗学习训练渲染器和分类器，使得能够针对特定逻辑的渲染器以及特定的计算机视觉任务全自动地选取效果最好的渲染参数，从而生成最佳渲染图像，能够有效且高效地提升计算机视觉任务的效果。

Description

渲染图像获取方法、装置、系统和存储介质

技术领域

本发明涉及计算机视觉技术领域，更具体地涉及一种渲染图像获取方法、装置、系统和存储介质。

背景技术

纯渲染图像或生成图像被广泛应用在计算机视觉领域，用于解决计算机视觉任务中训练数据不足、标注数据不足等问题。渲染图像的真实度在这个过程中尤其重要，过于虚假的渲染图像非常不利于计算机视觉任务效果的提升。

针对一个特定逻辑的渲染系统，渲染图像的真实性取决于渲染参数的选取，而目前并没有一个合理的方法来自动选取这些参数，基本靠人工经验，这基本决定了渲染数据对视觉任务效果的提升全靠人工经验，不仅效率低下且可靠性不高。

发明内容

本发明提出了一种关于渲染图像获取方案，其利用对抗学习训练渲染器和分类器，使得能够针对特定逻辑的渲染器以及特定的计算机视觉任务全自动地选取效果最好的渲染参数，从而生成最佳渲染图像，能够有效且高效地提升计算机视觉任务的效果。下面简要描述本发明提出的关于渲染图像获取方案，更多细节将在后续结合附图在具体实施方式中加以描述。

根据本发明一方面，提供了一种渲染图像获取方法，所述方法包括：获取用于特定视觉任务训练的真实图像，并利用所述真实图像基于对抗学习训练渲染模型直到训练结束，其中，所述渲染模型包括渲染器和分类器，所述分类器用于区分输入图像是真实的还是渲染得到的；以及获取所述渲染模型训练结束时所述渲染器采用的渲染参数作为最佳渲染参数，并采用所述渲染器基于所述最佳渲染参数生成用于所述特定视觉任务训练的最佳渲染图像。

在一个实施例中，所述利用所述真实图像基于对抗学习训练渲染模型直到训练结束包括：获取m个随机数，将所述m个随机数输入所述渲染器得到m个渲染图像，其中m为大于或等于1的整数；将所述m个渲染图像和所述真实图像中的n个图像分别输入所述分类器，得到m+n个分类结果，并基于所述m+n个分类结果计算所述分类器的损失函数，其中n为大于或等于1的整数；根据所述分类器的损失函数，采用梯度下降法更新所述分类器的参数，完成所述分类器的一次训练；计算所述m个渲染图像的每个渲染图像中每个像素值对所述渲染器当前采用的渲染参数的第一偏导数，并计算所述分类器的损失函数对输入所述分类器的每个渲染图像中每个像素值的第二偏导数；基于所述第一偏导数和所述第二偏导数计算当前渲染参数的梯度，并根据梯度下降法更新所述渲染器采用的渲染参数，从而完成所述渲染模型的一次训练；以及迭代上述步骤直到所述渲染模型训练结束。

在一个实施例中，所述基于所述第一偏导数和所述第二偏导数计算渲染参数的梯度包括：将所述第一偏导数与所述第二偏导数进行乘法运算，以得到所述分类器的损失函数对所述当前渲染参数的第三偏导数作为所述当前渲染参数的梯度。

在一个实施例中，所述根据梯度下降法更新所述渲染器采用的渲染参数包括：将所述第三偏导数与学习率进行乘法运算，并将所述当前渲染参数与所述乘法运算的结果进行减法运算以得到更新后的渲染参数。

在一个实施例中，所述基于所述m+n个分类结果计算所述分类器的损失函数包括：基于所述m+n个分类结果中的每一个计算一个子损失函数，并将得到的m+n个子损失函数之和作为所述分类器的损失函数，或者将得到的m+n个子损失函数的平均值作为所述分类器的损失函数。

在一个实施例中，在所述渲染模型进行初次训练时所述渲染器采用的渲染参数是经验性的初始渲染参数。

在一个实施例中，所述渲染参数包括光照属性和材质属性。

根据本发明另一方面，提供了一种渲染图像获取装置，所述装置包括：训练模块，用于获取用于特定视觉任务训练的真实图像，并利用所述真实图像基于对抗学习训练渲染模型直到训练结束，其中，所述渲染模型包括渲染器和分类器，所述分类器用于区分输入图像是真实的还是渲染得到的；以及生成模块，用于获取所述渲染模型训练结束时所述渲染器采用的渲染参数作为最佳渲染参数，并采用所述渲染器基于所述最佳渲染参数生成用于所述特定视觉任务训练的最佳渲染图像。

在一个实施例中，所述训练模块利用所述真实图像基于对抗学习训练渲染模型直到训练结束包括：获取m个随机数，将所述m个随机数输入所述渲染器得到m个渲染图像，其中m为大于或等于1的整数；将所述m个渲染图像和所述真实图像中的n个图像分别输入所述分类器，得到m+n个分类结果，并基于所述m+n个分类结果计算所述分类器的损失函数，其中n为大于或等于1的整数；根据所述分类器的损失函数，采用梯度下降法更新所述分类器的参数，完成所述分类器的一次训练；计算所述m个渲染图像的每个渲染图像中每个像素值对所述渲染器当前采用的渲染参数的第一偏导数，并计算所述分类器的损失函数对输入所述分类器的每个渲染图像中每个像素值的第二偏导数；基于所述第一偏导数和所述第二偏导数计算当前渲染参数的梯度，并根据梯度下降法更新所述渲染器采用的渲染参数，从而完成所述渲染模型的一次训练；以及迭代上述步骤直到所述渲染模型训练结束。

在一个实施例中，所述渲染参数包括光照属性和材质属性。

根据本发明又一方面，提供了一种渲染图像获取系统，所述系统包括存储装置和处理器，所述存储装置上存储有由所述处理器运行的计算机程序，所述计算机程序在被所述处理器运行时执行上述任一项所述的渲染图像获取方法。

根据本发明再一方面，提供了一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序在运行时执行上述任一项所述的渲染图像获取方法。

根据本发明实施例的渲染图像获取方法、装置、系统和存储介质利用对抗学习训练渲染器和分类器，使得能够针对特定逻辑的渲染器以及特定的计算机视觉任务全自动地选取效果最好的渲染参数，从而生成最佳渲染图像，能够有效且高效地提升计算机视觉任务的效果。

附图说明

通过结合附图对本发明实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与本发明实施例一起用于解释本发明，并不构成对本发明的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1示出用于实现根据本发明实施例的渲染图像获取方法、装置、系统和存储介质的示例电子设备的示意性框图；

图2示出根据本发明实施例的渲染图像获取方法的示意性流程图；

图3示出根据本发明实施例的渲染图像获取装置的示意性框图；以及

图4示出根据本发明实施例的渲染图像获取系统的示意性框图。

具体实施方式

为了使得本发明的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。

首先，参照图1来描述用于实现本发明实施例的渲染图像获取方法、装置、系统和存储介质的示例电子设备100。

如图1所示，电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106以及输出装置108，这些组件通过总线系统110和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子设备100的组件和结构只是示例性的，而非限制性的，根据需要，所述电子设备也可以具有其他组件和结构。

所述处理器102可以是中央处理单元(CPU)、图像处理单元(GPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器102可以运行所述程序指令，以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。

所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音)，并且可以包括显示器、扬声器等中的一个或多个。

示例性地，用于实现根据本发明实施例的渲染图像获取方法和装置的示例电子设备可以被实现诸如智能手机、平板电脑等等移动终端。

下面，将参考图2描述根据本发明实施例的渲染图像获取方法200。如图2所示，渲染图像获取方法200可以包括如下步骤：

在步骤S210，获取用于特定视觉任务训练的真实图像，并利用所述真实图像基于对抗学习训练渲染模型直到训练结束，其中，所述渲染模型包括渲染器和分类器，所述分类器用于区分输入图像是真实的还是渲染得到的。

在一个实施例中，特定的视觉任务可以指特定的渲染对象、渲染场景等，其中渲染对象可以为人、动物、车辆等具体的对象，渲染场景可以为室内场景、室外场景等具体场景。为了特定视觉任务的训练，需要高真实度的渲染图像来弥补训练数据不足的缺陷。为了获得高真实度的渲染图像，本发明的方法首先获取用于特定视觉任务训练的真实图像，然后利用真实图像基于对抗学习训练渲染模型来得到最佳渲染参数，从而生成最佳渲染图像。示例性地，真实图像可以为图片数据、视频数据或其他任何可以获得真实图像的数据形式。此处，真实图像是与渲染生成的图像(即渲染图像)相对应的术语，并无其他限制作用。

在本发明的实施例中，基于对抗学习训练渲染器和分类器的方法来获取渲染器的最佳渲染参数，无需人工经验，不仅效率高，而且可靠性高。此外，基于能够自动获取最佳渲染参数的渲染器即可大大强化渲染图像真实度，而无需采用深度学习模型。

具体地，利用真实图像基于对抗学习训练渲染模型直到训练结束的过程可以进一步包括：获取m个随机数，将所述m个随机数输入所述渲染器得到m个渲染图像，其中m为大于或等于1的整数；将所述m个渲染图像和所述真实图像中的n个图像分别输入所述分类器，得到m+n个分类结果，并基于所述m+n个分类结果计算所述分类器的损失函数，其中n为大于或等于1的整数；根据所述分类器的损失函数，采用梯度下降法更新所述分类器的参数，完成所述分类器的一次训练；计算所述m个渲染图像的每个渲染图像中每个像素值对所述渲染器当前采用的渲染参数的第一偏导数，并计算所述分类器的损失函数对输入所述分类器的每个渲染图像中每个像素值的第二偏导数；基于所述第一偏导数和所述第二偏导数计算当前渲染参数的梯度，并根据梯度下降法更新所述渲染器采用的渲染参数，从而完成所述渲染模型的一次训练；以及迭代上述步骤直到所述渲染模型训练结束。此处，渲染模型训练结束是指：所述分类器的损失函数收敛或所述渲染模型的训练次数达到了预设次数。

其中，所述基于所述m+n个分类结果计算所述分类器的损失函数可以包括：基于所述m+n个分类结果中的每一个计算一个子损失函数，并将得到的m+n个子损失函数之和作为所述分类器的损失函数，或者将得到的m+n个子损失函数的平均值作为所述分类器的损失函数。此外，所述基于所述第一偏导数和所述第二偏导数计算渲染参数的梯度可以包括：将所述第一偏导数与所述第二偏导数进行乘法运算，以得到所述分类器的损失函数对所述当前渲染参数的第三偏导数作为所述当前渲染参数的梯度。所述根据梯度下降法更新所述渲染器采用的渲染参数可以包括：将所述第三偏导数与学习率进行乘法运算，并将所述当前渲染参数与所述乘法运算的结果进行减法运算以得到更新后的渲染参数。

此处，第一偏导数、第二偏导数是为了将像素值对渲染参数的偏导数与损失函数对像素值的偏导数进行区分而如此命名，并无其他限制作用。同样地，第三偏导数表示渲染参数的梯度(即分类器的损失函数对渲染参数的偏导数)也是为了与前述的第一偏导数、第二偏导数进行区分而如此命名，并无其他限制作用。

在上述训练过程中，在渲染模型初次训练时，渲染器所采用的渲染参数可以为经验性的初始渲染参数(例如通过经验设置的光照属性和材质属性等渲染参数)，基于初始渲染参数得到初始渲染图像，同时，可以计算初始渲染图像中每个像素值(即像素的颜色值)对(每个)初始渲染参数的偏导数。然后，将所得到的渲染图像以及获取的真实图像分别输入到分类器，由分类器判断输入图像是真实图像还是渲染图像，例如分类器可以输出布尔值，以表示它将输入图像判定为真实图像还是渲染图像。接着，根据分类器输出的分类结果计算分类器的损失函数，并根据分类器的损失函数利用梯度下降法更新分类器的参数，以完成分类器的一次训练。最后，基于分类器的损失函数对输入分类器的初始渲染图像中每个像素值的偏导数和之前计算得到的初始渲染图像中每个像素值对初始渲染参数的偏导数计算出每个初始渲染参数的梯度，然后根据梯度下降法将初始渲染参数更新为新的渲染参数，用于由渲染器进行下一次渲染时使用，到此完成渲染模型的一次训练，接着回到最开始由渲染器(采用更新后的渲染参数而不是初始渲染参数)生成渲染图像的步骤，如此迭代，直到分类器的损失函数达到收敛或渲染模型的训练次数达到了预设次数。其中，分类器的损失函数可以采用现有的或将来出现的各种表达方式，本申请对此不作限定。例如，分类器的损失函数可表示为分类器的准确率。

现在继续参考图2，在步骤S220，获取所述渲染模型训练结束时所述渲染器采用的渲染参数作为最佳渲染参数，并采用所述渲染器基于所述最佳渲染参数生成用于所述特定视觉任务训练的最佳渲染图像。

经过步骤S210的对抗学习训练，在渲染模型训练结束时，可以获取渲染器此时采用的渲染参数，该渲染参数即为该特定逻辑的渲染系统针对特定计算机视觉任务可用的效果最好的渲染参数，基于该渲染参数，可以生成最佳渲染图像，从而使渲染图像得到真实感强化，得到高真实性的渲染图像用于特定视觉任务的训练。

基于上面的描述，根据本发明实施例的渲染图像获取方法利用对抗学习训练渲染器和分类器，使得能够针对特定逻辑的渲染器以及特定的计算机视觉任务全自动地选取效果最好的渲染参数，从而生成最佳渲染图像，能够有效且高效地提升计算机视觉任务的效果。

以上示例性地描述了根据本发明实施例的渲染图像获取方法。示例性地，根据本发明实施例的渲染图像获取方法可以在具有存储器和处理器的设备、装置或者系统中实现。

此外，根据本发明实施例的渲染图像获取方法可以方便地部署到智能手机、平板电脑、个人计算机等移动设备上。替代地，根据本发明实施例的渲染图像获取方法还可以部署在服务器端(或云端)。替代地，根据本发明实施例的渲染图像获取方法还可以分布地部署在服务器端(或云端)和个人终端处。

下面结合图3描述本发明另一方面提供的渲染图像获取装置。图3示出了根据本发明实施例的渲染图像获取装置300的示意性框图。

如图3所示，根据本发明实施例的渲染图像获取装置300包括训练模块310和生成模块320。所述各个模块可分别执行上文中结合图2描述的渲染图像获取方法的各个步骤/功能。以下仅对渲染图像获取装置300的各模块的主要功能进行描述，而省略以上已经描述过的细节内容。

训练模块310用于获取用于特定视觉任务训练的真实图像，并利用所述真实图像基于对抗学习训练渲染模型直到训练结束，其中，所述渲染模型包括渲染器和分类器，所述分类器用于区分输入图像是真实的还是渲染得到的。生成模块320用于获取所述渲染模型训练结束时所述渲染器采用的渲染参数作为最佳渲染参数，并采用所述渲染器基于所述最佳渲染参数生成用于所述特定视觉任务训练的最佳渲染图像。训练模块310和生成模块320均可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

在一个实施例中，特定的视觉任务可以指特定的渲染对象、渲染场景等，其中渲染对象可以为人、动物、车辆等具体的对象，渲染场景可以为室内场景、室外场景等具体场景。为了特定视觉任务的训练，需要高真实度的渲染图像来弥补训练数据不足的缺陷。为了获得高真实度的渲染图像，训练模块310首先获取用于特定视觉任务训练的真实图像，然后利用真实图像基于对抗学习训练渲染模型来得到最佳渲染参数，从而由生成模块320生成最佳渲染图像。示例性地，真实图像可以为图片数据、视频数据或其他任何可以获得真实图像的数据形式。此处，真实图像是与渲染生成的图像(即渲染图像)相对应的术语，并无其他限制作用。

在本发明的实施例中，训练模块310基于对抗学习训练渲染器和分类器来使生成模块320获取渲染器的最佳渲染参数，无需人工经验，不仅效率高，而且可靠性高。此外，基于能够自动获取最佳渲染参数的渲染器即可大大强化渲染图像真实度，而无需采用深度学习模型。

具体地，训练模块320利用真实图像基于对抗学习训练渲染模型直到训练结束的操作可以进一步包括：获取m个随机数，将所述m个随机数输入所述渲染器得到m个渲染图像，其中m为大于或等于1的整数；将所述m个渲染图像和所述真实图像中的n个图像分别输入所述分类器，得到m+n个分类结果，并基于所述m+n个分类结果计算所述分类器的损失函数，其中n为大于或等于1的整数；根据所述分类器的损失函数，采用梯度下降法更新所述分类器的参数，完成所述分类器的一次训练；计算所述m个渲染图像的每个渲染图像中每个像素值对所述渲染器当前采用的渲染参数的第一偏导数，并计算所述分类器的损失函数对输入所述分类器的每个渲染图像中每个像素值的第二偏导数；基于所述第一偏导数和所述第二偏导数计算当前渲染参数的梯度，并根据梯度下降法更新所述渲染器采用的渲染参数，从而完成所述渲染模型的一次训练；以及迭代上述步骤直到所述渲染模型训练结束。此处，渲染模型训练结束是指：所述分类器的损失函数收敛或所述渲染模型的训练次数达到了预设次数。

经过训练模块310的对抗学习训练，在渲染模型训练结束时，生成模块320可以获取渲染器此时采用的渲染参数，该渲染参数即为该特定逻辑的渲染系统针对特定计算机视觉任务可用的效果最好的渲染参数，基于该渲染参数，渲染器可以生成最佳渲染图像，从而使渲染图像得到真实感强化，得到高真实性的渲染图像用于特定视觉任务的训练。

基于上面的描述，根据本发明实施例的渲染图像获取装置利用对抗学习训练渲染器和分类器，使得能够针对特定逻辑的渲染器以及特定的计算机视觉任务全自动地选取效果最好的渲染参数，从而生成最佳渲染图像，能够有效且高效地提升计算机视觉任务的效果。

图4示出了根据本发明实施例的渲染图像获取系统400的示意性框图。渲染图像获取系统400包括存储装置410以及处理器420。

其中，存储装置410存储用于实现根据本发明实施例的渲染图像获取方法中的相应步骤的程序代码。处理器420用于运行存储装置410中存储的程序代码，以执行根据本发明实施例的渲染图像获取方法的相应步骤，并且用于实现根据本发明实施例的渲染图像获取装置中的相应模块。

在一个实施例中，在所述程序代码被处理器420运行时使得渲染图像获取系统400执行以下步骤：获取用于特定视觉任务训练的真实图像，并利用所述真实图像基于对抗学习训练渲染模型直到训练结束，其中，所述渲染模型包括渲染器和分类器，所述分类器用于区分输入图像是真实的还是渲染得到的；以及获取所述渲染模型训练结束时所述渲染器采用的渲染参数作为最佳渲染参数，并采用所述渲染器基于所述最佳渲染参数生成用于所述特定视觉任务训练的最佳渲染图像。

在一个实施例中，在所述程序代码被处理器420运行时使得渲染图像获取系统400执行的利用所述真实图像基于对抗学习训练渲染模型直到训练结束包括：获取m个随机数，将所述m个随机数输入所述渲染器得到m个渲染图像，其中m为大于或等于1的整数；将所述m个渲染图像和所述真实图像中的n个图像分别输入所述分类器，得到m+n个分类结果，并基于所述m+n个分类结果计算所述分类器的损失函数，其中n为大于或等于1的整数；根据所述分类器的损失函数，采用梯度下降法更新所述分类器的参数，完成所述分类器的一次训练；计算所述m个渲染图像的每个渲染图像中每个像素值对所述渲染器当前采用的渲染参数的第一偏导数，并计算所述分类器的损失函数对输入所述分类器的每个渲染图像中每个像素值的第二偏导数；基于所述第一偏导数和所述第二偏导数计算当前渲染参数的梯度，并根据梯度下降法更新所述渲染器采用的渲染参数，从而完成所述渲染模型的一次训练；以及迭代上述步骤直到所述渲染模型训练结束。

在一个实施例中，在所述程序代码被处理器420运行时使得渲染图像获取系统400执行的所述基于所述第一偏导数和所述第二偏导数计算渲染参数的梯度包括：将所述第一偏导数与所述第二偏导数进行乘法运算，以得到所述分类器的损失函数对所述当前渲染参数的第三偏导数作为所述当前渲染参数的梯度。

在一个实施例中，在所述程序代码被处理器420运行时使得渲染图像获取系统400执行的所述根据梯度下降法更新所述渲染器采用的渲染参数包括：将所述第三偏导数与学习率进行乘法运算，并将所述当前渲染参数与所述乘法运算的结果进行减法运算以得到更新后的渲染参数。

在一个实施例中，在所述程序代码被处理器420运行时使得渲染图像获取系统400执行的所述基于所述m+n个分类结果计算所述分类器的损失函数包括：基于所述m+n个分类结果中的每一个计算一个子损失函数，并将得到的m+n个子损失函数之和作为所述分类器的损失函数，或者将得到的m+n个子损失函数的平均值作为所述分类器的损失函数。

在一个实施例中，所述渲染参数包括光照属性和材质属性。

此外，根据本发明实施例，还提供了一种存储介质，在所述存储介质上存储了程序指令，在所述程序指令被计算机或处理器运行时用于执行本发明实施例的渲染图像获取方法的相应步骤，并且用于实现根据本发明实施例的渲染图像获取装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合。

在一个实施例中，所述计算机程序指令在被计算机运行时可以实现根据本发明实施例的渲染图像获取装置的各个功能模块，并且/或者可以执行根据本发明实施例的渲染图像获取方法。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行以下步骤：获取用于特定视觉任务训练的真实图像，并利用所述真实图像基于对抗学习训练渲染模型直到训练结束，其中，所述渲染模型包括渲染器和分类器，所述分类器用于区分输入图像是真实的还是渲染得到的；以及获取所述渲染模型训练结束时所述渲染器采用的渲染参数作为最佳渲染参数，并采用所述渲染器基于所述最佳渲染参数生成用于所述特定视觉任务训练的最佳渲染图像。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行的利用所述真实图像基于对抗学习训练渲染模型直到训练结束包括：获取m个随机数，将所述m个随机数输入所述渲染器得到m个渲染图像，其中m为大于或等于1的整数；将所述m个渲染图像和所述真实图像中的n个图像分别输入所述分类器，得到m+n个分类结果，并基于所述m+n个分类结果计算所述分类器的损失函数，其中n为大于或等于1的整数；根据所述分类器的损失函数，采用梯度下降法更新所述分类器的参数，完成所述分类器的一次训练；计算所述m个渲染图像的每个渲染图像中每个像素值对所述渲染器当前采用的渲染参数的第一偏导数，并计算所述分类器的损失函数对输入所述分类器的每个渲染图像中每个像素值的第二偏导数；基于所述第一偏导数和所述第二偏导数计算当前渲染参数的梯度，并根据梯度下降法更新所述渲染器采用的渲染参数，从而完成所述渲染模型的一次训练；以及迭代上述步骤直到所述渲染模型训练结束。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行的所述基于所述第一偏导数和所述第二偏导数计算渲染参数的梯度包括：将所述第一偏导数与所述第二偏导数进行乘法运算，以得到所述分类器的损失函数对所述当前渲染参数的第三偏导数作为所述当前渲染参数的梯度。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行的所述根据梯度下降法更新所述渲染器采用的渲染参数包括：将所述第三偏导数与学习率进行乘法运算，并将所述当前渲染参数与所述乘法运算的结果进行减法运算以得到更新后的渲染参数。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行的所述基于所述m+n个分类结果计算所述分类器的损失函数包括：基于所述m+n个分类结果中的每一个计算一个子损失函数，并将得到的m+n个子损失函数之和作为所述分类器的损失函数，或者将得到的m+n个子损失函数的平均值作为所述分类器的损失函数。

在一个实施例中，所述渲染参数包括光照属性和材质属性。

根据本发明实施例的渲染图像获取装置中的各模块可以通过根据本发明实施例的渲染图像获取的电子设备的处理器运行在存储器中存储的计算机程序指令来实现，或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。

根据本发明实施例，还提供了一种计算机程序，该计算机程序可以存储在云端或本地的存储介质上。在该计算机程序被计算机或处理器运行时用于执行本发明实施例的渲染图像获取方法的相应步骤，并且用于实现根据本发明实施例的渲染图像获取装置中的相应模块。

尽管这里已经参考附图描述了示例实施例，应理解上述示例实施例仅仅是示例性的，并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改，而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个设备，或一些特征可以忽略，或不执行。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该本发明的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如相应的权利要求书所反映的那样，其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域的技术人员可以理解，除了特征之间相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上所述，仅为本发明的具体实施方式或对具体实施方式的说明，本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种渲染图像生成方法，其特征在于，所述方法包括：

获取用于特定视觉任务训练的真实图像，并利用所述真实图像基于对抗学习训练渲染模型直到训练结束，其中，所述渲染模型包括渲染器和分类器，所述分类器用于区分输入图像是真实的还是渲染得到的；以及

获取所述渲染模型训练结束时所述渲染器采用的渲染参数作为最佳渲染参数，并采用所述渲染器基于所述最佳渲染参数生成用于所述特定视觉任务训练的最佳渲染图像。

2.根据权利要求1所述的方法，其特征在于，所述利用所述真实图像基于对抗学习训练渲染模型直到训练结束包括：

获取m个随机数，将所述m个随机数输入所述渲染器得到m个渲染图像，其中m为大于或等于1的整数；

将所述m个渲染图像和所述真实图像中的n个图像分别输入所述分类器，得到m+n个分类结果，并基于所述m+n个分类结果计算所述分类器的损失函数，其中n为大于或等于1的整数；

根据所述分类器的损失函数，采用梯度下降法更新所述分类器的参数，完成所述分类器的一次训练；

计算所述m个渲染图像的每个渲染图像中每个像素值对所述渲染器当前采用的渲染参数的第一偏导数，并计算所述分类器的损失函数对输入所述分类器的每个渲染图像中每个像素值的第二偏导数；

基于所述第一偏导数和所述第二偏导数计算当前渲染参数的梯度，并根据梯度下降法更新所述渲染器采用的渲染参数，从而完成所述渲染模型的一次训练；以及

迭代上述步骤直到所述渲染模型训练结束。

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一偏导数和所述第二偏导数计算渲染参数的梯度包括：

将所述第一偏导数与所述第二偏导数进行乘法运算，以得到所述分类器的损失函数对所述当前渲染参数的第三偏导数作为所述当前渲染参数的梯度。

4.根据权利要求3所述的方法，其特征在于，所述根据梯度下降法更新所述渲染器采用的渲染参数包括：

将所述第三偏导数与学习率进行乘法运算，并将所述当前渲染参数与所述乘法运算的结果进行减法运算以得到更新后的渲染参数。

5.根据权利要求2所述的方法，其特征在于，所述基于所述m+n个分类结果计算所述分类器的损失函数包括：

基于所述m+n个分类结果中的每一个计算一个子损失函数，并将得到的m+n个子损失函数之和作为所述分类器的损失函数，或者将得到的m+n个子损失函数的平均值作为所述分类器的损失函数。

6.根据权利要求2至5中任一项所述的方法，其特征在于，在所述渲染模型进行初次训练时所述渲染器采用的渲染参数是经验性的初始渲染参数。

7.根据权利要求1至5中任一项所述的方法，其特征在于，所述渲染参数包括光照属性和材质属性。

8.一种渲染图像生成装置，其特征在于，所述装置包括：

训练模块，用于获取用于特定视觉任务训练的真实图像，并利用所述真实图像基于对抗学习训练渲染模型直到训练结束，其中，所述渲染模型包括渲染器和分类器，所述分类器用于区分输入图像是真实的还是渲染得到的；以及

生成模块，用于获取所述渲染模型训练结束时所述渲染器采用的渲染参数作为最佳渲染参数，并采用所述渲染器基于所述最佳渲染参数生成用于所述特定视觉任务训练的最佳渲染图像。

9.根据权利要求8所述的装置，其特征在于，所述训练模块利用所述真实图像基于对抗学习训练渲染模型直到训练结束包括：

迭代上述步骤直到所述渲染模型训练结束。

10.一种渲染图像生成系统，其特征在于，所述系统包括存储装置和处理器，所述存储装置上存储有由所述处理器运行的计算机程序，所述计算机程序在被所述处理器运行时执行如权利要求1-7中的任一项所述的渲染图像生成方法。

11.一种存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序在运行时执行如权利要求1-7中的任一项所述的渲染图像生成方法。