CN111833238B

CN111833238B - 图像的翻译方法和装置、图像翻译模型的训练方法和装置

Info

Publication number: CN111833238B
Application number: CN202010484274.8A
Authority: CN
Inventors: 杨少雄; 赵晨
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-06-01
Filing date: 2020-06-01
Publication date: 2023-07-25
Anticipated expiration: 2040-06-01
Also published as: CN111833238A; EP3920130A1; US20210374924A1; KR102521013B1; JP2021190088A; JP7419226B2; KR20210149574A; US11526971B2

Abstract

本申请公开了图像的翻译方法和装置、图像翻译模型的训练方法和装置，涉及深度学习和图像处理技术领域。具体实现方案为：获取图像翻译请求，其中，翻译请求中包括原图像；对原图像进行处理，以生成与原图像对应的预翻译图像、掩膜图像及变形参数；根据变形参数将原图像进行变形处理，以获取变形图像；以及将变形图像、预翻译图像及掩膜图像进行融合，以生成目标翻译图像。由此，不仅提高了生成的目标翻译图像的清晰度，而且生成的目标翻译图像的背景部分也和原始图片一致，从而能够实现图像的无缝融合，大大提高了生成的目标翻译图像的自然度。

Description

图像的翻译方法和装置、图像翻译模型的训练方法和装置

技术领域

本申请涉及图像处理技术领域，具体涉及深度学习和图像处理技术领域，尤其涉及图像的翻译方法和装置、图像翻译模型的训练方法和装置。

背景技术

图像翻译网络能够在不改变图像内容的前提下，将一种类型的图像直接转换为另一种类型的图像，在图像生成、场景分割、图像风格化等领域有着广泛的应用。

相关技术中，一般是采用传统的图像翻译方法，例如，基于CycleGAN的图像转换方法，对图像进行翻译。然而，通过传统的图像翻译方法仅仅能够实现将一种类型的图像直接转换为另一种类型的图像，转换后的图像的清晰度较低，并且转换后的图像的背景部分也和原始图像存在差异，导致图像在融合时有明显的边框，无法做到自然衔接和无缝融合。

发明内容

提供了一种图像的翻译方法和装置、图像翻译模型的训练方法和装置、电子设备以及存储介质。

根据第一方面，提供了一种图像的翻译方法，包括：获取图像翻译请求，其中，所述翻译请求中包括原图像；对所述原图像进行处理，以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数；根据所述变形参数将所述原图像进行变形处理，以获取变形图像；以及将所述变形图像、所述预翻译图像及所述掩膜图像进行融合，以生成目标翻译图像。

根据第二方面，提供了一种图像翻译模型的训练方法，包括：获取训练样本集，其中，所述训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集；利用第一初始生成器对所述第一图像集中的图像分别进行处理，以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集；根据所述第一变形参数集，将所述第一图像集中的图像分别进行变形处理，以获取第一变形图像集；将所述第一变形图像集、所述第一预翻译图像集及所述第一掩膜图像集中的对应图像分别进行融合，以获取第三图像集；将所述第三图像集中的图像及所述第二图像集中的图像，分别输入至第一初始判别器，以获取所述第一初始判别器输出的所述第三图像集中的图像分别属于真实图像的第一概率集、及所述第二图像集中的图像分别属于真实图像的第二概率集；以及根据所述第一概率集及所述第二概率集，对所述第一初始生成器及所述第一初始判别器进行修正，以生成属于第一域的目标生成器，其中，所述属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。

根据第三方面，提供了一种图像的翻译装置，包括：第一获取模块，用于获取图像翻译请求，其中，所述翻译请求中包括原图像；第一处理模块，用于对所述原图像进行处理，以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数；第二处理模块，用于根据所述变形参数将所述原图像进行变形处理，以获取变形图像；以及第一融合模块，用于将所述变形图像、所述预翻译图像及所述掩膜图像进行融合，以生成目标翻译图像。

根据第四方面，提供了一种图像翻译模型的训练装置，包括：第二获取模块，用于获取训练样本集，其中，所述训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集；第三处理模块，用于利用第一初始生成器对所述第一图像集中的图像分别进行处理，以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集；第四处理模块，用于根据所述第一变形参数集，将所述第一图像集中的图像分别进行变形处理，以获取第一变形图像集；第二融合模块，用于将所述第一变形图像集、所述第一预翻译图像集及所述第一掩膜图像集中的对应图像分别进行融合，以获取第三图像集；第三获取模块，用于将所述第三图像集中的图像及所述第二图像集中的图像，分别输入至第一初始判别器，以获取所述第一初始判别器输出的所述第三图像集中的图像分别属于真实图像的第一概率集、及所述第二图像集中的图像分别属于真实图像的第二概率集；以及第一修正模块，用于根据所述第一概率集及所述第二概率集，对所述第一初始生成器及所述第一初始判别器进行修正，以生成属于第一域的目标生成器，其中，所述属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。

根据第五方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上所述的图像的翻译方法或者图像翻译模型的训练方法。

根据第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行如上所述的图像的翻译方法或者图像翻译模型的训练方法。

根据第七方面，提供了一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上所述的图像的翻译方法或者图像翻译模型的训练方法的步骤。

根据本申请的技术，解决了通过传统的图像翻译方法对图像进行翻译时，转换后的图像的清晰度较低，并且转换后的图像的背景部分也和原始图像存在差异，导致图像在融合时有明显的边框，无法做到自然衔接和无缝融合的技术问题，充分利用了原始图像输入的高清和丰富的高频细节信息，不仅提高了生成的目标翻译图像的清晰度，而且生成的目标翻译图像的背景部分也和原始图片一致，从而能够实现图像的无缝融合，大大提高了生成的目标翻译图像的自然度。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1为本申请实施例提供的一种图像的翻译方法的流程示意图；

图2a-2e为本申请实施例提供的在男女人脸性别转换的应用场景中原图像、预翻译图像、掩膜图像、变形图像和目标翻译图像的示意图；

图3为本申请实施例提供的另一种图像的翻译方法的流程示意图；

图4为本申请实施例提供的又一种图像的翻译方法的流程示意图；

图5为本申请实施例提供的一种图像的翻译装置的结构示意图；

图6为本申请实施例提供的另一种图像的翻译装置的结构示意图；

图7为本申请实施例提供的又一种图像的翻译装置的结构示意图；

图8为本申请实施例提供的一种图像翻译模型的训练方法的流程示意图；

图9为本申请实施例提供的另一种图像翻译模型的训练方法的流程示意图；

图10为本申请实施例提供的一种图像翻译模型的训练装置的结构示意图；

图11为本申请实施例提供的另一种图像翻译模型的训练装置的结构示意图；

图12为用来实现本申请实施例的图像的翻译方法或者图像翻译模型的训练方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

下面参考附图描述本申请实施例的图像的翻译方法和装置、图像翻译模型的训练方法和装置以及电子设备和存储介质。

本申请针对相关技术中，通过传统的图像翻译方法对图像进行翻译时，转换后的图像的清晰度较低，并且转换后的图像的背景部分也和原始图像存在差异，导致图像在融合时有明显的边框，无法做到自然衔接和无缝融合的问题，提出一种图像的翻译方法。

本申请提供的图像的翻译方法，首先获取图像翻译请求，然后对图像翻译请求中的原图像进行处理，以生成与原图像对应的预翻译图像、掩膜图像及变形参数，进而根据变形参数将原图像进行变形处理，以获取变形图像，最后将变形图像、预翻译图像及掩膜图像进行融合，以生成目标翻译图像。由此，生成的目标翻译图像中，包含了由原图像变形生成的变形图像，从而使得目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息，不仅提高了生成的目标翻译图像的清晰度，而且生成的目标翻译图像的背景部分也和原始图片一致，从而能够实现图像的无缝融合，大大提高了生成的目标翻译图像的自然度。

图1为本申请实施例提供的一种图像的翻译方法的流程示意图。

需要说明的是，本申请实施例的图像的翻译方法的执行主体为图像的翻译装置，图像的翻译装置可以被配置在电子设备中，以实现在根据变形参数将原图像进行变形处理，以获取变形图像后，再将变形图像、预翻译图像及掩膜图像进行融合，以生成目标翻译图像。其中，电子设备可以是任意能够进行数据处理的终端设备或服务器等，本申请对此不作限制。

如图1所示，图像的翻译方法，可以包括以下步骤：

步骤101，获取图像翻译请求，其中，翻译请求中可包括原图像。

在实际应用中，在不同的场景中可通过不同的实施方式获取图像翻译请求。作为一种可能的实现方式，用户可通过输入框输入图像翻译请求指令。

作为另一种可能的实现方式，当获取到用户对图像翻译程序的触发操作时，认为获取到图像翻译请求，例如，用户点击触控显示屏上的开始进行图像翻译的按钮时，认为获取到图像翻译请求。

作为又一种可能的实现方式，可以预先在图像翻译程序的消息控制类之中设置有钩子函数，从而根据该钩子函数检测图像翻译请求消息。具体地，在用户发送图像翻译请求时，会发送触发消息，此时，消息控制类函数被调用，因此，设置在消息控制类函数的钩子函数可以检测到该消息控制类函数的调用，并根据当前触发消息控制类函数的消息类型可以识别出图像翻译请求消息。

步骤102，对原图像进行处理，以生成与原图像对应的预翻译图像、掩膜图像及变形参数。

其中，预翻译图像为对原图像直接进行翻译后得到的图像。变形参数为对原图像进行处理时，确定的原图像需要变形的参数信息，即原图像中每个像素点需要平移的距离，也就是说，变形参数中包括每个像素点对应的x轴方向的平移量及y轴方向的平移量；掩膜图像为一种图像滤镜处理的模板，其中，掩膜图像的主要作用为：用掩模对图像上某些区域作屏蔽，使其不参加处理或不参加处理参数的计算；或者，用相似性变量或图像匹配方法检测和提取图像中与掩模相似的结构特征。

举例而言，在男女人脸性别转换的应用场景中，若原图像为男性脸的图像(如图2a)，在直接将男性脸转换为女性脸后，可生成未融合的女性化脸，即与原图像对应的预翻译图像(如图2b)。

需要说明的是，若原图像的分辨率为256*256，那么预翻译图像的分辨率也为256*256，变形参数为256*256组，每组变形参数中包括x轴方向参数及y轴方向参数。。

也就是说，在从翻译请求中获取到原图像后，可先对原图像进行相应的处理，以获取与原图像对应的预翻译图像，同时获取对应的掩膜图像(例如，在男女人脸性别转换的应用场景中，掩膜图像可如图2c所示)和变形参数，然后基于预翻译图像、变形参数和掩膜图像获取与原图像对应的目标翻译图像。

步骤103，根据变形参数将原图像进行变形处理，以获取变形图像。

其中，可通过图像变换工具根据变形参数对原图像进行相应的改变，以生成变形图像。

举例而言，当原图像为原始男性脸的图像，若变形参数中，用于指示男性眉毛区域的变形方式为沿y轴方向变窄，则通过图像变换工具根据变形参数，对原图像进行变形后，如图2d所示，获得的变形图像中原始男性脸的眉毛会变窄，从而使其更加接近女性眉毛特征。

步骤104，将变形图像、预翻译图像及掩膜图像进行融合，以生成目标翻译图像。

具体而言，在实际操作过程中，如果仅是对原图像进行处理，以生成预设翻译图像，并将预设翻译图像作为最终的输出的图像，那么生成的图像不仅清晰度较低，而且转换后的图像的背景部分也和原始图像存在差异，导致图像在融合时有明显的边框，无法做到自然衔接和无缝融合。

因此，本申请中在对原图像进行处理后，除了生成与原图像对应的预翻译图像，还生成对应的掩膜图像和变形参数，然后根据变形参数将原图像进行变形处理，以获取变形图像，最后将变形图像和预翻译图像按照掩膜图像中的权重进行融合操作以生成目标翻译图像(例如，在男女人脸性别转换的应用场景中，目标翻译图像可如图2e所示)。由此，由于变形图像是由原图像直接变形得到的，其保留了原图像的细节信息，从而使融合后得到的目标翻译图像通过掩膜图像将变形图像和预翻译图像进行融合操作，能够充分利用原始图像输入的高清和丰富的高频细节信息，从而不仅提高了生成的目标翻译图像的清晰度，而且生成的目标翻译图像的背景部分也和原始图片一致，能够实现图像的无缝融合，大大提高了生成的目标翻译图像的自然度。

举例而言，作为另一种可能的实施方式，通过上述的图像的翻译方法还可对图像的风格进行转换，例如，可将男性/女性脸的图像转换为油画、水彩画、国画等风格。以将男性/女性脸的图像转换为油画为例，当获取到图像翻译请求后，首先可直接将男性/女性脸的图像转换为未融合的油画风格的男性/女性脸的图像，即与原图像对应的预翻译图像，同时获取对应的掩膜图像和变形参数，然后根据变形参数将原图像进行变形处理，例如，变形参数中，用于指示线条轮廓区域的变形方式为沿x轴和y轴方向均变宽，则通过图像变换工具根据变形参数，对原图像进行变形后，获得的变形图像中原始男性/女性脸的图像中的线条均变宽，以得到对应的变形图像，最后将变形图像和预翻译图像按照掩膜图像中的权重进行融合操作以生成目标翻译图像。由此，可实现将将男性/女性脸的图像转换为油画风格，其中，将男性/女性脸的图像转换为水彩画、国画等风格方式也与上述方式类似，为避免冗余，在此不再详述。

需要说明的是，在上述实施例中，可通过目标生成器对原图像进行处理，以生成与原图像对应的预翻译图像、掩膜图像及变形参数。其中，在不同的应用场景中，目标生成器的获取方式也是不同的。

作为一种可能的实现方式，可先获取目标翻译图像所属的第一域，以根据目标翻译图像所属的第一域获取目标生成器。对应的，在本申请的一个实施例中，翻译请求中还包括目标翻译图像所属的第一域，因此，在上述步骤101之后，还包括：

根据目标翻译图像所属的第一域，获取目标生成器。

相应的，上述步骤102可包括：

利用目标生成器，对原图像进行处理，以生成与原图像对应的预翻译图像、掩膜图像及变形参数。

其中，在图像翻译领域，利用不同的域来区分原图像与目标翻译图像的区别。举例来说，进行性别翻译时，男性人脸图像和女性人脸图像分别为位于不同域的图像，或者，将图像中的苹果翻译成橘子时，包含苹果的图像和包含橘子的图像分别属于不同的域。

相应的，在本申请中目标翻译图像所属的第一域，为包含某一种指定对象的图像，比如女性人脸的图像，或者，包含苹果的对象等。

具体而言，在对不同的域中的图像进行翻译时，使用的生成器也不同，因此本公开在接收到翻译请求，并从翻译请求中获取到目标翻译图像所属的第一域后，可根据目标翻译图像所属的第一域确定与目标翻译图像所属的第一域对应的生成器。如果与目标翻译图像所属的第一域对应的生成器仅有一种，那么可根据目标翻译图像所属的第一域直接确定出对应的目标生成器。

举例而言，当目标翻译图像所属的第一域为女性人脸时，可确定出与该目标翻译图像对应的生成器仅有男性脸变女性脸的生成器，因此，可确定出目标生成器为男性脸变女性脸的生成器；当目标翻译图像所属的第一域为小孩脸时，可确定出该目标翻译图像对应的生成器仅有老人脸变小孩脸的生成器，因此，可确定出目标生成器为老人脸变小孩脸的生成器。

进一步地，在确定出目标生成器后，可通过目标生成器直接对原图像进行相应的处理，以生成与原图像对应的预翻译图像、掩膜图像及变形参数。

由此，在对原图像进行处理之前，能够根据目标翻译图像所属的第一域确定出专属的目标生成器对原图像进行相应的处理，从而大大提高了图像处理的效率和准确度。

需要说明的是，在实际操作过程中，也存在与目标翻译图像所属的第一域对应的生成器为多种的情况。

对应地，如果与目标翻译图像所属的第一域对应的生成器有N种，N为大于1的整数，则在上述步骤101之后，还包括：

对原图像进行识别，以确定原图像所属的第二域；以及根据原图像所属的第二域及目标翻译图像所属的第一域，从N种生成器中选取目标生成器。

具体而言，在根据目标翻译图像所属的第一域确定出与目标翻译图像所属的第一域对应的生成器有多种时，可对原图像进行识别，以获取原图像所属的第二域，然后根据目标翻译图像所属的第一域和原图像所属的第二域，从多种生成器中选取出一种生成器以作为目标生成器。

举例而言，当目标翻译图像所属的第一域为包含苹果的图像时，根据该目标翻译图像所属的第一域，可确定出与目标翻译图像所属的第一域对应的生成器有橘子变苹果生成器、鸭梨变苹果生成器、桃子变苹果生成器等多种生成器。此时，如果确定出原图像所属的第二域为包含橘子的图像，则可从上述多个生成器中选取出橘子变苹果生成器作为目标生成器。

由此，在根据目标翻译图像所属的第一域确定出与其对应的生成器为多种时，进一步根据原图像所属的第二域从多种生成器中选取出唯一的一种生成器作为目标生成器，以对原图像进行相应的处理，从而进一步提高了图像处理的效率和准确度。

作为另一种可能的实现方式，还可先获取原图像所属的第二域，以根据原图像所属的第二域获取目标生成器。对应的，在本申请的另一个实施例中，在上述步骤101之后，还包括：

对原图像进行识别，以确定原图像所属的第二域；以及根据原图像所属的第二域，获取目标生成器。

相应的，上述步骤102可包括：

具体而言，在获取到原图像后，可对原图像进行识别，以获取原图像所属的第二域。在确定出原图像所属的第二域后，可根据原图像所属的第二域确定与原图像所属的第二域对应的生成器。如果与原图像所属的第二域对应的生成器仅有一种，那么可根据原图像所属的第二域直接确定出对应的目标生成器。

举例而言，当确定出原图像所属的第二域为男性脸时，可确定出与原图像所属的第二域对应的生成器仅有男性脸变女性脸的生成器，因此，可确定出目标生成器为男性脸变女性脸的生成器；当确定出原图像所属的第二域为老人脸时，可确定出与原图像所属的第二域对应的生成器仅有老人脸变小孩脸的生成器，因此，可确定出目标生成器为老人脸变小孩脸的生成器。

由此，在对原图像进行处理之前，能够根据原图像所属的第二域确定出专属的目标生成器对原图像进行相应的处理，从而大大提高了图像处理的效率和准确度。

需要说明的是，在实际操作过程中，也存在与原图像所属的第二域对应的生成器为多种的情况。对应地，如果与原图像所属的第二域对应的生成器有N种，N为大于1的整数，则在上述步骤101之后，还包括：

获取目标翻译图像所属的第一域；以及根据目标翻译图像所属的第一域及原图像所属的第二域，从N种生成器中选取目标生成器。

具体而言，在确定出与原图像所属的第二域对应的生成器有多种时，可获取目标翻译图像所属的第一域。其中，如果在翻译请求中包括目标翻译图像所属的第一域，则可直接从翻译请求中获取目标翻译图像所属的第一域；如果在翻译请求中未包括目标翻译图像所属的第一域，则在确定与原图像所属的第二域对应的生成器有多种时，可弹出目标翻译图像所属的第一域的选择项，以便于用户根据目标翻译图像的图像类型和特征信息进行选择。在确定出目标翻译图像所属的第一域后，可根据目标翻译图像所属的第一域和原图像所属的第二域，从多种生成器中选取出一种生成器以作为目标生成器。

举例而言，当原图像所属的第二域为橘子时，根据原图像所属的第二域，可确定出与原图像所属的第二域对应的生成器有橘子变苹果生成器、橘子变鸭梨生成器、橘子变桃子生成器等多种生成器。此时，如果获取到目标翻译图像所属的第一域为鸭梨，则可从上述多个生成器中选取出橘子变鸭梨生成器作为目标生成器。

由此，在根据原图像所属的第二域确定出与其对应的生成器为多种时，进一步根据目标翻译图像所属的第一域从多种生成器中选取出唯一的一种生成器作为目标生成器，以对原图像进行相应的处理，从而进一步提高了图像处理的效率和准确度。

需要说明的是，在对图像进行处理时，一般是提取出该图像中的特征信息，并通过对特征信息进行相应的处理，以实现对图像的处理。

下面结合图3进行说明，如图3所示，上述步骤102具体包括：

步骤201，对原图像进行处理，以获取原图像中包含的目标对象在第一域的特征。

其中，目标对象为原图像中与目标翻译图像相比发生改变的对象。比如，如果原图像为包含男性人脸的图像，目标翻译图像为与男性人脸对应的女性人脸，则目标对象为原图像中的男性人脸。对应的，目标对象在第一域的特征可包括目标对象的特征和目标对象的背景部分的特征。

步骤202，根据目标对象在第一域的特征，重建目标对象在第二域的图像，以生成与原图像对应的预翻译图像、掩膜图像及变形参数。

具体地，生成器在获取到目标对象在第一域的特征后，可对目标对象的特征进行解码，以重建目标对象在第二域中的图像，以生成预翻译图像，并在对目标对象进行重建的过程中，生成掩膜图像及变形参数。

可以理解的是，预翻译图像、掩膜图像及变形参数，均是根据目标对象在第一域中的特征生成的，即掩膜图像及变形参数，都是根据预翻译图像与原图像的差异生成的，从而使得最后融合了掩膜图像及根据变形参数得到的变形图像的目标翻译图像，更准确。

进一步而言，为了生成高清晰度和高自然度的目标翻译图像，在获取到与原图像对应的预翻译图像、掩膜图像及变形参数后，还可根据变形参数将原图像进行变形处理，以获取变形图像，并将变形图像和预翻译图像按照掩膜图像中的权重进行融合操作以生成目标翻译图像。

下面结合图4来详细说明如何生成目标翻译图像，如图4所示，上述步骤104具体包括：

步骤301，根据掩膜图像中各像素点的像素值，确定预翻译图像的第一权重及变形图像的第二权重。

步骤302，根据第一权重及第二权重，将预翻译图像中各像素点的像素值与变形图像中各像素点的像素值进行融合，以生成目标翻译图像。

具体而言，可根据掩膜图像中各像素点的像素值，确定预翻译图像的第一权重及变形图像的第二权重，从而根据第一权重和第二权重的权重比，获取目标翻译图像的各像素点中，预翻译图像的像素值与变形图像中的像素值的比值，从而根据该比值将预翻译图像中各像素点的像素值与变形图像中各像素点的像素值进行融合。

在实际使用时，掩膜图像中像素点的像素值，可以是预翻译图像中同一像素点的权重，也可以是变形图像中同一像素点的权重。比如，若掩膜图像中第i个像素点的像素值为0.7，则可以确定预翻译图像中第i个像素点的权重为0.7(或0.3)，相应的，变形图像中第i个像素点的权重为0.3(或0.7)，若预翻译图像中第i个像素点的像素值为10，变形图像中第i个像素点的像素值为30，那么融合生成的目标翻译图像中第i个像素点的像素值为22或24。

由此，通过将变形图像和预翻译图像中的各像素点的像素值，分别按照掩膜图像的权重进行融合操作，从而使得融合生成的目标翻译图像中各个像素点的像素值即能满足翻译需求，又能够充分体现原始图像的高清和丰富的高频细节信息，从而不仅提高了生成的目标翻译图像的清晰度，而且生成的目标翻译图像的背景部分也和原始图片一致，能够实现图像的无缝融合，大大提高了生成的目标翻译图像的自然度。

综上所述，本申请提供的图像的翻译方法，首先获取图像翻译请求，然后对图像翻译请求中的原图像进行处理，以生成与原图像对应的预翻译图像、掩膜图像及变形参数，进而根据变形参数将原图像进行变形处理，以获取变形图像，最后将变形图像、预翻译图像及掩膜图像进行融合，以生成目标翻译图像。由此，生成的目标翻译图像中，包含了由原图像变形生成的变形图像，从而使得目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息，不仅提高了生成的目标翻译图像的清晰度，而且生成的目标翻译图像的背景部分也和原始图片一致，从而能够实现图像的无缝融合，大大提高了生成的目标翻译图像的自然度。

为了实现上述实施例，本申请实施例还提出一种图像的翻译装置。该图像的翻译装置可设置在电子设备中。图5为本申请实施例提供的一种图像的翻译装置的结构示意图。

如图5所示，该图像的翻译装置400可包括第一获取模块410、第一处理模块420、第二处理模块430和第一融合模块440。

其中，第一获取模块410用于获取图像翻译请求，其中，所述翻译请求中包括原图像；第一处理模块420用于对所述原图像进行处理，以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数；第二处理模块430用于根据所述变形参数将所述原图像进行变形处理，以获取变形图像；以及第一融合模块440用于将所述变形图像、所述预翻译图像及所述掩膜图像进行融合，以生成目标翻译图像。

在本申请实施例一种可能的实现方式中，翻译请求中还包括目标翻译图像所属的第一域，第一获取模块410在获取图像翻译请求之后，还用于：根据目标翻译图像所属的第一域，获取目标生成器；第一处理模块420具体用于：利用目标生成器，对原图像进行处理，以生成与原图像对应的预翻译图像、掩膜图像及变形参数。

在本申请实施例另一种可能的实现方式中，如果与目标翻译图像所属的第一域对应的生成器有N种，N为大于1的整数，则第一获取模块410在获取图像翻译请求之后，还用于：对原图像进行识别，以确定原图像所属的第二域；以及根据原图像所属的第二域及目标翻译图像所属的第一域，从N种生成器中选取目标生成器。

在本申请实施例又一种可能的实现方式中，第一获取模块410在获取图像翻译请求之后，还用于：对原图像进行识别，以确定原图像所属的第二域；以及根据原图像所属的第二域，获取目标生成器；第一处理模块420具体用于：利用目标生成器，对原图像进行处理，以生成与原图像对应的预翻译图像、掩膜图像及变形参数。

在本申请实施例再一种可能的实现方式中，如果与原图像所属的第二域对应的生成器有N种，N为大于1的整数，则第一获取模块410在获取图像翻译请求之后，还用于：获取目标翻译图像所属的第一域；以及根据目标翻译图像所属的第一域及原图像所属的第二域，从N种生成器中选取目标生成器。

图6为本申请实施例提供的另一种图像的翻译装置的结构示意图。在本申请实施例一种可能的实现方式中，如图6所示，第一处理模块420可包括：第一处理单元421和重构单元422。

其中，第一处理单元421用于对原图像进行处理，以获取原图像中包含的目标对象在第一域的特征；重构单元422用于根据目标对象在第一域的特征，重建目标对象在第二域的图像，以生成与原图像对应的预翻译图像、掩膜图像及变形参数。

图7为本申请实施例提供的又一种图像的翻译装置的结构示意图。在本申请实施例一种可能的实现方式中，如图7所示，第一融合模块440可包括：确定单元441和第一融合单元442。

其中，确定单元441用于根据掩膜图像中各像素点的像素值，确定预翻译图像的第一权重及变形图像的第二权重；以及第一融合单元442用于根据第一权重及第二权重，将预翻译图像中各像素点的像素值与变形图像中各像素点的像素值进行融合，以生成目标翻译图像。

需要说明的是，本申请实施例的图像的翻译装置中未披露的细节，请参照本申请实施例的图像的翻译方法中所披露的细节，具体这里不再赘述。

本申请实施例的图像的翻译装置，首先通过第一获取模块获取图像翻译请求，其中，翻译请求中包括原图像，然后通过第一处理模块对原图像进行处理，以生成与原图像对应的预翻译图像、掩膜图像及变形参数，进而通过第二处理模块根据变形参数将原图像进行变形处理，以获取变形图像，最后通过第一融合模块将变形图像、预翻译图像及掩膜图像进行融合，以生成目标翻译图像。由此，生成的目标翻译图像中，包含了由原图像变形生成的变形图像，从而使得目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息，不仅提高了生成的目标翻译图像的清晰度，而且生成的目标翻译图像的背景部分也和原始图片一致，从而能够实现图像的无缝融合，大大提高了生成的目标翻译图像的自然度。

为了实现上述实施例，本申请实施例还提出一种图像翻译模型的训练方法，以通过图像翻译模型实现上述的图像的翻译方法。图7为本申请实施例提供的一种图像翻译模型的训练方法的流程示意图。

需要说明的是，本申请实施例的图像翻译模型的训练方法的执行主体为图像翻译模型的训练装置，图像翻译模型的训练装置可以被配置在电子设备中，以实现对图像翻译模型进行训练，从而得到第一生成器。其中，电子设备可以是任意能够进行数据处理的终端设备或服务器等，本申请对此不作限制。

如图8所示，图像翻译模型的训练方法可包括以下步骤:

步骤701，获取训练样本集。

其中，训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集。

步骤702，利用第一初始生成器对第一图像集中的图像分别进行处理，以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集。

步骤703，根据第一变形参数集，将第一图像集中的图像分别进行变形处理，以获取第一变形图像集。

步骤704，将第一变形图像集、第一预翻译图像集及第一掩膜图像集中的对应图像分别进行融合，以获取第三图像集。

步骤705，将第三图像集中的图像及第二图像集中的图像，分别输入至第一初始判别器，以获取第一初始判别器输出的第三图像集中的图像分别属于真实图像的第一概率集、及第二图像集中的图像分别属于真实图像的第二概率集。

步骤706，根据第一概率集及第二概率集，对第一初始生成器及第一初始判别器进行修正，以生成属于第一域的目标生成器。其中，属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。

其中，第一图像集中的图像分别与第二图像集中的图像一一匹配。

具体而言，当训练样本集中的第一图像集中的图像与第二图像集中的图像一一匹配时，可将第一图像集中的图像作为第一初始生成器的输入，以通过第一初始生成器对第一图像集中的图像分别进行翻译，以获取属于第二域的第三图像集，其中，对第一图像集中的图像分别进行翻译的过程可参见上述实施例中提出的图像的翻译方法，为避免冗余，在此不再详述。

在获取到第三图像集后，可将第三图像集中的图像及第二图像集中的图像，分别输入至第一初始判别器，以通过第一初始判别器输出第三图像集中的图像分别属于真实图像的第一概率集、及第二图像集中的图像分别属于真实图像的第二概率集。此时，可通过比较第一概率集和第二概率集的大小，对第一初始生成器及第一初始判别器进行修正。

其中，当第一概率集与第二概率集偏差较大时，则说明通过第一初始生成器对图像进行翻译时，误差较大，因此，需要对第一初始生成器和第一初始判别器进行相应的修正，以获取属于第一域的目标生成器；当第一概率集与第二概率集偏差较小时，则说明通过第一初始生成器对图像进行翻译时，误差较小，因此，无需对第一初始生成器和第一初始判别器进行相应的修正，可直接将第一初始生成器作为属于第一域的目标生成器。其中，可将属于第一域的目标生成器作为一种图像翻译模型，以将位于第一域的图像翻译成位于第二域的图像。

由此，对图像翻译模型进行训练，并通过训练后的图像翻译模型对图像进行翻译，生成的目标翻译图像中，包含了由原图像变形生成的变形图像，从而使得目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息，不仅提高了生成的目标翻译图像的清晰度，而且生成的目标翻译图像的背景部分也和原始图片一致，从而能够实现图像的无缝融合，大大提高了生成的目标翻译图像的自然度，并且，该图像翻译模型的训练方法简单高效，图像翻译模型的负载也较低。

需要说明的是，如果第一图像集中的图像与第二图像集中的图像未匹配，则通过上述实施例获取到的第三图像集中的图像与第二图像集中的图像也不匹配，因此，根据第一概率集及第二概率集并无法准确地对第一初始生成器及第一初始判别器进行修正，从而使得生成的图像翻译模型的误差较大。

因此，在本申请的一个实施例中，当第一图像集中的图像与第二图像集中的图像未匹配时，如图9所示，在上述步骤706之后，该方法还包括：

步骤801，利用第二初始生成器对第三图像集中的图像分别进行处理，以生成第二预翻译图像集、第二掩膜图像集及第二变形参数集。

步骤802，根据第二变形参数集，将第三图像集中的图像分别进行变形处理，以获取第二变形图像集。

步骤803，将第二变形图像集、第二预翻译图像集及第二掩膜图像集中的对应图像分别进行融合，以获取第四图像集。

步骤804，将第四图像集中的图像及第一图像集中的图像，分别输入至第二初始判别器，以获取第二初始判别器输出的第四图像集中的图像分别属于真实图像的第三概率集、及第一图像集中的图像分别属于真实图像的第四概率集。

步骤805，根据第三概率集及第四概率集，对第一初始生成器、第二初始生成器、第一初始判别器及第二初始判别器进行修正，以生成属于第一域的目标生成器及属于第二域的目标生成器。其中，属于第一域的目标生成器，用于将位于第一域的图像翻译成位于第二域的图像，属于第二域的目标生成器，用于将位于第二域的图像翻译成位于第一域的图像。

具体而言，当训练样本集中的第一图像集中的图像与第二图像集中的图像不匹配时，可将第三图像集中的图像作为第二初始生成器的输入，以通过第二初始生成器对第三图像集中的图像分别进行翻译，以获取属于第一域的第四图像集，其中，对第三图像集中的图像分别进行翻译的过程可参见上述实施例中提出的图像的翻译方法，为避免冗余，在此不再详述。

在获取到第四图像集后，可将第四图像集中的图像及第一图像集中的图像，分别输入至第二初始判别器，以通过第二初始判别器输出第四图像集中的图像分别属于真实图像的第三概率集、及第一图像集中的图像分别属于真实图像的第四概率集。此时，可通过比较第三概率集和第四概率集的大小对第一初始生成器、第二初始生成器、第一初始判别器及第二初始判别器进行修正。

其中，当第三概率集和第四概率集偏差较大时，则说明通过第一初始生成器和第二初始生成器对图像进行翻译时，误差较大，因此，需要对第一初始生成器、第二初始生成器、第一初始判别器及第二初始判别器进行相应的修正，以获取属于第一域的目标生成器和属于第二域的目标生成器；当第三概率集和第四概率集偏差较小时，则说明通过第一初始生成器和第二初始生成器对图像进行翻译时，误差较小，因此，无需对第一初始生成器、第二初始生成器、第一初始判别器及第二初始判别器进行修正，可直接将第一初始生成器作为属于第一域的目标生成器，并将第二初始生成器作为属于第二域的目标生成器。其中，可将属于第一域的目标生成器作为一种图像翻译模型，以将位于第一域的图像翻译成位于第二域的图像，并可将属于第二域的目标生成器作为另一种图像翻译模型，以将位于第二域的图像翻译成位于第一域的图像，其中，该实施例中的属于第一域的目标生成器可与上述实施例中的属于第一域的目标生成器相同，也可以不同，具体可根据实际情况进行选择。

综上所述，本申请提供的图像翻译模型的训练方法，获取训练样本集，其中，训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集，并利用第一初始生成器对第一图像集中的图像分别进行处理，以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集，以及根据第一变形参数集，将第一图像集中的图像分别进行变形处理，以获取第一变形图像集，并将第一变形图像集、第一预翻译图像集及第一掩膜图像集中的对应图像分别进行融合，以获取第三图像集，以及将第三图像集中的图像及第二图像集中的图像，分别输入至第一初始判别器，以获取第一初始判别器输出的第三图像集中的图像分别属于真实图像的第一概率集、及第二图像集中的图像分别属于真实图像的第二概率集，并根据第一概率集及第二概率集，对第一初始生成器及第一初始判别器进行修正，以生成属于第一域的目标生成器，其中，属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。由此，对图像翻译模型进行训练，并通过训练后的图像翻译模型对图像进行翻译，生成的目标翻译图像中，包含了由原图像变形生成的变形图像，从而使得目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息，不仅提高了生成的目标翻译图像的清晰度，而且生成的目标翻译图像的背景部分也和原始图片一致，从而能够实现图像的无缝融合，大大提高了生成的目标翻译图像的自然度，并且，该图像翻译模型的训练方法简单高效，图像翻译模型的负载也较低。

为了实现上述实施例，本申请实施例还提出一种图像翻译模型的训练装置。该图像翻译模型的训练装置可设置在电子设备中。图10为本申请实施例提供的一种图像翻译模型的训练装置的结构示意图。

如图10所示，该图像翻译模型的训练装置900可包括第二获取模块901、第三处理模块902、第四处理模块903、第二融合模块904、第三获取模块905和第一修正模块906。

其中，第二获取模块901用于获取训练样本集，其中，训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集；第三处理模块902用于利用第一初始生成器对第一图像集中的图像分别进行处理，以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集；第四处理模块903用于根据第一变形参数集，将第一图像集中的图像分别进行变形处理，以获取第一变形图像集；第二融合模块904用于将第一变形图像集、第一预翻译图像集及第一掩膜图像集中的对应图像分别进行融合，以获取第三图像集；第三获取模块905用于将第三图像集中的图像及第二图像集中的图像，分别输入至第一初始判别器，以获取第一初始判别器输出的第三图像集中的图像分别属于真实图像的第一概率集、及第二图像集中的图像分别属于真实图像的第二概率集；以及第一修正模块906用于根据第一概率集及第二概率集，对第一初始生成器及第一初始判别器进行修正，以生成属于第一域的目标生成器，其中，属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。

在本申请的一个实施例中，第一图像集中的图像分别与第二图像集中的图像一一匹配。

图11为本申请实施例提供的另一种图像翻译模型的训练装置的结构示意图。在本申请实施例一种可能的实现方式中，第一图像集中的图像与第二图像集中的图像未匹配，如图11所示，该训练装置还包括：第五处理模块907、第六处理模块908、第三融合模块909、第四获取模块910和第二修正模块911。

其中，第五处理模块907用于利用第二初始生成器对第三图像集中的图像分别进行处理，以生成第二预翻译图像集、第二掩膜图像集及第二变形参数集；第六处理模块908用于根据第二变形参数集，将第三图像集中的图像分别进行变形处理，以获取第二变形图像集；第三融合模块909用于将第二变形图像集、第二预翻译图像集及第二掩膜图像集中的对应图像分别进行融合，以获取第四图像集；第四获取模块910用于将第四图像集中的图像及第一图像集中的图像，分别输入至第二初始判别器，以获取第二初始判别器输出的第四图像集中的图像分别属于真实图像的第三概率集、及第一图像集中的图像分别属于真实图像的第四概率集；以及第二修正模块911用于根据第三概率集及第四概率集，对第一初始生成器、第二初始生成器、第一初始判别器及第二初始判别器进行修正，以属于第一域的目标生成器及属于第二域的目标生成器，其中，属于第一域的目标生成器，用于将位于第一域的图像翻译成位于第二域的图像，属于第二域的目标生成器，用于将位于第二域的图像翻译成位于第一域的图像。

需要说明的是，本申请实施例的图像翻译模型的训练装置中未披露的细节，请参照本申请实施例的图像翻译模型的训练方法中所披露的细节，具体这里不再赘述。

本申请实施例的图像翻译模型的训练装置，通过第二获取模块获取训练样本集，其中，训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集，并通过第三处理模块利用第一初始生成器对第一图像集中的图像分别进行处理，以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集，以及通过第四处理模块根据第一变形参数集，将第一图像集中的图像分别进行变形处理，以获取第一变形图像集，并通过第二融合模块将第一变形图像集、第一预翻译图像集及第一掩膜图像集中的对应图像分别进行融合，以获取第三图像集，以及通过第三获取模块将第三图像集中的图像及第二图像集中的图像，分别输入至第一初始判别器，以获取第一初始判别器输出的第三图像集中的图像分别属于真实图像的第一概率集、及第二图像集中的图像分别属于真实图像的第二概率集，并通过第一修正模块根据第一概率集及第二概率集，对第一初始生成器及第一初始判别器进行修正，以生成属于第一域的目标生成器，其中，属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。由此，对图像翻译模型进行训练，并通过训练后的图像翻译模型对图像进行翻译，生成的目标翻译图像中，包含了由原图像变形生成的变形图像，从而使得目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息，不仅提高了生成的目标翻译图像的清晰度，而且生成的目标翻译图像的背景部分也和原始图片一致，从而能够实现图像的无缝融合，大大提高了生成的目标翻译图像的自然度，并且，该图像翻译模型的训练方法简单高效，图像翻译模型的负载也较低。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图12所示，是根据本申请实施例的图像的翻译方法或者图像翻译模型的训练方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图12所示，该电子设备包括：一个或多个处理器1101、存储器1102，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图12中以一个处理器1101为例。

存储器1102即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的图像的翻译方法或者图像翻译模型的训练方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的图像的翻译方法或者图像翻译模型的训练方法。

存储器902作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的图像的翻译方法或者图像翻译模型的训练方法对应的程序指令/模块(例如，附图5所示的第一获取模块410、第一处理模块420、第二处理模块430和第一融合模块440，附图10所示的第二获取模块901、第三处理模块902、第四处理模块903、第二融合模块904、第三获取模块905和第一修正模块906)。处理器1101通过运行存储在存储器1102中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的图像的翻译方法或者图像翻译模型的训练方法。

存储器1102可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据图像的翻译或者图像翻译模型的训练的电子设备的使用所创建的数据等。此外，存储器902可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器1102可选包括相对于处理器1101远程设置的存储器，这些远程存储器可以通过网络连接至图像的翻译或者图像翻译模型的训练的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

图像的翻译方法或者图像翻译模型的训练方法的电子设备还可以包括：输入装置1103和输出装置1104。处理器1101、存储器1102、输入装置1103和输出装置1104可以通过总线或者其他方式连接，图11中以通过总线连接为例。

输入装置1103可接收输入的数字或字符信息，以及产生与图像的翻译或者图像翻译模型的训练的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1104可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网以及区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。服务端可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务(“VirtualPrivate Server”，或简称“VPS”)中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

本申请还提供一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上所述的图像的翻译方法或者图像翻译模型的训练方法的步骤。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种图像的翻译方法，包括：

获取图像翻译请求，其中，所述翻译请求中包括原图像；

对所述原图像进行处理，以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数；

根据所述变形参数将所述原图像进行变形处理，以获取变形图像；以及

根据所述掩膜图像中各像素点的像素值，确定所述预翻译图像的第一权重及所述变形图像的第二权重，根据所述第一权重及所述第二权重，将所述变形图像中各像素点的像素值和所述预翻译图像中各像素点的像素值进行融合，以生成目标翻译图像；

对所述原图像进行处理，以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数，包括：

对所述原图像进行处理，以获取所述原图像中包含的目标对象在第一域的特征；

根据所述目标对象在第一域的特征，重建所述目标对象在第二域的图像，以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数，其中，预翻译图像为对原图像直接进行翻译后得到的图像，变形参数为对原图像进行处理时，确定的原图像需要变形的参数信息，即原图像中每个像素点需要平移的距离。

2.如权利要求1所述的方法，其中，所述翻译请求中还包括所述目标翻译图像所属的第一域，在所述获取图像翻译请求之后，还包括：

根据所述目标翻译图像所属的第一域，获取目标生成器；

所述对所述原图像进行处理，以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数，包括：

利用所述目标生成器，对所述原图像进行处理，以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数。

3. 如权利要求2所述的方法，其中，如果与所述目标翻译图像所属的第一域对应的生成器有N种，N为大于1的整数，则在所述获取图像翻译请求之后，还包括：

对所述原图像进行识别，以确定所述原图像所属的第二域；以及

根据所述原图像所属的第二域及所述目标翻译图像所属的第一域，从所述N种生成器中选取所述目标生成器。

4. 如权利要求1所述的方法，其中，在所述获取图像翻译请求之后，还包括：

根据所述原图像所属的第二域，获取目标生成器；

5. 如权利要求4所述的方法，其中，如果与所述原图像所属的第二域对应的生成器有N种，N为大于1的整数，则在所述获取图像翻译请求之后，还包括：

获取目标翻译图像所属的第一域；以及

根据所述目标翻译图像所属的第一域及所述原图像所属的第二域，从所述N种生成器中选取所述目标生成器。

6.一种图像翻译模型的训练方法，包括：

获取训练样本集，其中，所述训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集；

利用第一初始生成器对所述第一图像集中的图像分别进行处理，以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集；

根据所述第一变形参数集，将所述第一图像集中的图像分别进行变形处理，以获取第一变形图像集；

将所述第一变形图像集、所述第一预翻译图像集及所述第一掩膜图像集中的对应图像分别进行融合，以获取第三图像集；

将所述第三图像集中的图像及所述第二图像集中的图像，分别输入至第一初始判别器，以获取所述第一初始判别器输出的所述第三图像集中的图像分别属于真实图像的第一概率集、及所述第二图像集中的图像分别属于真实图像的第二概率集；以及

根据所述第一概率集及所述第二概率集，对所述第一初始生成器及所述第一初始判别器进行修正，以生成属于第一域的目标生成器，所述属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像；

其中，预翻译图像为对原图像直接进行翻译后得到的图像，变形参数为对原图像进行处理时，确定的原图像需要变形的参数信息，即原图像中每个像素点需要平移的距离。

7.如权利要求6所述的训练方法，其中，所述第一图像集中的图像分别与所述第二图像集中的图像一一匹配。

8.如权利要求6所述的训练方法，其中，第一图像集中的图像与所述第二图像集中的图像未匹配，在所述根据所述第一概率集及所述第二概率集，对所述第一初始生成器及所述第一初始判别器进行修正之后，还包括：

利用第二初始生成器对所述第三图像集中的图像分别进行处理，以生成第二预翻译图像集、第二掩膜图像集及第二变形参数集；

根据所述第二变形参数集，将所述第三图像集中的图像分别进行变形处理，以获取第二变形图像集；

将所述第二变形图像集、第二预翻译图像集及所述第二掩膜图像集中的对应图像分别进行融合，以获取第四图像集；

将所述第四图像集中的图像及所述第一图像集中的图像，分别输入至第二初始判别器，以获取所述第二初始判别器输出的所述第四图像集中的图像分别属于真实图像的第三概率集、及所述第一图像集中的图像分别属于真实图像的第四概率集；以及

根据所述第三概率集及所述第四概率集，对所述第一初始生成器、所述第二初始生成器、所述第一初始判别器及所述第二初始判别器进行修正，以生成属于第一域的目标生成器及属于第二域的目标生成器，其中，所述属于第一域的目标生成器，用于将位于第一域的图像翻译成位于第二域的图像，所述属于第二域的目标生成器，用于将位于第二域的图像翻译成位于第一域的图像。

9.一种图像的翻译装置，包括：

第一获取模块，用于获取图像翻译请求，其中，所述翻译请求中包括原图像；

第一处理模块，用于对所述原图像进行处理，以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数；

第二处理模块，用于根据所述变形参数将所述原图像进行变形处理，以获取变形图像；以及

第一融合模块，用于根据所述掩膜图像中各像素点的像素值，确定所述预翻译图像的第一权重及所述变形图像的第二权重，根据所述第一权重及所述第二权重，将所述变形图像中各像素点的像素值和所述预翻译图像中各像素点的像素值进行融合，以生成目标翻译图像；

所述第一处理模块包括：

第一处理单元，用于对所述原图像进行处理，以获取所述原图像中包含的目标对象在第一域的特征；

重构单元，用于根据所述目标对象在第一域的特征，重建所述目标对象在第二域的图像，以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数，其中，预翻译图像为对原图像直接进行翻译后得到的图像，变形参数为对原图像进行处理时，确定的原图像需要变形的参数信息，即原图像中每个像素点需要平移的距离。

10.如权利要求9所述的装置，其中，所述翻译请求中还包括所述目标翻译图像所属的第一域，所述第一获取模块在所述获取图像翻译请求之后，还用于：

根据所述目标翻译图像所属的第一域，获取目标生成器；

所述第一处理模块具体用于：

11. 如权利要求10所述的装置，其中，如果与所述目标翻译图像所属的第一域对应的生成器有N种，N为大于1的整数，则所述第一获取模块在所述获取图像翻译请求之后，还用于：

12. 如权利要求9所述的装置，所述第一获取模块在所述获取图像翻译请求之后，还用于：

根据所述原图像所属的第二域，获取目标生成器；

所述第一处理模块具体用于：

13. 如权利要求12所述的装置，其中，如果与所述原图像所属的第二域对应的生成器有N种，N为大于1的整数，则所述第一获取模块在所述获取图像翻译请求之后，还用于：

获取目标翻译图像所属的第一域；以及

14.一种图像翻译模型的训练装置，包括：

第二获取模块，用于获取训练样本集，其中，所述训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集；

第三处理模块，用于利用第一初始生成器对所述第一图像集中的图像分别进行处理，以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集；

第四处理模块，用于根据所述第一变形参数集，将所述第一图像集中的图像分别进行变形处理，以获取第一变形图像集；

第二融合模块，用于将所述第一变形图像集、所述第一预翻译图像集及所述第一掩膜图像集中的对应图像分别进行融合，以获取第三图像集；

第三获取模块，用于将所述第三图像集中的图像及所述第二图像集中的图像，分别输入至第一初始判别器，以获取所述第一初始判别器输出的所述第三图像集中的图像分别属于真实图像的第一概率集、及所述第二图像集中的图像分别属于真实图像的第二概率集；以及

第一修正模块，用于根据所述第一概率集及所述第二概率集，对所述第一初始生成器及所述第一初始判别器进行修正，以生成属于第一域的目标生成器，所述属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像；

15.如权利要求14所述的训练装置，其中，所述第一图像集中的图像分别与所述第二图像集中的图像一一匹配。

16.如权利要求14所述的训练装置，其中，第一图像集中的图像与所述第二图像集中的图像未匹配，所述训练装置还包括：

第五处理模块，用于利用第二初始生成器对所述第三图像集中的图像分别进行处理，以生成第二预翻译图像集、第二掩膜图像集及第二变形参数集；

第六处理模块，用于根据所述第二变形参数集，将所述第三图像集中的图像分别进行变形处理，以获取第二变形图像集；

第三融合模块，用于将所述第二变形图像集、第二预翻译图像集及所述第二掩膜图像集中的对应图像分别进行融合，以获取第四图像集；

第四获取模块，用于将所述第四图像集中的图像及所述第一图像集中的图像，分别输入至第二初始判别器，以获取所述第二初始判别器输出的所述第四图像集中的图像分别属于真实图像的第三概率集、及所述第一图像集中的图像分别属于真实图像的第四概率集；以及

第二修正模块，用于根据所述第三概率集及所述第四概率集，对所述第一初始生成器、所述第二初始生成器、所述第一初始判别器及所述第二初始判别器进行修正，以属于第一域的目标生成器及属于第二域的目标生成器，其中，所述属于第一域的目标生成器，用于将位于第一域的图像翻译成位于第二域的图像，所述属于第二域的目标生成器，用于将位于第二域的图像翻译成位于第一域的图像。

17. 一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法或者权利要求6-8中任一项所述的训练方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法或者权利要求6-8中任一项所述的训练方法。