CN116385270A

CN116385270A - 一种基于多重损失和分辨率的图像转图像的方法

Info

Publication number: CN116385270A
Application number: CN202310412411.0A
Authority: CN
Inventors: 虞钉钉; 徐清; 王晓梅; 沈伟林; 沈旭立; 曹培
Original assignee: Huayuan Computing Technology Shanghai Co ltd
Current assignee: Huayuan Computing Technology Shanghai Co ltd
Priority date: 2023-04-18
Filing date: 2023-04-18
Publication date: 2023-07-04

Abstract

本发明公开了一种基于多重损失和分辨率的图像转图像的方法，包括：获取输入图像，并对图像进行多分辨率预处理；将得到的不同分辨率图像输入到已经训练好的深度模型；其中，深度模型根据多个不同的分辨率，先从低分辨率模块至高分辨率模块依次进行训练，再进行整个模型的联合训练；在模型训练中，构造的损失函数包括：每个分辨率下的生成图像和真实图像之间的L1损失、由判别模型判断的生成图像是否真实的损失和生成图像和真实图像之间的风格损失；不同分辨率的图像通过深度模型进行整合最终得到相对应的图像。本发明充分利用图像的不同分辨率信息，结合应用多重损失训练好的深度模型，可以有效提高转换图像的质量。

Description

一种基于多重损失和分辨率的图像转图像的方法

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于多重损失和分辨率的图像转图像的方法。

背景技术

随着互联网的快速发展，内容分享已经成为了当前的一个热点；而在内容分享领域，图像生成是其中非常重要的一项技术。图像生成领域存在大量的子任务，其中由图像生成图像是一个非常有价值的应用问题。由图像生成图像任务又可称为图像转图像，该任务是将输入图像生成另一张图像；常见的应用包括风格迁移、转换等等。

对于图像转图像任务，当前主流技术都是采用深度模型；具体而言，可以细分为三个大类：一类是采用对抗生成网络框架，通过使用深度卷积神经网络作为生成器，并搭配相应的判别器网络进行训练；一类是采用变分自编码器模型，通过采用编码解码结构进行图像到图像生成；最后一类是采用扩散模型，通过扩散过程来完成相应的任务。

但无论采用上述的哪类方法，都会用到深度模型，会涉及到深度模型的训练问题。如何训练得到一个更好的生成深度模型，使得模型可以生成更高质量的图像仍然是一个非常困难的问题。

发明内容

针对现有技术中存在的不足之处，本发明提供一种基于多重损失和分辨率的图像转图像的方法，其通过采用多重损失和多重分辨率框架，充分利用不同分辨率下的尺度信息，可以有效提高生成图像的质量。

本发明公开了一种基于多重损失和分辨率的图像转图像的方法，包括：

获取输入图像，并对图像进行多分辨率预处理；

将得到的不同分辨率图像输入到已经训练好的深度模型；其中，所述深度模型根据多个不同的分辨率，先从低分辨率模块至高分辨率模块依次进行训练，再进行整个模型的联合训练；在模型训练中，构造的损失函数包括：每个分辨率下的生成图像和真实图像之间的L1损失、由判别模型判断的生成图像是否真实的损失和生成图像和真实图像之间的风格损失；

不同分辨率的图像通过深度模型进行整合最终得到相对应的图像。

作为本发明的进一步改进，所述图像包括轮廓图像、分割图像和真实图像。

作为本发明的进一步改进，所述对图像进行多分辨率预处理，包括：

对输入的图像进行缩小操作，得到包括原图在内的多个不同分辨率的图像。

作为本发明的进一步改进，采用插值法对输入的图像进行缩小操作，所述插值法包括最近邻插值法、双线性插值法、双三次插值法和Lanczos插值法中的一种。

作为本发明的进一步改进，不同分辨率的图像对应输入至深度模型的不同分辨率的模块中。

作为本发明的进一步改进，不同分辨率的图像通过深度模型进行整合最终得到相对应的图像，包括：

不同分辨率的图像通过深度模型的不同模块后，其编码的特征根据分辨率的大小进行逐层融合，之后通过联级的解码器生成相应的图像。

作为本发明的进一步改进，深度模型在训练时，输入N个不同分辨率的图像，则其输出也有N个不同分辨率；训练好的深度模型在使用时，输入N个不同分辨率的图像，输出和原始输入图像一样尺寸的图像。

与现有技术相比，本发明的有益效果为：

本发明充分利用图像的不同分辨率信息，结合应用多重损失训练好的深度模型，可以有效提高转换图像的质量。

附图说明

图1为本发明公开的一种基于多重损失和分辨率的图像转图像的方法的流程图；

图2为本发明公开的图像转图像的深度模型的示意图；

图3为本发明公开的深度模型在训练中的多输出示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合附图对本发明做进一步的详细描述：

如图1所示，本发明提供一种基于多重损失和分辨率的图像转图像的方法，包括：

步骤1、获取输入图像，并对图像进行多分辨率预处理；其中，

输入图像根据不同任务可以是不同的图像，比如：轮廓图像、分割图像以及真实图像等等；

图像的多分辨率预处理包括：采用插值法对输入的图像进行缩小操作，得到包括原图在内的多个不同分辨率的图像；其中，插值法包括最近邻插值法、双线性插值法、双三次插值法、Lanczos插值法等等，通常而言，是按1/2的缩小比例依次进行缩放，从而得到不同分辨率的图像。例如，在高分辨率原图的基础上进行一次1/2缩小，得到中分辨率图；在中分辨率图的基础上再进行一次1/2缩小，得到低分辨率图。

步骤2、将得到的不同分辨率图像输入到已经训练好的深度模型；其中，

如图2所示，本发明的深度模型的输入为多个不同分辨率的图像，且不同分辨率的图像对应输入至深度模型的不同分辨率的模块中，然后通过多个卷积层进行特征提取；此外，不同分辨率的图像所提取的特征也会依次进行融合。如图3所示，深度模型在训练时，输入N个不同分辨率的图像，则其输出也有N个不同分辨率。训练时，深度模型根据多个不同的分辨率，先从低分辨率模块至高分辨率模块依次进行训练，再进行整个模型的联合训练；在模型训练中，构造的损失函数包括：每个分辨率下的生成图像和真实图像之间的L1损失、由判别模型判断的生成图像是否真实的损失和生成图像和真实图像之间的风格损失。训练好的深度模型在使用时，输入N个不同分辨率的图像，输出和原始输入图像一样尺寸的图像。

步骤3、不同分辨率的图像通过深度模型进行整合最终得到相对应的图像；具体包括：

不同分辨率的图像通过深度模型的不同模块后，其编码的特征根据分辨率的大小进行逐层融合，之后通过联级的解码器生成相应的图像。具体的：最高分辨率的图像提取过一次特征以后，该特征会融合到下一个分辨率提取到的特征之后；按上述方式依次融合以后，最后得到维度相同的特征，然后该特征会通过解码器生成相应的图像；该解码器结构可以简单参考图2和图3。特别的是，该解码器的每个模块都会和不同分辨率图像的输入模块进行连接，在特征依次通过解码器每个模块的同时，输入的不同分辨率的特征也会依次和相应特征进行融合，然后输入下一个解码器模块，最终融合所有分辨率的图像特征生成相应的图像。

实施例：

本发明提供一种基于多重损失和分辨率的图像转图像的方法，包括：

S1、以宽和高分别为1024的轮廓图像作为输入图像为例，采用插值法，如双线性插值算法，得到512×512的中分辨轮廓图像；再采用插值法，如双线性插值算法，对512×512的中分辨轮廓图像进行插值，得到256×256的低分辨率图像。

S2、将上述三个分辨率的图像输入深度模型中，以图2为例，高分辨率图像会输入深度模型中的编码器的第一个模块，中分辨率图像会输入编码器的第二个模块，低分辨率图像会输入编码器的第三个模块；其中，

深度模型在训练时，输入上述三种分辨率的图像，模型会相应地输出三种分辨率图像，以图3为例，深度模型的解码器的最后一个模块会输出高分辨率的图像，解码器的倒数第二个模块会输出中分辨率的图像，解码器的倒数第三个模块会输出低分辨率的图像；针对轮廓图像所对应的真实图像，采用和轮廓图像一样的插值算法，可以得到相应的不同分辨率的真实图像；相应地，根据上述三个分辨率下的生成图像和真实图像之间的L1损失、由判别模型判断的生成图像是否真实的损失、生成图像和真实图像之间的风格损失，可以得到相应的损失函数，经过训练以后，可以得到训练好的模型。

S3、利用训练好的模型，输入上述三种分辨率的轮廓图像，生成最高分辨率所对应的真实图像。具体地，将三种分辨率的轮廓图像，依次分别输入编码器的第一、第二和第三个模块，然后这些图像经过编码器的其他模块以后，输入到解码器的第一个模块中，此外三种分辨率图像通过编码器的第一、第二和第三个模块后得到的特征，也会输入到解码器相对应的最后一个、倒数第二和倒数第三个模块中，最终解码器最后一个模块会输出高分辨率的真实图像。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于多重损失和分辨率的图像转图像的方法，其特征在于，包括：

获取输入图像，并对图像进行多分辨率预处理；

2.如权利要求1所述的基于多重损失和分辨率的图像转图像的方法，其特征在于，所述图像包括轮廓图像、分割图像和真实图像。

3.如权利要求1所述的基于多重损失和分辨率的图像转图像的方法，其特征在于，所述对图像进行多分辨率预处理，包括：

4.如权利要求3所述的基于多重损失和分辨率的图像转图像的方法，其特征在于，采用插值法对输入的图像进行缩小操作，所述插值法包括最近邻插值法、双线性插值法、双三次插值法和Lanczos插值法中的一种。

5.如权利要求1所述的基于多重损失和分辨率的图像转图像的方法，其特征在于，不同分辨率的图像对应输入至深度模型的不同分辨率的模块中。

6.如权利要求1所述的基于多重损失和分辨率的图像转图像的方法，其特征在于，不同分辨率的图像通过深度模型进行整合最终得到相对应的图像，包括：

7.如权利要求1所述的基于多重损失和分辨率的图像转图像的方法，其特征在于，深度模型在训练时，输入N个不同分辨率的图像，则其输出也有N个不同分辨率；训练好的深度模型在使用时，输入N个不同分辨率的图像，输出和原始输入图像一样尺寸的图像。