WO2020239026A1

WO2020239026A1 - 图像处理方法及装置、神经网络的训练方法、存储介质

Info

Publication number: WO2020239026A1
Application number: PCT/CN2020/092917
Authority: WO
Inventors: 刘瀚文; 那彦波; 朱丹; 张丽杰
Original assignee: 京东方科技集团股份有限公司
Priority date: 2019-05-30
Filing date: 2020-05-28
Publication date: 2020-12-03
Also published as: CN110188776A; US20210407041A1; US11908102B2

Abstract

一种图像处理方法及装置、神经网络的训练方法、存储介质。该图像处理方法包括：获取输入图像；以及使用生成网络对输入图像进行处理，以生成输出图像；生成网络包括第一子网络和至少一个第二子网络，使用生成网络对输入图像进行处理，以生成输出图像，包括：使用第一子网络对输入图像进行处理，以得到多个第一特征图；使用至少一个第二子网络对多个第一特征图进行分支处理和权值共享处理，以得到多个第二特征图；以及对多个第二特征图进行处理，以得到输出图像。

Description

图像处理方法及装置、神经网络的训练方法、存储介质

本申请要求于2019年5月30日递交的中国专利申请第201910463969.5号的优先权，在此全文引用上述中国专利申请公开的内容以作为本申请的一部分。

技术领域

本公开的实施例涉及一种图像处理方法及装置、神经网络的训练方法、存储介质。

背景技术

当前，基于人工神经网络的深度学习技术已经在诸如物体分类、文本处理、推荐引擎、图像搜索、面部识别、年龄和语音识别、人机对话以及情感计算等领域取得了巨大进展。随着人工神经网络结构的加深和算法的提升，深度学习技术在类人类数据感知领域取得了突破性的进展，深度学习技术可以用于描述图像内容、识别图像中的复杂环境下的物体以及在嘈杂环境中进行语音识别等。同时，深度学习技术还可以解决图像生成和融合的问题。

发明内容

本公开至少一个实施例提供一种图像处理方法，包括：获取输入图像；以及使用生成网络对所述输入图像进行处理，以生成输出图像；其中，所述生成网络包括第一子网络和至少一个第二子网络，使用所述生成网络对所述输入图像进行处理，以生成所述输出图像，包括：使用所述第一子网络对所述输入图像进行处理，以得到多个第一特征图；使用所述至少一个第二子网络对所述多个第一特征图进行分支处理和权值共享处理，以得到多个第二特征图；以及对所述多个第二特征图进行处理，以得到输出图像。

例如，在本公开一些实施例提供的图像处理方法中，每个所述第二子网络包括第一分支网络、第二分支网络、第三分支网络，每个所述第二子网络的所述分支处理包括：将每个所述第二子网络的输入划分为第一分支输入、第二分支输入和第三分支输入；以及使用所述第一分支网络对所述第一分支输入进行处理，以得到第一分支输出，使用所述第二分支网络对所述第二分支输入进行处理，以得到第二分支输出，使用所述第三分支网络对所述第三分支输入进行处理，以得到第三分支输出；其中，所述至少一个第二子网络包括第一个第二子网络，所述第一个第二子网络与所述第一子网络连接，所述多个第一特征图作为所述第一个第二子网络的输入。

例如，在本公开一些实施例提供的图像处理方法中，每个所述第二子网络还包括第一主干网络，每个所述第二子网络的所述权值共享处理包括：将所述第一分支输出、所述第二分支输出和所述第三分支输出进行连接，以得到第一中间输出；以及使用所述第一主干网络对所述第一中间输出进行处理，以得到每个所述第二子网络的输出。

例如，在本公开一些实施例提供的图像处理方法中，所述第一分支网络的处理包括标准卷积处理，所述第二分支网络的处理包括标准卷积处理，所述第三分支网络的处理包括标准卷积处理，所述第一主干网络的处理包括标准卷积处理和下采样处理。

例如，在本公开一些实施例提供的图像处理方法中，所述生成网络还包括第三子网络，对所述多个第二特征图进行处理，以得到所述输出图像，包括：对所述多个第二特征图进行处理，以得到多个第三特征图；使用所述第三子网络对所述多个第三特征图进行处理，以得到多个第四特征图；以及对所述多个第四特征图进行合成处理，以得到输出图像。

例如，在本公开一些实施例提供的图像处理方法中，所述第三子网络包括第二主干网络、第四分支网络、第五分支网络和第六分支网络，使用所述第三子网络对所述多个第三特征图进行处理，以得到所述多个第四特征图，包括：使用所述第二主干网络对所述多个第三个特征图进行处理，以得到多个第五特征图；将所述多个第五特征图划分为第四分支输入、第五分支输入和第六分支输入；以及使用所述第四分支网络对所述第四分支输入进行处理，以得到所述第四分支网络对应的第四特征图，使用所述第五分支网络对所述第五分支输入进行处理，以得到所述第五分支网络对应的第四特征图，使用所述第六分支网络对所述第六分支输入进行处理，以得到所述第六分支网络对应的第四特征图；其中，所述多个第四特征图包括所述第四分支网络对应的第四特征图、所述第五分支网络对应的第四特征图和所述第六分支网络对应的第四特征图。

例如，在本公开一些实施例提供的图像处理方法中，所述第二主干网络的处理包括上采样处理，所述第四分支网络的处理包括标准卷积处理，所述第五分支网络的处理包括标准卷积处理，所述第六分支网络的处理包括标准卷积处理。

例如，在本公开一些实施例提供的图像处理方法中，所述第四分支网络的处理还包括上采样处理，所述第五分支网络的处理还包括上采样处理，所述第六分支网络的处理还包括上采样处理。

例如，在本公开一些实施例提供的图像处理方法中，所述第一子网络的处理包括标准卷积处理，使用所述第一子网络对所述输入图像进行处理，以得到所述多个第一特征图，包括：使用所述第一子网络对所述输入图像进行标准卷积处理，以得到所述多个第一特征图。

例如，在本公开一些实施例提供的图像处理方法中，所述输入图像具有第一颜色通道、第二颜色通道和第三颜色通道，所述第一子网络包括转换模块、第七分支网络、第八分支网络、第九分支网络和第三主干网络，使用所述第一子网络对所述输入图像进行处理，以得到所述多个第一特征图，包括：使用所述转换模块将所述输入图像的第一颜色通道、第二颜色通道和第三颜色通道的数据信息转换为中间输入图像的第一亮度信道、第一色差信道和第二色差信道的数据信息；使用所述第七分支网络对所述中间输入图像的第一亮度信道的数据信息进行处理，以得到第七分支输出，使用所述第八分支网络对所述中间输入图像的第一色差信道的数据信息进行处理，以得到第八分支输出，使用所述第九分支网络对所述中间输入图像的第二色差信道的数据信息进行处理，以得到第九分支输出；将所述第七分支输出、所述第八分支输出和所述第九分支输出进行连接，以得到第二中间输出；以及使用所述第三主干网络对所述第二中间输出进行处理，以得到所述多个第一特征图。

例如，在本公开一些实施例提供的图像处理方法中，所述第七分支网络的处理包括标准卷积处理和下采样处理，所述第八分支网络的处理包括标准下采样处理，所述第九分支网络的处理包括标准下采样处理。

例如，在本公开一些实施例提供的图像处理方法中，所述第四分支网络的处理包括标准卷积处理和上采样处理，所述第五分支网络的处理包括标准卷积处理和标准上采样处理，所述第六分支网络的处理包括标准卷积处理和标准上采样处理。

例如，在本公开一些实施例提供的图像处理方法中，所述生成网络还包括密集子网络，所述密集子网络包括N个密集模块，对所述多个第二特征图进行处理，以得到所述多个第三特征图，包括：使用所述密集子网络对所述多个第二特征图进行处理，以得到所述多个第三特征图；其中，所述多个第二特征图作为所述N个密集模块中的第1个密集模块的输入，所述多个第二特征图与所述N个密集模块中的第i个密集模块之前的i-1个密集模块的输出连接，作为所述第i个密集模块的输入，所述多个第二特征图和每个所述密集模块的输出进行连接，作为所述多个第三特征图，N、i为整数，N≥2，i≥2且i≤N。

例如，在本公开一些实施例提供的图像处理方法中，每个密集模块的处理包括降维处理和卷积处理。

例如，在本公开一些实施例提供的图像处理方法中，所述生成网络还包括合成模块，对所述多个第四特征图进行合成处理，以得到所述输出图像，包括：使用所述合成模块对所述多个第四特征图进行合成处理，以得到所述输出图像。

例如，在本公开一些实施例提供的图像处理方法中，所述合成模块包括第一转换矩阵，使用所述合成模块对所述多个第四特征图进行合成处理，以得到所述输出图像，包括：利用所述第一转换矩阵，将所述第四分支网络对应的第四特征图的数据信息、所述第五分支网络对应的第四特征图的数据信息和所述第六分支网络对应的第四特征图的数据信息转换为所述输出图像的第一颜色通道的数据信息、第二颜色通道的数据信息和第三颜色通道的数据信息，以得到所述输出图像。

本公开至少一个实施例还提供一种神经网络的训练方法，包括：基于待训练的生成网络，对判别网络进行训练；基于所述判别网络，对所述待训练的生成网络进行训练；以及，交替地执行上述训练过程，以得到本公开任一实施例提供的图像处理方法中的所述生成网络；其中，基于所述判别网络，对所述待训练的生成网络进行训练，包括：使用所述待训练的生成网络对第一训练输入图像进行处理，以生成第一训练输出图像；基于所述第一训练输出图像，通过系统损失函数计算所述待训练的生成网络的系统损失值；以及基于所述系统损失值对所述待训练的生成网络的参数进行修正。

例如，在本公开一些实施例提供的训练方法中，所述系统损失函数包括生成网络对抗损失函数，所述系统损失值包括生成网络对抗损失值；所述生成网络对抗损失函数表示为：

其中，L _G表示所述生成网络对抗损失函数，z1表示所述第一训练输入图像，P _z1(z1)表示所述第一训练输入图像的集合，G(z1)表示所述第一训练输出图像，D(G(z1))表示所述判别网络针对所述第一训练输出图像的输出，

表示针对所述第一训练输入图像的集合求期望以得到所述生成网络对抗损失值。

例如，在本公开一些实施例提供的训练方法中，所述系统损失函数还包括内容损失函数，所述系统损失值还包括内容损失值；

基于所述第一训练输出图像，通过系统损失函数计算所述待训练的生成网络的系统损失值，包括：使用分析网络提取所述第一训练输入图像的第一内容特征图和所述第一训练输出图像的第二内容特征图，根据所述第一内容特征图和所述第二内容特征图，通过所述内容损失函数计算所述生成网络的所述内容损失值，

其中，所述分析网络包括用于提取所述第一内容特征图和所述第二内容特征图的至少一个卷积模块；

所述内容损失函数表示为：

其中，L _content表示所述内容损失函数，C _m表示所述至少一个卷积模块中的第m个卷积模块的单层内容损失函数，w _1m表示C _m的权重；

所述单层内容损失函数表示为：

其中，S ₁为常数，

表示在所述第m个卷积模块中第i个卷积核提取的所述第一训练输入图像的第一内容特征图中第j个位置的值，

表示在所述第m个卷积模块中第i个卷积核提取的所述第一训练输出图像的第二内容特征图中第j个位置的值。

例如，在本公开一些实施例提供的训练方法中，所述系统损失函数还包括颜色损失函数，所述系统损失值还包括颜色损失值；所述颜色损失函数表示为：

L _color＝abs(gaussian(G(z1))-gaussian(I1))

其中，L _color表示所述颜色损失函数，G(z1)表示所述第一训练输出图像，I1表示第二训练输入图像，gaussian()表示高斯模糊化运算，abs()表示求绝对值运算；

所述第二训练输入图像的质量比所述第一训练输入图像的质量高。

例如，在本公开一些实施例提供的训练方法中，所述第一训练输出图像具有第一颜色通道、第二颜色通道和第三颜色通道；

所述系统损失函数还包括对比损失函数，所述系统损失值还包括对比损失值；所述对比损失函数表示为：

L _L1＝0.299*abs(F _G(z1)-F _I2)+0.587*abs(S _G(z1)-S _I2)+0.299*abs(T _G(z1)-T _I2)

其中，L _L1表示所述对比损失函数，G(z1)表示所述第一训练输出图像，I2表示第三训练输入图像，F _G(z1)、S _G(z1)和T _G(z1)分别表示所述第一训练输出图像的第一颜色通道、第二颜色通道和第三颜色通道的数据信息，F _I2、S _I2和T _I2分别表示所述第三训练输入图像的第一颜色通道、第二颜色通道和第三颜色通道的数据信息，abs()表示求绝对值运算；

所述第三训练输入图像具有与所述第一训练输入图像相同的场景，且所述第三训练输入图像的质量比所述第一训练输入图像的质量高。

例如，在本公开一些实施例提供的训练方法中，基于所述待训练的生成网络，对所述判别网络进行训练，包括：利用所述待训练的生成网络对第四训练输入图像进行处理，以生成第二训练输出图像；基于所述第二训练输出图像和第五训练输入图像，通过判别网络对抗损失函数计算判别网络对抗损失值；以及根据所述判别网络对抗损失值对所述判别网络的参数进行修正；其中，所述第五训练输入图像的质量比所述第四训练输入图像的质量高。

例如，在本公开一些实施例提供的训练方法中，所述判别网络对抗损失函数表示为：

其中，L _D表示所述判别网络对抗损失函数，x表示所述第五训练输入图像，P _data(x)表示所述第五训练输入图像的集合，D(x)表示所述判别网络针对所述第五训练输入图像的输出，

表示针对所述第五训练输入图像的集合求期望，z2表示所述第四训练输入图像，P _z2(z2)表示所述第四训练输入图像的集合，G(z2)表示所述第二训练输出图像，D(G(z2))表示所述判别网络针对所述第二训练输出图像的输出，

表示针对所述第四训练输入图像的集合求期望。

本公开至少一个实施例还提供一种图像处理装置，包括：存储器，用于非暂时性存储计算机可读指令；以及处理器，用于运行所述计算机可读指令，所述计算机可读指令被所述处理器运行时执行本公开任一实施例提供的图像处理方法或本公开任一实施例提供的神经网路的训练方法。

本公开至少一个实施例还提供一种存储介质，非暂时性地存储计算机可读指令，当所述计算机可读指令由计算机执行时可以执行本公开任一实施例提供的图像处理方法或本公开任一实施例提供的神经网路的训练方法。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例的附图作简单地介绍，显而易见地，下面描述中的附图仅仅涉及本公开的一些实施例，而非对本公开的限制。

图1为一种卷积神经网络的示意图；

图2A为一种卷积神经网络的结构示意图；

图2B为一种卷积神经网络的工作过程示意图；

图3为另一种卷积神经网络的结构示意图；

图4为本公开至少一实施例提供的一种图像处理方法的流程图；

图5为一种对应于图4中所示的步骤S200的示例性流程图；

图6A为本公开至少一实施例提供的一种对应于图4中所示的图像处理方法的生成网络的示意性架构框图；

图6B为本公开至少一实施例提供的另一种对应于图4中所示的图像处理方法的生成网络的示意性架构框图；

图7为本公开至少一实施例提供的一种密集子网络的结构示意图；

图8A为本公开至少一实施例提供的一种上采样层的示意图；

图8B为本公开至少一实施例提供的另一种上采样层的示意图；

图9A为一种输入图像的示意图；

图9B为根据图6A所示的生成网络对图9A所示的输入图像进行处理得到的输出图像的示意图；

图9C为根据图6B所示的生成网络对图9A所示的输入图像进行处理得到的输出图像的示意图；

图10为本公开至少一实施例提供的一种神经网络的训练方法的流程图；

图11A为本公开至少一实施例提供的一种对应于图10中所示的训练方法训练待训练的生成网络的示意性架构框图；

图11B为本公开至少一实施例提供的一种训练待训练的生成网络的过程的示意性流程图；

图12为本公开至少一实施例提供的一种判别网络的结构示意图；

图13为本公开至少一实施例提供的一种分析网络的结构示意图；

图14A为本公开至少一实施例提供的一种对应于图10中所示的训练方法训练判别网络的示意性架构框图；

图14B为本公开至少一实施例提供的一种训练判别网络的过程的示意性流程图；

图15为本公开至少一实施例提供的一种图像处理装置的示意性框图；以及

图16为本公开至少一实施例提供的一种存储介质的示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例的附图，对本公开实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例是本公开的一部分实施例，而不是全部的实施例。基于所描述的本公开的实施例，本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

除非另外定义，本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。

下面通过几个具体的实施例对本公开进行说明。为了保持本公开实施例的以下说明清楚且简明，本公开省略了已知功能和已知部件的详细说明。当本公开实施例的任一部件在一个以上的附图中出现时，该部件在每个附图中由相同或类似的参考标号表示。

图像增强是图像处理领域的研究热点之一。由于在图像采集过程中存在各种物理因素的限制(例如，手机相机的图像传感器尺寸太小以及其他软件、硬件的限制等)以及环境噪声的干扰，会导致图像质量大大降低。图像增强的目的是通过图像增强技术，改善图像的灰度直方图，提高图像的对比度，从而凸显图像细节信息，改善图像的视觉效果。

利用深度神经网络进行图像增强是随着深度学习技术的发展而新兴起来的技术。例如，基于卷积神经网络，可以对手机拍摄的低质量的照片(输入图像)进行处理以获得高质量的输出图像，该输出图像的质量可以接近于数码单镜反光相机(Digital Single Lens Reflex Camera，常简称为DSLR，也简称为数码单反相机)拍摄的照片的质量。例如，常用峰值信噪比(Peak Signal to Noise Ratio，PSNR)指标来表征图像质量，其中PSNR值越高表示图像越接近于数码单镜反光相机拍摄的照片。

例如，Andrey Ignatov等人提出了一种卷积神经网络实现图像增强的方法，请参见文献，Andrey Ignatov,Nikolay Kobyshev,Kenneth Vanhoey,Radu Timofte,Luc Van Gool,DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks.arXiv:1704.02470v2[cs.CV]，2017年9月5日。在此将该文献全文引用结合于此，以作为本申请的一部分。该方法主要是利用卷积层、批量标准化层及残差连接构建了一种单一尺度的卷积神经网络，利用该网络可以将输入的低质量图像(例如，对比度较低，图像曝光不足或曝光过度，整幅图像过暗或过亮等)处理成一张较高质量图像。利用颜色损失、纹理损失及内容损失作为训练中的损失函数，能够取得较好的处理效果。

最初，卷积神经网络(Convolutional Neural Network，CNN)主要用于识别二维形状，其对图像的平移、比例缩放、倾斜或其他形式的变形具有高度不变性。CNN主要通过局部感知野和权值共享来简化神经网络模型的复杂性、减少权重的数量。随着深度学习技术的发展，CNN的应用范围已经不仅仅限于图像识别领域，其也可以应用在人脸识别、文字识别、动物分类、图像处理等领域。

图1示出了一种卷积神经网络的示意图。例如，该卷积神经网络可以用于图像处理，其使用图像作为输入和输出，并通过卷积核替代标量的权重。图1中仅示出了具有3层结构的卷积神经网络，本公开的实施例对此不作限制。如图1所示，卷积神经网络包括输入层101、隐藏层102和输出层103。输入层101具有4个输入，隐藏层102具有3个输出，输出层103具有2个输出，最终该卷积神经网络最终输出2幅图像。

例如，输入层101的4个输入可以为4幅图像，或者1幅图像的四种特征图像。隐藏层102的3个输出可以为经过输入层101输入的图像的特征图像。

例如，如图1所示，卷积层具有权重

和偏置

权重

表示卷积核，偏置

是叠加到卷积层的输出的标量，其中，k是表示输入层101的标签，i和j分别是输入层101的单元和隐藏层102的单元的标签。例如，第一卷积层201包括第一组卷积核(图1中的

)和第一组偏置(图1中的

)。第二卷积层202包括第二组卷积核(图1中的

)和第二组偏置(图1中的

)。通常，每个卷积层包括数十个或数百个卷积核，若卷积神经网络为深度卷积神经网络，则其可以包括至少五层卷积层。

例如，如图1所示，该卷积神经网络还包括第一激活层203和第二激活层204。第一激活层203位于第一卷积层201之后，第二激活层204位于第二卷积层202之后。激活层(例如，第一激活层203和第二激活层204)包括激活函数，激活函数用于给卷积神经网络引入非线性因素，以使卷积神经网络可以更好地解决较为复杂的问题。激活函数可以包括线性修正单元(ReLU)函数、S型函数(Sigmoid函数)或双曲正切函数(tanh函数)等。ReLU函数为非饱和非线性函数，Sigmoid函数和tanh函数为饱和非线性函数。例如，激活层可以单独作为卷积神经网络的一层，或者激活层也可以被包含在卷积层(例如，第一卷积层201可以包括第一激活层203，第二卷积层202可以包括第二激活层204)中。

例如，在第一卷积层201中，首先，对每个输入应用第一组卷积核中的若干卷积核

和第一组偏置中的若干偏置

以得到第一卷积层201的输出；然后，第一卷积层201的输出可以通过第一激活层203进行处理，以得到第一激活层203的输出。在第二卷积层202中，首先，对输入的第一激活层203的输出应用第二组卷积核中的若干卷积核

和第二组偏置中的若干偏置

以得到第二卷积层202的输出；然后，第二卷积层202的输出可以通过第二激活层204进行处理，以得到第二激活层204的输出。例如，第一卷积层201的输出可以为对其输入应用卷积核

后再与偏置

相加的结果，第二卷积层202的输出可以为对第一激活层203的输出应用卷积核

后再与偏置

相加的结果。

在利用卷积神经网络进行图像处理前，需要对卷积神经网络进行训练。经过训练之后，卷积神经网络的卷积核和偏置在图像处理期间保持不变。在训练过程中，各卷积核和偏置通过多组输入/输出示例图像以及优化算法进行调整，以获取优化后的卷积神经网络模型。

图2A示出了一种卷积神经网络的结构示意图，图2B示出了一种卷积神经网络的工作过程示意图。例如，如图2A和2B所示，输入图像通过输入层输入到卷积神经网络后，依次经过若干个处理过程(如图2A中的每个层级)后输出类别标识。卷积神经网络的主要组成部分可以包括多个卷积层、多个下采样层和全连接层等。在本公开中，应该理解的是，多个卷积层、多个下采样层和全连接层等这些层每个都指代对应的处理操作，即卷积处理、下采样处理、全连接处理等，所描述的神经网络也都指代对应的处理操作，以下将要描述的实例标准化层或层标准化层等也与此类似，这里不再重复说明。例如，一个完整的卷积神经网络可以由这三种层叠加组成。例如，图2A仅示出了一种卷积神经网络的三个层级，即第一层级、第二层级和第三层级。例如，每个层级可以包括一个卷积模块和一个下采样层。例如，每个卷积模块可以包括卷积层。由此，每个层级的处理过程可以包括：对输入图像进行卷积(convolution)处理以及下采样(sub-sampling/down-sampling)处理。例如，根据实际需要，每个卷积模块还可以包括实例标准化(instance normalization)层，从而每个层级的处理过程还可以包括标准化处理。

例如，实例标准化层用于对卷积层输出的特征图像进行实例标准化处理，以使特征图像的像素的灰度值在预定范围内变化，从而简化图像生成过程，改善图像增强的效果。例如，预定范围可以为[-1，1]。实例标准化层根据每个特征图像自身的均值和方差，对该特征图像进行实例标准化处理。例如，实例标准化层还可用于对单幅图像进行实例标准化处理。

例如，假设小批梯度下降法(mini-batch gradient decent)的尺寸为T，某一卷积层输出的特征图像的数量为C，且每个特征图像均为H行W列的矩阵，则特征图像的模型表示为(T,C,W,H)。从而，实例标准化层的实例标准化公式可以表示如下：

其中，x _tijk为该卷积层输出的特征图像集合中的第t个特征块(patch)、第i个特征图像、第j行、第k列的值。y _tijk表示经过实例标准化层处理x _tijk后得到的结果。ε ₁为一个很小的整数，以避免分母为0。

卷积层是卷积神经网络的核心层。在卷积神经网络的卷积层中，一个神经元只与部分相邻层的神经元连接。卷积层可以对输入图像应用若干个卷积核(也称为滤波器)，以提取输入图像的多种类型的特征。每个卷积核可以提取一种类型的特征。卷积核一般以随机小数矩阵的形式初始化，在卷积神经网络的训练过程中卷积核将通过学习以得到合理的权值。对输入图像应用一个卷积核之后得到的结果被称为特征图像(feature map)，特征图像的数目与卷积核的数目相等。一个层级的卷积层输出的特征图像可以被输入到相邻的下一个层级的卷积层并再次处理以得到新的特征图像。例如，如图2A所示，第一层级的卷积层可以输出第一特征图像，该第一特征图像被输入到第二层级的卷积层再次处理以得到第二特征图像。

例如，如图2B所示，卷积层可以使用不同的卷积核对输入图像的某一个局部感受域的数据进行卷积，卷积结果被输入激活层，该激活层根据相应的激活函数进行计算以得到输入图像的特征信息。

例如，如图2A和2B所示，下采样层设置在相邻的卷积层之间，下采样层是下采样的一种形式。一方面，下采样层可以用于缩减输入图像的规模，简化计算的复杂度，在一定程度上减小过拟合的现象；另一方面，下采样层也可以进行特征压缩，提取输入图像的主要特征。下采样层能够减少特征图像的尺寸，但不改变特征图像的数量。例如，一个尺寸为12×12的输入图像，通过6×6的卷积核对其进行采样，那么可以得到2×2的输出图像，这意味着输入图像上的36个像素合并为输出图像中的1个像素。最后一个下采样层或卷积层可以连接到一个或多个全连接层，全连接层用于连接提取的所有特征。全连接层的输出为一个一维矩阵，也就是向量。

图3示出了另一种卷积神经网络的结构示意图。例如，参见图3所示的示例，最后一个卷积层(即第t个卷积层)的输出被输入到平坦化层以进行平坦化操作(Flatten)。平坦化层可以将特征图像(2D图像)转换为向量(1D)。该平坦化操作可以按照如下的方式进行：

v _k＝f _k/j,k％j

其中，v是包含k个元素的向量，f是具有i行j列的矩阵。

然后，平坦化层的输出(即1D向量)被输入到一个全连接层(FCN)。全连接层可以具有与卷积神经网络相同的结构，但不同之处在于，全连接层使用不同的标量值以替代卷积核。

例如，最后一个卷积层的输出也可以被输入到均化层(AVG)。均化层用于对输出进行平均操作，即利用特征图像的均值表示输出图像，因此，一个2D的特征图像转换成为一个标量。例如，如果卷积神经网络包括均化层，则其可以不包括平坦化层。

例如，根据实际需要，均化层或全连接层可以连接到分类器，分类器可以根据提取的特征进行分类，分类器的输出可以作为卷积神经网络的最终输出，即表征图像类别的类别标识(label)。

例如，分类器可以为支持向量机(Support Vector Machine，SVM)分类器、softmax分类器以及最邻近规则(KNN)分类器等。如图3所示，在一个示例中，卷积神经网络包括softmax分类器，softmax分类器是一种逻辑函数的生成器，可以把一个包含任意实数的K维向量z压缩成K维向量σ(z)。softmax分类器的公式如下：

其中，Z _j表示K维向量z中第j个元素，σ(z)表示每个类别标识(label)的预测概率，σ(z)为实数，且其范围为(0,1)，K维向量σ(z)的和为1。根据以上公式，K维向量z中的每个类别标识均被赋予一定的预测概率，而具有最大预测概率的类别标识被选择作为输入图像的标识或类别。

本公开至少一实施例提供一种图像处理方法。该图像处理方法包括：获取输入图像；以及使用生成网络对所述输入图像进行处理，以生成输出图像；其中，所述生成网络包括第一子网络和至少一个第二子网络，使用所述生成网络对所述输入图像进行处理，以生成所述输出图像，包括：使用所述第一子网络对所述输入图像进行处理，以得到多个第一特征图；使用所述至少一个第二子网络对所述多个第一特征图进行分支处理和权值共享处理，以得到多个第二特征图；以及对所述多个第二特征图进行处理，以得到输出图像。

本公开的一些实施例还提供对应于上述图像处理方法的图像处理装置、神经网络的训练方法及存储介质。

本公开至少一实施例提供的图像处理方法结合分支处理和权值共享处理以进行图像增强处理，既可以减少参数数量，又可以便于反向传播时计算梯度，从而，在输出高质量图像的同时还可以提高处理速度和收敛速度。

下面结合附图对本公开的一些实施例及其示例进行详细说明。

图4为本公开至少一实施例提供的一种图像处理方法的流程图。例如，如图4所示，该图像处理方法包括步骤S100至步骤S200。

步骤S100：获取输入图像。

例如，在步骤S100中，输入图像可以包括通过智能手机的摄像头、平板电脑的摄像头、个人计算机的摄像头、数码照相机的镜头、监控摄像头或者网络摄像头等拍摄采集的照片，其可以包括人物图像、动植物图像或风景图像等，本公开的实施例对此不作限制。例如，输入图像为低质量图像，输入图像的质量低于例如采用数码单镜反光相机拍摄的照片的质量。例如，输入图像可以为包括3个通道的RGB图像，本公开的实施例包括但不限于此。

步骤S200：使用生成网络对输入图像进行处理，以生成输出图像。

例如，在步骤S200中，生成网络可以对输入图像进行图像增强处理，从而使输出图像为高质量图像，例如，输出图像的质量接近于例如数码单镜反光相机拍摄的照片。

图5为一种对应于图4中所示的步骤S200的示例性流程图，图6A为本公开至少一实施例提供的一种对应于图4中所示的图像处理方法的生成网络的示意性架构框图，图6B为本公开至少一实施例提供的另一种对应于图4中所示的图像处理方法的生成网络的示意性架构框图。

以下，先结合图6A所示的生成网络对图5所示的步骤S200进行详细说明。

例如，如图5所示，使用生成网络对输入图像进行处理，以生成输出图像，即步骤S200，包括步骤S210、步骤S220和步骤S225。

步骤S210：使用第一子网络对输入图像进行处理，以得到多个第一特征图。

例如，在一些示例中，如图6A所示，生成网络可以包括第一子网络N1。例如，如图6A所示，第一子网络N1可以包括卷积模块CN，即第一子网络N1的处理包括标准卷积处理，从而步骤S210可以包括使用第一子网络N1对输入图像IN进行标准卷积处理，以得到多个第一特征图F1。需要说明的是，在本公开的实施例中，卷积模块CN可以包括卷积层和实例标准化层，从而，标准卷积处理可以包括卷积处理和实例标准化处理，下文与此类似，不再重复赘述。

步骤S220：使用至少一个第二子网络对多个第一特征图进行分支处理和权值共享处理，以得到多个第二特征图。

例如，在一些示例中，如图6A所示，生成网络可以包括至少一个第二子网络N2。例如，如图6A所示，在一些实施例中，生成网络可以包括两个第二子网络N2，即第一个第二子网络N2和第二个第二子网络N2(需要说明的是，在图6A中靠近第一子网络N1的第二子网络N2为第一个第二子网络)，第一个第二子网络N2与第一子网络N1连接，第一个第二子网络N2和第二个第二子网络N2连接。从而，可以使用两个第二子网络N2对多个第一特征图F1进行处理。例如，如图6A所示，可以将多个第一特征图F1作为第一个第二子网络N2的输入，第一个第二子网络N2的输出作为第二个第二子网络N2的输入第二个第二子网络N2的输出为多个第二特征图F2。

需要说明的是，在本公开中，两个子网络“连接”可以表示在信号传输的方向上将两个子网络中的靠前的一个子网络的输出作为两个子网络中的靠后的另一个子网络的输入。例如，“第一个第二子网络N2与第一子网络N1连接”可以表示将第一子网络N1的输出作为第一个第二子网络N2的输入。

例如，在一些示例中，如图6A所示，每个第二子网络N2可以包括第一分支网络N21、第二分支网络N22、第三分支网络N23，从而，每个第二子网络N2的分支处理可以包括：将每个第二子网络的输入(如图6A中每个第二子网络N2中的dc所示)划分为第一分支输入B1、第二分支输入B2和第三分支输入B3；以及，使用第一分支网络N21对第一分支输入B1进行处理，以得到第一分支输出O1，使用所第二分支网络N22对第二分支输入B2进行处理，以得到第二分支输出O2，使用第三分支网络N23对第三分支输入B3进行处理，以得到第三分支输出O3。

例如，在本公开的一些实施例中，互相对应的每个分支网络的输入所包括的特征图的数量可以相同，例如，第一分支输入B1所包括的特征图的数量、第二分支输入B2所包括的特征图的数量和第三分支输入B3所包括的特征图的数量均相同。需要说明的是，本公开的实施例对此不作限制。例如，在本公开的另一些实施例中，互相对应的每个分支网络的输入所包括的特征图的数量可以互不相同或者不完全相同，例如，第二分支输入B2所包括的特征图的数量和第三分支输入B3所包括的特征图的数量相同，但不同于第一分支输入B1所包括的特征图的数量。应当理解的是，互相对应的分支网络是指处于同一层级的分支网络，例如，第一分支网络N21、第二分支网络N22和第三分支网络N23是一组互相对应的分支网络，下文中将要介绍的第四分支网络N31、第五分支网络N32和第六分支网络N33是一组互相对应的分支网络，以及下文中将要介绍的第七分支网络N11、第八分支网络N12和第九分支网络N13也是一组互相对应的分支网络。因此，第四分支网络N31、第五分支网络N32和第六分支网络N33的输入所包括的特征图的数量的要求，以及第七分支网络N11、第八分支网络N12和第九分支网络N13的输入所包括的特征图的数量的要求，均可以参考第一分支网络N21、第二分支网络N22和第三分支网络N23的输入所包括的特征图的数量的要求，下文中不再重复赘述。

例如，每个第二子网络N2的输入可以包括3n个特征图，其中n为正整数，从而，可以将第1～n个特征图划分为第一分支输入B1，将第n+1～2n个特征图划分为第二分支输入B2，将第2n+1～3n个特征图划分为第三分支输入B3；或者，也可以将第1、4、7、…、3n-2个特征图划分为第一分支输入B1，将第2、5、8、…、3n-1个特征图划分为第二分支输入 B2，将第3、6、9、…、3n个特征图划分为第三分支输入B3。需要说明的是，本公开的实施例对具体的划分方式不作限制。

例如，如图6A所示，第一分支网络N21、第二分支网络N22和第三分支网络N23均可以包括卷积模块CN，从而可以分别对第一分支输入B1、第二分支输入B2和第三分支输入B3进行标准卷积处理，以得到对应的第一分支输出O1、第二分支输出O2和第三分支输出O3。例如，在一些示例中，第一分支网络N21、第二分支网络N22和第三分支网络N23的标准卷积处理的次数可以相同；当然，第一分支网络N21、第二分支网络N22和第三分支网络N23的标准卷积处理的参数可以互不相同。需要说明的是，本公开的实施例对此均不作限制。

例如，在一些示例中，如图6A所示，每个第二子网络N2还可以包括第一主干网络N20，从而，每个第二子网络N2的权值共享处理可以包括：将第一分支输出O1、第二分支输出O2和第三分支输出O3进行连接，以得到第一中间输出M1(如图6A中每个第二子网络中的c所示)；以及，使用第一主干网络N20对第一中间输出M1进行处理，以得到每个第二子网络的输出。

例如，以第一分支输出O1、第二分支输出O2和第三分支输出O3包括的特征图均为H行W列的矩阵为例，第一分支输出O1包括的特征图的数量为C1，第二分支输出O2包括的特征图的数量为C2，第三分支输出O3包括的特征图的数量为C3，则第一分支输出O1、第二分支输出O2和第三分支输出O3的模型分别为(C1，H，W)、(C2，H，W)和(C3，H，W)。从而，将第一分支输出O1、第二分支输出O2和第三分支输出O3进行连接，得到的第一中间输出M1的模型为(C1+C2+C3，H，W)。第一中间输出M1包括的特征图的数量为C1+C2+C3，本公开对第一中间输出M1的模型中各个特征图的排列顺序不作限制。需要说明的是，本公开包括但不限于此。

例如，如图6A所示，第一主干网络N20可以包括卷积模块CN和下采样层DS，从而可以对第一中间输出M1进行标准卷积处理和下采样处理。需要说明的是，本公开的实施例对第一主干网络N20中的卷积模块CN和下采样层DS的先后顺序(即标准卷积处理和下采样处理的先后顺序)不作限制。

下采样处理用于减小特征图的尺寸，从而减少特征图的数据量，例如可以通过下采样层进行下采样处理，但不限于此。例如，下采样层可以采用最大值合并(max pooling)、平均值合并(average pooling)、跨度卷积(strided convolution)、欠采样(decimation，例如选择固定的像素)、解复用输出(demuxout，将输入图像拆分为多个更小的图像)等下采样方法实现下采样处理。

需要说明的是，当至少一个第二子网络N2的数量大于等于2时，不同的第二子网络N2的第一主干网络N20中的下采样处理的方法和参数等可以相同，也可以不同，本公开的实施例对此不作限制。

需要说明的是，图6A中的第二子网络N2的数量为2是示例性的，本公开的实施例对第二子网络N2的数量不作具体限制，例如第二子网络N2的数量还可以为1、3等。例如，所述至少一个第二子网络可以包括第一个第二子网络，第一个第二子网络与第一子网络N1连接，多个第一特征图F1作为第一个第二子网络的输入；又例如，所述至少一个第二子网络可以包括除第一个第二子网络之外的其他第二子网络，其他第二子网络中的每一个第二子网络均以与其连接的前一个第二子网络的输出作为该第二子网络的输入，最后一个第二子网络的输出即为多个第二特征图F2。

步骤S225：对多个第二特征图进行处理，以得到输出图像。

例如，具体地，如图5所示，步骤S225可以包括步骤S230至步骤S250。

步骤S230：对多个第二特征图进行处理，以得到多个第三特征图。

例如，在一些示例中，如图6A所示，生成网络还可以包括密集子网络DenseNet。例如，如图6A所示，在步骤S250中，可以使用密集子网络DenseNet对多个第二特征图F2进行处理，以得到多个第三特征图F3。

图7为本公开至少一实施例提供的一种密集子网络的结构示意图。例如，如图7所示，该密集子网络DenseNet包括多个密集模块DenseBlock，例如密集模块DenseBlock的数量为N，其中N≥2。需要说明的是，图7示出的密集子网络DenseNet中密集模块DenseBlock的数量为N＝4是示例性的，不应视作对本公开的限制。

例如，在一些示例中，结合图6A和图7所示，多个第二特征图F2可以作为N个密集模块DenseBlock中的第1个密集模块(例如，第1个密集模块与至少一个第二子网络N2中的最后一个第二子网络N2连接)的输入，该多个第二特征图F2还与N个密集模块DenseBlock中的第i个密集模块之前的i-1个密集模块的输出连接，作为第i个密集模块的输入，该多个第二特征图还和每个密集模块的输出进行连接，作为多个第三特征图F3。i为整数，i≥2且i≤N。需要说明的是，本公开包括但不限于此，例如，在另一些示例中，还可以仅将每个密集模块的输出进行连接，作为多个第三特征图F3。例如，此处的连接操作可以参考前述第二子网络中的连接操作，在此不再赘述。例如，在一些示例中，如图7所示，每个密集模块DenseBlock可以包括瓶颈(Bottleneck)层B和卷积层Cv，从而，每个密集模块DenseBlock的处理包括降维处理和卷积处理。例如，瓶颈层B可以采用1×1卷积核对数据进行降维，减少特征图的数量，从而减少后续卷积处理中的参数数量，降低计算量，从而提高处理速度。

例如，密集子网络DenseNet具有大幅度减少参数、降低计算量、能够有效地解决梯度消失问题、支持特征重用和强化特征传播以及具有非常好的抗过拟合性能等优点。

步骤S240：使用第三子网络对多个第三特征图进行处理，以得到多个第四特征图。

例如，在一些示例中，如图6A所示，生成网络还可以包括第三子网络N3。例如，如图6A所示，第三子网络N3可以包括第二主干网络N30、第四分支网络N31、第五分支网络N32和第六分支网络N33，从而，第三子网络N3的处理可以包括：使用第二主干网络 N30对多个第三个特征图F3进行处理，以得到多个第五特征图F5；将多个第五特征图F5划分为第四分支输入B4、第五分支输入B5和第六分支输入B6；以及，使用第四分支网络N31对第四分支输入B4进行处理，以得到第四分支网络N31对应的第四特征图F4，使用第五分支网络N32对第五分支输入B5进行处理，以得到第五分支网络N32对应的第四特征图F4，使用第六分支网络N33对第六分支输入B6进行处理，以得到第六分支网络N33对应的第四特征图F4。

例如，步骤S240得到的多个第四特征图F4包括第四分支网络N31对应的第四特征图、第五分支网络N32对应的第四特征图和第六分支网络N33对应的第四特征图。

例如，在一些示例中，如图6A所示，第二主干网络N30可以包括上采样层US，从而可以对输入的多个第三特征图F3进行上采样处理，以得到多个第五特征图F5。

上采样处理用于增大特征图的尺寸，从而增加特征图的数据量，例如可以通过上采样层进行上采样处理，但不限于此。例如，上采样层可以采用跨度转置卷积(strided transposed convolution)、插值算法等上采样方法实现上采样处理。插值算法例如可以包括内插值、双线性插值、两次立方插值(Bicubic Interprolation)等算法。

需要说明的是，插值算法不仅可以用于进行上采样处理，也可以用于下采样处理。例如，在利用插值算法进行上采样处理时，可以保留原始像素值和插入值，从而增大特征图的尺寸；例如，在利用插值算法进行下采样处理时，可以仅保留插入值(去除原始像素值)，从而减小特征图的尺寸。

图8A为本公开至少一实施例提供的一种上采样层的示意图，图8B为本公开至少一实施例提供的另一种上采样层的示意图。

例如，在一些示例中，如图8A所示，上采样层采用像素插值法实现上采样。此时，该上采样层还可以称为复合层。复合层采用2×2的上采样因子，从而可以将4个输入特征图像(即，图8A中的INPUT 4n，INPUT 4n+1，INPUT 4n+2，INPUT 4n+3)结合以得到1个具有固定像素顺序的输出特征图像(即，图8A中的OUTPUT n)。

例如，在一些示例中，对于二维的特征图像，上采样层获取输入的第一数量的输入特征图像，将这些输入特征图像的像素值交织(interleave)重排以产生相同的第一数量的输出特征图像。相比于输入特征图像，输出特征图像的数量没有改变，但是每个输出特征图像的大小增加相应倍数。由此，该复合层通过不同的排列组合增加更多的数据信息，这些组合可给出所有可能的上采样组合。最后，可通过激活层从上采样组合进行选择。

例如，在图8B所示的示例中，上采样层采用像素值交织重排方法实现上采样。此时，该上采样层也可以称为复合层。复合层同样采用2×2的上采样因子，即以每4个输入特征图像(即，图8B中的INPUT 4n，INPUT 4n+1，INPUT 4n+2，INPUT 4n+3)为一组，将它们的像素值交织生成4个输出特征图像(即，图8B中的OUTPUT 4n，OUTPUT 4n+1，OUTPUT 4n+2，OUTPUT 4n+3)。输入特征图像的数量和经过复合层处理后得到的输出特征图像的数量相同，而各输出特征图像的大小增加为输入特征图像的4倍，即具有输入特征图像的4倍的像素数量。

例如，在一些示例中，如图6A所示，第四分支网络N31、第五分支网络N32和第六分支网络N33均可以包括卷积模块CN，从而可以分别对第四分支输入B4、第五分支输入B5和第六分支输入B6进行标准卷积处理。例如，在一些示例中，第四分支网络N31、第五分支网络N32和第六分支网络N33的标准卷积处理的次数可以相同；当然，第四分支网络N31、第五分支网络N32和第六分支网络N33的标准卷积处理的参数可以互不相同。需要说明的是，本公开的实施例对此均不作限制。

例如，在一些示例中，如图6A所示，第四分支网络N31、第五分支网络N32和第六分支网络N33均可以包括上采样层US，从而第四分支网络N31、第五分支网络N32和第六分支网络N33的处理还均可以包括上采样处理。例如，在一些示例中，第四分支网络N31、第五分支网络N32和第六分支网络N33的上采样处理的次数可以相同；当然，第四分支网络N31、第五分支网络N32和第六分支网络N33的上采样处理的参数可以互不相同。需要说明的是，本公开的实施例对此均不作限制。

需要说明的是，第二主干网络N30中的上采样处理的方法与第四分支网络N31、第五分支网络N32和第六分支网络N33中的上采样处理的方法可以相同，也可以不同，本公开的实施例对此不作限制。

例如，在一些示例中，第四分支网络N31对应的第四特征图F4的数量为1，第五分支网络N32对应的第四特征图F4的数量为1，第六分支网络N33对应的第四特征图F4的数量为1，即多个特征图F4包括3幅特征图。

步骤S250：对多个第四特征图进行合成处理，以得到输出图像。

例如，在一些示例中，如图6A所示，生成网络还可以包括合成模块Merg。例如，如图6A所示，在步骤S250中，可以使用合成模块Merg对多个第四特征图F4进行处理，以得到输出图像OUT。

例如，在一些示例中，合成模块Merg可以包括第一转换矩阵，该第一转换模块用于将多个第四特征图F4转换为输出图像OUT。例如，在一些示例中，具体地，使用合成模块Merg对多个第四特征图F4进行处理，以得到输出图像OUT，可以包括：利用第一转换矩阵，将第四分支网络N31对应的第四特征图F4的数据信息、第五分支网络N32对应的第四特征图F4的数据信息和第六分支网络N33对应的第四特征图F4的数据信息转换为输出图像OUT的第一颜色通道的数据信息、第二颜色通道的数据信息和第三颜色通道的数据信息，以得到输出图像OUT。

例如，在一些示例中，第一颜色通道、第二颜色通道和第三颜色通道可以分别为红色(R)、绿色(G)、蓝色(B)通道，从而输出图像OUT为RGB格式的图像。需要说明的是，本公开的实施例包括但不限于此。

例如，在一些示例中，第一转换矩阵可以用于将YUV格式的图像转换为RGB格式的图像，例如，第一转换矩阵的转换公式可以表示如下：

其中，Y、U、V分别表示YUV格式图像的亮度信息(即第一亮度信道的数据信息)、第一色度信息(即第一色差信道的数据信息)和第二色度信息(即第二色差信道的数据信息)，R、G和B分别表示转换得到的RGB格式图像的红色信息(即第一颜色通道的数据信息)、绿色信息(即第二颜色通道的数据信息)和蓝色信息(即第三颜色通道的数据信息)。

需要说明的是，在使用例如图6A所示的生成网络执行本公开的实施例提供的图像处理方法之前，可以先对该生成网络进行训练。例如，在训练过程中，第一转换矩阵的参数固定不变。例如，图6A所示的生成网络经过训练后，其第四分支网络N31输出的第四特征图F4的数据信息、第五分支网络N32输出的第四特征图F4的数据信息和第六分支网络N33输出的第四特征图F4的数据信息分别对应第一亮度信道的数据信息、第一色差信道的数据信息和第二色差信道的数据信息，从而通过第一转换矩阵进行转换后可以得到RGB格式的输出图像OUT。

例如，输出图像OUT保留了输入图像IN的内容，但是，输出图像OUT为高质量图像，例如，输出图像OUT的质量可以接近于例如数码单镜反光相机拍摄的照片的质量。

例如，在一些示例中，第四分支网络N31输出的第四特征图F4、第五分支网络N32输出的第四特征图F4和第六分支网络N33输出的第四特征图F4的数量均为1，即多个特征图F4包括3幅特征图(分别对应第一亮度信道、第一色差信道、第二色差信道)，第一转换矩阵可以将该3幅特征图转换为RGB格式的输出图像。

例如，由于第四分支网络N31、第五分支网络N32和第六分支网络N33均包括标准卷积处理(标准卷积处理包括卷积处理和实例标准化处理)，多个第四特征图F4的像素的灰度值的范围可以为例如[-1，1]，因此，合成模块Merg的处理还可以包括：将输出图像OUT的像素的灰度值转换到例如[0，255]范围内。

对于YUV格式，Y代表亮度，U、V代表色度，U和V是构成彩色的两个分量，在YUV颜色空间中，第一亮度信道(即Y通道)和第一色差信道(即U通道)、第二色差信道(即V通道)是分离的。例如，YUV格式可以包括YUV444、YUV420以及YUV422等格式。YUV444、YUV420以及YUV422等格式的主要区别在于U通道和V通道的数据的采样方式和存储方式。

例如，YUV444格式表示每一行像素中，两种色度信息(即第一色度信息U和第二色度信息V)都是完整的，即两种色度信息均基于完全抽样进行存储。

假设，若一幅图像中的4个像素点分别表示为：

[Y0U0V0][Y1U1V1][Y2U2V2][Y3U3V3]

在图像处理过程中，存放或处理该4个像素点的数据流为：

Y0U0V0Y1U1V1Y2U2V2 Y3U3V3

映射出的像素点分别表示为：

[Y0U0V0][Y1U1V1][Y2U2V2][Y3U3V3]

即映射出的像素点为原始的像素点。

例如，YUV420格式表示每一行像素中，只有一种色度信息(第一色度信息U或第二色度信息V)，且第一色度信息U或第二色度信息V以1/2的频率抽样存储。在图像处理过程中，相邻的行处理不同的色度信息。

假设一幅图像中的两行8个像素点分别表示为：

[Y0U0V0][Y1U1V1][Y2U2V2][Y3U3V3]

[Y4U4V4][Y5U5V5][Y6U6V6][Y7U7V7]

在图像处理过程中，存放或处理该8个像素点的数据流为：

Y0U0 Y1 Y2U2 Y3

Y4V4 Y5 Y6V6 Y7

在第一行像素中，只有第一色度信息U；在第二行像素中，只有第二色度信息V。

映射出的像素点表示为：

[Y0 U0 V4][Y1 U0 V4][Y2 U2 V6][Y3 U2 V6]

[Y4 U0 V4][Y5 U0 V4][Y6U2 V7][Y7 U2 V6]

综上，每一行中相邻的4个像素点在存放或处理时仅占用6个字节，相比YUV444(4个像素点需要12个字节)的采样格式，YUV420格式减小了处理和存储的像素点的数据量。尽管映射出的像素点与原始像素点略有不同，但这些不同在人眼的感觉中不会引起明显的变化。

例如，在一些示例中，图6A所示的生成网络中，多个特征图F4可以具有YUV444的图像格式。需要说明的是，本公开的实施例包括但不限于此。

图6B所示的生成网络与图6A所示的生成网络的不同之处主要在于第一子网络N1和第三子网络N3。需要说明的是，图6B所示的生成网络的其他构造与图6A所示的生成网络基本相同，在此重复之处不再赘述。

以下结合图6B所示的生成网络与图6A所示的生成网络的不同之处，对这些不同之处对应的图5所示的流程中的步骤进行详细说明。

例如，在一些示例中，输入图像具有第一颜色通道、第二颜色通道和第三颜色通道。例如第一颜色通道、第二颜色通道和第三颜色通道可以分别为红色(R)、绿色(G)、蓝色(B)通道，本公开的实施例包括但不限于此。例如，相应地，在图6B所示的生成网络中，第一子网络N1可以包括转换模块Tran、第七分支网络N11、第八分支网络N12、第九分支网络N13和第三主干网络N10，从而，步骤S210可以包括以下步骤S211至步骤S214。

步骤S211：使用转换模块Tran将输入图像IN的第一颜色通道、第二颜色通道和第三颜色通道的数据信息转换为中间输入图像MIN的第一亮度信道、第一色差信道和第二色差信道的数据信息。

例如，在一些示例中，转换模块Tran可以包括第二转换矩阵，该第二转换矩阵用于将输入图像IN转换为中间输入图像MIN。例如，在一些示例中，第二转换矩阵可以用于将RGB格式的图像转换为YUV格式的图像，例如，第二转换矩阵的转换公式可以表示如下：

其中，R、G和B分别表示RGB格式图像的红色信息(即第一颜色通道的数据信息)、绿色信息(即第二颜色通道的数据信息)和蓝色信息(即第三颜色通道的数据信息)，Y、U、V分别表示转换得到的YUV格式图像的亮度信息(即第一亮度信道的数据信息)、第一色度信息(即第一色差信道的数据信息)和第二色度信息(即第二色差信道的数据信息)。

例如，在一些示例中，输入图像IN具有RGB格式，中间输入图像MIN具有例如YUV420格式，从而减小U通道和V通道的尺寸，进而减小生成网络中卷积核的数量。需要说明的是，本实施例包括但不限于此。

步骤S212：使用第七分支网络对中间输入图像的第一亮度信道的数据信息进行处理，以得到第七分支输出，使用第八分支网络对中间输入图像的第一色差信道的数据信息进行处理，以得到第八分支输出，使用第九分支网络对中间输入图像的第二色差信道的数据信息进行处理，以得到第九分支输出。

例如，在一些示例中，如图6B所示，将中间输入图像MIN的第一亮度信道、第一色差信道和第二色差信道的数据信息分别作为第七分支输入B7、第八分支输入B8和第九分支输入B9，并分别经过第七分支网络N11、第八分支网络N12和第九分支网路N13处理，以对应得到第七分支输出O7、第八分支输出O8和第九分支输出O9。

例如，如图6B所示，第七分支网络N11可以包括卷积模块CN和下采样层DS，从而可以对第七分支输入B7进行标准卷积处理和下采样处理；第八分支网络N12和第九分支网络N13均可以包括标准下采样层SDS，从而可以分别对第八分支输入B8和第九分支输入B9进行标准下采样处理。

例如，标准下采样层可以采用内插值、双线性插值、两次立方插值(Bicubic Interprolation)等插值算法进行标准下采样处理。例如，在利用插值算法进行标准下采样处理时，可以仅保留插入值(去除原始像素值)，从而减小特征图的尺寸。

例如，在一些示例中，第八分支网络N12和第九分支网络N13中的标准下采样处理的方法可以相同，而其参数可以不同。需要说明的是，本公开的实施例包括但不限于此。

例如，与第七分支网络N11相比，第八分支网络N12中相当于省略了处理U通道最高分辨率的卷积模块，第九分支网络N13中相当于省略了处理V通道最高分辨率的卷积模块，从而可以提高处理速度。

步骤S213：将第七分支输出、第八分支输出和第九分支输出进行连接，以得到第二中间输出。

例如，在一些示例中，如图6B所示，可以参考前述第二子网络中的连接方式，将第七分支输出O7、第八分支输出O8和第九分支输出O9进行连接，以得到第二中间输出M2，具体细节在此不再赘述。

步骤S214：使用第三主干网络对第二中间输出进行处理，以得到多个第一特征图。

例如，在一些示例中，如图6B所示，可以使用第三主干网络N10对第二中间输出M2进行处理，以得到多个第一特征图F1。例如，如图6B所示，第三主干网络N10可以包括卷积模块CN，从而可以对输入的第二中间输出M2进行标准卷积处理，以得到多个第一特征图F1。

例如，在图6B所示的生成网络中，可以使用至少一个第二子网络N2执行步骤S220，即对多个第一特征图F1进行分支处理和权值共享处理，以得到多个第二特征图F2，例如，具体细节可以参考前述基于图6A所示的生成网络执行步骤S220的相应描述，在此不再赘述。需要说明的是，图6B所示的生成网络中，第二子网络N2的数量为1是示例性的，不应视作对本公开的限制。

例如，在图6B所示的生成网络中，可以使用密集子网络DenseNet执行步骤S230，即对多个第二特征图F2进行处理，以得到多个第三特征图F3，例如，具体细节可以参考前述基于图6A所示的生成网络执行步骤S230的相应描述，在此不再赘述。

例如，在图6B所示的生成网络中，可以使用第三子网络N3执行步骤S240，即使用第三子网络N3对多个第三特征图F3进行处理，以得到多个第四特征图F4。例如，与图6A所示的生成网络类似，在图6B所示的生成网络中，第三子网络N3也可以包括第二主干网络N30、第四分支网络N31、第五分支网络N32和第六分支网络N33，从而，该第三子网络N3的处理也可以包括：使用第二主干网络N30对多个第三个特征图F3进行处理，以得到多个第五特征图F5；将多个第五特征图F5划分为第四分支输入B4、第五分支输入B5和第六分支输入B6；以及，使用第四分支网络N31对第四分支输入B4进行处理，以得到第四分支网络N31对应的第四特征图F4，使用第五分支网络N32对第五分支输入B5进行处理，以得到第五分支网络N32对应的第四特征图F4，使用第六分支网络N33对第六分支输入B6进行处理，以得到第六分支网络N33对应的第四特征图F4。

例如，与图6A所示的生成网络类似，在图6B所示的生成网络中，第二主干网络N30也可以包括上采样层US，从而可以对输入的多个第三特征图F3进行上采样处理，以得到多个第五特征图F5。

例如，与图6A所示的生成网络类似，在图6B所示的生成网络中，第四分支网络N31也可以包括卷积模块和上采样层，以用于进行标准卷积处理和上采样处理。例如，与图6B所示的生成网络不同的是，在图6B所示的生成网络中，第五分支网络N32和第六分支网络N33均可以包括卷积模块CN和标准上采样层SUS，以用于进行标准卷积处理和标准上采样处理。

例如，标准上采样层可以采用内插值、双线性插值、两次立方插值(Bicubic Interprolation)等插值算法进行标准上采样处理。例如，在利用插值算法进行标准上采样处理时，可以保留原始像素值和插入值，从而增大特征图的尺寸。

例如，与第四分支网络N31相比，第五分支网络N32中相当于省略了处理U通道最高分辨率的卷积模块，第六分支网络N33中相当于省略了处理V通道最高分辨率的卷积模块，从而可以提高处理速度。这与前述的第七分支网络N11、第八分支网络N12、第九分支网络N13的情况类似。需要说明的是，第五分支网络中N32中的标准上采样层SUS一般与第八分支网络N12中的标准下采样层SDS对应出现，第六分支网络中N33中的标准上采样层SUS一般与第九分支网络N13中的标准下采样层SDS对应出现。需要说明的是，本公开的实施例包括但不限于此。

例如，在图6B所示的生成网络中，可以使用合成模块Merg执行步骤S250，即使用合成模块Merg对多个第四特征图F4进行处理，以得到输出图像OUT，例如，具体细节可以参考前述基于图6A所示的生成网络执行步骤S250的相应描述，在此不再赘述。

需要说明的是，在本公开的实施例中，图6A所示的生成网络和图6B所示的生成网络都只是示例性的，而非限制性的。还需要说明的是，在对生成网络进行训练之前，生成网络可能完全不具有图像增强处理的功能，或者也可能具有图像增强处理的功能，但是图像增强处理的效果不好；对待训练的生成网络训练后得到的生成网络具有图像增强处理的功能，且能够生成高质量图像。

图9A为一种输入图像的示意图，图9B为根据图6A所示的生成网络对图9A所示的输入图像进行处理得到的输出图像的示意图，图9C为根据图6B所示的生成网络对图9A所示的输入图像进行处理得到的输出图像的示意图。例如，与图9A所示的输入图像相比，图9B和图9C所示的输出图像均保留了输入图像的内容，但是提高了图像的对比度，改善了输入图像过暗的问题，从而，与输入图像相比，输出图像的质量可以接近于例如数码单镜反光相机拍摄的照片的质量，即输出图像为高质量图像。由此，本公开的实施例提供的图像处理方法实现了图像增强处理的效果。

本公开的实施例提供的图像处理方法，可以结合分支处理和权值共享处理以进行图像增强处理，既可以减少参数数量，又可以便于反向传播时计算梯度，从而，在输出高质量图像的同时还可以提高处理速度和收敛速度。

本公开至少一实施例还提供一种神经网络的训练方法。图10为本公开至少一实施例提供的一种神经网络的训练方法的流程图。例如，如图10所示，该训练方法包括：

步骤S300：基于待训练的生成网络，对判别网络进行训练；

步骤S400：基于判别网络，对待训练的生成网络进行训练；以及，

交替地执行上述训练过程，以得到本公开上述任一实施例提供的图像处理方法中的生成网络。

例如，在一些示例中，该待训练的生成网络的构造可以与图6A所示的生成网络或图6B所示的生成网络相同，本公开的实施例包括但不限于此。例如，待训练的生成网络经过该训练方法的训练后可以执行本公开上述任一实施例提供的图像处理方法，即利用该训练方法得到的生成网络可以执行本公开上述任一实施例提供的图像处理方法。

图11A为本公开至少一实施例提供的一种对应于图10中所示的训练方法训练待训练的生成网络的示意性架构框图，图11B为本公开至少一实施例提供的一种训练待训练的生成网络的过程的示意性流程图。

例如，结合图11A和图11B所示，基于判别网络，对待训练的生成网络进行训练，即步骤S300，包括步骤S310至步骤S330。

步骤S310：使用待训练的生成网络对第一训练输入图像进行处理，以生成第一训练输出图像。

例如，与前述步骤S100中的输入图像类似，第一训练输入图像也可以包括通过智能手机的摄像头、平板电脑的摄像头、个人计算机的摄像头、数码照相机的镜头、监控摄像头或者网络摄像头等拍摄采集的照片，其可以包括人物图像、动植物图像或风景图像等，本公开的实施例对此不作限制。例如，第一训练输入图像为低质量图像，例如，第一训练输入图像的质量低于例如数码单镜反光相机拍摄的照片的质量。例如，在一些示例中，第一训练输入图像可以为RGB格式的图像，本公开的实施例包括但不限于此。

例如，待训练的生成网络G可以具有图6A所示的生成网络或图6B所示的生成网络的构架。例如，待训练的生成网络G的初始参数可以为随机数，例如随机数符合高斯分布。需要说明的是，本公开的实施例对此不作限制。

例如，步骤S310的具体过程可以参考前述步骤S200的相关描述，即第一训练输入图像对应于输入图像，第一训练输出图像对应于输出图像，根据第一训练输入图像生成第一训练输出图像的过程可以参考前述根据输入图像生成输出图像的过程，在此不再赘述。

步骤S320：基于第一训练输出图像，通过系统损失函数计算待训练的生成网络的系统损失值。

例如，在一些示例中，如图11A所示，系统损失函数可以包括生成网络对抗损失函数，相应地，系统损失值可以包括生成网络对抗损失值。例如，如图11A所示，在待训练的生成网络G的训练过程中，可以使用判别网络D对第一训练输出图像进行处理，根据判别网络D的输出，通过生成网络对抗损失函数计算生成网络对抗损失值。

图12为本公开至少一实施例提供的一种判别网络的结构示意图。例如，如图12所示，该判别网络D包括多个卷积模块CM、多个下采样层DS和全连接层FCN。例如，判别网络D中的卷积模块CM、下采样层DS和全连接层FCN的结构和作用可以分别参考前述与卷积模块、下采样层、全连接层相关的描述，本公开的实施例对此不作限制。

例如，如图12所示，在该判别网络D中，多个卷积模块CM依次连接，在一些相邻的卷积模块CM之间具有下采样层DS，例如，如图12所示，判别网络D包括依次连接的六个卷积模块CM，在第二个卷积模块和第三卷积模块之间具有一个下采样层，在第四个卷积模块和第五卷积模块之间具有一个下采样层。全连接层FCN与最后一个卷积模块CM连接。例如，每个卷积模块CM可以包括卷积层和实例标准化层；例如，至少部分卷积模块CM还可以省略实例标准化层。

例如，如图12所示，该判别网络D还包括激活层，该激活层连接到全连接层FCN。例如，如图12所示，该激活层的激活函数可以采用Sigmoid函数，从而，该激活层的输出(即判别网络D的输出)为一个在[0，1]的取值范围内的数值。例如，判别网络D可以判断第一训练输出图像的质量是否接近于高质量图像(例如，数码单镜反光相机拍摄的照片)，以第一训练输出图像作为判别网络D的输入为例，判别网络D对第一训练输出图像进行处理，以得到判别网络D输出，判别网络D输出的数值表示第一训练输出图像的质量与例如数码单镜反光相机拍摄的照片的质量的接近程度。例如，该判别网络D输出的数值越大，例如趋近于1，表示判别网络D认定第一训练输出图像的质量越接近于数码单镜反光相机拍摄的照片的质量，即第一训练输出图像的质量越高；例如，该判别网络D输出的数值越小，例如趋近于0，则表示判别网络D认定第一训练输出图像的质量越不接近于数码单镜反光相机拍摄的照片的质量，即第一训练输出图像的质量越低。

需要说明的是，图12所示的判别网络是示意性的。例如，在一些示例中，图12所示的判别网络可以包括更多或更少的卷积模块或下采样层。例如，在一些示例中，图12所示的判别网络还可以包括其他模块或层结构，例如在全连接层之前还具有一个平坦化模块。例如，在一些示例中，图12所示的判别网络中的部分模块或层结构可以替换为其他模块或层结构，例如将全连接层替换为进行平均操作(AVG)的卷积层(参考图3及前述相关描述)，又例如将激活层替换为二分类的softmax模块。进一步地，本公开的实施例对判别网络的结构不作限制，即包括但不限于图12所示的判别网络结构。

例如，在一些示例中，生成网络对抗损失函数可以表示为：

其中，L _G表示生成网络对抗损失函数，z1表示第一训练输入图像，P _z1(z1)表示第一训练输入图像的集合(例如，包括一个批次的多幅第一训练输入图像)，G(z1)表示第一训练输出图像，D(G(z1))表示判别网络D针对第一训练输出图像的输出，即判别网络D对第一训练输出图进行处理得到的输出，

表示针对第一训练输入图像的集合求平均以得到生成网络对抗损失值。由此，可以相应采用批量梯度下降算法对待训练的生成网络G进行参数优化。

需要说明的是，上述公式表示的生成网络对抗损失函数是示例性的，本公开的实施例包括但不限于此。

待训练的生成网络G的训练目标是最小化系统损失值，因此，在待训练的生成网络G的训练过程中，最小化系统损失值包括减小生成网络对抗损失值。例如，在待训练的生成网络G的训练过程中，第一训练输出图像的标签设置为1，即需要使判别网络D鉴别认定第一训练输出图像的质量与例如数码单镜反光相机拍摄的照片的质量一致。例如，在待训练的生成网络G的训练过程中，待训练的生成网络G的参数被不断地修正，以使经过参数修正后的待训练的生成网络G生成的第一训练输出图像对应的判别网络D的输出不断趋近于1，从而不断地减小生成网络对抗损失值。

例如，在一些示例中，如图11A所示，系统损失函数还可以包括内容损失函数，相应地，系统损失值可以包括内容损失值。例如，如图11A所示，在待训练的生成网络G的训练过程中，可以使用分析网络A对第一训练输出图像进行处理，根据分析网络A的输出，通过内容损失函数计算内容损失值。

图13为本公开至少一实施例提供的一种分析网络的结构示意图。例如，如图13所示，该分析网络A包括依次连接的多个卷积模块CM和间插于相邻卷积模块CM的多个下采样层DS。例如，每个卷积模块CM包括卷积层，每个卷积层包括多个卷积核，该卷积核可以用于提取分析网络A的输入图像的内容特征和风格特征。例如，参考图11A，图13所示的分析网络A的输入可以包括第一训练输入图像和第一训练输出图像。例如，每个卷积模块CM可以包括卷积层和实例标准化层；例如，至少部分卷积模块CM还可以省略实例标准化层。

例如，分析网络A可以采用能够对图像进行分类的深度神经网络如图13所示，输入经过若干个卷积模块CM和下采样层DS处理，以提取特征。每个卷积模块CM的输出都是其输入的特征图像。下采样层DS可以降低特征图像的尺寸并传递给下一层级的卷积模块。多个卷积模块CM可以输出多个特征图像，该多个特征图像可以表征输入的不同级别的特征(例如，纹理、边缘、物体等)。经过若干个卷积模块CM和下采样层DS处理之后，特征图像被输入至平坦化层，平坦化层将特征图像转换成向量然后传递给全连接层以及分类器。分类器层可以包括softmax分类器，softmax分类器可以输出输入属于每一个类别标识的概率，其中概率最大的标识将作为分析网络A最终的输出。由此，分析网络A实现图像分类。

例如，分析网络A可以采用已经训练好的卷积神经网络模型。从而，在待训练的生成网络G的训练过程中，不需对分析网络A的参数(例如，卷积核等)进行修正。例如，分析网络A可以采用AlexNet、GoogleNet、VGG、Deep Residual Learning等神经网络模型实现提取输入的内容特征和风格特征。VGG网络为深度卷积神经网络的一种，其是由牛津大学视觉几何组(Visual Geometry Group)开发，已经在视觉识别领域得到广泛应用。例如，VGG网络可以包括19层，并且可以对其中的一些层进行标准化处理。

需要说明的是，在一些示例中，在待训练的生成网络G的训练过程中，仅需要用到上述分析网络A中用于提取其输入的特征的部分，例如，如图13中虚线框所示的多个卷积模块CM和多个下采样层DS。例如，在本公开的实施例提供的分析网络A中，如图13所示，至少两个卷积模块CM用于提取风格特征，至少一个卷积模块CM用于提取内容特征。需要说明的是，图13所示的分析网络是示意性的。本公开的实施例对分析网络的结构、提取风格特征和内容特征的具体细节(例如，用于提取风格特征和内容特征的第一卷积模块的数量和层级等)等均不作限制。还需要说明的是，在一些示例中，在待训练的生成网络G的训练过程中，仅需要用到上述分析网络A中用于提取其输入的内容特征的部分。

例如，如图11A所示，在待训练的生成网络G的训练过程中，分析网络A用于接收第一训练输入图像和第一训练输出图像，且分别产生并输出第一训练输入图像的第一内容特征图以及第一训练输出图像的第二内容特征图。例如，内容特征表示图像中物体在整幅图像的分布，例如，内容特征包括图像的内容信息。

例如，在待训练的生成网络G的训练过程中，可以使用分析网络A提取第一训练输入图像的第一内容特征图和第一训练输出图像的第二内容特征图，并根据第一内容特征图和第二内容特征图，通过内容损失函数计算待训练的生成网络G的内容损失值。例如，在一些示例中，对于如图13所示的分析网络A，单层内容损失函数可以表示为：

其中，S ₁为常数，

表示在分析网络A中第m个卷积模块中第i个卷积核提取的第一训练输入图像的第一内容特征图中第j个位置的值，

表示在分析网络A中第m个卷积模块中第i个卷积核提取的第一训练输出图像的第二内容特征图中第j个位置的值。

例如，在如图13所示的分析网络A中，可以通过至少一个卷积模块CM提取输入图像(例如，此处的输入图像包括第一训练输入图像和第一训练输出图像)的内容特征，则内容损失函数可以表示为：

其中，L _content表示内容损失函数，C _m表示用于提取内容特征的至少一个卷积模块中的第m个卷积模块的单层内容损失函数，w _1m表示C _m的权重。

例如，在待训练的生成网络G的训练过程中，最小化系统损失值包括减小内容损失值。例如，在使用待训练的生成网络G进行图像增强处理时，需要使保持待训练的生成网络G的输出和输入具有相同的内容特征，即第一训练输出图像保留了第一训练输入图像的内容。例如，在待训练的生成网络G的训练过程中，待训练的生成网络G的参数被不断地修正，以使经过参数修正后的待训练的生成网络G生成的第一训练输出图像的内容特征不断趋近于第一训练输入图像的内容特征，从而不断地减小内容损失值。

例如，在一些示例中，如图11A所示，系统损失函数还可以包括颜色损失函数，相应地，系统损失值可以包括颜色损失值。例如，如图11A所示，在待训练的生成网络G的训练过程中，可以根据第一训练输出图像和第二训练输入图像建立颜色损失函数以计算颜色损失值。

例如，在一些示例中，颜色损失函数可以表示为：

L _color＝abs(gaussian(G(z1))-gaussian(I1))

其中，L _color表示所述颜色损失函数，G(z1)表示所述第一训练输出图像，I1表示第二训练输入图像，gaussian()表示高斯模糊化运算，abs()表示求绝对值运算。

例如，第二训练输入图像可以为高质量图像，即第二训练输入图像的质量比第一训练输入图像的质量高，例如，第二训练输入图像可以为例如数码单镜反光相机拍摄的照片图像。例如，第二训练输入图像可以包括人物图像、动植物图像或风景图像等，本公开的实施例对此不作限制。

例如，在一些示例中，第一训练输出图像的质量接近于例如数码单镜反光相机拍摄的照片的质量，至少可以部分体现为：第一训练输出图像与数码单镜反光相机拍摄的照片在各个局部的颜色分布和亮度分布等接近一致。

例如，在待训练的生成网络G的训练过程中，最小化系统损失值包括减小颜色损失值。例如，在使用待训练的生成网络G进行图像增强处理时，需要使第一训练输出图像在各个局部的颜色分布和亮度分布等与例如数码单镜反光相机拍摄的照片接近一致。例如，在待训练的生成网络G的训练过程中，待训练的生成网络G的参数被不断地修正，以使经过参数修正后的待训练的生成网络G生成的第一训练输出图像在各个局部的颜色分布和亮度分布等接近于例如数码单镜反光相机拍摄的照片，从而不断地减小颜色损失值。

例如，在一些示例中，第一训练输出图像具有第一颜色通道、第二颜色通道和第三颜色通道，例如，可以参考前述图像处理方法中的输出图像的相关描述，在此不再赘述。例如，如图11A所示，系统损失函数还可以包括对比损失函数，相应地，系统损失值可以包括对比损失值。例如，如图11A所示，在待训练的生成网络G的训练过程中，可以根据第一训练输出图像和第三训练输入图像建立对比损失函数以计算对比损失值。

例如，在一些示例中，对比损失函数可以表示为：

其中，L _L1表示所述对比损失函数，G(z1)表示所述第一训练输出图像，I2表示第三训练输入图像，F _G(z1)、S _G(z1)和T _G(z1)分别表示所述第一训练输出图像的第一颜色通道、第二颜色通道和第三颜色通道的数据信息，F _I2、S _I2和T _I2分别表示所述第三训练输入图像的第一颜色通道、第二颜色通道和第三颜色通道的数据信息，abs()表示求绝对值运算。

例如，第三训练输入图像可以具有与第一训练输入图像相同的场景，即内容相同，且第三训练输入图像的质量比第一训练输入图像的质量高，例如第三训练输入图像可以为例如数码单镜反光相机拍摄的照片图像。由于第三训练输入图像可以相当于待训练的生成网络G的目标输出图像，从而，在系统损失函数中增加对比损失函数，可以提高收敛速度和处理速度。

例如，在待训练的生成网络G的训练过程中，最小化系统损失值包括减小对比损失值。例如，在使用待训练的生成网络G进行图像增强处理时，需要使第一训练输出图像接近于第三训练输入图像。例如，在待训练的生成网络G的训练过程中，待训练的生成网络G的参数被不断地修正，以使经过参数修正后的待训练的生成网络G生成的第一训练输出图像接近于第三训练输入图像，从而不断地减小对比损失值。

例如，在本公开的实施例中，待训练的生成网络G的系统损失函数可以表示为：

L _total＝αL _G+βL _content+χL _color+δL _L1

其中，L _total表示系统损失函数，α、β、χ和δ分别为系统损失函数中生成网络对抗损失函数、内容损失函数、颜色损失函数和对比损失函数的权重。

例如，在一些示例中，为了防止过拟合，对比损失函数的权重δ可以小于内容损失函数的权重β；例如，在一些示例中，对比损失函数的权重占比不超过20％。

例如，在步骤S320中，可以通过上述公式表示的系统损失函数计算系统损失值，再执行后续步骤S330，对待训练的生成网络G的参数进行修正，由此可以实现步骤S300。

步骤S330：基于系统损失值对待训练的生成网络的参数进行修正。

例如，在待训练的生成网络G的训练过程中还可以包括优化函数(图11A中未示出)，优化函数可以根据系统损失函数计算得到的系统损失值计算生成网络G的参数的误差值，并根据该误差值对待训练的生成网络G的参数进行修正。例如，优化函数可以采用随机梯度下降(stochastic gradient descent，SGD)算法、批量梯度下降(batch gradient descent,BGD)算法等计算生成网络G的参数的误差值。

例如，以待训练的生成网络G为图6A所示的生成网络为例，对待训练的生成网络G的参数进行修正，包括：对图6A所示的生成网络中的除合成模块Merg的参数以外的参数进行修正，即该合成模块Merg的参数保持不变。例如，以待训练的生成网络G为图6B所示的生成网络为例，对待训练的生成网络G的参数进行修正，包括：对图6B所示的生成网络中的除转换模块Tran和合成模块Merg的参数以外的参数进行修正，即该转换模块Tran和合成模块Merg的参数均保持不变。

例如，基于判别网络，对待训练的生成网络进行训练，即步骤S300还可以包括：判断待训练的生成网络G的训练是否满足预定条件，若不满足预定条件，则重复执行上述待训练的生成网络G的训练过程；若满足预定条件，则停止本阶段的待训练的生成网络G的训练过程，得到本阶段训练好的生成网络G。需要说明的是，本阶段训练好的生成网络G可以作为下一阶段的待训练的生成网络G。例如，在一个示例中，上述预定条件为连续两幅(或更多幅)第一训练输入图像对应的系统损失值不再显著减小。例如，在另一个示例中，上述预定条件为生成网络G的训练次数或训练周期达到预定数目。需要说明的是，本公开的实施例对此不作限制。

例如，如图11A所示，在待训练的生成网络G的训练过程中，需要联合判别网络D和分析网络A进行训练。需要说明的是，在生成网络G的训练过程中，判别网络D的参数保持不变。需要说明的是，当分析网络A采用已经训练好的卷积神经网络模型时，分析网络A的参数也可以保持不变。

需要说明的是，在本公开中，例如，待训练的生成网络、判别网络、分析网络以及这些神经网络包括的各种层或模块(例如卷积模块、上采样层、下采样层等)等每个分别对应执行相应处理过程的程序/方法，例如通过相应的软件、固件、硬件等方式实现；并且，上述示例仅是示意性说明待训练的生成网络的训练过程。本领域技术人员应当知道，在训练阶段，需要利用大量样本图像对神经网络进行训练；同时，在每一幅样本图像训练过程中，都可以包括多次反复迭代以对待训练的生成网络的参数进行修正。又例如，训练阶段还包括对待训练的生成网络的参数进行微调(fine-tune)，以获取更优化的参数。

图14A为本公开至少一实施例提供的一种对应于图10中所示的训练方法训练判别网络的示意性架构框图，图14B为本公开至少一实施例提供的一种训练判别网络的过程的示意性流程图。

例如，结合图14A和图14B所示，基于待训练的生成网络，对判别网络进行训练，即步骤S400，包括步骤S410至步骤S430，如下所示：

步骤S410：利用待训练的生成网络对第四训练输入图像进行处理，以生成第二训练输出图像；

步骤S420：基于第二训练输出图像和第五训练输入图像，通过判别网络对抗损失函数计算判别网络对抗损失值；

步骤S430：根据判别网络对抗损失值对判别网络的参数进行修正。

例如，基于待训练的生成网络，对判别网络进行训练，即步骤S400还可以包括：判断判别网络D的训练是否满足预定条件，若不满足预定条件，则重复执行上述判别网络D的训练过程；若满足预定条件，则停止本阶段的判别网络D的训练过程，得到本阶段训练好的判别网络D。例如，在一个示例中，上述预定条件为连续两幅(或更多幅)第五训练输入图像和第二训练输出图像对应的判别网络对抗损失值不再显著减小。例如，在另一个示例中，上述预定条件为判别网络D的训练次数或训练周期达到预定数目。需要说明的是，本公开的实施例对此不作限制。

例如，如图14A所示，在判别网络D的训练过程中，需要联合待训练的生成网络G进行训练。需要说明的是，在判别网络D的训练过程中，待训练的生成网络G的参数保持不变。

需要说明的是，上述示例仅是示意性说明判别网络的训练过程。本领域技术人员应当知道，在训练阶段，需要利用大量样本图像对神经网络进行训练；同时，在每一幅样本图像训练过程中，都可以包括多次反复迭代以对判别网络的参数进行修正。又例如，训练阶段还包括对判别网络的参数进行微调(fine-tune)，以获取更优化的参数。

例如，判别网络D的初始参数可以为随机数，例如随机数符合高斯分布，本公开的实施例对此不作限制。

例如，判别网络D的训练过程中还可以包括优化函数(图14A中未示出)，优化函数可以根据判别网络对抗损失函数计算得到的判别网络对抗损失值计算判别网络D的参数的误差值，并根据该误差值对判别网络D的参数进行修正。例如，优化函数可以采用随机梯度下降(stochastic gradient descent，SGD)算法、批量梯度下降(batch gradient descent,BGD)算法等计算判别网络D的参数的误差值。

例如，第四训练输入图像可以与第一训练输入图像相同，例如，第四训练输入图像的集合与第一训练输入图像的集合是同一个图像集合。例如，第四训练输入图像也可以包括通过智能手机的摄像头、平板电脑的摄像头、个人计算机的摄像头、数码照相机的镜头、监控摄像头或者网络摄像头等拍摄采集的照片，其可以包括人物图像、动植物图像或风景图像等，本公开的实施例对此不作限制。例如，第四训练输入图像为低质量图像，例如第四训练输入图像的质量低于例如数码单镜反光相机拍摄的照片的质量。例如，在一些示例中，第四训练输入图像可以为RGB格式的图像，本公开的实施例包括但不限于此。

例如，第五训练输入图像为高质量图像，即第五训练输入图像的质量比第四训练输入图像的质量高，例如，第五训练输入图像可以为数码单镜反光相机拍摄的照片图像。例如，第五训练输入图像可以包括人物图像、动植物图像或风景图像等，本公开的实施例对此不作限制。例如，第五训练输入图像可以与第二训练输入图像相同，例如，第五训练输入图像的集合与第二训练输入图像的集合是同一个图像集合；当然，第五训练输入图像也可以与第二训练输入图像不同，本公开的实施例对此不作限制。

例如，判别网络D可以为如图12所示的判别网络，但不限于此。

例如，在一些示例中，判别网络对抗损失函数可以表示为：

其中，L _D表示判别网络对抗损失函数，x表示第五训练输入图像，P _data(x)表示第五训练输入图像的集合(例如，包括一个批次的多幅第五训练输入图像)，D(x)表示判别网络D针对第五训练输入图像x的输出，即判别网络D对第五训练输入图像x进行处理得到的输出，

表示针对第五训练输入图像的集合求期望，z2表示第四训练输入图像，P _z2(z2)表示第四训练输入图像的集合(例如，包括一个批次的多幅第四训练输入图像)，G(z2)表示第二训练输出图像，D(G(z2))表示判别网络D针对第二训练输出图像的输出，即判别网络D对第二训练输出图像进行处理得到的输出，

表示针对第为训练输入图像的集合求期望。由此，可以相应采用批量梯度下降算法对判别网络D进行参数优化。

需要说明的是，上述公式表示的判别网络对抗损失函数是示例性的，本公开包括但不限于此。

判别网络D的训练目标是最小化判别网络对抗损失值。例如，在判别网络D的训练过程中，第五训练输入图像的标签设置为1，即需要使判别网络D鉴别认定第五训练输入图像为例如数码单镜反光相机拍摄的照片图像，即为高质量图像；同时，第二训练输出图像的标签设置为0，即需要使判别网络D鉴别认定第二训练输出图像不是例如数码单镜反光相机拍摄的照片图像，即为低质量图像。

例如，在判别网络D的训练过程中，判别网络D的参数被不断地修正，以使经过参数修正后的判别网络D能够准确鉴别第五训练输入图像和第二训练输出图像的质量，也就是，使第五训练输入图像对应的判别网络D的输出不断趋近于1，以及使第二训练输出图像对应的判别网络D的输出不断趋近于0，从而不断地减小生成网络对抗损失值。

例如，在本公开的实施例中，待训练的生成网络G的训练和判别网络D的训练是交替迭代进行的。例如，对于未经训练的生成网络G和判别网络D，一般先对判别网络D进行第一阶段训练，提高判别网络D的鉴别能力(即，鉴别判别网络D的输入的质量高低)，得到经过第一阶段训练的判别网络D；然后，基于经过第一阶段训练的判别网络D对生成网络G(即待训练的生成网络G)进行第一阶段训练，提高生成网络G的图像增强处理能力(即，使生成网络G的输出为高质量图像)，得到经过第一阶段训练的生成网络G。与第一阶段训练类似，在第二阶段训练中，基于经过第一阶段训练的生成网络G，对经过第一阶段训练的判别网络D进行第二阶段训练，提高判别网络D的鉴别能力，得到经过第二阶段训练的判别网络D；然后，基于经过第二阶段训练的判别网络D对经过第一阶段训练的生成网络G进行第二阶段训练，提高生成网络G的图像增强处理能力，得到经过第二阶段训练的生成网络G，依次类推，接下来对判别网络D和生成网络G进行第三阶段训练、第四阶段训练、……，直到得到的生成网络G的输出的质量可以接近于例如的数码单镜反光相机拍摄的照片的质量，即训练输出图像为高质量图像。

需要说明的是，在生成网络G和判别网络D的交替训练过程中，生成网络G和判别网络D的对抗体现在生成网络G的输出(生成网络G生成的高分辨率图像)在各自单独的训练过程中具有不同的标签(在生成网络G的训练过程中标签为1，在判别网络D的训练过程中标签为0)，也体现在判别网络对抗损失函数的第二部分(即与生成网络G生成的高分辨率图像有关的部分)与系统损失函数中的生成网络对抗损失函数相反。还需要说明的是，理想情况下，经过训练得到的生成网络G输出的图像为高质量图像(即接近于例如数码单镜反光相机拍摄的照片的质量)，判别网络D针对第五训练输入图像和该生成网络G生成的第二训练输出图像的输出均为0.5，即生成网络G和判别网络D经过对抗博弈达到纳什均衡。

本公开的至少一实施例提供的神经网络的训练方法，结合了生成式对抗网络技术，经过该训练方法训练得到的生成网络可以结合分支处理和权值共享处理以进行图像增强处理，既可以减少参数数量，又可以便于反向传播时计算梯度，从而，在输出高质量图像的同时还可以提高处理速度和收敛速度。

本公开至少一实施例还提供一种图像处理装置。图15为本公开一实施例提供的一种图像处理装置的示意性框图。

例如，如图15所示，该图像处理装置500包括存储器510和处理器520。例如，存储器510用于非暂时性存储计算机可读指令，处理器520用于运行该计算机可读指令，该计算机可读指令被处理器520运行时执行本公开任一实施例提供的图像处理方法。

例如，存储器510和处理器520之间可以直接或间接地互相通信。例如，存储器510和处理器520等组件之间可以通过网络连接进行通信。网络可以包括无线网络、有线网络、和/或无线网络和有线网络的任意组合。网络可以包括局域网、互联网、电信网、基于互联网和/或电信网的物联网(Internet of Things)、和/或以上网络的任意组合等。有线网络例如可以采用双绞线、同轴电缆或光纤传输等方式进行通信，无线网络例如可以采用3G/4G/5G移动通信网络、蓝牙、Zigbee或者WiFi等通信方式。本公开对网络的类型和功能在此不作限制。

例如，处理器520可以控制图像处理装置中的其它组件以执行期望的功能。处理器520可以是中央处理单元(CPU)、张量处理器(TPU)或者图形处理器GPU等具有数据处理能力和/或程序执行能力的器件。中央处理器(CPU)可以为X86或ARM架构等。GPU可以单独地直接集成到主板上，或者内置于主板的北桥芯片中。GPU也可以内置于中央处理器(CPU)上。

例如，存储器510可以包括一个或多个计算机程序产品的任意组合，计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、闪存等。

例如，在存储器510上可以存储一个或多个计算机指令，处理器520可以运行所述计算机指令，以实现各种功能。在计算机可读存储介质中还可以存储各种应用程序和各种数据，例如第一至第五训练输入图像、以及应用程序使用和/或产生的各种数据等。

例如，存储器510存储的一些计算机指令被处理器520执行时可以执行本公开任一实施例提供的图像处理方法中的一个或多个步骤，和/或可以执行本公开任一实施例提供的神经网络的训练方法中的一个或多个步骤。

例如，关于图像处理方法的处理过程的详细说明可以参考上述图像处理方法的实施例中的相关描述，关于神经网络的训练方法的处理过程的详细说明可以参考上述神经网络的训练方法的实施例中的相关描述，重复之处不再赘述。

需要说明的是，本公开的实施例提供的图像处理装置是示例性的，而非限制性的，根据实际应用需要，该图像处理装置还可以包括其他常规部件或结构，例如，为实现图像处理装置的必要功能，本领域技术人员可以根据具体应用场景设置其他的常规部件或结构，本公开的实施例对此不作限制。

本公开的至少一实施例提供的图像处理装置的技术效果可以参考上述实施例中关于图像处理方法以及神经网络的训练方法的相应描述，在此不再赘述。

本公开至少一实施例还提供一种存储介质。图16为本公开一实施例提供的一种存储介质的示意图。例如，如图16所示，该存储介质600非暂时性地存储计算机可读指令601，当非暂时性计算机可读指令601由计算机(包括处理器)执行时可以执行本公开任一实施例提供的图像处理方法的指令。

例如，在存储介质600上可以存储一个或多个计算机指令。存储介质600上存储的一些计算机指令可以是例如用于实现上述图像处理方法中的一个或多个步骤的指令。存储介质上存储的另一些计算机指令可以是例如用于实现上述神经网络的训练方法中的一个或多个步骤的指令。

例如，存储介质可以包括平板电脑的存储部件、个人计算机的硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、光盘只读存储器(CD-ROM)、闪存、或者上述存储介质的任意组合，也可以为其他适用的存储介质。

本公开的实施例提供的存储介质的技术效果可以参考上述实施例中关于图像处理方法以及神经网络的训练方法的相应描述，在此不再赘述。

对于本公开，有以下几点需要说明：

(1)本公开实施例附图中，只涉及到与本公开实施例涉及到的结构，其他结构可参考通常设计。

(2)在不冲突的情况下，本公开同一实施例及不同实施例中的特征可以相互组合。

以上，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

一种图像处理方法，包括：

获取输入图像；以及

使用生成网络对所述输入图像进行处理，以生成输出图像；其中，

所述生成网络包括第一子网络和至少一个第二子网络，

使用所述生成网络对所述输入图像进行处理，以生成所述输出图像，包括：

使用所述第一子网络对所述输入图像进行处理，以得到多个第一特征图；

使用所述至少一个第二子网络对所述多个第一特征图进行分支处理和权值共享处理，以得到多个第二特征图；以及

对所述多个第二特征图进行处理，以得到输出图像。
根据权利要求1所述的图像处理方法，其中，每个所述第二子网络包括第一分支网络、第二分支网络、第三分支网络，每个所述第二子网络的所述分支处理包括：

将每个所述第二子网络的输入划分为第一分支输入、第二分支输入和第三分支输入；以及

使用所述第一分支网络对所述第一分支输入进行处理，以得到第一分支输出，使用所述第二分支网络对所述第二分支输入进行处理，以得到第二分支输出，使用所述第三分支网络对所述第三分支输入进行处理，以得到第三分支输出；

其中，所述至少一个第二子网络包括第一个第二子网络，所述第一个第二子网络与所述第一子网络连接，所述多个第一特征图作为所述第一个第二子网络的输入。
根据权利要求2所述的图像处理方法，其中，每个所述第二子网络还包括第一主干网络，每个所述第二子网络的所述权值共享处理包括：

将所述第一分支输出、所述第二分支输出和所述第三分支输出进行连接，以得到第一中间输出；以及

使用所述第一主干网络对所述第一中间输出进行处理，以得到每个所述第二子网络的输出。
根据权利要求3所述的图像处理方法，其中，所述第一分支网络的处理包括标准卷积处理，所述第二分支网络的处理包括标准卷积处理，所述第三分支网络的处理包括标准卷积处理，所述第一主干网络的处理包括标准卷积处理和下采样处理。
根据权利要求1-4任一项所述的图像处理方法，其中，所述生成网络还包括第三子网络，

对所述多个第二特征图进行处理，以得到所述输出图像，包括：

对所述多个第二特征图进行处理，以得到多个第三特征图；

使用所述第三子网络对所述多个第三特征图进行处理，以得到多个第四特征图；以及

对所述多个第四特征图进行合成处理，以得到输出图像。
根据权利要求5所述的图像处理方法，其中，所述第三子网络包括第二主干网络、第四分支网络、第五分支网络和第六分支网络，

使用所述第三子网络对所述多个第三特征图进行处理，以得到所述多个第四特征图，包括：

使用所述第二主干网络对所述多个第三个特征图进行处理，以得到多个第五特征图；

将所述多个第五特征图划分为第四分支输入、第五分支输入和第六分支输入；以及

使用所述第四分支网络对所述第四分支输入进行处理，以得到所述第四分支网络对应的第四特征图，使用所述第五分支网络对所述第五分支输入进行处理，以得到所述第五分支网络对应的第四特征图，使用所述第六分支网络对所述第六分支输入进行处理，以得到所述第六分支网络对应的第四特征图；

其中，所述多个第四特征图包括所述第四分支网络对应的第四特征图、所述第五分支网络对应的第四特征图和所述第六分支网络对应的第四特征图。
根据权利要求6所述的图像处理方法，其中，所述第二主干网络的处理包括上采样处理，所述第四分支网络的处理包括标准卷积处理，所述第五分支网络的处理包括标准卷积处理，所述第六分支网络的处理包括标准卷积处理。
根据权利要求7所述的图像处理方法，其中，所述第四分支网络的处理还包括上采样处理，所述第五分支网络的处理还包括上采样处理，所述第六分支网络的处理还包括上采样处理。
根据权利要求1-8任一项所述的图像处理方法，其中，所述第一子网络的处理包括标准卷积处理，

使用所述第一子网络对所述输入图像进行处理，以得到所述多个第一特征图，包括：

使用所述第一子网络对所述输入图像进行标准卷积处理，以得到所述多个第一特征图。
根据权利要求6所述的图像处理方法，其中，所述输入图像具有第一颜色通道、第二颜色通道和第三颜色通道，

所述第一子网络包括转换模块、第七分支网络、第八分支网络、第九分支网络和第三主干网络，

使用所述第一子网络对所述输入图像进行处理，以得到所述多个第一特征图，包括：

使用所述转换模块将所述输入图像的第一颜色通道、第二颜色通道和第三颜色通道的数据信息转换为中间输入图像的第一亮度信道、第一色差信道和第二色差信道的数据信息；

使用所述第七分支网络对所述中间输入图像的第一亮度信道的数据信息进行处理，以得到第七分支输出，使用所述第八分支网络对所述中间输入图像的第一色差信道的数据信息进行处理，以得到第八分支输出，使用所述第九分支网络对所述中间输入图像的第二色差信道的数据信息进行处理，以得到第九分支输出；

将所述第七分支输出、所述第八分支输出和所述第九分支输出进行连接，以得到第二中间输出；以及

使用所述第三主干网络对所述第二中间输出进行处理，以得到所述多个第一特征图。
根据权利要求10所述的图像处理方法，其中，所述第七分支网络的处理包括标准卷积处理和下采样处理，所述第八分支网络的处理包括标准下采样处理，所述第九分支网络的处理包括标准下采样处理。
根据权利要求11所述的图像处理方法，其中，所述第四分支网络的处理包括标准卷积处理和上采样处理，所述第五分支网络的处理包括标准卷积处理和标准上采样处理，所述第六分支网络的处理包括标准卷积处理和标准上采样处理。
根据权利要求5-8任一项所述的图像处理方法，其中，所述生成网络还包括密集子网络，所述密集子网络包括N个密集模块，

对所述多个第二特征图进行处理，以得到所述多个第三特征图，包括：

使用所述密集子网络对所述多个第二特征图进行处理，以得到所述多个第三特征图；

其中，所述多个第二特征图作为所述N个密集模块中的第1个密集模块的输入，

所述多个第二特征图与所述N个密集模块中的第i个密集模块之前的i-1个密集模块的输出连接，作为所述第i个密集模块的输入，

所述多个第二特征图和每个所述密集模块的输出进行连接，作为所述多个第三特征图，N、i为整数，N≥2，i≥2且i≤N。
根据权利要求13所述的图像处理方法，其中，每个密集模块的处理包括降维处理和卷积处理。
根据权利要求6-8任一项所述的图像处理方法，其中，所述生成网络还包括合成模块，

对所述多个第四特征图进行合成处理，以得到所述输出图像，包括：

使用所述合成模块对所述多个第四特征图进行合成处理，以得到所述输出图像。
根据权利要求15所述的图像处理方法，其中，所述合成模块包括第一转换矩阵，

使用所述合成模块对所述多个第四特征图进行合成处理，以得到所述输出图像，包括：

利用所述第一转换矩阵，将所述第四分支网络对应的第四特征图的数据信息、所述第五分支网络对应的第四特征图的数据信息和所述第六分支网络对应的第四特征图的数据信息转换为所述输出图像的第一颜色通道的数据信息、第二颜色通道的数据信息和第三颜色通道的数据信息，以得到所述输出图像。
一种神经网络的训练方法，包括：

基于待训练的生成网络，对判别网络进行训练；

基于所述判别网络，对所述待训练的生成网络进行训练；以及，

交替地执行上述训练过程，以得到根据权利要求1-16任一项所述的图像处理方法中的所述生成网络；其中，

基于所述判别网络，对所述待训练的生成网络进行训练，包括：

使用所述待训练的生成网络对第一训练输入图像进行处理，以生成第一训练输出图像；

基于所述第一训练输出图像，通过系统损失函数计算所述待训练的生成网络的系统损失值；以及

基于所述系统损失值对所述待训练的生成网络的参数进行修正。
根据权利要求17所述的训练方法，其中，所述系统损失函数包括生成网络对抗损失函数，所述系统损失值包括生成网络对抗损失值；所述生成网络对抗损失函数表示为：

其中，L _G表示所述生成网络对抗损失函数，z1表示所述第一训练输入图像，P _z1(z1)表示所述第一训练输入图像的集合，G(z1)表示所述第一训练输出图像，D(G(z1))表示所述判别网络针对所述第一训练输出图像的输出，
表示针对所述第一训练输入图像的集合求期望以得到所述生成网络对抗损失值。
根据权利要求18所述的训练方法，其中，所述系统损失函数还包括内容损失函数，所述系统损失值还包括内容损失值；

基于所述第一训练输出图像，通过系统损失函数计算所述待训练的生成网络的系统损失值，包括：使用分析网络提取所述第一训练输入图像的第一内容特征图和所述第一训练输出图像的第二内容特征图，根据所述第一内容特征图和所述第二内容特征图，通过所述内容损失函数计算所述生成网络的所述内容损失值，

其中，所述分析网络包括用于提取所述第一内容特征图和所述第二内容特征图的至少一个卷积模块；

所述内容损失函数表示为：

其中，L _content表示所述内容损失函数，C _m表示所述至少一个卷积模块中的第m个卷积模块的单层内容损失函数，w _1m表示C _m的权重；

所述单层内容损失函数表示为：

其中，S ₁为常数，
表示在所述第m个卷积模块中第i个卷积核提取的所述第一训练输入图像的第一内容特征图中第j个位置的值，
表示在所述第m个卷积模块中第i个卷积核提取的所述第一训练输出图像的第二内容特征图中第j个位置的值。
根据权利要求19所述的训练方法，其中，所述系统损失函数还包括颜色损失函数，所述系统损失值还包括颜色损失值；所述颜色损失函数表示为：

L _color＝abs(gaussian(G(z1))-gaussian(I1))

其中，L _color表示所述颜色损失函数，G(z1)表示所述第一训练输出图像，I1表示第二训练输入图像，gaussian()表示高斯模糊化运算，abs()表示求绝对值运算；

所述第二训练输入图像的质量比所述第一训练输入图像的质量高。
根据权利要求20所述的训练方法，其中，所述第一训练输出图像具有第一颜色通道、第二颜色通道和第三颜色通道；

所述系统损失函数还包括对比损失函数，所述系统损失值还包括对比损失值；所述对比损失函数表示为：

L _L1＝0.299*abs(F _G(z1)-F _I2)+0.587*abs(S _G(z1)-S _I2)+0.299*abs(T _G(z1)-T _I2)

其中，L _L1表示所述对比损失函数，G(z1)表示所述第一训练输出图像，I2表示第三训练输入图像，F _G(z1)、S _G(z1)和T _G(z1)分别表示所述第一训练输出图像的第一颜色通道、第二颜色通道和第三颜色通道的数据信息，F _I2、S _I2和T _I2分别表示所述第三训练输入图像的第一颜色通道、第二颜色通道和第三颜色通道的数据信息，abs()表示求绝对值运算；

所述第三训练输入图像具有与所述第一训练输入图像相同的场景，且所述第三训练输入图像的质量比所述第一训练输入图像的质量高。
根据权利要求17-21任一项所述的训练方法，其中，基于所述待训练的生成网络，对所述判别网络进行训练，包括：

利用所述待训练的生成网络对第四训练输入图像进行处理，以生成第二训练输出图像；

基于所述第二训练输出图像和第五训练输入图像，通过判别网络对抗损失函数计算判别网络对抗损失值；以及

根据所述判别网络对抗损失值对所述判别网络的参数进行修正；

其中，所述第五训练输入图像的质量比所述第四训练输入图像的质量高。
根据权利要求22所述的训练方法，其中，所述判别网络对抗损失函数表示为：

其中，L _D表示所述判别网络对抗损失函数，x表示所述第五训练输入图像，P _data(x)表示所述第五训练输入图像的集合，D(x)表示所述判别网络针对所述第五训练输入图像的输出，
表示针对所述第五训练输入图像的集合求期望，z2表示所述第四训练输入图像，P _z2(z2)表示所述第四训练输入图像的集合，G(z2)表示所述第二训练输出图像，D(G(z2))表示所述判别网络针对所述第二训练输出图像的输出，
表示针对所述第四训练输入图像的集合求期望。
一种图像处理装置，包括：

存储器，用于非暂时性存储计算机可读指令；以及

处理器，用于运行所述计算机可读指令，所述计算机可读指令被所述处理器运行时执行根据权利要求1-16任一项所述的图像处理方法或根据权利要求17-23任一项所述的神经网络的训练方法。
一种存储介质，非暂时性地存储计算机可读指令，当所述计算机可读指令由计算机执行时可以执行根据权利要求1-16任一项所述的图像处理方法或根据权利要求17-23任一项所述的神经网络的训练方法。