WO2022022001A1

WO2022022001A1 - 对风格迁移网络进行压缩的方法及风格迁移的方法、装置和系统

Info

Publication number: WO2022022001A1
Application number: PCT/CN2021/093265
Authority: WO
Inventors: 武泰屹; 项伟
Original assignee: 百果园技术(新加坡)有限公司; 武泰屹
Priority date: 2020-07-27
Filing date: 2021-05-12
Publication date: 2022-02-03
Also published as: CN111932445A; CN111932445B

Abstract

本文公开了一种对风格迁移网络进行压缩的方法及风格迁移的方法、装置和系统。该风格迁移的方法包括：在获得内容图像对应的内容特征图和风格图像对应的风格特征图以后，对所述内容特征图以及所述风格特征图分别进行逐通道排序；获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排；根据排序前的所述内容特征图以及重排后的风格特征图生成风格迁移图像。

Description

对风格迁移网络进行压缩的方法及风格迁移的方法、装置和系统

本申请要求在2020年07月27日提交中国专利局、申请号为202010733581.5的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像或视频处理技术领域，例如涉及一种对风格迁移网络进行压缩的方法及风格迁移的方法、装置和系统。

背景技术

在计算机视觉领域，风格迁移(style transfer)是一类很重要的图像编辑任务，风格迁移的目的是将一张风格图像(style image)的视觉元素迁移到另一张内容图像(content image)，从而生成风格化的图像(stylized image)。

在相关技术中，实现风格迁移的方式有两种：

一种是基于在线图像优化的风格迁移算法。该方案通过让重建后的图像以梯度下降的方式更新像素值，使重建后的图像的风格统计量(如格拉姆(Gram)矩阵)接近风格图像的风格统计量，然后使重建后的图像的超分辨率测试序列(Visual Geometry Group，VGG)网络的高层特征表达接近内容图像的特征表达，从而获得同时拥有风格图像和内容图像的特点的重建图像。该方案的缺点是图像重建的优化速度较慢，效率较低，不利于工业化的部署。

另一种是基于离线模型优化的风格迁移算法。该方案是通过预训练的前向网络，在重建图像的同时加入风格图像的信息。该方法是工业界采用的主要方法，该方法的缺点是单个模型可以学习的风格较少，通常对于一个新的风格需要重新训练新的模型，可扩展性较弱。

同时，上述的风格迁移方法均存在参数量较多、计算开销较大、不利于移动端部署的问题。

发明内容

本申请提供一种对风格迁移网络进行压缩的方法及风格迁移的方法、装置和系统，以解决单个风格迁移模型可以学习的风格较少，可扩展性较弱，以及风格迁移模型的参数量较多、计算开销较大、不利于移动端部署的问题。

提供了一种风格迁移的方法，包括：

在获得内容图像对应的内容特征图和风格图像对应的风格特征图以后，对所述内容特征图以及所述风格特征图分别进行逐通道排序；

获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排；

根据排序前的所述内容特征图以及重排后的风格特征图生成风格迁移图像。

还提供了一种风格迁移系统，所述风格迁移系统包括风格迁移网络，所述风格迁移网络包括编码网络、风格映射单元以及解码网络，其中，

所述编码网络，设置为对输入的内容图像以及风格图像进行编码处理，生成所述内容图像对应的内容特征图以及所述风格图像对应的风格特征图，并将所述内容特征图以及所述风格特征图输出至所述风格映射单元，以及，将所述内容特征图输出至所述解码网络；

所述风格映射单元，设置为对所述内容特征图以及所述风格特征图分别进行逐通道排序；获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排，以及，将重排后的风格特征图输出至所述解码网络；

所述解码网络，设置为根据所述内容特征图以及所述重排后的风格特征图生成风格迁移图像。

还提供了一种对上述的风格迁移网络进行压缩的方法，所述方法包括：

将风格迁移网络作为教师网络，并建立一个与所述教师网络具有相似结构的学生网络；

将所述教师网络的不同层中每层的输出通过一个预设大小的卷积与所述学生网络的与所述每层对应的层相连；

固定所述教师网络的权重，按照预设的损失函数，对所述学生网络进行训练，训练得到的网络作为压缩后的风格迁移网络。

还提供了一种风格迁移的装置，所述装置包括：

特征排序模块，设置为在获得内容图像对应的内容特征图和风格图像对应的风格特征图以后，对所述内容特征图以及所述风格特征图分别进行逐通道排序；

重排模块，设置为获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排；

风格迁移图像生成模块，设置为根据排序前的所述内容特征图以及重排后的风格特征图生成风格迁移图像。

还提供了一种对上述的风格迁移网络进行压缩的装置，所述装置包括：

学生网络创建模块，设置为将风格迁移网络作为教师网络，并建立一个与所述教师网络具有相似结构的学生网络；

卷积连接模块，设置为将所述教师网络的不同层中每层的输出通过一个预设大小的卷积与所述学生网络的与所述每层对应的层相连；

学生网络训练模块，设置为固定所述教师网络的权重，按照预设的损失函数，对所述学生网络进行训练，训练得到的网络作为压缩后的风格迁移网络。

还提供了一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储装置，设置为存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述的方法。

还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述的方法。

附图说明

图1是本申请实施例一提供的一种风格迁移的方法的流程图；

图2是本申请实施例二提供的一种风格迁移系统的结构框图；

图3是本申请实施例二提供的一种编码网络的网络结构示意图；

图4是本申请实施例二提供的另一种解码网络的网络结构示意图；

图5是本申请实施例三提供的一种风格迁移系统的结构框图；

图6是本申请实施例三提供的一种模型压缩的示意图；

图7是本申请实施例四提供的一种对风格迁移网络进行压缩的方法的流程图；

图8是本申请实施例五提供的一种风格迁移的装置的结构框图；

图9是本申请实施例六提供的一种对风格迁移网络进行压缩的装置的结构框图；

图10是本申请实施例七提供的一种计算机设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请进行说明。

实施例一

图1是本申请实施例一提供的一种风格迁移的方法的流程图，本实施例可适用于如下场景：用户上传图片或视频，可在预设的艺术风格图中选择一张用于风格迁移的目标风格图，或者自己上传一张风格图作为迁移目标，最终返回风格迁移后的图片或视频。该方法可以应用在视频或图片编辑应用程序、直播应用程序、短视频应用程序等产品中，可由风格迁移装置执行，可以包括如下步骤：

步骤110、在获得内容图像对应的内容特征图和风格图像对应的风格特征图以后，对内容特征图以及风格特征图分别进行逐通道排序。

在一种实施例中，内容特征图可以为内容图像经过编码网络，由编码网络对内容图像的颜色、统计、纹理、结构等特征信息进行提取，生成的图像特征(image features)；风格特征图可以为风格图像经过编码网络，由编码网络对风格图像的颜色、统计、纹理、结构等特征信息进行提取，输出的特征图像。

在步骤110中，可以分别对内容特征图以及风格特征图逐通道(Channel)进行排序。在一种实施方式中，步骤110可以包括如下步骤：

步骤110-1，对所述内容特征图以及风格特征图分别进行逐通道向量化处理，获得向量化后的内容特征向量以及向量化后的风格特征向量。

在该步骤中，假设内容特征图为x∈R ^C×H×W，风格特征图为y∈R ^C×H×W，则对两者分别进行向量化后，得到

以及

其中，N＝H×W，C为通道数，H为图像的高度，W为图像的宽度。

在一种实施方式中，一种向量化处理的方式可以为：按照从左到右、从上到下的顺序将特征图逐通道向量化为一个包含N个像素点样本的数据集。例如，假设内容特征图为

是一个2通道数的特征图，每个通道包括一个2x2矩阵，即x∈R ^2×？×？。风格特征图为

也是一个2通道数的特征图，每个通道包括一个2x2矩阵，即y∈R ^2×？×？。则按照从左到右、从上到下的顺序逐通道将两者分别向量化后，得到的内容特征向量为

风格特征向量为

步骤110-2，对所述向量化后的内容特征向量以及所述向量化后的风格特征向量分别进行逐通道排序。

在一种实施方式中，可以沿第二维度对

进行排序，得到排序后的内容特征向量

以及排序后的风格特征向量

例如，针对上例，对

进行排序后得到：

对

进行排序后得到：

步骤120、获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排。

在该步骤中，对内容特征图以及风格特征图进行排序后，可以获取排序后的内容特征图的次序统计信息，并基于该次序统计信息对排序后的风格特征图进行重排，使得重排后的风格特征图具有了内容特征图的次序统计信息，既保留了风格特征图的风格统计量不变，也引入了内容特征图的次序统计信息，便于实现对任意风格图像的迁移。

在一种实施方式中，步骤120可以包括如下子步骤：

步骤120-1，将排序前的内容特征图中的内容特征向量与排序后的内容特征图中的内容特征向量进行比较，确定排序后的内容特征图中的内容特征向量的排序索引，作为次序统计信息。

在一种实施方式中，排序索引为排序前的内容特征图中的内容特征向量中的特征元素位于排序后的内容特征图中的内容特征向量中的次序。例如，针对上例，对

进行排序后得到：

针对

中的第一个特征元素“4”，其位于排序后的

中的第4位，即其对应的排序索引是4；针对

中的第二个特征元素“3”，其位于排序后的

中的第3位，即其对应的排序索引是3，以此类推，得到多个特征元素的排序索引如下：d _x＝[4,3,1,2],[3,2,4,1]]。

同理，对于

其多个特征元素的排序索引为：d _y＝[1,3,2,4],[3,1,2,4]]。

步骤120-2，按照所述次序统计信息对排序后的风格特征图中的风格特征向量进行重排。

在该步骤中，得到排序后的内容特征图中的内容特征向量的次序统计信息(即排序索引)以后，则可以根据该次序统计信息对排序后的风格特征图中的风格特征向量进行重排，得到重排后的特征张量

例如，针对上例，可以采用排序索引d _x＝[4,3,1,2],[3,2,4,1]]对

进行重排，即，将

的第一个通道中排序在第“4”位的特征元素“23”重排在该通道的第1位，将

的第一个通道中排序在第“3”位的特征元素“19”重排在该通道的第2位，将

的第一个通道中排序在第“1”位的特征元素“11”重排在该通道的第3位，将

的第一个通道中排序在第“2”位的特征元素“14”重排在该通道的第4位，以此类推，得到重排后的风格特征向量如下：

此时，

就具有内容特征向量

的次序统计信息，或者说，

中元素的大小相对关系与

相同。

步骤120-3，恢复重排后的风格特征向量的空间维度，得到重排后的风格特征图。

在该步骤中，恢复重排后的风格特征张量

的空间维度，可以得到重排后的风格特征图z∈R ^C×H×W。例如，针对

恢复其空间维度可以得到：

步骤130、根据排序前的所述内容特征图以及重排后的风格特征图生成风格迁移图像。

在该步骤中，重排后的风格特征图既保留了风格特征的二阶统计信息，又具有内容特征图的次序统计信息，将内容特征图与重排后的风格特征图进行重建生成的风格迁移图像，可以更好地呈现出风格图像与内容图像的整合效果。

在一种实施方式中，步骤130可以包括如下步骤：

将排序前的所述内容特征图以及重排后的风格特征图输入至预训练的解码网络中，以由所述解码网络对排序前的所述内容特征图以及重排后的风格特征图进行解码重建，生成风格迁移图像。

在该实施例中，通过解码网络来对排序前的内容特征图以及重排后的风格特征图进行解码重建，输出风格迁移图像。其中，解码网络的网络结构与编码网络的网络结构对称。

在一种实施例中，在解码网络中，内容特征图的不同层级的内容特征信息可以以跳跃连接的方式被引入到解码网络中，这样可以帮助解码网络更好的恢复内容图像的细节。其中，跳跃连接的方式就是直接引入的方式，内容特征图的不同层级的内容特征信息可以不经过任何子网络被直接引入到解码网络中。

在本实施例中，在进行风格迁移时，通过对内容特征图以及风格特征图进行逐通道排序，获取排序后的内容特征图的次序统计信息，并按照该排序后的内容特征图的次序统计信息对排序后的风格特征图进行重排，这样，针对指定的内容特征图，当确定该内容特征图的次序统计信息以后，则可以基于该内容特征图的次序统计信息，通过对任意风格的风格特征图进行重排的方式，使得重排后的风格特征图既保留了自身的风格统计信息又具有内容特征图的次序统计信息，这样当需要转换当前内容图像的风格时，只需要根据内容图像的次序统计信息对风格特征图进行重排和解码等处理，从而实现对该指定内容特征图对应的内容图像的任意风格迁移，无需针对新的风格重新训练模型，可扩展性强。

实施例二

图2是本申请实施例二提供的一种风格迁移系统的结构框图，其中，该风格迁移系统中可以包括风格迁移网络，该风格迁移网络包括编码网络210、风格映射单元220以及解码网络230。其中，

所述编码网络210，设置为对输入的内容图像以及风格图像进行编码处理，生成内容图像对应的内容特征图以及风格图像对应的风格特征图，并将所述内容特征图以及所述风格特征图输出至所述风格映射单元，以及，将所述内容特征图输出至所述解码网络。

在该实施例中，编码网络210又称编码器，其有两个输入，分别是内容图像和风格图像，编码网络210对内容图像进行编码后输出内容特征图，对风格图像进行编码后输出风格特征图。其中，本实施例所提及的编码，可以包括但不限于：提取内容图像或者风格图像不同层级的特征信息。

如图2所示，编码网络210与风格映射单元220以及解码网络230均有连接，其将内容特征图和风格特征图输出给风格映射单元220，以及将内容特征图输出给解码网络230。

在一种实施例中，编码网络210可以为预训练的VGG网络，如VGG-19，该网络可以在图像数据集ImageNet上进行预训练，其中，在训练过程中编码器的权重不参与训练。

作为一种示例，编码网络210的网络结构可以图3所示，该编码网络210可以包括9个卷积层(conv)和3个最大池化层(maxpool)，每个卷积层后均接一个线性整流函数(Rectified Linear Unit，ReLU)非线性激活层。假设内容图像或者风格图像为蓝-绿-红(Blue-Green-Red，BGR)格式的图像(也可以是其他格式的图像，如RGB等，本实施例对此不作限制)，当内容图像或者风格图像输入至编码网络210以后，首先经过包括两个卷积核(每个卷积核大小是3x3)、输出通道数是64的卷积层，然后再经过一个最大池化层；之后再经过包括两个卷积核(每个卷积核大小是3x3)、输出通道数是128的卷积层，再经过一个最大池化层进行下采样；接着经过包括四个卷积核(每个卷积核大小是3x3)、输出通道数是256的卷积层，和一个最大池化层；最后再经过包括一个卷积核(卷积核大小是3x3)、输出通道数是512的卷积层，最终输出对应的特征图。

所述风格映射单元220，设置为对内容特征图以及风格特征图分别进行逐通道排序；获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排，以及，将重排后的风格特征图输出至所述解码网络。

风格映射单元220在接收到内容特征图以及风格特征图以后，对内容特征图以及风格特征图分别进行逐通道排序，并获取排序后的内容特征图的次序统计信息(即排序索引)，然后按照该次序统计信息对排序后的风格特征图进行重排，使得重排后的风格特征图既保留了风格特征的二阶统计信息又具有内容特征图的次序统计信息。

关于风格映射单元220对内容特征图以及风格特征图的排序、重排等过程，可以参考图1实施例的描述，此处不再赘述了。

风格映射单元220获得重排后的风格特征图以后，则可以将重排后的风格特征图输出至解码网络230。

在该实施例中，风格映射单元220是一个无可训练权重的独立单元，具有无参数的特点，因此在风格迁移网络中增加风格映射单元220不会带来网络体积的增大，计算开销也相对较低。

所述解码网络230，设置为根据所述内容特征图以及重排后的风格特征图生成风格迁移图像。

在该实施例中，解码网络230接收到来自于编码网络210的内容特征图以及来自于风格映射单元220的重排后的风格特征图以后，可以对该内容特征图以及重排后的风格特征图进行解码重建，输出风格迁移图像。

解码网络230的网络结构与编码网络210的网络结构是对称的。在一种实施例中，在解码网络230中，输入层的输入是重排后的风格特征图，内容特征图的不同层级的内容特征信息可以以跳跃连接的方式被引入到解码网络230中，这样可以帮助解码网络230更好地恢复内容图像的细节。

在一种实施例中，编码网络210还设置为将风格特征图输出至解码网络230中，而在解码网络230中还可以加入自适应实例规范化(Adaptive Instance Normalization，AdaIN)子网络，AdaIN子网络包括两个输入，分别是解码网络210中位于AdaIN子网络前一层的输出和该输出对应尺度的风格特征图，然后AdaIN子网络可以根据该输出对应尺度的风格特征图的均值和方差，逐通道地对该输出进行归一化处理，即：

其中，μ(x)是x逐通道的均值，μ(y)是风格特征图的逐通道的均值，σ(x)是x逐通道的标准差，σ(y)是风格特征图的逐通道的方差，x是解码网络210中位于AdaIN子网络前一层的输出。

AdaIN子网络通过改变特征图的逐通道的均值和方差，强化了图像重建过程中风格特征的统计分布。

作为一种示例，解码网络230的网络结构可以图4所示，对解码网络230的输入层(Input)输入的是风格映射单元220输出的重排后的风格特征图(output of style projection)，首先经过包括1个卷积核(卷积核大小是3x3)、输出通道数是256的卷积层，然后通过双线性插值进行上采样(upsample)，并和经过编码网络210得到的对应尺度的内容特征图(content feature map)进行级联；之后，再经过包括3个卷积核(每个卷积核大小是3x3)、输出通道数是256的卷积层和包括1个卷积核(卷积核大小是3x3)、输出通道数是128的卷积层；然后做双线性插值的上采样；接着经过AdaIN子网络并和经过编码网络210得到的对应尺度的内容特征图进行级联；然后经过包括1个卷积核(卷积核大小是3x3)、输出通道数是128的卷积层和包括1个卷积核(卷积核大小是3x3)、输出通道数是64的卷积层，并通过双线性插值进行上采样，和经过编码网络210得到的对应尺度的内容特征图进行级联，最后经过包括1个卷积核(卷积核大小是3x)、输出通道数是64的卷积层，以及包括1个卷积核(卷积核大小是3x3)、输出通道数是3的卷积层，最终将输出映射到RGB空间。其中，在上述解码网络230的网络结构中除了最后一个卷积层外，其余卷积层后均接一个ReLU非线性激活层。

在一种实施方式中，基于上述的风格迁移网络设计的损失函数可以包括内容损失函数、风格损失函数和重建损失函数。

内容损失函数可以采用将风格迁移图像和内容图像通过编码网络210后得到的编码网络210输出的特征的均方误差损失来度量，即：

L _c＝‖E(c)-E(p)‖ ₂

其中，c表示内容图像，p表示风格迁移图像，E(c)表示内容图像通过编码网络210后得到的内容特征图，E(p)表示风格迁移图像通过编码网络210后得到的风格迁移特征图。

风格损失函数可以采用将风格迁移图像和风格图像通过编码网络210后得到的编码网络210输出的特征，在编码网络210的一些对应层的逐通道的均值的距离和方差的距离来度量，即：

其中，E _i表示通过编码网络210得到的第i层特征图，s表示风格图像，N表示用于表征风格损失函数的对应层的数量。

重建损失函数是当输入的风格图像和内容图像一致(例如风格图像和内容图像是同一张图)时，模型重建的风格迁移图像与内容图像的接近程度，即：

L _r＝‖E(c)-E(p′)‖ ₂

其中，E(c)表示内容图像经过编码网络210后得到的特征图，E(p′)表示风格迁移图像经过编码网络210后得到的特征图。

最终的损失函数为上述三项损失函数的加权和，即：

L＝w _c*L _c+w _s*L _s+w _r*L _r

训练风格迁移网络时，优化目标是最小化损失函数L，内容损失、风格损失、重建损失的权重可以按需设置，本实施例对此不作限制，例如，内容损失、风格损失、重建损失的权重分别取为1、2、0.1。可以采用梯度下降法对风格迁移网络进行优化，例如，取初始步长为0.1，每隔500个epoch将步长缩小0.1倍。

在本申请实施例中，在风格迁移网络中引入无可训练参数的风格映射单元，该风格映射单元位于编码网络与解码网络之间，设置为对编码网络输出的内容特征图以及风格特征图进行逐通道排序，并获取排序后的内容特征图的次序统计信息，然后按照该次序统计信息对排序后的风格特征图进行重排，将重排后的风格特征图输入至解码网络进行解码，这样，针对指定的内容图像，当确定该内容图像的内容特征图的次序统计信息以后，则可以基于该内容特征图的次序统计信息，通过对任意风格的风格图像的风格特征图进行重排的方式，使得重排后的风格特征图具有内容特征图的次序统计信息，从而实现对该指定内容图像的任意风格迁移，无需针对新的风格重新训练模型，可扩展性强，给用户的自由度更大。

实施例三

图5是本申请实施例三提供的一种风格迁移系统的结构框图，该实施例在图2实施例的基础上实现，在该实施例中，风格迁移系统中还可以包括模型压缩模块240，设置为对图2实施例的风格迁移网络进行模型压缩处理。

在一种实施方式中，可以基于模型蒸馏的思想对风格迁移网络进行压缩。则模型压缩模块240可以包括如下子模块：

学生网络创建子模块，设置为将所述风格迁移网络作为教师网络，并建立一个与所述教师网络具有相似结构的学生网络。

关联子模块，设置为将所述教师网络的不同层中每层的输出通过一个预设大小的卷积与所述学生网络的与该层对应的层相连。

学生网络训练子模块，设置为固定所述教师网络的权重，按照预设的损失函数，对所述学生网络进行训练，训练得到的网络作为压缩后的风格迁移网络。

在一种实施例中，如图6的模型压缩示意图所示，以风格迁移网络作为教师网络(teacher model)，即教师网络中包括编码网络、风格映射单元以及解码网络，然后设计一个和教师网络具有相似结构的学生网络(student model)，其中，相似结构指的是网络层数相同，但卷积核数量更少，参数量更小的结构。

教师网络的不同层中每层的输出通过一个预设大小的卷积层和学生网络的对应层相连，该卷积参数可训练。其中，该卷积可以为小卷积，例如，该预设大小的卷积层可以为卷积核是1x1的卷积层。然后固定教师网络的权重，学生网络的全部参数均参与训练。

在一种实施例中，学生网络的损失函数可以包括风格损失函数、内容损失函数、重构损失函数以及蒸馏损失函数。

该蒸馏损失函数为学生网络的不同层中每层输出的特征与教师网络的与该层对应的层输出的特征经过上述卷积的映射后的相似程度，即学生网络的不同层输出的特征和教师网络对应层的输出经过预设大小的卷积映射后尽量接近，可以采用如下公式表示：

其中，f _i，g _i分别为教师网络中对编码网络和解码网络的每一层输出进行映射的1x1卷积，E _i(x)表示学生网络的编码网络的第i层的输出，D _i(x)表示学生网络的解码网络的第i层的输出，E′ _i(x)表示教师网络的编码网络的第i层的输出，D′ _i(x)表示教师网络的解码网络的第i层的输出，N表示用于表征蒸馏损失函数的对应层的数量。

重构损失函数为学生网络输出的风格迁移图像与教师网络输出的风格迁移图像的相似程度，即学生网络输出的风格迁移图像和教师网络输出的风格迁移图像尽量接近，可以采用如下公式表示：

L _r＝‖D(x)-D′(X)‖ ₂

内容损失函数采用将学生网络输出的风格迁移图像和内容图像通过学生网络的编码网络后得到的学生网络的编码网络输出的特征的均方误差损失来度量。

风格损失函数采用将学生网络输出的风格迁移图像和风格图像通过学生网络的编码网络后得到的学生网络的编码网络输出的特征，在学生网络的编码网络的一些对应层的逐通道的均值的距离和方差的距离来度量。由于风格损失函数和内容损失函数与实施例二中的风格迁移网络的训练所使用的损失函数类似，可以参考实施例二的描述，此处不再赘述。

学生网络最终的损失函数可以为：

L＝w _c*L _c+w _s*L _s+w _r*L _r+w _d*L _d

在本实施例中，在对风格迁移网络进行模型压缩处理时，以风格迁移网络作为教师网络，建立一个与该教师网络具有相似结构的学生网络，且教师网络的不同层中的每层的输出通过一个预设大小的卷积和学生网络的对应层相连，以实现采用预训练的教师网络对学生网络进行监督，利用教师网络的监督信息，可以直接从头训练一个小模型(即学生网络)，而不需要分步预训练编码网络和解码网络，较大程度上压缩了风格迁移网络的体积的同时，可以较好地保持网络的迁移效果和拓展性，降低了计算开销，达到模型轻量化，便于移动端部署。

实施例四

图7是本申请实施例四提供的一种对风格迁移网络进行压缩的方法的流程图，该方法可以应用于对图2所述的风格迁移网络进行压缩，可以包括如下步骤：

步骤710，将风格迁移网络作为教师网络，并建立一个与所述教师网络具有相似结构的学生网络。

步骤720，将所述教师网络的不同层中每层的输出通过一个预设大小的卷积与所述学生网络的与该层对应的层相连。

步骤730，固定所述教师网络的权重，按照预设的损失函数，对所述学生网络进行训练，训练得到的网络作为压缩后的风格迁移网络。

本实施例为实施例三对应的方法实施例，针对本实施例的说明可以参照实施例三的描述，本实施例对此不再赘述了。

实施例五

图8是本申请实施例五提供的一种风格迁移的装置的结构框图，可以包括如下模块：

特征排序模块810，设置为在获得内容图像对应的内容特征图和风格图像对应的风格特征图以后，对所述内容特征图以及所述风格特征图分别进行逐通道排序；重排模块820，设置为获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排；风格迁移图像生成模块830，设置为根据排序前的所述内容特征图以及重排后的风格特征图生成风格迁移图像。

本申请实施例所提供的一种风格迁移的装置可执行本申请任意实施例所提供的风格迁移的方法，具备执行方法相应的功能模块和效果。

实施例六

图9是本申请实施例六提供的一种对风格迁移网络进行压缩的装置的结构框图，可以包括如下模块：

学生网络创建模块910，设置为将风格迁移网络作为教师网络，并建立一个与所述教师网络具有相似结构的学生网络；卷积连接模块920，设置为将所述教师网络的不同层中每层的输出通过一个预设大小的卷积与所述学生网络的与所述每层对应的层相连；学生网络训练模块930，设置为固定所述教师网络的权重，按照预设的损失函数，对所述学生网络进行训练，训练得到的网络作为压缩后的风格迁移网络。

本申请实施例所提供的一种对风格迁移网络进行压缩的装置可执行本申请任意实施例所提供的对风格迁移网络进行压缩的方法，具备执行方法相应的功能模块和效果。

实施例七

图10是本申请实施例七提供的一种计算机设备的结构示意图，如图10所示，该计算机设备包括处理器100、存储器101、输入装置102和输出装置103；计算机设备中处理器100的数量可以是一个或多个，图10中以一个处理器100为例；计算机设备中的处理器100、存储器101、输入装置102和输出装置103可以通过总线或其他方式连接，图10中以通过总线连接为例。

存储器101作为一种计算机可读存储介质，可设置为存储软件程序、计算机可执行程序以及模块，如本申请实施例中的上述实施例对应的程序指令/模块。处理器100通过运行存储在存储器101中的软件程序、指令以及模块，从而执行计算机设备的多种功能应用以及数据处理，即实现上述的方法实施例中提到的方法。

实施例八

本申请实施例八还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行上述方法实施例中的方法。

本申请实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本申请任意实施例所提供的方法中的相关操作。

Claims

一种风格迁移的方法，包括：

在获得内容图像对应的内容特征图和风格图像对应的风格特征图以后，对所述内容特征图以及所述风格特征图分别进行逐通道排序；

获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排；

根据排序前的所述内容特征图以及重排后的风格特征图生成风格迁移图像。
根据权利要求1所述的风格迁移的方法，其中，所述对所述内容特征图以及所述风格特征图分别进行逐通道排序，包括：

对所述内容特征图以及所述风格特征图分别进行逐通道向量化处理，获得向量化后的内容特征向量以及向量化后的风格特征向量；

对所述向量化后的内容特征向量以及所述向量化后的风格特征向量分别进行逐通道排序。
根据权利要求2所述的风格迁移的方法，其中，所述获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排包括：

将排序前的所述内容特征图中的内容特征向量与所述排序后的内容特征图中的内容特征向量进行比较，确定所述排序后的内容特征图中的内容特征向量的排序索引，作为所述次序统计信息，其中，所述排序索引为排序前的所述内容特征图中的内容特征向量中的特征元素位于所述排序后的内容特征图中的内容特征向量中的次序；

按照所述次序统计信息对所述排序后的风格特征图中的风格特征向量进行重排；

恢复重排后的风格特征向量的空间维度，得到所述重排后的风格特征图。
根据权利要求1-3任一项所述的风格迁移的方法，其中，所述根据排序前的所述内容特征图以及重排后的风格特征图生成风格迁移图像包括：

将排序前的所述内容特征图以及所述重排后的风格特征图输入至预训练的解码网络中，以由所述解码网络对排序前的所述内容特征图以及所述重排后的风格特征图进行解码重建，生成所述风格迁移图像，其中，排序前的所述内容特征图的不同层级的内容特征信息以跳跃连接的方式被引入到所述解码网络中。
一种风格迁移系统，包括风格迁移网络，所述风格迁移网络包括编码网络、风格映射单元以及解码网络，其中，

所述编码网络，设置为对输入的内容图像以及风格图像进行编码处理，生成所述内容图像对应的内容特征图以及所述风格图像对应的风格特征图，并将所述内容特征图以及所述风格特征图输出至所述风格映射单元，以及，将所述内容特征图输出至所述解码网络；

所述风格映射单元，设置为对所述内容特征图以及所述风格特征图分别进行逐通道排序；获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排，以及，将重排后的风格特征图输出至所述解码网络；

所述解码网络，设置为根据所述内容特征图以及所述重排后的风格特征图生成风格迁移图像。
根据权利要求5所述的风格迁移系统，其中，所述解码网络的输入层的输入是所述重排后的风格特征图，排序前的所述内容特征图的不同层级的内容特征信息以跳跃连接的方式被引入到所述解码网络中。
根据权利要求5或6所述的风格迁移系统，其中，所述编码网络还设置为将所述风格特征图输出至所述解码网络中；

所述解码网络包括前向网络和自适应实例规范化AdaIN子网络，所述AdaIN子网络的输入包括所述解码网络中位于所述AdaIN子网络前一层的输出和所述输出对应尺度的风格特征图，所述AdaIN子网络设置为根据所述输出对应尺度的风格特征图的均值和方差，逐通道地对所述输出进行归一化处理。
根据权利要求5所述的风格迁移系统，还包括：

模型压缩模块，设置为对所述风格迁移网络进行模型压缩处理。
根据权利要求8所述的风格迁移系统，其中，所述模型压缩模块包括：

学生网络创建子模块，设置为将所述风格迁移网络作为教师网络，并建立一个与所述教师网络具有相似结构的学生网络；

关联子模块，设置为将所述教师网络的不同层中每层的输出通过一个预设大小的卷积与所述学生网络的与所述每层对应的层相连；

学生网络训练子模块，设置为固定所述教师网络的权重，按照预设的损失函数，对所述学生网络进行训练，训练得到的网络作为压缩后的风格迁移网络。
根据权利要求9所述的风格迁移系统，其中，所述损失函数包括风格损失函数、内容损失函数、重构损失函数以及蒸馏损失函数；

所述蒸馏损失函数为所述学生网络的不同层中每层输出的特征与所述教师网络的与所述每层对应的层输出的特征经过所述每层对应的卷积的映射后的相似程度；

所述重构损失函数为所述学生网络输出的风格迁移图像与所述教师网络输出的风格迁移图像的相似程度；

所述内容损失函数采用将所述学生网络输出的风格迁移图像和内容图像通过所述学生网络的编码网络后得到的所述学生网络的编码网络输出的特征的均方误差损失来度量；

所述风格损失函数采用将所述学生网络输出的风格迁移图像和风格图像通过所述学生网络的编码网络后得到的所述学生网络的编码网络输出的特征，在所述学生网络的编码网络的多层的逐通道的均值的距离和方差的距离来度量。
一种对权利要求5中的风格迁移网络进行压缩的方法，包括：

将风格迁移网络作为教师网络，并建立一个与所述教师网络具有相似结构的学生网络；

将所述教师网络的不同层中每层的输出通过一个预设大小的卷积与所述学生网络的与所述每层对应的层相连；

固定所述教师网络的权重，按照预设的损失函数，对所述学生网络进行训练，训练得到的网络作为压缩后的风格迁移网络。
一种风格迁移的装置，包括：

特征排序模块，设置为在获得内容图像对应的内容特征图和风格图像对应的风格特征图以后，对所述内容特征图以及所述风格特征图分别进行逐通道排序；

重排模块，设置为获取排序后的内容特征图的次序统计信息，并按照所述次序统计信息对排序后的风格特征图进行重排；

风格迁移图像生成模块，设置为根据排序前的所述内容特征图以及重排后的风格特征图生成风格迁移图像。
一种对权利要求5中的风格迁移网络进行压缩的装置，包括：

学生网络创建模块，设置为将风格迁移网络作为教师网络，并建立一个与所述教师网络具有相似结构的学生网络；

卷积连接模块，设置为将所述教师网络的不同层中每层的输出通过一个预设大小的卷积与所述学生网络的与所述每层对应的层相连；

学生网络训练模块，设置为固定所述教师网络的权重，按照预设的损失函数，对所述学生网络进行训练，训练得到的网络作为压缩后的风格迁移网络。
一种计算机设备，包括：

至少一个处理器；

存储装置，设置为存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1-4中任一项所述的风格迁移的方法和权利要求11所述的对风格迁移网络进行压缩的方法中的至少之一。
一种计算机可读存储介质，存储有计算机程序，其中，所述程序被处理器执行时实现如权利要求1-4中任一项所述的风格迁移的方法和权利要求11所述的对风格迁移网络进行压缩的方法中的至少之一。