CN112861884B

CN112861884B - 一种基于深度学习的服饰图像外观属性修改方法

Info

Publication number: CN112861884B
Application number: CN202110293375.1A
Authority: CN
Inventors: 陈彦; 司新建; 胡洋
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-03-19
Filing date: 2021-03-19
Publication date: 2022-05-03
Anticipated expiration: 2041-03-19
Also published as: CN112861884A

Abstract

本发明公开了一种基于深度学习的服饰图像外观属性修改方法，该方法主要包括：获取颜色属性、领口样式属性和袖子长度属性这三个服饰外观属性的子数据集；建立基于深度学习的服饰图像外观属性修改模型；使用三个子数据集对基于深度学习的服饰图像外观属性修改模型进行训练；使用训练好的基于深度学习的服饰图像外观属性修改模型对待测试服饰图像进行外观属性修改。本发明提出了一种将属性编码与内容编码分离表示的方法，使用这种方法进行服饰图像外观属性迁移，可以提升生成服饰图像的质量和外观属性迁移的成功率，同时保证生成服饰图像中与迁移的外观属性不相关的部分维持原状。

Description

一种基于深度学习的服饰图像外观属性修改方法

技术领域

本发明属于图像处理领域，具体涉及一种基于深度学习的服饰图像外观属性修改方法。

背景技术

图像编辑和转换一直是计算机视觉领域的热门研究方向。能够对图像中的某些属性进行编辑和迁移在特定场景下是非常有用的，例如用户对于图像中的某个视觉属性不满意的情况。对于购物网站来说，如果能够以让用户以低学习成本来修改商品服饰图像的属性，无疑可以大幅提升用户体验。

近年来深度学习和生成对抗网络得到了快速发展。越来越多的图像编辑任务都开始利用生成对抗网络(GAN)完成。然而已有的大部分工作都是在人脸数据集上完成，而鲜少在服饰图像这个更加广阔的应用场景上实现。相比起人脸图像，服饰图像属性编辑具有较高的难度，这主要是由于服饰图像种类繁多、属性复杂，更有颜色、纹理这种人脸数据上不具有的属性。

利用生成对抗网络对于服饰图像属性进行迁移有两大挑战，首先是如何生成高质量的属性迁移图像，使得得到的图像看起来真实；其次是在迁移属性时，如何保证不会影响原图的其他属性。本发明通过设计网络结构与损失函数，将属性和内容分开处理，实现了上述要求，实验证明这是一个有效的尝试。

发明内容

本发明的目的在于，提出一种基于深度学习的服饰图像外观属性修改方法，这种方法主要包括数据集的获取与清洗、网络结构的设计、网络训练方法和损失函数的选择。

本发明提出的一种基于深度学习的服饰图像外观属性修改方法，包括以下步骤：

步骤1：在公开的服饰属性数据集Shopping100k中，通过Category属性筛选出上半身服饰，并分别根据颜色属性、领口样式属性和袖子长度属性这三个服饰外观属性建立三个子数据集：颜色属性数据集Data_color、领口样式属性数据集Data_collar以及袖子长度属性数据集Data_sleeve，其中，颜色属性数据集Data_color包括38359张仅在颜色属性上进行了分类标注的服饰图像，即包括38359张真实样本图像；领口样式属性数据集Data_collar包括18076张仅在领口样式属性上进行了分类标注的服饰图像，即包括18076张真实样本图像；袖子长度属性数据集Data_sleeve包括45791张仅在袖子长度属性上进行了分类标注的服饰图像，即包括45791张真实样本图像；

步骤2：建立基于深度学习的服饰图像外观属性修改模型，所述基于深度学习的服饰图像外观属性修改模型共包括四个独立的神经网络模型，分别为：基于深度卷积神经网络的属性编码器E_a，用于提取输入服饰图像的属性相关的特征，得到输入服饰图像的属性编码；基于深度卷积神经网络的内容编码器E_c，用于提取输入服饰图像的内容特征，输出为输入服饰图像的内容编码；解码器Dec，接收属性编码和内容编码作为输入，按照属性编码以及内容编码表示的特征生成伪图像；判别器D，将来自三个子数据集的真实样本图像或者由解码器Dec生成的伪图像作为输入，输出为对输入的真伪判别结果以及输入在颜色、袖子长度或领口样式这三个服饰外观属性上的分类结果；

步骤3：使用步骤1得到的三个子数据集，对步骤2建立的基于深度学习的服饰图像外观属性修改模型进行训练，得到训练好的基于深度学习的服饰图像外观属性修改模型，其中，对基于深度学习的服饰图像外观属性修改模型的训练采取了循环训练的策略，循环次数为80000次，每次循环中依次进行三次子训练，这三次子训练分别对应三个服饰图像外观属性：领口样式属性、袖子长度属性和颜色属性；

步骤4：使用训练好的基于深度学习的服饰图像外观属性修改模型对待测试服饰图像进行外观属性修改。

本发明提出了一种将属性编码与内容编码分离表示的方法，使用这种方法进行服饰图像外观属性迁移，可以提升生成服饰图像的质量和外观属性迁移的成功率；同时保证生成服饰图像中与迁移的外观属性不相关的部分维持原状。与已有的服饰图像外观属性迁移方法相比，本发明具有精确修改外观属性、对生成服饰图像其他部分影响低的优点。

附图说明

图1是基于深度学习的服饰图像外观属性修改模型的整体结构图

图2是AdaIN的结构示意图

图3是本发明进行颜色属性迁移的结果图

图4是本发明进行领口样式属性迁移的结果图

图5是本发明进行袖子长度属性迁移的结果图

图6是本发明4个关键点检测结果以及对应生成的属性框的示意图

具体实施方式

本发明主要提出了一套基于生成对抗网络，对服饰图像外观属性进行迁移的方法。下面结合附图对本发明的细节进行描述。

本发明提出了一种基于深度学习的服饰图像外观属性修改方法，该方法的实现步骤如下：

步骤1：对Kenan Emir Ak在论文中公开的服饰属性数据集Shopping100k根据服饰外观属性建立了三个子数据集。服饰属性数据集Shopping100k共包括近10万张图像，每张图像在12个服饰图像外观属性上分别进行了标注，每个服饰图像外观属性都有数个类别，如袖子长度属性就包括9个可能的类别：3/4长度，Spaghetti(露肩)，Sleeveless(无袖)，Elbow(到手肘长度)，Extra Long(加长)，Extra Short(超短)，Long(长)，Short(短)，Strapless(无肩带)。注意到Shopping100k数据集中并非每一张图像都在所有的服饰图像外观属性上有对应的类别标注。根据本发明的实际需求，仅选取上半身服饰这个类别(通过服饰属性数据集Shopping100k中的Category属性筛选)，在此基础上为每个服饰图像外观属性建立单独的子数据集，例如袖子长度属性数据集中，仅包含在袖子长度属性上进行了分类标注的服饰图像。最终得到三个子数据集，包括颜色属性数据集(包括38359张服饰图像，即包括38359张真实样本图像)Data_color、领口样式属性数据集(包括18076张服饰图像，即包括18076张真实样本图像)Data_collar和袖子长度属性数据集(包括45791张服饰图像，即包括45791张真实样本图像)Data_sleeve。

步骤2：建立基于深度学习的服饰图像外观属性修改模型，图1展示了基于深度学习的服饰图像外观属性修改模型的整体结构。所述基于深度学习的服饰图像外观属性修改模型共包括四个独立的神经网络模型，分别为：基于深度卷积神经网络的属性编码器E_a，用于提取输入服饰图像的属性相关的特征，得到输入服饰图像的属性编码；基于深度卷积神经网络的内容编码器E_c，用于提取输入服饰图像的内容特征，输出为输入服饰图像的内容编码；解码器Dec，接收属性编码和内容编码作为输入，按照属性编码以及内容编码表示的特征生成伪图像；判别器D，将来自三个子数据集的真实样本图像或者由解码器Dec生成的伪图像作为输入，输出对来自三个子数据集的真实样本图像或者由解码器Dec生成的伪图像的真伪判别结果以及来自三个子数据集的真实样本图像或者由解码器Dec生成的伪图像在三个服饰外观属性(颜色、袖子长度与领口样式)的分类结果。属性编码和内容编码分别包含了服饰图像中不同部分的信息，内容编码指在特征上与属性编码不相关的信息。

步骤3：使用步骤1得到的三个子数据集，对步骤2建立的基于深度学习的服饰图像外观属性修改模型进行训练。训练采取了循环训练的策略，循环次数为80000次，每次循环训练依次进行三次子训练，这三次子训练分别对应三个服饰图像外观属性：领口样式属性、袖子长度属性和颜色属性。

对所述基于深度学习的服饰图像外观属性修改模型进行训练的具体步骤包括步骤3.1-步骤3.6，其中，步骤3.1-步骤3.3对应一次循环训练中的领口样式属性子训练；步骤3.4对应一次循环训练中的袖子长度属性子训练；步骤3.5对应一次循环训练中的颜色属性子训练：

步骤3.1：从领口样式属性数据集Data_collar中获取两张服饰图像src和ref，这两张服饰图像具有不同的领口样式属性分类，它们的领口样式属性分类标签分别用l_src和l_ref表示。

步骤3.2：训练判别器D：

使用属性编码器E_a分别提取服饰图像src和ref的属性编码a_s和a_r：

a_s＝E_a(src)

a_r＝E_a(ref)

将服饰图像src送入内容编码器E_c得到服饰图像src的内容编码c_s：

c_s＝E_c(src)

将服饰图像src送入判别器D，得到判别器D对于服饰图像src是否为领口样式属性数据集Data_collar中真实样本图像的判别结果adv_real以及对于服饰图像src的领口样式属性分类结果cls_real。判别器D在多次循环训练后由于对抗损失函数

的约束，学习到来自领口样式属性数据集Data_collar中的真实样本图像分布，因此adv_real代表了服饰图像src接近领口样式属性数据集Data_collar中真实样本图像分布的程度。

adv_real,cls_real＝D(src)

使用adv_real和cls_real计算一次判别器D的对抗损失函数

和分类损失函数

其中

采用二元交叉熵损失函数计算，binary_cross_entropy为PyTorch自带的损失函数，用于接收两个相同维度的张量并计算它们之间的交叉熵损失。在

的计算中要求adv_real的结果接近1，用于监督判别器D正确判断领口样式属性数据集中Data_collar的真实样本图像为真。

使用了交叉熵损失函数计算，用于监督判别器D对于服饰图像src进行正确的领口样式属性分类。

为了修改服饰图像外观属性，需要将a_r与a_s进行重组。a_r与a_s都是192维度的张量，分别沿着a_r与a_s中最后一个维度对张量a_r与a_s进行划分，有：

a_r＝[r₁,r₂,r₃]

a_s＝[s₁,s₂,s₃]

其中r_i与s_i(i＝1，2，3)分别代表了属性编码a_r与a_s中对应于第i个属性的特征编码，r_i与s_i均为64维度的张量。要将服饰图像ref中的第i个属性(本发明中，i＝1对应于颜色属性，i＝2对应于领口样式属性，i＝3对应于袖子长度属性，这里为第2个属性领口样式)迁移到服饰图像src中，需要将a_r与a_s重组得到a_rec：

a_rec＝[s₁,r₂,s₃]

将a_rec与c_s送入解码器Dec得到伪图像fake：

fake＝Dec(c_s,a_rec)

将伪图像fake送入判别器D，得到判别器D对于伪图像fake接近领口样式属性数据集Data_collar中真实样本图像分布程度的判别结果adv_fake以及对于伪图像fake的领口样式属性分类结果cls_fake。由于判别器D在多次循环训练后学习到领口样式属性数据集Data_collar中真实样本图像分布，因此adv_fake代表了伪图像fake接近领口样式属性数据集Data_collar中真实样本图像分布的程度。使用adv_fake计算一次判别器D的对抗损失函数

adv_fake,cls_fake＝D(fake)

其中

采用了二元交叉熵损失函数计算，要求adv_fake的结果接近0，用于监督判别器D正确判断生成的伪图像fake为假。

判别器D总的损失函数为：

其中，λ_adv、λ_cls分别代表判别器D总的对抗损失函数和分类损失函数的权重。λ_adv、λ_cls均为经验参数，可根据实际情况进行调节。本发明中，λ_adv的取值为1，λ_cls的取值为0.5。

采用上述判别器D总的损失函数并使用Pytorch框架的自动求导与反向传播机制，更新判别器D的参数，得到在领口样式属性修改任务上更新参数后的判别器D′。

步骤3.3：训练属性编码器E_a、内容编码器E_c与解码器Dec：

继续使用步骤3.1从领口样式属性数据集Data_collar中取出的服饰图像src与服饰图像ref。由于在实际训练中，步骤3.2使用Pytorch框架的反向传播机制后计算图被摧毁，因此需要重复步骤3.2中伪图像fake的生成过程，其中，计算图是指输入服饰图像被输入基于深度学习的服饰图像外观属性修改模型后，经过一系列计算得到的基于深度学习的服饰图像外观属性修改模型中各网络层参数之间的计算关系，计算图用于反向传播时计算梯度。

使用内容编码器E_c提取服饰图像src的内容编码c_s：

c_s＝E_c(src)

将服饰图像src与服饰图像ref分别送入属性编码器E_a得到服饰图像src的属性编码a_s与服饰图像ref的属性编码a_r：

a_s＝E_a(src)

a_r＝E_a(ref)

为了修改服饰图像外观属性，需要将a_r与a_s进行重组。a_r与a_s都是192维度的张量，分别沿着a_r与a_s中最后一个维度对张量a_r与a_s划分，有：

a_r＝[r₁,r₂,r₃]

a_s＝[s₁,s₂,s₃]

其中r_i与s_i分别代表了属性编码a_r与a_s中对应于第i个属性(第2个属性为领口样式属性)的特征编码，r_i与s_i均为64维度的张量。要将服饰图像ref中的第2个属性迁移到服饰图像src中，需要将a_r与a_s重组得到a_rec：

a_rec＝[s₁,r₂,s₃]

将a_rec与c_s送入解码器Dec得到伪图像fake(这里的伪图像fake与步骤3.2中得到的伪图像fake相同)

fake＝Dec(c_s,a_rec)

将伪图像fake送入判别器D′，得到判别器D′对于伪图像fake接近领口样式属性数据集Data_collar中真实样本图像分布程度的判别结果adv_fake′以及对于伪图像fake领口样式属性分类结果cls_fake′。l_ref为服饰图像ref在领口样式属性上的分类标签。

adv_fake′,cls_fake′＝D′(fake)

其中，

分别表示属性编码器E_a、内容编码器E_c与解码器Dec的对抗损失函数以及属性编码器E_a、内容编码器E_c与解码器Dec的分类损失函数。

采用了二元交叉熵损失函数计算，要求adv_fake′的结果接近1，使得生成的伪图像fake成功欺骗能够分辨输入服饰图像真伪的判别器D′，使其判断伪图像fake为领口样式属性数据集中的真实样本图像，来约束属性编码器E_a、内容编码器E_c与解码器Dec生成尽可能真实的服饰图像。

采用交叉熵损失函数计算，

的约束使得生成的伪图像fake在领口样式属性上的分类类别由原来服饰图像src的分类类别变为服饰图像ref的分类类别。

为了避免这种修改方式生成的伪图像fake将其他与领口样式属性不相关的属性也进行了修改，本发明还使用了基于PyTorch的开源视觉时尚分析工具箱mmfashion获取领口样式属性数据集Data_collar中每一张服饰图像的关键点，将对应于服饰图像ref中的第i个属性(这里为第2个属性领口样式属性)的关键点取出，使用取出的这些属性关键点，获取领口样式属性相关区域的框，如图6所示。利用获取的领口样式属性相关区域的框，将领口样式属性相关区域分别从伪图像fake和服饰图像src中去掉，分别获得伪图像fake和服饰图像src中与领口样式属性不相关的区域，获得与领口样式属性不相关的区域的过程用函数F_unrelate()表示，此处的不相关指服饰图像像素上的不相关。因此，属性编码器E_a、内容编码器E_c与解码器Dec的像素损失函数

有如下形式：

其中，||*||₁表示L1范数，

是为了约束基于深度学习的服饰图像外观属性修改模型，防止在生成的伪图像fake中将与领口样式属性不相关的区域进行了修改。

综上，属性编码器E_a、内容编码器E_c与解码器Dec总的损失函数为

其中，λ_adv、λ_cls和λ_pix分别代表属性编码器E_a、内容编码器E_c与解码器Dec对抗损失函数、分类损失函数和像素损失函数的权重。λ_adv、λ_cls和λ_pix均为经验参数，可根据实际情况进行调节。本发明中，λ_adv的取值为1，λ_cls的取值为0.5，λ_pix的取值为5。

采用属性编码器E_a、内容编码器E_c与解码器Dec总的损失函数

并使用Pytorch框架的自动求导与反向传播机制，更新属性编码器E_a、内容编码器E_c与解码器Dec的参数，得到在领口样式属性修改任务上更新参数后的属性编码器E_a′、内容编码器E_c′与解码器Dec′。

每次训练都使得基于深度学习的服饰图像外观属性修改模型在该服饰图像外观属性(此处指领口样式属性)上修改的效果好一点。

步骤3.4：从袖子长度属性数据集Data_sleeve中获取两张具有不同袖子长度属性分类的服饰图像src′和ref′，基于步骤3.2得到的在领口样式属性修改任务上更新参数后的判别器D′和步骤3.3得到的在领口样式属性修改任务上更新参数后的属性编码器E_a′、内容编码器E_c′与解码器Dec′，继续训练基于深度学习的服饰图像外观属性修改模型，其训练思路与步骤3.1-步骤3.3相同，最后得到在袖子长度属性修改任务上更新参数后的判别器以及在袖子长度属性修改任务上更新参数后的属性编码器、内容编码器与解码器。

步骤3.5：继续从颜色属性数据集Data_color中获取两张具有不同颜色属性分类的服饰图像src″和服饰图像ref″，基于步骤3.4得到的在袖子长度属性修改任务上更新参数后的判别器以及在袖子长度属性修改任务上更新参数后的属性编码器、内容编码器与解码器，继续训练基于深度学习的服饰图像外观属性修改模型，其训练思路与步骤3.1-步骤3.3相同，但在步骤3.3中，由于颜色属性的修改并不涉及服饰图像结构的变化，因此不再计算像素损失函数，属性编码器、内容编码器与解码器总的损失函数中不再包括像素损失函数。最后得到在颜色属性修改任务上更新参数后的判别器以及在颜色属性修改任务上更新参数后的属性编码器、内容编码器与解码器。

步骤3.6：重复步骤3.1-3.5直到达到给定的循环次数，最终得到训练好的基于深度学习的服饰图像外观属性修改模型及其参数。使用Pytorch提供的torch.save()函数，将训练好的基于深度学习的服饰图像外观属性修改模型的参数持久化保存为.pth格式的文件，以便测试和展示使用。

步骤4：使用训练好的基于深度学习的服饰图像外观属性修改模型进行测试：

从磁盘中读取.pth格式的文件，将保存的训练好的基于深度学习的服饰图像外观属性修改模型的参数加载到内存中，获得训练好的基于深度学习的服饰图像外观属性修改模型中的属性编码器

内容编码器

与解码器Dec_last。给定两张待测试服饰图像src″′和ref″′，以及需要迁移的服饰图像外观属性序号(本发明中，属性序号1对应于颜色属性，属性序号2对应于领口样式属性，属性序号3对应于袖子长度属性)。以迁移颜色属性为例，将服饰图像src″′分别送入属性编码器

和内容编码器

中，将服饰图像ref″′送入属性编码器

中，得到属性编码a″′_s和a″′_r以及内容编码c″′_s。

要迁移的颜色属性序号为1，得到a″′_rec：

a″′_rec＝[r″′₁,s″′₂,s″′₃]

将a″′_rec与c″′_s送入解码器Dec_last即可得到伪图像fake″′，伪图像fake″′具有与服饰图像src″′相同的形状结构，但颜色却与服饰图像ref″′相同，由此完成了服饰图像外观属性(以颜色属性为例)的迁移。

进一步地，在步骤1中，Shopping100k数据集本来包含了10万余张服饰图像，并对每张服饰图像在领口样式、颜色、袖子长度等属性上进行了标注。但并非每张服饰图像在每个属性上都有标注，对于未被标注的属性，数据集作者用‘-1’来表示。本发明是在颜色、袖子长度与领口样式属性上进行循环训练的，因此对每个子数据集(颜色、领口样式、袖子长度)都使用了独立的Dataloader来加载在当前属性上有标注的数据。

在加载每个子数据集的数据过程中，还对每个子数据集中的每张服饰图像进行了数据增强和标准化操作。具体而言，对于三个子数据集中的任意一个子数据集，其中的每张服饰图像都被按照原尺寸读入，然后使用Pytorch提供的resize()函数将每张服饰图像的尺寸均修改为256*256，随后对每张服饰图像进行随机翻转，以增加该子数据集的容量；由于每张服饰图像具有8bit的色深，像素值范围在0～255之间，在对每张服饰图像进行随机翻转之后，使用PyTorch的toTensor函数将每张服饰图像的像素值归一化到[0,1]区间，然后使用[0.5,0.5]的均值和标准差将每张服饰图像像素值的范围归一化到[-1,1]区间，这是因为神经网络的输入输出最好是0均值，这样参数比较好学习。

同时，由于每个子数据集中的服饰图像存在属性类别分布不均匀的情况，因此，在三个子数据集中的任意一个子数据集中，使用Pytorch提供的Datasampler工具，将出现频率低的属性类别对应的服饰图像进行多次采样，即重采样，通过重采样使得该子数据集中的服饰图像在属性类别分布上较为均衡，以提升判别器的属性分类准确率，进而间接地提升修改属性的成功率。

进一步地，在步骤2中建立的四个独立的神经网络模型均采用了深度卷积网络。属性编码器E_a输出属性编码a，内容编码器E_c输出内容编码c，解码器Dec负责接收输入a与c，其中a是一个192维度的张量，a与c同时输入解码器Dec，最终得到256*256*3的伪图像fake。解码器Dec的具体结构参数如表1所示，解码器Dec由6个Resblk结构依次串联组成，并在最后一个Resblk结构之后连接一个toImg层。所述toImg层由归一化层、激活函数和卷积层依次串联组成，用于将上一个Resblk结构输出的包含64通道的特征图张量的通道数降低为3，变成RGB图像，其中，toImg层中的归一化层为IN(Instance Normalization)层，toImg层中的激活函数为LeakyReLU。

每个Resblk结构有着归一化层-激活函数-卷积层-归一化层-激活函数-卷积层的结构，其中每个Resblk结构中的归一化层均为AdaIN(Adaptive InstanceNormalization)，每个Resblk结构中的激活函数均为LeakyReLU，每个Resblk结构中的卷积层中的卷积核尺寸均为3*3、卷积层的步长均为1。每个AdaIN由两个全连接层fc_beta和fc_gamma以及一个IN(Instance Normalization)层组成，如图2所示。

对于任意一个AdaIN，AdaIN接受的输入包括来自上一个卷积层输出的维度为C*H*W的特征图fea以及属性编码a，其中，C、H、W均为大于1的整数，表1中标注的输出维度就是C*H*W。特征图fea作为AdaIN中IN层的唯一输入，其输出为IN层输出的特征图IN(fea)；属性编码a分别通过AdaIN中的全连接层fc_beta与fc_gamma得到相应的beta与gamma，由此AdaIN通过属性编码a对IN层输出的特征图IN(fea)在通道C的维度上进行缩放和偏移，从而实现属性迁移的目的，其中，对IN(fea)的缩放采用gamma实现，对IN(fea)的偏移采用beta实现。

AdaIN(fea,a)＝(1+fc_gamma(a))*IN(fea)+fc_beta(a)

其中，fc_gamma(a)＝gamma，fc_beta(a)＝beta。

上述在步骤2中出现的所有IN(Instance Normalization)层的结构和功能均相同。

表1解码器的具体结构参数表

网络层	归一化层	采样方式	输出维度
				ResBlk	AdaIN		1616512
ResBlk	AdaIN		1616512
				ResBlk	AdaIN	上采样	3232512
ResBlk	AdaIN	上采样	6464256
				ResBlk	AdaIN	上采样	128128128
ResBlk	AdaIN	上采样	25625664
				toImg	IN		2562563

进一步地，在步骤3中，在每次循环中先从领口样式属性数据集对应的Dataloader中获取服饰图像，进行训练；然后从袖子长度属性数据集对应的Dataloader中获取服饰图像，进行训练；最后从颜色属性数据集对应的Dataloader中获取服饰图像，进行训练。为了保证不修改与领口样式或袖子长度属性不相关区域，在对领口样式和袖子长度属性进行训练时使用了mmfashion框架标注的属性关键点。mmfashion是香港中文大学开源的时尚图像多任务框架，提供关键点检测、属性预测等功能。本发明使用mmfashion的关键点检测功能，对领口样式属性数据集以及袖子长度属性数据集中的每张服饰图像的6个关键点(衣服左底部边缘关键点、衣服右底部边缘关键点、左袖底部关键点，右袖底部关键点，左领口边缘关键点和右领口边缘关键点)均进行检测，然后取出其中的4个关键点(左袖底部关键点，右袖底部关键点，左领口边缘关键点和右领口边缘关键点)，如图6所示。

对于领口样式属性数据集中的任意一张服饰图像，将对应于服饰图像中领口样式属性的关键点左领口边缘关键点和右领口边缘关键点取出，由此生成领口样式属性框，所述领口样式属性框左上角x坐标由该服饰图像左领口边缘关键点的x坐标减10个像素得到，y坐标由该服饰图像左领口边缘关键点的y坐标减10个像素得到；所述领口样式属性框右下角x坐标由该服饰图像右领口边缘关键点的x坐标加30个像素得到，y坐标由该服饰图像右领口边缘关键点的y坐标加10个像素得到。

对于袖子长度属性数据集中的任意一张服饰图像，将对应于服饰图像中袖子长度属性的关键点左袖底部关键点和右袖底部关键点取出，由此生成左袖子对应的属性框和右袖子对应的属性框，其中，所述左袖子对应的属性框左上角x坐标为0，y坐标为0；所述左袖子对应的属性框右下角x坐标由该服饰图像左袖底部关键点的x坐标加30个像素得到，y坐标为255。所述右袖子对应的属性框左上角x坐标为该服饰图像右袖底部关键点x坐标，y坐标为0；所述右袖子对应的属性框右下角x坐标为255，y坐标为255。在从领口样式属性数据集对应的Da taloader中获取服饰图像进行训练时，使用生成的领口样式属性框提取伪图像fake和图像src中与领口样式属性无关的区域，计算像素损失函数；在从袖子长度属性数据集对应的Dataloa der中获取服饰图像进行训练时，使用生成的左袖子对应的属性框和右袖子对应的属性框提取伪图像fake和图像src中与袖子长度属性无关的区域，计算像素损失函数。通过这样的约束，保证了在修改某一服饰图像外观属性时，其他与该服饰图像外观属性无关的区域和属性可以维持不变。图6展示了如何利用关键点生成对应的属性框。

进一步地，在步骤4的测试过程中，本实施例验证了对于256*256像素的服饰图像在仅有服饰图像外观属性分类标注的情况下，本发明提出的方法在服饰图像外观属性迁移任务上的有效性。在本实施例中分别选取颜色、领口样式和袖子长度三种服饰图像外观属性进行实验。这三种服饰图像外观属性进行迁移所得结果分别如图3、图4和图5所示。从图3中可以看出，训练好的基于深度学习的服饰图像外观属性修改模型可以在保证服饰整体形状和其他属性不变的情况下，将最左侧一列的参考服饰的颜色迁移到最上一行的样例服饰上；图4和图5则分别展示了从参考服饰中迁移领口样式和袖子长度的结果。可以看出，本发明可以有效对服饰图像外观属性进行迁移。

以上所述，仅为本发明的具体实施方式，本说明书中所公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换；所公开的所有特征、或所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以任何方式组合；本领域的技术人员根据本发明技术方案的技术特征所做出的任何非本质的添加、替换，均属于本发明的保护范围。

Claims

1.一种基于深度学习的服饰图像外观属性修改方法，其特征在于，该方法包括以下步骤：

步骤3：使用步骤1得到的三个子数据集，对步骤2建立的基于深度学习的服饰图像外观属性修改模型进行训练，得到训练好的基于深度学习的服饰图像外观属性修改模型，其中，对基于深度学习的服饰图像外观属性修改模型的训练采取了循环训练的策略，循环次数为80000次，每次循环训练中依次进行三次子训练，这三次子训练分别对应三个服饰图像外观属性：领口样式属性、袖子长度属性和颜色属性；

步骤4：使用训练好的基于深度学习的服饰图像外观属性修改模型对待测试服饰图像进行外观属性修改；

其中，所述步骤3中对基于深度学习的服饰图像外观属性修改模型进行训练的具体步骤包括步骤3.1-步骤3.6，其中，步骤3.1-步骤3.3对应一次循环训练中的领口样式属性子训练；步骤3.4对应一次循环训练中的袖子长度属性子训练；步骤3.5对应一次循环训练中的颜色属性子训练：

步骤3.1：从领口样式属性数据集Data_collar中获取两张服饰图像src和ref，这两张服饰图像具有不同的领口样式属性分类，它们的领口样式属性分类标签分别用l_src和l_ref表示；

步骤3.2：训练判别器D：

a_s＝E_a(src)

a_r＝E_a(ref)

c_s＝E_c(src)

将服饰图像src送入判别器D，得到判别器D对于服饰图像src是否为领口样式属性数据集Data_collar中真实样本图像的判别结果adv_real以及对于服饰图像src的领口样式属性分类结果cls_real；判别器D在多次循环训练后由于对抗损失函数

的约束，学习到来自领口样式属性数据集Data_collar中的真实样本图像分布，因此adv_real代表了服饰图像src接近领口样式属性数据集Data_collar中真实样本图像分布的程度；

adv_real，cls_real＝D(src)

使用adv_real和cls_real计算一次判别器D的对抗损失函数

和分类损失函数

其中

采用二元交叉熵损失函数计算，binary_cross_entropy为PyTorch自带的损失函数，用于接收两个相同维度的张量并计算它们之间的交叉熵损失，在

的计算中要求adv_real的结果接近1，用于监督判别器D正确判断领口样式属性数据集中Data_collar的真实样本图像为真；

使用了交叉熵损失函数计算，用于监督判别器D对于服饰图像src进行正确的领口样式属性分类；

为了修改服饰图像外观属性，需要将a_r与a_s进行重组，a_r与a_s都是192维度的张量，分别沿着a_r与a_s中最后一个维度对张量a_r与a_s进行划分，有：

a_r＝[r₁，r₂，r₃]

a_s＝[s₁，s₂，s₃]

其中r_i与s_i分别代表了属性编码a_r与a_s中对应于第i个属性的特征编码，i＝1，2，3；r_i与s_i均为64维度的张量；要将服饰图像ref中的第i个属性迁移到服饰图像src中，需要将a_r与a_s重组得到a_rec；i＝1对应于颜色属性，i＝2对应于领口样式属性，i＝3对应于袖子长度属性，在此次子训练中，i＝2；

a_rec＝[s₁，r₂，s₃]

将a_rec与c_s送入解码器Dec得到伪图像fake：

fake＝Dec(c_s，a_rec)

将伪图像fake送入判别器D，得到判别器D对于伪图像fake接近领口样式属性数据集Data_collar中真实样本图像分布程度的判别结果adv_fake以及对于伪图像fake的领口样式属性分类结果cls_fake；使用adv_fake计算一次判别器D的对抗损失函数

adv_fake，cls_fake＝D(fake)

其中

采用了二元交叉熵损失函数计算，要求adv_fake的结果接近0，用于监督判别器D正确判断生成的伪图像fake为假；

判别器D总的损失函数为：

其中，λ_adv、λ_cls分别代表判别器D总的对抗损失函数和分类损失函数的权重，λ_adv、λ_cls均为经验参数，可根据实际情况进行调节；

采用上述判别器D总的损失函数并使用Pytorch框架的自动求导与反向传播机制，更新判别器D的参数，得到在领口样式属性修改任务上更新参数后的判别器D′；

步骤3.3：训练属性编码器E_a、内容编码器E_c与解码器Dec：

继续使用步骤3.1从领口样式属性数据集Data_collar中取出的服饰图像src与服饰图像ref，由于在实际训练中，步骤3.2使用Pytorch框架的反向传播机制后计算图被摧毁，因此需要重复步骤3.2中伪图像fake的生成过程，其中，计算图是指输入服饰图像被输入基于深度学习的服饰图像外观属性修改模型后，经过一系列计算得到的基于深度学习的服饰图像外观属性修改模型中各网络层参数之间的计算关系，计算图用于反向传播时计算梯度；

使用内容编码器E_c提取服饰图像src的内容编码c_s：

c_s＝E_c(src)

a_s＝E_a(src)

a_r＝E_a(ref)

为了修改服饰图像外观属性，需要将a_r与a_s进行重组，a_r与a_s都是192维度的张量，分别沿着a_r与a_s中最后一个维度对张量a_r与a_s划分，有：

a_r＝[r₁，r₂，r₃]

a_s＝[s₁，s₂，s₃]

其中r_i与s_i分别代表了属性编码a_r与a_s中对应于第i个属性的特征编码，i＝1，2，3；r_i与s_i均为64维度的张量，要将服饰图像ref中的第2个属性迁移到服饰图像src中，需要将a_r与a_s重组得到a_rec：

a_rec＝[s₁，r₂，s₃]

将a_rec与c_s送入解码器Dec得到伪图像fake，这里的伪图像fake与步骤3.2中得到的伪图像fake相同，

fake＝Dec(c_s，a_rec)

将伪图像fake送入判别器D′，得到判别器D′对于伪图像fake接近领口样式属性数据集Data_collar中真实样本图像分布程度的判别结果adv_fake′以及对于伪图像fake领口样式属性的分类结果cls_fake′，l_ref为服饰图像ref在领口样式属性上的分类标签，

adv_fake′，cls_fake′＝D′(fake)

其中，

分别表示属性编码器E_a、内容编码器E_c与解码器Dec的对抗损失函数以及属性编码器E_a、内容编码器E_c与解码器Dec的分类损失函数；

果用二元交叉熵损失函数计算，要求adv_fake′的结果接近1，使得生成的伪图像fake成功欺骗能够分辨输入服饰图像真伪的判别器D′，使其判断伪图像fake为领口样式属性数据集中的真实样本图像，来约束属性编码器E_a、内容编码器E_c与解码器Dec生成尽可能真实的服饰图像；

采用交叉熵损失函数计算，

的约束使得生成的伪图像fake在领口样式属性上的分类由原来服饰图像src的分类变为服饰图像ref的分类；

为了避免生成的伪图像fake将其他与领口样式属性不相关的属性也进行了修改，还使用了基于PyTorch的开源视觉时尚分析工具箱mmfashion获取领口样式属性数据集Data_collar中每一张服饰图像的关键点，将对应于服饰图像ref中的领口样式属性的关键点取出，使用取出的这些属性关键点，获取领口样式属性相关区域的框，利用获取的领口样式属性相关区域的框，将领口样式属性相关区域分别从伪图像fake和服饰图像src中去掉，分别获得伪图像fake和服饰图像src中与领口样式属性不相关的区域，获得与领口样式属性不相关的区域的过程用函数F_unrelate()表示，因此，属性编码器E_a、内容编码器E_c与解码器Dec的像素损失函数有如下形式：

其中，||*||₁表示L1范数，

是为了约束基于深度学习的服饰图像外观属性修改模型，防止在生成的伪图像fake中将与领口样式属性不相关的区域进行了修改；

其中，λ_adv、λ_cls和λ_pix分别代表属性编码器E_a、内容编码器E_c与解码器Dec对抗损失函数、分类损失函数和像素损失函数的权重；λ_adv、λ_cls和λ_pix均为经验参数，可根据实际情况进行调节；

采用属性编码器E_a、内容编码器E_c与解码器Dec总的损失函数

并使用Pytorch框架的自动求导与反向传播机制，更新属性编码器E_a、内容编码器E_c与解码器Dec的参数，得到在领口样式属性修改任务上更新参数后的属性编码器E_a′、内容编码器E_c′与解码器Dec′；

步骤3.4：从袖子长度属性数据集Data_sleeve中获取两张具有不同袖子长度属性分类的服饰图像src′和ref′，基于步骤3.2得到的在领口样式属性修改任务上更新参数后的判别器D′和步骤3.3得到的在领口样式属性修改任务上更新参数后的属性编码器E_a′、内容编码器E_c′与解码器Dec′，继续训练基于深度学习的服饰图像外观属性修改模型，其训练思路与步骤3.1-步骤3.3相同，最后得到在袖子长度属性修改任务上更新参数后的判别器以及在袖子长度属性修改任务上更新参数后的属性编码器、内容编码器与解码器；

步骤3.5：继续从颜色属性数据集Data_color中获取两张具有不同颜色属性分类的服饰图像src″和服饰图像ref″，基于步骤3.4得到的在袖子长度属性修改任务上更新参数后的判别器以及在袖子长度属性修改任务上更新参数后的属性编码器、内容编码器与解码器，继续训练基于深度学习的服饰图像外观属性修改模型，其训练思路与步骤3.1-步骤3.3相同，但在步骤3.3中，由于颜色属性的修改并不涉及服饰图像结构的变化，因此不再计算像素损失函数，属性编码器、内容编码器与解码器总的损失函数中不再包括像素损失函数，最后得到在颜色属性修改任务上更新参数后的判别器以及在颜色属性修改任务上更新参数后的属性编码器、内容编码器与解码器；

步骤3.6：重复步骤3.1-步骤3.5直到达到给定的循环次数，最终得到训练好的基于深度学习的服饰图像外观属性修改模型及其参数，使用Pytorch提供的torch.save()函数，将训练好的基于深度学习的服饰图像外观属性修改模型的参数持久化保存为.pth格式的文件，以便测试和展示使用。

2.根据权利要求1所述的基于深度学习的服饰图像外观属性修改方法，其特征在于，所述步骤4中使用训练好的基于深度学习的服饰图像外观属性修改模型对待测试服饰图像进行外观属性修改具体包括：