CN113157954A

CN113157954A - 一种基于跨域转换的草图交互式服装图像检索方法

Info

Publication number: CN113157954A
Application number: CN202110421671.5A
Authority: CN
Inventors: 雷浩鹏; 陈思敏; 王明文; 李思波
Original assignee: Jiangxi Normal University
Current assignee: Jiangxi Normal University
Priority date: 2021-04-20
Filing date: 2021-04-20
Publication date: 2021-07-23
Anticipated expiration: 2041-04-20
Also published as: CN113157954B

Abstract

本发明提供了一种基于跨域转换的草图交互式服装图像检索方法，通过建立服装草图和服装图像之间的跨域转换网络模型，将服装草图和服装图像转换到相同的数据领域，从而解决服装草图和服装图像之间的异域问题；通过融合服装草图域和服装图像域中两个相似度，计算出最终的混合相似度来度量服装草图和服装图像之间的相似性，以获得更为准确的服装图像检索结果返还给用户，从而实现服装草图对服装图像的跨域检索。

Description

一种基于跨域转换的草图交互式服装图像检索方法

技术领域

本申请涉及计算机图形学及多媒体信息检索技术领域，具体涉及一种基于跨域转换的草图交互式服装图像检索方法。

背景技术

在信息技术促进下，随着服装电子商务平台的发展，网上服装商品日益增多，在巨大且迫切的市场需求下，面对庞大的服装数据库，如何帮助消费者在大规模的服装图像数据库中快速且准确的检索到其感兴趣的服装仍是一个长期而未解决的问题。解决用户对购物网站的服装图像检索问题，主流的服装图像检索系统仍局限于以文本或示例图像作为检索输入。

基于文本的图像检索技术（TBIR）是根据图像标注的关键字进行匹配检索，这种检索方式的特点是检索方式简单方便，检索过程比较快。但是这种基于文本的检索方式需要对图像进行大量的人工标注，并且人工对图像进行文本标注具有很强的主观性，所以关键字并不能详尽的描述出用户的检索意图，这就对用户的检索产生了局限性。

基于内容的图像检索技术（CBIR）需要用户提供一个与检索目标相类似的示例图像作为查询输入，度量示例图像与数据库中的检索对象之间的相似性，返回与查询输入相似度最大的图像作为检索结果给用户。但在实际的检索过程中，比如在线网购，用户拍到的示例图像常常会有以下问题：较差的光线、凌乱的场景、人物姿势变化以及拍摄角度不同等等，用户并不能随时随地拍到自己需要的理想示例图像，使得要求用户手上正好有理想的示例图像作为查询输入比较困难。

随着智能手机、平板电脑等触屏设备的普及，改变了人机交互的方式。人们可以简便的将自己脑海中想象的服装样式在触摸屏上手绘出来，形成服装草图，然后进一步的利用服装草图在大规模的服装图像库中找到与之形状相似的服装图像，完成服装图像检索任务。相较于以上两种检索技术，使用基于草图的服装检索可以同时解决以上问题。

但是使用草图作为服装图像检索的输入面临两个挑战。首先，收集基于草图的服装图像数据库非常困难，因此，没有可供研究人员开发先进的解决方案的大规模数据集。其次，服装草图和服装图像属于两个不同的图像领域，草图通常由白色背景上的黑线条组成，与图像相比，它们看起来更抽象，并且缺少诸如服装图像的纹理、材质和颜色之类的信息，这增加了对服装图像进行细粒度检索的难度。

发明内容

本发明的目的在于，提供一种基于跨域转换的草图交互式服装图像检索方法，建立服装草图和服装图像之间的跨域转换网络模型，将服装草图和服装图像转换到相同的数据领域，解决服装草图和服装图像之间的异域问题；融合服装草图域和服装图像域中两个相似度，计算出最终的混合相似度来度量服装草图和服装图像之间的相似性，获得更为准确的服装图像检索结果返还给用户，实现服装草图对服装图像的跨域检索。

本发明采取的技术方案是：一种基于跨域转换的草图交互式服装图像检索方法，包括如下步骤：

步骤S000：以服装草图域S和服装图像域P为数据集，建立并训练服装草图和服装图像之间的跨域转换网络模型，所述跨域转换网络模型包括服装跨域转换模块、服装跨域特征提取模块和服装跨域特征相似性度量模块；

步骤S100：输入服装查询草图

；

步骤S200：通过所述服装跨域转换模块将所述服装查询草图

转换为服装草图转换图像

，使用服装草图转换图像

与服装图像域P中的服装图像

进行相似度计算，其中

，N为服装图像域P中服装图像的总数；通过所述服装跨域特征提取模块分别提取服装草图转换图像

和服装图像域P中的服装图像

的深度特征，计算出服装草图转换图像

与服装图像域P中服装图像

之间的特征相似度

；

步骤S300：通过所述服装跨域转换模块将服装图像域P内的所有服装图像

映射到服装草图域S中，得到服装图像转换草图

，其中

，N为服装图像域P中服装图像的总数；通过所述服装跨域特征提取模块分别提取服装查询草图

和服装图像转换草图

的深度特征，计算服装查询草图

与服装图像转换草图

之间的特征相似度

；

步骤400：通过所述服装跨域特征相似性度量模块对特征相似度

和特征相似度

进行加权融合，得到混合相似度

；根据所述混合相似度

进行排序，服装查询草图

与服装图像域P中服装图像

之间的相似度索引表，根据索引表返回与服装查询草图

最为相似的服装图像给用户。

进一步地，所述服装跨域转换模块包括服装草图跨域转换模块

和服装图像跨域转换模块

；所述服装草图跨域转换模块

包括服装草图编码器

、服装草图生成器

、服装草图判别器

、服装图像生成器

和服装图像判别器

；所述服装图像跨域转换模块

包括服装图像编码器

、服装草图生成器

、服装草图判别器

、服装图像生成器

和服装图像判别器

。

进一步地，训练所述服装草图跨域转换模块

的具体方法为：从服装草图域S和服装图像域P中给定服装草图和服装图像训练样本对

，将服装草图训练样本

输入到服装草图跨域转换模块

中；服装草图编码器

将输入的服装草图训练样本

转换成一个潜在编码

，其中

表示服装草图训练样本

转换为潜在编码

的概率分布；服装草图生成器

将潜在编码

进行解码以重构输入的服装草图训练样本

，重构的服装草图表示为

，其中

表示潜在编码

利用服装草图生成器

重构的服装草图

的概率分布；在编码和解码过程中将重构的服装草图

和服装草图训练样本

输入到服装草图判别器

中，判别一张输入的服装草图是重构的服装草图

还是原始输入的服装草图训练样本

，服装草图生成器

与服装草图判别器

组成第一生成对抗网络

；将服装草图训练样本

的潜在编码

输入到服装图像生成器

中生成服装草图转换图像

，并将生成的服装草图转换图像

以及真实的服装图像训练样本

输入到服装图像判别器

中，判别一张输入的服装图像是真实的服装图像训练样本

还是服装草图训练样本

转换后生成的服装草图转换图像

，服装图像生成器

和服装图像判别器

组成第二生成对抗网络

。

进一步地，训练所述服装图像跨域转换模块

，将服装图像训练样本

输入到服装图像跨域转换模块

中；服装图像编码器

将输入的服装图像训练样本

转换成一个潜在编码

，其中

表示服装图像训练样本

转换为潜在编码

的概率分布；服装图像生成器

潜在编码

进行解码以重构输入的服装图像训练样本

，重构的服装图像表示为

，其中

表示输入潜在编码

利用服装图像生成器

重构的服装图像

的概率分布；在编码和解码过程中将重构的服装图像

和服装图像训练样本

输入到服装草图判别器

中，判别一张输入的服装图像是重构的服装图像

还是原始输入的服装图像训练样本

，服装图像生成器

与服装图像判别器

组成第三生成对抗网络

；将服装图像训练样本

的潜在编码

输入到服装草图生成器

中来生成服装图像转换草图

，将生成的服装图像转换草图

以及真实的服装草图训练样本

输入到服装草图判别器

中，判别一张输入的服装草图是真实的服装草图训练样本

还是服装图像训练样本

转换后生成的服装图像转换草图

，服装草图生成器

和服装草图判别器

组成第四生成对抗网络

。

进一步地，所述特征相似度

的表达式为：

其中，

为服装查询草图

转换生成的服装草图转换图像

的特征向量，

为服装图像域P中服装图像

的特征向量，d为特征向量的维度；

所述特征相似度

的表达式为：

其中，

为服装查询草图

的特征向量，

为服装图像域P中服装图像

转换生成的服装图像转换草图

的特征向量，d为特征向量的维度。

进一步地，所述混合相似度

具体表达式如下：

其中，

和

分别为特征相似度

和特征相似度

的权值，且

。

本发明的有益效果在于：通过建立服装查询草图与服装图像数据集的关联性，实现两种不同领域下的服装图像检索过程，将服装草图和服装图像转换到相同的数据领域，从而解决了服装草图和服装图像之间的异域问题；融合服装草图域和服装图像域中的两个相似度，并利用融合后的混合相似度来进行相似性度量，实现服装草图对服装图像的跨域检索；根据混合相似度进行排序，获取服装查询草图与服装图像之间的相似度索引表，并根据索引表能够准确地返回与服装查询草图最为相似的服装图像给用户；检索准确率高，可以实现大规模服装图像数据情况下特定服装的准确检索；提高服装草图和服装图像跨域转换的鲁棒性和稳定性，保证服装草图或服装图像经过跨域转换后，生成的服装图像或服装草图还能够再次转换回原来的服装草图或服装图像，并且转换后不会丢失原来的特征。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本发明实施例的流程图。

图2为本发明实施例的跨域转换网络模型架构图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明并不限于下面公开的具体实施例的限制。

除非另作定义，此处使用的技术术语或者科学术语应当为本申请所述领域内具有一般技能的人士所理解的通常意义。本专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。同样， “一个”或者“一”等类似词语也不表示数量限制，而是表示存在至少一个。 “连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。 “上”、 “下”、 “左”、 “右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也相应地改变。

如图1~图2所示，一种基于跨域转换的草图交互式服装图像检索方法，包括如下步骤：

步骤S100：输入服装查询草图

；

步骤S200：通过所述服装跨域转换模块将所述服装查询草图

转换为服装草图转换图像

，使用服装草图转换图像

与服装图像域P中的服装图像

进行相似度计算，其中

和服装图像域P中的服装图像

的深度特征，计算出服装草图转换图像

与服装图像域P中服装图像

之间的特征相似度

；

映射到服装草图域S中，得到服装图像转换草图

，其中

和服装图像转换草图

的深度特征，计算服装查询草图

与服装图像转换草图

之间的特征相似度

；

和特征相似度

进行加权融合，得到混合相似度

；根据所述混合相似度

进行排序，服装查询草图

与服装图像域P中服装图像

之间的相似度索引表，根据索引表返回与服装查询草图

最为相似的服装图像给用户。

在本发明实施例中，所述服装跨域转换模块包括服装草图跨域转换模块

和服装图像跨域转换模块

；所述服装草图跨域转换模块

包括服装草图编码器

、服装草图生成器

、服装草图判别器

、服装图像生成器

和服装图像判别器

；所述服装图像跨域转换模块

包括服装图像编码器

、服装草图生成器

、服装草图判别器

、服装图像生成器

和服装图像判别器

。

如图2中虚线所示，训练所述服装草图跨域转换模块

，将服装草图训练样本

输入到服装草图跨域转换模块

中；服装草图编码器

将输入的服装草图训练样本

转换成一个潜在编码

，其中

表示服装草图训练样本

转换为潜在编码

的概率分布；服装草图生成器

将潜在编码

进行解码以重构输入的服装草图训练样本

，重构的服装草图表示为

，其中

表示潜在编码

利用服装草图生成器

重构的服装草图

的概率分布；本发明实施例利用变分自编码器(VariationalAuto-Encoder, VAE)来构造服装草图的编码和解码过程，潜在编码

的先验概率

可选择为服从零均值高斯分布模型

，则服装草图训练样本

整个编、解码过程的目标函数

为：

(1)

其中，

表示

与

的KL散度距离，

为服装草图生成器

将潜在编码

进行解码以重构输入的服装草图训练样本

的数学期望；

为编码项，其作用为尽可能地拉近概率分布

与

的距离，在最优化目标函数

时，

与

都可视为服从高斯分布模型，

为解码项，其作用为尽可能地减小重构的服装草图

与实际输入的服装草图训练样本

之间的误差。

在编码和解码过程中，为了保证重构的服装草图

尽可能地还原初始输入的服装草图训练样本

，将重构的服装草图

和服装草图训练样本

输入到服装草图判别器

中，判别一张输入的服装草图是重构的服装草图

还是原始输入的服装草图训练样本

，服装草图生成器

与服装草图判别器

组成第一生成对抗网络

，所述第一生成对抗网络

的目标函数

为：

（2）

其中，

为服装草图判别器

判别原始输入的服装草图训练样本

为真的数学期望，

为服装草图判别器

判别利用服装草图生成器

生成的重构的服装草图

为假的数学期望，

表示服装草图域S中所有服装草图的概率分布。在训练时，服装草图生成器

会最小化目标函数

从而生成与原服装草图训练样本

尽可能相似的重构的服装草图

，服装草图判别器

会最大化目标函数

，从而尽可能地扩大服装草图训练样本

与重构的服装草图

的相似距离。

为了实现服装草图的跨域转换，本发明实施例将服装草图训练样本

的潜在编码

输入到服装图像生成器

中生成服装草图转换图像

，并将生成的服装草图转换图像

以及真实的服装图像训练样本

输入到服装图像判别器

中，判别一张输入的服装图像是真实的服装图像训练样本

还是服装草图训练样本

转换后生成的服装草图转换图像

，服装图像生成器

和服装图像判别器

组成第二生成对抗网络

，所述第二生成对抗网络

的目标函数

为：

（3）

其中，

为服装图像判别器

判别服装图像训练样本

为真的数学期望，

为服装图像判别器

判别利用服装图像生成器

生成的服装草图转换图像

为假的数学期望，

表示服装图像域P中的服装图像的概率分布。在训练时，服装图像生成器

会最小化目标函数

从而生成与原服装图像训练样本

尽可能相似的服装草图转换图像

，服装图像判别器

会最大化目标函数

，从而尽可能地扩大服装图像训练样本

与服装草图转换图像

的相似距离。

与服装草图跨域转换模块

的方法类似，如图2中实线所示，训练所述服装图像跨域转换模块

，将服装图像训练样本

输入到服装图像跨域转换模块

中；服装图像编码器

将输入的服装图像训练样本

转换成一个潜在编码

，其中

表示服装图像训练样本

转换为潜在编码

的概率分布；服装图像生成器

潜在编码

进行解码以重构输入的服装图像训练样本

，重构的服装图像表示为

，其中

表示输入潜在编码

利用服装图像生成器

重构的服装图像

的概率分布；本发明实施例利用变分自编码器(Variational Auto-Encoder, VAE)来构造服装图像的编码和解码过程，潜在编码

的先验概率

服从零均值高斯分布模型

，则服装图像整个编、解码过程的目标函数

为：

（4）

其中，

表示

与

的KL散度距离，

为服装图像生成器

将潜在编码

进行解码以重构输入的服装图像训练样本

的数学期望；

为编码项，其作用为尽可能地拉近概率分布

与

的距离，在最优化目标函数

时，

与

都可视为服从高斯分布模型。

为解码项，其作用为尽可能地减小重构的服装图像

与实际输入的服装图像训练样

之间的误差。

在编码和解码过程中，为了保证重构的服装图像

尽可能地还原初始输入的服装图像训练样

，将重构的服装图像

和服装图像训练样本

输入到服装草图判别器

中，判别一张输入的服装图像是重构的服装图像

还是原始输入的服装图像训练样本

，服装图像生成器

与服装图像判别器

组成第三生成对抗网络

，所述第三生成对抗网络

的目标函数

为：

（5）

其中，

为服装图像判别器

判别服装图像训练样本

为真的数学期望，

为服装图像判别器

判别利用服装图像生成器

生成的重构的服装草图

为假的数学期望；在训练时，服装图像生成器

会最小化目标函数

生成与原服装图像训练样本

尽可能相似的重构的服装图像

，而服装图像判别器

则会最大化目标函数

，来尽可能地扩大服装图像训练样本

与重构的服装图像

的相似距离。

为了实现服装图像的跨域转换，将服装图像训练样本

的潜在编码

输入到服装草图生成器

中来生成服装图像转换草图

，将生成的服装图像转换草图

以及真实的服装草图训练样本

输入到服装草图判别器

中，判别一张输入的服装草图是真实的服装草图训练样本

还是服装图像训练样本

转换后生成的服装图像转换草图

，服装草图生成器

和服装草图判别器

组成第四生成对抗网络

，所述第四生成对抗网络

的目标函数

为：

（6）

其中，

为服装草图判别器

判别服装草图训练样本

为真的数学期望，

为服装草图判别器

判别利用服装草图生成器

生成的服装图像转换草像

为假的数学期望，在训练时，服装草图生成器

会最小化目标函数

从而生成与原服装草图训练样本

尽可能相似的服装图像转换草图

，服装草图判别器

会最大化目标函数

，从而尽可能地扩大服装草图训练样本

与服装图像转换草图

的相似距离。

为了提高服装草图跨域转换模块

和服装图像跨域转换模块

的鲁棒性和稳定性，本发明实施例引入了服装草图的循环转换一致性约束条件和服装图像的循环转换一致性约束条件。所述服装草图的循环转换过程为：将服装草图训练样本

转换生成的服装草图转换图像

输入到服装图像编码器

中进行编码，然后在将编码输入到服装草图生成器

中进行解码，以重构出初始输入的服装草图训练样本

，保证服装草图训练样本

在经过跨域转换后，生成的服装草图转换图像

还能够再次转换回原来的服装草图训练样本

，并且转换后不会丢失原来的草图特征。整个编解码过程同样利用变分自编码器来进行构造，所述服装草图的循环转换一致性约束条件的目标函数

为：

（7）

其中，

为表示

与

的KL散度距离，

为服装草图生成器

将潜在编码

进行解码以重构输入的服装草图训练样本

的数学期望；

为编码项，其作用为将转换生成的服装草图转换图像

编码成

，

为解码项，其作用为根据输入的潜在编码

重构出初始的服装草图训练样本

。

所述服装图像的循环转换过程为：将服装图像训练样本

转换生成的服装图像转换草图

输入到服装草图编码器

中进行编码，然后在将编码输入到服装图像生成器

中进行解码，以重构出初始输入的服装图像训练样本

，保证服装图像训练样本

在经过跨域转换后，生成的服装图像转换草图

也能够再次转换回原来的服装图像训练样本

，并且转换后不会丢失原来的图像特征。整个编解码过程同样利用变分自编码器来进行构造，所述服装图像的循环转换一致性约束条件的目标函数

为：

（8）

其中，

为表示

与

的KL散度距离，

为服装图像生成器

将潜在编码

进行解码以重构输入的服装图像训练样本

的数学期望；

为编码项，其作用为将转换生成的服装图像转换草图

编码成

，

为解码项，其作用为根据输入的潜在编码

重构出初始的服装图像训练样本

。

综上所述，结合公式（1）、（2）、（3）、（7），所述服装草图跨域转换模块

的目标函数

为：

结合公式（4）、（5）、（6）、（8），所述服装图像跨域转换模块

的目标函数

为：

在训练过程中，本发明实施例利用Adam优化器交替优化目标函数

和目标函数

。优化结束后，则可完成服装跨域转换模块的训练过程。

当用户输入服装查询草图

后，通过所述服装跨域转换模块将所述服装查询草图

转换为服装草图转换图像

，使用服装草图转换图像

与服装图像域P中的服装图像

进行相似度计算。本发明实施例利用一组对称的VGG16卷积神经网络作为服装跨域特征提取模块的骨干网络，通过所述服装跨域特征提取模块分别提取服装草图转换图像

和服装图像域P中的服装图像

的深度特征，得到服装草图转换图像

的特征向量和服装图像域P中的服装图像

的特征向量，使用余弦相似度来计算两个特征向量之间的特征相似度

，所述特征相似度

的表达式为：

其中，

为服装查询草图

转换生成的服装草图转换图像

的特征向量，

为服装图像域P中服装图像

的特征向量，d为特征向量的维度。

通过所述服装跨域转换模块将服装图像域P内的所有服装图像

映射到服装草图域S中，得到服装图像转换草图

。通过所述服装跨域特征提取模块分别提取服装查询草图

和服装图像转换草图

的深度特征，得到了服装查询草图

的特征向量和服装图像转换草图

，所述特征相似度

的表达式为：

其中，

为服装查询草图

的特征向量，

为服装图像域P中服装图像

转换生成的服装图像转换草图

的特征向量，d为特征向量的维度。

通过所述服装跨域特征相似性度量模块对特征相似度

和特征相似度

进行加权融合，得到混合相似度

，所述混合相似度

具体表达式如下：

其中，

和

分别为特征相似度

和特征相似度

的权值，且

。

在本发明实施例中，经过实验验证，当

= 0.38，

= 0.62时，可取到最佳的服装图像检索精度。根据所述混合相似度

进行排序，获取服装查询草图

与服装图像域P中服装图像

之间的相似度索引表，根据索引表返回与服装查询草图

最为相似的服装图像给用户。

本发明实施例采用服装草图作为检索输入，相较于以文本或示例图像作为检索输入，服装草图包含了关键字描述方式所不能及的丰富信息，具有很强的解释性，更容易表达出服装款式特征且没有任何歧义，并且比服装示例图像更易获得。通过建立服装查询草图与服装图像数据集的关联性，实现这两种不同领域下的服装图像检索过程，将服装草图和服装图像转换到相同的数据领域，从而解决了服装草图和服装图像之间的异域问题；融合服装草图域和服装图像域中的两个相似度，并利用融合后的混合相似度来进行相似性度量，实现服装草图对服装图像的跨域检索；根据混合相似度进行排序，获取服装查询草图与服装图像之间的相似度索引表，并根据索引表能够准确地返回与服装查询草图最为相似的服装图像给用户；检索准确率高，可以实现大规模服装图像数据情况下特定服装的准确检索；提高服装草图和服装图像跨域转换的鲁棒性和稳定性，保证服装草图或服装图像经过跨域转换后，生成的服装图像或服装草图还能够再次转换回原来的服装草图或服装图像，并且转换后不会丢失原来的特征。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。