CN113157954A - 一种基于跨域转换的草图交互式服装图像检索方法 - Google Patents
一种基于跨域转换的草图交互式服装图像检索方法 Download PDFInfo
- Publication number
- CN113157954A CN113157954A CN202110421671.5A CN202110421671A CN113157954A CN 113157954 A CN113157954 A CN 113157954A CN 202110421671 A CN202110421671 A CN 202110421671A CN 113157954 A CN113157954 A CN 113157954A
- Authority
- CN
- China
- Prior art keywords
- clothing
- sketch
- image
- garment
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 163
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 8
- 238000012549 training Methods 0.000 claims description 106
- 239000013598 vector Substances 0.000 claims description 22
- 239000000126 substance Substances 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 12
- 238000005259 measurement Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 13
- 125000004122 cyclic group Chemical group 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000036544 posture Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于跨域转换的草图交互式服装图像检索方法,通过建立服装草图和服装图像之间的跨域转换网络模型,将服装草图和服装图像转换到相同的数据领域,从而解决服装草图和服装图像之间的异域问题;通过融合服装草图域和服装图像域中两个相似度,计算出最终的混合相似度来度量服装草图和服装图像之间的相似性,以获得更为准确的服装图像检索结果返还给用户,从而实现服装草图对服装图像的跨域检索。
Description
技术领域
本申请涉及计算机图形学及多媒体信息检索技术领域,具体涉及一种基于跨域转换的草图交互式服装图像检索方法。
背景技术
在信息技术促进下,随着服装电子商务平台的发展,网上服装商品日益增多,在巨大且迫切的市场需求下,面对庞大的服装数据库,如何帮助消费者在大规模的服装图像数据库中快速且准确的检索到其感兴趣的服装仍是一个长期而未解决的问题。解决用户对购物网站的服装图像检索问题,主流的服装图像检索系统仍局限于以文本或示例图像作为检索输入。
基于文本的图像检索技术(TBIR)是根据图像标注的关键字进行匹配检索,这种检索方式的特点是检索方式简单方便,检索过程比较快。但是这种基于文本的检索方式需要对图像进行大量的人工标注,并且人工对图像进行文本标注具有很强的主观性,所以关键字并不能详尽的描述出用户的检索意图,这就对用户的检索产生了局限性。
基于内容的图像检索技术(CBIR)需要用户提供一个与检索目标相类似的示例图像作为查询输入,度量示例图像与数据库中的检索对象之间的相似性,返回与查询输入相似度最大的图像作为检索结果给用户。但在实际的检索过程中,比如在线网购,用户拍到的示例图像常常会有以下问题:较差的光线、凌乱的场景、人物姿势变化以及拍摄角度不同等等,用户并不能随时随地拍到自己需要的理想示例图像,使得要求用户手上正好有理想的示例图像作为查询输入比较困难。
随着智能手机、平板电脑等触屏设备的普及,改变了人机交互的方式。人们可以简便的将自己脑海中想象的服装样式在触摸屏上手绘出来,形成服装草图,然后进一步的利用服装草图在大规模的服装图像库中找到与之形状相似的服装图像,完成服装图像检索任务。相较于以上两种检索技术,使用基于草图的服装检索可以同时解决以上问题。
但是使用草图作为服装图像检索的输入面临两个挑战。首先,收集基于草图的服装图像数据库非常困难,因此,没有可供研究人员开发先进的解决方案的大规模数据集。其次,服装草图和服装图像属于两个不同的图像领域,草图通常由白色背景上的黑线条组成,与图像相比,它们看起来更抽象,并且缺少诸如服装图像的纹理、材质和颜色之类的信息,这增加了对服装图像进行细粒度检索的难度。
发明内容
本发明的目的在于,提供一种基于跨域转换的草图交互式服装图像检索方法, 建立服装草图和服装图像之间的跨域转换网络模型,将服装草图和服装图像转换到相同的数据领域,解决服装草图和服装图像之间的异域问题;融合服装草图域和服装图像域中两个相似度,计算出最终的混合相似度来度量服装草图和服装图像之间的相似性,获得更为准确的服装图像检索结果返还给用户,实现服装草图对服装图像的跨域检索。
本发明采取的技术方案是:一种基于跨域转换的草图交互式服装图像检索方法,包括如下步骤:
步骤S000:以服装草图域S和服装图像域P为数据集,建立并训练服装草图和服装图像之间的跨域转换网络模型,所述跨域转换网络模型包括服装跨域转换模块、服装跨域特征提取模块和服装跨域特征相似性度量模块;
步骤S200:通过所述服装跨域转换模块将所述服装查询草图转换为服装草图转换图像,使用服装草图转换图像与服装图像域P中的服装图像进行相似度计算,其中,N为服装图像域P中服装图像的总数;通过所述服装跨域特征提取模块分别提取服装草图转换图像和服装图像域P中的服装图像的深度特征,计算出服装草图转换图像与服装图像域P中服装图像之间的特征相似度;
步骤S300:通过所述服装跨域转换模块将服装图像域P内的所有服装图像映射到服装草图域S中,得到服装图像转换草图,其中,N为服装图像域P中服装图像的总数;通过所述服装跨域特征提取模块分别提取服装查询草图和服装图像转换草图的深度特征,计算服装查询草图与服装图像转换草图之间的特征相似度;
步骤400:通过所述服装跨域特征相似性度量模块对特征相似度和特征相似度进行加权融合,得到混合相似度;根据所述混合相似度进行排序,服装查询草图与服装图像域P中服装图像之间的相似度索引表,根据索引表返回与服装查询草图最为相似的服装图像给用户。
进一步地,所述服装跨域转换模块包括服装草图跨域转换模块和服装图像跨域转换模块;所述服装草图跨域转换模块包括服装草图编码器、服装草图生成器、服装草图判别器、服装图像生成器和服装图像判别器;所述服装图像跨域转换模块包括服装图像编码器、服装草图生成器、服装草图判别器、服装图像生成器和服装图像判别器。
进一步地,训练所述服装草图跨域转换模块的具体方法为:从服装草图域S和服装图像域P中给定服装草图和服装图像训练样本对,将服装草图训练样本输入到服装草图跨域转换模块中;服装草图编码器将输入的服装草图训练样本转换成一个潜在编码,其中表示服装草图训练样本转换为潜在编码的概率分布;服装草图生成器将潜在编码进行解码以重构输入的服装草图训练样本,重构的服装草图表示为,其中表示潜在编码利用服装草图生成器重构的服装草图的概率分布;在编码和解码过程中将重构的服装草图和服装草图训练样本输入到服装草图判别器中,判别一张输入的服装草图是重构的服装草图还是原始输入的服装草图训练样本,服装草图生成器与服装草图判别器组成第一生成对抗网络;将服装草图训练样本的潜在编码输入到服装图像生成器中生成服装草图转换图像,并将生成的服装草图转换图像以及真实的服装图像训练样本输入到服装图像判别器中,判别一张输入的服装图像是真实的服装图像训练样本还是服装草图训练样本转换后生成的服装草图转换图像,服装图像生成器和服装图像判别器组成第二生成对抗网络。
进一步地,训练所述服装图像跨域转换模块的具体方法为:从服装草图域S和服装图像域P中给定服装草图和服装图像训练样本对,将服装图像训练样本输入到服装图像跨域转换模块中;服装图像编码器将输入的服装图像训练样本转换成一个潜在编码 ,其中表示服装图像训练样本转换为潜在编码的概率分布;服装图像生成器潜在编码进行解码以重构输入的服装图像训练样本,重构的服装图像表示为,其中表示输入潜在编码利用服装图像生成器重构的服装图像的概率分布;在编码和解码过程中将重构的服装图像和服装图像训练样本输入到服装草图判别器中,判别一张输入的服装图像是重构的服装图像还是原始输入的服装图像训练样本,服装图像生成器与服装图像判别器组成第三生成对抗网络;将服装图像训练样本的潜在编码输入到服装草图生成器中来生成服装图像转换草图,将生成的服装图像转换草图以及真实的服装草图训练样本输入到服装草图判别器中,判别一张输入的服装草图是真实的服装草图训练样本还是服装图像训练样本转换后生成的服装图像转换草图,服装草图生成器和服装草图判别器组成第四生成对抗网络。
本发明的有益效果在于:通过建立服装查询草图与服装图像数据集的关联性,实现两种不同领域下的服装图像检索过程,将服装草图和服装图像转换到相同的数据领域,从而解决了服装草图和服装图像之间的异域问题;融合服装草图域和服装图像域中的两个相似度,并利用融合后的混合相似度来进行相似性度量,实现服装草图对服装图像的跨域检索;根据混合相似度进行排序,获取服装查询草图与服装图像之间的相似度索引表,并根据索引表能够准确地返回与服装查询草图最为相似的服装图像给用户;检索准确率高,可以实现大规模服装图像数据情况下特定服装的准确检索;提高服装草图和服装图像跨域转换的鲁棒性和稳定性,保证服装草图或服装图像经过跨域转换后,生成的服装图像或服装草图还能够再次转换回原来的服装草图或服装图像,并且转换后不会丢失原来的特征。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例的流程图。
图2为本发明实施例的跨域转换网络模型架构图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明并不限于下面公开的具体实施例的限制。
除非另作定义,此处使用的技术术语或者科学术语应当为本申请所述领域内具有一般技能的人士所理解的通常意义。本专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样, “一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。 “连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。 “上”、 “下”、 “左”、 “右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也相应地改变。
如图1~图2所示,一种基于跨域转换的草图交互式服装图像检索方法,包括如下步骤:
步骤S000:以服装草图域S和服装图像域P为数据集,建立并训练服装草图和服装图像之间的跨域转换网络模型,所述跨域转换网络模型包括服装跨域转换模块、服装跨域特征提取模块和服装跨域特征相似性度量模块;
步骤S200:通过所述服装跨域转换模块将所述服装查询草图转换为服装草图转换图像,使用服装草图转换图像与服装图像域P中的服装图像进行相似度计算,其中,N为服装图像域P中服装图像的总数;通过所述服装跨域特征提取模块分别提取服装草图转换图像和服装图像域P中的服装图像的深度特征,计算出服装草图转换图像与服装图像域P中服装图像之间的特征相似度;
步骤S300:通过所述服装跨域转换模块将服装图像域P内的所有服装图像映射到服装草图域S中,得到服装图像转换草图,其中,N为服装图像域P中服装图像的总数;通过所述服装跨域特征提取模块分别提取服装查询草图和服装图像转换草图的深度特征,计算服装查询草图与服装图像转换草图之间的特征相似度;
步骤400:通过所述服装跨域特征相似性度量模块对特征相似度和特征相似度进行加权融合,得到混合相似度;根据所述混合相似度进行排序,服装查询草图与服装图像域P中服装图像之间的相似度索引表,根据索引表返回与服装查询草图最为相似的服装图像给用户。
在本发明实施例中,所述服装跨域转换模块包括服装草图跨域转换模块和服装图像跨域转换模块;所述服装草图跨域转换模块包括服装草图编码器、服装草图生成器、服装草图判别器、服装图像生成器和服装图像判别器;所述服装图像跨域转换模块包括服装图像编码器、服装草图生成器、服装草图判别器、服装图像生成器和服装图像判别器。
如图2中虚线所示,训练所述服装草图跨域转换模块的具体方法为:从服装草图域S和服装图像域P中给定服装草图和服装图像训练样本对,将服装草图训练样本输入到服装草图跨域转换模块中;服装草图编码器将输入的服装草图训练样本转换成一个潜在编码,其中表示服装草图训练样本转换为潜在编码的概率分布;服装草图生成器将潜在编码进行解码以重构输入的服装草图训练样本,重构的服装草图表示为,其中表示潜在编码利用服装草图生成器重构的服装草图的概率分布;本发明实施例利用变分自编码器(VariationalAuto-Encoder, VAE)来构造服装草图的编码和解码过程,潜在编码的先验概率可选择为服从零均值高斯分布模型,则服装草图训练样本整个编、解码过程的目标函数为:
其中,表示与的KL散度距离,为服装草图生成器将潜在编码进行解码以重构输入的服装草图训练样本的数学期望;为编码项,其作用为尽可能地拉近概率分布与的距离,在最优化目标函数时,与都可视为服从高斯分布模型,为解码项,其作用为尽可能地减小重构的服装草图与实际输入的服装草图训练样本之间的误差。
在编码和解码过程中,为了保证重构的服装草图尽可能地还原初始输入的服装草图训练样本,将重构的服装草图和服装草图训练样本输入到服装草图判别器中,判别一张输入的服装草图是重构的服装草图还是原始输入的服装草图训练样本,服装草图生成器与服装草图判别器组成第一生成对抗网络,所述第一生成对抗网络的目标函数为:
其中,为服装草图判别器判别原始输入的服装草图训练样本为真的数学期望,为服装草图判别器判别利用服装草图生成器生成的重构的服装草图为假的数学期望,表示服装草图域S中所有服装草图的概率分布。在训练时,服装草图生成器会最小化目标函数从而生成与原服装草图训练样本尽可能相似的重构的服装草图,服装草图判别器会最大化目标函数,从而尽可能地扩大服装草图训练样本与重构的服装草图的相似距离。
为了实现服装草图的跨域转换,本发明实施例将服装草图训练样本的潜在编码输入到服装图像生成器中生成服装草图转换图像,并将生成的服装草图转换图像以及真实的服装图像训练样本输入到服装图像判别器中,判别一张输入的服装图像是真实的服装图像训练样本还是服装草图训练样本转换后生成的服装草图转换图像,服装图像生成器和服装图像判别器组成第二生成对抗网络,所述第二生成对抗网络的目标函数为:
其中,为服装图像判别器判别服装图像训练样本为真的数学期望,为服装图像判别器判别利用服装图像生成器生成的服装草图转换图像为假的数学期望,表示服装图像域P中的服装图像的概率分布。在训练时,服装图像生成器会最小化目标函数从而生成与原服装图像训练样本尽可能相似的服装草图转换图像,服装图像判别器会最大化目标函数,从而尽可能地扩大服装图像训练样本与服装草图转换图像的相似距离。
与服装草图跨域转换模块的方法类似,如图2中实线所示,训练所述服装图像跨域转换模块的具体方法为:从服装草图域S和服装图像域P中给定服装草图和服装图像训练样本对,将服装图像训练样本输入到服装图像跨域转换模块中;服装图像编码器将输入的服装图像训练样本转换成一个潜在编码,其中表示服装图像训练样本转换为潜在编码的概率分布;服装图像生成器潜在编码进行解码以重构输入的服装图像训练样本,重构的服装图像表示为,其中表示输入潜在编码利用服装图像生成器重构的服装图像的概率分布;本发明实施例利用变分自编码器(Variational Auto-Encoder, VAE)来构造服装图像的编码和解码过程,潜在编码的先验概率服从零均值高斯分布模型,则服装图像整个编、解码过程的目标函数为:
其中,表示与的KL散度距离,为服装图像生成器将潜在编码进行解码以重构输入的服装图像训练样本的数学期望;为编码项,其作用为尽可能地拉近概率分布与的距离,在最优化目标函数时,与都可视为服从高斯分布模型。为解码项,其作用为尽可能地减小重构的服装图像与实际输入的服装图像训练样之间的误差。
在编码和解码过程中,为了保证重构的服装图像尽可能地还原初始输入的服装图像训练样,将重构的服装图像和服装图像训练样本输入到服装草图判别器中,判别一张输入的服装图像是重构的服装图像还是原始输入的服装图像训练样本,服装图像生成器与服装图像判别器组成第三生成对抗网络,所述第三生成对抗网络的目标函数为:
其中,为服装图像判别器判别服装图像训练样本为真的数学期望,为服装图像判别器判别利用服装图像生成器生成的重构的服装草图为假的数学期望;在训练时,服装图像生成器会最小化目标函数生成与原服装图像训练样本尽可能相似的重构的服装图像,而服装图像判别器则会最大化目标函数,来尽可能地扩大服装图像训练样本与重构的服装图像的相似距离。
为了实现服装图像的跨域转换,将服装图像训练样本的潜在编码输入到服装草图生成器中来生成服装图像转换草图,将生成的服装图像转换草图以及真实的服装草图训练样本输入到服装草图判别器中,判别一张输入的服装草图是真实的服装草图训练样本还是服装图像训练样本转换后生成的服装图像转换草图,服装草图生成器和服装草图判别器组成第四生成对抗网络,所述第四生成对抗网络的目标函数为:
其中,为服装草图判别器判别服装草图训练样本为真的数学期望,为服装草图判别器判别利用服装草图生成器生成的服装图像转换草像为假的数学期望,在训练时,服装草图生成器会最小化目标函数从而生成与原服装草图训练样本尽可能相似的服装图像转换草图,服装草图判别器会最大化目标函数,从而尽可能地扩大服装草图训练样本与服装图像转换草图的相似距离。
为了提高服装草图跨域转换模块和服装图像跨域转换模块的鲁棒性和稳定性,本发明实施例引入了服装草图的循环转换一致性约束条件和服装图像的循环转换一致性约束条件。所述服装草图的循环转换过程为:将服装草图训练样本转换生成的服装草图转换图像输入到服装图像编码器中进行编码,然后在将编码输入到服装草图生成器中进行解码,以重构出初始输入的服装草图训练样本,保证服装草图训练样本在经过跨域转换后,生成的服装草图转换图像还能够再次转换回原来的服装草图训练样本,并且转换后不会丢失原来的草图特征。整个编解码过程同样利用变分自编码器来进行构造,所述服装草图的循环转换一致性约束条件的目标函数为:
其中,为表示与的KL散度距离,为服装草图生成器将潜在编码进行解码以重构输入的服装草图训练样本的数学期望;为编码项,其作用为将转换生成的服装草图转换图像编码成,为解码项,其作用为根据输入的潜在编码重构出初始的服装草图训练样本。
所述服装图像的循环转换过程为:将服装图像训练样本转换生成的服装图像转换草图输入到服装草图编码器中进行编码,然后在将编码输入到服装图像生成器中进行解码,以重构出初始输入的服装图像训练样本,保证服装图像训练样本在经过跨域转换后,生成的服装图像转换草图也能够再次转换回原来的服装图像训练样本,并且转换后不会丢失原来的图像特征。整个编解码过程同样利用变分自编码器来进行构造,所述服装图像的循环转换一致性约束条件的目标函数为:
其中,为表示与的KL散度距离,为服装图像生成器将潜在编码进行解码以重构输入的服装图像训练样本的数学期望;为编码项,其作用为将转换生成的服装图像转换草图编码成,为解码项,其作用为根据输入的潜在编码重构出初始的服装图像训练样本。
当用户输入服装查询草图后,通过所述服装跨域转换模块将所述服装查询草图转换为服装草图转换图像,使用服装草图转换图像与服装图像域P中的服装图像进行相似度计算。本发明实施例利用一组对称的VGG16卷积神经网络作为服装跨域特征提取模块的骨干网络,通过所述服装跨域特征提取模块分别提取服装草图转换图像和服装图像域P中的服装图像的深度特征,得到服装草图转换图像的特征向量和服装图像域P中的服装图像的特征向量,使用余弦相似度来计算两个特征向量之间的特征相似度,所述特征相似度的表达式为:
通过所述服装跨域转换模块将服装图像域P内的所有服装图像映射到服装草图域S中,得到服装图像转换草图。通过所述服装跨域特征提取模块分别提取服装查询草图和服装图像转换草图的深度特征,得到了服装查询草图的特征向量和服装图像转换草图的特征向量,使用余弦相似度来计算两个特征向量之间的特征相似度,所述特征相似度的表达式为:
在本发明实施例中,经过实验验证,当= 0.38,= 0.62时,可取到最佳的服装图像检索精度。根据所述混合相似度进行排序,获取服装查询草图与服装图像域P中服装图像之间的相似度索引表,根据索引表返回与服装查询草图最为相似的服装图像给用户。
本发明实施例采用服装草图作为检索输入,相较于以文本或示例图像作为检索输入,服装草图包含了关键字描述方式所不能及的丰富信息,具有很强的解释性,更容易表达出服装款式特征且没有任何歧义,并且比服装示例图像更易获得。通过建立服装查询草图与服装图像数据集的关联性,实现这两种不同领域下的服装图像检索过程,将服装草图和服装图像转换到相同的数据领域,从而解决了服装草图和服装图像之间的异域问题;融合服装草图域和服装图像域中的两个相似度,并利用融合后的混合相似度来进行相似性度量,实现服装草图对服装图像的跨域检索;根据混合相似度进行排序,获取服装查询草图与服装图像之间的相似度索引表,并根据索引表能够准确地返回与服装查询草图最为相似的服装图像给用户;检索准确率高,可以实现大规模服装图像数据情况下特定服装的准确检索;提高服装草图和服装图像跨域转换的鲁棒性和稳定性,保证服装草图或服装图像经过跨域转换后,生成的服装图像或服装草图还能够再次转换回原来的服装草图或服装图像,并且转换后不会丢失原来的特征。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于跨域转换的草图交互式服装图像检索方法,其特征在于,包括如下步骤:
步骤S000:以服装草图域S和服装图像域P为数据集,建立并训练服装草图和服装图像之间的跨域转换网络模型,所述跨域转换网络模型包括服装跨域转换模块、服装跨域特征提取模块和服装跨域特征相似性度量模块;
步骤S200:通过所述服装跨域转换模块将所述服装查询草图转换为服装草图转换图像,使用服装草图转换图像与服装图像域P中的服装图像进行相似度计算,其中,N为服装图像域P中服装图像的总数;通过所述服装跨域特征提取模块分别提取服装草图转换图像和服装图像域P中的服装图像的深度特征,计算出服装草图转换图像与服装图像域P中服装图像之间的特征相似度;
步骤S300:通过所述服装跨域转换模块将服装图像域P内的所有服装图像映射到服装草图域S中,得到服装图像转换草图,其中,N为服装图像域P中服装图像的总数;通过所述服装跨域特征提取模块分别提取服装查询草图和服装图像转换草图的深度特征,计算服装查询草图与服装图像转换草图之间的特征相似度;
3.根据权利要求2所述的一种基于跨域转换的草图交互式服装图像检索方法,其特征在于,训练所述服装草图跨域转换模块的具体方法为:从服装草图域S和服装图像域P中给定服装草图和服装图像训练样本对,将服装草图训练样本输入到服装草图跨域转换模块中;服装草图编码器将输入的服装草图训练样本转换成一个潜在编码,其中表示服装草图训练样本转换为潜在编码的概率分布;服装草图生成器将潜在编码进行解码以重构输入的服装草图训练样本,重构的服装草图表示为,其中表示潜在编码利用服装草图生成器重构的服装草图的概率分布;在编码和解码过程中将重构的服装草图和服装草图训练样本输入到服装草图判别器中,判别一张输入的服装草图是重构的服装草图还是原始输入的服装草图训练样本,服装草图生成器与服装草图判别器组成第一生成对抗网络;将服装草图训练样本的潜在编码输入到服装图像生成器中生成服装草图转换图像,并将生成的服装草图转换图像以及真实的服装图像训练样本输入到服装图像判别器中,判别一张输入的服装图像是真实的服装图像训练样本还是服装草图训练样本转换后生成的服装草图转换图像,服装图像生成器和服装图像判别器组成第二生成对抗网络。
4.根据权利要求2所述的一种基于跨域转换的草图交互式服装图像检索方法,其特征在于,训练所述服装图像跨域转换模块的具体方法为:从服装草图域S和服装图像域P中给定服装草图和服装图像训练样本对,将服装图像训练样本输入到服装图像跨域转换模块中;服装图像编码器将输入的服装图像训练样本转换成一个潜在编码 ,其中表示服装图像训练样本转换为潜在编码的概率分布;服装图像生成器潜在编码进行解码以重构输入的服装图像训练样本,重构的服装图像表示为,其中表示输入潜在编码利用服装图像生成器重构的服装图像的概率分布;在编码和解码过程中将重构的服装图像和服装图像训练样本输入到服装草图判别器中,判别一张输入的服装图像是重构的服装图像还是原始输入的服装图像训练样本,服装图像生成器与服装图像判别器组成第三生成对抗网络;将服装图像训练样本的潜在编码输入到服装草图生成器中来生成服装图像转换草图,将生成的服装图像转换草图以及真实的服装草图训练样本输入到服装草图判别器中,判别一张输入的服装草图是真实的服装草图训练样本还是服装图像训练样本转换后生成的服装图像转换草图,服装草图生成器和服装草图判别器组成第四生成对抗网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110421671.5A CN113157954B (zh) | 2021-04-20 | 2021-04-20 | 一种基于跨域转换的草图交互式服装图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110421671.5A CN113157954B (zh) | 2021-04-20 | 2021-04-20 | 一种基于跨域转换的草图交互式服装图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113157954A true CN113157954A (zh) | 2021-07-23 |
CN113157954B CN113157954B (zh) | 2022-04-26 |
Family
ID=76868971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110421671.5A Active CN113157954B (zh) | 2021-04-20 | 2021-04-20 | 一种基于跨域转换的草图交互式服装图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113157954B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114860980A (zh) * | 2022-05-26 | 2022-08-05 | 重庆邮电大学 | 一种基于草图局部特征和全局特征匹配的图像检索方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150100332A (ko) * | 2014-02-25 | 2015-09-02 | 에스케이플래닛 주식회사 | 스케치 검색 시스템, 사용자 장치, 서비스 제공 장치, 그 서비스 방법 및 컴퓨터 프로그램이 기록된 기록매체 |
CN107220277A (zh) * | 2017-04-14 | 2017-09-29 | 西北大学 | 基于手绘草图的图像检索算法 |
CN109408655A (zh) * | 2018-10-19 | 2019-03-01 | 中国石油大学(华东) | 结合带孔卷积与多尺度感知网络的手绘草图检索方法 |
CN109614508A (zh) * | 2018-12-12 | 2019-04-12 | 杭州知衣科技有限公司 | 一种基于深度学习的服装图像搜索方法 |
CN109670066A (zh) * | 2018-12-11 | 2019-04-23 | 江西师范大学 | 一种基于双路径深层语义网络的手绘式服装商品图像检索方法 |
US20200073968A1 (en) * | 2018-09-04 | 2020-03-05 | Inception Institute of Artificial Intelligence, Ltd. | Sketch-based image retrieval techniques using generative domain migration hashing |
CN111581405A (zh) * | 2020-04-26 | 2020-08-25 | 电子科技大学 | 基于对偶学习生成对抗网络的跨模态泛化零样本检索方法 |
CN111858997A (zh) * | 2020-06-23 | 2020-10-30 | 浙江蓝天制衣有限公司 | 一种基于跨领域匹配的服装样板生成方法 |
-
2021
- 2021-04-20 CN CN202110421671.5A patent/CN113157954B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150100332A (ko) * | 2014-02-25 | 2015-09-02 | 에스케이플래닛 주식회사 | 스케치 검색 시스템, 사용자 장치, 서비스 제공 장치, 그 서비스 방법 및 컴퓨터 프로그램이 기록된 기록매체 |
CN107220277A (zh) * | 2017-04-14 | 2017-09-29 | 西北大学 | 基于手绘草图的图像检索算法 |
US20200073968A1 (en) * | 2018-09-04 | 2020-03-05 | Inception Institute of Artificial Intelligence, Ltd. | Sketch-based image retrieval techniques using generative domain migration hashing |
CN109408655A (zh) * | 2018-10-19 | 2019-03-01 | 中国石油大学(华东) | 结合带孔卷积与多尺度感知网络的手绘草图检索方法 |
CN109670066A (zh) * | 2018-12-11 | 2019-04-23 | 江西师范大学 | 一种基于双路径深层语义网络的手绘式服装商品图像检索方法 |
CN109614508A (zh) * | 2018-12-12 | 2019-04-12 | 杭州知衣科技有限公司 | 一种基于深度学习的服装图像搜索方法 |
CN111581405A (zh) * | 2020-04-26 | 2020-08-25 | 电子科技大学 | 基于对偶学习生成对抗网络的跨模态泛化零样本检索方法 |
CN111858997A (zh) * | 2020-06-23 | 2020-10-30 | 浙江蓝天制衣有限公司 | 一种基于跨领域匹配的服装样板生成方法 |
Non-Patent Citations (7)
Title |
---|
JIANJUN LEI等: "Sketch based Image retrieval via image-aided cross domain learning", 《2017 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING(ICIP)》 * |
LEI H等: "A New Algorithm for Sketch-Based Fashion Image Retrieval Based on Cross-Domain Transformation", 《WIRELESS COMMUNICATIONS AND MOBILE COMPUTING》 * |
SIMIN CHEN等: "Cross-Domain Transfer for Sketch-based Clothing Retrieval", 《2020 8TH INTERNATIONAL CONFERENCE ON DIGITAL HOME(ICDH)》 * |
周燕等: "基于深度学习的三维形状特征提取方法", 《计算机科学》 * |
张浩: "基于深度学习的手绘草图检索及相关研究", 《中国优秀硕博士学位论文全文数据库(硕士) (信息科技辑)》 * |
章玥: "图像到草图的跨域生成及其在图像检索中的应用", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 * |
蔡雨婷等: "基于双层级联GAN的草图到真实感图像的异质转换", 《模式识别与人工智能》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114860980A (zh) * | 2022-05-26 | 2022-08-05 | 重庆邮电大学 | 一种基于草图局部特征和全局特征匹配的图像检索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113157954B (zh) | 2022-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111291212B (zh) | 基于图卷积神经网络的零样本草图图像检索方法和系统 | |
Ye et al. | Person reidentification via ranking aggregation of similarity pulling and dissimilarity pushing | |
CN103593792B (zh) | 一种基于中文知识图谱的个性化推荐方法与系统 | |
Tang et al. | Unified generative adversarial networks for controllable image-to-image translation | |
Xia et al. | LAGA-Net: Local-and-global attention network for skeleton based action recognition | |
Jing et al. | Low-rank regularized multi-representation learning for fashion compatibility prediction | |
Sun et al. | Motion retrieval using low‐rank subspace decomposition of motion volume | |
Zhang et al. | Context-based sketch classification | |
CN113157954B (zh) | 一种基于跨域转换的草图交互式服装图像检索方法 | |
Zou et al. | Transductive zero-shot hashing for multilabel image retrieval | |
Xu et al. | On learning semantic representations for large-scale abstract sketches | |
Lei et al. | A New Algorithm for Sketch‐Based Fashion Image Retrieval Based on Cross‐Domain Transformation | |
Chen et al. | Automatic tagging by leveraging visual and annotated features in social media | |
Liu et al. | Cloudmix: Dual mixup consistency for unpaired point cloud completion | |
Yang et al. | Ghost shuffle lightweight pose network with effective feature representation and learning for human pose estimation | |
Luo et al. | A geometric-relational deep learning framework for BIM object classification | |
Yin et al. | A Cross‐Modal Image and Text Retrieval Method Based on Efficient Feature Extraction and Interactive Learning CAE | |
Zhu et al. | Gradually focused fine-grained sketch-based image retrieval | |
Chen et al. | SketchTrans: Disentangled prototype learning with transformer for sketch-photo recognition | |
CN114781348A (zh) | 一种基于词袋模型的文本相似度计算方法及系统 | |
Liu et al. | Part-object progressive refinement network for zero-shot learning | |
Liu et al. | Artistic image synthesis with tag-guided correlation matching | |
Ma et al. | Semantic-Aware Dual Contrastive Learning for Multi-label Image Classification | |
Yan et al. | Joint image-text representation learning for fashion retrieval | |
Runyan et al. | A Survey on Learning Objects’ Relationship for Image Captioning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |