CN113469223A

CN113469223A - 一种基于孪生网络和稠密网络的服装检索方法

Info

Publication number: CN113469223A
Application number: CN202110659233.2A
Authority: CN
Inventors: 徐菲菲; 田宇
Original assignee: Shanghai Electric Power University
Current assignee: Shanghai University of Electric Power; Shanghai Electric Power University; University of Shanghai for Science and Technology
Priority date: 2021-06-15
Filing date: 2021-06-15
Publication date: 2021-10-01

Abstract

本发明涉及一种基于孪生网络和稠密网络的服装检索方法，属于人工智能领域。包括如下步骤：将第一图片的像素矩阵、第二图片的像素矩阵输入到稠密网络中提取特征，得到第一特征向量、第二特征向量；以及步骤S2，将第一特征向量与第二特征向量输入头部网络层，进行预处理后，得到检索结果，其中，步骤S2包括如下子步骤：步骤S2‑1，将第一特征向量与第二特征向量经过多种运算并进行向量拼接后，得到拼接第一特征向量与第二特征向量的联合特征向量；步骤S2‑2，将拼接后的联合特征向量依次经过卷积层、全连接层，从而计算得到两张图片是否相似的结果。所以本发明的方法可以帮助用户快速定位心仪的服装款式、节约时间，提高了检索效率。

Description

一种基于孪生网络和稠密网络的服装检索方法

技术领域

本发明涉及人工智能领域，具体涉及一种基于孪生网络和稠密网络的服装检索方法。

背景技术

在信息大爆炸的年代，互联网科技的发展，使人们过上了足不出户的生活。网络发展到现在，网上购物的便捷性与超低的价格和实体店形成了反差。随着电商的发展，像淘宝、京东、拼多多等一些平台逐渐影响着人们网上购物习惯。人们购物的第一反应，已经不是最近的超市，而是去电商平台搜索，寻找价廉物美的商品。琳琅满目的商品可能使消费者看花了眼，这时图片的检索系统就满足了这方面需求。像淘宝的应用中，如果搜索需要商品的关键字，就可以出现了相关一系列的商品。这是以文搜图的措施，也是基于文本的图像检索。同时也可以进行以图搜图，像拍立淘等功能，把想要的商品拍成图片传上去，就可以获得其相似的商品，这是基于内容的图像检索。

服装商品作为众多网上商品的主要部分，深受各个年龄阶段的人群喜爱。随着人们生活质量的提高，对于服装的审美也更加挑剔了。当用户看到心仪的服装时，如何才能在众多的服装商场找到他所喜欢的服装款式。故将图像检索技术应用到服装领域，这样不需要消耗大把的人工时间成本，并且能够快速的定位用户心仪的品牌款式。

发明内容

本发明是为了解决上述问题而进行的，目的在于提供一种基于孪生网络和稠密网络的服装检索方法。

本发明提供了一种基于孪生网络和稠密网络的服装检索方法，具有这样的特征，包括如下步骤：步骤S1，将第一图片的像素矩阵、第二图片的像素矩阵输入到稠密网络中提取特征，得到第一特征向量、第二特征向量；以及步骤S2，将第一特征向量与第二特征向量输入头部网络层，进行预处理后，得到检索结果，其中，步骤S2包括如下子步骤：步骤S2-1，将第一特征向量与第二特征向量经过多种运算并进行向量拼接后，得到拼接第一特征向量与第二特征向量的联合特征向量；步骤S2-2，将联合特征向量依次经过卷积层、全连接层，得到检索结果。

在本发明提供的基于孪生网络和稠密网络的服装检索方法中，还具有这样的特征：其中，步骤S2-1，多种运算包括和运算、乘积运算、差的绝对值运算及其平方运算。

在本发明提供的基于孪生网络和稠密网络的服装检索方法中，还具有这样的特征：其中，卷积层的数量为2个。

在本发明提供的基于孪生网络和稠密网络的服装检索方法中，还具有这样的特征：其中，全连接层具有1个神经元。

在本发明提供的基于孪生网络和稠密网络的服装检索方法中，还具有这样的特征：其中，卷积层的卷积公式如下：

其中，a为计算后的像素点的值，f为激活函数，W为权重值，W_b为偏置值。

在本发明提供的基于孪生网络和稠密网络的服装检索方法中，还具有这样的特征：其中，全连接层的全连接公式如下：

A_i＝W_i1*x₁+W_i2*x₂+L W_ij*x_j+b_i

其中，A为当前层的神经元的值，W为权重参数，b_i为偏置值。

发明的作用与效果

根据本发明所涉及的基于孪生网络和稠密网络的服装检索方法，包括如下步骤：将第一图片的像素矩阵、第二图片的像素矩阵输入到稠密网络中提取特征，得到第一特征向量、第二特征向量；以及步骤S2，将第一特征向量与第二特征向量输入头部网络层，进行预处理后，得到检索结果，其中，步骤S2包括如下子步骤：步骤S2-1，将第一特征向量与第二特征向量经过多种运算并进行向量拼接后，得到拼接第一特征向量与第二特征向量的联合特征向量；步骤S2-2，将拼接后的联合特征向量依次经过卷积层、全连接层，得到检索结果。因为本发明建立了深度学习模型ISNH(Improved Siamese Network ofHead)，该模型是基于孪生网络以及稠密网络的服装检索模型，并使用稠密网络为内核来构建孪生网络架构模型，通过增加头部网络层，从而将两张图片的特征进行计算得到两张图片是否相似的结果，所以本发明提供的基于孪生网络和稠密网络的服装检索方法可以快速准确判断服装图片的相似性，从而可以帮助用户快速定位心仪的服装款式、节约时间，提高了检索效率。

附图说明

图1是本发明的实施例中基于孪生网络和稠密网络的服装检索方法的流程图；

图2是本发明的实施例中孪生网络架构模型图；

图3是本发明的实施例中步骤2的子步骤的流程图；

图4是本发明的实施例中头部网络层的结构示意图；

图5是本发明的测试例中的部分数据集；

图6是本发明的测试例中不同算法的检索准确率比较图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，以下结合实施例及附图对本发明基于孪生网络和稠密网络的服装检索方法作具体阐述。

<实施例>

图1是本发明的实施例中基于孪生网络和稠密网络的服装检索方法的流程图；图2是本发明的实施例中孪生网络架构模型。

如图1-2所示，本实施例中基于孪生网络和稠密网络的服装检索方法包括如下步骤：

步骤S1，将第一图片的像素矩阵、第二图片的像素矩阵输入到稠密网络中提取特征，得到第一特征向量、第二特征向量，具体包括如下步骤：

将两个服装图片的像素值矩阵共同通过孪生网络模型，不采用原始孪生网络的VGG内核，而仅仅引用它的构造，使用相同的两个网络模型结构，并且采用权重共享的方式进行训练。

在本实施例中，孪生网络架构的内核是稠密网络，它是基于卷积网络设计的一个分类模型，能够更好的表征图片特征。使用孪生网络架构分类层之前的网络层，并将稠密网络的特征提取部分作为孪生网络的内核，进行特征提取后，得到第一特征向量、第二特征向量。

在图2中，DenseNet为稠密网络，head为头部网络层。

图3是本发明的实施例中步骤2的子步骤的流程图。

如图3所示，步骤S2包括如下步骤：

步骤S2，将第一特征向量与第二特征向量输入头部网络层，进行预处理后，得到检索结果，

其中，步骤S2包括如下子步骤：

步骤S2-1，将第一特征向量与第二特征向量经过多种运算并进行向量拼接后，得到拼接第一特征向量与第二特征向量的联合特征向量；

步骤S2-2，将拼接后的联合特征向量依次经过卷积层、全连接层，得到检索结果。

在本实施例中，将第一特征向量与第二特征向量输入头部网络层后，进行差异性对比，使相似的图片的特征向量更为相似，而不相似的图片，矩阵向量更加不相似。

图4是本发明的实施例中头部网络层的结构示意图。

如图4所示，两个从稠密网络提取特征出来的第一特征向量、第二特征向量，经过和运算、乘积运算、差的绝对值运算、差的绝对值的平方运算，然后继续拼接操作，目的使两个特征向量的差异化更加明显，并且经过两个卷积层，最后经过一个神经元的全连接层，获取最终结果，输出0时，则两张图片相似，输出1时，两张图片不相似。

在本实施例中，卷积层的卷积公式如下：

全连接层的全连接公式如下：

A_i＝W_i1*x₁+W_i2*x₂+L W_ij*x_j+b_i

<测试例>

数据清洗操作：清除数据集中同类图片数小于3张的那一类数据集。由于单类数据太少，使其训练的数据信息不充分，直观上来说可能会影响模型训练的误判，然而在大数据集下删除不会对其有重要的影响。因为DeepFashion数据集经过作者的修正，大量学者的使用，基本上没有太大的数据干扰问题，所以不需要过多的数据清洗。经过简单的清洗结果，服装图片训练集从3985类降到了3975类。

图5是本发明的测试例的部分数据集。

测试方法：采用数据增广的方式进行横向扩充数据集，具体通过将图片进行颜色变换、色彩空间变换、亮度饱和度的调整，进行数据增强后，进行模型训练，得出检索准确率，具体过程如下；

本测试例在训练模型时，直接进行模型训练，权重设置初值为高斯分布的初值，经过反复的测试训练，模型未能很好的收敛，损失值无法降下来。于是，使用预训练的措施，使权重找到一个好的初值，对于整体训练有一个中间过渡。模型的预训练主要是采用稠密网络对数据集进行分类训练，主要是因为检索任务和分类任务的差别不是很大。在预训练模型中使用ImageNet数据集训练过的权重，这个数据集有1400多万张图片，包含了2万多个类。使用这个数据集的训练权重主要是因为其包含服装的种类多。预训练模型优化器使用的是带冲量的随机梯度算法，初始的学习率设为0.01。当预训练模型训练收敛平稳时，把其最后的权重参数作为主模型的初始权重。经过反复训练发现，主模型的优化器也是使用带冲量的随机梯度算法，初始的学习率也同样设置为0.01的结果能很好的收敛。损失函数没有使用孪生网络自带的对比损失函数，而是换成了二元损失函数。训练结束后，将稠密网络出口提取的特征矩阵，使用余弦相似度排序找到最匹配的。

本测试例在最终模型训练时，由于训练数据的独特性，以一种成对的数据出现，需要重新构建数据集。选取同类的未做数据增强的第一张作为anchor，同类但不相同的数据作为positive，不同类的随机数据作为negative。这样设计主要是为了平衡数据集，使相匹配的图片数和不匹配的图片数一致。本次训练经过了6个周期，损失值从0.22下降到0.01，经过验证选取了第5个周期的的权重结果，预测集上表现最优。

本测试例将Top50各算法的召回率进行比较，结果如表1所示。

表1 Top50各算法召回率比较结果

由表1可知，在Top-1(％)时，FashionNet模型的召回率为53，并高于其他模型的召回率，但是从Top-1(％)-Top-50(％)中，本实施例提供的ISNH模型均高于其他模型，并且在Top-50(％)中，召回率高达91，相比于其他模型，本实施例提供的ISNH模型具有较高的召回率。

基于表1，将不同算法与本实施例中的ISNH模型进行检索准确率对比。

图6是本发明的测试例中不同算法的检索准确率比较图。

由图6可知，将本实施例中的ISNH模型与其他同类型算法进行了对比发现，本实施例中的ISNH模型的检索准确率是最高的。

实施例的作用与效果

根据本实施例所涉及的基于孪生网络和稠密网络的服装检索方法，包括如下步骤：将第一图片的像素矩阵、第二图片的像素矩阵输入到稠密网络中提取特征，得到第一特征向量、第二特征向量；以及步骤S2，将第一特征向量与第二特征向量输入头部网络层，进行预处理后，得到检索结果，其中，步骤S2包括如下子步骤：步骤S2-1，将第一特征向量与第二特征向量经过多种运算并进行向量拼接后，得到拼接第一特征向量与第二特征向量的联合特征向量；步骤S2-2，将拼接后的联合特征向量依次经过卷积层、全连接层，得到检索结果。因为本实施例建立了深度学习模型ISNH(Improved Siamese Network ofHead)，该模型是基于孪生网络以及稠密网络的服装检索模型，并使用稠密网络为内核来构建孪生网络架构模型，通过增加头部网络层，从而将两张图片的特征进行计算得到两张图片是否相似的结果，所以本实施例提供的基于孪生网络和稠密网络的服装检索方法可以快速准确判断服装图片的相似性，从而可以帮助用户快速定位心仪的服装款式、节约时间，提高了检索效率。

上述实施方式为本发明的优选案例，并不用来限制本发明的保护范围。

Claims

1.一种基于孪生网络和稠密网络的服装检索方法，其特征在于，包括如下步骤：

步骤S1，将第一图片的像素矩阵、第二图片的像素矩阵输入到稠密网络中提取特征，得到第一特征向量、第二特征向量；

步骤S2，将所述第一特征向量与所述第二特征向量输入头部网络层，进行预处理后，得到检索结果，

其中，所述步骤S2包括如下子步骤：

步骤S2-1，将所述第一特征向量与所述第二特征向量经过多种运算并进行向量拼接后，得到拼接后的联合特征向量；

步骤S2-2，将所述拼接后的联合特征向量依次经过卷积层、全连接层，得到检索结果。

2.根据权利要求1所述的基于孪生网络和稠密网络的服装检索方法，其特征在于：

其中，步骤S2-1，所述多种运算包括和运算、乘积运算、差的绝对值运算及其平方运算。

3.根据权利要求1所述的基于孪生网络和稠密网络的服装检索方法，其特征在于：

其中，所述卷积层的数量为2个。

4.根据权利要求1所述的基于孪生网络和稠密网络的服装检索方法，其特征在于：

其中，所述全连接层具有1个神经元。

5.根据权利要求1所述的基于孪生网络和稠密网络的服装检索方法，其特征在于：

其中，所述卷积层的卷积公式如下：

6.根据权利要求1所述的基于孪生网络和稠密网络的服装检索方法，其特征在于：

其中，所述全连接层的全连接公式如下：

A_i＝W_i1*x₁+W_i2*x₂+LW_ij*x_j+b_i