CN110263252B - 一种基于深度学习的服装检索方法 - Google Patents
一种基于深度学习的服装检索方法 Download PDFInfo
- Publication number
- CN110263252B CN110263252B CN201910530599.2A CN201910530599A CN110263252B CN 110263252 B CN110263252 B CN 110263252B CN 201910530599 A CN201910530599 A CN 201910530599A CN 110263252 B CN110263252 B CN 110263252B
- Authority
- CN
- China
- Prior art keywords
- net
- clothing
- data set
- similarity
- equal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/061—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Neurology (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习的服装检索方法,该方法利用可变形卷积网络和相似性学习网络实现服装检索功能,设置了包含可变形卷积网络和相似性学习网络的两阶段学习架构,在可变形卷积网络中,学习并提取服装特征,利用哈希编码对特征进行表达,进一步在相似性学习网络中,对哈希编码特征进行比对,获得特征的相似性比对评分结果,该方法能够有效地检索出各种形状特征的服装目标,得到视觉一致性的检索结果。
Description
技术领域
本发明涉及服装检索技术领域,具体涉及一种基于深度学习的服装检索方法,采用包含可变形卷积网络和相似性学习网络的两阶段学习架构,在可变形卷积网络中,学习并提取服装特征,利用哈希编码对特征进行表达,进一步在相似性学习网络中,对哈希编码特征进行比对,获得比对特征的相似性评分结果,该方法能够有效地检索出各种形状特征的服装目标,得到视觉一致性的检索结果。
背景技术
传统的服装检索方法包括基于文本的方式和基于内容的方式,基于文本的方式不仅费时费力,且存在较大的主观差异性,而在基于内容的方式中,服装图像的低层视觉特征很难充分描述它的高层语义信息,无法保证查询图像和检索结果之间的视觉一致性;近年来,一些基于深度学习的服装检索方法可以有效地学习服装图像的高低层特征,实现服装图像的检索;如何建立有效的深度学习模型实现服装检索是一个亟待解决的实际问题。
发明内容
本发明的目的是针对现有技术的不足,并针对服装检索中服装目标几何变形问题和视觉一致性问题,利用深度学习策略,构建卷积神经网络,提供一种有效的服装检索方法,该方法能够获得较为准确的检索结果,具有更高的实用价值。
实现本发明目的的具体技术方案是:
一种基于深度学习的服装检索方法,其特征在于,该方法输入分辨率为f×f的RGB
图像I,100≤f≤1000,具体包括以下步骤:
步骤1:构建服装数据集F
从taobao.com网站收集J个单件服装样例,10000≤J≤15000,将收集的J个单件服装样例与http://mmlab.ie.cuhk.edu.hk/projects/DeepFashion.html提供的DeepFashion数据集合并,得到包含有M个单件服装样例的初始数据集T,80000≤M≤100000,利用T构建服装样例数据集R,R中服装种类数目为U,15≤U≤20,每个服装样例是同一件服装的采样信息,其包含三类信息:具有环境背景的一幅服装图像B、该服装无环境背景的多幅图像{Ek|2≤k≤10}以及此件服装的种类标签Oi,1≤i≤U;
进一步按照以下方法构建服装数据集F:F的每个样本的形式定义为三元组(Pi,Qi,li),1≤i≤500000,其中,Pi是从R中选取的B,将其尺度缩放为N×N,N为227、454或者908,Qi是从R中选取的任意样例数据的无环境背景服装图像,将其尺度也缩放为N×N,li是Pi与Qi相似性标签,li取值为0或者1,当Pi与Qi来自于R的同一组样例时,即是相同服装的两幅图像时,li取1,否则取0;
步骤2:构建神经网络
神经网络构建分为服装特征学习网络F-Net及相似性学习网络S-Net;
对于F-Net,先从F中选取Pi或者Qi作为输入,其尺度为227×227,张量形状为227×227×3,F-Net网络的输出有两个部分:一个是来自于F-Net中间层的哈希编码,即Pi的哈希编码HP或者Qi的哈希编码HQ,张量形状为h×1,h为64、128或者256,另一个输出是网络最后一层输出的Pi或者Qi的服装类别特征,张量形状为U×1;
对于S-Net,输入的是两个哈希编码HP及HQ,输出的是Pi与Qi相似性的比对结果C,其张量形状为2×1,张量的两个分量分别表示Pi与Qi之间的相似程度及不相似程度,相似程度记为评分V;
对于F-Net设置为5个卷积层和4个全连接层,对于前三层卷积得到的特征分别增加一个偏移量,偏移量的张量尺度与特征尺度相同;
5个卷积层设计为5个卷积子结构,各层卷积核的个数依次为96、256、384、384、256,前3个子结构都包括以下序列操作:卷积、批归一化、加上偏移量、激活、最大池化,后2个子结构都包括以下序列操作:卷积、激活、最大池化,4个全连接层的神经元的个数分别为4096、4096、h、U,倒数第二层全连接层的神经元个数为h,这一层得到的特征是输入图像的哈希编码结果,最后一层全连接层的神经元个数为U,这一层输出的特征是服装类别特征,F-Net中都采用ReLU激活函数进行处理;
对于S-Net设置为3层全连接结构,神经元的个数分别为G、G、2,其中G为512、1024或者2048,前两个全连接层输出的结果进一步采用ReLU函数进行激活;
步骤3:神经网络的训练
将数据集F中的样本按照7∶1∶2比例划分为训练数据集,评估数据集和测试数据集,利用训练数据集训练网络模型,利用评估数据集评估训练过程中网络的性能,利用测试数据集对网络性能进行测试;
首先对F-Net训练50000轮次,训练结束后,再对S-Net进行训练50000轮次,在训练S-Net时,每次训练过程需要输入的是Pi及Qi的编码HP和HQ;
在对F-Net进行训练时,损失函数eF定义为:
其中,ai是F-Net在最后一个全连接层的U个神经元中得到的第i个类别特征;
在对S-Net进行训练时,损失函数eS定义为:
其中,bi是S-Net在最后一个全连接层的2个神经元中得到的类别特征,其形状为2×1,yi表示Pi及Qi的相似性,yi形状为2×1,它的两个分量分别表示Pi与Qi之间的相似程度及不相似程度的标签,如果相似,相似程度的分量取1,不相似程度的分量取0,而当Pi与Qi不相似时,相似程度的分量取0,不相似程度的分量取1;
步骤4:服装检索操作
构建一个服装检索数据集S,其中服装分辨率为f×f,100≤f≤1000,将S中的每一幅服装图像都缩放为227×227,再将S中的每幅图像依次输入到F-Net,分别得到每幅图像的哈希编码,并写入磁盘文件code.txt进行保存;
从数据集S中选取I,根据I到磁盘文件code.txt中检索I的哈希编码K,K与磁盘文件code.txt中每个服装的哈希编码,分别多个哈希编码对,将这些哈希编码对依次输入到S-Net中进行预测,得到每次比对的相似性评分,再将这些评分进行降序排列,从中选取最优的检索结果。
本发明具有简单、实用的特点,本发明包含可变形卷积网络和相似性学习网络的两阶段学习架构,在可变形卷积网络中,学习并提取服装特征,利用哈希编码对特征进行表达,进一步在相似性学习网络中,对哈希编码特征进行比对,获得比对特征的相似性评分结果,该方法能够有效地检索出各种形状特征的服装目标,得到视觉一致性的检索结果。
附图说明
图1为本发明服装相似性评分及检索的结果图;
图2为本发明服装相似及不相似检索的结果图。
具体实施方式
实施例
下面结合附图对本发明进一步说明。
本实施例在PC机上Ubuntu16.0464位操作系统下进行实施,其硬件配置是CPUi5-7500,内存8G,GPUNVIDIAGeForceGTX 1070 8G;深度学习框架采用Caffe,编程语言采用Python2.7。
实现本发明目的的具体技术方案是:一种基于深度学习的服装检索方法,同时考虑服装目标的几何变形及查询图像和检索结果之间的视觉一致性的情况下,该方法输入分辨率为227×227的RGB图像I,具体包括以下步骤:
步骤1:构建服装数据集F
从taobao.com网站收集J个单件服装样例,J为11384,将收集的J个单件服装样例与http://mmlab.ie.cuhk.edu.hk/projects/DeepFashion.html提供的DeepFashion数据集合并,得到包含有M个单件服装样例的初始数据集T,M为85127,利用T构建服装样例数据集R,R中服装种类数目为U,U为19,每个服装样例是同一件服装的采样信息,其包含三类信息:具有环境背景的一幅服装图像B、该服装无环境背景的多幅图像{Ek|2≤k≤10}以及此件服装的种类标签Oi,1≤i≤U;
进一步按照以下方法构建服装数据集F:F的每个样本的形式定义为三元组(Pi,Qi,li),1≤i≤500000,其中,Pi是从R中选取的B,将其尺度缩放为N×N,N为227,Qi是从R中选取的任意样例数据的无环境背景服装图像,将其尺度也缩放为N×N,li是Pi与Qi相似性标签,li取值为0或者1,当Pi与Qi来自于R的同一组样例时,即是相同服装的两幅图像时,li取1,否则取0;
步骤2:构建神经网络
神经网络构建分为服装特征学习网络F-Net及相似性学习网络S-Net;
对于F-Net,先从F中选取Pi或者Qi作为输入,其尺度为227×227,张量形状为227×227×3,F-Net网络的输出有两个部分:一个是来自于F-Net中间层的哈希编码,即Pi的哈希编码HP或者Qi的哈希编码HQ,张量形状为h×1,h为64,另一个输出是网络最后一层输出的Pi或者Qi的服装类别特征,张量形状为U×1;
对于S-Net,输入的是两个哈希编码HP及HQ,输出的是Pi与Qi相似性的比对结果C,其张量形状为2×1,张量的两个分量分别表示Pi与Qi之间的相似程度及不相似程度,相似程度记为评分V;
对于F-Net设置为5个卷积层和4个全连接层,对于前三层卷积得到的特征分别增加一个偏移量,偏移量的张量尺度与特征尺度相同;
5个卷积层设计为5个卷积子结构,各层卷积核的个数依次为96、256、384、384、256,前3个子结构都包括以下序列操作:卷积、批归一化、加上偏移量、激活、最大池化,后2个子结构都包括以下序列操作:卷积、激活、最大池化,4个全连接层的神经元的个数分别为4096、4096、h、U,倒数第二层全连接层的神经元个数为h,这一层得到的特征是输入图像的哈希编码结果,最后一层全连接层的神经元个数为U,这一层输出的特征是服装类别特征,F-Net中都采用ReLU激活函数进行处理;
对于S-Net设置为3层全连接结构,神经元的个数分别为G、G、2,其中G为512,前两个全连接层输出的结果进一步采用ReLU函数进行激活;
步骤3:神经网络的训练
将数据集F中的样本按照7∶1∶2比例划分为训练数据集,评估数据集和测试数据集,利用训练数据集训练网络模型,利用评估数据集评估训练过程中网络的性能,利用测试数据集对网络性能进行测试;
首先对F-Net训练50000轮次,训练结束后,再对S-Net进行训练50000轮次,在训练S-Net时,每次训练过程需要输入的是Pi及Qi的编码HP和HQ;
在对F-Net进行训练时,损失函数eF定义为:
其中,ai是F-Net在最后一个全连接层的U个神经元中得到的第i个类别特征;
在对S-Net进行训练时,损失函数eS定义为:
其中,bi是S-Net在最后一个全连接层的2个神经元中得到的类别特征,其形状为2×1,yi表示Pi及Qi的相似性,yi形状为2×1,它的两个分量分别表示Pi与Qi之间的相似程度及不相似程度的标签,如果相似,相似程度的分量取1,不相似程度的分量取0,而当Pi与Qi不相似时,相似程度的分量取0,不相似程度的分量取1;
步骤4:服装检索操作
构建一个服装检索数据集S,其中服装分辨率为f×f,100≤f≤1000,将S中的每一幅服装图像都缩放为227×227,再将S中的每幅图像依次输入到F-Net,分别得到每幅图像的哈希编码,并写入磁盘文件code.txt进行保存;
从数据集S中选取I,根据I到磁盘文件code.txt中检索I的哈希编码K,K与磁盘文件code.txt中每个服装的哈希编码,分别多个哈希编码对,将这些哈希编码对依次输入到S-Net中进行预测,得到每次比对的相似性评分,再将这些评分进行降序排列,从中选取最优的检索结果;
实验过程中,网络的实现细节与使用的重要超参数如下:F-Net中卷积层采用Xavier方式进行网络参数的初始化,在批归一化操作中,β项初始化全部设置为0,γ项初始化全部设置为1;F-Net与S-Net中的全连接层采用Gaussian方式对网络参数初始化,动量系数momentum取0.9,Dropout率取0.5,优化器采用SGD优化器,每批样本取64,学习率初始值为0.01,之后每迭代10000次,学习率变为原来的0.1倍;
图1为服装相似性评分及检索的结果,每一行为一组检索结果,每行的第一个图像为检索的样例图像,其它5个为相应的检索结果,每幅检索结果图像的下方为其对应的相似性评分,在本实施例中,相似性评分V最高设置为100,最低为0,从结果可以看出,检索的样例图像与检索结果在视觉上相一致,此外,在包含复杂背景的样例图像检索时,甚至是几何变形的服装,也可以检索到较为准确的结果。
图2为服装相似及不相似的结果比较,每一组检索结果中,第1行为相似的检索的结果,第2行为不相似的检索结果,从对比结果中可以看出,相似的检索结果显示了与样例服装的外观的相似性,而不相似的检索结果与样例服装在外观上存在较大差异。
Claims (1)
1.一种基于深度学习的服装检索方法,其特征在于,该方法输入分辨率为f×f的RGB图像I,100≤f≤1000,具体包括以下步骤:
步骤1:构建服装数据集F
从taobao.com网站收集J个单件服装样例,10000≤J≤15000,将收集的J个单件服装样例与http://mmlab.ie.cuhk.edu.hk/projects/DeepFashion.html提供的DeepFashion数据集合并,得到包含有M个单件服装样例的初始数据集T,80000≤M≤100000,利用T构建服装样例数据集R,R中服装种类数目为U,15≤U≤20,每个服装样例是同一件服装的采样信息,其包含三类信息:具有环境背景的一幅服装图像B、该服装无环境背景的多幅图像{Ek|2≤k≤10}以及此件服装的种类标签Oi,1≤i≤U;
构建服装数据集F:F的每个样本的形式定义为三元组(Pi,Qi,li),1≤i≤500000,其中,Pi是从R中选取的B,将其尺度缩放为N×N,N为227、454或者908,Qi是从R中选取的任意样例数据的无环境背景服装图像,将其尺度也缩放为N×N,li是Pi与Qi相似性标签,li取值为0或者1,当Pi与Qi来自于R的同一组样例时,即是相同服装的两幅图像时,li取1,否则取0;
步骤2:构建神经网络
神经网络构建分为服装特征学习网络F-Net及相似性学习网络S-Net;
对于F-Net,先从F中选取Pi或者Qi作为输入,其尺度为227×227,张量形状为227×227×3,F-Net网络的输出有两个部分:一个是来自于F-Net中间层的哈希编码,即Pi的哈希编码Hp或者Qi的哈希编码HQ,张量形状为h×1,h为64、128或者256,另一个输出是网络最后一层输出的Pi或者Qi的服装类别特征,张量形状为U×1;
对于S-Net,输入的是两个哈希编码Hp及HQ,输出的是Pi与Qi相似性的比对结果C,其张量形状为2×1,张量的两个分量分别表示Pi与Qi之间的相似程度及不相似程度,相似程度记为评分V;
对于F-Net设置为5个卷积层和4个全连接层,对于前三层卷积得到的特征分别增加一个偏移量,偏移量的张量尺度与特征尺度相同;
5个卷积层设计为5个卷积子结构,各层卷积核的个数依次为96、256、384、384、256,前3个子结构都包括以下序列操作:卷积、批归一化、加上偏移量、激活、最大池化,后2个子结构都包括以下序列操作:卷积、激活、最大池化,4个全连接层的神经元的个数分别为4096、4096、h、U,倒数第二层全连接层的神经元个数为h,这一层得到的特征是输入图像的哈希编码结果,最后一层全连接层的神经元个数为U,这一层输出的特征是服装类别特征,F-Net中都采用ReLU激活函数进行处理;
对于S-Net设置为3层全连接结构,神经元的个数分别为G、G、2,其中G为512、1024或者2048,前两个全连接层输出的结果进一步采用ReLU函数进行激活;
步骤3:神经网络的训练
将数据集F中的样本按照7∶1∶2比例划分为训练数据集,评估数据集和测试数据集,利用训练数据集训练网络模型,利用评估数据集评估训练过程中网络的性能,利用测试数据集对网络性能进行测试;
首先对F-Net训练50000轮次,训练结束后,再对S-Net进行训练50000轮次,在训练S-Net时,每次训练过程需要输入的是Pi及Qi的编码HP和HQ;
在对F-Net进行训练时,损失函数eF定义为:
其中,ai是F-Net在最后一个全连接层的U个神经元中得到的第i个类别特征;
在对S-Net进行训练时,损失函数eS定义为:
其中,bi是S-Net在最后一个全连接层的2个神经元中得到的类别特征,其形状为2×1,yi表示Pi及Qi的相似性,yi形状为2×1,它的两个分量分别表示Pi与Qi之间的相似程度及不相似程度的标签,如果相似,相似程度的分量取1,不相似程度的分量取0,而当Pi与Qi不相似时,相似程度的分量取0,不相似程度的分量取1;
步骤4:服装检索操作
构建一个服装检索数据集S,其中服装分辨率为f×f,100≤f≤1000,将S中的每一幅服装图像都缩放为227×227,再将S中的每幅图像依次输入到F-Net,分别得到每幅图像的哈希编码,并写入磁盘文件code.txt进行保存;
从数据集S中选取I,根据I到磁盘文件code.txt中检索I的哈希编码K,K与磁盘文件code.txt中每个服装的哈希编码,分别多个哈希编码对,将这些哈希编码对依次输入到S-Net中进行预测,得到每次比对的相似性评分,再将这些评分进行降序排列,从中选取最优的检索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910530599.2A CN110263252B (zh) | 2019-06-19 | 2019-06-19 | 一种基于深度学习的服装检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910530599.2A CN110263252B (zh) | 2019-06-19 | 2019-06-19 | 一种基于深度学习的服装检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110263252A CN110263252A (zh) | 2019-09-20 |
CN110263252B true CN110263252B (zh) | 2023-02-03 |
Family
ID=67919347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910530599.2A Active CN110263252B (zh) | 2019-06-19 | 2019-06-19 | 一种基于深度学习的服装检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263252B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682233A (zh) * | 2017-01-16 | 2017-05-17 | 华侨大学 | 一种基于深度学习与局部特征融合的哈希图像检索方法 |
CN107330451A (zh) * | 2017-06-16 | 2017-11-07 | 西交利物浦大学 | 基于深度卷积神经网络的服装属性检索方法 |
CN109685121A (zh) * | 2018-12-11 | 2019-04-26 | 中国科学院苏州纳米技术与纳米仿生研究所 | 图像检索模型的训练方法、图像检索方法、计算机设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105512273A (zh) * | 2015-12-03 | 2016-04-20 | 中山大学 | 一种基于可变长深度哈希学习的图像检索方法 |
WO2017203262A2 (en) * | 2016-05-25 | 2017-11-30 | Metail Limited | Method and system for predicting garment attributes using deep learning |
-
2019
- 2019-06-19 CN CN201910530599.2A patent/CN110263252B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682233A (zh) * | 2017-01-16 | 2017-05-17 | 华侨大学 | 一种基于深度学习与局部特征融合的哈希图像检索方法 |
CN107330451A (zh) * | 2017-06-16 | 2017-11-07 | 西交利物浦大学 | 基于深度卷积神经网络的服装属性检索方法 |
CN109685121A (zh) * | 2018-12-11 | 2019-04-26 | 中国科学院苏州纳米技术与纳米仿生研究所 | 图像检索模型的训练方法、图像检索方法、计算机设备 |
Non-Patent Citations (1)
Title |
---|
基于深度卷积神经网络的服装图像分类检索算法;厉智等;《计算机工程》;20161115(第11期);315-321 * |
Also Published As
Publication number | Publication date |
---|---|
CN110263252A (zh) | 2019-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | Beyond bilinear: Generalized multimodal factorized high-order pooling for visual question answering | |
CN110442707B (zh) | 一种基于seq2seq的多标签文本分类方法 | |
CN110298037B (zh) | 基于增强注意力机制的卷积神经网络匹配的文本识别方法 | |
CN110362723B (zh) | 一种题目特征表示方法、装置及存储介质 | |
CN107480261A (zh) | 一种基于深度学习细粒度人脸图像快速检索方法 | |
CN110765775A (zh) | 一种融合语义和标签差异的命名实体识别领域自适应的方法 | |
CN111753189A (zh) | 一种少样本跨模态哈希检索共同表征学习方法 | |
CN111400494B (zh) | 一种基于GCN-Attention的情感分析方法 | |
CN113569001A (zh) | 文本处理方法、装置、计算机设备及计算机可读存储介质 | |
CN110263174B (zh) | —基于焦点关注的主题类别分析方法 | |
CN111476315A (zh) | 一种基于统计相关性与图卷积技术的图像多标签识别方法 | |
CN105894050A (zh) | 一种基于多任务学习的人脸图像种族和性别识别方法 | |
CN112417097A (zh) | 一种用于舆情解析的多模态数据特征提取与关联方法 | |
CN110705490B (zh) | 视觉情感识别方法 | |
CN114444600A (zh) | 基于记忆增强原型网络的小样本图像分类方法 | |
CN105701225B (zh) | 一种基于统一关联超图规约的跨媒体检索方法 | |
CN112232087A (zh) | 一种基于Transformer的多粒度注意力模型的特定方面情感分析方法 | |
CN110598022B (zh) | 一种基于鲁棒深度哈希网络的图像检索系统与方法 | |
Simske | Meta-analytics: consensus approaches and system patterns for data analysis | |
Xia et al. | Transferring ensemble representations using deep convolutional neural networks for small-scale image classification | |
CN107908757B (zh) | 网站分类方法及系统 | |
CN114329181A (zh) | 一种题目推荐方法、装置及电子设备 | |
CN115457332A (zh) | 基于图卷积神经网络和类激活映射的图像多标签分类方法 | |
CN111898704A (zh) | 对内容样本进行聚类的方法和装置 | |
Moholkar et al. | Lioness adapted GWO-based deep belief network enabled with multiple features for a novel question answering system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |