CN104834748B - 一种利用基于深度语义排序哈希编码的图像检索方法 - Google Patents
一种利用基于深度语义排序哈希编码的图像检索方法 Download PDFInfo
- Publication number
- CN104834748B CN104834748B CN201510272498.1A CN201510272498A CN104834748B CN 104834748 B CN104834748 B CN 104834748B CN 201510272498 A CN201510272498 A CN 201510272498A CN 104834748 B CN104834748 B CN 104834748B
- Authority
- CN
- China
- Prior art keywords
- image
- hash
- depth
- function
- hash function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 101150060512 SPATA6 gene Proteins 0.000 title claims abstract description 105
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000006870 function Effects 0.000 claims abstract description 79
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 10
- 238000012360 testing method Methods 0.000 claims abstract description 10
- 238000005259 measurement Methods 0.000 claims abstract description 3
- 238000005457 optimization Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims description 2
- 239000013598 vector Substances 0.000 claims description 2
- 238000011478 gradient descent method Methods 0.000 abstract description 5
- 238000013459 approach Methods 0.000 abstract 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2111—Selection of the most significant subset of features by using evolutionary computational techniques, e.g. genetic algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Physiology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种利用基于深度语义排序哈希编码的图像检索方法,该方法包括以下步骤:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;使用深度卷积神经网络来构建深度哈希函数;根据图像的多标签信息,构建出图像间的语义相似度排序;以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法来优化深度哈希函数;用学习到的深度哈希函数计算图像的哈希码,通过计算测试图像的哈希码与训练集中每一个图像的哈希码之间的汉明距离来检索图像。本发明方法能够保留多标签图像在语义空间中的多级相似度,并且联合学习图像的深度特征表达和哈希编码,从而避免了语义信息的损失。
Description
技术领域
本发明涉及模式识别与机器学习领域,特别涉及图像哈希编码与检索。
背景技术
网络图片的爆炸性增长使得基于内容的图像检索显得日趋重要。哈希编码由于其效率高、易存储等特性,已经被广泛的用于大规模图像检索当中。尽管如此,大部分的基于语义标签的哈希编码方法只解决了二元的相似度量(即相似或者不相似)问题,但是对于多标签图像中的多级语义相似度量去不能够很好的处理。此外,大部分的哈希编码方法的流程一般是首先提取手工设计的特征表达,然后在此基础上学习深度哈希函数。这些手工设计的特征更倾向于描述表观而非语义信息,并不适合用来处理涉及复杂语义结构的任务。
发明内容
(一)本发明要解决的技术问题
本发明的目的是提出一种利用基于深度语义排序哈希编码的图像检索的方法。基于深度语义排序的深度哈希函数学习方法来保留多标签图像中的复杂的多级语义结构。其利用深度卷积神经网络构建多层的深度哈希函数,并根据图像间共同标签的数目推导出语义排序列表用于监督深度哈希函数学习。同时,使用一种基于代理排序损失函数的算法来解决学习过程中的多变量非光滑排序度量优化问题。
(二)本发明的技术方案
本发明所提出的一种利用基于深度语义排序哈希编码的图像检索方法包括以下步骤:
步骤S0:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;
步骤S1:使用深度卷积神经网络(CNN)构建深度哈希函数;
步骤S2:根据图像的多标签信息,构建出图像间的语义相似度排序;
步骤S3,以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法和反向传播算法来优化深度哈希函数;
步骤S4:用步骤S3学习到的深度哈希函数计算图像的哈希码;
步骤S5,通过计算测试图像的哈希码与训练集中每一个图像的哈希码之间的汉明距离,并根据汉明距离来检索图像。
(三)本发明的有益效果:
本发明方法利用语义排序损失学习深度哈希函数,能够保留多标签图像中的多级语义结构,能够保留图像在语义空间中的多级相似度;并且这种使用排序监督的深度学习模型可以联合学习图像的深度特征表达和哈希编码,具有更强的语义学习能力从而避免了语义信息的损失。
附图说明
图1是本发明利用基于深度语义排序哈希编码的图像检索方法流程图。
图2是深度哈希函数的结构示意图。
图3是一些检索示例。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明提出了一种基于深度语义排序的哈希编码,并将其应用于图像检索。该方法利用深度卷积神经网络来构建一种多层的深度哈希函数,并且根据图像的多标签信息推导出图像间的语义相似度排序,用于深度哈希函数的监督学习。在此基础上,使用一种基于代理排序损失函数的策略来解决模型学习过程中非光滑的多变量排序度量优化问题。以下详细说明本发明方法涉及的关键步骤。
请参阅图1示出的本发明利用基于深度语义排序哈希编码的图像检索的方法,所述方法包括以下步骤:
步骤S0,将多标签图像数据集中的部分图像作为图像训练集剩下的图像作为图像测试集;
步骤S1,利用深度卷积神经网络(CNN)构建一种多层的深度哈希函数;
请参阅图2所示深度哈希函数的结构,所述深度哈希函数包含了一个七层深度卷积神经网络,以及一个哈希编码层。在第一个全连接层(FCa)和哈希编码层之间增加一个额外的跨层连接来减少可能的信息损失。由于第二个全连接层(FCb)过于依赖于高层的类标签,其激活响应对于图像细节特征有着很强的不变性,并不太适合于捕获精细化的语义差异。因此,把哈希编码层同时与两个全连接层进行连接,使得第一个全连接层FCa中偏向于视觉表观的多样化特征信息能够得到更多的利用。相应的,提出的一个深度哈希函数h(x;w)定义如下:
h(x;w)=sign(wT[fa(x);fb(x)]) (1)
其中,sign(.)为符号函数,x为数据库样本,w表示哈希编码层的权值,T表示转置,fa(x)和fb(x)分别表示来自于第一个全连接层FCa和第二个全连接层FCb的特征向量。这里为了表述的简洁性,我们略去了偏置项以及fa(x)和fb(x)的参数,并通过计算如下一组深度哈希函数h(x;W)能够得到K比特的哈希码:
h(x;W)=[h1(x;w1),h2(x;w2),...,hK(x;wK)], (2)
hK(x;wK)为第K个深度哈希函数;wK为第K个深度哈希函数的哈希编码层的权值,W=[w1,w2,...,wK]是一组深度哈希函数的权值,为了保证检索速度,哈希码的比特数K的取值为1≤K≤256;
步骤S2,根据图像的多标签信息,构建出图像间的语义相似度排序;
给定训练集中的一个样本做为查询样本q,数据库样本x与查询样本q的语义相似度等级r可以根据二者的相同标签个数计算得到。
如果数据库样本x的标签与查询样本q完全相同,那么数据库样本x与查询样本q的语义相似度等级数据库样本x与查询样本q的语义相似程度最高,表示查询样本q的标签集合,表示集合中标签的个数。
相应的,如果数据库样本x有任意个标签与查询样本q相同,则数据库样本x与查询样本q语义相似度等级数据库样本x与查询样本q的语义相似程度次之。
以此类推,最后如果数据库样本x没有与查询样本q相同的标签,数据库样本x与查询样本q语义相似度等级r=0,数据库样本x与查询样本q的语义视为不相似。
于是,按照这种语义相似度等级对数据库样本x进行排序,我们就能够得到一个关于查询样本q的语义排序列表。
步骤S3,以一种基于三元组的代理排序损失函数作为实际的模型目标函数,并使用随机梯度下降法和反向传播算法来优化深度哈希函数;
为了避免对排序评价标准的直接优化,使用更容易优化的代理排序损失函数作为学习过程中实际要最小化的模型目标函数。给定查询样本q、相应的排序列表和语义相似度等级r,我们可以在一组三元哈希码组上定义一种代理排序损失函数表示如下:
其中,h(q)为查询样本q的哈希码,h(xi)和h(xj)为数据库样本xi和xj的哈希码,ri和rj表示数据库样本xi和xj分别与的查询样本q的相似度等级,M是排序列表的长度;[.]+=max(0,.)表示取该值与0相比较大的那个值;δdH(·)表示两个样本对的汉明距离之差,即表示为δdH(h(q),h(xi),h(xj))=dH(h(q),h(xi))-dH(h(q),h(xj));dH(.,.)表示样本对的汉明距离,即为查询样本q和数据库样本x的汉明距离;ρ是间隔参数,用于控制两个查询样本对(q,xi)和(q,xj)的汉明距离间应该满足的最小间隔;ω是自适应权重,可由下式给出:
其中,Z是定义归一化常量。
给定训练集并令训练集中的所有样本分别做为查询样本q,我们希望学习深度哈希函数来优化关于查询样本q的排序。基于代理排序损失公式2和深度哈希函数公式1,模型目标函数可以由带正则项约束的经验损失给出:
其中W=[w1,w2,...,wK]是一组深度哈希函数的权值,是公式3中的排序代理损失,h(.;W)是公式2中的深度哈希函数,α和β是正则项系数,表示在数据集中的查询样本的每一个比特上求均值,是平衡性惩罚项,用于使哈希码的每一比特在整个训练集上的均值保持在0左右,使得学习过程的收敛更加稳定。是权值衰减项,用于惩罚过大的权值。由于公式1中非光滑的符号函数,不能直接对模型目标函数公式4进行优化。为了处理这个问题,我们将深度哈希函数h(x;w)近似为:
h(x;w)=2σ(wT[fa(x);fb(x)])-1 (6)
其中,σ(.)=1/(1+exp(-.))是逻辑斯谛函数。为了方便模型目标函数梯度的计算,我们把汉明距离重写为内积的形式:
其中,K是哈希码的比特数。
最后,我们使用随机梯度下降法来最小化模型目标函数公式5。可以看到,代理排序损失函数公式3实际上是一系列加权的三元函数之和。对于任意一个三元函数(q,xi,xj),如果
则目标函数对于哈希码的导数分别为:
其中,h(.;W)是深度哈希函数,“mean”表示在小批量样本(mini-batch)上的均值,Nq表示一个小批量样本的样本量。这些导数可以通过反向传播算法传递到下层的CNN模型来更新其每一层的参数。
步骤S4,用步骤S3学习到的深度哈希函数计算图像的哈希码;
如图2所示,输入图像首先被去中心化并缩放至固定的224*224像素,然后经过5层卷积层和2层全连接层得到一个深度特征表达向量,最后输入至哈希编码层,根据公式1和公式2得到哈希码。
步骤S5,计算测试图像的哈希码与训练集中每一个图像的哈希码之间的汉明距离,并根据汉明距离进行图像检索,得到与测试图像相似的图像;其中,汉明距离越小表明两个图像之间的相似度就越大。
为了详细说明本发明的具体实施方式,接下来以某多标签图像数据集为例对于本发明方法进行进一步的说明。所述图像数据集包含269,648张图片,总共有81个语义概念用于标注图片,包括不同的场景和目标,如天空、夜幕、食物以及树木等。在使用本发明方法进行图像检索时,按照以下步骤进行:
步骤S0,将所述多标签图像数据集中的随机5000张图像做为测试用的查询样本,剩下的图像作为测试集,用于训练和检索;
步骤S1,按照图2所示构建深度哈希函数。
步骤S2,根据图像间共有的标签个数计算语义相似度等级r,从而得到关于查询样本的语义相似度排序;
步骤S3,以一种基于三元组的代理排序损失做为实际的模型目标函数,使用随机梯度下降法和反向传播算法,根据目标函数对于哈希码的导数公式8最小化模型目标函数公式5来学习深度哈希函数公式1,得到深度哈希函数;
步骤S4,用步骤S3得到的深度哈希函数分别计算训练和测试图像的64比特哈希码;
步骤S5,计算测试图像的64比特哈希码与训练集中每一个图像的64比特哈希码之间的汉明距离,并根据汉明距离进行图像检索,得到与测试图像相似的图像列表。
本发明在检索结果的排序质量上要优于目前最好的哈希方法。图3给出了一些检索示例,其中第1列是查询图像,其它列是其相应的检索结果。可以看到,检索结果中排序靠前的图像与查询图像有着更多相同的标签。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种利用基于深度语义排序哈希编码的图像检索方法,其特征在于,该方法包括以下步骤:
步骤S0:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;
步骤S1:使用深度卷积神经网络构建深度哈希函数;
步骤S2:根据图像的多标签信息,构建出图像间的语义相似度排序;
步骤S3:以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法和反向传播算法来优化深度哈希函数;
步骤S4:用步骤S3学习到的深度哈希函数计算图像的哈希码;
步骤S5:计算测试图像的哈希码与训练集中每一个图像的哈希码之间的汉明距离,并根据汉明距离来检索图像。
2.根据权利要求1所述的方法,其特征在于,所述深度哈希函数为多层的深度哈希函数,多层的深度哈希函数包含一个七层深度卷积神经网络,以及一个哈希编码层。
3.根据权利要求1所述的方法,其特征在于,所述深度哈希函数为一个深度哈希函数时h(x;w)的定义如下:
h(x;w)=sign(wT[fa(x);fb(x)]) (1)
其中,sign(.)为符号函数,x为数据库样本,w表示哈希编码层的权值,T表示转置,fa(x)和fb(x)分别表示来自于第一个全连接层和第二个全连接层的特征向量。
4.根据权利要求1所述的方法,其特征在于,利用一组所述深度哈希函数h(x;W),获得K比特的哈希码,所述一组深度哈希函数h(x;W)表示如下:
h(x;W)=[h1(x;w1),h2(x;w2),..,hK(x;WK)], (2)
其中,hK(x;wK)为第K个深度哈希函数;wK为第K个深度哈希函数的哈希编码层的权值,W=[w1,w2,...,wK]是一组深度哈希函数的权值,为了保证检索速度,哈希码的比特数K的取值为1≤K≤256。
5.根据权利要求1所述的方法,其特征在于,按照所述语义相似度的等级对数据库样本x进行排序,获得一个关于查询样本q的语义排序列表。
6.根据权利要求1所述的方法,其特征在于,使用三元组的代理排序损失函数作为学习过程中实际要最小化的图像目标函数,用于避免对排序评价标准的直接优化;在一组三元哈希码组上定义所述代理排序损失函数表示如下:
其中h(q)为查询样本q的哈希码,h(xi)和h(xj)为数据库样本xi和xj的哈希码,ri和rj表示数据库样本xi和xj分别与的查询样本q的相似度等级,M是排序列表的长度,[.]+=max(0,.)表示取该值与0相比较大的那个值;δdH(·)表示两个样本对的汉明距离之差,即表示为δdH(h(q),h(xi),h(xi))=dH(h(q),h(xi))-dH(h(q),h(xi));dH(.,.)表示样本对的汉明距离,即为查询样本q和数据库样本x的汉明距离;ρ是间隔参数,用于控制两个查询样本对(q,xi)和(q,xj)的汉明距离间应该满足的最小间隔;ω是自适应权重由下式给出:
其中,Z是定义归一化常量。
7.根据权利要求6所述的方法,其特征在于,给定训练集并令训练集中的所有样本分别做为查询样本q,学习深度哈希函数来优化关于查询样本q的排序;基于代理排序损失函数和深度哈希函数,模型目标函数由带正则项约束的经验损失给出:
其中,W=[w1,w2,..,wK]是一组深度哈希函数的权值,是排序代理损失,h(.;W)是公式(2)中的深度哈希函数,α和β是正则项系数,表示在数据集中的查询样本的每一个比特上求均值,是平衡性惩罚项,用于使哈希码的每一比特在整个训练集上的均值保持在0左右,使得学习过程的收敛更加稳定;是权值衰减项,用于惩罚过大的权值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510272498.1A CN104834748B (zh) | 2015-05-25 | 2015-05-25 | 一种利用基于深度语义排序哈希编码的图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510272498.1A CN104834748B (zh) | 2015-05-25 | 2015-05-25 | 一种利用基于深度语义排序哈希编码的图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104834748A CN104834748A (zh) | 2015-08-12 |
CN104834748B true CN104834748B (zh) | 2018-08-03 |
Family
ID=53812634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510272498.1A Active CN104834748B (zh) | 2015-05-25 | 2015-05-25 | 一种利用基于深度语义排序哈希编码的图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104834748B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107870321B (zh) * | 2017-11-03 | 2020-12-29 | 电子科技大学 | 基于伪标签学习的雷达一维距离像目标识别方法 |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279554B (zh) * | 2015-09-29 | 2017-12-15 | 东方网力科技股份有限公司 | 基于哈希编码层的深度神经网络的训练方法及装置 |
CN105354228B (zh) * | 2015-09-30 | 2019-06-21 | 小米科技有限责任公司 | 相似图搜索方法及装置 |
CN105512273A (zh) * | 2015-12-03 | 2016-04-20 | 中山大学 | 一种基于可变长深度哈希学习的图像检索方法 |
CN105512289B (zh) * | 2015-12-07 | 2018-08-14 | 郑州金惠计算机系统工程有限公司 | 基于深度学习和哈希的图像检索方法 |
CN106408001B (zh) * | 2016-08-26 | 2019-10-11 | 西安电子科技大学 | 基于深度核哈希的感兴趣区域快速检测方法 |
CN106383891B (zh) * | 2016-09-22 | 2019-04-23 | 重庆理工大学 | 一种基于深度哈希的医学图像分布式检索方法 |
CN106383912B (zh) * | 2016-10-14 | 2019-09-03 | 北京字节跳动网络技术有限公司 | 一种图片检索方法和装置 |
WO2018076130A1 (zh) * | 2016-10-24 | 2018-05-03 | 中国科学院自动化研究所 | 物体识别模型的建立方法及物体识别方法 |
CN106557332A (zh) * | 2016-11-30 | 2017-04-05 | 上海寒武纪信息科技有限公司 | 一种指令生成过程的复用方法及装置 |
CN106776553A (zh) * | 2016-12-07 | 2017-05-31 | 中山大学 | 一种基于深度学习的非对称文本哈希方法 |
CN106649688A (zh) * | 2016-12-16 | 2017-05-10 | 深圳市华尊科技股份有限公司 | 一种图像检索方法及终端 |
CN106649782B (zh) * | 2016-12-28 | 2020-03-31 | 电子科技大学 | 一种图片检索方法和系统 |
CN107067020B (zh) | 2016-12-30 | 2019-11-15 | 腾讯科技(上海)有限公司 | 图片识别方法及装置 |
CN106777349A (zh) * | 2017-01-16 | 2017-05-31 | 广东工业大学 | 基于深度学习的人脸检索系统及方法 |
CN107092918B (zh) * | 2017-03-29 | 2020-10-30 | 太原理工大学 | 一种基于语义特征和有监督哈希的图像检索方法 |
CN107402947B (zh) * | 2017-03-29 | 2020-12-08 | 北京猿力教育科技有限公司 | 图片检索模型建立方法和装置、图片检索方法和装置 |
CN108805280B (zh) * | 2017-04-26 | 2020-11-03 | 深圳荆虹科技有限公司 | 一种图像检索的方法和装置 |
CN107451189A (zh) * | 2017-06-20 | 2017-12-08 | 中山大学 | 一种基于哈希编码的无监督图像检索方法 |
CN107423376B (zh) * | 2017-07-10 | 2019-12-27 | 上海媒智科技有限公司 | 一种有监督深度哈希快速图片检索方法及系统 |
CN107480261B (zh) * | 2017-08-16 | 2020-06-16 | 上海荷福人工智能科技(集团)有限公司 | 一种基于深度学习细粒度人脸图像快速检索方法 |
CN107918636B (zh) * | 2017-09-07 | 2021-05-18 | 苏州飞搜科技有限公司 | 一种人脸快速检索方法、系统 |
CN107832335B (zh) * | 2017-10-10 | 2019-12-17 | 西安电子科技大学 | 一种基于上下文深度语义信息的图像检索方法 |
CN109711422B (zh) * | 2017-10-26 | 2023-06-30 | 北京邮电大学 | 图像数据处理、模型的建立方法、装置、计算机设备和存储介质 |
CN107992611B (zh) * | 2017-12-15 | 2018-12-28 | 清华大学 | 基于柯西分布哈希方法的高维数据检索方法与系统 |
CN108280187B (zh) * | 2018-01-24 | 2021-06-01 | 湖南省瞬渺通信技术有限公司 | 一种基于卷积神经网络深度特征的分级图像检索方法 |
CN108427738B (zh) * | 2018-03-01 | 2022-03-25 | 中山大学 | 一种基于深度学习的快速图像检索方法 |
US11429820B2 (en) * | 2018-03-13 | 2022-08-30 | Recogni Inc. | Methods for inter-camera recognition of individuals and their properties |
CN108897791B (zh) * | 2018-06-11 | 2021-09-03 | 云南师范大学 | 一种基于深度卷积特征和语义相似度量的图像检索方法 |
CN108829848A (zh) * | 2018-06-20 | 2018-11-16 | 华中科技大学 | 一种图像检索方法和系统 |
CN108932314A (zh) * | 2018-06-21 | 2018-12-04 | 南京农业大学 | 一种基于深度哈希学习的菊花图像内容检索方法 |
CN110110122A (zh) * | 2018-06-22 | 2019-08-09 | 北京交通大学 | 基于多层语义深度哈希算法的图像-文本跨模态检索 |
CN109166615B (zh) * | 2018-07-11 | 2021-09-10 | 重庆邮电大学 | 一种随机森林哈希的医学ct图像存储与检索方法 |
CN109145132B (zh) * | 2018-07-12 | 2021-06-18 | 北京奇虎科技有限公司 | 从图像中提取哈希码的方法、装置及图像检索方法、装置 |
CN108766461B (zh) * | 2018-07-17 | 2021-01-26 | 厦门美图之家科技有限公司 | 音频特征提取方法及装置 |
CN109063113B (zh) * | 2018-07-30 | 2021-11-02 | 成都快眼科技有限公司 | 一种基于不对称深度离散哈希的快速图像检索方法、检索模型及模型构建方法 |
CN109241317B (zh) * | 2018-09-13 | 2022-01-11 | 北京工商大学 | 基于深度学习网络中度量损失的行人哈希检索方法 |
CN109558890B (zh) * | 2018-09-30 | 2023-03-31 | 天津大学 | 基于自适应权重哈希循环对抗网络的零样本图像分类方法 |
CN109800314A (zh) * | 2019-01-03 | 2019-05-24 | 上海大学 | 一种利用深度卷积网络生成用于图像检索的哈希码的方法 |
CN109933682B (zh) * | 2019-01-11 | 2022-01-04 | 上海交通大学 | 一种基于语义与内容信息结合的图像哈希检索方法及系统 |
CN109918532B (zh) * | 2019-03-08 | 2023-08-18 | 苏州大学 | 图像检索方法、装置、设备及计算机可读存储介质 |
CN109960738B (zh) * | 2019-03-15 | 2020-12-08 | 西安电子科技大学 | 基于深度对抗哈希学习的大规模遥感影像内容检索方法 |
CN109960737B (zh) * | 2019-03-15 | 2020-12-08 | 西安电子科技大学 | 半监督深度对抗自编码哈希学习的遥感影像内容检索方法 |
CN109977250B (zh) * | 2019-03-20 | 2023-03-28 | 重庆大学 | 融合语义信息和多级相似性的深度哈希图像检索方法 |
CN111563184B (zh) * | 2020-03-25 | 2023-04-18 | 中山大学 | 一种基于深度学习的视频哈希检索表征转换方法 |
CN111984810A (zh) * | 2020-08-17 | 2020-11-24 | 中移(杭州)信息技术有限公司 | 图像检索的方法及相关设备 |
CN112765382A (zh) * | 2021-01-20 | 2021-05-07 | 上海依图网络科技有限公司 | 图像搜索方法及其装置、介质和电子设备 |
CN113010720B (zh) * | 2021-02-24 | 2022-06-07 | 华侨大学 | 一种基于关键对象特征的深度监督跨模态检索方法 |
CN113052240B (zh) * | 2021-03-26 | 2024-03-05 | 北京达佳互联信息技术有限公司 | 图像处理模型的确定方法、装置、设备及存储介质 |
CN114155403A (zh) * | 2021-10-19 | 2022-03-08 | 中山大学 | 一种基于深度学习的图像分段哈希排序方法 |
CN114648648B (zh) * | 2022-02-21 | 2024-09-27 | 清华大学 | 一种深度内省度量学习方法、装置及存储介质 |
CN116383422B (zh) * | 2023-04-07 | 2023-11-03 | 四川大学 | 一种基于锚点的无监督跨模态哈希检索方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831161A (zh) * | 2012-07-18 | 2012-12-19 | 天津大学 | 用于图像检索的基于流形正则化的半监督排序学习方法 |
CN103593474A (zh) * | 2013-11-28 | 2014-02-19 | 中国科学院自动化研究所 | 基于深度学习的图像检索排序方法 |
CN104346440A (zh) * | 2014-10-10 | 2015-02-11 | 浙江大学 | 一种基于神经网络的跨媒体哈希索引方法 |
-
2015
- 2015-05-25 CN CN201510272498.1A patent/CN104834748B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831161A (zh) * | 2012-07-18 | 2012-12-19 | 天津大学 | 用于图像检索的基于流形正则化的半监督排序学习方法 |
CN103593474A (zh) * | 2013-11-28 | 2014-02-19 | 中国科学院自动化研究所 | 基于深度学习的图像检索排序方法 |
CN104346440A (zh) * | 2014-10-10 | 2015-02-11 | 浙江大学 | 一种基于神经网络的跨媒体哈希索引方法 |
Non-Patent Citations (1)
Title |
---|
Deep Semantic Ranking Based Hashing for Multi-Label Image Retrieval;Fang Zhao etal;《Computer Vision & Pattern Recognition》;20150419;第1556-1564页 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107870321B (zh) * | 2017-11-03 | 2020-12-29 | 电子科技大学 | 基于伪标签学习的雷达一维距离像目标识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104834748A (zh) | 2015-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104834748B (zh) | 一种利用基于深度语义排序哈希编码的图像检索方法 | |
CN107480261B (zh) | 一种基于深度学习细粒度人脸图像快速检索方法 | |
CN109063163B (zh) | 一种音乐推荐的方法、装置、终端设备和介质 | |
CN110555112B (zh) | 一种基于用户正负偏好学习的兴趣点推荐方法 | |
CN106407352B (zh) | 基于深度学习的交通图像检索方法 | |
CN107330451B (zh) | 基于深度卷积神经网络的服装属性检索方法 | |
CN105631479B (zh) | 基于非平衡学习的深度卷积网络图像标注方法及装置 | |
CN107944035B (zh) | 一种融合视觉特征和用户评分的图像推荐方法 | |
CN103324677B (zh) | 一种可分级的快速图像gps位置估计方法 | |
CN109740655B (zh) | 基于矩阵分解及神经协同过滤的物品评分预测方法 | |
CN110362723A (zh) | 一种题目特征表示方法、装置及存储介质 | |
CN111310063A (zh) | 基于神经网络的记忆感知门控因子分解机物品推荐方法 | |
CN109033107A (zh) | 图像检索方法和装置、计算机设备和存储介质 | |
Islam et al. | InceptB: a CNN based classification approach for recognizing traditional bengali games | |
CN107122411A (zh) | 一种基于离散多视图哈希的协同过滤推荐方法 | |
CN107665261A (zh) | 视频查重的方法及装置 | |
CN108804577B (zh) | 一种资讯标签兴趣度的预估方法 | |
CN112749330B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN109886342A (zh) | 基于机器学习的模型训练方法和装置 | |
CN114693397A (zh) | 一种基于注意力神经网络的多视角多模态商品推荐方法 | |
CN113806580B (zh) | 基于层次语义结构的跨模态哈希检索方法 | |
CN109146640A (zh) | 一种线上商品搜索方法及系统 | |
CN115545832A (zh) | 商品搜索推荐方法及其装置、设备、介质 | |
CN110019653A (zh) | 一种融合文本和标签网络的社交内容表征方法和系统 | |
CN111047406B (zh) | 一种电信套餐推荐方法、装置、存储介质和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |