CN110851645A - 一种基于深度度量学习下相似性保持的图像检索方法 - Google Patents
一种基于深度度量学习下相似性保持的图像检索方法 Download PDFInfo
- Publication number
- CN110851645A CN110851645A CN201911089274.1A CN201911089274A CN110851645A CN 110851645 A CN110851645 A CN 110851645A CN 201911089274 A CN201911089274 A CN 201911089274A CN 110851645 A CN110851645 A CN 110851645A
- Authority
- CN
- China
- Prior art keywords
- samples
- image
- query
- positive
- negative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度度量学习下相似性保持的图像检索方法,所述方法通过对具有代表性信息的样本对进行选择以及学习相似样本与查询图片的距离来保持内部的相似性结构,并根据正负样本对周围样本的分布情况设置不同的权重进行学习以保持其相似结构的一致性,从而更准确地提取图像特征。本发明将结构保持和正负样本挖掘理论引入到图像检索中,根据正样本与查询图片的欧式距离以及负样本周围样本的分布情况调整网络参数,能够更全面的学习图像特征从而进行更准确的检索。本发明充分考虑了正样本和负样本的分布情况对实验的影响,可以根据模型的训练效果对正样本和负样本的数量及选择进行调整。
Description
技术领域
本发明涉及一种图像检索方法,具体涉及一种基于深度度量学习下相似性保持的图像检索方法。
背景技术
近年来,互联网上视觉数据呈现出爆炸式的增长,越来越多的研究工作围绕图像搜索或图像检索技术而展开。早期的搜索技术仅采用文本信息,忽视了视觉内容作为排序的线索,导致搜索文本和视觉内容不一致。基于内容的图像检索(CBIR)技术充分利用视觉内容识别相关图像,在近几年来获得了广泛关注。
从众多图像中检测稳健且有辨别力的特征是图像检索的一个重大挑战。传统方法依赖于手工制作的特征,其中包括光谱(颜色)、纹理和形状特征等全局特征,以及像词袋(BoW)、本地聚合描述符(VLAD)矢量和Fisher矢量(FV)等聚合特征,这种设计耗时并且需要大量的专业知识。
深度学习的发展推动了CBIR的发展,从手工描述符演变到从卷积神经网络(CNNS)中提取学习的卷积描述符。深度卷积神经网络特征是高度抽象的并且具有高级语义信息。此外,深度特征从数据中自动学习,是数据驱动的,在设计特征方面不需要人为的努力,这使得深度学习技术在大规模图像检索中极具价值。深度度量学习(DML)是一种结合深度学习和度量学习的技术,其中度量学习的目的是学习嵌入空间,即鼓励相似样本的嵌入向量更接近,而不相似的样本彼此推开。深度度量学习利用深度卷积神经网络的鉴别能力将图像嵌入到度量空间中,其中可以使用欧几里得距离等简单的度量直接计算测量图像之间的语义相似度。深度度量学习被应用到很多自然图像领域,包括人脸识别、视觉追踪、自然图像检索。
在DML框架中,损失函数起着至关重要的作用,之前的研究中已经提出了大量的损失函数。对比损失捕获成对样本之间的关系,即相似性或相异性,使正对的距离最小化,同时大于边界的负对的距离最大化。基于三重损失也有很广泛的研究,三元组由查询图片、正样本和负样本组成。三重损失的目的是学习一个距离度量使得查询图片相比于负样本更接近正样本。通常来说,由于考虑了正负对之间的关系,三重损失优于对比损失。受此启发,最近很多研究都考虑了多个样本之间更丰富的结构化信息,并且在很多应用(如检索和聚类)上取得了很好的性能。
然而,目前最先进的DML方法仍然有一定的局限性。在之前的一些损失函数中,考虑了对多个样本的结构化信息进行合并,有的方法将和查询图片相同类别的所有除查询图片外的样本都用作正样本,将和查询图片不同类别的样本都当作负样本。通过这种方法可以利用所有非平凡样本构建一个信息量更大的结构用于学习更多的有区别的嵌入向量,虽然这样得到的信息量很大很丰富但存在很多的冗余信息,对计算量、计算成本和存储成本都带来了很大的麻烦。同时,在之前的结构性损失中没有考虑到类内的样本分布,所有的损失都希望可以尽可能靠近同一类中的样本。因此,这些算法都试图将同一类的样本压缩到特征空间中的一个点上,并且可能很容易丢失它们的一些相似性结构和有用的样本信息。
发明内容
本发明的目的是提供一种基于深度度量学习下相似性保持的图像检索方法,通过对具有代表性信息的样本对进行选择以及学习相似样本与查询图片的距离来保持内部的相似性结构,并根据正负样本对周围样本的分布情况设置不同的权重进行学习以保持其相似结构的一致性,从而更准确地提取图像特征。
本发明的目的是通过以下技术方案实现的:
一种基于深度度量学习下相似性保持的图像检索方法,包括如下步骤:
步骤1:初始化微调CNN网络,提取查询图像和训练数据库中图像的底层特征;
步骤2:通过计算步骤1提取得到的查询图像和训练数据库中所有图像底层特征的欧氏距离,以及根据训练数据的标签属性将训练集进行正负样本集划分,基于训练集样本与查询图像特征向量的距离挑选正负样本对,选择与查询图像同类别最不像的五个样本作为正样本,选择与查询图像不同类别且彼此类别不同的五个与查询图像最像的样本作为负样本,即每个查询图像通过计算获得五个正样本对及五个负样本对;
步骤3:设定阈值τ、α,跟据负样本和正样本分别的排序序号列表计算每个正负样本对的权重值;
步骤4:将步骤3获得的训练数据的真实排序序号分别赋予给选择出的负样本和正样本,将序号与其阈值相结合,分配给正负样本不同的权重,运用基于相似性保持的损失函数计算损失值,调整正负样本与查询图像特征向量的距离;
步骤5:通过反向传播和共享权重对深度卷积网络的初始参数进行进一步调整,得到深度卷积网络的更新参数;
步骤6:重复步骤1到步骤5,不断的训练更新网络参数,直到结束训练,epochdefault为30;
步骤7:对于测试阶段,将测试数据集中的查询图像和其他样本图像输入步骤6得到的深度卷积网络中,得到与查询图像相关的图像列表;
步骤8:选取查询图像以及步骤7中获取的各自相应图像列表中的Top-N图像进行特征排序,对特征进行加权求和取平均作为查询图像,再进行步骤7的操作,得到最终的图像列表。
相比于现有技术,本发明具有如下优点:
1、本发明将结构保持和正负样本挖掘理论引入到图像检索中,根据正样本与查询图片的欧式距离以及负样本周围样本的分布情况调整网络参数,能够更全面的学习图像特征从而进行更准确的检索。
2、本发明充分考虑了正样本和负样本的分布情况对实验的影响,可以根据模型的训练效果对正样本和负样本的数量及选择进行调整。
附图说明
图1是本发明基于深度度量学习下相似性保持的图像检索方法及其测试的流程图;
图2是本发明的样本对挖掘选择图;
图3是本发明检索结果的可视化呈现;
图4是本发明检索结果示例图。
具体实施方式
下面结合附图对本发明的技术方案作进一步的说明,但并不局限于此,凡是对本发明技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的保护范围中。
本发明考虑到样本周围样本的分布决定着在特征提取时特征向量贡献的大小,从而影响是否能够对图像特征进行准确提取进而对图像检索有着重要的影响,提出一种基于深度度量学习下相似性保持的图像检索方法。如图1所示,所述图像检索方法包括以下步骤:
步骤1:初始化微调CNN网络,提取查询图像和训练数据库中图像的底层特征。
提取底层特征是为了得到查询图像的初始特征表示。本发明采用的是微调CNN网络(ResNet50、VGG)的卷积部分对查询图像和训练数据库中图像的底层特征进行初步处理,即去掉卷积后的全连接层,并采用平均池化(SPoC)代替全连接后的最后一个最大池化进行池化操作。微调CNN网络如图1所示。
本步骤中,池化层采用SPoC池化,对每一个通道,取该通道上所有激活值的平均值作为通道池化层的输出值。
本步骤中,所述SPoC池化的计算方式为:
式中,K表示维度,x作为输入并产生一个向量f作为池化过程的输出,|χK|表示特征向量的个数,fk表示特征向量。
步骤2:通过计算步骤1提取得到的查询图像和训练数据库中所有图像底层特征的欧氏距离,以及根据训练数据的标签属性将训练集进行正负样本集划分;基于训练集样本与查询图像特征向量的距离挑选正负样本对,选择与查询图像同类别最不像的五个样本作为正样本,选择与查询图像不同类别且彼此类别不同的五个与查询图像最像的样本作为负样本,即每个查询图像通过计算获得五个正样本对及五个负样本对。
本步骤中,每个查询图像对应五个正样本和五个负样本,正样本与查询图像有很高的相似度,但是这些所选择的正样本在所有与查询图像类别相同的图片中相似度最低,而所选择的负样本是所有与查询图像不同类别样本中的相似度较高的。
本步骤中,所述正负样本是在训练的过程中获得。正负样本的选择依赖于当前网络的参数并且每轮训练都进行更新。通过对训练集中所有图片与查询样本的欧式距离计算,根据不同的选择规则进行正负样本的选择。
本步骤中,所述正相关对是从一组图像中随机选择的正样本,到查询图像的描述符距离最大的五个图像被选择为正样本,表示为:
其中,m(q)表示描述同一物体的难样本,M(q)表示基于q簇中的摄像机构建的正相关候选图像池,q表示查询图片,p表示所选的正样本,f(x)是学习的度量函数,在特征空间中正样本与查询图像的相似度高于负样本与查询图像的相似度。
本步骤中,所述负样本的选择图如图2所示,五个负样本是从不同于查询图像的聚类中选择的。
本步骤中,利用已有的方法对查询图片和训练数据集进行特征提取,计算提取到的查询图像与数据集图像的特征向量的欧式距离,在训练数据集中随机选取若干负样本数据作为待选高相关性图像池。
本步骤中,所述图像池选取同查询图像对应的特征向量欧式距离最小的N个图像聚类。
本步骤中,所述五个正样本的选择方法如图2所示,对于查询图像来说,计算查询图像的特征向量f(q),以及所有与查询图像同类的图像样本的特征向量f(p)。通过向量计算选择这些图像中与查询图像相似度最低的五个样本作为查询图片的正样本对。
本步骤中,所述五个负样本的选择方法如图2所示,对于查询图像来说,计算查询图像的特征向量f(q),以及所有与查询图像不同类的图像样本特征向量f(n)。通过向量计算后按照大小进行排序,在这些样本中选择与查询图像最像的五个不同类别的图像,同时这五个图像也不属于同一类别,作为负样本对。
步骤3:根据设定的阈值τ、α,跟据负样本和正样本分别的排序序号列表计算每个正负样本对的权重值。
本步骤中,使正样本比任何负样本更接近查询图像,同时将负样本推到比正样本更远的位置α。用边缘来划分正样本和负样本,即正样本离查询图片最大距离为τ-α。因此,α是正负样本之间的差距,也是选择正负样本的标准。如图2所示,最终希望达到的效果是所有正样本都在与查询图像距离τ-α的范围内,所有负样本都推出到离查询图像距离τ之外,正负样本之间距离为α。
本步骤中,计算并记录距离查询样本距离为(margin-(τ-α),margin)的所有与查询样本同类别的图像数量,记做hardnum,为后面对正样本的权重设置最准备。
本步骤中,对于查询样本Pi c表示所有与属于同一类别的样本(即:正样本)的集合,表示为则Pi c中样本的数量为|Pi c|=Nc-1,Nc表示图像类别c的样本数量,i和j分别表示类别中第i个和第j个样本。表示所有与不同类别的样本(即:负样本)集合,表示为则中样本的数量为Nk表示图像类别k的样本数量,k和c分别表示类别k和类别c。步骤2中挑选出的五个正样本和五个负样本与查询图像一同组成元组数据集其中表示五个被选择的正样本的集合,表示五个被选择的负样本的集合。表示正样本对的个数,表示负样本对的个数。
其中,rj是负样本在负样本列表中的排序位置。
其中,ni是本步骤中所记录的难正样本数量hardnum。
步骤4:将步骤3获得的训练数据的真实排序序号分别赋予给选择出的负样本和正样本,将序号与其阈值相结合,分配给正负样本不同的权重,运用基于相似性保持的损失函数计算损失值,调整正负样本与查询图像特征向量的距离。
本步骤中,所述基于相似性保持的损失函数可以调整损失值优化参数来学习判别特征表示。
本发明要训练一个双分支暹罗网络,这个网络除了损失函数外,其余完全相同,网络的两个分支共享相同的网络结构并且共享网络参数。
对于同查询图像具有高相关性、在数据集中已经标记为正相关的图像,即在集合中的图像,我们要保证它在特征空间中与查询图像保持固定的欧式距离τ-α,在这个距离内,正样本能够保持其结构特征。对于组内的所有正样本,如果它与查询图像的欧式距离小于按序边界值,则取loss=0,图像被视为容易样本,如果它与查询图像的欧式距离大于按序边界值,则计算损失。
对于同查询图像具有低相关性的图像,在网络训练过程中我们将其标记为其所处与训练集合中的数据,对于组内的所有负样本,如果它与查询图像的欧式距离大于按序边界值,则取夹紧下边界值即loss=0,图像被视为无用样本,如果它与查询图像的欧式距离小于按序边界值,则计算损失。
步骤5:通过反向传播和共享权重对深度卷积网络的初始参数进行调整,得到深度卷积网络的最终参数。
本步骤中,基于成对损失值对深度网络的参数进行全局调整。在本发明的实施中,采用著名的后向传播算法进行全局参数调整,最终得到所述深度网络的参数。
步骤6:重复步骤1到步骤5,不断的训练更新网络参数,直到结束训练,epochdefault为30。
步骤7:对于测试阶段,将测试数据集中的查询图像和其他样本图像输入步骤6得到的深度卷积网络中,得到与查询图像相关的图像列表,测试图如图1所示。
本步骤中,所述池化层采用与训练中一致的SPoC均值池化。
本步骤中,所述正则化采用L2正则化:
式中,m为样本数目,hθ(x)是我们的假设函数,(hθ(x)-y)2是单个样本的平方差,λ为正则化参数,θ为所求参数。
步骤8:选取查询图像以及步骤7中获取的图像列表中的Top-N图像进行特征排序,对特征进行加权求和取平均作为查询图像,再进行步骤7的操作,得到最终的图像列表。
本步骤中,特征排序的方法为:计算测试图片特征向量与查询图片特征向量的欧式距离,由小到大依次排序。
本步骤中,查询扩展通常会导致准确性的大幅提升,其工作过程包括以下步骤:
步骤8.1,初始查询阶段,使用查询图像的特证向量进行查询,通过查询得到返回的TopN个结果,前N个结果可能会经历空间验证阶段,其中与查询不匹配的结果会丢弃。
步骤8.2,将剩余的结果与原始查询一起进行求和并进行重新的正则化;
步骤8.3,使用组合描述符进行第二次查询,生成检索图像的最终列表,最后查询结果如图3和图4所示。
Claims (10)
1.一种基于深度度量学习下相似性保持的图像检索方法,其特征在于所述方法包括如下步骤:
步骤1:初始化微调CNN网络,提取查询图像和训练数据库中图像的底层特征;
步骤2:通过计算步骤1提取得到的查询图像和训练数据库中所有图像底层特征的欧氏距离,以及根据训练数据的标签属性将训练集进行正负样本集划分,基于训练集样本与查询图像特征向量的距离挑选正负样本对,选择与查询图像同类别最不像的五个样本作为正样本,选择与查询图像不同类别且彼此类别不同的五个与查询图像最像的样本作为负样本;
步骤3:设定阈值τ、α,跟据负样本和正样本分别的排序序号列表计算每个正负样本对的权重值;
步骤4:将步骤3获得的训练数据的真实排序序号分别赋予给选择出的负样本和正样本,将序号与其阈值相结合,分配给正负样本不同的权重,运用基于相似性保持的损失函数计算损失值,调整正负样本与查询图像特征向量的距离;
步骤5:通过反向传播和共享权重对深度卷积网络的初始参数进行进一步调整,得到深度卷积网络的更新参数;
步骤6:重复步骤1到步骤5,不断的训练更新网络参数,直到结束训练,epoch default为30;
步骤7:对于测试阶段,将测试数据集中的查询图像和其他样本图像输入步骤6得到的深度卷积网络中,得到与查询图像相关的图像列表;
步骤8:选取查询图像以及步骤7中获取的各自相应图像列表中的Top-N图像进行特征排序,对特征进行加权求和取平均作为查询图像,再进行步骤7的操作,得到最终的图像列表。
2.根据权利要求1所述的基于深度度量学习下相似性保持的图像检索方法,其特征在于所述步骤1中,提取查询图像和训练数据库中图像的底层特征的方法如下:采用的是微调CNN网络的卷积部分对查询图像和训练数据库中图像的底层特征进行初步处理,即去掉卷积后的全连接层,并采用平均池化代替全连接后的最后一个最大池化进行池化操作。
3.根据权利要求1所述的基于深度度量学习下相似性保持的图像检索方法,其特征在于所述步骤3中,所有正样本都在与查询图像距离τ-α的范围内,所有负样本都推出到离查询图像距离τ之外,正负样本之间距离为α。
9.根据权利要求1所述的基于深度度量学习下相似性保持的图像检索方法,其特征在于所述步骤8中,特征排序的方法为:计算测试图片特征向量与查询图片特征向量的欧式距离,由小到大依次排序。
10.根据权利要求1所述的基于深度度量学习下相似性保持的图像检索方法,其特征在于所述步骤8中,得到最终图像列表的方法如下:
步骤8.1,初始查询阶段,使用查询图像的特证向量进行查询,通过查询得到返回的TopN个结果,前N个结果可能会经历空间验证阶段,其中与查询不匹配的结果会丢弃;
步骤8.2,将剩余的结果与原始查询一起进行求和并进行重新的正则化;
步骤8.3,使用组合描述符进行第二次查询,生成检索图像的最终列表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911089274.1A CN110851645B (zh) | 2019-11-08 | 2019-11-08 | 一种基于深度度量学习下相似性保持的图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911089274.1A CN110851645B (zh) | 2019-11-08 | 2019-11-08 | 一种基于深度度量学习下相似性保持的图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110851645A true CN110851645A (zh) | 2020-02-28 |
CN110851645B CN110851645B (zh) | 2022-09-13 |
Family
ID=69600174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911089274.1A Active CN110851645B (zh) | 2019-11-08 | 2019-11-08 | 一种基于深度度量学习下相似性保持的图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110851645B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308139A (zh) * | 2020-10-29 | 2021-02-02 | 中国科学院计算技术研究所厦门数据智能研究院 | 一种基于主动学习的样本标注方法 |
CN112508105A (zh) * | 2020-12-11 | 2021-03-16 | 南京富岛信息工程有限公司 | 一种采油机故障检测与检索方法 |
CN112598658A (zh) * | 2020-12-29 | 2021-04-02 | 哈尔滨工业大学芜湖机器人产业技术研究院 | 基于轻量级孪生卷积神经网络的病识别方法 |
CN112766301A (zh) * | 2020-12-11 | 2021-05-07 | 南京富岛信息工程有限公司 | 一种采油机示功图相似性判断方法 |
CN112800959A (zh) * | 2021-01-28 | 2021-05-14 | 华南理工大学 | 一种用于人脸识别中数据拟合估计的困难样本发掘方法 |
CN112801208A (zh) * | 2021-02-25 | 2021-05-14 | 清华大学 | 基于结构化代理的深度度量学习方法和装置 |
CN113127661A (zh) * | 2021-04-06 | 2021-07-16 | 中国科学院计算技术研究所 | 基于循环查询扩展的多监督医学图像检索方法和系统 |
CN113297411A (zh) * | 2021-07-26 | 2021-08-24 | 深圳市信润富联数字科技有限公司 | 轮形图谱相似性的度量方法、装置、设备及存储介质 |
CN113361497A (zh) * | 2021-08-09 | 2021-09-07 | 北京惠朗时代科技有限公司 | 基于训练样本指纹识别智能尾箱应用方法及设备 |
CN113591782A (zh) * | 2021-08-12 | 2021-11-02 | 北京惠朗时代科技有限公司 | 一种基于训练式的人脸识别智能保险柜应用方法及系统 |
CN114020974A (zh) * | 2022-01-04 | 2022-02-08 | 阿里巴巴达摩院(杭州)科技有限公司 | 样本数据确定及对话意图识别方法、存储介质及程序产品 |
CN114998960A (zh) * | 2022-05-28 | 2022-09-02 | 华南理工大学 | 一种基于正负样本对比学习的表情识别方法 |
CN115344728A (zh) * | 2022-10-17 | 2022-11-15 | 北京百度网讯科技有限公司 | 图像检索模型训练、使用方法、装置、设备和介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120308121A1 (en) * | 2011-06-03 | 2012-12-06 | International Business Machines Corporation | Image ranking based on attribute correlation |
US9262688B1 (en) * | 2011-09-24 | 2016-02-16 | Z Advanced Computing, Inc. | Method and system for analyzing and recognition of an emotion or expression from multimedia, text, or sound track |
CN105512273A (zh) * | 2015-12-03 | 2016-04-20 | 中山大学 | 一种基于可变长深度哈希学习的图像检索方法 |
CN106897390A (zh) * | 2017-01-24 | 2017-06-27 | 北京大学 | 基于深度度量学习的目标精确检索方法 |
CN107273458A (zh) * | 2017-06-01 | 2017-10-20 | 百度在线网络技术(北京)有限公司 | 深度模型训练方法及装置、图像检索方法及装置 |
CN108427738A (zh) * | 2018-03-01 | 2018-08-21 | 中山大学 | 一种基于深度学习的快速图像检索方法 |
CN108595636A (zh) * | 2018-04-25 | 2018-09-28 | 复旦大学 | 基于深度跨模态相关性学习的手绘草图的图像检索方法 |
CN109871461A (zh) * | 2019-02-13 | 2019-06-11 | 华南理工大学 | 基于深度哈希网络和子块重排序的大规模图像子块检索方法 |
-
2019
- 2019-11-08 CN CN201911089274.1A patent/CN110851645B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120308121A1 (en) * | 2011-06-03 | 2012-12-06 | International Business Machines Corporation | Image ranking based on attribute correlation |
US9262688B1 (en) * | 2011-09-24 | 2016-02-16 | Z Advanced Computing, Inc. | Method and system for analyzing and recognition of an emotion or expression from multimedia, text, or sound track |
CN105512273A (zh) * | 2015-12-03 | 2016-04-20 | 中山大学 | 一种基于可变长深度哈希学习的图像检索方法 |
CN106897390A (zh) * | 2017-01-24 | 2017-06-27 | 北京大学 | 基于深度度量学习的目标精确检索方法 |
CN107273458A (zh) * | 2017-06-01 | 2017-10-20 | 百度在线网络技术(北京)有限公司 | 深度模型训练方法及装置、图像检索方法及装置 |
CN108427738A (zh) * | 2018-03-01 | 2018-08-21 | 中山大学 | 一种基于深度学习的快速图像检索方法 |
CN108595636A (zh) * | 2018-04-25 | 2018-09-28 | 复旦大学 | 基于深度跨模态相关性学习的手绘草图的图像检索方法 |
CN109871461A (zh) * | 2019-02-13 | 2019-06-11 | 华南理工大学 | 基于深度哈希网络和子块重排序的大规模图像子块检索方法 |
Non-Patent Citations (2)
Title |
---|
DIMITRIOS MARMANIS 等: "Deep Learning Earth Observation Classification Using ImageNet Pretrained Networks", 《IEEE GEOSCIENCE AND REMOTE SENSING LETTERS》 * |
何霞等: "基于Faster RCNNH的多任务分层图像检索技术", 《计算机科学》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308139B (zh) * | 2020-10-29 | 2024-03-22 | 中科(厦门)数据智能研究院 | 一种基于主动学习的样本标注方法 |
CN112308139A (zh) * | 2020-10-29 | 2021-02-02 | 中国科学院计算技术研究所厦门数据智能研究院 | 一种基于主动学习的样本标注方法 |
CN112508105B (zh) * | 2020-12-11 | 2024-03-19 | 南京富岛信息工程有限公司 | 一种采油机故障检测与检索方法 |
CN112766301A (zh) * | 2020-12-11 | 2021-05-07 | 南京富岛信息工程有限公司 | 一种采油机示功图相似性判断方法 |
CN112766301B (zh) * | 2020-12-11 | 2024-04-12 | 南京富岛信息工程有限公司 | 一种采油机示功图相似性判断方法 |
CN112508105A (zh) * | 2020-12-11 | 2021-03-16 | 南京富岛信息工程有限公司 | 一种采油机故障检测与检索方法 |
CN112598658A (zh) * | 2020-12-29 | 2021-04-02 | 哈尔滨工业大学芜湖机器人产业技术研究院 | 基于轻量级孪生卷积神经网络的病识别方法 |
CN112800959A (zh) * | 2021-01-28 | 2021-05-14 | 华南理工大学 | 一种用于人脸识别中数据拟合估计的困难样本发掘方法 |
CN112800959B (zh) * | 2021-01-28 | 2023-06-06 | 华南理工大学 | 一种用于人脸识别中数据拟合估计的困难样本发掘方法 |
CN112801208A (zh) * | 2021-02-25 | 2021-05-14 | 清华大学 | 基于结构化代理的深度度量学习方法和装置 |
CN112801208B (zh) * | 2021-02-25 | 2023-01-03 | 清华大学 | 基于结构化代理的深度度量学习方法和装置 |
CN113127661A (zh) * | 2021-04-06 | 2021-07-16 | 中国科学院计算技术研究所 | 基于循环查询扩展的多监督医学图像检索方法和系统 |
CN113127661B (zh) * | 2021-04-06 | 2023-09-12 | 中国科学院计算技术研究所 | 基于循环查询扩展的多监督医学图像检索方法和系统 |
CN113297411B (zh) * | 2021-07-26 | 2021-11-09 | 深圳市信润富联数字科技有限公司 | 轮形图谱相似性的度量方法、装置、设备及存储介质 |
CN113297411A (zh) * | 2021-07-26 | 2021-08-24 | 深圳市信润富联数字科技有限公司 | 轮形图谱相似性的度量方法、装置、设备及存储介质 |
CN113361497B (zh) * | 2021-08-09 | 2021-12-07 | 北京惠朗时代科技有限公司 | 基于训练样本指纹识别智能尾箱应用方法及设备 |
CN113361497A (zh) * | 2021-08-09 | 2021-09-07 | 北京惠朗时代科技有限公司 | 基于训练样本指纹识别智能尾箱应用方法及设备 |
CN113591782A (zh) * | 2021-08-12 | 2021-11-02 | 北京惠朗时代科技有限公司 | 一种基于训练式的人脸识别智能保险柜应用方法及系统 |
CN114020974B (zh) * | 2022-01-04 | 2022-06-21 | 阿里巴巴达摩院(杭州)科技有限公司 | 样本数据确定及对话意图识别方法、存储介质及程序产品 |
CN114020974A (zh) * | 2022-01-04 | 2022-02-08 | 阿里巴巴达摩院(杭州)科技有限公司 | 样本数据确定及对话意图识别方法、存储介质及程序产品 |
CN114998960A (zh) * | 2022-05-28 | 2022-09-02 | 华南理工大学 | 一种基于正负样本对比学习的表情识别方法 |
CN114998960B (zh) * | 2022-05-28 | 2024-03-26 | 华南理工大学 | 一种基于正负样本对比学习的表情识别方法 |
CN115344728A (zh) * | 2022-10-17 | 2022-11-15 | 北京百度网讯科技有限公司 | 图像检索模型训练、使用方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110851645B (zh) | 2022-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110851645B (zh) | 一种基于深度度量学习下相似性保持的图像检索方法 | |
CN110866134B (zh) | 一种面向图像检索的分布一致性保持度量学习方法 | |
WO2021134871A1 (zh) | 基于局部二值模式和深度学习的合成人脸图像取证方法 | |
CN113378632B (zh) | 一种基于伪标签优化的无监督域适应行人重识别方法 | |
CN111177446B (zh) | 一种用于足迹图像检索的方法 | |
Unnikrishnan et al. | Toward objective evaluation of image segmentation algorithms | |
CN110880019B (zh) | 通过无监督域适应训练目标域分类模型的方法 | |
CN110188225B (zh) | 一种基于排序学习和多元损失的图像检索方法 | |
CN109063649B (zh) | 基于孪生行人对齐残差网络的行人重识别方法 | |
CN105389326B (zh) | 基于弱匹配概率典型相关性模型的图像标注方法 | |
CN105631037B (zh) | 一种图像检索方法 | |
CN108052683B (zh) | 一种基于余弦度量规则的知识图谱表示学习方法 | |
CN114299362A (zh) | 一种基于k-means聚类的小样本图像分类方法 | |
CN110442736B (zh) | 一种基于二次判别分析的语义增强子空间跨媒体检索方法 | |
CN111506760A (zh) | 一种基于困难感知的深度集成度量图像检索方法 | |
CN110909785A (zh) | 基于语义层级的多任务Triplet损失函数学习方法 | |
CN113033345B (zh) | 基于公共特征子空间的v2v视频人脸识别方法 | |
CN111079840B (zh) | 基于卷积神经网络和概念格的图像语义完备标注方法 | |
CN110472088A (zh) | 一种基于草图的图像检索方法 | |
CN110750672B (zh) | 基于深度度量学习和结构分布学习损失的图像检索方法 | |
CN116935057A (zh) | 目标评价方法、电子设备和计算机可读存储介质 | |
CN113887653B (zh) | 一种基于三元网络的紧耦合弱监督学习的定位方法及系统 | |
CN114782209B (zh) | 一种基于社交网络拓扑图的关联用户身份识别方法 | |
CN111401519B (zh) | 一种基于物体内和物体间相似性距离的深层神经网络无监督学习方法 | |
CN113688879B (zh) | 一种基于置信度分布外检测的广义零样本学习分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |