CN110019910A - 图像检索方法及装置 - Google Patents
图像检索方法及装置 Download PDFInfo
- Publication number
- CN110019910A CN110019910A CN201711470662.5A CN201711470662A CN110019910A CN 110019910 A CN110019910 A CN 110019910A CN 201711470662 A CN201711470662 A CN 201711470662A CN 110019910 A CN110019910 A CN 110019910A
- Authority
- CN
- China
- Prior art keywords
- image
- local feature
- candidate
- library
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及图像检索方法及装置。该方法包括:建立图像库对应的局部特征索引文件和深度特征索引文件;在接收到图像检索请求的情况下,提取所述图像检索请求对应的查询图像的局部特征和深度特征;根据所述查询图像的局部特征检索所述局部特征索引文件,确定第一组候选图像;根据所述查询图像的深度特征检索所述深度特征索引文件,确定第二组候选图像;根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,确定检索结果。本公开能够提高图像检索的准确性和速度。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种图像检索方法及装置。
背景技术
近年来,随着多媒体技术和计算机网络的飞速发展,全世界的数字图像的数量正以惊人的速度在增长。为了使这些庞杂的图像中所包含的信息被有效地访问和利用,必然需要一种能够快速且准确地查找访问图像的技术,即图像的检索技术。随着大规模数字图像库的出现,传统的依赖于人工标注进行的基于文本的图像检索技术已经无法满足用户日益增长的需求,CBIR(Content Based Image Retrieval,基于内容的图像检索)技术便应运而生。CBIR的一般做法是先提取出图像的特征建立特征数据库,这样就把图像库中的一个实例转换成了特征空间中的一个点。而图像特征一般都是高维的矢量数据,所以对图像基于内容的相似检索就转换为对高维特征矢量的最邻近检索。如何提高图像检索的准确性和速度,是迫切需要解决的问题。
发明内容
有鉴于此,本公开提出了一种图像检索方法及装置。
根据本公开的一方面,提供了一种图像检索方法,包括:
建立图像库对应的局部特征索引文件和深度特征索引文件;
在接收到图像检索请求的情况下,提取所述图像检索请求对应的查询图像的局部特征和深度特征;
根据所述查询图像的局部特征检索所述局部特征索引文件,确定第一组候选图像;
根据所述查询图像的深度特征检索所述深度特征索引文件,确定第二组候选图像;
根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,确定检索结果。
在一种可能的实现方式中,建立图像库对应的局部特征索引文件和深度特征索引文件,包括:
提取所述图像库中的各个图像的局部特征;
提取所述图像库中的各个图像的深度特征;
根据所述图像库中的各个图像的局部特征,建立所述图像库对应的局部特征索引文件;
根据所述图像库中的各个图像的深度特征,建立所述图像库对应的深度特征索引文件。
在一种可能的实现方式中,提取所述图像库中的各个图像的局部特征,包括:
对于所述图像库中的任意一个图像,提取所述图像的特征点描述子;
对所述图像的特征点描述子进行聚类,得到聚类结果;
根据所述聚类结果生成所述图像的局部特征。
在一种可能的实现方式中,根据所述图像库中的各个图像的局部特征,建立所述图像库对应的局部特征索引文件,包括:
对所述图像库中的各个图像的局部特征进行降维处理,得到所述图像库中的各个图像的降维后的局部特征;
根据所述图像库中的各个图像的降维后的局部特征,建立所述图像库对应的局部特征索引文件。
在一种可能的实现方式中,根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,确定检索结果,包括:
获取所述图像检索请求的请求类型;
根据所述请求类型确定所述图像检索请求对应的距离区间;
根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述距离区间,确定所述第一组候选图像中的各个候选图像的分数;
根据所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,以及所述距离区间,确定所述第二组候选图像中的各个候选图像的分数;
根据所述第一组候选图像中的各个候选图像的分数以及各个所述第二组候选图像中的各个候选图像的分数,确定检索结果。
根据本公开的另一方面,提供了一种图像检索装置,包括:
建立模块,用于建立图像库对应的局部特征索引文件和深度特征索引文件;
提取模块,用于在接收到图像检索请求的情况下,提取所述图像检索请求对应的查询图像的局部特征和深度特征;
第一确定模块,用于根据所述查询图像的局部特征检索所述局部特征索引文件,确定第一组候选图像;
第二确定模块,用于根据所述查询图像的深度特征检索所述深度特征索引文件,确定第二组候选图像;
第三确定模块,用于根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,确定检索结果。
在一种可能的实现方式中,所述建立模块包括:
第一提取子模块,用于提取所述图像库中的各个图像的局部特征;
第二提取子模块,用于提取所述图像库中的各个图像的深度特征;
第一建立子模块,用于根据所述图像库中的各个图像的局部特征,建立所述图像库对应的局部特征索引文件;
第二建立子模块,用于根据所述图像库中的各个图像的深度特征,建立所述图像库对应的深度特征索引文件。
在一种可能的实现方式中,所述第一提取子模块包括:
提取单元,用于对于所述图像库中的任意一个图像,提取所述图像的特征点描述子;
聚类单元,用于对所述图像的特征点描述子进行聚类,得到聚类结果;
生成单元,用于根据所述聚类结果生成所述图像的局部特征。
在一种可能的实现方式中,所述第一建立子模块包括:
降维单元,用于对所述图像库中的各个图像的局部特征进行降维处理,得到所述图像库中的各个图像的降维后的局部特征;
建立单元,用于根据所述图像库中的各个图像的降维后的局部特征,建立所述图像库对应的局部特征索引文件。
在一种可能的实现方式中,所述第三确定模块包括:
获取子模块,用于获取所述图像检索请求的请求类型;
第一确定子模块,用于根据所述请求类型确定所述图像检索请求对应的距离区间;
第二确定子模块,用于根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述距离区间,确定所述第一组候选图像中的各个候选图像的分数;
第三确定子模块,用于根据所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,以及所述距离区间,确定所述第二组候选图像中的各个候选图像的分数;
第四确定子模块,用于根据所述第一组候选图像中的各个候选图像的分数以及各个所述第二组候选图像中的各个候选图像的分数,确定检索结果。
根据本公开的另一方面,提供了一种图像检索装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。
根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。
本公开的各方面的图像检索方法及装置通过建立图像库对应的局部特征索引文件和深度特征索引文件,在接收到图像检索请求的情况下,提取图像检索请求对应的查询图像的局部特征和深度特征,并基于查询图像的局部特征和深度特征检索局部特征索引文件和深度特征索引文件,得到检索结果,由此能够提高图像检索的准确性和速度。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出根据本公开一实施例的图像检索方法的流程图。
图2示出根据本公开一实施例的图像检索方法步骤S11的一示例性的流程图。
图3示出根据本公开一实施例的图像检索方法步骤S111的一示例性的流程图。
图4示出根据本公开一实施例的图像检索方法步骤S113的一示例性的流程图。
图5示出根据本公开一实施例的图像检索方法步骤S15的一示例性的流程图。
图6示出根据本公开一实施例的图像检索装置的框图。
图7示出根据本公开一实施例的图像检索装置的一示例性的框图。
图8是根据一示例性实施例示出的一种用于图像检索的装置1900的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开一实施例的图像检索方法的流程图。该方法可以应用于服务器中。该方法可以用于检索图像,也可以在检索到图像之后,获取图像所属的视频。如图1所示,该方法包括步骤S11至步骤S15。
在步骤S11中,建立图像库对应的局部特征索引文件和深度特征索引文件。
在本实施例中,图像库可以包括可被检索的所有图像,也可以包括从可被检索的视频中抽取的图像等,在此不作限定。
在步骤S12中,在接收到图像检索请求的情况下,提取图像检索请求对应的查询图像的局部特征和深度特征。
在一种可能的实现方式中,局部特征可以为VLAD(Vector of LocallyAggregated Descriptors,局部特征聚合描述符)特征。
在另一种可能的实现方式中,局部特征可以为VLAT(Vector of LocallyAggregated Tensors,局部特征聚合张量)。
在另一种可能的实现方式中,局部特征可以为LLC(Locality-constrainedLinear Coding,局部约束线性编码)特征。
在另一种可能的实现方式中,局部特征可以为SIFT(Scale-Invariant FeatureTransform,尺度不变特征变换)特征。
在另一种可能的实现方式中,局部特征可以为SURF(Speeded Up RobustFeatures,加速稳健特征)。
在另一种可能的实现方式中,局部特征可以为KAZE特征。
需要说明的是,尽管以以上实现方式介绍了局部特征如上,但本领域技术人员能够理解,本公开应不限于此。本领域技术人员可以根据实际应用场景需求和/或个人喜好灵活选择局部特征的具体类型。
在本实施例中,深度特征可以指通过深度学习网络提取的特征。其中,深度学习网络可以为ResNet、VGG网络或者AlexNet等,在此不作限定。本实施例提取的深度特征具有抽象性,具有抽象概念的语义描述能力,例如,可以描述脸型、汽车类型等上层概念,因此适合查找相似图像。
在步骤S13中,根据查询图像的局部特征检索局部特征索引文件,确定第一组候选图像。
在一种可能的实现方式中,可以计算查询图像的局部特征与局部特征索引文件中的各个局部特征的距离,并可以将与查询图像的局部特征的距离最小的N个局部特征对应的图像作为第一组候选图像,其中,N为正整数。
在步骤S14中,根据查询图像的深度特征检索深度特征索引文件,确定第二组候选图像。
在一种可能的实现方式中,可以计算查询图像的深度特征与深度特征索引文件中的各个深度特征的距离,并可以将与查询图像的深度特征的距离最小的N个深度特征对应的图像作为第二组候选图像,其中,N为正整数。
在步骤S15中,根据第一组候选图像中的各个候选图像与查询图像的局部特征的距离,以及第二组候选图像中的各个候选图像与查询图像的深度特征的距离,确定检索结果。
在一种可能的实现方式中,可以按照距离由小到大的顺序,对各个候选图像进行排序,得到检索结果。
在本实施例中,不限制步骤S13和步骤S14的执行顺序。可以先执行步骤S13,再执行步骤S14。也可以先执行步骤S14,再执行步骤S13。
本实施例通过建立图像库对应的局部特征索引文件和深度特征索引文件,在接收到图像检索请求的情况下,提取图像检索请求对应的查询图像的局部特征和深度特征,并基于查询图像的局部特征和深度特征检索局部特征索引文件和深度特征索引文件,得到检索结果,由此能够提高图像检索的准确性和速度。
图2示出根据本公开一实施例的图像检索方法步骤S11的一示例性的流程图。如图2所示,步骤S11可以包括步骤S111至步骤S114。
在步骤S111中,提取图像库中的各个图像的局部特征。
在一种可能的实现方式中,对于图像库中的任意一个图像,可以检测该图像中的各个物体,例如,图像中的物体可以包括动植物、人脸或者日常用品等。根据该图像中的物体检测结果,可以得到该图像中的物体所在区域。可以提取该图像中的物体所在区域的局部特征,作为该图像的局部特征。
在步骤S112中,提取图像库中的各个图像的深度特征。
在一种可能的实现方式中,可以采用预先训练好的ResNet提取图像库中的各个图像的深度特征。ResNet有很多层,在该实现方式中,可以将ResNet的最后一层的输出作为图像的深度特征。
在步骤S113中,根据图像库中的各个图像的局部特征,建立图像库对应的局部特征索引文件。
在一种可能的实现方式中,可以将图像库中的各个图像的局部特征加入局部特征索引文件中。
在一种可能的实现方式中,可以采用Faiss库,建立图像库对应的局部特征索引文件。
在步骤S114中,根据图像库中的各个图像的深度特征,建立图像库对应的深度特征索引文件。
在一种可能的实现方式中,可以将图像库中的各个图像的深度特征加入深度特征索引文件中。
在一种可能的实现方式中,可以采用Faiss库,建立图像库对应的深度特征索引文件。
在本实施例中,不限制步骤S111至步骤S114的执行顺序,只要步骤S111在步骤S113之前执行、步骤S112在步骤S114之前执行即可。
图3示出根据本公开一实施例的图像检索方法步骤S111的一示例性的流程图。如图3所示,步骤S111可以包括步骤S1111至步骤S1113。
在步骤S1111中,对于图像库中的任意一个图像,提取该图像的特征点描述子。
在一种可能的实现方式中,对于图像库中的任意一个图像,可以提取该图像的SIFT特征点描述子。
在步骤S1112中,对该图像的特征点描述子进行聚类,得到聚类结果。
在一种可能的实现方式中,可以对该图像的SIFT特征点描述子进行聚类,形成视觉码本(Visual Codebook),从而得到聚类结果。
在步骤S1113中,根据聚类结果生成该图像的局部特征。
在一种可能的实现方式中,可以根据SIFT特征点描述子的聚类结果生成VLAD特征,并可以将生成的VLAD特征作为该图像的局部特征。
图4示出根据本公开一实施例的图像检索方法步骤S113的一示例性的流程图。如图4所示,步骤S113可以包括步骤S1131和步骤S1132。
在步骤S1131中,对图像库中的各个图像的局部特征进行降维处理,得到图像库中的各个图像的降维后的局部特征。
在一种可能的实现方式中,对于图像库中的任意一个图像,可以对该图像的局部特征进行PCA(Principal Component Analysis,主成分分析)降维,得到该图像的降维后的局部特征。
例如,局部特征为VLAD特征,该VLAD特征的维度为1000维,则可以将该VLAD特征进行PCA降维,降维后的VLAD特征的维度为512维。
在步骤S1132中,根据图像库中的各个图像的降维后的局部特征,建立图像库对应的局部特征索引文件。
在一种可能的实现方式中,可以将图像库中的各个图像的降维后的局部特征加入局部特征索引文件中。
图5示出根据本公开一实施例的图像检索方法步骤S15的一示例性的流程图。如图5,步骤S15可以包括步骤S151至步骤S155。
在步骤S151中,获取图像检索请求的请求类型。
在一种可能的实现方式中,请求类型可以为请求获取相同的图像或者请求获取相似的图像。
在步骤S152中,根据该请求类型确定图像检索请求对应的距离区间。
在一种可能的实现方式中,第一距离区间的下界小于第二距离区间的下界,第一距离区间的上界小于第二距离区间的上界。其中,第一距离区间表示图像检索请求的请求类型为请求获取相同的图像对应的距离区间,第二距离区间表示图像检索请求的请求类型为请求获取相似的图像对应的距离区间。
在步骤S153中,根据第一组候选图像中的各个候选图像与查询图像的局部特征的距离,以及该距离区间,确定第一组候选图像中的各个候选图像的分数。
在一种可能的实现方式中,第一组候选图像中的各个候选图像的分数可以与距离差负相关,距离差越小,则分数越高,距离差越大,则分数越低。其中,距离差可以等于第一距离与中心距离的差值的绝对值,第一距离表示候选图像与查询图像的局部特征的距离,中心距离表示距离区间的中心值。
在步骤S154中,根据第二组候选图像中的各个候选图像与查询图像的深度特征的距离,以及该距离区间,确定第二组候选图像中的各个候选图像的分数。
在一种可能的实现方式中,第二组候选图像中的各个候选图像的分数可以与距离差负相关,距离差越小,则分数越高,距离差越大,则分数越低。其中,距离差可以等于第二距离与中心距离的差值的绝对值,第二距离表示候选图像与查询图像的深度特征的距离,中心距离表示距离区间的中心值。
在步骤S155中,根据第一组候选图像中的各个候选图像的分数以及各个第二组候选图像中的各个候选图像的分数,确定检索结果。
在一种可能的实现方式中,可以按照分数由高到低的顺序,对第一组候选图像和第二组候选图像中的各个候选图像进行排序,得到检索结果。
在本实施例中,不限制步骤S153和步骤S154的执行顺序。可以先执行步骤S153,再执行步骤S154;也可以先执行步骤S154,再执行步骤S153。
本实施例能够根据用户的检索需求改善检索结果。在图像检索请求的请求类型为请求获取相同的图像的情况下,可以在检索结果中展示较多与查询图像相同的图像,或者,可以在检索结果中将与查询图像相同的图像排在前面,将与查询图像相似的图像排在后面;在图像检索请求的请求类型为请求获取相似的图像的情况下,可以在检索结果中展示较多与查询图像相似的图像,或者,可以在检索结果中将与查询图像相似的图像排在前面,将与查询图像相同的图像排在后面。
图6示出根据本公开一实施例的图像检索装置的框图。如图6所示,该装置包括:建立模块61,用于建立图像库对应的局部特征索引文件和深度特征索引文件;提取模块62,用于在接收到图像检索请求的情况下,提取图像检索请求对应的查询图像的局部特征和深度特征;第一确定模块63,用于根据查询图像的局部特征检索局部特征索引文件,确定第一组候选图像;第二确定模块64,用于根据查询图像的深度特征检索深度特征索引文件,确定第二组候选图像;第三确定模块65,用于根据第一组候选图像中的各个候选图像与查询图像的局部特征的距离,以及第二组候选图像中的各个候选图像与查询图像的深度特征的距离,确定检索结果。
图7示出根据本公开一实施例的图像检索装置的一示例性的框图。如图7所示:
在一种可能的实现方式中,建立模块61包括:第一提取子模块611,用于提取图像库中的各个图像的局部特征;第二提取子模块612,用于提取图像库中的各个图像的深度特征;第一建立子模块613,用于根据图像库中的各个图像的局部特征,建立图像库对应的局部特征索引文件;第二建立子模块614,用于根据图像库中的各个图像的深度特征,建立图像库对应的深度特征索引文件。
在一种可能的实现方式中,第一提取子模块611包括:提取单元,用于对于图像库中的任意一个图像,提取该图像的特征点描述子;聚类单元,用于对该图像的特征点描述子进行聚类,得到聚类结果;生成单元,用于根据聚类结果生成该图像的局部特征。
在一种可能的实现方式中,第一建立子模块613包括:降维单元,用于对图像库中的各个图像的局部特征进行降维处理,得到图像库中的各个图像的降维后的局部特征;建立单元,用于根据图像库中的各个图像的降维后的局部特征,建立图像库对应的局部特征索引文件。
在一种可能的实现方式中,第三确定模块65包括:获取子模块651,用于获取图像检索请求的请求类型;第一确定子模块652,用于根据该请求类型确定图像检索请求对应的距离区间;第二确定子模块653,用于根据第一组候选图像中的各个候选图像与查询图像的局部特征的距离,以及该距离区间,确定第一组候选图像中的各个候选图像的分数;第三确定子模块654,用于根据第二组候选图像中的各个候选图像与查询图像的深度特征的距离,以及该距离区间,确定第二组候选图像中的各个候选图像的分数;第四确定子模块655,用于根据第一组候选图像中的各个候选图像的分数以及各个第二组候选图像中的各个候选图像的分数,确定检索结果。
本实施例通过建立图像库对应的局部特征索引文件和深度特征索引文件,在接收到图像检索请求的情况下,提取图像检索请求对应的查询图像的局部特征和深度特征,并基于查询图像的局部特征和深度特征检索局部特征索引文件和深度特征索引文件,得到检索结果,由此能够提高图像检索的准确性和速度。
图8是根据一示例性实施例示出的一种用于图像检索的装置1900的框图。例如,装置1900可以被提供为一服务器。参照图8,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由装置1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (12)
1.一种图像检索方法,其特征在于,包括:
建立图像库对应的局部特征索引文件和深度特征索引文件;
在接收到图像检索请求的情况下,提取所述图像检索请求对应的查询图像的局部特征和深度特征;
根据所述查询图像的局部特征检索所述局部特征索引文件,确定第一组候选图像;
根据所述查询图像的深度特征检索所述深度特征索引文件,确定第二组候选图像;
根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,确定检索结果。
2.根据权利要求1所述的方法,其特征在于,建立图像库对应的局部特征索引文件和深度特征索引文件,包括:
提取所述图像库中的各个图像的局部特征;
提取所述图像库中的各个图像的深度特征;
根据所述图像库中的各个图像的局部特征,建立所述图像库对应的局部特征索引文件;
根据所述图像库中的各个图像的深度特征,建立所述图像库对应的深度特征索引文件。
3.根据权利要求2所述的方法,其特征在于,提取所述图像库中的各个图像的局部特征,包括:
对于所述图像库中的任意一个图像,提取所述图像的特征点描述子;
对所述图像的特征点描述子进行聚类,得到聚类结果;
根据所述聚类结果生成所述图像的局部特征。
4.根据权利要求2所述的方法,其特征在于,根据所述图像库中的各个图像的局部特征,建立所述图像库对应的局部特征索引文件,包括:
对所述图像库中的各个图像的局部特征进行降维处理,得到所述图像库中的各个图像的降维后的局部特征;
根据所述图像库中的各个图像的降维后的局部特征,建立所述图像库对应的局部特征索引文件。
5.根据权利要求1所述的方法,其特征在于,根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,确定检索结果,包括:
获取所述图像检索请求的请求类型;
根据所述请求类型确定所述图像检索请求对应的距离区间;
根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述距离区间,确定所述第一组候选图像中的各个候选图像的分数;
根据所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,以及所述距离区间,确定所述第二组候选图像中的各个候选图像的分数;
根据所述第一组候选图像中的各个候选图像的分数以及各个所述第二组候选图像中的各个候选图像的分数,确定检索结果。
6.一种图像检索装置,其特征在于,包括:
建立模块,用于建立图像库对应的局部特征索引文件和深度特征索引文件;
提取模块,用于在接收到图像检索请求的情况下,提取所述图像检索请求对应的查询图像的局部特征和深度特征;
第一确定模块,用于根据所述查询图像的局部特征检索所述局部特征索引文件,确定第一组候选图像;
第二确定模块,用于根据所述查询图像的深度特征检索所述深度特征索引文件,确定第二组候选图像;
第三确定模块,用于根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,确定检索结果。
7.根据权利要求6所述的装置,其特征在于,所述建立模块包括:
第一提取子模块,用于提取所述图像库中的各个图像的局部特征;
第二提取子模块,用于提取所述图像库中的各个图像的深度特征;
第一建立子模块,用于根据所述图像库中的各个图像的局部特征,建立所述图像库对应的局部特征索引文件;
第二建立子模块,用于根据所述图像库中的各个图像的深度特征,建立所述图像库对应的深度特征索引文件。
8.根据权利要求7所述的装置,其特征在于,所述第一提取子模块包括:
提取单元,用于对于所述图像库中的任意一个图像,提取所述图像的特征点描述子;
聚类单元,用于对所述图像的特征点描述子进行聚类,得到聚类结果;
生成单元,用于根据所述聚类结果生成所述图像的局部特征。
9.根据权利要求7所述的装置,其特征在于,所述第一建立子模块包括:
降维单元,用于对所述图像库中的各个图像的局部特征进行降维处理,得到所述图像库中的各个图像的降维后的局部特征;
建立单元,用于根据所述图像库中的各个图像的降维后的局部特征,建立所述图像库对应的局部特征索引文件。
10.根据权利要求6所述的装置,其特征在于,所述第三确定模块包括:
获取子模块,用于获取所述图像检索请求的请求类型;
第一确定子模块,用于根据所述请求类型确定所述图像检索请求对应的距离区间;
第二确定子模块,用于根据所述第一组候选图像中的各个候选图像与所述查询图像的局部特征的距离,以及所述距离区间,确定所述第一组候选图像中的各个候选图像的分数;
第三确定子模块,用于根据所述第二组候选图像中的各个候选图像与所述查询图像的深度特征的距离,以及所述距离区间,确定所述第二组候选图像中的各个候选图像的分数;
第四确定子模块,用于根据所述第一组候选图像中的各个候选图像的分数以及各个所述第二组候选图像中的各个候选图像的分数,确定检索结果。
11.一种图像检索装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1至5中任意一项所述的方法。
12.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至5中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711470662.5A CN110019910A (zh) | 2017-12-29 | 2017-12-29 | 图像检索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711470662.5A CN110019910A (zh) | 2017-12-29 | 2017-12-29 | 图像检索方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110019910A true CN110019910A (zh) | 2019-07-16 |
Family
ID=67187100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711470662.5A Pending CN110019910A (zh) | 2017-12-29 | 2017-12-29 | 图像检索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110019910A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110765291A (zh) * | 2019-10-28 | 2020-02-07 | 广东三维家信息科技有限公司 | 检索方法、装置及电子设备 |
CN111966846A (zh) * | 2020-06-28 | 2020-11-20 | 北京百度网讯科技有限公司 | 图像查询方法、装置、电子设备和存储介质 |
WO2022227760A1 (zh) * | 2021-04-28 | 2022-11-03 | 北京百度网讯科技有限公司 | 图像检索方法、装置、电子设备及计算机可读存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101281520A (zh) * | 2007-04-05 | 2008-10-08 | 中国科学院自动化研究所 | 基于非监督学习和语义匹配特征交互式体育视频检索方法 |
CN101866348A (zh) * | 2009-04-17 | 2010-10-20 | 精工爱普生株式会社 | 打印装置、图像处理装置、图像处理方法及计算机程序 |
CN104346370A (zh) * | 2013-07-31 | 2015-02-11 | 阿里巴巴集团控股有限公司 | 图像搜索、获取图像文本信息的方法及装置 |
CN105069173A (zh) * | 2015-09-10 | 2015-11-18 | 天津中科智能识别产业技术研究院有限公司 | 基于有监督的拓扑保持哈希的快速图像检索方法 |
CN105138672A (zh) * | 2015-09-07 | 2015-12-09 | 北京工业大学 | 一种多特征融合的图像检索方法 |
CN105320705A (zh) * | 2014-08-05 | 2016-02-10 | 北京大学 | 相似车辆的检索方法及装置 |
CN106326288A (zh) * | 2015-06-30 | 2017-01-11 | 阿里巴巴集团控股有限公司 | 图像搜索方法及装置 |
CN106649487A (zh) * | 2016-10-09 | 2017-05-10 | 苏州大学 | 基于兴趣目标的图像检索方法 |
CN107423294A (zh) * | 2016-02-25 | 2017-12-01 | 北京联合大学 | 一种社群图像检索方法及系统 |
-
2017
- 2017-12-29 CN CN201711470662.5A patent/CN110019910A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101281520A (zh) * | 2007-04-05 | 2008-10-08 | 中国科学院自动化研究所 | 基于非监督学习和语义匹配特征交互式体育视频检索方法 |
CN101866348A (zh) * | 2009-04-17 | 2010-10-20 | 精工爱普生株式会社 | 打印装置、图像处理装置、图像处理方法及计算机程序 |
CN104346370A (zh) * | 2013-07-31 | 2015-02-11 | 阿里巴巴集团控股有限公司 | 图像搜索、获取图像文本信息的方法及装置 |
CN105320705A (zh) * | 2014-08-05 | 2016-02-10 | 北京大学 | 相似车辆的检索方法及装置 |
CN106326288A (zh) * | 2015-06-30 | 2017-01-11 | 阿里巴巴集团控股有限公司 | 图像搜索方法及装置 |
CN105138672A (zh) * | 2015-09-07 | 2015-12-09 | 北京工业大学 | 一种多特征融合的图像检索方法 |
CN105069173A (zh) * | 2015-09-10 | 2015-11-18 | 天津中科智能识别产业技术研究院有限公司 | 基于有监督的拓扑保持哈希的快速图像检索方法 |
CN107423294A (zh) * | 2016-02-25 | 2017-12-01 | 北京联合大学 | 一种社群图像检索方法及系统 |
CN106649487A (zh) * | 2016-10-09 | 2017-05-10 | 苏州大学 | 基于兴趣目标的图像检索方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110765291A (zh) * | 2019-10-28 | 2020-02-07 | 广东三维家信息科技有限公司 | 检索方法、装置及电子设备 |
CN111966846A (zh) * | 2020-06-28 | 2020-11-20 | 北京百度网讯科技有限公司 | 图像查询方法、装置、电子设备和存储介质 |
CN111966846B (zh) * | 2020-06-28 | 2024-06-11 | 天津霖岳科技发展有限公司 | 图像查询方法、装置、电子设备和存储介质 |
WO2022227760A1 (zh) * | 2021-04-28 | 2022-11-03 | 北京百度网讯科技有限公司 | 图像检索方法、装置、电子设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10853726B2 (en) | Neural architecture search for dense image prediction tasks | |
CN111444967B (zh) | 生成对抗网络的训练方法、生成方法、装置、设备及介质 | |
CN109325148A (zh) | 生成信息的方法和装置 | |
CN110516096A (zh) | 合成感知数字图像搜索 | |
TW201834462A (zh) | 視訊資料的推薦方法、裝置和伺服器 | |
CN108416028A (zh) | 一种搜索内容资源的方法、装置及服务器 | |
Du et al. | Personalized video recommendation using rich contents from videos | |
CN108733676A (zh) | 视频缩略图的提取方法及装置 | |
CN106611015B (zh) | 标签的处理方法及装置 | |
US9679380B2 (en) | Emotion modification for image and video content | |
US20160335493A1 (en) | Method, apparatus, and non-transitory computer-readable storage medium for matching text to images | |
Iakovidou et al. | Localizing global descriptors for content-based image retrieval | |
US20200175332A1 (en) | Out-of-sample generating few-shot classification networks | |
CN111460223B (zh) | 基于深度网络的多模态特征融合的短视频单标签分类方法 | |
CN104915673A (zh) | 一种基于视觉词袋模型的目标分类方法和系统 | |
CN106096028A (zh) | 基于图像识别的文物索引方法及装置 | |
CN110019910A (zh) | 图像检索方法及装置 | |
US20160307068A1 (en) | Method of clustering digital images, corresponding system, apparatus and computer program product | |
Kächele et al. | Revisiting the EmotiW challenge: how wild is it really? Classification of human emotions in movie snippets based on multiple features | |
CN114299321A (zh) | 视频分类方法、装置、设备及可读存储介质 | |
CN103473275A (zh) | 一种采用多特征融合的图像自动标注方法和系统 | |
CN113408581A (zh) | 一种多模态数据匹配方法、装置、设备及存储介质 | |
CN114298122A (zh) | 数据分类方法、装置、设备、存储介质及计算机程序产品 | |
JP2021039758A (ja) | 画像間の類似度を利用した類似領域強調方法およびシステム | |
Mo et al. | Class-incremental grouping network for continual audio-visual learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200511 Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Applicant after: Alibaba (China) Co.,Ltd. Address before: 200241 room 1162, building 555, Dongchuan Road, Shanghai, Minhang District Applicant before: SHANGHAI QUAN TOODOU CULTURAL COMMUNICATION Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190716 |