CN104731882A - 一种基于哈希编码加权排序的自适应查询方法 - Google Patents

一种基于哈希编码加权排序的自适应查询方法 Download PDF

Info

Publication number
CN104731882A
CN104731882A CN201510106700.3A CN201510106700A CN104731882A CN 104731882 A CN104731882 A CN 104731882A CN 201510106700 A CN201510106700 A CN 201510106700A CN 104731882 A CN104731882 A CN 104731882A
Authority
CN
China
Prior art keywords
query
feature
query result
data
anchor point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510106700.3A
Other languages
English (en)
Other versions
CN104731882B (zh
Inventor
刘祥龙
郎波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Aiguan Vision Technology Co ltd
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201510106700.3A priority Critical patent/CN104731882B/zh
Publication of CN104731882A publication Critical patent/CN104731882A/zh
Application granted granted Critical
Publication of CN104731882B publication Critical patent/CN104731882B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于哈希编码加权排序的自适应查询方法,该方法包括:对查询数据提取多种特征,分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询;获取利用所述每种特征对应的哈希表进行查询的多个查询结果,并将所述多个查询结果中的每个查询结果分别构建一个对应的图;将每个查询结果对应的图进行融合,得到一个融合图;利用图的重排序算法对所述每个查询结果在所述融合图上进行重新排序,得到最终的查询结果。本发明将基于图的重排序方法和多特征融合的重排序方法相结合,有效地综合多特征优势,实现数据的快速查询,降低内存的消耗,有效地提高了查询的效率和准确率,对查询性能有很大提升。

Description

一种基于哈希编码加权排序的自适应查询方法
技术领域
本发明涉及计算机搜索技术领域,尤其涉及一种基于哈希编码加权排序的自适应查询方法。
背景技术
图片、视频等数据的快速增长给数据索引和搜索带来了极大的挑战。大数据上的近似最近邻搜索由于其在查询性能和效率的出色表现,在过去数十年中引起越来越多的关注。
基于图的重排序算法一般分为图的构建过程和图传播过程。首先是图的构建过程。通常来说,把每个图像作为图的顶点,然后将这些相似的顶点连接起来,作为图的边,相似性的大小看成是这些节点之间边的权重。受启发于page-rank的排序思想,在一幅图中,被越多的顶点连接指向的顶点应该越重要,即一副图像和越多的图像相似越重要,而且通常越重要的顶点在排序的时候越靠前。顶点的重要性要靠图的传播过程来实现。具体来说,对于一个查询,节点v和查询相似,即是重要的节点,如果节点u和节点v相似,那么有很大的可能节点u也和查询相似。直观地,如果一个节点和查询非常相似,那么它的周围应该有很多节点也和查询相似。即采用随机游走的思想进行图的传播,随机游走过程稳定时的概率被当作图像最后的相关分数,然后按照相关分数的大小对图像进行重排序。
由于基于图的重排序方法,充分考虑了图像之间的相似性和图像数据的分布结构,这些特点使得该方法非常容易和多特征融合的排序方法相结合。现有技术中,无监督的基于图的多特征融合的方法,将多个特征查询的结果分别构造一张图,然后将多个图进行融合,融合之后,针对单个图运用page-rank等方法进行重排序。还有一种新的通过弱监督的方式多图进行融合的方法,通过引入了多图学习的框架,该方法对图的构建不仅考虑单个特征内的结果的关系,同时考虑特征之间的关系。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
现有的基于哈希的最近邻搜索技术,在大多数的图像查询中,都是采用单一的图像特征进行查询和排序,由于单一的特征无法全面表示图像信息,不能从多个方面查询出用户所需图像信息,而且即使虑特征之间的关系,但现有技术基于图像的原始特征进行多特征的融合进行重排序,或者需要存储图像的原始特征,或者需要存储图像的最近邻关系,需要消耗大量的硬盘空间,当数据量很大时,又不能加载到内存,导致内存消耗大,严重影响查询效率。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决或者减缓上述问题的基于哈希编码加权排序的自适应查询方法。
根据本发明的一个方面,提供了一种基于哈希编码加权排序的自适应查询方法,该方法包括:
对查询数据提取多种特征,分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询;
获取利用所述每种特征对应的哈希表进行查询的多个查询结果,并将所述多个查询结果中的每个查询结果分别构建一个对应的图;
将每个查询结果对应的图进行融合,得到一个融合图;
利用图的重排序算法对所述每个查询结果在所述融合图上进行重新排序,得到最终的查询结果。
可选的,所述对查询数据提取多种特征,分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询,具体包括:
训练数据提取多种数据特征,生成每种数据特征的至少一个锚点;
选取标记样例,用所述每种数据特征的至少一个锚点分别表示所述标记样例;
用所述每种数据特征的至少一个锚点分别表示查询,并计算每种数据特征表示的查询和所述标记样例的相似度量;
利用每种数据特征表示的查询和所述标记样例的相似度量分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询。
可选的,所述生成每种数据特征的至少一个锚点,具体为:
采用聚类的方式生成每种数据特征的至少一个锚点。
可选的,所述选取标记样例的方法具体为:采用聚类或随机的方式选取标记样例。
可选的,所述获取利用所述每种特征对应的哈希表进行查询的多个查询结果,并将所述多个查询结果中的每个查询结果分别构建一个对应的图,具体包括:
利用相似度量计算查询适应的比特级别的权重,并根据哈希函数之间的关系进行权重优化;
基于优化后的权重,计算查询和结果的海明距离,并根据所述海明距离进行排序,获得排序结果;
利用锚点,计算近似近邻相似度;
根据所述优化后的权重、排序结果以及近似近邻相似度将每个查询结果构建一个对应的图。
可选的,所述利用图的重排序算法对所述每个查询结果在所述融合图上进行重新排序,得到最终的查询结果,具体包括:
分别计算每个查询结果在所述融合图上进行重新排序的排序得分;
根据所述排序得分,选择得分最高的查询结果作为最终的查询结果。
本发明的有益效果为:
本发明提供的一种基于哈希编码加权排序的自适应查询方法,将基于图的重排序方法和多特征融合的重排序方法相结合,根据多特征融合的哈希重排序结果,构造多个图,然后采用特征融合进行图融合,最后对融合图进行重排序,从而有效地综合多特征优势,实现数据的快速查询,降低内存的消耗,有效地提高了查询的效率和准确率,对查询性能有很大提升。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例的一种基于哈希编码加权排序的自适应查询方法的流程图;
图2示出了本发明实施例的一种基于哈希编码加权排序的自适应查询方法中步骤S12的细分流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。
图1示出了本发明实施例的一种基于哈希编码加权排序的自适应查询方法的流程图。
参照图1,本发明实施例提出的基于哈希编码加权排序的自适应查询方法包括:
S11、对查询数据提取多种特征,分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询;
S12、获取利用所述每种特征对应的哈希表进行查询的多个查询结果,并将所述多个查询结果中的每个查询结果分别构建一个对应的图;
S13、将每个查询结果对应的图进行融合,得到一个融合图;
S14、利用图的重排序算法对所述每个查询结果在所述融合图上进行重新排序,得到最终的查询结果。
本发明实施例提供的基于哈希编码加权排序的自适应查询方法,可以自适应地针对每种特征查询生成一组权重,对查询的结果进行加权海明距离排序,从而获得更加细粒度的更加精确的排序结果,提高非监督情形下多哈希表的鲁棒性和查询整体性能;同时查询适应的哈希编码排序方法具备普遍适用性,占用内存少,具有较高的准确率和较短的响应时间。
进一步地,所述步骤S11:对查询数据提取多种特征,分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询,具体包括:
训练数据提取多种数据特征,生成每种数据特征的至少一个锚点;
选取标记样例,用所述每种数据特征的至少一个锚点分别表示所述标记样例;
用所述每种数据特征的至少一个锚点分别表示查询,并计算每种数据特征表示的查询和所述标记样例的相似度量;
利用每种数据特征表示的查询和所述标记样例的相似度量分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询。
更进一步地,所述生成每种数据特征的至少一个锚点,具体为:
采用聚类的方式生成每种数据特征的至少一个锚点。
更进一步地,所述选取标记样例的方法具体为:采用聚类或随机的方式选取标记样例。
目前,基于哈希的最近邻搜索中,海明距离排序起到了帮助压缩存储和快速计算的作用。然而,由于哈希的量化步骤使得海明距离排序失去了样例中的准确的排序信息,这样就会导致海明距离的区分能力下降。例如,在实际中,对于一个查询,会有多个哈希桶共享相同的海明距离,这样落在这些哈希桶中的样例根据海明距离就会获得相同的排序。为了提升海明距离排序的准确性,获得更细粒度的排序结果,减少量化的损失是非常必要的。查询适应的加权海明距离哈希重排序方法学习一组查询适应的比特编码级别的权重,同时考虑每个哈希函数的区分能力和哈希函数之间的互补关系进行最近邻搜索,能够有效提高哈希编码的区分度,提高检索的准确率。同时具有普遍适用性。
具体而言,本发明实施例中提出的步骤S11:对查询数据提取多种特征,分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询的整体流程如图2所示,具体如下:
1.训练数据提取特征,采用聚类等方式生成锚点。
(1)用聚类等的方式选取r个锚点
选取标记样例,并用锚点来表示标记样例。
(1)用聚类或随机等方式选取nl个标记样例。
(2)用步骤(1)生成的锚点来表示标记样例,
其中,NN(x)表示x的在集合U中的最近邻锚点,K(x,uj)是表示核函数(例如,高斯核函数)。
用锚点表示查询,并计算查询和标记样例的相似度量。
(1)按照步骤(2)中描述的方法,用锚点表示查询q为z(q)。
(2)对查询q和nl个标记样例,通过下式计算相似度量:
s(q,p)=exp(-||z(p)-z(q)||22)
其中,σ被设置为z(q)和z(p)之间的最大距离。
利用相似度量计算查询适应的哈希比特级别的权重,并根据哈希函数之间的关系进行权重优化。
(1)对于哈希函数hk,查询q和标记样例中的数据点p经过哈希之后的编码为hk(q)和hk(p),计算查询适应的权重:
w k = exp [ γ Σ p ∈ NN ( q ) s ( q , p ) h k ( q ) h k ( p ) ]
(2)基于哈希函数之间的相互关系,对上一步得到权重wk进行优化,具体包括:
a)计算哈希函数的独立性矩阵A=(aij),其中相互独立性按下式进行计算:
aij=exp[-λMI(yi,yj)]
其中,MI(yi,yj)是相互信息。
b)求解如下目标函数:
max Σ ij w i * w j * a ij
上式得约束条件为1Tπ=1,π≥0,其中wk *=wkπk,求解得到πk
c)根据πk,求得调整后的权重wk *=wkπk
基于学习到的权重,计算查询和结果的加权海明距离,对结果进行排序。
计算查询q和查询结果的加权海明距离:
d ( x i , x j ) = Σ k = 1 m w k ( y ik ⊕ y jk )
其中,yik=hk(xi)。
本发明实施例,针对每个查询,同时考虑哈希函数保存最近邻信息的能力和哈希函数之间的相互独立性,为每个哈希函数学习一个权重,对查询结果进行加权排序。该方式具有以下优势:查询适应的权重,对哈希编码加权可以得到更细粒度的排序结果;没有对数据集的严格分布假设,对于不同类型的哈希算法更加具备普遍适用性;内存消耗少,具有扩展性。
进一步地,所述步骤S12:获取利用所述每种特征对应的哈希表进行查询的多个查询结果,并将所述多个查询结果中的每个查询结果分别构建一个对应的图,具体包括:
利用相似度量计算查询适应的比特级别的权重,并根据哈希函数之间的关系进行权重优化;
基于优化后的权重,计算查询和结果的海明距离,并根据所述海明距离进行排序,获得排序结果;
利用锚点,计算近似近邻相似度;
根据所述优化后的权重、排序结果以及近似近邻相似度将每个查询结果构建一个对应的图。
本发明实施例提供的基于哈希编码加权排序的自适应查询方法具体包括如下两个阶段:
离线阶段,构建哈希表
输入:多个特征的数据(xi,i=1,...,n},哈希算法F
for m-th特征数据do
使用F产生哈希函数集H={h1(·),...,hb(·)};
将每个特征的数据xi映射为哈希编码yik=hk(xi);
计算独立性参数aij,构建哈希表Tm
end for
在线阶段,检索哈希表
输入:查询q,哈希表Tm,独立性参数aij
for哈希表Tm do
计算查询适应的比特级别的权重wk
根据海明距离排序,获得检索Top排序结果Vm
利用锚点,计算近似近邻相似度ωm
构建图Gm=(Vm,Em,ωm);
end for
将多图Gm融合,得到融合图G=(V,E,ω);
计算排序得分p,对候选集重新排序。
整个算法分为两个阶段。在离线阶段,我们可以非常高效的选取K个锚点。在线查询阶段,N个特征进行查询,每个特征得到n个查询结果,计算每个结果到查询结果到锚点的距离,并计算任意两个数据点之间的相似度,时间复杂度为O(K2Nn2),K,N都是常量,n是查询结果数,通常数值也较小。再用page-rank算法进行基于图的重排序阶段,时间复杂度为O(|E|)。
进一步地,所述利用图的重排序算法对所述每个查询结果在所述融合图上进行重新排序,得到最终的查询结果,具体包括:
分别计算每个查询结果在所述融合图上进行重新排序的排序得分;
根据所述排序得分,选择得分最高的查询结果作为最终的查询结果。
本发明实施例中,图构造和融合策略具体如下:
定义查询图像q,假设使用N个特征进行检索,则得到初始检索排序结果集合{Rm,m=1,...,N},然后我们构造重排序的数据集Dm={x|x∈Rm或x=q},若xi和xj是数据集Dm中的两张图像,则他们的相似度为S(xi,xj)。描绘多组候选节点局部近邻结构的模型中,图模型是非常有效的。
在实际中,相似的候选节点通常拥有一个共同的近邻分布结构。因此,在相似性测量中,能否获得每个节点的局部近邻结构是非常重要的。在传统的方法中,相似性测量通常基于视觉特征或者提前处理的近邻结构,使用特征之间的欧式距离等方式来计算。因为内存消耗和更新开销太大,这样的方式在实际的大规模数据集计算中很难被真正的应用。
为了避免这种问题,在线构造图的过程中,我们利用加权海明空间中的锚点相似性来估计近邻关系。在整个数据集中选择比较少的K个锚点组成的数据集合来代表整个数据集。这样,每个节点都能被它的最近邻锚点来表示,然后我们可以通过校验两个节点是否有相似的最近邻锚点的方法来说明这两个节点是否是近邻关系。
对于每个数据集Dm,我们构造一个带有权重的的无向图Gm=(Vm,Em,ωm),其中,图的顶点Vm由数据集Dm中的点构成,对于Dm中的两个图像i和i′,若它们是相似的,则它们之间由一条边相连,(xi,xj)∈Em,ω(xi,xj)=S(xi,xj)。
下面对于数据集中的点相似关系以及相似度进行详细定义。
对于候选集Vm,从数据集中选取K(K<<N)个锚点 来描绘固有的近邻结构。这样任何的数据点都可以xi都可以通过向量的方式,用它的近邻锚点来表示,其中向量中的元素通过下式来定义:
上式中,<i>m是点xi通过计算与锚点的加权海明距离产生的最近邻锚点的下标。接下来,候选集Vm中两点的相似度Sm可以通过下式计算:
s m ( x i , x j ) = 1 &lambda; i m Z i &CenterDot; m Z j &CenterDot; mT
其中,因为Zm只有s个非零元素,是个稀疏的,所以相似度Sm也是十分稀疏的,只有共享相同的最近邻锚点的数据才被认为是近邻数据。
在上面的计算中,锚点的个数通常是小于返回结果的个数的,这样相比于其它方法,我们的方法能够有效地减少计算量,提高效率。
根据每个特征的初始检索排序结果,我们获得多个图{Gm=(Vm,Em,ωm),m=1,...,N},然后我们将它们融合成一个图G=(V,E,ω),其中顶点对应所有的候选结果,无重复。然后,对于每对候选结果,如果在图Gm中有一条边,那么在图G中也有一条对应的边,该边的权重为所有子图权重之和。这就能够保证在每个图中都表现为最近邻关系的节点,再融合图中能够获得更高的排序。基于锚点表示的方法,不仅能够得到节点之间的局部结构关系,同时使得不同的排序结果经过归一化之后转化为可以比较的。这样,没有任何的预处理操作,我们平等的看待每个特征的检索结果图,将它们的边的权重相加,如下:
V=∪Vm
E=∪Em
ω(xi,xj)=Σmωm(xi,xj)
综上所述,本发明提供的一种基于哈希编码加权排序的自适应查询方法,将基于图的重排序方法和多特征融合的重排序方法相结合,根据多特征融合的哈希重排序结果,有效地表达图像分布的信息,并构造多个图,然后采用特征融合进行图融合,最后对融合图进行重排序,从而有效地综合多特征优势,实现数据的快速查询,降低内存的消耗,有效地提高了查询的效率和准确率,对查询性能有很大提升。
能够有效地综合多特征优势,对查询性能有很大改善
实现大数据的快速查询,同时降低内存的消耗,有效地提高了查询的效率和准确率。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (6)

1.一种基于哈希编码加权排序的自适应查询方法,其特征在于,所述方法包括:
对查询数据提取多种特征,分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询;
获取利用所述每种特征对应的哈希表进行查询的多个查询结果,并将所述多个查询结果中的每个查询结果分别构建一个对应的图;
将每个查询结果对应的图进行融合,得到一个融合图;
利用图的重排序算法对所述每个查询结果在所述融合图上进行重新排序,得到最终的查询结果。
2.根据权利要求1所述的方法,其特征在于,所述对查询数据提取多种特征,分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询,具体包括:
训练数据提取多种数据特征,生成每种数据特征的至少一个锚点;
选取标记样例,用所述每种数据特征的至少一个锚点分别表示所述标记样例;
用所述每种数据特征的至少一个锚点分别表示查询,并计算每种数据特征表示的查询和所述标记样例的相似度量;
利用每种数据特征表示的查询和所述标记样例的相似度量分别为每种特征构建一个哈希表,并利用每种特征对应的哈希表分别进行查询。
3.根据权利要求2所述的方法,其特征在于,所述生成每种数据特征的至少一个锚点,具体为:
采用聚类的方式生成每种数据特征的至少一个锚点。
4.根据权利要求2所述的方法,其特征在于,所述选取标记样例的方法具体为:采用聚类或随机的方式选取标记样例。
5.根据权利要求2所述的方法,其特征在于,所述获取利用所述每种特征对应的哈希表进行查询的多个查询结果,并将所述多个查询结果中的每个查询结果分别构建一个对应的图,具体包括:
利用相似度量计算查询适应的比特级别的权重,并根据哈希函数之间的关系进行权重优化;
基于优化后的权重,计算查询和结果的海明距离,并根据所述海明距离进行排序,获得排序结果;
利用锚点,计算近似近邻相似度;
根据所述优化后的权重、排序结果以及近似近邻相似度将每个查询结果构建一个对应的图。
6.根据权利要求1所述的方法,其特征在于,所述利用图的重排序算法对所述每个查询结果在所述融合图上进行重新排序,得到最终的查询结果,具体包括:
分别计算每个查询结果在所述融合图上进行重新排序的排序得分;
根据所述排序得分,选择得分最高的查询结果作为最终的查询结果。
CN201510106700.3A 2015-03-11 2015-03-11 一种基于哈希编码加权排序的自适应查询方法 Active CN104731882B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510106700.3A CN104731882B (zh) 2015-03-11 2015-03-11 一种基于哈希编码加权排序的自适应查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510106700.3A CN104731882B (zh) 2015-03-11 2015-03-11 一种基于哈希编码加权排序的自适应查询方法

Publications (2)

Publication Number Publication Date
CN104731882A true CN104731882A (zh) 2015-06-24
CN104731882B CN104731882B (zh) 2018-05-25

Family

ID=53455769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510106700.3A Active CN104731882B (zh) 2015-03-11 2015-03-11 一种基于哈希编码加权排序的自适应查询方法

Country Status (1)

Country Link
CN (1) CN104731882B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126670A (zh) * 2016-06-28 2016-11-16 努比亚技术有限公司 运营数据排序处理方法及装置
CN106126585A (zh) * 2016-06-20 2016-11-16 北京航空航天大学 基于质量分级与感知哈希特征组合的无人机图像检索方法
CN106484782A (zh) * 2016-09-18 2017-03-08 重庆邮电大学 一种基于多核哈希学习的大规模医学图像检索方法
CN109766371A (zh) * 2019-01-16 2019-05-17 宁波大学 基于列表监督的哈希排序方法
WO2020019562A1 (zh) * 2018-07-27 2020-01-30 天津字节跳动科技有限公司 搜索排序方法、装置、电子设备和存储介质
US10558687B2 (en) 2016-10-27 2020-02-11 International Business Machines Corporation Returning search results utilizing topical user click data when search queries are dissimilar
US10592568B2 (en) 2016-10-27 2020-03-17 International Business Machines Corporation Returning search results utilizing topical user click data when search queries are dissimilar
WO2021036070A1 (zh) * 2019-08-30 2021-03-04 深圳计算科学研究院 一种海明空间近似查询方法及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609441A (zh) * 2011-12-27 2012-07-25 中国科学院计算技术研究所 基于分布熵的局部敏感哈希高维索引方法
CN103077228A (zh) * 2013-01-02 2013-05-01 北京科技大学 一种基于集合特征向量的快速聚类方法和装置
CN104035949A (zh) * 2013-12-10 2014-09-10 南京信息工程大学 一种基于局部敏感哈希改进算法的相似性数据检索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609441A (zh) * 2011-12-27 2012-07-25 中国科学院计算技术研究所 基于分布熵的局部敏感哈希高维索引方法
CN103077228A (zh) * 2013-01-02 2013-05-01 北京科技大学 一种基于集合特征向量的快速聚类方法和装置
CN104035949A (zh) * 2013-12-10 2014-09-10 南京信息工程大学 一种基于局部敏感哈希改进算法的相似性数据检索方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
侯红梅: "图像搜索重排序算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
卢佳音: "基于图像哈希检索的图像重排方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
李艳凤等: "基于哈希理论和线性近邻传递反馈的乳腺X线图像肿块检索方法", 《物理学报》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126585A (zh) * 2016-06-20 2016-11-16 北京航空航天大学 基于质量分级与感知哈希特征组合的无人机图像检索方法
CN106126585B (zh) * 2016-06-20 2019-11-19 北京航空航天大学 基于质量分级与感知哈希特征组合的无人机图像检索方法
CN106126670A (zh) * 2016-06-28 2016-11-16 努比亚技术有限公司 运营数据排序处理方法及装置
CN106126670B (zh) * 2016-06-28 2020-01-14 江苏果米文化发展有限公司 运营数据排序处理方法及装置
CN106484782A (zh) * 2016-09-18 2017-03-08 重庆邮电大学 一种基于多核哈希学习的大规模医学图像检索方法
CN106484782B (zh) * 2016-09-18 2019-11-12 重庆邮电大学 一种基于多核哈希学习的大规模医学图像检索方法
US10558687B2 (en) 2016-10-27 2020-02-11 International Business Machines Corporation Returning search results utilizing topical user click data when search queries are dissimilar
US10592568B2 (en) 2016-10-27 2020-03-17 International Business Machines Corporation Returning search results utilizing topical user click data when search queries are dissimilar
WO2020019562A1 (zh) * 2018-07-27 2020-01-30 天津字节跳动科技有限公司 搜索排序方法、装置、电子设备和存储介质
CN109766371A (zh) * 2019-01-16 2019-05-17 宁波大学 基于列表监督的哈希排序方法
CN109766371B (zh) * 2019-01-16 2021-04-09 宁波大学 基于列表监督的哈希排序方法
WO2021036070A1 (zh) * 2019-08-30 2021-03-04 深圳计算科学研究院 一种海明空间近似查询方法及存储介质

Also Published As

Publication number Publication date
CN104731882B (zh) 2018-05-25

Similar Documents

Publication Publication Date Title
CN109918532B (zh) 图像检索方法、装置、设备及计算机可读存储介质
CN104731882A (zh) 一种基于哈希编码加权排序的自适应查询方法
CN108920720B (zh) 基于深度哈希和gpu加速的大规模图像检索方法
CN110765281A (zh) 一种多语义深度监督跨模态哈希检索方法
CN107092661A (zh) 一种基于深度卷积神经网络的图像检索方法
CN105469096A (zh) 一种基于哈希二值编码的特征袋图像检索方法
CN103617157A (zh) 基于语义的文本相似度计算方法
CN108446334B (zh) 一种无监督对抗训练的基于内容的图像检索方法
CN103778227A (zh) 从检索图像中筛选有用图像的方法
CN108399185B (zh) 一种多标签图像的二值向量生成方法及图像语义相似度查询方法
CN113377981B (zh) 基于多任务深度哈希学习的大规模物流商品图像检索方法
CN108595688A (zh) 基于在线学习的潜在语义跨媒体哈希检索方法
CN108984642A (zh) 一种基于哈希编码的印花织物图像检索方法
CN111125411A (zh) 一种深度强相关哈希学习的大规模图像检索方法
CN104715021A (zh) 一种基于哈希方法的多标记学习的设计方法
CN103020321B (zh) 近邻搜索方法与系统
CN110442618B (zh) 融合专家信息关联关系的卷积神经网络评审专家推荐方法
Liu et al. Neighbor selection for multilabel classification
CN107451617B (zh) 一种图转导半监督分类方法
CN105183746A (zh) 从多相关图片中挖掘显著特征实现图像检索的方法
CN113111185A (zh) 一种用于知识图谱补全任务的关键路径构建方法和系统
CN115457332A (zh) 基于图卷积神经网络和类激活映射的图像多标签分类方法
CN115618096A (zh) 内积检索方法和电子设备
CN115329120A (zh) 一种知识图谱嵌入注意力机制的弱标注哈希图像检索架构
Liang et al. Cross-media semantic correlation learning based on deep hash network and semantic expansion for social network cross-media search

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210319

Address after: 100080 c-95, 4th floor, 48 Haidian West Street, Haidian District, Beijing

Patentee after: Beijing Zhongke ningkun Technology Co.,Ltd.

Address before: 100191 No. 37, Haidian District, Beijing, Xueyuan Road

Patentee before: BEIHANG University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220906

Address after: A14-5, 13th Floor, Building A, Building J1, Phase II, Innovation Industrial Park, No. 2800, Chuangxin Avenue, High-tech Zone, Hefei, China (Anhui) Pilot Free Trade Zone, 230088

Patentee after: Anhui aiguan Vision Technology Co.,Ltd.

Address before: 100080 c-95, 4th floor, 48 Haidian West Street, Haidian District, Beijing

Patentee before: Beijing Zhongke ningkun Technology Co.,Ltd.

TR01 Transfer of patent right