CN104035949B - 一种基于局部敏感哈希改进算法的相似性数据检索方法 - Google Patents

一种基于局部敏感哈希改进算法的相似性数据检索方法 Download PDF

Info

Publication number
CN104035949B
CN104035949B CN201310664350.3A CN201310664350A CN104035949B CN 104035949 B CN104035949 B CN 104035949B CN 201310664350 A CN201310664350 A CN 201310664350A CN 104035949 B CN104035949 B CN 104035949B
Authority
CN
China
Prior art keywords
hash
data
hash table
function
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310664350.3A
Other languages
English (en)
Other versions
CN104035949A (zh
Inventor
马廷淮
陆颖华
田伟
朱节中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhixin Future Information Technology Co ltd
Shanghai Airlines Intellectual Property Services Ltd
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201310664350.3A priority Critical patent/CN104035949B/zh
Publication of CN104035949A publication Critical patent/CN104035949A/zh
Application granted granted Critical
Publication of CN104035949B publication Critical patent/CN104035949B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于局部敏感哈希改进算法的相似性数据检索方法,首先对数据对象进行特征提取,将每一个数据对象使用其特征集合表示,基于向量空间模型把每一个数据对象转换为特征空间的向量;然后使用一组哈希函数,建立多个哈希表,将所有的数据对象映射到相应的哈希桶中;接着对于查询对象,随机选择一个哈希表进行映射,对于与查询对象在同一哈希桶的数据对象,以同样方式利用剩余的哈希表进行映射,并将所有与这些对象在同一哈希桶中的对象合并成为查询候选集;最后将查询对象与查询候选集中的数据对象进行真实距离的计算,从而得到最邻近对象。本发明在保持准确率和召回率的前提下减少了传统局部敏感哈希的内存需求,适合于处理大量的高维数据的相似性检索。

Description

一种基于局部敏感哈希改进算法的相似性数据检索方法
技术领域
本发明涉及相似性搜索技术领域,设计一种基于局部敏感哈希改进算法的相似性数据检索方法。
背景技术
数据的相似性研究是计算机科学中一个重要的基础性课题,在很多情况下,我们需要从海量数据对象集合中快速而准确地找出与给定数据相似的那些数据对象,这一过程称之为相似性搜索。相似性搜索被广泛应用于信息检索、数据挖掘、机器学习、信号处理等领域。目前广泛采用的检索算法主要是基于空间划分的算法,多表现为树形结构,例如R-tree,Kd-tree和SR-tree等。这种树形索引算法在处理低维数据空间上的相似性查询表现优异,但是当维数升高时,这些方法的性能会退化到线性查找的程度,也就是常说的“维度灾害”。LSH(Locality Sensitive Hashing)算法为解决这种“维度灾难”问题提供了一条有效途径,可用来解决主存储器中高维特征的相似性搜索问题。
LSH作为一种有效的近似最近邻查询技术,它把高维向量的相似性计算问题转换到低维的海明空间,并且在低维空间保证数据之间的相似性,其实质是一种数据降维操作。其过程主要分为两个过程:过滤和查询。过滤即选用一组特定的哈希函数,把具有相同特性的数据以特定的概率投影到同一个集合中,即保证数据的相似度越高,投影到相同集合中的概率就越大,从而实现了过滤掉非相似数据集,得到了近乎全部候选数据集合的目的。查询即将待查询的对象通过相同的哈希函数将其投影到对应的集合中,然后在所投影的集合中计算待查询对象与改集合中数据对象之间距离或者是相似程度,从而返回查询的结果。
根据LSH函数族的种类可以将LSH分为:基于比特取样的LSH、基于最小独立置换的LSH、基于随机投影的LSH、基于Lattice的LSH以及基于P稳定分布的LSH,其中基于P稳定分布的LSH被广泛应用。由于LSH在高维数据空间的优异性能,其被广泛应用于数据库、信息检索等领域。王洪峰提出了基于局部敏感哈希的网络视频重复检测方法,成功检索出与查询镜头想匹配的所有镜头,得到查询视频的重复或者近似重复的视频集。赵永威利用LSH构建了视觉词典,提取了查询目标与图像数据库的SIFT特征,利用LSH进行映射,实现特征点与视觉单词的匹配,生成视觉词典组。
LSH被提出之后得到了广泛的关注,并被成功用于许多应用中。但是LSH本身依然存在不少问题,比如为了获得较好的查询效果,需要大量的哈希表,进而消耗大量的内存空间。
发明内容
本发明所要解决的技术问题是针对传统的局部敏感哈希算法为了要得到更加准确的查询 结果,需要大量哈希表的问题,提出一种基于随机策略的基于局部敏感哈希改进算法的相似性数据检索方法,利用由待查询对象随机选择哈希表的方法,减少需要存储的哈希表的个数,不仅可以较为精确地查找与待查询对象的最近邻对象,而且扩展了局部敏感哈希可以处理的数据集的大小。
本发明为解决上述技术问题采用以下技术方案:
一种基于局部敏感哈希改进算法的相似性数据检索方法,包含以下步骤:
步骤1),对需要处理的数据集合进行特征提取,得到预处理之后的数据集;
步骤2),将得到的数据集中的对象根据向量空间模型均表示为向量形式,得到数据对象向量集合;
步骤3),根据数据集特征以及所需的准确率和召回率来确定哈希表个数并根据局部敏感哈希函数族构建个哈希表;
步骤4),将数据向量集合中的每一个对象分别通过个哈希表进行映射,映射到相应的哈希桶中;
步骤5),将待查询对象以向量形式表示,从个哈希表中任意选取一个哈希表进行映射,得到与待查询对象处于同一哈希桶的其他对象的集合;
步骤6),对于步骤5)中得到的对象的集合的每一个对象,在其余的哈希表分别进行查找,得到与这些对象处于同一哈希桶的其他对象的集合;
步骤7),将步骤5)和步骤6)得到的对象的集合融合形成最终的候选对象集合;
步骤8),计算候选对象集合中每一个对象与待查询对象之间的真实距离,并根据真实距离进行升序排序,得到最相似的对象。
作为本发明一种基于局部敏感哈希改进算法的相似性数据检索方法进一步的优化方案,步骤3)中所述构建个哈希表的步骤如下:
步骤301),根据实际采用的距离函数,选取局部敏感哈希函数族n≥1,其中为局部敏感哈希族,hi表示该哈希函数族所包含的哈希函数,i=1,2,...,n;
步骤302),根据所需的准确率和召回率来选取参数k,在哈希函数族的基础上,对数据集中的点进行哈希,构造新的函数族使得距离近的点冲突的概率远大于距离远的点冲突的概率,m≥1,其中每一个函数h′i由k个中的函数h1,h2,…,hk构成,即h′i={hi1,hi2,...,hik},i=1,2,...,m;
步骤303),从函数族中,根据数据集特征以及所需的准确率和召回率选取个函数组成函数族G,其中每个哈希函数对应一个哈希表,形成个哈希表。
作为本发明一种基于局部敏感哈希改进算法的相似性数据检索方法进一步的优化方案, 步骤5)采用随机数方法来实现所述从个哈希表中任意选取一个哈希表进行映射。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明针对局部敏感哈希算法进行改进,基于随机策略的局部敏感哈希方法,能够较快、较准的查询到与待查询对象最近邻的对象。该方法首先根据不同的数据类型对数据对象进行特征提取,其次在减少了哈希表个数的同时保证了查询对象的多样性,最大化涵盖了与待查询对象相似的所有对象,从而提升了相似性检索的查询效益。相对于传统的局部敏感哈希算法,能够处理维度更大,个数更多的数据集合,特别适合高维度稀疏数据的相似性检索。
附图说明
图1是本发明的流程图;
图2是本发明构建哈希表的流程图;
图3是本发明哈希表的构建过程示意图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
如图1所示,本发明公开了一种基于局部敏感哈希改进算法的相似性数据检索方法,包含以下步骤:
步骤10,将需要处理的数据集合按照不同的数据类型提取出数据的属性特征;
步骤20,根据向量空间模型将数据均表示为向量形式,得到数据对象向量集合S={s1,s2,...,sn},每一个si均是d维向量si=(si1,si2,...,sid);
步骤30,根据数据集特征以及所需的准确率和召回率来选取适当的参数其中是哈希表的个数,根据局部敏感哈希函数族构建个哈希表在这里分别取值
步骤40,将数据向量集合S中的每一个对象分别通过个哈希表进行映射,映射到相应的哈希桶中,记录下每个数据对象在每一个哈希表中对应的哈希桶索引编号,以这种形式表示(ID,,BucketID),ID表示数据对象序号,表示哈希表编号,BucketID表示数据对象ID在哈希表编号为的情况下对应的哈希桶编号BucketID;
步骤50,将待查询对象q,同样以向量形式表示,从个哈希表中利用随机函数任意选取一个哈希表进行映射,得到与待查询对象处于同一哈希桶的其他对象Xi=(xi1,xi2,...,xim),i代表随机选择的哈希表编号;
步骤60,对与待查询对象冲突的其他数据对象集合Xi=(xi1,xi2,...,xim)的每一个对象xir通过其他个哈希表(哈希表编号不等于i)进行查找,得到与这些对象处于同一哈希桶的对象集合其中Xj≠Xi
步骤70,将步骤50和步骤60得到的对象集合X和Xi融合形成最终的候选对象集合CandidateSet。
步骤80,计算待查询对象与候选对象CandidateSet的真实距离,升序排序得到最邻近对象或前K个邻近对象,这里K的值根据用户需要指定。
如图2所示,构建哈希表的流程如下:
步骤301,根据实际采用的距离函数,选取合适的局部敏感哈希函数族(n≥1),其中为局部敏感哈希族,hi(i=1,2,...,n)表示该哈希函数族所包含的哈希函数。
步骤302,根据所需的准确率和召回率来选取参数k,这里取值k=10,在哈希函数族的基础上,构造新的函数族 (m≥1),其中每一个函数h′i(i=1,2,...,m)由k个中的函数h1,h2,…,hk构成,即h′i={hi1,hi2,...,hik}。任意两个数据对象x和y经过h′映射后,h′i(x)=h′i(y)当且仅当至少有一个hij(x)=hij(y),i=1,2,...,m,j=1,2,...,k。这里能够选择的局部敏感哈希族是有限制的,它们均是在下面的原则上构建的:对数据集中的点进行哈希,使得距离近的点冲突的概率远大于距离远的点冲突的概率。常用的四种典型的局部敏感哈希函数族分别是:基于海明距离的局部敏感哈希函数族、基于Jaccard参数的局部敏感哈希函数族、Arccos局部敏感哈希函数族和基于稳态分布的局部敏感哈希函数族。例如对于稳态分布的局部敏感哈希函数族中的每个哈希函数定义为:
其中a是一个满足p稳态分布的随机向量,b是一个实数,满足b∈[0,W]。每一个哈希函数ha,b:Rd→Z将一个d维向量映射成一个整数。
步骤303,根据数据集特征以及所需的准确率和召回率,从函数族中选取个函数组成函数族其中每个哈希函数gi 对应一个哈希表,形成个哈希表,如图3所示。对于S中的向量v和任一个函数gi∈Ggi(v)=<hi1(v),hi2(v),...,hik(v)>,其中hij∈H(1≤j≤k)。这里通过对k个哈希函数 值的连接构成哈希的键,即key=hi1(v)Λhi2(v)Λ...Λhik(v),这里用符号Λ表示哈希关键字的连接操作。连接即是对k个哈希函数值通过某种运算操作,构造一个整数值,使得不同的哈希函数值连接之后的值不同,例如MD5算法。
以上所述的具体实施方案,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,所应理解的是,以上所述仅为本发明的具体实施方案而已,并非用以限定本发明的范围,任何本领域的技术人员,在不脱离本发明的构思和原则的前提下所做出的等同变化与修改,均应属于本发明保护的范围。

Claims (3)

1.一种基于局部敏感哈希改进算法的相似性数据检索方法,其特征在于包含以下步骤:
步骤1),对需要处理的数据集合进行特征提取,得到预处理之后的数据集;
步骤2),将得到的数据集中的对象根据向量空间模型均表示为向量形式,得到数据对象向量集合;
步骤3),根据数据集特征以及所需的准确率和召回率来确定哈希表个数并根据局部敏感哈希函数族构建个哈希表;
步骤4),将数据向量集合中的每一个对象分别通过个哈希表进行映射,映射到相应的哈希桶中;
步骤5),将待查询对象以向量形式表示,从个哈希表中任意选取一个哈希表进行映射,得到与待查询对象处于同一哈希桶的其他对象的集合;
步骤6),对于步骤5)中得到的对象的集合的每一个对象,在其余的哈希表分别进行查找,得到与这些对象处于同一哈希桶的其他对象的集合;
步骤7),将步骤5)和步骤6)得到的对象的集合融合形成最终的候选对象集合;
步骤8),计算候选对象集合中每一个对象与待查询对象之间的真实距离,并根据真实距离进行升序排序,得到最相似的对象。
2.根据权利要求1所述的基于局部敏感哈希改进算法的相似性数据检索方法,其特征在于,步骤3)中所述构建个哈希表的步骤如下:
步骤301),根据实际采用的距离函数,选取局部敏感哈希函数族n≥1,其中为局部敏感哈希族,hi表示该哈希函数族所包含的哈希函数,i=1,2,...,n;
步骤302),根据所需的准确率和召回率来选取参数k,在哈希函数族的基础上,对数据集中的点进行哈希,构造新的函数族使得距离近的点冲突的概率远大于距离远的点冲突的概率,m≥1,其中每一个函数h′i由k个中的函数h1,h2,…,hk构成,即h′i={hi1,hi2,...,hik},i=1,2,...,m;
步骤303),从函数族中,根据数据集特征以及所需的准确率和召回率选取个函数组成函数族G,其中每个哈希函数对应一个哈希表,形成个哈希表。
3.根据权利要求1所述的基于局部敏感哈希改进算法的相似性数据检索方法,其特征在于,步骤5)中采用随机数方法来实现所述从个哈希表中任意选取一个哈希表进行映射。
CN201310664350.3A 2013-12-10 2013-12-10 一种基于局部敏感哈希改进算法的相似性数据检索方法 Expired - Fee Related CN104035949B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310664350.3A CN104035949B (zh) 2013-12-10 2013-12-10 一种基于局部敏感哈希改进算法的相似性数据检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310664350.3A CN104035949B (zh) 2013-12-10 2013-12-10 一种基于局部敏感哈希改进算法的相似性数据检索方法

Publications (2)

Publication Number Publication Date
CN104035949A CN104035949A (zh) 2014-09-10
CN104035949B true CN104035949B (zh) 2017-05-10

Family

ID=51466720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310664350.3A Expired - Fee Related CN104035949B (zh) 2013-12-10 2013-12-10 一种基于局部敏感哈希改进算法的相似性数据检索方法

Country Status (1)

Country Link
CN (1) CN104035949B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019165546A1 (en) * 2018-03-01 2019-09-06 Huawei Technologies Canada Co., Ltd. Layered locality sensitive hashing (lsh) partition indexing for big data applications

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104516946B (zh) * 2014-11-27 2017-08-04 宁波大学 一种基于高维数据过滤器的近似成员查询方法
CN105989078B (zh) * 2015-02-11 2019-05-07 烟台中科网络技术研究所 一种结构化对等网络构建索引的方法、检索方法、装置及系统
CN104731882B (zh) * 2015-03-11 2018-05-25 北京航空航天大学 一种基于哈希编码加权排序的自适应查询方法
CN104778234A (zh) * 2015-03-31 2015-07-15 南京邮电大学 基于局部敏感哈希技术的多标记文件近邻查询方法
CN104866471B (zh) * 2015-06-05 2017-09-19 南开大学 一种基于局部敏感哈希策略的实例匹配方法
CN105095435A (zh) * 2015-07-23 2015-11-25 北京京东尚科信息技术有限公司 一种图像高维特征的相似比较方法及装置
CN105183792B (zh) * 2015-08-21 2017-05-24 东南大学 一种基于局部敏感哈希的分布式快速文本分类方法
CN110175258B (zh) * 2016-02-05 2024-01-23 大连大学 建立基于位置敏感哈希索引的移动感知数据查询方法
CN105760469B (zh) * 2016-02-05 2019-05-31 大连大学 云计算环境下基于倒排lsh的高维近似图象检索方法
US10778707B1 (en) 2016-05-12 2020-09-15 Amazon Technologies, Inc. Outlier detection for streaming data using locality sensitive hashing
CN106570141B (zh) * 2016-11-04 2020-05-19 中国科学院自动化研究所 近似重复图像检测方法
US10496706B2 (en) 2017-04-17 2019-12-03 International Business Machines Corporation Matching strings in a large relational database
CN107515937B (zh) * 2017-08-29 2020-10-27 千寻位置网络有限公司 差分账户的归类方法及系统、服务终端、存储器
CN107656989B (zh) * 2017-09-13 2019-09-13 华中科技大学 云存储系统中基于数据分布感知的近邻查询方法
CN109697641A (zh) * 2017-10-20 2019-04-30 北京京东尚科信息技术有限公司 计算商品相似度的方法和装置
CN107729557A (zh) * 2017-11-08 2018-02-23 北京大学 一种编目信息的分类、检索方法和装置
US10949467B2 (en) * 2018-03-01 2021-03-16 Huawei Technologies Canada Co., Ltd. Random draw forest index structure for searching large scale unstructured data
CN108959441A (zh) * 2018-06-13 2018-12-07 新华智云科技有限公司 一种基于局部敏感哈希的近相似快速查找方法
CN109189964A (zh) * 2018-07-20 2019-01-11 杭州电子科技大学 基于局部敏感哈希索引和图像路标的场景识别方法
CN109213874A (zh) * 2018-08-30 2019-01-15 福建师范大学 一种wmsn区块链的多媒体混合数据近似近邻二元查询方法
CN110889422A (zh) * 2018-09-10 2020-03-17 百度在线网络技术(北京)有限公司 同行车辆的判断方法、装置、设备及计算机可读介质
CN109445703B (zh) * 2018-10-26 2019-10-25 黄淮学院 一种基于块级数据去重的Delta压缩存储组件
CN111294728A (zh) * 2018-12-06 2020-06-16 西安光启未来技术研究院 同行分析方法及装置
CN109766341B (zh) * 2018-12-27 2022-04-22 厦门市美亚柏科信息股份有限公司 一种建立哈希映射的方法、装置、存储介质
CN110134714B (zh) * 2019-05-22 2021-04-20 东北大学 适用于大数据迭代计算的分布式计算框架缓存索引方法
WO2020252639A1 (zh) * 2019-06-17 2020-12-24 深圳市欢太科技有限公司 内容推送方法及相关产品
CN110543622A (zh) * 2019-08-02 2019-12-06 北京三快在线科技有限公司 文本相似度检测方法、装置、电子设备及可读存储介质
CN110502629B (zh) * 2019-08-27 2020-09-11 桂林电子科技大学 一种基于lsh的过滤验证字符串相似性连接方法
CN110795469B (zh) * 2019-10-11 2022-02-22 安徽工业大学 基于Spark的高维序列数据相似性查询方法及系统
CN111241106B (zh) * 2020-01-15 2023-08-29 平安科技(深圳)有限公司 近似数据处理方法、装置、介质及电子设备
CN111352834B (zh) * 2020-02-25 2023-06-09 江苏大学 一种基于局部敏感哈希的自适应随机测试方法
CN112559170B (zh) * 2020-11-30 2022-09-20 河海大学 一种边缘计算环境下缓存数据的近似匹配方法
CN112699676B (zh) * 2020-12-31 2024-04-12 中国农业银行股份有限公司 一种地址相似关系生成方法及装置
CN113515450A (zh) * 2021-05-20 2021-10-19 广东工业大学 一种环境异常检测方法和系统
CN114332742B (zh) * 2022-03-08 2022-06-03 西安科技大学 一种基于深度神经网络的异常视频大数据清洗方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8185561B1 (en) * 2005-08-15 2012-05-22 Google Inc. Scalable user clustering based on set similarity
CN103336963A (zh) * 2013-07-08 2013-10-02 天脉聚源(北京)传媒科技有限公司 一种图像特征提取的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100070509A1 (en) * 2008-08-15 2010-03-18 Kai Li System And Method For High-Dimensional Similarity Search

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8185561B1 (en) * 2005-08-15 2012-05-22 Google Inc. Scalable user clustering based on set similarity
CN103336963A (zh) * 2013-07-08 2013-10-02 天脉聚源(北京)传媒科技有限公司 一种图像特征提取的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种重复视频的快速检测算法;刘大伟等;《小型微型计算机系统》;20130630;第34卷(第6期);第1400-1404页 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019165546A1 (en) * 2018-03-01 2019-09-06 Huawei Technologies Canada Co., Ltd. Layered locality sensitive hashing (lsh) partition indexing for big data applications

Also Published As

Publication number Publication date
CN104035949A (zh) 2014-09-10

Similar Documents

Publication Publication Date Title
CN104035949B (zh) 一种基于局部敏感哈希改进算法的相似性数据检索方法
Zheng et al. Packing and padding: Coupled multi-index for accurate image retrieval
US11048966B2 (en) Method and device for comparing similarities of high dimensional features of images
CN101866366B (zh) 一种基于内容的图像格式中文文档检索方法
Chen et al. Ranking consistency for image matching and object retrieval
CN104081435A (zh) 一种基于级联二值编码的图像匹配方法
Zheng et al. Visual phraselet: Refining spatial constraints for large scale image search
CN104199827A (zh) 基于局部敏感哈希的大规模多媒体数据的高维索引方法
CN102254015A (zh) 基于视觉词组的图像检索方法
CN103617217A (zh) 一种基于层次索引的图像检索方法及系统
CN102609441A (zh) 基于分布熵的局部敏感哈希高维索引方法
CN107180079B (zh) 基于卷积神经网络以及树与哈希结合索引的图像检索方法
CN106570165A (zh) 一种基于内容的视频检索方法及装置
CN110334290B (zh) 一种基于MF-Octree的时空数据快速检索方法
Dong et al. Mining data correlation from multi-faceted sensor data in the Internet of Things
Liu et al. Visual reranking with improved image graph
Zhu et al. SVS-JOIN: efficient spatial visual similarity join for geo-multimedia
CN106557533B (zh) 一种单目标多图像联合检索的方法和装置
CN104978729A (zh) 一种基于数据感知的图像哈希方法
Zhou et al. Accurate querying of frequent subgraphs in power grid graph data
Zhou et al. Large scale nearest neighbors search based on neighborhood graph
Mu et al. Coordinate Discrete Optimization for Efficient Cross-View Image Retrieval.
Buaba et al. Locality sensitive hashing for satellite images using texture feature vectors
Kong et al. Coarse2Fine: Two-layer fusion for image retrieval
Li et al. Partial-duplicate clustering and visual pattern discovery on web scale image database

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181126

Address after: Room 1108, 11th floor, 23 Zhichun Road, Haidian District, Beijing, 100089

Patentee after: BEIJING ZHIXIN FUTURE INFORMATION TECHNOLOGY Co.,Ltd.

Address before: Room 610, No. 999 Shanxi Road, Changning District, Shanghai 200000

Patentee before: Shanghai Airlines Intellectual Property Services Ltd.

Effective date of registration: 20181126

Address after: Room 610, No. 999 Shanxi Road, Changning District, Shanghai 200000

Patentee after: Shanghai Airlines Intellectual Property Services Ltd.

Address before: Room 2310, Building 2, Wuzhong Science and Technology Pioneering Park, 70 Zhongshan East Road, Mudu Town, Wuzhong District, Suzhou City, Jiangsu Province

Patentee before: Nanjing University of Information Science and Technology

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170510

Termination date: 20211210