CN104899326A - 一种基于二进制多索引哈希技术的图像检索方法 - Google Patents

一种基于二进制多索引哈希技术的图像检索方法 Download PDF

Info

Publication number
CN104899326A
CN104899326A CN201510346696.8A CN201510346696A CN104899326A CN 104899326 A CN104899326 A CN 104899326A CN 201510346696 A CN201510346696 A CN 201510346696A CN 104899326 A CN104899326 A CN 104899326A
Authority
CN
China
Prior art keywords
mrow
msub
binary
mfrac
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510346696.8A
Other languages
English (en)
Inventor
桑永胜
章毅
邓涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201510346696.8A priority Critical patent/CN104899326A/zh
Publication of CN104899326A publication Critical patent/CN104899326A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于二进制多索引哈希技术的图像检索方法,属于图像检索技术领域,该方法首先采用主成分分析方法,求出第一主成分并把其作为投影向量,并对二进制数据集进行投影,以得到分布较为均匀的浮点型数据集;其次通过计算把浮点型数据集转化为二进制数据集;最后对二进制数据集进行投影映射得到二进制数据集的子串。本发明在使用分段哈希索引之前,先对图像特征进行投影映射,使图像特征数据分布均匀,从而提高检索效率;优化的分段哈希索引技术与传统的分段哈希索引技术相比,在精度较高的前提下,大量地提高了检索效率,满足了大规模图像检索的需求。

Description

一种基于二进制多索引哈希技术的图像检索方法
技术领域
本发明涉及图像检索技术领域,具体涉及一种查询效率高、空间资源占用率低的高基于二进制多索引哈希技术的图像检索方法。
背景技术
随着网络的飞速发展以及多媒体技术应用的不断普及,互联网上的图像数量已达到上亿级并正在不断地高速增长。截止2014年3月,Instagram分享图片数量已经超过了200亿张,并以每天多于4000万幅的速度增长。因此,如何在海量图像数据库中对图像建立高效的高维索引并实现精度高、速度快的相似图像检索,是多媒体领域研究的热点与难点。
早年,图像检索仅仅局限于“以字搜图”的方法,这种方法是基于关键字或文本的,他依靠人工标注的文本来搜索图像。虽然“以字搜图”迈出了图像检索的第一步,大大减少了图像搜索的难点,但检索出来的图像往往具有很大的局限性:例如对大规模图像进行标注的工作量太大,人工描述的文字可能具有歧义性,以及图像的轮廓纹理等内容很难进行人工标注等。
目前,越来越多的知名搜索引擎采用了基于图像内容的图像检索技术来搜索图像,例如谷歌、百度。基于图像内容的图像检索使大规模图像检索成为可能,克服了“以字搜图”的局限性。基于内容的图像检索步骤通常如下:首先,利用图像处理技术检测图像的视觉特征;其次,用数字描述检测到的特征并表示为高维的特征向量;然后,在生成的特征库中为高维的特征向量建立索引;最后,使用生成的高维索引对查询向量进行相似性查询。因此,图像检索问题转化为了高维向量相似性查询问题。由于图像特征往往维度很高,所以如何建立高效的高维索引是进行快速、准确的图像检索的关键。
目前,大规模图像检索中高维索引技术面临的挑战主要包括以下两个方面:
一、维数高引起的“维数灾难”
由视觉特征生成的描述子数据往往维数很高,比如SIFT特征128维、GIST特征960维。传统基于树结构的索引方法,在维数大于十时容易受到“维数灾难”的影响。近似最近邻ANN(Approximate Nearest Neighbor)的查询方法通过牺牲很小的精度换取了效率的大幅度提高,得到了广泛的研究和应用。典型的ANN算法如David M.Mount和Sunil Arya于1998年实现的ANN-package。但是ANN基于KD树结构,在维数达到几十时,仍然受到维数灾难的影响。随后Piotr Indyk等人根据近似最近邻搜索的思想,提出了局部敏感哈希LSH(Locality SensitiveHashing)的概念,把查询时间降到了亚线性,消除了查询时间对维数的指数级依赖。LSH基于哈希表结构,通过计算哈希值可直接访问到数据所在的存储结构,在视频检索等领域得到了成功应用。但是LSH对数据空间均匀划分,不适用于多媒体领域非均匀分布的数据。对LSH的改进方法,主要针对查询扩展方面,并没有考虑哈希函数本身带来的问题。如何针对成百上千维的数据建立高维索引,并实现高效率高性能的近似最近邻查询算法,仍然是个有待于进一步研究的难点。
二、大规模数据引起的空间资源不足
面向大规模图像库的检索对高维索引提出了新的要求。在大规模的数据规模下,内存资源成为瓶颈。例如,对一幅图像提取的SIFT局部特征数大约有102~103,在百万级规模的图像库下原始特征至少消耗500G的空间。庞大的数据无法在内存中存储,而基于磁盘的查找又严重影响了检索效率。针对这一问题,学者们提出了对数据压缩后建立索引的方法,本发明称为“压缩索引”。代表性方法如谱哈希,基于随机投影的中国科学院博士学位论文──面向大规模图像检索的高维索引技术研究二进制码和量化方法等。压缩索引方法大大缓解了空间资源不足的问题,但以损失查询精度为代价。将数据编码为二进制码是目前常用的压缩索引方法,但是现有方法对二进制码的索引往往采用线性查询的方式,查询效率有待于进一步提高。
图像检索的过程通常为以下几个步骤:首先,利用计算机图像处理技术检测图像的视觉特征;其次,用数字表示检测到的特征并生成高维特征向量;然后,对高维特征向量建立索引;最后,利用索引对高维向量进行检索。其中,图像查询是在线进行的,所以对实时性要求很高。为了提高查询效率,我们使用二进制特征描述图像内容。
发明内容
针对上述现有技术,本发明的目在于如何提供一种查询效率高、空间资源占用率低的高基于二进制多索引哈希技术的图像检索方法,旨在百万级甚至千万级的大规模图像数据库中准确快速的图像检索。
为了解决上述技术问题,本发明采用如下技术方案:
一种基于二进制多索引哈希技术的图像检索方法,其特征在于,首先采用主成分分析方法,求出第一主成分并把其作为投影向量,并对二进制数据集进行投影,以得到分布较为均匀的浮点型数据集;其次通过计算把浮点型数据集转化为二进制数据集;最后对二进制数据集进行投影映射得到二进制数据集的子串。
所述主成分分析方法具体分解为以下几步:
①求出需要简化的数据集的协方差矩阵;
②求出该协方差矩阵的特征值和对应的特征向量,最后按特征值的大小对特征值和对应的特征向量进行排序;其中,最佳的投影直线是特征值最大时对应的特征向量,即第一主成分。
更进一步地,求解第一主成分的过程如下:
a、最初的数据的标准化采集m维向量X=(X1,X2,…Xm)TN个样x=(xi1,xi2,…xim),i=1,2,…,N N>m,构造样本矩阵,对样本阵进行归一化:
Z i - j = x i j - x ‾ s j , i = 1 , 2 , ... , m ; j = 1 , 2 , ... , p ,
其中, x ‾ J = Σ i = 1 n x i j n , s j 2 = Σ i = 0 n ( x i j - x ‾ j ) 2 n - 1 , 得标准化阵Z;
b、求标准化阵Z的协方差矩阵:
R = [ r i j ] p x p = Z T Z n - 1 , 其中, r i j = Σz k i · z k j n - 1 , i , j = 1 , 2 , ... , m
C、求解协方差矩阵R的特征方程|R-λIm|=0,得到m个特征根,对最大的特征根λ,解方程组,Rb=λb得到单位特征向量,即第一主成分bo
在本发明中,对二进制数据集进行投影映射,投影映射以二进制向量的子串为单位进行,公式如下:
b = 2 s - 1 * b s o * b s + 2 s - 1 * b s - 1 o * b s - 1 + ... + 2 0 * b 1 0 * b 1 , 其中,b为子串投影结果,s代表子串长度,bi为子串b的第i位比特值。
一种基于基于二进制多索引哈希技术的图像检索方法的结构算法,其特征在于,包括如下步骤:
①将特征库中二进制向量串划分为连续但不重叠的m个子串;
②对二进制向量子串进行主成分,对每个子串进行投影映射,得到分布更加均匀的新的子串。
③为每个子串建立哈希表即为m个哈希表,并直接以子串为索引项放入对应的哈希桶中;
④将查询向量同样分为m个子串,并对每个子串进行步骤2,得到新的查询向量子串;对每个子串进行步骤⑤和⑥;
⑤将初始海明距离设为0,查找出对应的哈希桶,把哈希桶中的子串对应的完整二进制串与查询向量对比,过滤不符合要求的向量;
⑥当最近邻数目不足k时,海明距离增加1,重复步骤⑤,直到最近邻数目不小于k。
与现有技术相比,本发明具有以下有益效果:
本发明在使用分段哈希索引之前,先对图像特征进行投影映射,使图像特征数据分布均匀,从而提高检索效率;优化的分段哈希索引技术与传统的分段哈希索引技术相比,在精度较高的前提下,大量地提高了检索效率,满足了大规模图像检索的需求。
具体实施方式
下面将结合附图及具体实施方式对本发明作进一步的描述。
首先对本发明提出的主成分分析方法对数据分布的影响进行对比实验分析,然后将对本发明提出的多哈希分段索引算法进行速度和精度的实验,实验的数据集为10亿特征向量,查询数据集为1000个特征向量,详细的数据集描述参照表5-1所示。实验过程将首先取完整数据集前部分或全部建立不同规模的数据集,大小分别为104,105,106,2*106,5*106,107,2*107,5*107,108,2*108,5*108,109这12组数据,每一组数据建立一个多索引哈希结构,设置K值为1000;然后计算查询精度与速度,比较本发明算法与传统多哈希分段索引算法的查询性能,证明本发明所提出的优化的多哈希分段索引算法在精度一定的情况下大大提高了查询效率。
1000-NN查询的平均搜索半径的比较
在执行k-最近邻查询过程中,对所有查询向量来说一个固定的半径可能会对一部分查询向量产生过多的最近邻,而对另一部分产生过少的最近邻。所以,最好的办法是根据需要的最近邻个数,而逐渐增大需要的查询半径。当数据库中二进制向量分布不均时,会导致多索引哈希表中各哈希桶中的子串个数差异较大。当搜索半径较小时,而对应的哈希桶中的子串个数较少,为了找到最邻近的K个向量,就需要增大搜索半径,从而导致查询效率降低。在从104到109不同规模的数据库中,传统的多索引哈希结构的平均搜索半径与优化的多索引哈希结构相比略多,从而查询效率也略低于后者。
1000-NN查询的精度的比较
精度是判断索引优劣的一个重要准则。对从104到109不同规模的数据库进行实验分析,我们发现优化的多索引哈希结构与传统的多索引哈希结构相比精度都略有减少。这是因为在进行主成分分析时与生成新的地址的投影过程中,都存在精度损失。但在实际应用中,这样略微的精度损失往往能换回查询速度较大幅度的提高。
1000-NN查询的平均查询时间的比较
运行时间是判断索引优劣的关键。我们将优化的多索引哈希结构、传统的多索引哈希结构与线性查找作对比,在不同规模的数据库下,两种多索引哈希结构的查询时间明显小于线性查找,从而证实了多索引哈希结构的高效性。当对两种多索引哈希结构单独对比时,对从104到109不同规模的数据库进行实验分析,我们发现优化的多索引哈希结构与传统的多索引哈希结构相比,执行每次查询的平均时间都有较大幅度的降低。这是因为我们对数据库中二进制向量进行了主成分分析,并将原来的二进制向量映射到新的空间,使数据分布更加均匀,减少了搜索半径,从而提高了查询效率。

Claims (5)

1.一种基于二进制多索引哈希技术的图像检索方法,其特征在于,首先采用主成分分析方法,求出第一主成分并把其作为投影向量,并对二进制数据集进行投影,以得到分布较为均匀的浮点型数据集;其次通过计算把浮点型数据集转化为二进制数据集;最后对二进制数据集进行投影映射得到二进制数据集的子串。
2.根据权利要求1所述的基于二进制多索引哈希技术的图像检索方法,其特征在于,所述主成分分析方法具体分解为以下几步:
①求出需要简化的数据集的协方差矩阵;
②求出该协方差矩阵的特征值和对应的特征向量,最后按特征值的大小对特征值和对应的特征向量进行排序;其中,最佳的投影直线是特征值最大时对应的特征向量,即第一主成分。
3.根据权利要求2所述的基于二进制多索引哈希技术的图像检索方法,其特征在于,求解第一主成分的过程如下:
a、最初的数据的标准化采集m维向量X=(X1,X2,…Xm)TN个样x=(xi1,xi2,…xim),i=1,2,…,NN>m,构造样本矩阵,对样本阵进行归一化:
Z i j = x i j - x ‾ s j , i = 1 , 2 , ... , m ; j = 1 , 2 , ... , p ,
其中, x J ‾ = Σ i = 1 n x i j n , s j 2 = Σ i = o n ( x i j - x ‾ j ) 2 n - 1 , 得标准化阵Z;
b、求标准化阵Z的协方差矩阵:
R = [ r i j ] p x p Z T Z n - 1 , 其中, r i j = Σ z k i · z k j n - 1 , i , j = 1 , 2 , ... , m
C、求解协方差矩阵R的特征方程|R-λIm|=0,得到m个特征根,对最大的特征根λ,解方程组,Rb=λb得到单位特征向量,即第一主成分bo
4.根据权利要求1所述的基于二进制多索引哈希技术的图像检索方法,其特征在于,对二进制数据集进行投影映射,投影映射以二进制向量的子串为单位进行,公式如下:
b = 2 s - 1 * b s o * b s + 2 s - 1 * b s - 1 o * b s - 1 + ... + 2 0 * b 1 o * b 1 , 其中,b为子串投影结果,s代表子串长度,bi为子串b的第i位比特值。
5.一种基于基于二进制多索引哈希技术的图像检索方法的结构算法,其特征在于,包括如下步骤:
①将特征库中二进制向量串划分为连续但不重叠的m个子串;
②对二进制向量子串进行主成分,对每个子串进行投影映射,得到分布更加均匀的新的子串。
③为每个子串建立哈希表即为m个哈希表,并直接以子串为索引项放入对应的哈希桶中;
④将查询向量同样分为m个子串,并对每个子串进行步骤2,得到新的查询向量子串;对每个子串进行步骤⑤和⑥;
⑤将初始海明距离设为0,查找出对应的哈希桶,把哈希桶中的子串对应的完整二进制串与查询向量对比,过滤不符合要求的向量;
⑥当最近邻数目不足k时,海明距离增加1,重复步骤⑤,直到最近邻数目不小于k。
CN201510346696.8A 2015-06-19 2015-06-19 一种基于二进制多索引哈希技术的图像检索方法 Pending CN104899326A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510346696.8A CN104899326A (zh) 2015-06-19 2015-06-19 一种基于二进制多索引哈希技术的图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510346696.8A CN104899326A (zh) 2015-06-19 2015-06-19 一种基于二进制多索引哈希技术的图像检索方法

Publications (1)

Publication Number Publication Date
CN104899326A true CN104899326A (zh) 2015-09-09

Family

ID=54031988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510346696.8A Pending CN104899326A (zh) 2015-06-19 2015-06-19 一种基于二进制多索引哈希技术的图像检索方法

Country Status (1)

Country Link
CN (1) CN104899326A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156284A (zh) * 2016-06-24 2016-11-23 合肥工业大学 基于随机多视角哈希的大规模近重复视频检索方法
CN106570166A (zh) * 2016-11-07 2017-04-19 北京航空航天大学 一种基于多个局部敏感哈希表的视频检索方法及装置
CN106897734A (zh) * 2017-01-12 2017-06-27 南京大学 基于深度卷积神经网络的层内非均匀的k平均聚类定点量化方法
CN106997385A (zh) * 2017-03-09 2017-08-01 杭州电子科技大学 一种基于双倍比特量化及加权的最近邻搜索方法
CN109241325A (zh) * 2018-09-11 2019-01-18 武汉魅瞳科技有限公司 一种基于深度特征的大规模人脸检索方法和设备
CN110188242A (zh) * 2019-05-30 2019-08-30 北京三快在线科技有限公司 无人驾驶设备定位方法、装置、无人驾驶设备和存储介质
CN112307225A (zh) * 2020-11-02 2021-02-02 中国海洋大学 基于改进哈希学习算法的大规模数据检索方法
CN113326752A (zh) * 2021-05-20 2021-08-31 淮阴工学院 一种基于无人机的光伏电站识别方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101404091A (zh) * 2008-11-07 2009-04-08 重庆邮电大学 基于两步形状建模的三维人脸重建方法和系统
CN101710334A (zh) * 2009-12-04 2010-05-19 大连理工大学 基于图像哈希的大规模图像库检索方法
CN102508910A (zh) * 2011-11-11 2012-06-20 大连理工大学 基于多哈希表映射误差最小化的图像检索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101404091A (zh) * 2008-11-07 2009-04-08 重庆邮电大学 基于两步形状建模的三维人脸重建方法和系统
CN101710334A (zh) * 2009-12-04 2010-05-19 大连理工大学 基于图像哈希的大规模图像库检索方法
CN102508910A (zh) * 2011-11-11 2012-06-20 大连理工大学 基于多哈希表映射误差最小化的图像检索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖云茹: "《概率统计计算方法》", 28 February 1994, 南开大学出版社 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156284A (zh) * 2016-06-24 2016-11-23 合肥工业大学 基于随机多视角哈希的大规模近重复视频检索方法
CN106570166A (zh) * 2016-11-07 2017-04-19 北京航空航天大学 一种基于多个局部敏感哈希表的视频检索方法及装置
CN106897734A (zh) * 2017-01-12 2017-06-27 南京大学 基于深度卷积神经网络的层内非均匀的k平均聚类定点量化方法
CN106997385A (zh) * 2017-03-09 2017-08-01 杭州电子科技大学 一种基于双倍比特量化及加权的最近邻搜索方法
CN109241325A (zh) * 2018-09-11 2019-01-18 武汉魅瞳科技有限公司 一种基于深度特征的大规模人脸检索方法和设备
CN109241325B (zh) * 2018-09-11 2020-12-08 武汉魅瞳科技有限公司 一种基于深度特征的大规模人脸检索方法和设备
CN110188242A (zh) * 2019-05-30 2019-08-30 北京三快在线科技有限公司 无人驾驶设备定位方法、装置、无人驾驶设备和存储介质
CN112307225A (zh) * 2020-11-02 2021-02-02 中国海洋大学 基于改进哈希学习算法的大规模数据检索方法
CN113326752A (zh) * 2021-05-20 2021-08-31 淮阴工学院 一种基于无人机的光伏电站识别方法及系统
CN113326752B (zh) * 2021-05-20 2024-04-30 淮阴工学院 一种基于无人机的光伏电站识别方法及系统

Similar Documents

Publication Publication Date Title
CN104899326A (zh) 一种基于二进制多索引哈希技术的图像检索方法
CN108573045B (zh) 一种基于多阶指纹的比对矩阵相似度检索方法
US11048966B2 (en) Method and device for comparing similarities of high dimensional features of images
CN110222218B (zh) 基于多尺度NetVLAD和深度哈希的图像检索方法
CN104199923B (zh) 基于最优k均值哈希算法的大规模图像库检索方法
CN111177435B (zh) 一种基于改进pq算法的cbir方法
Wei et al. Projected residual vector quantization for ANN search
CN102693299A (zh) 一种并行视频拷贝检测系统和方法
US20220414144A1 (en) Multi-task deep hash learning-based retrieval method for massive logistics product images
CN109657112A (zh) 一种基于锚点图的跨模态哈希学习方法
Tavenard et al. Balancing clusters to reduce response time variability in large scale image search
CN105183792A (zh) 一种基于局部敏感哈希的分布式快速文本分类方法
CN105760875A (zh) 基于随机森林算法的判别二进制图像特征相似实现方法
Zhang et al. Data-oriented locality sensitive hashing
Sun et al. Search by detection: Object-level feature for image retrieval
CN117763185A (zh) 一种基于思考空间维度的哈希图像检索方法
Da et al. Nonlinear asymmetric multi-valued hashing
US20220179890A1 (en) Information processing apparatus, non-transitory computer-readable storage medium, and information processing method
Ma et al. Fast search with data-oriented multi-index hashing for multimedia data.
Mu et al. Coordinate Discrete Optimization for Efficient Cross-View Image Retrieval.
Zhou et al. Large scale nearest neighbors search based on neighborhood graph
Ladhake Promising large scale image retrieval by using intelligent semantic binary code generation technique
Wang et al. Research on Index Optimization Method Based on Line Quantification in Topic Network Crawler
Xie et al. Data-dependent locality sensitive hashing
Deo et al. A PSO Algorithm Based Web Page Retrieval System

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150909

RJ01 Rejection of invention patent application after publication