CN104933154B - 一种基于分布式网络实现图像按内容快速检索的方法 - Google Patents

一种基于分布式网络实现图像按内容快速检索的方法 Download PDF

Info

Publication number
CN104933154B
CN104933154B CN201510357412.5A CN201510357412A CN104933154B CN 104933154 B CN104933154 B CN 104933154B CN 201510357412 A CN201510357412 A CN 201510357412A CN 104933154 B CN104933154 B CN 104933154B
Authority
CN
China
Prior art keywords
image
feaid
chord
interest point
nodeid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510357412.5A
Other languages
English (en)
Other versions
CN104933154A (zh
Inventor
廖建新
王敬宇
杨迪
戚琦
张�成
张乐剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201510357412.5A priority Critical patent/CN104933154B/zh
Publication of CN104933154A publication Critical patent/CN104933154A/zh
Application granted granted Critical
Publication of CN104933154B publication Critical patent/CN104933154B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于分布式网络实现图像按内容快速检索的方法,包括下列操作步骤:(1)图像索引建立和网络发布:提取所要发布图像的兴趣点特征;对兴趣点特征进行聚类;建立所要发布图像的图像索引信息;把图像索引信息发布到分布式网络上,实现图像的网络发布;(2)图像按内容检索:提取所要检索图像的兴趣点特征;对兴趣点特征进行分类;建立所要检索图像的图像检索信息;把图像检索信息发布到分布式网络上,并对反馈结果进行合并处理。本发明的方法实现了基于内容的图像的快速发布和检索,部署方便、易于维护。

Description

一种基于分布式网络实现图像按内容快速检索的方法
技术领域
本发明涉及一种基于分布式网络实现图像按内容快速检索的方法,属于信息技术领域,特别是属于基于因特网的图像检索技术领域。
背景技术
移动互联网的迅猛发展和移动智能产品的迅速推广,使得新型应用风靡全球,促使互联网中的图像资源呈现指数级爆炸式增长,催生了以“大数据”为特色的网络数据时代。大数据以及云计算技术为基于图像检索的应用研究带来了新的机遇和挑战。图像数量的快速增长使得传统的以集中式索引模式构建的数据中心面临低效、扩展性差等问题。近几年来,依据覆盖网络(Overlay network)的思想,借助分布式哈希表(Distributed HashTable,DHT)技术为数据中心构建一个纯分布式架构成为一种新型解决方案,更加适用于海量资源的检索和管理需求。在基于DHT的结构化分布式系统中,每个结点只负责部分资源索引和小范围路由信息,实现了整个分布式网络的寻址和资源快速定位。
但是,基于DHT的关键字的索引方式导致资源分散在网络任意位置,无法对其进行有效的预取、浏览和检索。目前很多研究工作通过改进资源映射策略、基于内容特征生成键值等措施,在一定程度保证了媒体内容的相似性。一种方法(参见Batko M,Falchi F,Lucchese C,et al.Building a web-scale image similarity search system[J].Multimedia Tools and Applications,2010,47(3):599-629.)是对内容特征空间利用iDistance进行聚类分割,将相似的内容映射到DHT相近结点,便于查询,但是轴的选择需要收集数据集中运算,再分发到各个结点中;另一种方法(参见Batko M,Dohnal V,Novak D,et al.Mufin:A multi-feature indexing network[C].Proceedings of the 2009SecondInternational Workshop on Similarity Search and Applications.IEEE ComputerSociety,2009:158-159.)是多层覆盖网图像检索框架,其针对图像的颜色、纹理和形状等内容特征分别建立覆盖网,查询在每层覆盖网中执行,对于覆盖网中没有的特征,再发送到底层网络查询,最后经过聚合函数汇总结果。
以上基于DHT的图像检索方法主要使用了图像的全局特征,但是这些全局特征难以针对图像的局部区域信息进行描述。由于大多数局部特征对图像的尺度缩放、目标旋转、仿射变换等具有不变性,所以局部特征更适合表示图像中的物体,从而取得比全局特征更准确的检索结果。因此,如何结合DHT检索机制,基于图像的局部特征,实现基于内容的图像快速检索,已成为急需要解决的技术难题。
发明内容
有鉴于此,本发明的目的是发明一种方法,基于分布式网络和图像的局部特征,实现图像的快速检索。
为了达到上述目的,本发明提出了一种基于分布式网络实现图像按内容快速检索的方法,所述方法包括下列操作步骤:
(1)图像索引建立和网络发布,具体包括如下子步骤:
(101)提取所要发布图像的r1个兴趣点特征,其中r1是一个大于等于1的自然数;
(102)对所提取的所要发布图像的兴趣点特征进行聚类;具体内容包括如下操作子步骤:
(1021)构造m个p-stable LSH哈希表,其中m为大于1的自然数;每个p-stable LSH哈希表由k个哈希篮子组成,其中k为大于1的自然数;
(1022)对所述的所要发布图像的每一个兴趣点特征,分别先用所述的m个p-stable LSH哈希表进行哈希运算,然后再用安全哈希算法SHA-1对前面得到的结果进行再次哈希运算,得到所述的兴趣点特征的视觉词汇签名feaID,这样对所述的每一个兴趣点特征,总共得到m个视觉词汇签名feaID;
(1023)根据所述的兴趣点特征的视觉词汇签名feaID对所要发布的图像进行聚类,即把具有相同的视觉词汇签名feaID的图像聚为一类;
(103)根据聚类结果,建立所要发布图像的图像索引信息;所述的所要发布图像的图像索引信息是一个四元组{feaID,f,imgID,nodeID},该四元组中,feaID表示兴趣点特征的视觉词汇签名;f表示所述的兴趣点特征;imgID是一个随机数,代表所要发布的图像;nodeID表示实际存贮所要发布图像的物理网络网元节点的IP地址;对于一副要发布的图像,共要建立r1×m条图像索引信息
(104)把所述的图像索引信息发布到分布式网络上,实现图像的网络发布;所述的分布式网络是指一种覆盖网络Overlay network,具体为Chord网络,该网络使用与所述步骤(1022)中相同的安全哈希算法SHA-1生成该网络上网络节点的Chord键值;
所述的把图像索引信息发布到分布式网络上的具体操作如下:把所述的图像索引信息中的feaID作为所述的Chord网络的键值,找到该feaID的直接后继Chord节点,然后把该图像索引信息发送到该直接后继Chord节点,该直接后继Chord节点保存该图像索引信息
(2)图像按内容检索,具体包括如下子步骤:
(201)提取所要检索图像的r2个兴趣点特征,其中r2是一个大于等于1的自然数;
(202)根据步骤(1)中所述的聚类结果,对所提取的所要检索图像的兴趣点特征进行分类;具体内容包括如下操作子步骤:
(2021)从所述步骤(1021)所构造的m个p-stable LSH哈希表中随机选择n个,其中n为大于1的自然数;参数n按照如下公式计算:
上式中,表示上取整运算,c是一个自然数,λ表示在设定的单位时间内,所有被检索图像的平均检索次数,x表示当前所要检索图像在设定的单位时间内的平均检索次数;
(2022)对所述的所要检索图像的每一个兴趣点特征,先用所述的n个p-stableLSH哈希表进行哈希运算,然后再用所述步骤(1022)中相同的安全哈希算法SHA-1对前面得到的结果进行再次哈希运算,得到所述的兴趣点特征的视觉词汇签名feaID,这样对所述的每一个兴趣点特征,总共得到n个视觉词汇签名feaID,从而把所述的每一个兴趣点特征分到n个类别里;
(203)根据分类结果,建立所要检索图像的图像检索信息;所述的所要检索图像的图像检索信息是一个三元组{feaID,f,nodeID},该三元组中,feaID表示兴趣点特征的视觉词汇签名;f表示所述的兴趣点特征;nodeID表示发出所述的图像检索信息的物理网络查询节点的IP地址;对于一副要检索的图像,共要建立r2×n条图像检索信息;
(204)把所述的图像检索信息发布到步骤(1)中所述的分布式网络上,并对反馈结果进行合并处理。
所述步骤(101)和步骤(201)中图像的兴趣点特征是指加速鲁棒特征SURF。
所述步骤(204)的具体内容是:查询节点采用并行检索方法把所述的图像检索信息发布到所述的分布式网络上,并对反馈结果进行合并处理,具体包括如下操作步骤:
(20411)查询节点把步骤(203)所建立的图像检索信息{feaID,f,nodeID}中的feaID作为所述的Chord网络的键值,找到该feaID的直接后继Chord节点,然后把该图像检索信息发送到该直接后继Chord节点;
(20412)该直接后继Chord节点找到与所收到的图像检索信息{feaID,f,nodeID}中的feaID相同,并且与所收到的图像检索信息{feaID,f,nodeID}中的f距离最近的前T1条图像索引信息,并反馈给查询节点,其中T1为大于等于1的自然数;
(20413)所述的查询节点对反馈的图像索引信息进行处理,按照图像索引信息{feaID,f,imgID,nodeID}中的imgID对图像进行统计,把出现次数最高的前T2幅图像检索出来,其中T2为大于等于1的自然数。
所述步骤(204)的具体内容是:查询节点采用串行检索方法把所述的图像检索信息发布到所述的分布式网络上,并对反馈结果进行合并处理,具体包括如下操作步骤:
(20421)查询节点根据图像检索信息{feaID,f,nodeID}中的feaID值,按照从小到大的顺序对图像检索信息进行排序;
(20422)查询节点把当前排在最前面,即当前feaID最小的图像检索信息{feaID,f,nodeID}中feaID作为所述的Chord网络的键值,找到该feaID的直接后继Chord节点,然后把该图像检索信息发送到该直接后继Chord节点;发送成功后,查询节点删除该图像检索信息;
(20423)所述的该直接后继Chord节点找到与所收到的图像检索信息{feaID,f,nodeID}中的feaID相同,并且与所收到的图像检索信息{feaID,f,nodeID}中的f距离最近的前T1条图像索引信息,并反馈给查询节点,其中T1为大于等于1的自然数;并且该直接后继Chord节点把其Chord网络键值ResponsenodeID反馈给查询节点;
(20424)查询节点判断下一条图像检索信息{feaID,f,nodeID}中的feaID是否小于所述的Chord网络键值ResponsenodeID,如果是,则查询节点直接把该下一条图像检索信息发送到所述的Chord网络键值ResponsenodeID所对应的Chord网络节点;如果不是则转步骤(20422);
(20425)所述的查询节点对反馈的图像索引信息进行处理,按照图像索引信息{feaID,f,imgID,nodeID}中的imgID对图像进行统计,把出现次数最高的前T2幅图像检索出来,其中T2为大于等于1的自然数。
本发明的有益效果在于:利用p-stable LSH哈希表和安全哈希算法SHA-1,并基于图像的局部特征即图像的兴趣点特征建立视觉词汇签名,实现了图像的快速聚类和分类,同时结合分布式覆盖网Chord网络,实现了基于内容的图像的快速发布和检索,本发明的方法部署方便,易于维护。
附图说明
图1是本发明提出的一种基于分布式网络实现图像按内容快速检索的方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
参见图1,介绍本发明提出的一种基于分布式网络实现图像按内容快速检索的方法,所述方法包括下列操作步骤:
(1)图像索引建立和网络发布,具体包括如下子步骤:
(101)提取所要发布图像的r1个兴趣点特征,其中r1是一个大于等于1的自然数(比如r1=100);
(102)对所提取的所要发布图像的兴趣点特征进行聚类;
(103)根据聚类结果,建立所要发布图像的图像索引信息;
(104)把所述的图像索引信息发布到分布式网络上,实现图像的网络发布;
(2)图像按内容检索,具体包括如下子步骤:
(201)提取所要检索图像的r2个兴趣点特征,其中r2是一个大于等于1的自然数(比如r2=150);
(202)根据步骤(1)中所述的聚类结果,对所提取的所要检索图像的兴趣点特征进行分类;
(203)根据分类结果,建立所要检索图像的图像检索信息;
(204)把所述的图像检索信息发布到步骤(1)中所述的分布式网络上,并对反馈结果进行合并处理。
所述步骤(101)和步骤(201)中图像的兴趣点特征是指加速鲁棒特征SURF(SpeedUp Robust Feature,参见Bay H,Tuytelaars T,Van Gool L.Surf:Speeded up robustfeatures[M].Computer vision–ECCV 2006.Springer Berlin Heidelberg,2006:404-417.)。
所述步骤(102)的具体内容包括如下操作子步骤:
(1021)构造m个p-stable LSH哈希表(p稳定局部敏感哈希表),其中m为大于1的自然数(比如m=10);每个p-stable LSH哈希表由k个哈希篮子组成,其中k为大于1的自然数(比如k=10);
(1022)对所述的所要发布图像的每一个兴趣点特征,分别先用所述的m个p-stable LSH哈希表进行哈希运算,然后再用安全哈希算法SHA-1对前面得到的结果进行再次哈希运算,得到所述的兴趣点特征的视觉词汇签名feaID,这样对所述的每一个兴趣点特征,总共得到m个视觉词汇签名feaID;
(1023)根据所述的兴趣点特征的视觉词汇签名feaID对所要发布的图像进行聚类,即把具有相同的视觉词汇签名feaID的图像聚为一类。
所述步骤(103)中的所要发布图像的图像索引信息是一个四元组{feaID,f,imgID,nodeID},该四元组中,feaID表示兴趣点特征的视觉词汇签名;f表示所述的兴趣点特征;imgID是一个随机数,代表所要发布的图像;nodeID表示实际存贮所要发布图像的物理网络网元节点的IP地址;对于一副要发布的图像,共要建立r1×m条图像索引信息。
比如一个图像索引信息{feaID,f,imgID,nodeID}的例子中各组元信息如下所示:
feaID=26439;
imgID=112;
nodeID=10.108.127.104;
f=[2.4327e-05,2.0658e-05,6.654e-05,0.00028069,4.2674e-05,8.5297e-05,0.0002592,0.00045178,-9.8656e-06,3.3508e-05,0.00026311,0.00036247,-2.304e-05,1.0063e-05,0.00013141,0.00033871,0.0040141,0.14732,0.012186,0.20757,0.0063159,0.24827,0.026816,0.34836,-0.00020999,0.22401,0.042034,0.33897,-0.0034496,0.13656,0.031437,0.2053,0.0067435,0.027724,0.10045,0.283,-0.0022998,0.093126,0.15879,0.32037,-0.015963,0.033042,0.25503,0.30271,-0.010156,0.029824,0.12546,0.22336,0.023026,0.023085,0.048608,0.10342,-0.0056805,0.0014317,0.069407,0.1033,-0.020817,0.031641,0.085195,0.13725,-0.00062826,0.030858,0.050407,0.099086];
所述步骤(104)中的分布式网络是指一种覆盖网络Overlaynetwork,具体为Chord网络,该网络使用与所述步骤(1022)中相同的安全哈希算法SHA-1生成该网络上网络节点的Chord键值;
所述的把图像索引信息发布到分布式网络上的具体操作如下:把所述的图像索引信息中的feaID作为所述的Chord网络的键值,找到该feaID的直接后继Chord节点,然后把该图像索引信息发送到该直接后继Chord节点,该直接后继Chord节点保存该图像索引信息。
所述步骤(202)的具体内容包括如下操作子步骤:
(2021)从所述步骤(1021)所构造的m个p-stable LSH哈希表中随机选择n个,其中n为大于1的自然数(比如n=5);
(2022)对所述的所要检索图像的每一个兴趣点特征,先用所述的n个p-stableLSH哈希表进行哈希运算,然后再用所述步骤(1022)中相同的安全哈希算法SHA-1对前面得到的结果进行再次哈希运算,得到所述的兴趣点特征的视觉词汇签名feaID,这样对所述的每一个兴趣点特征,总共得到n个视觉词汇签名feaID,从而把所述的每一个兴趣点特征分到n个类别里。
所述步骤(203)中的所要检索图像的图像检索信息是一个三元组{feaID,f,nodeID},该三元组中,feaID表示兴趣点特征的视觉词汇签名;f表示所述的兴趣点特征;nodeID表示发出所述的图像检索信息的物理网络查询节点的IP地址;对于一副要检索的图像,共要建立r2×n条图像检索信息。
例如,在100个结点的Chord中,一个图像检索信息{feaID,f,nodeID}的例子中各组元信息如下:
feaID=4799;
nodeID=10.108.126.201
f=[-0.0065445,0.037159,0.043697,0.10562,0.011064,0.085183,0.062973,0.15948,-0.0045133,0.1029,0.029153,0.16247,0.0041014,0.099539,0.018882,0.11445,0.00043803,0.1123,0.063953,0.24424,0.020232,0.17584,0.10556,0.30819,0.01424,0.14061,0.06421,0.28189,0.0043076,0.067646,0.05345,0.098771,-0.030897,-0.019324,0.082827,0.1643,-0.012232,-0.087078,0.12126,0.3448,0.041944,-0.10411,0.085778,0.26803,-0.0070466,-0.012205,0.10218,0.13252,-0.021202,0.012076,0.084654,0.18899,0.0024886,0.039099,0.12964,0.2801,0.036013,0.050158,0.12473,0.23888,-0.080475,-0.023986,0.15724,0.089098];
当查询发起时,经过结点3168、4554、5007,到达目的结点5007,完成查询。
所述步骤(204)的具体内容是:查询节点采用并行检索方法把所述的图像检索信息发布到所述的分布式网络上,并对反馈结果进行合并处理,具体包括如下操作步骤:
(20411)查询节点把步骤(203)所建立的图像检索信息{feaID,f,nodeID}中的feaID作为所述的Chord网络的键值,找到该feaID的直接后继Chord节点,然后把该图像检索信息发送到该直接后继Chord节点;
(20412)该直接后继Chord节点找到与所收到的图像检索信息{feaID,f,nodeID}中的feaID相同,并且与所收到的图像检索信息{feaID,f,nodeID}中的f距离最近的前T1条图像索引信息,并反馈给查询节点,其中T1为大于等于1的自然数(比如T1=100);
(20413)所述的查询节点对反馈的图像索引信息进行处理,按照图像索引信息{feaID,f,imgID,nodeID}中的imgID对图像进行统计,把出现次数最高的前T2幅图像检索出来,其中T2为大于等于1的自然数(比如T2=100)。
所述步骤(204)的具体内容是:查询节点采用串行检索方法把所述的图像检索信息发布到所述的分布式网络上,并对反馈结果进行合并处理,具体包括如下操作步骤:
(20421)查询节点根据图像检索信息{feaID,f,nodeID}中的feaID值,按照从小到大的顺序对图像检索信息进行排序;
(20422)查询节点把当前排在最前面,即当前feaID最小的图像检索信息{feaID,f,nodeID}中feaID作为所述的Chord网络的键值,找到该feaID的直接后继Chord节点,然后把该图像检索信息发送到该直接后继Chord节点;发送成功后,查询节点删除该图像检索信息;
(20423)所述的该直接后继Chord节点找到与所收到的图像检索信息{feaID,f,nodeID}中的feaID相同,并且与所收到的图像检索信息{feaID,f,nodeID}中的f距离最近的前T1条图像索引信息,并反馈给查询节点,其中T1为大于等于1的自然数;并且该直接后继Chord节点把其Chord网络键值ResponsenodeID反馈给查询节点;
(20424)查询节点判断下一条图像检索信息{feaID,f,nodeID}中的feaID是否小于所述的Chord网络键值ResponsenodeID,如果是,则查询节点直接把该下一条图像检索信息发送到所述的Chord网络键值ResponsenodeID所对应的Chord网络节点;如果不是则转步骤(20422);
(20425)所述的查询节点对反馈的图像索引信息进行处理,按照图像索引信息{feaID,f,imgID,nodeID}中的imgID对图像进行统计,把出现次数最高的前T2幅图像检索出来,其中T2为大于等于1的自然数。
步骤(2021)中从所述步骤(1021)所构造的m个p-stable LSH哈希表中随机选择n个中的参数n按照如下公式计算:
上式中,表示上取整运算,c是一个自然数,λ表示在设定的单位时间内,所有被检索图像的平均检索次数,x表示当前所要检索图像在设定的单位时间内的平均检索次数。比如假设λ=20,x=5,c=2,求得n=2。
发明人对本发明的方法进行了大量仿真实验,在仿真实验中用了两个权威图像样本库,即:
Caltech 101Object Categories
http://www.vision.caltech.edu/Image_Datasets/Caltech101/和
Columbia Object Image Library(COIL)
http://www1.cs.columbia.edu/CAVE/software/softlib/coil-100.php,
实验结果证明本发明的方法是可行有效的,能实现图像按内容的快速查找。

Claims (4)

1.一种基于分布式网络实现图像按内容快速检索的方法,其特征在于:所述方法包括下列操作步骤:
(1)图像索引建立和网络发布,具体包括如下子步骤:
(101)提取所要发布图像的r1个兴趣点特征,其中r1是一个大于等于1的自然数;
(102)对所提取的所要发布图像的兴趣点特征进行聚类;具体内容包括如下操作子步骤:
(1021)构造m个p-stable LSH哈希表,其中m为大于1的自然数;每个p-stable LSH哈希表由k个哈希篮子组成,其中k为大于1的自然数;
(1022)对所述的所要发布图像的每一个兴趣点特征,分别先用所述的m个p-stableLSH哈希表进行哈希运算,然后再用安全哈希算法SHA-1对前面得到的结果进行再次哈希运算,得到所述的兴趣点特征的视觉词汇签名feaID,这样对所述的每一个兴趣点特征,总共得到m个视觉词汇签名feaID;
(1023)根据所述的兴趣点特征的视觉词汇签名feaID对所要发布的图像进行聚类,即把具有相同的视觉词汇签名feaID的图像聚为一类;
(103)根据聚类结果,建立所要发布图像的图像索引信息;所述的所要发布图像的图像索引信息是一个四元组{feaID,f,imgID,nodeID},该四元组中,feaID表示兴趣点特征的视觉词汇签名;f表示所述的兴趣点特征;imgID是一个随机数,代表所要发布的图像;nodeID表示实际存贮所要发布图像的物理网络网元节点的IP地址;对于一副要发布的图像,共要建立r1×m条图像索引信息;
(104)把所述的图像索引信息发布到分布式网络上,实现图像的网络发布;所述的分布式网络是指一种覆盖网络Overlay network,具体为Chord网络,该网络使用与所述步骤(1022)中相同的安全哈希算法SHA-1生成该网络上网络节点的Chord键值;
所述的把图像索引信息发布到分布式网络上的具体操作如下:把所述的图像索引信息中的feaID作为所述的Chord网络的键值,找到该feaID的直接后继Chord节点,然后把该图像索引信息发送到该直接后继Chord节点,该直接后继Chord节点保存该图像索引信息;
(2)图像按内容检索,具体包括如下子步骤:
(201)提取所要检索图像的r2个兴趣点特征,其中r2是一个大于等于1的自然数;
(202)根据步骤(1)中所述的聚类结果,对所提取的所要检索图像的兴趣点特征进行分类;具体内容包括如下操作子步骤:
(2021)从所述步骤(1021)所构造的m个p-stable LSH哈希表中随机选择n个,其中n为大于1的自然数;参数n按照如下公式计算:
上式中,表示上取整运算,c是一个自然数,λ表示在设定的单位时间内,所有被检索图像的平均检索次数,x表示当前所要检索图像在设定的单位时间内的平均检索次数;
(2022)对所述的所要检索图像的每一个兴趣点特征,先用所述的n个p-stable LSH哈希表进行哈希运算,然后再用所述步骤(1022)中相同的安全哈希算法SHA-1对前面得到的结果进行再次哈希运算,得到所述的兴趣点特征的视觉词汇签名feaID,这样对所述的每一个兴趣点特征,总共得到n个视觉词汇签名feaID,从而把所述的每一个兴趣点特征分到n个类别里;
(203)根据分类结果,建立所要检索图像的图像检索信息;所述的所要检索图像的图像检索信息是一个三元组{feaID,f,nodeID},该三元组中,feaID表示兴趣点特征的视觉词汇签名;f表示所述的兴趣点特征;nodeID表示发出所述的图像检索信息的物理网络查询节点的IP地址;对于一副要检索的图像,共要建立r2×n条图像检索信息;
(204)把所述的图像检索信息发布到步骤(1)中所述的分布式网络上,并对反馈结果进行合并处理。
2.根据权利要求1所述的一种基于分布式网络实现图像按内容快速检索的方法,其特征在于:所述步骤(101)和步骤(201)中图像的兴趣点特征是指加速鲁棒特征SURF。
3.根据权利要求1所 述的一种基于分布式网络实现图像按内容快速检索的方法,其特征在于:所述步骤(204)的具体内容是:查询节点采用并行检索方法把所述的图像检索信息发布到所述的分布式网络上,并对反馈结果进行合并处理,具体包括如下操作步骤:
(20411)查询节点把步骤(203)所建立的图像检索信息{feaID,f,nodeID}中的feaID作为所述的Chord网络的键值,找到该feaID的直接后继Chord节点,然后把该图像检索信息发送到该直接后继Chord节点;
(20412)该直接后继Chord节点找到与所收到的图像检索信息{feaID,f,nodeID}中的feaID相同,并且与所收到的图像检索信息{feaID,f,nodeID}中的f距离最近的前T1条图像索引信息,并反馈给查询节点,其中T1为大于等于1的自然数;
(20413)所述的查询节点对反馈的图像索引信息进行处理,按照图像索引信息{feaID,f,imgID,nodeID}中的imgID对图像进行统计,把出现次数最高的前T2幅图像检索出来,其中T2为大于等于1的自然数。
4.根据权利要求1所述的一种基于分布式网络实现图像按内容快速检索的方法,其特征在于:所述步骤(204)的具体内容是:查询节点采用串行检索方法把所述的图像检索信息发布到所述的分布式网络上,并对反馈结果进行合并处理,具体包括如下操作步骤:
(20421)查询节点根据图像检索信息{feaID,f,nodeID}中的feaID值,按照从小到大的顺序对图像检索信息进行排序;
(20422)查询节点把当前排在最前面,即当前feaID最小的图像检索信息{feaID,f,nodeID}中feaID作为所述的Chord网络的键值,找到该feaID的直接后继Chord节点,然后把该图像检索信息发送到该直接后继Chord节点;发送成功后,查询节点删除该图像检索信息;
(20423)所述的该直接后继Chord节点找到与所收到的图像检索信息{feaID,f,nodeID}中的feaID相同,并且与所收到的图像检索信息{feaID,f,nodeID}中的f距离最近的前T1条图像索引信息,并反馈给查询节点,其中T1为大于等于1的自然数;并且该直接后继Chord节点把其Chord网络键值ResponsenodeID反馈给查询节点;
(20424)查询节点判断下一条图像检索信息{feaID,f,nodeID}中的feaID是否小于所述的Chord网络键值ResponsenodeID,如果是,则查询节点直接把该下一条图像检索信息发送到所述的Chord网络键值ResponsenodeID所对应的Chord网络节点;如果不是则转步骤(20422);
(20425)所述的查询节点对反馈的图像索引信息进行处理,按照图像索引信息{feaID,f,imgID,nodeID}中的imgID对图像进行统计,把出现次数最高的前T2幅图像检索出来,其中T2为大于等于1的自然数。
CN201510357412.5A 2015-06-25 2015-06-25 一种基于分布式网络实现图像按内容快速检索的方法 Expired - Fee Related CN104933154B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510357412.5A CN104933154B (zh) 2015-06-25 2015-06-25 一种基于分布式网络实现图像按内容快速检索的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510357412.5A CN104933154B (zh) 2015-06-25 2015-06-25 一种基于分布式网络实现图像按内容快速检索的方法

Publications (2)

Publication Number Publication Date
CN104933154A CN104933154A (zh) 2015-09-23
CN104933154B true CN104933154B (zh) 2017-12-29

Family

ID=54120321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510357412.5A Expired - Fee Related CN104933154B (zh) 2015-06-25 2015-06-25 一种基于分布式网络实现图像按内容快速检索的方法

Country Status (1)

Country Link
CN (1) CN104933154B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512273A (zh) * 2015-12-03 2016-04-20 中山大学 一种基于可变长深度哈希学习的图像检索方法
CN106096065B (zh) * 2016-07-29 2019-10-29 贵州大学 一种多媒体对象的相似检索方法及装置
CN107798093B (zh) * 2017-10-25 2022-05-03 成都尽知致远科技有限公司 图像检索方法
CN110879846A (zh) * 2018-09-05 2020-03-13 深圳云天励飞技术有限公司 图像检索方法及装置、电子设备和计算机可读存储介质
CN109902198A (zh) * 2019-03-11 2019-06-18 京东方科技集团股份有限公司 一种以图搜图的方法、装置及应用系统
CN111506750B (zh) * 2020-06-15 2021-03-16 北京金山云网络技术有限公司 图片检索方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436491A (zh) * 2011-11-08 2012-05-02 张三明 一种基于BigBase的海量图片搜索系统及方法
CN103218441A (zh) * 2013-04-22 2013-07-24 北京邮电大学 一种基于内容和反馈的图像检索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436491A (zh) * 2011-11-08 2012-05-02 张三明 一种基于BigBase的海量图片搜索系统及方法
CN103218441A (zh) * 2013-04-22 2013-07-24 北京邮电大学 一种基于内容和反馈的图像检索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
An Image Retrieval Framework for Distributed Datacenters;Di Yang 等;《 2014 IEEE 39th Conference on Local Computer Networks (LCN)》;20140911;406-409 *

Also Published As

Publication number Publication date
CN104933154A (zh) 2015-09-23

Similar Documents

Publication Publication Date Title
CN104933154B (zh) 一种基于分布式网络实现图像按内容快速检索的方法
US9087267B2 (en) Image scene recognition
JP2018504710A (ja) 位置特定およびマッピングの方法
Shen et al. On robust image spam filtering via comprehensive visual modeling
EP2929485B1 (en) Matching a feature of captured visual data
CN105844230B (zh) 一种基于云平台的遥感影像分割方法
CN104244035A (zh) 基于多层聚类的网络视频流分类方法
Walia et al. An effective and fast hybrid framework for color image retrieval
TW201523300A (zh) 三維圖檔搜尋方法與三維圖檔搜尋系統
CN108470028A (zh) 一种图片审核方法和装置
CN103177105B (zh) 一种图像检索方法及装置
CN114925286B (zh) 舆情数据处理方法及装置
CN106203449A (zh) 移动云环境的近似空间聚类系统
Ding et al. Light-Deeplabv3+: a lightweight real-time semantic segmentation method for complex environment perception
Dong et al. Effective and efficient photo quality assessment
CN108122011B (zh) 基于多种不变性混合的目标跟踪方法和系统
Tencer et al. A new framework for online sketch-based image retrieval in web environment
Meng et al. A multi-level weighted representation for person re-identification
Salma et al. A hybrid feature extraction for satellite image segmentation using statistical global and local feature
CN113762040A (zh) 视频识别方法、装置、存储介质及计算机设备
Zi et al. RGB-D Saliency Object Detection Based on Adaptive Manifolds Filtering
Dong et al. Research on a Pedestrian Detection Algorithm Based on Improved SSD Network
Zhang et al. Crossvision: Real-time on-camera video analysis via common roi load balancing
JP6034702B2 (ja) 画像処理装置及び画像処理プログラム
Aamir et al. Heuristics based mosaic of social-sensor services for scene reconstruction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171229

CF01 Termination of patent right due to non-payment of annual fee