CN104778281A - 一种基于社区分析的图像索引并行构建方法 - Google Patents

一种基于社区分析的图像索引并行构建方法 Download PDF

Info

Publication number
CN104778281A
CN104778281A CN201510224042.8A CN201510224042A CN104778281A CN 104778281 A CN104778281 A CN 104778281A CN 201510224042 A CN201510224042 A CN 201510224042A CN 104778281 A CN104778281 A CN 104778281A
Authority
CN
China
Prior art keywords
image
index
clustering
community analysis
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510224042.8A
Other languages
English (en)
Inventor
束兰
黄裕新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUZHOU SOUKE INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SUZHOU SOUKE INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU SOUKE INFORMATION TECHNOLOGY Co Ltd filed Critical SUZHOU SOUKE INFORMATION TECHNOLOGY Co Ltd
Priority to CN201510224042.8A priority Critical patent/CN104778281A/zh
Publication of CN104778281A publication Critical patent/CN104778281A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种基于社区分析的图像索引并行构建方法,采用并行K均值聚类算法对图像块实现聚类,图像采用由一系列的视觉关键词构成的特征聚类向量表示,在图像检索时能避免线性扫描海量、高维和动态的特征数据库。采用向量空间模型及语言模型计算每个图像对的语义相似度,构建图像的语义相似度社会网络,在此基础上,基于大规模社区分析方法构建海量图像的语义索引。在索引构建中采用高维聚类索引空间的某些有意义的子空间计算图像间的相似度,从而克服聚类索引“维度灾难”的问题,结合图像块物理特征索引与图像全局层次的语义索引,提升海量图像检索的速度和效果。

Description

一种基于社区分析的图像索引并行构建方法
技术领域
本发明涉及图像查询技术领域,具体地是涉及一种基于社区分析的图像索引并行构建方法。
背景技术
从人类的认知角度看,人类对图像的描述和理解主要是在语义层次上进行。而图像的底层物理特征(如色彩、纹理、形状、结构等)难于表达图像高层语义内容,图像表达的数字阵列与通常可以被人类所接受的概念化内容之间存在着语义鸿沟。如果不对原始图像进行预处理,仅仅根据整幅图像的底层物理特征进行检索,图像中将包含了大量不相关的信息。这些不相关的信息直接影响检索的准确性,即使采用相关反馈技术也难以取得比较令人满意的检索结果。
因此,本发明的发明人亟需构思一种新技术以改善其问题。
发明内容
为了解决上述不足,本发明提供了一种基于社区分析的图像索引并行构建方法。
为解决上述技术问题,本发明的技术方案是:
一种基于社区分析的图像索引并行构建方法,包括如下步骤:
S1:采用并行K均值聚类算法对目标图像实现聚类,所述目标图像由多个视觉关键词构成的特征聚类向量表示;
S2:对聚类得到的每个类分别建立索引;
S3:进行图像查询。
进一步地,所述步骤S1具体包括:
S11:提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征;
S12:对描述图像内容的高维特征进行降维,得到特征子集;
S13:结合网格的样本密度,对特征子集构成的数据集进行聚类。
进一步地,所述步骤S3具体包括:
S31:将目标图像中提取的降维后的特征子集与所述步骤S1最终所得到的各聚类中心进行匹配,选择最相似的索引树;
S32:在最相似的索引树中,根据目标图像的所述颜色特征和纹理特征进行检索,得到相似性匹配结果。
进一步地,所述步骤S13具体包括:
S131:将降维后的低维数据空间划分成固定大小的网格;
S132:计算每个网格中落入的样本数目得到每个格点的样本密度;
S133:将格点按照其样本密度排序;
S134:根据排序结果得到初始聚类的分类数和各分类的初始中心;
S135:用K均值方法来模拟数据点的分布,得到最终的聚类结果。
进一步地,所述步骤S12中对高维图像特征进行降维时,选择全局颜色矩作为表征图像内容的特征向量。
进一步地,选择全局颜色矩是选取颜色的一阶矩、二阶矩和三阶矩作为表征图像的特征向量。
采用上述技术方案,本发明至少包括如下有益效果:
本发明所述的基于社区分析的图像索引并行构建方法,采用并行K均值聚类算法对图像块实现聚类,图像采用由一系列的视觉关键词构成的特征聚类向量表示,在图像检索时能避免线性扫描海量、高维和动态的特征数据库。采用向量空间模型及语言模型计算每个图像对的语义相似度,构建图像的语义相似度社会网络,在此基础上,基于大规模社区分析方法构建海量图像的语义索引。在索引构建中采用高维聚类索引空间的某些有意义的子空间计算图像间的相似度,从而克服聚类索引“维度灾难”的问题,结合图像块物理特征索引与图像全局层次的语义索引,提升海量图像检索的速度和效果。
附图说明
图1为本发明所述的基于社区分析的图像索引并行构建方法的流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
如图1所示,为符合本发明的一种基于社区分析的图像索引并行构建方法,包括如下步骤:
S1:采用并行K均值聚类算法对目标图像实现聚类,所述目标图像由多个视觉关键词构成的特征聚类向量表示;
S2:对聚类得到的每个类分别建立索引;
S3:进行图像查询。
进一步地,所述步骤S1具体包括:
S11:提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征;
S12:对描述图像内容的高维特征进行降维,得到特征子集;
S13:结合网格的样本密度,对特征子集构成的数据集进行聚类。
进一步地,所述步骤S3具体包括:
S31:将目标图像中提取的降维后的特征子集与所述步骤S1最终所得到的各聚类中心进行匹配,选择最相似的索引树;
S32:在最相似的索引树中,根据目标图像的所述颜色特征和纹理特征进行检索,得到相似性匹配结果。
进一步地,所述步骤S13具体包括:
S131:将降维后的低维数据空间划分成固定大小的网格;
S132:计算每个网格中落入的样本数目得到每个格点的样本密度;
S133:将格点按照其样本密度排序;
S134:根据排序结果得到初始聚类的分类数和各分类的初始中心;
S135:用K均值方法来模拟数据点的分布,得到最终的聚类结果。
进一步地,所述步骤S12中对高维图像特征进行降维时,选择全局颜色矩作为表征图像内容的特征向量。
进一步地,选择全局颜色矩是选取颜色的一阶矩、二阶矩和三阶矩作为表征图像的特征向量。
本实施例采用并行K均值聚类算法对图像块实现聚类,图像采用由一系列的视觉关键词构成的特征聚类向量表示,在图像检索时能避免线性扫描海量、高维和动态的特征数据库。采用向量空间模型及语言模型计算每个图像对的语义相似度,构建图像的语义相似度社会网络,在此基础上,基于大规模社区分析方法构建海量图像的语义索引。在索引构建中采用高维聚类索引空间的某些有意义的子空间计算图像间的相似度,从而克服聚类索引“维度灾难”的问题,结合图像块物理特征索引与图像全局层次的语义索引,提升海量图像检索的速度和效果。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种基于社区分析的图像索引并行构建方法,其特征在于,包括如下步骤:
S1:采用并行K均值聚类算法对目标图像实现聚类,所述目标图像由多个视觉关键词构成的特征聚类向量表示;
S2:对聚类得到的每个类分别建立索引;
S3:进行图像查询。
2.如权利要求1所述的基于社区分析的图像索引并行构建方法,其特征在于,所述步骤S1具体包括:
S11:提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征;
S12:对描述图像内容的高维特征进行降维,得到特征子集;
S13:结合网格的样本密度,对特征子集构成的数据集进行聚类。
3.如权利要求1所述的基于社区分析的图像索引并行构建方法,其特征在于,所述步骤S3具体包括:
S31:将目标图像中提取的降维后的特征子集与所述步骤S1最终所得到的各聚类中心进行匹配,选择最相似的索引树;
S32:在最相似的索引树中,根据目标图像的所述颜色特征和纹理特征进行检索,得到相似性匹配结果。
4.如权利要求2或3所述的基于社区分析的图像索引并行构建方法,其特征在于,所述步骤S13具体包括:
S131:将降维后的低维数据空间划分成固定大小的网格;
S132:计算每个网格中落入的样本数目得到每个格点的样本密度;
S133:将格点按照其样本密度排序;
S134:根据排序结果得到初始聚类的分类数和各分类的初始中心;
S135:用K均值方法来模拟数据点的分布,得到最终的聚类结果。
5.如权利要求4所述的基于社区分析的图像索引并行构建方法,其特征在于:所述步骤S12中对高维图像特征进行降维时,选择全局颜色矩作为表征图像内容的特征向量。
6.如权利要求5所述的基于社区分析的图像索引并行构建方法,其特征在于:选择全局颜色矩是选取颜色的一阶矩、二阶矩和三阶矩作为表征图像的特征向量。
CN201510224042.8A 2015-05-06 2015-05-06 一种基于社区分析的图像索引并行构建方法 Pending CN104778281A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510224042.8A CN104778281A (zh) 2015-05-06 2015-05-06 一种基于社区分析的图像索引并行构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510224042.8A CN104778281A (zh) 2015-05-06 2015-05-06 一种基于社区分析的图像索引并行构建方法

Publications (1)

Publication Number Publication Date
CN104778281A true CN104778281A (zh) 2015-07-15

Family

ID=53619745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510224042.8A Pending CN104778281A (zh) 2015-05-06 2015-05-06 一种基于社区分析的图像索引并行构建方法

Country Status (1)

Country Link
CN (1) CN104778281A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021362A (zh) * 2016-05-10 2016-10-12 百度在线网络技术(北京)有限公司 查询式的图片特征表示的生成、图片搜索方法和装置
CN106682684A (zh) * 2016-11-23 2017-05-17 天津津航计算技术研究所 一种基于k均值聚类的目标识别方法
CN107194424A (zh) * 2017-05-19 2017-09-22 山东财经大学 一种图像相似块快速搜索方法
CN108875828A (zh) * 2018-06-19 2018-11-23 太原学院 一种相似图像的快速匹配方法和系统
CN109447098A (zh) * 2018-08-27 2019-03-08 西北大学 一种基于深度语义嵌入的图像聚类算法
CN110297935A (zh) * 2019-06-28 2019-10-01 京东数字科技控股有限公司 图像检索方法、装置、介质及电子设备
CN110689964A (zh) * 2019-09-12 2020-01-14 银江股份有限公司 一种健康数据样例搜索方法及系统
CN111753116A (zh) * 2019-05-20 2020-10-09 北京京东尚科信息技术有限公司 图像检索方法、装置、设备及可读存储介质
CN113225300A (zh) * 2020-09-10 2021-08-06 深圳信息职业技术学院 一种基于图像的大数据分析方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004111931A2 (en) * 2003-06-10 2004-12-23 California Institute Of Technology A system and method for attentional selection
CN101211355A (zh) * 2006-12-30 2008-07-02 中国科学院计算技术研究所 一种基于聚类的图像查询方法
CN103593458A (zh) * 2013-11-21 2014-02-19 电子科技大学 一种基于颜色特征与倒排索引的海量图像检索系统
CN104142920A (zh) * 2013-05-06 2014-11-12 苏州搜客信息技术有限公司 一种在线图像检索系统
CN104142919A (zh) * 2013-05-06 2014-11-12 苏州搜客信息技术有限公司 一种手机移动在线图像搜索系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004111931A2 (en) * 2003-06-10 2004-12-23 California Institute Of Technology A system and method for attentional selection
CN101211355A (zh) * 2006-12-30 2008-07-02 中国科学院计算技术研究所 一种基于聚类的图像查询方法
CN104142920A (zh) * 2013-05-06 2014-11-12 苏州搜客信息技术有限公司 一种在线图像检索系统
CN104142919A (zh) * 2013-05-06 2014-11-12 苏州搜客信息技术有限公司 一种手机移动在线图像搜索系统
CN103593458A (zh) * 2013-11-21 2014-02-19 电子科技大学 一种基于颜色特征与倒排索引的海量图像检索系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张培珍等: "基于快速聚类索引的图像检索系统", 《吉林大学学报》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021362A (zh) * 2016-05-10 2016-10-12 百度在线网络技术(北京)有限公司 查询式的图片特征表示的生成、图片搜索方法和装置
CN106021362B (zh) * 2016-05-10 2018-04-13 百度在线网络技术(北京)有限公司 查询式的图片特征表示的生成、图片搜索方法和装置
CN106682684A (zh) * 2016-11-23 2017-05-17 天津津航计算技术研究所 一种基于k均值聚类的目标识别方法
CN106682684B (zh) * 2016-11-23 2020-12-01 天津津航计算技术研究所 一种基于k均值聚类的目标识别方法
CN107194424B (zh) * 2017-05-19 2019-08-27 山东财经大学 一种图像相似块快速搜索方法
CN107194424A (zh) * 2017-05-19 2017-09-22 山东财经大学 一种图像相似块快速搜索方法
CN108875828A (zh) * 2018-06-19 2018-11-23 太原学院 一种相似图像的快速匹配方法和系统
CN108875828B (zh) * 2018-06-19 2022-01-28 太原学院 一种相似图像的快速匹配方法和系统
CN109447098A (zh) * 2018-08-27 2019-03-08 西北大学 一种基于深度语义嵌入的图像聚类算法
CN111753116A (zh) * 2019-05-20 2020-10-09 北京京东尚科信息技术有限公司 图像检索方法、装置、设备及可读存储介质
CN110297935A (zh) * 2019-06-28 2019-10-01 京东数字科技控股有限公司 图像检索方法、装置、介质及电子设备
CN110689964A (zh) * 2019-09-12 2020-01-14 银江股份有限公司 一种健康数据样例搜索方法及系统
CN110689964B (zh) * 2019-09-12 2022-08-26 银江技术股份有限公司 一种健康数据样例搜索方法及系统
CN113225300A (zh) * 2020-09-10 2021-08-06 深圳信息职业技术学院 一种基于图像的大数据分析方法
CN113225300B (zh) * 2020-09-10 2022-12-27 深圳信息职业技术学院 一种基于图像的大数据分析方法

Similar Documents

Publication Publication Date Title
CN104778281A (zh) 一种基于社区分析的图像索引并行构建方法
Wang et al. Fast approximate k-means via cluster closures
CN103207879B (zh) 图像索引的生成方法及设备
Murthy et al. Content based image retrieval using Hierarchical and K-means clustering techniques
CN104035949A (zh) 一种基于局部敏感哈希改进算法的相似性数据检索方法
CN107223242B (zh) 用于在多个已存储图像中搜索相似图像的方法
CN105205135B (zh) 一种基于主题模型的3d模型检索方法及其检索装置
CN110019914A (zh) 一种支持三维场景交互的三维模型数据库检索方法
Wang et al. Duplicate discovery on 2 billion internet images
Mishra et al. Image mining in the context of content based image retrieval: a perspective
CN101211344A (zh) 文本信息遍历的快速四维可视化方法
JP2000311246A (ja) 類似画像表示方法及び類似画像表示処理プログラムを格納した記録媒体
Jenni et al. Pre-processing image database for efficient Content Based Image Retrieval
CN109784360A (zh) 一种基于深度多视角子空间集成学习的图像聚类方法
CN108564116A (zh) 一种摄像头场景图像的成分智能分析方法
Blažek et al. Video retrieval with feature signature sketches
Meng et al. Merged region based image retrieval
Uchida et al. Character image patterns as big data
CN106547825B (zh) 基于全局特征与子块特征的三维模型检索方法
CN114549838A (zh) 分割点云数据的方法、装置、设备和计算机可读介质
CN113378842A (zh) 基于分割图像特征提取的推荐方法
Gorisse et al. Scalable active learning strategy for object category retrieval
Wu et al. Similar image retrieval in large-scale trademark databases based on regional and boundary fusion feature
CN106503270B (zh) 一种基于多视点及二部图匹配的3d目标检索方法
Yeh et al. Extraction of robust visual phrases using graph mining for image retrieval

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150715

RJ01 Rejection of invention patent application after publication