CN104021171A - 一种基于gmm的手机内图像的组织和搜索方法 - Google Patents

一种基于gmm的手机内图像的组织和搜索方法 Download PDF

Info

Publication number
CN104021171A
CN104021171A CN201410239322.1A CN201410239322A CN104021171A CN 104021171 A CN104021171 A CN 104021171A CN 201410239322 A CN201410239322 A CN 201410239322A CN 104021171 A CN104021171 A CN 104021171A
Authority
CN
China
Prior art keywords
image
cluster
mobile phone
images
index structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410239322.1A
Other languages
English (en)
Inventor
刘咏梅
李智慧
张菁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201410239322.1A priority Critical patent/CN104021171A/zh
Publication of CN104021171A publication Critical patent/CN104021171A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明属于图像库的组织和搜索领域,主要涉及一种基于GMM的手机内图像的组织和搜索方法。本发明包括:对手机内photo文件夹下的所有图像按高斯混合模型进行聚类;对全部图像进行聚类的K幅聚类中心图像;将每幅最上一层图像所对应的该类别下的所有图像继续按高斯混合模型进行聚类;从第二层图像开始重复步骤3;图像索引结构建立好后,用户开始搜索图像;点选图像后进入图像索引结构的下一层。本发明提供给手机用户按图像语义的不同进行搜索和查找的方式,极大地方便了手机图像管理和使用上的智能化。考虑到手机内图像的数量要比大型图像库要小得多,因此经典的图像聚类技术就可以满足其实时性的要求。

Description

一种基于GMM的手机内图像的组织和搜索方法
技术领域
本发明专利属于图像库的组织和搜索领域,主要涉及一种基于GMM的手机内图像的组织和搜索方法。
背景技术
随着手机的广泛普及和移动通信技术的快速发展,手机已经不单纯是作为个人用户的移动通信终端,而是越来越多地发展成为个人的多媒体综合应用平台,其中被应用得最多的功能就是利用手机拍摄图片,并对图像进行浏览和搜索。目前手机内图像的存储一般是按照图像文件名称的字典顺进行排列,而不是按图像的内容进行合理组织,导致语义内容相同或相近的图片无法存放在一起。当手机用户在搜索图像时往往需要不停地翻屏,这种按图像名称来组织图像的方式无疑会给用户带来极大的不便。
本专利针对这一不足,提出一种基于分层聚类的手机内图像的图像组织和搜索方法。图像分类是将一些图像按语义分成不同的类别的处理技术,常分为监督和非监督两大类,监督方法需要训练样本具有先验的类别信息,而非监督方法(聚类分析)则无需样本的类别信息,因此利用聚类分析对图像进行分类显得更加方便。我们利用聚类分析技术将手机内图像按语义内容进行聚类,使每张图像都归属于不同的类别。目前手机拍摄图像的存储一般是按照拍摄时间的先后按顺序进行存储,而不是按图像的内容进行组织,在搜索相同内容的图像时方面非常不方便。本发明针对这一不足,提出一种针对手机图像的层次聚类图像组织和搜索算法。
发明内容
本发明的目的在于提供一种手机图像管理智能化的基于GMM的手机内图像的组织和搜索方法。
本发明的目的是这样实现的:
步骤1:对手机内photo文件夹下的所有图像按高斯混合模型进行聚类,图像特征采用MPEG-7的视觉特征描述子,聚类的数目K需要事先设置,K一般可设置为手机一屏所显示的图像数目,得到K个聚类,由于采用软聚类方式,每幅图像按一定概率分别属于每个聚类;
步骤2:对全部图像进行聚类的K幅聚类中心图像,作为图像索引结构中的最上一层的图像;
步骤3:将每幅最上一层图像所对应的该类别下的所有图像继续按高斯混合模型进行聚类,聚类的数目仍然为K,将本次聚类的K*K幅聚类中心图像作为图像索引结构中的第二层图像;
步骤4:从第二层图像开始重复步骤3,直到每个聚类为一幅图像,建立一个手机内图像的基于软聚类的GMM分层聚类图像索引结构;
步骤5:图像索引结构建立好后,用户可以开始搜索图像,由图像索引结构的最上一层图像开始,将K个最上一层图像显示在手机屏幕上,用户如果发现欲搜索的图像则停止搜索,否则点选手机屏幕上与欲搜索图像内容最接近似的一幅图像;
步骤6:点选图像后进入图像索引结构的下一层,手机屏幕上则显示与所点选图像对应的K个下一层图像,这样逐层进行搜索,直到找到满意的结果。
本发明的有益效果在于:
本发明提供给手机用户按图像语义的不同进行搜索和查找的方式,极大地方便了手机图像管理和使用上的智能化。考虑到手机内图像的数量要比大型图像库要小得多,因此经典的图像聚类技术就可以满足其实时性的要求。
附图说明
图1一般的分层聚类的图像分层组织示意图;
图2本专利的GMM分层聚类的图像索引结构图。
具体实施方式
下面结合附图对本发明做进一步描述。
本专利对手机内图像采用逐层聚类的方式,逐步缩小图像高低级语义之间的差异。本专利对手机图像进行组织和搜索的具体方法如下:
首先对所有图像进行聚类,聚类数目设为手机一屏之内所能显示的图片数目,将聚类中心的图像作为最上层的代表图像;对每个类别下的图像进行进一步聚类,分成更细化的类别,将本次聚类的聚类中心图像作为第二层的代表图像;依此类推,直到每个聚类就是一幅图像,这样,图像按类别的由粗到细构成了一个树状索引结构,对图像的层次组织就完成了。
对于图片搜索功能,先在屏幕上显示图像组织结构中最上层的图像代表,如果该屏图像中包含用户的欲搜索图像则停止,如果没有包含,则用户点选与其欲搜索图片最接近的相应图像,进入下一层,屏幕上则显示刚才被点选图像所对应的图像聚类的代表图像,如果该屏图像中包含用户的欲搜索图像则停止,如果没有包含,用户继续点选,直到搜索到所需要的图像。
高斯混合模型(Gaussian Mixture Model,GMM)是最具有代表性的一种聚类方法,它在图像聚类过程中考虑了像素在视觉空间中的统计分布特性。高斯混合模型的求解采用期望最大化(Expectation Maximization,EM)算法,为GMM模型参数提供了一种简单有效的最大似然迭代估计方法。因此我们采用高斯混合模型来对手机内图像进行逐层聚类,来达到对图像的分层组织和按这种组织方式进行搜索的目标。由于一幅图像可能呈现出不同层面的信息,因此我们采取软聚类(Soft Clustering)方式,一幅图像在聚类时,可以按照一定的概率被归属于不同的图像类别,即使用户按不同语义选择了不同的路径,也会找到相同的图像(见图1和图2)。在建立好的图像索引结构中,最上层(图2中的聚类层1)图像代表对所有图像进行聚类的聚类中心图像,最底层图像代表手机内的所有图像,边上的权值代表某图像属于上一层聚类的概率。这样,手机内的任意一幅图像都相当于通过一定的概率相乘和最上一层的图像建立了连接,因此,由最上层节点开始,沿着某一条路径就可以搜索到任一幅图像。
对于图像的视觉特征,我们采用国际标准化组织发布的MPEG-7标准,即多媒体内容描述接口(Multimedia Content Description Interface)。其中视觉特征描述子部分(VisualDescriptor)使对图像视觉特征的提取和描述将更具规范性。MPEG-7标准确定了一个标准描述子(Descriptors)集,用来描述各种类型的多媒体信息。一个特征,如颜色、纹理或形状,可能对应多个描述子,这组描述子力图从不同的角度对视觉特征进行描述。
本专利提出的针对手机内图像的分层聚类图像组织和搜索方法,其具体的实施方案如下:设置每层的聚类数目K均为手机一屏内所显示的图像数目。首先对手机内photo文件夹下的所有图像按高斯混合模型进行聚类,对应K个聚类,每个聚类下包含有该类别下的所有图像。将代表K个聚类中心的K幅图像,作为GMM分层聚类的图像索引结构的最上一层的图像。然后,对每一幅最上一层图像,将其对应的类别下的所有图像继续按高斯混合模型进行聚类,聚类数目仍然为K,将代表K个聚类中心的K幅图像,作为GMM分层聚类的图像索引结构的第二层的图像。重复上述步骤,直到每幅图像为一个单独的聚类。在上述步骤中,一幅图像在聚类时,可以按照一定的概率被归属于不同的图像类别,即使用户按不同语义选择了不同的路径,也会找到相同的图像。手机内图像的分层聚类的图像索引结构建立好后,将索引结构中K个最上一层图像(对全部图像进行聚类的K幅聚类中心图像)显示在手机屏幕上。用户可以从最上一层开始搜索图像,点选与欲搜索图像内容接近的图像,然后,手机屏幕上显示相应的K个第二层图像(由被点选的上一层图像所确定的该类别下所有图像的K幅聚类中心图像)。这样,通过逐层点选与欲搜索图像内容接近的图像,逐层向下搜索,直到找到满意的结果。具体步骤如下:
步骤1:首先对手机内photo文件夹下的所有图像按高斯混合模型进行聚类,图像特征采用MPEG-7的视觉特征描述子。聚类的数目K需要事先设置,K一般可设置为手机一屏所显示的图像数目。这样,得到K个聚类,由于采用软聚类方式,每幅图像按一定概率分别属于每个聚类。
步骤2:对全部图像进行聚类的K幅聚类中心图像,作为图像索引结构中的最上一层的图像。
步骤3:将每幅最上一层图像所对应的该类别下的所有图像继续按高斯混合模型进行聚类,聚类的数目仍然为K,将本次聚类的K*K幅聚类中心图像作为图像索引结构中的第二层图像。
步骤4:从第二层图像开始重复步骤3,直到每个聚类为一幅图像。这时,一个手机内图像的基于软聚类的GMM分层聚类图像索引结构就建立好了。
步骤5:图像索引结构建立好后,用户可以开始搜索图像。由图像索引结构的最上一层图像开始,将K个最上一层图像显示在手机屏幕上,用户如果发现欲搜索的图像则停止搜索,否则点选手机屏幕上与欲搜索图像内容最接近似的一幅图像。
步骤5:点选图像后进入图像索引结构的下一层,手机屏幕上则显示与所点选图像对应的K个下一层图像。这样逐层进行搜索,直到找到满意的结果。
(1)由于手机内photo文件夹下的图像不会更新得特别频繁,所以可以对手机图像按天进行图像索引结构的建立,即在每天的固定时间进行索引结构的更新。(2)由于手机内图像的数目相比于大型图像库来说要小得多,所以图像索引结构的层数不会太多,例如K=6,手机内图像为1000幅时,图像索引结构的层数为4。

Claims (1)

1.一种基于GMM的手机内图像的组织和搜索方法,其特征在于:
步骤1:对手机内photo文件夹下的所有图像按高斯混合模型进行聚类,图像特征采用MPEG-7的视觉特征描述子,聚类的数目K需要事先设置,K一般可设置为手机一屏所显示的图像数目,得到K个聚类,由于采用软聚类方式,每幅图像按一定概率分别属于每个聚类;
步骤2:对全部图像进行聚类的K幅聚类中心图像,作为图像索引结构中的最上一层的图像;
步骤3:将每幅最上一层图像所对应的该类别下的所有图像继续按高斯混合模型进行聚类,聚类的数目仍然为K,将本次聚类的K*K幅聚类中心图像作为图像索引结构中的第二层图像;
步骤4:从第二层图像开始重复步骤3,直到每个聚类为一幅图像,建立一个手机内图像的基于软聚类的GMM分层聚类图像索引结构;
步骤5:图像索引结构建立好后,用户可以开始搜索图像,由图像索引结构的最上一层图像开始,将K个最上一层图像显示在手机屏幕上,用户如果发现欲搜索的图像则停止搜索,否则点选手机屏幕上与欲搜索图像内容最接近似的一幅图像;
步骤6:点选图像后进入图像索引结构的下一层,手机屏幕上则显示与所点选图像对应的K个下一层图像,这样逐层进行搜索,直到找到满意的结果。
CN201410239322.1A 2014-06-03 2014-06-03 一种基于gmm的手机内图像的组织和搜索方法 Pending CN104021171A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410239322.1A CN104021171A (zh) 2014-06-03 2014-06-03 一种基于gmm的手机内图像的组织和搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410239322.1A CN104021171A (zh) 2014-06-03 2014-06-03 一种基于gmm的手机内图像的组织和搜索方法

Publications (1)

Publication Number Publication Date
CN104021171A true CN104021171A (zh) 2014-09-03

Family

ID=51437925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410239322.1A Pending CN104021171A (zh) 2014-06-03 2014-06-03 一种基于gmm的手机内图像的组织和搜索方法

Country Status (1)

Country Link
CN (1) CN104021171A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113010615A (zh) * 2021-04-12 2021-06-22 安徽农业大学 基于高斯混合模型聚类算法的分层级数据可视化方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1773492A (zh) * 2004-11-09 2006-05-17 国际商业机器公司 组织多个文档的方法以及显示多个文档的设备
US20070214172A1 (en) * 2005-11-18 2007-09-13 University Of Kentucky Research Foundation Scalable object recognition using hierarchical quantization with a vocabulary tree
CN102254015A (zh) * 2011-07-21 2011-11-23 上海交通大学 基于视觉词组的图像检索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1773492A (zh) * 2004-11-09 2006-05-17 国际商业机器公司 组织多个文档的方法以及显示多个文档的设备
US20070214172A1 (en) * 2005-11-18 2007-09-13 University Of Kentucky Research Foundation Scalable object recognition using hierarchical quantization with a vocabulary tree
CN102254015A (zh) * 2011-07-21 2011-11-23 上海交通大学 基于视觉词组的图像检索方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113010615A (zh) * 2021-04-12 2021-06-22 安徽农业大学 基于高斯混合模型聚类算法的分层级数据可视化方法
CN113010615B (zh) * 2021-04-12 2021-10-01 安徽农业大学 基于高斯混合模型聚类算法的分层级数据可视化方法

Similar Documents

Publication Publication Date Title
US10621755B1 (en) Image file compression using dummy data for non-salient portions of images
JP5282658B2 (ja) 画像学習、自動注釈、検索方法及び装置
US20180189325A1 (en) Clustering search results based on image composition
EP4002161A1 (en) Image retrieval method and apparatus, storage medium, and device
Zhang et al. Discovering place-informative scenes and objects using social media photos
CN104331509A (zh) 照片管理方法及装置
CN106599925A (zh) 一种基于深度学习的植物叶片识别系统与方法
CN108875797B (zh) 一种确定图像相似度的方法、相册管理方法及相关设备
CN104679863A (zh) 一种基于深度学习的以图搜图方法和系统
WO2011097041A2 (en) Recommending user image to social network groups
CN108288208B (zh) 基于图像内容的展示对象确定方法、装置、介质及设备
US20180046721A1 (en) Systems and Methods for Automatic Customization of Content Filtering
CN111177559A (zh) 文旅服务推荐方法、装置、电子设备及存储介质
CN104156464A (zh) 基于微视频特征数据库的微视频检索方法及装置
CN111949806A (zh) 一种基于Resnet-Bert网络模型的跨媒体检索方法
CN108427774A (zh) 一种用于内容推荐的方法和装置
CN102855245A (zh) 一种用于确定图片相似度的方法与设备
CN112579822A (zh) 一种视频数据的推送方法、装置、计算机设备和存储介质
CN110852224B (zh) 一种表情识别方法及相关装置
CN110019913A (zh) 图片匹配方法、用户设备、存储介质及装置
CN105631404A (zh) 对照片进行聚类的方法及装置
CN111652073B (zh) 视频分类方法、装置、系统、服务器和存储介质
CN104021171A (zh) 一种基于gmm的手机内图像的组织和搜索方法
CN107656760A (zh) 数据处理方法及装置、电子设备
CN107577681B (zh) 一种基于社交媒体图片的地域分析、推荐方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140903