CN101599077B - 一种三维对象检索的方法 - Google Patents

一种三维对象检索的方法 Download PDF

Info

Publication number
CN101599077B
CN101599077B CN2009100884162A CN200910088416A CN101599077B CN 101599077 B CN101599077 B CN 101599077B CN 2009100884162 A CN2009100884162 A CN 2009100884162A CN 200910088416 A CN200910088416 A CN 200910088416A CN 101599077 B CN101599077 B CN 101599077B
Authority
CN
China
Prior art keywords
view
view collection
collection
search object
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009100884162A
Other languages
English (en)
Other versions
CN101599077A (zh
Inventor
戴琼海
路瑶
尔桂花
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN2009100884162A priority Critical patent/CN101599077B/zh
Publication of CN101599077A publication Critical patent/CN101599077A/zh
Application granted granted Critical
Publication of CN101599077B publication Critical patent/CN101599077B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种三维对象检索的方法,所述方法包括:将三维检索对象视图集与数据库中的视图集进行二分图最大匹配,滤除数据库中不满足预设匹配条件的视图集,得到剩余视图集;将所述三维检索对象视图集与每个所述剩余视图集进行二分图最优匹配,获取所述三维检索对象视图集与每个所述剩余视图集之间的距离;对每个所述剩余视图集进行排序,将排序后的每个所述剩余视图集作为检索结果输出。本发明实施例采用统计聚类的预处理,结合二分图最大匹配和最优匹配,获取三维检索对象视图集与数据库中的视图集之间的距离,提高了三维对象检索的正确率,同时使得三维对象的检索可以不依赖采集环境的信息,使三维对象检索的方法能够更广泛地应用。

Description

一种三维对象检索的方法 
技术领域
本发明涉及图像检索领域,特别涉及一种三维对象检索的方法。 
背景技术
三维对象由于其真实、立体的特点,正在成为重要的计算机多媒体数据类型,其数量在互联网和个人电脑上迅速增长。因此使用者会有对三维对象数据信息进行检索的需求,即从海量的三维对象数据中获取所需的信息。 
三维对象检索方法有基于模型的统计信息、基于几何结构和基于模型视图这三种方式。这些方法都是依赖于现有的模型信息,通过构建好的几何模型,计算出需要的信息,即便是基于视图的检索方式,也是根据模型信息,进而得到各个角度的视图。由于模型的复杂度直接与实际物体或者场景的复杂度相关,完全依赖于模型会造成计算复杂度的增加,对于复杂场景,建模十分困难甚至无法实现。 
目前基于图像的三维对象表示和渲染技术都有了重要发展,特别是密集多视图采样技术,是一种快速发展并颇具前景的立体描述技术,三维对象的多视图采集一般用如下方法:将三维对象置于一个摄像机阵列中进行拍摄,得到描述该对象的二维图像集合,基于多视图的三维对象检索也成为了一个很有前景的研究方向。 
现有的三维对象检索的方法中,大多需要获得采集环境的信息,如摄像机阵列分布方式等信息,并且采集环境大多是固定单一的,如等间隔环形分布的摄像机阵列等。在三维对象的检索过程中,由于依赖采集环境信息的获取,使得三维对象检索方法的应用具有一定的局限性。 
发明内容
本发明实施例提供了一种三维对象检索的方法,所述方法包括: 
获取用户输入的三维检索对象的视图集; 
将所述三维检索对象视图集与数据库中的视图集进行二分图最大匹配,滤除数据库中不满足预设匹配条件的视图集,得到剩余视图集; 
对所述三维检索对象的视图集进行统计聚类,得到所述三维检索对象视图集的统计聚类结果; 
对每个所述剩余视图集进行统计聚类,得到每个所述剩余视图集的统计聚类结果; 
根据所述三维检索对象视图集的统计聚类结果与每个所述剩余视图集的统计聚类结果,将所述三维检索对象视图集与每个所述剩余视图集进行二分图最优匹配,获取所述三维检索对象视图集与每个所述剩余视图集之间的距离; 
根据所述三维检索对象视图集与每个所述剩余视图集之间的距离,对每个所述剩余视图集进行排序,将排序后的每个所述剩余视图集作为检索结果输出。 
本发明实施例在三维对象检索的过程中,通过采用统计聚类的预处理,结合二分图最大匹配和最优匹配,获取三维检索对象视图集与数据库中的视图集之间的距离,提高了三维对象检索的正确率,同时使得三维对象的检索可以不依赖采集环境的信息,使三维对象检索的方法能够更广泛地应用。 
附图说明
图1是本发明实施例1中提供的三维对象检索的方法流程图。 
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。 
实施例1 
本发明实施例提供了一种三维对象检索的方法,参见图1,该方法包括: 
101:获取用户输入的三维检索对象的视图集。 
具体的,用户输入的需要检索的三维对象的视图集,是表示该三维对象的一组二维视图。 
102:对该三维检索对象的视图集进行统计聚类,得到三维检索对象视图集的统计聚类结果。 
具体的,在对视图集进行统计聚类时,需要先对视图集进行特征的提取,通常提取的是视图的底层视觉特征,然后利用无监督或半监督的学习方法将该视图集合划分为若干个视图子集,每个视图子集里面包括一组视觉上相似的图像。如一个视图集X={x1,x2,...,xn},其中xi为X中的一幅二维视图,在进行聚类 时,即将与xi视觉上相似的图像的图像xp,xq,...,xt划分为一个视图子集X1={xi,xp,xq...,xt},由此视图集X={x1,x2,...,xn}进行统计聚类后,得到k个视图子集,即X={X1,X2,...,XK},且每个视图子集中的视图都是视觉上相似的视图。优选的,k的取值为3-6之间。 
103:将该三维检索对象视图集与数据库中的视图集进行二分图最大匹配,滤除数据库中不满足预设匹配条件的视图集,得到剩余视图集。 
具体的,进行二分图的最大匹配的方法如下:设X={x1,x2,...,xn}时三维检索对象的视图集,Yk={y1,y2,...,ym}是数据库中的一个三维对象的视图集合。依次对X和Yk中的视图使用二分图最大匹配,滤除数据库中不满足预设匹配条件的视图集,得到数据库中满足预设条件的每个剩余视图集,其中,该预设条件为:与该三维检索对象视图集的相似度大于预设的阈值。 
优选的,可以使用Hungarian算法。如果X中的视图xi和Yk中的视图yj的相似度大于阈值T,则认为这两幅图相关,用一条边线连接这两幅视图。其中,阈值T的值可以根据匹配视图的个数进行调整。在视图一对一匹配的约束下,可以求出最大匹配子图M,如果最大匹配子图M中边线的总个数l大于预设的匹配阈值(如n/2)时,则认为Yk和X相似。否则最大匹配子图M中边线的总个数l小于预设的匹配阈值,则认为Yk和X不相似,滤除Yk,继续比较数据库中其他视图集。 
由上述方法可知,二分图的最大匹配的计算复杂度是O((n+m)*l),其中l是最大匹配子图M中的边线的个数。通过步骤103,就滤除了和用户输入的三维检索对象不相关的视图集合,得到的剩余视图集也就与该三维检索对象相关。 
104:对上述的每个剩余视图集进行统计聚类,得到每个剩余视图集的统计聚类结果。 
对数据库中的每个剩余视图集进行统计聚类的方法与102中的方法相同,不再赘述,对数据库中的视图集进行统计聚类可以预先进行,由此在检索时可以直接从数据库中提取每个剩余视图集的统计聚类结果。 
105:根据该三维检索对象视图集的统计聚类结果和每个剩余视图集的统计聚类结果,对该三维检索对象视图集与该每个剩余视图集进行二分图最优匹配,得到该三维检索对象视图集与每个该剩余视图集之间的距离。 
具体的,进行二分图的最优匹配的方法如下: 
1)求出视图子集的聚类中心,用属于该子集的视图的特征向量平均值作为该子集中心,对于划分为K个子集的X和Yk,求出其子集中心记为{x1,x2,...,xK},{y1,y2,...,yK},步骤1)的计算复杂度为O((n+m)*K)。 
2)对聚类中心Xc={xc1,xc2,...,xcK}和Ykc={yc1,yc2,...,ycK}两个集合,构成二分图Gc={Xc,Ykc,Ec},用Kuhn-Munkres算法,在一对一匹配的约束下,可以求出最优匹配子图Mc,从而得到Xc={xc1,xc2,...,xcK}和Ykc={yc1,yc2,...,ycK}里各个视图的对应关系,也就是视图集合X和Yk里各个子集的对应关系,将Yk按照和X的对应关系重新排序,得到X={X1,X2,...,XK},Yk={Yk 1,Yk 2,...,Yk },其中Xi和yk i相对应。步骤2)的计算复杂度为O(K4)。 
3)根据每一对对应子集Xi和Yk i构成一个二分图Gi={Xi,Yk i,Ei},使用最优匹配的算法,如Kuhn-Munkres算法,对各个边进行权值的设定,具体的,在本发明实施例中,两幅视图特征向量的欧氏距离被设定为边的权值。在一对一匹配的约束下,求得权值最小的子图,作为该二分图的最优匹配,并对权值求和得到子集Xi和Yk i的距离: 
Dis i ( X i , Y k i ) = ΣDis ( x i i , y i j ) n i
其中, X i = { x i 1 , x i 2 , . . . , x i n i } , Y k i = { y i 1 , y i 2 , . . . , y i m i } , ni,mi分别是Xi和Yk i的视图个数。 
进一步,将对应子集距离进行求和,得到视图集合X和Yk的距离: 
Dis ( X , Y k ) = Σ Dis i ( X i , Y k i ) K , 步骤3)的计算复杂度为为 
Figure G2009100884162D00047
在上述计算两个视图集的距离的步骤中,可知由于在密集采样中视图的个数n和m远大于k,统计聚类和视图匹配过程中的计算复杂度相对很小,可以忽略,由此降低了最优匹配的复杂度,因此,本发明采用聚类预处理提高了系统的效率。 
106:根据该三维检索对象视图集与每个该剩余视图集之间的距离,对每个该剩余视图集进行排序,将排序后的每个该剩余视图集作为检索结果输出。 
有上述描述可知,本发明通过统计聚类,先采用二分图最大匹配,滤除数据库中与检索对象相关度不高的视图集,然后再采用二分图最优匹配,从数据库中视图集进一步的检索和匹配。本发明实施例通过采用统计聚类以及二分图的最大匹配和最优匹配,使得基于多视图集的三维对象检索可以不依赖采集环境的信息,同时三维对象检索的正确率也得到了提高。 
本发明实施例在三维对象检索的过程中,通过采用统计聚类的预处理,结合二分图最大匹配和最优匹配,获取三维检索对象视图集与数据库中的视图集之间的距离,提高了三维对象检索的正确率,同时使得三维对象的检索可以不依赖采集环境的信息,使三维对象检索的方法能够更广泛地应用。 
本发明实施例可以利用软件实现,相应的软件程序可以存储在可读取的存储介质中,例如,路由器的硬盘、缓存或光盘中。 
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。 

Claims (4)

1.一种三维对象检索的方法,其特征在于,所述方法包括:
获取用户输入的三维检索对象的视图集;
将所述三维检索对象视图集与数据库中的视图集进行二分图最大匹配,滤除数据库中不满足预设匹配条件的视图集,得到剩余视图集;
对所述三维检索对象的视图集进行统计聚类,得到所述三维检索对象视图集的统计聚类结果;
对每个所述剩余视图集进行统计聚类,得到每个所述剩余视图集的统计聚类结果;
根据所述三维检索对象视图集的统计聚类结果与每个所述剩余视图集的统计聚类结果,将所述三维检索对象视图集与每个所述剩余视图集进行二分图最优匹配,获取所述三维检索对象视图集与每个所述剩余视图集之间的距离;
根据所述三维检索对象视图集与每个所述剩余视图集之间的距离,对每个所述剩余视图集进行排序,将排序后的每个所述剩余视图集作为检索结果输出。
2.根据权利要求1所述的三维对象检索的方法,其特征在于,所述将所述三维检索对象视图集与每个所述剩余视图集进行二分图最优匹配之前,还包括:
对所述三维检索对象的视图集进行底层视觉特征的提取;并根据提取的特征对所述三维检索对象的视图集进行统计聚类,得到所述三维检索对象视图集的统计聚类结果;
对每个所述剩余视图集进行底层视觉特征的提取;并根据提取的特征对每个所述剩余视图集进行统计聚类,得到每个所述剩余视图集的统计聚类结果。
3.根据权利要求1所述的三维对象检索的方法,其特征在于,所述预设匹配条件为:与所述三维检索对象视图集的相似度大于预设的阈值。
4.根据权利要求1所述的三维对象检索的方法,其特征在于,所述将所述三维检索对象视图集与每个所述剩余视图集进行二分图最优匹配,获取所述三维检索对象视图集与每个所述剩余视图集之间的距离,包括:
获取所述三维检索对象的视图子集的第一聚类中心,并获取所述剩余视图子集的第二聚类中心;
计算得到所述第一聚类中心与所述第二聚类中心的对应关系,根据所述对应关系,将所述三维检索对象的视图子集与所述剩余视图子集进行对应;
根据相互对应的所述三维检索对象的视图子集与所述剩余视图子集,计算所述三维检索对象视图集与所述剩余视图集之间的距离。
CN2009100884162A 2009-06-29 2009-06-29 一种三维对象检索的方法 Expired - Fee Related CN101599077B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100884162A CN101599077B (zh) 2009-06-29 2009-06-29 一种三维对象检索的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100884162A CN101599077B (zh) 2009-06-29 2009-06-29 一种三维对象检索的方法

Publications (2)

Publication Number Publication Date
CN101599077A CN101599077A (zh) 2009-12-09
CN101599077B true CN101599077B (zh) 2011-01-05

Family

ID=41420525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100884162A Expired - Fee Related CN101599077B (zh) 2009-06-29 2009-06-29 一种三维对象检索的方法

Country Status (1)

Country Link
CN (1) CN101599077B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894267B (zh) * 2010-07-06 2012-07-18 清华大学 一种三维对象特征视图选取方法
CN102073738B (zh) * 2011-01-20 2013-04-17 清华大学 基于智能检索视图选择的三维对象检索方法和装置
CN104298758A (zh) * 2014-10-22 2015-01-21 天津大学 一种多视角目标检索的方法
CN105243139B (zh) * 2015-10-10 2018-10-23 天津大学 一种基于深度学习的三维模型检索方法及其检索装置
CN106503270B (zh) * 2016-12-09 2020-02-14 厦门大学 一种基于多视点及二部图匹配的3d目标检索方法
CN108717424B (zh) * 2018-04-25 2021-06-11 鹰霆(天津)科技有限公司 一种基于分解式图匹配的三维模型检索方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040249809A1 (en) * 2003-01-25 2004-12-09 Purdue Research Foundation Methods, systems, and data structures for performing searches on three dimensional objects
CN101281545A (zh) * 2008-05-30 2008-10-08 清华大学 一种基于多特征相关反馈的三维模型检索方法
CN101458714A (zh) * 2008-12-30 2009-06-17 清华大学 一种基于精确测地线的三维模型检索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040249809A1 (en) * 2003-01-25 2004-12-09 Purdue Research Foundation Methods, systems, and data structures for performing searches on three dimensional objects
CN101281545A (zh) * 2008-05-30 2008-10-08 清华大学 一种基于多特征相关反馈的三维模型检索方法
CN101458714A (zh) * 2008-12-30 2009-06-17 清华大学 一种基于精确测地线的三维模型检索方法

Also Published As

Publication number Publication date
CN101599077A (zh) 2009-12-09

Similar Documents

Publication Publication Date Title
Gu et al. A review on 2D instance segmentation based on deep neural networks
Wen et al. UA-DETRAC: A new benchmark and protocol for multi-object detection and tracking
ElAlami A novel image retrieval model based on the most relevant features
Chum Large-scale discovery of spatially related images
CN101599077B (zh) 一种三维对象检索的方法
CN101853486A (zh) 一种基于局部数字指纹的图像拷贝检测方法
JP4937395B2 (ja) 特徴ベクトル生成装置、特徴ベクトル生成方法及びプログラム
CN105205135A (zh) 一种基于主题模型的3d模型检索方法及其检索装置
Papadopoulos et al. Image clustering through community detection on hybrid image similarity graphs
Petkos et al. Graph-based multimodal clustering for social event detection in large collections of images
Su et al. Scalable deep learning logo detection
Suwanwimolkul et al. Learning of low-level feature keypoints for accurate and robust detection
Gao et al. Event video mashup: From hundreds of videos to minutes of skeleton
Dhoot et al. Efficient Dimensionality Reduction for Big Data Using Clustering Technique
Wang et al. Action recognition by latent duration model
Hu et al. STRNN: End-to-end deep learning framework for video partial copy detection
Priya et al. Optimized content based image retrieval system based on multiple feature fusion algorithm
Deng et al. Visualisation and comparison of image collections based on self-organised maps
Zheng et al. Automatic image indexing for rapid content-based retrieval
Vandaele et al. Mining topological structure in graphs through forest representations
Sun et al. A novel region-based approach to visual concept modeling using web images
Bouachir et al. Fuzzy indexing for bag of features scene categorization
Yang et al. Saliency regions for 3D mesh abstraction
Alfarrarjeh et al. Spatial aggregation of visual features for image data search in a large geo-tagged image dataset
Lin et al. MHCN: A Hyperbolic Neural Network Model for Multi-view Hierarchical Clustering

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110105

Termination date: 20140629

EXPY Termination of patent right or utility model