CN109543054B - 一种基于视图的特征降维三维模型检索方法 - Google Patents
一种基于视图的特征降维三维模型检索方法 Download PDFInfo
- Publication number
- CN109543054B CN109543054B CN201811208023.6A CN201811208023A CN109543054B CN 109543054 B CN109543054 B CN 109543054B CN 201811208023 A CN201811208023 A CN 201811208023A CN 109543054 B CN109543054 B CN 109543054B
- Authority
- CN
- China
- Prior art keywords
- view
- characteristic
- library
- dimension reduction
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于视图的特征降维三维模型检索方法,所述方法包括以下步骤:将数据库中各物体的多视角彩色视图集定义为多视角模型库,提取多视角模型库的特征得到各物体的特征向量集,并定义为多视角特征库;利用奇异值分解算法计算多视角特征库的特征值和特征向量,选取每个三维物体的代表视图以降低视图数量,得到减少视图数后的特征库;构建降维方程,利用迭代算法和特征库对降维方程中的变量进行最优化训练;根据最优变量计算两模型间的距离,得到最终的检索结果。本方法实现了在选取视图代表的同时降低了特征维度,降低了计算的复杂度,提高了三维模型检索的精度。
Description
技术领域
本发明涉及三维模型检索领域,尤其涉及一种基于视图的特征降维三维模型检索方法。
背景技术
3D模型作为一种比2D图片更加丰富多彩的多媒体数据类型在近几年正不断进步和发展。一方面,建模工具,3D扫描器,3D图形加速硬件等等设备的发展使得接入和产生高质量的3D模型成为可能。尤其是微软Kinect的发明和使用,有力的推动和促进了这个发展趋势。另一方面,计算机图形学的发展,工业产品设计[1],三维场景[2],虚拟现实[3]等等3D模型的应用使得3D模型被广泛传播和使用。3D模型在娱乐[4]、医学[5]、工业等应用领域的研究和使用得到了认同。日益发展的互联网技术也为3D模型的传输和处理提供了条件,这些都推动了3D模型数据库及其应用需求的快速增长。因此,面对一个庞大的3D模型数据库,如何高效率地检索成为了一个热门课题[6]。
3D模型检索技术和其他的多媒体数据检索技术一样,3D模型检索技术可以分为基于文本的检索技术[7]和基于内容的检索技术[8],但是基于文本的检索需要对模型库用关键字或者文本信息对模型进行描述且需要人工进行标注,要花费大量的人力物力,容易降低检索效率,因此,基于内容的检索技术是目前的主流研究方法。
基于内容的检索方法首先从模型的数据中提取出相应的特征,如形状、颜色以及纹理等等。这些特征可以用来代表或者表示一个3D模型。然后在多维特征空间中计算待查询模型与目标3D模型之间的相似度,从而实现对三维数据库的检索[9]。基于内容的3D模型检索方法主要可以分为两类:1)基于几何形状的检索技术;2)基于多视图的检索技术。早期的研究工作主要关注基于几何形状的检索技术。但是近几年,基于多视图的检索技术由于其较高的辨别度而引起了更多的关注。
基于视图的三维模型检索领域目前面临的主要挑战为:大多数方法都关注在相似度计算和模型结构表征上,而忽略了代表视图的选择和特征维度的减少,限制了实际应用范围。
发明内容
本发明提供了一种基于视图的特征降维三维模型检索方法,本发明在选取视图代表的同时降低了特征维度,降低了计算的复杂度,提高了三维模型检索的精度,详见下文描述:
一种基于视图的特征降维三维模型检索方法,所述方法包括以下步骤:
将数据库中各物体的多视角彩色视图集定义为多视角模型库,提取多视角模型库的特征得到各物体的特征向量集,并定义为多视角特征库;
利用奇异值分解算法计算多视角特征库的特征值和特征向量,选取每个三维物体的代表视图以降低视图数量,得到减少视图数后的特征库;
构建降维方程,利用迭代算法和特征库对降维方程中的变量进行最优化训练;根据最优变量计算两模型间的距离,得到最终的检索结果。
所述利用奇异值分解算法计算多视角特征库的特征值和特征向量,选取每个三维物体的代表视图的步骤具体为:
每张视图的特征为D维,R表示矩阵。
所述降维方程具体为:
其中,Y*为最优化训练后得到的最优映射矩阵;Y为映射矩阵;M(Y)为使用映射矩阵作为输入的降维方程;α反映了类内相似度距离和类间相似度距离的权衡度;Mw(Y)为类内特征的降维方程;Mb(Y)为类间特征的降维方程。
所述利用迭代算法和特征库对降维方程中的变量进行最优化训练的步骤具体为:
通过对Yk-1=γ(k-1)进行梯度求导得到梯度方向Hk-1并利用步长γ得到
Yk=arg minYM(Y),重复计算直到收敛;
其中,Yk-1为第k-1次迭代的Y矩阵;M(Y)为需要进行求最优化操作的降维方程。
本发明提供的技术方案的有益效果是:
1、避免了采集初始视图时对样本视图数的依赖,可设定代表视图的数量,具有很好的调节性;
2、使用迭代方法降低特征维度,提高了匹配精确度。
附图说明
图1为一种基于视图的特征降维三维模型检索方法的流程图;
图2为物体的初始多视角视图集样例;
图3为四种三维模型检索方法的查准-查全曲线。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。
实施例1
为了解决三维模型检索中特征降维的问题,提高三维模型检索的准确度,参见图1,本发明实施提供了一种基于视图的特征降维三维模型检索方法,该方法包括以下步骤:
101:将数据库中各物体的多视角彩色视图集定义为多视角模型库,提取多视角模型库的特征得到各物体的特征向量集,并定义为多视角特征库;
102:利用奇异值分解算法计算多视角特征库的特征值和特征向量,选取每个三维物体的代表视图以降低视图数量,得到减少视图数后的特征库;
103:构建降维方程,利用迭代算法和步骤102中得到的特征库对降维方程中的变量进行最优化训练;
104:利用上述步骤中得到的最优变量计算两模型间的距离,得到最终的检索结果。
综上所述,本发明实施例通过上述步骤101-步骤104实现了在选取视图代表的同时降低了特征维度,降低了计算的复杂度,提高了三维模型检索的精度。
实施例2
下面结合具体的计算公式、实例对实施例1中的方案进行详细介绍,详见下文描述:
201:将数据库中各物体的多视角彩色视图集定义为多视角模型库SD(SetDatabase),提取多视角模型库的特征得到各物体的特征向量集并定义为初始多视角特征库FD(Feature Database);
由于Zernike矩[10]在视图的平移、缩放和旋转中具有不变性,所以不失一般性的,采用Zernike矩为例进行实验,得到特征向量集并定义为初始多视角特征库FD,用S表示,S={s1,s2,...,sm}和类别标签其中,m为三维模型的数量;sm为第m个三维模型的特征;为第m个三维模型的类别标签。
202:利用奇异值分解算法计算多视角特征库的特征值和特征向量,选取每个三维物体的代表视图以降低视图数量,得到减少视图数后的特征库;
奇异值分解算法[11]的主要思路是求出每个三维模型的特征si的特征值和特征向量,并利用特征值和特征向量来表示si,针对本发明的具体计算方法为:设定代表视图的数量为x,其中Λi,Qi为si的前x个特征值和特征向量,T为矩阵转置。选取Qi∈RD ×x作为si减少视图数后的特征组成特征库Q。
203:构建降维方程,利用迭代算法和步骤202中得到的特征库对方程中的变量进行最优化训练;
降维方程使得类内相似度最小、并且类间相似度最大:
其中,Y*为最优化训练后得到的最优映射矩阵;Y为映射矩阵;M(Y)为使用映射矩阵作为输入的降维方程;α反映了类内相似度距离和类间相似度距离的权衡度;Mw(Y)为类内特征的降维方程;Mb(Y)为类间特征的降维方程。
类内相似度和类间相似度的计算方法如下:
其中,Z∈RD×d且为一个正交矩阵,d为降维后的矩阵维数,Qi∈RD×x为第i个三维模型si的代表视图,但是ZTQi一般在最初时非正交,所以需要将Qi转换为Q′i从而使得ZTQ′i正交,要求Z满秩,Q′i为Qi转换后的使得ZTQ′i正交的矩阵,Q′j为Qj转换后的使得ZTQ′j正交的矩阵;i,j分别为第i个三维模型和第j个三维模型,Nw为同类的样本对数,Nb为不同类的样本对数,m为三维模型的数量,li为第i个三维模型的类别标签,lj为j个三维模型的类别标签;Y=ZZT,Y和P为需要学习的矩阵,tr和F为数学中的矩阵计算公式。
对每个三维模型i,它的降维矩阵Qi都应当变为Q′i,这样矩阵ZTQi才是正交的并且可得到固定的Y=ZZT。为了得到所需的Q′i值,首先对ZTQi进行QR-分解得到q列的正交矩阵Oi和可逆上三角矩阵Fi∈Rq×q,ZTQi=OiFi。由于Oi正交且Fi可逆,可得到更新的Q′i使得ZTQi正交:
Oi=ZT(QiFi -1)→Q′i=QiFi -1
将目标函数转换如下:
Xw和Xb定义为:
初始化Y:Y0是通过利用非线性RCG(黎曼共轭梯度)算法给定的Qi得到的,具体计算步骤为本领域技术人员所公知。
迭代优化(该部分是对Y的处理,YK是第k次迭代产生的矩阵):
步骤1:输入原始的Y0,根据Y0矩阵求出共轭梯度H0=0;
步骤3:通过对Yk-1=γ(k-1)进行梯度求导得到梯度方向Hk-1并利用步长γ得到Yk=arg minYM(Y),重复计算直到收敛。
其中,Yk-1为第k-1次迭代的Y矩阵;M(Y)为需要进行求最优化操作的降维方程。
204:利用上述步骤中得到的最优变量计算两模型间的距离,得到最终的检索结果。
根据步骤203得到的最优变量Y和P,任意两个三维模型之间的距离定义为:
距离越小,代表两个三维模型间的相似度越大。
综上所述,本发明实施例通过上述步骤201-步骤204实现了在选取视图代表的同时降低了特征维度,降低了计算的复杂度,提高了三维模型检索的精度。
实施例3
下面结合具体的实验数据、图3对实施例1和2中的方案进行可行性验证,详见下文描述:
本实验使用的数据库为由中国台湾大学发布的数据库ETH。这是一个真实世界的多视角模型数据库,共包含8类80个物体,每个物体共有41张视图。
本实验中涉及到了几个参数:迭代次数、权重系数α和代表视图数x。本实验中设置迭代次数为8,权重系数α=0.06和代表视图数x=16。
采用查准-查全曲线(Precision-Recall)来衡量本方法的检索性能。查准-查全曲线是三维物体检索的性能评估的重要指标之一,以查全率(Recall)为横坐标,查准率(Precision)为纵坐标。根据以下公式求得Recall和Precision,做出查准-查全曲线:
其中,Recall是查全率,Nz是正确检索对象的数量,Nr是所有相关对象的数量。
其中Precision是查准率,Nall是所有检索对象的数量。
实验中将本方法与五种三维模型检索方法进行对比:
AVC[12](A Bayesian 3D Search Engine using Adaptive Views Clustering),又称“利用可适应视图分类基于贝叶斯准则的三维检索算法”;CCFV[13](CameraConstraint-Free View-Based),又称“基于视图的相机约束自由”;NN[14](The nearestneighbor method),又称“最近邻分析”;SCCV[15](Graph-based characteristic view setextraction and matching),又称“基于图的特征视图集提取与匹配”;WBGM[16](WeightedBipartite Graph Matching),又称“加权二分图匹配”。
本实验与五种三维模型检索算法的查准-查全曲线比较结果如图3,查准-查全曲线与横纵坐标所围面积越大,代表检索性能越优良。
由图3可知,本方法的检索性能明显高于其他算法。这是由于与三维模型检索算法相比,本方法结合使用视图选取和特征降维,大幅度提升了检索性能。实验结果验证了本方法的可行性与优越性。
参考文献:
[1]Pu J,Lou K,Ramani K.A 2D Sketch-Based User Interface for 3D CADModel Retrieval[J].Computer-Aided Design and Applications,2005,2(6):717-725.
[2]Bao H,Dong W.The calculation and the drawing of equivalentsections of model-based 3D graphics[C]//International Congress on Image andSignal Processing.IEEE,2015.
[3]Watanabe T,Saito Y.Camera modeling technique of 3D sensing basedon tile coding for computer vision[C]//International Conference on Body AreaNetworks.2013.
[4]Wong H S,Ma B,Yu Z,et al.3-D Head Model Retrieval Using a SingleFace View Query[J].Multimedia IEEE Transactions on,2007,9(5):1026-1036.
[5]Guetat G,Maitre M,Joly L,et al.Automatic 3-D grayscale volumematching and shape analysis[J].Information Technology in Biomedicine IEEETransactions on,2006,10(2):362-376.
[6]Vranic D V,Saupe D.A feature vector approach for retrieval of 3Dobjects in the context of MPEG-7[C]//Proc.Intl.Conf.on Augmented,VirtualEnvironments and Three-Dimensional Imaging(ICAV3D’01).2001:37-40.
[7]Renu R S,Mocko G.Computing similarity oftext-based assemblyprocesses for knowledge retrieval and reuse[J].Journal of ManufacturingSystems,2016,39:101-110.
[8]Chen Y,Medasani S,Jiang Q,et al.Video content-based retrieval[J].2016.
[9]俞晓妮.基于特征提取的三维模型检索技术研究[J].科技传播,2014,(2).
[10]Khotanzad A,Hong Y H.Invariant Image Recognition by ZernikeMoments[J].IEEETransactions on Pattern Analysis&Machine Intelligence,1990,12(5):489-497.
[11]Golub G H,Reinsch C.Singular value decomposition and leastsquares solutions[J].Numerische Mathematik,1970,14(5):403-420.
[12]Ansary T F,Daoudi M,Vandeborre J P.A bayesian 3-d search engineusing adaptive views clustering[J].Multimedia,IEEE Transactions on,2007,9(1):78-88.
[13]Gao Y,Tang J,Hong R,et al.Camera Constraint-Free View-Based 3-DObject Retrieval[J].IEEE Transactions on Image Processing A Publication ofthe IEEE Signal Processing Society,2012,21(4):2269-2281.
[14]Cover T M,Hart P E.Nearest neighbor pattern classification[J].IEEE Transactions on Information Theory,1967,13(1):21-27.
[15]Liu A,Wang Z,Nie W,et al.Graph-based characteristic view setextraction and matching for 3D model retrieval[J].Information Sciences,2015,320:429-442.
[16]Gao Y,Dai Q,Wang M,et al.3D model retrieval using weightedbipartite graph matching[J].Signal Processing Image Communication,2011,26(1):39-47.
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种基于视图的特征降维三维模型检索方法,其特征在于,所述方法包括以下步骤:
将数据库中各物体的多视角彩色视图集定义为多视角模型库,提取多视角模型库的特征得到各物体的特征向量集,并定义为多视角特征库;
利用奇异值分解算法计算多视角特征库的特征值和特征向量,选取每个三维物体的代表视图以降低视图数量,得到减少视图数后的特征库;
构建降维方程,利用迭代算法和特征库对降维方程中的变量进行最优化训练;根据最优变量计算两模型间的距离,得到最终的检索结果;
其中,所述利用奇异值分解算法计算多视角特征库的特征值和特征向量,选取每个三维物体的代表视图的步骤具体为:
所述降维方程具体为:
其中,Y*为最优化训练后得到的最优映射矩阵;Y为映射矩阵;M(Y)为使用映射矩阵作为输入的降维方程;α反映了类内相似度距离和类间相似度距离的权衡度;Mw(Y)为类内特征的降维方程;Mb(Y)为类间特征的降维方程;
所述利用迭代算法和特征库对降维方程中的变量进行最优化训练的步骤具体为:
通过对Yk-1=γ(k-1)进行梯度求导得到梯度方向Hk-1并利用步长γ得到
Yk=argminYM(Y),重复计算直到收敛;
其中,Yk-1为第k-1次迭代的Y矩阵;M(Y)为需要进行求最优化操作的降维方程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811208023.6A CN109543054B (zh) | 2018-10-17 | 2018-10-17 | 一种基于视图的特征降维三维模型检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811208023.6A CN109543054B (zh) | 2018-10-17 | 2018-10-17 | 一种基于视图的特征降维三维模型检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109543054A CN109543054A (zh) | 2019-03-29 |
CN109543054B true CN109543054B (zh) | 2022-12-09 |
Family
ID=65844243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811208023.6A Active CN109543054B (zh) | 2018-10-17 | 2018-10-17 | 一种基于视图的特征降维三维模型检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109543054B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113220916A (zh) * | 2021-05-31 | 2021-08-06 | 中国邮政储蓄银行股份有限公司 | 图像的检索方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294832A (zh) * | 2013-06-27 | 2013-09-11 | 西安工业大学 | 一种基于反馈学习的运动捕获数据检索方法 |
CN106778639A (zh) * | 2016-12-23 | 2017-05-31 | 常州纺织服装职业技术学院 | 一种基于姿态相对时空特征统计描述的运动数据检索方法 |
CN106844620A (zh) * | 2017-01-19 | 2017-06-13 | 天津大学 | 一种基于视图的特征匹配三维模型检索方法 |
CN108596186A (zh) * | 2018-03-19 | 2018-09-28 | 西北大学 | 一种三维模型检索方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8396870B2 (en) * | 2009-06-25 | 2013-03-12 | University Of Tennessee Research Foundation | Method and apparatus for predicting object properties and events using similarity-based information retrieval and modeling |
-
2018
- 2018-10-17 CN CN201811208023.6A patent/CN109543054B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294832A (zh) * | 2013-06-27 | 2013-09-11 | 西安工业大学 | 一种基于反馈学习的运动捕获数据检索方法 |
CN106778639A (zh) * | 2016-12-23 | 2017-05-31 | 常州纺织服装职业技术学院 | 一种基于姿态相对时空特征统计描述的运动数据检索方法 |
CN106844620A (zh) * | 2017-01-19 | 2017-06-13 | 天津大学 | 一种基于视图的特征匹配三维模型检索方法 |
CN108596186A (zh) * | 2018-03-19 | 2018-09-28 | 西北大学 | 一种三维模型检索方法 |
Non-Patent Citations (2)
Title |
---|
Cross-View Action Recognition Based on Hierarchical View-Shared Dictionary Learning;Chengkun Zhang;《IEEE》;20180313;全文 * |
基于视图的三维模型检索技术研究;冯毅攀;《信息科技辑》;20120531;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109543054A (zh) | 2019-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hong et al. | Image-based three-dimensional human pose recovery by multiview locality-sensitive sparse retrieval | |
Yang et al. | Content-based 3-D model retrieval: A survey | |
Bustos et al. | Content-based 3D object retrieval | |
CN106844620B (zh) | 一种基于视图的特征匹配三维模型检索方法 | |
CN110069656A (zh) | 一种基于生成对抗网络的二维图片检索三维模型的方法 | |
CN107633065B (zh) | 一种基于手绘草图的识别方法 | |
CN105205135B (zh) | 一种基于主题模型的3d模型检索方法及其检索装置 | |
CN112784782B (zh) | 一种基于多视角双注意网络的三维物体识别方法 | |
Xiao et al. | Motion retrieval using weighted graph matching | |
CN104462365A (zh) | 一种基于概率模型的多视角目标检索方法 | |
Lu et al. | Learning-based bipartite graph matching for view-based 3D model retrieval | |
CN112115291A (zh) | 一种基于深度学习的三维室内模型检索方法 | |
CN111797269A (zh) | 基于多级视图关联卷积网络的多视图三维模型检索方法 | |
Su et al. | 3d-assisted image feature synthesis for novel views of an object | |
CN109543054B (zh) | 一种基于视图的特征降维三维模型检索方法 | |
CN106951501B (zh) | 一种基于多图匹配的三维模型检索方法 | |
CN111597367B (zh) | 基于视图和哈希算法的三维模型检索方法 | |
CN117522990A (zh) | 基于多头注意力机制和迭代细化的类别级位姿估计方法 | |
Li et al. | A non-rigid 3D model retrieval method based on scale-invariant heat kernel signature features | |
Lakhili et al. | Rigid and non-rigid 3D shape classification based on 3D Hahn moments neural networks model | |
Ji et al. | Efficient semi-supervised multiple feature fusion with out-of-sample extension for 3D model retrieval | |
Yang et al. | 3D model retrieval using constructive-learning for cross-model correlation | |
Wu et al. | Active 3-D shape cosegmentation with graph convolutional networks | |
Guan et al. | View-based 3D model retrieval by joint subgraph learning and matching | |
Su et al. | Unsupervised feature learning with graph embedding for view-based 3D model retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |