CN105205135B - 一种基于主题模型的3d模型检索方法及其检索装置 - Google Patents
一种基于主题模型的3d模型检索方法及其检索装置 Download PDFInfo
- Publication number
- CN105205135B CN105205135B CN201510589032.4A CN201510589032A CN105205135B CN 105205135 B CN105205135 B CN 105205135B CN 201510589032 A CN201510589032 A CN 201510589032A CN 105205135 B CN105205135 B CN 105205135B
- Authority
- CN
- China
- Prior art keywords
- model
- theme
- document
- models
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Abstract
本发明公开了一种基于主题模型的3D模型检索方法及其检索装置,所述方法包括以下步骤:将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获取每个3D模型的主题分布向量;选择查询模型,计算查询模型与3D模型库中其余模型之间主题分布向量在欧式空间内的距离;将欧式空间内的距离升序排列,得到最终的检索结果。所述装置包括:第一获取模块、第二获取模块以及第三获取模块,通过该些获取模块,本发明克服了LDA主题模型忽略了空间信息的缺点,提高了检索性能。通过无监督学习利用隐含主题变量更加准确地描述了模型特征之间深层的结构联系。
Description
技术领域
本发明涉及3D模型检索领域,尤其涉及一种基于主题模型的3D模型检索方法及其检索装置。
背景技术
现实世界中的物体存在空间特性,而人眼对于物体的视觉感知也是三维的。三维模型比二维图像能够带来更加具体的感知细节、更加生动的真实感受和更加丰富的视觉效果,现已发展成为了继声音、图像、视频之后的第四种多媒体数据类型。近年来3D模型被广泛应用于社会生产生活中的各个领域,如计算机辅助设计[1]、计算机视觉、生物信息学[2]、医学[3]和娱乐产业[4]。
随着计算机技术和网络的迅速发展,多媒体数据规模日益庞大。目前有数以兆计的3D数据存在,而且每天都有大量的3D模型产生和传播,存在着对3D模型进行检索的迫切需求。之前主要考虑如何构造三维模型,而这样的构造问题无疑需要花费大量的时间和人力成本,所以现在设计3D模型时,考虑更多的问题是如何从现有的海量数据库中寻找合适的、与3D模型相似的模型加以利用以降低开发成本,或者是在此基础上构造所需要的3D模型以提高创建模型的效率[5]。基于这种设计思路的转变,3D模型检索技术应运而生。
目前主要将3D模型检索分为基于文本检索和基于内容检索:基于文本检索技术主要是依靠关键字进行检索,但关键字描述很难全面的使用文字准确表达、耗费人力物力、易受主观因素干扰、因此基于文本的检索方法可靠性和有效性都有其局限性[6]。
基于内容的检索主要利用检索对象本身所携带的信息与库中模型进行所设计特征的相似度比较,方法比较客观,可靠性和有效性较高[7]。基于内容检索方法已被证实在多媒体检索技术中有优越性。根据所利用的模型格式不同,基于内容的检索又可分为基于模型的检索和基于视图的检索[8]。由于二维图像的检索已经蓬勃发展了几十年,已经积累了丰富的技术基础,基于视图的方法可以利用现有的技术进行有效的检索,且已被证实相对于基于模型的检索方法有更好的检测结果[9-10]。大多数基于内容的检索根据3D模型的形状拓扑结构获取特征向量后,只是单纯通过地计算特征向量之间的距离作为相似度比较,而忽略了特征向量间更加深层的含义与联系。本发明通过引入LDA主题模型探索特征向量之间的主题分布,更深入地刻画了特征向量的深层子结构。
发明内容
本发明提供了一种基于主题模型的3D模型检索方法及其检索装置,本发明通过引入LDA主题模型探索特征向量之间的主题分布,更深入地刻画了特征向量的深层子结构,提高了检索性能,详见下文描述:
一种基于主题模型的3D模型检索方法,所述方法包括以下步骤:
将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获取每个3D模型的主题分布向量;
选择查询模型,计算查询模型与3D模型库中其余模型之间主题分布向量在欧式空间内的距离;
将欧式空间内的距离升序排列,得到最终的检索结果。
其中,在将单词内容分布和文档分布分别输入LDA主题模型的步骤之前,所述方法还包括:
在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类,获取词典,根据词典获取每个兴趣点的单词内容分布;
根据SIFT兴趣点所在视图的空间位置不同,划分为文档,生成每个3D模型中兴趣点的文档分布。
其中,所述根据词典获取每个兴趣点的单词内容分布的步骤具体为:在词典中查找距离每个视觉单词最近的聚类中心作为单词内容,获取3D模型中每个兴趣点的单词内容分布。
其中,所述3D特征库具体为:
提取每个3D模型初始视图集的SIFT特征,由SIFT特征组成的特征库。
进一步地,所述将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获取每个3D模型的主题分布向量的步骤具体为:
获取各文档的主题分布参数、各主题的单词内容分布参数,当条件概率最大时,通过吉普斯采样获取各3D模型中每个文档的各主题分布向量;
通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
进一步地,所述各文档的主题分布参数、各主题的单词内容分布参数具体为:
每个文档采样一个主题分布,对文档中的每个单词采样一个主题;为每个单词采样单词内容。
一种基于主题模型的3D模型检索装置,所述装置包括:
第一获取模块,用于将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获取每个3D模型的主题分布向量;
第二获取模块,用于选择查询模型,计算查询模型与3D模型库中其余模型之间主题分布向量在欧式空间内的距离;
第三获取模块,用于将欧式空间内的距离升序排列,得到最终的检索结果。
进一步地,所述装置还包括:
第四获取模块,用于在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类,获取词典,根据词典获取每个兴趣点的单词内容分布;
生成模块,用于根据SIFT兴趣点所在视图的空间位置不同,划分为文档,生成每个3D模型中兴趣点的文档分布。
其中,所述第四获取模块包括:
查找子模块,用于在词典中查找距离每个视觉单词最近的聚类中心作为单词内容;
第一获取子模块,用于获取3D模型中每个兴趣点的单词内容分布。
进一步地,所述第一获取模块包括:
第二获取子模块,用于获取各文档的主题分布参数、各主题的单词内容分布参数,当条件概率最大时,通过吉普斯采样获取各3D模型中每个文档的各主题分布向量;
第三获取子模块,用于通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
本发明提供的技术方案的有益效果是:
1、通过获取3D模型的多视角视图,将3D模型检索问题巧妙地转化为2D图像比较问题,可利用二维图像处理中较成熟的特征提取方法。
2、在3D模型检索领域引入了LDA主题模型,通过无监督学习利用隐含主题变量更加准确地描述了模型特征之间深层的结构联系。
3、创造性地提出了根据模型特征空间位置的不同有选择地划分文档,克服了LDA主题模型忽略了空间信息的缺点,提高了检索性能。
附图说明
图1为一种基于主题模型的3D模型检索方法的流程图;
图2为一种基于主题模型的3D模型检索方法的另一流程图;
图3为采集初始视图时摄像机位置的排列图;
图4为3D模型的彩色视图样例;
图5为3D模型的初始视图样例;
图6为五种算法的查准-查全曲线示意图;
图7为五种算法的其它评测标准比较结果示意图;
图8为一种基于主题模型的3D模型检索装置的结构示意图;
图9为一种基于主题模型的3D模型检索装置的另一结构示意图;
图10为第四获取模块的结构示意图;
图11为第一获取模块的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。
LDA(Latent Dirichlet Allocation)主题模型,也称为三层贝叶斯概率模型,包含词、主题和文档三层结构。它是一种非监督机器学习技术,可以用来识别大规模文档集或语料库中潜藏的主题信息。
3D模型检索领域需要能够全面、自动、准确提取3D模型特征并进行检索的方法。研究表明:LDA主题模型可以识别大规模文档集中潜藏的主题信息,通过在3D模型检索领域引入LDA主题模型可更加准确地描述模型特征之间深层的结构与联系。生成文档分布时又根据模型特征的空间位置信息有选择地划分文档,克服了LDA主题模型忽略了空间信息的缺点,提高了检索性能。
实施例1
一种基于主题模型的3D模型检索方法,参见图1,该3D模型检索方法包括以下步骤:
101:将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获取每个3D模型的主题分布向量;
102:选择查询模型,计算查询模型与3D模型库中其余模型之间主题分布向量在欧式空间内的距离;
103:将欧式空间内的距离升序排列,得到最终的检索结果。
在步骤101将单词内容分布和文档分布分别输入LDA主题模型的步骤之前,该3D模型检索方法还包括以下步骤:
在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类,获取词典,根据词典获取每个兴趣点的单词内容分布;
根据SIFT兴趣点所在视图的空间位置不同,划分为文档,生成每个3D模型中兴趣点的文档分布。
其中,上述步骤中的根据词典获取每个兴趣点的单词内容分布的步骤具体为:
在词典中查找距离每个视觉单词最近的聚类中心作为单词内容,获取3D模型中每个兴趣点的单词内容分布。
进一步地,3D特征库具体为:
提取每个3D模型初始视图集的SIFT特征,由SIFT特征组成的特征库。
进一步地,步骤101中的将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获取每个3D模型的主题分布向量的步骤具体为:
获取各文档的主题分布参数、各主题的单词内容分布参数,当条件概率最大时,通过吉普斯采样获取各3D模型中每个文档的各主题分布向量;
通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
其中,上述步骤中的各文档的主题分布参数、各主题的单词内容分布参数具体为:
每个文档采样一个主题分布,对文档中的每个单词采样一个主题;
为每个单词采样单词内容。
综上所述,本发明实施例通过上述步骤101至步骤103克服了LDA主题模型忽略了空间信息的缺点,提高了检索性能,满足了实际应用中的多种需要。
实施例2
下面结合具体的计算公式、例子、以及图2至图5对实施例1中的方案进行详细的说明,详见下文描述:
201:拍摄Nc个3D模型的多视角彩色视图组成3D模型库,经过提取掩膜等预处理后得到各3D模型的初始视图集,定义为3D视图库;
本发明实施例首先拍摄Nc个3D模型的多视角彩色视图,例如苹果、水杯、围巾、雨伞等。
具体过程如下:将三个Kinect摄像头(此摄像头为本领域所公知,全称为“XBOX360第一代Kinect”,型号为1414)分别置于距离可旋转工作台30厘米,与水平面夹角为0°、45°和90°处拍摄一系列彩色视图,示意图如图3所示。当工作台上的3D模型匀速旋转一圈时,每个摄像头均匀拍摄36张视图,每个物体共得到108张视图,示意图如图4所示。
运用Matlab软件对所获取的108张视图进行预处理,首先提取各视图掩膜,即分离前景物体与背景区域并将背景区域置为黑色。然后对部分缺损图像进行空洞填充、轮廓调整等处理[11]。最后得到各3D模型的初始视图集,如图5所示,定义为3D视图库。
202:在3D视图库中,提取每个3D模型初始视图集的局部特征,不失一般性的,我们采用SIFT特征进而得到初始特征向量集,定义为3D特征库;
SIFT特征,即尺度不变特征变换(Scale-invariant feature transform,SIFT),可在图像中检测出局部兴趣点并得到局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性;并且SIFT特征独特性好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配。
SIFT是局部特征描述子,根据文献[13-14]运用Matlab软件可提取各初始视图中局部兴趣点的SIFT特征,单个兴趣点的SIFT特征为128维,若在某视图中检测到x个SIFT兴趣点,则此视图的SIFT特征为x行128列。此时初始视图集转化为初始特征向量集,定义为3D特征库。
203:对3D特征库中所有兴趣点的SIFT特征进行K-means聚类得到词典,进而根据词典得到每个兴趣点的单词内容分布,定义为3D单词库;
利用Matlab软件自带的K-means函数,输入3D特征库中所有兴趣点的SIFT特征向量以及聚类个数δ(本例中选取δ=500),输出满足方差最小标准的δ个聚类中心。
生成BOW(Bag-of-words)单词内容的主要过程为:将3D特征库中每个兴趣点的SIFT特征向量作为视觉单词,δ个聚类中心作为词典,在词典中查找距离每个视觉单词最近的聚类中心作为它的单词内容,即可得到每个3D模型中兴趣点的单词内容分布,定义为3D单词库,作为步骤205中LDA主题模型的输入之一。
204:在3D单词库中,根据每个SIFT兴趣点所在视图的空间位置不同,将属于同一3D模型的SIFT兴趣点划分为w个文档,分别生成每个3D模型中所有兴趣点的文档分布;
在步骤201中采集3D模型的多视角彩色视图时,初始视图分别来自于与水平面夹角为0°、45°和90°的三个Kinect摄像机。由于空间位置相近的视图在形状纹理上存在较大的相似性,若划分在同一文档中有更大的可能性被分配到相同的主题。所以根据SIFT兴趣点所在视图的空间位置不同,将每个3D模型的SIFT兴趣点划分为t个文档(本例中t=3,即从0°采集的视图中的兴趣点属于文档1,从45°采集的视图中的兴趣点属于文档2,从90°采集的视图中的兴趣点属于文档3),生成每个3D模型中所有兴趣点的文档分布,作为下一步中LDA主题模型的输入之一。
205:将步骤203得到的单词内容分布和步骤204得到的文档分布分别输入LDA主题模型,并指定生成的主题个数K,得到每个3D模型对于K个主题的分布向量;
一篇文档的每个词都是通过“文档以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布,而多项式分布的参数符合狄利克雷分布。可以通过吉普斯采样的方法识别大规模文档集或语料库中潜藏的主题信息[13]。
步骤205的详细的生成过程如下:
本例中将每个SIFT兴趣点视为一个单词,空间位置相似的SIFT兴趣点集存在于同一个文档。数据库中共有Nc个3D模型,每个3D模型中的所有SIFT兴趣点被划分成t个文档,故整个语料库中共有tNc个文档。假设文档i中有N个单词,文档i的第j个单词的内容在本例中为SIFT兴趣点经过BOW模型后的单词内容,表示为wij。理论上每个文档i中的每个单词j都会被分配一个隐含的主题zij,共有K个隐含主题。α和β是狄利克雷超参数,θi、和zij是学习过程中的中间参数,生成过程分为四步:
1)首先给每个文档采样一个主题分布,然后给文档中的每个单词采样一个特定的主题;
对于文档i,其主题分布的参数θi服从超参数为α的狄利克雷分布θi~Dir(α),如式(1)所示:
其中p(θi|α)表示给定狄利克雷超参数α时,第i个文档的主题分布参数θi的条件概
率分布,αk表示第k个狄利克雷超参数,K表示主题个数,θk表示主题为k的主题分布参数,并
且函数
对于文档i中的单词j,它的主题标签zij采样于K个主题的多项式分布zij~Discrete(θi)。即给定主题多项式分布的参数θi时,文档i中的单词j被分配到主题k的条件概率为p(zij=k|θi)。
2)为每个单词选定主题后,接下来为它采样单词内容;
对于每个主题k,单词内容分布的参数服从超参数为β的狄利克雷分布如下式所示:
其中表示给定狄利克雷超参数β时,第k个主题的单词内容分布参数的条件概率分布,βm表示第m个狄利克雷超参数,N表示文档i中的单词个数,表示单词内容为m的单词内容分布参数。
对于文档i中的单词j,它的单词内容wij服从参数为的多项式分布,即当确定单词的主题k以及该主题下单词内容的多项式分布参数时,文档i中的单词j被分配到内容m的条件概率为
3)若已知参数α、β以及各文档中单词的内容wij,则当条件概率p(wij|α,β)取得最大值时可以得到各文档的主题分布参数θ*和各主题的单词内容分布参数
其中,
其中p(wij|α,β)表示给定超参数α和β时,第i个文档中第j个单词的单词内容wij的条件概率分布,p(θi|α)表示给定狄利克雷超参数α时主题分布参数θi的条件概率分布,p(zij|θi)表示给定主题多项式分布的参数θi时,文档i中的单词j主题zij的条件概率分布,表示给定狄利克雷超参数β和主题zij时,单词内容分布参数的条件概率分布,确定单词的主题zij以及该主题下单词内容的多项式分布参数时,文档i中的单词j的单词内容wij的条件概率分布。已知3D模型中各文档的单词内容wij时,上式可以利用吉普斯采样经过一系列迭代收敛时得到θ*和值,采样的详细描述和具体推导可见参考文献[15-17]。
通过吉普斯采样得到了各3D模型中每个文档的K主题分布向量后,从3D模型库中随机选择一3D模型作为查询目标Q,再选取任一3D模型作为比较目标M,检索任务为从3D模型库中找到与Q相似的模型。
4)模型Q由t个文档组成,将t个文档的主题分布向量求平均值得到Q的主题分布,如下式所示:
其中,θQ表示模型Q的主题分布向量,θQi表示模型Q的第i个文档的主题分布向量,t表示Q中的文档数目。
同理可得模型M的主题分布向量:
其中,θM表示模型M的主题分布向量,θMi表示模型M的第i个文档的主题分布向量,t表示M中的文档数目。
206:计算Q和M的主题分布向量在欧式空间内的距离DQM;
其中,θQ和θM分别表示3D模型Q和M的主题分布向量。
207:选取3D模型库中的下一个比较模型M,重复上述步骤203至步骤206,直至遍历模型库中的所有模型;
208:将Q与3D模型库中所有模型的欧式距离升序排列,得到最终的检索结果。
综上所述,本发明实施例通过上述步骤201至步骤208克服了LDA主题模型忽略了空间信息的缺点,提高了检索性能,满足了实际应用中的多种需要。
实施例3
下面结合具体的实例、图6和图7,对实施例1和2中的方案进行实验验证,详见下文描述:
一、数据库:
本实验使用实施例1和2中构建的数据库进行实验,共包含分属于61类的505个真实3D模型。当模型转动一周时,三个Kinect摄像机分别置于距可旋转工作台30厘米,与水平面夹角为0°、45°和90°处均匀拍摄36张彩色视图,故每个3D模型共有108张视图,每张图片的分辨率为640*480。
二、对比实验:
最近邻算法NN(Nearest Neighbor)[18]通过计算不同物体的视图特征在欧式空间内的距离,按照距离大小进行排序进而得到物体间的相似度完成3D模型检索。
豪斯多夫距离算法HAUS(Hausdorff)[19]在提供3D模型物体的一系列二维视图并提取特征的情况下,根据不同物体在欧式空间内最近点的最大距离计算两个物体的相似度,根据豪斯多夫距离的大小判断它们是否属于同类物体。
Gao Y等人提出的WBGM(Weighted Bipartite Graph Matching)[20]采用多视角2D视图来表示3D模型,对每个2D视图提取Zernike矩来进行视觉特征描述,从而构建3D模型数据库的特征表示。其次,研究了三维模型的代表性视图提取方法,采用层次化聚类方法对视图集进行聚类,并提取代表性视图来区分不同3D模型。再次,重点研究和实现了最大权二分图匹配,利用选取的代表性视图和更新后的权重构建二分图,再根据Kuhn-Munkres算法寻找最佳匹配,并依据相似度值的大小排序,完成三维模型相似度的比较。
Gao Y等人提出的CCFV(Camera Constraint-Free View-Based 3-D ObjectRetrieval)[21]算法认为具有相似形状的三维模型的视图应具有相似的特征分布,他们提出利用高斯分布拟合相似物体视图集的匹配概率关系,结合正负匹配的思想通过比较两个三维模型的概率匹配程度进而判断它们是否属于同类物体。
三、常用评价标准:
PR曲线(PR,Precision Recall Curve)——又称查全查准曲线,是检测系统性能的常用评价标准。查全率和查准率是信息检索中的标准评价方法,现已被广泛用于图像检索中。评价一个检索系统的好坏,可以看曲线与坐标轴围成的图形的面积,面积越大,检索能力越强大。
最近邻(NN,Nearest Neighbor)——表示第一列检索结果的正确率。
一级查全率(FT,First Tier)——定义为前Γ个结果的查全率,Γ是数据库中与查询物体同类的物体总数。
二级查全率(ST,Second Tier)——定义为前2Γ个结果的查全率,Γ是数据库中与查询物体同类的物体总数。
F值(F,F Measure)——查准率和查全率的综合衡量。本实验中,F值根据前20个检索结果的查准率和查全率计算得到。
折扣累积增益(DCG,Discounted Cumulative Gain)——考虑到用户使用排序靠后元素的可能性小,它是使得所有相关视图中前侧权重大于后侧的统计数值。
归一化平均修正检索排序(ANMRR,Average Normalized Modified RetrievalRank)——另一种客观评价检索性能的衡量标准,ANMRR值低表示前列搜索结果的精度高。
四、实验结果
同一数据库中五种算法的查准-查全曲线比较结果如图6所示,其它评测标准比较结果如图7所示。查准-查全曲线与横纵坐标所围面积越大,代表检索性能越优良。其它评测标准除ANMRR值以外,数值越大检索效果越优异。
由图6和图7所示,本方法的检索性能均高于NN、HAUS、WBGM、CCFV四种算法。这是由于LDA模型根据3D模型的局部特征观测值构造了隐含的主题变量,用以表示观测值之间深层的内容含义与结构联系。再加上考虑了视图的空间结构,将同一模型空间相邻的部分视图分在同一个文档,使同一文档内的单词更大概率地属于相同主题,克服了LDA主题模型忽略了空间信息的缺点,提高了检索性能。
实施例4
一种基于主题模型的3D模型检索装置,参见图8,该3D模型检索装置包括:
第一获取模块,用于将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获取每个3D模型的主题分布向量;
第二获取模块,用于选择查询模型,计算查询模型与3D模型库中其余模型之间主题分布向量在欧式空间内的距离;
第三获取模块,用于将欧式空间内的距离升序排列,得到最终的检索结果。
进一步地,参见图9,该3D模型检索装置还包括:
第四获取模块,用于在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类,获取词典,根据词典获取每个兴趣点的单词内容分布;
生成模块,用于根据SIFT兴趣点所在视图的空间位置不同,划分为文档,生成每个3D模型中兴趣点的文档分布。
其中,参见图10,第四获取模块包括:
查找子模块,用于在词典中查找距离每个视觉单词最近的聚类中心作为单词内容;
第一获取子模块,用于获取3D模型中每个兴趣点的单词内容分布。
进一步地,参见图11,第一获取模块包括:
第二获取子模块,用于获取各文档的主题分布参数、各主题的单词内容分布参数,当条件概率最大时,通过吉普斯采样获取各3D模型中每个文档的各主题分布向量;
第三获取子模块,用于通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
具体实现时,本发明实施例对上述模块、子模块的执行主体不做限制,可以为单片机、PC机等能实现上述功能的器件。
综上所述,本发明实施例通过上述模块、子模块克服了LDA主题模型忽略了空间信息的缺点,提高了检索性能,满足了实际应用中的多种需要。
本发明实施例对各器件的型号除做特殊说明的以外,其他器件的型号不做限制,只要能完成上述功能的器件均可。
参考文献:
[1]Regli W.C,Cicirello V.A.Managing Digital Libraries for Computer-Aided Design[J].Computer-Aided Design,2000,32:119–132.DOI:info:doi/10.1016/S0010-4485(99)00095-0.
[2]Yeh J S,Chen D Y,Chen B Y,et al.A web-based three-dimensionalprotein retrieval system by matching visual similarity[J].Bioinformatics,2005,21(13):3056-3057(2).
[3]Guetat G,Maitre M,Joly L,et al.Automatic 3-D grayscale volumematching and shape analysis[J].Information Technology in Biomedicine IEEETransactions on,2006,10(2):362-376.
[4]Wong H S,Ma B,Yu Z,et al.3-D Head Model Retrieval Using a SingleFace View Query[J].Multimedia IEEE Transactions on,2007,9(5):1026-1036.
[5]唐祺.基于概率密度和轮廓线的三维模型检索研究[D].上海交通大学,2013.
[6]张开兴,张树生,刘贤喜.三维CAD模型检索技术研究现状与发展分析[J].农业机械学报,2013,44(7):256-263.DOI:10.6041/j.issn.1000-1298.2013.07.044.
[7]杨育彬,林珲,朱庆.基于内容的三维模型检索综述[J].计算机学报,2004,27(10):1297-1310.DOI:10.3321/j.issn:0254-4164.2004.10.001.
[8]Bimbo A D,Pala P.Content-Based Retrieval of 3D Models[C]//ACMTrans.Multimedia Computing Comm.Applications.2006.
[9]Bustos B,Keim D A,Saupe D,et al.Feature-based similarity search in3D object databases[J].Acm Computing Surveys,2005,37(4):2005.
[10]Tangelder J W H,Veltkamp R C.A Survey of Content Based 3D ShapeRetrieval Methods[C]//Shape Modeling and Applications,InternationalConference on.IEEE Computer Society,2004:145-156.
[11]贾永红.数字图像处理[M]//武汉大学出版社,2003.
[12]Lowe D G.Object recognition from local scale-invariant features[C]//Computer vision,1999.The proceedings of the seventh IEEE internationalconference on.Ieee,1999,2:1150-1157.
[13]Lowe D G.Distinctive image features from scale-invariantkeypoints[J].International journal of computer vision,2004,60(2):91-110.
[14]Leng B,Zeng J,Yao M,et al.3D Object Retrieval With MultitopicModel Combining Relevance Feedback and LDA Model[J].Image Processing,IEEETransactions on,2015,24(1):94-105.
[15]T.Griffiths and M.Steyvers.Finding scientific topics.In Proc.ofthe National Academy of Sciences,2004.
[16]T.Griffiths,“Gibbs sampling in the generative model of latentdirichlet allocation,”Standford University,vol.518,no.11,pp.1–3,2002.
[17]M.Steyvers,P.Smyth,M.Rosen-Zvi,and T.Griffiths,“Probabilistic
author-topic models for information discovery,”in Proceedings of thetenth ACM SIGKDD International Conference on Knowledge Discovery and DataMining,Seattle,WA,USA,September 2004,pp.306–315.
[18]Cover T,Hart P.Nearest neighbor pattern classification[J].IEEETransactions on Information Theory,1967,13(1):21-27.
[19]Aspert N,Santa-Cruz D,Ebrahimi T.MESH:Measuring Errors betweenSurfaces using the Hausdorff distance[J].IEEE International Conference onMultimedia&Expo,2002,i-ii:705--708.
[20]Gao Y,Dai Q,Wang M,et al.3D model retrieval using weightedbipartite graph matching[J].Signal Processing Image Communication,2011,26(1):39-47.
[21]Gao Y.Camera constraint-free view-based 3-D object retrieval.[J].IEEE Transactions on Image Processing,2012,21(4):2269-2281.
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于主题模型的3D模型检索方法,其特征在于,所述方法包括以下步骤:
将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获取每个3D模型的主题分布向量;
选择查询模型,计算查询模型与3D模型库中其余模型之间主题分布向量在欧式空间内的距离;
将欧式空间内的距离升序排列,得到最终的检索结果;
其中,所述选择查询模型具体为:
从3D模型库中随机选择一3D模型作为查询目标Q,再选取任一3D模型作为比较目标M,检索任务为从3D模型库中找到与Q相似的模型;
模型Q由t个文档组成,将t个文档的主题分布向量求平均值得到Q的主题分布:
其中,θQ表示模型Q的主题分布向量,θQi表示模型Q的第i个文档的主题分布向量,t表示Q中的文档数目;
同理可得模型M的主题分布向量:
其中,θM表示模型M的主题分布向量,θMi表示模型M的第i个文档的主题分布向量,t表示M中的文档数目。
2.根据权利要求1所述的一种基于主题模型的3D模型检索方法,其特征在于,在将单词内容分布和文档分布分别输入LDA主题模型的步骤之前,所述方法还包括:
在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类,获取词典,根据词典获取每个兴趣点的单词内容分布;
根据SIFT兴趣点所在视图的空间位置不同,划分为文档,生成每个3D模型中兴趣点的文档分布。
3.根据权利要求2所述的一种基于主题模型的3D模型检索方法,其特征在于,所述根据词典获取每个兴趣点的单词内容分布的步骤具体为:
在词典中查找距离每个视觉单词最近的聚类中心作为单词内容,获取3D模型中每个兴趣点的单词内容分布。
4.根据权利要求2或3所述的一种基于主题模型的3D模型检索方法,其特征在于,所述3D特征库具体为:
提取每个3D模型初始视图集的SIFT特征,由SIFT特征组成的特征库。
5.根据权利要求1至3中任一权利要求所述的一种基于主题模型的3D模型检索方法,其特征在于,所述将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获取每个3D模型的主题分布向量的步骤具体为:
获取各文档的主题分布参数、各主题的单词内容分布参数,当条件概率最大时,通过吉普斯采样获取各3D模型中每个文档的各主题分布向量;
通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
6.根据权利要求5所述的一种基于主题模型的3D模型检索方法,其特征在于,所述各文档的主题分布参数、各主题的单词内容分布参数具体为:
每个文档采样一个主题分布,对文档中的每个单词采样一个主题;
为每个单词采样单词内容。
7.一种基于主题模型的3D模型检索装置,其特征在于,所述装置包括:
第一获取模块,用于将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获取每个3D模型的主题分布向量;
第二获取模块,用于选择查询模型,计算查询模型与3D模型库中其余模型之间主题分布向量在欧式空间内的距离;
第三获取模块,用于将欧式空间内的距离升序排列,得到最终的检索结果;
其中,所述选择查询模型具体为:
从3D模型库中随机选择一3D模型作为查询目标Q,再选取任一3D模型作为比较目标M,检索任务为从3D模型库中找到与Q相似的模型;
模型Q由t个文档组成,将t个文档的主题分布向量求平均值得到Q的主题分布:
其中,θQ表示模型Q的主题分布向量,θQi表示模型Q的第i个文档的主题分布向量,t表示Q中的文档数目;
同理可得模型M的主题分布向量:
其中,θM表示模型M的主题分布向量,θMi表示模型M的第i个文档的主题分布向量,t表示M中的文档数目。
8.根据权利要求7所述的一种基于主题模型的3D模型检索装置,其特征在于,所述装置还包括:
第四获取模块,用于在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类,获取词典,根据词典获取每个兴趣点的单词内容分布;
生成模块,用于根据SIFT兴趣点所在视图的空间位置不同,划分为文档,生成每个3D模型中兴趣点的文档分布。
9.根据权利要求8所述的一种基于主题模型的3D模型检索装置,其特征在于,所述第四获取模块包括:
查找子模块,用于在词典中查找距离每个视觉单词最近的聚类中心作为单词内容;
第一获取子模块,用于获取3D模型中每个兴趣点的单词内容分布。
10.根据权利要求7所述的一种基于主题模型的3D模型检索装置,其特征在于,所述第一获取模块包括:
第二获取子模块,用于获取各文档的主题分布参数、各主题的单词内容分布参数,当条件概率最大时,通过吉普斯采样获取各3D模型中每个文档的各主题分布向量;
第三获取子模块,用于通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510589032.4A CN105205135B (zh) | 2015-09-15 | 2015-09-15 | 一种基于主题模型的3d模型检索方法及其检索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510589032.4A CN105205135B (zh) | 2015-09-15 | 2015-09-15 | 一种基于主题模型的3d模型检索方法及其检索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105205135A CN105205135A (zh) | 2015-12-30 |
CN105205135B true CN105205135B (zh) | 2018-10-19 |
Family
ID=54952818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510589032.4A Active CN105205135B (zh) | 2015-09-15 | 2015-09-15 | 一种基于主题模型的3d模型检索方法及其检索装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105205135B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294933A (zh) * | 2016-07-27 | 2017-01-04 | 北京小米移动软件有限公司 | 3d打印的方法、装置、终端及服务器 |
CN106503044B (zh) * | 2016-09-21 | 2020-02-28 | 北京小米移动软件有限公司 | 兴趣特征分布获取方法及装置 |
CN107402958B (zh) * | 2017-06-12 | 2020-09-15 | 重庆市勘测院 | 一种gkf三维空间数据库的创建和访问方法 |
CN108170823B (zh) * | 2018-01-04 | 2021-10-15 | 江西师范大学 | 一种基于高层语义属性理解的手绘交互式三维模型检索方法 |
CN109918476A (zh) * | 2019-01-26 | 2019-06-21 | 北京工业大学 | 一种基于主题模型的主题检索方法 |
CN110209814B (zh) * | 2019-05-23 | 2021-02-02 | 西安交通大学 | 一种利用领域建模从百科知识网站抽取知识主题的方法 |
CN111008210B (zh) * | 2019-11-18 | 2023-08-11 | 浙江大华技术股份有限公司 | 商品识别方法、装置、编解码器及存储装置 |
CN113240012B (zh) * | 2021-05-14 | 2022-08-23 | 天津大学 | 一种基于二维图像的无监督多视角三维目标检索方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101299218A (zh) * | 2008-06-26 | 2008-11-05 | 覃征 | 三维模型的检索方法和装置 |
CN102073713A (zh) * | 2010-12-31 | 2011-05-25 | 北京理工大学 | 一种基于优化BoW模型的三维模型检索方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101350016B (zh) * | 2007-07-20 | 2010-11-24 | 富士通株式会社 | 三维模型检索装置及方法 |
-
2015
- 2015-09-15 CN CN201510589032.4A patent/CN105205135B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101299218A (zh) * | 2008-06-26 | 2008-11-05 | 覃征 | 三维模型的检索方法和装置 |
CN102073713A (zh) * | 2010-12-31 | 2011-05-25 | 北京理工大学 | 一种基于优化BoW模型的三维模型检索方法 |
Non-Patent Citations (1)
Title |
---|
3D Object Retrieval With Multitopic Model Combining Relevance Feedback and LDA Model;Biao Leng等;《IEEE TRANSACTIONS ON IMAGE PROCESSING》;20150131;第24卷(第1期);第96-97页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105205135A (zh) | 2015-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105205135B (zh) | 一种基于主题模型的3d模型检索方法及其检索装置 | |
Assfalg et al. | Content-based retrieval of 3-D objects using spin image signatures | |
Yang et al. | Content-based 3-D model retrieval: A survey | |
Lian et al. | Rectilinearity of 3D meshes | |
CN101477529B (zh) | 一种三维对象的检索方法和装置 | |
CN106844620B (zh) | 一种基于视图的特征匹配三维模型检索方法 | |
Lu et al. | Learning view-model joint relevance for 3D object retrieval | |
CN110019914A (zh) | 一种支持三维场景交互的三维模型数据库检索方法 | |
CN110992217B (zh) | 一种外观设计专利多视图特征表示、检索的方法及装置 | |
CN111078916A (zh) | 一种基于多层次特征对齐网络的跨域三维模型检索方法 | |
Lu et al. | Learning-based bipartite graph matching for view-based 3D model retrieval | |
CN111354076A (zh) | 一种基于嵌入空间的单幅图像三维零件组合式建模方法 | |
CN111597367B (zh) | 基于视图和哈希算法的三维模型检索方法 | |
CN105868324B (zh) | 一种基于隐含状态模型的多视角目标检索方法 | |
Gao et al. | Efficient view-based 3-D object retrieval via hypergraph learning | |
Zeng et al. | 3-D object retrieval using topic model | |
Wu et al. | Mvpn: Multi-view prototype network for 3d shape recognition | |
Li et al. | 3D object retrieval based on multi-view convolutional neural networks | |
CN116089639A (zh) | 一种辅助三维建模方法、系统、装置和介质 | |
Su et al. | Semantically guided projection for zero-shot 3D model classification and retrieval | |
Tan et al. | Local features and manifold ranking coupled method for sketch-based 3D model retrieval | |
Xiao et al. | Fast view-based 3D model retrieval via unsupervised multiple feature fusion and online projection learning | |
CN110163091B (zh) | 基于lstm网络多模态信息融合的三维模型检索方法 | |
CN106845543B (zh) | 一种基于特征匹配的三维模型分类方法 | |
CN109272013B (zh) | 基于学习的相似性度量方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |