CN110059205A - 一种基于多视图的三维模型分类检索方法 - Google Patents
一种基于多视图的三维模型分类检索方法 Download PDFInfo
- Publication number
- CN110059205A CN110059205A CN201910213225.8A CN201910213225A CN110059205A CN 110059205 A CN110059205 A CN 110059205A CN 201910213225 A CN201910213225 A CN 201910213225A CN 110059205 A CN110059205 A CN 110059205A
- Authority
- CN
- China
- Prior art keywords
- threedimensional model
- view
- feature
- render view
- render
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于多视图的三维模型分类检索方法。本发明具体实现如下:1、将三维模型数据进行预处理;2、获取三维模型的多角度渲染视图,在12个不同的视点处对三维模型进行投影得到其相应角度的渲染视图;3、提取三维模型渲染视图的特征,将每一个渲染视图分解成多个同心正方形,通过在两个连续同心正方形之间的图像灰度差异来获得渲染视图的特征;4、利用SVM分类器对三维模型进行分类检索。本发明方法通过一系列的预处理后,渲染得到三维模型不同角度下的视图,然后利用改进过的多分类SVM分类器实现了针对三维模型的分类检索任务,具有一定的鲁棒性,取得了较为高效、可靠的优越性能。
Description
技术领域
本发明涉及计算机图形学、机器学习领域,具体涉及一种基于多视图的三维模型分类检索方法。
背景技术
近些年来,计算机技术飞速发展,三维建模技术日趋成熟。伴随着这股热潮,三维模型渐渐的发展成为继声音、图像和视频之后的第四代多媒体数据类型。目前,网络上的三维模型以指数的方式爆炸性增长,同时在许多方面都获得了普遍的应用,如科研、工业和医学等领域。其在我们的生活中也随处可见,如在虚拟环境、计算机辅助设计、3D游戏、影视动画、分子生物学、地理信息系统等领域均发挥着重要的作用,甚至一些购物网站也推出了3D试衣间。
随着三维模型在越来越多的领域扮演着越来越重要的角色,越来越成为我们生活中不可或缺的一部分,开展三维模型分类检索技术的研究具有重要的理论意义和广泛的实用价值。相比于二维视图,三维模型更符合人类的视觉感知和思维模式规律。对三维模型的分类检索已然成为计算机视觉领域中一个新兴起的研究热点。因此,如何能够快速而高效的从网络上大量的三维模型数据资源中分类检索到所需要的三维模型,已经成为当前信息检索领域中急需解决的问题。
发明内容
本发明提出了一种基于多视图的三维模型分类检索方法,该方法可以有效地实现对于三维模型的分类检索工作。
本发明提出了一种基于多视图的三维模型分类检索方法,其特征在于,包括以下步骤:
步骤1、对三维模型数据进行预处理。为了保证提取的形状特征在三维模型发生平移、旋转、缩放等情况下保持稳定性,在特征提取之前需要对三维模型数据进行坐标系归一化预处理;为了提高分类检索的准确性,在特征提取之前需要对三维模型数据进行各向同性预处理,使得三维模型的某个特征在各个方向上大小一致。
步骤2、获取三维模型的多角度渲染视图。将三维模型的质心移动到坐标系原点处,在同一水平面上每间隔30°、仰角15°对三维模型进行投影,得到12张不同视点的三维模型渲染视图,用来表征三维模型。
步骤3、提取三维模型渲染视图的特征。将每一个渲染视图分解成多个同心正方形,通过在两个连续同心正方形之间的图像灰度差异来获得渲染视图的特征,进而得到三维模型的特征表示。
步骤4、利用SVM分类器对三维模型进行分类检索。将提取的三维模型特征通过合适的核函数映射到高维空间,使得不同类别的特征线性可分,最后利用改进过的多分类SVM分类器对未知三维模型进行分类检索,从而实现了对三维模型的分类检索工作。
本发明有益效果如下:
本方法的一个最大好处是避免了训练神经网络所需要的巨大样本量及高额的时间成本,只需要较少的训练样本即可以实现对三维模型的分类检索。本方法的一个特点是在不同的视点处对三维模型进行投影,用得到的多张渲染视图来表征三维模型,同时引入核函数解决了原本数据集线性不可分的问题,进一步提高了分类结果的准确性。
具体实施方式
本发明提出了一种基于多视图的三维模型分类检索方法,有效地实现了对三维模型进行分类检索的工作,下面结合相关步骤进行详细说明:
步骤1、对三维模型数据进行预处理。为了保证提取的形状特征在三维模型发生平移、旋转、缩放等情况下保持稳定性,在特征提取之前需要对三维模型数据进行坐标系归一化预处理,本发明中使用0均值归一化方法;为了提高分类检索的准确性,在特征提取之前需要对三维模型数据进行各向同性预处理,使得三维模型的某个特征在各个方向上大小一致。
步骤2、获取三维模型的多角度渲染视图。将三维模型的质心移动到坐标系原点处,在同一水平面上每间隔30°、仰角15°对三维模型进行投影,得到12张不同视点的三维模型渲染视图,用来表征三维模型。
步骤3、提取三维模型渲染视图的特征。将每一个渲染视图分解成多个同心正方形,通过在两个连续同心正方形之间的图像灰度差异来获得渲染视图的特征。具体来说,首先将每一张渲染视图在中心点周围分解成L个同心正方形,定义渲染视图中某点的像素值为fk(x,y)(k=1,2,…,12),位于每张渲染视图第j个同心正方形区域Cj中的所有像素值的和为gk(j),其中
Cj={|X-L|<j,|y-L|<j},j=1,2,…,L
然后求出两个连续的同心正方形中像素值的差别dk(j),并将其标准化为vk(j),表示为
dk(j)=gk(j)-gk(j-1),j=2,3,…,L
其中,定义dk(1)=gk(1);最后将每张渲染视图的特征描述定义为vk,三维模型的特征描述定义为v,可表示为
vk=[vk(1),vk(2),…,vk(L),h(k)]T
其中h(k)=∑sgn(fk(x,y)≠fb)(k=1,2,…,12)为每张渲染视图中非背景像素点的个数,fb为背景像素值。
步骤4利用SVM分类器对三维模型进行分类检索。将提取的三维模型特征通过选定的核函数映射到高维空间,使得不同类别的特征线性可分,最后利用多分类SVM分类器对未知三维模型进行分类检索,从而实现了对三维模型的分类检索工作。
Claims (1)
1.一种基于多视图的三维模型分类检索方法,其特征在于包括如下步骤:
步骤1、对三维模型数据进行预处理;
使用0均值归一化方法在特征提取之前需要对三维模型数据进行坐标系归一化预处理,对三维模型数据进行各向同性预处理,使得三维模型的某个特征在各个方向上大小一致;
步骤2、获取三维模型的多角度渲染视图;将三维模型的质心移动到坐标系原点处,在同一水平面上每间隔30°、仰角15°对三维模型进行投影,得到12张不同视点的三维模型渲染视图,用来表征三维模型;
步骤3、提取三维模型渲染视图的特征;将每一个渲染视图分解成多个同心正方形,通过在两个连续同心正方形之间的图像灰度差异来获得渲染视图的特征;具体来说,首先将每一张渲染视图在中心点周围分解成L个同心正方形,定义渲染视图中某点的像素值为fk(x,y)(k=1,2,…,12),位于每张渲染视图第j个同心正方形区域Cj中的所有像素值的和为gk(j),其中
Cj={|x-L|<j,|y-L|<j},j=1,2,…,L
然后求出两个连续的同心正方形中像素值的差别dk(j),并将其标准化为vk(j),表示为
dk(j)=gk(j)-gk(j-1),j=2,3,…,L
其中,定义dk(1)=gk(1);最后将每张渲染视图的特征描述定义为vk,三维模型的特征描述定义为v,可表示为
vk=[vk(1),vk(2),…,vk(L),h(k)]T
其中h(k)=∑sgn(fk(x,y)≠fb)(k=1,2,…,12)为每张渲染视图中非背景像素点的个数,fb为背景像素值;
步骤4 利用SVM分类器对三维模型进行分类检索;将提取的三维模型特征通过选定的核函数映射到高维空间,使得不同类别的特征线性可分,最后利用多分类SVM分类器对未知三维模型进行分类检索,从而实现了对三维模型的分类检索工作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910213225.8A CN110059205A (zh) | 2019-03-20 | 2019-03-20 | 一种基于多视图的三维模型分类检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910213225.8A CN110059205A (zh) | 2019-03-20 | 2019-03-20 | 一种基于多视图的三维模型分类检索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110059205A true CN110059205A (zh) | 2019-07-26 |
Family
ID=67316216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910213225.8A Pending CN110059205A (zh) | 2019-03-20 | 2019-03-20 | 一种基于多视图的三维模型分类检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110059205A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110674333A (zh) * | 2019-08-02 | 2020-01-10 | 杭州电子科技大学 | 基于多视图增强深度哈希的大规模图像高速检索方法 |
CN111382300A (zh) * | 2020-02-11 | 2020-07-07 | 山东师范大学 | 基于组对深度特征学习的多视图三维模型检索方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622609A (zh) * | 2012-03-01 | 2012-08-01 | 西北工业大学 | 一种基于支持向量机的三维模型自动分类方法 |
CN106021330A (zh) * | 2016-05-06 | 2016-10-12 | 浙江工业大学 | 一种用于混合轮廓线视图下的三维模型检索方法 |
CN109213884A (zh) * | 2018-11-26 | 2019-01-15 | 北方民族大学 | 一种基于草图检索三维模型的跨模态检索方法 |
-
2019
- 2019-03-20 CN CN201910213225.8A patent/CN110059205A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622609A (zh) * | 2012-03-01 | 2012-08-01 | 西北工业大学 | 一种基于支持向量机的三维模型自动分类方法 |
CN106021330A (zh) * | 2016-05-06 | 2016-10-12 | 浙江工业大学 | 一种用于混合轮廓线视图下的三维模型检索方法 |
CN109213884A (zh) * | 2018-11-26 | 2019-01-15 | 北方民族大学 | 一种基于草图检索三维模型的跨模态检索方法 |
Non-Patent Citations (3)
Title |
---|
JAU-LING SHIH等: ""A new 3D model retrieval approach based on the elevation descriptor"", 《PATTERN RECOGNITION》 * |
刘晓静: ""一种改进的三维模型特征提取算法"", 《青海大学学报(自然科学版)》 * |
刘晓静: ""基于内容的三维模型检索方法研究及实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110674333A (zh) * | 2019-08-02 | 2020-01-10 | 杭州电子科技大学 | 基于多视图增强深度哈希的大规模图像高速检索方法 |
CN110674333B (zh) * | 2019-08-02 | 2022-04-01 | 杭州电子科技大学 | 基于多视图增强深度哈希的大规模图像高速检索方法 |
CN111382300A (zh) * | 2020-02-11 | 2020-07-07 | 山东师范大学 | 基于组对深度特征学习的多视图三维模型检索方法及系统 |
CN111382300B (zh) * | 2020-02-11 | 2023-06-06 | 山东师范大学 | 基于组对深度特征学习的多视图三维模型检索方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cong et al. | Global-and-local collaborative learning for co-salient object detection | |
Torii et al. | Visual place recognition with repetitive structures | |
Liu et al. | Image retrieval based on multi-texton histogram | |
CN205721777U (zh) | 视觉搜索设备和系统 | |
Nedović et al. | Stages as models of scene geometry | |
CN111563502A (zh) | 图像的文本识别方法、装置、电子设备及计算机存储介质 | |
CN110110578B (zh) | 一种室内场景语义标注方法 | |
CN107808129A (zh) | 一种基于单个卷积神经网络的面部多特征点定位方法 | |
Zhi et al. | Two-stage pooling of deep convolutional features for image retrieval | |
CN105868706A (zh) | 一种基于稀疏自编码的三维模型识别方法 | |
CN111667005B (zh) | 一种采用rgbd视觉传感的人体交互系统 | |
CN110019914A (zh) | 一种支持三维场景交互的三维模型数据库检索方法 | |
CN110517270B (zh) | 一种基于超像素深度网络的室内场景语义分割方法 | |
Walia et al. | An effective and fast hybrid framework for color image retrieval | |
CN110751097A (zh) | 一种半监督的三维点云手势关键点检测方法 | |
CN110059205A (zh) | 一种基于多视图的三维模型分类检索方法 | |
Sun et al. | Quadratic terms based point-to-surface 3D representation for deep learning of point cloud | |
CN107358189A (zh) | 一种基于多视目标提取的室内环境下物体检测方法 | |
Mei et al. | Large-field contextual feature learning for glass detection | |
CN108875828A (zh) | 一种相似图像的快速匹配方法和系统 | |
Liu | A survey of recent view-based 3d model retrieval methods | |
Yu et al. | A novel multi-feature representation of images for heterogeneous IoTs | |
CN107992532A (zh) | 基于渲染图像角度结构特征的三维模型检索方法 | |
CN116935008A (zh) | 一种基于混合现实的展示交互方法和装置 | |
Janik et al. | Zero in on shape: A generic 2d-3d instance similarity metric learned from synthetic data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190726 |
|
RJ01 | Rejection of invention patent application after publication |