CN110059205A

CN110059205A - 一种基于多视图的三维模型分类检索方法

Info

Publication number: CN110059205A
Application number: CN201910213225.8A
Authority: CN
Inventors: 颜成钢; 温洪发; 孙垚棋; 张继勇; 张勇东
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2019-03-20
Filing date: 2019-03-20
Publication date: 2019-07-26

Abstract

本发明提出了一种基于多视图的三维模型分类检索方法。本发明具体实现如下：1、将三维模型数据进行预处理；2、获取三维模型的多角度渲染视图，在12个不同的视点处对三维模型进行投影得到其相应角度的渲染视图；3、提取三维模型渲染视图的特征，将每一个渲染视图分解成多个同心正方形，通过在两个连续同心正方形之间的图像灰度差异来获得渲染视图的特征；4、利用SVM分类器对三维模型进行分类检索。本发明方法通过一系列的预处理后，渲染得到三维模型不同角度下的视图，然后利用改进过的多分类SVM分类器实现了针对三维模型的分类检索任务，具有一定的鲁棒性，取得了较为高效、可靠的优越性能。

Description

一种基于多视图的三维模型分类检索方法

技术领域

本发明涉及计算机图形学、机器学习领域，具体涉及一种基于多视图的三维模型分类检索方法。

背景技术

近些年来，计算机技术飞速发展，三维建模技术日趋成熟。伴随着这股热潮，三维模型渐渐的发展成为继声音、图像和视频之后的第四代多媒体数据类型。目前，网络上的三维模型以指数的方式爆炸性增长，同时在许多方面都获得了普遍的应用，如科研、工业和医学等领域。其在我们的生活中也随处可见，如在虚拟环境、计算机辅助设计、3D游戏、影视动画、分子生物学、地理信息系统等领域均发挥着重要的作用，甚至一些购物网站也推出了3D试衣间。

随着三维模型在越来越多的领域扮演着越来越重要的角色，越来越成为我们生活中不可或缺的一部分，开展三维模型分类检索技术的研究具有重要的理论意义和广泛的实用价值。相比于二维视图，三维模型更符合人类的视觉感知和思维模式规律。对三维模型的分类检索已然成为计算机视觉领域中一个新兴起的研究热点。因此，如何能够快速而高效的从网络上大量的三维模型数据资源中分类检索到所需要的三维模型，已经成为当前信息检索领域中急需解决的问题。

发明内容

本发明提出了一种基于多视图的三维模型分类检索方法，该方法可以有效地实现对于三维模型的分类检索工作。

本发明提出了一种基于多视图的三维模型分类检索方法，其特征在于，包括以下步骤：

步骤1、对三维模型数据进行预处理。为了保证提取的形状特征在三维模型发生平移、旋转、缩放等情况下保持稳定性，在特征提取之前需要对三维模型数据进行坐标系归一化预处理；为了提高分类检索的准确性，在特征提取之前需要对三维模型数据进行各向同性预处理，使得三维模型的某个特征在各个方向上大小一致。

步骤2、获取三维模型的多角度渲染视图。将三维模型的质心移动到坐标系原点处，在同一水平面上每间隔30°、仰角15°对三维模型进行投影，得到12张不同视点的三维模型渲染视图，用来表征三维模型。

步骤3、提取三维模型渲染视图的特征。将每一个渲染视图分解成多个同心正方形，通过在两个连续同心正方形之间的图像灰度差异来获得渲染视图的特征，进而得到三维模型的特征表示。

步骤4、利用SVM分类器对三维模型进行分类检索。将提取的三维模型特征通过合适的核函数映射到高维空间，使得不同类别的特征线性可分，最后利用改进过的多分类SVM分类器对未知三维模型进行分类检索，从而实现了对三维模型的分类检索工作。

本发明有益效果如下：

本方法的一个最大好处是避免了训练神经网络所需要的巨大样本量及高额的时间成本，只需要较少的训练样本即可以实现对三维模型的分类检索。本方法的一个特点是在不同的视点处对三维模型进行投影，用得到的多张渲染视图来表征三维模型，同时引入核函数解决了原本数据集线性不可分的问题，进一步提高了分类结果的准确性。

具体实施方式

本发明提出了一种基于多视图的三维模型分类检索方法，有效地实现了对三维模型进行分类检索的工作，下面结合相关步骤进行详细说明：

步骤1、对三维模型数据进行预处理。为了保证提取的形状特征在三维模型发生平移、旋转、缩放等情况下保持稳定性，在特征提取之前需要对三维模型数据进行坐标系归一化预处理，本发明中使用0均值归一化方法；为了提高分类检索的准确性，在特征提取之前需要对三维模型数据进行各向同性预处理，使得三维模型的某个特征在各个方向上大小一致。

步骤3、提取三维模型渲染视图的特征。将每一个渲染视图分解成多个同心正方形，通过在两个连续同心正方形之间的图像灰度差异来获得渲染视图的特征。具体来说，首先将每一张渲染视图在中心点周围分解成L个同心正方形，定义渲染视图中某点的像素值为f_k(x，y)(k＝1，2，…，12)，位于每张渲染视图第j个同心正方形区域C_j中的所有像素值的和为g_k(j)，其中

C_j＝{|X-L|＜j，|y-L|＜j}，j＝1，2，…，L

然后求出两个连续的同心正方形中像素值的差别d_k(j)，并将其标准化为v_k(j)，表示为

d_k(j)＝g_k(j)-g_k(j-1)，j＝2，3，…，L

其中，定义d_k(1)＝g_k(1)；最后将每张渲染视图的特征描述定义为v_k，三维模型的特征描述定义为v，可表示为

v_k＝[v_k(1)，v_k(2)，…，v_k(L)，h(k)]^T

其中h(k)＝∑sgn(f_k(x，y)≠f_b)(k＝1，2，…，12)为每张渲染视图中非背景像素点的个数，f_b为背景像素值。

步骤4利用SVM分类器对三维模型进行分类检索。将提取的三维模型特征通过选定的核函数映射到高维空间，使得不同类别的特征线性可分，最后利用多分类SVM分类器对未知三维模型进行分类检索，从而实现了对三维模型的分类检索工作。

Claims

1.一种基于多视图的三维模型分类检索方法，其特征在于包括如下步骤：

步骤1、对三维模型数据进行预处理；

使用0均值归一化方法在特征提取之前需要对三维模型数据进行坐标系归一化预处理，对三维模型数据进行各向同性预处理，使得三维模型的某个特征在各个方向上大小一致；

步骤2、获取三维模型的多角度渲染视图；将三维模型的质心移动到坐标系原点处，在同一水平面上每间隔30°、仰角15°对三维模型进行投影，得到12张不同视点的三维模型渲染视图，用来表征三维模型；

步骤3、提取三维模型渲染视图的特征；将每一个渲染视图分解成多个同心正方形，通过在两个连续同心正方形之间的图像灰度差异来获得渲染视图的特征；具体来说，首先将每一张渲染视图在中心点周围分解成L个同心正方形，定义渲染视图中某点的像素值为f_k(x，y)(k＝1，2，…，12)，位于每张渲染视图第j个同心正方形区域C_j中的所有像素值的和为g_k(j)，其中

C_j＝{|x-L|＜j，|y-L|＜j}，j＝1，2，…，L

d_k(j)＝g_k(j)-g_k(j-1)，j＝2，3，…，L

v_k＝[v_k(1)，v_k(2)，…，v_k(L)，h(k)]^T

其中h(k)＝∑sgn(f_k(x，y)≠f_b)(k＝1，2，…，12)为每张渲染视图中非背景像素点的个数，f_b为背景像素值；

步骤4 利用SVM分类器对三维模型进行分类检索；将提取的三维模型特征通过选定的核函数映射到高维空间，使得不同类别的特征线性可分，最后利用多分类SVM分类器对未知三维模型进行分类检索，从而实现了对三维模型的分类检索工作。