CN112085837B - 一种基于几何形状和lstm神经网络的三维模型分类方法 - Google Patents

一种基于几何形状和lstm神经网络的三维模型分类方法 Download PDF

Info

Publication number
CN112085837B
CN112085837B CN202010944886.0A CN202010944886A CN112085837B CN 112085837 B CN112085837 B CN 112085837B CN 202010944886 A CN202010944886 A CN 202010944886A CN 112085837 B CN112085837 B CN 112085837B
Authority
CN
China
Prior art keywords
dimensional model
random points
lstm neural
calculating
random
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010944886.0A
Other languages
English (en)
Other versions
CN112085837A (zh
Inventor
高雪瑶
李正杰
张春祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Science and Technology
Original Assignee
Harbin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin University of Science and Technology filed Critical Harbin University of Science and Technology
Priority to CN202010944886.0A priority Critical patent/CN112085837B/zh
Publication of CN112085837A publication Critical patent/CN112085837A/zh
Application granted granted Critical
Publication of CN112085837B publication Critical patent/CN112085837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/04Indexing scheme for image data processing or generation, in general involving 3D image data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于几何形状和LSTM神经网络的三维模型分类方法。本发明提取三维模型的几何形状特征向量D1、D2、D3和A3,将这些特征向量视为一个向量序列作为输入传递到LSTM神经网络,训练降噪自编码器。降噪自编码器的编码部分是LSTM神经网络,LSTM神经网络将特征向量进行特征提取聚合为全局特征,用于三维模型的识别和分类。使用训练集中三维模型的全局特征和类别标签,来训练XGBoost分类器的权值。利用优化的LSTM神经网络和XGBoost分类器对测试集中的三维模型进行分类。本发明在三维模型分类方面具有较好的效果。

Description

一种基于几何形状和LSTM神经网络的三维模型分类方法
技术领域:
本发明涉及一种基于几何形状和LSTM神经网络的三维模型分类方法,该方法在三维模型分类中有着较好的应用。
背景技术:
近些年来,随着三维建模技术、成像技术及计算机视觉的快速发展,三维模型的种类和数量出现了爆炸式的增长。如何有效地对这些三维模型进行分类和管理成了一个亟待解决的问题。神经网络已被广泛地应用于语音识别、机器翻译、语言建模、字符识别和三维模型分类等多个领域。传统的神经网络对三维模型分类存在着一些不足。当三维模型众多而且比较复杂时,分类效果不理想。几何形状信息能够准确地反映出不同三维模型之间的差异,能够用于模型分类过程。LSTM神经网络对传统神经网络进行了改进,具有更好的分类效果。因此,可以利用三维模型的几何形状信息,结合LSTM神经网络对三维模型进行高效地分类。
发明内容:
为了解决三维模型分类问题,本发明公开了一种基于几何形状和LSTM神经网络的三维模型分类方法。
为此,本发明提供了如下技术方案:
1.基于几何形状和LSTM神经网络的三维模型方法,包括如下步骤:
步骤1为了构建三维模型的几何形状,读取三维模型的数据文件,将三维模型离散化,使得模型表面三角面片化。
步骤2在三维模型表面采样若干个随机点,选取N个随机点,并计算每个随机点与模型质点之间的欧式距离,获得随机点与质点之间的距离值集合,构建该距离值集合的分布折线图,将其视为三维模型的整体特征向量D1。
步骤3在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意两个随机点的欧式距离,获得点与点之间的距离值集合,构建该距离值集合的分布折线图,将其视为三维模型的整体特征向量D2。
步骤4在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意三个随机点构成三角形面积的平方根,获得三个点构成面积的平方根数值集合,构建该数值集合的分布折线图,将其视为三维模型整体特征向量D3。
步骤5在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意三个随机点构成两直线之间的夹角度数,获得该夹角的角度数值集合,构建该数值集合的分布折线图,将其视为三维模型的整体特征向量A3。
步骤6通过步骤1到步骤5,计算出训练集中的每一个三维模型计算几何形状向量,并将其存储为i个数值构成的特征向量。将特征向量D1、D2、D3和A3拼接在一起作为输入,训练降噪自编码器,完成LSTM神经网络的训练。
步骤7通过三维模型的类别标签和全局特征,训练XGBoost分类器的权值,通过训练完成的XGBoost分类器对测试集中的三维模型进行分类实验。
2.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤1中,具体步骤为:
步骤1-1通过使用解析工具对三维模型文件进行读取。
步骤1-2使用三角面片化工具对三维模型进行三角面片化。
3.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤2中,获取三维模型的D1形状特征向量,具体步骤为:
步骤2-1根据随机取点公式,在三维模型表面采样若干随机点。在获取的若干随机点中,选取并计算N个随机点与三维模型质点之间的欧式距离,获得随机点与质点之间的距离值集合。
步骤2-2将该距离值集合分布到B个固定大小的区间内,根据集合中的最大值和最小值计算出每个区间长度Size,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图,将其视为三维模型的D1特征向量。
4.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤3中,获取三维模型的D2形状特征向量,具体步骤为:
步骤3-1根据随机取点公式,在三维模型表面采样若干随机点,选取N个随机点,并计算其中任意两个随机点的欧式距离,获得两个随机点之间的距离值集合。
步骤3-2将该距离值集合分布到B个固定大小的区间内,根据集合中的最大值和最小值计算出每个区间长度Size,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图,将其视为三维模型的D2特征向量。
5.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤4中,获取三维模型的D3形状特征向量,具体步骤为:
步骤4-1根据随机取点公式,在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意三个随机点构成三角形的面积平方根,获得该面积平方根的数值集合。
步骤4-2将该数值集合分布到B个固定大小的区间内,根据集合中的最大值和最小值计算出每个区间长度Size,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图。将其视为三维模型的D3特征向量。
6.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤5中,获取三维模型的A3形状特征向量,具体步骤为:
步骤5-1根据随机取点公式,在三维模型表面采样若干随机点,选取N个随机点,并计算其中任意三个随机点构成两直线之间的夹角度数,获得该夹角角度的数值集合。
步骤5-2将该数值集合分布到B个固定大小的区间内,根据集合中的最大值和最小值计算出每个区间长度Size,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图。将其视为三维模型的A3特征向量。
7.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤6中,LSTM神经网络的训练,具体步骤为:
步骤6-1通过步骤1到步骤5,为训练集的每一个三维模型计算D1、D2、D3和A3几何形状向量,并将分别存储为i个数值构成的特征向量。
步骤6-2将这些特征向量输入到降噪自编码器中,降噪自编码器的编码器LSTM神经网络可以获取融合后的特征向量,经过降噪自编码器的解码获取输出特征,通过计算输入特征和输出特征的误差,进而更新LSTM神经网络中的参数。
步骤6-3利用训练集中三维模型的特征向量,重复实验步骤6-2,完成对LSTM神经网络的训练。
8.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤7中,三维模型的分类,具体步骤为:
步骤7-1将训练集中三维模型的几何形状向量D1、D2、D3和A3输入到LSTM神经网络中,经过处理获得三维模型的全局特征,利用三维模型的类别标签和全局特征,训练XGBoost分类器。
步骤7-2通过步骤1到步骤6,获得测试集中三维模型的全局特征,将其输入到训练完成的XGBoost分类器,完成测试集的三维模型分类实验。
有益效果:
1.本发明是一种基于几何形状和LSTM神经网络的三维模型分类方法。
2.三维模型的全局特征由多个几何形状向量D1、D2、D3和A3融合得到,具有良好的旋转鲁棒性,能够很好地表达三维模型的整体特点。
3.针对传统神经网络存在的梯度消失和梯度爆炸问题,LSTM神经网络在此基础上更新了计算节点,通过引入内存单元来长期保留输入序列信息。从而对三维模型分类有了更准确和高效的分类结果。
4.本发明以普林斯顿形状基准PSB(Princrton Shape Bechmark)模型库,验证本发明所提出方法。结果表明,本发明的方法具有较高的准确性。
附图说明:
图1为本发明实施方式中的三维模型。
图2为本发明实施方式中的三维模型的D1特征向量分布折线图。
图3为本发明实施方式中的三维模型的D2特征向量分布折线图。
图4为本发明实施方式中的三维模型的D3特征向量分布折线图。
图5为本发明实施方式中的三维模型的A3特征向量分布折线图。
图6为本发明实施方式中的基于几何形状和LSTM神经网络的三维模型分类方法的流程图。
具体实施方式:
以下结合附图和具体实施例,对本发明的具体实施方式作进一步地详细说明。
本发明实施的基于几何形状和LSTM神经网络的三维模型分类方法的流程图,如图1所示,用图2中三维模型进行说明,本发明包括以下步骤:
步骤1为了构建三维模型的几何特征,读取三维模型的数据文件,将三维模型离散化,使得模型表面三角面片化。
步骤1-1通过使用解析工具对三维模型文件进行读取。
步骤1-2使用三角面化的工具对三维模型进行三角面片化,使用文件解析工具对三维模型样本进行数据读取和三角面化处理,将其储存在列表文件中。
步骤2在三维模型表面采样若干个随机点,选取N个随机点,并计算每个随机点与模型质点之间的欧式距离,获得随机点与质点之间的距离值集合,构建该距离值集合的分布折线图,将其视为三维模型的整体特征向量D1。
步骤2-1根据随机取点公式,在三维模型表面采样若干随机点。对表面三角面片化后,定义每个三角形的三个顶点坐标向量为(A,B,C),我们通过生成介于0和1之间的两个随机数r1和r2,可以在其表面上获取一个随机点P。取点公式如下:
Figure GDA0002734737450000061
其中r1表示顶点A到对边的概率,r2表示沿着A的对边的概率。
在若干随机点中选取10000个随机点,并计算每个随机点与三维模型质点之间的欧式距离,获得每个随机点与质点之间的距离值集合。部分数据如下:
D1=[0.1680,0.1668,0.1673,0.2141,0.2177,0.2223,0.2275,0.2332,0.2126,0.2114,0.2119,0.5140,0.5155,0.5175,0.5197,0.5222,0.5134,0.5129,0.5131,…]
步骤2-2将该集合分布到60个固定大小的区间内,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图,将其视为三维模型的D1特征向量。如图3所示。
步骤3在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意两个随机点的欧式距离,获得点与点之间的距离值集合,构建该距离值集合的分布折线图,将其视为三维模型的整体特征向量D2。
步骤3-1根据随机取点公式,在三维模型表面采样若干随机点,选取10000个随机点,并计算其中任意两个随机点的欧式距离,获得两个随机点之间的距离值集合,部分数据如下:
D2=[0.1860,0.6034,0.6808,0.4356,0.0699,0.7046,0.0958,0.4761,0.4818,0.3730,0.3413,0.2965,0.4689,0.2814,0.5202,0.4419,0.2957,0.4152,…]
步骤3-2将该集合分布到60个固定大小的区间内,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图。将其视为三维模型的D2特征向量。如图4所示。
步骤4在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意三个随机点构成三角形面积的平方根,获得三个点构成面积的平方根数值集合,构建该数值集合的分布折线图,将其视为三维模型整体特征向量D3。
步骤4-1根据随机取点公式,在三维模型表面采样若干个随机点,选取10000个随机点,并计算其中任意三个随机点构成三角形的面积平方根,获得该面积平方根的数值集合,部分数据如下:
D3=[0.1165,0.0295,0.0509,0.0049,0.0884,0.0283,0.1136,0.0491,0.0455,0.0638,0.0420,0.0527,0.0045,0.1500,0.0580,0.0928,0.0709,0.1011,…]
步骤4-2将该集合分布到60个固定大小的区间内,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图。将其视为三维模型的D3特征向量,如图5所示。
步骤5在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意三个随机点构成两直线之间的夹角度数,获得该夹角的角度数值集合,构建该数值集合的分布折线图,将其视为三维模型的整体特征向量A3。
步骤5-1根据随机取点公式,在三维模型表面采样若干随机点,选取10000个随机点,并计算其中任意三个随机点构成两直线之间的夹角度数,获得该夹角角度的数值集合。部分数据如下:
A3=[0.3944,0.8690,0.5547,0.0333,0.8551,0.9434,0.9761,1.0707,0.9925,0.8683,0.6119,0.7609,0.4581,0.9934,1.1856,1.2241,0.9772,1.0785,…]
步骤5-2将该集合分布到60个固定大小的区间内,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图,将其视为三维模型的A3特征向量。如图6所示。
步骤6通过步骤1到步骤5,为训练集中的每一个三维模型计算几何形状分布折线图,并将其存储为i个数值构成的特征向量。将这些特征向量D1、D2、D3和A3拼接在一起输入输出,训练降噪自编码器,同时也完成LSTM神经网络的训练。LSTM神经网络作为降噪自编码器的编码部分,获取几何形状向量D1、D2、D3和A3融合的全局特征。降噪自编码器的解码器是编码器的镜像结构,解码器将特征维数升至原来的维数。
步骤6-1通过步骤1到步骤5,为训练集中的每一个三维模型计算D1、D2、D3和A3形状分布折线图,并将分别存储为60个数值构成的特征向量。
步骤6-2将这些特征向量输入到降噪自编码器中,降噪自编码器的编码器LSTM神经网络可以获取融合后的特征,经过降噪自编码器的解码获取输出特征,利用输入特征和输出特征的计算损失,根据损失更新LSTM神经网络中各个网络层的权值,损失函数Loss如下:
Figure GDA0002734737450000091
其中,X=[x1,...,xi,...,xn],X'=[x`1,...,x`i,...,x`n]。X是降噪自编码器的正确输出特征,X'是降噪自编码器的实际输出特征,X和X'有相同的维度n。
步骤6-3利用训练集中三维模型的特征向量,重复实验步骤6-2,训练降噪自编码器,完成对LSTM神经网络的训练。
步骤7通过三维模型的类别标签和全局特征,训练XGBoost分类器的权值,通过训练完成的XGBoost分类器对测试集中的三维模型进行分类。
步骤7-1将训练集中三维模型的几何形状向量D1、D2、D3和A3输入到LSTM神经网络中,经过处理获得三维模型的全局特征,利用全局特征和类别标签,训练XGBoost分类器。
步骤7-2通过上述步骤,获取测试集中三维模型的全局特征,将其输入到XGBoost分类器,完成测试集的三维模型分类实验。
图2的三维模型所在的普林斯顿形状基准PSB模型库一共有1814个典型的三维模型,可以分为7类,分别为animal、household、plant、building、furniture、vehicle和other,分别对三维模型的类别标签进行编号处理,其映射关系为{animal:0、household:1、plant:2、building:3、furniture:4、vehicle:5和other:6}。
XGBoost分类器的计算方法:
Figure GDA0002734737450000101
其中,F={f(x)=Wq(x)}(q:Rm→T,w∈RT)
这里K是基分类器的个数,m是特征的维数,q表示将Rm映射到相应的叶索引的结构,T是叶子节点的数量,f对应于独立的树结构q和叶子节点的权值w。
XGBoost的目标函数L
Figure GDA0002734737450000102
如下:
Figure GDA0002734737450000103
Figure GDA0002734737450000104
其中,L是一个用来衡量预测值
Figure GDA0002734737450000105
和真实值yi之间差异的损失函数,训练的目的就是使L最小化,其中Ω(f)的作用是防止训练过拟合。
经过计算,图2中的三维模型的全局特征X`=[37,71,66,63,51,54,39,41,55,34,59,34,46,65,59,79,68,70,72,79,64,70,51,48,53,60,78,64,58,55,72,73,66,66,52,59,62,44,52,40,46,43,45,41,27,29,8,14,18,29,27,28,31,12,6,15,15,19,15,15,34]。将其带入XGBoost分类器,得到分类结果。
Figure GDA0002734737450000106
编号4对应的是furniture类,所以图2所示的三维模型分类结果是furniture类。
将测试集中三维模型的全局特征,将其输入到XGBoost分类器,完成测试集的三维模型分类实验。
本发明实施方式所实现的基于几何形状和LSTM神经网络的三维模型分类方法,采用了多种几何形状特征来表达三维模型的形状特点,利用LSTM神经网络提取形状特征向量D1、D2、D3和A3进而完成模型分类,实现较高的的分类准确率。
以上所述是结合附图对本发明的实施例进行的详细介绍,本文的具体实施方式只是用于帮助理解本发明的方法。对于本技术领域的普通技术人员,依据本发明的思想,在具体实施方式及应用范围内均可有所变更和修改,故本发明书不应理解为对本发明的限制。

Claims (8)

1.基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,该方法包括以下步骤:
步骤1为了构建三维模型的几何形状,读取三维模型的数据文件,将三维模型离散化,使得模型表面三角面片化;
步骤2在三维模型表面采样若干个随机点,选取N个随机点,并计算每个随机点与模型质点之间的欧式距离,获得随机点与质点之间的距离值集合,构建该距离值集合的分布折线图,将其视为三维模型的整体特征向量D1;
步骤3在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意两个随机点的欧式距离,获得点与点之间的距离值集合,构建该距离值集合的分布折线图,将其视为三维模型的整体特征向量D2;
步骤4在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意三个随机点构成三角形面积的平方根,获得三个点构成面积的平方根数值集合,构建该数值集合的分布折线图,将其视为三维模型整体特征向量D3;
步骤5在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意三个随机点构成两直线之间的夹角度数,获得该夹角的角度数值集合,构建该数值集合的分布折线图,将其视为三维模型的整体特征向量A3;
步骤6通过步骤1到步骤5,计算出训练集中的每一个三维模型计算几何形状向量,并将其存储为i个数值构成的特征向量,将特征向量D1、D2、D3和A3拼接在一起作为输入,训练降噪自编码器,完成LSTM神经网络的训练;
步骤7通过三维模型的类别标签和全局特征,训练XGBoost分类器的权值,通过训练完成的XGBoost分类器对测试集中的三维模型进行分类实验。
2.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤1中,具体步骤为:
步骤1-1通过使用解析工具对三维模型文件进行读取;
步骤1-2使用三角面化的工具对三维模型进行三角面片化。
3.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤2中,获取三维模型的D1形状特征向量,具体步骤为:
步骤2-1根据随机取点公式,在三维模型表面采样若干随机点,在获取的若干随机点中,选取并计算N个随机点与三维模型质点之间的欧式距离,获得随机点与质点之间的距离值集合;
步骤2-2将该距离值集合分布到B个固定大小的区间内,根据集合中的最大值和最小值计算出每个区间长度Size,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图,将其视为三维模型的D1特征向量。
4.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤3中,获取三维模型的D2形状特征向量,具体步骤为:
步骤3-1根据随机取点公式,在三维模型表面采样若干随机点,选取N个随机点,并计算其中任意两个随机点的欧式距离,获得两个随机点之间的距离值集合;
步骤3-2将该距离值集合分布到B个固定大小的区间内,根据集合中的最大值和最小值计算出每个区间长度Size,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图,将其视为三维模型的D2特征向量。
5.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤4中,获取三维模型的D3形状特征向量,具体步骤为:
步骤4-1根据随机取点公式,在三维模型表面采样若干个随机点,选取N个随机点,并计算其中任意三个随机点构成三角形的面积平方根,获得该面积平方根的数值集合;
步骤4-2将该数值集合分布到B个固定大小的区间内,根据集合中的最大值和最小值计算出每个区间长度Size,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图,将其视为三维模型的D3特征向量。
6.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤5中,获取三维模型的A3形状特征向量,具体步骤为:
步骤5-1根据随机取点公式,在三维模型表面采样若干随机点,选取N个随机点,并计算其中任意三个随机点构成两直线之间的夹角度数,获得该夹角角度的数值集合;
步骤5-2将该数值集合分布到B个固定大小的区间内,根据集合中的最大值和最小值计算出每个区间长度Size,将数值按照大小的顺序排列,统计不同区间内的分布数量,构建该集合的分布折线图,将其视为三维模型的A3特征向量。
7.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤6中,LSTM神经网络的训练,具体步骤为:
步骤6-1通过步骤1到步骤5,为训练集的每一个三维模型计算D1、D2、D3和A3几何形状向量,并将分别存储为i个数值构成的特征向量;
步骤6-2将这些特征向量输入到降噪自编码器中,降噪自编码器的编码器LSTM神经网络可以获取融合后的特征向量,经过降噪自编码器的解码获取输出特征,通过计算输入特征和输出特征的误差,进而更新LSTM神经网络中的参数;
步骤6-3利用训练集中三维模型的特征向量,重复实验步骤6-2,完成对LSTM神经网络的训练。
8.根据权利要求1所述的基于几何形状和LSTM神经网络的三维模型分类方法,其特征在于,所述步骤7中,三维模型的分类,具体步骤为:
步骤7-1将训练集中三维模型的几何形状向量D1、D2、D3和A3输入到LSTM神经网络中,经过处理获得三维模型的全局特征,利用三维模型的类别标签和全局特征,训练XGBoost分类器;
步骤7-2通过步骤1到步骤6,获得测试集中三维模型的全局特征,将其输入到训练完成的XGBoost分类器,完成测试集的三维模型分类实验。
CN202010944886.0A 2020-09-10 2020-09-10 一种基于几何形状和lstm神经网络的三维模型分类方法 Active CN112085837B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010944886.0A CN112085837B (zh) 2020-09-10 2020-09-10 一种基于几何形状和lstm神经网络的三维模型分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010944886.0A CN112085837B (zh) 2020-09-10 2020-09-10 一种基于几何形状和lstm神经网络的三维模型分类方法

Publications (2)

Publication Number Publication Date
CN112085837A CN112085837A (zh) 2020-12-15
CN112085837B true CN112085837B (zh) 2022-04-26

Family

ID=73731713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010944886.0A Active CN112085837B (zh) 2020-09-10 2020-09-10 一种基于几何形状和lstm神经网络的三维模型分类方法

Country Status (1)

Country Link
CN (1) CN112085837B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052231A (zh) * 2021-03-23 2021-06-29 哈尔滨理工大学 一种基于体素和全局形状分布特征的三维模型分类方法
CN113066187A (zh) * 2021-04-20 2021-07-02 哈尔滨理工大学 一种基于形状特征和卷积神经网络的三维模型分类方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845499A (zh) * 2017-01-19 2017-06-13 清华大学 一种基于自然语言语义的图像目标检测方法
CN107301246A (zh) * 2017-07-14 2017-10-27 河北工业大学 基于超深卷积神经网络结构模型的中文文本分类方法
CN107480194A (zh) * 2017-07-13 2017-12-15 中国科学院自动化研究所 多模态知识表示自动学习模型的构建方法及系统
CN107562784A (zh) * 2017-07-25 2018-01-09 同济大学 基于ResLCNN模型的短文本分类方法
CN108021544A (zh) * 2016-10-31 2018-05-11 富士通株式会社 对实体词的语义关系进行分类的方法、装置和电子设备
CN108416065A (zh) * 2018-03-28 2018-08-17 复旦大学 基于层级神经网络的图像-句子描述生成系统及方法
CN110059191A (zh) * 2019-05-07 2019-07-26 山东师范大学 一种文本情感分类方法及装置
CN110119772A (zh) * 2019-05-06 2019-08-13 哈尔滨理工大学 一种基于几何形状特征融合的三维模型分类方法
CN110334580A (zh) * 2019-05-04 2019-10-15 天津开发区精诺瀚海数据科技有限公司 基于集成增量的动态权重组合的设备故障分类方法
CN110349159A (zh) * 2019-06-21 2019-10-18 浙江大学宁波理工学院 基于权重能量自适应分布的三维形状分割方法及系统
GB201916465D0 (en) * 2019-11-13 2019-12-25 British Telecomm Device classification based network security
CN110619364A (zh) * 2019-09-18 2019-12-27 哈尔滨理工大学 一种基于云模型的小波神经网络三维模型分类方法
EP3608918A1 (en) * 2018-08-08 2020-02-12 Tata Consultancy Services Limited Parallel implementation of deep neural networks for classifying heart sound signals

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021544A (zh) * 2016-10-31 2018-05-11 富士通株式会社 对实体词的语义关系进行分类的方法、装置和电子设备
CN106845499A (zh) * 2017-01-19 2017-06-13 清华大学 一种基于自然语言语义的图像目标检测方法
CN107480194A (zh) * 2017-07-13 2017-12-15 中国科学院自动化研究所 多模态知识表示自动学习模型的构建方法及系统
CN107301246A (zh) * 2017-07-14 2017-10-27 河北工业大学 基于超深卷积神经网络结构模型的中文文本分类方法
CN107562784A (zh) * 2017-07-25 2018-01-09 同济大学 基于ResLCNN模型的短文本分类方法
CN108416065A (zh) * 2018-03-28 2018-08-17 复旦大学 基于层级神经网络的图像-句子描述生成系统及方法
EP3608918A1 (en) * 2018-08-08 2020-02-12 Tata Consultancy Services Limited Parallel implementation of deep neural networks for classifying heart sound signals
CN110334580A (zh) * 2019-05-04 2019-10-15 天津开发区精诺瀚海数据科技有限公司 基于集成增量的动态权重组合的设备故障分类方法
CN110119772A (zh) * 2019-05-06 2019-08-13 哈尔滨理工大学 一种基于几何形状特征融合的三维模型分类方法
CN110059191A (zh) * 2019-05-07 2019-07-26 山东师范大学 一种文本情感分类方法及装置
CN110349159A (zh) * 2019-06-21 2019-10-18 浙江大学宁波理工学院 基于权重能量自适应分布的三维形状分割方法及系统
CN110619364A (zh) * 2019-09-18 2019-12-27 哈尔滨理工大学 一种基于云模型的小波神经网络三维模型分类方法
GB201916465D0 (en) * 2019-11-13 2019-12-25 British Telecomm Device classification based network security

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Length Adaptive Recurrent Model for Text Classification;Zhengjie Huang 等;《CIKM’17》;20171110;1019-1027 *
基于多源遥感影像的动态滑坡灾害空间预测模型研究;许石罗;《中国优秀博硕士学位论文全文数据库(博士)基础科学辑》;20180715(第07期);A011-13 *
基于多视角的三维物体识别算法研究与实现;刘雪纯;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20200215(第02期);I138-1736 *

Also Published As

Publication number Publication date
CN112085837A (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN109002834B (zh) 基于多模态表征的细粒度图像分类方法
Medioni et al. A computational framework for segmentation and grouping
Orbay et al. Beautification of design sketches using trainable stroke clustering and curve fitting
CN111488734A (zh) 基于全局交互和句法依赖的情感特征表示学习系统及方法
CN101477529B (zh) 一种三维对象的检索方法和装置
CN112085837B (zh) 一种基于几何形状和lstm神经网络的三维模型分类方法
CN114078151B (zh) 一种点云融合方法、装置、电子设备及存储介质
CN102004922A (zh) 基于骨架特征的高分辨率遥感影像飞机提取方法
CN110119772B (zh) 一种基于几何形状特征融合的三维模型分类方法
CN108170823B (zh) 一种基于高层语义属性理解的手绘交互式三维模型检索方法
Zou et al. A novel 3D model retrieval approach using combined shape distribution
CN108595631B (zh) 基于图谱理论的三维cad模型双层检索方法
Perez-Gallardo et al. GEODIM: a semantic model-based system for 3D recognition of industrial scenes
CN113628329A (zh) 一种零样本草图三维点云检索方法
CN110503148B (zh) 一种具有尺度不变性的点云对象识别方法
CN104050640A (zh) 一种多视角密集点云数据融合方法
CN110400370B (zh) 一种构建三维cad模型的语义级部件模板的方法
CN110310322A (zh) 一种10微米级高精度器件装配表面检测方法
Guo et al. SGLBP: Subgraph‐based local binary patterns for feature extraction on point clouds
US20240020970A1 (en) Pointeff method for urban object classification with lidar point cloud data
Li et al. [Retracted] Deep‐Learning‐Based 3D Reconstruction: A Review and Applications
Jin et al. SHRAG: semantic hierarchical graph for floorplan representation
CN116627952A (zh) 一种遥感影像编目数据相似重复清洗方法
CN114511745A (zh) 三维点云分类及旋转姿态预测方法及系统
CN112668590A (zh) 基于图像特征空间和空域空间的视觉词组构建方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant