CN114863134B - 基于交替优化深度学习模型的三维模型兴趣点提取方法 - Google Patents
基于交替优化深度学习模型的三维模型兴趣点提取方法 Download PDFInfo
- Publication number
- CN114863134B CN114863134B CN202210348420.3A CN202210348420A CN114863134B CN 114863134 B CN114863134 B CN 114863134B CN 202210348420 A CN202210348420 A CN 202210348420A CN 114863134 B CN114863134 B CN 114863134B
- Authority
- CN
- China
- Prior art keywords
- interest
- points
- vertexes
- point
- dimensional model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 53
- 238000005457 optimization Methods 0.000 title claims abstract description 50
- 238000013136 deep learning model Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 76
- 238000012549 training Methods 0.000 claims abstract description 70
- 239000013598 vector Substances 0.000 claims abstract description 42
- 238000013528 artificial neural network Methods 0.000 claims abstract description 34
- 238000003062 neural network model Methods 0.000 claims abstract description 21
- 230000006870 function Effects 0.000 claims abstract description 16
- 238000010586 diagram Methods 0.000 claims description 37
- 238000012986 modification Methods 0.000 claims description 14
- 230000004048 modification Effects 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 7
- NRNCYVBFPDDJNE-UHFFFAOYSA-N pemoline Chemical compound O1C(N)=NC(=O)C1C1=CC=CC=C1 NRNCYVBFPDDJNE-UHFFFAOYSA-N 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 66
- 238000001514 detection method Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 8
- 238000013216 cat model Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 241000251730 Chondrichthyes Species 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 210000003371 toe Anatomy 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于交替优化深度学习模型的三维模型兴趣点提取方法;采用特征描述符提取每个三维模型表面所有顶点的特征向量,组成第一高维向量,作为输入;使用标签值函数对所有顶点进行计算,获得所有顶点为兴趣点的标签值,作为输出,训练神经网络;使用训练后的神经网络对每个三维模型进行预测,结合密度峰值聚类方法提取出兴趣点;将预测结果与所有顶点为兴趣点的标签值对比,基于此对部分顶点为兴趣点的标签值进行优化;将优化后的标签值作为输出,输入不变,再次对神经网络进行训练;多次训练后得到最终神经网络模型;采用最终神经网络模型,并结合密度峰值聚类方法,可提取出同一类三维模型的兴趣点;该方法不仅快速且准确。
Description
技术领域
本发明属于三维模型兴趣点提取技术领域,特别是基于交替优化深度学习模型的三维模型兴趣点提取方法。
背景技术
三维模型表面的兴趣点(Points of Interest)也被称为特征点,一般具有特定的几何与语义特征,往往是三维模型表面视觉效果突出的点。提取三维模型上的兴趣点,能够对数字几何处理中的许多问题提供帮助。比如,在三维模型分割问题中[1],Katz等[2]利用兴趣点将网格模型划分为不同的部分,然后沿着部位的边界生成一致性的分割。在人脸识别问题中,Blanz等[3]通过在人脸图片上标注兴趣点,以此估计人脸的三维形状和纹理,从而建模出强大且通用的人脸表示。此外,提取兴趣点对于面部表情识别[4]、网络的变形和编辑[5]等问题也有较大的帮助。
传统三维模型兴趣点检测算法通常根据多边形面片上几何特征的显著性来提取兴趣点。例如,Wang等提出了基于数据引力(Data Gravitation)的三维模型特征点检测算法,该算法通过选择高斯曲率值最大的顶点作为初始点,然后计算每个顶点的权重,并删除阈值之下的多余点,从而得到三维模型表面的兴趣点。Sipiran等提出了一种基于Harris算子的兴趣点检测器,该算法对三维模型的形变具有较强的鲁棒性。Hu等提出一种在Laplace-Beltrami谱域中提取几何特征点的算法,该算法将频率与三维模型的尺度信息对应,实现了全局和局部匹配,即使对形变的模型也十分有效。
除了几何特征之外,还可以根据其他的一些描述方式来进行三维模型上的兴趣点检测。例如Wang等研究人员提出了一种新的多尺度图卷积网络(Multiscale GraphConvolutional Network),将小波能量分解特征转换为新的描述符,该描述符能够适应模型上多种不同曲面。Wang等提出了一种新的局部特征描述符,该描述符将顶点周围的光谱特征编码为几何图像,对二维图像进行傅里叶变换,计算区域的特征信息。使用该描述符计算局部特征信息时,模型的分辨率和面片的三角剖分方式并不影响实验结果。
此外,图像信息也对三维模型兴趣点提取有较大的帮助。Castellani等通过计算三维模型的局部特征,对三维模型表面的每个顶点训练隐马尔可夫模型(HMMs),并利用相似度的差异来匹配不同视图的兴趣点。Tonioni等将兴趣点检测问题与网格分割问题相结合,使用给定的描述符对特征点进行分类,并使用随机森林分类器实现兴趣点的提取。
除了利用顶点的几何特征外,还能在顶点上附加如语义标签等额外的特征信息,从而提高三维模型兴趣点提取算法的鲁棒性。Teran等通过编码人工标签的主观认知标准,并由此提取模型上的兴趣点,使得提取结果更符合人类的主观认知。Creusot等使用多个局部表面描述符提取特征,利用提取到的特征拟合出一个最优函数,利用这个最优函数分离出模型的普通顶点和兴趣点。Saliti等利用一个预定义的特征描述符检测器,将三维模型上的顶点划分为特征点和非特征点,从而实现三维模型兴趣点的提取。
近年来,随着三维建模技术的不断进步,三维模型也变得越来越复杂,对模型兴趣点的提取算法也提出了更高的要求。然而传统的兴趣点提取算法中,有的使用特征描述符提取特征,有的使用模型的二维投影提取特征。对于复杂的模型来说,在某些区域内模型的顶点特征差异较小,点与点之间距离不大,通过传统的兴趣点提取算法直接提取特征点可能会造成较多误判。而在某些区域,点与点之间的特征变化明显,通过传统的兴趣点提取算法提取这些顶点后,可能会遗漏邻近区域特征变化平滑的兴趣点。
因此,如何快速准确提取出复杂的三维模型表面的兴趣点,克服传统方式存在的问题,成为当前研究的关键问题。
发明内容
鉴于上述问题,本发明提供一种至少解决上述部分技术问题的基于交替优化深度学习模型的三维模型兴趣点提取方法,通过交替优化的策略强化复杂模型上的提取能力,从而快速准确提取出复杂的三维模型表面的兴趣点。
本发明实施例提供了基于交替优化深度学习模型的三维模型兴趣点提取方法,包括:
S1、将同一类的三维模型作为训练集;
S2、采用多种特征描述符,提取所述训练集中每个三维模型表面所有顶点对应的特征向量,并将提取出来的特征向量串联成第一高维向量;
S3、使用标签值函数对所述训练集中每个三维模型表面所有顶点进行计算,获得所述训练集中所有顶点为兴趣点的标签值;
S4、将所述第一高维向量作为输入,将所述S3中所有顶点为兴趣点的标签值作为输出,训练神经网络;
S5、使用训练后的神经网络分别对所述训练集中每个三维模型进行预测,输出所有顶点对应的标签值,基于此使用密度峰值聚类方法,提取出所述训练集中每个三维模型的兴趣点;
S6、将所述S5中所有顶点对应的标签值与该所有顶点在S3中为兴趣点的标签值进行对比,根据对比结果对部分顶点为兴趣点的标签值进行优化;
S7、将优化后的训练集中三维模型表面所有顶点为兴趣点的标签值作为输出,将所述第一高维向量作为输入,再次对所述神经网络进行训练;
S8、循环执行S5-S7至预设次数,得到最终神经网络模型;
S9、对于同一类的三维模型,通过所述最终神经网络模型对其进行操作,并结合所述密度峰值聚类方法,提取出所述同一类的三维模型的兴趣点。
进一步地,所述S2中,多种特征描述符包括:平均测地距离描述符、形状直径函数描述符、高斯曲率描述符、全局特征尺度不变热核特征描述符,以及波核特征描述符。
进一步地,所述S3中,标签值函数表示为:
其中,cn表示三维模型上距离顶点vi最近的兴趣点;d(cn,vi)表示三维模型顶点vi与兴趣点cn的测地距离;Dmax表示d(cn,vi)的最大值;Dmin表示d(cn,vi)的最小值。
进一步地,所述S5具体包括:
S51、将所述训练集中每个三维模型表面所有顶点对应的特征向量依次输入到训练后的所述神经网络中,输出所有顶点对应的标签值;
S52、基于所述S51中所有顶点对应的标签值,通过密度峰值聚类方法画出决策图;
S53、通过所述决策图上点的分布提取出所述训练集中三维模型的兴趣点。
进一步地,所述S52具体包括:
将所述所有顶点对应的密度值ρ作为横轴,将顶点vi到顶点vj的测地距离值δ作为纵轴,构建决策图;
其中,所述密度值ρ为每一个顶点的标签值;所述顶点vj是距离所述顶点vi最近的一个密度值大于所述顶点vi的顶点。
进一步地,所述S53具体包括:
S531、基于所述决策图,通过公式(3)确定兴趣点选择区域;
其中,ri表示兴趣点选择区域的横轴;di表示兴趣点选择区域的纵轴;ρmin表示兴趣点中最小的ρ值;δmin表示兴趣点之间的最小测地距离;将非兴趣点中拥有最大δ值的点命名为k点;δk表示k点的δ值;
S532、通过公式(4)筛选所述兴趣点选择区域中的顶点,并将筛选出来的顶点作为兴趣点;
其中,密度值ρ为决策图的横轴,即表示兴趣点的横坐标;测地距离值δ为决策图的纵轴,即表示兴趣点的纵坐标。
进一步地,所述S6具体包括:
S61、将所述S5中所有顶点对应的标签值与该所有顶点在S3中为兴趣点的标签值进行对比,将S5中所提取出来的兴趣点划分为三类:预测正确的点、由于遗漏而未提取的点、以及预测错误而多余的点;
S62、对于所述由于遗漏而未提取的点、以及预测错误而多余的点,对这两类点为兴趣点的标签值进行优化。
进一步地,所述S62中,对所述由于遗漏而未提取的点为兴趣点的标签值进行优化,所对应的优化公式为:
其中,ρj表示顶点vj在S3中为兴趣点的标签值;表示顶点vj经线性优化后的标签值;di,j表示遗漏而未提取的点pi与顶点vj之间的测地距离;dmin表示该类模型训练集中不同兴趣点之间的最小测地距离;t、a和b均表示线性提升参数;a表示线性修改的斜率;b表示截距;t来控制修改的范围。
进一步地,所述S62中,对所述预测错误而多余的点为兴趣点的标签值进行优化,所对应的优化公式为:
其中,ρj表示顶点vj在S3中为兴趣点的标签值;表示顶点vj经线性优化后的标签值;dm,j表示预测错误而多余的点pm与顶点vj之间的测地距离;dmin表示该类模型训练集中兴趣点之间的最小测地距离;t、a和b均表示线性提升参数;a表示线性修改的斜率;b表示截距;t来控制修改的范围。
进一步地,所述S9具体包括:
S91、对于同一类的三维模型,采用所述多种特征描述符,提取其中三维模型表面所有顶点对应的特征向量,并将提取出来的特征向量串联成第二高维向量;
S92、将所述第二高维向量输入至所述最终神经网络模型中,输出所述同一类的三维模型中所有顶点是兴趣点的标签值;
S93、基于所述S92所有顶点是兴趣点的标签值通过密度峰值聚类方法画出决策图;
S94、基于所述S93中的决策图,通过公式(3)确定兴趣点选择区域;
S95、通过公式(4)筛选所述S94中兴趣点选择区域中的顶点,并将筛选出来的顶点作为兴趣点。
与现有技术相比,本发明记载的基于交替优化深度学习模型的三维模型兴趣点提取方法,具有如下有益效果:
1、将三维模型顶点的筛选问题转换为预测顶点为兴趣点的的标签值的回归问题,有效解决了训练样本不平衡的难题。
2、本发明采取数据驱动的方法自动提取三维模型的兴趣点,不仅省时省力,还会解决现有技术中人工提取兴趣点的主管误差问题。
3、采用交替优化的策略对顶点为兴趣点的标签值进行优化,提升对神经网络的训练效果,有助于快速准确得提取出三维模型上的兴趣点。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的基于交替优化深度学习模型的三维模型兴趣点提取方法流程示意图。
图2(a)为本发明实施例提供的猫模型及兴趣点标注示意图。
图2(b)为本发明实施例提供的猫模型上非兴趣点和兴趣点的数量对比示意图。
图3为相关技术中对猫模型生成概率场后的示意图。
图4为本发明实施例提供的对猫模型生成概率场后的示意图。
图5为本发明实施例提供的密度峰值聚类算法的决策图。
图6(a)为本发明实施例提供的鸟模型示意图及兴趣点标注示意图。
图6(b)为本发明实施例提供的手动选择鸟模型决策图中兴趣点示意图。
图7(a)为本发明实施例提供的鲨鱼模型示意图及兴趣点标注示意图。
图7(b)为本发明实施例提供的自动选择鲨鱼模型决策图中兴趣点示意图。
图8为本发明实施例提供的对外星人模型提取兴趣点示意图。
图9为本发明实施例提供的某兴趣点到标签值比它大的兴趣点的测地距离值求解示意图。
图10为本发明实施例提供的SHREC 2011数据集中部分三维模型示意图。
图11为本发明实施例提供的在SHREC 2011数据集上的部分测试结果图。
图12(a)为本发明实施例提供的眼镜模型顶点分布示意图。
图12(b)为本发明实施例提供的眼镜模型顶点标签值预测结果图。
图12(c)为本发明实施例提供的眼镜模型兴趣点提取结果图。
图13(a)为本发明实施例提供的不同兴趣点检测算法在FNE评价指标上的性能对比结果图。
图13(b)为本发明实施例提供的不同兴趣点检测算法在FPE评价指标上的性能对比结果图。
图14为现有相关技术中的未使用交替优化算法的流程图。
图15(a)为在SHREC2011数据集上,本发明实施例提供的方法与未进行交替优化的方法在FNE评价指标上的对比结果图。
图15(b)为在SHREC2011数据集上,本发明实施例提供的方法与未进行交替优化的方法在FPE评价指标上的对比结果图。
图16(a)为在SHREC2007数据集上,本发明实施例提供的方法与未进行交替优化的方法在FNE评价指标上的对比结果图。
图16(b)为在SHREC2007数据集上,本发明实施例提供的方法与未进行交替优化的方法在FPE评价指标上的对比结果图。
图17(a)为本发明实施例提供的不同特征描述符在FNE评价指标下对本发明实施例提供的方法所产生的影响。
图17(b)为本发明实施例提供的不同特征描述符在FPE评价指标下对本发明实施例提供的方法所产生的影响。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供的基于交替优化深度学习模型的三维模型兴趣点提取方法如图1所示,具体包括如下步骤:
S1、将同一类的三维模型作为训练集;
S2、采用多种特征描述符,提取所述训练集中每个三维模型表面所有顶点对应的特征向量,并将提取出来的特征向量串联成第一高维向量;
S3、使用标签值函数对所述训练集中每个三维模型表面所有顶点进行计算,获得所述训练集中所有顶点的标签数据;所述标签数据为顶点属于兴趣点的标签值;
S4、将所述第一高维向量作为输入,将所述所有顶点的标签数据作为输出,训练神经网络;
S5、使用训练后的神经网络分别对所述训练集中每个三维模型进行预测,输出所有顶点对应的标签值,基于此使用密度峰值聚类方法,提取出所述训练集中每个三维模型的兴趣点;
S6、将所述S5中所有顶点对应的标签值与该所有顶点在S3中为兴趣点的标签值进行对比,根据对比结果对部分顶点为兴趣点的标签值进行优化;
S7、将优化后的训练集中三维模型表面所有顶点的标签数据作为输出,将所述第一高维向量作为输入,再次对所述神经网络进行训练;
S8、循环执行S5-S7至预设次数,得到最终神经网络模型;
S9、对于需要提取兴趣点的同一类的三维模型,通过所述最终神经网络模型对其进行测试,并结合所述密度峰值聚类方法,提取出兴趣点。
1、下面分别对上述各个步骤进行详细的说明。
1.1、关于上述步骤S1:
在上述步骤S1中将同一类的三维模型作为训练集,来对神经网络模型进行训练。其中同一类的三维模型指的是该类三维模型都是植物,或都是动物,或都是饰品等。在本发明实施例中,以动物的三维模型作为实验对象展开说明。在具体实验过程中,由于上述方法中,S1-S8是对神经网络完整的训练过程,训练完成之后需要通过测试来证明该神经网络模型的准确性。因此,在具体实验过程中,可将同一类的三维模型划分为训练集和测试集;在通过训练集对神经网络模型进行训练后,通过测试集对训练后的神经网络模型进行测试,以此来验证神经网络模型的准确性。
1.2、关于上述步骤S2:
在神经网络训练之前,需要对三维模型进行特征提取。目前学术界已有多种三维模型特征描述符可以进行模型的特征提取,不同的特征描述符能从不同的角度刻画三维模型的特征。为了得到更好的特征描述效果,在上述步骤S2中使用了多种特征描述符,分别是:平均测地距离(average geodesic distance,AGD)的描述符、形状直径函数(shapediameter function,SDF)描述符、高斯曲率(Gaussian curvature,GC)描述符、全局特征尺度不变热核特征描述符(scale-invariant heat kernel signatures,SIHKS)和波核特征描述符(wave kernel signature,WKS)。上述步骤S2中使用以上五种三维形状特征描述符,通过每种特征描述符分别提取训练集中每个三维模型表面所有顶点的特征,得到相应的特征向量,然后将特征向量串联成高维向量,为便于陈述说明,将其记作第一高维向量。通过该第一高维向量来表示训练集中每个三维模型表面所有顶点的特征。
1.3、关于上述步骤S3:
在三维模型上,兴趣点的数量相对较少。例如在如图2所示的猫模型中,兴趣点只有8个,但非兴趣点有近万个。悬殊的正负样本比例给神经网络训练带来了较大的困难,会导致神经网络模型泛化能力低下,过拟合严重。为了解决样本不平衡问题,在上述步骤S3中,利用双调和距离场(Biharmonic Distance Field给训练集中每个三维模型表面所有顶点进行赋值。即利用高斯函数为兴趣点及其附近的顶点设置一个标签值,即计算该顶点是兴趣点的概率值,从而在整体三维模型上构建一个概率场。通过对顶点赋值,将提取兴趣点的问题转化为利用神经网络预测顶点是兴趣点的概率。在具体实验过程中,在神经网络训练和测试阶段,输入的是上述步骤S2得到的第一高维向量,输出的是所有顶点属于兴趣点的标签值。标签值越大的顶点,是兴趣点的可能性越大;标签值越小的顶点,是兴趣点的可能性越小。
在上述步骤S3中,通过能量扩散的方式给每个顶点赋予标签值,以此平衡数据样本的比例。对于三维模型上的顶点vi,其标签值fi的计算公式为:
其中,cn表示三维模型上距离顶点vi最近的兴趣点;d(cn,vi)表示三维模型顶点vi与兴趣点cn的测地距离;Dmax表示d(cn,vi)的最大值;Dmin表示d(cn,vi)的最小值;对于一个三维模型,首先将其表面所有顶点输入到公式(1)中,计算每个顶点的标签值,然后得到此模型的概率场。根据模型上人工标注的兴趣点与公式(1),在猫模型上得到的概率场如图3所示。
从公式(1)和图3可知,根据测地距离大小给顶点赋值的方式是线性的,大多数顶点被赋予了较大的标签值,不利于后续的聚类步骤。本发明实施例算法在公式(1)的基础上对顶点标签值进行重新定义,标签值函数表示为:
其中,fi表示顶点vi经过公式(1)计算后的标签值;函数表示高斯分布函数;在本发明实施例中,设μ=1,σ=0.1。
本发明实施例所提供的算法在猫模型上最终生成的概率场如图4所示。通过给模型表面顶点赋予标签值的方法,将顶点的分类问题转换为预测顶点标签值的回归问题,解决了训练样本不平衡的困难。
1.4、关于上述步骤S4:
在上述步骤S4中,属于对神经网络的第一轮训练,具体为将步骤S2中获得的第一高维向量充当输入,将步骤S3中获得的所有顶点为兴趣点的标签值作为输出,来训练神经网络。
1.5、关于上述步骤S5:
在上述步骤S5中,使用训练后的神经网络分别对训练集中每个三维模型进行预测;具体为将训练集中每个三维模型表面所有顶点对应的特征向量依次输入到训练后的神经网络中,输出所有顶点对应的标签值;即,预测结果即为输出的所有顶点对应的标签值;由于标签值较大的顶点分布集中,而且数量较多,所以仍需要一种能够在标签值较大的众多顶点中提取兴趣点的方法,在步骤S5中给出了这一方法,即根据所有顶点对应的标签值,通过密度峰值聚类方法画出决策图;之后通过决策图上点的分布提取出训练集中三维模型的兴趣点,并获得兴趣点对应的密度值。
密度峰值聚类(Density Peaks Clustering)算法是一种聚类算法,能够自动找出簇的中心,实现任意形状数据的聚类。该算法有两个前提假设:密度峰值点的局部密度大于其周围邻居点的局部密度:不同密度峰值点的距离相对较远。上述步骤S5从密度峰值聚类的思想出发,将所有顶点对应的密度值ρ作为横轴,将顶点vi到顶点vj的测地距离值δ作为纵轴,构建一个关于距离和密度的决策图;其中,所述密度值ρ为每一个顶点的标签值;所述顶点vj是距离所述顶点vi最近的一个密度值大于所述顶点vi的顶点。构造的决策图如图5所示。构造决策图后,算法将ρ值和δ值都较大的点作为聚类的中心,靠近决策图右上方的点ρ值较大,表明该点密度值较高;δ值也较大,表明此点距离其他密度值高的点相对较远,这些点即局部密度峰值点,也是需要提取的兴趣点。
当然兴趣点不只是决策图右上方的点,接下来对从决策图上自动提取兴趣点进行具体说明:
如图6(a)所示的鸟模型,在神经网络预测顶点标签值后,各个顶点在决策图上的分布情况如图6(b)所示。若采用人工提取兴趣点的方法,对于如图6(b)右上方的顶点,由于它们ρ值和δ值都相对较高,因此能够正确选择这些顶点;而对于图6(b)右下角的部分兴趣点,它们由于距离较近,δ值较小,所以靠近横轴。另外,由于个人主观对这些点的判断不同,所以提取的结果会有一定的差异,使得一个或多个兴趣点被遗漏。这种判断差异将导致提取结果不同,从而影响后续交替优化过程,最终影响实验结果。所以找到一种自动选择兴趣点的方法十分必要。
本发明实施例采取数据驱动的方法自动提取决策图上的兴趣点,如图7所示,在将一类模型的所有顶点都布置在决策图上后,首先通过公式(3)确定决策图中的兴趣点选择区域;
其中,ri表示兴趣点选择区域的横轴;di表示兴趣点选择区域的纵轴;ρmin表示兴趣点中最小的ρ值;δmin表示兴趣点之间的最小测地距离;将非兴趣点中拥有最大δ值的点命名为k点;δk表示k点的δ值;
然后通过公式(4)筛选所述兴趣点选择区域中的顶点,并将筛选出来的顶点作为兴趣点;
其中,密度值ρ为决策图的横轴,即表示兴趣点的横坐标;测地距离值δ为决策图的纵轴,即表示兴趣点的纵坐标。利用自动提取兴趣点的方法,在鲨鱼模型上的自动提取效果如图7(b)所示。
1.6、关于上述步骤S6:
在上述步骤S6中,通过将所述兴趣点对应的密度值与所述兴趣点在S3中对应的标签值进行对比,可将步骤S5中提取出的兴趣点分为三类;即预测正确的点、由于遗漏而未提取的点、以及预测错误而多余的点。
其中,预测正确的点大多是在决策图中的靠近右上方的顶点,在决策图上选择顶点时,自动提取算法能够准确地框选出这些顶点(如图6(b)中右上方的点)。
遗漏提取的点大多是在决策图上特征不够突出的点,并且这些兴趣点的局部范围内有其他兴趣点。对部分模型而言,如果某个兴趣点与另一个兴趣点之间的测地距离非常近,在决策图上则表现为δ值很小,靠近横轴,在提取兴趣点过程中,可能会遗漏这些点(如图6(b)中右下方的点)。
多余提取的点大多分布在兴趣点附近,它们是额外的局部峰值点。一个顶点越靠近兴趣点,那么它的标签值ρ就越大。如果这个顶点与兴趣点的测地距离较大,那么此点可能会成为局部峰值点,在决策图上表现为δ值较大。在决策图中,如果ρ和δ同时较大,那么此点会靠近决策图的右上方。所以在利用密度峰值聚类算法进行兴趣点提取时,这些局部峰值点会被错误提取。如图8所示,外星人模型右边触角上形成了额外的局部峰值点,从而造成了多余的兴趣点被错误提取。因此为了改善兴趣点提取效果,找到一种能够减少多余的兴趣点被错误提取的方法十分必要。
本发明实施例中,为实现这一目的,对遗漏提取的点和多余提取的点为兴趣点的标签值进行优化;接下来对优化公式和原理进行具体说明:
对于预测正确的兴趣点,它们大多分布在决策图右上角,使用自动提取算法检测时出错的可能性很小,因此对该类点为兴趣点的标签值不作额外处理。
对于提取遗漏的点,这类点由于δ值太小,与一些ρ值较大的非兴趣点一起分布在决策图的右下角,提取时就会造成遗漏。所以,对提取遗漏的顶点采取的优化策略是利用公式(5)阶段性提高此点周围领域的ρ值。对于分布在决策图右下角的兴趣点而言,其本身的标签值ρ比较高,但是由于此兴趣点与其他兴趣点之间测地距离较近,导致距离δ值较小,从而该点会处在决策图右下角的位置。而使用本文算法提升其ρ值之后,该点到密度大于自身顶点之间的距离会增大,达到δ值增大的效果。在决策图上的具体表现为此点往决策图的右上角移动。
将兴趣点与兴趣点之间的最小测地距离作为阈值距离d,提升ρ值的公式为:
其中,ρj表示顶点vj在S3中为兴趣点的标签值;表示顶点vj经线性优化后的标签值;di,j表示遗漏而未提取的点pi与顶点vj之间的测地距离;dmin表示该类模型训练集中不同兴趣点之间的最小测地距离;t、a和b均表示线性提升参数;a表示线性修改的斜率;b表示截距;t来控制修改的范围。本发明实施例中对t、a和b分别赋值0.4、0.4和0.25。通过线性修正的方法,本发明优化了提取遗漏的点及其附近顶点的标签值。如图9所示,用户可指定参数t调整测地距离,从而控制修改标签值的顶点范围。
对于多余提取的点,这些顶点由于距离兴趣点较近,所以本身ρ值较大,而距离标签值大于自身的点有一定的测地距离,所以会分布在决策图的右下角.在提取兴趣点时,这些顶点容易被误识别成局部峰值点,造成提取错误。由此,本文算法对多余提取的点采取的优化策略是利用公式(6)阶段性降低此点周围顶点的ρ值。降低这些点的ρ值之后,该点到标签值大于自身顶点之间的测地距离会减小,达到δ值减小的效果。在决策图上的具体表现为此点往决策图的左下角移动。降低ρ值的公式为:
其中,ρj表示顶点vj在S3中为兴趣点的标签值;表示顶点vj经线性优化后的标签值;dm,j表示预测错误而多余的点pm与顶点vj之间的测地距离;dmin表示该类模型训练集中兴趣点之间的最小测地距离;t、a和b均表示线性提升参数;a表示线性修改的斜率;b表示截距;t来控制修改的范围。
通过对顶点为兴趣点的标签值进行优化,改进了模型顶点标签值分布,避免了产生部分局部峰值点,突出了特征不明显的兴趣点,从而改善了算法提取效果。
1.7、关于上述步骤S5-S8:
传统的三维模型兴趣点提取算法大都从模型的整体出发,寻找人工标记的兴趣点与非兴趣点的集合特征差异,通过差异来辨别新模型的兴趣点和非兴趣点。早期的三维模型扫描技术和建模技术还未发展完善,建立的三维模型结构较为简单,细节较为模糊,模型上人工标记的标签值位置差异较大,兴趣点提取算法只找出兴趣点的大致位置,提取结果不够准确。随着技术的进步,三维模型的结构越来越复杂,细节表达更加完善,这对三维模型相关处理算法要求也越来越高。
传统算法关注三维模型的整体特征,特征区域内兴趣点无法正确提取;而本发明实施例采用的三维模型兴趣点提取方法中(即上述步骤S1-S5),单纯使用概率密度峰值聚类会受限于概率密度峰值之间的距离,导致兴趣点预测错误。如图8所示,在外星人模型中,触角部分是一个特征突出的区域,在此区域中一般认为包含且仅包含一个人工标记的兴趣点。而在此区域中,各个顶点的特征向量十分相似,可能造成多余的兴趣点被错误提取的问题、同时,因为触角部分比较大,该部分局部峰值点之间的距离可能比脚尖的峰值距离更大,使用密度峰值聚类算法提取兴趣点时,会因为脚尖的概率峰值点距离较小,在决策图上δ值太小,较为靠近横轴,从而遗漏脚尖的兴趣点。
为此,本文算法提出采用交替优化的策略(即上述步骤S5-S7),对模型中顶点为兴趣点的标签值进行优化,将优化后的训练集中三维模型表面所有顶点为兴趣点的标签值作为输出,再去训练神经网络。多次循环后,得到最终的神经网络模型,通过该最终神经网络模型能够快速准确地提取出复杂的三维模型的兴趣点。
1.8、关于上述步骤S9:
在得到最终神经网络模型后,通过该最终神经网络模型对同一类的三维模型进行操作,并结合所述密度峰值聚类方法,提取出所述同一类的三维模型的兴趣点。具体方法如下:
S91、对于同一类的三维模型,采用所述多种特征描述符,提取其中三维模型表面所有顶点对应的特征向量,并将提取出来的特征向量串联成第二高维向量;
S92、将所述第二高维向量输入至所述最终神经网络模型中,输出所述同一类的三维模型中所有顶点是兴趣点的标签值;
S93、基于所述S92所有顶点是兴趣点的标签值通过密度峰值聚类方法画出决策图;
S94、基于所述S93中的决策图,通过公式(3)确定兴趣点选择区域;
S95、通过公式(4)筛选所述S94中兴趣点选择区域中的顶点,并将筛选出来的顶点作为兴趣点。
2、接下来对本发明实施例进一步展开说明。
2.1、实验结果。
本发明选择公开数据集SHREC 2011进行实验,该数据集包含30类模型,每一类模型有20个,总共600个三维模型。部分三维模型如图10所示。
本发明实施例在训练和测试的过程中,随机从一类模型中抽取70%的样本,即14个模型作为训练集;另外30%的样本,即6个模型作为测试集。图11为本文算法的实验结果,与通过标签值函数算出的标签值对比可知,通过本发明实施例提供的方法所预测出来的兴趣点,与人工标记的兴趣点一致,极少出现预测多余和遗漏的情况。
训练神经网络时,设置神经网络的学习率为0.0001,使用随机梯度下降算法进行优化。神经网络分为4层;第一层神经元个数对应输入的特征向量的维数,包含122个神经元;第二层包含50个神经元;第三层包含25个神经元;第四层1个神经元。实验结果表明,这种神经网络的设计能得到较好的实验结果。
表1展示了本文算法在SHREC 2011数据集上的准确率。
表1本文算法在选定数据集上的表现
在表格的数据中,检测范围λ表示的是;记录兴趣点之间的最大测地距离为dmax,在测地距离d≤λ×dmax的范围内,由本文算法提取到的顶点都被认为是正确兴趣点。因为三维模型上的兴趣点并不是特指模型上某顶点,而是代表某视觉效果突出区域的一个点。比如手指尖视觉效果突出,但构成手指尖的所有面片上有很多顶点,每个顶点都可能被标注为兴趣点。所以如果提取到的点距离人工标签的测地距离在一定的检测范围内,则可被认为提取正确。
2.2、本发明实施例提供的方法在复杂三维模型上的表现效果。
本文算法通过交替优化的策略提取兴趣点的最大优势在于提升了对复杂三维模型兴趣点的提取能力,尤其是兴趣点数量较多,而且兴趣点特征不突出的模型上。通过对标签(此处标签即为上述提到的顶点是兴趣点的标签值)的多轮优化和神经网络的多轮训练,实现了算法在特征不明显的复杂模型中也能准确提取到兴趣点。图12展示了本文算法在复杂模型上的表现。从图12可以看出,眼镜模型镜框部分兴趣点之间的测地距离很小,在决策图中靠近右下方,在提取过程中很有可能会被遗漏。而交替优化的训练策略可以正确选择这些兴趣点。同时,本发明实施例所提供的兴趣点提取方法比人工提取兴趣点的方法更快,神经网络预测出来的结果与人工标注基本一致。
2.3、与其他兴趣点提取算法的比较。
该部分内容中,将本发明实施例提供的方法与3D-SIFT、3D-Harris和基于HKS的兴趣点提取算法进行了比较,比较结果如图13所示。在神经网络预测出来的概率场中,结合改进的密度峰值聚类算法在概率场中提取概率峰值点作为算法结果。因为局部区域内的顶点特征向量相似,所以算法提取到的兴趣点可能会在人工标签的附近,而不是完全与人工标记的点重合,所以随着检测范围增大,各个算法的误差都有减小的趋势,到一定检测范围后趋于平稳。
本发明实施例采用两个评价指标对算法进行评价,分别是假阴性误差(FalseNegative Error,FNE)和假阳性误差(False Positive Error,FPE),图13展示了两个误差评价曲线,两个评价指标计算公式为
其中,大写K表示在给定范围内判定为正确的兴趣点数目;N表示标签中的兴趣点数量;M表示算法提取的兴趣点数目。根据公式(7)的表述,FNE表示没有被正确提取的兴趣点的比例,FPE表示算法结果中不是正确兴趣点的比例。FPE越小,表示算法提取错误的点越少,FNE越小,表示算法提取兴趣点的准确率越高。
从图13的算法结果来看,各算法随着检测范围增大,遗漏的兴趣点比例会下降,即FNE会下降。同时,各算法结果中错误提取的点的比例也会下降,即FPE也会下降。从图中可以看出,本发明实施例提供的三维模型兴趣点提取方法优于传统方法。
结合两个评价指标分析可知,3D-Harris算法的FNE值较低,但是FPE值较高,这表明3D-Harris算法基本能够提取出所有兴趣点,但同时在检测范围内也提取了很多错误的点,说明此算法提取出来的错误点较多;3D-SIFT算法类似。基于HKS的兴趣点提取算法FPE值较低,但是FNE较高,这表明该算法错误率较低,但是不能在模型上正确提取出所有兴趣点,造成兴趣点遗漏较多。从三种方法的效果对比可知,同时要求准确率高、错误率低有较大的挑战,这也进一步表明了本发明实施例提供的三维模型兴趣点提供方法的优势。
2.4、本发明实施例提供的方法与未进行交替优化的方法比较。
未使用交替优化算法的流程图如图14所示。未使用交替优化的算法训练过程和本文类似,使用同样的三维模型和特征描述符,采用相同的方法对神经网络进行训练,两种算法的对比结果如图15所示。
从图14和图15可知,本发明实施例提供的方法采用了交替优化的策略之后,所实现的结果在已有的基础上有了进一步的提升,正确提取到的兴趣点更多,提取准确率更高,
本发明实施例还在Intel Core TM i7 3.70GHz CPU、32GB RAM和NVIDIA GeForceGTX 1080Ti GPU的硬件设备上用Matlab实现了本文算法。在SHREC 2011数据集中的外星人模型类别中随机选取一定数量的三维模型,分别使用本发明实施例提供的方法和未使用交替优化策略的算法训练神经网络,重复5次后计算平均训练时间。由以上过程得到算法效率对比结果如表2所示。
表2神经网络训练时间对比分钟(min)
从表2可以看出,在训练神经网络过程中,因为涉及到顶点标签值的交替优化过程,所以本发明实施例提供的方法的整体训练时间会比未使用交替优化算法的训练时间更长。
此外,本发明还在公开数据集SHREC2007[31]上做了进一步实验。该数据及包含20类模型,每一类模型有20个,总共400个模型,此数据集与上述SHREC2011数据集有较大不同,能进一步体现实验效果。在此数据集上使用交替优化进行模型兴趣点提取,与没有进行交替优化的方法进行比较,得到的结果对比如图16所示.
由图15和图16展示的结果可以看出,在使用了五种特征描述符之后,三维兴趣点提取的效果比较令人满意。而使用了交替优化策略之后,本发明实施例提供的方法最终所呈现的效果能够在原有的基础上继续进行提升。
2.5、五种特征描述符的对比实验。
本发明实施例采用了五种特征描述符提取三维模型表面顶点的特征向量,为了区分不同特征描述符对算法性能的影响,本文设计了4组对照实验。在其他实验条件都相同的情况下,分别使用不同的特征描述符组合进行性能测试,得到的结果如图17所示。
由图17可知,SIHKS和WKS特征描述符相较于其他三种特征描述符对实验结果有着更大的贡献,而这两者之间,WKS描述符对算法性能提升的贡献更大。综合考虑之下,同时使用五种特征描述符时,本发明实施例提供的算法可以呈现出最好的效果。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.基于交替优化深度学习模型的三维模型兴趣点提取方法,其特征在于,包括:
S1、将同一类的三维模型作为训练集;
S2、采用多种特征描述符,提取所述训练集中每个三维模型表面所有顶点对应的特征向量,并将提取出来的特征向量串联成第一高维向量;
S3、使用标签值函数对所述训练集中每个三维模型表面所有顶点进行计算,获得所述训练集中所有顶点为兴趣点的标签值;
S4、将所述第一高维向量作为输入,将所述S3中所有顶点为兴趣点的标签值作为输出,训练神经网络;
S5、使用训练后的神经网络分别对所述训练集中每个三维模型进行预测,输出所有顶点对应的标签值,基于此使用密度峰值聚类方法,提取出所述训练集中每个三维模型的兴趣点;
S6、将所述S5中所有顶点对应的标签值与该所有顶点在S3中为兴趣点的标签值进行对比,根据对比结果对部分顶点为兴趣点的标签值进行优化;
S7、将优化后的训练集中三维模型表面所有顶点为兴趣点的标签值作为输出,将所述第一高维向量作为输入,再次对所述神经网络进行训练;
S8、循环执行S5-S7至预设次数,得到最终神经网络模型;
S9、对于同一类的三维模型,通过所述最终神经网络模型对其进行操作,并结合所述密度峰值聚类方法,提取出所述同一类的三维模型的兴趣点。
2.如权利要求1所述的基于交替优化深度学习模型的三维模型兴趣点提取方法,其特征在于,所述S2中,多种特征描述符包括:平均测地距离描述符、形状直径函数描述符、高斯曲率描述符、全局特征尺度不变热核特征描述符,以及波核特征描述符。
3.如权利要求1所述的基于交替优化深度学习模型的三维模型兴趣点提取方法,其特征在于,所述S3中,标签值函数表示为:
其中,cn表示三维模型上距离顶点vi最近的兴趣点;d(cn,vi)表示三维模型顶点vi与兴趣点cn的测地距离;Dmax表示d(cn,vi)的最大值;Dmin表示d(cn,vi)的最小值。
4.如权利要求1所述的基于交替优化深度学习模型的三维模型兴趣点提取方法,其特征在于,所述S5具体包括:
S51、将所述训练集中每个三维模型表面所有顶点对应的特征向量依次输入到训练后的所述神经网络中,输出所有顶点对应的标签值;
S52、基于所述S51中所有顶点对应的标签值,通过密度峰值聚类方法画出决策图;
S53、通过所述决策图上点的分布提取出所述训练集中三维模型的兴趣点。
5.如权利要求4所述的基于交替优化深度学习模型的三维模型兴趣点提取方法,其特征在于,所述S52具体包括:
将所述所有顶点对应的密度值ρ作为横轴,将顶点vi到顶点vj的测地距离值δ作为纵轴,构建决策图;
其中,所述密度值ρ为每一个顶点的标签值;所述顶点vj是距离所述顶点vi最近的一个密度值大于所述顶点vi的顶点。
6.如权利要求4所述的基于交替优化深度学习模型的三维模型兴趣点提取方法,其特征在于,所述S53具体包括:
S531、基于所述决策图,通过公式(3)确定兴趣点选择区域;
其中,ri表示兴趣点选择区域的横轴;di表示兴趣点选择区域的纵轴;ρmin表示兴趣点中最小的ρ值;δmin表示兴趣点之间的最小测地距离;将非兴趣点中拥有最大δ值的点命名为k点;δk表示k点的δ值;
S532、通过公式(4)筛选所述兴趣点选择区域中的顶点,并将筛选出来的顶点作为兴趣点;
其中,密度值ρ为决策图的横轴,即表示兴趣点的横坐标;测地距离值δ为决策图的纵轴,即表示兴趣点的纵坐标。
7.如权利要求1所述的基于交替优化深度学习模型的三维模型兴趣点提取方法,其特征在于,所述S6具体包括:
S61、将所述S5中所有顶点对应的标签值与该所有顶点在S3中为兴趣点的标签值进行对比,将S5中所提取出来的兴趣点划分为三类:预测正确的点、由于遗漏而未提取的点、以及预测错误而多余的点;
S62、对于所述由于遗漏而未提取的点、以及预测错误而多余的点,对这两类点为兴趣点的标签值进行优化。
8.如权利要求7所述的基于交替优化深度学习模型的三维模型兴趣点提取方法,其特征在于,所述S62中,对所述由于遗漏而未提取的点为兴趣点的标签值进行优化,所对应的优化公式为:
其中,ρj表示顶点vj在S3中为兴趣点的标签值;表示顶点vj经线性优化后的标签值;di,j表示遗漏而未提取的点pi与顶点vj之间的测地距离;dmin表示该类模型训练集中不同兴趣点之间的最小测地距离;t、a和b均表示线性提升参数;a表示线性修改的斜率;b表示截距;t来控制修改的范围。
9.如权利要求7所述的基于交替优化深度学习模型的三维模型兴趣点提取方法,其特征在于,所述S62中,对所述预测错误而多余的点为兴趣点的标签值进行优化,所对应的优化公式为:
其中,ρj表示顶点vj在S3中为兴趣点的标签值;表示顶点vj经线性优化后的标签值;dm,j表示预测错误而多余的点pm与顶点vj之间的测地距离;dmin表示该类模型训练集中兴趣点之间的最小测地距离;t、a和b均表示线性提升参数;a表示线性修改的斜率;b表示截距;t来控制修改的范围。
10.如权利要求5所述的基于交替优化深度学习模型的三维模型兴趣点提取方法,其特征在于,所述S9具体包括:
S91、对于同一类的三维模型,采用所述多种特征描述符,提取其中三维模型表面所有顶点对应的特征向量,并将提取出来的特征向量串联成第二高维向量;
S92、将所述第二高维向量输入至所述最终神经网络模型中,输出所述同一类的三维模型中所有顶点是兴趣点的标签值;
S93、基于所述S92所有顶点是兴趣点的标签值通过密度峰值聚类方法画出决策图;
S94、基于所述S93中的决策图,通过公式(3)确定兴趣点选择区域;
S95、通过公式(4)筛选所述S94中兴趣点选择区域中的顶点,并将筛选出来的顶点作为兴趣点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210348420.3A CN114863134B (zh) | 2022-04-01 | 2022-04-01 | 基于交替优化深度学习模型的三维模型兴趣点提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210348420.3A CN114863134B (zh) | 2022-04-01 | 2022-04-01 | 基于交替优化深度学习模型的三维模型兴趣点提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114863134A CN114863134A (zh) | 2022-08-05 |
CN114863134B true CN114863134B (zh) | 2024-06-14 |
Family
ID=82629845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210348420.3A Active CN114863134B (zh) | 2022-04-01 | 2022-04-01 | 基于交替优化深度学习模型的三维模型兴趣点提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114863134B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334704A (zh) * | 2019-06-21 | 2019-10-15 | 浙江大学宁波理工学院 | 基于分层学习的三维模型兴趣点提取方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3710981A4 (en) * | 2017-11-14 | 2020-12-23 | Magic Leap, Inc. | DETECTION AND DESCRIPTION OF FULLY CONVOLUTIVE POINT OF INTEREST BY HOMOGRAPHIC ADAPTATION |
EP3881125A4 (en) * | 2018-11-15 | 2022-08-31 | Magic Leap, Inc. | SYSTEMS AND METHODS FOR PERFORMING SELF-IMPROVING VISUAL ODOMETRY |
CN110929748A (zh) * | 2019-10-12 | 2020-03-27 | 杭州电子科技大学 | 一种基于深度学习的运动模糊图像特征匹配方法 |
-
2022
- 2022-04-01 CN CN202210348420.3A patent/CN114863134B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334704A (zh) * | 2019-06-21 | 2019-10-15 | 浙江大学宁波理工学院 | 基于分层学习的三维模型兴趣点提取方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于分层学习的三维模型兴趣点提取算法;舒振宇;杨思鹏;辛士庆;刘予琪;龚梦航;庞超逸;胡超;;计算机辅助设计与图形学学报;20200215(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114863134A (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110580445B (zh) | 一种基于GIoU和加权NMS改进的人脸关键点检测方法 | |
CN111368683B (zh) | 基于模约束CenterFace的人脸图像特征提取方法及人脸识别方法 | |
CN109829420B (zh) | 一种基于改进蚁狮优化算法的高光谱图像的特征选择方法 | |
Alsmadi et al. | A hybrid memetic algorithm with back-propagation classifier for fish classification based on robust features extraction from PLGF and shape measurements | |
CN107683469A (zh) | 一种基于深度学习的产品分类方法及装置 | |
CN109033978B (zh) | 一种基于纠错策略的cnn-svm混合模型手势识别方法 | |
CN111178208A (zh) | 基于深度学习的行人检测方法、装置及介质 | |
JP2006268825A (ja) | オブジェクト検出装置、学習装置、オブジェクト検出システム、方法、およびプログラム | |
CN110543906B (zh) | 基于Mask R-CNN模型的肤质自动识别方法 | |
JPWO2019026104A1 (ja) | 情報処理装置、情報処理プログラム及び情報処理方法 | |
CN111833322B (zh) | 一种基于改进YOLOv3的垃圾多目标检测方法 | |
Alsmadi et al. | Fish recognition based on robust features extraction from color texture measurements using back-propagation classifier | |
CN113920400A (zh) | 一种基于改进YOLOv3的金属表面缺陷检测方法 | |
JP2003256443A (ja) | データ分類装置 | |
CN112560710B (zh) | 一种用于构建指静脉识别系统的方法及指静脉识别系统 | |
CN111860587A (zh) | 一种用于图片小目标的检测方法 | |
CN115457051A (zh) | 基于全局自注意力与多尺度特征融合的肝脏ct图像分割方法 | |
WO2022100497A1 (zh) | 表皮生长因子受体突变状态判断方法、介质及电子设备 | |
CN108877947A (zh) | 基于迭代均值聚类的深度样本学习方法 | |
CN115049952A (zh) | 一种基于多尺度级联感知深度学习网络的幼鱼肢体识别方法 | |
CN110334704B (zh) | 基于分层学习的三维模型兴趣点提取方法及系统 | |
Damkliang et al. | Tissue classification for colorectal cancer utilizing techniques of deep learning and machine learning | |
CN108520539B (zh) | 一种基于稀疏学习可变模型的图像目标检测方法 | |
CN111222546A (zh) | 一种多尺度融合的食品图像分类模型训练及图像分类方法 | |
CN114821299A (zh) | 一种遥感图像变化检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |