CN110276266B - 一种基于旋转的点云数据的处理方法、装置及终端设备 - Google Patents
一种基于旋转的点云数据的处理方法、装置及终端设备 Download PDFInfo
- Publication number
- CN110276266B CN110276266B CN201910451526.4A CN201910451526A CN110276266B CN 110276266 B CN110276266 B CN 110276266B CN 201910451526 A CN201910451526 A CN 201910451526A CN 110276266 B CN110276266 B CN 110276266B
- Authority
- CN
- China
- Prior art keywords
- clustering
- rotation
- point cloud
- cloud data
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于旋转的点云数据的特征处理方法、装置及终端设备,其中方法包括:获取目标点云数据;利用旋转映射模块从目标点云数据中提取旋转不变特征;利用多个聚类模块对旋转不变特征进行多维特征处理,多个聚类模块依次按照由大至小的聚类数目顺序连接;利用分类器模块将多维特征处理后的旋转不变特征进行分类,得到旋转不变特征的分类结果。本发明结合旋转映射模块、多个聚类模块对从目标点云数据中提取的旋转不变特征进行处理,可以确保基于3D点云数据进行目标识别的鲁棒性,增强目标点云数据的分类识别精度,同时降低了对深度学习模型的训练数据的数量需求和深度学习模型训练时的计算成本。
Description
技术领域
本发明涉及点云数据的三维变换处理技术领域,具体涉及一种基于旋转的点云数据的处理方法、装置及终端设备。
背景技术
点云的旋转变换在3D技术领域中较为常见,同时,它在3D识别中引起了不可避免的挑战。理论上讲,任意3D旋转可以由多个操作组合而成,且这种组合的数量是无限的。因此,机器学习模型从极大的输入空间提取特征,对该提取的特征进行训练处理进而确保旋转变换带来的点云数据的分类精度。
目前,现有技术中为了确保点云数据在3D旋转过程中的旋转不变性,往往通过提供大量的旋转增强数据,即应用空间变换器网路在特征提取之前规范输入数据,虽然旋转增强数据在某种程度上对提高机器模型的旋转鲁棒性是有效的,但是基于大量的旋转增强数据,显然其计算成本较高,并且利用较为固定的规范方式进行数据增强,使得机器模型按照该固定的方式进行持续训练,其训练方式不够灵活,很难保证旋转鲁棒性得到保证。
发明内容
因此,本发明实施例要解决的技术问题在于现有技术中为了确保点云数据在3D旋转过程中的旋转不变性,通过提供大量的旋转增强数据,利用机器模型按照固定的方式进行持续训练,其训练方式不够灵活,很难保证旋转鲁棒性得到保证。
为此,本发明实施例提供了如下技术方案:
根据第一方面,本发明实施例提供一种基于旋转的点云数据的特征处理方法,包括如下步骤:
获取目标点云数据;
利用旋转映射模块从所述目标点云数据中提取旋转不变特征;
利用多个聚类模块对所述旋转不变特征进行多维特征处理,所述多个聚类模块依次按照由大至小的聚类数目顺序连接;
利用分类器模块将所述多维特征处理后的所述旋转不变特征进行分类,得到所述旋转不变特征的分类结果。
结合第一方面,在第一方面第一实施方式中,所述利用旋转映射模块从所述目标点云数据中提取旋转不变特征的步骤还包括:
利用K最邻近算法将所述目标点云数据从第一维空间变换至第二维空间;
建立具有多层感知机的第一神经网络模型;
将变换至所述第二维空间的所述目标点云数据输入至所述第一神经网络模型训练得到所述旋转不变特征。
结合第一方面,在第一方面第二实施方式中,,所述将变换至所述第二维空间的所述目标点云数据输入至所述第一神经网络模型训练得到所述旋转不变特征的步骤还包括:
将所述旋转不变特征进行池化处理。
结合第一方面,在第一方面第三实施方式中,,所述利用多个聚类模块对所述旋转不变特征进行多维特征处理,所述多个聚类模块依次按照由大至小的聚类数目顺序连接的步骤还包括:
将所述旋转不变特征依次输入至第一聚类模块、第二聚类模块和第三聚类模块进行聚类处理得到多维的所述旋转不变特征,所述第一聚类模块的聚类数目大于第二聚类模块的聚类数目,所述第二聚类模块的聚类数目大于第三聚类模块的聚类数目。
结合第一方面第一实施方式,在第一方面第四实施方式中,所述第一聚类模块、所述第二聚类模块和所述第三聚类模块进行聚类处理的步骤还包括
构建所述旋转不变特征的K最邻近图;
建立具有多层感知机的第二神经网络模型;
将所述旋转不变特征的K最邻近图输入至所述第二神经网络模型训练得到多维的所述旋转不变特征;
将所述多维的所述旋转不变特征进行池化处理。
根据第二方面,本发明实施例提供一种基于旋转的点云数据的特征处理装置,包括:
获取单元,用于获取目标点云数据;
提取单元,用于利用旋转映射模块从所述目标点云数据中提取旋转不变特征;
多维处理单元,用于利用多个聚类模块对所述旋转不变特征进行多维特征处理,所述多个聚类模块依次按照由大至小的聚类数目顺序连接;
分类单元,用于利用分类器模块将所述多维特征处理后的所述旋转不变特征进行分类,得到所述旋转不变特征的分类结果。
结合第二方面,在第二方面第一实施方式中,所述提取单元还包括:
变换子单元,用于利用K最邻近算法将所述目标点云数据从第一维空间变换至第二维空间;
建立子单元,用于建立具有多层感知机的第一神经网络模型;
训练子单元,用于将变换至所述第二维空间的所述目标点云数据输入至所述第一神经网络模型训练得到所述旋转不变特征。
结合第二方面,在第二方面第二实施方式中,,所述多维处理单元还包括:
聚类处理子单元,用于将所述旋转不变特征依次输入至第一聚类模块、第二聚类模块和第三聚类模块进行聚类处理得到多维的所述旋转不变特征,所述第一聚类模块的聚类数目大于第二聚类模块的聚类数目,所述第二聚类模块的聚类数目大于第三聚类模块的聚类数目。
根据第三方面,本发明实施例提供一种存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面或第一方面任一实施方式中所述的基于旋转的点云数据的特征处理方法的步骤。
根据第四方面,本发明实施例提供一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面或第一方面任一实施方式中所述的基于旋转的点云数据的特征处理方法的步骤。
本发明实施例技术方案,具有如下优点:
本发明实施例提供一种基于旋转的点云数据的特征处理方法及装置,其中方法包括:获取目标点云数据;利用旋转映射模块从所述目标点云数据中提取旋转不变特征;利用多个聚类模块对所述旋转不变特征进行多维特征处理,所述多个聚类模块依次按照由大至小的聚类数目顺序连接;利用分类器模块将所述多维特征处理后的所述旋转不变特征进行分类,得到所述旋转不变特征的分类结果。本发明结合旋转映射模块、多个聚类模块对从目标点云数据中提取的旋转不变特征进行处理,可以确保基于3D点云数据进行目标识别的鲁棒性,增强目标点云数据的分类识别精度,同时降低了对深度学习模型的训练数据的数量需求和深度学习模型训练时的计算成本。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于旋转的点云数据的特征处理方法的第一流程图;
图2为本发明实施例中旋转映射模块表示点云的示意图;
图3为本发明实施例中基于旋转的点云数据的特征处理方法的第二流程图;
图4为本发明实施例中旋转映射模块对旋转不变特征进行处理的示意图;
图5为本发明实施例中基于旋转的点云数据的特征处理方法利用多个模块进行处理的示意图;
图6为本发明实施例中基于旋转的点云数据的特征处理方法的第三流程图;
图7为本发明实施例中聚类模块的进行聚类的示意图;
图8为本发明实施例中基于旋转的点云数据的特征处理装置的结构框图;
图9为本发明实施例中终端设备的硬件示意图。
具体实施方式
下面将结合附图对本发明实施例的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明实施例的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本发明实施例提供一种基于旋转的点云数据的特征处理方法,如图1所示,包括如下步骤:
步骤S1:获取目标点云数据。此处的目标点云数据可以为一幅图像,该幅图像可以由很多的点云构成。
步骤S2:利用旋转映射模块从目标点云数据中提取旋转不变特征。此处的旋转映射模块为RRI模块,该RRI模块在数学上经过证明,其可以保证图像数据在旋转的过程中保持其不变性,并在正常条件下保证图像数据不会发生丢失现象。具体地,如图2所示,RRI模块可以通过将每个点,用下式表示:
RRI模块可以表示两点之间的相对位置关系,在图2中的pi和pi1可以由一个向量表示。而任意一点可以用与其相邻的若干个点来表示出相对位置信息。换句话说,我们将点pi和其K个最近邻点之间的RRI信息概括为(Ti1,Ti2,…,TiK)以表征点pi。
在一具体实施例中,上述步骤S2在执行的过程中,如图3所示,可具体包括如下步骤:
步骤S21:利用K最邻近算法将目标点云数据从第一维空间变换至第二维空间。此处的K最邻近算法是将每个点云数据用它最接近的k个邻近点云数据来代表,其中k为超参数。其中第一维空间为三维空间,第二维空间为四维空间,即将目标点云K周围的邻近点云数据从三维空间变换至四维空间,即可以用一个向量来表示两个点之间的相对位置关系。经过该映射变换后,每个点由周围k个点对应的向量组成,一个N点的点云图由N×K×4的张量表示。在图2中,点云S∈RN×3的新表示是张量T∈RN×K×4,由于pi的局部邻域信息可能嵌入在其K个最近邻点中,因此所提出的表示利用了该属性并通过RRI和条件信息无损机制捕获K-NN邻域中的局部信息。
步骤S22:建立具有多层感知机的第一神经网络模型。如图4所示,此处的具有多层感知机的第一神经网络模型就是常规的卷积神经网络。
步骤S23:将变换至第二维空间的目标点云数据输入至第一神经网络模型训练得到旋转不变特征。例如:在图4中,输入N×3的目标点云数据,经过RRI模块映射成N×K×4的目标点云数据,利用多层感知机进行的第一神经网络进行卷积成N×K×64的目标点云数据。
具体地,上述步骤S23还包括:
将所述旋转不变特征进行池化处理。此处池化是为了改善第一神经网络模型训练的精度,在图4中将第一神经网络模型输出的N×K×64的目标点云数据池化成N×64。
上述中的旋转映射模块(RRI模块)在数学上确实有证明是严格旋转不变的,并且在正常条件下不丢失点云信息。其给定点云中的任何数据点和任意非共线邻域,即使点云处于未知方向,也可以使用RRI模块表示完整地恢复整个点云。换句话说,除了特定的方向信息之外,RRI模块表示保留点云的所有关键信息。此外,RRI模块表示可以灵活地插入当前的第一神经网络架构中,赋予它们严格的旋转不变性。目前现有技术中的旋转等变网络在于将不变性属性先验嵌入到神经网络中,而本实施例通过RRI模块与第一神经网络分离,直接减少了输入空间的方向冗余。
步骤S3:利用多个聚类模块对旋转不变特征进行多维特征处理,多个聚类模块依次按照由大至小的聚类数目顺序连接。具体如图5所示,第一聚类模块为11、第二聚类模块为12、第三聚类模块为13以及分类器为14,旋转映射模块为10。
具体地,上述步骤S3在执行的过程中,可具体包括如下步骤:
将旋转不变特征依次输入至第一聚类模块、第二聚类模块和第三聚类模块进行聚类处理得到多维的旋转不变特征,第一聚类模块的聚类数目大于第二聚类模块的聚类数目,第二聚类模块的聚类数目大于第三聚类模块的聚类数目。
如图5所示,多个聚类模块分别为第一聚类模块11、第二聚类模块12和第三聚类模块13,其中,第一聚类模块11的聚类数目为32,第二聚类模块12的聚类数目为8,第三聚类模块13的聚类数目为1,第一聚类模块11与第二聚类模块12连接,第二聚类模块12与第三聚类模块13连接。每个聚类模块为ClusterNet的深层次网络,以更好地适应本实施例中的方法。
具体地,本实施例采用无监督的分层聚类来学习点云的基本几何结构。聚类的定义是,试图将数据中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”。本实施例使用这种方法,可以获得分层结构树,然后用它来指导分层特征学习。与CNN类似,ClusterNet提取与较小簇相对应的特征,这些较小簇学习了点云的精细特征;然后将较小簇的簇特征融合为捕获更高级别信息的较大簇特征。嵌入过程沿着层次结构树从下到上重复,直到我们实现整个点云的全局特征。
在一具体实施例中,如图6所示,上述步骤S3中的多个聚类模块在进行聚类处理的步骤还包括
步骤S31:构建旋转不变特征的K最邻近图。在图4中的第一聚类模块11,第二聚类模块12以及第三聚类模块13,其输入是一组D维簇特征C=(c1,c2,…,cn)∈RD,其中n是特定分区中的簇数。因此,本实施例中的第一聚类模块、第二聚类模块以及第三聚类模块应用于C,ci的K最邻近聚类特征将被聚合为更高级别的特征以表征聚类ci。
步骤S32:建立具有多层感知机的第二神经网络模型。同理,此处的具有多层感知机的第一神经网络模型就是常规的卷积神经网络。
步骤S33:将旋转不变特征的K最邻近图输入至第二神经网络模型训练得到多维的旋转不变特征。例如:在图7中,经过RRI模块输出的M×D转换成K-NN Graphmlp(a1,a2,……an)输入第二神经网络模型进行训练转变为多维的旋转不变特征N×K×an。
步骤S34:将多维的旋转不变特征进行池化处理。此处池化是为了改善第一神经网络模型训练的精度,在图7中,将第二神经网络模型输出的N×K×an的目标点云数据池化成N×an,再次进一步池化处理输出C×an。
由于目标点云可以嵌入具有欧几里德度量的低维空间R3,因此分层聚类是分析点云分层结构的合适方法。使用层次聚类方法,可以表示簇的划分方式和不同簇之间的关系。在图5中,第一聚类模块11、第二聚类模块12以及第三聚类模块13与卷积神经网络类似,ClusterNet从较小簇中学习几何结构的精细尺度局部特征,然后根据层次聚类树中显示的聚类关系将局部特征进一步聚合为更大聚类簇的更高级别特征。换句话说,本实施例可以应用层次聚类树来指示第二神经网络以更有效的方式提取和聚合特征。
本实施例中第一聚类模块、第二聚类模块以及第三聚类模块类似于卷积神经网络中的池化方法,因为它们都对输入数据进行下采样并保持最大信号。就下采样的性质而言,所提出的聚合方法可以提高对输入数据轻微失真的鲁棒性。此外,在提取原始点云中所有点特征的过程中,该聚类方式还降低了GPU的总计算开销和内存使用。
步骤S4:利用分类器模块将多维特征处理后的旋转不变特征进行分类,得到旋转不变特征的分类结果。将经过细化后的多维旋转不变特征利用分类器模块进行分类,并输出每个类的分数得到最终的旋转不变特征。
本实施例中的基于旋转的点云数据的特征处理方法,利用旋转映射模块进行旋转不变特征提取,在旋转变换的过程中都满足旋转不变性,且与神经网络模型进行结合,可以提高了基于3D点云数据进行目标识别的鲁棒性;同时与多个聚类模块结合构成深层次网络,可以更好地适应旋转不变特征进行空间转变,具有更好的灵活性,也增强目标点云数据的分类识别精度,同时降低了对深度学习模型的训练数据的数量需求和深度学习模型训练时的计算成本。
实施例2
本发明实施例提供一种基于旋转的点云数据的特征处理装置,如图8所示,包括:
获取单元81,用于获取目标点云数据。
提取单元82,用于利用旋转映射模块从目标点云数据中提取旋转不变特征。
多维处理单元83,用于利用多个聚类模块对旋转不变特征进行多维特征处理,多个聚类模块依次按照由大至小的聚类数目顺序连接。
分类单元84,用于利用分类器模块将多维特征处理后的旋转不变特征进行分类,得到旋转不变特征的分类结果。
本发明实施例中的基于旋转的点云数据的特征处理装置,提取单元82还包括:
变换子单元,用于利用K最邻近算法将目标点云数据从第一维空间变换至第二维空间。
第一建立子单元,用于建立具有多层感知机的第一神经网络模型。
第一训练子单元,用于将变换至第二维空间的目标点云数据输入至第一神经网络模型训练得到旋转不变特征。
本发明实施例中的基于旋转的点云数据的特征处理装置,第一建立子单元还包括:
第一池化处理模块,用于将所述旋转不变特征进行池化处理。
本发明实施例中的基于旋转的点云数据的特征处理装置,多维处理单元83还包括:
聚类处理子单元,用于将旋转不变特征依次输入至第一聚类模块、第二聚类模块和第三聚类模块进行聚类处理得到多维的旋转不变特征,第一聚类模块的聚类数目大于第二聚类模块的聚类数目,第二聚类模块的聚类数目大于第三聚类模块的聚类数目。
本发明实施例中的基于旋转的点云数据的特征处理装置,聚类处理子单元中还包括
构建模块,用于构建旋转不变特征的K最邻近图;
建立模块,用于建立具有多层感知机的第二神经网络模型;
训练模块,用于将旋转不变特征的K最邻近图输入至第二神经网络模型训练得到多维的旋转不变特征;
池化模块,用于将多维的旋转不变特征进行池化处理。
本实施例中的基于旋转的点云数据的特征处理装置,利用旋转映射模块进行旋转不变特征提取,在旋转变换的过程中都满足旋转不变性,且与神经网络模型进行结合,可以提高了基于3D点云数据进行目标识别的鲁棒性;同时与多个聚类模块结合构成深层次网络,可以更好地适应旋转不变特征进行空间转变,具有更好的灵活性,也增强目标点云数据的分类识别精度,同时降低了对深度学习模型的训练数据的数量需求和深度学习模型训练时的计算成本。
实施例3
本发明实施例提供一种存储介质,其上存储有计算机指令,该指令被处理器执行时实现实施例1中的方法的步骤。该存储介质上还存储有目标点云数据、旋转不变特征等。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。
实施例4
本发明实施例提供一种终端设备,如图9所示,包括存储器920、处理器910及存储在存储器920上并可在处理器910上运行的计算机程序,处理器910执行程序时实现实施例1中方法的步骤。
图9是本发明实施例提供的执行列表项操作的处理方法的一种终端设备的硬件结构示意图,如图9所示,该终端设备包括一个或多个处理器910以及存储器920,图9中以一个处理器910为例。
执行列表项操作的处理方法的终端设备还可以包括:输入装置930和输出装置940。
处理器910、存储器920、输入装置930和输出装置940可以通过总线或者其他方式连接,图9中以通过总线连接为例。
处理器910可以为中央处理器(Central Processing Unit,CPU)。处理器910还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (7)
1.一种基于旋转的点云数据的特征处理方法,其特征在于,包括如下步骤:
获取目标点云数据;
利用旋转映射模块从所述目标点云数据中提取旋转不变特征;
利用多个聚类模块对所述旋转不变特征进行多维特征处理,所述多个聚类模块依次按照由大至小的聚类数目顺序连接;
利用分类器模块将所述多维特征处理后的所述旋转不变特征进行分类,得到所述旋转不变特征的分类结果;
其中,所述利用多个聚类模块对所述旋转不变特征进行多维特征处理,所述多个聚类模块依次按照由大至小的聚类数目顺序连接的步骤还包括:
将所述旋转不变特征依次输入至第一聚类模块、第二聚类模块和第三聚类模块进行聚类处理得到多维的所述旋转不变特征,所述第一聚类模块的聚类数目大于第二聚类模块的聚类数目,所述第二聚类模块的聚类数目大于第三聚类模块的聚类数目;
所述第一聚类模块、所述第二聚类模块和所述第三聚类模块进行聚类处理的步骤还包括:
构建所述旋转不变特征的K最邻近图;
建立具有多层感知机的第二神经网络模型;
将所述旋转不变特征的K最邻近图输入至所述第二神经网络模型训练得到多维的所述旋转不变特征;
将所述多维的所述旋转不变特征进行池化处理。
2.根据权利要求1所述的基于旋转的点云数据的特征处理方法,其特征在于,所述利用旋转映射模块从所述目标点云数据中提取旋转不变特征的步骤还包括:
利用K最邻近算法将所述目标点云数据从第一维空间变换至第二维空间;
建立具有多层感知机的第一神经网络模型;
将变换至所述第二维空间的所述目标点云数据输入至所述第一神经网络模型训练得到所述旋转不变特征。
3.根据权利要求2所述的基于旋转的点云数据的特征处理方法,其特征在于,所述将变换至所述第二维空间的所述目标点云数据输入至所述第一神经网络模型训练得到所述旋转不变特征的步骤还包括:
将所述旋转不变特征进行池化处理。
4.一种基于旋转的点云数据的特征处理装置,其特征在于,包括:
获取单元,用于获取目标点云数据;
提取单元,用于利用旋转映射模块从所述目标点云数据中提取旋转不变特征;
多维处理单元,用于利用多个聚类模块对所述旋转不变特征进行多维特征处理,所述多个聚类模块依次按照由大至小的聚类数目顺序连接;
分类单元,用于利用分类器模块将所述多维特征处理后的所述旋转不变特征进行分类,得到所述旋转不变特征的分类结果;
所述多维处理单元还包括:
聚类处理子单元,用于将旋转不变特征依次输入至第一聚类模块、第二聚类模块和第三聚类模块进行聚类处理得到多维的旋转不变特征,第一聚类模块的聚类数目大于第二聚类模块的聚类数目,第二聚类模块的聚类数目大于第三聚类模块的聚类数目;
所述聚类处理子单元中还包括:
构建模块,用于构建旋转不变特征的K最邻近图;
建立模块,用于建立具有多层感知机的第二神经网络模型;
训练模块,用于将旋转不变特征的K最邻近图输入至第二神经网络模型训练得到多维的旋转不变特征;
池化模块,用于将多维的旋转不变特征进行池化处理。
5.根据权利要求4所述的基于旋转的点云数据的特征处理装置,其特征在于,所述提取单元还包括:
变换子单元,用于利用K最邻近算法将所述目标点云数据从第一维空间变换至第二维空间;
建立子单元,用于建立具有多层感知机的第一神经网络模型;
训练子单元,用于将变换至所述第二维空间的所述目标点云数据输入至所述第一神经网络模型训练得到所述旋转不变特征。
6.一种存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-3任一项所述的基于旋转的点云数据的特征处理方法的步骤。
7.一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-3任一项基于旋转的点云数据的特征处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910451526.4A CN110276266B (zh) | 2019-05-28 | 2019-05-28 | 一种基于旋转的点云数据的处理方法、装置及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910451526.4A CN110276266B (zh) | 2019-05-28 | 2019-05-28 | 一种基于旋转的点云数据的处理方法、装置及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110276266A CN110276266A (zh) | 2019-09-24 |
CN110276266B true CN110276266B (zh) | 2021-09-10 |
Family
ID=67960253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910451526.4A Active CN110276266B (zh) | 2019-05-28 | 2019-05-28 | 一种基于旋转的点云数据的处理方法、装置及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110276266B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111028151B (zh) * | 2019-12-03 | 2023-05-26 | 西安科技大学 | 基于图残差神经网络融合的点云数据拼接方法 |
CN111028279A (zh) * | 2019-12-12 | 2020-04-17 | 商汤集团有限公司 | 点云数据处理方法及装置、电子设备和存储介质 |
CN111310811B (zh) * | 2020-02-06 | 2021-01-15 | 东华理工大学 | 一种基于多维特征最优组合的大场景三维点云分类方法 |
CN113128591B (zh) * | 2021-04-14 | 2023-12-05 | 中山大学 | 基于自监督学习的旋转鲁棒的点云分类方法 |
CN114492619B (zh) * | 2022-01-22 | 2023-08-01 | 电子科技大学 | 一种基于统计和凹凸性的点云数据集构建方法及装置 |
CN115879004A (zh) * | 2022-12-21 | 2023-03-31 | 北京百度网讯科技有限公司 | 目标模型的训练方法、装置、电子设备、介质和程序产品 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7672791B2 (en) * | 2003-06-13 | 2010-03-02 | International Business Machines Corporation | Method of performing three-dimensional molecular superposition and similarity searches in databases of flexible molecules |
CN104091321A (zh) * | 2014-04-14 | 2014-10-08 | 北京师范大学 | 适用于地面激光雷达点云分类的多层次点集特征的提取方法 |
CN104268138A (zh) * | 2014-05-15 | 2015-01-07 | 西安工业大学 | 融合深度图和三维模型的人体运动捕捉方法 |
CN106556412A (zh) * | 2016-11-01 | 2017-04-05 | 哈尔滨工程大学 | 一种室内环境下考虑地面约束的rgb‑d视觉里程计方法 |
CN107273831A (zh) * | 2017-06-05 | 2017-10-20 | 苏州大学 | 一种基于球空间的三维目标识别方法 |
CN108898663A (zh) * | 2018-06-13 | 2018-11-27 | 东莞时谛智能科技有限公司 | 一种脚部特征参数驱动标准鞋楦变形方法及系统 |
CN109410238A (zh) * | 2018-09-20 | 2019-03-01 | 中国科学院合肥物质科学研究院 | 一种基于PointNet++网络的枸杞识别计数方法 |
-
2019
- 2019-05-28 CN CN201910451526.4A patent/CN110276266B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7672791B2 (en) * | 2003-06-13 | 2010-03-02 | International Business Machines Corporation | Method of performing three-dimensional molecular superposition and similarity searches in databases of flexible molecules |
CN104091321A (zh) * | 2014-04-14 | 2014-10-08 | 北京师范大学 | 适用于地面激光雷达点云分类的多层次点集特征的提取方法 |
CN104268138A (zh) * | 2014-05-15 | 2015-01-07 | 西安工业大学 | 融合深度图和三维模型的人体运动捕捉方法 |
CN106556412A (zh) * | 2016-11-01 | 2017-04-05 | 哈尔滨工程大学 | 一种室内环境下考虑地面约束的rgb‑d视觉里程计方法 |
CN107273831A (zh) * | 2017-06-05 | 2017-10-20 | 苏州大学 | 一种基于球空间的三维目标识别方法 |
CN108898663A (zh) * | 2018-06-13 | 2018-11-27 | 东莞时谛智能科技有限公司 | 一种脚部特征参数驱动标准鞋楦变形方法及系统 |
CN109410238A (zh) * | 2018-09-20 | 2019-03-01 | 中国科学院合肥物质科学研究院 | 一种基于PointNet++网络的枸杞识别计数方法 |
Non-Patent Citations (2)
Title |
---|
Classifying CT Image Data Into Material Fractions by a Scale and Rotation Invariant Edge Model;Iwo W.O.Serlie et al;《IEEE Transactions on Image Processing》;20081119;第16卷(第12期);2891-2904页 * |
基于聚类平面特征的三维点云数据精简算法;王茹等;《计算机工程》;20110531;第37卷(第10期);249-254页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110276266A (zh) | 2019-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110276266B (zh) | 一种基于旋转的点云数据的处理方法、装置及终端设备 | |
Song et al. | Region-based quality estimation network for large-scale person re-identification | |
Jiang et al. | Deep learning-based face super-resolution: A survey | |
Ye et al. | DeepCloud: Ground-based cloud image categorization using deep convolutional features | |
Yue-Hei Ng et al. | Exploiting local features from deep networks for image retrieval | |
Yu et al. | A deep convolutional neural network-based framework for automatic fetal facial standard plane recognition | |
Wang et al. | Large-margin multi-modal deep learning for RGB-D object recognition | |
Sankaranarayanan et al. | Unsupervised domain adaptation for semantic segmentation with gans | |
Reddy Mopuri et al. | Object level deep feature pooling for compact image representation | |
Ge et al. | Exploiting local and generic features for accurate skin lesions classification using clinical and dermoscopy imaging | |
Zhang et al. | Image categorization by learning a propagated graphlet path | |
WO2014205231A1 (en) | Deep learning framework for generic object detection | |
CN111339343A (zh) | 图像检索方法、装置、存储介质及设备 | |
JP2017062778A (ja) | 画像のオブジェクトを分類するための方法およびデバイスならびに対応するコンピュータプログラム製品およびコンピュータ可読媒体 | |
TW201237806A (en) | Method for representing a shape of an object represented by a set of points | |
Xu et al. | Weakly supervised deep semantic segmentation using CNN and ELM with semantic candidate regions | |
CN107085731B (zh) | 一种基于rgb-d融合特征与稀疏编码的图像分类方法 | |
Keceli et al. | Combining 2D and 3D deep models for action recognition with depth information | |
Jiang et al. | Joint kernel-based supervised hashing for scalable histopathological image analysis | |
Anvar et al. | Multiview face detection and registration requiring minimal manual intervention | |
Wang et al. | Neural koopman pooling: Control-inspired temporal dynamics encoding for skeleton-based action recognition | |
Lu et al. | Learning-based bipartite graph matching for view-based 3D model retrieval | |
Ahmad et al. | Describing colors, textures and shapes for content based image retrieval-a survey | |
Ahmad et al. | 3D capsule networks for object classification from 3D model data | |
Zarbakhsh et al. | Low-rank sparse coding and region of interest pooling for dynamic 3D facial expression recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |