CN115546549A - 点云分类模型构建方法、点云分类方法、装置及设备 - Google Patents
点云分类模型构建方法、点云分类方法、装置及设备 Download PDFInfo
- Publication number
- CN115546549A CN115546549A CN202211243119.2A CN202211243119A CN115546549A CN 115546549 A CN115546549 A CN 115546549A CN 202211243119 A CN202211243119 A CN 202211243119A CN 115546549 A CN115546549 A CN 115546549A
- Authority
- CN
- China
- Prior art keywords
- layer
- weight
- target
- point cloud
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000010276 construction Methods 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 119
- 230000004927 fusion Effects 0.000 claims abstract description 93
- 230000004913 activation Effects 0.000 claims abstract description 65
- 238000005516 engineering process Methods 0.000 claims abstract description 55
- 238000012545 processing Methods 0.000 claims abstract description 13
- 239000013598 vector Substances 0.000 claims description 22
- 238000004891 communication Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 8
- 230000014509 gene expression Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 238000013135 deep learning Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 4
- 230000002860 competitive effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开点云分类模型构建方法、点云分类方法、装置及设备,本发明涉及数据处理技术领域,用于解决现有技术中点云模型结构复杂、模型推理速度低的问题。包括:获取点云样本数据,搭建模型开始训练,得到初始训练模型;提取初始训练模型的权重;并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合,得到目标一维卷积层;并利用结构重参数化技术,将线性层以及激活层进行权重融合,得到目标线性层;基于目标一维卷积层以及目标线性层,构建得到无分支的目标点云分类模型。将模型进行权重融合化为基本由一维卷积层以及目标线性层组成的无分支简单结构网络,以此降低模型复杂度,提升模型推理速度。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及点云分类模型构建方法、点云分类方法、装置及设备。
背景技术
基于深度学习的点云分类模型发展迅速,其已经逐渐被应用到各个领域中,如人脸识别、机器人的物体识别、无人驾驶的障碍检测等。随着激光雷达的廉价普及,点云开始广泛应用于自动驾驶、机器人、AR/VR。点云作为三维世界主要的信息表示,已经是目前三维视觉炙手可热的研究热点,其研究方向包括点云分类、点云分割、点云检测等方向。其中点云分类作为三维点云基础任务,在相关应用场景检测识别都有非常广泛的应用。
目前点云处理技术最常用的是基于深度学习的方法,其在分类检测等领域已经取得了显著的成就。但是相比传统的技术而言,深度学习对计算力有一定的要求,其性能在计算资源不足的场景下受限,同时自动驾驶、AR等领域对算法模型的实时性十分严苛,这给算法的优化加速带来了挑战。复杂的模型结构使得模型推理速度较低,现有融合技术无法融合像ResNet一样的残差连接大层的问题。
发明内容
本发明的目的在于提供点云分类模型构建方法、点云分类方法、装置及设备,用于解决现有技术中点云模型结构复杂、模型推理速度低的问题。
为了实现上述目的,本发明提供如下技术方案:
第一方面,本发明提供点云分类模型构建方法,包括:
获取点云样本数据,搭建模型开始训练,得到初始训练模型;所述初始训练模型包括残差层、一维卷积层、线性层以及激活层;
提取所述初始训练模型的权重;
利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,得到目标一维卷积层;
根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,得到目标线性层;
基于所述目标一维卷积层以及所述目标线性层,构建得到无分支的目标点云分类模型。
第二方面,本发明提供点云分类方法,包括:
获取待分类点云数据;
提取所述待分类点云数据的特征向量;
将所述特征向量输入目标点云分类模型中,得到分类结果;所述目标点云分类模型是基于目标一维卷积层以及目标线性层构建得到的无分支网络;所述目标一维卷积层是提取初始训练模型的权重,并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合得到的;所述目标线性层是根据所述权重,利用所述结构重参数化技术,将所述初始训练模型中的线性层以及激活层进行权重融合得到的。
第三方面,本发明提供点云分类模型构建装置,包括:
初始训练模型搭建模块,用于获取点云样本数据,搭建模型开始训练,得到初始训练模型;所述初始训练模型包括残差层、一维卷积层、线性层以及激活层;
权重提取模块,用于提取所述初始训练模型的权重;
第一权重融合模块,用于利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,得到目标一维卷积层;
第二权重融合模块,用于根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,得到目标线性层;
目标点云分类模型构建模块,用于基于所述目标一维卷积层以及所述目标线性层,构建得到无分支的目标点云分类模型。
第四方面,本发明提供点云分类装置,包括:
待分类点云数据获取模块,用于获取待分类点云数据;
特征向量提取模块,用于提取所述待分类点云数据的特征向量;
分类模块,用于将所述特征向量输入目标点云分类模型中,得到分类结果;所述目标点云分类模型是基于目标一维卷积层以及目标线性层构建得到的无分支网络;所述目标一维卷积层是提取初始训练模型的权重,并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合得到的;所述目标线性层是根据所述权重,利用所述结构重参数化技术,将所述初始训练模型中的线性层以及激活层进行权重融合得到的。
第五方面,本发明提供点云分类模型构建方法设备,包括:
通信单元/通信接口,用于获取点云样本数据,搭建模型开始训练,得到初始训练模型;所述初始训练模型包括残差层、一维卷积层、线性层以及激活层;
处理单元/处理器,用于提取所述初始训练模型的权重;
利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,得到目标一维卷积层;
根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,得到目标线性层;
基于所述目标一维卷积层以及所述目标线性层,构建得到无分支的目标点云分类模型。
第六方面,本发明提供点云分类设备,包括:
通信单元/通信接口,用于获取待分类点云数据;
处理单元/处理器,用于提取所述待分类点云数据的特征向量;
将所述特征向量输入目标点云分类模型中,得到分类结果;所述目标点云分类模型是基于目标一维卷积层以及目标线性层构建得到的无分支网络;所述目标一维卷积层是提取初始训练模型的权重,并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合得到的;所述目标线性层是根据所述权重,利用所述结构重参数化技术,将所述初始训练模型中的线性层以及激活层进行权重融合得到的。
与现有技术相比,本发明提供点云分类模型构建方法、点云分类方法、装置及设备。点云分类模型构建方法通过获取点云样本数据,搭建模型开始训练,得到包括残差层、一维卷积层、线性层以及激活层的初始训练模型;提取初始训练模型的权重;并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合,得到目标一维卷积层;根据权重,利用结构重参数化技术,将线性层以及激活层进行权重融合,得到目标线性层;基于目标一维卷积层以及目标线性层,构建得到无分支的目标点云分类模型。训练阶段具有多分支残差结构以及大量BN层,模型具有良好的表征能力,经过训练后容易取得具有竞争力的性能,推理阶段时将模型进行权重融合,化为基本由一维卷积层以及目标线性层组成的无分支简单结构网络,以此降低模型复杂度,提升模型推理速度。
点云分类方法采用构建的目标点云分类模型进行点云分类,可以提高分类效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明提供的点云分类模型构建方法的流程示意图;
图2为本发明提供的点云分类模型构建方法中基于结构重参数化进行权重融合的原理示意图;
图3为本发明提供的点云分类方法的流程示意图;
图4为本发明提供的供点云分类模型构建装置结构示意图;
图5为本发明提供的供点云分类装置结构示意图;
图6为本发明提供的电子设备结构示意图。
具体实施方式
为了便于清楚描述本发明实施例的技术方案,在本发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一阈值和第二阈值仅仅是为了区分不同的阈值,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
需要说明的是,本发明中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
本发明中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,a和b的结合,a和c的结合,b和c的结合,或a、b和c的结合,其中a,b,c可以是单个,也可以是多个。
目前点云处理技术最常用的是基于深度学习的方法,其在分类检测等领域已经取得了显著的成就。但是相比传统的技术而言,深度学习对计算力有一定的要求,其性能在计算资源不足的场景下受限,同时自动驾驶、AR等领域对算法模型的实时性十分严苛,这给算法的优化加速带来了挑战。复杂的模型结构使得模型推理速度较低,现有融合技术无法融合像ResNet一样的残差连接大层的问题。
现有技术中,中国专利(CN114611700A)提出了一种基于Conv2D算子的结构重参数化,其基本方法思路是融合Conv2D_1x1分支和Conv2D_3x3分支,解决了现有融合技术无法融合像ResNet一样的残差连接大层的问题。但是其局限与Conv2D算子,而点云处理经典算法PointNet用到了大量的Conv1D算子。
对此,本发明提供一个适用于Conv1D算子的结构重参数化技术,便于扩展到点云领域。
接下来,结合附图对本说明书实施例提供的方案进行说明:
实施例1
图1为本发明提供的点云分类模型构建方法的流程示意图,如图1所示,该流程可以包括以下步骤:
步骤110:获取点云样本数据,搭建模型开始训练,得到初始训练模型;所述初始训练模型包括残差层、一维卷积层、线性层以及激活层。
点云数据(point cloud data)是指在一个三维坐标系统中的一组向量的集合。点云数据除了具有几何位置以外,有的还有颜色信息。颜色信息通常是通过相机获取彩色影像,然后将对应位置的像素的颜色信息(RGB)赋予点云中对应的点。强度信息的获取是激光扫描仪接收装置采集到的回波强度,此强度信息与目标的表面材质、粗糙度、入射角方向,以及仪器的发射能量,激光波长有关。
初始训练模型中至少可以包括残差层、一维卷积层、线性层以及激活层。其中,一维卷积(Conv1D)是在width或者height方向上进行滑动窗口并相乘求和。自然语言处理中一个句子序列是一维的,所以使用Conv1D,此时卷积核除去chanel,也是一维的。
一般将卷积神经网络看成两部分:特征提取层以及任务相关层。其中,特征提取层有一系列的Conv、ReLU、Pool等网络层串联或并联,最终得到特征图。任务相关层,比如用全连接层对得到的特征图做回归任务,拟合分布等。在图像分类中,经常使用全连接层输出每个类别的概率,但全连接层也有说法是线性变换层+激活函数+线性变换层+......,多层感知机。当输入特征被一个线性(Linear)层接收时,以一个展平成一维张量的形式接收,然后乘以权重矩阵。这个矩阵乘法产生输出特征。
与激活函数层、卷积层、全连接层、池化层一样,激活层(Batch Normalization,简称BN)也属于网络的一层。在网络的每一层输入的时候,又插入了一个归一化层,也就是先做一个归一化处理(归一化至:均值0、方差为1),然后再进入网络的下一层。BN就是对不同样本的同一特征做归一化。BN层的作用主要有:加快网络的训练和收敛的速度、控制梯度爆炸防止梯度消失、防止过拟合。
步骤110中经过训练之后的初始训练模型虽然具有良好的性能,但是其具有一定的复杂度和计算量,一定程度限制了模型推理速度。因此,采用步骤120-150中的方案解决这一问题。
步骤120:提取所述初始训练模型的权重。
将训练得到的初始训练模型的模型权重(weight)提取出来,用于后续的权重融合。
步骤130:利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,得到目标一维卷积层。
结构重参数化(structural re-parameterization)可以指的是首先构造用于训练的一系列结构,并将其参数等价转换为用于推理或部署的另一组参数,从而将这一系列结构等价转换为另一系列结构。训练时的结构对应一组参数,推理时的结构对应另一组参数;只要能把前者的参数等价转换为后者,就可以将前者的结构等价转换为后者。结构A对应一组参数X,结构B对应一组参数Y,如果我们能将X等价转换为Y,就能将结构A等价转换为B。
步骤140:根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,得到目标线性层。
步骤150:基于所述目标一维卷积层以及所述目标线性层,构建得到无分支的目标点云分类模型。
图1中的方法,点云分类模型构建方法通过获取点云样本数据,搭建模型开始训练,得到包括残差层、一维卷积层、线性层以及激活层的初始训练模型;提取初始训练模型的权重;并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合,得到目标一维卷积层;根据权重,利用结构重参数化技术,将线性层以及激活层进行权重融合,得到目标线性层;基于目标一维卷积层以及目标线性层,构建得到无分支的目标点云分类模型。训练阶段具有多分支残差结构以及大量BN层,模型具有良好的表征能力,经过训练后容易取得具有竞争力的性能,推理阶段时将模型进行权重融合,化为基本由一维卷积层以及目标线性层组成的无分支简单结构网络,以此降低模型复杂度,提升模型推理速度。
换句话说,本方案中提供的方法,训练阶段具有多分支残差结构以及大量BN层,模型具有良好的表征能力,经过训练后容易取得具有竞争力的性能,推理阶段时将模型进行权重融合,化为基本由Conv1D组成的简单结构网络,以此降低模型复杂度和提升模型推理速度。
图1中的方法对应的实现原理可以结合图2进行说明。图2为本发明提供的点云分类模型构建方法中基于结构重参数化进行权重融合的原理示意图。如图2所示,基于Conv1D层、Linear层和BN层搭建点云分类模型,利用点云分类数据对模型进行训练,训练后得到模型的权重,将模型的Conv1D层权重和BN层权重进行融合,重参数化为一个Conv1D层,除此之外也包括Linear层和BN层的权重融合,重参数化为一个Linear层。权重融合后,将模型结构简化为基本由Conv1D组成的简单结构网络。
基于图1的方法,本说明书实施例还提供了该方法的一些具体实施方式,下面进行说明。
可选的,步骤130具体可以包括:
利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合;将一维卷积层分支和激活层分支进行融合;其中,所述初始训练模型的融合残差层为Conv1D算子,重参数化为一个一维卷积层。
可选的,步骤140具体可以包括:
根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,去除BN算子,得到目标线性层;其中,重参数化为一个线性层。
进一步地,一维卷积层以及所述激活层进行权重融合时,可以采用以下实现方式:
采用公式(1):
Conv1D(x)=Wconvld*x+bconvld (1)
进行Conv1D运算,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,其中,输入为x∈RB*C*N,B表示Batch Size,C表示输入特征通道数,N表示输入特征个数,Wconv1d表示权重,bconv1d表示偏置;
采用公式(2):
进行BN运算,其中,γ表示BN层的缩放系数,mean表示BN层均值,var表示BN层方差,β表示BN层的偏移系数,则如公式(3)的计算过程:
令:
Conv1D′(x)=W′conv1d*x+b′conv1d=BN(Conv1D(x)) (4)
通过上述步骤完成权重融合。
进一步地,将一维卷积层分支和激活层分支进行融合,具体实现方式为:
多分支残差层运算为公式(5)的计算过程:
令:
融合得到目标一维卷积层表达式为公式(6):
Conv1Dresiduals(x)=Wresiduals*x+bresiduals=BN(Conv1D(x))+BN (6)
融合残差层为Conv1D算子,完成权重融合。
在融合了Conv1D层权重和BN层权重之后,还需要将线性层以及激活层进行权重融合,去除BN算子,得到目标线性层,具体可以包括:
采用公式(7)线性层以及激活层进行权重融合:
其中,输入为x∈RB*K,B表示Batch Size,K表示分类类别数,Wlinear表示线性层权重,blinear表示线性层偏置;令:
融合得到目标线性层如公式(8):
Lineat(x)′=W′lineat(x)+b′linear=BN(Lineat(x)) (8)
最后训练模型权重经过上述的结构重参数化大幅度降低模型复杂度,转为由Conv1D、ReLU、Linear等组成的简单无分支的直筒式网络,表达式为:
Model(x)≈Linear(Max(Relu(Conv1D(Relu(Conv1D(...)))))。
本方案在ModelNet40数据集上进行训练,最终模型的精度为89.3%,进行结构重参数化后模型的推理速度为,虽然精度性能和目前前沿点云分类算法还有微小的差距,但是其训练收敛速度和推理速度相比前沿点云分类算法具有极大的竞争力,可以在计算资源受限的条件下发挥更好的性能。
通过具体应用比对,以配置为V10032G为例:现有技术中的模型的吞吐量(Throughput)为105sample/s,准确率(Acc)为89.2%;本方案的目标分类模型的吞吐量(Throughput)为201sample/s,准确率(Acc)为89.3%。
与现有技术相比,本发明的有益效果是:引进残差模块,训练时可以加速网络收敛,收敛速度明显优于PointNet、PointNet++等网络。提出了基于Conv1D的结构重参数化来解耦训练模型和推理模型,使得复杂的训练模型可以通过权重融合转为简单的推理模型并保持性能不变。简单的模型结构不仅加速了模型推理速度,同时极大方便了模型在各个硬件平台的底层部署。
上述实施例1中提出构建点云分类模型的方法,训练完成之后,可以采用训练完成的目标点云分类模型应用至具体的应用场景中进行分类。具体可以结合实施例2进行说明:
实施例2
图3为本发明提供的点云分类方法的流程示意图,如图3所示,该流程可以包括以下步骤:
步骤310:获取待分类点云数据。
步骤320:提取所述待分类点云数据的特征向量。
步骤330:将所述特征向量输入目标点云分类模型中,得到分类结果;所述目标点云分类模型是基于目标一维卷积层以及目标线性层构建得到的无分支网络;所述目标一维卷积层是提取初始训练模型的权重,并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合得到的;所述目标线性层是根据所述权重,利用所述结构重参数化技术,将所述初始训练模型中的线性层以及激活层进行权重融合得到的。
实施例2主要是采用实施例1中的目标分类模型完成识别分类。对应的内容解释与实施例1相同,此处不再赘述。
基于同样的思路,对应于实施例1,本发明还提供点云分类模型构建装置,图4为本发明提供的供点云分类模型构建装置结构示意图。如图4所示,所述装置可以包括:
初始训练模型搭建模块410,用于获取点云样本数据,搭建模型开始训练,得到初始训练模型;所述初始训练模型包括残差层、一维卷积层、线性层以及激活层;
权重提取模块420,用于提取所述初始训练模型的权重;
第一权重融合模块430,用于利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,得到目标一维卷积层;
第二权重融合模块440,用于根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,得到目标线性层;
目标点云分类模型构建模块450,用于基于所述目标一维卷积层以及所述目标线性层,构建得到无分支的目标点云分类模型。
基于图4中的装置,还可以包括一些具体的实施单元:
可选的,第一权重融合模块430,具体可以包括:
第一权重融合单元,用于利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合;将一维卷积层分支和激活层分支进行融合;其中,所述初始训练模型的融合残差层为Conv1D算子,重参数化为一个一维卷积层。
可选的,第二权重融合模块440,具体可以包括:
第二权重融合单元,用于根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,去除BN算子,得到目标线性层;其中,重参数化为一个线性层。
可选的,第一权重融合模块430具体可以用于:
采用公式:
Conv1D(x)=Wconv1d*x+bconv1d
Conv1D(x)表示进行Conv1D运算,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,其中,输入为x∈RB*C*N,B表示Batch Size,C表示输入特征通道数,N表示输入特征个数,Wconv1d表示一维卷积层权重,bconv1d表示一维卷积层偏置;
采用公式:
BN(x)表示进行BN运算,其中,γ表示激活层的缩放系数,mean表示激活层均值,var表示激活层方差,β表示激活层的偏移系数,则:
令:
Con1D′(x)=W′conv1d*x+b′conv1d=BN(Conv1D(x)),完成权重融合。
可选的,第二权重融合模块440具体可以用于:
其中,输入为x∈RB*K,B表示Batch Size,K表示分类类别数,Wlinear表示线性层权重,blinear表示线性层偏置;令:
融合得到目标线性层:
Linear(x)′=W′linear(x)+b′linear=BN(Linear(x))。
基于同样的思路,对应于实施例2,本发明还提供点云分类模型构建装置,图5为本发明提供的供点云分类装置结构示意图。如图5所示,所述装置可以包括:
待分类点云数据获取模块510,用于获取待分类点云数据;
特征向量提取模块520,用于提取所述待分类点云数据的特征向量;
分类模块530,用于将所述特征向量输入目标点云分类模型中,得到分类结果;所述目标点云分类模型是基于目标一维卷积层以及目标线性层构建得到的无分支网络;所述目标一维卷积层是提取初始训练模型的权重,并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合得到的;所述目标线性层是根据所述权重,利用所述结构重参数化技术,将所述初始训练模型中的线性层以及激活层进行权重融合得到的。
基于同样的思路,本说明书实施例还提供了点云分类模型构建方法设备以及点云分类设备。图6为本发明提供的电子设备结构示意图。可以包括:
对应于实施例1,通信单元/通信接口,用于获取点云样本数据,搭建模型开始训练,得到初始训练模型;所述初始训练模型包括残差层、一维卷积层、线性层以及激活层;
处理单元/处理器,用于提取所述初始训练模型的权重;
利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,得到目标一维卷积层;
根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,得到目标线性层;
基于所述目标一维卷积层以及所述目标线性层,构建得到无分支的目标点云分类模型。
对应于实施例2,通信单元/通信接口,用于获取待分类点云数据;
处理单元/处理器,用于提取所述待分类点云数据的特征向量;
将所述特征向量输入目标点云分类模型中,得到分类结果;所述目标点云分类模型是基于目标一维卷积层以及目标线性层构建得到的无分支网络;所述目标一维卷积层是提取初始训练模型的权重,并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合得到的;所述目标线性层是根据所述权重,利用所述结构重参数化技术,将所述初始训练模型中的线性层以及激活层进行权重融合得到的。
如图6所示,上述终端设备还可以包括通信线路。通信线路可包括一通路,在上述组件之间传送信息。
可选的,如图6所示,该终端设备还可以包括存储器。存储器用于存储执行本发明方案的计算机执行指令,并由处理器来控制执行。处理器用于执行存储器中存储的计算机执行指令,从而实现本发明实施例提供的方法。
如图6所示,存储器可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路与处理器相连接。存储器也可以和处理器集成在一起。
可选的,本发明实施例中的计算机执行指令也可以称之为应用程序代码,本发明实施例对此不作具体限定。
在具体实现中,作为一种实施例,如图6所示,处理器可以包括一个或多个CPU,如图6中的CPU0和CPU1。
在具体实现中,作为一种实施例,如图6所示,终端设备可以包括多个处理器,如图6中的处理器。这些处理器中的每一个可以是一个单核处理器,也可以是一个多核处理器。
上述主要从各个模块之间交互的角度对本发明实施例提供的方案进行了介绍。可以理解的是,各个模块为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件单元。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本发明实施例可以根据上述方法示例进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
本说明书中的处理器还可以具有存储器的功能。存储器用于存储执行本发明方案的计算机执行指令,并由处理器来控制执行。处理器用于执行存储器中存储的计算机执行指令,从而实现本发明实施例提供的方法。
存储器可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路与处理器相连接。存储器也可以和处理器集成在一起。
可选的,本发明实施例中的计算机执行指令也可以称之为应用程序代码,本发明实施例对此不作具体限定。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机程序或指令。在计算机上加载和执行所述计算机程序或指令时,全部或部分地执行本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、终端、用户设备或者其它可编程装置。所述计算机程序或指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机程序或指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是集成一个或多个可用介质的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,例如,软盘、硬盘、磁带;也可以是光介质,例如,数字视频光盘(digital video disc,DVD);还可以是半导体介质,例如,固态硬盘(solid state drive,SSD)。
尽管在此结合各实施例对本发明进行了描述,然而,在实施所要求保护的本发明过程中,本领域技术人员通过查看附图、公开内容、以及所附权利要求书,可理解并实现公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
尽管结合具体特征及其实施例对本发明进行了描述,显而易见的,在不脱离本发明的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本发明的示例性说明,且视为已覆盖本发明范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
Claims (10)
1.点云分类模型构建方法,其特征在于,包括:
获取点云样本数据,搭建模型开始训练,得到初始训练模型;所述初始训练模型包括残差层、一维卷积层、线性层以及激活层;
提取所述初始训练模型的权重;
利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,得到目标一维卷积层;
根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,得到目标线性层;
基于所述目标一维卷积层以及所述目标线性层,构建得到无分支的目标点云分类模型。
2.根据权利要求1所述的方法,其特征在于,利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,得到目标一维卷积层,具体包括:
利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合;将一维卷积层分支和激活层分支进行融合;其中,所述初始训练模型的融合残差层为Conv1D算子,重参数化为一个一维卷积层。
3.根据权利要求1所述的方法,其特征在于,根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,得到目标线性层,具体包括:
根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,去除BN算子,得到目标线性层;其中,重参数化为一个线性层。
4.根据权利要求2所述的方法,其特征在于,利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,具体包括:
采用公式:
Conv1D(x)=Wconv1d*x+bconv1d
其中,Conv1D(x)表示进行Conv1D运算,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,其中,输入为x∈RB*C*N,B表示Batch Size,C表示输入特征通道数,N表示输入特征个数,Wconv1d表示一维卷积层权重,bconv1d表示一维卷积层偏置;
采用公式:
其中,BN(x)表示进行BN运算,γ表示激活层的缩放系数,mean表示激活层均值,var表示激活层方差,β表示激活层的偏移系数,则:
令:
6.点云分类方法,其特征在于,包括:
获取待分类点云数据;
提取所述待分类点云数据的特征向量;
将所述特征向量输入目标点云分类模型中,得到分类结果;所述目标点云分类模型是基于目标一维卷积层以及目标线性层构建得到的无分支网络;所述目标一维卷积层是提取初始训练模型的权重,并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合得到的;所述目标线性层是根据所述权重,利用所述结构重参数化技术,将所述初始训练模型中的线性层以及激活层进行权重融合得到的。
7.点云分类模型构建装置,其特征在于,包括:
初始训练模型搭建模块,用于获取点云样本数据,搭建模型开始训练,得到初始训练模型;所述初始训练模型包括残差层、一维卷积层、线性层以及激活层;
权重提取模块,用于提取所述初始训练模型的权重;
第一权重融合模块,用于利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,得到目标一维卷积层;
第二权重融合模块,用于根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,得到目标线性层;
目标点云分类模型构建模块,用于基于所述目标一维卷积层以及所述目标线性层,构建得到无分支的目标点云分类模型。
8.点云分类装置,其特征在于,包括:
待分类点云数据获取模块,用于获取待分类点云数据;
特征向量提取模块,用于提取所述待分类点云数据的特征向量;
分类模块,用于将所述特征向量输入目标点云分类模型中,得到分类结果;所述目标点云分类模型是基于目标一维卷积层以及目标线性层构建得到的无分支网络;所述目标一维卷积层是提取初始训练模型的权重,并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合得到的;所述目标线性层是根据所述权重,利用所述结构重参数化技术,将所述初始训练模型中的线性层以及激活层进行权重融合得到的。
9.点云分类模型构建方法设备,其特征在于,包括:
通信单元/通信接口,用于获取点云样本数据,搭建模型开始训练,得到初始训练模型;所述初始训练模型包括残差层、一维卷积层、线性层以及激活层;
处理单元/处理器,用于提取所述初始训练模型的权重;
利用结构重参数化技术,将所述初始训练模型中的所述一维卷积层以及所述激活层进行权重融合,得到目标一维卷积层;
根据所述权重,利用所述结构重参数化技术,将所述线性层以及所述激活层进行权重融合,得到目标线性层;
基于所述目标一维卷积层以及所述目标线性层,构建得到无分支的目标点云分类模型。
10.点云分类设备,其特征在于,包括:
通信单元/通信接口,用于获取待分类点云数据;
处理单元/处理器,用于提取所述待分类点云数据的特征向量;
将所述特征向量输入目标点云分类模型中,得到分类结果;所述目标点云分类模型是基于目标一维卷积层以及目标线性层构建得到的无分支网络;所述目标一维卷积层是提取初始训练模型的权重,并利用结构重参数化技术,将初始训练模型中的一维卷积层以及激活层进行权重融合得到的;所述目标线性层是根据所述权重,利用所述结构重参数化技术,将所述初始训练模型中的线性层以及激活层进行权重融合得到的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211243119.2A CN115546549A (zh) | 2022-10-11 | 2022-10-11 | 点云分类模型构建方法、点云分类方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211243119.2A CN115546549A (zh) | 2022-10-11 | 2022-10-11 | 点云分类模型构建方法、点云分类方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115546549A true CN115546549A (zh) | 2022-12-30 |
Family
ID=84733993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211243119.2A Pending CN115546549A (zh) | 2022-10-11 | 2022-10-11 | 点云分类模型构建方法、点云分类方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115546549A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116910566A (zh) * | 2023-09-12 | 2023-10-20 | 深圳须弥云图空间科技有限公司 | 一种目标识别模型训练方法和装置 |
CN117392672A (zh) * | 2023-12-11 | 2024-01-12 | 季华实验室 | 流式细胞分类模型的获取方法、分类方法及相关设备 |
-
2022
- 2022-10-11 CN CN202211243119.2A patent/CN115546549A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116910566A (zh) * | 2023-09-12 | 2023-10-20 | 深圳须弥云图空间科技有限公司 | 一种目标识别模型训练方法和装置 |
CN116910566B (zh) * | 2023-09-12 | 2024-01-05 | 深圳须弥云图空间科技有限公司 | 一种目标识别模型训练方法和装置 |
CN117392672A (zh) * | 2023-12-11 | 2024-01-12 | 季华实验室 | 流式细胞分类模型的获取方法、分类方法及相关设备 |
CN117392672B (zh) * | 2023-12-11 | 2024-03-19 | 季华实验室 | 流式细胞分类模型的获取方法、分类方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111797893B (zh) | 一种神经网络的训练方法、图像分类系统及相关设备 | |
CN110175671B (zh) | 神经网络的构建方法、图像处理方法及装置 | |
CN113705769B (zh) | 一种神经网络训练方法以及装置 | |
US20220215227A1 (en) | Neural Architecture Search Method, Image Processing Method And Apparatus, And Storage Medium | |
CN112990211B (zh) | 一种神经网络的训练方法、图像处理方法以及装置 | |
US20220375213A1 (en) | Processing Apparatus and Method and Storage Medium | |
CN111507378A (zh) | 训练图像处理模型的方法和装置 | |
CN111797983A (zh) | 一种神经网络构建方法以及装置 | |
CN112529015A (zh) | 一种基于几何解缠的三维点云处理方法、装置及设备 | |
CN113570029A (zh) | 获取神经网络模型的方法、图像处理方法及装置 | |
CN110222718B (zh) | 图像处理的方法及装置 | |
CN115546549A (zh) | 点云分类模型构建方法、点云分类方法、装置及设备 | |
WO2021218470A1 (zh) | 一种神经网络优化方法以及装置 | |
CN111382868A (zh) | 神经网络结构搜索方法和神经网络结构搜索装置 | |
CN111797970B (zh) | 训练神经网络的方法和装置 | |
CN113807399A (zh) | 一种神经网络训练方法、检测方法以及装置 | |
Dai | Real-time and accurate object detection on edge device with TensorFlow Lite | |
CN111931901A (zh) | 一种神经网络构建方法以及装置 | |
CN114419570A (zh) | 一种点云数据识别方法、装置、电子设备及存储介质 | |
CN111738403A (zh) | 一种神经网络的优化方法及相关设备 | |
CN113516227A (zh) | 一种基于联邦学习的神经网络训练方法及设备 | |
WO2021190433A1 (zh) | 更新物体识别模型的方法和装置 | |
CN113011568A (zh) | 一种模型的训练方法、数据处理方法及设备 | |
CN114746868A (zh) | 编译神经网络模型的方法和装置 | |
CN115018039A (zh) | 一种神经网络蒸馏方法、目标检测方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |