CN116824188A

CN116824188A - 一种基于多神经网络集成学习的吊物类型识别方法及系统

Info

Publication number: CN116824188A
Application number: CN202310652099.2A
Authority: CN
Inventors: 姜贺; 安民洙; 葛晓东
Original assignee: Guangdong Light Speed Intelligent Equipment Co ltd; Tenghui Technology Building Intelligence Shenzhen Co ltd
Current assignee: Guangdong Light Speed Intelligent Equipment Co ltd; Tenghui Technology Building Intelligence Shenzhen Co ltd
Priority date: 2023-06-05
Filing date: 2023-06-05
Publication date: 2023-09-29
Anticipated expiration: 2043-06-05
Also published as: CN116824188B

Abstract

本发明公开了一种基于多神经网络集成学习的吊物类型识别方法及系统，包括：基于收集的吊物激光雷达点云数据和三个特征提取神经网络对吊物识别神经网络进行训练，得到训练完成的吊物识别神经网络；将吊钩的高度值下方的点云进行欧式聚类，获取体积最大的聚类联通体作为吊物识别的输入点云；利用三个特征提取神经网络对输入点云进行特征提取，得到三个特征向量，并进行并联扩展，形成高维特征向量；对高维特征向量进行范数归一化，得到归一化高维特征向量，并将归一化高维特征向量输入到训练完成的吊物识别神经网络；利用训练完成的吊物识别神经网络对归一化高维特征向量进行推理，获得吊物类型。本发明达到大幅提高吊物类型识别的稳定性的目的。

Description

一种基于多神经网络集成学习的吊物类型识别方法及系统

技术领域

本发明涉及吊物识别技术领域，具体涉及一种基于多神经网络集成学习的吊物类型识别方法及系统。

背景技术

在塔吊的自动驾驶中，塔吊吊物的类型识别具有重要意义。一般使用面阵激光雷达，将视口垂直向下对吊物进行观测。由于吊物的类型多样，形态各异，识别的挑战性较大。目前深度学习是主流方法，但是不同的深度神经网络对不同类型物体的表达能力是不同的，采用单一架构的深度神经网络很难保证基于点云的吊物识别的可靠性。

基于深度学习的点云目标识别方法有多种类型，比较典型的方法包括：(1)基于体素或多视图的方法；(2)基于原始点云排列不变性的方法；(3)基于点云局部特征的方法等。基于体素的方法通过在3位空间构建网格(体素)并用3维卷积运算构建神经网络实现目标识别。或将原始点云投影到多个二维平面，再通过多通道的二维卷积实现神经网络搭建。基于原始点云排序不变形的方法直接利用原始点云，通过层级下采样与共享的多层感知机来捕捉细节信息，最后利用最大池化将所有点的信息聚合得到全局特征。基于点云局部特征的方法根据某种距离度量方式选择节点的近邻，动态生成神经网络的每一层，能够最大化的充分利用点云局部结构信息。上述方法的原理和出发点不同，因此都有独特的应用场景。

在塔吊的吊物识别任务中，吊物的形态差异化极大，并且在远端存在点云稀疏的现象。使用前述的任何一种方法都很难获得稳定的识别效果。

发明内容

为了克服现有技术的不足，本发明提供一种基于多神经网络集成学习的吊物类型识别方法及系统，用于解决现有技术在对塔吊吊物的类型进行识别时难以获得稳定的识别效果的技术问题，从而达到大幅提高吊物类型识别的稳定性的目的。

为解决上述问题，本发明所采用的技术方案如下：

一种基于多神经网络集成学习的吊物类型识别方法，包括以下步骤：

基于收集的吊物的激光雷达点云数据和三个特征提取神经网络对吊物识别神经网络进行训练，得到训练完成的吊物识别神经网络；

获取塔吊小车吊钩的高度值，并将所述吊钩的高度值下方的点云进行欧式聚类，获取体积最大的聚类联通体作为吊物识别的输入点云；

利用所述三个特征提取神经网络对所述输入点云进行特征提取，得到三个特征向量，并对所述三个特征向量进行并联扩展，形成高维特征向量；

对所述高维特征向量进行范数归一化，得到归一化高维特征向量，并将所述归一化高维特征向量输入到所述训练完成的吊物识别神经网络；

利用所述训练完成的吊物识别神经网络对所述归一化高维特征向量进行推理，获得吊物类型。

作为本发明优选的实施方式，在基于收集的吊物激光雷达点云数据和三个特征提取神经网络对吊物识别神经网络进行训练时，包括：

将激光雷达安装于所述塔吊小车下方，视口方向垂直地面，收集吊物的激光雷达点云数据，并针对每个激光雷达点云数据给定吊物类型标签，得到带有标签的激光雷达点云数据；

其中，每种类别的吊物收集50个激光雷达点云数据，所述50个激光雷达点云数据覆盖10米到100米不同高度。

作为本发明优选的实施方式，在得到带有标签的激光雷达点云数据后，包括：

针对每个所述带有标签的激光雷达点云数据，利用3DmFV神经网络进行特征提取，得到第一训练特征向量；

针对每个所述带有标签的激光雷达点云数据，利用PointNet++神经网络进行特征提取，得到第二训练特征向量；

针对每个所述带有标签的激光雷达点云数据，利用DGCNN神经网络进行特征提取，得到第三训练特征向量；

其中，所述三个特征提取神经网络包括：所述3DmFV神经网络、所述PointNet++神经网络以及所述DGCNN神经网络。

作为本发明优选的实施方式，在利用3DmFV神经网络进行特征提取时，包括：

所述3DmFV神经网络使用FisherVector组织原始点云，并级联CNN进行特征提取，得到所述第一训练特征向量。

作为本发明优选的实施方式，在利用PointNet++神经网络进行特征提取时，包括：

所述PointNet++神经网络在保持原始点云的排列顺序的情况下，通过MLP完成特征捕获，再级联CNN获取全局语义，得到所述第二训练特征向量。

作为本发明优选的实施方式，在利用DGCNN神经网络进行特征提取时，包括：

所述DGCNN神经网络基于局部拓扑关系动态调整神经网络每层的架构后，进行特征提取，得到所述第三训练特征向量。

作为本发明优选的实施方式，在得到所述第一训练特征向量、所述第二训练特征向量以及所述第三训练特征向量后，包括：

将所述第一训练特征向量、所述第二训练特征向量以及所述第三训练特征向量并联扩展为训练高维特征向量，并将所述训练高维特征向量进行范数归一化，得到归一化训练高维特征向量；

利用所述归一化训练高维特征向量对所述吊物识别神经网络进行训练，得到所述训练完成的吊物识别神经网络。

作为本发明优选的实施方式，在利用所述归一化训练高维特征向量对所述吊物识别神经网络进行训练时，包括：

利用所述归一化训练高维特征向量训练一个包含2个隐含层，并且每个隐含层有512个神经元的多层感知机神经网络；

其中，所述多层感知机神经网络的输出为Softmax形式，输出层节点个数为吊物类别数量。

作为本发明优选的实施方式，利用所述三个特征提取神经网络对所述输入点云进行特征提取时，包括：

利用3DmFV神经网络对所述输入点云进行特征提取，得到第一特征向量；

利用PointNet++神经网络对所述输入点云进行特征提取，得到第二特征向量；

利用DGCNN神经网络对所述输入点云进行特征提取，得到第三特征向量；

其中，所述三个特征提取神经网络包括：所述3DmFV神经网络、所述PointNet++神经网络以及所述DGCNN神经网络；所述三个特征向量包括：所述第一特征向量、所述第二特征向量以及所述第三特征向量。

一种基于多神经网络集成学习的吊物类型识别系统，包括：

训练单元：用于基于收集的吊物的激光雷达点云数据和三个特征提取神经网络对吊物识别神经网络进行训练，得到训练完成的吊物识别神经网络；

输入点云获取单元；用于获取塔吊小车吊钩的高度值，并将所述吊钩的高度值下方的点云进行欧式聚类，获取体积最大的聚类联通体作为吊物识别的输入点云；

高维特征向量获取单元：用于利用所述三个特征提取神经网络对所述输入点云进行特征提取，得到三个特征向量，并对所述三个特征向量进行并联扩展，形成高维特征向量；

吊物类型识别单元：用于对所述高维特征向量进行范数归一化，得到归一化高维特征向量，并将所述归一化高维特征向量输入到所述训练完成的吊物识别神经网络；利用所述训练完成的吊物识别神经网络对所述归一化高维特征向量进行推理，获得吊物类型。

相比现有技术，本发明的有益效果在于：

(1)本发明对同一个吊物点云数据，使用不同的神经网络进行特征提取，对提取的特征再进行集成学习，从而大幅提高吊物类型识别的稳定性；

(2)本发明所采用三个特征提取神经网络在点云的特征提取方面具有极强的互补性，将点云经过三个特征提取神经网络的特征提取的结果进行组合，形成更高维度的特征向量，再训练MLP实现高维特征到目标类型的映射，从而完成多个神经网络的集成，并且在使用中，通过三个特征提取神经网络完成特征提取，再基于训练好的MLP完成点云类型识别，从而获得准确的识别结果。

下面结合附图和具体实施方式对本发明作进一步详细说明。

附图说明

图1-是本发明实施例的激光雷达部署示意图；

图2-是本发明实施例的基于多神经网络集成学习的吊物类型识别方法的计算方案流程图；

图3-是本发明实施例的基于多神经网络集成学习的吊物类型识别方法步骤图。

附图标号说明：1、塔吊；2、塔吊小车；3、激光雷达；4、吊物。

具体实施方式

本发明所提供的基于多神经网络集成学习的吊物类型识别方法，如图3所示，包括以下步骤：

步骤S1：基于收集的吊物4的激光雷达点云数据和三个特征提取神经网络对吊物识别神经网络进行训练，得到训练完成的吊物识别神经网络；

步骤S2：获取塔吊小车2吊钩的高度值，并将吊钩的高度值下方的点云进行欧式聚类，获取体积最大的聚类联通体作为吊物识别的输入点云；

步骤S3：利用三个特征提取神经网络对输入点云进行特征提取，得到三个特征向量，并对三个特征向量进行并联扩展，形成高维特征向量；

步骤S4：对高维特征向量进行范数归一化，得到归一化高维特征向量，并将归一化高维特征向量输入到训练完成的吊物识别神经网络；

步骤S5：利用训练完成的吊物识别神经网络对归一化高维特征向量进行推理，获得吊物4类型。

在上述步骤S1中，在基于收集的吊物激光雷达点云数据和三个特征提取神经网络对吊物识别神经网络进行训练时，包括：

将激光雷达3安装于塔吊小车2下方，视口方向垂直地面，收集吊物4的激光雷达点云数据，并针对每个激光雷达点云数据给定吊物类型标签，得到带有标签的激光雷达点云数据；

其中，每种类别的吊物4收集50个激光雷达点云数据，50个激光雷达点云数据覆盖10米到100米不同高度。

具体地，激光雷达3的安装位置如图1所示。

进一步地，在得到带有标签的激光雷达点云数据后，包括：

针对每个带有标签的激光雷达点云数据，利用3DmFV神经网络进行特征提取，得到第一训练特征向量；

针对每个带有标签的激光雷达点云数据，利用PointNet++神经网络进行特征提取，得到第二训练特征向量；

针对每个带有标签的激光雷达点云数据，利用DGCNN神经网络进行特征提取，得到第三训练特征向量；

其中，三个特征提取神经网络包括：3DmFV神经网络、PointNet++神经网络以及DGCNN神经网络。

更进一步地，在利用3DmFV神经网络进行特征提取时，包括：

3DmFV神经网络使用FisherVector组织原始点云，并级联CNN进行特征提取，得到第一训练特征向量。

更进一步地，在利用PointNet++神经网络进行特征提取时，包括：

PointNet++神经网络在保持原始点云的排列顺序的情况下，通过MLP完成特征捕获，再级联CNN获取全局语义，得到第二训练特征向量。

更进一步地，在利用DGCNN神经网络进行特征提取时，包括：

DGCNN神经网络基于局部拓扑关系动态调整神经网络每层的架构后，进行特征提取，得到第三训练特征向量。动态调整神经网络每层的架构后能实现精确的局部信息的利用。

更进一步地，在得到第一训练特征向量、第二训练特征向量以及第三训练特征向量后，包括：

将第一训练特征向量、第二训练特征向量以及第三训练特征向量并联扩展为训练高维特征向量，并将训练高维特征向量进行范数归一化，得到归一化训练高维特征向量；

利用归一化训练高维特征向量对吊物识别神经网络进行训练，得到训练完成的吊物识别神经网络。

具体地，将训练高维特征向量进行范数归一化具体为：将训练高维特征向量进行L2范数归一化。

更进一步地，在利用归一化训练高维特征向量对吊物识别神经网络进行训练时，包括：

利用归一化训练高维特征向量训练一个包含2个隐含层，并且每个隐含层有512个神经元的多层感知机(MLP)神经网络；

其中，多层感知机(MLP)神经网络的输出为Softmax形式，输出层节点个数为吊物类别数量。

具体地，3DmFV神经网络、PointNet++神经网络以及DGCNN神经网络只完成特征提取，而不进行类型判别。三个特征提取神经网络在点云的特征提取方面具有极强的互补性。将点云经过三个特征提取神经网络的特征提取的结果进行组合，形成更高维度的特征向量，再训练多层感知机(MLP)神经网络实现高维特征到目标类型的映射，完成多个神经网络的集成。在训练中，三个特征提取神经网络是冻结状态，不更新，只使用其特征描述能力。在分类决策中，训练更新多层感知机(MLP)神经网络的权重，完成方法的集成。

在上述步骤S2中，获取体积最大的聚类联通体的过程具体为：

首先读取塔吊小车2吊钩的高度数据，将小车正下方，吊钩高度以下10米×10米×10米立方体内的点云进行欧式聚类，获取体积最大的聚类联通体作为吊物识别的输入。

在上述步骤S3中，利用三个特征提取神经网络对输入点云进行特征提取时，包括：

利用3DmFV神经网络对输入点云进行特征提取，得到第一特征向量；

利用PointNet++神经网络对输入点云进行特征提取，得到第二特征向量；

利用DGCNN神经网络对输入点云进行特征提取，得到第三特征向量；

其中，三个特征提取神经网络包括：3DmFV神经网络、PointNet++神经网络以及DGCNN神经网络；三个特征向量包括：第一特征向量、第二特征向量以及第三特征向量。

在上述步骤S4中，对高维特征向量进行范数归一化具体为：对高维特征向量进行L2范数归一化。

本发明所提供的基于多神经网络集成学习的吊物类型识别系统，包括：训练单元、输入点云获取单元、高维特征向量获取单元以及吊物类型识别单元。

训练单元用于基于收集的吊物4的激光雷达点云数据和三个特征提取神经网络对吊物识别神经网络进行训练，得到训练完成的吊物识别神经网络。

输入点云获取单元用于获取塔吊小车2吊钩的高度值，并将吊钩的高度值下方的点云进行欧式聚类，获取体积最大的聚类联通体作为吊物识别的输入点云。

高维特征向量获取单元用于利用三个特征提取神经网络对输入点云进行特征提取，得到三个特征向量，并对三个特征向量进行并联扩展，形成高维特征向量。

吊物类型识别单元用于对高维特征向量进行范数归一化，得到归一化高维特征向量，并将归一化高维特征向量输入到训练完成的吊物识别神经网络；利用训练完成的吊物识别神经网络对归一化高维特征向量进行推理，获得吊物4类型。

图2是本发明识别方法的计算方案流程图，现在结合图1和图2对本发明识别方法的具体流程进行说明：

步骤401到步骤403是吊物识别神经网络的训练过程。

在步骤401中，首先收集吊物4的激光雷达点云数据，每个类别收集50个点云数据，激光雷达3与吊物4的相对位置关系如图1所示，50个点云数据覆盖10米到100米不同高度。给定每个点云数据的吊物类型标签，然后转步骤402。

在步骤402中，针对每个点云数据，计算3DmFV、PointNet++、DGCNN三个特征提取神经网络的特征向量，并将三个特征向量并联扩展为高维特征向量，并对该高维特征向量进行L2范数归一化，然后转步骤403。

在步骤403中，利用三个特征提取神经网络得到的吊物点云高维特征向量，训练一个包含2个隐含层，每个隐含层有512个神经元的多层感知机(MLP)神经网络。多层感知机(MLP)神经网络的输出为Softmax形式，输出层节点个数为吊物类别数量。

步骤404到步骤407为实际应用中的计算步骤。

在步骤404中，读取吊钩高度传感器给出的高度初值，将小车正下方，吊钩高度下方10米×10米×10米内的点云进行欧式聚类，取体积最大的聚类联通体作为吊物识别的输入点云。转步骤405。

在步骤405中，利用3DmFV、PointNet++、DGCNN三个特征提取神经网络分别计算输入点云的特征向量，并联扩展，形成高维特征向量。转步骤406。

在步骤406中，对高维特征向量进行L2范数归一化，得到多层感知机(MLP)神经网络的输入向量。转步骤407。

在步骤407中，利用403步骤中训练得到的多层感知机(MLP)神经网络对输入的归一化高维特征向量进行推理，获得吊物4类型。

相比现有技术，本发明的有益效果在于：

上述实施方式仅为本发明的优选实施方式，不能以此来限定本发明保护的范围，本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

Claims

1.一种基于多神经网络集成学习的吊物类型识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于多神经网络集成学习的吊物类型识别方法，其特征在于，在基于收集的吊物激光雷达点云数据和三个特征提取神经网络对吊物识别神经网络进行训练时，包括：

3.根据权利要求2所述的基于多神经网络集成学习的吊物类型识别方法，其特征在于，在得到带有标签的激光雷达点云数据后，包括：

4.根据权利要求3所述的基于多神经网络集成学习的吊物类型识别方法，其特征在于，在利用3DmFV神经网络进行特征提取时，包括：

5.根据权利要求3所述的基于多神经网络集成学习的吊物类型识别方法，其特征在于，在利用PointNet++神经网络进行特征提取时，包括：

6.根据权利要求3所述的基于多神经网络集成学习的吊物类型识别方法，其特征在于，在利用DGCNN神经网络进行特征提取时，包括：

7.根据权利要求3-6任一项所述的基于多神经网络集成学习的吊物类型识别方法，其特征在于，在得到所述第一训练特征向量、所述第二训练特征向量以及所述第三训练特征向量后，包括：

8.根据权利要求7所述的基于多神经网络集成学习的吊物类型识别方法，其特征在于，在利用所述归一化训练高维特征向量对所述吊物识别神经网络进行训练时，包括：

9.根据权利要求1所述的基于多神经网络集成学习的吊物类型识别方法，其特征在于，利用所述三个特征提取神经网络对所述输入点云进行特征提取时，包括：

10.一种基于多神经网络集成学习的吊物类型识别系统，其特征在于，包括：