CN108960326B

CN108960326B - 一种基于深度学习框架的点云快速分割方法及其系统

Info

Publication number: CN108960326B
Application number: CN201810721795.3A
Authority: CN
Inventors: 徐楷; 冯良炳
Original assignee: Shenzhen Institute of Advanced Technology of CAS
Current assignee: Shenzhen Institute of Advanced Technology of CAS
Priority date: 2018-07-04
Filing date: 2018-07-04
Publication date: 2021-03-23
Anticipated expiration: 2038-07-04
Also published as: CN108960326A

Abstract

本发明涉及计算机视觉技术领域，特别涉及一种基于深度学习框架的点云快速分割方法及其系统；本发明从深度学习框架内的点网中公开的点云数据选取适合输入卷积神经网络的数据集；再组织该数据集的数据格式且进行数据预处理；然后构建一个深层的卷积神经网络；再对该卷积神经网络进行测试训练；最后进行网络性能的评估；本发明有效地提高了特征利用率和特征传播速度，加速了网络收敛速度同时在不降低网络预测性能的前提下极大地减少了网络的参数而减少了冗余，降低了学习成本。

Description

一种基于深度学习框架的点云快速分割方法及其系统

技术领域

本发明涉及计算机视觉技术领域，特别涉及一种基于深度学习框架的点云快速分割方法及其系统。

背景技术

目前卷积神经网络要求高度规则化的输入数据格式，如图片网格化和3D体素来确保权重共享；点云拥有简单统一的结构，如(x,y,z)三个坐标轴的坐标值，因此点云可以避免不规则的组合和复杂的网格化并且容易学习，从而点云经常作为卷积神经网络的输入数据格式来使用，然而点云数据不是规则化的格式，如果将点云转化为规则化的3D体素或图片，然后作为卷积神经网络的输入格式，这样会引入人为误差。

深度学习框架具备在3D数据上的有效且灵活的操作，点网是一种统一的体系结构，它可以直接将点云作为输入和输出深度学习框架，其是为整个输入提供的类标签或为输入的每个点提供的语义/部分标签；点网可以针对点集的无序性和不规则化性，然而点网内在特征提取上存在冗余且同时特征传播速度与特征利用程度比较慢。

发明内容

本发明主要解决的技术问题是提供一种基于深度学习框架的点云快速分割方法，其通过使用密集的快捷连接来提高特征利用率与特征传播速度，同时为了减少冗余，因此在保证性能的同时减少了网络的训练代价；还提供一种基于深度学习框架的点云快速分割系统。

为解决上述技术问题，本发明采用的一个技术方案是：提供一种基于深度学习框架的点云快速分割方法，其中，包括如下步骤：

步骤S1、从深度学习框架内的点网中公开的点云数据选取适合输入卷积神经网络的数据集；

步骤S2、组织该数据集的数据格式并与读取该数据集的代码相匹配从而进行数据预处理，使该数据格式的数据样本分为数据集、验证集、测试集；

步骤S3、根据步骤S2中的数据集的数据特征构建一个深层的卷积神经网络；

步骤S4、通过深度学习框架对该卷积神经网络进行测试训练，得到训练好的卷积神经网；

步骤S5、使用步骤S4中的训练好的卷积神经网络在测试集上进行网络性能的评估。

作为本发明的一种改进，在步骤S1内，选取的数据集为斯坦福室内场景3D数据集。

作为本发明的进一步改进，在步骤S2内，数据预处理是指读取该数据集的代码将步骤S1中的数据集进行重新组织产生适合点网输入的数据格式。

作为本发明的更进一步改进，在步骤S3内，数据特征包括网络深度和网络层之间的连接方式。

作为本发明的更进一步改进，在步骤S3内，数据特征还包括卷积核大小和每层卷积的特征图个数。

作为本发明的更进一步改进，在步骤S3内，数据特征还包括步长的大小。

作为本发明的更进一步改进，在步骤S4内，该卷积神经网络先在验证集内进行实验。

作为本发明的更进一步改进，在步骤S4内，该测试训练的优化算法采用自适应矩估计算法。

作为本发明的更进一步改进，在步骤S5内，根据积神经网络在测试集上输出的逐点的分类准确率、部分分割的准确率与平均交并比而来评估该卷积神经网络的最终性能。

一种基于深度学习框架的点云快速分割系统，其中，包括：

选取模块，用于从深度学习框架内的点网中公开的点云数据选取适合输入卷积神经网络的数据集；

预处理模块，用于组织数据集的数据格式并与读取该数据集的代码相匹配从而进行数据预处理，使该数据格式的数据样本分为数据集、验证集、测试集；

构建模块，用于根据预处理模块中的数据集的数据特征构建一个深层的卷积神经网络；

训练模块，用于通过深度学习框架对卷积神经网络进行测试训练；

评估模块，用于使用训练模块中的训练好的卷积神经网络在测试集上进行网络性能的评估。

本发明的有益效果是：与现有技术相比，本发明通过从从深度学习框架内的点网中公开的点云数据选取适合输入卷积神经网络的数据集；再组织该数据集的数据格式且进行数据预处理；然后构建一个深层的卷积神经网络；再对该卷积神经网络进行测试训练；最后进行网络性能的评估；本发明有效地提高了特征利用率和特征传播速度，加速了网络收敛速度同时在不降低网络预测性能的前提下极大地减少了网络的参数而减少了冗余，降低了学习成本。

附图说明

图1是本发明的基于深度学习框架的点云快速分割方法的框图；

图2是本发明的基于深度学习框架的点云快速分割系统的框图。

具体实施方式

本发明提供一种基于深度学习框架的点云快速分割方法。

请参照图1至图2，在本发明中，一种基于深度学习框架的点云快速分割方法，如图2所示，包括如下步骤：

步骤S1、从从深度学习框架内的点网中公开的点云数据选取合适合输入卷积神经网络的数据集；

本发明通过从深度学习框架内的点网中公开的点云数据选取合适合输入卷积神经网络的数据集；再重新组织该数据集的数据格式且进行数据预处理；然后构建一个深层的卷积神经网络；再对该卷积神经网络进行测试训练；最后进行网络性能的评估；本发明有效地提高了特征利用率和特征传播速度，加速了网络收敛速度同时在不降低网络预测性能的前提下极大地减少了网络的参数而减少了冗余，降低了学习成本。

进一步，在步骤S1内，选取的数据集为斯坦福室内场景3D数据集。

再进一步，在步骤S2内，数据预处理是指读取该数据集的代码将步骤S1中的数据集进行重新组织产生适合点网输入的数据格式。

在步骤S3中根据输入数据设计出了卷积神经网络，其核心算法如下：

g^[l]({x₁,x₂,x₃,...x_n})＝g^[l-1]({x₁,x₂,x₃,...x_n})+h^[l-1]({x₁,x₂,x₃,...x_n})，

{x₁,x₂,x₃,...x_n}为网络的输入，g^[l]()为网络第l层的输入，g^[l-1]()为网络第(l-1)层的输入，h^[l-1]()为网络第(l-1)层的输出，以此为基础设计了密集连接的残差块结构，在同一个残差块结构每个卷积网络输出的特征图个数相同，在不同的残差块中每个卷积网络输出的特征图个数不同，且随着网络层数加深，靠后的残差块中每个卷积网络输出的特征图个数明显多以之前的，残差块之间同样通过快捷连接相连，同时可以动态的设定每个残差块中卷积层的个数；将分割问题通过全卷积神经网络来解决。

更再进一步，在步骤S3内，数据特征包括网络深度和网络层之间的连接方式。

更再进一步，在步骤S3内，数据特征还包括卷积核大小和每层卷积的特征图个数。

更再进一步，在步骤S3内，数据特征还包括步长的大小。

更再进一步，在步骤S4内，该卷积神经网络先在验证集内进行实验；验证集内的实验代码采用python语言实现。

更再进一步，在步骤S4内，该测试训练的优化算法采用自适应矩估计算法，在自适应矩估计算法内设置：基础学习率为0.001，学习率衰减为0.05，衰减策略为按步骤衰减，设置的最大的epoch(迭代次数)为70。

还可以在进行网络训练时根据日志信息决定是否提前结束训练或延长训练时间。

更再进一步，在步骤S5内，根据积神经网络在测试集上输出的逐点的分类准确率、部分分割的准确率与平均交并比而来评估该卷积神经网络的最终性能；可以obj文件格式保存预测结果。

在本发明中，具体地实施例操作如下：

1)从深度学习框架内的点网中公开的点云数据选取合适合输入卷积神经网络的数据集，如ModelNet40，ShapeNet part dataset，S3DIS(斯坦福室内场景3D数据集)；

2)组织数据格式使其与读取文件的代码相匹配并进行数据预处理，然后将重新组织的数据样本分为三个部分：数据集、验证集和测试集。

3)构建一个深层的卷积神经网络，具体包括确定网络深度、网络层之间的连接方式、卷积核大小、每层卷积的特征图个数、步长的大小；权重参数的初始化策略、动量、学习率、迭代次数等超参数的设置；优化算法的选择与其参数配置。

4)实验代码采用python语言实现，通过tensorflow深度学习框架进行网络的训练,得到训练好的卷积神经网，经测试训练的超参数设置如下：优化算法使用Adam(Adaptive Moment Estimate自适应矩估计)，基础学习率为0.001，学习率衰减为0.05，衰减策略为按步骤衰减，设置的最大的epoch(迭代次数)为70。

5)使用训练好的深层卷积网络模型对测试数据进行评估，输出逐点的分类准确率、部分分割的准确率与平均交并比，来评估网络的最终性能。

该实施例经过实验证明可行，结果如下：

表一：

	params	time/epoch
			PointNet	8.6M	274s
Ours	3.7M	198s

注：M：代表百万，现有技术点网参数为8.6M，本发明中参数为3.7M，在相同的训练集中点网迭代一次需274秒，本实验需要198秒。

表二：

表二中第一行为点网在测试集的预测结果，第二行为本算法在相同测试集上的预测结果；其中的评价标准为第二列表格中的数据平均化的交并比，其值越高代表网络性能越好。

如图2所示，本发明中一种基于深度学习框架的点云快速分割系统，包括：

选取模块，用于从深度学习框架内的点网中公开的点云数据选取合适合输入卷积神经网络的数据集；

与现有技术相比，本发明有效的提高了特征利用率，特征传播速度，加速了网络收敛速度同时在不降低网络预测性能的前提下极大地减少了网络的参数或减少了冗余，降低了学习成本。

以上所述仅为本发明的实施方式，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于深度学习框架的三维室内场景的点云快速分割方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于深度学习框架的三维室内场景的点云快速分割方法，其特征在于，在步骤S1内，选取的数据集为斯坦福室内场景3D数据集。

3.根据权利要求2所述的一种基于深度学习框架的三维室内场景的点云快速分割方法，其特征在于，在步骤S2内，数据预处理是指读取该数据集的代码将步骤S1中的数据集进行重新组织产生适合点网输入的数据格式。

4.根据权利要求3所述的一种基于深度学习框架的三维室内场景的点云快速分割方法，其特征在于，在步骤S3内，数据特征包括网络深度和网络层之间的连接方式。

5.根据权利要求4所述的一种基于深度学习框架的三维室内场景的点云快速分割方法，其特征在于，在步骤S3内，数据特征还包括卷积核大小和每层卷积的特征图个数。

6.根据权利要求5所述的一种基于深度学习框架的三维室内场景的点云快速分割方法，其特征在于，在步骤S3内，数据特征还包括步长的大小。

7.根据权利要求6所述的一种基于深度学习框架的三维室内场景的点云快速分割方法，其特征在于，在步骤S4内，该卷积神经网络先在验证集内进行实验。

8.根据权利要求7所述的一种基于深度学习框架的三维室内场景的点云快速分割方法，其特征在于，在步骤S4内，该测试训练的优化算法采用自适应矩估计算法。

9.根据权利要求8所述的一种基于深度学习框架的三维室内场景的点云快速分割方法，其特征在于，在步骤S5内，根据积神经网络在测试集上输出的逐点的分类准确率、部分分割的准确率与平均交并比而来评估该卷积神经网络的最终性能。

10.一种基于深度学习框架的三维室内场景的点云快速分割系统，其特征在于，包括：

训练模块，用于通过深度学习框架对卷积神经网络进行测试训练，得到训练好的卷积神经网；