CN110245709B - 基于深度学习和自注意力的3d点云数据语义分割方法 - Google Patents

基于深度学习和自注意力的3d点云数据语义分割方法 Download PDF

Info

Publication number
CN110245709B
CN110245709B CN201910526990.5A CN201910526990A CN110245709B CN 110245709 B CN110245709 B CN 110245709B CN 201910526990 A CN201910526990 A CN 201910526990A CN 110245709 B CN110245709 B CN 110245709B
Authority
CN
China
Prior art keywords
point cloud
cloud data
self
semantic segmentation
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910526990.5A
Other languages
English (en)
Other versions
CN110245709A (zh
Inventor
焦李成
李玲玲
张�杰
张格格
马清华
郭雨薇
丁静怡
张梦璇
程曦娜
王佳宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201910526990.5A priority Critical patent/CN110245709B/zh
Publication of CN110245709A publication Critical patent/CN110245709A/zh
Application granted granted Critical
Publication of CN110245709B publication Critical patent/CN110245709B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds

Abstract

本发明提出了一种基于深度学习和自注意力机制的3D点云数据语义分割方法,用于解决现有技术中存在的分割精度较低的技术问题,实现步骤包括:(1)获取训练集和验证集;(2)构建深度学习和自注意力机制的3D点云数据语义分割网络;(3)设置训练深度学习和自注意力机制的3D点云数据语义分割网络所需的损失函数;(4)对深度学习和自注意力机制的3D点云数据语义分割网络进行监督训练;(5)获取3D点云数据测试集的语义分割结果。本发明在深度学习网络中加入了自注意力模块,能够更好地提取包含各个特征通道之间关系的深层特征,从而提高分割精度。

Description

基于深度学习和自注意力的3D点云数据语义分割方法
技术领域
本发明属于雷达3D点云数据处理技术领域,涉及一种3D点云数据分割方法,具体涉及一种基于深度学习和自注意力机制的3D点云数据语义分割方法。可用于自动驾驶、机器人技术领域、3D地图、土地测绘、前景分割、智慧城市建设、农业估产、林业资源普查、生态环境监测及防灾减灾等方面。
背景技术
近年来,随着深度传感器的发展,点云处理已经成为研究热点之一。点云数据是指:扫描资料以点的形式记录,每一个点包含有三维坐标,有些可能还含有颜色信息、反射强度信息、灰度值,深度或者返回次数等信息。一般主要用来代表一个物体的外表面形状。大多数点云数据是由3D扫描设备产生的,例如激光雷达,立体摄像头,越渡时间相机等。作为3D扫描的结果,点云数据因其获取方式容易,数据量小、数据形式简洁,已成为3D数据的代表,对3D点云数据进行语义分割能够区分出不同的分割物,使得3D点云数据能够广泛应用于自动驾驶、机器人技术领域、3D地图、土地测绘、前景分割、智慧城市建设、农业估产、林业资源普查、生态环境监测及防灾减灾等方面。
3D点云数据语义分割是指将3D点云数据作为输入,最终将3D点云数据中的每一个点标记为预定义类之一,从而区分出不同的分割物。传统的3D点云数据语义分割方法通常是将3D点云数据转换为体积表示,例如体素网格,或者将3D点云数据转换为图像数据然后采用聚类或深度学习网络等方法进行语义分割,这样的话数据量、计算复杂度和运行时间将会大大增加,同时也会带来量化误差,分割精度较低。但是,将深度学习直接应用于3D点云数据面临着许多的挑战:(1)点云数据的无序性:点云是分布在空间中的XYZ点的无序排列;(2)点云数据的不变性排列:在几何上,相同的点云数据可以由两个完全不同的矩阵表示;(3)点云数据的旋转不变性。
Qi C R,Su H等人发表在CVPR2017,名称为“PointNet:Deep Learning on PointSets for 3D Classification and Segmentation”的论文,公开了一种直接将深度学习应用于3D点云数据语义分割的方法PointNet,该方法首先将3D点云数据输入PDAL库进行分块,然后构建由多个多层感知机、多个最大池化和多个特征转换模块组成的深度学习网络,最后将分完块的数据输入构建好的深度学习网络中进行训练及测试,得到3D点云数据语义分割结果。该方法直接将3D点云数据输入深度学习网络进行语义分割而不需要将3D点云数据转换为其他数据形式,并采用特征转换模块解决点云数据的旋转不变性问题,采用最大池化解决点云数据的无序性问题,与传统方法相比数据量、计算复杂度大大降低,精度也有所提升,但是该方法只是简单的将所有点连接起来,只考虑了全局特征,丢失了每个点的局部信息导致精度较低,随后该团队又在PointNet的基础上进行了改进,在NIPS2017发表了名称为“PointNet++:Deep Hierarchical Feature Learning on Point Sets in aMetric Space”的论文,公开了一种基于度量空间中点集的深层特征学习的3D点云数据语义分割方法PointNet++,该方法在PointNet网络原有的基础上增加了采样模块和分组模块来捕捉点云数据的局部结构信息,与PointNet相比精度有所提升,但是,PointNet++由于没有考虑到点云数据中各个特征通道之间的关系,特别是对室外大范围内的点云数据进行处理时,没有增加对通道的关注与处理,导致分割结果的精度不高。
发明内容
本发明的目的在于克服上述现有技术存在的缺陷,提出了一种基于深度学习和自注意力机制的3D点云数据语义分割方法,用于解决现有技术中存在的分割精度较低的技术问题。
为实现上述目的,本发明采取的技术方案包括如下步骤:
(1)获取训练集R2和验证集V2
(1a)从数据库中获取带有标签的3D点云数据文件F:{F1,F2,...,Fi,...,Ff,},并将其中比例为nR的3D点云数据文件作为初始训练集R0,其余f(1-nR)个3D点云数据文件作为初始验证集V0,Fi表示第i个3D点云数据文件,f为3D点云数据文件总数,f≥100,0.6≤nR<1;
(1b)将R0输入PDAL库进行分块,得到训练数据块集合R1,并从R1中的每个数据块中随机选取N0个点组成训练集R2,同时将V0输入PDAL库进行分块,得到验证数据块集合V1,并从V1中的每个数据块中随机选取N0个点组成验证集V2,N0≥4096;
(2)构建深度学习和自注意力机制的3D点云数据语义分割网络:
构建包括依次级联的特征提取网络、特征回传网络和分割网络的深度学习和自注意力机制的3D点云数据语义分割网络,其中:
所述特征提取网络,包括m个级联的PointAt模块,所述PointAt模块包括依次级联的采样模块、分组模块、点集特征提取模块和自注意力模块,m≥2;所述自注意力模块,用于计算自身输入数据P的各个特征通道之间关系的深层特征并输出O:
O=β(PT A)T+P
其中,(PT A)T表示通道自注意力模块,β表示(PT A)T的权重,PT表示P的转置,A表示自注意力特征图,
所述特征回传网络,包括m个级联的FP模块,所述FP模块包括依次级联的特征插值模块和特征整合模块;
所述分割网络,包括依次层叠的第一全卷积层、dropout层和第二全卷积层;
(3)设置训练深度学习和自注意力机制的3D点云数据语义分割网络所需的损失函数loss:
Figure GDA0002984908720000031
其中,Y(x)和V(x)分别表示训练集R2中第x点的标签和预测结果;
(4)对深度学习和自注意力机制的3D点云数据语义分割网络进行监督训练:
(4a)设监督训练的轮次为K,模型评估间隔的轮次K1,K≥600,K1≥1;
(4b)将训练集R2输入深度学习和自注意力机制的3D点云数据语义分割网络,通过损失函数loss对该模型进行K轮监督训练,在监督训练过程中每隔K1轮通过验证集V2对当前训练模型进行精度评估,并且将精度最高的深度学习和自注意力机制的3D点云数据语义分割模型作为训练好的深度学习和自注意力机制的3D点云数据语义分割模型并保存;
(5)获取3D点云数据测试集的语义分割结果:
(5a)将待分割的3D点云数据处理为文件形式,并将处理后的文件数据作为测试数据集E0,将E0输入PDAL库进行分块,得到测试数据块集合E1,并从E1中的每个数据块中随机选取N0个点组成测试数据E2
(5b)将测试数据E2输入训练好的深度学习和自注意力机制的3D点云数据语义分割模型中进行语义分割,得到测试数据E2中每一个点的预测类别,并将E2中每一个点的预测类别和测试集E0输入到PDAL库中,通过最近邻投票算法对测试集E0中的每个点的类别进行预测,得到3D点云数据测试集的语义分割结果。
本发明与现有技术相比,具有以下优点:
本发明构建的基于深度学习和自注意力机制的3D点云数据语义分割网络,其中的自注意力模块通过计算自身输入数据的各个特征通道之间关系的深层特征,能够自主地提取上下文信息,避免了现有技术仅能提取局部信息对分割精度的影响,仿真结果表明,本发明有效提高了3D点云数据语义分割结果的精度。
附图说明
图1是本发明实现流程图;
图2是本发明实施例采用的基于深度学习和自注意力机制的3D点云数据语义分割网络的整体结构图;
图3是本发明自注意力模块的实现流程图。
具体实施方式
下面结合附图和具体实施例,对本发明作进一步详细描述。
参照图1,本发明包括如下步骤:
步骤1)获取训练集R2和验证集V2
步骤1a)从数据库中获取带有标签的3D点云数据文件F:{F1,F2,...,Fi,...,Ff,},并将其中比例为nR的3D点云数据文件作为初始训练集R0,其余f(1-nR)个3D点云数据文件作为初始验证集V0,Fi表示第i个3D点云数据文件,f为3D点云数据文件总数,f≥100,0.6≤nR<1;通常会选择60%以上的数据作为训练数据,其余作为验证数据,本实施例设置nR=0.8,这样将从数据库中随机选取80%的3D点云数据文件作为初始训练集R0,其余20%的3D点云数据文件作为初始验证集V0
步骤1b)将R0输入PDAL库进行分块,得到训练数据块集合R1,并从R1中的每个数据块中随机选取N0个点组成3D点云数据的训练集R2
Figure GDA0002984908720000051
C0为原始特征通道总数,同时将V0输入PDAL库进行分块,得到验证数据块集合,V1,并从V1中的每个数据块中随机选取N0个点组成3D点云数据的验证集V2
Figure GDA0002984908720000052
N0≥4096,本实施例中设置N0=8192;
步骤2)构建深度学习和自注意力机制的3D点云数据语义分割网络:
构建深度学习和自注意力机制的3D点云数据语义分割网络,其结构如图2所示,该深度学习和自注意力机制的3D点云数据语义分割网络包括依次级联的特征提取网络、特征回传网络和分割网络,依次级联是指特征提取网络的输出作为特征回传网络的输入,特征回传网络的输出作为分割网络的输入,其中:
所述特征提取网络,包括m个级联的PointAt模块的特征提取网络,所述PointAt模块包括依次级联的采样模块、分组模块、点集特征提取模块和自注意力模块,m≥2,m设置过大时,会导致网络参数过多训练时不易收敛,m过小则会导致无法提取到更深层的特征,因此本实施例中该参数设置为m=4。
4个级联的PointAt模块前一个PointAt模块的输出作为后一个PointAt模块的输入,每一个PointAt模块内部的采样模块、分组模块、点集特征提取模块和自注意力模块也依次级联,也就是每一个PointAt模块内部采样模块输出作为分组模块的输入,分组模块的输出作为点集特征提取模块的输入,点集特征提取模块的输出作为自注意力模块的输入,最后自注意力模块的输出,作为该PointAt模块的输出,将被输入下一个PointAt模块的采样模块;
对于第n个PointAt模块的采样模块,n=1,2,...,m,采用迭代最远点采样法从输入数据中采样出
Figure GDA0002984908720000061
个能够代表局部区域质心的点,第一个PointAt模块的采样模块,其输入数据为训练集R2,其他PointAt模块的采样模块,输入数据为前一个PointAt模块的输出数据On-1,实验条件允许的话可以选择全部的点作为采样点,这样计算量会非常大,在权衡了精度和计算量之后,本实施例中采样点数设置为
Figure GDA0002984908720000062
也就是第一个PointAt模块的采样模块从输入的8192个点中采样出了1024个质心点,第二个PointAt模块的采样模块从输入的1024个点中采样出了256个质心点,第三个PointAt模块的采样模块从输入的256个点中采样出了64个质心点,第三个PointAt模块的采样模块从输入的64个点中采样出了16个质心点;
对于第n个PointAt模块的分组模块,用于搜索采样模块采样出的
Figure GDA0002984908720000063
个质心点中每个质心点的
Figure GDA0002984908720000064
个邻近点并输出,本实施例中所有分组模块都采用球形搜索的方法,
Figure GDA0002984908720000065
都设置为
Figure GDA0002984908720000066
n=1,2,3,4,4个PointAt模块的分组模块采用的搜索半径大小分别为0.1,0.2,0.4,0.8,也就是第一个PointAt模块的分组模块以0.1为搜索半径,从该PointAt模块的输入数据中搜索采样出的1024个质心点中每一个质心点的32个邻近点,第二个PointAt模块的分组模块以0.2为搜索半径,从该PointAt模块的输入数据中搜索采样出的256个质心点中每一个质心点的32个邻近点,第三个PointAt模块的分组模块以0.4为搜索半径,从该PointAt模块的输入数据中搜索采样出的64个质心点中每一个质心点的32个邻近点,第四个PointAt模块的分组模块以0.8为搜索半径,从该PointAt模块的输入数据中搜索采样出的16个质心点中每一个质心点的32个邻近点;
对于第n个PointAt模块的点集特征提取模块,包括依次层叠的卷积层、ReLU激活层和最大池化层,用于提取分组模块输出数据的深层特征,本实施例中所有点集特征提取模块的卷积层卷积核大小为1,步长为1,4个点集特征提取模块的卷积层,其输出特征通道数依次设置为64,128,256,512,最大池化层都是对数据的第二个维度求最大值并输出;
对于第n个PointAt模块的自注意力模块,其输入数据为第n个PointAt模块的点集特征提取模块的输出P,用于计算自身输入数据P的各个特征通道之间的关系,并输出包含各个特征通道之间关系的深层特征O:
O=β(PT A)T+P
其中,(PT A)T表示通道自注意力模块,β表示(PT A)T的权重,PT表示P的转置,A表示自注意力特征图,其第i行第j列元素Aij的计算公式为:
Figure GDA0002984908720000071
其中,Pi表示自注意力模块输入数据P的第i个特征通道,Pj表示自注意力模块的输入数据P的第j个特征通道,C表示P的特征通道总数,由上式可见自注意力特征图A中计算了P的各个特征通道之间的关系,这样自注意力模块输出O也同样包含各个特征通道之间的关系;
参照图3,自注意力模块的实现步骤为:
第一步计算PTP,图3中操作(1)处;
第二步计算A=softmax(PTP),其中softmax操作是指按行进行softmax操作,图3中操作(2)处;
第三步计算O=β(PT A)T+P,图3中操作(3)处;
从图3中也可以看出自注意力模块的输入输出数据形状大小相同;
所述特征回传网络,包括m个级联的FP模块的特征回传网络,所述FP模块用于对特征提取模块提取出的特征进行特征融合操作,该模块包括依次级联的特征插值模块和特征整合模块,特征插值模块根据第n-1个PointAt模块的输出On-1,对第n个PointAt模块的输出On进行插值操作,特征整合模块有依次级联的卷积层、ReLU激活层、BN层完成,本实施例中4个特征整合模块的卷积层,其参数设置为:卷积核大小为都1,步长都为1,输出特征通道数依次为256,256,128,128;
所述分割网络,包括依次层叠的第一全卷积层、dropout层和第二全卷积层的分割网络,本实施例中第一全卷积层输出特征通道数设置为128,第二全卷积层输出特征通道数设置为分割类别总数;
步骤3)设置训练深度学习和自注意力机制的3D点云数据语义分割网络所需的损失函数loss:
Figure GDA0002984908720000081
其中,Y(x)和V(x)分别表示训练集R2中第x点的标签和预测结果,V(x)的计算公式为:
Figure GDA0002984908720000082
其中,zx为分割网络输出的第x点的特征值,
Figure GDA0002984908720000083
q表示总的语义分割类别数,q≥2,本实施例中采用的ScanNet数据集中共分了21类,q=21;
步骤4)对深度学习和自注意力机制的3D点云数据语义分割网络进行监督训练:
步骤4a)设监督训练的轮次为K,模型评估的频次K1,K≥600,K1≥1,本实施例中参数K设置为1000,本实施例中参数K1设置为5;
步骤4b)将训练集R2输入深度学习和自注意力机制的3D点云数据语义分割网络,通过损失函数loss对该模型进行K轮监督训练,并每隔K1轮通过验证集V2对该轮模型的精度进行评估,之后将精度最高的深度学习和自注意力机制的3D点云数据语义分割网络作为训练好的深度学习和自注意力机制的3D点云数据语义分割网络并保存,在训练过程中自注意力模块能够自主的学习到最有利于分割结果的通道关系,自主地提取上下文信息;
步骤5)获取3D点云数据测试集的语义分割结果:
步骤5a)将待分割的3D点云数据处理为文件形式,并将处理后的文件数据作为测试数据集E0,将E0输入PDAL库进行分块,得到测试数据块集合E1,并从E1中的每个数据块中随机选取N0个点组成测试数据E2
步骤5b)将测试数据E2输入训练好的深度学习和自注意力机制的3D点云数据语义分割模型中进行语义分割,得到测试数据E2中每一个点的预测类别,并将E2中每一个点的预测类别和测试集E0输入到PDAL库中,通过最近邻投票算法对测试集E0中的每个点的类别进行预测,得到3D点云数据测试集的语义分割结果。
以下结合仿真实验,对本发明的技术效果作以说明:
1.仿真条件和内容:
本发明在ScanNet数据集上进行了仿真实验:
ScanNet是一个RGB-D视频数据集,包含超过1500次扫描的250万个视图,并且用3D相机姿势,表面重建和实例级语义分割进行了标注。
利用本发明和现有的Pointnet++算法在ScanNet数据集上进行了3D点云数据分割的实验仿真,仿真平台为:主频为2.40GHz的Intel Xeon CPU E5-2630 v3 CPU,64GB的运行内存,Ubuntu16.04操作系统,Tensorflow深度学习平台,Python3.5开发平台。显卡:GeForce GTX 1080;利用本发明方法和现有技术在上述仿真条件下进行实验,即运用本发明和现有技术Pointnet++在ScanNet数据集上进行了3D点云数据分割的训练和测试,得到了如表1所示的仿真精度对比;
2.仿真结果分析:
表1.本发明和现有技术在ScsnNet数据集上分割结果对比表
方法 精度
本发明 0.851
现有技术 0.833
表1中,精度表示测试结果的分割准确率。方法一栏中,现有技术表示现有的Pointnet++技术。
从表格中可以看出,本发明在ScsnNet数据集上相较于现有技术Pointnet++,精度提升了0.018。已经达到了目前3D点云分割领域在该数据集上的最高精度。
本发明利用一种基于深度学习和自注意力机制的方法来解决3D点云语义分割这个任务,在深度学习网络的基础上,加入的自注意力模块通过计算自身输入数据的各个特征通道之间关系的深层特征,能够自主地提取上下文信息来提高分割结果精度,此外,自注意力模块并不改变输入数据的形状大小,因此可移植性强,可以作为一个模块加入到任何一个基于深度学习网络的3D点云数据语义分割任务中来提高分割结果精度。

Claims (3)

1.一种基于深度学习和自注意力机制的3D点云数据语义分割方法,其特征在于,包括如下步骤:
(1)获取训练集R2和验证集V2
(1a)从数据库中获取带有标签的3D点云数据文件F:{F1,F2,...,Fi,...,Ff,},并将其中比例为nR的3D点云数据文件作为初始训练集R0,其余f(1-nR)个3D点云数据文件作为初始验证集V0,Fi表示第i个3D点云数据文件,f为3D点云数据文件总数,f≥100,0.6≤nR<1;
(1b)将R0输入PDAL库进行分块,得到训练数据块集合R1,并从R1中的每个数据块中随机选取N0个点组成训练集R2,同时将V0输入PDAL库进行分块,得到验证数据块集合V1,并从V1中的每个数据块中随机选取N0个点组成验证集V2,N0≥4096;
(2)构建深度学习和自注意力机制的3D点云数据语义分割网络:
构建包括依次级联的特征提取网络、特征回传网络和分割网络的深度学习和自注意力机制的3D点云数据语义分割网络,其中:
所述特征提取网络,包括m个级联的PointAt模块,所述PointAt模块包括依次级联的采样模块、分组模块、点集特征提取模块和自注意力模块,m≥2;所述自注意力模块,用于计算自身输入数据P的各个特征通道之间关系的深层特征并输出O:
O=β(PTA)T+P
A=softmax(PTP)
其中,(PTA)T表示通道自注意力模块,β表示(PTA)T的权重,PT表示P的转置,A表示自注意力特征图,softmax表示按行进行softmax操作;
所述特征回传网络,包括m个级联的FP模块,所述FP模块包括依次级联的特征插值模块和特征整合模块;
所述分割网络,包括依次层叠的第一全卷积层、dropout层和第二全卷积层;
(3)设置训练深度学习和自注意力机制的3D点云数据语义分割网络所需的损失函数loss:
Figure FDA0002984908710000021
其中,Y(x)和V(x)分别表示训练集R2中第x点的标签和预测结果;
(4)对深度学习和自注意力机制的3D点云数据语义分割网络进行监督训练:
(4a)设监督训练的轮次为K,模型评估间隔的轮次K1,K≥600,K1≥1;
(4b)将训练集R2输入深度学习和自注意力机制的3D点云数据语义分割网络,通过损失函数loss对该模型进行K轮监督训练,在监督训练过程中每隔K1轮通过验证集V2对当前训练模型进行精度评估,并且将精度最高的深度学习和自注意力机制的3D点云数据语义分割模型作为训练好的深度学习和自注意力机制的3D点云数据语义分割模型并保存;
(5)获取3D点云数据测试集的语义分割结果:
(5a)将待分割的3D点云数据处理为文件形式,并将处理后的文件数据作为测试数据集E0,将E0输入PDAL库进行分块,得到测试数据块集合E1,并从E1中的每个数据块中随机选取N0个点组成测试数据E2
(5b)将测试数据E2输入训练好的深度学习和自注意力机制的3D点云数据语义分割模型中进行语义分割,得到测试数据E2中每一个点的预测类别,并将E2中每一个点的预测类别和测试集E0输入到PDAL库中,通过最近邻投票算法对测试集E0中的每个点的类别进行预测,得到3D点云数据测试集的语义分割结果。
2.根据权利要求1所述的基于深度学习和自注意力机制的3D点云数据语义分割方法,其特征在于,步骤(2)中所述的自注意力特征图A,其第i行第j列元素Aij的计算公式为:
Figure FDA0002984908710000031
其中,Pi表示自注意力模块输入数据P的第i个特征通道,Pj表示自注意力模块的输入数据P的第j个特征通道,C表示P的特征通道总数。
3.根据权利要求1所述的基于深度学习和自注意力机制的3D点云数据语义分割方法,其特征在于,步骤(3)中所述的训练集R2中第x点的预测结果V(x),其计算公式为:
Figure FDA0002984908710000032
其中,zx为分割网络输出的第x点的特征值,
Figure FDA0002984908710000033
q表示总的语义分割类别数,q≥2。
CN201910526990.5A 2019-06-18 2019-06-18 基于深度学习和自注意力的3d点云数据语义分割方法 Active CN110245709B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910526990.5A CN110245709B (zh) 2019-06-18 2019-06-18 基于深度学习和自注意力的3d点云数据语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910526990.5A CN110245709B (zh) 2019-06-18 2019-06-18 基于深度学习和自注意力的3d点云数据语义分割方法

Publications (2)

Publication Number Publication Date
CN110245709A CN110245709A (zh) 2019-09-17
CN110245709B true CN110245709B (zh) 2021-09-03

Family

ID=67887764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910526990.5A Active CN110245709B (zh) 2019-06-18 2019-06-18 基于深度学习和自注意力的3d点云数据语义分割方法

Country Status (1)

Country Link
CN (1) CN110245709B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046781B (zh) * 2019-12-09 2022-05-27 华中科技大学 一种基于三元注意力机制的鲁棒三维目标检测方法
CN111192270A (zh) * 2020-01-03 2020-05-22 中山大学 一种基于点全局上下文关系推理的点云语义分割方法
CN111242208B (zh) * 2020-01-08 2023-05-02 深圳大学 一种点云分类方法、分割方法及相关设备
CN111260660B (zh) * 2020-01-14 2023-04-11 电子科技大学 一种基于元学习的3d点云语义分割迁移方法
CN111553353B (zh) * 2020-05-11 2023-11-07 北京小马慧行科技有限公司 3d点云的处理方法、装置、存储介质与处理器
CN111462324B (zh) * 2020-05-18 2022-05-17 南京大学 一种在线时空语义融合方法和系统
CN111860668B (zh) * 2020-07-27 2024-04-02 辽宁工程技术大学 一种针对原始3d点云处理的深度卷积网络的点云识别方法
CN112085123B (zh) * 2020-09-25 2022-04-12 北方民族大学 基于显著点采样的点云数据分类和分割方法
CN112037228A (zh) * 2020-11-05 2020-12-04 中南大学 一种基于双倍注意力的激光雷达点云目标分割方法
CN112560865B (zh) * 2020-12-23 2022-08-12 清华大学 一种室外大场景下点云的语义分割方法
CN112801059B (zh) * 2021-04-07 2021-07-20 广东众聚人工智能科技有限公司 图卷积网络系统和基于图卷积网络系统的3d物体检测方法
CN113421267B (zh) * 2021-05-07 2024-04-12 江苏大学 一种基于改进PointConv的点云语义与实例联合分割方法及系统
CN113298822B (zh) * 2021-05-18 2023-04-18 中国科学院深圳先进技术研究院 点云数据的选取方法及选取装置、设备、存储介质
CN113177555B (zh) * 2021-05-21 2022-11-04 西南大学 基于跨层级跨尺度跨注意力机制的目标处理方法及装置
CN114677322B (zh) * 2021-12-30 2023-04-07 东北农业大学 基于注意力引导点云特征学习的奶牛体况自动评分方法
CN115311274B (zh) * 2022-10-11 2022-12-23 四川路桥华东建设有限责任公司 一种基于空间变换自注意力模块的焊缝检测方法及系统
CN116416586B (zh) * 2022-12-19 2024-04-02 香港中文大学(深圳) 基于rgb点云的地图元素感知方法、终端及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492273A (zh) * 2018-03-28 2018-09-04 深圳市唯特视科技有限公司 一种基于自注意力模型的图像生成方法
CN108647684A (zh) * 2018-05-02 2018-10-12 深圳市唯特视科技有限公司 一种基于引导注意力推理网络的弱监督语义分割方法
CN108961339A (zh) * 2018-07-20 2018-12-07 深圳辰视智能科技有限公司 一种基于深度学习的点云物体姿态估计方法、装置及其设备
US10169678B1 (en) * 2017-12-21 2019-01-01 Luminar Technologies, Inc. Object identification and labeling tool for training autonomous vehicle controllers
CN109753995A (zh) * 2018-12-14 2019-05-14 中国科学院深圳先进技术研究院 一种基于3d目标分类和场景语义分割的网络优化结构

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10824862B2 (en) * 2017-11-14 2020-11-03 Nuro, Inc. Three-dimensional object detection for autonomous robotic systems using image proposals

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10169678B1 (en) * 2017-12-21 2019-01-01 Luminar Technologies, Inc. Object identification and labeling tool for training autonomous vehicle controllers
CN108492273A (zh) * 2018-03-28 2018-09-04 深圳市唯特视科技有限公司 一种基于自注意力模型的图像生成方法
CN108647684A (zh) * 2018-05-02 2018-10-12 深圳市唯特视科技有限公司 一种基于引导注意力推理网络的弱监督语义分割方法
CN108961339A (zh) * 2018-07-20 2018-12-07 深圳辰视智能科技有限公司 一种基于深度学习的点云物体姿态估计方法、装置及其设备
CN109753995A (zh) * 2018-12-14 2019-05-14 中国科学院深圳先进技术研究院 一种基于3d目标分类和场景语义分割的网络优化结构

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
" 融合多尺度信息的弱监督语义分割及优化";熊昌镇;《通信学报》;20190131;第163-171页 *
"GAPNet: Graph Attention based Point Neural Network for Exploiting Local Feature of Point Cloud";Can Chen;《arXiv》;20190521;第1-11页 *

Also Published As

Publication number Publication date
CN110245709A (zh) 2019-09-17

Similar Documents

Publication Publication Date Title
CN110245709B (zh) 基于深度学习和自注意力的3d点云数据语义分割方法
CN113449680B (zh) 一种基于知识蒸馏的多模小目标检测方法
CN106909924B (zh) 一种基于深度显著性的遥感影像快速检索方法
CN110111345B (zh) 一种基于注意力网络的3d点云分割方法
CN114926746B (zh) 基于多尺度差分特征注意力机制的sar图像变化检测方法
CN108428220B (zh) 静止轨道卫星序列遥感影像海岛礁区域自动几何校正方法
CN111639587B (zh) 基于多尺度谱空卷积神经网络的高光谱图像分类方法
CN114241464A (zh) 基于深度学习的跨视角影像实时匹配地理定位方法及系统
CN115984850A (zh) 基于改进Deeplabv3+的轻量级遥感影像语义分割方法
CN115497002A (zh) 一种多尺度特征融合的激光雷达遥感分类方法
CN113435254A (zh) 一种基于哨兵二号影像的耕地深度学习提取方法
CN113807278A (zh) 一种基于深度学习的土地利用分类及变化预测方法
Cai et al. A comparative study of deep learning approaches to rooftop detection in aerial images
CN111242028A (zh) 基于U-Net的遥感图像地物分割方法
Nie et al. Adap-EMD: Adaptive EMD for aircraft fine-grained classification in remote sensing
Souffer et al. Automatic extraction of photovoltaic panels from UAV imagery with object-based image analysis and machine learning
CN114882373A (zh) 基于深度神经网络的多特征融合沙尘暴预测方法
Dawod et al. Assessing mangrove deforestation using pixel-based image: a machine learning approach
CN112668662B (zh) 基于改进YOLOv3网络的野外山林环境目标检测方法
CN116403071B (zh) 基于特征重构的少样本混凝土缺陷检测方法及装置
CN116486089A (zh) 基于知识蒸馏的点云分割网络轻量化方法、装置及设备
Varlik et al. Filtering airborne LIDAR data by using fully convolutional networks
Li et al. A Hierarchical Deformable Deep Neural Network and an Aerial Image Benchmark Dataset for Surface Multiview Stereo Reconstruction
KR102576427B1 (ko) 구름 이미지를 이용한 실시간 강수량 예측 장치, 이를 이용한 강수량 예측 방법 및 이를 제공하기 위한 컴퓨터 프로그램이 기록된 컴퓨터-판독가능매체
Luo et al. Multi‐scale information extraction from high resolution remote sensing imagery and region partition methods based on GMRF–SVM

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant