CN116739940A - 一种点云补全的方法、装置、设备及介质 - Google Patents
一种点云补全的方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116739940A CN116739940A CN202310790431.1A CN202310790431A CN116739940A CN 116739940 A CN116739940 A CN 116739940A CN 202310790431 A CN202310790431 A CN 202310790431A CN 116739940 A CN116739940 A CN 116739940A
- Authority
- CN
- China
- Prior art keywords
- semantic features
- point cloud
- dimensional semantic
- point
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004364 calculation method Methods 0.000 claims abstract description 70
- 230000004927 fusion Effects 0.000 claims abstract description 40
- 239000013598 vector Substances 0.000 claims description 36
- 238000011176 pooling Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012821 model calculation Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种点云补全的方法、装置、设备及可读介质,方法包括:计算传感器采集到的点云数据的第一高维语义特征,并计算第一高维语义特征的全局语义特征;计算点云数据聚类后点簇的特征,并计算点簇的特征的第二高维语义特征;将第二高维语义特征与全局语义特征进行拼接得到融合特征图;计算融合特征图的高维语义特征,对高维语义特征进行解码计算得到补全后的点云。通过使用本发明的方案,能够大幅度提高模型计算效率,降低对计算设备内存空间的要求,减少模型的参数量和计算量,提高了点云补全的准确性和鲁棒性。
Description
技术领域
本发明涉及点云补全领域,并且更具体地涉及一种点云补全的方法、装置、设备及可读介质。
背景技术
在车路协同和自动驾驶领域中,Lidar和毫米波雷达等传感器采集的点云数据通常被用来进行3D目标检测,这些传感器在数据采集过程中受外部障碍物遮挡、目标物体自遮挡、采集盲点等因素影响往往无法采集到目标物体的完整数据。此外,随着采集设备与目标物体之间距离的增加,这些点云采集设备获取的点云数据还会变得稀疏,对这些不完整的点云数据和稀疏点云数据进行3D目标检测会大幅度降低模型的准确率和召回率,这会严重影响自动驾驶和车路协同行驶车辆的安全性。现有的点云补全技术获得的点云补全结果存在准确性差、计算过程对设备内存要求高、计算速度慢等问题。
发明内容
有鉴于此,本发明实施例的目的在于提出一种点云补全的方法、装置、设备及可读介质,通过使用本发明的技术方案,能够大幅度提高模型计算效率,降低对计算设备内存空间的要求,能够减少模型的参数量和计算量,提高了点云补全的准确性和鲁棒性。
基于上述目的,本发明的实施例的一个方面提供了一种点云补全的方法,包括以下步骤:
计算传感器采集到的点云数据的第一高维语义特征,并计算第一高维语义特征的全局语义特征;
计算点云数据聚类后点簇的特征,并计算点簇的特征的第二高维语义特征;
将第二高维语义特征与全局语义特征进行拼接得到融合特征图;
计算融合特征图的第三高维语义特征,对第三高维语义特征进行解码计算得到补全后的点云。
根据本发明的一个实施例,计算传感器采集到的点云数据的第一高维语义特征包括:
将点云数据输入到共享多层感知机中进行计算,以得到第一高维语义特征。
根据本发明的一个实施例,计算第一高维语义特征的全局语义特征包括:
将第一高维语义特征进行最大池化计算,以得到全局语义特征。
根据本发明的一个实施例,计算点云数据聚类后点簇的特征包括:
将点云数据进行聚类计算以得到K个点簇,其中K大于1且小于N/2。
根据本发明的一个实施例,计算点云数据聚类后点簇的特征包括:
计算K个点簇中每个点簇中特征向量的平均向量,并使用每个点簇中特征向量的平均向量作为K个点簇中每个点簇的特征。
根据本发明的一个实施例,计算点簇的特征的第二高维语义特征包括:
将K个点簇的特征输入第一多层感知机中进行计算,以得到第二高维语义特征。
根据本发明的一个实施例,将第二高维语义特征与全局语义特征进行拼接得到融合特征图包括:
将全局语义特征重复K次得到第一全局语义特征;
将第二高维语义特征与第一全局语义特征进行拼接得到融合特征;
将融合特征输入第二多层感知机中进行计算,以得到融合特征图。
根据本发明的一个实施例,计算融合特征图的第三高维语义特征包括:
将融合特征图进行最大池化计算得到第三高维语义特征。
根据本发明的一个实施例,对第三高维语义特征进行解码计算得到补全后的点云包括:
将第三高维语义特征输入到多层感知机中进行解码计算得到补全后的点。
本发明的实施例的另一个方面,还提供了一种点云补全的装置,装置包括:
第一计算模块,第一计算模块配置为计算传感器采集到的点云数据的第一高维语义特征,并计算第一高维语义特征的全局语义特征;
第二计算模块,第二计算模块配置为计算点云数据聚类后点簇的特征,并计算点簇的特征的第二高维语义特征;
拼接模块,拼接模块配置为将第二高维语义特征与全局语义特征进行拼接得到融合特征图;
第三计算模块,第三计算模块配置为计算融合特征图的高维语义特征,对高维语义特征进行解码计算得到补全后的点云。
本发明的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:
至少一个处理器;以及
存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。
本发明的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。
本发明具有以下有益技术效果:本发明实施例提供的点云补全的方法,通过计算传感器采集到的点云数据的第一高维语义特征,并计算第一高维语义特征的全局语义特征;计算点云数据聚类后点簇的特征,并计算点簇的特征的第二高维语义特征;将第二高维语义特征与全局语义特征进行拼接得到融合特征图;计算融合特征图的高维语义特征,对高维语义特征进行解码计算得到补全后的点云的技术方案,能够大幅度提高模型计算效率,降低对计算设备内存空间的要求,能够减少模型的参数量和计算量,提高了点云补全的准确性和鲁棒性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为根据本发明一个实施例的点云补全的方法的示意性流程图;
图2为根据本发明一个实施例的点云补全过程的示意图;
图3为根据本发明一个实施例的encode模块的示意图;
图4为根据本发明一个实施例的点云补全的装置的示意图;
图5为根据本发明一个实施例的计算机设备的示意图;
图6为根据本发明一个实施例的计算机可读存储介质的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
基于上述目的,本发明的实施例的第一个方面,提出了一种点云补全的方法的一个实施例。图1示出的是该方法的示意性流程图。
如图1中所示,该方法可以包括以下步骤:
S1计算传感器采集到的点云数据的第一高维语义特征,并计算第一高维语义特征的全局语义特征。可以通过雷达、毫米波雷达等传感器采集车辆或物体或环境等的点云数据,将采集到的N*3的点云数据输入到共享多层感知机中进行计算,可以得到N*512的第一高维语义特征,其中N为传感器采集到的点云的数量,3表示点云中点的坐标(x,y,z),其中共享多层感知机包括六个包含三个隐藏层的多层感知机,如图2所示,六个多层感知机的特征向量长度依次为256、512、1024、2048、1024和512,也可以根据需要使用其他的向量长度。然后将N*512的第一高维语义特征进行最大池化计算,可以得到1*512的全局语义特征。这部分的计算过程是在辅助分支中进行,如图3所示,辅助头所在分支作为辅助分支,用来监督中间语义特征层的学习,提高中间语义特征层获得的全局语义信息丰富性和表征能力,提高点云补全的准确性,降低点云补全的错误率。
S2计算点云数据聚类后点簇的特征,并计算点簇的特征的第二高维语义特征。如图3所示,将上述N*3的点云数据进行聚类计算以得到K个点簇的关键点特征数据,其中N为传感器采集到的点云的数量,3表示点云中点的坐标(x,y,z),K大于1且小于N/2,K的取值范围可以根据需求进行设定。在一些实施例中,还可以计算K个点簇中每个点簇中特征向量的平均向量,并使用每个点簇中特征向量的平均向量作为K个点簇中每个点簇的特征,这可以提高模型计算速度和降低对硬件设备内存要求。例如,点云数据中有100个点,聚类计算后得到5个点簇,即每个点簇中有20个点,计算第一个点簇中的20个点的特征向量的平均向量,并使用该平均向量代表第一个点簇的特征,以此类推。然后将K个点簇的关键点数据输入一个三层的第一多层感知机中进行计算,可以得到K*512的第二高维语义特征。
S3将第二高维语义特征与全局语义特征进行拼接得到融合特征图。将上述的1*512的全局语义特征重复K次可以得到K*512的全局语义特征,将K*512的第二高维语义特征与K*512的全局语义特征进行拼接可以得到K*1024的融合特征,然后将K*1024的融合特征输入一个三层的第二多层感知机中进行计算,可以得到K*2048的融合特征图。
S4计算融合特征图的高维语义特征,对高维语义特征进行解码计算得到补全后的点云。将上述得到的K*2048的融合特征图进行最大池化计算得到1*2048的高维语义特征,然后将1*2048的高维语义特征输入到包含五个隐藏层的多层感知机中进行解码计算得到补全后的点云。
本发明对Lidar和毫米波雷达采集的不完整和稀疏点云数据进行补全,将点云采集设备获取的点云数据分别输入主分支和辅助分支进行计算,其中辅助分支使用所有点云数据信息进行全局语义特征提取,主分支对输入点云先进行预处理,使用预处理后得到的关键点代替原始点云进行计算,主分支预测结果作为点云补全最终结果进行输出,解决现有点云补全模型存在的模型参数多、计算速度慢、对计算设备内存空间要求高和补全效果差的问题。
通过使用本发明的技术方案,能够大幅度提高模型计算效率,降低对计算设备内存空间的要求,能够减少模型的参数量和计算量,提高了点云补全的准确性和鲁棒性。
在本发明的一个优选实施例中,计算传感器采集到的点云数据的第一高维语义特征包括:
将N*3的点云数据输入到共享多层感知机中进行计算,以得到N*512的第一高维语义特征,其中N为传感器采集到的点云的数量。
在本发明的一个优选实施例中,共享多层感知机包括六个包含三个隐藏层的多层感知机,六个多层感知机的特征向量长度依次为256、512、1024、2048、1024和512。将采集到的N*3的点云数据输入辅助分支中的encode(编码)模块进行特征提取,其中N为点云采集设备采集的部分点云缺失或者稀疏的点云的数量,3表示点云中点的坐标(x,y,z),encode模块的内部结构如图2所示,会对输入的点云依次通过六个包含三个隐藏层的共享多层感知机(Multilayer Perceptron,MLP)进行计算,多层感知机共享权重参数,可以提高计算效率和减少模型参数量,encode模块经过多层共享权重参数的多层感知机计算后输出的特征图尺寸为F=N*V,V表示向量的长度,取值依次为{256,512,1024,2048,1024,512},即对输入的N*3的点云数据进行先升维后降维计算,最后获得N*512的高维语义特征,以上向量长度的取值可以根据计算需要选用其他的值。
在本发明的一个优选实施例中,计算第一高维语义特征的全局语义特征包括:
将N*512的第一高维语义特征进行最大池化计算,以得到1*512的全局语义特征。对encode模块输出的N*512的高维语义特征进行最大池化计算(point-wise maxpool),可以得到1*512的包含所有点信息的全局语义特征。
在本发明的一个优选实施例中,计算点云数据的关键点数据包括:
将N*3的点云数据进行聚类计算以得到K个点簇的关键点数据,其中N为传感器采集到的点云的数量,K大于1且小于N/2。将采集到的N*3的点云数据输入主分支中,对N*3的点云数据进行聚类计算获得K个点簇的关键点,K的取值范围设为(1,N/2),也可以根据实际情况进行设定。
在本发明的一个优选实施例中,还包括:
计算K个点簇中每个点簇中特征向量的平均向量,并使用每个点簇中特征向量的平均向量作为K个点簇中每个点簇的特征。对这K个点簇中每个点簇的特征向量求平均计算,然后使用点簇的平均向量作为关键点(key point)的特征代表该点簇的特征,这可以提高模型计算速度和降低对硬件设备内存要求,例如,点云数据中有100个点,聚类计算后得到5个点簇,即每个点簇中有20个点,计算第一个点簇中的20个点的特征向量的平均向量,并使用该平均向量代表第一个点簇的特征,以此类推,最终点云数据中100个点的特征向量由5个关键点的特征向量表示。
在本发明的一个优选实施例中,计算关键点数据的第二高维语义特征包括:
将K个点簇的关键点数据输入三层的第一多层感知机中进行计算,以得到K*512的第二高维语义特征。将K个关键点特征值输入一个三层的MLP中进行计算,可以得到K*512的第二高维语义特征。
在本发明的一个优选实施例中,将第二高维语义特征与全局语义特征进行拼接得到融合特征图包括:
将1*512的全局语义特征重复K次得到K*512的全局语义特征;
将K*512的第二高维语义特征与K*512的全局语义特征进行拼接得到K*1024的融合特征;
将K*1024的融合特征输入三层的第二多层感知机中进行计算,以得到K*2048的融合特征图。将辅助分支计算得到的1*512的全局语义特征重复K次可以得到K*512的全局语义特征,然后将K*512的第二高维语义特征与K*512的全局语义特征进行拼接,可以得到K*1024的融合特征,然后将K*1024的融合特征输入到一个三层的第二多层感知机中进行计算,可以得到K*2048的融合特征图,第一多层感知机和第二多层感知机的参数可以相同也可以不同,本发明中不做限制。
在本发明的一个优选实施例中,计算融合特征图的高维语义特征包括:
将K*2048的融合特征图进行最大池化计算得到1*2048的高维语义特征。对上述的K*2048的融合特征图进行最大池化计算,可以得到1*2048的包含局部和全局点云信息的高维语义特征。
在本发明的一个优选实施例中,对高维语义特征进行解码计算得到补全后的点云包括:
将1*2048的高维语义特征输入到包含五个隐藏层的多层感知机中进行解码计算得到补全后的点云。将上述的1*2048的高维语义特征输入到一个包含五个隐藏层的多层感知机中进行解码计算,可以得到预测的补全后的点云,本发明不对包含五层隐藏层的多层感知机的每层神经元个数进行限制。
在本发明的一个优选实施例中,还包括:
将1*512的全局语义特征输入到一个包含三层隐藏层的MLP进行解码获得2048*3的点云预测结果。
在本发明的一个优选实施例中,还包括:
将2048*3的点云预测结果(predict point set)与真实点集(ground true),即采集到的点云数据进行EMD(Earth Mover’s Distance,推土机距离)计算,EMD的函数表达式为:其中LEMD表示预测点与真实点的距离,P表示辅助分支预测的点云集合,Q表示真实的点云集合,φ:P→Q表示在辅助分支预测点云集和真实点云集两个数据集进行双向计算。通过这种有监督的计算方式进行点云全局特征的提取可以提高辅助分支全局语义特征的表征能力,进而提高点云补全结果的准确性。
在本发明的一个优选实施例中,还包括:
将主分支获得的补全后的点云与真实的点云差距计算评估损失,损失函数Chamfer Distance(CD)计算公式为:
,其中S1为补全的点云数据集,S2是真实目标点云数据集,s′1和s′2分别表示点云的点。
在本发明的一个优选实施例中,还包括:
设计模型优化的总损失函数,总损失函数表达式为:其中α与β满足α+β=1且0.5<α<1,其中α为主分支的权重,β为辅助分支的权重,主分支的权重需要大于辅助分支的权重,可以根据计算的总损失函数的情况更新权重参数。
通过使用本发明的技术方案,能够大幅度提高模型计算效率,降低对计算设备内存空间的要求,能够减少模型的参数量和计算量,提高了点云补全的准确性和鲁棒性。
需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,上述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中存储介质可为磁碟、光盘、只读存储器(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
此外,根据本发明实施例公开的方法还可以被实现为由CPU执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时,执行本发明实施例公开的方法中限定的上述功能。
基于上述目的,本发明的实施例的第二个方面,提出了一种点云补全的装置,如图4所示,装置200包括:
第一计算模块,第一计算模块配置为计算传感器采集到的点云数据的第一高维语义特征,并计算第一高维语义特征的全局语义特征;
第二计算模块,第二计算模块配置为计算点云数据聚类后点簇的特征,并计算点簇的特征的第二高维语义特征;
拼接模块,拼接模块配置为将第二高维语义特征与全局语义特征进行拼接得到融合特征图;
第三计算模块,第三计算模块配置为计算融合特征图的高维语义特征,对高维语义特征进行解码计算得到补全后的点云。
在本发明的一个优选实施例中,第一计算模块还配置为:
将点云数据输入到共享多层感知机中进行计算,以得到第一高维语义特征。
在本发明的一个优选实施例中,第一计算模块还配置为:
将第一高维语义特征进行最大池化计算,以得到全局语义特征。
在本发明的一个优选实施例中,第二计算模块还配置为:
将点云数据进行聚类计算以得到K个点簇,其中K大于1且小于N/2。
在本发明的一个优选实施例中,第二计算模块还配置为:
计算K个点簇中每个点簇中特征向量的平均向量,并使用每个点簇中特征向量的平均向量作为K个点簇中每个点簇的特征。
在本发明的一个优选实施例中,第二计算模块还配置为:
将K个点簇的特征输入第一多层感知机中进行计算,以得到第二高维语义特征。
在本发明的一个优选实施例中,拼接模块还配置为:
将全局语义特征重复K次得到第一全局语义特征;
将第二高维语义特征与第一全局语义特征进行拼接得到融合特征;
将融合特征输入第二多层感知机中进行计算,以得到融合特征图。
在本发明的一个优选实施例中,第三计算模块还配置为:
将融合特征图进行最大池化计算得到第三高维语义特征。
在本发明的一个优选实施例中,第三计算模块还配置为:
将第三高维语义特征输入到多层感知机中进行解码计算得到补全后的点云。
基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备。图5示出的是本发明提供的计算机设备的实施例的示意图。如图5所示,本发明实施例包括如下装置:至少一个处理器21;以及存储器22,存储器22存储有可在处理器上运行的计算机指令23,指令由处理器执行时实现以上任一方法。
基于上述目的,本发明实施例的第四个方面,提出了一种计算机可读存储介质。图6示出的是本发明提供的计算机可读存储介质的实施例的示意图。如图6所示,计算机可读存储介质31存储有被处理器执行时执行如上任一方法的计算机程序32。
此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。
此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(DSL)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、DSL或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(CD)、激光盘、光盘、数字多功能盘(DVD)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (12)
1.一种点云补全的方法,其特征在于,包括以下步骤:
计算传感器采集到的点云数据的第一高维语义特征,并计算第一高维语义特征的全局语义特征;
计算点云数据聚类后点簇的特征,并计算点簇的特征的第二高维语义特征;
将第二高维语义特征与全局语义特征进行拼接得到融合特征图;
计算融合特征图的第三高维语义特征,对第三高维语义特征进行解码计算得到补全后的点云。
2.根据权利要求1所述的方法,其特征在于,计算传感器采集到的点云数据的第一高维语义特征包括:
将点云数据输入到共享多层感知机中进行计算,以得到第一高维语义特征。
3.根据权利要求2所述的方法,其特征在于,计算第一高维语义特征的全局语义特征包括:
将第一高维语义特征进行最大池化计算,以得到全局语义特征。
4.根据权利要求1所述的方法,其特征在于,计算点云数据聚类后点簇的特征包括:
将点云数据进行聚类计算以得到K个点簇,其中K大于1且小于N/2。
5.根据权利要求4所述的方法,其特征在于,计算点云数据聚类后点簇的特征包括:
计算K个点簇中每个点簇中特征向量的平均向量,并使用每个点簇中特征向量的平均向量作为K个点簇中每个点簇的特征。
6.根据权利要求5所述的方法,其特征在于,计算点簇的特征的第二高维语义特征包括:
将K个点簇的特征输入第一多层感知机中进行计算,以得到第二高维语义特征。
7.根据权利要求6所述的方法,其特征在于,将第二高维语义特征与全局语义特征进行拼接得到融合特征图包括:
将全局语义特征重复K次得到第一全局语义特征;
将第二高维语义特征与第一全局语义特征进行拼接得到融合特征;
将融合特征输入第二多层感知机中进行计算,以得到融合特征图。
8.根据权利要求7所述的方法,其特征在于,计算融合特征图的第三高维语义特征包括:
将融合特征图进行最大池化计算得到第三高维语义特征。
9.根据权利要求8所述的方法,其特征在于,对第三高维语义特征进行解码计算得到补全后的点云包括:
将第三高维语义特征输入到多层感知机中进行解码计算得到补全后的点云。
10.一种点云补全的装置,其特征在于,所述装置包括:
第一计算模块,所述第一计算模块配置为计算传感器采集到的点云数据的第一高维语义特征,并计算第一高维语义特征的全局语义特征;
第二计算模块,所述第二计算模块配置为计算点云数据聚类后点簇的特征,并计算点簇的特征的第二高维语义特征;
拼接模块,所述拼接模块配置为将第二高维语义特征与全局语义特征进行拼接得到融合特征图;
第三计算模块,所述第三计算模块配置为计算融合特征图的第三高维语义特征,对第三高维语义特征进行解码计算得到补全后的点云。
11.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-9任意一项所述方法的步骤。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-9任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310790431.1A CN116739940A (zh) | 2023-06-30 | 2023-06-30 | 一种点云补全的方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310790431.1A CN116739940A (zh) | 2023-06-30 | 2023-06-30 | 一种点云补全的方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116739940A true CN116739940A (zh) | 2023-09-12 |
Family
ID=87909590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310790431.1A Pending CN116739940A (zh) | 2023-06-30 | 2023-06-30 | 一种点云补全的方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116739940A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117496161A (zh) * | 2023-12-29 | 2024-02-02 | 武汉理工大学 | 一种点云分割方法及装置 |
-
2023
- 2023-06-30 CN CN202310790431.1A patent/CN116739940A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117496161A (zh) * | 2023-12-29 | 2024-02-02 | 武汉理工大学 | 一种点云分割方法及装置 |
CN117496161B (zh) * | 2023-12-29 | 2024-04-05 | 武汉理工大学 | 一种点云分割方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110660062B (zh) | 一种基于PointNet的点云实例分割方法及系统 | |
CN107844743A (zh) | 一种基于多尺度分层残差网络的图像多字幕自动生成方法 | |
CN112187554B (zh) | 一种基于蒙特卡洛树搜索的运维系统故障定位方法和系统 | |
CN116739940A (zh) | 一种点云补全的方法、装置、设备及介质 | |
CN112445957A (zh) | 社交网络异常用户检测方法、系统、介质、设备、终端 | |
CN114418189A (zh) | 水质等级预测方法、系统、终端设备及存储介质 | |
CN116166642A (zh) | 基于引导信息的时空数据填补方法、系统、设备及介质 | |
CN113870312A (zh) | 基于孪生网络的单目标跟踪方法 | |
CN116861262B (zh) | 一种感知模型训练方法、装置及电子设备和存储介质 | |
CN116432736A (zh) | 神经网络模型优化方法、装置及计算设备 | |
Weilharter et al. | Atlas-mvsnet: Attention layers for feature extraction and cost volume regularization in multi-view stereo | |
CN117636626A (zh) | 强化道路周边空间特征的异质图交通预测方法及系统 | |
CN117671480A (zh) | 基于视觉大模型的滑坡自动识别方法、系统和计算机设备 | |
CN112862211A (zh) | 通信管理系统动环缺陷派单方法及装置 | |
CN116579409A (zh) | 基于重参数化的智能相机模型剪枝加速方法及加速系统 | |
CN116910608A (zh) | 一种基于时空门控图卷积网络的多源数据预测方法和装置及计算机和存储介质 | |
CN114372526B (zh) | 一种数据恢复方法、系统、计算机设备及存储介质 | |
CN113449626B (zh) | 隐马尔科夫模型振动信号分析方法装置、存储介质和终端 | |
CN116151409A (zh) | 基于神经网络的城市日需水量预测的方法 | |
CN115393735A (zh) | 基于改进U-Net的遥感影像建筑物提取方法 | |
CN114926652A (zh) | 基于交互与聚合式特征优化的孪生跟踪方法及系统 | |
Du et al. | Big Data Analysis and Prediction System Based on Improved Convolutional Neural Network | |
Zhao et al. | E‐Commerce Picture Text Recognition Information System Based on Deep Learning | |
Zou et al. | Group‐Based Atrous Convolution Stereo Matching Network | |
CN116150699B (zh) | 基于深度学习的交通流预测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |