CN114492619A - 一种基于统计和凹凸性的点云数据集构建方法及装置 - Google Patents

一种基于统计和凹凸性的点云数据集构建方法及装置 Download PDF

Info

Publication number
CN114492619A
CN114492619A CN202210077736.3A CN202210077736A CN114492619A CN 114492619 A CN114492619 A CN 114492619A CN 202210077736 A CN202210077736 A CN 202210077736A CN 114492619 A CN114492619 A CN 114492619A
Authority
CN
China
Prior art keywords
point
point cloud
clustering
centroid
cloud data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210077736.3A
Other languages
English (en)
Other versions
CN114492619B (zh
Inventor
余思佳
赵志彬
王华磊
胡任杰
黄世昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202210077736.3A priority Critical patent/CN114492619B/zh
Publication of CN114492619A publication Critical patent/CN114492619A/zh
Application granted granted Critical
Publication of CN114492619B publication Critical patent/CN114492619B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及计算机视觉、点云分割技术领域,提供了一种基于统计和凹凸性的点云数据集构建方法及装置。目的在于将传统点云分割方法应用于深度学习数据集的构建,解决深度学习点云数据集匮乏的问题。主要方案包括,步骤1:获取目标原始点云数据,进行基于特征的滤波去噪;步骤2:第一次聚类,对点云进行超体聚类过分割,得到体素块集合;步骤3:第二次聚类,对步骤2获得的各体素块进行LCCP聚类,得到LCCP聚类集合;步骤4:第三次聚类,基于点特征直方图对LCCP聚类集合进行条件欧几里得聚类,得到最终聚类集合;步骤5:根据最终聚类集合的结果将点云进行标记,组织文件得到点云数据集。

Description

一种基于统计和凹凸性的点云数据集构建方法及装置
技术领域
本发明涉及计算机视觉、点云分割技术领域,提供了一种基于统计和凹凸性的点云数据集构建方法及装置。
背景技术
近年来,深度传感器和三维激光扫描仪的普及推动了三维点云处理方法的快速发展。点云分割作为点云数据处理与分析的基础技术,成为自动驾驶、导航定位、智慧城市、医学影像分割等领域的研究热点。
点云分割是把点云分为若干个特定的、具有独特性质的区域并识别出点云内容的技术。传统的点云分割方法大多是通过提取三维形状几何属性的空间分布手工提取特征,构建相应的判别模型实现分割。手工提取的特征主要依靠设计者的先验知识以及手工调动参数,限制了大数据的使用。伴随着大型三维模型数据的出现和GPU计算能力的不断迭代更新,深度学习在点云分割领域逐渐占据了绝对主导地位。
但是基于深度学习的分割方法需要大量的数据对模型进行训练且需要大量的计算资源,目前已有的数据集并不能满足语义分割发展的需求,因此构建数据量丰富、有效且全面的数据集是目前语义分割的首要条件。而且,现有的三维数据集大部分局限在室内场景以及城市街道场景,例如图1所示的Matterport3D数据集。有标注且内容丰富的户外点云场景、遥感和机械零件等针对各领域的专门数据集相对较少,建立一套标准的数据集构建方法对构建针对各领域需求的数据集,以及加速深度学习技术在三维领域的发展十分必要。
目前,构建点云数据集的主要方法是首先通过标注软件对点云进行标注,然后按照深度学习模型的输入要求将数据组织成文件。其中最耗时耗力的工作就是点云标注,主流的标注软件有semantic-segmentation-editor等,但是都需要人工逐点操作,工作量大、效率低。为了提高标注效率,首要目标就是实现点云的精细预分割,将人工因素压缩到最小以实现数据的批量处理。
目前的点云分割方法主要分为传统方法和基于深度学习的方法两大类。
传统的点云分割方法主要分为以下4种:
一、以边缘为基础的分割方法:这种方法通过计算梯度检测表面上单位法向量方向的变化,或者计算点云强度,根据单位法向量或者点云强度变化来确定点云区域的边界,从而得到分割块,但是点云分割块边缘的损失会偏大,准确度也不能得到保证,原因在于边缘对于噪声、不均匀或稀疏的点云非常敏感。
二、区域生长算法:即根据点云法线、曲率估计算法获得其法线和曲率值,通过法线和曲率来判断某点是否属于该类,进而获取点云的不同分割区域,但存在分割过度或者分割不足的问题。
三、基于属性的分割算法:使用点云属性作为聚类阈值得到分割结果,但是过于依赖点云密度且相当耗时。
四、以模型为基础的分割方法:通过将提取的特征与存储在数据库中的场景相匹配来执行物体的分割,这种算法强烈依赖于检测测试场景和存储模型之间的重复性的、可靠的和描述性特征,以及相应的准确特征,当场景点云数量较大时,算法执行起来需要大量的时间和计算。
LCCP(Locally Convex Connected Patches)算法在区域生长算法的基础上做了进一步工作,通过距离以及法线信息分析体素块之间的凹凸性关系,比前述4类传统方法有更高的分割精度和效率,也能够分割发生接触或者层叠的点云。算法大致可以分成两个部分:基于超体聚类的过分割和在超体聚类基础上的再聚类。
基于深度学习的点云分割方法发展迅速,主要有基于投影的深度神经网络、基于体素的深度神经网络、基于点的深度神经网络和基于超点图的深度神经网络等。基于深度学习的方法通过使用大量的训练数据对设计好的深层神经网络进行参数训练,提取点云高层次的特征并对其进行分类,最终实现对点云数据逐点的语义分割。但是基于深度学习的方法需要大量的数据对模型进行训练且需要大量的计算资源,对于较少的训练数据很难使深度神经网络达到理想的分割效果。因此利用传统方法获得一定数量的标注好的点云数据集,是基于深度学习方法应用和推广的基础。
目前,关于点云数据标注的相关成果相对较少。在“点云数据的标注方法、装置、设备和介质”中提出了一种基于预训练模型的点云标注方法。具体为,将原始点云数据集合进行数据分割,得到至少两个点云数据子集;利用预先训练的预测模型,分别对所述每个点云数据子集进行预测,得到所述每个点云数据子集中各点云数据的预测类别和预测概率;再根据每个点云数据子集中各点云数据的预测类别和预测概率,确定原始点云数据集合中各点云数据的标注结果。“一种三维点云语义分割标注方法”中公开了一种三维点云语义分割标注方法。具体为,将多线束激光雷达采集到的点云数据进行球面映射预处理,将稀疏的不均匀分布的点云数据转换为均匀密集分布的球面图;设计神经网络结构,对点云数据进行分割,并基于kitti数据集中的标签文件和点云数据文件对网络模型进行预训练;利用预训练网络模型得到点云场景的语义分割结果。
上述相关方法的主要缺陷有两方面:
一、只有预训练模型的质量足够好才能保障最终数据集的准确性;
二、需要数量充足和类别丰富的点云数据集来训练预测模型,才能得到鲁棒性较好的点云数据集。这些方法都没有解决神经网络应用中训练和测试数据集快速高效构建的基本问题。
发明内容
本发明的目的在于将传统点云分割方法应用于深度学习数据集的构建,解决深度学习点云数据集匮乏的问题。
本发明为了解决上述技术问题,采用以下技术方案:
一种基于统计和凹凸性的点云数据集构建方法,包括以下步骤:
步骤1:获取目标原始点云数据,进行基于特征的滤波去噪;
步骤2:第一次聚类,对点云进行超体聚类过分割,得到体素块集合;
步骤3:第二次聚类,对步骤2获得的各体素块进行LCCP聚类,得到LCCP聚类集合;
步骤4:第三次聚类,基于点特征直方图对LCCP聚类集合进行条件欧几里得聚类,得到最终聚类集合;
步骤5:根据最终聚类集合的结果将点云进行标记,组织文件得到点云数据集。
上述技术方案中,步骤1包括以下步骤:
步骤1.1、获取目标原始点云数据,扫描点云数据,构建八叉树,其中点云中点的个数为n,任意一点pi的ki邻域点集为Ni(pi),其中i=1,2,…n,ki表示pi的最近邻点的个数,其初始值由用户给定;
步骤1.2、求解每一个点pi在Ni(pi)内的局部邻域距离di
步骤1.3、求解当前所有点局部邻域距离的平均值
Figure BDA0003483927330000041
设初始平均距离
Figure BDA0003483927330000042
步骤1.4、如果
Figure BDA0003483927330000043
转到步骤1.5;否则转到步骤1.6,f由用户设定;
步骤1.5、逐点判断点pi的局部邻域距离di,如果
Figure BDA0003483927330000044
则ki=ki-1:如果此时ki==0,则将点pi去除,如果ki>0,则更新Ni(pi),重新计算di;同时j=j+1,转到步骤1.3,其中σ为标准差
Figure BDA0003483927330000045
λ为给定值,di的分布应符合高斯分布,由于一维高斯分布的数据点集中分布在以均值为中心、±3σ之内的范围内,因此一般取λ为3;
步骤1.6、逐点判断点pi的局部邻域距离di,如果
Figure BDA0003483927330000046
就将点pi去除,否则就保留点pi,处理完所有的点。
上述技术方案中,步骤3包括以下步骤:
步骤3.1、获取体素块集合中邻接体素块之间的局部凹凸性,具体方法为:当体素块集合中邻接体素块连接时,采用CC准则获取所述邻接体素块的局部凹凸性;当体素块集合中邻接体素块不连接时,采用SC准则获取所述邻接体素块的局部凹凸性;
步骤3.2、在标记完各个区域之间的凹凸关系后,采用区域生长算法将小区域聚类成较大的区域,得到LCCP聚类集合。
上述技术方案中,步骤4包括以下步骤:
步骤4.1、步骤3得到的LCCP聚类集合中的类别数为K0,求解每一个类别集合的质心ci(i=1,2,…K0);
步骤4.2、将质心ci构建为八叉树结构T;
步骤4.3、建立待处理集合P,集群列表C,以及类别质心队列Q,将所有质心ci添加到待处理集合P中;
步骤4.4、对每一个质心ci,判断以质心ci为球心的球体内的候选点的类别。
步骤4.4.1、判断待处理集合P是否为空,若P是则算法终止;否则从P中随机取出一个质心ci放到类别质心队列Q中,并从P中去除该质心ci
步骤4.4.2、对类别质心队列Q中的质心ci逐个执行以下操作:
在半径为R的球体中搜索ci的邻居点集合N(ci);使用巴氏距离比较法计算点ci与N(ci)中的每一个邻居点cj的PFH特征的巴氏距离Bij
若Bij≥α,则断定点ci与cj代表的两个类别集合不属于同一类;
若Bij<α,则将点cj添加到类别质心队列Q中,并从P中去除;
其中,R、α由用户自定义,将处理完的点ci标记为已处理,当类别质心队列Q中所有质心均标记为已处理时,转到步骤4.4.3;
步骤4.4.3、将类别质心队列Q中的点集添加到集群列表C中的第k项,重置类别质心队列Q为空,转到步骤4.4.1,其中,k=1,2,3...K,K为最终聚类集合的类别数目,点云中的点被聚类成K个点群。
上述技术方案中,步骤5包括以下步骤:
对分好类的点群进行编号并与目标标签一一对应,然后将每一个点以(x坐标,y坐标,z坐标,标签编号)的四元组形式存储在H5文件中,将标签编号与类别名称一一对应,以(标签编号,类别名称)二元组形式存储在txt文件中,H5文件、txt文件共同组成点云数据集。
本发明提供了一种基于统计和凹凸性的点云数据集构建装置,包括以下模块:
滤波模块:获取目标原始点云数据,进行基于特征的滤波去噪;
第一次聚类模块:对点云进行超体聚类过分割,得到体素块集合;
第二次聚类模块:对第一次聚类模块获得的各体素块进行LCCP聚类,得到LCCP聚类集合;
第三次聚类模块:基于点特征直方图对LCCP聚类集合进行条件欧几里得聚类,得到最终聚类集合;
标记模块:根据最终聚类集合的结果将点云进行标记,组织文件得到点云数据集。
上述技术方案中,滤波模块的实现步骤包括以下步骤:
步骤1.1、获取目标原始点云数据,扫描点云数据,构建八叉树,其中点云中点的个数为n,任意一点pi的ki邻域点集为Ni(pi),其中i=1,2,…n,ki表示pi的最近邻点的个数,其初始值由用户给定;
步骤1.2、求解每一个点pi在Ni(pi)内的局部邻域距离di
步骤1.3、求解当前所有点局部邻域距离的平均值
Figure BDA0003483927330000061
设初始平均距离
Figure BDA0003483927330000062
步骤1.4、如果
Figure BDA0003483927330000063
转到步骤1.5;否则转到步骤1.6,ε由用户设定;
步骤1.5、逐点判断点pi的局部邻域距离di,如果
Figure BDA0003483927330000064
则ki=ki-1:如果此时ki==0,则将点pi去除,如果ki>0,则更新Ni(pi),重新计算di;同时j=j+1,转到步骤1.3,其中σ为标准差
Figure BDA0003483927330000065
λ为给定值;
步骤1.6、逐点判断点pi的局部邻域距离di,如果
Figure BDA0003483927330000066
就将点pi去除,否则就保留点pi,处理完所有的点。
上述技术方案中,第二次聚类模块的实现包括以下步骤:
步骤3.1、获取体素块集合中邻接体素块之间的局部凹凸性,具体方法为:当体素块集合中邻接体素块连接时,采用CC准则获取所述邻接体素块的局部凹凸性;当体素块集合中邻接体素块不连接时,采用SC准则获取所述邻接体素块的局部凹凸性;
步骤3.2、在标记完各个区域之间的凹凸关系后,采用区域生长算法将小区域聚类成较大的区域,得到LCCP聚类集合。
上述技术方案中,第三次聚类模块的实现包括以下步骤:
步骤4.1、第二次聚类模块得到的LCCP聚类集合中的类别数为K0,求解每一个类别集合的质心ci(i=1,2,…K0);
步骤4.2、将质心ci构建为八叉树结构T;
步骤4.3、建立待处理集合P,集群列表C,以及类别质心队列Q,将所有质心ci添加到待处理集合P中;
步骤4.4、对每一个质心ci,判断以质心ci为球心的球体内的候选点的类别。
步骤4.4.1、判断待处理集合P是否为空,若P是则算法终止;否则从P中随机取出一个质心ci放到类别质心队列Q中,并从P中去除该质心ci
步骤4.4.2、对类别质心队列Q中的质心ci逐个执行以下操作:
在半径为R的球体中搜索ci的邻居点集合N(ci);使用巴氏距离比较法计算点ci与N(ci)中的每一个邻居点cj的PFH特征的巴氏距离Bij
若Bij≥α,则断定点ci与cj代表的两个类别集合不属于同一类;
若Bij<α,则将点cj添加到类别质心队列Q中,并从P中去除;
其中,R、α由用户自定义,将处理完的点ci标记为已处理,当类别质心队列Q中所有质心均标记为已处理时,转到步骤4.4.3;
步骤4.4.3、将类别质心队列Q中的点集添加到集群列表C中的第k项,重置类别质心队列Q为空,转到步骤4.4.1,其中,k=1,2,3...K,K为最终聚类集合的类别数目,点云中的点被聚类成K个点群。
上述技术方案中,标记模块的实现包括以下步骤:
对分好类的点群进行编号并与目标标签一一对应,然后将每一个点以(x坐标,v坐标,z坐标,标签编号)的四元组形式存储在H5文件中,将标签编号与类别名称一一对应,以(标签编号,类别名称)二元组形式存储在txt文件中,H5文件、txt文件共同组成点云数据集。
因为本发明采用上述技术方案,因此具备以下有益效果:
一、现有点云标注方法对预训练数据集和预训练模型的质量依赖程度较高,本申请能够快速构建高质量的点云数据集,适合在深度学习的初期用于样本数据库的构建;由于采用了传统的点云处理算法,本申请的方法对各种类型的数据均适用,不受特定学习特征的限制。
二、本申请提出了一种改进的基于统计的点云去噪处理方法,相比传统的处理方法考虑了离群点对边缘点的影响,尽可能避免了去除位于边缘的非噪声点,能够在保证点云边缘质量的基础上有效去噪。
三、对经过LCCP算法得到的聚类集合,通过计算PFH并结合条件欧几里得聚类算法进一步聚类得到更加准确地结果,有效的解决了分割过细、类别过多的过分割问题;相较于现有的LCCP算法,能够对具有光滑曲面的几何形状上的点进行更加有效的聚类;同时通过人为控制点之间的特征相似性,可以有效控制聚类过程,从而得到最佳的分割效果。
附图说明
图1为Matterport3D点云数据;
图2为数据集构建流程图;
图3为基于统计的点云去噪算法流程;
图4为超体聚类前后对比;
图5为LCCP聚类集合图像;
图6为任意一点pi的PFH示意;
图7为基于PFH特征的条件欧几里得聚类算法流程;
图8为最终聚类集合图像。
具体实施方式
以下将对本发明的实施例给出详细的说明。尽管本发明将结合一些具体实施方式进行阐述和说明,但需要注意的是本发明并不仅仅只局限于这些实施方式。相反,对本发明进行的修改或者等同替换,均应涵盖在本发明的权利要求范围当中。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员将理解,没有这些具体细节,本发明同样可以实施。
本申请提出一种基于统计和凹凸性的点云数据集构建方法和装置,克服或部分解决前述算法过分割的问题,是一种能够大幅度降低人工工作量的数据集构建方法和装置。主要思想是采用基于统计的方式去除原始点云噪声,然后对点云进行超体聚类生成超素体,并在使用LCCP算法进行分割的基础上进一步聚类,最后对聚类的结果进行标注,按照深度学习网络数据格式构建数据集。
本申请提出的点云数据集构建流程如图2所示,所述方法包括以下5个步骤:
步骤1:获取目标原始点云数据,进行基于特征的滤波去噪;
步骤2:第一次聚类,对点云进行超体聚类过分割,得到体素块集合;
步骤3:第二次聚类,对步骤2获得的各体素块进行LCCP聚类,得到LCCP聚类集合;
步骤4:第三次聚类,基于点特征直方图对LCCP聚类集合进行条件欧几里得聚类,得到最终聚类集合;
步骤5:根据最终聚类集合的结果将点云进行标记,组织文件得到点云数据集。
其中对于步骤1,作如下说明:
使用数据采集设备,获取目标的空间三维信息即点云数据。由于采集设备的限制和环境中光线等的影响,获取的点云数据不可避免的会有噪点产生,因此需对三维点云进行去噪处理。现有的基于统计的点云去噪算法流程为:
1、扫描点云,构建八叉树结构。设点云中点的个数为n,任意一点pi(i=1,2,…n)的k邻域点集为N(pi),其中k为与pi距离最近的点的个数,其取值由用户确定。一般情况下,k值如果过小,则被看作噪声的点就会较多,容易产生过去噪,如果取值过大,则无法有效去噪。
2、求解每一个点pi与N(pi)内各个点的平均距离di,di称为点pi的局部邻域距离;
3、求解点云中所有点的局部邻域距离的平均距离
Figure BDA0003483927330000091
和标准差
Figure BDA0003483927330000092
4、对点云逐点进行判断,如果点pi的局部邻域距离
Figure BDA0003483927330000093
就认为该点为噪声,应将其从点云中去除。其中,局部邻域距离di分的布应符合高斯分布,由于一维高斯分布的数据点集中分布在以均值为中心、±3σ之内的范围内,因此一般取λ为3。
该去噪算法的缺点是没有考虑离群点对边缘点的影响,可能错误地去除非噪声点。为了在保证点云边缘的基础上有效去除噪声,本申请提出改进的基于统计的点云去噪算法,具体流程为:
步骤1.1、获取目标原始点云数据,扫描点云数据,构建八叉树,其中点云中点的个数为n,任意一点pi的ki邻域点集为Ni(pi),其中i=1,2,…n,ki表示pi的最近邻点的个数,其初始值由用户给定;
步骤1.2、求解每一个点pi在Ni(pi)内的局部邻域距离di
步骤1.3、求解当前所有点局部邻域距离的平均值
Figure BDA0003483927330000101
设初始平均距离
Figure BDA0003483927330000102
步骤1.4、如果
Figure BDA0003483927330000103
转到步骤1.5;否则转到步骤1.6,f由用户设定;
步骤1.5、逐点判断点pi的局部邻域距离di,如果
Figure BDA0003483927330000104
则ki=ki-1:如果此时ki==0,则将点pi去除,如果ki>0,则更新Ni(pi),重新计算di;同时j=j+1,转到步骤1.3,其中σ为标准差
Figure BDA0003483927330000105
根据一维高斯分布规律λ,一般取值3;
步骤1.6、逐点判断点pi的局部邻域距离di,如果
Figure BDA0003483927330000106
就将点pi去除,否则就保留点pi,处理完所有的点。
改进的基于统计的点云去噪算法的流程如图3所示。
其中对于步骤2,作如下说明:
在二维图像处理中,将图像无监督地过度分割成相似的像素区域(超像素)是分割算法中广泛使用的预处理步骤。超像素方法减少了后续必须由计算量更大的算法来考虑的区域数量,而信息丢失最少——这一思路同样适用于三维点云数据的处理。本申请采用的超体聚类方法是VCCS(Voxel Cloud Connectivity Segmentation),它是一种区域生长方法,其基本思想是从点云空间中均匀分布的一组种子点开始扩展得到超体素。超体聚类效果如图4所示。
其中对于步骤3,作如下说明:
基于凹凸性进行分割处理的方法最早来源于对二维图像的研究,因为二维图像的凹凸性很难描述,同时随着神经网络的出现,这种方法并没有被广泛研究。但是,对于三维图像,凹凸性是很容易描述的特性,基于凹凸性对体素块集合进行分割处理的算法能得到比较好的结果,例如LCCP算法。其具体步骤为:
1、获取体素块集合中邻接体素块之间的局部凹凸性,具体方法为:当体素块集合中邻接体素块连接时,采用CC(Extended Convexity Criterion)准则获取所述邻接体素块的局部凹凸性;当体素块集合中邻接体素块不连接时,采用SC(Sanity Criterion)准则获取所述邻接体素块的局部凹凸性。
2、在标记完各个区域之间的凹凸关系后,采用区域生长算法将小区域聚类成较大的区域。
至此,分割完成,得到LCCP聚类集合,如图5所示。
其中对于步骤4,作如下说明:
可以观察到LCCP得到的聚类集合仍存在过分割的情况。LCCP算法对曲面等光滑几何形状的分割效果不好,主要原因是LCCP算法对邻接体素块是否应聚类进行正确判断的基础是邻接体素块的形状接近平面,而曲面形状会导致CC和CS准则判断失误,有必要进行再次聚类。
点特征直方图(PointFeamreHistograms,PFH)是通过数理统计的方法获得的一种用于描述中心点邻域内的平均曲率信息的直方图,其目的是将一个点的邻域曲率集合特性编码到多维的直方图中,这样的高维数据可以提供丰富信息量的特征表达,并且具备旋转平移不变性和良好的鲁棒性。图6是点云中某一点的PFH直方图。
点的PFH相似性可以表征点的相似程度,判别PFH的相似性的常用方法是巴氏距离(Bhattacharyya distance)比较法,巴氏距离范围为[0,1],越接近0表示点的相似度越高。
条件欧几里得聚类[5]是一种基于欧几里得距离和自定义条件对点进行聚类的算法,类似于区域生长算法,但是合并邻居点的条件由用户自定义。
本申请结合PFH的相似性和条件欧几里得聚类,实现进一步聚类,提高分类的准确性。具体的过程为:
步骤4.1、步骤3得到的LCCP聚类集合中的类别数为K0,求解每一个类别集合的质心ci(i=1,2,…K0);
步骤4.2、将质心ci构建为八叉树结构T;
步骤4.3、建立待处理集合P,集群列表C,以及类别质心队列Q,将所有质心ci添加到待处理集合P中;
步骤4.4、对每一个质心ci,判断以质心ci为球心的球体内的候选点的类别。
步骤4.4.1、判断待处理集合P是否为空,若P是则算法终止;否则从P中随机取出一个质心ci放到类别质心队列Q中,并从P中去除该质心ci
步骤4.4.2、对类别质心队列Q中的质心ci逐个执行以下操作:
在半径为R的球体中搜索ci的邻居点集合N(ci);使用巴氏距离比较法计算点ci与N(ci)中的每一个邻居点cj的PFH特征的巴氏距离Bij
若Bij≥α,则断定点ci与cj代表的两个类别集合不属于同一类;
若Bij<α,则将点cj添加到类别质心队列Q中,并从P中去除;
其中,R、α由用户自定义,R和a过大会导致不相关的类别合并,过小则导致过分割,一般α取值为0.5。将处理完的点ci标记为已处理,当类别质心队列Q中所有质心均标记为已处理时,转到步骤4.4.3;
步骤4.4.3、将类别质心队列Q中的点集添加到集群列表C中的第k项,重置类别质心队列Q为空,转到步骤4.4.1,其中,k=1,2,3...K,K为最终聚类集合的类别数目,点云中的点被聚类成K个点群。
其中对于步骤5,作如下说明:
对点群进行编号并与目标标签一一对应,然后将每一个点以(x坐标,y坐标,z坐标,标签编号)的四元组形式存储在H5文件中,将标签编号与类别名称一一对应,以(标签编号,类别名称)二元组形式存储在txt文件中,H5文件、txt文件共同组成点云数据集。

Claims (10)

1.一种基于统计和凹凸性的点云数据集构建方法,其特征在于,包括以下步骤:
步骤1:获取目标原始点云数据,进行基于特征的滤波去噪;
步骤2:第一次聚类,对点云进行超体聚类过分割,得到体素块集合;
步骤3:第二次聚类,对步骤2获得的各体素块进行LCCP聚类,得到LCCP聚类集合;
步骤4:第三次聚类,基于点特征直方图对LCCP聚类集合进行条件欧几里得聚类,得到最终聚类集合;
步骤5:根据最终聚类集合的结果将点云进行标记,组织文件得到点云数据集。
2.根据权利要求1所述的一种基于统计和凹凸性的点云数据集构建方法,其特征在于,步骤1包括以下步骤:
步骤1.1、获取目标原始点云数据,扫描点云数据,构建八叉树,其中点云中点的个数为n,任意一点pi的ki邻域点集为Ni(pi),其中i=1,2,…n,ki表示pi的最近邻点的个数,其初始值由用户给定;
步骤1.2、求解每一个点pi与Ni(pi)内其他点的局部邻域距离di
步骤1.3、求解当前所有点局部邻域距离的平均值
Figure FDA0003483927320000011
设初始平均距离
Figure FDA0003483927320000012
步骤1.4、如果
Figure FDA0003483927320000013
转到步骤1.5;否则转到步骤1.6,ε由用户设定;
步骤1.5、逐点判断点pi的局部邻域距离di,如果
Figure FDA0003483927320000014
则ki=ki-1:如果此时ki==0,则将点pi去除,如果ki>0,则更新Ni(pi),重新计算di;同时j=j+1,转到步骤1.3,其中σ为标准差
Figure FDA0003483927320000015
λ为给定值;
步骤1.6、逐点判断点pi的局部邻域距离di,如果
Figure FDA0003483927320000016
就将点pi去除,否则就保留点pi,处理完所有的点。
3.根据权利要求1所述的一种基于统计和凹凸性的点云数据集构建方法,其特征在于,步骤3包括以下步骤:
步骤3.1、获取体素块集合中邻接体素块之间的局部凹凸性,具体方法为:当体素块集合中邻接体素块连接时,采用CC准则获取所述邻接体素块的局部凹凸性;当体素块集合中邻接体素块不连接时,采用SC准则获取所述邻接体素块的局部凹凸性;
步骤3.2、在标记完各个区域之间的凹凸关系后,采用区域生长算法将小区域聚类成较大的区域,得到LCCP聚类集合。
4.根据权利要求1所述的一种基于统计和凹凸性的点云数据集构建方法,其特征在于,步骤4包括以下步骤:
步骤4.1、步骤3得到的LCCP聚类集合中的类别数为K0,求解每一个类别集合的质心ci(i=1,2,…K0);
步骤4.2、将质心ci构建为八叉树结构T;
步骤4.3、建立待处理集合P,集群列表C,以及类别质心队列Q,将所有质心ci添加到待处理集合P中;
步骤4.4、对每一个质心ci,判断以质心ci为球心的球体内的候选点的类别;
步骤4.4.1、判断待处理集合P是否为空,若P是则算法终止;否则从P中随机取出一个质心ci放到类别质心队列Q中,并从P中去除该质心ci
步骤4.4.2、对类别质心队列Q中的质心ci逐个执行以下操作:
在半径为R的球体中搜索ci的邻居点集合N(ci);使用巴氏距离比较法计算点ci与N(ci)中的每一个邻居点cj的PFH特征的巴氏距离Bij
若Bij≥α,则断定点ci与cj代表的两个类别集合不属于同一类;
若Bij<α,则将点cj添加到类别质心队列Q中,并从P中去除;
其中,R、α由用户自定义,将处理完的点ci标记为已处理,当类别质心队列Q中所有质心均标记为已处理时,转到步骤4.4.3;
步骤4.4.3、将类别质心队列Q中的点集添加到集群列表C中的第k项,重置类别质心队列Q为空,转到步骤4.4.1;其中,k=1,2,3...K,K为最终聚类集合的类别数目,点云中的点被聚类成K个点群。
5.根据权利要求4所述的一种基于统计和凹凸性的点云数据集构建方法,其特征在于,步骤5包括以下步骤:
对分好类的点群进行编号并与目标标签一一对应,然后将每一个点以(x坐标,y坐标,z坐标,标签编号)的四元组形式存储在H5文件中,将标签编号与类别名称一一对应,以(标签编号,类别名称)二元组形式存储在txt文件中,H5文件、txt文件共同组成点云数据集。
6.一种基于统计和凹凸性的点云数据集构建装置,其特征在于,包括以下模块:
滤波模块:获取目标原始点云数据,进行基于特征的滤波去噪;
第一次聚类模块:对点云进行超体聚类过分割,得到体素块集合;
第二次聚类模块:对第一次聚类模块获得的各体素块进行LCCP聚类,得到LCCP聚类集合;
第三次聚类模块:基于点特征直方图对LCCP聚类集合进行条件欧几里得聚类,得到最终聚类集合;
标记模块:根据最终聚类集合的结果将点云进行标记,组织文件得到点云数据集。
7.根据权利要求6所述的一种基于统计和凹凸性的点云数据集构建装置,其特征在于,滤波模块的实现步骤包括以下步骤:
步骤1、获取目标原始点云数据,扫描点云数据,构建八叉树,其中点云中点的个数为n,任意一点pi的ki邻域点集为Ni(pi),其中i=1,2,…n,ki表示pi的最近邻点的个数,其初始值由用户给定;
步骤2、求解每一个点pi在Ni(pi)内的局部邻域距离di
步骤3、求解当前所有点局部邻域距离的平均值
Figure FDA0003483927320000031
设初始平均距离
Figure FDA0003483927320000032
步骤4、如果
Figure FDA0003483927320000033
转到步骤5;否则转到步骤6,ε由用户设定;
步骤5、逐点判断点pi的局部邻域距离di,如果
Figure FDA0003483927320000041
则ki=ki-1:如果此时ki==0,则将点pi去除,如果ki>0,则更新Ni(pi),重新计算di;同时j=j+1,转到步骤3,其中σ为标准差
Figure FDA0003483927320000042
λ为给定值;
步骤6、逐点判断点pi的局部邻域距离di,如果
Figure FDA0003483927320000043
就将点pi去除,否则就保留点pi,处理完所有的点。
8.根据权利要求6所述的一种基于统计和凹凸性的点云数据集构建装置,其特征在于,第二次聚类模块的实现包括以下步骤:
步骤1、获取体素块集合中邻接体素块之间的局部凹凸性,具体方法为:当体素块集合中邻接体素块连接时,采用CC准则获取所述邻接体素块的局部凹凸性;当体素块集合中邻接体素块不连接时,采用SC准则获取所述邻接体素块的局部凹凸性;
步骤2、在标记完各个区域之间的凹凸关系后,采用区域生长算法将小区域聚类成较大的区域,得到LCCP聚类集合。
9.根据权利要求6所述的一种基于统计和凹凸性的点云数据集构建装置,其特征在于,第三次聚类模块的实现包括以下步骤:
步骤1、第二次聚类模块得到的LCCP聚类集合中的类别数为K0,求解每一个类别集合的质心ci(i=1,2,…K0);
步骤2、将质心ci构建为八叉树结构T;
步骤3、建立待处理集合P,集群列表C,以及类别质心队列Q,将所有质心ci添加到待处理集合P中;
步骤4、对每一个质心ci,判断以质心ci为球心的球体内的候选点的类别;
步骤4.1、判断待处理集合P是否为空,若P是则算法终止;否则从P中随机取出一个质心ci放到类别质心队列Q中,并从P中去除该质心ci
步骤4.2、对类别质心队列Q中的质心ci逐个执行以下操作:
在半径为R的球体中搜索ci的邻居点集合N(ci);使用巴氏距离比较法计算点ci与N(ci)中的每一个邻居点cj的PFH特征的巴氏距离Bij
若Bij≥α,则断定点ci与cj代表的两个类别集合不属于同一类;
若Bij<α,则将点cj添加到类别质心队列Q中,并从P中去除;
其中,R、α由用户自定义,将处理完的点ci标记为已处理,当类别质心队列Q中所有质心均标记为已处理时,转到步骤4.3;
步骤4.3、将类别质心队列Q中的点集添加到集群列表C中的第k项,重置类别质心队列Q为空,转到步骤4.1;其中,k=1,2,3...K,K为最终聚类集合的类别数目,点云中的点被聚类成K个点群。
10.根据权利要求9所述的一种基于统计和凹凸性的点云数据集构建装置,其特征在于,标记模块的实现包括以下步骤:
对分好类的点群进行编号并与目标标签一一对应,然后将每一个点以(x坐标,y坐标,z坐标,标签编号)的四元组形式存储在H5文件中,将标签编号与类别名称一一对应,以(标签编号,类别名称)二元组形式存储在txt文件中,H5文件、txt文件共同组成点云数据集。
CN202210077736.3A 2022-01-22 2022-01-22 一种基于统计和凹凸性的点云数据集构建方法及装置 Active CN114492619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210077736.3A CN114492619B (zh) 2022-01-22 2022-01-22 一种基于统计和凹凸性的点云数据集构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210077736.3A CN114492619B (zh) 2022-01-22 2022-01-22 一种基于统计和凹凸性的点云数据集构建方法及装置

Publications (2)

Publication Number Publication Date
CN114492619A true CN114492619A (zh) 2022-05-13
CN114492619B CN114492619B (zh) 2023-08-01

Family

ID=81473012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210077736.3A Active CN114492619B (zh) 2022-01-22 2022-01-22 一种基于统计和凹凸性的点云数据集构建方法及装置

Country Status (1)

Country Link
CN (1) CN114492619B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100272A (zh) * 2022-06-17 2022-09-23 浙江大学 面向深度学习分割网络的预制构件点云数据集制作方法
CN116520289A (zh) * 2023-07-04 2023-08-01 东莞市新通电子设备有限公司 五金件加工过程智能控制方法及相关装置
CN117808703A (zh) * 2024-02-29 2024-04-02 南京航空航天大学 一种多尺度大型部件装配间隙点云滤波方法
CN117874900A (zh) * 2024-03-12 2024-04-12 中钜(陕西)工程咨询管理有限公司 一种基于bim技术的房屋建筑工程监理方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150003723A1 (en) * 2013-06-27 2015-01-01 Chevron U.S.A. Inc. System and method of detecting objects in scene point cloud
CN107369161A (zh) * 2017-07-19 2017-11-21 无锡信捷电气股份有限公司 一种基于改进欧式聚类的散乱工件点云分割方法
US20190000564A1 (en) * 2015-12-30 2019-01-03 The Johns Hopkins University System and method for medical imaging
CN109166145A (zh) * 2018-08-10 2019-01-08 中国农业大学 一种基于聚类分割的果树叶片生长参数提取方法及系统
CN109257604A (zh) * 2018-11-20 2019-01-22 山东大学 一种基于tmc3点云编码器的颜色属性编码方法
CN110036392A (zh) * 2017-01-04 2019-07-19 高通股份有限公司 用于基于多行程数据来绘图的系统和方法
CN110110802A (zh) * 2019-05-14 2019-08-09 南京林业大学 基于高阶条件随机场的机载激光点云分类方法
CN110276266A (zh) * 2019-05-28 2019-09-24 暗物智能科技(广州)有限公司 一种基于旋转的点云数据的处理方法、装置及终端设备
CN111158015A (zh) * 2019-12-31 2020-05-15 飞燕航空遥感技术有限公司 机载激光雷达点云数据误分地面点的检测方法和系统
CN111275052A (zh) * 2020-01-13 2020-06-12 南京林业大学 基于多层次聚合特征提取与融合的点云分类方法
WO2020258314A1 (zh) * 2019-06-28 2020-12-30 西门子(中国)有限公司 点云模型的切割方法、装置和系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150003723A1 (en) * 2013-06-27 2015-01-01 Chevron U.S.A. Inc. System and method of detecting objects in scene point cloud
US20190000564A1 (en) * 2015-12-30 2019-01-03 The Johns Hopkins University System and method for medical imaging
CN110036392A (zh) * 2017-01-04 2019-07-19 高通股份有限公司 用于基于多行程数据来绘图的系统和方法
CN107369161A (zh) * 2017-07-19 2017-11-21 无锡信捷电气股份有限公司 一种基于改进欧式聚类的散乱工件点云分割方法
CN109166145A (zh) * 2018-08-10 2019-01-08 中国农业大学 一种基于聚类分割的果树叶片生长参数提取方法及系统
CN109257604A (zh) * 2018-11-20 2019-01-22 山东大学 一种基于tmc3点云编码器的颜色属性编码方法
CN110110802A (zh) * 2019-05-14 2019-08-09 南京林业大学 基于高阶条件随机场的机载激光点云分类方法
CN110276266A (zh) * 2019-05-28 2019-09-24 暗物智能科技(广州)有限公司 一种基于旋转的点云数据的处理方法、装置及终端设备
WO2020258314A1 (zh) * 2019-06-28 2020-12-30 西门子(中国)有限公司 点云模型的切割方法、装置和系统
CN111158015A (zh) * 2019-12-31 2020-05-15 飞燕航空遥感技术有限公司 机载激光雷达点云数据误分地面点的检测方法和系统
CN111275052A (zh) * 2020-01-13 2020-06-12 南京林业大学 基于多层次聚合特征提取与融合的点云分类方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
C. M. MATEO 等: "Visual perception for the 3D recognition of geometric pieces in robotic manipulation", 《INT J ADV MANUF TECHNOL 》, pages 1999 - 2013 *
SI YANG 等: "An Efficient Processing Approach for Colored Point Cloud-Based High-Throughput Seedling Phenotyping", 《REMOTE SENSING》, pages 1 - 21 *
宋成航 等: "利用特征点采样一致性改进ICP算法点云配准方法", 《北京测绘》, vol. 35, no. 3, pages 317 - 322 *
王茹 等: "基于聚类平面特征的三维点云数据精简算法", 《计算机工程》, vol. 37, no. 10, pages 249 - 254 *
马大贺: "基于RGBD摄像头的物体中异形凹陷三维图像重建技术的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 138 - 976 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100272A (zh) * 2022-06-17 2022-09-23 浙江大学 面向深度学习分割网络的预制构件点云数据集制作方法
CN115100272B (zh) * 2022-06-17 2023-09-22 浙江大学 面向深度学习分割网络的预制构件点云数据集制作方法
CN116520289A (zh) * 2023-07-04 2023-08-01 东莞市新通电子设备有限公司 五金件加工过程智能控制方法及相关装置
CN116520289B (zh) * 2023-07-04 2023-09-01 东莞市新通电子设备有限公司 五金件加工过程智能控制方法及相关装置
CN117808703A (zh) * 2024-02-29 2024-04-02 南京航空航天大学 一种多尺度大型部件装配间隙点云滤波方法
CN117808703B (zh) * 2024-02-29 2024-05-10 南京航空航天大学 一种多尺度大型部件装配间隙点云滤波方法
CN117874900A (zh) * 2024-03-12 2024-04-12 中钜(陕西)工程咨询管理有限公司 一种基于bim技术的房屋建筑工程监理方法
CN117874900B (zh) * 2024-03-12 2024-05-24 中钜(陕西)工程咨询管理有限公司 一种基于bim技术的房屋建筑工程监理方法

Also Published As

Publication number Publication date
CN114492619B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN108648233B (zh) 一种基于深度学习的目标识别与抓取定位方法
CN109522908B (zh) 基于区域标签融合的图像显著性检测方法
CN114492619B (zh) 一种基于统计和凹凸性的点云数据集构建方法及装置
CN111709420B (zh) 文本检测方法、电子设备及计算机可读介质
Deng et al. Color image segmentation
CN110334762B (zh) 一种基于四叉树结合orb和sift的特征匹配方法
WO2023083059A1 (zh) 一种路面缺陷检测方法、装置、电子设备和可读存储介质
CN107833213B (zh) 一种基于伪真值自适应法的弱监督物体检测方法
CN108537239B (zh) 一种图像显著性目标检测的方法
CN109325484B (zh) 基于背景先验显著性的花卉图像分类方法
CN109086777B (zh) 一种基于全局像素特征的显著图精细化方法
CN111652892A (zh) 一种基于深度学习的遥感影像建筑物矢量提取及优化方法
Zhang et al. Road recognition from remote sensing imagery using incremental learning
CN110188763B (zh) 一种基于改进图模型的图像显著性检测方法
CN109034065B (zh) 一种基于点云的室内场景物体提取方法
CN106780639B (zh) 基于显著性特征稀疏嵌入和极限学习机的哈希编码方法
CN111783722B (zh) 一种激光点云的车道线提取方法和电子设备
CN115170805A (zh) 一种结合超像素和多尺度分层特征识别的图像分割方法
CN112541491A (zh) 基于图像字符区域感知的端到端文本检测及识别方法
CN115797813B (zh) 基于航拍图像的水环境污染检测方法
Yong et al. GrabCut image segmentation algorithm based on structure tensor
CN111695373A (zh) 斑马线的定位方法、系统、介质及设备
CN115471682A (zh) 一种基于SIFT融合ResNet50的图像匹配方法
CN116721121A (zh) 一种植物表型彩色图像特征提取方法
CN111709317A (zh) 一种基于显著性模型下多尺度特征的行人重识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant