CN111860359B - 一种基于改进随机森林算法的点云分类方法 - Google Patents

一种基于改进随机森林算法的点云分类方法 Download PDF

Info

Publication number
CN111860359B
CN111860359B CN202010719284.5A CN202010719284A CN111860359B CN 111860359 B CN111860359 B CN 111860359B CN 202010719284 A CN202010719284 A CN 202010719284A CN 111860359 B CN111860359 B CN 111860359B
Authority
CN
China
Prior art keywords
point cloud
random forest
point
distance
decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010719284.5A
Other languages
English (en)
Other versions
CN111860359A (zh
Inventor
孙铁波
王卫兵
李萌
刘春月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Food and Pharmaceutical Science College
Original Assignee
Jiangsu Food and Pharmaceutical Science College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Food and Pharmaceutical Science College filed Critical Jiangsu Food and Pharmaceutical Science College
Priority to CN202010719284.5A priority Critical patent/CN111860359B/zh
Publication of CN111860359A publication Critical patent/CN111860359A/zh
Application granted granted Critical
Publication of CN111860359B publication Critical patent/CN111860359B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及3D成像技术领域,公开了一种基于改进随机森林算法的点云分类方法,S1:点云特征计算,包括高程相关特征、拟合平面相关特征、协方差矩阵特征值相关特征、光谱相关特征以及其余点特征;S2:进行多尺度特征构建;S3:对决策树进行聚类精简操作,选择类簇中评价精度高的若干决策树重新构建随机森林;S4:引入决策树评价精度权重,得到决策树评价精度矩阵与权重矩阵W;S5:根据权重矩阵W进行加权投票,最终得到点云分类结果。与现有技术相比,本发明对传统的随机森林算法进行改进,决策树聚类精简后加权投票,点云分类精度及分类效率得到了较大提高。

Description

一种基于改进随机森林算法的点云分类方法
技术领域
本发明涉及3D成像技术领域,具体涉及一种基于改进随机森林算法的点云分类方法。
背景技术
近年来,随着遥感领域软硬件技术的发展,遥感数据获取的技术成本迅速降低,遥感数据也得到了更为广泛的应用。遥感数据在传统的DEM、DOM、DLG制作基础上又增加了快拼影像图、三维数据建模、林业资源调查等应用,而快速、精确的获取目标区域三维点云是实现遥感数据进一步应用的基础。在现阶段,三维点云数据的获取主要采用以下两种方法:一是使用激光雷达扫描获取;二是通过摄影测量的方式由密集匹配算法来获取。点云数据有两种基本特征:一是点云数据包含有空间三维坐标信息,不同采集方式获取的点云有些还包含回波信息、光谱信息等。二是点云数据虽然数据量大,但是互相无关联,是无序数据。对点云数据进行精细划分是进一步对点云数据进行处理的基础,目前实现点云自动分类的方法主要有以下两种:
(1)基于无监督的方法。目前针对三维点云数据特点通过提取点云数据各种特征构建三维点之间联系的无监督分类方法有很多。Gerke(2014)等提取了点云数据的影像上线段长度、归一化高程、法向量Z分量及颜色和纹理等特征结合图割算法,将LiDAR点云划分为地面、建筑物、低矮植被和树木4类。田青华(2017)等对欧式聚类算法进行了改进,实现了搜索半径的自适应,同时基于距离约束解决了点云子集的边缘点识别问题,从而实现了点云分割。Zhang(2016)等首先对三维点云数据进行翻转,然后模拟布料与反转后点云之间的关系从而实现地面点与地物点之间的分割。无监督下的点云分类算法大都针对特定类别点云数据,应用场景单一,可移植性差。
(2)基于有监督的方法。传统无监督的点云分类方式通过设置判定规则来确定点所属类别,有监督的分类方式则通过提取分类特征后训练分类器来实现点的类别判定。Zhang(2013)等人使用支持向量机对LiDAR数据进行分类。而Niemeyer(2012)等人则采用一种基于条件随机场(Conditional random field,CRF)的上下文分类方法实现LiDAR点云分类。Xu(2014)等提取了点、平面和均值漂移三类特征对分类器进行训练,同时系统比较了Adaboost、随机森林、ANN MLP(Artificial Neural Networks Multiple LayerPerceptrons)、支持向量机(SupportVector Machine,SVM)和Rule-based等多种分类器的分类效果。Guan(2013)等采用光谱特征、几何特征和回波强度特征训练随机森林分类器将LiDAR点云划分为建筑物、树木、地面点等几类。上述基于机器学习的有监督点云分类方法使用提取到的全部点云特征进行分类划分,在分类过程中未能全面分析点云特征与分类精度之间的关系,且由于特征维度高易造成算法分类效率低。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供一种基于改进随机森林算法的点云分类方法,通过决策树之间的编辑距离并进行聚类实现了对随机森林中冗余决策树的剔除,在随机森林投票阶段引入决策树评价精度权重,根据投票权值进行投票分类,使得点云分类精度及分类效率得到了较大提高。
技术方案:本发明提供了一种基于改进随机森林算法的点云分类方法,包括如下步骤:
S1:点云特征计算,所述点云特征包括高程相关特征、拟合平面相关特征、协方差矩阵特征值相关特征、光谱相关特征以及其余点特征;
S2:多尺度特征构建,针对步骤S1中的点云特征,按照点云的不同领域范围确定点云不同尺度构建参数,进行多尺度特征构建;
S3:冗余决策树剔除,所述S1中计算出来的点云特征作为决策树的分裂节点,以传统方式构建随机森林,通过树编辑距离算法计算决策树之间的相似度,并按相似度进行聚类,对评价精度由高到低排序,选取评价精度排在前面的若干决策树重新构建随机森林;
S4:引入评价精度权重,在S3中的重新构建的随机森林的投票阶段引入决策树评价精度权重,得到决策树评价精度矩阵,采用加权投票法作为最终的分类依据,将决策树的评价精度转化为随机森林算法的投票权值,最终得到权重矩阵W;
S5:根据权重矩阵W进行加权投票,最终得到点云分类结果。
进一步地,所述S3中聚类过程如下:
1.1)将传统方式随机森林算法的决策树作为待选数据集,随机抽取Q个决策树作为初始聚类中心;
1.2)采用最大最小距离方法确定Q个聚类中心;
1.3)遍历所有的决策树,计算其与Q个聚类中心的编辑距离,按照最近距离原则将决策树聚类为Q个簇;
1.4)重复步骤1.2)-1.3),直到所有决策树完成聚类停止;
1.5)在得到的Q个决策树类簇中对评价精度进行排序,选取评价精度排在前面的若干决策树重新构建随机森林。
进一步地,所述最大最小距离方法确定Q个聚类中心,具体为:
2.1)随机选取一个数据作为第一个聚类中心z1
2.2)计算其余数据到z1距离,距离最大的为第二个聚类中心z2
2.3)计算其余数据与现有聚类中心距离,取距离最小值集合中的最大值作为新的聚类中心;
2.4)重复以上过程直到确定Q个聚类中心。
进一步地,所述S4中决策树评价精度矩阵ACC为:
Figure BDA0002599374100000031
其中,accij表示第j棵决策树对第i种点云的分类精度,其中,j=1,2,…J,J为聚类精简后的决策树数量;i=1,2,…,I,I为评价精度等级,通过计算验证集在聚类精简后的随机森林中每棵决策树对应的每一类点云分类的准确率获得。
进一步地,所述权重矩阵为:
Figure BDA0002599374100000032
其中,wqp表示第j棵决策树对应于第i种点云的投票权重,wij=accij
进一步地,所述多尺度构建为:首先利用八叉树组织点云并求出点云的平均点距dm,然后以此为基础确定点云邻域尺度;尺度层级Li表示为:Li=sidm,其中,s为尺度放大因子,i为层级。
进一步地,所述高程相关特征包括点云的平均高程、点云的高程方差、点云的高程差。
进一步地,,所述点云拟合平面相关特征有如下几种:
(1)平面粗糙度N:其值为所取当前点与拟合平面间的距离;
(2)平面极差Sr:其值为当前邻域范围内全部点到拟合平面距离中的最大值;
(3)平面标准差SSTD:其值为当前邻域范围内全部点到拟合平面距离的标准差;
(4)平面斜率Sn:平面斜率为拟合平面的法向量与竖直方向的夹角。
进一步地,所述光谱特征的选取主要包含RGB特征、可见光波段差异植被指数、归一化绿蓝差异指数以及绿信比Gr
进一步地,所述协方差矩阵特征值相关特征,点云数据的协方差矩阵是3×3阶的对称矩阵,求解协方差矩阵可得到三个特征值,记为λ1,λ2和λ3,根据特征值大小关系有如下三种情况:
(1)如果λ1≈λ2≈λ3,则当前点集具有发散特征,通常植被或灌丛有此特性;
(2)如果λ1≥λ2≈λ3,则当前点集具有线状特性,通常树木枝干,建筑边缘具有此种特性;
(3)如果λ1≈λ2≥λ3,则当前点集为面状特性,通常地面及建筑立面等表现出此种特性。
在此基础上,为了使上述特征容易量化,引入曲率λc、λs、λl、λp四个指标,曲率λc的表达式为:
Figure BDA0002599374100000041
分割段的发散指数λs,线性指数λl和面性指数λp的表达式如下:
Figure BDA0002599374100000042
Figure BDA0002599374100000043
Figure BDA0002599374100000044
有益效果:
1、本发明对随机森林算法进行优化改进,通过计算决策树之间的编辑距离并进行聚类实现了对随机森林中冗余决策树的剔除,使得随机森林算法的决策效率更高。
2、本发明在随机森林投票阶段引入决策树评价精度权重,采用了加权投票法作为最终的分类依据,具体为将决策树的评价精度转化为算法的投票权值,根据投票权值进行投票分类,与传统的随机森林平均投票法相比本发明的加权投票法能够使得随机森林算法的决策精度更高。
附图说明
图1为本发明改进随机森林算法的点云分类流程图;
图2为本发明决策树结构图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明公开的点云分类方法包括如下步骤:
步骤一:点云特征计算。
1.1高程相关特征:
高程是三维点云分类中较为常用的一类特征,可以有效区分三维点云数据中的地面点与非地面点,但由于采集区域地面起伏不同等原因,高程值并不能直接作为特征应用于点云分类。本发明使用三个与高程相关的特征,分别为点云的平均高程、点云的高程方差、点云的高程差。
(1)平均高程Hav。平均高程定义为当前点及其邻域范围全部点绝对高程的平均值,公式如下:
Figure BDA0002599374100000051
其中n为所取邻域范围点的总数,Hk为所取邻域范围每个点的高程值。
(2)高程方差Hv。高程方差定义为所取邻域内所有点高程的方差,公式如下:
Figure BDA0002599374100000052
其中n为所取邻域范围点的总数,Hk为所取邻域范围每个点的高程值,Hav为平均高程。
(3)高程差Hdiff。高程差定义为所取邻域中高程最大点和最小点高程之间的差值,公式如下:
Hdiff=Hh-Hl
其中Hh为所取邻域范围全部点高程的最大值,Hl为所取邻域范围全部点高程的最小值。
1.2拟合平面相关特征:
拟合平面相关特征主要是描述点与拟合平面(将当前点与所取邻域点以最小二乘方式拟合所得平面)之间的关系,本发明选用的点云拟合平面相关特征有如下几种:
(1)平面粗糙度(N)。其值为所取当前点与拟合平面间的距离;
(2)平面极差(Sr)。其值为当前邻域范围内全部点到拟合平面距离中的最大值;
(3)平面标准差(SSTD)。其值为当前邻域范围内全部点到拟合平面距离的标准差;
(4)平面斜率(Sn)。平面斜率为拟合平面的法向量与竖直方向的夹角。
1.3协方差矩阵特征值相关特征:
点云数据的协方差矩阵是3×3阶的对称矩阵。求解协方差矩阵可得到三个特征值,记为λ1,λ2和λ3,根据特征值大小关系有如下三种情况:
(1)如果λ1≈λ2≈λ3,则当前点集具有发散特征,通常植被或灌丛有此特性;
(2)如果λ1≥λ2≈λ3,则当前点集具有线状特性,通常树木枝干,建筑边缘具有此种特性;
(3)如果λ1≈λ2≥λ3,则当前点集为面状特性,通常地面及建筑立面等表现出此种特性。
在此基础上,为了使上述特征容易量化,引入曲率λc、λs、λl、λp等四个指标,曲率λc的表达式为:
Figure BDA0002599374100000061
分割段的发散指数λs,线性指数λl和面性指数λp的表达式如下:
Figure BDA0002599374100000062
Figure BDA0002599374100000063
Figure BDA0002599374100000064
1.4光谱相关特征
光谱特征的选取主要包含RGB特征、可见光波段差异植被指数(Disible-BandDifference Vegetation Index,VDVI)、归一化绿蓝差异指数(Normalized Green-BlueDifference Index,NGBDI)以及绿信比Gr
(1)RGB特征由可见光红光R、绿光G、蓝光B三个通道的DN值构成,可在含有RGB信息的点云数据中直接获取;
(2)植被指数VDVI和NGBDI能够很好的对植被点云进行划分,具体公式为:
Figure BDA0002599374100000065
Figure BDA0002599374100000066
(3)绿信比Gr则通过计算G通道DN值与RGB三通道总DN值得比值来区分植被,具体公式为:
Figure BDA0002599374100000067
1.5其余点特征
(1)点密度n是指该点邻域内所有点的个数;
(2)法向量nx,ny和nz。定义为对当前点邻域范围内点进行最小二乘拟合所得平面的法向量三个分量。
1.6多尺度特征构建
不同的点云数据自身密度不同,所以在点云分类中对于点云统计类特征计算的邻域选择不能只是简单的按照同一种尺度,本文按照点云的不同点距来确定点云邻域选取的适当尺度。
首先利用八叉树组织点云并求出点云的平均点距dm,然后以此为基础确定点云邻域尺度。Li表示尺度层级,尺度计算公式如下:
Li=sidm
其中,s为尺度放大因子,i为层级,确定最小尺度层级L1之后,即可利用放大因子s得到其他层级。
比如,所提取最大尺度层级为3,放大因子s=2,则:
Figure BDA0002599374100000071
具体邻域的划分方法为以当前点为球心,当前尺度为半径画球,球体内点集即为当前邻域点集。
步骤二、基于改进随机森林的点云分类算法
2.1决策树相似度
步骤一计算出来的点云特征即为决策树的分裂节点,在此基础上构建传统随机森林算法决策树。从随机森林算法自身的构造过程可以看出,其评价精度的优劣受两种条件制约:第一个是每棵决策树的自身分类性能,单棵决策树的分类精度越高组成的子森林分类性能就越好。如果存在很多自身分类性能低的决策树那么组成的随机森林分类器分类性能就会受到很大影响。第二个是决策树之间的相关性,组成子森林的决策树之间的相关性越低,则子森林的分类决策性能就越好。相关性高的决策树决策结果相似性高,如果同时决策树的精度低那么组成的子森林分类效果就差。
由随机森林性质可知其决策树为二叉树结构,二叉树结构相似性采用树编辑距离算法(Zhang&Shasha算法)计算,算法通过计算一棵树转换到另一棵树的步骤(编辑距离)来衡量两棵树之间的相似度。
定义对树的操作方式有三种:删除、插入和修改。设T1,T2两棵有序决策树,其中T2为目标树。定义一个特殊标签∧,∧→a表示增加节点a,b→∧代表删除节点b。S表示一个操作序列,记为s1,…,sk。定义一个代价函数γ,表示a→b的节点转换编辑操作,其返回值为一个非负实数γ(a→b),对于不同树之间的节点操作来说代价函数的返回值不同,即可以通过节点权重的不同得到不同的权值。将γ拓展到序列S中,可得:
Figure BDA0002599374100000081
两棵树T1到T2之间的编辑距离可表示为:
δ(T1,T2)=min{γ(S)|S是将T1转换为T2的编辑操作序列}
如图2所示,T[i]表示在T树中从左开始的第i个节点,l(i)表示根节点为T[i]的子树中左侧第一个节点。T[i]的子节点集合d(i)表示为d(i)={l(i),l(i1),…,l(in)},将T[i]的父节点记为a(i)。如图2中虚线内节点所示,t(i)表示由T[i]和他的子节点d(i)组成的子树,子树中的父子关系小于等于一层。如图2中实线内节点所示,T[i'…i]表示树T中从i'到i的全部有序子森林,子森林中的父子关系大于等于二层。
用forestdist(T1[l(i)...i1],T2[l(j)...j1])表示两个森林之间的距离,treedist(i1,j1)表示两棵树之间的距离,计算treedist(i,j)的公式如下:
(1)如果l(i)=l(i1)且l(j)=l(j1)
forestdist(T1[l(i)...i1],T2[l(j)...j1])=min{
forestdist(T1[l(i)...i1-1],T2[l(j)...j1])+γ(T1[i1]→Λ),
forestdist(T1[l(i)...i1],T2[l(j)...j1-1])+γ(Λ→T2[j1]),
forestdist(T1[l(i)...i1-1],T2[l(j)...j1-1])+γ(T1[i1]→T2[j1])}
(2)如果l(i)!=l(i1)或者l(j)!=l(j1)
forestdist(T1[l(i)...i1],T2[l(j)...j1])=min{
forestdist(T1[l(i)...i1-1],T2[l(j)...j1])+γ(T1[i1]→Λ),
forestdist(T1[l(i)...i1],T2[l(j)...j1-1])+γ(Λ→T2[j1]),
forestdist(T1[l(i)...i1-1],T2[l(j)...j1-1])+treedist(i1,j1)}
可以定义一个临时数组来存储森林的距离,一旦全部treedist被计算完就释放,同时定义一个永久数组将treedist数据存储在内,通过迭代计算最终得到treedist(i,j)。
在求解出树结构的关键节点之间的编辑距离后,通过迭代运算至根节点就可以最终计算出两棵决策树之间的编辑距离,以此为基础即可实现决策树的聚类操作。通过计算树编辑距离的精简聚类过程如下:
(1)将未优化算法生成的决策树作为待选数据集,随机抽取Q个决策树作为初始聚类中心;
(2)采用最大最小距离方法确定Q个聚类中心,具体为:
①随机选取一个数据作为第一个聚类中心z1
②计算其余数据到z1距离,距离最大的为第二个聚类中心z2
③计算其余数据与现有聚类中心距离,取距离最小值集合中的最大值作为新的聚类中心;
④重复以上过程直到确定Q个聚类中心。
(3)遍历所有的决策树,计算其与Q个聚类中心的编辑距离,按照最近距离原则将决策树聚类为Q个簇;
(4)重复步骤(2)-(3),直到所有决策树完成聚类停止;
(5)在得到的Q个决策树类簇中对评价精度进行排序,选取评价精度高的决策树重新构建随机森林。
2.2加权投票
生成决策树后随机森林算法采用的是多数投票法,未考虑决策树的评价精度,忽略了权重对评价精度的影响。为了在随机森林投票阶段引入决策树评价精度权重,本文采用了加权投票法作为最终的分类依据,具体为将决策树的评价精度转化为算法的投票权值。在通过上一节的决策树聚类精简后新的随机森林决策树评价精度矩阵ACC可表示为:
Figure BDA0002599374100000091
其中,accij表示第j棵决策树对第i种点云的分类精度,其中,j=1,2,…J,J为聚类精简后的决策树数量;i=1,2,…,I,I为评价精度等级,通过计算验证集在聚类精简后的随机森林中每棵决策树对应的每一类点云分类的准确率获得。
进一步根据评价精度矩阵,定义权重矩阵W为:
Figure BDA0002599374100000092
其中wqp表示第j棵决策树对应于第i种点云的投票权重,其计算方式为:
wij=accij
改进后的算法流程图如图1所示。
本发明所用测试数据集为罗蒙诺索夫国立大学图形与媒体实验室提供的激光雷达数据,点云数据由无人机搭载激光雷达获取,采集区主要包含树木,低矮植被,建筑和汽车。雷达点云密度为6points/m2,共1002668个点,点云包含x,y,z坐标信息。采用MATLABR2017a软件编写随机森林分类程序,操作系统为64位Windows10,CPU为Inteli9900k,内存64G。提取数据集中10%的地面点、树木点、低矮植被点、建筑点、汽车点作为训练样本。
本次实验基于验证数据建立了混淆矩阵评价本发明的点云分类精度,同时为验证本发明算法的有效性,分别与传统随机森林(RF)算法、马尔科夫随机场(MRF)算法、支持向量机(SVM)算法分类结果做对比,整体来看本发明在地面点、低矮植被点及汽车点分类效果优于其他算法,但从总体上看,所有算法对于建筑点、汽车点、低矮植被点分类精度都较低。本发明分类总体精度为94.15%,传统RF算法为92.89%,MRF算法为90.77%,SVM算法为90.98%。
上述实施方式只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种基于改进随机森林算法的点云分类方法,其特征在于,包括如下步骤:
S1:点云特征计算,所述点云特征包括高程相关特征、拟合平面相关特征、协方差矩阵特征值相关特征、光谱相关特征以及其余点特征;
S2:多尺度特征构建,针对步骤S1中的点云特征,按照点云的不同领域范围确定点云不同尺度构建参数,进行多尺度特征构建;
S3:冗余决策树剔除,所述S1中计算出来的点云特征作为决策树的分裂节点,构建随机森林,通过树编辑距离算法计算决策树之间的相似度,并按相似度进行聚类,对评价精度由高到低排序,选取评价精度排在前面的若干决策树重新构建随机森林;两棵树T1到T2之间的编辑距离可表示为:
δ(T1,T2)=min{γ(S)|S是将T1转换为T2的编辑操作序列}
Figure FDF0000013125290000011
用forestdist(T1[l(i)...i1],T2[l(j)...j1])表示两个森林之间的距离,treedist(i1,j1)表示两棵树之间的距离,计算treedist(i,j)的公式如下:
(1)如果l(i)=l(i1)且l(j)=l(j1)
forestdist(T1[l(i)...i1],T2[l(j)...j1])=min{
forestdist(T1[l(i)...i1-1],T2[l(j)...j1])+γ(T1[i1]→Λ),
forestdist(T1[l(i)...i1],T2[l(j)...j1-1])+γ(Λ→T2[j1]),
forestdist(T1[l(i)...i1-1],T2[l(j)...j1-1])+γ(T1[i1]→T2[j1])}
(2)如果l(i)!=l(i1)或者l(j)!=l(j1)
forestdist(T1[l(i)...i1],T2[l(j)...j1])=min{
forestdist(T1[l(i)...i1-1],T2[l(j)...j1])+γ(T1[i1]→Λ),
forestdist(T1[l(i)...i1],T2[l(j)...j1-1])+γ(Λ→T2[j1]),
forestdist(T1[l(i)...i1-1],T2[l(j)...j1-1])+treedist(i1,j1)}
其中,T1,T2为两棵有序决策树,其中T2为目标树,S表示一个操作序列,记为s1,…,sk;特殊标签∧,∧→a表示增加节点a,b→^代表删除节点b,γ为代价函数,表示a→b的节点转换编辑操作,其返回值为一个非负实数γ(a→b);T[i]表示在T树中从左开始的第i个节点,l(i)表示根节点为T[i]的子树中左侧第一个节点,T[i]的子节点集合d(i)表示为d(i)={l(i),l(i1),…,l(in)},将T[i]的父节点记为a(i),t(i)表示由T[i]和他的子节点d(i)组成的子树,子树中的父子关系小于等于一层;T[i'…i]表示树T中从i'到i的全部有序子森林,子森林中的父子关系大于等于二层;定义一个临时数组来存储森林的距离,一旦全部treedist被计算完就释放,同时定义一个永久数组将treedist数据存储在内,通过迭代计算最终得到treedist(i,j);
所述聚类过程如下:
1.1)将随机森林算法的决策树作为待选数据集,随机抽取Q个决策树作为初始聚类中心;
1.2)采用最大最小距离方法确定Q个聚类中心;
1.3)遍历所有的决策树,计算其与Q个聚类中心的编辑距离,按照最近距离原则将决策树聚类为Q个簇;
1.4)重复步骤1.2)-1.3),直到所有决策树完成聚类停止;
1.5)在得到的Q个决策树类簇中对评价精度进行排序,选取评价精度排在前面的若干决策树重新构建随机森林;
S4:引入评价精度权重,在S3中的重新构建的随机森林的投票阶段引入决策树评价精度权重,得到决策树评价精度矩阵,采用加权投票法作为最终的分类依据,将决策树的评价精度转化为随机森林算法的投票权值,最终得到权重矩阵W;
S5:根据权重矩阵W进行加权投票,最终得到点云分类结果。
2.根据权利要求1所述的种基于改进随机森林算法的点云分类方法,其特征在于,所述最大最小距离方法确定Q个聚类中心,具体为:
2.1)随机选取一个数据作为第一个聚类中心z1
2.2)计算其余数据到z1距离,距离最大的为第二个聚类中心z2
2.3)计算其余数据与现有聚类中心距离,取距离最小值集合中的最大值作为新的聚类中心;
2.4)重复以上过程直到确定Q个聚类中心。
3.根据权利要求1所述的种基于改进随机森林算法的点云分类方法,其特征在于,所述S4中决策树评价精度矩阵ACC为:
Figure FDF0000013125290000031
其中,accij表示第j棵决策树对第i种点云的分类精度,其中,j=1,2,…J,J为聚类精简后的决策树数量;i=1,2,…,I,I为评价精度等级,通过计算验证集在聚类精简后的随机森林中每棵决策树对应的每一类点云分类的准确率获得。
4.根据权利要求3所述的种基于改进随机森林算法的点云分类方法,其特征在于,所述权重矩阵为:
Figure FDF0000013125290000032
其中,wqp表示第j棵决策树对应于第i种点云的投票权重,wij=accij
5.根据权利要求1所述的种基于改进随机森林算法的点云分类方法,其特征在于,所述多尺度构建为:首先利用八叉树组织点云并求出点云的平均点距dm,然后以此为基础确定点云邻域尺度;尺度层级Li表示为:Li=sidm,其中,s为尺度放大因子,i为层级。
6.根据权利要求1所述的种基于改进随机森林算法的点云分类方法,其特征在于,所述高程相关特征包括点云的平均高程、点云的高程方差、点云的高程差。
7.根据权利要求1所述的种基于改进随机森林算法的点云分类方法,其特征在于,所述点云拟合平面相关特征有如下几种:
(1)平面粗糙度N:其值为所取当前点与拟合平面间的距离;
(2)平面极差Sr:其值为当前邻域范围内全部点到拟合平面距离中的最大值;
(3)平面标准差SSTD:其值为当前邻域范围内全部点到拟合平面距离的标准差;
(4)平面斜率Sn:平面斜率为拟合平面的法向量与竖直方向的夹角。
8.根据权利要求1所述的种基于改进随机森林算法的点云分类方法,其特征在于,所述光谱特征的选取主要包含RGB特征、可见光波段差异植被指数、归一化绿蓝差异指数以及绿信比Gr
9.根据权利要求1所述的种基于改进随机森林算法的点云分类方法,其特征在于,所述协方差矩阵特征值相关特征,点云数据的协方差矩阵是3×3阶的对称矩阵,求解协方差矩阵可得到三个特征值,记为λ1,λ2和λ3,根据特征值大小关系有如下三种情况:
(1)如果λ1≈λ2≈λ3,则当前点集具有发散特征,通常植被或灌丛有此特性;
(2)如果λ1≥λ2≈λ3,则当前点集具有线状特性,通常树木枝干,建筑边缘具有此种特性;
(3)如果λ1≈λ2≥λ3,则当前点集为面状特性,通常地面及建筑立面等表现出此种特性;
在此基础上,为了使上述特征容易量化,引入曲率λc、λs、λl、λp四个指标,曲率λc的表达式为:
Figure FDF0000013125290000041
分割段的发散指数λs,线性指数λl和面性指数λp的表达式如下:
Figure FDF0000013125290000042
Figure FDF0000013125290000043
Figure FDF0000013125290000044
CN202010719284.5A 2020-07-23 2020-07-23 一种基于改进随机森林算法的点云分类方法 Active CN111860359B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010719284.5A CN111860359B (zh) 2020-07-23 2020-07-23 一种基于改进随机森林算法的点云分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010719284.5A CN111860359B (zh) 2020-07-23 2020-07-23 一种基于改进随机森林算法的点云分类方法

Publications (2)

Publication Number Publication Date
CN111860359A CN111860359A (zh) 2020-10-30
CN111860359B true CN111860359B (zh) 2021-08-17

Family

ID=72949864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010719284.5A Active CN111860359B (zh) 2020-07-23 2020-07-23 一种基于改进随机森林算法的点云分类方法

Country Status (1)

Country Link
CN (1) CN111860359B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112560947A (zh) * 2020-12-14 2021-03-26 国网青海省电力公司 基于能源供需结构分析的聚类方法及装置
CN113033599B (zh) * 2021-02-01 2024-03-15 陈建华 基于空间随机森林算法的露头地质体岩层分层方法
CN116910668B (zh) * 2023-09-11 2024-04-02 国网浙江省电力有限公司余姚市供电公司 一种避雷器故障预警方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484571A (zh) * 2014-12-22 2015-04-01 深圳先进技术研究院 一种基于边缘距离排序的集成学习机修剪方法及系统
CN104537353A (zh) * 2015-01-07 2015-04-22 深圳市唯特视科技有限公司 基于三维点云的三维人脸年龄分类装置及方法
CN107292335A (zh) * 2017-06-06 2017-10-24 云南电网有限责任公司信息中心 一种基于随机森林模型的输电线路点云数据自动分类方法
CN110009054A (zh) * 2019-04-12 2019-07-12 南京大学 一种利用几何与强度特征的分层次机载LiDAR点云分类方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8015125B2 (en) * 2006-08-31 2011-09-06 Drexel University Multi-scale segmentation and partial matching 3D models
CN102096944A (zh) * 2010-11-25 2011-06-15 中国水电顾问集团西北勘测设计研究院 地质体结构面三维激光扫描点云识别方法
CN102629367B (zh) * 2012-01-17 2014-11-26 安徽建筑工业学院 基于KDTree的点云数据双边滤波去噪的方法
CN103093466B (zh) * 2013-01-21 2016-05-25 武汉大学 基于LiDAR点云和影像的建筑物三维变化检测方法
CN104091321B (zh) * 2014-04-14 2016-10-19 北京师范大学 适用于地面激光雷达点云分类的多层次点集特征的提取方法
CN104143210B (zh) * 2014-07-31 2017-04-12 哈尔滨工程大学 一种多尺度法向特征点云配准方法
CN104656098B (zh) * 2015-02-03 2018-04-13 南京林业大学 一种遥感森林生物量反演的方法
CN106022381B (zh) * 2016-05-25 2020-05-22 厦门大学 基于车载激光扫描点云的路灯杆自动提取方法
CN108363983B (zh) * 2018-03-06 2021-05-18 河南理工大学 一种基于无人机影像与重建点云的城市植被分类方法
CN109509517A (zh) * 2018-10-16 2019-03-22 华东理工大学 一种医学检验检查指标自动修正的方法
US10388272B1 (en) * 2018-12-04 2019-08-20 Sorenson Ip Holdings, Llc Training speech recognition systems using word sequences
CN110210500A (zh) * 2019-06-06 2019-09-06 上海黑塞智能科技有限公司 一种基于多尺度局部特征嵌入的点云分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484571A (zh) * 2014-12-22 2015-04-01 深圳先进技术研究院 一种基于边缘距离排序的集成学习机修剪方法及系统
CN104537353A (zh) * 2015-01-07 2015-04-22 深圳市唯特视科技有限公司 基于三维点云的三维人脸年龄分类装置及方法
CN107292335A (zh) * 2017-06-06 2017-10-24 云南电网有限责任公司信息中心 一种基于随机森林模型的输电线路点云数据自动分类方法
CN110009054A (zh) * 2019-04-12 2019-07-12 南京大学 一种利用几何与强度特征的分层次机载LiDAR点云分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"一种基于聚类约简决策树的改进随机森林算法";王诚等;《南京邮电大学学报( 自然科学版)》;20190630;第39卷(第3期);第91-97页 *

Also Published As

Publication number Publication date
CN111860359A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN111860359B (zh) 一种基于改进随机森林算法的点云分类方法
CN110110802B (zh) 基于高阶条件随机场的机载激光点云分类方法
CN107066559B (zh) 一种基于深度学习的三维模型检索方法
Jimenez et al. Classification of hyperdimensional data based on feature and decision fusion approaches using projection pursuit, majority voting, and neural networks
Zhong Intrinsic shape signatures: A shape descriptor for 3D object recognition
US7995055B1 (en) Classifying objects in a scene
CN110992341A (zh) 一种基于分割的机载LiDAR点云建筑物提取方法
CN108197538A (zh) 一种基于局部特征和深度学习的卡口车辆检索系统及方法
CN105631892B (zh) 一种基于阴影和纹理特征的航空影像建筑物损毁检测方法
CN109446986B (zh) 一种面向树木激光点云的有效特征抽取与树种识别方法
CN107679509A (zh) 一种小环藻识别方法及装置
CN111898688A (zh) 一种基于三维深度学习的机载LiDAR数据树种分类方法
CN107341813A (zh) 基于结构学习和素描特性推理网络的sar图像分割方法
CN110222767A (zh) 基于嵌套神经网络和栅格地图的三维点云分类方法
CN113484875B (zh) 一种基于混合高斯排序的激光雷达点云目标分级识别方法
CN110348478B (zh) 一种基于形状分类与组合的室外点云场景中树木提取方法
CN114386466B (zh) 一种用于脉冲星搜寻中候选体信号挖掘的并行的混合聚类方法
CN116310849A (zh) 基于三维形态特征的树木点云单体化提取方法
CN108647719B (zh) 用于大数据量光谱遥感图像分类的非监督聚类方法
Al-Ghrairi et al. Classification of satellite images based on color features using remote sensing
CN111798526A (zh) 基于聚类空间映射的彩色图像主色快速提取方法及系统
Sun et al. A study on the classification of vegetation point cloud based on random forest in the straw checkerboard barriers area
CN105844299B (zh) 一种基于词袋模型的图像分类方法
CN110097636B (zh) 一种基于可视域分析的选址规划方法
CN116664854A (zh) 目标检测方法、装置、电子设备及机器可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20201030

Assignee: Jiangsu tuhuai Ecological Agriculture Co.,Ltd.

Assignor: JIANGSU FOOD & PHARMACEUTICAL SCIENCE COLLEGE

Contract record no.: X2022980008072

Denomination of invention: A point cloud classification method based on improved random forest algorithm

Granted publication date: 20210817

License type: Common License

Record date: 20220624