发明内容
本发明所要解决的技术问题是针对上述现有技术的不足提供一种面向树木激光点云的有效特征抽取与树种识别方法,本面向树木激光点法云的有效特征抽取与识别方法提出三类有效特征:树木相对聚类特征、点云分布特征和树木表观特征,列举多个特征参数供最优特征抽取,采用SVM分类器在交叉验证中确定最优特征参数组,利用最优特征参数组进行树种分类,达到了较高的树种分类精度,为获得更准确的森林树种分布提供了强有力的工具,减少了野外实体调查的高成本、费时、费力,减少了人工判读带来的误差。
为实现上述技术目的,本发明采取的技术方案为:
一种面向树木激光点云的有效特征抽取与树种识别方法,包括:
步骤1:获取目标树的全覆盖点云数据;
步骤2:对目标树的全覆盖点云数据进行降噪处理以去除异常点;
步骤3:根据降噪后获得的点云数据分别分析目标树的三种类别的树木特征,所述三种类别的树木特征分别为树木相对聚类特征、点云分布特征和树木表观特征,从而获得多个树木相对聚类特征参数、多个点云分布特征参数和多个树木表观特征参数;
步骤4:将所有树木相对聚类特征参数按类别分别进行交叉组合,将得到的所有组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度抽取基于树木相对聚类特征的最优特征参数组;将所有点云分布特征参数进行交叉组合,将得到的所有组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度抽取基于点云分布特征的最优特征参数组;将所有树木表观特征参数进行交叉组合,将得到的组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度抽取基于树木表观特征的最优特征参数组;
步骤5:将基于树木相对聚类特征的最优特征参数组、基于点云分布特征的最优特征参数组以及基于树木表观特征的最优特征参数组进行组合并作为变量输入到SVM分类器中进行树种分类。
作为本发明进一步改进的技术方案,所述的步骤1具体包括:将地面激光雷达放置在距离目标树3米的不同侧面并设置相同的扫描精度,扫描后,将不同角度得到的扫描结果整合到同一坐标系中,继而得到目标树的全覆盖点云数据。
作为本发明进一步改进的技术方案,所述的步骤2具体包括:采用TerraScan软件划分目标树的点云从而滤除点云噪声,去除异常点。
作为本发明进一步改进的技术方案,所述的步骤3中的树木相对聚类特征表示目标树的点云的聚集离散结构,分析目标树的树木相对聚类特征的具体步骤为:
(a)对目标树的点云数据进行计算,实现树冠的提取,将获取到的树冠自顶而下水平分割成10个相同高度的矩形层R
k,k=1,2,…,10;取树高与冠底高度之差作为树冠高度H
Crown,则R
k的高度为H
Crown/10;R
k的长度为
R
k的宽度为
其中3D坐标系下任意点云坐标为
j为目标树中的第j株树,i为第j株树内的第i个点云;
(b)将矩形层R
k分割成m个边长为H
Crown/10的正方形区域的样方,
为R
k内第l个样方中的点云数量,在每个R
k内用特征值V
k描述对应k层点云的聚集离散结构,V
k定义为:
若Vk<1,则Rk的结构特征为分散;若Vk>1,则Rk的结构特征为聚集;若Vk=1,则Rk的结构特征为随机;
(c)通过公式(2)将特征值Vk作0到1之间的归一化处理:
其中min(V)和max(V)分别为目标树的10个矩形层中对应的最小Vk值与最大Vk值;
(d)计算关于距离度量r的函数Pk(r):
其中公式(3)中A
k代表R
k垂直于地面方向上的投影面积,n
k是R
k内的点云个数;公式(4)中
为指标函数,
代表任意两点
和
之间的距离,若
则
取值为1,否则为0;
求取Pk(r)函数的偏差:
其中r的取值为从0.2m至6m区间内间隔为0.2m的30个数值,则单株目标树的每个矩形层包含30个Lk(r)函数值,30个Lk(r)函数值中最大正值表示Rk在刻度r上存在最大程度的分散,30个Lk(r)函数值中最小负值表示Rk在刻度r上存在最大程度的聚集,从30个Lk(r)函数值中计算出最大正值Lmax_k、最小负值Lmin_k、最大正值处对应的距离度量rmax_k以及最小负值处对应的距离度量rmin_k;
(e)所述的树木相对聚类特征参数分为5种类别,分别为:V特征参数、Lmax特征参数、 Lmin特征参数、rmax特征参数以及rmin特征参数,V特征参数包括V1,V2,…,V10;Lmax特征参数包括Lmax_1,Lmax_2,…,Lmax_10;Lmin特征参数包括Lmin_1,Lmin_2,…,Lmin_10;rmax特征参数包括rmax_1,rmax_2,…,rmax_10;rmin特征参数包括rmin_1,rmin_2,…,rmin_10;因此所有类别的树木相对聚类特征参数的个数一共50个。
作为本发明进一步改进的技术方案,所述的步骤3中点云分布特征参数分别为点云高度均值、点云高度标准偏差、点云高度偏移量、点云高度峰值、树高的0%和20%之间的点云数量与整株树点云数量的比率、树高的20%和40%之间的点云数量与整株树点云数量的比率、树高的40%和60%之间的点云数量与整株树点云数量的比率、树高的60%和80%之间的点云数量与整株树点云数量的比率以及树高的80%和100%之间的点云数量与整株树点云数量的比率。
作为本发明进一步改进的技术方案,所述的步骤3中分析目标树的树木表观特征的具体步骤为:
(a1)获取树高H
Tree和树冠高度H
Crown,从扫描点云数据获取冠中最高分支高度H
maxb、冠中最低分支的高度H
minb、冠盖的最长分布L
Crown和与L
Crown垂直的冠盖最长分布
(b1)以树干为中心垂直于地面方向切割树冠,将其平均分成8段,将每个分段内的所有点云投影到各个分段的中心垂直剖面上,将中心垂直剖面划分为g×g的网格;
(c1)分别计算出等效冠直径、树冠高度与树高的比率、等效冠直径与树高的比率、树冠高度和等效冠直径的比率、(树高-H
minb)和(树高-H
maxb)的比率、L
crown和
的比率、树冠椭球模型拟合参量、所有网格内点云的平均高度以及中心垂直剖面内的网格参量并将其作为树木表观特征参数,所述的等效冠直径为具有与冠盖相等面积的等效最小外接圆直径D
EA。
作为本发明进一步改进的技术方案,所述的步骤4中的将所有树木相对聚类特征参数按类别分别进行交叉组合,所有组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度抽取基于树木相对聚类特征的最优特征参数组的具体步骤为:
将50个树木相对聚类特征参数按步骤(e)中所述的5种类别进行分类,将每种类别中的10个树木相对聚类特征参数分别进行交叉组合,将每种类别对应的所有组合方式作为SVM 分类器的输入变量进行分类,获得每种类别对应的所有组合方式的分类精度,根据分类精度和组合方式内的参数个数抽取V2、V4和V8的组合方式作为V特征参数的最优特征参数,抽取单个特征参数Lmax_2作为Lmax特征参数的最优特征参数,抽取单个特征参数Lmin_4作为Lmin特征参数的最优特征参数,抽取rmin_2和rmin_8的组合方式作为rmin特征参数的最优特征参数;因此 {V2、V4、V8、Lmax_2、Lmin_4、rmin_2、rmin_8}为基于树木相对聚类特征的最优特征参数组。
作为本发明进一步改进的技术方案,所述的步骤4中的将所有点云分布特征参数进行交叉组合,将得到的所有组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度抽取基于点云分布特征的最优特征参数组的具体步骤为:
将9个点云分布特征参数进行交叉组合,将得到的所有组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度和组合方式内的参数个数抽取点云高度峰值、树高的40%和60%之间的点云数量与整株树点云数量的比率以及树高的60%和80%之间的点云数量与整株树点云数量的比率的组合作为基于点云分布特征的最优特征参数组。
作为本发明进一步改进的技术方案,所述的步骤4中的将所有树木表观特征参数进行交叉组合,将得到的组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度抽取基于树木表观特征的最优特征参数组的具体步骤为:
将9个树木表观特征参数进行交叉组合,将得到的组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度和组合方式内的参数个数抽取树冠高度和等效冠直径的比率、树冠椭球模型拟合参量以及中心垂直剖面内的网格参量的组合作为基于树木表观特征的最优特征参数组。
本发明的有益效果为:本发明通过地面激光扫描获取树木的光探测和测距数据为遥感数据源,提出三类有效特征:树木相对聚类特征、点云分布特征和树木表观特征,列举多个特征参数供最优特征抽取,采用SVM分类器在交叉验证中确定三种类别的最优特征参数组,采用整合三种类别的最优特征参数组的方式进行树种分类,达到了较高的树种分类精度,为获得更准确的森林树种分布提供了强有力的工具,减少了野外实体调查的高成本、费时、费力,减少了人工判读带来的误差。
具体实施方式
下面根据图1至图10对本发明的具体实施方式作出进一步说明:
一种面向树木激光点云的有效特征抽取与树种识别方法,包括:
步骤1:数据获取:获取目标树的全覆盖点云数据;
步骤2:数据预处理:对目标树的全覆盖点云数据进行降噪处理以去除异常点;
步骤3:树木特征分析:根据降噪后获得的点云数据分别分析目标树的三种类别的树木特征,所述三种类别的树木特征分别为树木相对聚类特征(反映树冠聚集离散结构和尺度)、点云分布特征(反映整株树的点云分布)和树木表观特征(反映树木结构的细化解释),从而获得多个树木相对聚类特征参数、多个点云分布特征参数和多个树木表观特征参数;
步骤4:有效特征抽取:将所有树木相对聚类特征参数按类别分别进行交叉组合,将得到的所有组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度抽取基于树木相对聚类特征的最优特征参数组;将所有点云分布特征参数进行交叉组合,将得到的所有组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度抽取基于点云分布特征的最优特征参数组;将所有树木表观特征参数进行交叉组合,将得到的组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,根据分类精度抽取基于树木表观特征的最优特征参数组;
步骤5:树种分类:将基于树木相对聚类特征的最优特征参数组、基于点云分布特征的最优特征参数组以及基于树木表观特征的最优特征参数组进行组合并作为变量输入到SVM分类器中进行树种分类。
本实施例的步骤1中数据获取包括:本实施例将地面激光雷达(Leica C10)放置在距离目标树3米的不同侧面并设置相同的扫描精度,扫描后,将不同角度得到的扫描结果整合到同一坐标系中,继而得到目标树的全覆盖点云数据。
本实施例的步骤2中数据预处理包括采用TerraScan软件划分目标树的点云从而滤除点云噪声,去除异常点。
由于步骤1获取到的点云数据存在一些偏离度太大的扫描点,为了减小树种分类结果的误差,本实施例对所有点云数据进行降噪处理以去除异常点,最终选取240株树进行树种分类研究。这些树种包括水杉、棕榈、无患子、橡胶树和竹子。为了能有效的滤除点云噪声并且保持良好的树种特征,本实施例使用TerraScan软件以交互式的方式划分出了每株样本树的点云,参见图1,图1为水杉、棕榈、无患子、橡胶树和竹子这五种样本树的点云表示。
表1列出了在统计学中五种样本树的基本结构特征描述:
本实施例的步骤1和步骤2介绍的是数据获取和数据预处理,下面针对点云数据进行具体分析。
为了能够提出更好的反映每种树木的私有特征,从而进行更有效的树种分类,首先从分析树木特征开始。本实施例在步骤3中提出三种类别的树木特征:(1)树木相对聚类特征;(2)点云分布特征;(3)树木表观特征。接下来,针对每种类别,通过SVM分类器将其特征参数的所有组合方式作为输入变量进行分类,比较其分类精度。在寻找树种分类最佳精度的同时保持参与分类的特征参数尽可能少的过程中,可以获得相关的特征参数,这些特征参数被定义为最优特征参数。然后,组合三种类别的最优特征参数将其作为变量输入到SVM分类器中以获得更高的分类精度。最后,本实施例将进行树种分类的整体性能评估。具体的方法流程框架如图2所示。
步骤3中树木相对聚类特征的分析过程如下:
为了描述单株树的聚集离散结构,本实施例提出树木相对聚类这一特征。对于一株给定树,采用现有文献[T.Yun,F.An,W.Li,Y.Sun,L.Cao,and L.Xue,“Anovel approachfor retrieving tree leaf area from ground-based LiDAR,”Remote Sens.,vol.8,no.11,p.942,2016]的方法对其点云进行计算,实现树冠的提取。将获取到的树冠自顶而下水平分割成10个相同高度的矩形层R
k,k=1,2,…,10。取树高与冠底高度之差作为树冠高度H
Crown,则R
k的高度为H
Crown/10。R
k的长度和宽度由所有点云在3-D坐标中X轴和Y 轴的最大值与最小值确定,设坐标系下的任意点云坐标为:
其中j为样本树中的第j株树,i为第j株树内的第i个点云,则R
k的长度和宽度可以分别表示为
和
接下来,将R
k分割成m个边长为H
Crown/10的正方形区域的样方,
为R
k内第l个样方中的点云数量。在每个R
k内用特征值V
k描述对应k层点云的聚集离散结构,V
k定义为:
通过定量比较可以确定Rk的结构特征:若Vk<1,则Rk的结构特征为分散;若Vk>1,则Rk的结构特征为聚集;若Vk=1,则Rk的结构特征是随机的。一般来说Vk值越大,点聚类越多。树冠自顶而下的每个矩形层的Vk特征值可以分别表示为V1,V2,…,V10(见表2)。
由于不同树木之间矩形层的高度HCrown/10不同,使得不同数木之间Vk特征值的比较存在尺度上的差异。因此,在具体的分类过程中针对每株树,通过公式(2)将Vk特征值作0到1 之间的归一化处理,这一做法进一步解释了“相对”的概念,使得不同树木之间Vk特征值的比较是可行的。
其中公式(2)中min(V)和max(V)分别为给定树的10个矩形层中对应的最小Vk值与最大 Vk值。
通过Vk特征值的大小可以得知样本树中任意树冠在某一高度层的聚集离散结构,为了进一步探讨该层最大化聚集离散的相对尺度,本实施例提出Lk函数(参见公式(5)),具体过程如下:首先Pk(r)为关于距离度量r的函数,Pk(r)定义为:
其中公式(3)中A
k代表R
k垂直于地面方向上的投影面积,n
k是R
k内的点云个数;公式 (4)中
为指标函数,
代表任意两点
和
之间的距离,若
则
取值为1,否则为0。最后求取P
k(r)函数的偏差,如下式:
通过对点云水平间距和样本树平均冠幅大小的估计,本实施例将r的取值设置为从0.2m 至6m区间内间隔为0.2m的30个数值,则单株树的每个矩形层包含30个Lk(r)函数值,可视为具有正峰值或负峰值的函数曲线。Lk(r)的最大正值表示Rk在刻度r上存在最大程度的分散, Lk(r)的最小负值表示Rk在刻度r上存在最大程度的聚集。从Lk(r)函数计算出四个代表性数值: (1)Lk(r)函数的最大正值(用Lmax_k表示),(2)Lk(r)函数的最小负值(用Lmin_k表示),(3)Lk(r) 函数最大正值处对应的距离度量(用rmax_k表示),(4)Lk(r)函数最小负值处对应的距离度量 (用rmin_k表示)。由于任意单株树都包含10个矩形层,针对Lk(r)函数的四个代表性数值,则任意单株树都将包含40特征值,分别表示为Lmax_1,Lmax_2,…,Lmax_10;Lmin_1,Lmin_2,…, Lmin_10;rmax_1,rmax_2,…,rmax_10;rmin_1,rmin_2,…,rmin_10(见表2)。
表2为与树木相对聚类特征相关联的参数列表:
因此所述的树木相对聚类特征参数分为5种类别,分别为:V特征参数、Lmax特征参数、 Lmin特征参数、rmax特征参数以及rmin特征参数,V特征参数包括V1,V2,…,V10;Lmax特征参数包括Lmax_1,Lmax_2,…,Lmax_10;Lmin特征参数包括Lmin_1,Lmin_2,…,Lmin_10;rmax特征参数包括rmax_1,rmax_2,…,rmax_10;rmin特征参数包括rmin_1,rmin_2,…,rmin_10;因此所有类别的树木相对聚类特征参数的个数一共50个。
步骤3中点云分布特征的分析过程如下:
虽然使用点云数据不能重建树木的详细结构,但是在统计意义上它可以反映出不同树种的结构特征。例如:由于树冠对激光的阻碍作用,获取到的点云数量从树的顶部到底部呈现下降趋势,这种下降趋势的程度取决于树木种类的不同。因此,本实施例除了提出点高度类型的特征参数之外,还提出位于不同高度分位点处的点云数量作为特征参数。点云分布特征参数分别为点云高度均值、点云高度标准偏差、点云高度偏移量、点云高度峰值、树高的0%和20%之间的点云数量与整株树点云数量的比率、树高的20%和40%之间的点云数量与整株树点云数量的比率、树高的40%和60%之间的点云数量与整株树点云数量的比率、树高的60%和 80%之间的点云数量与整株树点云数量的比率以及树高的80%和100%之间的点云数量与整株树点云数量的比率;具体见表3,表3为与点云分布特征相关联的参数列表:
其中n
tp表示目标树的点云总数,
为点云坐标
中Z轴的分量值,
表示高度在a和b之间的点云总数,H
Tree是目标树的树高。
步骤3中树木表观特征的分析过程如下:
首先获取常见的树木表观特征,常见的树木表观特征包括树高(H
Tree)、树冠高度(H
Crown)、冠中最高分支高度(简称H
maxb)、冠中最低分支的高度(简称H
minb)、冠盖的最长分布(简称L
Crown)和与L
Crown垂直的冠盖最长分布(简称
)(如图3所示),图3 中的(a)为样例树(橡胶树)的侧视图;图3中的(b)为样例树(橡胶树)的俯视图。
除了常见的特征参数外,还可以通过寻求更强大的特征参数或是组合两个通用特征参数的方法提出其他特征参数。对于第一种方法,本实施例提出了如图3中的(b)所示的具有与冠盖相等面积的等效最小外接圆直径DEA,其在一定程度上克服了冠形变化的影响。对于第二种方法,本实施例使用常见特征参数与树高之间的比率作为新的特征参数,该度量可以减少树龄对树种分类的影响。本实施例所采用的树木表观特征参数具体见表4。
在表4中,D
EA的推导涉及到处理树冠投影到地面的二维散射点,从最小外接圆的面积可以推导出相关的D
EA值。根据文献[张志华,云挺,薛联凤,李卫正,张天安,and孙圆,“基于近景摄影测量技术的关键林分参数的获取研究,”科学技术与工程,no.12,pp.85- 92,2017]的方法研究,可以从扫描点云获取L
Crown、
H
maxb和H
minb。表4中其它树木表观特征参数的获取主要来自点云投影平面的网格划分,划分过程具体如下:首先以树干为中心垂直于地面方向切割树冠,将其平均分成8段,接下来将每个分段内的所有点云投影到各个分段的中心垂直剖面上,如图4中的(a)所示,图4中的(a)为样例树(橡胶树)8分段划分与各分段的中心垂直剖面投影的俯视图。最后将中心垂直剖面划分为g×g的网格,用C
b1,b2代表第b1行第b2列个网格,如图4中的(b)所示,图4中的(b)为第3分段投影到中心垂直剖面的网格化示意图。
表4为与树木表观特征相关联的参数列表:
表4中A
Base为树冠垂直于地面的投影面积;a为沿X轴方向上的椭球半径,b为沿着Y轴方向上的椭球半径,c为沿Z轴方向上的椭球半径;
表示第b1行第b2列个网格内的点云数量;
为第t个中心垂直剖面内点云投影覆盖到的网格数量;
为第t个中心垂直剖面内点云投影覆盖到的网格面积;
为第t个中心垂直剖面内点云投影的凸包面积。
根据表4中的公式分别计算出等效冠直径、树冠高度与树高的比率、等效冠直径与树高的比率、树冠高度和等效冠直径的比率、(树高-H
minb)和(树高-H
maxb)的比率、L
crown和
的比率、树冠椭球模型拟合参量、所有网格内点云的平均高度以及中心垂直剖面内的网格参量并将其作为树木表观特征参数。
在本实施例中,树种分类是基于支持向量机(SVM)完成的,最优特征的抽取可以提高树种分类的效率和分类结果的准确性。因此,步骤4的最优特征参数的抽取是树种分类的关键步骤。本实施例提出68个特征参数(包括50个树木相对聚类特征参数、9个点云分布特征参数、9个树木表现特征参数)用于最优特征参数抽取,采用SVM分类器在交叉验证中进行样本树的分类。本实施例首先将每个类别的所有特征参数所能构成的组合作为输入变量进行分类,比较得到的分类精度确定基于该类别的最优特征参数组。然后整合三个类别的所有最优特征参数组,重复上述分类操作,获得整体意义上的最佳分类精度。
每种树木的样本树被随机分为两个子集,其中一个子集作为训练数据集,用于特征抽取并训练个体以获得最佳SVM分类器;另一个子集作为测试数据集,用于评估最终树种分类的准确性。针对每个类别的样本树,随机抽取其样本数量的1/3作为训练数据集,其余的样本树为测试数据集,本文的训练数据集具体包含16株水杉、18株棕榈、14株无患子、17株橡胶树以及15株竹子。
本实施例基于树木相对聚类特征的树种分类分析如下:
图5显示了一株橡胶树和一株水杉中两个矩形层的点云投影和关于Vk特征值的坐标系描述;图5中的(a)和图5中的(b)分别为点云表示的橡胶树和水杉以及它们第二个和第八个矩形层的点云投影;图5中的(c)显示了橡胶树和水杉各个高度层关于V特征的坐标系表示。就单株树而言,橡胶树的R2和R8虽然含有相近的点云个数,其中R2内的点云数量为28500,R8内的点云数量为31900,但是它们的点云分布却存在差异,R8相对R2点云分布更集中,其中V2为 0.63(<1),而V8相对较高为1.1(>1)。从图5中的(b)可以明显地看出水杉的R2相对R8点云分布更为集中,通过图5中的(c)进行验证,其中水杉的V2为4.07(>1),而水杉的V8为0.41(<1),与预估相符。
图6显示了图5所示两株树内关于L2函数和L8函数(参见公式(5))的分布。图6中的(a)和图6中的(b)分别为橡胶树和水杉第二层和第八层的点云数据关于Lk(r)函数的坐标系表示。从图6中的(a)中可以看出:橡胶树的R2在r=0.6m时存在最大化的聚集,而水杉的R2在 r=1.2m时存在最大化的聚集,因此,在R2中水杉相对橡胶树具有更大的点云聚集面积。从图6中的(b)中可以看出:橡胶树的R8在r=0.8m时存在最大化的聚集,而水杉的R8在r=2m时存在最大化的聚集,因此,在R8中水杉的点云聚集面积仍相对较大。此外,橡胶树和水杉在R2和R8中,当r取6m时都存在最大化的分散。
在分类过程中,为了降低程序复杂度和完善方法框架的模块化功能,将树木相对聚类特征(参见表2)包含的5种类别(V特征参数、Lmax特征参数、Lmin特征参数、rmax特征参数以及rmin特征参数)共50个树木相对聚类特征参数按类别分类,将每种类别中的10个树木相对聚类特征参数分别进行交叉组合,交叉组合后得到的特征参数的组合数量分别为1,2…,10;每种类别对应的所有组合方式作为SVM分类器的输入变量进行分类,获得每种类别对应的所有组合方式的分类精度,5种类别的不同组合方式对应的分类结果的箱形图如图7所示,图7中所有的横坐标表示特征参数的组合数量。
从图7中的(a)可以看出,基于V特征参数的分类性能首先得到了一定程度的改善,然后改善幅度逐渐趋于平稳,最终特征在组合数(组合方式内的参数个数)为3、8、9和10的条件下产生较高的分类精度。因此,为了减少运算,本实施例按照特征组合数为3抽取V2、V4和 V8的组合方式作为V特征参数的最优特征参数。从图7中的(b)和图7中的(c)可以看出,基于 Lmax特征参数和Lmin特征参数的分类一开始都表现出了较高的性能,出现这一现象的主要原因是某一参数的显著性造成的。通过计算,发现在图7中的(b)中仅使用Lmax_2参数就达到了 35.8%的分类精度,在图7中的(c)中仅使用Lmin_4参数同样达到了单个特征参数分类的最高精度38.7%。因此,本实施例抽取单个特征参数Lmax_2作为Lmax特征参数的最优特征参数,抽取单个特征参数Lmin_4作为Lmin特征参数的最优特征参数。图7中的(d)显示,由于rmax特征参数的不同组合数量的平均分类精度均较低,普遍在10%到20%之间。因此,本实施例忽略rmax特征参数在树种分类中的影响。针对rmin特征参数的不同组合数量,本实施例选取2个特征参数组合数即达到较高分类精度36.7%,经过对比选取rmin_2和rmin_8的组合方式作为rmin特征参数的最优特征参数。
综上所述,{V2、V4、V8、Lmax_2、Lmin_4、rmin_2、rmin_8}为基于树木相对聚类特征的最优特征参数组。表5列出了训练数据集基于树木相对聚类特征的最优特征参数组的交叉验证分类结果,由表5可以看出尽管五种树木的分类精度均为正值,但分类结果仍待改善。表5:
树种 |
水杉 |
棕榈 |
无患 |
橡胶 |
竹子 |
错判 |
漏判 |
水杉 |
8 |
2 |
2 |
3 |
2 |
52.9% |
50% |
棕榈 |
3 |
8 |
2 |
3 |
3 |
57.9% |
55.5% |
无患子 |
2 |
3 |
6 |
3 |
1 |
60% |
57.2% |
橡胶树 |
2 |
3 |
3 |
7 |
1 |
56.3% |
58.8% |
竹子 |
1 |
2 |
1 |
1 |
7 |
41.7% |
53.3% |
分类正确 |
8 |
8 |
6 |
7 |
7 |
|
|
训练样本 |
16 |
18 |
14 |
17 |
15 |
|
|
正确率 |
50% |
44.5% |
42.8% |
41.2% |
46.7% |
|
|
表5为基于树木相对聚类特征{V2、V4、V8、Lmax_2、Lmin_4、rmin_2、rmin_8}的交叉验证分类结果。
本实施例基于点云分布特征的树种分类分析如下:
将表3中的9个点云分布特征参数进行交叉组合,将得到的所有组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,不同组合方式的分类精度的结果的箱形图如图8所示。从图8中可以看出,分类的性能首先得到了一定程度的改善,然后改善情况逐渐趋于平稳,并且在组合数(组合方式内的参数个数)为3和9个特征参数的情况下产生较好的分类精度56.9%和57.7%。为了减少运算,选取最小组合数同时分类精度高的组合方式作为最优特征参数组,因此本实施例通过比对抽取点云高度峰值PH、树高的40%和60%之间的点云数量与整株树点云数量的比率
和树高的60%和80%之间的点云数量与整株树点云数量的比率
这三个特征参数的组合作为基于点云分布特征的最优特征参数组。表6列出了训练数据集基于点云分布特征的最优特征参数组的交叉验证分类结果,由于水杉高大且树冠分布连续、竹子矮小且树冠分布不均以及棕榈树高适中但树冠分布密集,从表6 可以看出在基于点云分布特征分类中对水杉、竹子和棕榈识别较为敏感。表6:
树种 |
水杉 |
棕榈 |
无患 |
橡胶 |
竹子 |
错判 |
漏判 |
水杉 |
10 |
1 |
1 |
1 |
0 |
23.1% |
37.5% |
棕榈 |
1 |
11 |
1 |
2 |
1 |
31.3% |
38.9% |
无患子 |
2 |
2 |
8 |
4 |
2 |
55.6% |
42.9% |
橡胶树 |
2 |
2 |
3 |
9 |
3 |
52.6% |
47.1% |
竹子 |
1 |
2 |
1 |
1 |
9 |
35.7% |
40% |
分类正确 |
10 |
11 |
8 |
9 |
9 |
|
|
训练样本 |
16 |
18 |
14 |
17 |
15 |
|
|
正确率 |
62.5% |
61.1% |
57.1% |
52.9% |
60% |
|
|
本实施例基于树木表观特征的树种分类分析如下:
将表4中的9个树木表观特征参数进行交叉组合,将得到的组合方式作为SVM分类器的输入变量进行分类,获得所有组合方式的分类精度,不同组合方式的分类结果的箱形图如图 9所示。在这里,选取分类精度高且组合数(组合方式内的参数个数)少的组合方式作为最优特征参数组,本实施例抽取树冠高度和等效冠直径的比率RC/D、树冠椭球模型拟合参量ηCrown和中心垂直剖面内的网格参量QL这三个特征参数的组合确定为基于树木表观特征的最优特征参数组。其中,RC/D和ηCrown对冠形敏感,QL可以反映枝叶密度是稠密或稀疏。表7 列出了训练数据集基于树木表观特征的最优特征参数组的交叉验证分类结果,由于水杉的树冠多为圆锥状,区别于其他树种的树冠形状,所以在本类特征分类中表现突出。而竹子的树冠和橡胶树的树冠相似度较高并且林木枝叶密集程度相仿,所以在此特征分类中这两种树木的区别较为模糊。表7:
表7为基于树木表观特征{RC/D、ηCrown、QL}的交叉验证分类结果。
本实施例的步骤5中基于整合三种类别的最优特征参数组的树种分类分析如下:
将基于树木相对聚类特征的最优特征参数组、基于点云分布特征的最优特征参数组和基于树木表观特征的树木表观特征的最优特征参数组一共13个特征参数进行交叉组合,作为 SVM分类器的输入变量,分类结果的箱形图如图10所示。从图10中可以看出,随着组合最优特征参数的数量的增多,分类精度平均值呈现平缓的上升趋势,当组合三种类别的最优特征参数组内所有的特征参数时,分类精度平均值达到最大值82.5%。此外,与上述分别进行基于树木相对聚类特征的最优特征参数组的树种分类操作(参见表5)、基于点云分布特征的最优特征参数组的树种分类操作(参见表6)、基于树木表观特征的最优特征参数组的树种分类操作(参见表7)相比,基于整合三种类别的最优特征参数组的树种分类(参见表8)性能有一定程度的提高,但最终的分类精度尚未达到完全精确,因为其分类结果会受很多因素的影响,例如:树木空间竞争关系对树冠的影响、扫描时由于遮挡问题造成的数据缺失、同种树木的个体性差异以及树木生长环境的各异性等。为了提高树种分类结果的可靠性,这些因素都需考虑在内。表8列出了测试数据集基于整合三种类别的最优特征参数组的交叉验证分类结果,结果验证了整合三种类别的最优特征参数组可以实现较高性能的树种分类。表8:
树种 |
水杉 |
棕榈 |
无患 |
橡胶 |
竹子 |
错判 |
漏判 |
水杉 |
29 |
2 |
0 |
0 |
0 |
6.7% |
12.5% |
棕榈 |
2 |
30 |
3 |
1 |
0 |
16.7% |
16.7% |
无患子 |
0 |
2 |
23 |
2 |
2 |
21.4% |
21.4% |
橡胶树 |
1 |
2 |
2 |
27 |
2 |
20.6% |
23.5% |
竹子 |
0 |
0 |
0 |
4 |
26 |
13.3% |
13.4% |
分类正确 |
29 |
30 |
23 |
27 |
26 |
|
|
测试样本 |
32 |
36 |
28 |
34 |
30 |
|
|
正确率 |
90.6% |
83.3% |
82.1% |
79.4% |
86.6% |
|
|
表8为:
因此本实施例最终采用将基于树木相对聚类特征的最优特征参数组、基于点云分布特征的最优特征参数组以及基于树木表观特征的最优特征参数组进行全部组合并作为变量输入到 SVM分类器中进行树种分类。
森林树种的正确识别是利用和保护森林资源的基础和依据,现阶段的树种分类结果尚未令人满意。为了解决现阶段的树种分类方法大多依赖于一些高成本、费时和费力的野外实体调查或精度不高的航片进行人工判读的技术问题,本实施例开发一个全面而有效的方法框架检验基于TLS的点云数据对树种分类的作用。通过地面激光扫描(terrestriallaser scanner 简称TLS)获取树木的光探测和测距(light detection and ranging简称LiDAR)数据为遥感数据源,面向基于TLS的点云数据选取五种树种(水杉、棕榈、无患子、橡胶树、竹子) 为研究对象,提出三类有效特征:树木相对聚类特征(反映树冠聚集离散结构和尺度)、点云分布特征(反映整株树的点云分布)和树木表观特征(反映树木结构的细化解释),列举68 个特征参数供最优特征抽取。研究过程采用SVM分类器在交叉验证中对训练数据集检验计算确定最优特征参数组,最终抽取13个最优特征参数在测试数据集中进行树种分类的方法。计算得出:基于树木相对聚类特征的最优特征参数组进行树种分类的平均分类精度较低(45%);基于点云分布特征的最优特征参数组进行树种分类的平均分类精度有所增长(58.8%);基于树木表观特征的最优特征参数组进行树种分类的平均分类精度较高(63.8%);基于整合三种类别的树木特征的13个最优特征参数进行树种分类的平均分类精度最高(82.5%)。实验结果表明该方法达到较高的树种分类精度,证明了采用SVM分类器进行交叉验证的方法具有较高的可行性,为获得更准确的森林树种分布提供了强有力的工具,对可持续森林管理和生态环境保护提供了有力的辅助手段。后续研究内容将侧重于大数据样本的建立、地基与机载激光全方位扫描以消除遮挡以及结合深度学习进一步优化树种分类方法,从而期望达到一个更优良的分类精度,为实际应用提供更坚实的理论基础。
本发明的保护范围包括但不限于以上实施方式,本发明的保护范围以权利要求书为准,任何对本技术做出的本领域的技术人员容易想到的替换、变形、改进均落入本发明的保护范围。