CN109446986B

CN109446986B - 一种面向树木激光点云的有效特征抽取与树种识别方法

Info

Publication number: CN109446986B
Application number: CN201811263570.4A
Authority: CN
Inventors: 云挺; 卢晓艺; 曹林; 薛联凤
Original assignee: Nanjing Forestry University
Current assignee: Zhejiang Zhongnan Green Carbon Technology Co ltd
Priority date: 2018-10-28
Filing date: 2018-10-28
Publication date: 2021-09-24
Anticipated expiration: 2038-10-28
Also published as: CN109446986A

Abstract

本发明公开了一种面向树木激光点云的有效特征抽取与树种识别方法，包括：获取目标树的全覆盖点云数据；对目标树的全覆盖点云数据进行降噪处理以去除异常点；根据降噪后获得的点云数据分别分析目标树的三种类别的树木特征；抽取基于树木相对聚类特征的最优特征参数组；抽取基于点云分布特征的最优特征参数组；抽取基于树木表观特征的最优特征参数组；将三种类别的树木特征的最优特征参数组进行组合并作为变量输入到SVM分类器中进行树种分类。本发明达到了较高的树种分类精度，为获得更准确的森林树种分布提供了强有力的工具，减少了野外实体调查的高成本、费时、费力，减少了人工判读带来的误差。

Description

一种面向树木激光点云的有效特征抽取与树种识别方法

技术领域

本发明涉及树种分类技术领域，具体涉及一种面向树木激光点云的有效特征抽取与树种识别方法。

背景技术

森林作为地球上可再生自然资源及陆地生态系统的主体，它为人类的生存和发展提供了丰富的物质资源，在维持生态过程和生态平衡中发挥着重要的作用。正确的识别森林物种是利用和保护森林资源的基础和依据。在过去的四十年中，遥感技术的进步使得树种分类在几种传感器类型中得以实现。现阶段的树种分类方法大多依赖于一些高成本、费时、费力的野外实体调查方法或精确度不高的航片来进行人工判读。

目前许多研究从各个方面对树种分类问题进行了探讨，例如利用树冠内部信号特征作为附加特征对树木内部参数和大小尺寸进行鲁棒性评估；利用归一化差异植被指数作为特征参数在树种多样性相当大的情况下对树种进行分类；利用频谱变量选择与PLS-DA相结合在不受分类器约束的情况下提高随机树种分类精确度；使用平均加权算法提取高光谱图像中冠层像素加权光谱并进行有效分析；提出用于树冠层次上树种分类的半监督支持向量机分类器；检测树种之间冠聚集偏态属性的差异；制定基于静态TLS的树种分类程序；然而具体到特定树种的分类，基于单株树的LiDAR数据提取特征研究则相对较少，而以一定的算法进行最优特征提取的研究更是鲜有报道。

发明内容

本发明所要解决的技术问题是针对上述现有技术的不足提供一种面向树木激光点云的有效特征抽取与树种识别方法，本面向树木激光点法云的有效特征抽取与识别方法提出三类有效特征：树木相对聚类特征、点云分布特征和树木表观特征，列举多个特征参数供最优特征抽取，采用SVM分类器在交叉验证中确定最优特征参数组，利用最优特征参数组进行树种分类，达到了较高的树种分类精度，为获得更准确的森林树种分布提供了强有力的工具，减少了野外实体调查的高成本、费时、费力，减少了人工判读带来的误差。

为实现上述技术目的，本发明采取的技术方案为：

一种面向树木激光点云的有效特征抽取与树种识别方法，包括：

步骤1：获取目标树的全覆盖点云数据；

步骤2：对目标树的全覆盖点云数据进行降噪处理以去除异常点；

步骤3：根据降噪后获得的点云数据分别分析目标树的三种类别的树木特征，所述三种类别的树木特征分别为树木相对聚类特征、点云分布特征和树木表观特征，从而获得多个树木相对聚类特征参数、多个点云分布特征参数和多个树木表观特征参数；

步骤4：将所有树木相对聚类特征参数按类别分别进行交叉组合，将得到的所有组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于树木相对聚类特征的最优特征参数组；将所有点云分布特征参数进行交叉组合，将得到的所有组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于点云分布特征的最优特征参数组；将所有树木表观特征参数进行交叉组合，将得到的组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于树木表观特征的最优特征参数组；

步骤5：将基于树木相对聚类特征的最优特征参数组、基于点云分布特征的最优特征参数组以及基于树木表观特征的最优特征参数组进行组合并作为变量输入到SVM分类器中进行树种分类。

作为本发明进一步改进的技术方案，所述的步骤1具体包括：将地面激光雷达放置在距离目标树3米的不同侧面并设置相同的扫描精度，扫描后，将不同角度得到的扫描结果整合到同一坐标系中，继而得到目标树的全覆盖点云数据。

作为本发明进一步改进的技术方案，所述的步骤2具体包括：采用TerraScan软件划分目标树的点云从而滤除点云噪声，去除异常点。

作为本发明进一步改进的技术方案，所述的步骤3中的树木相对聚类特征表示目标树的点云的聚集离散结构，分析目标树的树木相对聚类特征的具体步骤为：

(a)对目标树的点云数据进行计算，实现树冠的提取，将获取到的树冠自顶而下水平分割成10个相同高度的矩形层R_k，k＝1，2，…，10；取树高与冠底高度之差作为树冠高度H_Crown，则R_k的高度为H_Crown/10；R_k的长度为

R_k的宽度为

其中3D坐标系下任意点云坐标为

j为目标树中的第j株树，i为第j株树内的第i个点云；

(b)将矩形层R_k分割成m个边长为H_Crown/10的正方形区域的样方，

为R_k内第l个样方中的点云数量，在每个R_k内用特征值V_k描述对应k层点云的聚集离散结构，V_k定义为：

若V_k＜1，则R_k的结构特征为分散；若V_k＞1，则R_k的结构特征为聚集；若V_k＝1，则R_k的结构特征为随机；

(c)通过公式(2)将特征值V_k作0到1之间的归一化处理：

其中min(V)和max(V)分别为目标树的10个矩形层中对应的最小V_k值与最大V_k值；

(d)计算关于距离度量r的函数P_k(r)：

其中公式(3)中A_k代表R_k垂直于地面方向上的投影面积，n_k是R_k内的点云个数；公式(4)中

为指标函数，

代表任意两点

和

之间的距离，若

则

取值为1，否则为0；

求取P_k(r)函数的偏差：

其中r的取值为从0.2m至6m区间内间隔为0.2m的30个数值，则单株目标树的每个矩形层包含30个L_k(r)函数值，30个L_k(r)函数值中最大正值表示R_k在刻度r上存在最大程度的分散，30个L_k(r)函数值中最小负值表示R_k在刻度r上存在最大程度的聚集，从30个L_k(r)函数值中计算出最大正值L_{max_k}、最小负值L_{min_k}、最大正值处对应的距离度量r_{max_k}以及最小负值处对应的距离度量r_{min_k}；

(e)所述的树木相对聚类特征参数分为5种类别，分别为：V特征参数、L_max特征参数、 L_min特征参数、r_max特征参数以及r_min特征参数，V特征参数包括V₁，V₂，…，V₁₀；L_max特征参数包括L_{max_1}，L_{max_2}，…，L_{max_10}；L_min特征参数包括L_{min_1}，L_{min_2}，…，L_{min_10}；r_max特征参数包括r_{max_1}，r_{max_2}，…，r_{max_10}；r_min特征参数包括r_{min_1}，r_{min_2}，…，r_{min_10}；因此所有类别的树木相对聚类特征参数的个数一共50个。

作为本发明进一步改进的技术方案，所述的步骤3中点云分布特征参数分别为点云高度均值、点云高度标准偏差、点云高度偏移量、点云高度峰值、树高的0％和20％之间的点云数量与整株树点云数量的比率、树高的20％和40％之间的点云数量与整株树点云数量的比率、树高的40％和60％之间的点云数量与整株树点云数量的比率、树高的60％和80％之间的点云数量与整株树点云数量的比率以及树高的80％和100％之间的点云数量与整株树点云数量的比率。

作为本发明进一步改进的技术方案，所述的步骤3中分析目标树的树木表观特征的具体步骤为：

(a1)获取树高H_Tree和树冠高度H_Crown，从扫描点云数据获取冠中最高分支高度H_maxb、冠中最低分支的高度H_minb、冠盖的最长分布L_Crown和与L_Crown垂直的冠盖最长分布

(b1)以树干为中心垂直于地面方向切割树冠，将其平均分成8段，将每个分段内的所有点云投影到各个分段的中心垂直剖面上，将中心垂直剖面划分为g×g的网格；

(c1)分别计算出等效冠直径、树冠高度与树高的比率、等效冠直径与树高的比率、树冠高度和等效冠直径的比率、(树高-H_minb)和(树高-H_maxb)的比率、L_crown和

的比率、树冠椭球模型拟合参量、所有网格内点云的平均高度以及中心垂直剖面内的网格参量并将其作为树木表观特征参数，所述的等效冠直径为具有与冠盖相等面积的等效最小外接圆直径D_EA。

作为本发明进一步改进的技术方案，所述的步骤4中的将所有树木相对聚类特征参数按类别分别进行交叉组合，所有组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于树木相对聚类特征的最优特征参数组的具体步骤为：

将50个树木相对聚类特征参数按步骤(e)中所述的5种类别进行分类，将每种类别中的10个树木相对聚类特征参数分别进行交叉组合，将每种类别对应的所有组合方式作为SVM 分类器的输入变量进行分类，获得每种类别对应的所有组合方式的分类精度，根据分类精度和组合方式内的参数个数抽取V₂、V₄和V₈的组合方式作为V特征参数的最优特征参数，抽取单个特征参数L_{max_2}作为L_max特征参数的最优特征参数，抽取单个特征参数L_{min_4}作为L_min特征参数的最优特征参数，抽取r_{min_2}和r_{min_8}的组合方式作为r_min特征参数的最优特征参数；因此 {V₂、V₄、V₈、L_{max_2}、L_{min_4}、r_{min_2}、r_{min_8}}为基于树木相对聚类特征的最优特征参数组。

作为本发明进一步改进的技术方案，所述的步骤4中的将所有点云分布特征参数进行交叉组合，将得到的所有组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于点云分布特征的最优特征参数组的具体步骤为：

将9个点云分布特征参数进行交叉组合，将得到的所有组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度和组合方式内的参数个数抽取点云高度峰值、树高的40％和60％之间的点云数量与整株树点云数量的比率以及树高的60％和80％之间的点云数量与整株树点云数量的比率的组合作为基于点云分布特征的最优特征参数组。

作为本发明进一步改进的技术方案，所述的步骤4中的将所有树木表观特征参数进行交叉组合，将得到的组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于树木表观特征的最优特征参数组的具体步骤为：

将9个树木表观特征参数进行交叉组合，将得到的组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度和组合方式内的参数个数抽取树冠高度和等效冠直径的比率、树冠椭球模型拟合参量以及中心垂直剖面内的网格参量的组合作为基于树木表观特征的最优特征参数组。

本发明的有益效果为：本发明通过地面激光扫描获取树木的光探测和测距数据为遥感数据源，提出三类有效特征：树木相对聚类特征、点云分布特征和树木表观特征，列举多个特征参数供最优特征抽取，采用SVM分类器在交叉验证中确定三种类别的最优特征参数组，采用整合三种类别的最优特征参数组的方式进行树种分类，达到了较高的树种分类精度，为获得更准确的森林树种分布提供了强有力的工具，减少了野外实体调查的高成本、费时、费力，减少了人工判读带来的误差。

附图说明

图1为本实施例五种树木的点云表示。

图2为本实施例树种分类的方法流程框架图。

图3为本实施例树木表观特征相关参数定义示意图。

图4为本实施例树木表观特征中与网格相关特征的求取示意图。

图5为本实施例样例树(橡胶树和水杉)基于V特征的结果描述。

图6为本实施例样例树(橡胶树和水杉)基于L特征的结果描述。

图7为本实施例基于树木相对聚类特征的分类精度箱形图。

图8为本实施例基于点云分布特征的分类精度箱形图。

图9为本实施例基于树木表观特征参数的分类精度箱形图。

图10为本实施例基于整合三种类别最优特征参数组的分类精度箱形图。

具体实施方式

下面根据图1至图10对本发明的具体实施方式作出进一步说明：

步骤1：数据获取：获取目标树的全覆盖点云数据；

步骤2：数据预处理：对目标树的全覆盖点云数据进行降噪处理以去除异常点；

步骤3:树木特征分析：根据降噪后获得的点云数据分别分析目标树的三种类别的树木特征，所述三种类别的树木特征分别为树木相对聚类特征(反映树冠聚集离散结构和尺度)、点云分布特征(反映整株树的点云分布)和树木表观特征(反映树木结构的细化解释)，从而获得多个树木相对聚类特征参数、多个点云分布特征参数和多个树木表观特征参数；

步骤4：有效特征抽取：将所有树木相对聚类特征参数按类别分别进行交叉组合，将得到的所有组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于树木相对聚类特征的最优特征参数组；将所有点云分布特征参数进行交叉组合，将得到的所有组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于点云分布特征的最优特征参数组；将所有树木表观特征参数进行交叉组合，将得到的组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于树木表观特征的最优特征参数组；

步骤5：树种分类：将基于树木相对聚类特征的最优特征参数组、基于点云分布特征的最优特征参数组以及基于树木表观特征的最优特征参数组进行组合并作为变量输入到SVM分类器中进行树种分类。

本实施例的步骤1中数据获取包括：本实施例将地面激光雷达(Leica C10)放置在距离目标树3米的不同侧面并设置相同的扫描精度，扫描后，将不同角度得到的扫描结果整合到同一坐标系中，继而得到目标树的全覆盖点云数据。

本实施例的步骤2中数据预处理包括采用TerraScan软件划分目标树的点云从而滤除点云噪声，去除异常点。

由于步骤1获取到的点云数据存在一些偏离度太大的扫描点，为了减小树种分类结果的误差，本实施例对所有点云数据进行降噪处理以去除异常点，最终选取240株树进行树种分类研究。这些树种包括水杉、棕榈、无患子、橡胶树和竹子。为了能有效的滤除点云噪声并且保持良好的树种特征，本实施例使用TerraScan软件以交互式的方式划分出了每株样本树的点云，参见图1，图1为水杉、棕榈、无患子、橡胶树和竹子这五种样本树的点云表示。

表1列出了在统计学中五种样本树的基本结构特征描述：

本实施例的步骤1和步骤2介绍的是数据获取和数据预处理，下面针对点云数据进行具体分析。

为了能够提出更好的反映每种树木的私有特征，从而进行更有效的树种分类，首先从分析树木特征开始。本实施例在步骤3中提出三种类别的树木特征：(1)树木相对聚类特征；(2)点云分布特征；(3)树木表观特征。接下来，针对每种类别，通过SVM分类器将其特征参数的所有组合方式作为输入变量进行分类，比较其分类精度。在寻找树种分类最佳精度的同时保持参与分类的特征参数尽可能少的过程中，可以获得相关的特征参数，这些特征参数被定义为最优特征参数。然后，组合三种类别的最优特征参数将其作为变量输入到SVM分类器中以获得更高的分类精度。最后，本实施例将进行树种分类的整体性能评估。具体的方法流程框架如图2所示。

步骤3中树木相对聚类特征的分析过程如下：

为了描述单株树的聚集离散结构，本实施例提出树木相对聚类这一特征。对于一株给定树，采用现有文献[T.Yun，F.An，W.Li，Y.Sun，L.Cao，and L.Xue，“Anovel approachfor retrieving tree leaf area from ground-based LiDAR，”Remote Sens.，vol.8，no.11，p.942，2016]的方法对其点云进行计算，实现树冠的提取。将获取到的树冠自顶而下水平分割成10个相同高度的矩形层R_k，k＝1，2，…，10。取树高与冠底高度之差作为树冠高度H_Crown，则R_k的高度为H_Crown/10。R_k的长度和宽度由所有点云在3-D坐标中X轴和Y 轴的最大值与最小值确定，设坐标系下的任意点云坐标为：

其中j为样本树中的第j株树，i为第j株树内的第i个点云，则R_k的长度和宽度可以分别表示为

和

接下来，将R_k分割成m个边长为H_Crown/10的正方形区域的样方，

为R_k内第l个样方中的点云数量。在每个R_k内用特征值V_k描述对应k层点云的聚集离散结构，V_k定义为：

通过定量比较可以确定R_k的结构特征：若V_k＜1，则R_k的结构特征为分散；若V_k＞1，则R_k的结构特征为聚集；若V_k＝1，则R_k的结构特征是随机的。一般来说V_k值越大，点聚类越多。树冠自顶而下的每个矩形层的V_k特征值可以分别表示为V₁，V₂，…，V₁₀(见表2)。

由于不同树木之间矩形层的高度H_Crown/10不同，使得不同数木之间V_k特征值的比较存在尺度上的差异。因此，在具体的分类过程中针对每株树，通过公式(2)将V_k特征值作0到1 之间的归一化处理，这一做法进一步解释了“相对”的概念，使得不同树木之间V_k特征值的比较是可行的。

其中公式(2)中min(V)和max(V)分别为给定树的10个矩形层中对应的最小V_k值与最大 V_k值。

通过V_k特征值的大小可以得知样本树中任意树冠在某一高度层的聚集离散结构，为了进一步探讨该层最大化聚集离散的相对尺度，本实施例提出L_k函数(参见公式(5))，具体过程如下：首先P_k(r)为关于距离度量r的函数，P_k(r)定义为：

其中公式(3)中A_k代表R_k垂直于地面方向上的投影面积，n_k是R_k内的点云个数；公式 (4)中

为指标函数，

代表任意两点

和

之间的距离，若

则

取值为1，否则为0。最后求取P_k(r)函数的偏差，如下式：

通过对点云水平间距和样本树平均冠幅大小的估计，本实施例将r的取值设置为从0.2m 至6m区间内间隔为0.2m的30个数值，则单株树的每个矩形层包含30个L_k(r)函数值，可视为具有正峰值或负峰值的函数曲线。L_k(r)的最大正值表示R_k在刻度r上存在最大程度的分散， L_k(r)的最小负值表示R_k在刻度r上存在最大程度的聚集。从L_k(r)函数计算出四个代表性数值： (1)L_k(r)函数的最大正值(用L_{max_k}表示)，(2)L_k(r)函数的最小负值(用L_{min_k}表示)，(3)L_k(r) 函数最大正值处对应的距离度量(用r_{max_k}表示)，(4)L_k(r)函数最小负值处对应的距离度量 (用r_{min_k}表示)。由于任意单株树都包含10个矩形层，针对L_k(r)函数的四个代表性数值，则任意单株树都将包含40特征值，分别表示为L_{max_1}，L_{max_2}，…，L_{max_10}；L_{min_1}，L_{min_2}，…， L_{min_10}；r_{max_1}，r_{max_2}，…，r_{max_10}；r_{min_1}，r_{min_2}，…，r_{min_10}(见表2)。

表2为与树木相对聚类特征相关联的参数列表：

因此所述的树木相对聚类特征参数分为5种类别，分别为：V特征参数、L_max特征参数、 L_min特征参数、r_max特征参数以及r_min特征参数，V特征参数包括V₁，V₂，…，V₁₀；L_max特征参数包括L_{max_1}，L_{max_2}，…，L_{max_10}；L_min特征参数包括L_{min_1}，L_{min_2}，…，L_{min_10}；r_max特征参数包括r_{max_1}，r_{max_2}，…，r_{max_10}；r_min特征参数包括r_{min_1}，r_{min_2}，…，r_{min_10}；因此所有类别的树木相对聚类特征参数的个数一共50个。

步骤3中点云分布特征的分析过程如下：

虽然使用点云数据不能重建树木的详细结构，但是在统计意义上它可以反映出不同树种的结构特征。例如：由于树冠对激光的阻碍作用，获取到的点云数量从树的顶部到底部呈现下降趋势，这种下降趋势的程度取决于树木种类的不同。因此，本实施例除了提出点高度类型的特征参数之外，还提出位于不同高度分位点处的点云数量作为特征参数。点云分布特征参数分别为点云高度均值、点云高度标准偏差、点云高度偏移量、点云高度峰值、树高的0％和20％之间的点云数量与整株树点云数量的比率、树高的20％和40％之间的点云数量与整株树点云数量的比率、树高的40％和60％之间的点云数量与整株树点云数量的比率、树高的60％和 80％之间的点云数量与整株树点云数量的比率以及树高的80％和100％之间的点云数量与整株树点云数量的比率；具体见表3，表3为与点云分布特征相关联的参数列表：

其中n_tp表示目标树的点云总数，

为点云坐标

中Z轴的分量值，

表示高度在a和b之间的点云总数，H_Tree是目标树的树高。

步骤3中树木表观特征的分析过程如下：

首先获取常见的树木表观特征，常见的树木表观特征包括树高(H_Tree)、树冠高度(H_Crown)、冠中最高分支高度(简称H_maxb)、冠中最低分支的高度(简称H_minb)、冠盖的最长分布(简称L_Crown)和与L_Crown垂直的冠盖最长分布(简称

)(如图3所示)，图3 中的(a)为样例树(橡胶树)的侧视图；图3中的(b)为样例树(橡胶树)的俯视图。

除了常见的特征参数外，还可以通过寻求更强大的特征参数或是组合两个通用特征参数的方法提出其他特征参数。对于第一种方法，本实施例提出了如图3中的(b)所示的具有与冠盖相等面积的等效最小外接圆直径D_EA，其在一定程度上克服了冠形变化的影响。对于第二种方法，本实施例使用常见特征参数与树高之间的比率作为新的特征参数，该度量可以减少树龄对树种分类的影响。本实施例所采用的树木表观特征参数具体见表4。

在表4中，D_EA的推导涉及到处理树冠投影到地面的二维散射点，从最小外接圆的面积可以推导出相关的D_EA值。根据文献[张志华，云挺，薛联凤，李卫正，张天安，and孙圆，“基于近景摄影测量技术的关键林分参数的获取研究，”科学技术与工程，no.12，pp.85- 92，2017]的方法研究，可以从扫描点云获取L_Crown、

H_maxb和H_minb。表4中其它树木表观特征参数的获取主要来自点云投影平面的网格划分，划分过程具体如下：首先以树干为中心垂直于地面方向切割树冠，将其平均分成8段，接下来将每个分段内的所有点云投影到各个分段的中心垂直剖面上，如图4中的(a)所示，图4中的(a)为样例树(橡胶树)8分段划分与各分段的中心垂直剖面投影的俯视图。最后将中心垂直剖面划分为g×g的网格，用C_b1，b2代表第b1行第b2列个网格，如图4中的(b)所示，图4中的(b)为第3分段投影到中心垂直剖面的网格化示意图。

表4为与树木表观特征相关联的参数列表：

表4中A_Base为树冠垂直于地面的投影面积；a为沿X轴方向上的椭球半径，b为沿着Y轴方向上的椭球半径，c为沿Z轴方向上的椭球半径；

表示第b1行第b2列个网格内的点云数量；

为第t个中心垂直剖面内点云投影覆盖到的网格数量；

为第t个中心垂直剖面内点云投影覆盖到的网格面积；

为第t个中心垂直剖面内点云投影的凸包面积。

根据表4中的公式分别计算出等效冠直径、树冠高度与树高的比率、等效冠直径与树高的比率、树冠高度和等效冠直径的比率、(树高-H_minb)和(树高-H_maxb)的比率、L_crown和

的比率、树冠椭球模型拟合参量、所有网格内点云的平均高度以及中心垂直剖面内的网格参量并将其作为树木表观特征参数。

在本实施例中，树种分类是基于支持向量机(SVM)完成的，最优特征的抽取可以提高树种分类的效率和分类结果的准确性。因此，步骤4的最优特征参数的抽取是树种分类的关键步骤。本实施例提出68个特征参数(包括50个树木相对聚类特征参数、9个点云分布特征参数、9个树木表现特征参数)用于最优特征参数抽取，采用SVM分类器在交叉验证中进行样本树的分类。本实施例首先将每个类别的所有特征参数所能构成的组合作为输入变量进行分类，比较得到的分类精度确定基于该类别的最优特征参数组。然后整合三个类别的所有最优特征参数组，重复上述分类操作，获得整体意义上的最佳分类精度。

每种树木的样本树被随机分为两个子集，其中一个子集作为训练数据集，用于特征抽取并训练个体以获得最佳SVM分类器；另一个子集作为测试数据集，用于评估最终树种分类的准确性。针对每个类别的样本树，随机抽取其样本数量的1/3作为训练数据集，其余的样本树为测试数据集，本文的训练数据集具体包含16株水杉、18株棕榈、14株无患子、17株橡胶树以及15株竹子。

本实施例基于树木相对聚类特征的树种分类分析如下：

图5显示了一株橡胶树和一株水杉中两个矩形层的点云投影和关于V_k特征值的坐标系描述；图5中的(a)和图5中的(b)分别为点云表示的橡胶树和水杉以及它们第二个和第八个矩形层的点云投影；图5中的(c)显示了橡胶树和水杉各个高度层关于V特征的坐标系表示。就单株树而言，橡胶树的R₂和R₈虽然含有相近的点云个数，其中R₂内的点云数量为28500，R₈内的点云数量为31900，但是它们的点云分布却存在差异，R₈相对R2点云分布更集中，其中V₂为 0.63(＜1)，而V₈相对较高为1.1(＞1)。从图5中的(b)可以明显地看出水杉的R₂相对R₈点云分布更为集中，通过图5中的(c)进行验证，其中水杉的V₂为4.07(＞1)，而水杉的V₈为0.41(＜1)，与预估相符。

图6显示了图5所示两株树内关于L₂函数和L₈函数(参见公式(5))的分布。图6中的(a)和图6中的(b)分别为橡胶树和水杉第二层和第八层的点云数据关于L_k(r)函数的坐标系表示。从图6中的(a)中可以看出：橡胶树的R₂在r＝0.6m时存在最大化的聚集，而水杉的R₂在 r＝1.2m时存在最大化的聚集，因此，在R₂中水杉相对橡胶树具有更大的点云聚集面积。从图6中的(b)中可以看出：橡胶树的R₈在r＝0.8m时存在最大化的聚集，而水杉的R₈在r＝2m时存在最大化的聚集，因此，在R₈中水杉的点云聚集面积仍相对较大。此外，橡胶树和水杉在R₂和R₈中，当r取6m时都存在最大化的分散。

在分类过程中，为了降低程序复杂度和完善方法框架的模块化功能，将树木相对聚类特征(参见表2)包含的5种类别(V特征参数、L_max特征参数、L_min特征参数、r_max特征参数以及r_min特征参数)共50个树木相对聚类特征参数按类别分类，将每种类别中的10个树木相对聚类特征参数分别进行交叉组合，交叉组合后得到的特征参数的组合数量分别为1，2…，10；每种类别对应的所有组合方式作为SVM分类器的输入变量进行分类，获得每种类别对应的所有组合方式的分类精度，5种类别的不同组合方式对应的分类结果的箱形图如图7所示，图7中所有的横坐标表示特征参数的组合数量。

从图7中的(a)可以看出，基于V特征参数的分类性能首先得到了一定程度的改善，然后改善幅度逐渐趋于平稳，最终特征在组合数(组合方式内的参数个数)为3、8、9和10的条件下产生较高的分类精度。因此，为了减少运算，本实施例按照特征组合数为3抽取V₂、V₄和 V₈的组合方式作为V特征参数的最优特征参数。从图7中的(b)和图7中的(c)可以看出，基于 L_max特征参数和L_min特征参数的分类一开始都表现出了较高的性能，出现这一现象的主要原因是某一参数的显著性造成的。通过计算，发现在图7中的(b)中仅使用L_{max_2}参数就达到了 35.8％的分类精度，在图7中的(c)中仅使用L_{min_4}参数同样达到了单个特征参数分类的最高精度38.7％。因此，本实施例抽取单个特征参数L_{max_2}作为L_max特征参数的最优特征参数，抽取单个特征参数L_{min_4}作为L_min特征参数的最优特征参数。图7中的(d)显示，由于r_max特征参数的不同组合数量的平均分类精度均较低，普遍在10％到20％之间。因此，本实施例忽略r_max特征参数在树种分类中的影响。针对r_min特征参数的不同组合数量，本实施例选取2个特征参数组合数即达到较高分类精度36.7％，经过对比选取r_{min_2}和r_{min_8}的组合方式作为r_min特征参数的最优特征参数。

综上所述，{V₂、V₄、V₈、L_{max_2}、L_{min_4}、r_{min_2}、r_{min_8}}为基于树木相对聚类特征的最优特征参数组。表5列出了训练数据集基于树木相对聚类特征的最优特征参数组的交叉验证分类结果，由表5可以看出尽管五种树木的分类精度均为正值，但分类结果仍待改善。表5：

树种	水杉	棕榈	无患	橡胶	竹子	错判	漏判
								水杉	8	2	2	3	2	52.9％	50％
棕榈	3	8	2	3	3	57.9％	55.5％
								无患子	2	3	6	3	1	60％	57.2％
橡胶树	2	3	3	7	1	56.3％	58.8％
								竹子	1	2	1	1	7	41.7％	53.3％
分类正确	8	8	6	7	7
								训练样本	16	18	14	17	15
正确率	50％	44.5％	42.8％	41.2％	46.7％

表5为基于树木相对聚类特征{V₂、V₄、V₈、L_{max_2}、L_{min_4}、r_{min_2}、r_{min_8}}的交叉验证分类结果。

本实施例基于点云分布特征的树种分类分析如下：

将表3中的9个点云分布特征参数进行交叉组合，将得到的所有组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，不同组合方式的分类精度的结果的箱形图如图8所示。从图8中可以看出，分类的性能首先得到了一定程度的改善，然后改善情况逐渐趋于平稳，并且在组合数(组合方式内的参数个数)为3和9个特征参数的情况下产生较好的分类精度56.9％和57.7％。为了减少运算，选取最小组合数同时分类精度高的组合方式作为最优特征参数组，因此本实施例通过比对抽取点云高度峰值PH、树高的40％和60％之间的点云数量与整株树点云数量的比率

和树高的60％和80％之间的点云数量与整株树点云数量的比率

这三个特征参数的组合作为基于点云分布特征的最优特征参数组。表6列出了训练数据集基于点云分布特征的最优特征参数组的交叉验证分类结果，由于水杉高大且树冠分布连续、竹子矮小且树冠分布不均以及棕榈树高适中但树冠分布密集，从表6 可以看出在基于点云分布特征分类中对水杉、竹子和棕榈识别较为敏感。表6：

树种	水杉	棕榈	无患	橡胶	竹子	错判	漏判
								水杉	10	1	1	1	0	23.1％	37.5％
棕榈	1	11	1	2	1	31.3％	38.9％
								无患子	2	2	8	4	2	55.6％	42.9％
橡胶树	2	2	3	9	3	52.6％	47.1％
								竹子	1	2	1	1	9	35.7％	40％
分类正确	10	11	8	9	9
								训练样本	16	18	14	17	15
正确率	62.5％	61.1％	57.1％	52.9％	60％

表6为基于点云分布特征

的交叉验证分类结果。

本实施例基于树木表观特征的树种分类分析如下：

将表4中的9个树木表观特征参数进行交叉组合，将得到的组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，不同组合方式的分类结果的箱形图如图 9所示。在这里，选取分类精度高且组合数(组合方式内的参数个数)少的组合方式作为最优特征参数组，本实施例抽取树冠高度和等效冠直径的比率R_C/D、树冠椭球模型拟合参量η_Crown和中心垂直剖面内的网格参量QL这三个特征参数的组合确定为基于树木表观特征的最优特征参数组。其中，R_C/D和η_Crown对冠形敏感，QL可以反映枝叶密度是稠密或稀疏。表7 列出了训练数据集基于树木表观特征的最优特征参数组的交叉验证分类结果，由于水杉的树冠多为圆锥状，区别于其他树种的树冠形状，所以在本类特征分类中表现突出。而竹子的树冠和橡胶树的树冠相似度较高并且林木枝叶密集程度相仿，所以在此特征分类中这两种树木的区别较为模糊。表7：

表7为基于树木表观特征{R_C/D、η_Crown、Q_L}的交叉验证分类结果。

本实施例的步骤5中基于整合三种类别的最优特征参数组的树种分类分析如下：

将基于树木相对聚类特征的最优特征参数组、基于点云分布特征的最优特征参数组和基于树木表观特征的树木表观特征的最优特征参数组一共13个特征参数进行交叉组合，作为 SVM分类器的输入变量，分类结果的箱形图如图10所示。从图10中可以看出，随着组合最优特征参数的数量的增多，分类精度平均值呈现平缓的上升趋势，当组合三种类别的最优特征参数组内所有的特征参数时，分类精度平均值达到最大值82.5％。此外，与上述分别进行基于树木相对聚类特征的最优特征参数组的树种分类操作(参见表5)、基于点云分布特征的最优特征参数组的树种分类操作(参见表6)、基于树木表观特征的最优特征参数组的树种分类操作(参见表7)相比，基于整合三种类别的最优特征参数组的树种分类(参见表8)性能有一定程度的提高，但最终的分类精度尚未达到完全精确，因为其分类结果会受很多因素的影响，例如：树木空间竞争关系对树冠的影响、扫描时由于遮挡问题造成的数据缺失、同种树木的个体性差异以及树木生长环境的各异性等。为了提高树种分类结果的可靠性，这些因素都需考虑在内。表8列出了测试数据集基于整合三种类别的最优特征参数组的交叉验证分类结果，结果验证了整合三种类别的最优特征参数组可以实现较高性能的树种分类。表8：

树种	水杉	棕榈	无患	橡胶	竹子	错判	漏判
								水杉	29	2	0	0	0	6.7％	12.5％
棕榈	2	30	3	1	0	16.7％	16.7％
								无患子	0	2	23	2	2	21.4％	21.4％
橡胶树	1	2	2	27	2	20.6％	23.5％
								竹子	0	0	0	4	26	13.3％	13.4％
分类正确	29	30	23	27	26
								测试样本	32	36	28	34	30
正确率	90.6％	83.3％	82.1％	79.4％	86.6％

表8为：

的交叉验证分类结果。

因此本实施例最终采用将基于树木相对聚类特征的最优特征参数组、基于点云分布特征的最优特征参数组以及基于树木表观特征的最优特征参数组进行全部组合并作为变量输入到 SVM分类器中进行树种分类。

森林树种的正确识别是利用和保护森林资源的基础和依据，现阶段的树种分类结果尚未令人满意。为了解决现阶段的树种分类方法大多依赖于一些高成本、费时和费力的野外实体调查或精度不高的航片进行人工判读的技术问题，本实施例开发一个全面而有效的方法框架检验基于TLS的点云数据对树种分类的作用。通过地面激光扫描(terrestriallaser scanner 简称TLS)获取树木的光探测和测距(light detection and ranging简称LiDAR)数据为遥感数据源，面向基于TLS的点云数据选取五种树种(水杉、棕榈、无患子、橡胶树、竹子) 为研究对象，提出三类有效特征：树木相对聚类特征(反映树冠聚集离散结构和尺度)、点云分布特征(反映整株树的点云分布)和树木表观特征(反映树木结构的细化解释)，列举68 个特征参数供最优特征抽取。研究过程采用SVM分类器在交叉验证中对训练数据集检验计算确定最优特征参数组，最终抽取13个最优特征参数在测试数据集中进行树种分类的方法。计算得出：基于树木相对聚类特征的最优特征参数组进行树种分类的平均分类精度较低(45％)；基于点云分布特征的最优特征参数组进行树种分类的平均分类精度有所增长(58.8％)；基于树木表观特征的最优特征参数组进行树种分类的平均分类精度较高(63.8％)；基于整合三种类别的树木特征的13个最优特征参数进行树种分类的平均分类精度最高(82.5％)。实验结果表明该方法达到较高的树种分类精度，证明了采用SVM分类器进行交叉验证的方法具有较高的可行性，为获得更准确的森林树种分布提供了强有力的工具，对可持续森林管理和生态环境保护提供了有力的辅助手段。后续研究内容将侧重于大数据样本的建立、地基与机载激光全方位扫描以消除遮挡以及结合深度学习进一步优化树种分类方法，从而期望达到一个更优良的分类精度，为实际应用提供更坚实的理论基础。

本发明的保护范围包括但不限于以上实施方式，本发明的保护范围以权利要求书为准，任何对本技术做出的本领域的技术人员容易想到的替换、变形、改进均落入本发明的保护范围。

Claims

1.一种面向树木激光点云的有效特征抽取与树种识别方法，其特征在于，包括：

步骤1：获取目标树的全覆盖点云数据；

步骤5：将基于树木相对聚类特征的最优特征参数组、基于点云分布特征的最优特征参数组以及基于树木表观特征的最优特征参数组进行组合并作为变量输入到SVM分类器中进行树种分类；

所述的步骤3中的树木相对聚类特征表示目标树的点云的聚集离散结构，分析目标树的树木相对聚类特征的具体步骤为：

R_k的宽度为

其中3D坐标系下任意点云坐标为

j为目标树中的第j株树，i为第j株树内的第i个点云；

(c)通过公式(2)将特征值V_k作0到1之间的归一化处理：

(d)计算关于距离度量r的函数P_k(r)：

为指标函数，

代表任意两点

和

之间的距离，若

则

取值为1，否则为0；

求取P_k(r)函数的偏差：

(e)所述的树木相对聚类特征参数分为5种类别，分别为：V特征参数、L_max特征参数、L_min特征参数、r_max特征参数以及r_min特征参数，V特征参数包括V₁，V₂，…，V₁₀；L_max特征参数包括L_{max_1}，L_{max_2}，…，L_{max_10}；L_min特征参数包括L_{min_1}，L_{min_2}，…，L_{min_10}；r_max特征参数包括r_{max_1}，r_{max_2}，…，r_{max_10}；r_min特征参数包括r_{min_1}，r_{min_2}，…，r_{min_10}；因此所有类别的树木相对聚类特征参数的个数一共50个；

所述的步骤3中点云分布特征参数分别为点云高度均值、点云高度标准偏差、点云高度偏移量、点云高度峰值、树高的0％和20％之间的点云数量与整株树点云数量的比率、树高的20％和40％之间的点云数量与整株树点云数量的比率、树高的40％和60％之间的点云数量与整株树点云数量的比率、树高的60％和80％之间的点云数量与整株树点云数量的比率以及树高的80％和100％之间的点云数量与整株树点云数量的比率；

所述的步骤3中分析目标树的树木表观特征的具体步骤为：

2.根据权利要求1所述的面向树木激光点云的有效特征抽取与树种识别方法，其特征在于，所述的步骤1具体包括：将地面激光雷达放置在距离目标树3米的不同侧面并设置相同的扫描精度，扫描后，将不同角度得到的扫描结果整合到同一坐标系中，继而得到目标树的全覆盖点云数据。

3.根据权利要求1所述的面向树木激光点云的有效特征抽取与树种识别方法，其特征在于，所述的步骤2具体包括：采用TerraScan软件划分目标树的点云从而滤除点云噪声，去除异常点。

4.根据权利要求1所述的面向树木激光点云的有效特征抽取与树种识别方法，其特征在于，

所述的步骤4中的将所有树木相对聚类特征参数按类别分别进行交叉组合，所有组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于树木相对聚类特征的最优特征参数组的具体步骤为：

将50个树木相对聚类特征参数按步骤(e)中所述的5种类别进行分类，将每种类别中的10个树木相对聚类特征参数分别进行交叉组合，将每种类别对应的所有组合方式作为SVM分类器的输入变量进行分类，获得每种类别对应的所有组合方式的分类精度，根据分类精度和组合方式内的参数个数抽取V₂、V₄和V₈的组合方式作为V特征参数的最优特征参数，抽取单个特征参数L_{max_2}作为L_max特征参数的最优特征参数，抽取单个特征参数L_{min_4}作为L_min特征参数的最优特征参数，抽取r_{min_2}和r_{min_8}的组合方式作为r_min特征参数的最优特征参数；因此{V₂、V₄、V₈、L_{max_2}、L_{min_4}、r_{min_2}、r_{min_8}}为基于树木相对聚类特征的最优特征参数组。

5.根据权利要求1所述的面向树木激光点云的有效特征抽取与树种识别方法，其特征在于，

所述的步骤4中的将所有点云分布特征参数进行交叉组合，将得到的所有组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于点云分布特征的最优特征参数组的具体步骤为：

6.根据权利要求1所述的面向树木激光点云的有效特征抽取与树种识别方法，其特征在于，

所述的步骤4中的将所有树木表观特征参数进行交叉组合，将得到的组合方式作为SVM分类器的输入变量进行分类，获得所有组合方式的分类精度，根据分类精度抽取基于树木表观特征的最优特征参数组的具体步骤为：