CN109840542A

CN109840542A - 基于极化特征的自适应维度决策树分类方法

Info

Publication number: CN109840542A
Application number: CN201811489586.7A
Authority: CN
Inventors: 尹嫱; 程建达; 张帆; 洪文
Original assignee: Beijing University of Chemical Technology
Current assignee: Beijing University of Chemical Technology
Priority date: 2018-12-06
Filing date: 2018-12-06
Publication date: 2019-06-04
Anticipated expiration: 2038-12-06
Also published as: CN109840542B

Abstract

本发明公开了基于极化特征的自适应维度决策树分类方法，本发明在决策树分类器的基础上，使节点自适应的选择所需维度，节点的维度从一维开始，如果需要将扩展到二维甚至三维，不再是所有节点都使用统一维度的特征。灵活地选择节点维度，使易分类别节点仍保持低维度，避免节点选择无关冗余特征，在提高分类精度的同时，有效地缩减了计算复杂度。实验结果表明，基于极化特征的自适应维度决策树较一维节点的决策树平均分类精度提高了8.89％，相较于二维节点的决策树平均分类精度提高了1.65％的同时，避免了节点在特征上的无关冗余，计算所需时间同比三维决策树降低了27％左右。

Description

基于极化特征的自适应维度决策树分类方法

技术领域

本发明涉及一种基于极化特征的自适应维度决策树分类方法，属于极化合成孔径雷达图像处理领域。

背景技术

雷达成像技术是雷达技术发展史上一个伟大的里程碑，大体可以分为实孔径雷达和合成孔径雷达。传统的单极化的SAR图像，信息量少，极化特征单一，已难以满足高精度分类和识别的需要。极化合成孔径雷达(PolSAR)目的是在多个极化通道获取地物多个极化状态下的散射特性，POLSAR极大地丰富了SAR图像的信息量，扩宽了PolSAR的应用领域。

随着对雷达图像获取更精确目标需求的提升，出现了许多雷达图像的分类方法，大体可以分为提取极化特征和选用分类器。通过提取极化特征提高雷达图像分类精度，在不同地物之间的划分不具备普适性。目前行业中，普遍采用机器学习的方法对雷达图像进行分类，比如，支持向量机、BP神经网络、决策树等。机器学习的方法不仅提高了分类精度，而且节省了大量的人工计算，结果准确、应用便捷。

基于极化特征的决策树分类方法，一方面属于机器学习范畴，分类精度高；另一方面决策树节点使用了极化特征，分类结果反映了目标间散射机制的差异。传统的极化特征决策树，其节点采用单个特征，极少数采用了二维特征空间，随着节点特征空间维度的增加，更全面地描述了目标的散射机制，不同目标间的差异更加明显，目标分类精度更高，但计算复杂度也会随之提升。因此，提高分类精度的同时，降低计算复杂度成了一个亟需解决的问题。

由于目标之间散射机制差异的不同，分类的难易程度也不同，对于散射机制差异较大的两类目标，单个特征便可实现精确分类，反之，散射机制相似的两类目标则需要更高维度的特征空间。传统的决策树节点采用统一的特征维度，并不适用于每一个节点的分类，例如采用一维特征，则散射机制相似的目标无法分开，反之采用多维特征，则对散射机制差异较大的目标提供了多余的特征，增加了不必要的计算复杂度。因此，本发明提出了自适应维度的极化特征决策树，节点空间的维度从一维开始，如果有需要则增加至二维甚至三维特征。灵活地选择特征空间维度，更准确的反映了目标间散射机制的差异，同时避免计算无关特征带来的计算复杂度。

发明内容

本发明的主要目的在于提供了一种基于极化特征的自适应维度决策树分类方法，应用于PolSAR图像的分类。

通过提高决策树节点选用极化特征空间的维度，更全面地描述了目标的散射机制，不同目标间散射机制的差异也更加明显，目标分类精度更高。本发明在充分调研了国内外决策树分类方法，借鉴了二维极化特征决策树算法，提出了一种基于极化特征的自适应维度决策树分类方法，通过灵活选择特征空间维度，使易分目标保持低维度和低计算复杂度，对于难分以目标采取三维特征空间，对节点的特征空间采用了降低维度的处理，并采用J-M距离划分类别边界。实验结果表明，通过自适应选择决策树节点空间的维度，相比于传统的一维极化特征决策树，平均分类精度提高了8.89％，相比于二维极化特征决策树，平均分类精度提高了1.65％的同时，避免了节点在特征上的无关冗余。

本发明的技术方案具体来说，主要包括如下内容：

1、提取极化特征：对PolSAR图像进行窗口大小为7*7的Lee滤波处理，提取8个极化特征用于决策树分类。

2、建立决策树，构建自适应维度特征空间：本发明构造节点的自适应维度特征空间，节点特征空间的维度从一维开始，对训练样本进行划分，对划分结果计算混淆矩阵行列式作为“纯度”，设定纯度高值和纯度低值，来确定该处节点的最终维度。当纯度大于等于纯度高值时，判定该节点处为易分目标，确定该处节点特征空间的维度是一维；当纯度小于纯度高值且大于纯度低值时，此时一维特征空间满足不了分类要求，确定该处节点特征空间的维度是二维；当纯度小于等于纯度低值时，判定该节点处是难分的目标，确定该处节点特征空间维度是三维。决策树在分类时，采用Fisher线性判别式分析对特征空间进行降低维度的处理，采用Jeffries-Matusita(J-M)距离对训练样本分类。

3、对测试样本进行分类：通过建立好的决策树，对整体样本进行层级分类，计算分类结果的混淆矩阵，得到各地物的分类精度，以及整体样本分类的纯度。

本发明采用的技术方案为基于极化特征的自适应维度决策树分类方法，该方法的实施步骤如下：

步骤1、对PolSAR图像提取极化特征。

特征1：<|S_HH|²>——HH后向散射系数；

特征2：<|S_VV|²>——VV后向散射系数；

特征3：——HH-VV后向散射系数；

特征4：Span——极化散射总功率；

特征5：α——极化散射角；

特征6：H(1-A)——极化熵和各向异性组合；

特征7：P_V——Freeman-Durden分解的体散射功率；

特征8：CPR——圆极化比。

步骤2、训练决策树。

1)建立决策树模型。

2)构造自适应维度特征空间。节点不再使用单个特征进行划分，而是引入了特征空间，特征空间的维度自一维开始，对训练样本进行划分并计算混淆矩阵“纯度”，如果纯度超过设定的门限高值，则判断该节点处为易分地物，该处节点使用一维特征空间；如果纯度在门限高值与低值之间，则该处节点选用二维特征空间，并重新计算最优分支和所需特征；如果纯度低于门限低值，则判断该节点处为难分地物，该处节点选用三维特征空间，实现难分地物的分离。

3)使用Fisher线性判别式分析对特征空间降低维度。

4)使用J-M距离划分目标边界。

步骤3、测试样本分类：

对测试样本分类之前需要采用训练样本相同的数据预处理过程，需要注意的是：一维测试样本可以直接进行归一化处理，二维、三维测试样本需要先进行Fisher线性判别式分析投影到一维，再进行归一化处理。遵循决策树训练规则，调用各节点的最佳阈值，通过测试样本特征值与最佳阈值的比较，对测试样本进行完整地层次分类。

步骤4、计算分类结果的混淆矩阵

在测试样本的分类结果和标记样本中，统计分类结果中各类别的样本点数量以及标记样本中各类别的样本点数量，并计算混淆矩阵C。

由于各类别样本数量差距较大，采用总体分类精度衡量分类效果时，样本数量大的类别占比较大，因此本实验统一采用平均分类精度衡量分类效果。与一维极化特征决策树相比，本发明极大地提高了平均分类精度；与二维极化特征决策树相比，提高了难分目标分类精度的同时，避免了节点在无关特征上的冗余；与三维极化特征决策树相比，不仅实现了难分目标的分离，并且降低了27％的分类精度，同样避免了节点在无关特征上的冗余。

附图说明

图1构建自适应维度特征空间流程图。

图2自适应维度特征空间结构图。

图3基于极化特征的自适应维度决策树整体流程图。

图4 flevoland地区决策树层次分类结果图。

具体实施方式

步骤1、对PolSAR图像提取极化特征。

在全极化观测中，假定用于发送和接收的方式是线性水平和垂直极化，则极化后向散射矩阵[S]表示为：

其中S_HH、S_VV项包含了同极化通道回波功率，而S_HV、S_VH项则包含了交叉极化通道回波功率。S_HH表示水平发射水平接收的回波功率，S_HV表示水平发射垂直接收的回波功率，S_VH表示垂直发射水平接收的回波功率，S_VV表示垂直发射垂直接收的回波功率。如果发射天线和接收天线是能够交换的，及发射和接收时满足互易性，同时电磁波也在满足互异性的媒介中传递，则后向散射矩阵也应该满足互异性，即S_HV＝S_VH。

从观察到的散射过程中提取目标信息时，从[S]中导出极化协方差C₃矩阵。

其中<|S_HH|²>表示水平发射水平接收的功率，<|S_VV|²>表示垂直发射垂直接收的功率，<|S_HV|²>表示水平发射垂直接收的功率，表示S_HH和S_VV的共轭之间的时间或空间集合平均。选取C₃矩阵中的元素：作为三个特征。

选取总功率Span作为特征，Span由Hermitian矩阵C₃导出，是其对角线元素的和：

Span＝Tr{C₃}＝<|S_HH|²>+2<|S_HV|²>+<|S_VV|²> (3)

选取散射角α作为特征，α是用来分析目标的主要散射机制，同Span一样都是旋转不变的参数，散射角由极化相干T₃矩阵提取：

T₃(θ)＝R₃(θ)T₃R₃(θ)^-1 (4)

其中R₃(θ)是特殊酉旋转算子，R₃(θ)^-1表示R₃(θ)的逆。

对角θ求平均，则平均相干矩阵T3，并导出α：

其中，P(θ)是三个旋转不变伪概率P₁、P₂、P₃的集合。

该方法将散射角的大小和目标的散射行为直接联系起来，通过散射角估计目标的材料。例如：海洋地区的α普遍较低，表明海洋区域的主要的散射机制是单次散射，森林以及高大建筑物地区的α普遍较高，表明其主要散射机制是二面角散射。

散射机制从整体看来是无序的、不具有统计意义的，除了少数完全去相关或完全极化的情况，不同的散射很难统计成有序的整体，根据John von Neumann的论述，提出了极化熵H的概念，极化熵H的公式如下：

其中，P_i为对应特征值的伪概率，N为极化维度。

当极化熵的值较低，一般认为低于0.3时，目标的主要散射机制可以看成目标中某个有效点的散射机制；当极化熵的值较高时，散射目标不再是单一的有效点，而是多个有效点的集合，需要从特征值分布上考虑每个有效点的散射类型占整个集合中的比例。极化熵的值与能识别的散射机制数目成反比，即H值越大，PolSAR数据中能识别的散射机制的数量越少，当H＝1时，PolSAR数据中没有能够识别的散射机制，目标的散射行为变成了一个随机噪声的过程。同散射角α类似，海洋区域具有较低的H值，森林和高大建筑物地区具有较高的H值。

散射角和极化熵都是衡量随机散射问题的旋转不变参数，虽然都涉及到了特征值的比较，但是没能详细表示特征值的比值关系，因此提出了另一个旋转不变的参数——极化各向异性度A，将特征值按由大到小的顺序排列λ1>λ2>λ3>0，极化各向异性度A定义为：

选取极化熵H和极化各向异性度A的乘积组合H(1-A)作为特征。

Freeman-Durden分解是由极化协方差矩阵C₃的导出参数，是以物理实际为基础的非相干矩阵分解方法，基于3种模型进行极化分解，如来自裸露地表的面散射，来自森林冠层的体散射和来自和地物与地面共同作用的二次散射。

f_v是体散射分量的贡献，f_s是单次散射分量对|S_VV|²的贡献，f_s是二次散射分量对|S_VV|²的贡献。参数α、β以及f_s、f_d由实际雷达实测数据估计出来。

通过对散射分量的贡献的估计，得到总散射功率为：

Span＝<|S_HH|²>+2<|S_HV|²>+<|S_VV|²>＝P_S+P_D+P_V (9)

式中，P_S＝f_S(1+|β|²)；P_D＝f_D(1+|α|²)；P_V＝f_V。

Freeman-Durden模型方法同比于其他特征模型，由于该方法是基于雷达散射回波的物理模型，而不是仅使用数学推导，其物理意义明显，并且在大多数情况下是可以使用的。这个模型可以用来初步识别哪些散射机制成分可以支配目标极化数据的后向散射。通过极化分解得到的三个分量可以适用于分类识别植被、农作物、建筑物等不同类别的目标。选取分量P_V作为特征。

根据后向散射矩阵[S]，导出下面3个圆极化分量：

其中S_RR或S_LL分别表示右-右圆极化分量和左-左圆极化分量，S_RL表示右-左圆极化分量。

选取圆极化比(Circular Polarization Ratio，CPR)作为特征，CPR是S_RR或S_LL与S_RL的比值：

步骤2、训练决策树：

1)建立决策树模型。决策树模型是分类方法中较为简洁和可读性较高的一类分类方法，通过样本的层次分类，最终实现每个标记样本的精确分类。决策树由叶子和节点组成，每个叶子表示一个簇，每个节点代表一个特征空间，当簇中只有一类标记样本时，决策树停止分支。本方法对测试样本中每一类随机取5％的样本点作为训练样本输入决策树，输入步骤1中提取的8个极化特征对训练样本进行分类，寻找并建立最优分支顺序。

3)使用Fisher线性判别式分析对特征空间降低维度。Fisher线性判别式分析降低维度的基本方法就是获得一个最佳投影方向的矩阵。在多维数据样本中，Fisher投影降维的损失在空间维度小于样本类别数时，忽略不计。衡量分离效果需要同时考虑两个方面：一是类间离散度，表示不同类别的样本点之间的距离，二是类内离散度，表示相同类别的样本点之间的距离。Fisher线性判别式分析就是找到类内离散度较小同时类间离散度较大的投影方向，公式如下：

y＝ω^Tx (12)

其中ω^T为最佳投影方向。

然而，将多维空间投影到一维必然会造成数据的损失，使得原本在多维空间中分离较好的类别会在投影到一维空间后严重重叠，于是，Fisher提出了标准函数(Fisher比率)，其公式如下：

式中，m₁、m₂表示样本的均值，s₁、s₂表示样本的标准差。

4)使用J-M距离划分目标。不同目标间的分类，由于散射机制差异程度不同，采用一个或多个极化特征对其进行类别划分，因此特征选择上，可以是单个特征f_i(i＝1,2,3...)，也可以是多个特征组成的特征空间F＝{f₁,f₂,f₃...}。本发明对多维空间采用Fisher线性判别式分析降低至一维维度，进而采用J-M(Jeffries-Matusita)距离计算样本间的分离度，J-M距离的取值范围是[0,2]，0表示在某个特征的两个类别完全混淆，2表示在某个特征的两个类别完全分离。J-M距离公式如下：

J＝2(1-e^-B) (14)

其中B为巴氏距离：

其中m₁、m₂表示样本的均值，σ₁、σ₂表示样本的标准差。

当两个类别在某个特征上的J-M距离满足线性可分条件时，可以计算两个类别在此特征的阈值，根据高斯概率分布密度函数：

p(x)＝p(x|ω₁)p(ω₁)+p(x|ω₂)p(ω₂) (16)

其中ω₁、ω₂为两个类，p(ω₁)、p(ω₂)为先验概率，p(x|ω₁)、p(x|ω₂)为后验概率，当存在x₀，使得p(x₀|ω₁)＝p(x₀|ω₂)时，两个类别分离效果最好。因此，把x₀的值作为阈值，阈值T的计算公式如下：

其中，

J-M距离充分考虑了样本的类间距离和概率分布密度，是具有统计意义的分离度的计算方法。当J-M距离的值大于0.5时，可认为两个类别是可分的。本发明通过计算J-M距离，得到所有线性可分的可能，自动定位分离度最优的分支，确定此最优分支的特征空间。

步骤3、测试样本分类：

步骤4、计算分类结果的混淆矩阵

在测试样本的分类结果和标记样本中，统计分类结果中各类别的样本点数量以及标记样本中各类别的样本点数量，并计算得到混淆矩阵C：

混淆矩阵的行表示实际的类别，列表示划分的类别。因此，对角线元素(C₁₁、C₂₂…C_nm)行和列相等，表示正确分类的样本点数量，非对角线元素C_ij表示第i类地物的样本错分到第j类中的数目。混淆矩阵中每行总和为该类样本总数，对上述混淆矩阵按行的方向做归一化处理后，得到归一化后的混淆矩阵中的各个元素就表示了该分类结果在该实际类别中所占的比例。

通过计算的行列式度量分类效果——“纯度”，这种纯度的计算，不仅考虑了对角线元素分类的正确率，还考虑了非对角线元素分类的错误率，并且该计算方法与各类别的样本数量无关。

本发明使用flevoland地区全极化数据进行验证，并计算平均分类精度，分类纯度，代码运行时间。

1)从实验结果分析，自适应维度极化特征决策树的平均分类精度为94.22％相比一维极化特征决策树，平均分类精度提高了8.89％；相比于二维极化特征决策树，平均分类精度提高了1.65％，在易分地物的分离上，保持相同分类精度，重点提高了难分地物的分类精度。

2)从实验结果分析，自适应维度极化特征决策树的分类纯度为0.5088，二维极化特征决策树的分类纯度为0.4188，一维极化特征决策树的分类纯度仅为0.1428。自适应维度决策树相比二维决策树，同比提高了21.49％的纯度；相比一维决策树，同比提高了256.3％的纯度。可以得出，本发明提出的方法，在错分类别和错分数量上都有显著降低。

3)从节点特征空间的维度上分析，难分地物如茎豆、马铃薯、小麦、甜菜、豌豆，均自适应地选择了三维特征空间进行划分，均提高了1％～5％不等的分类精度。值得注意的是，本发明在裸地的划分中使用了一维特征空间，得到了99.19％的准确率，而二维极化特征决策树选用二维特征空间，只得到了98.97％的准确率，二维特征空间选择了一个无关特征，错误地划分了0.22％的样本，降低了分类的准确率。同时也说明，不同的分类节点，选用统一的维度是不科学的，特征空间的维度并非越高越好，灵活选用节点维度，才能实现更准确的分类。

4)本实验环境：mac OS操作系统、intel Core i5处理器、8G内存、Inter IrisGraphics 6100显卡。通过计算代码运行时间，得出一处节点采用一维特征空间的运行时间在3.5s左右；一处节点采用二维特征空间的分类时间是一维特征空间的40倍左右，在130s左右；一处节点采用三维特征空间的分类时间是二维特征空间的2倍左右，在260s左右。自适应维度极化特征决策树的运行时间相比与三维决策树，同比降低了27％左右。

Claims

1.基于极化特征的自适应维度决策树分类方法，其特征在于：该方法的实施步骤如下，

步骤1、对PolSAR图像提取极化特征；

特征1：<|S_HH|²>——HH后向散射系数；

特征2：<|S_VV|²>——VV后向散射系数；

特征3：——HH-VV后向散射系数；

特征4：Span——极化散射总功率；

特征5：α——极化散射角；

特征6：H(1-A)——极化熵和各向异性组合；

特征7：P_V——Freeman-Durden分解的体散射功率；

特征8：CPR——圆极化比；

步骤2、训练决策树；

1)建立决策树模型；

2)构造自适应维度特征空间；节点不再使用单个特征进行划分，而是引入了特征空间，特征空间的维度自一维开始，对训练样本进行划分并计算混淆矩阵“纯度”，如果纯度超过设定的门限高值，则判断该节点处为易分地物，该处节点使用一维特征空间；如果纯度在门限高值与低值之间，则该处节点选用二维特征空间，并重新计算最优分支和所需特征；如果纯度低于门限低值，则判断该节点处为难分地物，该处节点选用三维特征空间，实现难分地物的分离；

3)使用Fisher线性判别式分析对特征空间降低维度；

4)使用J-M距离划分目标边界；

步骤3、测试样本分类：

对测试样本分类之前需要采用训练样本相同的数据预处理过程，需要注意的是：一维测试样本可以直接进行归一化处理，二维、三维测试样本需要先进行Fisher线性判别式分析投影到一维，再进行归一化处理；遵循决策树训练规则，调用各节点的最佳阈值，通过测试样本特征值与最佳阈值的比较，对测试样本进行完整地层次分类；

步骤4、计算分类结果的混淆矩阵

2.根据权利要求1所述的基于极化特征的自适应维度决策树分类方法，其特征在于：步骤1、对PolSAR图像提取极化特征；

其中S_HH、S_VV项包含了同极化通道回波功率，而S_HV、S_VH项则包含了交叉极化通道回波功率；S_HH表示水平发射水平接收的回波功率，S_HV表示水平发射垂直接收的回波功率，S_VH表示垂直发射水平接收的回波功率，S_VV表示垂直发射垂直接收的回波功率；如果发射天线和接收天线是能够交换的，及发射和接收时满足互易性，同时电磁波也在满足互异性的媒介中传递，则后向散射矩阵也应该满足互异性，即S_HV＝S_VH；

从观察到的散射过程中提取目标信息时，从[S]中导出极化协方差C₃矩阵；

其中<|S_HH|²>表示水平发射水平接收的功率，<|S_VV|²>表示垂直发射垂直接收的功率，<|S_HV|²>表示水平发射垂直接收的功率，表示S_HH和S_VV的共轭之间的时间或空间集合平均；选取C₃矩阵中的元素：<|S_HH|²>、<|S_VV|²>、作为三个特征；

Span＝Tr{C₃}＝<|S_HH|²>+2<|S_HV|²>+<|S_VV|²> (3)

T₃(θ)＝R₃(θ)T₃R₃(θ)^-1 (4)

其中R₃(θ)是特殊酉旋转算子，R₃(θ)^-1表示R₃(θ)的逆；

对角θ求平均，则平均相干矩阵T3，并导出α：

其中，P(θ)是三个旋转不变伪概率P₁、P₂、P₃的集合；

该方法将散射角的大小和目标的散射行为直接联系起来，通过散射角估计目标的材料；提出极化熵H的概念，极化熵H的公式如下：

其中，P_i为对应特征值的伪概率，N为极化维度；

当极化熵的值低，认为低于0.3时，目标的散射机制看成目标中某个有效点的散射机制；当极化熵的值较高时，散射目标不再是单一的有效点，而是多个有效点的集合，需要从特征值分布上考虑每个有效点的散射类型占整个集合中的比例；极化熵的值与能识别的散射机制数目成反比，即H值越大，PolSAR数据中能识别的散射机制的数量越少，当H＝1时，PolSAR数据中没有能够识别的散射机制，目标的散射行为变成了一个随机噪声的过程；同散射角α类似，海洋区域具有较低的H值，森林和高大建筑物地区具有较高的H值；

选取极化熵H和极化各向异性度A的乘积组合H(1-A)作为特征；

Freeman-Durden分解是由极化协方差矩阵C₃的导出参数，是以物理实际为基础的非相干矩阵分解方法，基于3种模型进行极化分解，如来自裸露地表的面散射，来自森林冠层的体散射和来自和地物与地面共同作用的二次散射；

f_v是体散射分量的贡献，f_s是单次散射分量对|S_VV|²的贡献，f_s是二次散射分量对|S_VV|²的贡献；参数α、β以及f_s、f_d由实际雷达实测数据估计出来；

通过对散射分量的贡献的估计，得到总散射功率为：

Span＝<|S_HH|²>+2<|S_HV|²>+<|S_VV|²>＝P_S+P_D+P_V (9)

式中，P_S＝f_S(1+|β|²)；P_D＝f_D(1+|α|²)；P_V＝f_V；

Freeman-Durden模型方法同比于其他特征模型，由于该方法是基于雷达散射回波的物理模型，而不是仅使用数学推导，其物理意义明显，并且在大多数情况下是可以使用的；这个模型可以用来初步识别哪些散射机制成分可以支配目标极化数据的后向散射；通过极化分解得到的三个分量可以适用于分类识别植被、农作物、建筑物不同类别的目标；选取分量P_V作为特征；

根据后向散射矩阵[S]，导出下面3个圆极化分量：

其中S_RR或S_LL分别表示右-右圆极化分量和左-左圆极化分量，S_RL表示右-左圆极化分量；

选取圆极化比CPR作为特征，CPR是S_RR或S_LL与S_RL的比值：

3.根据权利要求1所述的基于极化特征的自适应维度决策树分类方法，其特征在于：步骤2、训练决策树：

1)建立决策树模型；决策树模型是分类方法中较为简洁和可读性较高的一类分类方法，通过样本的层次分类，最终实现每个标记样本的精确分类；决策树由叶子和节点组成，每个叶子表示一个簇，每个节点代表一个特征空间，当簇中只有一类标记样本时，决策树停止分支；本方法对测试样本中每一类随机取5％的样本点作为训练样本输入决策树，输入步骤1中提取的8个极化特征对训练样本进行分类，寻找并建立最优分支顺序；

3)使用Fisher线性判别式分析对特征空间降低维度；Fisher线性判别式分析就是找到类内离散度较小同时类间离散度较大的投影方向，公式如下：

y＝ω^Tx (12)

其中ω^T为最佳投影方向；

然而，将多维空间投影到一维必然会造成数据的损失，使得原本在多维空间中分离较好的类别会在投影到一维空间后严重重叠，于是，Fisher提出了标准函数，其公式如下：

式中，m₁、m₂表示样本的均值，s₁、s₂表示样本的标准差；

4)使用J-M距离划分目标；不同目标间的分类，由于散射机制差异程度不同，采用一个或多个极化特征对其进行类别划分，因此特征选择上，可以是单个特征f_i，i＝1,2,3...，也是多个特征组成的特征空间F＝{f₁,f₂,f₃...}；本发明对多维空间采用Fisher线性判别式分析降低至一维维度，进而采用J-M距离计算样本间的分离度，J-M距离的取值范围是[0,2]，0表示在某个特征的两个类别完全混淆，2表示在某个特征的两个类别完全分离；J-M距离公式如下：

J＝2(1-e^-B) (14)

其中B为巴氏距离：

其中m₁、m₂表示样本的均值，σ₁、σ₂表示样本的标准差；

当两个类别在某个特征上的J-M距离满足线性分条件时，计算两个类别在此特征的阈值，根据高斯概率分布密度函数：

p(x)＝p(x|ω₁)p(ω₁)+p(x|ω₂)p(ω₂) (16)

其中ω₁、ω₂为两个类，p(ω₁)、p(ω₂)为先验概率，p(x|ω₁)、p(x|ω₂)为后验概率，当存在x₀，使得p(x₀|ω₁)＝p(x₀|ω₂)时，两个类别分离效果最好；因此，把x₀的值作为阈值，阈值T的计算公式如下：

其中，

J-M距离充分考虑了样本的类间距离和概率分布密度，是具有统计意义的分离度的计算方法；当J-M距离的值大于0.5时，认为两个类别是可分的；本发明通过计算J-M距离，得到所有线性可分的可能，自动定位分离度最优的分支，确定此最优分支的特征空间。

4.根据权利要求1所述的基于极化特征的自适应维度决策树分类方法，其特征在于：步骤3、测试样本分类：

对测试样本分类之前需要采用训练样本相同的数据预处理过程，需要注意的是：一维测试样本可以直接进行归一化处理，二维、三维测试样本需要先进行Fisher线性判别式分析投影到一维，再进行归一化处理；遵循决策树训练规则，调用各节点的最佳阈值，通过测试样本特征值与最佳阈值的比较，对测试样本进行完整地层次分类。

5.根据权利要求1所述的基于极化特征的自适应维度决策树分类方法，其特征在于：步骤4、计算分类结果的混淆矩阵

混淆矩阵的行表示实际的类别，列表示划分的类别；因此，对角线元素(C₁₁、C₂₂…C_nm)行和列相等，表示正确分类的样本点数量，非对角线元素C_ij表示第i类地物的样本错分到第j类中的数目；混淆矩阵中每行总和为该类样本总数，对上述混淆矩阵按行的方向做归一化处理后，得到归一化后的混淆矩阵中的各个元素就表示了该分类结果在该实际类别中所占的比例；