CN109840542A - 基于极化特征的自适应维度决策树分类方法 - Google Patents
基于极化特征的自适应维度决策树分类方法 Download PDFInfo
- Publication number
- CN109840542A CN109840542A CN201811489586.7A CN201811489586A CN109840542A CN 109840542 A CN109840542 A CN 109840542A CN 201811489586 A CN201811489586 A CN 201811489586A CN 109840542 A CN109840542 A CN 109840542A
- Authority
- CN
- China
- Prior art keywords
- polarization
- feature
- node
- scattering
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010287 polarization Effects 0.000 title claims abstract description 97
- 238000003066 decision tree Methods 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims description 42
- 238000012360 testing method Methods 0.000 claims description 31
- 230000007246 mechanism Effects 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 22
- 238000004458 analytical method Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000000926 separation method Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 11
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 8
- 239000006185 dispersion Substances 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000009795 derivation Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 230000005571 horizontal transmission Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000005570 vertical transmission Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 125000000914 phenoxymethylpenicillanyl group Chemical group CC1(S[C@H]2N([C@H]1C(=O)*)C([C@H]2NC(COC2=CC=CC=C2)=O)=O)C 0.000 claims description 2
- 238000005388 cross polarization Methods 0.000 claims 1
- 239000000463 material Substances 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 claims 1
- 238000010801 machine learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Radar Systems Or Details Thereof (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于极化特征的自适应维度决策树分类方法,本发明在决策树分类器的基础上,使节点自适应的选择所需维度,节点的维度从一维开始,如果需要将扩展到二维甚至三维,不再是所有节点都使用统一维度的特征。灵活地选择节点维度,使易分类别节点仍保持低维度,避免节点选择无关冗余特征,在提高分类精度的同时,有效地缩减了计算复杂度。实验结果表明,基于极化特征的自适应维度决策树较一维节点的决策树平均分类精度提高了8.89%,相较于二维节点的决策树平均分类精度提高了1.65%的同时,避免了节点在特征上的无关冗余,计算所需时间同比三维决策树降低了27%左右。
Description
技术领域
本发明涉及一种基于极化特征的自适应维度决策树分类方法,属于极化合成孔径雷达图像处理领域。
背景技术
雷达成像技术是雷达技术发展史上一个伟大的里程碑,大体可以分为实孔径雷达和合成孔径雷达。传统的单极化的SAR图像,信息量少,极化特征单一,已难以满足高精度分类和识别的需要。极化合成孔径雷达(PolSAR)目的是在多个极化通道获取地物多个极化状态下的散射特性,POLSAR极大地丰富了SAR图像的信息量,扩宽了PolSAR的应用领域。
随着对雷达图像获取更精确目标需求的提升,出现了许多雷达图像的分类方法,大体可以分为提取极化特征和选用分类器。通过提取极化特征提高雷达图像分类精度,在不同地物之间的划分不具备普适性。目前行业中,普遍采用机器学习的方法对雷达图像进行分类,比如,支持向量机、BP神经网络、决策树等。机器学习的方法不仅提高了分类精度,而且节省了大量的人工计算,结果准确、应用便捷。
基于极化特征的决策树分类方法,一方面属于机器学习范畴,分类精度高;另一方面决策树节点使用了极化特征,分类结果反映了目标间散射机制的差异。传统的极化特征决策树,其节点采用单个特征,极少数采用了二维特征空间,随着节点特征空间维度的增加,更全面地描述了目标的散射机制,不同目标间的差异更加明显,目标分类精度更高,但计算复杂度也会随之提升。因此,提高分类精度的同时,降低计算复杂度成了一个亟需解决的问题。
由于目标之间散射机制差异的不同,分类的难易程度也不同,对于散射机制差异较大的两类目标,单个特征便可实现精确分类,反之,散射机制相似的两类目标则需要更高维度的特征空间。传统的决策树节点采用统一的特征维度,并不适用于每一个节点的分类,例如采用一维特征,则散射机制相似的目标无法分开,反之采用多维特征,则对散射机制差异较大的目标提供了多余的特征,增加了不必要的计算复杂度。因此,本发明提出了自适应维度的极化特征决策树,节点空间的维度从一维开始,如果有需要则增加至二维甚至三维特征。灵活地选择特征空间维度,更准确的反映了目标间散射机制的差异,同时避免计算无关特征带来的计算复杂度。
发明内容
本发明的主要目的在于提供了一种基于极化特征的自适应维度决策树分类方法,应用于PolSAR图像的分类。
通过提高决策树节点选用极化特征空间的维度,更全面地描述了目标的散射机制,不同目标间散射机制的差异也更加明显,目标分类精度更高。本发明在充分调研了国内外决策树分类方法,借鉴了二维极化特征决策树算法,提出了一种基于极化特征的自适应维度决策树分类方法,通过灵活选择特征空间维度,使易分目标保持低维度和低计算复杂度,对于难分以目标采取三维特征空间,对节点的特征空间采用了降低维度的处理,并采用J-M距离划分类别边界。实验结果表明,通过自适应选择决策树节点空间的维度,相比于传统的一维极化特征决策树,平均分类精度提高了8.89%,相比于二维极化特征决策树,平均分类精度提高了1.65%的同时,避免了节点在特征上的无关冗余。
本发明的技术方案具体来说,主要包括如下内容:
1、提取极化特征:对PolSAR图像进行窗口大小为7*7的Lee滤波处理,提取8个极化特征用于决策树分类。
2、建立决策树,构建自适应维度特征空间:本发明构造节点的自适应维度特征空间,节点特征空间的维度从一维开始,对训练样本进行划分,对划分结果计算混淆矩阵行列式作为“纯度”,设定纯度高值和纯度低值,来确定该处节点的最终维度。当纯度大于等于纯度高值时,判定该节点处为易分目标,确定该处节点特征空间的维度是一维;当纯度小于纯度高值且大于纯度低值时,此时一维特征空间满足不了分类要求,确定该处节点特征空间的维度是二维;当纯度小于等于纯度低值时,判定该节点处是难分的目标,确定该处节点特征空间维度是三维。决策树在分类时,采用Fisher线性判别式分析对特征空间进行降低维度的处理,采用Jeffries-Matusita(J-M)距离对训练样本分类。
3、对测试样本进行分类:通过建立好的决策树,对整体样本进行层级分类,计算分类结果的混淆矩阵,得到各地物的分类精度,以及整体样本分类的纯度。
本发明采用的技术方案为基于极化特征的自适应维度决策树分类方法,该方法的实施步骤如下:
步骤1、对PolSAR图像提取极化特征。
特征1:<|SHH|2>——HH后向散射系数;
特征2:<|SVV|2>——VV后向散射系数;
特征3:——HH-VV后向散射系数;
特征4:Span——极化散射总功率;
特征5:α——极化散射角;
特征6:H(1-A)——极化熵和各向异性组合;
特征7:PV——Freeman-Durden分解的体散射功率;
特征8:CPR——圆极化比。
步骤2、训练决策树。
1)建立决策树模型。
2)构造自适应维度特征空间。节点不再使用单个特征进行划分,而是引入了特征空间,特征空间的维度自一维开始,对训练样本进行划分并计算混淆矩阵“纯度”,如果纯度超过设定的门限高值,则判断该节点处为易分地物,该处节点使用一维特征空间;如果纯度在门限高值与低值之间,则该处节点选用二维特征空间,并重新计算最优分支和所需特征;如果纯度低于门限低值,则判断该节点处为难分地物,该处节点选用三维特征空间,实现难分地物的分离。
3)使用Fisher线性判别式分析对特征空间降低维度。
4)使用J-M距离划分目标边界。
步骤3、测试样本分类:
对测试样本分类之前需要采用训练样本相同的数据预处理过程,需要注意的是:一维测试样本可以直接进行归一化处理,二维、三维测试样本需要先进行Fisher线性判别式分析投影到一维,再进行归一化处理。遵循决策树训练规则,调用各节点的最佳阈值,通过测试样本特征值与最佳阈值的比较,对测试样本进行完整地层次分类。
步骤4、计算分类结果的混淆矩阵
在测试样本的分类结果和标记样本中,统计分类结果中各类别的样本点数量以及标记样本中各类别的样本点数量,并计算混淆矩阵C。
由于各类别样本数量差距较大,采用总体分类精度衡量分类效果时,样本数量大的类别占比较大,因此本实验统一采用平均分类精度衡量分类效果。与一维极化特征决策树相比,本发明极大地提高了平均分类精度;与二维极化特征决策树相比,提高了难分目标分类精度的同时,避免了节点在无关特征上的冗余;与三维极化特征决策树相比,不仅实现了难分目标的分离,并且降低了27%的分类精度,同样避免了节点在无关特征上的冗余。
附图说明
图1构建自适应维度特征空间流程图。
图2自适应维度特征空间结构图。
图3基于极化特征的自适应维度决策树整体流程图。
图4 flevoland地区决策树层次分类结果图。
具体实施方式
步骤1、对PolSAR图像提取极化特征。
在全极化观测中,假定用于发送和接收的方式是线性水平和垂直极化,则极化后向散射矩阵[S]表示为:
其中SHH、SVV项包含了同极化通道回波功率,而SHV、SVH项则包含了交叉极化通道回波功率。SHH表示水平发射水平接收的回波功率,SHV表示水平发射垂直接收的回波功率,SVH表示垂直发射水平接收的回波功率,SVV表示垂直发射垂直接收的回波功率。如果发射天线和接收天线是能够交换的,及发射和接收时满足互易性,同时电磁波也在满足互异性的媒介中传递,则后向散射矩阵也应该满足互异性,即SHV=SVH。
从观察到的散射过程中提取目标信息时,从[S]中导出极化协方差C3矩阵。
其中<|SHH|2>表示水平发射水平接收的功率,<|SVV|2>表示垂直发射垂直接收的功率,<|SHV|2>表示水平发射垂直接收的功率,表示SHH和SVV的共轭之间的时间或空间集合平均。选取C3矩阵中的元素: 作为三个特征。
选取总功率Span作为特征,Span由Hermitian矩阵C3导出,是其对角线元素的和:
Span=Tr{C3}=<|SHH|2>+2<|SHV|2>+<|SVV|2> (3)
选取散射角α作为特征,α是用来分析目标的主要散射机制,同Span一样都是旋转不变的参数,散射角由极化相干T3矩阵提取:
T3(θ)=R3(θ)T3R3(θ)-1 (4)
其中R3(θ)是特殊酉旋转算子,R3(θ)-1表示R3(θ)的逆。
对角θ求平均,则平均相干矩阵T3,并导出α:
其中,P(θ)是三个旋转不变伪概率P1、P2、P3的集合。
该方法将散射角的大小和目标的散射行为直接联系起来,通过散射角估计目标的材料。例如:海洋地区的α普遍较低,表明海洋区域的主要的散射机制是单次散射,森林以及高大建筑物地区的α普遍较高,表明其主要散射机制是二面角散射。
散射机制从整体看来是无序的、不具有统计意义的,除了少数完全去相关或完全极化的情况,不同的散射很难统计成有序的整体,根据John von Neumann的论述,提出了极化熵H的概念,极化熵H的公式如下:
其中,Pi为对应特征值的伪概率,N为极化维度。
当极化熵的值较低,一般认为低于0.3时,目标的主要散射机制可以看成目标中某个有效点的散射机制;当极化熵的值较高时,散射目标不再是单一的有效点,而是多个有效点的集合,需要从特征值分布上考虑每个有效点的散射类型占整个集合中的比例。极化熵的值与能识别的散射机制数目成反比,即H值越大,PolSAR数据中能识别的散射机制的数量越少,当H=1时,PolSAR数据中没有能够识别的散射机制,目标的散射行为变成了一个随机噪声的过程。同散射角α类似,海洋区域具有较低的H值,森林和高大建筑物地区具有较高的H值。
散射角和极化熵都是衡量随机散射问题的旋转不变参数,虽然都涉及到了特征值的比较,但是没能详细表示特征值的比值关系,因此提出了另一个旋转不变的参数——极化各向异性度A,将特征值按由大到小的顺序排列λ1>λ2>λ3>0,极化各向异性度A定义为:
选取极化熵H和极化各向异性度A的乘积组合H(1-A)作为特征。
Freeman-Durden分解是由极化协方差矩阵C3的导出参数,是以物理实际为基础的非相干矩阵分解方法,基于3种模型进行极化分解,如来自裸露地表的面散射,来自森林冠层的体散射和来自和地物与地面共同作用的二次散射。
fv是体散射分量的贡献,fs是单次散射分量对|SVV|2的贡献,fs是二次散射分量对|SVV|2的贡献。参数α、β以及fs、fd由实际雷达实测数据估计出来。
通过对散射分量的贡献的估计,得到总散射功率为:
Span=<|SHH|2>+2<|SHV|2>+<|SVV|2>=PS+PD+PV (9)
式中,PS=fS(1+|β|2);PD=fD(1+|α|2);PV=fV。
Freeman-Durden模型方法同比于其他特征模型,由于该方法是基于雷达散射回波的物理模型,而不是仅使用数学推导,其物理意义明显,并且在大多数情况下是可以使用的。这个模型可以用来初步识别哪些散射机制成分可以支配目标极化数据的后向散射。通过极化分解得到的三个分量可以适用于分类识别植被、农作物、建筑物等不同类别的目标。选取分量PV作为特征。
根据后向散射矩阵[S],导出下面3个圆极化分量:
其中SRR或SLL分别表示右-右圆极化分量和左-左圆极化分量,SRL表示右-左圆极化分量。
选取圆极化比(Circular Polarization Ratio,CPR)作为特征,CPR是SRR或SLL与SRL的比值:
步骤2、训练决策树:
1)建立决策树模型。决策树模型是分类方法中较为简洁和可读性较高的一类分类方法,通过样本的层次分类,最终实现每个标记样本的精确分类。决策树由叶子和节点组成,每个叶子表示一个簇,每个节点代表一个特征空间,当簇中只有一类标记样本时,决策树停止分支。本方法对测试样本中每一类随机取5%的样本点作为训练样本输入决策树,输入步骤1中提取的8个极化特征对训练样本进行分类,寻找并建立最优分支顺序。
2)构造自适应维度特征空间。节点不再使用单个特征进行划分,而是引入了特征空间,特征空间的维度自一维开始,对训练样本进行划分并计算混淆矩阵“纯度”,如果纯度超过设定的门限高值,则判断该节点处为易分地物,该处节点使用一维特征空间;如果纯度在门限高值与低值之间,则该处节点选用二维特征空间,并重新计算最优分支和所需特征;如果纯度低于门限低值,则判断该节点处为难分地物,该处节点选用三维特征空间,实现难分地物的分离。
3)使用Fisher线性判别式分析对特征空间降低维度。Fisher线性判别式分析降低维度的基本方法就是获得一个最佳投影方向的矩阵。在多维数据样本中,Fisher投影降维的损失在空间维度小于样本类别数时,忽略不计。衡量分离效果需要同时考虑两个方面:一是类间离散度,表示不同类别的样本点之间的距离,二是类内离散度,表示相同类别的样本点之间的距离。Fisher线性判别式分析就是找到类内离散度较小同时类间离散度较大的投影方向,公式如下:
y=ωTx (12)
其中ωT为最佳投影方向。
然而,将多维空间投影到一维必然会造成数据的损失,使得原本在多维空间中分离较好的类别会在投影到一维空间后严重重叠,于是,Fisher提出了标准函数(Fisher比率),其公式如下:
式中,m1、m2表示样本的均值,s1、s2表示样本的标准差。
4)使用J-M距离划分目标。不同目标间的分类,由于散射机制差异程度不同,采用一个或多个极化特征对其进行类别划分,因此特征选择上,可以是单个特征fi(i=1,2,3...),也可以是多个特征组成的特征空间F={f1,f2,f3...}。本发明对多维空间采用Fisher线性判别式分析降低至一维维度,进而采用J-M(Jeffries-Matusita)距离计算样本间的分离度,J-M距离的取值范围是[0,2],0表示在某个特征的两个类别完全混淆,2表示在某个特征的两个类别完全分离。J-M距离公式如下:
J=2(1-e-B) (14)
其中B为巴氏距离:
其中m1、m2表示样本的均值,σ1、σ2表示样本的标准差。
当两个类别在某个特征上的J-M距离满足线性可分条件时,可以计算两个类别在此特征的阈值,根据高斯概率分布密度函数:
p(x)=p(x|ω1)p(ω1)+p(x|ω2)p(ω2) (16)
其中ω1、ω2为两个类,p(ω1)、p(ω2)为先验概率,p(x|ω1)、p(x|ω2)为后验概率,当存在x0,使得p(x0|ω1)=p(x0|ω2)时,两个类别分离效果最好。因此,把x0的值作为阈值,阈值T的计算公式如下:
其中,
J-M距离充分考虑了样本的类间距离和概率分布密度,是具有统计意义的分离度的计算方法。当J-M距离的值大于0.5时,可认为两个类别是可分的。本发明通过计算J-M距离,得到所有线性可分的可能,自动定位分离度最优的分支,确定此最优分支的特征空间。
步骤3、测试样本分类:
对测试样本分类之前需要采用训练样本相同的数据预处理过程,需要注意的是:一维测试样本可以直接进行归一化处理,二维、三维测试样本需要先进行Fisher线性判别式分析投影到一维,再进行归一化处理。遵循决策树训练规则,调用各节点的最佳阈值,通过测试样本特征值与最佳阈值的比较,对测试样本进行完整地层次分类。
步骤4、计算分类结果的混淆矩阵
在测试样本的分类结果和标记样本中,统计分类结果中各类别的样本点数量以及标记样本中各类别的样本点数量,并计算得到混淆矩阵C:
混淆矩阵的行表示实际的类别,列表示划分的类别。因此,对角线元素(C11、C22…Cnm)行和列相等,表示正确分类的样本点数量,非对角线元素Cij表示第i类地物的样本错分到第j类中的数目。混淆矩阵中每行总和为该类样本总数,对上述混淆矩阵按行的方向做归一化处理后,得到归一化后的混淆矩阵中的各个元素就表示了该分类结果在该实际类别中所占的比例。
通过计算的行列式度量分类效果——“纯度”,这种纯度的计算,不仅考虑了对角线元素分类的正确率,还考虑了非对角线元素分类的错误率,并且该计算方法与各类别的样本数量无关。
本发明使用flevoland地区全极化数据进行验证,并计算平均分类精度,分类纯度,代码运行时间。
1)从实验结果分析,自适应维度极化特征决策树的平均分类精度为94.22%相比一维极化特征决策树,平均分类精度提高了8.89%;相比于二维极化特征决策树,平均分类精度提高了1.65%,在易分地物的分离上,保持相同分类精度,重点提高了难分地物的分类精度。
2)从实验结果分析,自适应维度极化特征决策树的分类纯度为0.5088,二维极化特征决策树的分类纯度为0.4188,一维极化特征决策树的分类纯度仅为0.1428。自适应维度决策树相比二维决策树,同比提高了21.49%的纯度;相比一维决策树,同比提高了256.3%的纯度。可以得出,本发明提出的方法,在错分类别和错分数量上都有显著降低。
3)从节点特征空间的维度上分析,难分地物如茎豆、马铃薯、小麦、甜菜、豌豆,均自适应地选择了三维特征空间进行划分,均提高了1%~5%不等的分类精度。值得注意的是,本发明在裸地的划分中使用了一维特征空间,得到了99.19%的准确率,而二维极化特征决策树选用二维特征空间,只得到了98.97%的准确率,二维特征空间选择了一个无关特征,错误地划分了0.22%的样本,降低了分类的准确率。同时也说明,不同的分类节点,选用统一的维度是不科学的,特征空间的维度并非越高越好,灵活选用节点维度,才能实现更准确的分类。
4)本实验环境:mac OS操作系统、intel Core i5处理器、8G内存、Inter IrisGraphics 6100显卡。通过计算代码运行时间,得出一处节点采用一维特征空间的运行时间在3.5s左右;一处节点采用二维特征空间的分类时间是一维特征空间的40倍左右,在130s左右;一处节点采用三维特征空间的分类时间是二维特征空间的2倍左右,在260s左右。自适应维度极化特征决策树的运行时间相比与三维决策树,同比降低了27%左右。
Claims (5)
1.基于极化特征的自适应维度决策树分类方法,其特征在于:该方法的实施步骤如下,
步骤1、对PolSAR图像提取极化特征;
特征1:<|SHH|2>——HH后向散射系数;
特征2:<|SVV|2>——VV后向散射系数;
特征3:——HH-VV后向散射系数;
特征4:Span——极化散射总功率;
特征5:α——极化散射角;
特征6:H(1-A)——极化熵和各向异性组合;
特征7:PV——Freeman-Durden分解的体散射功率;
特征8:CPR——圆极化比;
步骤2、训练决策树;
1)建立决策树模型;
2)构造自适应维度特征空间;节点不再使用单个特征进行划分,而是引入了特征空间,特征空间的维度自一维开始,对训练样本进行划分并计算混淆矩阵“纯度”,如果纯度超过设定的门限高值,则判断该节点处为易分地物,该处节点使用一维特征空间;如果纯度在门限高值与低值之间,则该处节点选用二维特征空间,并重新计算最优分支和所需特征;如果纯度低于门限低值,则判断该节点处为难分地物,该处节点选用三维特征空间,实现难分地物的分离;
3)使用Fisher线性判别式分析对特征空间降低维度;
4)使用J-M距离划分目标边界;
步骤3、测试样本分类:
对测试样本分类之前需要采用训练样本相同的数据预处理过程,需要注意的是:一维测试样本可以直接进行归一化处理,二维、三维测试样本需要先进行Fisher线性判别式分析投影到一维,再进行归一化处理;遵循决策树训练规则,调用各节点的最佳阈值,通过测试样本特征值与最佳阈值的比较,对测试样本进行完整地层次分类;
步骤4、计算分类结果的混淆矩阵
在测试样本的分类结果和标记样本中,统计分类结果中各类别的样本点数量以及标记样本中各类别的样本点数量,并计算混淆矩阵C。
2.根据权利要求1所述的基于极化特征的自适应维度决策树分类方法,其特征在于:步骤1、对PolSAR图像提取极化特征;
在全极化观测中,假定用于发送和接收的方式是线性水平和垂直极化,则极化后向散射矩阵[S]表示为:
其中SHH、SVV项包含了同极化通道回波功率,而SHV、SVH项则包含了交叉极化通道回波功率;SHH表示水平发射水平接收的回波功率,SHV表示水平发射垂直接收的回波功率,SVH表示垂直发射水平接收的回波功率,SVV表示垂直发射垂直接收的回波功率;如果发射天线和接收天线是能够交换的,及发射和接收时满足互易性,同时电磁波也在满足互异性的媒介中传递,则后向散射矩阵也应该满足互异性,即SHV=SVH;
从观察到的散射过程中提取目标信息时,从[S]中导出极化协方差C3矩阵;
其中<|SHH|2>表示水平发射水平接收的功率,<|SVV|2>表示垂直发射垂直接收的功率,<|SHV|2>表示水平发射垂直接收的功率,表示SHH和SVV的共轭之间的时间或空间集合平均;选取C3矩阵中的元素:<|SHH|2>、<|SVV|2>、作为三个特征;
选取总功率Span作为特征,Span由Hermitian矩阵C3导出,是其对角线元素的和:
Span=Tr{C3}=<|SHH|2>+2<|SHV|2>+<|SVV|2> (3)
选取散射角α作为特征,α是用来分析目标的主要散射机制,同Span一样都是旋转不变的参数,散射角由极化相干T3矩阵提取:
T3(θ)=R3(θ)T3R3(θ)-1 (4)
其中R3(θ)是特殊酉旋转算子,R3(θ)-1表示R3(θ)的逆;
对角θ求平均,则平均相干矩阵T3,并导出α:
其中,P(θ)是三个旋转不变伪概率P1、P2、P3的集合;
该方法将散射角的大小和目标的散射行为直接联系起来,通过散射角估计目标的材料;提出极化熵H的概念,极化熵H的公式如下:
其中,Pi为对应特征值的伪概率,N为极化维度;
当极化熵的值低,认为低于0.3时,目标的散射机制看成目标中某个有效点的散射机制;当极化熵的值较高时,散射目标不再是单一的有效点,而是多个有效点的集合,需要从特征值分布上考虑每个有效点的散射类型占整个集合中的比例;极化熵的值与能识别的散射机制数目成反比,即H值越大,PolSAR数据中能识别的散射机制的数量越少,当H=1时,PolSAR数据中没有能够识别的散射机制,目标的散射行为变成了一个随机噪声的过程;同散射角α类似,海洋区域具有较低的H值,森林和高大建筑物地区具有较高的H值;
散射角和极化熵都是衡量随机散射问题的旋转不变参数,虽然都涉及到了特征值的比较,但是没能详细表示特征值的比值关系,因此提出了另一个旋转不变的参数——极化各向异性度A,将特征值按由大到小的顺序排列λ1>λ2>λ3>0,极化各向异性度A定义为:
选取极化熵H和极化各向异性度A的乘积组合H(1-A)作为特征;
Freeman-Durden分解是由极化协方差矩阵C3的导出参数,是以物理实际为基础的非相干矩阵分解方法,基于3种模型进行极化分解,如来自裸露地表的面散射,来自森林冠层的体散射和来自和地物与地面共同作用的二次散射;
fv是体散射分量的贡献,fs是单次散射分量对|SVV|2的贡献,fs是二次散射分量对|SVV|2的贡献;参数α、β以及fs、fd由实际雷达实测数据估计出来;
通过对散射分量的贡献的估计,得到总散射功率为:
Span=<|SHH|2>+2<|SHV|2>+<|SVV|2>=PS+PD+PV (9)
式中,PS=fS(1+|β|2);PD=fD(1+|α|2);PV=fV;
Freeman-Durden模型方法同比于其他特征模型,由于该方法是基于雷达散射回波的物理模型,而不是仅使用数学推导,其物理意义明显,并且在大多数情况下是可以使用的;这个模型可以用来初步识别哪些散射机制成分可以支配目标极化数据的后向散射;通过极化分解得到的三个分量可以适用于分类识别植被、农作物、建筑物不同类别的目标;选取分量PV作为特征;
根据后向散射矩阵[S],导出下面3个圆极化分量:
其中SRR或SLL分别表示右-右圆极化分量和左-左圆极化分量,SRL表示右-左圆极化分量;
选取圆极化比CPR作为特征,CPR是SRR或SLL与SRL的比值:
3.根据权利要求1所述的基于极化特征的自适应维度决策树分类方法,其特征在于:步骤2、训练决策树:
1)建立决策树模型;决策树模型是分类方法中较为简洁和可读性较高的一类分类方法,通过样本的层次分类,最终实现每个标记样本的精确分类;决策树由叶子和节点组成,每个叶子表示一个簇,每个节点代表一个特征空间,当簇中只有一类标记样本时,决策树停止分支;本方法对测试样本中每一类随机取5%的样本点作为训练样本输入决策树,输入步骤1中提取的8个极化特征对训练样本进行分类,寻找并建立最优分支顺序;
2)构造自适应维度特征空间;节点不再使用单个特征进行划分,而是引入了特征空间,特征空间的维度自一维开始,对训练样本进行划分并计算混淆矩阵“纯度”,如果纯度超过设定的门限高值,则判断该节点处为易分地物,该处节点使用一维特征空间;如果纯度在门限高值与低值之间,则该处节点选用二维特征空间,并重新计算最优分支和所需特征;如果纯度低于门限低值,则判断该节点处为难分地物,该处节点选用三维特征空间,实现难分地物的分离;
3)使用Fisher线性判别式分析对特征空间降低维度;Fisher线性判别式分析就是找到类内离散度较小同时类间离散度较大的投影方向,公式如下:
y=ωTx (12)
其中ωT为最佳投影方向;
然而,将多维空间投影到一维必然会造成数据的损失,使得原本在多维空间中分离较好的类别会在投影到一维空间后严重重叠,于是,Fisher提出了标准函数,其公式如下:
式中,m1、m2表示样本的均值,s1、s2表示样本的标准差;
4)使用J-M距离划分目标;不同目标间的分类,由于散射机制差异程度不同,采用一个或多个极化特征对其进行类别划分,因此特征选择上,可以是单个特征fi,i=1,2,3...,也是多个特征组成的特征空间F={f1,f2,f3...};本发明对多维空间采用Fisher线性判别式分析降低至一维维度,进而采用J-M距离计算样本间的分离度,J-M距离的取值范围是[0,2],0表示在某个特征的两个类别完全混淆,2表示在某个特征的两个类别完全分离;J-M距离公式如下:
J=2(1-e-B) (14)
其中B为巴氏距离:
其中m1、m2表示样本的均值,σ1、σ2表示样本的标准差;
当两个类别在某个特征上的J-M距离满足线性分条件时,计算两个类别在此特征的阈值,根据高斯概率分布密度函数:
p(x)=p(x|ω1)p(ω1)+p(x|ω2)p(ω2) (16)
其中ω1、ω2为两个类,p(ω1)、p(ω2)为先验概率,p(x|ω1)、p(x|ω2)为后验概率,当存在x0,使得p(x0|ω1)=p(x0|ω2)时,两个类别分离效果最好;因此,把x0的值作为阈值,阈值T的计算公式如下:
其中,
J-M距离充分考虑了样本的类间距离和概率分布密度,是具有统计意义的分离度的计算方法;当J-M距离的值大于0.5时,认为两个类别是可分的;本发明通过计算J-M距离,得到所有线性可分的可能,自动定位分离度最优的分支,确定此最优分支的特征空间。
4.根据权利要求1所述的基于极化特征的自适应维度决策树分类方法,其特征在于:步骤3、测试样本分类:
对测试样本分类之前需要采用训练样本相同的数据预处理过程,需要注意的是:一维测试样本可以直接进行归一化处理,二维、三维测试样本需要先进行Fisher线性判别式分析投影到一维,再进行归一化处理;遵循决策树训练规则,调用各节点的最佳阈值,通过测试样本特征值与最佳阈值的比较,对测试样本进行完整地层次分类。
5.根据权利要求1所述的基于极化特征的自适应维度决策树分类方法,其特征在于:步骤4、计算分类结果的混淆矩阵
在测试样本的分类结果和标记样本中,统计分类结果中各类别的样本点数量以及标记样本中各类别的样本点数量,并计算得到混淆矩阵C:
混淆矩阵的行表示实际的类别,列表示划分的类别;因此,对角线元素(C11、C22…Cnm)行和列相等,表示正确分类的样本点数量,非对角线元素Cij表示第i类地物的样本错分到第j类中的数目;混淆矩阵中每行总和为该类样本总数,对上述混淆矩阵按行的方向做归一化处理后,得到归一化后的混淆矩阵中的各个元素就表示了该分类结果在该实际类别中所占的比例;
通过计算的行列式度量分类效果——“纯度”,这种纯度的计算,不仅考虑了对角线元素分类的正确率,还考虑了非对角线元素分类的错误率,并且该计算方法与各类别的样本数量无关。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811489586.7A CN109840542B (zh) | 2018-12-06 | 2018-12-06 | 基于极化特征的自适应维度决策树分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811489586.7A CN109840542B (zh) | 2018-12-06 | 2018-12-06 | 基于极化特征的自适应维度决策树分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109840542A true CN109840542A (zh) | 2019-06-04 |
CN109840542B CN109840542B (zh) | 2021-03-26 |
Family
ID=66883184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811489586.7A Active CN109840542B (zh) | 2018-12-06 | 2018-12-06 | 基于极化特征的自适应维度决策树分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109840542B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110646795A (zh) * | 2019-09-16 | 2020-01-03 | 武汉大学 | 一种简缩极化sar的海洋溢油检测方法和系统 |
CN110879893A (zh) * | 2019-11-11 | 2020-03-13 | 图林科技(深圳)有限公司 | 基于区块链和云计算的物流供应链大数据处理系统 |
CN111144505A (zh) * | 2019-12-30 | 2020-05-12 | 北京三快在线科技有限公司 | 基于维度切片的变量分类方法、装置、设备及介质 |
CN113408945A (zh) * | 2021-07-15 | 2021-09-17 | 广西中烟工业有限责任公司 | 一种烤烟纯度的检测方法、装置、电子设备及存储介质 |
CN115062260A (zh) * | 2022-06-16 | 2022-09-16 | 电子科技大学 | 一种适用于异质森林的森林生物量PolInSAR估算方法和系统、存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101498789A (zh) * | 2009-02-25 | 2009-08-05 | 中国测绘科学研究院 | 一种基于全极化合成孔径雷达的地物目标分类方法和装置 |
US8125370B1 (en) * | 2007-04-16 | 2012-02-28 | The United States Of America As Represented By The Secretary Of The Navy | Polarimetric synthetic aperture radar signature detector |
CN103617427A (zh) * | 2013-12-13 | 2014-03-05 | 首都师范大学 | 极化sar图像分类方法 |
CN103824084A (zh) * | 2014-03-12 | 2014-05-28 | 西安电子科技大学 | 基于sdit和svm的极化sar图像分类方法 |
CN104331707A (zh) * | 2014-11-02 | 2015-02-04 | 西安电子科技大学 | 基于深度pca网络和svm的极化sar图像分类方法 |
US20180052229A1 (en) * | 2014-12-08 | 2018-02-22 | United States of America as Represented by the Secretary of the Army (Army Research Laboratory) | System for detecting man-made objects using polarimetric synthetic aperture radar imagery with error reduction and method of use |
CN108399436A (zh) * | 2018-03-22 | 2018-08-14 | 中国科学院电子学研究所 | 一种基于极化sar数据的多变量决策树特征集选取方法 |
-
2018
- 2018-12-06 CN CN201811489586.7A patent/CN109840542B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8125370B1 (en) * | 2007-04-16 | 2012-02-28 | The United States Of America As Represented By The Secretary Of The Navy | Polarimetric synthetic aperture radar signature detector |
CN101498789A (zh) * | 2009-02-25 | 2009-08-05 | 中国测绘科学研究院 | 一种基于全极化合成孔径雷达的地物目标分类方法和装置 |
CN103617427A (zh) * | 2013-12-13 | 2014-03-05 | 首都师范大学 | 极化sar图像分类方法 |
CN103824084A (zh) * | 2014-03-12 | 2014-05-28 | 西安电子科技大学 | 基于sdit和svm的极化sar图像分类方法 |
CN104331707A (zh) * | 2014-11-02 | 2015-02-04 | 西安电子科技大学 | 基于深度pca网络和svm的极化sar图像分类方法 |
US20180052229A1 (en) * | 2014-12-08 | 2018-02-22 | United States of America as Represented by the Secretary of the Army (Army Research Laboratory) | System for detecting man-made objects using polarimetric synthetic aperture radar imagery with error reduction and method of use |
CN108399436A (zh) * | 2018-03-22 | 2018-08-14 | 中国科学院电子学研究所 | 一种基于极化sar数据的多变量决策树特征集选取方法 |
Non-Patent Citations (2)
Title |
---|
WEN HONG 等: "Decision hierarchical classification by FLD for vegetation application using PolSAR features", 《2017 IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM (IGARSS)》 * |
邵璐熠 等: "基于二维极化特征的PolSAR图像决策分类", 《雷达学报》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110646795A (zh) * | 2019-09-16 | 2020-01-03 | 武汉大学 | 一种简缩极化sar的海洋溢油检测方法和系统 |
CN110646795B (zh) * | 2019-09-16 | 2021-09-24 | 武汉大学 | 一种简缩极化sar的海洋溢油检测方法和系统 |
CN110879893A (zh) * | 2019-11-11 | 2020-03-13 | 图林科技(深圳)有限公司 | 基于区块链和云计算的物流供应链大数据处理系统 |
CN111144505A (zh) * | 2019-12-30 | 2020-05-12 | 北京三快在线科技有限公司 | 基于维度切片的变量分类方法、装置、设备及介质 |
CN111144505B (zh) * | 2019-12-30 | 2023-09-01 | 北京三快在线科技有限公司 | 基于维度切片的变量分类方法、装置、设备及介质 |
CN113408945A (zh) * | 2021-07-15 | 2021-09-17 | 广西中烟工业有限责任公司 | 一种烤烟纯度的检测方法、装置、电子设备及存储介质 |
CN115062260A (zh) * | 2022-06-16 | 2022-09-16 | 电子科技大学 | 一种适用于异质森林的森林生物量PolInSAR估算方法和系统、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109840542B (zh) | 2021-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109840542B (zh) | 基于极化特征的自适应维度决策树分类方法 | |
Mishra et al. | Land cover classification of PALSAR images by knowledge based decision tree classifier and supervised classifiers based on SAR observables | |
CN103839073B (zh) | 一种基于极化特征和近邻传播聚类的极化sar图像分类方法 | |
CN104504393B (zh) | 基于集成学习的极化sar图像半监督分类方法 | |
CN103413146B (zh) | 基于Freeman熵和自学习的极化SAR图像精细分类方法 | |
CN102999762B (zh) | 基于Freeman分解和谱聚类的极化SAR图像分类方法 | |
CN102968640B (zh) | 基于Freeman分解和数据分布特征的极化SAR图像分类方法 | |
CN103426175B (zh) | 基于特征值度量谱聚类的极化sar图像分割方法 | |
CN109359525B (zh) | 基于稀疏低秩的判别谱聚类的极化sar图像分类方法 | |
CN110197209A (zh) | 一种基于多特征融合的辐射源识别方法 | |
CN108256436A (zh) | 一种基于联合分类的雷达hrrp目标识别方法 | |
CN105160353B (zh) | 基于多特征集的极化sar数据地物分类方法 | |
Maghsoudi | Analysis of Radarsat-2 full polarimetric data for forest mapping | |
CN107203791B (zh) | 基于异极化比和散射功率熵的极化sar图像分类方法 | |
CN103955709B (zh) | 基于加权合成核与tmf的极化sar图像分类方法 | |
CN102208017A (zh) | 基于高分辨率合成孔径雷达图像的舰船检测方法 | |
CN106446935A (zh) | 基于核稀疏表示和空间约束的极化sar图像分类方法 | |
CN103870842B (zh) | 结合极化特征和分水岭的极化sar图像分类方法 | |
CN104239895B (zh) | 基于特征降维的sar目标鉴别方法 | |
CN104463227A (zh) | 基于fqpso和目标分解的极化sar图像分类方法 | |
CN104050489B (zh) | 一种基于多核最优化的合成孔径雷达自动目标识别方法 | |
CN105046286A (zh) | 基于自动视图生成和联合l1,2范数最小化的监督多视图特征选择方法 | |
Fernández-Michelli et al. | Unsupervised classification algorithm based on EM method for polarimetric SAR images | |
CN116681927A (zh) | 结合深度学习模型和传统分类器的用于PolSAR数据的分类方法及系统 | |
CN104463222B (zh) | 基于特征向量分布特性的极化sar图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |