基于超像素和主题模型的极化SAR图像分类方法
技术领域
本发明属于图像处理和遥感技术领域,涉及一种基于超像素和主题模型的极化SAR图像分类方法。
背景技术
与合成孔径雷达(Synthetic Aperture Radar,SAR)图像相比,极化SAR图像作为多通道的SAR图像,富含更多的极化信息其的地物分类是图像处理的基本任务,也是国家发展的重大需求,受到越来越多人的关注。然而,对于城区,森林等异质区域,由于地物的混杂性,传统的基于目标分解的方法很难将图像分为语义一致的地物区域,这也是极化SAR图像分类的一个挑战。
极化SAR图像含有丰富的极化散射信息,传统的极化SAR图像分类方法主要通过目标分解,得到对应地物的散射类型,如经典的H/α分类,Freeman分类等;另外,一些极化数据的统计模型被提出用来分类,如Wishart分类器;此外,通过结合目标分解和统计分布,H/-Wishart分类方法能够得到更好的分类结果。然而,由于这些方法没有考虑图像的空间和语义信息,对斑点噪声敏感,很难得到区域一致性好的分类结果。后来,许多学者提出了基于图像处理技术的极化SAR图像分类方法,这类算法通过提取极化SAR图像的纹理和结构特征,使用分类器进行分类,通过加入空间信息,能够有效地抑制噪声,获得区域一致的分类结果。
上述极化SAR分类算法虽考虑了极化SAR的散射特性和空间信息,但仍存在很多缺陷:(1)对于极化SAR异质区域,如城区、森林等,由于城区由多个建筑物聚集形成,散射回波会形成强烈的亮暗变化,这种亮暗变化重复出现,形成城区,现有算法由于没有考虑图像的高层语义信息,很难将异质区域划分为语义一致的同类区域。(2)由于没有融合散射特征和图像特性,传统算法难以学习到高层的判别性特征,对极化SAR图像进行分类,考虑极化特性的高层语义特征和分类方法还有待挖掘。
综上所述,现有的极化SAR图像分类方法仍存在一些缺陷,难以将极化SAR异质区域划分为语义一致的区域,难以有效分类极化SAR地物目标。
发明内容
本发明的目的是提供一种基于超像素和主题模型的极化SAR图像分类方法,能够有效表示极化SAR图像的异质区域。
本发明所采用的技术方案是,基于超像素和主题模型的极化SAR图像分类方法,包括以下步骤:
步骤1,输入待分类的极化SAR图像,对极化SAR图像进行精致Lee滤波处理;
步骤2,使用均匀采样的方式对步骤1处理后的图像进行样本点采集,得到样本点集合;
步骤3,对样本点集合提取极化SAR图像的三种类型的特征,并分别进行归一化,得到特征集合F1、F2、F3;
步骤4,对特征集合F1、F2、F3分别进行K-means聚类,形成视觉字典V1、V2、V3,并将V1、V2、V3合并为多特征视觉字典V;
步骤5,在步骤1处理后的图像的基础上进行过分割,得到若干个超像素,根据多特征视觉字典V对每个超像素进行稀疏编码;
步骤6,使用主题模型对超像素的稀疏编码进行特征学习,得到高层特征,并用SVM分类法对高层特征进行分类,得到极化SAR图像的最终分类结果。
步骤3的具体步骤为:
步骤3.1,基于极化数据表示分别提取极化SAR图像的16维特征,并归一化得到特征集合F1;
步骤3.2,基于极化目标分解分别提取极化SAR图像的17维特征,并归一化得到特征集合F2;
步骤3.3,基于图像处理技术分别提取极化SAR图像的20维特征,并归一化得到特征集合F3。
步骤3.1中,基于极化数据表示提取的极化SAR图像的16维特征具体为:
a)极化散射矩阵S的6维特征:
{real(Shh),imag(Shh),real(Shv),imag(Shv),real(Svv),imag(Svv)} (1)
其中,Shh为水平接收的水平向发射极化波的回波数据、Shv为垂直接收的水平向发射极化波的回波数据、Svv为垂直接收的垂直向发射极化波的回波数据,real(·)为求实部操作,imag(·)为求虚部操作;
b)相干矩阵T的9维特征:
{T11,T22,T33,real(T12),imag(T12),real(T13),imag(T13),real(T23),imag(T23)}(2)
其中,相干矩阵T由极化散射矩阵S在Pauli基下转换得到,T11、T22、T33、T12、T13和T23为相干矩阵T中的元素;
c)SPAN图的1维特征:
span=|Shh|2+2|Shv|2+|Svv|2 (3)
SPAN图为极化SAR总功率图,其中,span为散射矩阵S的各元素的功率之和;
步骤3.2中,基于极化目标分解提取的极化SAR图像的17维特征具体为:
a)Cloude-Pottier分解得到3维特征:熵H、反熵A和平均散射角α;
熵H定义为:
其中:
其中,n为通道数,n=3;相干矩阵T分解得到多个特征值和特征向量,λi是第i个特征值,λj是第j个特征值,Pi为λi的归一化结果;
反熵A定义为:
P2为第2个特征值的归一化结果,P3为第3个特征值的归一化结果;
平均散射角α定义为:
α=P1α1+P2α2+P3α3 (7)
α1为第1个特征向量中的第一个元素、α2为第2个特征向量中的第一个元素、α3为第3个特征向量中的第一个元素;
b)Freeman分解得到3维特征:表面散射功率、二次散射功率和体散射功率:
Freeman分解将协方差矩阵C分解为三种散射矩阵:
C=fsCS+fdCD+fvCV (8)
其中,CS、CD、CV分别为表面散射矩阵、二次散射矩阵、体散射矩阵,fs、fd、fv分别为CS、CD、CV对应的系数;
表面散射功率、二次散射功率、体散射功率分别为pS、pD、pV:
其中,a为二次散射参数、b为表面散射参数;
c)Huynen分解得到9维特征:
{A0,B0,B,C,D,E,F,G,H} (10)
A0表示目标对称性,B0-B表示目标非对称性,B0+B表示目标非规则性,C表示目标线性特性,D表示局部曲率差,E表示表面扭转度,F表示目标螺旋性,G表示对称与非对称的粘合力,H表示目标方向;
Huynen分解将相干矩阵T表示为9个独立元素,9个元素表示不同的目标散射信息:
其中,
d)极化参数的2维特征:
共极化比:
交叉极化比:
其中,(Svv)*为矩阵Svv的共轭转置。
步骤3.3中,基于图像处理技术提取的极化SAR图像的20维特征具体为:
a)基于灰度共生矩阵定义4维纹理特征:
对比度con:
能量Asm:
熵Ent:
相关性Corr:
其中,
其中,p(i,j)为像素点i和像素点j之间的灰度共生矩阵值,k为像素点的个数;
b)16维轮廓特征:
设计4个尺度N个方向的边线滤波器组,并将边线滤波器组应用在SPAN图和极化SAR图上,得到不同尺度和方向的能量值:
其中,Eedge和Eline分别为边能量值和线能量值,上标a、b、c分别表示线滤波器的上、中、下三个区域,xi为边线滤波器内第i个像素点的像素值,wi为第i个像素点对应的高斯核权重,m和n分别为边线滤波器两个不同区域的像素点的个数;在1个SPAN图和3个通道的极化SAR图上,对于4个尺度,分别选择各个方向中的最大能量值作为该尺度的能量值,得到16维轮廓能量图。
步骤4的具体步骤为:
步骤4.1,对特征集合F1进行K-means聚类,类别数定义为m类,得到m个聚类中心,将m个聚类中心作为视觉字典V1;
对特征集合F2进行K-means聚类,类别数定义为m类,得到m个聚类中心,将m个聚类中心作为视觉字典V2;
对特征集合F3进行K-means聚类,类别数定义为m类,得到m个聚类中心,将m个聚类中心作为视觉字典V3;
步骤4.2,合并视觉字典V1、V2、V3,得到3m维的多特征视觉字典V。
步骤5具体为:
对步骤1处理后的图像获取SPAN图,对SPAN图进行均值漂移过分割,每个过分割区域作为一个超像素;
根据多特征视觉字典V对每个超像素进行稀疏编码,并对所有超像素的稀疏编码进行归一化处理。
步骤6具体为:
使用LDA模型对超像素的稀疏编码进行特征学习,先使用贝叶斯学习方法进行模型推理,再使用EM参数估计算法进行参数估计,得到主题概率,使用SVM分类法对主题概率进行分类,得到SAR图像的最终分类结果。
本发明的有益效果是,基于超像素和主题模型的极化SAR图像分类方法,通过提取极化SAR图像的多种特征构成多特征视觉字典,不仅提取了极化分解信息,同时加入纹理和轮廓特征,能够更加全面的刻画地物目标;为了加入空间信息并且减少计算量,采用超像素作为单位来进行稀疏编码,有效减少了时间复杂度;采用主题模型来进行特征学习,学习了图像的高层语义特征,有效克服了复杂地物分类的语义鸿沟问题。
附图说明
图1是本发明的流程图;
图2(a)是Flevoland地区全极化SAR伪彩图;
图2(b)是图2(a)对应的类标参考图;
图2(c)是本发明对Flevoland地区全极化SAR图像的分类结果图;
图2(d)是SVM算法分类结果图;
图3(a)是San Francisco地区全极化伪彩图;
图3(b)是图3(a)对应的类标参考图;
图3(c)是本发明对San Francisco地区全极化SAR图像的分类结果图;
图3(d)是SVM算法分类结果图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
如图1所示,基于超像素和主题模型的极化SAR图像分类方法,包括以下步骤:
步骤1,输入待分类的极化SAR图像,对极化SAR图像进行精致Lee滤波处理;精致Lee滤波方法不仅能够平滑匀质区域,抑制噪声,同时能够保持边界细节。
步骤2,使用均匀采样的方式对步骤1处理后的图像进行样本点采集,隔10个点进行采样,得到样本点集合;
步骤3,对样本点集合提取极化SAR图像的三种类型的特征,并分别进行归一化,得到特征集合F1、F2、F3;
步骤3的具体步骤为:
步骤3.1,基于极化数据表示分别提取极化SAR图像的16维特征,并归一化得到特征集合F1;
a)极化散射矩阵S的6维特征:
{real(Shh),imag(Shh),real(Shv),imag(Shv),real(Svv),imag(Svv)} (1)
其中,Shh为水平接收的水平向发射极化波的回波数据、Shv为垂直接收的水平向发射极化波的回波数据、Svv为垂直接收的垂直向发射极化波的回波数据,real(·)为求实部操作,imag(·)为求虚部操作;
b)相干矩阵T的9维特征:
{T11,T22,T33,real(T12),imag(T12),real(T13),imag(T13),real(T23),imag(T23)}(2)
其中,相干矩阵T由极化散射矩阵S在Pauli基下转换得到,T11、T22、T33、T12、T13和T23为相干矩阵T中的元素;
c)SPAN图的1维特征:
span=|Shh|2+2|Shv|2+|Svv|2 (3)
SPAN图为极化SAR总功率图,其中,span为散射矩阵S的各元素的功率之和。
步骤3.2,基于极化目标分解分别提取极化SAR图像的17维特征,并归一化得到特征集合F2;
a)Cloude-Pottier分解得到3维特征:熵H、反熵A和平均散射角α;
熵H定义为:
其中:
其中,n为通道数,n=3;相干矩阵T分解得到多个特征值和特征向量,λi是第i个特征值,λj是第j个特征值,Pi为λi的归一化结果;
反熵A定义为:
P2为第2个特征值的归一化结果,P3为第3个特征值的归一化结果;
平均散射角α定义为:
α=P1α1+P2α2+P3α3 (7)
α1为第1个特征向量中的第一个元素、α2为第2个特征向量中的第一个元素、α3为第3个特征向量中的第一个元素;
b)Freeman分解得到3维特征:表面散射功率、二次散射功率和体散射功率:
Freeman分解将协方差矩阵C分解为三种散射矩阵:
C=fsCS+fdCD+fvCV (8)
其中,CS、CD、CV分别为表面散射矩阵、二次散射矩阵、体散射矩阵,fs、fd、fv分别为CS、CD、CV对应的系数;
表面散射功率、二次散射功率、体散射功率分别为pS、pD、pV:
其中,a为二次散射参数、b为表面散射参数;
c)Huynen分解得到9维特征:
{A0,B0,B,C,D,E,F,G,H} (10)
Huynen分解得到各参数的物理含义如表1所示:
表1 Huynen分解得到的各参数的物理含义
A<sub>0</sub> |
目标对称性 |
B<sub>0</sub>-B |
目标非对称性 |
B<sub>0</sub>+B |
目标非规则性 |
C |
目标线性特性 |
D |
局部曲率差 |
E |
表面扭转度 |
F |
目标螺旋性 |
G |
对称与非对称的粘合力 |
H |
目标方向 |
Huynen分解将相干矩阵T表示为9个独立元素,9个元素表示不同的目标散射信息:
其中,
d)极化参数的2维特征:
共极化比:
交叉极化比:
其中,(Svv)*为矩阵Svv的共轭转置。
步骤3.3,基于图像处理技术分别提取极化SAR图像的20维特征,并归一化得到特征集合F3;
a)灰度共生矩阵是描述极化SAR图像的纹理的有效工具,通过计算图像局部空间关系能够反映图像局部的方向、间隙、变换模式等信息;基于灰度共生矩阵定义4维纹理特征:
对比度con:
能量Asm:
熵Ent:
相关性Corr:
其中,
其中,p(i,j)为像素点i和像素点j之间的灰度共生矩阵值,k为像素点的个数;
b)16维轮廓特征:
在本实施例中,设计4个尺度18个方向的滤波器组,为了减少噪声,设计各向异性高斯核对滤波器进行加权,并将滤波器组应用在SPAN图和极化SAR图上,得到不同方向和尺度的能量值:
其中,Eedge和Eline分别为边能量值和线能量值,上标a、b、c分别表示线滤波器的上、中、下三个区域,xi为滤波器内第i个像素点的像素值,wi为第i个像素点对应的高斯核权重,m和n分别为滤波器两个不同区域的像素点的个数;在1个SPAN图和3个通道的极化SAR图上,对于4个尺度,分别选择18个方向中的最大能量值作为该尺度的能量值,得到16维轮廓能量图。
步骤4,对特征集合F1、F2、F3分别进行K-means聚类,形成视觉字典V1、V2、V3,并将V1、V2、V3合并为多特征视觉字典V;
步骤4的具体步骤为:
步骤4.1,对特征集合F1进行K-means聚类,类别数定义为100类,得到100个聚类中心,将100个聚类中心作为视觉字典V1;
对特征集合F2进行K-means聚类,类别数定义为100类,得到100个聚类中心,将100个聚类中心作为视觉字典V2;
对特征集合F3进行K-means聚类,类别数定义为100类,得到100个聚类中心,将100个聚类中心作为视觉字典V3。
步骤4.2,合并视觉字典V1、V2、V3,得到300维的多特征视觉字典V。
步骤5,对步骤1处理后的图像获取SPAN图,选择EDISON系统对SPAN图进行均值漂移过分割,得到多个一致的小区域,即为过分割区域,每个过分割区域作为一个超像素;
超像素能够刻画图像的自适应邻域关系,每个像素点的邻域不再是固定的4-邻域或者8-邻域,而是整个超像素;目前,许多过分割方法已经被提出,如分水岭算法、均值漂移算法、水平集方法,本发明选择均值漂移算法进行初始分割,能够获得一致的区域,且不会引起太多的超像素块。
根据多特征视觉字典V对每个超像素进行稀疏编码,具体为,对超像素中的每个像素点,向学习的多特征视觉字典V进行投影,距离V最近的像素点编码为1,其他像素点编码为0,对超像素中所有像素点的编码进行直方图统计,得到超像素的稀疏编码,并对所有超像素的稀疏编码进行归一化处理。
步骤6,使用LDA模型对超像素的稀疏编码进行特征学习,先使用贝叶斯学习方法进行模型推理,再使用EM参数估计算法进行参数估计,得到主题概率,使用SVM分类法对主题概率进行分类,选择10%的样本进行训练,再对整幅图像进行测试,得到极化SAR图像的最终分类结果。
下面结合仿真实验对本发明的效果进行进一步的说明:
仿真实验1:
1.仿真条件
(1)仿真实验中,输入NASA/JPL AIRSAR卫星L波段在荷兰Flevoland地区农田的四视极化SAR图像,图像大小为300×270像素;
(2)仿真实验中,精致Lee滤波的窗口选为5×5;
(3)仿真实验中,边线滤波器选取为4个尺度18个方向;
2.仿真内容与结果
图2(a)为Flevoland地区全极化SAR伪彩图,以Pauli基为RGB三通道颜色表示;图2(b)为2(a)对应的类标参考图,白色区域没有参考类标,因此,本发明不考虑白色区域的分类结果,在参考图中Flevoland地区被划分为6类;图2(c)是本发明对Flevoland地区全极化SAR图像的分类结果,分类精度为96.8%;图2(d)为SVM算法分类结果,分类精度为95.9%。能够看出,图2(d)会得到很多杂点,对噪声不能很好的抑制,本发明算法能够得到更加一致的分类结果。
仿真实验2:
1.仿真条件
(1)仿真实验中,输入AIRSAR卫星L波段San Francisco地区四视极化SAR图像,图像大小为512×512像素;
(2)仿真实验中,Lee滤波窗口选为5×5;
(3)仿真实验中,边线滤波器选取为4个尺度18个方向;
2.仿真内容与结果
图3(a)为San Francisco地区全极化伪彩图,以Pauli基为RGB三通道颜色表示。图3(b)为对应的参考图,参考图中该区域被划分为三类,黑色表示海洋,深灰色表示城区,浅灰色表示森林,白色为无标记区域,不进行考虑;图3(c)是本发明对San Francisco地区全极化SAR图像的分类结果,分类精度为95.75%;图3(d)为SVM算法分类结果,分类精度为93.35%。能够看出,图3(d)的分类结果有很多噪声,城区和森林产生了混淆,且海洋部分也有错分,不能很好的抑制;本发明能够得到更加一致的分类结果。
通过上述方法,本发明基于超像素和主题模型的极化SAR图像分类方法,首先对极化SAR图像进行精致Lee滤波处理,对滤波后的图像进行均匀采样;对样本点集合提取极化SAR图像的三类特征集合,分别对三类特征集合进行聚类,形成三组视觉字典,并合并为多特征视觉字典;对SPAN图像进行均值漂移过分割,对分割的每个超像素进行稀疏编码,并使用主题模型进行特征学习,对学到的高层特征进行SVM分类,得到极化SAR图像的分类结果图。本发明通过提取极化SAR图像的多种特征构成多特征视觉字典,不仅提取了极化分解信息,同时加入纹理和轮廓特征,能够更加全面的刻画地物目标;为了加入空间信息并且减少计算量,采用超像素作为单位来进行稀疏编码,有效减少了时间复杂度;采用主题模型来进行特征学习,学习了图像的高层语义特征,有效克服了复杂地物分类的语义鸿沟问题。