CN101196564A - 拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法 - Google Patents

拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法 Download PDF

Info

Publication number
CN101196564A
CN101196564A CNA2007101992714A CN200710199271A CN101196564A CN 101196564 A CN101196564 A CN 101196564A CN A2007101992714 A CNA2007101992714 A CN A2007101992714A CN 200710199271 A CN200710199271 A CN 200710199271A CN 101196564 A CN101196564 A CN 101196564A
Authority
CN
China
Prior art keywords
sample
alpha
gamma
sign
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101992714A
Other languages
English (en)
Other versions
CN101196564B (zh
Inventor
张向荣
焦李成
阳春
公茂果
刘芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN2007101992714A priority Critical patent/CN101196564B/zh
Publication of CN101196564A publication Critical patent/CN101196564A/zh
Application granted granted Critical
Publication of CN101196564B publication Critical patent/CN101196564B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法,它涉及雷达技术领域,其目的在于采用该方法以提高SAR目标图像的识别率,对方位具有较好的鲁棒性。该方法的实现步骤为:首先将MSTAR数据库中的全部样本采用KPCA进行特征提取,再将训练集数据全部作为有标识样本,测试集数据全部作为无标识样本来建立一个无向加权图G=(V,E),将数据点看作G的顶点V,并定义成对数据点的相似度为该图的边,然后求该图的Laplacian,将它作为一个正则项,添加到正则化最小二乘分类中,称为拉普拉斯正则化最小二乘分类,求解对应的优化问题,最后用训练得到的分类函数对无标识样本进行分类。该方法可用于解决基于二维SAR图像的识别问题。

Description

拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法
技术领域
本发明属于雷达技术领域,涉及一种模式识别技术的具体应用,具体地说是一种拉普拉斯Laplacian正则化最小二乘合成孔径雷达SAR自动目标识别方法。该方法可用于解决基于二维SAR图像的识别问题。
背景技术
SAR技术在对地面目标,特别是对静止目标探测方面的独特优势,以及其在现代战场感知、对地面打击等领域的良好应用前景,使得基于SAR图像的自动目标识别技术ATR受到了越来越多的重视。目前针对SAR图像的自动目标识别学者们已经进行了多方面的研究,提出了各种方法,这些方法都是基于目标模型的识别方法。目标模型的描述方法通常分为两类:基于模板的目标描述方法和基于模型的目标描述方法。基于模板的目标描述方法通过一些典型的目标特征样本来描述每一类目标,基于模型的目标描述方法利用隐马尔可夫模型或神经网络模型来描述每一类目标特征,这些方法都存在一定的不足和缺陷。
1998年,美国的Timothy Ross等人提出一种基于模板匹配的SAR自动目标识别方法,并以此结果作为标准,向该领域征集更优的ATR方法。该方法是在图像域内,将样本按10°方位间隔分组,在每一个方位单元内利用样本均值作为模板,用最小距离分类法进行分类。由于模板匹配法是利用样本的均值作为模板,其与样本图像的几何形状有直接关系,同时SAR目标图像对方位比较敏感,所以方位间隔越小,形成的模板质量越高,匹配效果越好,但是需要对方位有较好的估计,并且随着模板数量的增加,所需存储空间增大。
同样在1998年,Theera-Umpon提出利用形态学权值共享神经网络来解决SAR图像中军用车辆的检测和识别问题。这种处理方法基于如下事实:异类神经网络能够同时学习特征提取和分类。权值共享神经网络和形态学权值共享神经网络是异类神经网络的一种。这些神经网络由两个阶段组成:特征提取阶段和分类阶段。此方法只能对两类目标进行分类识别,由于神经网络的输入是一块图像,因此网络的训练计算量较大。在目标类较多的情况下,可能导致网络训练无法收敛。
2001年,Qun Zhao对样本不做任何特征提取,将样本按30°方位分组,在每一个方位单元内建立支撑矢量机SVM分类器,识别时利用目标的方位信息选出相应方位单元的分类器进行分类。虽然SVM适合解决小样本高维模式分类问题,但在按10°方位间隔分组时,样本数目过于少,每类目标在每个方位单元内只有6~7个训练样本,训练性能较差,在此情况下达不到较高的识别率。另外,该方法没有经过特征提取的预处理,一方面会因为噪声的存在降低识别率,另一方面达不到降维的目的,给计算带来负担。
目前,已经有学者将核主成分分析KPCA的特征提取方法对SAR目标进行预处理,然后用SVM进行目标识别,与上述的方法相比该方法的识别率有一定的提高,但在训练样本过于少的情况下,比如按10°方位间隔分组,训练性能同样会较差。
发明内容
本发明的目的在于:为了克服现有技术的不足,提出了一种拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法,以提高SAR图像的目标识别率,并且对方位不需要精确的估计,在小样本情况下仍然可以获得很好的识别效果。
本发明的技术方案是:将待识别的SAR目标图像看作是半监督学习中训练集的无标识样本,通过转导推理得到标识。首先将运动、静止目标获取与识别MSTAR数据库中的全部样本采用KPCA进行特征提取,再将训练集数据全部作为有标识样本,测试集数据全部作为无标识样本来建立一个无向加权图G=(V,E),将数据点看作G的顶点V,并定义成对数据点的相似度为无向加权图的边,然后用图的方法逼近流形,在全局上要求满足光滑性的假设,并将它作为一个正则项,添加到正则化最小二乘分类RLSC中,称为拉普拉斯正则化最小二乘分类LapRLSC,求解对应的优化问题,最后用训练得到的分类函数对无标识样本进行分类。该方法的具体实现步骤如下:
(1)输入l个有标识样本{(xi,yi)i=1 l,l是训练集样本的个数,xi表示第i个样本,用一个行向量表示,yi是该样本所属的类别标号,输入u个无标识样本{xj}j=l+1 l+u,u是测试集样本的个数,xj表示第j个样本,也用一个行向量表示,用l+u个数据点建立一个邻接图,数据点看作邻接图的顶点,定义Wij为邻接图的边,是成对数据点的相似性度量,上述的邻接图可以选择n近邻或者图核,n为近邻个数,边的权值选择0或1的二值权;
(2)计算第(1)步得到的邻接图的Laplacian矩阵:L=D-W,其中:L表示Laplacian矩阵,D是一个对角矩阵, D ii · = Σ j = 1 l + u W ij , 即第i个点到其它各点的权值之和,其值越大表示该点越重要;
(3)采用一个核函数K(xi,xj)对第(1)步所说的l+u个数据点,计算核矩阵K,Kij=K(xi,xj),Kij表示样本i和样本j的相似性;
(4)选择正则化参数γA和γI;它们分别控制周围空间函数的复杂性和边缘分布的内在几何函数的复杂性,该两参数的确定可以采用简单的网格搜索方法来实现;
(5)采用上述(1)~(4)步得到的结果,计算向量α*,其计算公式如下:
α * = ( JK + γ A lI + γ I l ( l + u ) 2 LK ) - 1 Y
其中:J是一个(l+u)×(l+u)的对角矩阵,J=diag(1,...1,0,...,0),Y是一个(l+u)维的标识向量,Y=[y1,...yl,0,...0];
(6)输出分类函数 f * ( x ) = Σ i = 1 l + u α i * K ( x i , x ) , x表示一个测试集样本,即待识别目标,对于两类的分类问题,根据分类函数 f * ( x ) = Σ i = 1 l + u α i * K ( x i , x ) 的正负来分类,对于多类的分类问题,则采用“一对多“的策略,把有标识的当前类作为+1类,有标识的剩余样本作为-1类,无标识的样本全部标为0。当有C类时,得到C个分类函数,对无标识的每一个样本都有C个函数值,取其中最大的一个所对应的类别作为该样本所属的类别。
上述的拉普拉斯正则化最小二乘SAR自动目标识别方法,第(3)步所说的核函数的计算,可以选用以下几种核函数来进行计算:
①多项式核函数:k(x,y)=(a(x·y)+b)d,x,y表示两个样本,每个样本用一个向量表示,a,b,d均表示多项式核函数的参数;
②高斯核函数: k ( x , y ) = exp { - | | x - y | | 2 2 σ 2 } , σ2表示高斯核函数的参数;
③Sigmoid核函数:k(x,y)=tanh(α(x·y)+β),α,β表示Sigmoid核函数的参数。
本发明采用了高斯核函数,参数σ2通过核-目标配准方法,在某个参数范围上搜索,找到使 A ^ ( K ′ , yy T ) = ⟨ K ′ , yy T ⟩ ⟨ K ′ , K ′ ⟩ ⟨ yy T , yy T ⟩ 得到最大值的σ2,其中K′是关于有标识样本的核矩阵,y是有标识样本的标号列向量,yT表示y的转置。
上述的Laplacian正则化最小二乘SAR自动目标识别方法,所说的通过表达式 α * = ( JK + γ A lI + γ I l ( l + u ) 2 LK ) - 1 Y 得到α*,其实现过程如下:
根据再生核希尔伯特空间RKHS的两个重要事实:
第一,正则化最小二乘问题可以用 f * = arg min f ∈ H K 1 l Σ i = 1 l ( y i - f ( x i ) ) 2 + γ | | f | | K 2 来表示,其中:H表示再生核希尔伯特空间。该问题的解存在并且唯一,由“表示理论”给出解的表达形式:
f * ( x ) = Σ i = 1 l α i * K ( x i , x )
第二,‖f‖K 2可以表示成下面的式子:
| | f | | K 2 = α T Kα
α是待优化的列向量。
那么将其扩展到拉普拉斯正则化最小二乘法,它需要解决下式所表示的优化问题:
f * = min f ∈ H K 1 l Σ i = 1 l ( y i - f ( x i ) ) 2 + γ A | | f | | K 2 + γ I ( l + u ) 2 f T Lf
其解可以表达为 f * ( x ) = Σ i = 1 l + u α i * K ( x i , x ) , f * ( x ) = Σ i = 1 l + u α i * K ( x i , x ) | | f | | K 2 = α T Kα 代入 min f ∈ H K 1 l Σ i = 1 l ( y i - f ( x i ) ) 2 + γ A | | f | | K 2 + γ I ( l + u ) 2 f T Lf 中得到:
Figure S2007101992714D00056
对它求关于α的偏导数,并令该偏导数等于零,即求解 1 l ( Y - JKα ) T ( - JK ) + ( γ A K + γ I l ( l + u ) 2 KLK ) α = 0 , 则得到解的表达式 α * = ( JK + γ A lI + γ I l ( u + l ) 2 LK ) - 1 Y .
本发明通过上述步骤,拉普拉斯正则化最小二乘SAR自动目标识别方法最终输出识别结果。
本发明与现有技术相比具有如下优点:
1.识别率高,对方位具有较好的鲁棒性,实现简单
为了验证拉普拉斯正则化最小二乘SAR自动目标识别方法的优越性,我们将其与模板匹配法和SVM进行了比较。仿真实验表明,与模板匹配法相比,拉普拉斯正则化最小二乘SAR自动目标识别方法不需要对方位估计有较高的精度,并且不需要大量的空间来存储模板,与SVM相比,拉普拉斯正则化最小二乘SAR自动目标识别方法实现简单,仅仅需要求解一个线性方程系统,复杂度的计算很明确,需要O((l+u)3),l+u为训练集和测试集样本的总个数。针对SAR自身的特点,其在360°方位范围内对目标的成像数目有限,数据量不大,该方法依然可以很快地求解。而SVM需要求解一个凸的二次规划问题,它通常对解有个稀疏的表示,实现起来比较复杂,对资源的需求也不能通过简单的分析得到。此外拉普拉斯正则化最小二乘SAR自动目标识别方法在10°、30°、90°、180°、和360°方位间隔分组内均比模板匹配法和SVM的识别率要高。尽管在10°方位间隔分组时,样本数目很少,每类目标在每个方位单元内只有6~7个样本,识别率仍然可以达到95%左右,说明该方法对小样本问题仍然可行。
2.理论上具有合理性
拉普拉斯正则化最小二乘分类问题可以用下面的式子来表示:
f * arg min f ∈ H K 1 l Σ i = 1 1 ( y i - f ( x i ) ) 2 + γ A | | f | | K 2 + γ I ( l + u ) 2 Σ i , j = 1 l + u ( f ( x i ) - f ( x j ) ) 2 W ij
它是在正则化最小二乘分类上加了有关无标识样本的一个正则化项,可以证明:
Σ i , j ( f i - f j ) 2 W ij = Σ i , j ( f i 2 + f j 2 - 2 f i f j ) W ij =
Σ i f i 2 D ii + Σ j f j 2 D jj - 2 Σ i , j f i f j W ij = 2 f T Lf
其中: D ii = Σ j = 1 l + u W ij , L=D-W,L是一个有限半正定的矩阵,可以看成定义在图上的算子,根据谱图理论-如果数据均匀取样自高维空间中的低维流形,流形上的Laplacian-Beltrami算子可以由图的Laplacian逼近,其最前面的几个特征向量就是流形上的Laplacian-Beltrami算子特征函数的离散逼近,那么L就相当于流形学习中的Laplacian-Beltrami算子。
附图说明
图1是本发明实现步骤的流程原理框图
图2是本发明针对的SAR目标图像,其中:图2(a)是BMP2装甲车;图2(b)是RTR70装甲车;图2(c)是T72坦克
图3是10°方位间隔分组时各方法的性能比较图
图4是30°方位间隔分组时各方法的性能比较图
图5是90°方位间隔分组时各方法的性能比较图
图6是180°方位间隔分组时各方法的性能比较图
图7是360°方位间隔分组时各方法的性能比较图
图8是正则化最小二乘和Laplacian正则化最小二乘的性能比较图
图9是在测试集样本不参与训练的情况下,识别误差率随训练集中有标识样本的个数变化的曲线图
图10是在测试集样本参与训练的情况下,识别误差率随训练集中有标识样本的个数变化的曲线图
具体实施方式
参照图1和图2,图1是本发明实现步骤的流程原理框图,图2是本发明的主要针对的目标图像,训练集是MSTAR数据中17°俯视角的图像,测试集是MSTAR数据中15°俯视角的图像。
针对SAR自动目标识别的具体问题,对本发明设计的基于KPCA特征提取和Laplacian正则化最小二乘SAR自动目标识别方法具体描述如下:
先进行预处理,从原始128×128的图像中心截取60×60的区域,该区域包含了整个目标,而去除了多余的背景区域。在此基础上利用KPCA提取各自目标图像35维特征,并进行归一化到[-1,1]。
将每一类训练样本在0°~360°方位范围内,按等方位间隔分为P组,比如方位间隔为10°,则分为36组,在每一组上进行测试,将36组得到的测试结果做平均。其中P为分成的组数。
结合图1可以看出本发明的具体实现步骤如下:
(1)输入l个有标识样本{(xi,yi)}i=1 l,l是训练集样本的个数,xi表示第i个样本,用一个行向量表示,yi是该样本所属的类别标号,输入u个无标识样本{xj}j=l+1 l+u,u是测试集样本的个数,xj表示第j个样本,也用一个行向量表示,用l+u个数据点建立一个邻接图,数据点看作邻接图的顶点,定义Wij为邻接图的边,是成对数据点的相似性度量,上述的邻接图可以选择n近邻或者图核,n为近邻个数,边的权值选择0或1的二值权;
(2)计算第(1)步得到的邻接图的Laplacian矩阵:L=D-W,其中:L表示Laplacian矩阵,D是一个对角矩阵, D ii = Σ j = 1 l + u W ij , 即第i个点到其它各点的权值之和,其值越大表示该点越重要;
(3)选择一个核函数 K ( x i , x j ) = exp { - | | x i - x j | | 2 2 σ 2 } , 计算(l+u)×(l+u)的核矩阵K,Kij=K(xi,xj),Kij表示样本i和样本j的相似性;
(4)选择正则化参数γA和γI;它们分别控制周围空间函数的复杂性和边缘分布的内在几何函数的复杂性,该两参数的确定可以采用简单的网格搜索方法来实现;
(5)采用上述(1)~(4)步得到的结果,计算向量α*,其计算公式如下:
α * = ( JK + γ A lI + γ I l ( l + u ) 2 LK ) - 1 Y
其中:J是一个(l+u)×(l+u)的对角矩阵,J=diag(1,...1,0,...,0),Y是一个(l+u)维的标识向量,Y=[y1,...yl,0,...0];
(6)输出分类函数 f * ( x ) = Σ i = 1 l + u α i * K ( x i , x ) , x表示一个测试集样本,即待识别目标,对于两类的分类问题,根据分类函数 f * ( x ) = Σ i = 1 l + u α i * K ( x i , x ) 的正负来分类,对于多类的分类问题,则采用“一对多“的策略,把有标识的当前类作为+1类,有标识的剩余样本作为-1类,无标识的样本全部标为0。当有C类时,得到C个分类函数,对无标识的每一个样本都有C个函数值,取其中最大的一个所对应的类别作为该样本所属的类别。
本发明采用了高斯核函数,参数σ2通过核-目标配准方法,在参数范围lnσ2={-10∶1∶10}上搜索,找到使 A ^ ( K ′ , yy T ) = ⟨ K ′ , yy T ⟩ ⟨ K ′ , K ′ ⟩ ⟨ yy T , yy T ⟩ 得到最大值的σ2,其中K′是关于有标识样本的核矩阵,y是有标识样本的标号列向量,yT表示y的转置。
为了验证在KPCA提取特征的基础上用拉普拉斯正则化最小二乘SAR自动目标识别方法的优越性,我们将其与模板匹配法和SVM,以及线性主成分分析PCA+SVM,KPCA+SVM,KPCA+RLSC的方法通过以下仿真实验进行了比较。以下仿真实验中用KPCA提取目标图像的35维特征,并归一化到[-1,1]。采用的近邻个数是6,高斯核函数的σ2在1~e2范围内取值,γA
Figure S2007101992714D00091
分别取0.005和0.045。
Laplacian正则化最小二乘在不同方位间隔分组内的识别率与其它方法的比较
(1)Laplacian正则化最小二乘在10°方位间隔分组的识别率与其它方法的比较
参照图3,它是10°方位间隔分组时各方法的性能比较图。本实验是将每一类训练样本在0°~360°方位范围内,按等方位间隔10°分为36组,在每一组上进行测试,将36组得到的测试结果做平均。在每一组上,σ2通过核-目标配准方法,在参数范围lnσ2={-10∶1∶10}上搜索,找到使 A ^ ( K ′ , yy T ) = ⟨ K ′ , yy T ⟩ ⟨ K ′ , K ′ ⟩ ⟨ yy T , yy T ⟩ 得到最大值的σ2,此时K′为有标识样本的核矩阵,y是有标识样本的标号列向量,也就是说核参数σ2的确定只用到有标识的样本。10°方位间隔分组内各识别方法:模板匹配法、SVM、线性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的识别结果分别用1、2、3、4、5、6所标注。
(2)Laplacian正则化最小二乘在30°方位间隔分组的识别率与其它方法的比较
参照图4,它是30°方位间隔分组时各方法的性能比较图。本实验是将每一类训练样本在0°~360°方位范围内,按等方位间隔30°分为12组,在每一组上进行测试,将12组得到的测试结果做平均。在每一组上,σ2与上述(1)一样,用核-目标配准方法得到,搜索范围为lnσ2={-10∶1∶10}。30°方位间隔分组内各识别方法:模板匹配法、SVM、线性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的识别结果分别用1、2、3、4、5、6所标注。
(3)Laplacian正则化最小二乘在90°方位间隔分组的识别率与其它方法的比较
参照图5,它是90°方位间隔分组时各方法的性能比较图。本实验是将每一类训练样本在0°~360°方位范围内,按等方位间隔90°分为4组,在每一组上进行测试,将4组得到的测试结果做平均。在每一组上,σ2与上述(1)一样,用核-目标配准方法得到,搜索范围为lnσ2={-10∶1∶10}。90°方位间隔分组内各识别方法:线性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的识别结果分别用1、2、3、4所标注。
(4)Laplacian正则化最小二乘在180°方位间隔分组的识别率与其它方法的比较
参照图6,它是180°方位间隔分组时各方法的性能比较图。本实验是将每一类训练样本在0°~360°方位范围内,按等方位间隔180°分为2组,在每一组上进行测试,将2组得到的测试结果做平均。在每一组上,σ2与上述(1)一样,用核-目标配准方法得到,搜索范围为lnσ2={-10∶1∶10}。180°方位间隔分组内各识别方法:线性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的识别结果分别用1、2、3、4所标注。
(5)Laplacian正则化最小二乘在360°方位范围内的识别率与其它方法的比较
参照图7,它是360°方位间隔分组时各方法的性能比较图。本实验是将每一类训练样本在0°~360°方位范围内,按方位间隔360°,成为一组,在这一组上进行测试。σ2与上述(1)一样,用核-目标配准方法得到,搜索范围为lnσ2={-10∶1∶10}。最后将该方位范围的测试结果作为最终结果。360°方位范围内各识别方法:线性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的识别结果分别用1、2、3、4所标注。
正则化最小二乘和Laplacian正则化最小二乘的性能比较
参照图8,它是正则化最小二乘和Laplacian正则化最小二乘的性能比较图,图中识别方法中的1和2分别表示用RLSC对训练集中无标识样本和测试集样本进行分类的结果,识别方法3和4分别表示用LapRLSC对训练集中无标识样本和测试集样本进行分类的结果。训练集中随机取150个有标识的样本。训练集中有不同个数的有标识样本时,用LapRLSC方法的识别误差率
(1)训练过程只包含训练集中有标识和无标识样本,测试集不参与训练
从训练集的每类中随机取出个数相同的有标识样本,依次为20~100个,用转导推理对无标识样本进行标识,即LapRLSC-U(transductive),用只包含训练集样本信息的分类函数,对测试集样本分类,即LapRLSC-T(out-of-sample),做10次实验取平均,识别结果如图9所示。
(2)训练过程包含训练集中的有标识样本,训练集剩余无标识样本和测试集样本全部作为无标识样本
从训练集的每类中随机取出个数相同的有标识样本,依次为20~100个,对所有的无标识样本通过转导推理transductive赋予标识,即LapRLSC-U(transductive)表示用LapRLSC通过转导推理对训练集中无标识样本进行标识,LapRLSC-U(transductive)表示用LapRLSC通过转导推理对测试集样本进行标识,做10次实验取平均,识别结果如图10所示。
仿真实验结果分析
SVM是没有做任何特征提取,将样本按10°或30°方位间隔分组,在每一个方位单元内建立SVM分类器。从图3和图4可以看到,KPCA+LapRLSC在各个方位间隔分组内均比模板匹配法,SVM,线性PCA+SVM,KPCA+SVM和KPCA+RLSC的识别率要高,给出KPCA+RLSC的仿真结果是为了说明它可以获得与其它方法相比的结果,进而将其扩展成为半监督的LapRLSC。
从图5~图7可以看到,KPCA+LapRLSC在90°、180°和360°方位间隔分组内比线性PCA+SVM、KPCA+SVM以及KPCA+RLSC的识别率都要高,并且都达到了98%以上。
图8说明在只有150个有标识的样本参与训练的情况下,RLSC对训练集中无标识样本的正确率95.77%要高于RLSC对测试样本集的正确率91.86%,而在有150个有标识的样本和548个无标识样本参与训练的情况下,LapRLSC对训练集中无标识样本的正确率98.69%要高于LapRLSC对测试样本集的正确率95.13%,LapRLSC不论是对无标识样本还是对测试集样本的识别率都要高于RLSC。原因分析:对于RLSC,它是一个全监督的方法,只有150个有标识的样本参与训练,548个无标识样本相当于测试集中的样本,对训练集中无标识样本的正确率95.77%要高于对测试样本集的正确率91.86%,是因为无标识的548个样本与有标识的150个样本同属于17°俯视角下的样本集中,相似性较高,而测试集的1169个样本是15°俯视角下的图像。对于LapRLSC,它是一个半监督的方法,有150个有标识和548个无标识样本参与训练,参与了邻接图的建立和对邻接图求Laplacian的过程,通过挖掘有标识样本和无标识样本的相对位置再对548个无标识样本进行标识,而测试集的样本没有参与这一过程,所以对训练集中无标识样本的正确率98.69%要高于对测试样本集的正确率95.13%。
LapRLSC无论是对训练集中的无标识样本进行标识,还是对测试集样本进行分类的结果都比RLSC要好,因为RLSC仅仅利用了150个有标识的训练样本得到分类函数,对无标识和测试样本进行分类,而LapRLSC对150个有标识样本和548个无标识样本进行学习,再用学习得到的分类函数对测试集样本进行分类。主要区别是LapRLSC用了有标识样本和无标识样本共同来建立邻接图,求邻接图的Laplacian,RLSC没有这一步。
图9说明随着训练集中有标识样本数目的增加,对无标识样本和测试集样本的识别误差率都会下降,图10也能说明同样的问题。所不同的是,图9的结果是在只有训练集的有标识和无标识样本参与训练,测试集样本没有当作无标识样本参与训练的情况下得到的,而图10的结果是除了训练集的有标识样本和无标识样本参与训练以外,测试集样本也全部作为无标识样本参与训练的情况下得到的,可以看到,图10所示的情况下对无标识样本LapRLSC-U(transductive)和测试集样本LapRLSC-T(transductive)的误差率都比图9所示的情况下对无标识样本LapRLSC-U(transductive)和测试集样本LapRLSC-T(out-of-sample)要低。原因是测试样本参与了训练,通过转导推理得到标识的正确率要比其不参与训练直接用分类函数得到的正确率要高。
总之,本发明在基于KPCA特征提取的基础上用Laplacian正则化最小二乘SAR自动目标识别方法达到了较高的识别率,与传统的模板匹配法、有特征提取和没有特征提取的基于SVM的方法相比,对方位具有更好的鲁棒性,降低了对目标方位信息估计的精度要求,并且不像模板匹配法需要大量的空间存储模板,在小样本的情况下也可以获得较高的识别率。
算法参数影响分析
用于SAR自动目标识别的Laplacian正则化最小二乘方法主要有5个设定的初始参数,即:邻接图的近邻个数n,训练集中有标识样本的个数l,高斯核函数K(xi,xj)=exp(-‖xi-xj2/2σ2)的宽度σ2,控制周围空间中函数的复杂性γA,和控制分布的内在几何结构函数的复杂性
Figure S2007101992714D00131
其中邻接图的近邻个数n,在此算法中不敏感,实验中设为6不变,在其它参数不变的情况下,训练集中有标识样本的个数l越大,越有利于提高识别率,因此本发明提出利用全部的有标识的样本,只将测试集样本作为无标识样本。所以主要考虑核函数的宽度σ2,以及γA
Figure S2007101992714D00132
对识别率的影响。
1.核函数的宽度σ2对识别率算法性能的影响
基于核的学习算法将数据嵌入在核的核矩阵中。核的宽度σ2过大或者过小都会使识别率下降。如果能建立起目标与核函数之间的匹配程度的一种度量,则可为确定最优核参数提供依据。配准的一个关键特性是它的实际值可以通过经验值有效估计,因此为每一个σ2计算核矩阵K′,只要找到使 A ^ ( K ′ , yy T ) = ⟨ K ′ , yy T ⟩ ⟨ K ′ , K ′ ⟩ ⟨ yy T , yy T ⟩ 最大的σ2即为最优的σ2。本发明中在参数范围lnσ2={-10∶1∶10}上搜索,得到在不同的目标方位范围内高斯核函数的σ2有较小的不同,都在1~e2的范围内。
2.γA
Figure S2007101992714D00141
对识别率的影响
γA
Figure S2007101992714D00142
分别控制周围空间中函数的复杂性和控制分布的内在几何结构函数的复杂性,针对不同的有标识样本和无标识样本的比例有所不同,从图9可以看到在有标识样本数目改变时,曲线不是严格下降的,就是因为有标识和无标识样本数目的比例变了,而两个参数保持不变。所以本发明针对全部训练集作为有标识样本,全部测试集作为无标识样本的样本数目比例固定的情况下,采用网格搜索法找到最佳的参数组合,分别设置为0.005和0.045。

Claims (3)

1.一种拉普拉斯正则化最小二乘SAR自动目标识别方法,其具体实现步骤如下:
(1)输入l个有标识样本{(xi,yi)}i=1 l,l是训练集样本的个数,xi表示第i个样本,用一个行向量表示,yi是该样本所属的类别标号,输入u个无标识样本{xj}j=l+1 l+u,u是测试集样本的个数,xj表示第j个样本,也用一个行向量表示,用l+u个数据点建立一个邻接图,数据点看作邻接图的顶点,定义Wij为邻接图的边,是成对数据点的相似性度量,上述的邻接图可以选择n近邻或者图核,n为近邻个数,边的权值选择0或1的二值权;
(2)计算第(1)步得到的邻接图的Laplacian矩阵:L=D-W,其中:L表示Laplacian矩阵,D是一个对角矩阵, D ii = Σ j = 1 l + u W ij , 即第i个点到其它各点的权值之和,其值越大表示该点越重要;
(3)采用一个核函数K(xi,xj)对第(1)步所说的l+u个数据点,计算核矩阵K,Kij=K(xi,xj),Kij表示样本i和样本j的相似性;
(4)选择正则化参数γA和γI;它们分别控制周围空间函数的复杂性和边缘分布的内在几何函数的复杂性,该两参数的确定可以采用简单的网格搜索方法来实现;
(5)采用上述(1)~(4)步得到的结果,计算向量α*,其计算公式如下:
α * = ( JK + γ A lI + γ I l ( l + u ) 2 LK ) - 1 Y
其中:J是一个(l+u)×(l+u)的对角矩阵,J=diag(1,...1,0,...,0),Y是一个(l+u)维的标识向量,Y=[y1,...yl,0,...0];
(6)输出分类函数 f * ( x ) = Σ i = 1 l + u α i * K ( x i , x ) , x表示一个测试集样本,即待识别目标,对于两类的分类问题,根据分类函数 f * ( x ) = Σ i = 1 l + u α i * K ( x i , x ) 的正负来分类,对于多类的分类问题,则采用“一对多“的策略,把有标识的当前类作为+1类,有标识的剩余样本作为-1类,无标识的样本全部标为0。当有C类时,得到C个分类函数,对无标识的每一个样本都有C个函数值,取其中最大的一个所对应的类别作为该样本所属的类别。
2.根据权利要求1所述的拉普拉斯正则化最小二乘SAR自动目标识别方法,所说的核函数的计算,可以选用以下几种核函数来进行计算:
①多项式核函数:k(x,y)=(a(x·y)+b)d,x,y表示两个样本,每个样本用一个向量表示,a,b,d均表示多项式核函数的参数;
②高斯核函数: k ( x , y ) = exp { - | | x - y | | 2 2 σ 2 } , σ2表示高斯核函数的参数;
③Sigmoid核函数:k(x,y)=tanh(α(x·y)+β),α,β表示Sigmoid核函数的参数。
本方法采用了高斯核函数,参数σ2通过核-目标配准方法,在某个参数范围上搜索,找到使 A ^ ( K ′ , yy T ) = ⟨ K ′ , yy T ⟩ ⟨ K ′ , K ′ ⟩ ⟨ yy T , yy T ⟩ 得到最大值的σ2,其中K′是关于有标识样本的核矩阵,y是有标识样本的标号列向量,yT表示y的转置。
3.根据权利要求1所述的Laplacian正则化最小二乘SAR自动目标识别方法,所说的通过 α * = ( JK + γ A lI + γ I l ( u + l ) 2 LK ) - 1 Y 得到α*,其实现过程如下:
根据再生核希尔伯特空间RKHS的两个重要事实:
第一,正则化最小二乘问题可以用 f * = arg min f ∈ H K 1 l Σ i = 1 l ( y i - f ( x i ) ) 2 + γ | | f | | K 2 来表示,其中:H表示再生核希尔伯特空间。该问题的解存在并且唯一,由“表示理论”给出解的表达形式:
f * ( x ) = Σ i = 1 l α i * K ( x i , x )
第二,‖f‖K 2可以表示成下面的式子:
| | f | | K 2 = α T Kα
α是待优化的列向量。
那么将其扩展到拉普拉斯正则化最小二乘法,它需要解决下式所表示的优化问题:
f * = min f ∈ H K 1 l Σ i = 1 l ( y i - f ( x i ) ) 2 + γ A | | f | | K 2 + γ I ( l + u ) 2 f T Lf
其解可以表达为 f * ( x ) = Σ i = 1 l + u α i * K ( x i , x ) , f * ( x ) = Σ i = 1 l + u α i * K ( x i , x ) | | f | | K 2 = α T Kα 代入 min f ∈ H K 1 l Σ i = 1 l ( y i - f ( x i ) ) 2 + γ A | | f | | K 2 + γ I ( l + u ) 2 f T Lf 中得到:
Figure S2007101992714C00039
对它求关于α的偏导数,并令该偏导数等于零,即求解 1 l ( Y - JKα ) T ( - JK ) + ( γ A K + γ I l ( l + u ) 2 KLK ) α = 0 , 则得到解的表达式 α * = ( JK + γ A lI + γ I l ( u + l ) 2 LK ) - 1 Y .
CN2007101992714A 2007-12-18 2007-12-18 拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法 Expired - Fee Related CN101196564B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101992714A CN101196564B (zh) 2007-12-18 2007-12-18 拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101992714A CN101196564B (zh) 2007-12-18 2007-12-18 拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法

Publications (2)

Publication Number Publication Date
CN101196564A true CN101196564A (zh) 2008-06-11
CN101196564B CN101196564B (zh) 2010-06-16

Family

ID=39547096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101992714A Expired - Fee Related CN101196564B (zh) 2007-12-18 2007-12-18 拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法

Country Status (1)

Country Link
CN (1) CN101196564B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101908138A (zh) * 2010-06-30 2010-12-08 北京航空航天大学 基于噪声独立成分分析的合成孔径雷达图像目标识别方法
CN101561865B (zh) * 2009-05-22 2012-03-28 西安电子科技大学 基于多参数谱特征的合成孔径雷达图像目标识别方法
CN101807258B (zh) * 2010-01-08 2012-05-23 西安电子科技大学 基于核标度切维数约简的合成孔径雷达图像目标识别方法
CN101695152B (zh) * 2009-10-12 2013-01-30 中国科学院计算技术研究所 室内定位的方法及其系统
CN103630897A (zh) * 2012-08-28 2014-03-12 中国科学院电子学研究所 一种多通道合成孔径雷达成像的方法
CN103886327A (zh) * 2014-03-07 2014-06-25 西安电子科技大学 基于2d-kpca的极化sar图像分类方法
CN104408480A (zh) * 2014-11-28 2015-03-11 安徽师范大学 一种基于Laplacian算子的特征选择方法
CN104463212A (zh) * 2014-12-09 2015-03-25 环境保护部卫星环境应用中心 基于阈值和正则化最小二乘的云检测方法和系统
CN105913073A (zh) * 2016-04-05 2016-08-31 西安电子科技大学 基于深度增量支持向量机的sar图像目标识别方法
CN105974412A (zh) * 2016-06-07 2016-09-28 电子科技大学 一种用于合成孔径雷达的目标特征提取方法
CN106874932A (zh) * 2016-12-30 2017-06-20 陕西师范大学 基于快速稀疏描述的sar目标型号识别方法
CN110009020A (zh) * 2019-03-12 2019-07-12 宁波大学 一种基于多核主元分析模型的非线性过程监测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6741202B1 (en) * 2003-04-29 2004-05-25 Kapriel V. Krikorian Techniques for 3-dimensional synthetic aperture radar
CN1327242C (zh) * 2004-07-26 2007-07-18 电子科技大学 逆合成孔径雷达机动多目标相对运动补偿方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101561865B (zh) * 2009-05-22 2012-03-28 西安电子科技大学 基于多参数谱特征的合成孔径雷达图像目标识别方法
CN101695152B (zh) * 2009-10-12 2013-01-30 中国科学院计算技术研究所 室内定位的方法及其系统
CN101807258B (zh) * 2010-01-08 2012-05-23 西安电子科技大学 基于核标度切维数约简的合成孔径雷达图像目标识别方法
CN101908138B (zh) * 2010-06-30 2012-05-23 北京航空航天大学 基于噪声独立成分分析的合成孔径雷达图像目标识别方法
CN101908138A (zh) * 2010-06-30 2010-12-08 北京航空航天大学 基于噪声独立成分分析的合成孔径雷达图像目标识别方法
CN103630897A (zh) * 2012-08-28 2014-03-12 中国科学院电子学研究所 一种多通道合成孔径雷达成像的方法
CN103886327A (zh) * 2014-03-07 2014-06-25 西安电子科技大学 基于2d-kpca的极化sar图像分类方法
CN104408480B (zh) * 2014-11-28 2018-05-04 安徽师范大学 一种基于Laplacian算子的特征选择方法
CN104408480A (zh) * 2014-11-28 2015-03-11 安徽师范大学 一种基于Laplacian算子的特征选择方法
CN104463212A (zh) * 2014-12-09 2015-03-25 环境保护部卫星环境应用中心 基于阈值和正则化最小二乘的云检测方法和系统
CN104463212B (zh) * 2014-12-09 2018-05-25 环境保护部卫星环境应用中心 基于阈值和正则化最小二乘的云检测方法和系统
CN105913073A (zh) * 2016-04-05 2016-08-31 西安电子科技大学 基于深度增量支持向量机的sar图像目标识别方法
CN105974412A (zh) * 2016-06-07 2016-09-28 电子科技大学 一种用于合成孔径雷达的目标特征提取方法
CN105974412B (zh) * 2016-06-07 2018-03-02 电子科技大学 一种用于合成孔径雷达的目标特征提取方法
CN106874932A (zh) * 2016-12-30 2017-06-20 陕西师范大学 基于快速稀疏描述的sar目标型号识别方法
CN106874932B (zh) * 2016-12-30 2020-07-10 陕西师范大学 基于快速稀疏描述的sar目标型号识别方法
CN110009020A (zh) * 2019-03-12 2019-07-12 宁波大学 一种基于多核主元分析模型的非线性过程监测方法
CN110009020B (zh) * 2019-03-12 2021-06-15 宁波大学 一种基于多核主元分析模型的非线性过程监测方法

Also Published As

Publication number Publication date
CN101196564B (zh) 2010-06-16

Similar Documents

Publication Publication Date Title
CN101196564B (zh) 拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法
CN104091321B (zh) 适用于地面激光雷达点云分类的多层次点集特征的提取方法
Li et al. A spatial–contextual support vector machine for remotely sensed image classification
CN109902590B (zh) 深度多视图特征距离学习的行人重识别方法
CN103955702B (zh) 基于深度rbf网络的sar图像地物分类方法
CN105956612B (zh) 基于主动学习和半监督学习的高光谱图像分类方法
CN101551856B (zh) 基于稀疏最小二乘支撑向量机的sar目标识别方法
CN102592134B (zh) 一种高光谱与红外数据多级决策融合分类方法
CN105718866B (zh) 一种视觉目标检测与识别方法
CN101807258B (zh) 基于核标度切维数约简的合成孔径雷达图像目标识别方法
CN107506703A (zh) 一种基于无监督局部度量学习和重排序的行人再识别方法
CN108629373B (zh) 一种图像分类方法、系统、设备及计算机可读存储介质
CN101561865B (zh) 基于多参数谱特征的合成孔径雷达图像目标识别方法
CN102208034A (zh) 基于半监督维数约减的高光谱图像分类方法
CN102982349A (zh) 一种图像识别方法及装置
CN106326938B (zh) 基于弱监督学习的sar图像目标鉴别方法
CN102982338A (zh) 基于谱聚类的极化sar图像分类方法
CN106127228A (zh) 一种基于决策模板分类器融合的遥感图像船舶检测候选区鉴别方法
CN103955709B (zh) 基于加权合成核与tmf的极化sar图像分类方法
CN104732224B (zh) 基于二维泽尔尼克矩特征稀疏表示的sar目标识别方法
CN104268510A (zh) 基于稀疏约束的非负矩阵分解的sar图像目标识别方法
CN109034213B (zh) 基于相关熵原则的高光谱图像分类方法和系统
CN113191359A (zh) 基于支持与查询样本的小样本目标检测方法与系统
CN102902976A (zh) 一种基于目标及其空间关系特性的图像场景分类方法
CN103426004A (zh) 基于纠错输出编码的车型识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100616

Termination date: 20131218