CN105320963A - 面向高分遥感图像的大尺度半监督特征选择方法 - Google Patents

面向高分遥感图像的大尺度半监督特征选择方法 Download PDF

Info

Publication number
CN105320963A
CN105320963A CN201510689508.1A CN201510689508A CN105320963A CN 105320963 A CN105320963 A CN 105320963A CN 201510689508 A CN201510689508 A CN 201510689508A CN 105320963 A CN105320963 A CN 105320963A
Authority
CN
China
Prior art keywords
remote sensing
data
sigma
feature
sensing image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510689508.1A
Other languages
English (en)
Other versions
CN105320963B (zh
Inventor
陈曦
戚金子
周共建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201510689508.1A priority Critical patent/CN105320963B/zh
Publication of CN105320963A publication Critical patent/CN105320963A/zh
Application granted granted Critical
Publication of CN105320963B publication Critical patent/CN105320963B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Abstract

面向高分遥感图像的大尺度半监督特征选择方法,属于半监督特征选择技术领域,本发明是为了解决现有高分遥感图像监督特征选择方法中,需要大量训练数据的标记,当无标记对象的数量远远大于带标记的数据时,影响被选择的特征的合理性的问题。它首先采集遥感图像数据,处理后获得归一化后的数据x;再构建基于损失函数和无标记样本的概率分布矩阵{yjk}的度量函数;对度量函数的三个参数依次循环优化,获得相应特征对应的度量值;根据所述的度量值,对特征进行排序,获得遥感图像数据的特征子集,该特征子集作为大尺度半监督特征选择方法选择获得的数据。本发明用于遥感图像的特征选择。

Description

面向高分遥感图像的大尺度半监督特征选择方法
技术领域
本发明涉及半监督特征选择方法,特别涉及一种面向高分遥感图像的大尺度半监督特征选择方法。
背景技术
通过提供精准而广泛的土地利用、土地覆盖信息,高分辨率(VHR)遥感图像在现实生活中起到了极大的作用。高分辨率遥感图像在现实生活中的应用常依赖于面向对象的图像分析(objectbasedimageanalysis,OBIA)。OBIA需要各种目标特征,包括目标的光谱、结构和形状特征,太多的底层特征会降低OBIA的性能。这个矛盾可以通过特征选择方法缓解。通过有效地选择少量具有更高辨别力的原始特征,特征选择方法对数据挖掘算法的加速,性能的提高及模型的可理解性的提高有着直接而显著的影响。
现有的特征选择方法主要分为三类:无监督,监督和半监督方法。监督特征选择算法需要大量的训练数据的标记。当无标记对象的数量远远大于带标记的数据时,监督方法往往并不适合。非监督特征选择算法忽略标记信息,却也因此可能导致算法性能的恶化。相比之下,半监督特征选择方法同时利用标记和未标记对象:有标记对象提供的监督信息通常被转化为背景知识,无标号对象提供几何结构信息。因为背景知识和几何结构信息被集成到特征选择的过程中,所以相比来说在同时存在标记数据和无标记数据的情况下,半监督方法更加有效。
尽管半监督特征选择具有优势,却很少有应用于高分辨率遥感图像的方法。不对称局部判别选择(AsymmetricallyLocalDiscriminantSelection,ALDS)基于样本对之间的多种类型关系,将类别的不对称的误分类代价引入到边的权重矩阵中。在其他的领域研究中,基于谱分析和形成相同的结构的数据点很可能会有相同的标记的假设上,提出了光谱特征选择框架(spectralfeatureselectionframework,SPEC)。通过样条回归的半监督特征选择方法(Semisupervisedfeatureselectionviasplineregression,S2FS2R)更好地利用了数据分布与标记和未标记的影像信息的局部几何结构。海森稀疏特征选择(Hessiansparsefeatureselection,HFSL)则基于l2,1/2范数矩阵范数模型和图的结构来选择最有识别力的稀疏征。
上述各种算法需要事先构建图的拉普拉斯算子矩阵,而建立一个n×n矩阵的计算成本至少是O(n2)。巨大的计算量可能导致准确捕捉高分辨率遥感图像局部几何特征能力的缺乏,并且使计算过程变得极为低效。最近,凸状半监督多标记特征选择(ConvexSemi-supervisedmulti-labelFeatureSelection,CSFS)方法可以同时利用标记数据和未标记数据来选择特性并且也考虑了不同特征之间的相关性。由于最大分辨力的提高和高光谱图像的普及,还提出了高识别、高信息和低冗余的准则。总的来说,这种不需要构建图的方法仍然十分稀缺。
发明内容
本发明目的是为了解决现有高分遥感图像监督特征选择方法中,需要大量训练数据的标记,当无标记对象的数量远远大于带标记的数据时,影响被选择的特征的合理性的问题,提供了一种面向高分遥感图像的大尺度半监督特征选择方法。
本发明所述面向高分遥感图像的大尺度半监督特征选择方法,它包括以下步骤:
步骤一:采集遥感图像数据,对遥感图像数据进行预处理;将预处理后的遥感图像分割成n个样本,对每个样本进行特征提取,获得样本数据;再将样本数据中的每个特征归一化处理后,获得归一化后的数据X;
步骤二:针对归一化后的数据X中的每一个特征构建基于损失函数和无标记样本的概率分布矩阵{yjk}的度量函数;
步骤三:对步骤二中获得的度量函数的三个参数依次循环优化,获得相应特征对应的度量值;
步骤四:根据所述的度量值,对特征进行排序,获得遥感图像数据的特征子集,该特征子集作为大尺度半监督特征选择方法选择获得的数据。
步骤一中,设定归一化后的数据X为:
其中m为对每个样本进行特征提取获得的特征数量,为归一化后的数据X中对应于第j个样本的特征,j=1,2,3,……,n;
样本总数n=nl+nu,其中nl为标记样本数,nu为无标记样本数;
xj的标记类别为yj,yj∈{1,...,c},c为类别数。
步骤二中:由第i个特征fi的目标函数Qi计算其所表征的内在数据特性,i=1,2,3,……,m;
min w i , b i , y j k Q i s . t . Q i = | | f i l w i + 1 n l b i - Y l | | F 2 + Σ j = 1 n u Σ k = 1 c y j k r | | f i j w i + b i - t k | | F 2 ∀ j , y j k ∈ [ 0 , 1 ] , Σ k = 1 c y j k r = 1 , - - - ( 1 )
其中||·||F是Frobenius范数,为fi的权重系数,为回归偏置,yjk∈[0,1]为第j个无标记样本属于第k个类别的概率,r为需要调整的自适应参数,为fi的标记部分,为包含nl个元素1的列向量,为标记数据的标记矩阵,fij为fi的第j个元素;是类别指示向量,它的第k类别的第k个元素是1,剩余元素为0;
目标函数Qi中第一项为标记数据的损失函数,第二项为无标记数据的损失函数,由概率作为其权重。
步骤三中:获得相应特征对应的度量值的具体过程为:
固定模型参数中权重系数wi和回归偏置bi,求解类别概率yjk
由于标记数据的损失函数为常量,则目标函数Qi简化为:
min y j k Σ j = 1 n u Σ k = 1 c y j k r | | f i j w i + b i - t k | | F 2 s . t . ∀ i , y i k ∈ [ 0 , 1 ] , Σ k = 1 c y i k = 1 , - - - ( 2 )
p j k = | | f i j w i + b i - t k | | F 2 , 则式(2)变形为:
min y j k Σ i = 1 n u Σ k = 1 c y j k r p i k s . t . ∀ j , y j k ∈ [ 0 , 1 ] , Σ k = 1 c y j k = 1 , - - - ( 3 )
由于公式(3)与样本无关,则有:
min y j · Σ k = 1 c y j k r p i k s . t . ∀ j , y j k ∈ [ 0 , 1 ] , Σ k = 1 c y j k = 1 , - - - ( 4 )
其中y表示Yu的第j行,且
取r>1,则公式(4)的拉格朗日函数为:
Σ k = 1 c y j k r p j k - β ( Σ k = 1 c y j k - 1 ) , - - - ( 5 )
其中β为拉格朗日乘数;
令公式(5)关于yjk的导数为0,则有:
y j k = ( β rp j k ) 1 r - 1 , - - - ( 6 )
将约束ck=1,yjk=1代入公式(6),获得类别概率yjk的封闭形式解:
y j k = ( 1 p j k ) 1 r - 1 Σ k = 1 c ( 1 p j k ) 1 r - 1 ; - - - ( 7 )
再固定类别概率求解权重系数wi和回归偏置bi,通过变形以及对目标函数Qi求关于bi的导数,有:
b i = q [ ( Y l T - w i f i l ) 1 n l + ( F T - w i f i T S ) 1 n u ] , - - - ( 8 )
其中 代表对Y中每个元素进行能量上的操作,为对角矩阵,它的第i个对角元素q为标量,
所述目标函数Qi作为相应特征对应的度量值。
步骤四中:获得遥感图像数据的特征子集的方法为:
根据目标函数Qi的度量值,对相应的特征进行排序,获得遥感图像数据的特征子集。
本发明的优点:本发明提出了一种面向高分遥感图像的大尺度半监督特征选择方法——自适应半监督特征选择(adaptivesemisupervisedfeatureselection,ASFS)方法。该方法从半监督学习方法出发,建立基于损失函数和无标记样本的概率分布矩阵的特征度量函数,通过循环优化模型求得每个特征向量对应的度量值。ASFS方法可以度量高分辨率遥感数据的特征,并且对其进行排序和选择。不同于以前的半监督学习方法,ASFS模型不依赖于图的拉普拉斯算子矩阵的构建,因此实现了计算复杂度与数据点数量之间的线性关系,对于大尺度数据也有良好的适应性,在处理海量高分遥感图像时与其他算法相比显然性能更好。同时,ASFS能够减轻噪声影响。实验评估结果表明,使用本发明所提出的ASFS算法所得结果的平均总体精度和Kappa系数均优于其他常用的特征选择算法。
本发明所述ASFS方法是一种半监督特征选择方法,它将数据的标记加入训练中,从而扩展了方法的应用广度,并且对特征进行分类时可以充分利用各种功能类别的互补信息。不同于以往的方法,ASFS并不需要构造图拉普拉斯算子矩阵。因此,ASFS可以更好的处理海量高分遥感图像。此外,ASFS自适应抑制边界点的权重。这使得模型有着健壮的边界点。实验结果表明,该方法优于传统的单一视图方法、经典方法和相关最新方法。
ASFS算法在将组织结构信息合并为前提信息后,有效的提高了被选择的特征的合理性。与其他算法相比,本发明中所提出的新方法具有更好的性能,在只有部分训练数据有标记的情况下,该优势更加明显。
附图说明
图1是本发明所述面向高分遥感图像的大尺度半监督特征选择方法的流程图;
图2a是澳大利亚悉尼沿海地区的Worldview-2实验图像;
图2b是澳大利亚悉尼沿海地区的Worldview-2地面实况参考图像;
图2c是中国深圳密集城区的Quickbird-2实验图像;
图2d是中国深圳密集城区的Quickbird-2地面实况参考图像;
图3a是针对悉尼图像采用SVM且标记样本数为10时的总体分类精度随特征数量的变化曲线;
图3b是针对悉尼图像采用1-NN且标记样本数为10时的总体分类精度随特征数量的变化曲线;
图3c是针对悉尼图像采用SVM且标记样本数为10时的Kappa系数随特征数量的变化曲线;
图3d是针对悉尼图像采用1-NN且标记样本数为10时的Kappa系数随特征数量的变化曲线;
图4a是针对悉尼图像采用SVM且标记样本数为50时的总体分类精度随特征数量的变化曲线;
图4b是针对悉尼图像采用1-NN且标记样本数为50时的总体分类精度随特征数量的变化曲线;
图4c是针对悉尼图像采用SVM且标记样本数为50时的Kappa系数随特征数量的变化曲线;
图4d是针对悉尼图像采用1-NN且标记样本数为50时的Kappa系数随特征数量的变化曲线;
图5a是针对深圳图像采用SVM且标记样本数为10时的总体分类精度随特征数量的变化曲线;
图5b是针对深圳图像采用1-NN且标记样本数为10时的总体分类精度随特征数量的变化曲线;
图5c是针对深圳图像采用SVM且标记样本数为10时的Kappa系数随特征数量的变化曲线;
图5d是针对深圳图像采用1-NN且标记样本数为10时的Kappa系数随特征数量的变化曲线;
图6a是针对深圳图像采用SVM且标记样本数为50时的总体分类精度随特征数量的变化曲线;
图6b是针对深圳图像采用1-NN且标记样本数为50时的总体分类精度随特征数量的变化曲线;
图6c是针对深圳图像采用SVM且标记样本数为50时的Kappa系数随特征数量的变化曲线;
图6d是针对深圳图像采用1-NN且标记样本数为50时的Kappa系数随特征数量的变化曲线;
具体实施方式
具体实施方式一:下面结合图1至图6说明本实施方式,本实施方式所述面向高分遥感图像的大尺度半监督特征选择方法,它包括以下步骤:
步骤一:采集遥感图像数据,对遥感图像数据进行预处理;将预处理后的遥感图像分割成n个样本,对每个样本进行特征提取,获得样本数据;再将样本数据中的每个特征归一化处理后,获得归一化后的数据X;
步骤二:针对归一化后的数据X中的每一个特征构建基于损失函数和无标记样本的概率分布矩阵{yjk}的度量函数;
步骤三:对步骤二中获得的度量函数的三个参数依次循环优化,获得相应特征对应的度量值;
步骤四:根据所述的度量值,对特征进行排序,获得遥感图像数据的特征子集,该特征子集作为大尺度半监督特征选择方法选择获得的数据。
步骤一中,设定归一化后的数据X为:
其中m为对每个样本进行特征提取获得的特征数量,为归一化后的数据X中对应于第j个样本的特征,j=1,2,3,……,n;
样本总数n=nl+nu,其中nl为标记样本数,nu为无标记样本数;
xj的标记类别为yj,yj∈{1,...,c},c为类别数。
步骤二中:由第i个特征fi的目标函数Qi计算其所表征的内在数据特性,i=1,2,3,……,m;
min w i , b i , y j k Q i s . t . Q i = | | f i l w i + 1 n l b i - Y l | | F 2 + Σ j = 1 n u Σ k = 1 c y j k r | | f i j w i + b i - t k | | F 2 ∀ j , y j k ∈ [ 0 , 1 ] , Σ k = 1 c y j k r = 1 , - - - ( 1 )
其中||·||F是Frobenius范数,为fi的权重系数,为回归偏置,yjk∈[0,1]为第j个无标记样本属于第k个类别的概率,r为需要调整的自适应参数,为fi的标记部分,为包含nl个元素1的列向量,为标记数据的标记矩阵,fij为fi的第j个元素;是类别指示向量,它的第k类别的第k个元素是1,剩余元素为0;
目标函数Qi中第一项为标记数据的损失函数,第二项为无标记数据的损失函数,由概率作为其权重。
步骤三中:获得相应特征对应的度量值的具体过程为:
固定模型参数中权重系数wi和回归偏置bi,求解类别概率yjk
由于标记数据的损失函数为常量,则目标函数Qi简化为:
min y j k Σ j = 1 n u Σ k = 1 c y j k r | | f i j w i + b i - t k | | F 2 s . t . ∀ i , y i k ∈ [ 0 , 1 ] , Σ k = 1 c y i k = 1 , - - - ( 2 )
p j k = | | f i j w i + b i - t k | | F 2 , 则式(2)变形为:
min y j k Σ i = 1 n u Σ k = 1 c y j k r p i k s . t . ∀ j , y j k ∈ [ 0 , 1 ] , Σ k = 1 c y j k = 1 , - - - ( 3 )
由于公式(3)与样本无关,则有:
min y j · Σ k = 1 c y j k r p i k s . t . ∀ j , y j k ∈ [ 0 , 1 ] , Σ k = 1 c y j k = 1 , - - - ( 4 )
其中y表示Yu的第j行,且
取r>1,则公式(4)的拉格朗日函数为:
Σ k = 1 c y j k r p j k - β ( Σ k = 1 c y j k - 1 ) , - - - ( 5 )
其中β为拉格朗日乘数;
令公式(5)关于yjk的导数为0,则有:
y j k = ( β rp j k ) 1 r - 1 , - - - ( 6 )
将约束ck=1,yjk=1代入公式(6),获得类别概率yjk的封闭形式解:
y j k = ( 1 p j k ) 1 r - 1 Σ k = 1 c ( 1 p j k ) 1 r - 1 ; - - - ( 7 )
再固定类别概率求解权重系数wi和回归偏置bi,通过变形以及对目标函数Qi求关于bi的导数,有:
b i = q [ ( Y l T - w i f i l ) 1 n l + ( F T - w i f i T S ) 1 n u ] , - - - ( 8 )
其中 代表对Y中每个元素进行能量上的操作,为对角矩阵,它的第i个对角元素q为标量,
所述目标函数Qi作为相应特征对应的度量值。
步骤四中:获得遥感图像数据的特征子集的方法为:
根据目标函数Qi的度量值,对相应的特征进行排序,获得遥感图像数据的特征子集。
步骤一中对每个样本进行特征向量提取,所述特征向量如下表1中所示:
表1
对遥感图像数据进行预处理包括对其进行分割、提取特征及归一化等。对每个特征向量归一化处理指将每个特征都归一化到[0,1]区间。对每个样本进行特征向量提取,获得的特征向量集合用{fi}表示。
步骤三中,若r=1,则公式(4)可写为:
yjk=1,ifk=k*
,(9)
yjk=0,ifk≠k*
其中r有助于自动调整目标的权重。特征空间决策边界周围的无标签目标常有相似的类别概率,因此可能会带来巨大的误差。假设目标xj为边界目标,则有yjk=1/c。当r>1时,边界目标的权重将比确定类别的目标的权重小得多。在这种情况下,边界目标将被抑制,因此ASFS算法具有更好的鲁棒性。公式(5)得到了所述问题的最优化解。
步骤四中对相应的原始特征向量进行排序,需要根据实际情况将最好几个的特征选入最后的特征子集。
本发明方法从半监督学习方法出发,通过选择性的优化关键变量,模型参数和无标号对象的类别概率分布,对目标方程进行求解。ASFS方法可以测量数据的特征,并且对其进行排序和选择。同时,ASFS能够应付离群值。
下面采用具体实施例验证本发明的效果:
为了验证本发明所提出的ASFS算法在解决高分辨率遥感图像处理问题上的性能,将它和拉普拉斯分数(LaplacianScore,LS)、mcLogisticC算法、SPEC算法、TRCFS算法、S2FS2R算法进行实验比较。如图2所示,实验所用数据集为两幅高分辨率遥感图像,分别为Sydney的Worldview-2图和Shenzhen的Quickbird-2图,该图像通过eCognitionDeveloper使用多尺度分割技术进行分割。分割参数包括紧密性,平滑度,形状,颜色和尺度参数,分别被设置为0.5,0.5,0.1,0.9和50。分别应用SVM和1-NN这两种常用监督分类方法,在标记样本数分别为10和50的情况下进行试验,实验过程重复多次进行,计算每种算法所得结果的所有维度平均总体精度和Kappa系数,实验结果见图3至图6。
由图3至图6可看出,从整体来看,本发明所提出的ASFS算法在平均总体精度和Kappa系数上占有一定优势。在图3和图5中,ASFS方法在所选择的特征数在100以内时效果明显好于其他算法;在图4和图6中,随着标记样本数增加到50,ASFS算法的表现依旧占有优势,但与标记样本数较少时相比,优势减小。另外随着特征数的不断增大,所有算法的结果均趋于相同。说明在特征数极高时,各类算法效果相仿,但特征数有限时,我们所提出的ASFS算法效果明显更优。
表2和表3选取了针对两幅高分辨率遥感图像,在标记样本数为10时,ASFS算法和LS算法、mcLogisticC算法、SPEC算法、TRCFS算法、S2FS2R算法在所有维度上的平均总体精度和Kappa系数。表4和表5为相同实验条件下标记样本数为50时的实验结果。
表2针对Sydney数据集标记样本数为10时所有维度平均总体精度和Kappa系数
表3针对Shenzhen数据集标记样本数为10时所有维度平均总体精度和Kappa系数
表4针对Sydney数据集标记样本数为50时所有维度平均总体精度和Kappa系数
表5针对Shenzhen数据集标记样本数为50时所有维度平均总体精度和Kappa系数
从表2和表3可以看出针对两种不同的数据集,ASFS算法产生的结果好于其他算法。以针对Sydney数据集使用SVM监督分类方法时为例,ASFS算法平均总体精度最高,为58.18,TRCFS算法其次,为51.67,Kappa系数分别为40.54和35.74,mcLogisticC算法平均总体精度最低,仅为44.53。使用1-NN分类方法时,仍是ASFS算法平均总体精度最高,为68.41,其次是S2FS2R算法,最低的为SPEC算法,Kappa系数分别为53.32,51.23和49.07。从表4和表5,同样可看出ASFS算法产生的结果好于其他算法。由此,可得出结论,基于本发明所提出的ASFS算法,可以有效提高对高分辨率遥感图像进行半监督特征选择的平均总体精度和Kappa系数。

Claims (5)

1.一种面向高分遥感图像的大尺度半监督特征选择方法,其特征在于,它包括以下步骤:
步骤一:采集遥感图像数据,对遥感图像数据进行预处理;将预处理后的遥感图像分割成n个样本,对每个样本进行特征提取,获得样本数据;再将样本数据中的每个特征归一化处理后,获得归一化后的数据X;
步骤二:针对归一化后的数据X中的每一个特征构建基于损失函数和无标记样本的概率分布矩阵{yjk}的度量函数;
步骤三:对步骤二中获得的度量函数的三个参数依次循环优化,获得相应特征对应的度量值;
步骤四:根据所述的度量值,对特征进行排序,获得遥感图像数据的特征子集,该特征子集作为大尺度半监督特征选择方法选择获得的数据。
2.根据权利要求1所述的面向高分遥感图像的大尺度半监督特征选择方法,其特征在于,步骤一中,设定归一化后的数据X为:
其中m为对每个样本进行特征提取获得的特征数量,为归一化后的数据X中对应于第j个样本的特征,j=1,2,3,……,n;
样本总数n=nl+nu,其中nl为标记样本数,nu为无标记样本数;
xj的标记类别为yj,yj∈{1,...,c},c为类别数。
3.根据权利要求2所述的面向高分遥感图像的大尺度半监督特征选择方法,其特征在于,步骤二中:由第i个特征fi的目标函数Qi计算其所表征的内在数据特性,i=1,2,3,……,m;
min w i , b i , y j k Q i s . t . Q i = | | f i l w i + 1 n l b i - Y l | | F 2 + Σ j = 1 n u Σ k = 1 c y j k r | | f i j w i + b i - t k | | F 2 ∀ j , y j k ∈ [ 0 , 1 ] , Σ k = 1 c y j k = 1 , - - - ( 1 )
其中||·||F是Frobenius范数,为fi的权重系数,为回归偏置,yjk∈[0,1]为第j个无标记样本属于第k个类别的概率,r为需要调整的自适应参数,为fi的标记部分,为包含nl个元素1的列向量,为标记数据的标记矩阵,fij为fi的第j个元素;是类别指示向量,它的第k类别的第k个元素是1,剩余元素为0;
目标函数Qi中第一项为标记数据的损失函数,第二项为无标记数据的损失函数,由概率作为其权重。
4.根据权利要求3所述的面向高分遥感图像的大尺度半监督特征选择方法,其特征在于,步骤三中:获得相应特征对应的度量值的具体过程为:
固定模型参数中权重系数wi和回归偏置bi,求解类别概率yjk
由于标记数据的损失函数为常量,则目标函数Qi简化为:
min y j k Σ j = 1 n u Σ k = 1 c y j k r | | f i j w i + b i - t k | | F 2 s . t . ∀ i , y i k ∈ [ 0 , 1 ] , Σ k = 1 c y i k = 1 , - - - ( 2 )
p j k = | | f i j w i + b i - t k | | F 2 , 则式(2)变形为:
min y j k Σ i = 1 n u Σ k = 1 c y j k r p i k s . t . ∀ j , y j k ∈ [ 0 , 1 ] , Σ k = 1 c y j k = 1 , - - - ( 3 )
由于公式(3)与样本无关,则有:
min y j . Σ k = 1 c y j k r p i k s . t . ∀ j , y j k ∈ [ 0 , 1 ] , Σ k = 1 c y j k = 1 , - - - ( 4 )
其中y表示Yu的第j行,且
取r>1,则公式(4)的拉格朗日函数为:
Σ k = 1 c y j k r p j k - β ( Σ k = 1 c y j k - 1 ) , - - - ( 5 )
其中β为拉格朗日乘数;
令公式(5)关于yjk的导数为0,则有:
y j k = ( β rp j k ) 1 r - 1 , - - - ( 6 )
将约束ck=1,yjk=1代入公式(6),获得类别概率yjk的封闭形式解:
y j k = ( 1 p j k ) 1 r - 1 Σ k = 1 c ( 1 p j k ) 1 r - 1 ; - - - ( 7 )
再固定类别概率求解权重系数wi和回归偏置bi,通过变形以及对目标函数Qi求关于bi的导数,有:
b i = q [ ( Y l T - w i f i l ) 1 n l + ( F T - w i f i T S ) 1 n u ] , - - - ( 8 )
其中 代表对Y中每个元素进行能量上的操作,为对角矩阵,它的第i个对角元素q为标量, q = 1 n l + 1 n u T S 1 n u ;
所述目标函数Qi作为相应特征对应的度量值。
5.根据权利要求4所述的面向高分遥感图像的大尺度半监督特征选择方法,其特征在于,步骤四中:获得遥感图像数据的特征子集的方法为:
根据目标函数Qi的度量值,对相应的特征进行排序,获得遥感图像数据的特征子集。
CN201510689508.1A 2015-10-21 2015-10-21 面向高分遥感图像的大尺度半监督特征选择方法 Active CN105320963B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510689508.1A CN105320963B (zh) 2015-10-21 2015-10-21 面向高分遥感图像的大尺度半监督特征选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510689508.1A CN105320963B (zh) 2015-10-21 2015-10-21 面向高分遥感图像的大尺度半监督特征选择方法

Publications (2)

Publication Number Publication Date
CN105320963A true CN105320963A (zh) 2016-02-10
CN105320963B CN105320963B (zh) 2018-10-02

Family

ID=55248317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510689508.1A Active CN105320963B (zh) 2015-10-21 2015-10-21 面向高分遥感图像的大尺度半监督特征选择方法

Country Status (1)

Country Link
CN (1) CN105320963B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740917A (zh) * 2016-03-21 2016-07-06 哈尔滨工业大学 带有标签学习的高分遥感图像的半监督多视图特征选择方法
CN105809172A (zh) * 2016-03-07 2016-07-27 哈尔滨工业大学 面向高分辨率遥感图像的有效半监督特征选择方法
CN108564097A (zh) * 2017-12-05 2018-09-21 华南理工大学 一种基于深度卷积神经网络的多尺度目标检测方法
CN108830336A (zh) * 2018-06-27 2018-11-16 重庆交通大学 一种面向高分影像的地物特征筛选方法
CN109299668A (zh) * 2018-08-30 2019-02-01 中国科学院遥感与数字地球研究所 一种基于主动学习和聚类分析的高光谱图像分类方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060050953A1 (en) * 2004-06-18 2006-03-09 Farmer Michael E Pattern recognition method and apparatus for feature selection and object classification
CN101853394A (zh) * 2010-05-14 2010-10-06 中国农业大学 基于改进蚁群算法的图像特征优化选择方法与系统
CN102096825A (zh) * 2011-03-23 2011-06-15 西安电子科技大学 基于图的半监督高光谱遥感图像分类方法
CN102930275A (zh) * 2012-10-29 2013-02-13 福州大学 基于Cramer’s V指数的遥感影像特征选择方法
CN104680169A (zh) * 2015-03-18 2015-06-03 哈尔滨工业大学 一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060050953A1 (en) * 2004-06-18 2006-03-09 Farmer Michael E Pattern recognition method and apparatus for feature selection and object classification
CN101853394A (zh) * 2010-05-14 2010-10-06 中国农业大学 基于改进蚁群算法的图像特征优化选择方法与系统
CN102096825A (zh) * 2011-03-23 2011-06-15 西安电子科技大学 基于图的半监督高光谱遥感图像分类方法
CN102930275A (zh) * 2012-10-29 2013-02-13 福州大学 基于Cramer’s V指数的遥感影像特征选择方法
CN104680169A (zh) * 2015-03-18 2015-06-03 哈尔滨工业大学 一种面向高空间分辨率遥感图像专题信息提取的半监督诊断性特征选择方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
史彩娟等: ""基于Hessian半监督特征选择的网络图像标注"", 《计算机应用研究》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809172A (zh) * 2016-03-07 2016-07-27 哈尔滨工业大学 面向高分辨率遥感图像的有效半监督特征选择方法
CN105809172B (zh) * 2016-03-07 2019-07-02 哈尔滨工业大学 面向高分辨率遥感图像的有效半监督特征选择方法
CN105740917A (zh) * 2016-03-21 2016-07-06 哈尔滨工业大学 带有标签学习的高分遥感图像的半监督多视图特征选择方法
CN105740917B (zh) * 2016-03-21 2019-02-19 哈尔滨工业大学 带有标签学习的遥感图像的半监督多视图特征选择方法
CN108564097A (zh) * 2017-12-05 2018-09-21 华南理工大学 一种基于深度卷积神经网络的多尺度目标检测方法
CN108564097B (zh) * 2017-12-05 2020-09-22 华南理工大学 一种基于深度卷积神经网络的多尺度目标检测方法
CN108830336A (zh) * 2018-06-27 2018-11-16 重庆交通大学 一种面向高分影像的地物特征筛选方法
CN108830336B (zh) * 2018-06-27 2021-08-13 重庆交通大学 一种面向高分影像的地物特征筛选方法
CN109299668A (zh) * 2018-08-30 2019-02-01 中国科学院遥感与数字地球研究所 一种基于主动学习和聚类分析的高光谱图像分类方法
CN109299668B (zh) * 2018-08-30 2021-10-19 中国科学院遥感与数字地球研究所 一种基于主动学习和聚类分析的高光谱图像分类方法

Also Published As

Publication number Publication date
CN105320963B (zh) 2018-10-02

Similar Documents

Publication Publication Date Title
CN110334765B (zh) 基于注意力机制多尺度深度学习的遥感影像分类方法
CN108664924B (zh) 一种基于卷积神经网络的多标签物体识别方法
CN107491792B (zh) 基于特征映射迁移学习的电网故障分类方法
CN101551809B (zh) 基于高斯混合模型分类的sar图像检索方法
CN105320963A (zh) 面向高分遥感图像的大尺度半监督特征选择方法
CN102930533B (zh) 一种基于改进k-均值聚类的半监督高光谱影像降维方法
CN108875816A (zh) 融合置信度准则和多样性准则的主动学习样本选择策略
CN106203523A (zh) 基于梯度提升决策树半监督算法融合的高光谱图像分类
CN109523520A (zh) 一种基于深度学习的染色体自动计数方法
CN105260738A (zh) 基于主动学习的高分辨率遥感影像变化检测方法及系统
CN105389583A (zh) 图像分类器的生成方法、图像分类方法和装置
CN105678261B (zh) 基于有监督图的直推式数据降维方法
CN105825502A (zh) 一种基于显著性指导的词典学习的弱监督图像解析方法
CN106611423B (zh) 基于脊波滤波器和反卷积结构模型的sar图像分割方法
CN105184298A (zh) 一种快速局部约束低秩编码的图像分类方法
CN104598885A (zh) 街景图像中的文字标牌检测与定位方法
CN108447057A (zh) 基于显著性和深度卷积网络的sar图像变化检测方法
CN104268556A (zh) 一种基于核低秩表示图和空间约束的高光谱图像分类方法
CN103577841A (zh) 一种无监督多视图特征选择的人体行为识别方法
CN107219510B (zh) 基于无限最大间隔线性判别投影模型的雷达目标识别方法
CN109753874A (zh) 一种基于机器学习的低慢小雷达目标分类方法
Ge et al. Fine-grained bird species recognition via hierarchical subset learning
CN103456017B (zh) 基于种子集的半监督权重核模糊聚类的图像分割方法
CN113723492A (zh) 一种改进主动深度学习的高光谱图像半监督分类方法及装置
CN106651884A (zh) 基于素描结构的平均场变分贝叶斯sar图像分割方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant