CN113343804B - 面向单视全极化sar数据的集成迁移学习分类方法及系统 - Google Patents

面向单视全极化sar数据的集成迁移学习分类方法及系统 Download PDF

Info

Publication number
CN113343804B
CN113343804B CN202110577250.1A CN202110577250A CN113343804B CN 113343804 B CN113343804 B CN 113343804B CN 202110577250 A CN202110577250 A CN 202110577250A CN 113343804 B CN113343804 B CN 113343804B
Authority
CN
China
Prior art keywords
sample
target domain
samples
class
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110577250.1A
Other languages
English (en)
Other versions
CN113343804A (zh
Inventor
孙维东
赵伶俐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202110577250.1A priority Critical patent/CN113343804B/zh
Publication of CN113343804A publication Critical patent/CN113343804A/zh
Application granted granted Critical
Publication of CN113343804B publication Critical patent/CN113343804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种面向单视全极化SAR数据的集成迁移学习分类方法,采用全图分割和局部开窗分割,利用图像空间上下文信息浓缩源域有标签样本量和扩充目标域有标签样本量;然后结合散射矢量相似性系数和适应度函数设置源域有标签样本选取过程,根据目标域类别中心调整训练评判器模型所用源域样本分布;引入对弱分类器可靠性的参考信息作为权重因子,采用加权形式利用迁移弱分类器进行类别软预测,给予预测结果一致的目标域无标签像元伪标签,以扩充目标域有标签样本量并训练新弱分类器;通过迭代利用生成的迁移弱分类器集合完成目标域所有像元的集成分类。本发明能够显著降低雷达图像分类任务对目标域标签信息的高度依赖,提高分类效率和自动化水平。

Description

面向单视全极化SAR数据的集成迁移学习分类方法及系统
技术领域
本发明属于全极化雷达遥感图像处理技术领域,设计一种基于全极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,POLSAR)单视数据进行地物集成分类的迁移学习新方法及系统。
背景技术
遥感技术可以不与目标直接接触而进行远距离观测,是获取区域性地表信息的理想方式。遥感图像监督分类是利用有类别标签的像元样本建立识别模型,从而推断图像中其他像元所属类别的过程,其在土地利用管理、土地覆盖变化等方面有着巨大的应用潜力,能够为了解和规划土地用途、评估自然灾害影响、组织灾区救援与重建等工作提供重要支撑。在各类遥感传感器中,合成孔径雷达(Synthetic Aperture Radar,SAR)以其全天时、全天候的成像优势,成为了整个遥感观测体系中不可或缺的一部分。随着近年来雷达遥感卫星的频繁发射,海量雷达图像为雷达遥感图像处理技术的发展与应用提供了肥沃的土壤,同时也对雷达图像处理的自动化水平提出了严峻挑战。目前,雷达图像的产出速度与雷达图像的解译处理效率已存在严重的不匹配现象:在监督分类方面,有标签样本最直接的获取方式是在卫星过境观测期间,同步或近同步地开展实地调绘工作,但这种方式效率较低、耗资较大,且部分区域地形地势险峻,难以到达;另一种替代的方式是对雷达影像进行目视解译,但由于SAR的微波工作频段和特殊的侧视成像方式,其影像迥异于常规可见光图像,导致目视解译非常依赖于专家知识。考虑到存档图像中已有丰富的历史标签信息,若能将历史标签样本迁移至新的雷达数据进行类别信息共享,辅助完成当前分类任务,则可大大降低对当前待分类影像中的标签信息需求,提高雷达图像解译自动化程度。然而,现阶段的迁移学习技术主要是聚焦于常规的模式识别任务,未能结合遥感图像中的空间上下文信息和雷达散射矢量数据特性设计算法,直接用在SAR图像中易引起负迁移效应;此外,全极化合成孔径雷达(POLSAR)采用多通道形式获取地物目标后向散射信息,分类结果极易受斑点噪声影响。降低噪声影响的常用方式是采用多视处理,即利用空域集合平均求取散射矢量的二阶统计量作为分类器的输入特征,但这种处理人为地降低了空间分辨率,损失了大量空间细节。
发明内容
本发明的目的即在于直接使用POLSAR单视复散射矢量数据,并通过引入雷达图像空间上下文信息和散射矢量相似性系数建立集成迁移学习模型,利用大量历史数据中的有标签样本辅助极少量当前数据中的有标签样本完成地物分类。
本发明的技术方案提供一种面向单视全极化SAR数据的集成迁移学习分类方法,采用全图分割和局部开窗分割的方式,利用图像空间上下文信息浓缩源域有标签样本量和扩充目标域有标签样本量;然后结合散射矢量相似性系数和适应度函数设置源域有标签样本选取过程,根据目标域类别中心动态调整训练评判器模型所用的源域样本分布;随后引入对弱分类器可靠性的参考信息作为权重因子,采用加权形式利用迁移弱分类器进行类别软预测,给予预测结果一致的目标域无标签像元伪标签,以此扩充目标域有标签样本量并训练新的弱分类器;通过迭代运行,最终利用生成的迁移弱分类器集合完成目标域所有像元的集成分类。
而且,实现过程包括以下步骤:
步骤1,将整景历史存档图像作为源域,对整景历史存档图像进行分割处理,得到源域全部像元的图斑对象索引值;
步骤2,初始化源域有标签样本集合DS为空,然后遍历源域图斑对象索引值,若具有同一索引值的源域像元具有相同的类别标签c,则取这些像元的复散射矢量均值作为样本值,并以c作为标签,加入至集合DS
步骤3,将当前待分类的影像作为目标域,在当前待分类的影像中,以稀少的有标签样本为中心,分别开大小为Nwin×Nwin的窗口,在各窗口中进行分割处理,得到窗口内像元的图斑对象索引值;其中,Nwin为预设的窗口尺寸值;
步骤4,初始化目标域扩充样本集合C为空,然后在步骤3开的各窗口内,找到与窗口中心具有相同索引值的像元,分别取这些像元的复散射矢量作为样本值、中心像元的类别标签作为这些像元的标签,加入至集合C;
步骤5,原始目标域有标签样本集合DTL仅含稀少的目标域标签样本,将集合C中样本全部加入DTL中,进行扩充更新;
步骤6,根据DTL中样本散射矢量值和标签信息,得到目标域中各类别散射中心,计算DS中源域样本与目标域类别中心间的散射相似性系数r
步骤7,计算DS中样本在目标域类别中的适应度,规范化后作为样本被选择的概率;随后,根据适应度大小从DS有放回地选取样本,构建源域样本子集,并与DTL融合形成融合子集;重复上述过程m次,生成m个融合子集D1,D2,…,Dm,其中m为预设的次数;
步骤8,逐个利用融合子集作为独立的训练数据集,训练分类模型作为评判器,构成包含m个评判器的模型集合H;
步骤9,逐个利用H中每个评判器模型独立地对目标域无标签像元样本进行分类,即对每个被分类的像元样本均产生m个预测标签;
步骤10,利用目标域有标签样本集DTL作为训练数据集,训练新的分类模型作为弱分类器;
步骤11,将步骤10中完全基于目标域样本训练得到的弱分类器加入到迁移弱分类器集合F中,对其进行更新;
步骤12,利用F中每个弱分类器对目标域无标签像元样本进行类别预测,独立地输出预测样本从属于各类别的概率或与各类别中心的距离;
步骤13,遍历全部目标域无标签样本,比较利用H得到的m个预测标签与利用F得到的预测标签是否一致;取共计m+1个预测标签完全一致的样本构成目标域伪标签样本扩充集合C,C中每个样本的标签为其预测标签;
步骤14,判断是否集合F中的弱分类器数量不少于阈值T,或者,集合C中的样本数量不大于阈值N;
若是,则输出迁移弱分类器集合F,进入步骤15;否则,返回到步骤5,再次执行步骤5至步骤14;
步骤15,利用F中弱分类器独立完成剩余目标域无标签像元样本的分类,对各弱分类器预测类别进行多数投票作为最终的样本标签,从而完成了全部目标域像元的分类结果输出。
而且,步骤1采用POLSRM分割算法实现对整景历史存档图像进行分割处理。
而且,步骤6中,计算DS中源域样本与目标域类别中心间的散射相似性系数r方式实现如下,
Figure BDA0003084858820000031
式中,Ωx为任一DS中的复散射矢量样本值,Ωc为目标域中某类别c的复散射矢量中心;上标H代表共轭转置运算,|·|为求模运算,||·||2为矢量2范数。
而且,根据适应度大小从DS有放回地选取样本,构建源域样本子集,并与DTL融合形成融合子集
而且,步骤7中,适应度计算实现如下,
Figure BDA0003084858820000032
其中,I[·]是二值函数,方括号内条件为真时I[·]=1,条件为假时I[·]=0;x表示DS中某样本,cx是样本x的真实类别,
Figure BDA0003084858820000041
是目标域各类别中心中与该样本相似性系数最高的类别,nc是地物类别总数;H(x)为基于该样本相似性系数序列得到的熵值。
而且,步骤12中,进行类别预测实现如下,
对于任一样本x,将各弱分类器的预测概率或距离加权平均,找到概率平均值最大或距离平均值最小的类别作为F对该样本类别的预测标签;对于某类别c,样本x属于c的加权概率或与c中心的加权距离为dc(x),则
Figure BDA0003084858820000042
其中,|F|是集合F中的弱分类器总数,
Figure BDA0003084858820000043
是第i个弱分类器预测x属于c的概率或x与类别c中心的距离,wi是第i个弱分类器的权重。
另一方面,本发明还提供一种面向单视全极化SAR数据的集成迁移学习分类系统,用于实现如上所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。
而且,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。
或者,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。
本发明的创新之处在于,以往的集成迁移学习方法直接利用有标签样本建立弱分类器集合,当目标域有标签样本数量过于稀少时,不充分且蕴含一定偏差因素的监督信息非常容易导致过拟合和负迁移问题。尤其是在POLSAR单视数据中,严重的相干斑噪声会加剧上述问题。本发明采用局部开窗分割的方式,利用图像空间上下文信息提取目标域样本,然后根据目标域类别中心动态调整训练评判器模型所用的源域样本分布,既增加了目标域有标签样本量又降低了选取到源域干扰样本的可能,减小了过拟合和负迁移风险,可大大提高迁移鲁棒性。本发明在集成学习框架下,面向全极化雷达单视数据特性进行了迁移学习形式扩展,在迭代训练新的弱分类器的同时持续更新融合子集和评判器模型集合,相当于不断用性能更高的评判器辅助预测样本标签,从而有助于降低相干斑噪声的不利影响,提高迁移分类精度。综上,本发明能够显著降低雷达图像分类任务对目标域标签信息的高度依赖,提高分类效率和自动化水平。再考虑到雷达传感器全天时、全天候的观测优势,本发明将可为土地覆盖利用与规划、国土资源调查、灾区灾情评估等任务提供充分保障,具有广阔的应用前景和经济价值。
附图说明
图1是本发明实施例的流程图。
具体实施方式
以下结合附图和实施例详细说明本发明技术方案。
大体上,POLSAR原始单视数据包含特定极化基(一般是水平-垂直极化基)下获取的4个通道数据,因此每一像元均对应着一个2×2大小的复数矩阵,称为S2散射矩阵:
Figure BDA0003084858820000051
在满足互易性前提时,可不失一般性地将该矩阵矢量化为3维复散射矢量Ω如下:
Figure BDA0003084858820000052
其中的矩阵元素sXX、sXY、sYX、sYY分别表示发射X极化波-接收X极化波、发射Y极化波-接收X极化波、发射X极化波-接收Y极化波、发射Y极化波-接收Y极化波组合下的复后向散射系数。X和Y一般为水平、垂直极化,但也可取其他相互正交的极化方式。一方面,获取有标签样本的高昂代价制约了雷达图像分类效率;另一方面,由于雷达图像易受斑点噪声干扰,处理雷达图像前往往需要进行多视处理以得到散射信息的二阶统计量,这一操作导致空间分辨率的降低。
为了提高POLSAR影像处理效率,仅基于稀少目标域监督样本完成地物分类,本发明实施例首先分别对源域和目标域图像采用全局和局部分割,减少噪声影响的同时增加目标域有标记样本数量。由于目标域监督信息不充分且可能有偏,通过引入源域监督信息帮助筛选目标域样本以提高目标域分类器泛化能力是十分必要的。本实施例在机器学习领域广泛采用的集成学习框架下,进行了面向地物分类的迁移学习形式扩展,同时适当融入POLSAR数据特性降低负迁移风险,最终完成整景目标域影像迁移分类。
本发明的技术方案为,分别采用全图分割和局部开窗分割的方式,利用图像空间上下文信息浓缩源域有标签样本量和扩充目标域有标签样本量;然后结合散射矢量相似性系数和本发明提出的适应度函数设计源域有标签样本选取过程,可根据目标域类别中心动态调整训练评判器模型所用的源域样本分布;随后引入对弱分类器可靠性的参考信息作为权重因子,采用加权形式利用迁移弱分类器进行类别软预测,给予预测结果一致的目标域无标签像元伪标签,以此扩充目标域有标签样本量并训练新的弱分类器。随上述样本选取、类别预测等步骤的迭代运行,最终可利用生成的迁移弱分类器集合完成目标域所有像元的集成分类。
本发明技术方案可采用计算机技术实现自动运行,如图1所示,本发明实施例提供的一种面向单视全极化SAR数据的集成迁移学习分类方法的流程包括以下步骤:
步骤1,源域图像整景分割处理。
对整景历史存档图像(以下称为源域)进行分割处理,得到源域全部像元的图斑对象索引值。
具体实施时,分割方法可自行选择图像分割的常用算法实现。
实施例优选采用POLSRM分割算法,为便于实施参考起见提供说明如下:
首先,逐像元计算与相邻像元间的归一化梯度g(x,x'),
Figure BDA0003084858820000061
其中,x为待处理像元,x'为其相邻像元,此处
Figure BDA0003084858820000062
Figure BDA0003084858820000063
为待处理像元和相邻像元在发射X极化波、接收X极化波组合下的后向散射强度值,
Figure BDA0003084858820000064
Figure BDA0003084858820000065
为待处理像元和相邻像元在发射X极化波、接收Y极化波组合下的后向散射强度值,
Figure BDA0003084858820000066
Figure BDA0003084858820000067
为待处理像元和相邻像元在发射Y极化波、接收Y极化波组合下的后向散射强度值。
按照梯度结果对所有像元与其相邻像元组成的像元对升序排序。根据排序顺序依次判断像元对(x,x')各自所属的图斑对象是否需要融合,判断方式如下:
Figure BDA0003084858820000068
融合R(x)和R(x')
else
不进行融合
式中,R(x)为像元x所在图斑对象,R(x')为相邻像元x'所在图斑对象,nR(x)和nR(x')为各自图斑对象所占像元总数,N为分割影像的像元总数;
Figure BDA0003084858820000069
为像元x和相邻像元x'所在图斑对象的后向散射强度值,下标AB代表发射A极化波、接收B极化波的电磁波组合,AB=XX、XY、YY;L为分割尺度参数,一般设置为不大于1024的任意正整数;C代表用户预先设定的恒虚警率,如0.0001。初始默认每一像元自身即为一个图斑对象。
此公式代表在设定的恒虚警率C下,两个图斑对象源自同一地物目标的可能性。
为防止图斑对象过于细碎,可加入分割后处理,将小图斑强制融合到梯度最小的相邻图斑中。最后更新对象索引号,去除不连续的索引值。
步骤2,源域有标签样本集提取。
初始化源域有标签样本集合DS为空,然后遍历源域图斑对象索引值:若具有同一索引值的源域像元同样具有相同的类别标签c,则取这些像元的复散射矢量均值作为样本值、c作为标签,加入至集合DS
以上利用整景图像分割,引入空间上下文信息以提取源域代表性图斑样本,降低噪声影响的同时减少了后续源域样本运算量。
步骤3,目标域图像局部分割处理。
在具体实施中,可由本领域技术人员根据具体影像情况相应设置窗口尺寸值Nwin。在当前待分类的影像(以下称为目标域)中,以稀少的有标签样本(每一类别至少存在一个目标域有标签的样本)为中心,分别开大小为Nwin×Nwin的窗口,在各窗口中进行分割处理,得到窗口内像元的图斑对象索引值。分割方法同步骤1中所用算法即可。
步骤4,目标域伪标签扩充集提取。
初始化目标域扩充样本集合C为空,然后在步骤3开的各窗口内,找到与窗口中心具有相同索引值的像元,分别取这些像元的复散射矢量作为样本值、中心像元的类别标签作为这些像元的标签,加入至集合C。
步骤5,目标域有标签样本集更新。
起初,由稀少的目标域标签样本构成了原始的目标域有标签样本集合DTL。此步将集合C中像元样本及其标签信息全部加入DTL中,对其进行扩充更新。以上通过开窗局部分割获取了有标签样本的同质像元位置,利用上下文信息增加了目标域有标签样本的数量。
步骤6,源域有标签样本与目标域类别中心相似度计算。
根据DTL中样本散射矢量值和标签信息,得到目标域中各类别散射中心。如对于类别c,其散射中心为
Figure BDA0003084858820000071
Figure BDA0003084858820000072
表示目标域属于类别c的样本集合,
Figure BDA0003084858820000073
为集合
Figure BDA0003084858820000074
中的样本总数;
Figure BDA0003084858820000075
表示该类别某样本x的复散射矢量。
从而可以计算DS中源域样本与目标域类别中心间的散射相似性系数r,计算方式如下:
Figure BDA0003084858820000076
式中,Ωx为任一DS中的复散射矢量样本值,Ωc为目标域某类别c的复散射矢量中心,上标H代表共轭转置运算,|·|对于矢量输入形式为求模运算,||·||2为矢量2范数。以上计算方式得到的系数不受散射矢量总功率大小和目标方向角的影响,能够对单视POLSAR数据的散射相似性进行客观度量。
步骤7,联合双域有标签样本集合的融合样本子集提取。
本步首先计算DS中样本在目标域类别中的适应度,适应度函数设计如下:
Figure BDA0003084858820000081
其中的I[·]是二值函数,方括号内条件为真时I[·]=1,条件为假时I[·]=0;x表示DS中某样本,cx是样本x的真实类别,
Figure BDA0003084858820000082
是目标域各类别中心中与该样本相似性系数最高的类别,nc是地物类别总数;H(x)为基于该样本相似性系数序列得到的信息熵,具体地,若该样本与目标域各类别中心间的相似性系数分别为
Figure BDA0003084858820000087
将任一系数转换为
Figure BDA0003084858820000083
Figure BDA0003084858820000084
上述函数fit取值范围为[0,2lognc],代表了两种情况:(1)若与源域样本最相似的目标域类别中心是样本的标记类别中心,则越确定越好,即信息熵越低越好;(2)若与源域样本最相似的目标域类别中心是其他类别中心,则越不确定越好,即信息熵越高越好。
然后,根据适应度大小从DS有放回地选取样本,构建源域有标签样本子集。筛选样本的算法可自行选择,具体实施时优选建议采用轮盘赌算法:
(1)将适应度规范化至[0,1]区间且和为1,即
Figure BDA0003084858820000085
Fit(xi)为规范化后的适应度值;
(2)将各样本及其Fit函数值随机重新排列,并将Fit值作为样本选择概率。不妨设排列后Fit值序列为Fit(x1),Fit(x2),Fit(x3)…;
(3)随机生成[0,1]区间内的数字Rand,利用随机数有放回地选取样本:
if Rand≤Fit(x1)
选取重排后的第1个样本x1
Figure BDA0003084858820000086
选取重排后的第K个样本xK
利用轮盘赌方法不断生成随机数选取样本,可形成与DS大小相同的源域样本子集,随后将DTL中样本全部加入,最终形成双域融合子集。
具体实施时可以预设重复次数m,通过重复上述过程m次,生成m个融合子集D1,D2,…,Dm
步骤8,评判器模型训练与集合构建。
逐个利用融合子集作为独立的训练数据集,训练分类模型作为评判器,构成包含m个评判器的模型集合H={h1,h2,…,hm}。
具体实施时,分类器可根据具体影像数据和需求自行选用合适的监督分类算法。实施例优选采用POLSAR领域单视数据分类最为经典的复高斯分类器进行实现说明。此分类器基于贝叶斯理论和多元复高斯分布,可推导出如下距离度量:
Figure BDA0003084858820000091
其中Ωx为任意输入样本x的复散射矢量,Covc为某一类别c的协方差矩阵中心,|·|在此处表示对矩阵求行列式。因此利用上式可计算任何样本到各类中心的距离,将距离最小的类别作为复高斯分类器对该样本的预测类别。而在训练阶段,仅需获取各类别矩阵中心,获取方式是先将训练数据集内属于同一类的样本散射矢量与自身的共轭转置相乘,得到3×3大小的复矩阵,再求其平均值。
步骤9,评判器模型独立分类预测。
逐个利用H中的每个评判器模型h1,h2,…,hm独立地对目标域无标签像元样本进行分类,分类过程即为利用前述距离度量找出与像元样本距离最小的类别,以此作为预测类别。因此,H对每个被分类的像元样本将产生m个预测标签。
步骤10,弱分类器模型训练。
利用经扩充后的目标域有标签样本集DTL作为训练数据集,训练新的分类模型作为弱分类器f。分类模型采用步骤8中所用模型即可,训练过程也与步骤8中相应过程类似。
步骤11,迁移弱分类器集合更新。
起初,迁移弱分类器集合F设置为空。每次执行本步时,均将当前次迭代执行上一步骤中完全基于目标域样本训练得到的弱分类器加入到迁移弱分类器集合F中,对其进行更新。
步骤12,弱分类器集合加权分类预测。
利用F中每个弱分类器对目标域无标签像元样本进行类别预测,独立地输出预测样本从属于各类别的概率或与各类别中心间的距离(本实施例中采用复高斯分类器进行说明,因此符合后一种情况)。对于任一样本x,将各弱分类器的预测概率或距离加权平均,找到概率平均值最大或距离平均值最小的类别作为F对该样本类别的预测标签。如对于某类别c,样本x属于它的平均预测概率或与其中心间的平均距离为dc(x),则
Figure BDA0003084858820000101
其中,|F|是集合F中的弱分类器总数,
Figure BDA0003084858820000102
是第i个弱分类器预测x属于c的概率或x与类别c中心的距离,wi是第i个弱分类器的权重。w1可设置为0.5,其他的wi等于上一轮迭代中更新DTL时,集合C中的样本量与当时目标域无标签样本量的比值。
Figure BDA0003084858820000103
视具体实施采用的分类器而定,一部分分类器是概率预测,此时即为“概率平均值最大”;一部分分类器是计算样本和类别中心间特定测度下的距离,此时即为“距离平均值最小”。
步骤13,目标域伪标签扩充集提取。
遍历全部目标域无标签样本,比较利用H得到的m个预测标签与利用F得到的预测标签是否一致。取共计m+1个预测标签完全一致的样本构成新的目标域伪标签样本扩充集合C,C中每个样本的标签为其预测标签。
步骤14,判断迁移弱分类器集合构建阶段是否结束。
判断是否集合F中的弱分类器数量不少于阈值T,或者,集合C中的样本数量不大于阈值N?若是,则表明迁移弱分类器集合构建完成,输出F并直接进入步骤15;否则,返回到步骤5,再次执行步骤5至步骤14。具体实施时,T可视具体需求设定,T越大精度越高,但时间开销越多,一般可设T不低于10;N一般可设为5%的目标域样本总数。
步骤15,迁移弱分类器投票分类预测。
利用F中弱分类器独立完成剩余目标域无标签像元样本的分类。此阶段先利用F中的弱分类器对无标签像元独立进行类别预测,然后按多数投票原则得到最终的样本标签,即对于某样本x,取其预测类别中出现次数最多的类别为预测结果。
综上,经过上述步骤1至步骤15,可得到全部目标域像元的预测类别,最终输出目标域数据的整体分类结果。
步骤3至步骤5中,采用开窗分割方式引入空间上下文信息扩充目标域有标签样本集;步骤7设计了基于相似性系数的特殊适应度函数并利用适应度选取源域样本构建子集,从而在建立评判器集合前预先筛选了源域样本,降低了源域无关样本对迁移分类过程的干扰;步骤12中,通过加权预测像元类别,增强迭代过程中选取新样本扩充目标域有标签样本集的可靠性。最终,通过多数投票法结合全体弱分类器分类结果,获取目标域影像中的地物类别信息。
具体实施时,本发明技术方案提出的方法可由本领域技术人员采用计算机软件技术实现自动运行流程,实现方法的系统装置例如存储本发明技术方案相应计算机程序的计算机可读存储介质以及包括运行相应计算机程序的计算机设备,也应当在本发明的保护范围内。
在一些可能的实施例中,提供一种面向单视全极化SAR数据的集成迁移学习分类系统,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。
在一些可能的实施例中,提供一种面向单视全极化SAR数据的集成迁移学习分类系统,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,如采用其他图像分割算法或监督分类算法替代POLSRM分割和复高斯分类器,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (9)

1.一种面向单视全极化SAR数据的集成迁移学习分类方法,其特征在于:采用全图分割和局部开窗分割的方式,利用图像空间上下文信息浓缩源域有标签样本量和扩充目标域有标签样本量;然后结合散射矢量相似性系数和适应度函数设置源域有标签样本选取过程,根据目标域类别中心动态调整训练评判器模型所用的源域样本分布;随后引入对弱分类器可靠性的参考信息作为权重因子,采用加权形式利用迁移弱分类器进行类别软预测,给予预测结果一致的目标域无标签像元伪标签,以此扩充目标域有标签样本量并训练新的弱分类器;通过迭代运行,最终利用生成的迁移弱分类器集合完成目标域所有像元的集成分类;
实现过程包括以下步骤:
步骤1,将整景历史存档图像作为源域,对整景历史存档图像进行分割处理,得到源域全部像元的图斑对象索引值;
步骤2,初始化源域有标签样本集合DS为空,然后遍历源域图斑对象索引值,若具有同一索引值的源域像元具有相同的类别标签c,则取这些像元的复散射矢量均值作为样本值,并以c作为标签,加入至集合DS
步骤3,将当前待分类的影像作为目标域,在当前待分类的影像中,以稀少的有标签样本为中心,分别开大小为Nwin×Nwin的窗口,在各窗口中进行分割处理,得到窗口内像元的图斑对象索引值;其中,Nwin为预设的窗口尺寸值;
步骤4,初始化目标域扩充样本集合C为空,然后在步骤3开的各窗口内,找到与窗口中心具有相同索引值的像元,分别取这些像元的复散射矢量作为样本值、中心像元的类别标签作为这些像元的标签,加入至集合C;
步骤5,原始目标域有标签样本集合DTL仅含稀少的目标域标签样本,将集合C中样本全部加入DTL中,进行扩充更新;
步骤6,根据DTL中样本散射矢量值和标签信息,得到目标域中各类别散射中心,计算DS中源域样本与目标域类别中心间的散射相似性系数r
步骤7,计算DS中样本在目标域类别中的适应度,规范化后作为样本被选择的概率;随后,根据适应度大小从DS有放回地选取样本,构建源域样本子集,并与DTL融合形成融合子集;重复上述过程m次,生成m个融合子集D1,D2,…,Dm,其中m为预设的次数;
步骤8,逐个利用融合子集作为独立的训练数据集,训练分类模型作为评判器,构成包含m个评判器的模型集合H;
步骤9,逐个利用H中每个评判器模型独立地对目标域无标签像元样本进行分类,即对每个被分类的像元样本均产生m个预测标签;
步骤10,利用目标域有标签样本集DTL作为训练数据集,训练新的分类模型作为弱分类器;
步骤11,将步骤10中完全基于目标域样本训练得到的弱分类器加入到迁移弱分类器集合F中,对其进行更新;
步骤12,利用F中每个弱分类器对目标域无标签像元样本进行类别预测,独立地输出预测样本从属于各类别的概率或与各类别中心的距离;
步骤13,遍历全部目标域无标签样本,比较利用H得到的m个预测标签与利用F得到的预测标签是否一致;取共计m+1个预测标签完全一致的样本构成目标域伪标签样本扩充集合C,C中每个样本的标签为其预测标签;
步骤14,判断是否集合F中的弱分类器数量不少于阈值T,或者,集合C中的样本数量不大于阈值N;
若是,则输出迁移弱分类器集合F,进入步骤15;否则,返回到步骤5,再次执行步骤5至步骤14;
步骤15,利用F中弱分类器独立完成剩余目标域无标签像元样本的分类,对各弱分类器预测类别进行多数投票作为最终的样本标签,从而完成了全部目标域像元的分类结果输出。
2.根据权利要求1 所述面向单视全极化SAR数据的集成迁移学习分类方法,其特征在于:步骤1采用POLSRM分割算法实现对整景历史存档图像进行分割处理。
3.根据权利要求2所述面向单视全极化SAR数据的集成迁移学习分类方法,其特征在于:步骤6中,计算DS中源域样本与目标域类别中心间的散射相似性系数r方式实现如下,
Figure FDA0003544312820000021
式中,Ωx为任一DS中的复散射矢量样本值,Ωc为目标域中某类别c的复散射矢量中心;上标H代表共轭转置运算,|·|为求模运算,||·||2为矢量2范数。
4.根据权利要求2所述面向单视全极化SAR数据的集成迁移学习分类方法,其特征在于:根据适应度大小从DS有放回地选取样本,构建源域样本子集,并与DTL融合形成融合子集。
5.根据权利要求2所述面向单视全极化SAR数据的集成迁移学习分类方法,其特征在于:步骤7中,适应度计算实现如下,
Figure FDA0003544312820000031
其中,I[·]是二值函数,方括号内条件为真时I[·]=1,条件为假时I[·]=0;x表示DS中某样本,cx是样本x的真实类别,
Figure FDA0003544312820000032
是目标域各类别中心中与该样本相似性系数最高的类别,nc是地物类别总数;H(x)为基于该样本相似性系数序列得到的熵值。
6.根据权利要求2所述面向单视全极化SAR数据的集成迁移学习分类方法,其特征在于:步骤12中,进行类别预测实现如下,
对于任一样本x,将各弱分类器的预测概率或距离加权平均,找到概率平均值最大或距离平均值最小的类别作为F对该样本类别的预测标签;对于某类别c,样本x属于c的加权概率或与c中心的加权距离为dc(x),则
Figure FDA0003544312820000033
其中,|F|是集合F中的弱分类器总数,
Figure FDA0003544312820000034
是第i个弱分类器预测x属于c的概率或x与类别c中心的距离,wi是第i个弱分类器的权重。
7.一种面向单视全极化SAR数据的集成迁移学习分类系统,其特征在于:用于实现如权利要求1-6任一项所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。
8.根据权利要求7所述面向单视全极化SAR数据的集成迁移学习分类系统,其特征在于:包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如权利要求1-6任一项所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。
9.根据权利要求7所述面向单视全极化SAR数据的集成迁移学习分类系统,其特征在于:包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如权利要求1-6任一项所述的一种面向单视全极化SAR数据的集成迁移学习分类方法。
CN202110577250.1A 2021-05-26 2021-05-26 面向单视全极化sar数据的集成迁移学习分类方法及系统 Active CN113343804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110577250.1A CN113343804B (zh) 2021-05-26 2021-05-26 面向单视全极化sar数据的集成迁移学习分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110577250.1A CN113343804B (zh) 2021-05-26 2021-05-26 面向单视全极化sar数据的集成迁移学习分类方法及系统

Publications (2)

Publication Number Publication Date
CN113343804A CN113343804A (zh) 2021-09-03
CN113343804B true CN113343804B (zh) 2022-04-29

Family

ID=77471544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110577250.1A Active CN113343804B (zh) 2021-05-26 2021-05-26 面向单视全极化sar数据的集成迁移学习分类方法及系统

Country Status (1)

Country Link
CN (1) CN113343804B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114021180B (zh) * 2021-10-11 2024-04-12 清华大学 一种电力系统动态安全域确定方法、装置、电子设备及可读介质
CN114708609B (zh) * 2021-11-12 2023-08-18 中国矿业大学 一种基于持续学习的域适应骨架行为识别方法和系统
CN114005015B (zh) * 2021-12-28 2022-05-31 合肥的卢深视科技有限公司 图像识别模型的训练方法、电子设备和存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106680238B (zh) * 2017-01-06 2019-09-06 东北大学秦皇岛分校 基于红外光谱分析物质成分含量的方法
CN110472627B (zh) * 2019-07-02 2022-11-08 五邑大学 一种端到端的sar图像识别方法、装置及存储介质
CN112598051B (zh) * 2020-12-19 2023-03-24 武汉大学 一种基于极化统计散射成分的跨域sar图像地物分类方法

Also Published As

Publication number Publication date
CN113343804A (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN113343804B (zh) 面向单视全极化sar数据的集成迁移学习分类方法及系统
Wan et al. A post-classification comparison method for SAR and optical images change detection
CN108038445B (zh) 一种基于多视角深度学习框架的sar自动目标识别方法
Zhang et al. A novel adaptive fuzzy local information $ C $-means clustering algorithm for remotely sensed imagery classification
Tupin et al. Detection of linear features in SAR images: Application to road network extraction
CN109871902B (zh) 一种基于超分辨率对抗生成级联网络的sar小样本识别方法
Dong et al. A multiscale self-attention deep clustering for change detection in SAR images
CN108805057B (zh) 一种基于联合显著性分析的sar图像油库区检测方法
CN104751183B (zh) 基于张量mpca的极化sar图像分类方法
CN107742133A (zh) 一种用于极化sar图像的分类方法
CN115236655B (zh) 基于全极化sar的滑坡识别方法、系统、设备及介质
Meng et al. Factorization-based active contour for water-land SAR image segmentation via the fusion of features
Frizzelle et al. Mapping continuous distributions of land cover: A comparison of maximum-likelihood estimation and artificial neural networks
CN115049841A (zh) 基于深度无监督多步对抗域自适应的高分辨sar图像地物要素提取方法
CN109829426A (zh) 基于高分遥感影像的铁路建设临时建筑监测方法及系统
Li et al. Object-oriented classification of polarimetric SAR imagery based on statistical region merging and support vector machine
Lamei et al. Cloud-type discrimination via multispectral textural analysis
Kusetogullari et al. Unsupervised change detection in landsat images with atmospheric artifacts: a fuzzy multiobjective approach
CN112270285A (zh) 一种基于稀疏表示和胶囊网络的sar图像变化检测方法
Chawla Possibilistic c-means-spatial contextual information based sub-pixel classification approach for multi-spectral data
CN115829996A (zh) 基于深度特征图的无监督合成孔径雷达图像变化检测方法
CN112419266B (zh) 一种地表覆盖类别约束的遥感影像变化检测方法
CN112464997B (zh) 基于模糊-贪婪搜索决策的多传感器协同监测方法及系统
CN114926696A (zh) 基于复矩阵和多特征协同学习的遥感图像分类方法
Lombardo et al. Optimal classification of polarimetric SAR images using segmentation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant