CN115205693B - 一种多特征集成学习的双极化sar影像浒苔提取方法 - Google Patents

一种多特征集成学习的双极化sar影像浒苔提取方法 Download PDF

Info

Publication number
CN115205693B
CN115205693B CN202211126727.5A CN202211126727A CN115205693B CN 115205693 B CN115205693 B CN 115205693B CN 202211126727 A CN202211126727 A CN 202211126727A CN 115205693 B CN115205693 B CN 115205693B
Authority
CN
China
Prior art keywords
enteromorpha
feature
training
classification
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211126727.5A
Other languages
English (en)
Other versions
CN115205693A (zh
Inventor
许明明
祝晓芳
郑红霞
盛辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202211126727.5A priority Critical patent/CN115205693B/zh
Publication of CN115205693A publication Critical patent/CN115205693A/zh
Application granted granted Critical
Publication of CN115205693B publication Critical patent/CN115205693B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/188Vegetation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Image Processing (AREA)

Abstract

本发明公开的一种多特征集成学习的双极化SAR影像浒苔提取方法,属于海洋遥感探测技术领域。该方法包括以下步骤:数据预处理,提取24个纹理和极化特征,利用集成随机森林、Jeffries‑Matusita距离、皮尔森相关系数三种算法进行特征优选;随机分组优选特征,分层采样浒苔和海水样本点集对每组特征进行LDA特征变换;构建并训练浒苔多特征集成分类模型,将测试影像导入训练好的模型中,判定样本点类别并提取浒苔。本发明提供的方法科学合理,综合考虑了微波遥感监测浒苔的优势,顾及多种特征选择算法对特征重要性的评价角度,并优化集成学习方法,可在一定程度上提高浒苔提取的精度,实现浒苔灾害全天侯监测。

Description

一种多特征集成学习的双极化SAR影像浒苔提取方法
技术领域
本发明属于海洋遥感探测技术领域,具体涉及一种多特征集成学习的双极化SAR影像浒苔提取方法。
背景技术
近年来,我国黄海浒苔灾害频发,不仅影响海洋生态系统,而且造成了严重的社会影响和经济损失。每年5-7月黄海地区多云多雨,光学遥感监测浒苔受限,特别是云覆盖较为严重时,光学影像基本无法应用于浒苔监测。相比之下,合成孔径雷达(SAR)可穿云透雾,受天气影响较小,具有全天时、全天候观测的特点,有利于及时掌握浒苔灾害动态和制定合理高效的防治措施。
目前,基于SAR影像的浒苔提取方法主要分为阈值分割、单个弱分类器分类和深度学习分类。阈值法原理简单,实现速度快,但不能充分利用图像的隐藏信息。单个弱分类器结构简单,但分类精度不高,不利于精确提取浒苔。而深度学习虽然学习能力强,但依赖于大量的样本数据,制作样本集较为费时费力。
双极化SAR影像具有丰富的极化和纹理信息,可以计算得到多个特征,不同特征对浒苔与海水的区分性能不同,综合考虑多种特征评价角度能够避免特征利用率低以及区分不同地区的浒苔与海水泛化能力较差的问题。此外,集成学习更适合小样本数据,集成多个基分类器比单个基分类器具有更高的分类精度。鉴于此,本发明提出了一种多特征集成学习的双极化SAR影像浒苔提取方法,能够提高浒苔提取精度并及时获取浒苔分布情况,有利于实现浒苔的动态监测与时空特征分析。
发明内容
(一)要解决的技术问题
为解决现有特征优选择算法评价角度单一和AdaBoost集成算法权重更新时忽略样本距离正确预测多远的问题,本发明提供了一种多特征集成学习的双极化SAR影像浒苔提取方法,该方法可以充分利用多特征信息逐像素对双极化SAR影像上漂浮浒苔进行监测,能够实现浒苔全天时全天候监测,并进一步提高浒苔提取精度。
(二)技术方案
本发明包含以下步骤:
步骤一:获取双极化SAR浒苔研究区影像,对其进行轨道校正、辐射定标、Deburst、生成极化矩阵C2、多视、地形校正、精致Lee滤波去噪、影像裁剪预处理操作,得到大小为row×col的影像,按照4∶1划分为训练影像Ii及测试影像Gj,目视解译制作Ii的对应标签Li,对Ii进行特征提取,得到特征Fk影像,对特征影像中各像素进行标准化操作,生成样本数据集D;
其中,i=1,2,3,...,u,u为训练影像数,j=1,2,3,…,v,v为测试影像数;
k=1,2,3,…,n,k表示特征序号,n=24,24个特征分别为:极化总功率、散射角、极化反熵、极化熵、极化协方差矩阵平均实特征值、雷达植被指数、幅值、双极化水体指数、四个极化熵与极化反熵的组合参数、极化协方差矩阵的四个分量、均值、方差、协同性、对比度、异质性、熵、角二阶矩、相关性;
步骤二:从信息度量、可分性度量和关联性度量三个方面分别评价特征重要性:通过随机森林算法判定样本数据集D的特征重要性,计算获取各特征基尼不纯度大小RF_scorek,根据样本数据集D类间样本的Jeffries-Matusita距离,求得各特征中海水与浒苔两类的可分性大小JM_scorek,利用皮尔森相关系数算法根据特征与类别之间的相关性对每个特征分配不同权重PRS_scorek
①信息度量:计算归一化后各特征的基尼不纯度大小RF_scorek
第d棵树节点q的Gini指数的计算公式为:
Figure GDA0003912712940000021
其中,
Figure GDA0003912712940000022
表示第d棵树节点q的Gini指数,
Figure GDA0003912712940000023
表示第d棵树节点q中类别c所占的比例;
特征Fk在第d棵树节点q的重要性,即节点q分枝前后Gini指数变化量为:
Figure GDA0003912712940000024
其中,
Figure GDA0003912712940000025
为特征Fk在第d棵树节点q的重要性评分,
Figure GDA0003912712940000026
Figure GDA0003912712940000027
是分枝后两个新节点的Gini指数;
若特征Fk在决策树中出现的节点为集合Q,特征Fk在第d棵树的重要性的计算公式为:
Figure GDA0003912712940000028
其中,
Figure GDA0003912712940000029
表示特征Fk在第d棵树节点集合Q的重要性评分;
假设RF中共有TD棵树,则:
Figure GDA0003912712940000031
其中,
Figure GDA0003912712940000032
表示特征Fk在所有TD棵树节点集合Q的重要性评分;
将所有求得的重要性评分归一化处理得RF_scorek
Figure GDA0003912712940000033
其中,
Figure GDA0003912712940000034
是24个特征在所有TD棵树节点集合Q的总重要性评分,RF_scorek表示基于特征Fk的基尼不纯度大小;
②可分性度量:浒苔ht与海水hs的类别可分性大小IM_scorek
Figure GDA0003912712940000035
Figure GDA0003912712940000036
其中,BDk为基于特征Fk计算出的类别hl与hs的巴氏距离,
Figure GDA0003912712940000037
Figure GDA0003912712940000038
分别为基于特征Fk两个类别的样本协方差矩阵,
Figure GDA0003912712940000039
Figure GDA00039127129400000310
分别为基于特征Fk对应类别的样本均值向量,e是自然常数e,JM_scorek表示基于特征Fk的浒苔与海水的类别可分性大小;
③关联性度量:将特征Fk与类别进行相关性分析,计算归一化后的PRS_scorek
Figure GDA00039127129400000311
其中,a为像素点序号,S为像素点总数,
Figure GDA00039127129400000312
为特征Fk第a个像素点的灰度值,
Figure GDA00039127129400000313
为特征Fk总像素点的灰度值均值,
Figure GDA00039127129400000314
为特征Fk第a个像素点的标签值,
Figure GDA00039127129400000315
为特征Fk第a个像素点的标签值均值,PRS_scorek表示根据特征Fk与类别之间的相关性对特征Fk分配的权重;
步骤三:以0.4、0.3、0.3的权重分配方式集成步骤二中三种评价角度分别对应的随机森林、Jeffries-Matusita距离和皮尔森相关系数算法,求得各特征重要性Total_scorek,并按照特征重要性由高到低排序,选择前15个特征作为优选特征SFs,与对应标签构成训练样本集D1;其中,s=1,2,3,…,15,集成后的各特征重要性Total_scorek的计算公式如下:
Figure GDA00039127129400000316
步骤四:将步骤三所得优选特征SFs随机划分为特征互不重复的3组,每组包含5个特征,对训练样本集D1进行浒苔样本:海水样本=1∶1的分层采样,产生训练样本点集,使用选取的训练样本点对每组特征进行LDA特征变换,得到三组变换后的训练子集Xt
其中,t=1,2,3表示分类的轮次,Xt表示参与第t轮分类的训练子集;
步骤五:在windows上搭建scikit-learn机器学习框架,采用DT、GBDT、NB、SVM、RF五种弱分类器作为AdaBoost的候选基分类器,逐一对本轮训练子集Xt进行分类,并将分类结果最优的弱分类器作为该轮基分类器,根据scikit-learn库中该轮基分类器的predict_proba函数计算并获取当前各样本分类预测的后验概率,使其参与下一轮样本权重更新,得到浒苔多特征集成分类模型Algae_Model;
步骤六:对每张测试影像Gj提取优选特征SFs,将其输入步骤五所得浒苔多特征集成分类模型Algae_Model,判定各像素类别并提取浒苔,得到浒苔提取结果图Aj
(三)有益效果
本方法的优点体现在:
本发明提供了一种多特征集成学习的双极化SAR影像浒苔提取方法,该方法综合考虑了微波遥感监测浒苔的优势,顾及多种特征选择算法对特征重要性的评价角度,并优化了已有的AdaBoost集成学习方法,可在一定程度上提高浒苔信息提取的精度,并实现浒苔全天侯监测,为浒苔灾害遥感业务化提供了技术支撑。
附图说明
图1为本发明的流程图;
图2为本发明实施例的详细流程图;
图3为本发明实施例的集成特征优选算法结果图;
图3中:span—极化总功率;alpha—散射角;anisotropy—极化反熵;entropy—极化熵;lambda—极化协方差矩阵平均实特征值;RVI4SI—雷达植被指数;AMP—幅值;BM_index—双极化水体指数;C1SH1SH/C1SHA/CH1SA/CHA—四个极化熵与极化反熵的组合参数;C11/C12_img/C12_real/C22—极化协方差矩阵的四个分量;Mean—均值;Variance—方差;Homogeneity—协同性;Contrast—对比度;Dissimilarity—异质性;Entropy—熵;Second Moment—角二阶矩;Correlation—相关性;Total_scorek—各特征重要性;RF_scorek—基于特征Fk的基尼不纯度大小;JM_scorek—基于特征Fk的浒苔与海水的类别可分性大小;PRS_scorek—根据特征Fk与类别之间的相关性对特征Fk分配的权重。
具体实施方式
为使本发明的目的、内容和优点更加清楚,下面结合附图与实施例,对本发明的具体实施方法作进一步详细描述:
参照图1,以Sentinel-1影像作为数据源,本发明实施例的详细流程如图2所示,具体实施步骤为:
(1)获取Sentinel-1浒苔研究区的影像,利用SNAP软件对其进行轨道校正、辐射定标、Deburst、生成极化矩阵C2、多视、地形校正预处理操作后将其导出,使用ENVI软件进行精致Lee滤波去噪和影像裁剪操作,得到大小为row×col的影像,按照4∶1划分为训练影像Ii及测试影像Gj,目视解译制作Ii的对应标签,综合利用PIE-SAR与ENVI软件对Ii进行特征提取,得到特征Fk影像,对特征影像中各像素进行标准化操作,生成样本数据集D;
其中,i=1,2,3,...,u,u为训练影像数,j=1,2,3,…,v,v为测试影像数;
k=1,2,3,…,n,k表示特征序号,n=24,24个特征分别为:极化总功率、散射角、极化反熵、极化熵、极化协方差矩阵平均实特征值、雷达植被指数、幅值、双极化水体指数、四个极化熵与极化反熵的组合参数((1—极化熵)×(1—极化反熵)、(1—极化熵)×极化反熵、极化熵×(1—极化反熵)、极化熵×极化反熵)、极化协方差矩阵的四个分量、均值、方差、协同性、对比度、异质性、熵、角二阶矩、相关性;
(2)从信息度量、可分性度量和关联性度量三个方面分别评价特征重要性:通过随机森林算法判定样本数据集D的特征重要性,计算获取各特征基尼不纯度大小RF_scorek,根据样本数据集D类间样本的Jeffries-Matusita距离,求得各特征中海水与浒苔两类的可分性大小,利用皮尔森相关系数算法根据特征与类别之间的相关性对每个特征分配不同权重PRS_scorek
①信息度量:计算归一化后各特征的基尼不纯度大小RF_scorek
第d棵树节点q的Gini指数的计算公式为:
Figure GDA0003912712940000051
其中,
Figure GDA0003912712940000052
表示第d棵树节点q的Gini指数,
Figure GDA0003912712940000053
表示第d棵树节点q中类别c所占的比例;
特征Fk在第d棵树节点q的重要性,即节点q分枝前后Gini指数变化量为:
Figure GDA0003912712940000061
其中,
Figure GDA0003912712940000062
为特征Fk在第d棵树节点q的重要性评分,
Figure GDA0003912712940000063
Figure GDA0003912712940000064
是分枝后两个新节点的Gini指数;
若特征Fk在决策树中出现的节点为集合Q,特征Fk在第d棵树的重要性的计算公式为:
Figure GDA0003912712940000065
其中,
Figure GDA0003912712940000066
表示特征Fk在第d棵树节点集合Q的重要性评分;
假设RF中共有TD棵树,则:
Figure GDA0003912712940000067
其中,
Figure GDA0003912712940000068
表示特征Fk在所有TD棵树节点集合Q的重要性评分;
将所有求得的重要性评分归一化处理得RF_scorek
Figure GDA0003912712940000069
其中,
Figure GDA00039127129400000610
是24个特征在所有TD棵树节点集合Q的总重要性评分,RF_scorek表示基于特征Fk的基尼不纯度大小;
②可分性度量:浒苔ht与海水hs的类别可分性大小JM_scorek
Figure GDA00039127129400000611
Figure GDA00039127129400000612
其中,BDk为基于特征Fk计算出的类别ht与hs的巴氏距离,
Figure GDA00039127129400000613
Figure GDA00039127129400000614
分别为基于特征Fk两个类别的样本协方差矩阵,
Figure GDA00039127129400000615
Figure GDA00039127129400000616
分别为基于特征Fk对应类别的样本均值向量,e是自然常数e,JM_scorek表示基于特征Fk的浒苔与海水的类别可分性大小;
③关联性度量:将特征Fk与类别进行相关性分析,计算归一化后的PRS_scorek
Figure GDA00039127129400000617
其中,a为像素点序号,S为像素点总数,
Figure GDA00039127129400000618
为特征Fk第a个像素点的灰度值,
Figure GDA00039127129400000619
为特征Fk总像素点的灰度值均值,
Figure GDA0003912712940000071
为特征Fk第a个像素点的标签值,
Figure GDA0003912712940000072
为特征Fk第a个像素点的标签值均值,PRS_scorek表示根据特征Fk与类别之间的相关性对特征Fk分配的权重;
(3)以0.4、0.3、0.3的权重分配方式集成步骤(2)中三种评价角度对应的随机森林、Jeffries-Matusita距离和皮尔森相关系数算法,求得各特征重要性Total_scorek,图3显示了本发明实施例的三种特征选择算法和集成特征优选算法结果图,按照特征重要性由高到低排序,选择前15个特征作为优选特征SFs,与对应标签构成训练样本集D1
其中,s=1,2,3,…,15,集成后的各特征重要性Total_scorek的计算公式如下:
Figure GDA0003912712940000073
(4)将步骤(3)所得优选特征SFs随机划分为特征互不重复的3组,每组包含5个特征,对训练样本集D1进行浒苔样本:海水样本=1∶1的分层采样,产生训练样本点集,使用选取的训练样本点对每组特征进行LDA特征变换,得到三组变换后的训练子集Xt
其中,t=1,2,3表示分类的轮次,Xt表示参与第t轮分类的训练子集;
(5)在windows上搭建scikit-learn机器学习框架,采用DT、GBDT、NB、SVM、RF五种弱分类器作为AdaBoost的候选基分类器,逐一对本轮训练子集Xt进行分类,并将分类结果最优的弱分类器作为该轮基分类器,根据scikit-learn库中该轮基分类器的predict_proba函数计算获得当前各样本分类预测的后验概率,使其参与下一轮样本权重更新,得到浒苔多特征集成分类模型Algae_Model,具体包括以下步骤:
5.1)训练子集
Figure GDA0003912712940000074
对第一轮训练子集X1权重进行初始化:
Figure GDA0003912712940000075
其中,b=1,2,3,...,m,
Figure GDA0003912712940000076
Figure GDA0003912712940000077
分别表示第t轮分类的第b个实例样本和类别标志,且
Figure GDA0003912712940000078
∈{-1,1},m表示本轮训练样本总数,b表示训练样本点序号,X1表示当t=1时第一轮分类训练子集,
Figure GDA0003912712940000079
表示第1轮迭代时每个样本点对应的权重;
5.2)循环t=1,2,3,t为分类轮次,h={DT,GBDT,NB,SVM,RF}为弱分类器集合:
5.2.1)在当前的样本权重
Figure GDA00039127129400000710
下,逐个训练h中的弱分类器,采用F1_score作为评价标准,选取分类结果最佳的弱分类器作为本轮基分类器ht
Figure GDA00039127129400000711
其中,TP表示真值是浒苔,预测也是浒苔的像素点个数,FN表示真值是海水,预测也是海水的像素点个数,F1_score是评价弱分类器分类性能的指标;
5.2.2)计算基分类器分类的错误率et
Figure GDA0003912712940000081
其中,et表示基分类器ht分类的错误率,
Figure GDA0003912712940000082
Figure GDA0003912712940000083
分别表示第t轮的第b个像素点的分类值和真值,
Figure GDA0003912712940000084
表示第t轮的第b个像素点权重;
5.2.3)计算基分类器的权重因子αt
Figure GDA0003912712940000085
其中,αt为基分类器ht的权重因子,et为基分类器ht分类的错误率;
5.2.4)更新下一轮训练子集权重
Figure GDA0003912712940000086
根据scikit-learn库中该轮基分类器的predict_proba函数计算并获取基分类器ht分类结果对应的后验概率
Figure GDA0003912712940000087
参与样本权重的更新:
Figure GDA0003912712940000088
其中,
Figure GDA0003912712940000089
Figure GDA00039127129400000810
分别为第t次迭代时被正确分类的样本总数和错误分类的样本总数,
Figure GDA00039127129400000811
表示基分类器ht分类结果对应的后验概率,
Figure GDA00039127129400000812
表示下一轮训练子集权重,Zt为规范化因子,公式为:
Figure GDA00039127129400000813
5.2.5)将各基分类器集成,得到浒苔多特征集成分类模型Algae_Model:
Figure GDA00039127129400000814
其中,Xt表示参与第t轮分类的训练子集,ht(Xt)表示第t轮基分类器ht对训练子集Xt的分类值,
Figure GDA00039127129400000815
表示所有训练样本最终分类结果;
(6)对每张测试影像Gj提取优选特征SFs,对特征影像中各像素进行标准化操作,将其输入步骤(5)所得浒苔多特征集成分类模型Algae_Model,判定像素点类别,并将浒苔像素赋值为255,海水像素赋值为0,得到各浒苔提取结果图Aj

Claims (3)

1.一种多特征集成学习的双极化SAR影像浒苔提取方法,其特征在于,包括以下步骤:
步骤一:获取双极化SAR浒苔研究区影像,对其进行轨道校正、辐射定标、Deburst、生成极化矩阵C2、多视、地形校正、精致Lee滤波去噪、影像裁剪预处理操作,得到大小为row×col的影像,按照4:1划分为训练影像Ii及测试影像Gj,目视解译制作Ii的对应标签Li,对Ii进行特征提取,得到特征Fk影像,对特征影像中各像素进行标准化操作,生成样本数据集D;
其中,i=1,2,3,...,u,u为训练影像数,j=1,2,3,…,v,v为测试影像数;
k=1,2,3,…,n,k表示特征序号,n=24,24个特征分别为:极化总功率、散射角、极化反熵、极化熵、极化协方差矩阵平均实特征值、雷达植被指数、幅值、双极化水体指数、四个极化熵与极化反熵的组合参数、极化协方差矩阵的四个分量、均值、方差、协同性、对比度、异质性、熵、角二阶矩、相关性;
步骤二:从信息度量、可分性度量和关联性度量三个方面分别评价特征重要性:通过随机森林算法判定样本数据集D的特征重要性,计算获取各特征基尼不纯度大小RF_scorek,根据样本数据集D类间样本的Jeffries-Matusita距离,求得各特征中海水与浒苔两类的可分性大小JM_scorek,利用皮尔森相关系数算法根据特征与类别之间的相关性对每个特征分配不同权重PRS_scorek
步骤三:以0.4、0.3、0.3的权重分配方式集成步骤二中三种评价角度对应的随机森林、Jeffries-Matusita距离和皮尔森相关系数算法,求得各特征重要性Total_scorek,并按照特征重要性由高到低排序,选择前15个特征作为优选特征SFs,与对应标签构成训练样本集D1
其中,s=1,2,3,…,15,集成后的各特征重要性Total_scorek的计算公式如下:
Figure FDA0003912712930000011
步骤四:将步骤三所得优选特征SFs随机划分为特征互不重复的3组,每组包含5个特征,对训练样本集D1进行浒苔样本:海水样本=1:1的分层采样,产生训练样本点集,使用选取的训练样本点对每组特征进行LDA特征变换,得到三组变换后的训练子集Xt
其中,t=1,2,3表示分类的轮次,Xt表示参与第t轮分类的训练子集;
步骤五:在windows上搭建scikit-learn机器学习框架,采用DT、GBDT、NB、SVM、RF五种弱分类器作为AdaBoost的候选基分类器,逐一对本轮训练子集Xt进行分类,并将分类结果最优的弱分类器作为该轮基分类器,根据scikit-learn库中该轮基分类器的predict_proba函数计算并获取当前各样本分类预测的后验概率,使其参与下一轮样本权重更新,得到浒苔多特征集成分类模型Algae_Model;
步骤六:对每张测试影像Gj提取优选特征SFs,将其输入步骤五所得浒苔多特征集成分类模型Algae_Model,判定各像素类别并提取浒苔,得到浒苔提取结果图Aj
2.如权利要求1所述的一种多特征集成学习的双极化SAR影像浒苔提取方法,其特征在于,步骤五中,构建浒苔多特征集成分类模型Algae_Model,包括以下步骤:
1)训练子集
Figure FDA0003912712930000021
对第一轮训练子集X1权重进行初始化:
Figure FDA0003912712930000022
其中,b=1,2,3,...,m,
Figure FDA0003912712930000023
Figure FDA0003912712930000024
分别表示第t轮分类的第b个实例样本和类别标志,且
Figure FDA0003912712930000025
Figure FDA0003912712930000026
m表示本轮训练样本总数,b表示训练样本点序号,X1表示当t=1时第一轮分类训练子集,
Figure FDA0003912712930000027
表示第1轮迭代时每个样本点对应的权重;
2)循环t=1,2,3,t为分类轮次,h={DT,GBDT,NB,SVM,RF}为弱分类器集合,利用本轮训练子集逐个训练h中的弱分类器,选取最佳弱分类器作为本轮基分类器,根据本轮基分类器分类结果对应的后验概率更新下一轮训练子集权重,三轮训练结束后,集成各基分类器,得到浒苔多特征集成分类模型Algae_Model。
3.如权利要求2所述的一种多特征集成学习的双极化SAR影像浒苔提取方法,其特征在于,步骤2)中,选取并训练各基分类器,将各基分类器集成得到浒苔多特征集成分类模型Algae_Model,包括以下步骤:
①在当前的样本权重
Figure FDA0003912712930000028
下,逐个训练h中的弱分类器,采用F1_score作为评价标准,选取分类结果最佳的弱分类器作为本轮基分类器ht
Figure FDA0003912712930000029
其中,TP表示真值是浒苔,预测也是浒苔的像素点个数,FN表示真值是海水,预测也是海水的像素点个数,F1_score是评价弱分类器分类性能的指标;
②计算基分类器分类的错误率et
Figure FDA00039127129300000210
其中,et表示基分类器ht分类的错误率,
Figure FDA00039127129300000211
Figure FDA00039127129300000212
分别表示第t轮的第b个像素点的分类值和真值,
Figure FDA0003912712930000031
表示第t轮的第b个像素点权重;
③计算基分类器的权重因子αt
Figure FDA0003912712930000032
其中,αt为基分类器ht的权重因子,et为基分类器ht分类的错误率;
④更新下一轮训练子集权重
Figure FDA0003912712930000033
根据scikit-learn库中该轮基分类器的predict_proba函数计算并获取基分类器ht分类结果对应的后验概率
Figure FDA0003912712930000034
参与样本权重的更新:
Figure FDA0003912712930000035
其中,
Figure FDA0003912712930000036
Figure FDA0003912712930000037
分别为第t次迭代时被正确分类的样本总数和错误分类的样本总数,
Figure FDA0003912712930000038
表示基分类器ht分类结果对应的后验概率,
Figure FDA0003912712930000039
表示下一轮训练子集权重,Zt为规范化因子,公式为:
Figure FDA00039127129300000310
⑤将各基分类器集成,得到浒苔多特征集成分类模型Algae_Model:
Figure FDA00039127129300000311
其中,Xt表示参与第t轮分类的训练子集,ht(Xt)表示第t轮基分类器ht对训练子集Xt的分类值,
Figure FDA00039127129300000312
表示所有训练样本最终分类结果。
CN202211126727.5A 2022-09-16 2022-09-16 一种多特征集成学习的双极化sar影像浒苔提取方法 Active CN115205693B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211126727.5A CN115205693B (zh) 2022-09-16 2022-09-16 一种多特征集成学习的双极化sar影像浒苔提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211126727.5A CN115205693B (zh) 2022-09-16 2022-09-16 一种多特征集成学习的双极化sar影像浒苔提取方法

Publications (2)

Publication Number Publication Date
CN115205693A CN115205693A (zh) 2022-10-18
CN115205693B true CN115205693B (zh) 2022-12-02

Family

ID=83572099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211126727.5A Active CN115205693B (zh) 2022-09-16 2022-09-16 一种多特征集成学习的双极化sar影像浒苔提取方法

Country Status (1)

Country Link
CN (1) CN115205693B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118016315B (zh) * 2024-04-09 2024-06-25 数据空间研究院 基于数据分析的胰腺癌预测系统及预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326741A (zh) * 2021-05-08 2021-08-31 东南大学 一种基于sar和光学影像的优化特征选择分类方法
CN114266961A (zh) * 2021-12-02 2022-04-01 桂林理工大学 一种整合高光谱和多频段全极化sar影像的沼泽植被堆栈集成学习分类方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101610485B1 (ko) * 2014-08-12 2016-04-20 두산중공업 주식회사 감지 조류 제거 시스템 및 방법
CN106548209A (zh) * 2016-11-07 2017-03-29 国家海洋局第海洋研究所 一种基于多纹理特征的sar绿潮信息提取方法
CN106803100B (zh) * 2016-12-26 2020-08-18 国家海洋局第二海洋研究所 一种双极化星载sar图像海上船舶检测分类方法
CN109061628B (zh) * 2018-06-22 2020-06-23 中船重工鹏力(南京)大气海洋信息系统有限公司 一种基于多功能雷达慢扫增强的浒苔提取方法
CN109781626B (zh) * 2019-03-11 2021-07-06 王祥 一种基于光谱分析的近岸高悬沙水体绿潮遥感识别方法
CN110503244B (zh) * 2019-07-29 2022-04-15 武汉大学 一种面向浒苔灾害覆盖区域的多观测手段组网优化监测方法
CN110501302B (zh) * 2019-07-29 2020-06-09 武汉大学 一种多源证据融合数据的浒苔分布图生成方法
CN112258523B (zh) * 2020-10-20 2022-03-08 中国石油大学(华东) 一种中低分辨率遥感影像浒苔覆盖信息精细提取方法
CN112926397B (zh) * 2021-01-28 2022-03-01 中国石油大学(华东) 基于两轮投票策略集成学习的sar图像海冰类型分类方法
CN113807208B (zh) * 2021-08-30 2024-05-31 中科海慧(天津)科技有限公司 浒苔监测方法、装置、电子设备及存储介质
CN114049243B (zh) * 2021-10-26 2023-09-29 中山大学 一种浒苔堆积量估算方法、系统及存储介质
CN114022782B (zh) * 2021-11-01 2024-05-10 中国石油大学(华东) 一种基于modis卫星数据的海雾探测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326741A (zh) * 2021-05-08 2021-08-31 东南大学 一种基于sar和光学影像的优化特征选择分类方法
CN114266961A (zh) * 2021-12-02 2022-04-01 桂林理工大学 一种整合高光谱和多频段全极化sar影像的沼泽植被堆栈集成学习分类方法

Also Published As

Publication number Publication date
CN115205693A (zh) 2022-10-18

Similar Documents

Publication Publication Date Title
Dhingra et al. A review of remotely sensed satellite image classification
WO2023029461A1 (zh) 海量高维ais轨迹数据聚类方法
Moustakidis et al. SVM-based fuzzy decision trees for classification of high spatial resolution remote sensing images
CN101308544B (zh) 一种基于栅格的空间异质模式识别方法
CN110135267A (zh) 一种大场景sar图像细微目标检测方法
CN109614985A (zh) 一种基于密集连接特征金字塔网络的目标检测方法
CN111898633B (zh) 一种基于高光谱图像的海上舰船目标检测方法
Pankiewicz Pattern recognition techniques for the identification of cloud and cloud systems
CN110309780A (zh) 基于bfd-iga-svm模型的高分辨率影像房屋信息快速监督识别
Su et al. Machine learning-assisted region merging for remote sensing image segmentation
Nurmasari et al. Oil palm plantation detection in Indonesia using Sentinel-2 and Landsat-8 optical satellite imagery (case study: Rokan Hulu regency, Riau Province)
Yuan et al. Fine-grained classification of urban functional zones and landscape pattern analysis using hyperspectral satellite imagery: A case study of Wuhan
CN112766161B (zh) 基于集成约束多示例学习的高光谱目标检测方法
Li et al. Point-based weakly supervised learning for object detection in high spatial resolution remote sensing images
CN115205693B (zh) 一种多特征集成学习的双极化sar影像浒苔提取方法
Genitha et al. Classification of satellite images using new fuzzy cluster centroid for unsupervised classification algorithm
Fan et al. Urban functional zone mapping with a bibranch neural network via fusing remote sensing and social sensing data
CN112084860A (zh) 目标对象检测、火力发电厂检测方法和装置
Alburshaid et al. Palm trees detection using the integration between gis and deep learning
CN115719453B (zh) 一种基于深度学习的水稻种植结构遥感提取方法
Zhu et al. S 3 trm: spectral-spatial unmixing of hyperspectral imagery based on sparse topic relaxation-clustering model
Pérez-Hernández et al. CI-dataset and DetDSCI methodology for detecting too small and too large critical infrastructures in satellite images: airports and electrical substations as case study
CN110427956A (zh) 一种基于谱聚类算法的LiDAR点云数据单木提取方法
CN115965867A (zh) 基于伪标签和类别词典学习的遥感图像地表覆盖分类方法
Zhang et al. A rough set decision tree based MLP-CNN for very high resolution remotely sensed image classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant