CN115205693A - 一种多特征集成学习的双极化sar影像浒苔提取方法 - Google Patents

一种多特征集成学习的双极化sar影像浒苔提取方法 Download PDF

Info

Publication number
CN115205693A
CN115205693A CN202211126727.5A CN202211126727A CN115205693A CN 115205693 A CN115205693 A CN 115205693A CN 202211126727 A CN202211126727 A CN 202211126727A CN 115205693 A CN115205693 A CN 115205693A
Authority
CN
China
Prior art keywords
enteromorpha
feature
classification
training
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211126727.5A
Other languages
English (en)
Other versions
CN115205693B (zh
Inventor
许明明
祝晓芳
郑红霞
盛辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202211126727.5A priority Critical patent/CN115205693B/zh
Publication of CN115205693A publication Critical patent/CN115205693A/zh
Application granted granted Critical
Publication of CN115205693B publication Critical patent/CN115205693B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/188Vegetation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Image Processing (AREA)

Abstract

本发明公开的一种多特征集成学习的双极化SAR影像浒苔提取方法,属于海洋遥感探测技术领域。该方法包括以下步骤:数据预处理,提取24个纹理和极化特征,利用集成随机森林、Jeffries‑Matusita距离、皮尔森相关系数三种算法进行特征优选;随机分组优选特征,分层采样浒苔和海水样本点集对每组特征进行LDA特征变换;构建并训练浒苔多特征集成分类模型,将测试影像导入训练好的模型中,判定样本点类别并提取浒苔。本发明提供的方法科学合理,综合考虑了微波遥感监测浒苔的优势,顾及多种特征选择算法对特征重要性的评价角度,并优化集成学习方法,可在一定程度上提高浒苔提取的精度,实现浒苔灾害全天侯监测。

Description

一种多特征集成学习的双极化SAR影像浒苔提取方法
技术领域
本发明属于海洋遥感探测技术领域,具体涉及一种多特征集成学习的双极化SAR影像浒苔提取方法。
背景技术
近年来,我国黄海浒苔灾害频发,不仅影响海洋生态系统,而且造成了严重的社会影响和经济损失。每年5-7月黄海地区多云多雨,光学遥感监测浒苔受限,特别是云覆盖较为严重时,光学影像基本无法应用于浒苔监测。相比之下,合成孔径雷达(SAR)可穿云透雾,受天气影响较小,具有全天时、全天候观测的特点,有利于及时掌握浒苔灾害动态和制定合理高效的防治措施。
目前,基于SAR影像的浒苔提取方法主要分为阈值分割、单个弱分类器分类和深度学习分类。阈值法原理简单,实现速度快,但不能充分利用图像的隐藏信息。单个弱分类器结构简单,但分类精度不高,不利于精确提取浒苔。而深度学习虽然学习能力强,但依赖于大量的样本数据,制作样本集较为费时费力。
双极化SAR影像具有丰富的极化和纹理信息,可以计算得到多个特征,不同特征对浒苔与海水的区分性能不同,综合考虑多种特征评价角度能够避免特征利用率低以及区分不同地区的浒苔与海水泛化能力较差的问题。此外,集成学习更适合小样本数据,集成多个基分类器比单个基分类器具有更高的分类精度。鉴于此,本发明提出了一种多特征集成学习的双极化SAR影像浒苔提取方法,能够提高浒苔提取精度并及时获取浒苔分布情况,有利于实现浒苔的动态监测与时空特征分析。
发明内容
(一)要解决的技术问题
为解决现有特征优选择算法评价角度单一和AdaBoost集成算法权重更新时忽略样本距离正确预测多远的问题,本发明提供了一种多特征集成学习的双极化SAR影像浒苔提取方法,该方法可以充分利用多特征信息逐像素对双极化SAR影像上漂浮浒苔进行监测,能够实现浒苔全天时全天候监测,并进一步提高浒苔提取精度。
(二)技术方案
本发明包含以下步骤:
步骤一:获取双极化SAR浒苔研究区影像,对其进行轨道校正、辐射定标、Deburst、生成极化矩阵C2、多视、地形校正、精致Lee滤波去噪、影像裁剪预处理操作,得到大小为
Figure 160808DEST_PATH_IMAGE001
的影像,按照4:1划分为训练影像
Figure 713495DEST_PATH_IMAGE002
及测试影像
Figure 78398DEST_PATH_IMAGE003
,目视解译制作
Figure 759522DEST_PATH_IMAGE002
的对应标签
Figure 900172DEST_PATH_IMAGE004
,对
Figure 771832DEST_PATH_IMAGE002
进行特征提取,得到特征
Figure 741539DEST_PATH_IMAGE005
影像,对特征影像中各像素进行标准化操作,生成样本数据集D
其中,i = 1,2,3,...,uu为训练影像数,j = 1,2,3,…,vv为测试影像数;
k = 1,2,3,…,nk表示特征序号,n = 24,24个特征分别为:极化总功率、散射角、极化反熵、极化熵、极化协方差矩阵平均实特征值、雷达植被指数、幅值、双极化水体指数、四个极化熵与极化反熵的组合参数、极化协方差矩阵的四个分量、均值、方差、协同性、对比度、异质性、熵、角二阶矩、相关性;
步骤二:从信息度量、可分性度量和关联性度量三个方面分别评价特征重要性:通过随机森林算法判定样本数据集D的特征重要性,计算获取各特征基尼不纯度大小
Figure 950322DEST_PATH_IMAGE006
,根据样本数据集D类间样本的Jeffries-Matusita距离,求得各特征中海水与浒苔两类的可分性大小
Figure 80564DEST_PATH_IMAGE007
,利用皮尔森相关系数算法根据特征与类别之间的相关性对每个特征分配不同权重
Figure 749224DEST_PATH_IMAGE008
①信息度量:计算归一化后各特征的基尼不纯度大小
Figure 711888DEST_PATH_IMAGE006
d棵树节点q的Gini指数的计算公式为:
Figure 935620DEST_PATH_IMAGE009
其中,
Figure 50862DEST_PATH_IMAGE010
表示第d棵树节点q的Gini指数,
Figure 494351DEST_PATH_IMAGE011
表示第d棵树节点q中类别c所占的比例;
特征
Figure 85257DEST_PATH_IMAGE005
在第d棵树节点q的重要性,即节点q分枝前后Gini指数变化量为:
Figure 278253DEST_PATH_IMAGE012
其中,
Figure 224564DEST_PATH_IMAGE013
为特征
Figure 592616DEST_PATH_IMAGE005
在第d棵树节点q的重要性评分,
Figure 41790DEST_PATH_IMAGE014
Figure 775827DEST_PATH_IMAGE015
是分枝后两个新节点的Gini指数;
若特征
Figure 236633DEST_PATH_IMAGE005
在决策树中出现的节点为集合Q,特征
Figure 266996DEST_PATH_IMAGE005
在第d棵树的重要性的计算公式为:
Figure 819112DEST_PATH_IMAGE016
其中,
Figure 852445DEST_PATH_IMAGE017
表示特征
Figure 921420DEST_PATH_IMAGE005
在第d棵树节点集合Q的重要性评分;
假设RF中共有TD棵树,则:
Figure 143192DEST_PATH_IMAGE018
其中,
Figure 516756DEST_PATH_IMAGE019
表示特征
Figure 229147DEST_PATH_IMAGE005
在所有TD棵树节点集合Q的重要性评分;
将所有求得的重要性评分归一化处理得
Figure 789179DEST_PATH_IMAGE006
Figure 925062DEST_PATH_IMAGE020
其中,
Figure 944446DEST_PATH_IMAGE021
是24个特征在所有TD棵树节点集合Q的总重要性评分,
Figure 953127DEST_PATH_IMAGE006
表示基于特征
Figure 373525DEST_PATH_IMAGE005
的基尼不纯度大小;
②可分性度量:浒苔ht与海水hs的类别可分性大小
Figure 435634DEST_PATH_IMAGE007
Figure 698906DEST_PATH_IMAGE022
Figure 503832DEST_PATH_IMAGE023
其中,
Figure 772877DEST_PATH_IMAGE024
为基于特征
Figure 112944DEST_PATH_IMAGE005
计算出的类别hths的巴氏距离,
Figure 237413DEST_PATH_IMAGE025
Figure 78986DEST_PATH_IMAGE026
分别为基于特征
Figure 343483DEST_PATH_IMAGE005
两个类别的样本协方差矩阵,
Figure 379353DEST_PATH_IMAGE027
Figure 826736DEST_PATH_IMAGE028
分别为基于特征
Figure 108550DEST_PATH_IMAGE005
对应类别的样本均值向量,e是自然常数e,
Figure 358047DEST_PATH_IMAGE029
表示基于特征
Figure 171675DEST_PATH_IMAGE005
的浒苔与海水的类别可分性大小;
③关联性度量:将特征
Figure 506623DEST_PATH_IMAGE005
与类别进行相关性分析,计算归一化后的
Figure 791194DEST_PATH_IMAGE008
Figure 404185DEST_PATH_IMAGE030
其中,a为像素点序号,S为像素点总数,
Figure 781857DEST_PATH_IMAGE031
为特征
Figure 86324DEST_PATH_IMAGE005
a个像素点的灰度值,
Figure 574855DEST_PATH_IMAGE032
为特征
Figure 492426DEST_PATH_IMAGE005
总像素点的灰度值均值,
Figure 910506DEST_PATH_IMAGE033
为特征
Figure 220046DEST_PATH_IMAGE005
a个像素点的标签值,
Figure 384704DEST_PATH_IMAGE034
为特征
Figure 457440DEST_PATH_IMAGE005
a个像素点的标签值均值,
Figure 35970DEST_PATH_IMAGE008
表示根据特征
Figure 917690DEST_PATH_IMAGE005
与类别之间的相关性对特征
Figure 148689DEST_PATH_IMAGE005
分配的权重;
步骤三:以0.4、0.3、0.3的权重分配方式集成步骤二中三种评价角度分别对应的随机森林、Jeffries-Matusita距离和皮尔森相关系数算法,求得各特征重要性
Figure 68409DEST_PATH_IMAGE035
,并按照特征重要性由高到低排序,选择前15个特征作为优选特征
Figure 828292DEST_PATH_IMAGE036
,与对应标签构成训练样本集
Figure 701703DEST_PATH_IMAGE037
其中,s = 1,2,3,…,15,集成后的各特征重要性
Figure 205235DEST_PATH_IMAGE035
的计算公式如下:
Figure 616012DEST_PATH_IMAGE038
步骤四:将步骤三所得优选特征
Figure 818235DEST_PATH_IMAGE036
随机划分为特征互不重复的3组,每组包含5个特征,对训练样本集
Figure 816760DEST_PATH_IMAGE037
进行浒苔样本:海水样本=1:1的分层采样,产生训练样本点集,使用选取的训练样本点对每组特征进行LDA特征变换,得到三组变换后的训练子集
Figure 453541DEST_PATH_IMAGE039
其中,t = 1,2,3表示分类的轮次,
Figure 355376DEST_PATH_IMAGE039
表示参与第t轮分类的训练子集;
步骤五:在windows上搭建scikit-learn机器学习框架,采用DT、GBDT、NB、SVM、RF五种弱分类器作为AdaBoost的候选基分类器,逐一对本轮训练子集
Figure 977768DEST_PATH_IMAGE039
进行分类,并将分类结果最优的弱分类器作为该轮基分类器,根据scikit-learn库中该轮基分类器的predict_proba函数计算并获取当前各样本分类预测的后验概率,使其参与下一轮样本权重更新,得到浒苔多特征集成分类模型Algae_Model
步骤六:对每张测试影像
Figure 79235DEST_PATH_IMAGE003
提取优选特征
Figure 428963DEST_PATH_IMAGE036
,将其输入步骤五所得浒苔多特征集成分类模型Algae_Model,判定各像素类别并提取浒苔,得到浒苔提取结果图
Figure 559206DEST_PATH_IMAGE040
(三)有益效果
本方法的优点体现在:
本发明提供了一种多特征集成学习的双极化SAR影像浒苔提取方法,该方法综合考虑了微波遥感监测浒苔的优势,顾及多种特征选择算法对特征重要性的评价角度,并优化了已有的AdaBoost集成学习方法,可在一定程度上提高浒苔信息提取的精度,并实现浒苔全天侯监测,为浒苔灾害遥感业务化提供了技术支撑。
附图说明
图1为本发明的流程图;
图2为本发明实施例的详细流程图;
图3为本发明实施例的集成特征优选算法结果图;
图3中:span—极化总功率;alpha—散射角;anisotropy—极化反熵;entropy—极化熵;lambda—极化协方差矩阵平均实特征值;RVI4SI—雷达植被指数;AMP—幅值;BM_index—双极化水体指数;C1SH1SH/C1SHA/CH1SA/CHA—四个极化熵与极化反熵的组合参数;C11/C12_img/C12_real/C22—极化协方差矩阵的四个分量;Mean—均值;Variance—方差;Homogeneity—协同性;Contrast—对比度;Dissimilarity—异质性;Entropy—熵;Second Moment—角二阶矩;Correlation—相关性;
Figure 219000DEST_PATH_IMAGE035
—各特征重要性;
Figure 197976DEST_PATH_IMAGE006
—基于特征
Figure 852860DEST_PATH_IMAGE005
的基尼不纯度大小;
Figure 827157DEST_PATH_IMAGE029
—基于特征
Figure 536225DEST_PATH_IMAGE005
的浒苔与海水的类别可分性大小;
Figure 480524DEST_PATH_IMAGE008
—根据特征
Figure 795224DEST_PATH_IMAGE005
与类别之间的相关性对特征
Figure 401524DEST_PATH_IMAGE005
分配的权重。
具体实施方式
为使本发明的目的、内容和优点更加清楚,下面结合附图与实施例,对本发明的具体实施方法作进一步详细描述:
参照图1,以Sentinel-1影像作为数据源,本发明实施例的详细流程如图2所示,具体实施步骤为:
(1)获取Sentinel-1浒苔研究区的影像,利用SNAP软件对其进行轨道校正、辐射定标、Deburst、生成极化矩阵C2、多视、地形校正预处理操作后将其导出,使用ENVI软件进行精致Lee滤波去噪和影像裁剪操作,得到大小为
Figure 644942DEST_PATH_IMAGE001
的影像,按照4:1划分为训练影像
Figure 473877DEST_PATH_IMAGE002
及测试影像
Figure 571760DEST_PATH_IMAGE003
,目视解译制作
Figure 396015DEST_PATH_IMAGE002
的对应标签,综合利用PIE-SAR与ENVI软件对
Figure 181306DEST_PATH_IMAGE002
进行特征提取,得到特征
Figure 481225DEST_PATH_IMAGE005
影像,对特征影像中各像素进行标准化操作,生成样本数据集D
其中,i = 1,2,3,...,uu为训练影像数,j = 1,2,3,…,vv为测试影像数;
k = 1,2,3,…,nk表示特征序号,n = 24,24个特征分别为:极化总功率、散射角、极化反熵、极化熵、极化协方差矩阵平均实特征值、雷达植被指数、幅值、双极化水体指数、四个极化熵与极化反熵的组合参数((1-极化熵)×(1-极化反熵)、(1-极化熵)×极化反熵、极化熵×(1-极化反熵)、极化熵×极化反熵)、极化协方差矩阵的四个分量、均值、方差、协同性、对比度、异质性、熵、角二阶矩、相关性;
(2)从信息度量、可分性度量和关联性度量三个方面分别评价特征重要性:通过随机森林算法判定样本数据集D的特征重要性,计算获取各特征基尼不纯度大小
Figure 780138DEST_PATH_IMAGE006
,根据样本数据集D类间样本的Jeffries-Matusita距离,求得各特征中海水与浒苔两类的可分性大小,利用皮尔森相关系数算法根据特征与类别之间的相关性对每个特征分配不同权重
Figure 95450DEST_PATH_IMAGE008
Figure 286262DEST_PATH_IMAGE041
信息度量:计算归一化后各特征的基尼不纯度大小
Figure 683264DEST_PATH_IMAGE006
d棵树节点q的Gini指数的计算公式为:
Figure 395655DEST_PATH_IMAGE009
其中,
Figure 221266DEST_PATH_IMAGE010
表示第d棵树节点q的Gini指数,
Figure 47701DEST_PATH_IMAGE011
表示第d棵树节点q中类别c所占的比例;
特征
Figure 433463DEST_PATH_IMAGE005
在第d棵树节点q的重要性,即节点q分枝前后Gini指数变化量为:
Figure 323447DEST_PATH_IMAGE012
其中,
Figure 613351DEST_PATH_IMAGE013
为特征
Figure 930588DEST_PATH_IMAGE005
在第d棵树节点q的重要性评分,
Figure 29477DEST_PATH_IMAGE014
Figure 94122DEST_PATH_IMAGE015
是分枝后两个新节点的Gini指数;
若特征
Figure 601983DEST_PATH_IMAGE005
在决策树中出现的节点为集合Q,特征
Figure 840853DEST_PATH_IMAGE005
在第d棵树的重要性的计算公式为:
Figure 325842DEST_PATH_IMAGE016
其中,
Figure 284922DEST_PATH_IMAGE017
表示特征
Figure 674053DEST_PATH_IMAGE005
在第d棵树节点集合Q的重要性评分;
假设RF中共有TD棵树,则:
Figure 67513DEST_PATH_IMAGE018
其中,
Figure 413699DEST_PATH_IMAGE019
表示特征
Figure 685061DEST_PATH_IMAGE005
在所有TD棵树节点集合Q的重要性评分;
将所有求得的重要性评分归一化处理得
Figure 285022DEST_PATH_IMAGE006
Figure 361300DEST_PATH_IMAGE020
其中,
Figure 303105DEST_PATH_IMAGE021
是24个特征在所有TD棵树节点集合Q的总重要性评分,
Figure 253524DEST_PATH_IMAGE006
表示基于特征
Figure 747740DEST_PATH_IMAGE005
的基尼不纯度大小;
Figure 493455DEST_PATH_IMAGE042
可分性度量:浒苔ht与海水hs的类别可分性大小
Figure 932931DEST_PATH_IMAGE007
Figure 559478DEST_PATH_IMAGE022
Figure 658933DEST_PATH_IMAGE023
其中,
Figure 673419DEST_PATH_IMAGE024
为基于特征
Figure 441745DEST_PATH_IMAGE005
计算出的类别hths的巴氏距离,
Figure 216190DEST_PATH_IMAGE025
Figure 668687DEST_PATH_IMAGE026
分别为基于特征
Figure 371850DEST_PATH_IMAGE005
两个类别的样本协方差矩阵,
Figure 410828DEST_PATH_IMAGE027
Figure 848019DEST_PATH_IMAGE028
分别为基于特征
Figure 40840DEST_PATH_IMAGE005
对应类别的样本均值向量,e是自然常数e,
Figure 793201DEST_PATH_IMAGE029
表示基于特征
Figure 805894DEST_PATH_IMAGE005
的浒苔与海水的类别可分性大小;
Figure 915016DEST_PATH_IMAGE043
关联性度量:将特征
Figure 843570DEST_PATH_IMAGE005
与类别进行相关性分析,计算归一化后的
Figure 898989DEST_PATH_IMAGE008
Figure 892920DEST_PATH_IMAGE030
其中,a为像素点序号,S为像素点总数,
Figure 823311DEST_PATH_IMAGE031
为特征
Figure 299853DEST_PATH_IMAGE005
a个像素点的灰度值,
Figure 656666DEST_PATH_IMAGE032
为特征
Figure 121582DEST_PATH_IMAGE005
总像素点的灰度值均值,
Figure 731030DEST_PATH_IMAGE033
为特征
Figure 968328DEST_PATH_IMAGE005
a个像素点的标签值,
Figure 745310DEST_PATH_IMAGE034
为特征
Figure 707974DEST_PATH_IMAGE005
a个像素点的标签值均值,
Figure 736760DEST_PATH_IMAGE008
表示根据特征
Figure 205396DEST_PATH_IMAGE005
与类别之间的相关性对特征
Figure 651814DEST_PATH_IMAGE005
分配的权重;
(3)以0.4、0.3、0.3的权重分配方式集成步骤(2)中三种评价角度对应的随机森林、Jeffries-Matusita距离和皮尔森相关系数算法,求得各特征重要性
Figure 603239DEST_PATH_IMAGE035
,图3显示了本发明实施例的三种特征选择算法和集成特征优选算法结果图,按照特征重要性由高到低排序,选择前15个特征作为优选特征
Figure 793306DEST_PATH_IMAGE036
,与对应标签构成训练样本集
Figure 134026DEST_PATH_IMAGE037
其中,s = 1,2,3,…,15,集成后的各特征重要性
Figure 983035DEST_PATH_IMAGE035
的计算公式如下:
Figure 654712DEST_PATH_IMAGE038
(4)将步骤(3)所得优选特征
Figure 274568DEST_PATH_IMAGE036
随机划分为特征互不重复的3组,每组包含5个特征,对训练样本集
Figure 345085DEST_PATH_IMAGE037
进行浒苔样本:海水样本=1:1的分层采样,产生训练样本点集,使用选取的训练样本点对每组特征进行LDA特征变换,得到三组变换后的训练子集
Figure 645223DEST_PATH_IMAGE039
其中,t = 1,2,3表示分类的轮次,
Figure 810056DEST_PATH_IMAGE039
表示参与第t轮分类的训练子集;
(5)在windows上搭建scikit-learn机器学习框架,采用DT、GBDT、NB、SVM、RF五种弱分类器作为AdaBoost的候选基分类器,逐一对本轮训练子集
Figure 334799DEST_PATH_IMAGE039
进行分类,并将分类结果最优的弱分类器作为该轮基分类器,根据scikit-learn库中该轮基分类器的predict_proba函数计算获得当前各样本分类预测的后验概率,使其参与下一轮样本权重更新,得到浒苔多特征集成分类模型Algae_Model,具体包括以下步骤:
5.1)训练子集
Figure 13560DEST_PATH_IMAGE044
,对训练子集
Figure 609233DEST_PATH_IMAGE045
权重进行初始化:
Figure 261362DEST_PATH_IMAGE046
其中,b=1,2,3,...,m
Figure 324217DEST_PATH_IMAGE047
Figure 621599DEST_PATH_IMAGE048
分别表示第t轮分类的第b个实例样本和类别标志,且
Figure 361410DEST_PATH_IMAGE048
∈{-1,1},m表示本轮训练样本总数,b表示训练样本点序号,
Figure 370342DEST_PATH_IMAGE045
表示第1轮分类训练子集,
Figure 862986DEST_PATH_IMAGE049
表示第1轮迭代时每个样本点对应的权重;
5.2)循环t=1,2,3,t为分类轮次,h={DT,GBDT,NB,SVM,RF}为弱分类器集合:
5.2.1)在当前的样本权重
Figure 765607DEST_PATH_IMAGE050
下,逐个训练h中的弱分类器,采用F1_score作为评价标准,选取分类结果最佳的弱分类器作为本轮基分类器
Figure 947758DEST_PATH_IMAGE051
Figure 373353DEST_PATH_IMAGE052
其中,TP表示真值是浒苔,预测也是浒苔的像素点个数,FN表示真值是海水,预测也是海水的像素点个数,F1_score是评价弱分类器分类性能的指标;
5.2.2)计算基分类器分类的错误率
Figure 909770DEST_PATH_IMAGE053
Figure 561505DEST_PATH_IMAGE054
其中,
Figure 386725DEST_PATH_IMAGE053
表示基分类器
Figure 603205DEST_PATH_IMAGE051
分类的错误率,
Figure 477401DEST_PATH_IMAGE055
Figure 866531DEST_PATH_IMAGE048
分别表示第t轮的第b个像素点的分类值和真值,
Figure 135357DEST_PATH_IMAGE056
表示第t轮的第b个像素点权重;
5.2.3)计算基分类器的权重因子
Figure 225150DEST_PATH_IMAGE057
Figure 480201DEST_PATH_IMAGE058
其中,
Figure 103599DEST_PATH_IMAGE059
为基分类器
Figure 304511DEST_PATH_IMAGE051
的权重因子,
Figure 137993DEST_PATH_IMAGE053
为基分类器
Figure 438876DEST_PATH_IMAGE051
分类的错误率;
5.2.4)更新下一轮训练子集权重
Figure 401934DEST_PATH_IMAGE060
,根据scikit-learn库中该轮基分类器的predict_proba函数计算并获取基分类器
Figure 23015DEST_PATH_IMAGE051
分类结果对应的后验概率
Figure 845258DEST_PATH_IMAGE061
参与样本权重的更新:
Figure 222538DEST_PATH_IMAGE062
其中,
Figure 437761DEST_PATH_IMAGE063
Figure 855842DEST_PATH_IMAGE064
分别为第t次迭代时被正确分类的样本总数和错误分类的样本总数,
Figure 663916DEST_PATH_IMAGE061
表示基分类器
Figure 330040DEST_PATH_IMAGE051
分类结果对应的后验概率,
Figure 890859DEST_PATH_IMAGE060
表示下一轮训练子集权重,
Figure 570585DEST_PATH_IMAGE065
为规范化因子,公式为:
Figure 990589DEST_PATH_IMAGE066
5.2.5)将各基分类器集成,得到浒苔多特征集成分类模型Algae_Model
Figure 690430DEST_PATH_IMAGE067
其中,
Figure 997433DEST_PATH_IMAGE068
表示参与第t轮分类的训练子集,
Figure 278022DEST_PATH_IMAGE069
表示第t轮基分类器
Figure 647039DEST_PATH_IMAGE070
对训练子集
Figure 399838DEST_PATH_IMAGE039
的分类值,
Figure 453025DEST_PATH_IMAGE071
表示所有训练样本最终分类结果;
(6)对每张测试影像
Figure 888204DEST_PATH_IMAGE003
提取优选特征
Figure 876277DEST_PATH_IMAGE036
,对特征影像中各像素进行标准化操作,将其输入步骤(5)所得浒苔多特征集成分类模型Algae_Model,判定像素点类别,并将浒苔像素赋值为255,海水像素赋值为0,得到各浒苔提取结果图
Figure 539822DEST_PATH_IMAGE040

Claims (3)

1.一种多特征集成学习的双极化SAR影像浒苔提取方法,其特征在于,包括以下步骤:
步骤一:获取双极化SAR浒苔研究区影像,对其进行轨道校正、辐射定标、Deburst、生成极化矩阵C2、多视、地形校正、精致Lee滤波去噪、影像裁剪预处理操作,得到大小为
Figure 882163DEST_PATH_IMAGE001
的影像,按照4:1划分为训练影像
Figure 317343DEST_PATH_IMAGE002
及测试影像
Figure 817332DEST_PATH_IMAGE003
,目视解译制作
Figure 612637DEST_PATH_IMAGE002
的对应标签
Figure 746161DEST_PATH_IMAGE004
,对
Figure 227608DEST_PATH_IMAGE002
进行特征提取,得到特征
Figure 594654DEST_PATH_IMAGE005
影像,对特征影像中各像素进行标准化操作,生成样本数据集D
其中,i = 1,2,3,... ,uu为训练影像数,j = 1,2,3,…,vv为测试影像数;
k = 1,2,3,…,nk表示特征序号,n = 24,24个特征分别为:极化总功率、散射角、极化反熵、极化熵、极化协方差矩阵平均实特征值、雷达植被指数、幅值、双极化水体指数、四个极化熵与极化反熵的组合参数、极化协方差矩阵的四个分量、均值、方差、协同性、对比度、异质性、熵、角二阶矩、相关性;
步骤二:从信息度量、可分性度量和关联性度量三个方面分别评价特征重要性:通过随机森林算法判定样本数据集D的特征重要性,计算获取各特征基尼不纯度大小
Figure 689255DEST_PATH_IMAGE006
,根据样本数据集D类间样本的Jeffries-Matusita距离,求得各特征中海水与浒苔两类的可分性大小
Figure 559778DEST_PATH_IMAGE007
,利用皮尔森相关系数算法根据特征与类别之间的相关性对每个特征分配不同权重
Figure 578902DEST_PATH_IMAGE008
步骤三:以0.4、0.3、0.3的权重分配方式集成步骤二中三种评价角度对应的随机森林、Jeffries-Matusita距离和皮尔森相关系数算法,求得各特征重要性
Figure 59342DEST_PATH_IMAGE009
,并按照特征重要性由高到低排序,选择前15个特征作为优选特征
Figure 988198DEST_PATH_IMAGE010
,与对应标签构成训练样本集
Figure 483201DEST_PATH_IMAGE011
其中,s = 1,2,3,…,15,集成后的各特征重要性
Figure 532281DEST_PATH_IMAGE009
的计算公式如下:
Figure 106875DEST_PATH_IMAGE012
步骤四:将步骤三所得优选特征
Figure 408193DEST_PATH_IMAGE010
随机划分为特征互不重复的3组,每组包含5个特征,对训练样本集
Figure 892788DEST_PATH_IMAGE011
进行浒苔样本:海水样本=1:1的分层采样,产生训练样本点集,使用选取的训练样本点对每组特征进行LDA特征变换,得到三组变换后的训练子集
Figure 159964DEST_PATH_IMAGE013
其中,t = 1,2,3表示分类的轮次,
Figure 707008DEST_PATH_IMAGE013
表示参与第t轮分类的训练子集;
步骤五:在windows上搭建scikit-learn机器学习框架,采用DT、GBDT、NB、SVM、RF五种弱分类器作为AdaBoost的候选基分类器,逐一对本轮训练子集
Figure 77596DEST_PATH_IMAGE013
进行分类,并将分类结果最优的弱分类器作为该轮基分类器,根据scikit-learn库中该轮基分类器的predict_proba函数计算并获取当前各样本分类预测的后验概率,使其参与下一轮样本权重更新,得到浒苔多特征集成分类模型Algae_Model
步骤六:对每张测试影像
Figure 151119DEST_PATH_IMAGE003
提取优选特征
Figure 433679DEST_PATH_IMAGE010
,将其输入步骤五所得浒苔多特征集成分类模型Algae_Model,判定各像素类别并提取浒苔,得到浒苔提取结果图
Figure 841920DEST_PATH_IMAGE014
2.如权利要求1所述的一种多特征集成学习的双极化SAR影像浒苔提取方法,其特征在于,步骤五中,构建浒苔多特征集成分类模型Algae_Model,主要包括以下步骤:
1)训练子集
Figure 875253DEST_PATH_IMAGE015
,对训练子集
Figure 68862DEST_PATH_IMAGE016
权重进行初始化:
Figure 522323DEST_PATH_IMAGE017
其中,b=1,2,3,...,m
Figure 919325DEST_PATH_IMAGE018
Figure 625856DEST_PATH_IMAGE019
分别表示第t轮分类的第b个实例样本和类别标志,且
Figure 414252DEST_PATH_IMAGE019
∈{-1,1},m表示本轮训练样本总数,b表示训练样本点序号,
Figure 197137DEST_PATH_IMAGE016
表示第1轮分类训练子集,
Figure 949676DEST_PATH_IMAGE020
表示第1轮迭代时每个样本点对应的权重;
2)循环t=1,2,3,t为分类轮次,h={DT,GBDT,NB,SVM,RF}为弱分类器集合,利用本轮训练子集逐个训练h中的弱分类器,选取最佳弱分类器作为本轮基分类器,根据本轮基分类器分类结果对应的后验概率更新下一轮训练子集权重,三轮训练结束后,集成各基分类器,得到浒苔多特征集成分类模型Algae_Model
3.如权利要求2所述的一种多特征集成学习的双极化SAR影像浒苔提取方法,其特征在于,步骤2)中,选取并训练各基分类器,将各基分类器集成得到浒苔多特征集成分类模型Algae_Model,主要包括以下步骤:
①在当前的样本权重
Figure 449446DEST_PATH_IMAGE021
下,逐个训练h中的弱分类器,采用F1_score作为评价标准,选取分类结果最佳的弱分类器作为本轮基分类器
Figure 863985DEST_PATH_IMAGE022
Figure 666374DEST_PATH_IMAGE023
其中,TP表示真值是浒苔,预测也是浒苔的像素点个数,FN表示真值是海水,预测也是海水的像素点个数,F1_score是评价弱分类器分类性能的指标;
②计算基分类器分类的错误率
Figure 929646DEST_PATH_IMAGE024
Figure 977980DEST_PATH_IMAGE025
其中,
Figure 211945DEST_PATH_IMAGE024
表示基分类器
Figure 811335DEST_PATH_IMAGE022
分类的错误率,
Figure 431410DEST_PATH_IMAGE026
Figure 403476DEST_PATH_IMAGE019
分别表示第t轮的第b个像素点的分类值和真值,
Figure 792606DEST_PATH_IMAGE027
表示第t轮的第b个像素点权重;
③计算基分类器的权重因子
Figure 37995DEST_PATH_IMAGE028
Figure 134914DEST_PATH_IMAGE029
其中,
Figure 806941DEST_PATH_IMAGE030
为基分类器
Figure 414027DEST_PATH_IMAGE022
的权重因子,
Figure 620799DEST_PATH_IMAGE024
为基分类器
Figure 949887DEST_PATH_IMAGE022
分类的错误率;
④更新下一轮训练子集权重
Figure 375404DEST_PATH_IMAGE031
,根据scikit-learn库中该轮基分类器的predict_proba函数计算并获取基分类器
Figure 479407DEST_PATH_IMAGE022
分类结果对应的后验概率
Figure 230981DEST_PATH_IMAGE032
参与样本权重的更新:
Figure 286180DEST_PATH_IMAGE033
其中,
Figure 34431DEST_PATH_IMAGE034
Figure 343404DEST_PATH_IMAGE035
分别为第t次迭代时被正确分类的样本总数和错误分类的样本总数,
Figure 16612DEST_PATH_IMAGE032
表示基分类器
Figure 694194DEST_PATH_IMAGE022
分类结果对应的后验概率,
Figure 986416DEST_PATH_IMAGE031
表示下一轮训练子集权重,
Figure 189645DEST_PATH_IMAGE036
为规范化因子,公式为:
Figure 539735DEST_PATH_IMAGE037
⑤将各基分类器集成,得到浒苔多特征集成分类模型Algae_Model
Figure 189766DEST_PATH_IMAGE038
其中,
Figure 285679DEST_PATH_IMAGE039
表示参与第t轮分类的训练子集,
Figure 717316DEST_PATH_IMAGE040
表示第t轮基分类器
Figure 601833DEST_PATH_IMAGE041
对训练子集
Figure 10598DEST_PATH_IMAGE013
的分类值,
Figure 854141DEST_PATH_IMAGE042
表示所有训练样本最终分类结果。
CN202211126727.5A 2022-09-16 2022-09-16 一种多特征集成学习的双极化sar影像浒苔提取方法 Active CN115205693B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211126727.5A CN115205693B (zh) 2022-09-16 2022-09-16 一种多特征集成学习的双极化sar影像浒苔提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211126727.5A CN115205693B (zh) 2022-09-16 2022-09-16 一种多特征集成学习的双极化sar影像浒苔提取方法

Publications (2)

Publication Number Publication Date
CN115205693A true CN115205693A (zh) 2022-10-18
CN115205693B CN115205693B (zh) 2022-12-02

Family

ID=83572099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211126727.5A Active CN115205693B (zh) 2022-09-16 2022-09-16 一种多特征集成学习的双极化sar影像浒苔提取方法

Country Status (1)

Country Link
CN (1) CN115205693B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160019681A (ko) * 2014-08-12 2016-02-22 두산중공업 주식회사 감지 조류 제거 시스템 및 방법
CN106548209A (zh) * 2016-11-07 2017-03-29 国家海洋局第海洋研究所 一种基于多纹理特征的sar绿潮信息提取方法
CN106803100A (zh) * 2016-12-26 2017-06-06 国家海洋局第二海洋研究所 一种双极化星载sar图像海上船舶检测分类方法
CN109061628A (zh) * 2018-06-22 2018-12-21 中船重工鹏力(南京)大气海洋信息系统有限公司 一种基于多功能雷达慢扫增强的浒苔提取方法
CN109781626A (zh) * 2019-03-11 2019-05-21 王祥 一种基于光谱分析的近岸高悬沙水体绿潮遥感识别方法
CN110503244A (zh) * 2019-07-29 2019-11-26 武汉大学 一种面向浒苔灾害覆盖区域的多观测手段组网优化监测方法
CN110501302A (zh) * 2019-07-29 2019-11-26 武汉大学 一种多源证据融合数据的浒苔分布图生成方法
CN112258523A (zh) * 2020-10-20 2021-01-22 中国石油大学(华东) 一种中低分辨率遥感影像浒苔覆盖信息精细提取方法
CN112926397A (zh) * 2021-01-28 2021-06-08 中国石油大学(华东) 基于两轮投票策略集成学习的sar图像海冰类型分类方法
CN113326741A (zh) * 2021-05-08 2021-08-31 东南大学 一种基于sar和光学影像的优化特征选择分类方法
CN113807208A (zh) * 2021-08-30 2021-12-17 中科海慧(天津)科技有限公司 浒苔监测方法、装置、电子设备及存储介质
CN114022782A (zh) * 2021-11-01 2022-02-08 中国石油大学(华东) 一种基于modis卫星数据的海雾探测方法
CN114049243A (zh) * 2021-10-26 2022-02-15 中山大学 一种浒苔堆积量估算方法、系统及存储介质
CN114266961A (zh) * 2021-12-02 2022-04-01 桂林理工大学 一种整合高光谱和多频段全极化sar影像的沼泽植被堆栈集成学习分类方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160019681A (ko) * 2014-08-12 2016-02-22 두산중공업 주식회사 감지 조류 제거 시스템 및 방법
CN106548209A (zh) * 2016-11-07 2017-03-29 国家海洋局第海洋研究所 一种基于多纹理特征的sar绿潮信息提取方法
CN106803100A (zh) * 2016-12-26 2017-06-06 国家海洋局第二海洋研究所 一种双极化星载sar图像海上船舶检测分类方法
CN109061628A (zh) * 2018-06-22 2018-12-21 中船重工鹏力(南京)大气海洋信息系统有限公司 一种基于多功能雷达慢扫增强的浒苔提取方法
CN109781626A (zh) * 2019-03-11 2019-05-21 王祥 一种基于光谱分析的近岸高悬沙水体绿潮遥感识别方法
CN110501302A (zh) * 2019-07-29 2019-11-26 武汉大学 一种多源证据融合数据的浒苔分布图生成方法
CN110503244A (zh) * 2019-07-29 2019-11-26 武汉大学 一种面向浒苔灾害覆盖区域的多观测手段组网优化监测方法
CN112258523A (zh) * 2020-10-20 2021-01-22 中国石油大学(华东) 一种中低分辨率遥感影像浒苔覆盖信息精细提取方法
CN112926397A (zh) * 2021-01-28 2021-06-08 中国石油大学(华东) 基于两轮投票策略集成学习的sar图像海冰类型分类方法
CN113326741A (zh) * 2021-05-08 2021-08-31 东南大学 一种基于sar和光学影像的优化特征选择分类方法
CN113807208A (zh) * 2021-08-30 2021-12-17 中科海慧(天津)科技有限公司 浒苔监测方法、装置、电子设备及存储介质
CN114049243A (zh) * 2021-10-26 2022-02-15 中山大学 一种浒苔堆积量估算方法、系统及存储介质
CN114022782A (zh) * 2021-11-01 2022-02-08 中国石油大学(华东) 一种基于modis卫星数据的海雾探测方法
CN114266961A (zh) * 2021-12-02 2022-04-01 桂林理工大学 一种整合高光谱和多频段全极化sar影像的沼泽植被堆栈集成学习分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CUI XIE ET AL: "Object-Oriented Random Forest Classification for Enteromorpha Prolifera Detection with SAR Images", 《2016 INTERNATIONAL CONFERENCE ON VIRTUAL REALITY AND VISUALIZATION》 *
XIANCI WAN ET AL: "Enteromorpha Coverage Information Extraction by 1D-CNN and Bi-LSTM Networks Considering Sample Balance From GOCI Images", 《IEEE JOURNAL OF SELECTED TOPICS IN APPLIED EARTH OBSERVATIONS AND REMOTE SENSING》 *
万剑华 等: "多指数决策融合的MODIS浒苔提取方法", 《海洋环境科学》 *
蒋兴伟 等: "基于SAR 快速提取浒苔信息应用研究", 《海洋学报》 *

Also Published As

Publication number Publication date
CN115205693B (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
Ming et al. Land cover classification using random forest with genetic algorithm-based parameter optimization
CN102096825B (zh) 基于图的半监督高光谱遥感图像分类方法
CN111898633B (zh) 一种基于高光谱图像的海上舰船目标检测方法
Liu et al. Uncertainty and confidence in land cover classification using a hybrid classifier approach
CN110309868A (zh) 结合无监督学习的高光谱图像分类方法
CN108334859B (zh) 一种基于细粒度特征的光学遥感舰船型号识别众包系统
CN102945553B (zh) 基于自动差分聚类算法的遥感图像分割方法
Yuan et al. Fine-grained classification of urban functional zones and landscape pattern analysis using hyperspectral satellite imagery: A case study of wuhan
Rodrigues et al. Automatic classification of points-of-interest for land-use analysis
Genitha et al. Classification of satellite images using new fuzzy cluster centroid for unsupervised classification algorithm
Li et al. Point-based weakly supervised learning for object detection in high spatial resolution remote sensing images
Sun et al. Image target detection algorithm compression and pruning based on neural network
Fan et al. Urban functional zone mapping with a bibranch neural network via fusing remote sensing and social sensing data
Codella et al. Towards large scale land-cover recognition of satellite images
CN115205693B (zh) 一种多特征集成学习的双极化sar影像浒苔提取方法
Zhu et al. S 3 trm: spectral-spatial unmixing of hyperspectral imagery based on sparse topic relaxation-clustering model
CN115965867A (zh) 基于伪标签和类别词典学习的遥感图像地表覆盖分类方法
Zhu et al. A sparse topic relaxion and group clustering model for hyperspectral unmixing
Zheng et al. Deep learning for typhoon intensity classification using satellite cloud images
CN114492830A (zh) 基于个体歧视实例对生成的深度学习模型去偏方法及其装置
Hamidi et al. Texture‐based classification of high‐resolution precipitation forecasts with machine‐learning methods
Zhang et al. Bag-of-words model based image classification and evaluation of image sample quality in remote sensing
Kavitha et al. Machine learning paradigm towards content-based image retrieval on high-resolution satellite images
Srivastava et al. Correlation Between Built-Up and Land Surface Temperature Using Sentinel-2 and Landsat-8 Images through Semi-Supervised Deep Learning Model for Efficient Land Surface Monitoring
Ma Methodologies for earth observation with hyperspectral analysis and multimodal image fusion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant