CN112767543B - 基于逻辑回归的fy-3d红外高光谱云检测方法 - Google Patents

基于逻辑回归的fy-3d红外高光谱云检测方法 Download PDF

Info

Publication number
CN112767543B
CN112767543B CN202110133631.0A CN202110133631A CN112767543B CN 112767543 B CN112767543 B CN 112767543B CN 202110133631 A CN202110133631 A CN 202110133631A CN 112767543 B CN112767543 B CN 112767543B
Authority
CN
China
Prior art keywords
hiras
cloud
pixel
logistic regression
mersi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110133631.0A
Other languages
English (en)
Other versions
CN112767543A (zh
Inventor
余意
史华湘
张卫民
罗藤灵
张琪
王鹏飞
吴建平
王舒畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202110133631.0A priority Critical patent/CN112767543B/zh
Publication of CN112767543A publication Critical patent/CN112767543A/zh
Application granted granted Critical
Publication of CN112767543B publication Critical patent/CN112767543B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Operations Research (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于逻辑回归的FY‑3D红外高光谱云检测方法,涉及卫星遥感技术领域。本发明利用传统的基于成像仪的云检测方法,将MERSI的云检测段产品与HIRAS像元进行匹配,得到带有云标签的HIRAS数据,构成训练数据集,然后使用逻辑回归算法训练数据集,在训练过程中,采用网格搜索方法选择合适的逻辑回归算法超常数,得到泛化性能最佳的模型参数,最后将训练得到逻辑回归云检测模型用于YF‑3D的红外高光谱数据的云检测处理。本发明的逻辑回归云检测模型能达到0.97的分类准确度,预测速度是传统方法的50倍左右,体现出良好的泛化性能。

Description

基于逻辑回归的FY-3D红外高光谱云检测方法
技术领域
本发明涉及卫星遥感技术领域,尤其涉及一种机器学习领域的逻辑回归算法,结合利用FY-3D卫星HIRAS仪器的红外高光谱数据进行HIRAS视场云检测的方法。
背景技术
红外高光谱数据是现代数值天气预报系统重要的观测数据。红外高光谱数据的同化,对于有效地提升数值天气预报水平具有重要意义。云中的水滴和冰晶能有效吸收红外辐射,导致卫星的红外探测仪无法探测云层以下的大气和地表的红外辐射。此外,当前的辐射传输观测算子很难准确地模拟云的辐射效应。因此,云的污染是红外高光谱数据同化的重要问题。当前的解决办法是在红外高光谱数据进入同化系统之前,先剔除被云污染的像元。因此,在红外高光谱数据的同化应用中,首先需要判断红外探测仪像元视场是否有云,该过程即被称为云检测。因此,准确快速地对红外高光谱数据进行云检测,是有效应用卫星红外高光谱数据的前提。准确高效的云检测算法对于提升红外高光谱数据的同化水平,具有重要意义。
当前实际业务使用的云检测算法,有多通道阈值法、匹配成像仪方法等。其中,基于云的物理特征提出的多通道阈值方法,以应用于大数业务卫星红外探测仪上,但是许多云检测带有多个阈值,很难设置合适的阈值;另一种基于成像仪匹配的云检测方法,显著提升了高光谱红外探测的云检测准确度,但是该方法具有较高计算时间成本。因此,在实际的红外高光谱数据云检测应用中,急需一种准确度高的快速云检测算法。
随着人工智能时代的到来,使用人工智能技术做云检测的算法应运而生。已有人利用经典图像分类网络(Unet,resnet等)作为基础模型,将卫星云图作为特征输入,通过对分类网络微调,构建云检测分类模型,并取得了较高精度的云检测效果。但是,该方法将高分辨率的云图作为特征输入,同样需要较高的计算成本。另外,典型的图像分类网络较大,不便于加入到数值模式的业务同化系统中去。
因此,寻找一种快速高效的云检测方法是本领域技术人员极为关注的技术问题。
发明内容
本发明的目的在于提供了一种基于逻辑回归的快速准确实现FY-3D红外高光谱数据云检测的算法,该逻辑回归云检测模型能达到0.97的分类准确度,预测速度是传统方法的50倍左右,体现出良好的泛化性能。
为了解决上述技术问题,本发明使用传统机器学习算法中常用的分类算法—逻辑回归算法,通过大量样本训练,使模型学习风云3D卫星红外高光谱大气探测仪器(HIRAS)的通道辐射数据与视场的云标签(完全有云、晴空、部分有云)之间的映射关系,最后将学习到云检测知识的逻辑回归模型用于实现HIRAS仪器的快速云检测。
本发明提供的一种基于逻辑回归的FY-3D红外高光谱云检测方法,包括以下具体步骤:
S1.构建HIRAS与MERSI数据匹配模型
(1)时间匹配:
当HIRAS和MERSI的观测时间满足以下公式时,则可认为HIRAS和MERSI仪器同时对相同区域进行了观测,
|tHIRAS-tMERSI|<δmax
其中,tHIRAS表示HIRAS的观测时间,tMERSI表示MERSI的观测时间,δmax为匹配时间阈值,一般不超过59s。
(2)空间匹配:
匹配算法遍历每个HIRAS像元,基于球面距离找到该HIRAS像元视场所覆盖的MERSI像元,当MERSI像元中心经纬度与HIRAS像元中心经纬度满足以下距离公式时,则可认为HIRAS与MERSI数据空间匹配,以此找到每个HIRAS像元匹配到的MERSI像元,
Figure BDA0002926218620000031
d<dr
其中,d是MERSI像元与HIRAS像元之间的距离,x1是HIRAS像元中心的纬度,x2是MERSI像元中心的纬度,y1是HIRAS像元中心的经度,y2是MERSI中心像元的经度,R是地球半径;dr是HIRAS的匹配半径,设置为9KM。
(3)确定HIRAS像元云标签:
根据每个HIRAS像元匹配到的MERSI像元的云检测数据,确定每个HIRAS视场的云标签。
S2.生成训练数据集和测试数据集
将步骤S1中确定的带有云标签的HIRAS像元样本,根据其海陆位置,分别构建海洋数据集和陆地数据集,然后分别训练海洋云检测模型和陆地云检测模型,进而生成海洋和陆地训练数据集,并将海洋数据集和陆地数据集中的30%作为测试数据集。
S3.训练逻辑回归云检测模型
将上述得到的海洋数据集和陆地数据集,采用逻辑回归分类算法分别训练海洋和陆地云检测模型,并通过使用机器学习算法中的网格搜索方法,选择合适的逻辑回归超参数,得到海洋和陆地逻辑回归云检测模型。
S4.使用不同天气实例来做云检测测试
1)构造训练海洋和陆地数据集以外的测试数据集,包括不同训练区域和时间的数据,即时间和空间的泛化性能测试,将原始HIRAS和MERSI数据通过步骤S1生成带标签的测试数据集,带入训练好的陆地和海洋逻辑回归云检测模型做分类,计算出有云、晴空类别的准确度、查准率、查全率和AUC值,验证模型的性能。
2)选择训练数据集之外的天气实例数据做验证数据集。
3)将预报结果可视化,并与相同时刻的卫星的真彩云图、MERSI云检测产品做比较,检验逻辑回归检测模型的预报准确性。
进一步的,所述步骤S1中所述HIRAS与MERSI仪器都在同一个卫星平台,且MERSI仪器的观测范围完全覆盖了HIRAS仪器的观测范围。
进一步的,所述MERSI探元阵列的扫描范围为±55.1°±1°,所述HIRAS探元阵列的扫描范围为±50.4°。
进一步的,所述步骤S1的(2)中匹配算法的搜索方法为:先找到离HIRAS像元中心最近的MERSI像元,然后基于该MERSI像元上下左右分别搜索32行和32列。
进一步的,所述步骤S1的(3)中所述HIRAS视场的云标签的确定:当匹配的MERSI像元95%以上都是晴空时,则认为该HIRAS像元为晴空;当匹配的MERSI像元95%以上都是云时,则认为该HIRAS像元为云;当匹配的MERSI像元数量较小或者可能云、可能晴空、未确定的像元比率较大时,将该HIRAS像元的云标签设为未确定,则该未确定的HIRAS像元的云标签需要从样本中剔除。
进一步的,所述步骤S3中所述逻辑回归分类算法的原理为:逻辑回归是一种分类方法,主要用于二分类问题,现设置0代表有云像元,1代表晴空像元,假设判别函数z为:
z=ωTx+b
上述公式中,ω为特征系数,x为输入特征,这里x设置为红外高光谱资料的通道观测值,b为偏置系数,
一个像元晴空或者有云的概率为:
Figure BDA0002926218620000051
Figure BDA0002926218620000052
根据最大似然方程,损失函数定义为:
Figure BDA0002926218620000053
最大损失函数可得到特征系数ω:
ω=argmax L(ω)
得到特征系数ω后,给定分类阈值θ,就可得到模型预测的云标签:
Figure BDA0002926218620000054
进一步的,所述步骤S4的1)中所述陆地逻辑回归云检测模型的性能为:在5232个测试样本中预测准确度可达0.97,完全云类别的召回率可达0.97,AUC值可达0.99。
进一步的,所述步骤S4的1)中所述海洋逻辑回归云检测模型的性能为:在3648个测试样本中预测准确度可达0.96,完全云类别的召回率可达0.96,AUC值可达0.99。
进一步的,所述步骤S4的2)中所述验证数据集的生成是经过HIRAS像元的海陆标识划分为海洋样本和陆地样本,并将通道数据处理成海洋和陆地逻辑回归云检测模型输入的格式。
进一步的,所述步骤S4的2)中所述预报结果是通过海洋和陆地逻辑回归云检测模型来预报HIRAS像元的云标签。
本发明取得了以下有益效果:
1、本发明的逻辑回归算法在训练阶段学习了HIRAS红外高光谱通道辐射数据与对应像元云标签之间的映射关系,算法的输入数据只有HIRAS的红外高光谱数据,便可快速鉴别出该像元视场是否有云,则本发明的云检测时间成本低。而传统的基于成像仪的红外高光谱云检测方法,其输入是两种数据,一种为成像仪云检测数据,一种为红外高光谱数据,虽然匹配精度较高,但其云检测过程比较耗时,计算成本较高。
2、本发明的逻辑回归云检测算法的分类精度可以媲美传统的高精度的云检测方法,并在一些高影响天气(例如台风)的云检测过程中表现较好,即本发明云检测分类的准确率高。因此,对于FY-3D红外高光谱数据的业务同化应用的云检测预处理,本发明算法具有较高的实际应用价值。
附图说明
图1是本发明的总流程图;
图2是本发明的基于成像仪的HIRAS云标签生成模块流程图;
图3是本发明的逻辑回归云检测模型在台风天气的一种实施例的检测结果;
图4(a)是本发明的一种实施例的MERSI L2级云检测产品4:10的观测结果;
图4(b)是本发明一种实施例的逻辑回归模型的预报结果。
具体实施方式
下面结合附图对本发明的具体实施方式进行详细地描述。本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本发明使用传统机器学习算法中常用的分类算法—逻辑回归算法,通过大量样本训练,使模型学习风云3D卫星红外高光谱大气探测仪器(HIRAS)的通道辐射数据与视场的云标签(完全有云、晴空、部分有云)之间的映射关系,最后将学习到云检测知识的逻辑回归模型用于实现HIRAS仪器的快速云检测。
如图1所示,该HIRAS仪器的快速云检测的主要实现过程包括以下三个步骤:
a.生成训练测试数据集
利用传统的基于成像仪的云检测方法,将中分辨率光谱成像仪(MERSI)的云检测段产品与HIRAS像元进行匹配,生成HIRAS像元的云标签。尽管是同FY-3D卫星平台,但由于它们观测频率、观测驻留时间、观测范围不一样,因此需要将两个仪器依次进行观测时间匹配、像元空间匹配,然后通过云、晴空像元的比例确定HIRAS像元的云标签。最后通过HIRAS像元的海陆分布,将带有云标签的数据集划分为海洋、陆地两个数据集。
b.训练逻辑回归云检测模型,并进行模型性能验证
首先,将步骤a生成的海陆数据集分别进行预处理—包括剔除辐射值为负的样本、输入特征数据的正规化。然后将数据集划分为训练集、验证集。训练集由于训练逻辑回归模型,让其从数据中学习云检测知识,验证集用于检验训练好的模型在未知样本中的泛化性能。在训练过程中,采用网格搜索方法选择合适的逻辑回归算法超常数,得到泛化性能最佳的模型参数。
c.逻辑回归云检测模型的应用测试
将已训练好的逻辑回归云检测模型用于不同地区、不同天气个例情形的云检测应用,其预报结果同真实云图、MERIS L2级云检测产品、传统云检测方法的结果比较,检测模型实际应用的良好性能。
如图1和图2所示,本发明提供的一种基于逻辑回归的FY-3D红外高光谱云检测方法,具体包括以下步骤:
S1.构建HIRAS与MERSI数据匹配模型
虽然HIRAS与MERSI仪器都在同一个卫星平台,但是它们的观测频率、驻留时间不一样,所以首先需要进行观测时间的匹配。另外,由于本发明的MERSI探元阵列的扫描范围设置为±55.1°±1°,HIRAS探元阵列的扫描范围设置为±50.4°,因此MERSI仪器的观测范围完全覆盖了HIRAS仪器的观测范围。只要保证观测时间一致,便可以保证两个仪器的观测区域是一致的。
(1)时间匹配:
当HIRAS和MERSI的观测时间满足以下公式时,则可认为HIRAS和MERSI仪器同时对相同区域进行了观测,
|tHIRAS-tMERSI|<δmax
其中,tHIRAS表示HIRAS的观测时间,tMERSI表示MERSI的观测时间,δmax为匹配时间阈值,一般不超过59s。
(2)空间匹配:
匹配算法遍历每个HIRAS像元,基于球面距离找到该HIRAS像元视场所覆盖的MERSI像元。为了提高搜索效率,该匹配算法首先找到离该HIRAS像元中心最近的MERSI像元,然后基于该MERSI像元上下左右搜索,分别搜索32行和列(能充分保证超过HIRAS像元的视场范围)。当MERSI像元中心经纬度与HIRAS像元中心经纬度满足以下距离公式时,则可认为HIRAS与MERSI数据空间匹配,以此找到每个HIRAS像元匹配到的MERSI像元,
Figure BDA0002926218620000081
d<dr
其中,d是MERSI像元与HIRAS像元之间的距离,x1是HIRAS像元中心的纬度,x2是MERSI像元中心的纬度,y1是HIRAS像元中心的经度,y2是MERSI中心像元的经度,R是地球半径(6371km);dr是HIRAS的匹配半径,因为考虑到向两边摆扫时的形变,本发明设置为9KM。
(3)确定HIRAS像元云标签:
根据每个HIRAS像元匹配到的MERSI像元的云检测数据,确定每个HIRAS视场的云标签。当匹配的MERSI像元95%以上都是晴空时,则认为该HIRAS像元为晴空(标记为1);当匹配的MERSI像元95%以上都是云,则认为该HIRAS像元为云(标记为0);当匹配的MERSI像元数量较小或者可能云、可能晴空、未确定的像元比率较大时,将该HIRAS像元的云标签设为未确定(-1),该未确定的HIRAS像元的云标签需要从样本中剔除。
S2.生成训练数据集和测试数据集
由于海洋和陆地地表类型和辐射性质的巨大差异,我们需要分别构建海洋数据集和陆地数据集,然后分别训练海洋云检测模型和陆地云检测模型。将步骤S1中确定的带有云标签的HIRAS像元样本,根据其海陆位置,分别构建海洋数据集和陆地数据集。为了在训练过程中同时检测海洋、陆地云检测模型的性能,本发明将海洋数据集和陆地数据集中的30%作为测试数据集。
S3.训练逻辑回归云检测模型
将上述得到的海洋数据集和陆地数据集,采用逻辑回归分类算法分别训练海洋和陆地云检测模型。
该逻辑回归分类算法的原理为:逻辑回归是一种分类方法,主要用于二分类问题,现设置0代表有云像元,1代表晴空像元,假设判别函数z为:
z=ωTx+b
上述公式中,ω为特征系数,x为输入特征,这里x设置为红外高光谱资料的通道观测值,b为偏置系数,上标T是ω系数矩阵的转置。
一个像元晴空或者有云的概率为:
Figure BDA0002926218620000101
Figure BDA0002926218620000102
上式中,p(y=1|x)为一个像元晴空的概率,p(y=0|x)为一个像元有云的概率。
根据最大似然方程,损失函数L(ω)定义为:
Figure BDA0002926218620000103
上式中,yi为第i个样本(HIRAS像元)的标签,xi为第i个样本的特征,i的取值范围时1到n,表示从n个样本中任取一个样本。
根据最大损失函数可得到特征系数ω:
ω=argmax L(ω)
得到特征系数ω后,给定分类阈值θ,就可得到模型预测的云标签:
Figure BDA0002926218620000104
通过使用机器学习算法中的网格搜索方法(GridSearchCV),选择合适的逻辑回归超参数,得到泛化性能最好的海洋和陆地逻辑回归云检测模型。
S4.使用不同天气实例来做云检测测试
1)构造训练海洋和陆地数据集以外的测试数据集,包括不同训练区域和时间的数据,即时间和空间的泛化性能测试。将原始HIRAS和MERSI数据通过步骤S1生成带标签的测试数据集,带入训练好的陆地和海洋逻辑回归云检测模型做分类,计算出有云、晴空类别的准确度、查准率、查全率和AUC值,验证模型的性能。陆地逻辑回归云检测模型在5232个测试样本中预测准确度可达0.97,完全云类别的召回率可达0.97,AUC值可达0.99。海洋逻辑回归云检测模型在3648个测试样本中预测准确度可达0.96,完全云类别的召回率可达0.96,模型的AUC值可达0.99。从这些数据可以看出,本发明的陆地和海洋逻辑回归云检测模型表现出了较好的性能。
2)选择训练数据集之外的天气实例数据做验证数据集。验证数据集的生成无需经过匹配生成云标签,只需经过HIRAS像元的海陆标识划分为海洋样本和陆地样本,并将通道数据处理成海洋和陆地逻辑回归云检测模型输入的格式,通过海洋和陆地逻辑回归云检测模型来预报HIRAS像元的云标签。
3)将预报结果可视化,并与相同时刻的葵花8号卫星的真彩云图、MERSI L2级云检测产品做比较,检验逻辑回归检测模型的预报准确性。
以下结合具体实施例和附图对本发明作进一步详细说明,但不作为对本申请的限定。
具体实施例:
为了更加了解本发明的技术内容,特举2020年第10号台风—“风神”个例的预报结果。该台风在9月3日发展为台风,并有进一步增强的趋势,在9月4号发展为强台风并迅速发展为超强台风。
如图4(a)和图4(b)所示,为2020年第10号台风“海神”个例9月3日04时10分(世界时)的检验结果。图4(a)表示MERSI L2级云检测产品04:10的观测结果,其中0表示确定云,1表示可能云,2表示可能晴空,3表示确定晴空,4表示未确定。图4(b)表示逻辑回归模型的预报结果,其输入为04:10HIRAS的全通道辐射数据,输出为对应HIRAS像元的云标签,其中0表示确定云,1表示确定晴空。
如图4(a)所示,从MERSI L2级的云检测产品可以看出,该台风在04时10分,呈现圆形结构,台风眼区云层密实,台风外围条状云带还不够明显,表明此时台风正处于发展阶段,台风眼区云墙将增厚,外围云带将逐渐拉长。结合L2级成品的质量报告,可以认为该产品表征台风的真实情况。
如图4(b)所示,从逻辑回归模型的预报结果的对比图,可以看出,逻辑回归模型只接受HIRAS的红外高光谱辐射数据,结合前期训练学习到的红外高光谱云检测知识,便可以较准确地预报出此时刻台风区域的有云、晴空状态,并较好地保持了台风发展阶段的台风云区特征,与真实情形具有较高的一致性。结果表明,本发明的逻辑回归云检测模型能较好地对台风天气情形进行云检测。这对于HIRAS红外高光谱数据的资料同化应用,以及台风的数据天气预报具有重要意义。
以本时刻的观测为例,传统的基于成像仪的云检测算法,完成该时刻HIRAS红外高光谱辐射数据的云检测所需要的时间是26.337575s,而逻辑回归模型的云检测所需要的时间是0.531182s,后者是前者的49.58倍,并且这只是一个时刻的HIRAS数据云检测,如果对于全球连续的HIRAS观测数据做云检测,本发明的云检测模型的计算高效性是非常显著的。
下面定量分析本发明的逻辑回归云检测模型的预报性能。对于机器学习分类模型评价,我们首先需要计算分类模型的混淆矩阵,如图3。然后基于混淆矩阵,计算机器学习分类模型的各项评价指标,其中常用的评价指标有准确率(accuracy)、查准率(precision)、查全率(recall)、F1得分(F1)和AUC值(Area Under Curve),其计算公式如下:
Figure BDA0002926218620000121
Figure BDA0002926218620000131
Figure BDA0002926218620000132
Figure BDA0002926218620000133
AUC=∫ROC ⑤
Figure BDA0002926218620000134
Figure BDA0002926218620000135
上述公式①-⑦中,TP代表实际为晴空预测也为晴空的样本数,TN代表实际为云预测也为云的样本数,FP代表实际为云预测为晴空的样本数,FN表示实际为晴空预报为云的样本数,ROC表示模型的ROC曲线,该曲线的纵坐标为TPR,横坐标为FPR。AUC则表示ROC曲线与x轴的面积,该数值越大,表征该分类模型性能越好,最理想的情形是AUC数值等于1,表示该分类模型可以完美检测出正例样本和负例样本。
本发明根据上述各项评价指标,在5232个测试样本中对本发明的陆地云检测模型进行分类性能统计,在3648个测试样本中对本发明的海洋云检测模型进行分类性能统计,如表1所示。
表1逻辑回归云检测模型的测试性能统计
模型 准确率 查准率 查全率 F1得分 AUC 样本数
陆地 0.97 0.97 0.97 0.97 0.99 5232
海洋 0.96 0.96 0.96 0.96 0.99 3648
从表1可以看出,本发明的云检测模型,具有较好的云检测分类性能。陆地云检测模型在5232个测试样本中的分类准确度可达0.97,分类模型的AUC达到0.99,表明陆地模型能准确地分类陆地上HIRAS像元的完全云或者完全晴空视场。海洋云检测模型在3648个测试样本中的分类准确度为0.96,分类模型的AUC可达0.99,表明海洋模型能准确地分类海洋上HIRAS像元的完全云或者完全晴空视场。
综上所述,一方面,本发明的逻辑回归云检测算法具有较高的云检测准确度,并在未知样本中表现出良好泛化性能。另一方面,该算法具有非常显著的计算高效性,单个时刻预报速度是传统基于成像仪匹配算法的49.58倍。因此,本发明的逻辑回归云检测算法在FY-3D红外高光谱数据的云检测方面具有较高的实用价值。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (9)

1.一种基于逻辑回归的FY-3D红外高光谱云检测方法,其特征在于,包括以下具体步骤:
S1.构建HIRAS与MERSI数据匹配模型
(1)时间匹配:
当HIRAS和MERSI的观测时间满足以下公式时,则可认为HIRAS和MERSI仪器同时对相同区域进行了观测,
|tHIRAS-tMERSI|<δmax
其中,tHIRAS表示HIRAS的观测时间,tMERSI表示MERSI的观测时间,δmax为匹配时间阈值,不超过59s;
(2)空间匹配:
匹配算法遍历每个HIRAS像元,基于球面距离找到该HIRAS像元视场所覆盖的MERSI像元,当MERSI像元中心经纬度与HIRAS像元中心经纬度满足以下距离公式时,则可认为HIRAS与MERSI数据空间匹配,以此找到每个HIRAS像元匹配到的MERSI像元,
Figure FDA0003557652890000011
d<dr
其中,d是MERSI像元与HIRAS像元之间的距离,x1是HIRAS像元中心的纬度,x2是MERSI像元中心的纬度,y1是HIRAS像元中心的经度,y2是MERSI中心像元的经度,R是地球半径;dr是HIRAS的匹配半径,设置为9KM;
(3)确定HIRAS像元云标签:
根据每个HIRAS像元匹配到的MERSI像元的云检测数据,确定每个HIRAS视场的云标签;
S2.生成训练数据集和测试数据集
将步骤S1中确定的带有云标签的HIRAS像元样本,根据其海陆位置,分别构建海洋数据集和陆地数据集,然后分别训练海洋云检测模型和陆地云检测模型,进而生成海洋和陆地训练数据集,并将海洋数据集和陆地数据集中的30%作为测试数据集;
S3.训练逻辑回归云检测模型
将上述得到的海洋数据集和陆地数据集,采用逻辑回归分类算法分别训练海洋和陆地云检测模型,并通过使用机器学习算法中的网格搜索方法,选择合适的逻辑回归超参数,得到海洋和陆地逻辑回归云检测模型;
S4.使用不同天气实例来做云检测测试
1)构造训练海洋和陆地数据集以外的测试数据集,包括不同训练区域和时间的数据,即时间和空间的泛化性能测试,将原始HIRAS和MERSI数据通过步骤S1生成带标签的测试数据集,带入训练好的陆地和海洋逻辑回归云检测模型做分类,计算出有云、晴空类别的准确度、查准率、查全率和AUC值,验证模型的性能;
2)选择训练数据集之外的天气实例数据做验证数据集;
3)将预报结果可视化,并与相同时刻的卫星的真彩云图、MERSI云检测产品做比较,检验逻辑回归检测模型的预报准确性。
2.根据权利要求1所述的基于逻辑回归的FY-3D红外高光谱云检测方法,其特征在于,所述步骤S1中所述HIRAS与MERSI仪器都在同一个卫星平台,且MERSI仪器的观测范围完全覆盖了HIRAS仪器的观测范围。
3.根据权利要求2所述的基于逻辑回归的FY-3D红外高光谱云检测方法,其特征在于,所述MERSI探元阵列的扫描范围为±55.1°±1°,所述HIRAS探元阵列的扫描范围为±50.4°。
4.根据权利要求1所述的基于逻辑回归的FY-3D红外高光谱云检测方法,其特征在于,所述步骤S1的(2)中匹配算法的搜索方法为:先找到离HIRAS像元中心最近的MERSI像元,然后基于该MERSI像元上下左右分别搜索32行和32列。
5.根据权利要求1所述的基于逻辑回归的FY-3D红外高光谱云检测方法,其特征在于,所述步骤S3中所述逻辑回归分类算法的原理为:逻辑回归是一种分类方法,主要用于二分类问题,现设置0代表有云像元,1代表晴空像元,假设判别函数z为:
z=ωTx+b
上述公式中,ω为特征系数,x为输入特征,这里x设置为红外高光谱资料的通道观测值,b为偏置系数,
一个像元晴空或者有云的概率为:
Figure FDA0003557652890000031
Figure FDA0003557652890000032
根据最大似然方程,损失函数定义为:
Figure FDA0003557652890000033
最大损失函数可得到特征系数ω:
ω=argmax L(ω)
得到特征系数ω后,给定分类阈值θ,就可得到模型预测的云标签:
Figure FDA0003557652890000034
6.根据权利要求1所述的基于逻辑回归的FY-3D红外高光谱云检测方法,其特征在于,所述步骤S4的1)中所述陆地逻辑回归云检测模型的性能为:在5232个测试样本中预测准确度可达0.97,完全云类别的召回率可达0.97,AUC值可达0.99。
7.根据权利要求1所述的基于逻辑回归的FY-3D红外高光谱云检测方法,其特征在于,所述步骤S4的1)中所述海洋逻辑回归云检测模型的性能为:在3648个测试样本中预测准确度可达0.96,完全云类别的召回率可达0.96,AUC值可达0.99。
8.根据权利要求1所述的基于逻辑回归的FY-3D红外高光谱云检测方法,其特征在于,所述步骤S4的2)中所述验证数据集的生成是经过HIRAS像元的海陆标识划分为海洋样本和陆地样本,并将通道数据处理成海洋和陆地逻辑回归云检测模型输入的格式。
9.根据权利要求1所述的基于逻辑回归的FY-3D红外高光谱云检测方法,其特征在于,所述步骤S4的2)中所述预报结果是通过海洋和陆地逻辑回归云检测模型来预报HIRAS像元的云标签。
CN202110133631.0A 2021-02-01 2021-02-01 基于逻辑回归的fy-3d红外高光谱云检测方法 Active CN112767543B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110133631.0A CN112767543B (zh) 2021-02-01 2021-02-01 基于逻辑回归的fy-3d红外高光谱云检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110133631.0A CN112767543B (zh) 2021-02-01 2021-02-01 基于逻辑回归的fy-3d红外高光谱云检测方法

Publications (2)

Publication Number Publication Date
CN112767543A CN112767543A (zh) 2021-05-07
CN112767543B true CN112767543B (zh) 2022-05-27

Family

ID=75704389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110133631.0A Active CN112767543B (zh) 2021-02-01 2021-02-01 基于逻辑回归的fy-3d红外高光谱云检测方法

Country Status (1)

Country Link
CN (1) CN112767543B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113096129B (zh) * 2021-06-08 2021-09-10 自然资源部国土卫星遥感应用中心 高光谱卫星影像中的云量检测方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018162443A (ja) * 2017-03-24 2018-10-18 カシオ計算機株式会社 インク、印刷装置、印刷方法及び造形物の製造方法
CN111783555A (zh) * 2020-06-08 2020-10-16 山东科技大学 一种使用统一样本的深度学习卫星数据云检测算法
CN112001374A (zh) * 2020-10-28 2020-11-27 航天宏图信息技术股份有限公司 一种高光谱影像的云检测方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190261913A1 (en) * 2016-10-18 2019-08-29 The Johns Hopkins University Hyperspectral imaging for passive detection of colorectal cancers

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018162443A (ja) * 2017-03-24 2018-10-18 カシオ計算機株式会社 インク、印刷装置、印刷方法及び造形物の製造方法
CN111783555A (zh) * 2020-06-08 2020-10-16 山东科技大学 一种使用统一样本的深度学习卫星数据云检测算法
CN112001374A (zh) * 2020-10-28 2020-11-27 航天宏图信息技术股份有限公司 一种高光谱影像的云检测方法和装置

Also Published As

Publication number Publication date
CN112767543A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN112308019B (zh) 基于网络剪枝和知识蒸馏的sar舰船目标检测方法
CN112464920B (zh) 基于极端随机树的fy-3d红外高光谱云检测方法
CN110533631B (zh) 基于金字塔池化孪生网络的sar图像变化检测方法
CN108600135B (zh) 一种信号调制方式的识别方法
CN109871902B (zh) 一种基于超分辨率对抗生成级联网络的sar小样本识别方法
Seydi et al. Oil spill detection based on multiscale multidimensional residual CNN for optical remote sensing imagery
CN109871875B (zh) 一种基于深度学习的建筑物变化检测方法
Dong et al. A multiscale self-attention deep clustering for change detection in SAR images
CN112966710B (zh) 基于线性判别分析的fy-3d红外高光谱云检测方法
CN108428220A (zh) 静止轨道卫星序列遥感影像海岛礁区域自动几何校正方法
CN111860106B (zh) 一种无监督的桥梁裂缝识别方法
Yang et al. Evaluation and mitigation of rain effect on wave direction and period estimation from X-band marine radar images
CN114821358A (zh) 光学遥感图像海上舰船目标提取与识别方法
CN111414951B (zh) 用于图像的细分类方法及装置
CN107392863A (zh) 基于亲和矩阵融合谱聚类方法的sar图像变化检测方法
CN116152678A (zh) 小样本条件下基于孪生神经网络的海洋承灾体识别方法
CN112767543B (zh) 基于逻辑回归的fy-3d红外高光谱云检测方法
CN117725448A (zh) 气象导航信号特征的聚类分析方法
CN112084860A (zh) 目标对象检测、火力发电厂检测方法和装置
CN116542912A (zh) 一种多目标视觉跟踪的柔性体桥梁振动检测模型、应用
Liu et al. Ground-based cloud classification using weighted local binary patterns
CN112270285B (zh) 一种基于稀疏表示和胶囊网络的sar图像变化检测方法
Liu et al. A novel deep framework for change detection of multi-source heterogeneous images
CN114170487A (zh) 一种基于视觉的水面油污检测方法
CN105825215A (zh) 一种基于局部近邻嵌入核函数的仪表定位方法及其使用载体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant