CN112131789A - 一种基于随机森林算法的多光谱降水检测系统及方法 - Google Patents
一种基于随机森林算法的多光谱降水检测系统及方法 Download PDFInfo
- Publication number
- CN112131789A CN112131789A CN202010991858.4A CN202010991858A CN112131789A CN 112131789 A CN112131789 A CN 112131789A CN 202010991858 A CN202010991858 A CN 202010991858A CN 112131789 A CN112131789 A CN 112131789A
- Authority
- CN
- China
- Prior art keywords
- module
- random forest
- visible
- model
- temperature detector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 67
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 55
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 title claims description 33
- 238000001556 precipitation Methods 0.000 claims abstract description 67
- 238000012795 verification Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims description 40
- 238000003066 decision tree Methods 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000004088 simulation Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 230000005855 radiation Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000009987 spinning Methods 0.000 claims description 4
- 238000012952 Resampling Methods 0.000 claims description 3
- 230000003287 optical effect Effects 0.000 abstract description 8
- 230000003068 static effect Effects 0.000 abstract 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Radiation Pyrometers (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明公开了一种基于随机森林算法的多光谱降水检测方法,利用静止卫星上搭载的可见和红外自旋扫描辐射仪和极轨卫星上搭载的微波温度探测仪同时对相同云区进行观测,得到观测数据后,将可见和红外自旋扫描辐射仪高分辨率云产品匹配到微波温度探测仪相元中后,既获得了微波温度探测仪AMSU‑A像元中云体表面的信息又得到了云体内部的信息,进而使用随机森林算法模拟出云顶光学信息和云体内部微波降水信息之间的非线性关系,建立起光学信息和微波降水信息之间的联系,本发明还提供了一种基于随机森林算法的多光谱降水检测系统,包括数据采集模块、匹配模块、建模模块、模型验证模块和降水检测模块。本发明的检测系统及方法比传统的检测方法有着更高的准确率、检测率和较低的错误率。
Description
技术领域
本发明属于卫星遥感技术领域,具体涉及一种以机器学习领域的随机森林算法结合利用可见光和微波交叉光谱信息进行降水检测的方法。
背景技术
卫星微波资料是数值天气预报(NWP)重要的观测数据源,研究表明在资料同化中引入微波观测数据能为数值天气预报带来正效果,与卫星红外、可见光仪器相比,微波探测仪能穿透非降水云体从而获得大气温湿廓线信息。但是微波易受大直径水成物粒子散射的影响,很难穿透降水云体,在降水区域的微波观测数据往往不准确,故而在同化卫星微波资料之前需要剔除降水区域的观测。因此在业务运行中,精确地检测出微波观测像元是否发生降水显得尤为重要。
对于像元是否发生散射降水,利用O-B(观测减去模式背景场)信息可以部分剔除受降水污染的像元,但是该方法对观测资料和背景场的质量要求很高,对数据质量要求十分严苛,实际使用效果往往不佳。对于50GHZ O2吸收线的微波温度计(AMSU-A),传统的降水检测主要是利用23、31和89GHz通道的亮温差得到散射指数(SI),若SI超过某阈值(业务中阈值设为30)则可判定AMSU-A像元发生降水,或者计算得到云水路径CLWP(Cloud LiquidWater Path)值,若CLWP超过0.5也可视为发生降水。但是传统降水检测方法受限于极轨卫星载荷的影响,存在时间和空间分辨低、空间覆盖范围不足的问题。因此,如何研发一种精准且时空分辨率高的新型降水检测方法是本领域技术人员及为关注的技术问题。
发明内容
针对上述存在的不足,本发明提出一种基于随机森林算法的多光谱降水检测方法,利用静止卫星(FY-2F)上搭载的可见和红外自旋扫描辐射仪(VISSR)和极轨卫星(NOAA-19)上搭载的微波温度探测仪(AMSU-A)同时对相同云区进行观测,得到观测数据后,将可见和红外自旋扫描辐射仪(VISSR)高分辨率云产品匹配到微波温度探测仪(AMSU-A)相元中后,既获得了微波温度探测仪AMSU-A像元中云体表面的信息(VISSR观测数据)又得到了云体内部的信息(AMSU-A观测数据),进而使用随机森林算法模拟出云顶光学信息和云体内部微波降水信息之间的非线性关系,建立起光学信息和微波降水信息之间的联系,根据之间的联系检测降水。
本发明采用的技术方案是:
一种基于随机森林算法的多光谱降水检测方法,
包括以下步骤:
步骤S1:收集数据
通过数据采集模块收集历史观测数据,该历史观测数据包括可见和红外自旋扫描辐射仪和微波温度探测仪分别对云区进行观测得到的高分辨率云产品和微波散射指数,其中,微波散射指数记为SI;
步骤S2:数据处理
通过匹配模块对可见和红外自旋扫描辐射仪和微波温度探测仪的观测时间、观测对象和相元分别进行匹配,挑选出匹配的观测数据,形成观测数据训练样本集,按照1:9的比例将训练样本集分成训练集和测试集;
步骤S3:建立随机森林模型
将训练集和测试集代入建模模块中,由训练模块对随机森林模型初始模块中的模型进行训练,使随机森林模型的散射指数进行优化,完成随机森林模型的建立;
步骤S4:验证模型
通过模型验证模块将红外自旋扫描辐射仪采集的可见和红外自旋扫描辐射仪个例实际观测数据作为验证集输入到训练好的模型中进行计算,得到随机森林模拟的散射指数,记为RF_SI,将RF_SI与阈值进行对比,若RF_SI大于阈值,则发生降水,否则,不发生降水;将计算结果与历史数据进行核对,用以评估模型模拟效果;
步骤S5:降水检测
利用可见和红外自旋扫描辐射仪对待检测云区进行观测,得到观测数据,将观测数据输入到降水检测模块内通过随机森林模型进行模拟,得到检测结果。
优选的,在上述步骤S2中,匹配处理过程包括:
(1)观测时间匹配
|tVISSR-tAMSU-A|<δmax_min (1)
其中,tVISSR表示可见和红外自旋扫描辐射仪像元观测的时间,tAMSU-A表示微波温度探测仪像元观测的时间,δmax_min为时间阈值,设置为30min;
若满足公式(1),则可见和红外自旋扫描辐射仪和微波温度探测仪为同时观测;
(2)观测对象匹配
在可见和红外自旋扫描辐射仪和微波温度探测仪同时观测的基础上,要确保两者观测的对象是相同的,则仿效静止卫星和极轨卫星交叉定标法,
其中,θLEO表示极轨卫星的天顶角,θGEO表示静止卫星的天顶角,α是用经验确定的阈值,α=0.08;
若满足上述公式,则视为两种仪器观测扫描角度之差足够小,可见和红外自旋扫描辐射仪和微波温度探测仪观测到的对象为同一对象;
(3)观测像元匹配
假设微波温度探测仪的相元(x1,y1)和可见和红外自旋扫描辐射仪的相元(x2,y2),x1和y1表示微波温度探测仪相元的经纬度,x2和y2表示可见和红外自旋扫描辐射仪像元的经纬度,其匹配公式为:
d<dmax (4)
其中,R是地球的半径,为6371km,dmax是设定的阈值,为30km;
若微波温度探测仪的相元(x1,y1)和可见和红外自旋扫描辐射仪的相元(x2,y2)满足公式(3)和(4),则两者的观测相元匹配。
优选的,在上述步骤S3中,模型训练过程包括:假设训练集有n个训练样本,则运用Bootstrap重抽样方法抽取m个样本,用m个样本对CART决策树进行训练,得到m棵训练后的CART决策树;然后,输入测试集,则每棵CART决策树均模拟得到一个散射指数值,计算m棵CART决策树的散射指数值的平均值,得出的平均值即为随机森林模型的散射指数,记为RF_SI。
优选的,上述步骤S4中,所述阈值的取值为30。
优选的,该检测系统包括数据采集模块、匹配模块、建模模块、模型验证模块和降水检测模块,所述数据采集模块包括可见和红外自旋扫描辐射仪和微波温度探测仪,所述可见和红外自旋扫描辐射仪的输出端分别与匹配模块、模型验证模块和降水检测模块的输入端相连接,所述微波温度探测仪的输出端与匹配模块的输入端相连接,所述匹配模块的输出端与建模模块的输入端相连接,所述建模模块分别与模型验证模块和降水检测模块互连。
优选的,所述建模模块包括随机森林模型初始模块和训练模块,所述随机森林初始模块的输入端与匹配模块的输出端相连接,所述随机森林模型初始模块的输出端与训练模块的输入端相连接,所述训练模块还分别与模型验证模块和降水检测模型互连。
本发明的有益效果:本发明的基于随机森林算法的多光谱降水检测方法(记RF_SI)相比于传统微波降水检测方法(SI),主要有以下四个优点:
(1)RF_SI比SI有更高的空间分辨率。在卫星下点位置,RF_SI的空间分辨率是5km,SI空间分辨率高为48km,RF_SI空间分辨率是SI的9.6倍。
(2)RF_SI比SI有更大的空间覆盖范围。RF_SI的空间覆盖范围与搭载在静止卫星上的可见和红外自旋扫描辐射仪(VISSR)相同,而SI仅与微波温度探测仪(AMSU-A)覆盖范围相同,RF_SI能够比SI检测更广阔的区域。
(3)RF_SI比SI有更高的时间分辨率。
(4)RF_SI有比传统的检测方法的更高的准确率、检测率和较低的错误率,具有较高的使用价值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于随机死恶邻算法的多光谱降水检测流程图;
图2为本发明中随机森林模型训练图;
图3为本发明的基于随机死恶邻算法的多光谱降水检测系统模块连接框图;
图4为2017年6月6日21时太平洋洋面上验证集实验结果;
图5为AMSU-A过境区域内,不同方法得到的降水检测结果。
其中,
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明具体提供了一种基于随机森林算法的多光谱降水检测方法,利用静止卫星(FY-2F)上搭载的可见和红外自旋扫描辐射仪(VISSR)和极轨卫星(NOAA-19)上搭载的微波温度探测仪(AMSU-A)同时对相同云区进行观测,得到观测数据后,将可见和红外自旋扫描辐射仪(VISSR)高分辨率云产品匹配到微波温度探测仪(AMSU-A)相元中后,既获得了微波温度探测仪AMSU-A像元中云体表面的信息(VISSR观测数据)又得到了云体内部的信息(AMSU-A观测数据),进而使用随机森林算法模拟出云顶光学信息和云体内部微波降水信息之间的非线性关系,建立起光学信息和微波降水信息之间的联系,根据之间的联系检测降水。
如图1所示,具体包括以下步骤:
步骤S1:收集数据
通过数据采集模块收集历史观测数据,该历史观测数据包括可见和红外自旋扫描辐射仪和微波温度探测仪分别对云区进行观测得到的高分辨率云产品和微波和微波散射指数(记为SI);
步骤S2:数据处理
通过匹配模块对可见和红外自旋扫描辐射仪和微波温度探测仪的观测时间、观测对象和相元分别进行匹配,挑选出匹配的观测数据,形成观测数据训练样本集,按照1:9的比例将训练样本集分成训练集和测试集;
匹配处理过程包括:
(1)观测时间匹配
|tVISSR-tAMSU-A|<δmax_min (1)
其中,tVISSR表示可见和红外自旋扫描辐射仪像元观测的时间,tAMSU-A表示微波温度探测仪像元观测的时间,δmax_min为时间阈值,设置为30min;
若满足公式(1),则可见和红外自旋扫描辐射仪和微波温度探测仪为同时观测;
(2)观测对象匹配
在可见和红外自旋扫描辐射仪和微波温度探测仪同时观测的基础上,要确保两者观测的对象是相同的,则仿效静止卫星和极轨卫星交叉定标法,
其中,θLEO表示极轨卫星的天顶角,θGEO表示静止卫星的天顶角,α是用经验确定的阈值,α=0.08;
若满足上述公式,则视为两种仪器观测扫描角度之差足够小,可见和红外自旋扫描辐射仪和微波温度探测仪观测到的对象为同一对象;
(3)观测像元匹配
假设微波温度探测仪的相元(x1,y1)和可见和红外自旋扫描辐射仪的相元(x2,y2),x1和y1表示微波温度探测仪相元的经纬度,x2和y2表示可见和红外自旋扫描辐射仪像元的经纬度,其匹配公式为:
d<dmax (4)
其中,R是地球的半径,为6371km,dmax是设定的阈值,为30km;
若微波温度探测仪的相元(x1,y1)和可见和红外自旋扫描辐射仪的相元(x2,y2)满足公式(3)和(4),则两者的观测相元匹配;
步骤S3:建立随机森林模型
将训练集和测试集代入建模模块中,由训练模块对随机森林模型初始模块中的模型进行训练,使随机森林模型的散射指数进行优化,完成随机森林模型的建立;
如图2所示,模型训练过程包括:
随机森林模型的基本组成单元是决策树,本发明中采用的决策树是分类回归树(CART);假设训练集有n个训练样本,则运用Bootstrap重抽样方法抽取m个样本,用m个样本对CART决策树进行训练,得到m棵训练后的CART决策树;然后,输入测试集,则每棵CART决策树均模拟得到一个散射指数值(SI),计算m棵CART决策树的散射指数值的平均值,得出的平均值即为随机森林模型的散射指数(RF_SI)。
步骤S4:验证模型
通过模型验证模块将可见和红外自旋扫描辐射仪采集的个例实际观测数据作为验证集输入到训练好的模型中进行计算,得到RF_SI,将RF_SI与阈值进行对比,若RF_SI大于阈值,则发生降水,否则,不发生降水;将计算结果与历史数据进行核对,用以评估模型模拟效果;
步骤S5:降水检测
利用可见和红外自旋扫描辐射仪对待检测云区进行观测,得到观测数据,将观测数据输入到降水检测模块内通过随机森林模型进行模拟,得到检测结果。
本发明还提供了一种基于随机森林算法的多光谱降水检测系统,该检测系统包括数据采集模块1、匹配模块2、建模模块3、模型验证模块4和降水检测模块5,所述数据采集模块1包括可见和红外自旋扫描辐射仪102和微波温度探测仪101,所述可见和红外自旋扫描辐射仪102的输出端分别与匹配模块2、模型验证模块4和降水检测模块5的输入端相连接,所述微波温度探测仪101的输出端与匹配模块2的输入端相连接,所述匹配模块2的输出端与建模模块3的输入端相连接,所述建模模块3分别与模型验证模块4和降水检测模块5互连。
其中,所述建模模块3包括随机森林模型初始模块301和训练模块302,所述随机森林初始模块301的输入端与匹配模块2的输出端相连接,所述随机森林模型初始模块301的输出端与训练模块302的输入端相连接,所述训练模块302还分别与模型验证模块4和降水检测模型5互连。
为了更清楚的理解本发明的技术方案,特举2017年6月6日21时太平洋洋面为例并配合附图说明如下。
实验结果如图4所示,图4a是太平洋洋面上随机森林算法模型对SI的模拟值(RF_SI),图4b是FY-2F云分类产品;图4c是NOAA-19中AMSU-A过境区域内截取的RF_SI值;图4d是AMSU-A计算出的SI值;图4e是AMUS-A计算出的云水路径CLWP(Cloud Liquid Water Path)。
通过对比图4c、4d和4e,发现RF_SI和SI、CLWP基本上有着相同的空间分布特征,但是RF_SI的空间分辨率远远超过了SI和CLWP这两种传统检测方法。传统的SI(图4d)只能粗略的显示降水云的位置,RF_SI(图4c)却能够清晰地反映降水云区的细节特征。RF_SI比SI的空间分辨率更高,主要是由于模拟RF_SI的输入变量是FY-2F上VISSR 5km分辨率的光学产品,所以RF_SI的空间分辨率是5km;而受限于AMSU-A的空间分辨率,传统的SI的空间分辨率为48km,这相当于RF_SI是SI空间分辨率的9.6倍。RF_SI除了比SI有着更高的空间分辨率外,还具备比拟静止卫星的空间覆盖范围和时间分辨率。传统SI方法受限于极轨卫星的运动轨迹,只能得到小范围、粗分辨率的SI值(图4d),且时间分辨率低。但是VISSR搭载在静止卫星FY-2F上,用VISSR光学云产品模拟出来的RF_SI有着和静止卫星同样宽广的空间覆盖范围(图4a),且每1小时可以得到一次RF_SI数值,有着很高的时间分辨率。
图5是AMSU-A过境区域内,不同方法得到的降水检测结果。结果表明随机森林算法能够有效地检测出云体温度较低的积雨云区域,说明本发明随机森林方法对降水的检测结果有着较高的准确性。
图5b和图5c是传统AMSU-A的SI和CLWP得到的降水检测结果。可以发现,SI和CLWP降水检测算法能够将绝大部分降水区域检测出来,但是对于南面积雨云的部分区域,两种方法的检测结果为未发生降水。图5d是引入模式背景场计算得到的O-B的降水检测结果,与传统的SI和CLWP方法类似,南面仍然有部分低温积雨云的区域未检测出降水。此外,在扫描轨道的西边缘有个别像元错误地被检测出发生了降水,这可能是由于背景场误差造成的。图5e是VISSR CLC云产品方案的降水检测结果,它可以比较准确地检测出降水云的位置,可以作为是否发生降水的“真实结果”。
最后为了定量评估各算法的优劣,我们计算了检测率(POD)、错误率(FAR)、准确率(ACC)用于评估降水的检测效果。
POD=H/(H+M) (5)
FAR=FA/(FA+H) (6)
ACC=(H+CN)/(H+CN+M+FA) (7)
其中,H代表的是正确被检测出降水的样本数量;M代表了本来是有降水的样本,但是错误地检测为非降水的数量,即“漏报”;FA代表了原本是非降水的样本,结果却错误地检测为有降水的数量,即“错报”;CN表示正确地被检测为非降水的样本数量,计算结果如表1所示。
表1检测率、错误率、准确率计算结果
准确率 | 检测率 | 错误率 | |
RF_SI方法 | 94.24% | 94.68% | 0.80% |
SI方法 | 89.87% | 92.55% | 3.54% |
CLWP方法 | 90.80% | 94.67% | 5.56% |
O-B方法 | 86.89% | 89.36% | 3.66% |
表1中可以看出AMSU-A SI方法计算得到的准确率89.87%,检测率92.55%,错误率3.54%为;CLWP方法得到的准确率为90.80%、检测率为94.67%、错误率为5.56%。O-B方法准确率为86.89%,检测率为89.36%,错误率为3.66%。随机森林模型降水检测结果的准确率为94.24%,检测率为94.68%(略高于CLWP方法),错误率为0.80%,这说明,在此个例种随机森林算法比目前几种常见的传统降水检测方法更精确。
以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种基于随机森林算法的多光谱降水检测方法,其特征在于,包括以下步骤:
步骤S1:收集数据
通过数据采集模块收集历史观测数据,该历史观测数据包括可见和红外自旋扫描辐射仪和微波温度探测仪分别对云区进行观测得到的高分辨率云产品和微波散射指数,其中,微波散射指数记为SI;
步骤S2:数据处理
通过匹配模块对可见和红外自旋扫描辐射仪和微波温度探测仪的观测时间、观测对象和相元分别进行匹配,挑选出匹配的观测数据,形成观测数据训练样本集,按照1:9的比例将训练样本集分成训练集和测试集;
步骤S3:建立随机森林模型
将训练集和测试集代入建模模块中,由训练模块对随机森林模型初始模块中的模型进行训练,使随机森林模型的散射指数进行优化,完成随机森林模型的建立;
步骤S4:验证模型
通过模型验证模块将红外自旋扫描辐射仪采集的可见和红外自旋扫描辐射仪个例实际观测数据作为验证集输入到训练好的模型中进行计算,得到随机森林模拟的散射指数,记为RF_SI,将RF_SI与阈值进行对比,若RF_SI大于阈值,则发生降水,否则,不发生降水;将计算结果与历史数据进行核对,用以评估模型模拟效果;
步骤S5:降水检测
利用可见和红外自旋扫描辐射仪对待检测云区进行观测,得到观测数据,将观测数据输入到降水检测模块内通过随机森林模型进行模拟,得到检测结果。
2.根据权利要求1所述的一种基于随机森林算法的多光谱降水检测方法,其特征在于,在上述步骤S2中,匹配处理过程包括:
(1)观测时间匹配
|tVISSR-tAMSU-A|<δmax_min (1)
其中,tVISSR表示可见和红外自旋扫描辐射仪像元观测的时间,tAMSU-A表示微波温度探测仪像元观测的时间,δmax_min为时间阈值,设置为30min;
若满足公式(1),则可见和红外自旋扫描辐射仪和微波温度探测仪为同时观测;
(2)观测对象匹配
在可见和红外自旋扫描辐射仪和微波温度探测仪同时观测的基础上,要确保两者观测的对象是相同的,则仿效静止卫星和极轨卫星交叉定标法,
其中,θLEO表示极轨卫星的天顶角,θGEO表示静止卫星的天顶角,α是用经验确定的阈值,α=0.08;
若满足上述公式,则视为两种仪器观测扫描角度之差足够小,可见和红外自旋扫描辐射仪和微波温度探测仪观测到的对象为同一对象;
(3)观测像元匹配
假设微波温度探测仪的相元(x1,y1)和可见和红外自旋扫描辐射仪的相元(x2,y2),x1和y1表示微波温度探测仪相元的经纬度,x2和y2表示可见和红外自旋扫描辐射仪像元的经纬度,其匹配公式为:
d<dmax (4)
其中,R是地球的半径,为6371km,dmax是设定的阈值,为30km;
若微波温度探测仪的相元(x1,y1)和可见和红外自旋扫描辐射仪的相元(x2,y2)满足公式(3)和(4),则两者的观测相元匹配。
3.根据权利要求1所述的一种基于随机森林算法的多光谱降水检测方法,其特征在于,在上述步骤S3中,模型训练过程包括:假设训练集有n个训练样本,则运用Bootstrap重抽样方法抽取m个样本,用m个样本对CART决策树进行训练,得到m棵训练后的CART决策树;然后,输入测试集,则每棵CART决策树均模拟得到一个散射指数值,计算m棵CART决策树的散射指数值的平均值,得出的平均值即为随机森林模型的散射指数,记为RF_SI。
4.根据权利要求1所述的一种基于随机森林算法的多光谱降水检测方法,其特征在于,上述步骤S4中,所述阈值的取值为30。
5.一种基于随机森林算法的多光谱降水检测系统,其特征在于,该检测系统包括数据采集模块、匹配模块、建模模块、模型验证模块和降水检测模块,所述数据采集模块包括可见和红外自旋扫描辐射仪和微波温度探测仪,所述可见和红外自旋扫描辐射仪的输出端分别与匹配模块、模型验证模块和降水检测模块的输入端相连接,所述微波温度探测仪的输出端与匹配模块的输入端相连接,所述匹配模块的输出端与建模模块的输入端相连接,所述建模模块分别与模型验证模块和降水检测模块互连。
6.根据权利要求4所述的一种基于随机森林算法的多光谱降水检测系统,其特征在于,所述建模模块包括随机森林模型初始模块和训练模块,所述随机森林初始模块的输入端与匹配模块的输出端相连接,所述随机森林模型初始模块的输出端与训练模块的输入端相连接,所述训练模块还分别与模型验证模块和降水检测模型互连。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010991858.4A CN112131789B (zh) | 2020-09-18 | 2020-09-18 | 一种基于随机森林算法的多光谱降水检测系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010991858.4A CN112131789B (zh) | 2020-09-18 | 2020-09-18 | 一种基于随机森林算法的多光谱降水检测系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112131789A true CN112131789A (zh) | 2020-12-25 |
CN112131789B CN112131789B (zh) | 2023-11-21 |
Family
ID=73841870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010991858.4A Active CN112131789B (zh) | 2020-09-18 | 2020-09-18 | 一种基于随机森林算法的多光谱降水检测系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112131789B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464920A (zh) * | 2021-02-01 | 2021-03-09 | 中国人民解放军国防科技大学 | 基于极端随机树的fy-3d红外高光谱云检测方法 |
CN114354655A (zh) * | 2022-01-18 | 2022-04-15 | 国家卫星气象中心(国家空间天气监测预警中心) | 一种适用于微波探测器的降水知识库构建方法 |
CN114492210A (zh) * | 2022-04-13 | 2022-05-13 | 潍坊绘圆地理信息有限公司 | 一种高光谱卫星星载数据智能解译系统及其实现方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102013225997A1 (de) * | 2013-12-16 | 2015-06-18 | Robert Bosch Gmbh | Verfahren zum Ermitteln eines Modellwertsaus einem Random-Forest-Modell |
US20170071664A1 (en) * | 2012-07-18 | 2017-03-16 | Bernard Boon Chye Lim | Apparatus and method for assessing tissue treatment |
CN109213964A (zh) * | 2018-07-13 | 2019-01-15 | 中南大学 | 一种融合多源特征地理参数的卫星aod产品校正方法 |
CN109740639A (zh) * | 2018-12-15 | 2019-05-10 | 中国科学院深圳先进技术研究院 | 一种风云卫星遥感影像云检测方法、系统及电子设备 |
-
2020
- 2020-09-18 CN CN202010991858.4A patent/CN112131789B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170071664A1 (en) * | 2012-07-18 | 2017-03-16 | Bernard Boon Chye Lim | Apparatus and method for assessing tissue treatment |
DE102013225997A1 (de) * | 2013-12-16 | 2015-06-18 | Robert Bosch Gmbh | Verfahren zum Ermitteln eines Modellwertsaus einem Random-Forest-Modell |
CN109213964A (zh) * | 2018-07-13 | 2019-01-15 | 中南大学 | 一种融合多源特征地理参数的卫星aod产品校正方法 |
CN109740639A (zh) * | 2018-12-15 | 2019-05-10 | 中国科学院深圳先进技术研究院 | 一种风云卫星遥感影像云检测方法、系统及电子设备 |
Non-Patent Citations (2)
Title |
---|
孙刚;黄文江;陈鹏飞;高帅;王秀;: "轻小型无人机多光谱遥感技术应用进展", 农业机械学报, no. 03 * |
罗藤灵;张卫民;余意;冯淼;段博恒;邢德: "一种基于机器学习的IASI云检测方法", 第35届中国气象学会年会 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464920A (zh) * | 2021-02-01 | 2021-03-09 | 中国人民解放军国防科技大学 | 基于极端随机树的fy-3d红外高光谱云检测方法 |
CN114354655A (zh) * | 2022-01-18 | 2022-04-15 | 国家卫星气象中心(国家空间天气监测预警中心) | 一种适用于微波探测器的降水知识库构建方法 |
CN114354655B (zh) * | 2022-01-18 | 2024-07-23 | 国家卫星气象中心(国家空间天气监测预警中心) | 一种适用于微波探测器的降水知识库构建方法 |
CN114492210A (zh) * | 2022-04-13 | 2022-05-13 | 潍坊绘圆地理信息有限公司 | 一种高光谱卫星星载数据智能解译系统及其实现方法 |
CN114492210B (zh) * | 2022-04-13 | 2022-07-19 | 潍坊绘圆地理信息有限公司 | 一种高光谱卫星星载数据智能解译系统及其实现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112131789B (zh) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | Investigation and validation of algorithms for estimating land surface temperature from Sentinel-3 SLSTR data | |
Xie et al. | Reprocessed, bias-corrected CMORPH global high-resolution precipitation estimates from 1998 | |
Zibordi et al. | AERONET-OC: a network for the validation of ocean color primary products | |
Lopez | Direct 4D-Var assimilation of NCEP stage IV radar and gauge precipitation data at ECMWF | |
Guillevic et al. | Validation of Land Surface Temperature products derived from the Visible Infrared Imaging Radiometer Suite (VIIRS) using ground-based and heritage satellite measurements | |
CN112131789B (zh) | 一种基于随机森林算法的多光谱降水检测系统及方法 | |
Windahl et al. | An intercomparison of Landsat land surface temperature retrieval methods under variable atmospheric conditions using in situ skin temperature | |
Ishida et al. | Investigation of GOSAT TANSO-CAI cloud screening ability through an intersatellite comparison | |
Anderson et al. | Long-term statistical assessment of Aqua-MODIS aerosol optical depth over coastal regions: bias characteristics and uncertainty sources | |
CN102298150B (zh) | 全球陆表宽波段发射率反演方法及系统 | |
Weisz et al. | Advances in simultaneous atmospheric profile and cloud parameter regression based retrieval from high‐spectral resolution radiance measurements | |
CN104820250A (zh) | 一种极轨气象卫星virr海洋上云检测的处理方法 | |
Lien et al. | Statistical properties of global precipitation in the NCEP GFS model and TMPA observations for data assimilation | |
Zou et al. | Improved quantitative precipitation forecasts by MHS radiance data assimilation with a newly added cloud detection algorithm | |
CN111079835B (zh) | 一种基于深度全连接网络的Himawari-8大气气溶胶反演方法 | |
Yeom et al. | Mapping rice area and yield in northeastern Asia by incorporating a crop model with dense vegetation index profiles from a geostationary satellite | |
Chen et al. | Post-typhoon forest damage estimation using multiple vegetation indices and machine learning models | |
CN113408111A (zh) | 大气可降水量反演方法及系统、电子设备和存储介质 | |
Lee et al. | New approach for snow cover detection through spectral pattern recognition with MODIS data | |
Mélin | Uncertainties in ocean colour remote sensing | |
He et al. | Water vapor retrieval from MERSI NIR channels of Fengyun-3B satellite using ground-based GPS data | |
CN113532652A (zh) | 一种基于浮标和大气再分析数据的红外遥感传感器绝对定标方法 | |
CN113740263B (zh) | 一种气溶胶光学厚度反演方法及大气颗粒物遥感反演方法 | |
CN117708548A (zh) | 一种遥感卫星应用效能评估方法 | |
Chen et al. | Remote sensing retrieval of aerosol types in China using geostationary satellite |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |